基本图表绘制方法(最简单详尽的常用图表用法总结)
基本图表绘制方法(最简单详尽的常用图表用法总结)•对比两类数据的数值大小•横向不超过 30 条数据、纵向不超过 12 条数据双向柱状图适用场景:•分类比较•对比分类不超过 12 条数据横向柱状图适用场景:•不超过 30 条数据•分类主体标签过长
本期小哥根据网上的资料,简单总结了常用各种图表的功能和用法。
图表内容均参考自:https://antv-2018.alipay.com/zh-cn/vis/chart/index.html
1. 比较类图表
基础柱状图(Basic Bar Chart)
一般基础柱状图又分纵向柱状图和横向柱状图。
纵向柱状图适用场景:
•分类比较•对比分类不超过 12 条数据
横向柱状图适用场景:
•不超过 30 条数据•分类主体标签过长
双向柱状图(Bi-directional Bar Chart)
双向柱状图适用场景:
•对比两类数据的数值大小•横向不超过 30 条数据、纵向不超过 12 条数据
气泡图(Bubble Chart)
气泡图适用场景:
•分类对比数据•多变量映射,用于分析数据相关性•与地图结合使用
需要注意:
气泡的大小是映射到面积而不是半径或者直径绘制的。因为如果是基于半径或者直径的话,圆的大小不仅会呈指数级变化,而且还会导致视觉误差。
漏斗图(Funnel Chart)
漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
重点:漏斗图分类对象具有逻辑性!如果没有,则使用柱状图。
雷达图(Radar Chart)
雷达图适用场景:
•多维数据对比(四维以上)•不超过30*N条数据(N是雷达链分类数,N取4~8)
南丁格尔玫瑰图( Nightingale Rose Chart)
南丁格尔玫瑰图是在极坐标下绘制的柱状图,使用圆弧的半径长短表示数据的大小(数量的多少)。
南丁格尔玫瑰图适用场景:
•对比大小相近的数值(因为半径和面积的关系是平方的关系,南丁格尔玫瑰图会将数据的比例大小夸大)•表示一个周期内的时间概念,比如星期、月份(因为圆形有周期的特性)•不超过 30 条数据
不适用场景:
•分类过少,分类数值过小
扩展:
扇形玫瑰图:
层叠玫瑰图:
2. 分布类图表
箱型图(Box Chart)
从箱形图中我们可以观察到:
•一组数据的关键值:中位数、最大值、最小值等•数据集中是否存在异常值,以及异常值的具体数值•数据是否是对称的•这组数据的分布是否密集、集中•数据是否扭曲,即是否有偏向性
气泡图(Bubble Chart)
详见上节比较类图表中关于气泡图的内容。
散点图(Scatter graph)
散点图经常与回归线(就是最准确地贯穿所有点的线)结合使用,归纳分析现有数据以进行预测分析。
通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。
直方图(Histogram)
直方图的作用:
•能够显示各组频数或数量分布的情况•易于显示各组之间频数或数量的差别
直方图适用场景:
•用于表示分布情况•用于观察异常或孤立数据•样本数不应少于 50 个
热力图(Heatmap)
热力图适用场景:
•连续数值数据分布•数据的统计预测
3. 占比类图表
饼图(Pie Chart)
饼图不适用场景:
•超过 9 个分类的占比情况(此时推荐使用横向柱状图)•分类占比差别不明显的场景•同时对比两个图的场景
环图(Donut Chart)
环图本质是饼图将中间区域挖空。环图相对于饼图空间的利用率更高,比如我们可以使用它的空心区域显示文本信息。适用场景同饼图相似。
堆叠柱状图(Stacked Bar Chart)
一般的堆叠柱状图:每一根柱子上的值分别代表不同的数据大小,各层的数据总和代表整根柱子的高度。非常适用于比较每个分组的数据总量。
堆叠柱状图适用场景:
•映射到位置的分类不超过 12 个, 映射到颜色的分类不超过 6 个•对比不同分组的总量大小,同时对比同一分组内不同分类的大小
4. 趋势类图表
折线图(Line Chart)
折线图适用场景:
•有序的因变量•单条线的数据记录数要大于2,但是同一个图上不要超过5条折线
回归曲线图
======================
公众号:牵引小哥讲Python