这是一个完全为了练习Power Query基础使用方法而准备的练习。
茎叶图是一种在数据分析中使用非常广泛的图形,从茎叶图中可以直接读取原始数据的信息,尤其适用于数据量较少的情况。从本质上来说,将茎叶图逆时针旋转90度得到的图形就是直方图。
茎叶图的结构
2)茎左叶右,把茎由小到大,从上到下排成一列,把每片叶子写在它所属的茎右侧,由小到大排成一行。
茎叶图的结构
思路和操作步骤
1)使用Power Query导入需要制作茎叶图的数据。
107 135 136 138 139 140 146 147 153 172 173 175 179 182 190 191 195
2)根据数据的存储格式,执行转置、更改数据类型、排序等操作。为便于以后把代码封装成函数进行自动化处理,此处可以把导入数据后Power Query自动执行的类型转换步骤删除。数据整理完毕后打开高级编辑器,确认代码如下。
画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分。(2)将茎按从小到大的次序自上而下写成一列,写在分界线一侧。(3)将各个数据的叶按从小到大的次序写在对应茎的另一侧,同行列出。注意:在制。
导入整理数据
3)因为茎叶图是由茎和叶两个部分组成,所以很自然的会想到要把原始数据拆分成十位数和个位数两个部分。使用添加列中的整除和提取功能在查询中添加两列。整除时使用10为除数。
使用整除和提取结尾字符添加两个新列
“整数”列和“结尾字符”列
4)因为茎叶图是以茎为分组单位进行绘制,所以此处以“整除”列为基准应用透视列,值列则使用作为“叶"的“结尾字符”列。茎叶图最终使用的是未做任何汇总的原始数据,所以透视选项中的聚合方式为“不要聚合”。
应用透视列
5)如果把此时得到的数据表逆时针旋转90度观察,可以看到茎叶图的基本构造已经大致完成。各列列名为茎,各列数据为叶。与真正的茎叶图相比,不同之处只是在于叶的排序。后续步骤的基本思路就是要解决各个叶的排序问题。因为null值在排序中小于数值型数据,所以此处需要考虑用其他值代替null值。另外,在转换数据时,Power Query会自动更改列名,所以考虑使用一个变量暂存各列的列名(也就是分组的茎的名称)。打开高级编辑器,添加如下代码。
叶片可用自选图形中的“曲线”工具,画好大概轮廓后,右击图形,选“编辑顶点”进行细调,这时可增加编辑点。茎和叶脉可用“曲线”工具或“自由曲线”工具来画。各部分调节好后,用“选择”工具框选全部图形,组合。问题四。
添加代码
恢复表后各列标题发生了改变,我们要使用原始列标题作为茎名,所以在前面的步骤中要暂存列名
6)恢复列标题。打开高级编辑器,添加如下代码。
如下:1、根据数据,建立茎,及叶。2、如图,5.6.7.8是茎,后面是对应的叶子。3、数据量不大,这是最简单的茎叶图。4、也可以复制7~10行的数据,选择性粘贴--转置为直方图。
添加代码
恢复null值
8)此时数据表逆时针旋转90°后即可作为茎叶图使用。依次选择“将标题作为第一行”,“转置表”。
完成
9)上载至Excel表后,简单修改单元格边框和网格显示样式,得到原始数据的茎叶图。
用excel做茎叶图需要一个外挂软件PHStat2,请到百度下载。1、解压压缩包,在PHStat2文件夹中找到setup文件,双击安装。2、打开excel。3、在桌面双击PHstat2。4、然后打开你刚才打开的excel。你会发现在菜单栏里多了这一项。
修改样式,完成茎叶图的制作。
注:总体分布的密度曲线与横轴围成的面积为1。⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的药重复写。