rank使用完成后如何排序:Knime数据分析入门-
rank使用完成后如何排序:Knime数据分析入门-2、分组后,该组内按照那个列排序,如按照销量降序排序1、选择分组列。每个相同属性值将排列在一起,如“华东”地区的各行都排在一起可根据小于等于3进行过滤使用Knime分析软件,So Easy! 一个Rank节点搞定。标号为1黄色框选节点时生成模拟数据表,你可以直接使用读入类节点,载入你需要的数据表。使用Rank节点排序
说到排序,大家都不陌生,任何使用过Excel的人都知道,对一列或多列,升序或降序排序,简直不要太Easy。但遇到如下的情况,你还要使用Excel排序吗?至少我不会,即使能实现也可能很麻烦,不要给我提什么VBA,有学这个的时间,Python都可以学会了。
补充说明:在常见的数据库如MySQL,Hive等有窗口函数,指定窗口(即分组),按照指定的列排序,如常用的row_number()函数,效果类似本节内容。
数据:有各个地区的水果销量,请找出每个地区销量排前三的水果
其他类似场景,如班级各科考试成绩都在一个数据竖表中(若不通科目在不同的列,可使用Unpivoting 节点转换在同一列的长表中),找出每科成绩最高的三个学生,与下数据类似
原始数据可根据小于等于3进行过滤
如何实现使用Knime分析软件,So Easy! 一个Rank节点搞定。标号为1黄色框选节点时生成模拟数据表,你可以直接使用读入类节点,载入你需要的数据表。
使用Rank节点排序
Rank节点设置,及说明1、选择分组列。每个相同属性值将排列在一起,如“华东”地区的各行都排在一起
2、分组后,该组内按照那个列排序,如按照销量降序排序
3、排序的标号有三种 比如:数值95 95 92 90
- Standar: 标准排序,排序则为1 1 3 4 (相同值同序,不连续)
- Dense:密度排序,排序为1 1 2 3(相同值同序,下一个接上一个顺序,不会跳序)
- Ordinal:顺序排序 排序为1 2 3 4(即使有相同值,也会按照排序的绝对顺序排序,不重复序号)
本例中,选择Ordinal即可,可根据你的需要,选择不同的排序方式。
补充若使用Row Filter,选择小于等于3的条件过滤,在只保留各地区前三销量的水果
此处的Sorter 为常用的排序节点
过滤后的明显数据
若在使用Group by节点,可得到汇总的如下数据
汇总后数据
不了解Knime软件的同学,请翻我往期的文章。