11问答网
所有问题
spark sql dataset怎么做分组排序呢
这样的一组dataset数据,用spark sql按goods_name分组,每个分组内当city_name相同时,要累加num的值,变成新的一行,然后各个分组内按第三列排序取前10呢?
举报该问题
推荐答案 2019-09-08
sparksql怎样取分组后的topn
Spark SQL 开窗函数
1、Spark 1.5.x版本以后,在Spark SQL和DataFrame中引入了开窗函数,比如最经典的就是我们的row_number(),可以让我们实现分组取topn的逻辑。
2、做一个案例进行topn的取值(利用Spark的开窗函数),不知道是否还有印象,我们之前在最早的时候,做过topn的计算,当时是非常麻烦的。但是现在用了Spark SQL之后,非常方便。
温馨提示:答案为网友推荐,仅供参考
当前网址:
http://11.wendadaohang.com/zd/F27FFvv7qP42vPMF8Sq.html
相似回答
怎么
将
spark的dataset
归一化?
答:
1、首先,打开软件,如下图所示,然后进入下一步。2、其次,完成上述步骤后,单击SparkLines图以查看趋势图,如下图所示,然后进入下一步。3、接着,完成上述步骤后,纵坐标显示的数据没有归一化,如下图所示,然后进入下一步。4、然后,完成上述步骤后,执行以下归一化过程,然后选择整个数据列,如下...
大家正在搜
spark dataset
spark dataframe
spark中dataset创建
spark中dataset用法
sparksql遵循的sql标准
cdh spark _sql
spark sql 临时表
hive sparksql
spark sql 优化
相关问题
sparksql怎样取分组后的topn
data.table或data.frame中,怎样按照col...
org.apache.spark.sql.dataset 怎...
基于spark SQL之上的检索与排序对比性能测试
spark streaming中怎么对数据进行排序
如何把spark sql的dataset缓存
spark sql怎么划分stage
求问sparksql怎么用SQL语句实现查找分位数