spark sql dataset怎么做分组排序呢

这样的一组dataset数据,用spark sql按goods_name分组,每个分组内当city_name相同时,要累加num的值,变成新的一行,然后各个分组内按第三列排序取前10呢?

sparksql怎样取分组后的topn
Spark SQL 开窗函数
1、Spark 1.5.x版本以后,在Spark SQL和DataFrame中引入了开窗函数,比如最经典的就是我们的row_number(),可以让我们实现分组取topn的逻辑。
2、做一个案例进行topn的取值(利用Spark的开窗函数),不知道是否还有印象,我们之前在最早的时候,做过topn的计算,当时是非常麻烦的。但是现在用了Spark SQL之后,非常方便。
温馨提示:答案为网友推荐,仅供参考