spark中sparkStreaming的核心是DataFrame() 2022年3月15日 评论关闭 0次浏览 『题目』:spark中sparkStreaming的核心是DataFrame() 答案: A.错误 1、 jxJybA、CОM 收集sparkStreaming的核心抽象是Rdd() 答案: A.错误 2、sparkStreaming的核心抽象是Dstream … 阅读全文
Spark中的窄依赖有shuffle宽依赖没有shuffle() 2022年3月15日 评论关闭 0次浏览 『题目』:Spark中的窄依赖有shuffle宽依赖没有shuffle() 答案: A.错误 1、在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对 … 阅读全文