Spark Scheduling
从源码的角度稍微来追踪一下Spark中的任务调度是什么样的。网上好多分析的版本跟carolz看的spark版本不一样啊,真忧桑。顺便说一句,Spark源码是用Scala写的,对于新手,那些语法糖让我们实在痛苦>。<,稍稍坚持一下~那么,就开始吧。
Spark Version: 1.0.1
让我们从一个例子开始:
val textFile = sc.textFile("readme.md")
textFile.filter(line=>line.contains("spark")).count()