Spark 2.0 新特性
2019-02-08
Spark 2.0主要聚焦于三个方面:对标准的SQL支持、统一DataFrame和Dataset API和提供SparkSession。下面重点介绍最后两点。
Carpe diem
Spark 2.0主要聚焦于三个方面:对标准的SQL支持、统一DataFrame和Dataset API和提供SparkSession。下面重点介绍最后两点。

它能使用正则表达式搜索文本,并把匹配的行打印出来。
Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: