大数据Spark企业级项目实战(实战sparksql和kafka的流数据处理应用) - 北风资讯
北风首页资讯登陆RSS收藏
您现在所在的位置: 北风资讯 > 大数据 >

大数据Spark企业级项目实战(实战sparksql和kafka的流数据处理应用)

作者: 发布于:2016年02月14日 14:40

 

推荐课程:大数据Spark企业级项目实战(实战sparksql和kafka的流数据处理应用)

学习地址:http://www.ibeifeng.com/goods-591.html

内容简介:本教程从最基础的Spark介绍开始,介绍Spark的各种部署模式以及动手进行搭建,然后逐步介绍其中RDD的计算模型,创建和常用的操作,以及其中一些分布式计算,RDD持久化,容错,shuffle机制,共享变量等内容。而后在RDD的基础上,讲解SparkSQL的子框架,介绍dataframe,使用场景,创建方法,对parquet等文件格式和不同类型的数据源的支持,对hive的兼容和整合,以及对传统数据库的JDBC的支持,和thriftserver的部署等。再配合一些实战动手的实验来加深对dataframe的理解和应用。然后,讲解sparkstreaming的子框架,介绍DSTREAM的概念,使用场景,数据源,操作,容错,性能调优,还有与kafka的集成。

来源:北风网
原文链接:http://column.ibeifeng.com/ibeifeng/20160214145937.shtml

( 内容完 )

您可能还对这些文章感兴趣:



没有评论, 我来评论

评论被关闭