SAS咋样和HADOOP交互、集成?

通常有人提问,SAS怎么样和HADOOP交互、集成?下边我们大圣众包(www.dashengzb.cn)小编分享一篇来自CSDN的Anyjack著作。在答复这多少个问题前,重要看HADOOP在SAS系统中的定位,有下边定位考虑:

图片 1

1.把HADOOP作为传统数据源供SAS访问

这是最简单易行的一种接纳场景,就是把HADOOP当做类似于ORACLE/DB2等等等的数据库源来使用,SAS有力量一贯在HADOOP上展开数量处理,在HADOOP上拓展直接数据读写

2.把HADOOP作为分析平台

由此在HADOOP上嵌入SAS分析组件,SAS可以使你在数秒内交互式浏览或者分析上十亿行记录。

匹配SAS 的伊夫nt Stream
Process(实时事件处理引擎),你可以实时的辨析当前数码,急速侦破变化。

3..把HADOOP作为数据管理平台

行使SAS Data Loader for
haddop组件,集团用户能利用其对HADOOP上的数额开展简要、急忙的数额清洗、转换、数据质量管理等操作

换此外一种格局来说,SAS针对HADOOP提供有FROM /WITH/IN的力量

FROM

您的数额可以来自(FROM)你的HADOOP系统,你也得以写多少从(FROM)SAS到HADOOP

透过利用SAS/ACCESS to haddop组件或者利用SAS SPDE FOR
HADOOP技术,你能像操作常规数量这样操作HADOOP

图片 2

WITH

“With”是行使HADOOP上相继节点的存储能力和计量能力并行举行多少访问和处理的力量。而不像是”FROM”抓取、写入能力,存在一个管道来集中接收来自HADOOP的数码仍然从一个管道往HADOOP中写入数据。

“WITH”能够充分利用HADOOP各种节点的蕴藏能力和总结能力,使HADOOP节点和SAS节点间相互交互和计量,比如SAS产品
Visual Analytics, Visual Statistics, In-Memory Statistics for Hadoop,
High Performance Analytic procedures .

IN

“In”就是SAS帮忙直接在HADOOP中举办总括,所有的操作都在HADOOP内部形成,SAS只是承受提交代码、转换SAS代码为HADOOP代码(M/R)、接收代码执行结果。

典型的SAS组件有:SAS Code Accelerator for Hadoop, SAS Data Quality
Accelerator for Hadoop

愿意上述讲解能答应HADOOP和SAS的涉及,让我们对SAS在HADOOP上的运用有个相比较简单的领悟。

初稿地址:http://www.dashengzb.cn/articles/a-320.html

(更多大数目与商业智能领域干货、或电子书,可添加个人微信号(dashenghuaer))

相关文章