Cloudera凌琦:大数据正加速在中国落地

原创
服务器
CDH就来自这家名为Cloudera的公司。Cloudera是Hadoop系统的首创者组织,在国内,很多人都了解CDH却对Cloudera鲜有耳闻。在Cloudera中国办公室入驻一周年当天,Cloudera大中华区总裁凌琦在北京接受了51CTO记者的采访,大谈大数据价值以及大数据在中国的落地情况。

Hadoop因其在大数据处理领域有很强的实用性和易用性,自2007年推出后很快受到了业界的认可。在Hadoop商用方面,不少公司基于开源Hadoop系统,对系统性能、系统可用性和系统可靠性等方面做了优化,最广为人熟知的产品就是Hadoop 商业刊发版CDH (Cloudera Distribution Including Apache Hadoop)。

CDH就来自这家名为Cloudera的公司。Cloudera是Hadoop系统的首创者组织,在国内,很多人都了解CDH却对Cloudera鲜有耳闻。在Cloudera中国办公室入驻一周年当天,Cloudera大中华区总裁凌琦在北京接受了51CTO记者的采访,大谈大数据价值以及大数据在中国的落地情况。

Hadoop让数据产生价值

“让数据产生价值”,当企业面对越来越多的数据时,开始考虑利用数据的价值。数据利用面临四大问题:数据从哪里来,数据存在什么地方,有了数据以后怎么处理,处理完后怎么用。当下,挖掘并分析数据***的解决方案就是部署一套基于Hadoop的大数据平台。

很多企业已经这样在做了。

比如,电商企业。以阿里巴巴为例,有报告显示,2014年,阿里巴巴通过对往年交易情况分析,尤其是对用户的消费习惯、搜索习惯以及浏览习惯等数据进行综合分析,使天猫淘宝双十一零漏单地应对了全天571亿元的交易量。这就是Hadoop的力量和魅力。

事实上,早在2012年Hadoop已经在领先的企业中广泛被应用,如百度、腾讯、华为、中国移动等公司都在用Hadoop集群搭建基础架构,

CDH独特价值所在

关于Hadoop的概念,百度百科上有非常详细的解释。不妨简要地了解一下其架构。

Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。Hadoop框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。

 

Hadoop核心架构

ClouderaCDH是Cloudera的100%开源平台分发版,它包含了Apache HadoopTM,并且特别创建了来满足企业的需求,是目前最为广泛部署的Hadoop分发版。

CDH之所以能得到如此广泛的应用,凌琦认为,CDH在安全性、高可用性有保障,同时可以广泛与软硬件集成。“对于想要寻找一个稳定的、经过验证的开源大数据管理解决方案,又不愿被专有供应商锁定的企业来说,CDH是理想的选择。CDH是一个独特的解决方案,企业在使用Hadoop于生产环境中的同时,还能获得来自开源社区的持续创新力。” 凌琦表示。

Cloudera极力推进商业化版本

目前,Cloudera的产品在科技、金融、电信、零售、能源、医疗以及媒体等行业有广泛应用,甚至与高性能和OpenStack有了很好的结合。高性能方面,Hadoop在气象行业的应用,气象需要存储云图和分析云图,前端计算的时候做成分布式的,高性能的存储就可以放在Hadoop中。Hadoop与OpenStack的结合方面,备受关注的贵阳云平台的建设也引入了Cloudera的产品。

Cloudera正式进入中国已经一年,对于Cloudera来说,商业版本的推广会是未来的重点。

凌琪介绍,现在很多企业都部署大数据平台,但往往是一个部门自己部署一套,这在企业需要做全局大数据分析时是极其不方面的。在这样的情况下,就可以采用Cloudera的商用版本,能够升级并在同一平台上做数据管理。

在中国这个爱用免费的市场,其实商业版本也不缺乏机会。毕竟,市场足够大,真正有实力能够搞定Hadoop的公司并不多。尤其如金融领域对稳定性有极高的要求,商业版本对他们来说是不错的选择。

实际上,Cloudera已经迈出了这一步。在今年9月,Cloudera与东方国信达成战略合作伙伴关系,这一合作将加速Cloudera商用版本的推进。

责任编辑:老门 来源: 51CTO
相关推荐

2016-09-22 14:32:46

IBM

2016-08-09 09:22:52

英特尔Cloudera

2022-05-27 17:54:43

元宇宙科技区块链

2014-09-09 17:38:10

大数据IMOIA

2012-05-14 09:29:40

云应用

2015-06-24 16:09:06

2016-02-16 20:27:24

ClouderaHadoop

2018-03-06 15:12:05

云计算 大数据

2012-05-24 17:49:25

华为云计算

2017-10-24 10:39:21

2014-10-13 10:31:02

UCloud大数据

2009-08-05 16:40:44

ITIL

2021-07-15 14:28:59

Cloudera阿里云数据

2016-07-28 13:32:28

大数据物联网

2014-06-11 09:14:50

Cloudera

2022-10-18 09:57:40

​​Cloudera混合数据CDP

2009-08-19 22:22:42

英特尔社会基础设施

2014-02-20 09:47:19

LTE4G

2016-10-11 10:20:04

IBM
点赞
收藏

51CTO技术栈公众号