社区编辑申请
注册/登录
Cloudera凌琦:大数据正加速在中国落地 原创
服务器
CDH就来自这家名为Cloudera的公司。Cloudera是Hadoop系统的首创者组织,在国内,很多人都了解CDH却对Cloudera鲜有耳闻。在Cloudera中国办公室入驻一周年当天,Cloudera大中华区总裁凌琦在北京接受了51CTO记者的采访,大谈大数据价值以及大数据在中国的落地情况。

Hadoop因其在大数据处理领域有很强的实用性和易用性,自2007年推出后很快受到了业界的认可。在Hadoop商用方面,不少公司基于开源Hadoop系统,对系统性能、系统可用性和系统可靠性等方面做了优化,最广为人熟知的产品就是Hadoop 商业刊发版CDH (Cloudera Distribution Including Apache Hadoop)。

CDH就来自这家名为Cloudera的公司。Cloudera是Hadoop系统的首创者组织,在国内,很多人都了解CDH却对Cloudera鲜有耳闻。在Cloudera中国办公室入驻一周年当天,Cloudera大中华区总裁凌琦在北京接受了51CTO记者的采访,大谈大数据价值以及大数据在中国的落地情况。

Hadoop让数据产生价值

“让数据产生价值”,当企业面对越来越多的数据时,开始考虑利用数据的价值。数据利用面临四大问题:数据从哪里来,数据存在什么地方,有了数据以后怎么处理,处理完后怎么用。当下,挖掘并分析数据***的解决方案就是部署一套基于Hadoop的大数据平台。

很多企业已经这样在做了。

比如,电商企业。以阿里巴巴为例,有报告显示,2014年,阿里巴巴通过对往年交易情况分析,尤其是对用户的消费习惯、搜索习惯以及浏览习惯等数据进行综合分析,使天猫淘宝双十一零漏单地应对了全天571亿元的交易量。这就是Hadoop的力量和魅力。

事实上,早在2012年Hadoop已经在领先的企业中广泛被应用,如百度、腾讯、华为、中国移动等公司都在用Hadoop集群搭建基础架构,

CDH独特价值所在

关于Hadoop的概念,百度百科上有非常详细的解释。不妨简要地了解一下其架构。

Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。Hadoop框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。

 

Hadoop核心架构

ClouderaCDH是Cloudera的100%开源平台分发版,它包含了Apache HadoopTM,并且特别创建了来满足企业的需求,是目前最为广泛部署的Hadoop分发版。

CDH之所以能得到如此广泛的应用,凌琦认为,CDH在安全性、高可用性有保障,同时可以广泛与软硬件集成。“对于想要寻找一个稳定的、经过验证的开源大数据管理解决方案,又不愿被专有供应商锁定的企业来说,CDH是理想的选择。CDH是一个独特的解决方案,企业在使用Hadoop于生产环境中的同时,还能获得来自开源社区的持续创新力。” 凌琦表示。

Cloudera极力推进商业化版本

目前,Cloudera的产品在科技、金融、电信、零售、能源、医疗以及媒体等行业有广泛应用,甚至与高性能和OpenStack有了很好的结合。高性能方面,Hadoop在气象行业的应用,气象需要存储云图和分析云图,前端计算的时候做成分布式的,高性能的存储就可以放在Hadoop中。Hadoop与OpenStack的结合方面,备受关注的贵阳云平台的建设也引入了Cloudera的产品。

Cloudera正式进入中国已经一年,对于Cloudera来说,商业版本的推广会是未来的重点。

凌琪介绍,现在很多企业都部署大数据平台,但往往是一个部门自己部署一套,这在企业需要做全局大数据分析时是极其不方面的。在这样的情况下,就可以采用Cloudera的商用版本,能够升级并在同一平台上做数据管理。

在中国这个爱用免费的市场,其实商业版本也不缺乏机会。毕竟,市场足够大,真正有实力能够搞定Hadoop的公司并不多。尤其如金融领域对稳定性有极高的要求,商业版本对他们来说是不错的选择。

实际上,Cloudera已经迈出了这一步。在今年9月,Cloudera与东方国信达成战略合作伙伴关系,这一合作将加速Cloudera商用版本的推进。

责任编辑:老门
相关推荐

2016-08-09 09:22:52

英特尔Cloudera

2022-03-14 15:06:15

数据战略Cloudera混合云

2018-08-06 10:41:37

大数据

2020-06-23 15:56:55

Cloudera

2021-07-23 11:35:23

2016-12-29 18:12:56

2013-10-25 13:30:53

云计算

2016-12-21 16:53:51

大数据互联网阿里

2016-11-23 20:34:29

2014-09-26 14:37:38

大数据运动

同话题下的热门内容

谷歌数据中心炸了数据中心的停机时间怎么会成为企业的噩梦?数据中心的可持续性发展现状数据中心正在成为不断发展的数字经济的重要资产区块链对芯片短缺的影响村田中国参展OCP China Day 2022: 为数据中心提供安全、绿色供电,赋能算力提升全面提升智慧化发展水平 紫光云助力安庆迎江经济开发区创新型智慧园区建设如何为智慧城市创建经济高效的数据存储基础设施

编辑推荐

什么是中间件,常见中间件服务器有哪些?如何快速搭建一个阿里云服务器Windows和Ubuntu系统如何远程连接Linux服务器Python与PHP、Java等4大流行语言过招,谁更胜一筹?解决Nginx服务返回500状态码问题
我收藏的内容
点赞
收藏

51CTO技术栈公众号