伴随着交易型IT过渡到交互型IT,企业数据出现了爆炸性增长。社交媒体的兴起、数字传感器的大量应用以及移动设备的大面积普及等多种因素,导致各种海量数据的快速产生。此类多结构化的数据价 值较低(低价值密度),但庞大的数据量却蕴含着巨大财富(高价值总量)。因此,如何高效的治理 大数据日益成为业界关注的话题。
在这种环境下,如何充分使用大数据和挖掘大数据商业价值将为企业带来强大的竞争力,成为了企业制胜未来的主要法宝。随着Oracle大数据机的推出,甲骨文公司成为了业界首个以全面、软硬件集成 的产品满足企业关键大数据需求的公司。它可帮助客户进一步提高效率、简化管理并洞察数据的内在 本质,从而最大限度地挖掘数据的商业价值。
Oracle大数据机与Oracle Exalogic中间件云服务器、Oracle Exadata数据库云服务器以及Oracle Exalytics商务智能云服务器一起组成了甲骨文最广泛、高度集成化系统产品组合,为企业提供了一个 端到端的大数据解决方案,可满足企业对大数据治理的所有需求。
集成化系统 破解大数据疑难
Oracle大数据机是一款集成设计的系统,旨在简化大数据项目的实施与管理。该数据机采用18台 Oracle Sun服务器的全机架式配置,总共拥有864 GB主内存、216核CPU、648 TB原始磁盘存储空间, 并在节点和其他Oracle集成化系统之间采用40 Gb/s的InfiniBand网络连接以及10 Gb/s的以太网数据 中心连接,可通过InfiniBand网络连接多个机架进行横向升级扩展,使其能够获取、组织和分析超级 海量的数据。
Oracle大数据机集成了Cloudera公司的Distribution Including Apache Hadoop(CDH)和Cloudera Manager软件,还能够快速便捷的与Oracle数据库11g、Oracle Exadata数据库云服务器和Oracle Exalytics商务智能云服务器集成,并通过提供企业级的应用性能、可用性、可支持性和安全性,对所 有数据类型提供极高的数据分析能力。
#p#
创新技术 构造高效平台
Oracle NoSQL数据库:为了快速、实时地捕获所有大数据,企业需要处理大数据量、低密度的信息,需要频繁更改应用程序,而且还必须横向扩展以满足急剧扩张的部署计划。作为一款分布式、高度可 扩展并能够提供关键价值的数据库,Oracle NoSQL数据库专门为管理海量数据而设计,可以帮助企业 存取非结构化数据,并可横向扩展至数百个高可用性节点。同时,该产品能够提供可预测的吞吐量和 延迟时间,而且更加容易安装、配置和管理,支持广泛的工作负载。
Oracle NoSQL数据库:为了快速、实时地捕获所有大数据,企业需要处理大数据量、低密度的信息,需要频繁更改应用程序,而且还必须横向扩展以满足急剧扩张的部署计划。作为一款分布式、高度可 扩展并能够提供关键价值的数据库,Oracle NoSQL数据库专门为管理海量数据而设计,可以帮助企业 存取非结构化数据,并可横向扩展至数百个高可用性节点。同时,该产品能够提供可预测的吞吐量和 延迟时间,而且更加容易安装、配置和管理,支持广泛的工作负载。
分析沙盒:目前,企业所面临的挑战包括拥有现有Oracle数据仓库、对大数据进行分析、不允许对数据仓库SLA产生负面影响等。通过分析沙盒,企业可获得分析工作区,控制对资源和数据的访问, 而且完全不影响生产系统。它还可以将沙盒功能与安全、可伸缩、易于安装的Oracle企业管理器进行 集成,从而帮助企业高效利用服务器、通过付费方式进行自我管理。
针对Hadoop 架构的系统:大数据组织和提取面临的挑战还包括将大数据转换为易于分析的内容、避免编写大量 Hadoop代码以及数据快速载入 Oracle 数据仓库等,Oracle大数据机中的开源Apache Hadoop、Oracle数据集成Hadoop应用适配器、Oracle Hadoop装载器、Oracle Direct Connector,可 以帮助企业充分应对这些挑战。
Oracle数据集成Hadoop应用适配器通过Oracle数据集成器易于使用的界面,自动生成Hadoop MapReduce代码,简化了Hadoop应用与Oracle数据库的数据集成。Oracle Hadoop装载器使客户能够利 用Hadoop MapReduce处理功能建立优化的数据集,从而在Oracle数据库11g中进行高效率加载和分析。 Oracle Direct Connector可通过SQL语言从Oracle数据库直接访问Hadoop分布式文件系统上的数据。
R语言:在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle数据库11g 的集成,分析师和统计人员可以运行现有的R应用,并利用R客户端直接处理存储在Oracle数据库11g中 的数据,从而极大地提高可扩展性、性能和安全性。Oracle数据库11g与R开源统计环境的整合为进行 更进一步的数据分析提供了一个企业就绪的、深度集成的环境。
通过Oracle大数据机快速获得、组织大数据之后,企业还需要根据对大数据全面实时的分析做出最恰当的业务决策。作为业界首款集成设计的内存硬件与软件系统,Oracle Exalytics商务智能云服务器能够以前所未有的速度运行数据分析应用,为客户提供实时的、快速的可视分析。Oracle Exalytics实现了新型分析应用,可用于异构IT环境,并能存取和分析来自任何Oracle或非Oracle的关系型、OLAP或非结构化数据源的数据。
凭借在软硬件双方面的创新,Oracle Exalytics商务智能云服务器实现极致数据分析性能,其亚秒级性能可以支持快速的数据分析,还能提供建模、规划、预测和预测性分析,同时使企业规划应用能够以更快的、更准确的规划周期在整个企业内扩展,可有效帮助企业加快业务决策,最大限度地挖掘大数据的商业价值。