最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:***,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。***这一点也是和传统的数据挖掘技术有着本质的不同。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
哪些传统企业最需要大数据服务呢?抛砖引玉,先举几个例子:1) 对大量消费者提供产品或服务的企业(精准营销);2) 做小而美模式的中长尾企业(服务转型);3) 面临互联网压力之下必须转型的传统企业(生死存亡)。
对于企业的大数据,还有一种预测:随着数据逐渐成为企业的一种资产,数据产业会向传统企业的供应链模式发展,最终形成“数据供应链”。这里尤其有两个明显的现象:1) 外部数据的重要性日益超过内部数据。在互联互通的互联网时代,单一企业的内部数据与整个互联网数据比较起来只是沧海一粟;2) 能提供包括数据供应、数据整合与加工、数据应用等多环节服务的公司会有明显的综合竞争优势。
正是基于对企业大数据优势的预测,这里就不得不提到提供舆情大数据应用服务的代表性企业蚁坊软件,它正是这样一家能提供包括数据供应、数据整合加工、数据应用等多环节服务的公司,它专业从事互联网大数据分析,是大数据的“拾荒者”和“淘金者”,拥有自主品牌的大数据处理平台:蚂蚁工厂(Antfact ),并专注于大数据信息挖掘的价值传递。蚁坊软件为客户提供舆情应用服务,其中鹰击提供微博舆情监测分析服务,其舆情“早发现”的能力显著领先竞争对手,为舆情早报告、早响应提供先机;鹰眼提供全网舆情监测分析服务,方便客户“速读网”,掌控舆情发展态势。
蚁坊软件还与国防科技大学、北京邮电大学、中科院软件所等科研院所建立了紧密的“产学研”合作,正是基于这种强大的技术背景,蚁坊软件必将利用其海量数据处理技术的优势,为需要舆情应用服务的政企单位保教护航。