大数据持续影响全球的大规模企业和行业用户。已经改变了金融服务,医疗保健,零售和制造业以及其他业务决策的方式。然而,可能较少检查其对数据中心行业的影响。随着越来越多的数据被创建,存储和分析,将需要更多的服务器。在何处以及如何存储和管理这些服务器以继续保持正常运行,并实现高性能操作是重要的考虑因素。随着大数据业务的增长和更多服务器的需求,物理空间和可用的可靠电力也将增加。
虽然云的发展如火如荼,但我们应该记住云实际上只是其他人的服务器空间,所以需要服从相同的电源和连接需求。因此,无论企业内部,主机托管数据中心还是云中都存在大数据操作,IT运营商必须确保其今天和未来满足其基础架构需求。
数据中心建设现状简析
三大运营商中国电信、中国联通和移动是数据中心建设的主力军。它们在国家政府、资金、人力方面都具有强大的优势,只有它们有能力建设大规模的数据中心。除了运营商,还有一些第三方IDC企业也建设了一些数据中心,这些数据中心主要是填补运营商的弱势部分,一般这些第三方IDC企业不会与运营商正面竞争,也不具备竞争的实力,通过与运营商合作,利用自身小而提供服务丰富的优势,也参与了部分数据中心的建设。
再有就是一些大型互联网企业,出于自身业务的发展,建设一些数据中心,用于部署自己的业务,这类数据中心有,但数量非常少,绝大多数互联网企业的数据中心也基本是建设在运营商数据中心内部,租用运营商数据中心的场地和机柜完成部署。
工业和信息化部《全国数据中心应用发展指引(2017)》
我国数据中心数量众多,从2010年的51万个增加到现在的近100万个,不过大型的数据中心并不是很多。拥有超过3000个机柜的大型数据中心2010年有164个,发展到现在超过300个,这些大型数据中心有近1/3都集中在北上广三地,经济发达的地方也是数据中心最为集中的地方,在新疆、西藏、青海经济落后的地方到现在还没有大型数据中心。
一个地区的经济水平越高,对建设数据中心越有吸引力。这几年,很多地方政府加大了引入数据中心的力度,推出了很多优惠的减税减负政策,吸引大家到当地建设数据中心,寄期望于通过数据中心拉动地方经济,一时间全国各地都陆续开工建设了很大一批数据中心。
大型数据中心建设现状特点
一、数据中心建设扎堆情况严重。大型数据中心基本都集中于北上广三地,每个城市的数据中心超过50个,每个运营商都有自己的数据中心基地,不少第三方数据中心也喜欢在这三地建设数据中心,另外像浙江、福建、江苏经济比较好的省区,也是数据中心建设较多的省份,建设数据中心的数量与当地经济发展情况密切相关;
二、每个省份基本都有运营商建设的数据中心,运营商的数据中心遍布全国,第三方数据中心难见踪影,数据中心市场仍然是运营商独大,给第三方数据中心服务商发展空间不大;
三、在内蒙古、甘肃、云南等经济欠发达地区,近期尽力吸引运营商来建设数据中心,这些地方新建了几个超级数据中心,这些数据中心全面投入运营,将有效改变当地的信息网络水平,随着北上广逐渐饱和,新建数据中心逐渐向其它省份倾斜,未来这种情况会更加明显,现在北京已经表明不再批准新建数据中心用地,这基本上关上了新建数据中心的大门。
四、我国大陆面积近960万平方公里,跨越亚寒带到热带多个维度地区,各个地方的温度和地形变化很大,但这些都不能阻止数据中心在这些地区的落地生根,强大的数据中心技术都可以解决这些外部环境问题,这些数据中心为生活在那里的人们带来了极大的便利,同时带动了当地经济的发展。
我国数据中心仍处于高速的建设发展时期,各政府部门对战略性新兴产业的大力扶持,以及对云计算、物联网、宽带和下一代网络的发展的高度重视,都给建设数据中心带来极大利好因素,尤其在二三线城市还有很大的发展空间,这些地方也迫切需要建设数据中心,可以确定是未来大型数据中心的数量会越来越多,在经济不够发达地方会建设越来越多的数据中心,全国数据中心数量分布上会更加均衡些。
数据中心基础架构注意事项
1.物理空间。无论服务器在主机托管设施中,还是云中部署,服务器都需要物理空间。随着数据中心越来越接近人口中心,因为空间的稀缺性,它正成为大数据运营和增长的限制因素。
当涉及到增长潜力时,不仅要认识到数据中心提供商的经营稳定性,还要能够获得空间,这样灵活的基础设施才可实现可扩展性和满足部署速度。
2.电力。如今每天产生2.5万亿字节的数据,全球90%的数据都是在过去两年中创建的。这一速度反映在数据中心的增长中。美国用电量达到了创纪录的357.85兆瓦--JLL称为“全球数据中心使用率仍然猖獗的势头”的延续。除了整体功耗之外,每台服务器的功率密度也在增加。不久前,每机架2kW是典型的;现在,这几乎不可能,每个机架需要30或40kW的密度。
随着企业及其IT基础架构规划的发展,还必须确保数据中心可以使用有效电力,因为并非所有电网都可以按需提供MW。数据中心还必须能够冷却高密度机架,这是相对较新的行业要求。如果你的企业重视数据中心的可持续性,另一个重要考虑是确保你的提供商提供先进的冷却技术,以降低功耗和整体碳消耗。
3.正常运行。对大数据运行的期望必须是“永远在线”。当“两分钟太晚”是大数据的工作方式时,基础设施的基本要求是100%的正常运行时间。在数据中心环境中,通过冗余设计都可实现正常运行。发生故障时,发电机和瞬时开关能接替当地基础设施的电力供应。100%正常运行时间是可以实现的,但风险依然存在。虽然额外的冗余可以通过额外的发电机和瞬时开关构建,但这些往往会以高昂的成本留给最终用户。
减少停机风险的新趋势来自使用人工智能(AI)和机器学习,以保持最佳性能的运营。Google在2014年首次利用人工智能追踪变量并计算其数据中心的最高效率。其他大规模数据中心也使用人工智能和机器学习来降低数据中心停机风险。AI融入托管生态系统旨在与现有员工一起工作,将人员和技术相结合。数据中心现在可以利用由数据中心技术人员进行培训的机器学习传感器和人工智能角色来确定可能发生故障的指标。
如果企业正在启动或扩展大数据计划,那么保持房地产,电力和正常运行时间的首要考虑是明智的。无论大数据业务是最终在本地,托管数据中心还是云中,灵活性,可扩展性,可持续性和可靠性的基础架构都可确保其成功。
网络质量、价格成本、建设运维水平都是选择数据中心时重点考虑的因素。网络质量方面,网络时延是影响数据中心业务选择的重要因素,价格成本受建设投入、运营成本及供需关系决定,一线城市数据中心供应紧张,租用价格相对较高,一线城市周边地区及中西部地区供应充足,价格相对较低;此外,选择数据中心时还需考虑建设等级、运维水平等因素。
总体来说,在选择数据中心时,首先考虑网络质量因素,如果开展的业务对网络时延的要求较高,可根据时延要求圈定一定的地域范围,进而综合考虑数据中心的价格成本及软硬件条件,合理进行选择;如果开展的业务可以容忍一定程度的网络时延,则可以考虑将业务部署在可用数据中心资源更为充足的地区,避免集中在一线城市,以合理配置资源,提升使用性价比,享受质优价廉的数据中心服务。