在金融圈,资产管理行业是一个发展极其迅速的细分领域。实现资产管理规模上千亿,在国内74家基金管理公司中资产排名前十,工银瑞信做到这一步,只用了不到七年时间。
在这七年中,业务飞速发展的需求让工银瑞信的IT不得不“加速快跑”,但公司所配备的专业IT人员却始终非常有限。为了解决这一矛盾,且不让工银瑞信的IT在这种快速发展中 “跌倒”,他们开始一步步尝试虚拟化,进而过渡到“私有云”。
IT一直在“跑”
“从公司成立到现在,整个IT一直在‘跑’。”专门负责信息化工作的工银瑞信基金管理有限公司执行董事张轶告诉记者,这几年工银瑞信业务的飞速发展一直在逼着IT“向前跑”。公司成立之初,系统数据量只有600GB,但是现在这个数字已经变成了200TB,而明年一季度就会突破300TB。
从刚成立时的几台小型机和机架式服务器,到现在的60多台IBM小型机,200多台服务器,6000多个信息点……7年时间,几百倍的数据量增长带来了工银瑞信数据中心的多次扩建。但在公司内部,支撑2家子公司、3家分公司及总部整个IT系统稳定运转的专业工程师却只有12个人。虽然按照金融行业监管机构的要求,这样的人员配备刚好达标,但面对如此规模的基础设施,仅靠12人来管理依旧是难以想象的。然而现实是,这12个人里负责管理基础设施的却只有3人,其他人的主要工作则是做项目管理、应用管理、系统分析等。为张轶团队解围的,正是“私有云”。
和很多金融行业中追求稳健的用户一样,工银瑞信的“私有云”尝试也非一蹴而就。在应用新技术之前,他们也经历了反复实践的过程,才一步步走向了私有云。
工银瑞信的IT基础架构,一直在随着业务的快速发展而扩张。按照张轶的说法,起初6个人管几十台服务器都管不过来,每天都要到处“救火”。为了提高个人管理效率和管理能力,张轶和他的团队开始尝试将服务器虚拟化,结果发现这种方法能极大地释放生产力和管理能力。但是由于最初并没有想到大量刀片服务器对电力、空调、散热和机房承压会产生很高的要求,所以一直无法实现规模化地虚拟化,应用也有局限性。
直到2008年,借助数据中心搬迁的机会,工银瑞信才开始决定逐步实现服务器的全面虚拟化。金融业务不敢过于冒险,所以最初只是把测试系统、内部系统和非重要系统迁移到了虚拟化环境中,但这个过程却让技术人员得到了一次管理和维护技能上的飞跃。“我们花了1年多的时间培训技术队伍,让大家习惯并且接受,同时也能更好的利用虚拟化技术。到了2010年年底,我们才开始进行大规模的虚拟化迁移。”在张轶看来,云计算带给企业的***风险是IT管理和运维方式的变革,在尝试虚拟化、进行测试、应用迁移实践和培训的过程中,他们不断发现问题、解决问题,这些过程都为日后工银瑞信顺利过渡到私有云打下了坚实的基础。
在应用虚拟化技术时,张轶和他的团队也经历了不少难题。比如在服务器实现全面虚拟化的过程中,他们发现异构计算平台的虚拟化要想实现未来灵活非配资源的目标是难以做到的,所以就将服务器尽量统一更新为基于英特尔E7处理器家族的IBM 3850 X5服务器,可根据自己的实际情况对目标工作负载进行自定义的配置。
在应用迁移的过程中,起初工程师们普遍认为要实现系统100%的虚拟化。但在实际操作时却发现问题很多,造成数据库效率、中间件效率低下,在切换的过程中难以保证数据完整性等,如果非要实现数据库虚拟化反而会增加系统的复杂度。经过反复实践,他们终于找到了虚拟化技术应用的平衡点。
张轶回顾上述历程时,就总结道:任何一个好技术都有它适用的范围,最适合的其实才是***的。在企业尝试云应用的过程中,一定要看清这一点,避免技术上的“洁癖”,让恰当的技术应用在恰当的地方。而且,基于英特尔架构的虚拟化在管理的方便性和资源调配的便捷等方面具有突出优势。以前一个工程师可能只能管理为数不多的物理服务器。现在由于标准化的应用,可以管理上百台甚至数百台虚拟服务器,并可以进行便捷的部署和分配,这是以前在纯物理环境中做不到的。
解决基金公司快速成长的烦恼
工银瑞信的数据中心目前承载着90多套应用系统,目前超过2/3的系统都是运行在虚拟化环境中的。基金行业有一个特点,应用对IT资源的占用在白天和晚上有巨大的区别:白天交易密集,会占用大量处理器资源;晚上系统主要进行批处理类的操作,需要耗费大量内存。“虚拟化之后,我们可以更轻松的调配IT资源。非常简单就可以完成处理器、内存、存储在不同系统间的调配,资源的释放、回收可以完全实现自动化,管理压力就会小得多。”
张轶认为,用3个人管理全部基础设施,没有虚拟化技术的支撑是做不到的。随着计算技术的发展,现在x86架构的服务器与RISC架构小型机在计算性能上的差距已不再明显,在高可用性的问题上,虚拟化反而更有优势,因为一旦物理机器出现故障可以随时迁移到另外一台机器上,应用不会停机。而且,实现不断线的无缝应用迁移,只需点鼠标这样的动作即可完成。
每年年底,都是基金行业的“战争期”,各基金公司争排名的时候,也是IT部门最忙的时候。从产品的提出到发行,一般时间只有2周,2周IT部门要完成系统的开发、测试、上线、部署等一系列工作。由于开发测试的时间一般很难压缩,张轶和其团队总是不得不想方设法压缩上线部署的时间。在规模化应用虚拟化技术后,数据中心实现了标准化的IT资源采购和分配机制,上线布署的时间也变成了按分钟计算。在张轶看来,虚拟化只是云的初级阶段。真正的私有云应该是一个集大成的结果,包含了对存储、计算、网络的虚拟化,对前端虚拟化,对应用的虚拟化,通过云发布出来的则是各种应用和服务。去年,工银瑞信进行了私有云应用的***步尝试,将内部办公系统以云应用的方式发布到门户网站上。张轶暗示,如果一切顺利,未来他们还会继续尝试将生产系统搬到云中。
“基金行业是高压行业,基金公司的IT部门也是高压部门。”张轶直言,基金公司与银行不同,IT人员资源不足的问题逼得基金企业的IT部门不得不去尝试新的技术,以解决业务快速发展与IT支撑力不足之间的长期矛盾。基金行业内的企业要想快速成长,必然要掌握虚拟化、私有云这类能够扩大个人管理范围、降低管理成本的技术。