当前,随着数字经济蓬勃发展,数字信息和技术在人们工作、生活中扮演着越来越重要的角色,而由此引发的网络安全问题日趋严重。据国家互联网应急中心(CNCERT)报告显示,2022年上半年,我国境内遭篡改的网站有近 30,706个,其中被篡改的政府网站有 166 个,被植入后门网站数量12,247个,被植入后门的政府网站90个。政府、企业面临的网络事件如:安全漏洞、恶意程序、网页仿冒、网站后门、网页篡改、网页挂马等问题层出不穷,这些迫使政府、企业不得不重新审视网络安全风险带来的巨大影响。
中云网安科技有限公司(以下简称:中云网安)是一家人工智能网络安全技术创新企业,具有全球独创的对未知网络攻击防御的核心算法——中云网安AI算法,致力于成为智能安全技术先行者与行业引领者。经历十二年底层算法攻坚,八年网络安全算法研发,成为全球率先实现对未知攻击防御能力的产品化企业,产品已服务金融、运营商、政企等不同行业近百家客户。
中云网安AI防护者平台应用于构建WEB应用层安全防护,利用机器学习为web系统构建的安全模型,防护漏洞扫描、跨站脚本攻击XSS、跨站请求伪造CSRF、远程代码执行、SQL注入、目录遍历等已知和未知的web应用层攻击。AI防护者平台是以AI算法为驱动力,以零信任策略为基本原则,通过提供入口安全算法模型,学习被防护对象的网站功能、用户访问和HTTP/HTTPS协议等多重逻辑,为网站建立“量体裁衣”的安全防护模型,实现对外部攻击的100%抵御。同时,开创性的将数据之间关联的行为特征作为学习的依据,全自动生产特征,实现算法自适应,颠覆传统的安全和业务相分离的方式,将AI核心作为开发模块嵌入到应用开发中,加固应用自身安全,真正从“根”上解决应用的安全问题。
在构建安全防护模型的过程中,AI 防护者平台需要实时解析、检测和决策处置大量Http和Https流量和数据,比如将前端访问流量实时同步给后端应用,及时阻断攻击流量等,从而实现对业务连续性的影响降至最低,因此对承载业务的底层IT设施提出了更高的要求:
●高吞吐量:Web应用数据流需要满足多个Web应用高性能并发计算的挑战,单实例节点高峰期平均可达1万/秒。
●低时延:为应对用户延时无感知,平台对数据实时处理要求极高,需要毫秒级完成数据的处理。
●高可靠:网络数据涉及信息安全管理,对可靠性要求非常高,服务一旦宕机,就会造成业务中断,影响重大。
鲲鹏平台天生的多核多并行能力,能够很好的满足高吞吐量、高可靠和超低时延的要求,低功耗能够节约更多成本;此外,鲲鹏同时提供完善的DevKit开发套件以支撑应用的快速迁移、开发、编译和调优。
【AI防护者平台架构图】
基于上述考虑,中云网安选择鲲鹏作为AI 防护者平台的数字底座,并在鲲鹏上原生开发AI防护者平台的核心组件——高性能AI引擎。通过该方案实现HTTP/HTTPS流量数据的机器学习和智能处理等主要功能。
基于DevKit代码迁移工具实现AI防护者平台快速迁移
在项目初期,开发人员需要将AI防护者平台快速迁移到鲲鹏。但平台包含的依赖文件高达170个,无法快速获取鲲鹏兼容生态,手动查找、编译效率太低。通过鲲鹏DevKit代码迁移工具可以直接获取软件的兼容性依赖库,代码修改建议一键替换,免除了手动编译。整个系统只用了1人天完成了迁移,平均每个服务0.5人天即可完成自动迁移。
【鲲鹏DevKit代码迁移工具扫描获取迁移报告】
基于DevKit高效开发高性能AI引擎,性能提升55%
迁移完成之后,针对Web应用实时流量学习、实时建模、实时检测拦截的主动防御场景需求,中云网安在鲲鹏平台上新开发高性能AI引擎。高性能AI引擎用于协议解析、行为识别、多级决策、安全模型构建,是AI防护者平台的核心组件。由于AI引擎需要对应用层访问流量进行解析检测,进行多级决策完成流量处置,同时进行机器学习实时构建安全模型,所以对性能要求极高。
基于上述挑战,为进一步提升业务性能和稳定性,中云网安将之前使用的开源GCC编译器替换为鲲鹏DevKit提供的GCC for openEuler,作为高性能AI引擎源码的编译和驱动程序,GCC for openEuler是在开源GCC基础上针对鲲鹏平台进行质量加固,提供鲲鹏微架构芯片及指令优化、高性能计算典型应用性能深度优化、支持自动反馈优化等多重优化提升,通过软硬协同提供相较开源GCC更高的性能。
此外,在编译完成之后,开发人员还使用了鲲鹏DevKit性能分析工具针对高性能AI引擎中的关键模块——协议解析引擎和行为识别引擎进行了性能调优:
●通过进程线程分析发现了吞吐量瓶颈点,进一步分析出alertsync、wsrep_sst_rsync任务模块通讯数据处理存在延时,进而进行了优化,将多个核结成一个节点,每一个节点相当于是一个对称多处理机(SMP),一块CPU的节点之间通过On-chip Network通讯,不同的CPU之间采用Hydra Interface实现高带宽低时延的通讯,调优之后数据处理&吞吐量都得到了提升,吞吐量指标值提升25%;
●通过热点函数功能对系统进行分析,分析报告中查看各CPU指标的相关数据分布情况,识别出CPU单次利用率高和两处热点函数占比较大的瓶颈,并给出了优化建议,解决了CPU瓶颈问题,提高了平台运行性能。
【通过鲲鹏DevKit优化(编译器替换+调优)高性能AI引擎的性能对比】
通过上述的优化分析,对比鲲鹏DevKit优化前,协议解析引擎和行为识别引擎的关键数据得到了极大的提升,HTTP最大请求数提升了近50%;接收数2620KB;发送数1052KB;吞吐量达到9453,提升近55%。通过高性能AI引擎的性能提升,AI防护者对流量处置效率、机器学习效率以及应用安全模型构建效率得到大幅提升。
中云网安AI防护者平台已服务金融、运营商、政企等不同行业近百家客户,在全国多省市落地。该方案也在鲲鹏应用创新大赛2022北京赛区初创应用赛道获得了一等奖荣誉。这不仅验证了该平台的高性能、高兼容性、完整性和成熟度等技术优势,也标志着中云网安科技有限公司产品在鲲鹏计算应用创新、产业融合、市场应用方面达到领先水平。
作为鲲鹏计算产业生态重要伙伴,中云网安希望与鲲鹏生态创新中心建立长期合作关系。未来,鲲鹏将继续坚持“硬件开放、软件开源、使能伙伴,发展人才”的生态策略,通过最新的技术使能伙伴联合创新,打造更具竞争力的行业解决方案,促进千行百业数字化转型。
鲲鹏原生开发是指使用鲲鹏DevKit的原生开发能力,如鲲鹏开发框架(含场景化SDK)、编译调试工具、云测服务、调优&诊断工具等,在鲲鹏平台上开发新软件/新功能,充分发挥鲲鹏架构优势,从而获得开发效率/运行性能提升。未来,鲲鹏DevKit将持续增强开发体验、优化工具能力,提升鲲鹏开发效率,促进千行百业数字化转型。
【扫码登录鲲鹏社区DevKit专区,了解更多】