SD-WAN自诞生至今,外界各类声音不断,其中也不乏“SD-WAN究竟是否有前途”这样的犀利问题,李昕老师就该问题进行了深入探讨。
SD-WAN和SDN:相同的问题,不同的约束条件
我觉得既然置身SD-WAN行业之中的人都开始对前途感到忐忑,那么一定是这个行业遇到了某种瓶颈,而且一时之间找不到突破瓶颈的解药。
根据我粗浅的理解,这个瓶颈就是,留给已知形态SD-WAN的时间窗口已经不多了,但下一个时间窗口属于哪种技术或产品,大家并不清楚。
虽然SD-WAN和SDN都属于软件定义的范畴,但二者的定位截然不同。
SDN建立在一种全新的网络需求场景——超大规模数据中心交换网络的场景之上,传统的网络技术无论如何优化都没有能力去应对这种场景,即使投入巨量网络资源,传统交换技术的调度能力也无法将这些资源转化为说得过去的网络转发能力,而且成本极为高昂。
如果某个问题依靠网络资源趋近于无限的供给都无法解决,那么除了对网络技术进行颠覆式创新,就再也没有其他出路了。
改良式的优化只能在原有的方向、趋势和基础上做线性增量,但原有的技术内核和逻辑本身又构成了优化效能的天花板。改良的极致,便是唯有拼命奔跑才能留在原地。
当增量的空间被逐渐挤压到极限,除了技术革新,就再也没有其他选项了。
SD-WAN诞生的动力,也来自于网络基础设施在扩展性或者说扩张性方面面临的阻碍,这种阻碍表现为应用层对网络服务质量不断提升的需求与网络基础设施所能提供的尽力而为网络服务之间日益激化的矛盾。
这种矛盾中既包含资源供给数量不足的问题,也表现为网络资源调度技术在资源转化效率方面表现出的不足。
从这两个方面来说,SD-WAN和SDN面临的问题本质上没有区别。
二者的区别在于问题本身的复杂性以及解决问题的成本,也就是解决问题的约束条件。
对于广域网而言,无论是显著提升网络资源供给量,还是显著提升网络资源调度效率,都牵扯到一个超大规模复杂巨系统本身的演化问题,属于极为复杂的系统工程。即便面临的挑战类型相同,广域网都是一种和数据中心网络截然不同的物种,在演化到某种稳态之前,甚至没有人能说清楚技术发展的路线,更不要说预见具体的未来技术形态了。
所以亚洲四小龙驶上发展快车道的风险和成本要远远小于中国,中国的改革开放即使是走到今天,在已经被证明取得巨大成功的情况下,仍然需要保持巨大的勇气和创新精神,非发起二次改革不能保持攻击态势。
改革大背景下的改良没有终局
超大规模复杂巨系统不断冲击无人区的成功之道,是摸着石头过河。
没有人知道哪一块石头能够通向富强之路,哪一块石头的下面是陷阱和漩涡,但超大规模复杂巨系统的演化模式恰好就是这种摸着石头过河的模式,在微观层面缺乏明确指向性,但在宏观层面却能够聚合为前进动力的不断冒险和尝试。
这些变革性的尝试当中,既包含了改良和优化,也包含革命性的创新,二者互为表里。
洋务运动式改良只包含优化,但拒绝革命性的创新,因为革命性的创新终将颠覆旧的体制和机制,这和洋务运动的初衷本身是悖离的,自然也就不能被洋务运动所接纳。
现在正在发生的互联网技术体系的变革,是一种非常典型的技术革命,而非洋务运动式的改良,因此具体技术形态的演化也表现为改良和革新两种形态并存。
在相对封闭和独立的系统和场景中,技术体系切换成本和风险相对可控,革命性创新的投入产出比更高,改革比改良更适宜。
但在开放和混合异构的网络场景中,向后兼容性则是首先必须考虑的要素,激进的改革就要让位于循序渐进式的小步快跑。
SD-WAN更多是就是一种面向开放和混合异构网络场景的技术,因此保持向后兼容性是任何一种SD-WAN技术必须遵循的铁律。
即使是强大如谷歌这样的互联网公司,在涉及到开放系统互联的领域都保持了巨大的耐心和容忍度,外圆内方(Espresso),但在自己可管可控的数据中心网络、自有DCI以及应用层流控的范畴内则可以放开手脚游刃有余(B4,BBR,QUIC)。
这种在管理域内部快速变革而在管理域边界谨慎小步快跑的技术演进模式,也意味着广域网领域的每一次改良,都是内外矛盾运动共同推动的结果,都在为系统性的变革集聚力量。
这种改良既是旧问题的局部性解决方案,也在为下一次埋葬自己的系统性改革准备土壤。
无论是深孚众望的Segement Routing 还是被寄予厚望的SASE,都是整个互联网基础设施在变革过程中发生的技术改良,这些改良,远远不是变革的终局。
没有人知道变革的终局在哪里,也没有人知道覆盖现有SD-WAN技术的新技术将会是什么样貌。因此对于一家致力于SD-WAN的公司来说,无论是巨头还是中小企业,都很难利用在某一项具体技术上的优势获得长期红利。
依靠一两项独门招式闯荡江湖的创业公司,注定是没有前途的。更何况网络本身所具有的系统工程属性,也决定了网络世界中并不存在什么包打天下的独门秘籍葵花宝典。
唯有能够保持持续演化能力、快速发现新需求、解决新问题的公司,才有可能保持长期活力。
互联网以扩张为生,唯有扩张能对抗熵增。
所谓内卷,就是丧失了扩张的动力。
互联网的核心是开放系统互联,互联网运行的动力来自于不断接纳新的网络,或将新的领域纳入互联网范畴。一旦一家互联网公司不再具备向外扩张的能力,这公司便只能退化为网络公司,而不能再被称为互联网公司。
996、ICU,这些都只是互联网公司内卷的外在表现,内卷的原因,也不过是因为巨头体量过于庞大,与外部世界和其他开放系统的接触面指数级增长,但运行模式的演进还无法适应更为庞大的外部世界,以至于无法继续保持快速扩张的能力,不得不寄希望于通过提高人力资源的供给数量来破解困境。
这和电信运营商希望通过网络扩容、4G升5G来摆脱增量不增收魔咒的思路如出一辙,当然困境也如出一辙:封闭系统对抗熵增定律的困境。
在系统运行机制没有发生根本性改变以适应外部环境巨变的情况下,仅仅增加资源的供给量必然会导致资源转化率边际效用递减,直至归零。
在广域网这样的复杂巨系统当中,任何改良和改革都会面临巨大的不确定性风险,我们现在使用的网络技术,每一个脚下都踩着无数同类的尸体。
活下来的技术,因何而活,死去的技术,因何而死?
这个问题的答案并不复杂,活下来的技术,都顺应了开放系统互联的基本原则,能够赋予互联网继续向外扩张的能力,而死去的技术往往痴迷于内卷,却无法为扩张赋能。
这也是判断一家SD-WAN初创公司是否具有投资价值,或者某个大厂的SD-WAN产品是否具备长期生命力的唯一标准。
标准虽然简单,但在具体的运用上往往面临各种迷雾。
比如电信运营商的网络基础设施是否应该具备高度灵活的源路由能力这个问题,就往往会在技术层面引起激烈的争论,但如果跳出技术的视野,思考一下问题背后的问题,可能更有现实意义:
- 第一,电信运营商的源路由技术是为网络本身服务的(优化尽力而为的服务),还是为特定应用和业务服务的?
- 第二,如果是为特定应用和业务服务,那么这类业务和应用所需要的网络服务能否被清晰定义?
- 第三,这项网络服务目前遇到的瓶颈是网络资源不足问题还是网络资源调度效率不足问题,抑或是兼而有之?
- 第四,如果瓶颈在于网络资源调度效率,源路由技术能破解效率瓶颈吗?
- 第五,如果源路由技术能够破解效率瓶颈,其成本和风险如何评估?成本和收益的平衡点在哪里?复杂性和风险如何控制?扩展性如何保证?
- 第六,网络基础设施的核心价值是提供普适性的网络服务,也就是尽力而为的网络服务,注入面向特定应用和业务的网络服务,将会引入哪些成本和风险,服务于不同应用的特殊网络服务之间是否会出现冲突和竞争,会对尽力而为的网络服务产生哪些影响,这些冲突和影响如何应对?
我认为电信运营商以及设备制造商并非没有审慎考虑过上述问题的答案,只是在整个论证和思考的过程中,那个被服务的对象:应用,一直缺位没有发言的机会,而网络基础设施的核心价值应该体现在哪种网络服务上,也一直没有确切的答案。
以网络为中心的思维模式,天然趋向于优化内卷而排斥扩张以及未知的风险,因为扩张必然带来不确定性和不可控的风险,而最优化和不确定是不可能共存于一个系统当中的。
于是,上面那一大堆问题就可以归结为一个问题,一项看起来很不错的技术能否赋予电信运营商更强大的连接应用以及拥抱不确定性风险的能力?
尽力而为的网络服务不是贬义词,对于电信运营商来说,如何保持尽力而为网络服务与时俱进的能力可能要比提供特需服务更具有战略价值。
**因为尽力而为的网络服务也是最具扩张性和抵御风险能力的网络服务,是电信运营商有所为有所不为的平衡点,做好尽力而为的网络服务才是电信运营商的立足之本。
甚至电信运营商能否提供特需服务,能提供什么样的特需服务,也首先取决于电信运营商所提供的尽力而为网络服务的质量和水平。
皮之不存,毛将焉附。**
相比于令人眼花缭乱的各种新技术,我更看好电信运营商的云网一体和大管道战略,至于具体使用什么技术来践行这一战略,车到山前必有路,反而没那么重要。
我甚至认为,对于中国电信这个具体的电信运营商来说,云网一体战略的关键在于一个独立的电信云堤公司,因此中国电信下一步的发展方向非常值得期待。
这个问题的展开比较漫长,以后再讲。
要拥抱扩张的不确定性,就注定会排斥技术的复杂性
判断一项网络技术是否有价值的标准,不在于这项技术当前与需求的匹配度,或者技术本身的精致程度,而是其能否有效地控制复杂性,以及是否具备通过不断降低自身复杂性来获得控制风险和拥抱扩张性的能力。
网络技术的终极使命,是为互联网的扩张服务,而扩张的内核是借助不断兼容异构系统、陌生领域资源,获得麦特卡夫效应,产生指数级的增量,并依靠这种增量来完成更大规模的扩张。
虽然听起来有点庞氏骗局的味道,但庞氏骗局本身不存在麦特卡夫效应,不会产生价值的任何增量,一旦维持骗局的成本超过了扩张带来的增量便会崩塌,所以庞氏骗局的扩张半径本身有其无法逾越的界线。而互联网则是通过麦特卡夫效应激发出资源的爆发潜力和指数级价值增量来获得运转的动力,扩张半径没有极限。
这种扩张,既包含在同一个层面上的数量型横向扩张,例如扩大互联网用户数量,也包括跨越层次的纵向扩张,例如将交通运输系统和制造业也纳入互联网的势力范围。
但无论是何种类型的扩张,第一要务都是保持持续扩张的能力,而不是追求一城一地的得失。
而互联网保持持续扩张能力的前提条件,是将新的资源被吸纳的成本降到最低。
上善若水。
水善利万物而不争,处众人之恶,故几于道。
互联网降低扩张成本的唯一途径,就是把自己变得足够简单,简单到和谁都能搞到一起,不仅不需要别人付出什么代价,而且扩张的红利能够立即给对方兑现。
互联网+的核心,不是互联网冲上去改造这个改造那个,而是互联网通过不断的自我改造从而被其他行业快速接纳。
行有不得,反求诸己。
如果沉迷于通过不断提升封闭系统的性能和精致性来获得内部运行效率的提升,反而会不断增强系统与外界之间的壁垒,削弱对外扩张能力。
但引入复杂性对提升系统短期效率的作用又是如此显著,以至于工程师往往对复杂的改良毫无抵抗力。
在网络技术发展道路上,随处可见精致而复杂的尸体。
对于SD-WAN技术而言,复杂性是一剂诱惑力极强的毒药。
早期的SD-WAN控制器ODL和ONOS皆以大而全著称,但在生产环境的实践中,使用者们却发现这些庞然大物与现实需求并不匹配,one fit all的控制器只是一个美丽的传说。
SD-WAN是一种面向特定应用和业务的技术,并不适合替代网管系统的职能,因此一个趁手的SD-WAN系统首先是为特定应用和业务服务的,应该能够将网络资源抽象为特定应用和业务所需的网络服务。这其中又可以区分为网络应用和网络接口,网络应用直接面向业务提供网络服务,而网络应用对网络资源的调度则通过网络接口完成,这个接口就是通常所说的SD-WAN控制器。
SD-WAN控制器本身只是一个控制的接口,并不控制任何东西,也不附着任何控制的逻辑,这可能是SD-WAN领域最诡异的现实。
在同一个网络中,不同SD-WAN系统的差异主要体现在网络应用上,在网络应用之间不发生冲突且需要维护的网络状态信息简单的情况下,不同的网络应用自带控制器反而效率更高。
到底应该采用哪一种控制器,完全取决于网络本身以及网络服务的特点,菜刀制造商并不需要把自己生产的菜刀和具体的厨艺或菜肴捆绑起来,大厨更需要的是一把简单而纯粹的菜刀。
思科在Segment Routing详解一书中之所以对控制器进行了极为淡化的处理,可能也是出于这种考虑。
SD-WAN的生存之道在于不断寻找新的缝隙,而非专注于优化某个缝隙
一项好的网络技术,要么能够为特定应用和场景提供贴身服务,例如BBR,要么能够为使用者提供尽可能多的可能性,例如IP。
前者效能显著但普适性很差,后者普适性极佳但几乎无法对性能做出任何承诺。
世上从来就没有两全其美的技术,因此才需要用多层协议栈去将对立冲突的矛盾分解到多个层次。
SD-WAN虽然名字里带有网络二字,却是地地道道的应用层技术,也可以说是披着网络层外衣的应用层技术,或者应用层和网络层之间的一个夹层,而这个夹层存在的价值是填充由于应用需求和网络服务不匹配而产生的缝隙。
这很容易让人联想起MPLS技术,一个用来填补网络层和链路层之间缝隙的夹层。
但SD-WAN与MPLS的不同之处在于二者在网络协议栈中所处的位置。
MPLS工作在网络协议栈的底层,上下游协议栈以及场景需求相对稳定,因此MPLS本身的形态也能在大时间尺度上保持稳定,不需要频繁变身。
但SD-WAN位于网络协议栈的上层,上游应用演进迅速而起变化频繁,下游网络形态和场景也因时间和空间的不同而具有很大的不确定性,因此SD-WAN拥有更显著的case by case属性,自身并不能长期维持固定的形态。
虽然都置身缝隙之中,但MPLS所处缝隙的动态性更像是欧亚大陆板块之间的地质运动,而SD-WAN则是直接坐在了活火山上。
这就要求SD-WAN必须同时具备灵活性和最优化这两个对立冲突的属性,而解决之道只能是尽可能缩小问题域,降低问题本身的复杂性和不确定性,也就是在缝隙之中寻找和定位更具体的缝隙。
这类缝隙不仅狭小,而且生命周期极为短暂,即便在缝隙中追求极致也难久存。
对于SD-WAN的从业者来说,生存之道不在于能将某个缝隙的技术形态做到极致,而取决于能否快速发现新的缝隙并从中汲取能量。
小敌之坚大敌之擒,阵地战的打法,不适合SD-WAN。
而要敏锐地发现新的缝隙,就必须对上游应用以及下游网络设施的特性以及演化方向保持敏感性和预见性。
如果你想知道某个SD-WAN技术或初创公司是否有投资价值,不需要关注其技术细节,问问设计者或创始人对上下游发展趋势的理解程度就够了。
SD-WAN的前途取决于应用层和网络层之间相对运动的剧烈程度
现在可以回答本文开头的问题了:SD-WAN还有前途吗?
作为一种在夹缝中谋生存的技术,SD-WAN的前途取决于应用层和网络层之间的夹缝将会如何演化,但不会取决于某个具体的SD-WAN技术本身。
任何一种具体的SD-WAN技术或产品,其寿命都是非常短暂的。
那么,应用层和网络层之间的夹缝将会如何演化?
我认为从一轮技术革命的时间尺度和演化周期上来说,将会朝着越来越狭窄的方向演化,或者说,应用层需求和网络层服务之间的冲突将会通过两个层次的运动和磨合逐渐演化到一种新的稳定平衡状态,而这种新常态的标志性事件,我认为应该是应用层和网络层之间妥协出新的接口,以及尽力而为的网络服务演进到新的形态。
互联网的扩张特性决定了互联网技术体系只会向着简单、极简的方向演化,尽管在转折时期会产生混乱和冲突,为多样性和复杂的技术创造生存空间,但在每一次物种大爆发之后,都会迎来物种大灭绝,重新收敛到简单、平衡的状态,将网络扩张的成本降到最低限度。
网络的核心价值,仍然会回归资源属性。
一切网络技术的价值,几乎都是为了充分发挥资源的效能,但是能发挥多少,还是取决于资源本身的数量和质量。
巧妇难为无米之炊,穷日子富过只是个传说。
如无必要,勿增实体。能通过增加资源供给解决的问题,通常不需要劳动技术大驾。
尽管我认为经过这一轮互联网技术革命之后,应用层和网络层之间的缝隙会归于平静,但我也认为这一轮技术革命还远远没有发展到中场,我们只是处在热身阶段,中场将会发生何种战事,无人知晓,但是其剧烈程度以及表现形态一定会远远超出我们这一代人的想象。
尽管整个互联网都在追求极简,但应用层永无止境的贪婪却是推动互联网不断运动的重要内在动力,这种贪婪属性本身也是互联网扩张性的表现之一。
只要互联网仍然处在高速的扩张和运动之中,应用和网络之间的缝隙便会随之演化、层出不穷。
而能否发现和抓住这些缝隙,能否识别出高价值缝隙,就更加不是一个技术问题了。
不以物喜不以己悲。
与趋势共舞,其乐无穷。