63

数据中心要考虑的四要素:成本、技术、简洁、可重构

 5 years ago
source link: https://www.linuxprobe.com/4-data-center.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
导读 我们今天有必要重新复述一个话题:建议是把数据中心切分为传输结构和互连结构两个部分,在传输层采用 WDM 有源架构,而在互连层坚定地采用平行的PSM结构(包括平行光和平行电)。我们确实看到类似FB 的架构是十分简洁,但是高成本的。所以我们也有必要论证成本经济性和架构经济性之间的关系。

100G 数据中心正在趋向成熟,不管是从哪个角度,其中的技术都在趋于完美。100G 数据中心已经可以承载大多数我们想要的事物,但是它最多是装载人类生活的记忆和精神粮食,我们确实看到了一些计算的存在,但类似这样的计算和上个时代的超算并无二异。如果我们不搞清楚数据中心应用的目标,我们就不可能设计一个技术和应用相互匹配的数据中心。


光互连技术从100G 正在走向200G 和400G ,也许我们可以说,100G 光互连也只是到2018年才达到稳定的性能。所以我们基本可以断言,在此之前建设的100G 数据中心都是危楼或建立在沙地上的房子,我们必须意识到这个存在的风险。

当下的大型数据中心基本沿袭了上个时代的100G CWDM4结构,并伴随AOC 和DAC。我们今天有必要重新复述一个话题:建议是把数据中心切分为传输结构和互连结构两个部分,在传输层采用 WDM 有源架构,而在互连层坚定地采用平行的PSM结构(包括平行光和平行电)。我们确实看到类似FB 的架构是十分简洁,但是高成本的。所以我们也有必要论证成本经济性和架构经济性之间的关系。我们所要做的必须找到一种原则的排序关系,从而指引我们在困难取舍中做出最佳抉择。

100G CWDM4成为爆品是付出高昂代价的。主要的原因是上个时代光芯片的稳定性和一致性欠佳。在上个时代,数据中心光互连处于毫无标准时期。(好在,至少我认为,易飞扬在2018年8月份为该款产品设计的标准是符合预期和应用的)现在业界都明白:可靠性、产品寿命和维护成本这些是彼此关联的。目前的结论基本支持CWDM4从技术实现上符合100G 数据中心主流的特征,比较节约光纤,从维护多个不同款式产品到维护一个等等。但是从不同角度,这酷似简洁架构的结论也有问题:

一、成本昂贵:

在计算互连架构的时候我们倾向于不计算光纤的成本,因为计算这个成本处于本末倒置,引导我们的思维朝不能再土的方向。正如我们在构造大厦的时候,不会考虑要用多少涂料一样。光纤是为系统服务的,正如涂料是为大厦服务的,或者粮食是为人类三餐服务的一样。在互连的所有架构中引入WDM 技术,需要支付至少2-3倍模块的成本。

二、总成本不经济:

我们之所以不倾向在互连架购中采用更多波分复用技术是因为密集网络的信号分层最好是清晰的,可调度的。波分复用模块主要是通过AWG或者自由空间光学技术把光纤成本砍掉3/4,但是它带来高度的生产投入和工业界良品率问题。生产成本投入和良品筛选率牺牲了业界利润率。事实上我们了解到绝大多数互连的距离还是500米之内,所以节省的光纤成本也是有限的。

三、维护成本是否经济:

争议在于维护的经济性。维护的经济性在于产品的稳定性和网络可重构性。从产品稳定性角度,目前CWDM4 的产品都在趋于成熟和可靠,但是和PSM类模块还是差别一个数量级。当然这个数量级数据中心可以不考虑。那接下来就是网络的可重构性。所谓重构就是在原来的地方推倒重来,是否还有剩下的东西。从人类绿色经济性的角度,如果要在本来的地方升级现有网络,则我们有必要接下去论证未来的网络架构到底应该是什么模样?然后我们回来检验这里的结论。

二年前我写过《数据中心:平行还是波分复用》招致了一些批评。实践中数据中心也正在走向CWDM4 覆盖PSM4的结构。正如人类走过的道路一样,正确的视野被错误的路线取代非常常见。一个从贫穷中长大的孩子肯定和出身富贵的孩子在世界观和金钱观上完全不同。2018年的OFC 人们确实热炒了一把400G,但是它的确是不成熟的。按照2018年初对400G 的理解,基本是跳过PAM4技术直接采用 100G 单波DSP 技术植入400G 模块。也就是跳过200G 直达一种超乎想象的400G ,这个跳跃不是一代,而是两代,现在我们知道这种愿望显然是太过于乐观了。

从NRZ 到PAM4 再到DSP 是一个渐进型跨越,还是一步可以到达终极目标的跨越?我们还是要回到是传输还是互连本身去讨论。我认为前两者是互连架构,而到DSP 基本就是传输领域的事情。

DSP 要处理的工作和PAM4调制有根本的区别。DSP 是否能在客户侧模块走向成功仍旧是未知数,我基本难以理解如果不对链路光层做任何处理,如何能采用DSP 去处理收回的信号畸变。当然正如我很多看法被时代的进步逐步校正一样,尝试争论、探索和试错正是人类技术和市场进步必经的领地。抛开对技术实现的不可预知,我们有4个分析架构,覆盖了200G和400G 网络:
分析之一是200G NRZ 的架构,这是一种采用8路平行信号的架构。优点是成本很低,密度很高,缺点是:光纤数量带来的物理布线复杂性和一次性成本投入较高。

分析之二是 200G PAM4的架构,这是一种在电域做调制技术革新的FR4架构 。优点是成本适中,密度很高,相对于NRZ 架构去掉了大量光纤。缺点:如果有的话,和100G CWDM4雷同。

分析之三是 200G/400G 混合架构,这种架构将采用PAM4技术+8路复用的FR8 技术。优点是成本均衡,密度极高,光纤数量极少。缺点:光学结构和模块性能的稳定性待察。

分析之四是:400G SIIICON 架构,这种架构借助SILICON 技术平台可以实现理想的100G 单波传输,且不需要采用DSP。这种架构的优点显然是成本经济、密度适中、网络高速而简洁。缺点是SILICON 光模块属于替代性技术,尚需要时间孕育。

由此我们有一个小结:

1)纯粹100G CWDM4 架构的演进是200G FR4 ,再往下是无法演进的,必须重新布线或增加光纤资源。
2)100G PSM4网络架构的演进是 200G DR4 或者200G SILICON DR4 ,也可以持续演进为400G DR4。
3)200G NRZ 8路的网络提供了富裕的光纤资源,未来演进不是问题,将很可能浪费掉一半光纤资源
我们目前没有关注一个流行的400G 网络结构:400G DR4+400G FR4 ,基本上我们认定这个架构极其难以实现。这个架构是人们超越技术难度的美丽幻象,从实用角度也不一定是经济的。

我们理解人们(也包括我们自己)一直在找寻一种简洁、可重构以及成本经济的数据中心,但是人们的排序通常是:简洁===可重构===成本===技术可实现。这违背了事物规律。实现违背事物规律的结果就是额外的开支。人类的确没有什么做不到的,很多时候是不惜成本的任性。从专业的角度我们最好是:成本===技术===简洁===可重构。

成本:数据中心必定必须成本导向。人类只有围绕成本导向的经济是最合理且符合整体收益的。由于经济的出发点是成本和收益的关系。不计成本的产业结构扭曲了技术和简洁性以及世界秩序。

技术:技术是有其实现的时间进程的,不同期技术的使用和成本呈现对应的关系。成本决定了技术规模。而不是强行为一种技术去刻意降低成本。比如我们为太阳能和电动车强行推进技术规模,从而降低成本,让人类付出了极其高昂的代价。

简洁:简洁性不能泛泛去看,或从表面去看那一种幼稚的简洁。简洁性是一种过程设计的结果,它不能成为一种初衷。我们说设计必须简洁是指:蕴藏所有能力和技术之后,找到一种简洁的表达。简洁是一种把复杂抽象后的艺术。表面的简洁可以理解为涂鸦也可以理解为一知半解。

可重构:可重构是非常困难的。人类走过的技术路线表现,技术和网络都是不可重构的,这的确造成了大量浪费。可重构使命要求人类必须按照计划去做生产和投入。无节制浪费为本的市场经济本质是不可重构的。目前人类还无法做到技术的可重构,所以我们与其把计划做好,也不要去想如何重构!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK