1、數(shù)據(jù)中心流量趨勢(shì)
在移動(dòng)互聯(lián)網(wǎng)時(shí)代以前,人們上網(wǎng)接入帶寬也就是幾十到幾百 K,上網(wǎng)的主要目的是瀏覽網(wǎng)頁(yè)、聊 QQ、聽(tīng)音樂(lè),信息的流向主要是下行,規(guī)模不大,數(shù)據(jù)中心流量主要是南北向的流量;但是隨著移動(dòng)互聯(lián)網(wǎng)的到來(lái),智能手機(jī)的普及,4K 視頻、微信、視頻、語(yǔ)音、AR/VR等互聯(lián)網(wǎng)應(yīng)用等對(duì)網(wǎng)絡(luò)帶寬都帶來(lái)了巨大的增長(zhǎng),信息的流向不在是以下行為主了,上行和下行都在變大,數(shù)據(jù)中心除了南北向流量外,東西向流量也在同步增長(zhǎng);
下圖是 cisco 對(duì)未來(lái)數(shù)據(jù)中心流量的預(yù)測(cè),預(yù)測(cè)到2021年全球數(shù)據(jù)中心流量年增長(zhǎng)25%,Google 的數(shù)據(jù)中心流量從2008年到2014年增長(zhǎng)了50倍,百度近幾年數(shù)據(jù)中心流量的年增長(zhǎng)比例也在50%以上;
數(shù)據(jù)中心流量組成中,數(shù)據(jù)中心內(nèi)流量占比高達(dá)71.5%,在數(shù)據(jù)中心間占比13.6%,數(shù)據(jù)中心到用戶(hù)的流量占比只有14.9%;這么高的內(nèi)部流量占比,需要一個(gè)強(qiáng)有力的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)才能支撐。
2、數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)演進(jìn)
數(shù)據(jù)中心網(wǎng)絡(luò)在演進(jìn)過(guò)程中有很多種架構(gòu),以 Four-Post 和 Clos最為常見(jiàn),以下是 Facebook 公開(kāi)的兩種網(wǎng)絡(luò)架構(gòu)。
此架構(gòu)由4臺(tái) CSW 交換機(jī)組成一個(gè)網(wǎng)絡(luò)集群Cluster,在 Cluster 內(nèi)每臺(tái) RSW(即 TOR) 交換機(jī)有4條鏈路上行至 CSW,網(wǎng)絡(luò) Cluster 間通過(guò) FC 交換機(jī)互聯(lián);該架構(gòu),通過(guò)復(fù)制 Cluster可以滿(mǎn)足大規(guī)模服務(wù)器組網(wǎng)的需求,但該網(wǎng)絡(luò)在某些方面有些不足,如
1)在冗余度上,單臺(tái) CSW 故障流量損失25%;單臺(tái) FC 故障Cluster 間流量損失25%;
2)Cluster 集群規(guī)模由 CSW 設(shè)備端口容量決定;
3)該架構(gòu)收斂比較高;
4)CSW 設(shè)備一般是大型框式設(shè)備,供應(yīng)商少,CAPEX 和 OPEX高;
5)核心設(shè)備軟件問(wèn)題和定制化開(kāi)發(fā)難度大;
CLOS Fabric
此架構(gòu)由三個(gè)層級(jí)的交換機(jī)組成,分別是 Spine SW、Edge SW、RSW。每4臺(tái) ESW 和48臺(tái) RSW 組成1個(gè) Server Pod,每 RSW 有4條鏈路上聯(lián) ESW,每臺(tái) ESW 上聯(lián)一個(gè) Spine 平面;該架構(gòu),通過(guò)復(fù)制 Server Pod 來(lái)擴(kuò)展網(wǎng)絡(luò) Cluster 集群規(guī)模,集群擴(kuò)展很靈活,可支持的服務(wù)器規(guī)模大,設(shè)備和鏈路的冗余度也大,可靠性高,且網(wǎng)絡(luò)Cluster 集群內(nèi)無(wú)收斂比,網(wǎng)絡(luò)吞吐能力高,但在管理運(yùn)維方面復(fù)雜度高,需要部署 SDN 等自動(dòng)化的管理運(yùn)維手段。
百度數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu);下圖是百度在2017年以前的數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),架構(gòu)和上述 Four-Post 相同,該架構(gòu)的特點(diǎn)如下:
1)網(wǎng)絡(luò)Cluster集群的截面帶寬(BBW)有100X Tbps;
2)TOR 層級(jí)有3:1的收斂比;
3)網(wǎng)絡(luò)可靠性,單臺(tái)Leaf設(shè)備故障 影響一個(gè) POD 的25%流量;單臺(tái) Spine 交換機(jī)故障,影響整個(gè)網(wǎng)絡(luò)集群1/8的流量;
4)CLOS 內(nèi)部互聯(lián)鏈路多,運(yùn)維監(jiān)控是個(gè)挑戰(zhàn);
下圖是百度現(xiàn)在的 CLOS 架構(gòu);架構(gòu)同 Facebook 的 Clos 架構(gòu)類(lèi)同,但Leaf 節(jié)點(diǎn)、Spine 節(jié)點(diǎn)仍采用大型的商用框式交換機(jī),后續(xù)會(huì)使用自研交換機(jī)替代。這個(gè)架構(gòu)特點(diǎn)如下:
由上述網(wǎng)絡(luò)架構(gòu)演進(jìn)可見(jiàn),不管是Four-Post 架構(gòu)還是 Clos架構(gòu),在數(shù)據(jù)中心內(nèi),網(wǎng)絡(luò)設(shè)備和光互聯(lián)鏈路的數(shù)量非常多,如何有效的進(jìn)行網(wǎng)絡(luò)和鏈路的運(yùn)維是我們面臨的巨大挑戰(zhàn)。
數(shù)據(jù)中心光互聯(lián)網(wǎng)絡(luò)運(yùn)維實(shí)踐
首先,數(shù)據(jù)中心光互聯(lián)網(wǎng)絡(luò)運(yùn)維都有哪些挑戰(zhàn):
1)光互聯(lián)覆蓋范圍廣;1Xm ~100X Km;
2)光互聯(lián)鏈路數(shù)量和類(lèi)型很多;在100m 上,有 OM3/OM4,模塊有 SR4、ESR4;500m 距離,有單模光纖,PSM4、CWDM4模塊;2KM 的數(shù)據(jù)中心園區(qū)場(chǎng)景,有單模光纜、CWDM4、LR4光模塊;數(shù)據(jù)中心間,隨著距離的增長(zhǎng)也有不同的技術(shù)應(yīng)用,LR4、10G DWDM 彩光、200G OTN 等;
3)難以用一種監(jiān)控手段覆蓋所有的技術(shù)類(lèi)別,存在多種監(jiān)控系統(tǒng)和平臺(tái),運(yùn)維效率低。
然后,百度針對(duì)這些不同互聯(lián)場(chǎng)景的運(yùn)維實(shí)踐,如下:
1)設(shè)備或模塊故障,采用 基于設(shè)備SYSLOG 日志分析的運(yùn)維監(jiān)控方法,針對(duì)設(shè)備上報(bào)的日志來(lái)及時(shí)監(jiān)控運(yùn)行狀態(tài);
2)針對(duì)鏈路類(lèi)的故障,采用自動(dòng)化 ping 程序來(lái)監(jiān)控鏈路狀態(tài),同時(shí)部署了多個(gè)路由協(xié)議探針做鏈路級(jí)故障的分析和判斷;
3)針對(duì)鏈路的誤碼和丟包等質(zhì)量問(wèn)題,部署了2套網(wǎng)絡(luò)質(zhì)量監(jiān)控系統(tǒng)來(lái)監(jiān)控,一套是部署在網(wǎng)絡(luò)核心 IC層級(jí)的天網(wǎng) 監(jiān)控系統(tǒng),實(shí)時(shí)監(jiān)測(cè)鏈路的誤碼和丟包情況;另一套是業(yè)務(wù)部門(mén)在服務(wù)器上部署的 Net-radar 系統(tǒng),實(shí)時(shí)感知網(wǎng)絡(luò)質(zhì)量異常;
最后,SDN 的部署,整合了上述傳統(tǒng)網(wǎng)絡(luò)監(jiān)控工具,基于 SDN/IBN 的思想構(gòu)建了智能管控編排中心,下圖是框圖:
SDN系統(tǒng)實(shí)時(shí)采集網(wǎng)絡(luò)設(shè)備各種配置和狀態(tài)數(shù)據(jù);包括單不限于,資產(chǎn)、配置、拓?fù)?、流量、日志等?/span>
整個(gè)系統(tǒng)是個(gè)閉環(huán)系統(tǒng),當(dāng)監(jiān)測(cè)到網(wǎng)絡(luò)異常時(shí),根據(jù)不同的策略進(jìn)行業(yè)務(wù)編排,下發(fā)控制命令,故障隔離,編排處理流程策略;自動(dòng)或轉(zhuǎn)人工處理;在處理過(guò)程中,自動(dòng)校驗(yàn)檢測(cè)、自動(dòng)恢復(fù)上線(xiàn)和流量調(diào)度;全程都是現(xiàn)場(chǎng)的人和機(jī)器人交互,提高溝通效率;
4、從運(yùn)維角度對(duì)數(shù)據(jù)中心光互聯(lián)網(wǎng)絡(luò)的技術(shù)需求
1)我們希望設(shè)備商、模塊商、系統(tǒng)商,更加開(kāi)放,讓用戶(hù)擁有自主權(quán),可在內(nèi)部編寫(xiě) APP 或 AGENT,自定義管理控制功能及接口,提取或主動(dòng)上報(bào)各類(lèi)運(yùn)行數(shù)據(jù),加速數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維自動(dòng)化進(jìn)程;
2)我們希望 IP 和光能夠進(jìn)一步融合(軟件或硬件層面),便于 SDN 統(tǒng)一管控,為業(yè)務(wù)提供多層次的控制策略。