中新經緯7月3日電 題:企業實施云邊架構上云面臨哪些問題?
(資料圖片僅供參考)
作者 李向輝 騰訊云分布式云負責人
“十四五規劃和2035年遠景目標綱要”指出,要協同發展云服務與邊緣計算服務。近年來,技術的升級使得云邊協同向云邊端一體化協同演進,驅動計算處理向邊端擴散,推動算力多層級、泛在化發展,同時與網絡、數據、AI深度融合,構建企業新型IT基礎設施“操作系統”,支撐企業進行數字化轉型勢在必行。因為用戶實施云邊架構面臨著一些問題和核心挑戰。
首先是位置的分散性。各行各業都有中心云的服務;其次是場景的多樣性,現在有些場景基于IDC(互聯網數據中心)部署穩態業務,希望云廠商能夠提供彈性資源。工業場景有中心工廠和各地分布在全球或者各個地域的工廠,需要通過中心管控解決各個工廠和生產車間中的IT設備交付和運維。例如車聯網企業在做自動駕駛的時候需要將業務發送在邊緣車機,通過5G聯網在斷網的情況下可以保證服務完全穩定運行。
但在這種情況下,中心云IDC甚至邊緣場景的能力是不一樣的。中心云的彈性能力怎么在IDC使用,邊緣的情況下怎么自治,如何應用同樣的IDC PaaS(平臺即服務)服務治理能力,都是亟待解決的問題。
用戶實施云服務的時候往往會建立許多集群。但云服務給客戶提供的集群中包括上層應用治理、彈性調度和分布、利用率的提升都需要客戶解決。因此,用戶希望被提供一種Serverless(無服務器)服務,但建立這樣的集群,IDC同樣需要建立K8S(編排容器的工具)獨立集群。多個集群需要同樣的權限管理、應用分發,而且要把不同能力進行對接,用戶需要負責K8S版本升級、節點運維等等。那么,資源異構形態的多樣就會導致集群形態管理非常復雜,無法實現統一管理,即便通過S集群把這些資源進行統一屏蔽,也無法真正實現客戶視角的一朵云統一調度和管理。正常情況下,K8S調度是基于Request(計算機用語),因此,無法做到基于實時負載而進行感知和調度。也無法解決不同優先級的節點以及邊緣自治的能力,邊緣網絡斷開等問題。
眾所周知,Serverless是基于運維流量觸發,IT運行成本是有預算機制的,但經常出現因為業務流量彈性伸縮導致的成本不可控。只有獨創的超級節點,提出獨特資源包的概念,在這樣的資源付費的規格情況下才可以選擇云上的任意規格,把預算體系和運維體系進行打通。
業務部門利用AI模型訓練為了提升最大性能,需要基于不同GPU型號和數量進行模型調優。但是會出現每個卡和模型都要進行部署和發布,而完成一次部署和發展甚至需要兩三周的時間。通過注冊節點,所有GPU資源看到的將會是統一卡號、統一資源型號,不需要用戶再去針對不同的機型、不同的卡數進行調優,進行部署發布確認,極大地簡化部署發布的效率。
總之,云原生分布解決云邊架構,整體上還是通過云原生分布式真正實現屏蔽資源、承接應用,就是通過三項核心能力:通過TKE集群實現任意位置、任意形態的統一管理;通過數據服務實現云服務一體機的延伸,把最新特性交付到用戶IDC和現場;通過一站式的運維管理中心管理用戶應用,讓用戶真正實現任意基礎設施享受云廠商服務的生態。(中新經緯APP)
本文由中新經緯研究院選編,因選編產生的作品中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其它方式使用。選編內容涉及的觀點僅代表原作者,不代表中新經緯觀點。
責任編輯:孫慶陽 實習生 饒奎
標簽:














