Bank of America AI Deep Dive Report: Where are the computing power opportunities in the AI era?

華爾街見聞
2024.03.26 06:30
portai
I'm PortAI, I can summarize articles.

美銀指出,AI 模型訓練所需的算力每 2 年漲 275 倍,下一代計算機包括高性能計算、邊緣計算、空間計算、量子計算和生物計算。

作者:李笑寅

來源:硬 AI

在數據呈指數級增長的後摩爾時代,基於強大算力支持的 AI 技術正在蓬勃成長,同時對算力的要求也與日俱增。

隨着 AI 訓練和推理成本持續上升,LLM(大型語言模型)的參數數量已從 2018 年的 9400 萬參數發展到商業上可用的 1750 億參數的 GPT-3,預計 GPT-4 將超過 1 萬億。有數據顯示,訓練一個 AI 模型所需的算力將每 2 年漲 275 倍。

數據處理技術的進步推動了計算機演變,但傳統的處理單元和大型計算集羣無法突破計算複雜性的界限。摩爾定律雖然仍在進步和重生,但無法解釋對更快、更強大的計算能力的需求。

英偉達 CEO 黃仁勳曾坦言:摩爾定律已死。伴隨算力不斷突破邊界,AI 的機會在哪?

美銀美林在 3 月 21 日發佈的深度報告中指出,下一代計算機將包括:高性能計算(HPC)、邊緣計算、空間計算、量子計算和生物計算。

高性能計算(HPC)

高性能計算是指使用超級計算機和並行計算機集羣解決高級計算問題的計算系統。

報告指出,高性能計算系統通常比最快的桌面電腦、筆記本電腦或服務器系統快 100 萬倍以上,在自動駕駛汽車、物聯網和精準農業等已建立和新興領域都有廣泛的應用。

美銀認為,高性能計算的發展趨勢為超大規模系統(包括 LLM)加速器帶來上升空間

儘管高性能計算在數據中心總可用市場(TAM)中只佔很小一部分(約 5% 的份額),但未來的發展趨勢是成為雲/企業應用的領先指標。

尤其是隨着 LLM 對算力的需求越來越高,48 個新系統中有 19 個採用了加速器,代表了大約 40% 的加速器附加率。而對全球 500 強企業的調查顯示,在超大規模服務系統中採用加速器有上升空間,目前只有大約 10% 的服務器是加速的。

美銀指出,另一個趨勢在於,藉助於協處理器(協助 CPU 完成其無法執行或執行效率、效果低下的處理工作而開發和應用的處理器),計算方式將越來越多地從串行轉向並行。

摩爾定律/串行計算的成熟正在將更多工作負載轉移到並行計算上,這是通過使用獨立的協處理器/加速器(如 GPU、定製芯片(ASIC)和可編程芯片(FPGA))實現的。

截至 2023 年 11 月,全球 500 強企業中有 186 台機器使用了協處理器,比五年前的 137 個系統有所增加;500 強中的協處理器/加速器使用在環比上持平,在同比上增長了約 5%;500 強超級計算機的總計算性能增長到了 7.0 exaflops,同比增長了 45%。

空間計算

空間計算是指通過使用 AR/VR 技術,將用户的圖形界面融入真實物理世界,從而改變人機交互的計算機。

實際上,我們正在到達人機交互的一個轉折點:從傳統的鍵盤和鼠標配置轉向觸摸手勢、對話式 AI 和增強視覺計算交互的邊緣。

美銀認為,繼 PC 和智能手機之後,空間計算有潛力推動下一波顛覆性變革——使技術成為我們日常行為的一部分,用實時數據和通信連接我們的物理和數字生活。

比如蘋果的 Vision Pro 就邁出了關鍵一步。

邊緣計算

相對雲端計算,邊緣計算是指在物理位置上更靠近終端設備的位置處理數據,在延遲、帶寬、自主性和隱私方面更具優勢。據研究機構 Omdia,“邊緣” 是指與最終用户的往返時間最多為 20 毫秒(毫秒)的位置。

美銀表示,許多企業正在投資邊緣計算和邊緣位置(從內部 IT 和 OT 到外部、遠程站點),以更接近最終用户和數據生成的地方。

Facebook、亞馬遜、微軟、谷歌和蘋果這些科技巨頭都在投資邊緣計算,預計這種投資的回報將成為這些公司未來 5 年股票表現的驅動力。

預計到 2025 年,75% 的企業生成數據將在邊緣創建和處理。

據研究機構 IDC 的數據,到 2028 年,預計邊緣計算的市場規模將達到 4040 億美元,2022-28 年複合年增長率為 15%。

預計 2022-2025 年間,邊緣計算市場的發展軌跡將大致如下:

第一階段(2022 年):使用案例 - 高度定製化;第二階段(2023 年):垂直領域 - 垂直套件/包;第三階段(2024 年):水平領域 - 跨垂直技術;第四階段(2025 年):IT 策略 - 垂直策略。

未來,美銀認為,AI 的機會來自推理,對邊緣計算推理來説,CPU 將是最佳選擇。

與在核心計算中進行的訓練不同,推理需要一個分佈式、可擴展、低延遲、低成本的模型,這正是邊緣計算模型提供的。當前邊緣計算行業的分歧在於是否使用 CPU 或 GPU 來支持邊緣推理。雖然所有主要供應商都支持 GPU 和 CPU 功能,但我們認為 CPU 是支持邊緣推理的最佳選擇。

在 GPU 模型下,一次只能處理 6-8 個請求。然而,CPU 能夠按用户細分服務器,使其成為邊緣上更有效的處理系統。相反,CPU 提供了成本效率、可擴展性和靈活性,並允許邊緣計算供應商在計算過程中疊加專有軟件。

霧計算

在邊緣計算領域,還有一個引申分支概念:霧計算(Fog computering)。

霧計算是一種網絡架構,是指使用終端設備在現場進行大量邊緣計算時用於存儲、通信、傳輸數據的架構。

美銀認為,霧計算和雲計算之間是互補的關係,未來可能會形成混合/多雲的部署業態。

隨着應用程序遷移到雲端,混合/多雲方法正在被部署。雲計算和邊緣計算是互補的,採用分佈式方法可以通過不同方法解決不同需求來創造價值。

IDC 的一項調查顯示,42% 的企業受訪者在設計和實施關鍵組件(包括基礎設施、連接性、管理和安全)方面存在困難。從長遠來看,邊緣數據聚合和分析與雲訪問的規模化能力(如分析和模型訓練)的結合,將創造一個建立在數字化邊緣交互之上的新經濟。

量子計算

量子計算是指利用亞原子粒子存儲信息,並使用疊加進行復雜計算的計算。

美銀認為,量子計算的重要性在於,其在解決傳統計算機無法解決的問題方面具有內在的不可替代優勢——這也被稱為 “量子霸權”。不過,目前量子計算的商業化進程還處於初級階段。

量子計算幾乎可以瞬間解決傳統計算機需要數十億年才能解決的問題。我們正處於採用的非常早期階段,只有少數幾台部署在雲上的機器作商用,主要用於研究。不過商業化進程正在迅速推進中。

美銀認為,量子計算機打破了計算的邊界,AI 和量子計算機兩大最強技術的結合可以使得物理世界和數學世界發生根本性改變。

中短期看,生命科學、化學、材料、金融和物流行業受益最多。長期看,當 AI 達到人類認知能力甚至擁有自我意識時,通用人工智能(AGI)將導致技術發生根本性轉變。

報告指出,量子計算機不適合像使用互聯網、辦公任務或電子郵件這樣的常規任務,但適合像區塊鏈、機器和深度學習或核模擬這樣的複雜大數據計算。量子計算機和 6G 移動網絡的結合將改變各行各業的遊戲規則。

大數據分析:未開發大數據潛力巨大未開發大數據潛力巨大,預計到 2024 年創建的數據量將翻倍,從 2022 年的 120ZB 增加到 183ZB。

IDC 數據顯示,目前,受算力瓶頸限制,我們只存儲、傳輸和使用了全球數據的 1%。但量子計算可以改變這一點,並釋放真正的經濟價值——有望使用全球 24% 的數據並推動全球 GDP 翻番

網絡安全:通過每秒高達 1 萬億次計算的並行處理能力(Bernard Marr),量子計算能夠在技術上挑戰所有當前的加密方法,包括區塊鏈。這也為基於量子計算元素的新加密技術打開了大門。

人工智能和機器學習: 機器學習和深度學習的進步受限於底層數據計算的速度。量子計算機可以通過使用更多數據更快地解決複雜數據點之間的連接來加速機器學習能力。

雲: 這可能是贏家之一,因為雲可能是所有數據創建、共享和存儲發生的平台。一旦量子計算機的商業化開始,就需要雲訪問,數據生成應該指數級增長。因此,雲平台將是解決方案

自動駕駛車輛車隊管理: 一輛連接的自動駕駛車輛將產生與 3000 名互聯網用户相同的數據量;對兩輛車而言,產生的數據量將躍升至約 8000-9000 名用户的數據量。因此,僅自動駕駛車輛產生的數據增長將是指數級的。

腦機接口

腦機接口是指通過人類和動物的腦波直接與外部世界互動。

美銀指出,像 Neuralink 這樣的初創公司正在研究通過植入物(BCI)實現人機合作,在動物實驗環節已經實現了腦波控制設備,早期人類臨牀試驗仍在進行中。

目前,腦機接口(BCI)和腦腦接口(CBI)技術正在開發中,已有通過思想控制手部動作的實例。

Synchron 的方案是在供應大腦的血管中放置一個布有傳感器和電極的網格管,可以從中接收神經元信號,信號被傳遞到外部單元后,將被翻譯並傳達給計算機。臨牀試驗中,癱瘓的個體能夠發短信、發電子郵件,以及網上銀行和購物。

Neural 的植入物包括神經線,這些線通過神經外科機器人插入大腦以拾取神經信號,臨牀患者現可以通過思考移動計算機鼠標。