How did Alibaba become the Android of the AI era?

華爾街見聞
2025.09.25 05:29
portai
I'm PortAI, I can summarize articles.

背後的比拼,是系統工程。

作者 | 柴旭晨

編輯 | 王小娟

在展示出三年 3800 億元的 ALL IN 的姿態,講出超級人工智能 “ASI” 的澎湃故事後,阿里又站上了全球 AI 界的 C 位。

在 2025 年雲棲大會上,阿里巴巴首席執行官吳泳銘暢談 ASI 的前景,他認為 “大模型是下一代的操作系統”,替代現有系統,AI 模型將順勢加速滲透進所有設備;而超級 AI 雲將成為下一代的計算機,他斷言,未來全世界可能只會有 5-6 個超級雲計算平台。

基於上述可預見的願景,阿里做了一個戰略選擇:加碼基建投入、開源通義千問,他的陽謀是成為 “AI 時代的安卓”。這就意味着,阿里要在模型端、算力端等都保持高速迭代的迅猛姿態,才能在如此內卷的賽道中,鎖定贏面。

做到這點並不容易,在會後的訪談中,阿里雲 CTO 周靖人向華爾街見聞坦言,AI 市場競爭非常激烈,像 Open AI、谷歌、Claude 相關的模型都在加速,通義模型一直在跟全球的領先者你追我趕。

周靖人指出,行業進入加速期後,眼下玩家們比拼的不單單是單幾個模型的能力,更重要的是迭代快速創新。

阿里雲底氣十足。在周靖人看來,今天模型之間的競爭,其實是系統的競爭;今天雲的競爭,也是模型的競爭,這兩者是密不可分的。而阿里雲是那全球少數幾家,在大模型和雲計算方面都能夠做到全棧自研、聯合創新的雲計算公司。

阿里雲副總裁張啓向華爾街見聞表示,阿里雲具備全棧的 AI 能力,包括底層算力、雲的佈局、大模型家族,“從這三個部分來看,全球能夠對這三層同時有佈局的公司只有阿里和 Google”。

面向 ASI,吳泳銘透露,阿里雲正在全力打造一台全新的 AI 超級計算機,可以在基礎架構設計和模型架構上協同創新,從而確保在阿里雲上調用和訓練大模型時,能達到最高的效率。

面對 ASI 時代的巨大機遇,阿里雲已做好充分準備,將在激烈的市場競爭中迎戰對手,成為未來支撐阿里體系發展的關鍵力量。

以下是與阿里雲 CTO 周靖人、副總裁張啓的對話實錄(經編輯):

問:為什麼阿里今年能保持高節奏的模型發佈的狀態,是否會出現像 Open AI GPT5 一樣,一個大一統的模型來終結他這麼豐富的模型狀態。

周靖人:全球整個 AI 模型的進展都在加速。通義模型一直在跟全球的領先者你追我趕。這個行業大家可能可以看到,像 Open AI、谷歌、Claude 相關的模型都在加速。

AI 從過去的有很多的突破,但今天進入到一個加速期。今天大家比拼的不單單是單幾個模型的能力,更重要的是迭代快速創新。無形之中大家都在加快今天模型迭代的效率。第二個方面,從以前單模態模型到多模態的演進是一個必然的趨勢,這跟我們人的智能很相關的。

問:AI 市場競爭非常激烈,阿里雲做到了市佔率第一後在 AI 雲這塊的打法和競爭優勢上有沒有獨特的策略和想法?

周靖人:阿里雲是全球少數幾家,在大模型和雲計算方面都能夠做到全棧自研、聯合創新的雲計算公司。這方面是我們獨特的一個優勢。

阿里的 AI 模型、Agent 的開發、AI 的基礎設施的創新是聯合在一起的,也是相輔相成的。今天模型之間的競爭,其實也是系統的競爭;今天雲的競爭,也是模型的競爭。這兩者是密不可分的。

問:如今在研發人員精力有限的情況下,如何做一些像 deepseek 更底層範式上的創新?

周靖人:整個模型集羣的創新不是分散的,背後都是連在一起的。有的時候需要在單模態有一個具體任務的場景裏面能夠做到最優,然後才能提高一個整體模型的能力。這方面所有的模型的發展,一定是整體通義整個大模型演進聯合優化的一部分。

從今年年初到現在已經突飛猛進,甚至已經有幾代模型的發展。每一代模型的能力有大幅度的提升,同時我們也在積極做下一代模型的研發。包括通義千問 Next 就在架構上面做了大量的創新。我們一旦推出來過後,整個社區都在圍繞新的架構進行適配、進行相關的嘗試。

模型的發展是一個循序漸進的,不是憋大招的邏輯。所有的海外廠商都會逐步的發展起來,今天在中間是需要加快模型迭代以及創新的速度。

張啓:今天上午發的通義千問 3-MAX 是全球所有模型榜單裏第三名。

今天千問我們有 300 多個模型,因為我們既有最好的模型也有最強的雲,今天從 AI 雲的層面上來看,阿里雲是全球前四里面的唯一一箇中國的選手。目前來説,我們也是中國唯一具備國際影響力和具有國際很強大競爭力的這樣一個雲廠商。

像 Salesforce、像 SPA 這一些國際的廠商在中國或者在亞洲主選合作的廠商就是阿里雲,我們就是在這樣一個戰略位置上面全棧去發力。

問:今年有廠商他把 Agent 能力做模型裏,未來 model 跟 Agent 的能力是怎樣的關係?

周靖人:其實這沒有一個明確的邊界解。我們的模型服務本身也會具備 Agent 的能力。從模型具備搜索的功能,它本身就是一個 Agent。

今天講到的智能體的開發是面向行業的,這部分它需要對當前每個行業的知識體系有一個深度的認知。百鍊提供的一些核心的 Agent 的能力在通義千問、在萬相里面也會慢慢的集成進去,也就是説底層的模型會越來越強大。但今天面向業務層工具的使用,業務層的調優,還是需要有業務層的智能體來做實現和解決。

問:怎麼激發 AI 科學家的創造力?

周靖人:整個通義實驗室裏面相對比較開放,鼓勵大家去做新的創新的。今天整個行業的發展的一些方向,不像幾年前海外公司佔優,整個行業越來越有共識。但有共識並不代表它就能夠實現、能夠完成。

今天我們需要的是更有效的把這一系列的工作,按照優先級能夠做相關的一系列的規劃,通過我們的系統和算法的聯合優化,能夠把工作推動起來。

今天我們是齊頭並進的邏輯。最終我們希望在單項方面要做到極致,否則今天模型大的能力的提升也會遇到瓶頸。這些背後的邏輯,各家公司的大致的方向是沒有什麼大的變化,只不過大家沒有像我們這麼開放。

我們有一個重要的理解是站在開發者視角,為什麼會提供這麼多模型、參數,我們知道開發者的需求是多樣性的,讓大家都能在自己的場景裏面選擇最好的模型,集成到自己系統裏面來。我們真正意義上是希望跟開發者、企業共同推動 AI 產業的發展。

問:面對對手在 Token 調用幾十億規模的市場,阿里雲怎麼在激烈的競爭環境中保持前瞻性?

張啓:在 AI 雲市場包括底層基礎設施、Token 調用,阿里雲是中國的第一,是第二到第四名的總和。沙利文調研了中國 500 強,有超過 70% 已經採用了生成式 AI,其中阿里雲和通義千問的滲透率是 53%。

問:阿里雲是全棧,但核心抓手是什麼?

張啓:關於全棧的 AI,底層算力、雲的佈局、大模型家族,從這三個部分來看,全球能夠對這三層同時有佈局的公司只有阿里和 Google。

周靖人:阿里雲所謂全棧自研的體系,也不是今天我們才開始做。我們早在大家都還沒有做模型服務的時候,就提出 Mode as a service ,從那個時候開始,我們雲的發展的方向就是跟 AI 模型融合在一起的。在 ChatGPT 爆發之前我們就在提到今天 AI 跟雲重要的整合性。

問:現在大的技術路線沒大的分歧,阿里想要在模型上保持領先,最關鍵的要素是什麼?

周靖人:我不認為創新的速度有任何減緩,全球在這方面投資也在加速,都在印證 AI 模型的上限還沒有看到,我們還在不斷加速,不斷創新過程中。

至於要達到 ASI,這中間有非常多難題需要解決。從目前看,模型整個複雜,包括處理能力,包括深度思考的能力,我們解決的有些好的地方,像數學、代碼,還有其他的場景。真正做到各種工具快速的接入,模型訓練的方式、模型創新的模式、模型的結構,都有可能發生很多一系列變化。最終還要做到模型自主完成學習,自主通過反饋,利用跟世界的交互,能夠收集反饋,能夠用好反饋去做模型進一步進化和升級。

這中間從我們當前一代代模型發展的路線,要慢慢營造成模型持續去學習、持續去自我完善的過程。這中間有架構上的挑戰,有系統方面的挑戰,有算法上面的挑戰。

問:MaaS 各家都在跟進,阿里是否有差異化?

周靖人:“模型服務” 不是簡簡單單的概念,今天要做到極致彈性、極致性能、極致高吞吐的模型服務是非常難的,甚至我們經常説模型服務是 AI 時代的彈性計算。

講到 MaaS 的性能之前先要講到精度。同樣一個模型,客户有時候會發現為什麼在不同平台上採用不同服務的時候,效果就是不一樣。其實這背後就是在精度對齊方面。在這些方面,我們有非常嚴格的流程。包括通義模型一系列的服務確保原生支持最佳的精度。

今天,通義模型的服務,包括其他模型服務在阿里雲上會得到非常高質量的效果。當然,大家還對模型服務的吞吐、延遲、成本各方面都有要求,大家對模型服務需求是多樣化的。有的企業更加追求極致的效率,甚至效率這部分有的是指模型效果、有的是指延遲。有的企業追求的是極致性價比,甚至對模型服務的時間也會有一些靈活的取捨。

今天,全球在這方面只有幾家公司能做到。

問:Agent 目前在做多模態相關的記憶部分邊界點在什麼地方?

周靖人:“記憶” 這裏是個泛義詞。我們首先希望模型回答能夠熟知上下文,這是簡單的,而人的記憶,不僅是昨天發生了什麼事,也許是去年,十年前發生了什麼事,是對於超大規模信息的管理。AI 需要做到各個模態記憶的支持,不單單是個文本,甚至是今天的視頻,過去的音頻等。

另外,我們要對記憶進行分層,就像人的記憶力,從具體的記錄,過去發生了什麼事情,是要進行抽象,從中抽象成一個經驗,抽象成一個習慣,甚至今天變成個性的一部分。這中間有短期記憶,有多重記憶,這是智能化的過程,也不是純粹的規則,在這方面還有很多研究。我們認為做一個智能體,做一個企業應用的智能體,相關的記憶還是需要的。

問:內部對於通義大模型評估維度的優先級?

周靖人:首先,我們所有技術工作直接的評價體系更多是能力,包括模型的能力。通往 ASI 的路徑上,最重要的是先要有技術上的突破,能力上的突破,能夠真正朝着吳泳銘講到的 ASI 方向有進一步的技術突破和進展。