
In the era of physical AI, a "visual data competition" will unfold

大摩認為,正如聊天機器人需要文本數據來訓練大語言模型(LLM)一樣,物理機器人需要數據來訓練其視覺 - 語言 - 動作模型(VLA),預計隨着算力規模不斷擴展且效率提升,AI 公司需要大量的視覺數據來創建物理世界的 “數字孿生”,視覺數據將成為 AI 巨頭們的競爭焦點。
隨着人工智能從數字世界走向物理世界,競爭焦點將轉向視覺數據。
在 21 日發佈的研報中,摩根士丹利分析師 Adam Jonas、Daniela M Haigian 等指出,正如聊天機器人需要文本數據來訓練大語言模型(LLM)一樣,物理機器人需要數據來訓練其視覺 - 語言 - 動作模型(VLA)。摩根士丹利認為,AI 正在從純數字領域向物理世界擴展,例如自動駕駛、人形機器人和電動垂直起降飛行器(eVTOLs)等領域。
報告引用了馬斯克在今年早些時候發表的觀點,即 “三到四年內,AI 將可以解決任何不涉及物理世界的認知任務”。大摩預計,隨着算力規模不斷擴展且效率提升,AI 公司需要大量的視覺數據來創建物理世界的 “數字孿生”,即通過高精度的視覺數據構建一個虛擬的物理世界模型,全球範圍內將展開一場爭奪光學數據的 “光子競賽”。
報告還將光子數據比作 “Fat tuna”(肥金槍魚),認為如果無法捕捉或利用數據,那麼這些數據就像海中的金槍魚一樣毫無價值;而一旦具備捕捉和處理這些數據的能力,其價值將大幅提升。這意味着,當 AI 技術成熟後,視覺數據將成為極其寶貴的資源。
大摩認為,這種數據需求將涵蓋生活的各個方面,包括倉庫、工廠、醫院、學校、商店、車輛、機場、礦山、家庭和森林等,甚至生物體的視覺數據也將成為重要的資源。
報告還特別提及特斯拉在這個進程中起到的關鍵作用,認為該公司處於 “技術寒武紀大爆發的中心地帶”,其投資故事已經遠遠超出了電動汽車的範疇,馬斯克旗下 “DREAMS”(數據、機器人、能源、AI、製造和太空)的龐大商業帝國將推動特斯拉價值的進一步釋放。
報告表示,隨着馬斯克在構建推理羣(汽車、機器人)和 AI 基礎設施方面取得進一步進展,通用 AI 和 LLM 可能成為解鎖特斯拉作為 AI 巨頭價值的 “關鍵鑰匙”。