Track Hyper | "Keling AI + Lovart": Integration of AI Toolchain

華爾街見聞
2025.06.09 04:51
portai
I'm PortAI, I can summarize articles.

AI 視頻生成的產業級應用樣本。

作者:周源/華爾街見聞

最近,快手旗下可靈 AI 與全球設計智能體 Lovart 達成深度合作,雙方通過 API 接口實現技術協同,Lovart 將可靈 AI 的視頻生成能力嵌入其設計流程,支持單次任務自動生成超過一分鐘的完整視頻內容,覆蓋廣告營銷、Vlog(Video Blog/Video Weblog)等多類場景。

這場合作恰似熊彼特在《經濟發展理論》中所言的 “創造性破壞”——當生成式 AI 技術與設計流程深度融合,傳統內容生產模式,就開始經歷從工具迭代到生態重構的質變;而這一合作是生成式 AI 技術在內容創作領域的重要進展,意味着 AI 工具鏈整合進入新階段。

整合 AI 工具鏈適應變革

從產業背景看,中國內容創作市場正經歷結構性變革。

根據 IDC《中國生成式 AI 應用開發平台市場》報告,2025 年中國生成式 AI 軟件市場規模預計達 35.4 億美元,智能算力需求持續增長。

隨着生成式 AI 技術的成熟,廣告營銷、影視製作等行業對高效內容生產的需求激增,傳統依賴人工的創作模式已難以滿足市場快速迭代的要求。

可靈 AI 與 Lovart 的合作,正是對這一產業趨勢的直接響應。

可靈 AI 作為快手自研的視頻生成大模型,其技術優勢主要體現在三個方面,即生成能力、多模態協同和商業化成熟程度。

生成能力方面,可靈 AI 支持 1080P 高清視頻輸出,通過 v1.5 高品質模型實現畫面質量、動態質量提升 95%,支持最長 3 分鐘的視頻生成,遠超抖音即夢 AI(5 秒)和騰訊混元(文生視頻 16 秒、圖生視頻 5 秒)。

必須明確,可靈 AI 生成視頻時長 “3 分鐘”,實際上是用户對初始生成的 4-5 秒視頻多次續寫的總時長,並非一次性能完成;單次生成時長仍受限於模型架構(如可靈 2.1 大師版單次生成上限為 10 秒),續寫功能依賴提示詞連貫性,複雜場景可能出現內容斷層。

多模態協同:結合類 Sora 的 DiT 結構與 Flow 擴散模型,可靈 AI 在物理模擬(如流體運動、重力影響)和細節表現(如毛髮、面部肌肉動態)上達到行業領先水平。

商業化層面,截至今年 6 月,可靈 AI 已為超過 1 萬家企業客户提供 API(應用程序編程接口:Application Programming Interface)服務,覆蓋廣告營銷、影視動畫等領域,企業客户續費率較高。

Lovart 是全球首個設計領域的智能 Agent,核心價值在於構建從需求理解,再到成品輸出的全鏈路自動化能力。

通過自然語言交互,Lovart 的用户只需輸入 “30 秒視頻廣告,6 幀故事板” 等指令,Lovart 即可自動完成分鏡腳本撰寫、角色造型設計、場景佈局規劃等任務,並調用可靈 AI 生成視頻內容。

舉個例子,在 “VIVIDPIX” 品牌發佈案例中,Lovart 不僅生成 3D Logo 動畫,還通過 Suno AI 同步創作品牌主題曲,實現視覺與聽覺的初步統一。

此次雙方合作的核心在於 “AI 工具鏈” 的整合。

Lovart 通過調用可靈 AI 的 API,將視頻生成環節深度嵌入設計流程,解決了傳統設計工具在動態內容生產上的短板。

以植物奶品牌視覺系統設計為例,Lovart 調用可靈 AI 生成動態海報的同時,自動匹配背景音樂並優化光影效果,使從需求到成品的全流程耗時從 72 小時壓縮至 45 分鐘,效率提升超 5 倍。

這種 “設計 - 生成 - 優化” 的閉環,顯著降低了專業創作門檻,尤其對中小企業極具吸引力,畢竟設計成本可降低約 70%。

看不見的技術之手

這項合作直接推動內容生產從 “人力密集型” 向 “AI 創意型” 轉型。

在廣告營銷領域,可靈 AI 與 Lovart 的組合可實現 “一句話生成廣告視頻”,比如輸入 “經典紅,定義你的力量”,系統自動生成包含口紅特寫、派對場景的分鏡視頻,並匹配磁性女聲旁白。

正如《失控》作者凱文・凱利所言,“最深刻的技術是那些看不見的技術”。當 AI 工具鏈融入生產流程,其價值已超越技術本身,成為產業運行的底層基礎設施。

這種能力使企業能快速響應市場熱點,將營銷素材的製作週期,從數週縮短至數小時。

對可靈 AI 而言,雙方合作進一步鞏固其在 B 端市場的優勢。

據快手科技在 5 月 27 日發佈的 2025 年第一季度財報,截至報告期末,可靈 AI 收入規模已達 1.5 億元,其中 P 端付費訂閲會員貢獻近 70% 營收。

與 Lovart 的合作,快手科技的 AI 視頻技術優勢,能延伸至設計領域,形成差異化競爭力;Lovart 通過整合可靈 AI 的視頻生成能力,也彌補了自身在動態內容生產上的不足。

當前,可靈 AI 在視頻生成領域的競對主要是騰訊混元和字節跳動(即夢 AI),前者的視頻生成模型能實現 16 秒文生視頻生成,還支持多視角鏡頭切換;即夢 AI 則推出 2K 分辨率、最長 5 秒的視頻生成功能。

因此,可靈 AI 需持續優化模型性能,如提升中文語義理解精度,並加強與 ISV(獨立軟件開發商)的合作,擴大應用場景覆蓋;而 Lovart 在內測階段仍面臨生成效率問題:生成 5 秒視頻需 5 分鐘,穩定性尚有待提升。

可靈 AI 與 Lovart 的合作,本質上是技術理性與創意感性的一次握手。

這場 “創意與創意” 碰撞的合作,沒有 “劃時代” 的豪言,卻切切實實地將視頻生成,從 “少數人的特權” 變為 “多數人的工具”,在技術的點滴改進中,推動着內容產業向更高效、更普惠的方向演進。

就像達芬奇在《論繪畫》中寫的那樣,“藝術藉助科學,才能更精準地表達想象”。

當 AI 技術成為創意表達的 “新畫筆”,業界見證的不是技術超越人類的想象能力,而是人機協同打開了新的可能:在由算力編織的畫布上,創意之海的畫卷,正徐徐展開。