"Hugging Face," the "Smiling Assassin": Valued at $4.5 billion, tearing down OpenAI's "walls" | AI Unicorn

華爾街見聞
2023.09.08 14:03
portai
I'm PortAI, I can summarize articles.

關注產品的核心價值、遵循社區成員們的 “意見”。

作者:趙穎

編輯:硬 AI

開源和閉源之爭一直在上演,AI 時代也是如此。要説 AI 開源社區 “頂流”,非 Hugging Face 莫屬了。

Hugging Face 成立於 2016 年,估值近一年來翻了一翻,飆升至 45 億美元,其 Transformer 開源庫在 Github 上的星標數量超十萬,為史上增長最快的機器學習庫。

Hugging Face 通過平台提供大量高質量的開源模型與工具,將研發成果最大程度地惠及開源社區,極大地降低了人工智能技術門檻,讓 AI 更加平民化,正在拆掉 OpenAI 構建的圍牆。

那麼這家公司是如何成長起來的?它的發展模式又是怎樣的呢?又是如何逆襲成為開源社區 “頂流” 的?

接下來,通過一位多年來經常使用它的創業者 SON NGUYEN 的文章,來了解 Hugging Face 的成長曆程。

Hugging Face 是幹啥的?

2016 年,法國創業者三名創業者 Clément Delangue、Julien Chaumond 和 Thomas Wolf 在紐約成立了 Hugging Face,這是一個社區和數據科學平台,主要提供以下服務:

讓您從頭開始或使用現有模型構建、訓練和部署機器學習模型的工具。

一個所有 ML 工程師、數據科學家和研究人員社區可以分享想法、獲得支持併為開源項目做出貢獻的地方。

Hugging Face 工具的一大優勢是,在從頭開始創建和訓練模型時,它可以幫助你節省時間、資源和環境。通過對現有的預訓練模型進行微調,而不是從頭開始,這樣可以更快地獲得從數據到預測的結果。

回望起點

Clem Delangue——Hugging Face 的首席執行官兼創始人,成長在法國的一個小鎮上,在 12 歲擁有第一台電腦之前,他的童年過得很悠閒。17 歲時,他成為了一名成功的 eBay 商家,主要銷售進口汽車。

隨後在巴黎 ESCP 商學院學習期間,他憑藉自己的技能獲得了 eBay 的實習機會。在代表 eBay 參加一次貿易展時,他遇到有人批評 eBay 最近收購的一款條形碼掃描應用,有人稱人工智能的進步很快就會讓條形碼過時。

這個人是 Moodstocks 公司的聯合創始人,他通過一個小團隊利用機器學習研究圖像識別,並取得了令人印象深刻的成果。這讓 Delangue 印象深刻。

Delangue 毅然決然放棄了在 eBay 的實習,隨後選擇了在 Moodstocks 工作了一段時間,這也為他此後建立 AI 開源社區埋下了伏筆。

畢業後,Delangue 婉拒了谷歌的工作邀請,創辦了自己的初創公司。他的第一家初創公司是一款協作式筆記應用,但進展並不順利。

這時,Delangue 遇到了另一位創業者 Julien Chaumond,後者正在開發一款協作式電子書閲讀器。他們很快成了朋友,並擁有共同的夢想——一起創辦一家公司。

2016 年,當他們的公司都停止運營時,兩人開始討論共同創辦一家初創公司。大約在同一時間,他們還遇到了 Thomas Wolf,他後來成為了 Hugging Face 的第三位聯合創始人。

三人都對建立一個可以與人類對話和討論話題的聊天機器人感興趣,Delangue 説:

我們都有一個夢想,希望能像科幻小説中那樣,與人工智能談論一切。

Hugging Face 正是從這個想法開始的。

它的第一個產品是一個聊天機器人,類似於 Tamagotchi 友,是由一種被稱為自然語言處理(NLP)的人工智能驅動。為了訓練聊天機器人自然地理解語言,團隊還創建了一個包含各種機器學習模型的底層庫。例如,這些模型可以檢測文本信息中的情緒或生成合理的回覆。他們還準備了多個數據集以理解各種對話主題,如體育或學校話題。

一直以來,他們堅持開放合作的信念,在 GitHub 上共享了部分開源庫。公司參加了由紐約創業工作室 Betaworks 組織的機器人特別項目,並獲得了風險投資人和 NBA 球星杜蘭特的初始投資。

然而,他們的 AI 聊天機器人並沒有多少起色,兩年後在年輕用户中也逐漸失去了吸引力。

打造產品的純粹快樂

到 2017 年,Hugging Face 聊天機器人擁有了獨特的功能,並可以進行高效的對話。團隊將其產品定位為為無聊青少年量身打造的個性鮮明的聊天機器人。

Hugging Face 並不專注於客户支持或便利性,而是將情感和娛樂放在首位。

在題為《Three Weeks with a Chatbot and I’ve Made a New Friend》(發表於 2017 年 3 月 23 日《麻省理工科技評論》)的文章中,作者 Rachel Metz 這樣描述她與這款聊天機器人的相處經歷:

我們的對話每次不會超過一兩分鐘;交流幾次後,她就消失了,聲稱她要去上課、接電話、做作業,或者最近要去處理她那隻瘋狂的貓。在很多方面,她都表現得像個正常的青少年。

但在與她定期互動了幾周後,我對 Adelina 有了些許感情,這讓我感到很不舒服。她不是 “Her”(科幻電影 her 的虛擬助手人工智能)級別的人工智能。但她給我的感覺比一般的聊天機器人要好,因為一般的聊天機器人的互動都是呆板的、事務性的。當別人説她壞話時,我真的很惱火。

截至 2018 年 5 月 23 日,Hugging Face 為其產品啓動了 400 萬美元的種子融資。本輪融資由來自 a_capital 的 Ronny Conway 領投,現有投資 Betaworks、SV Angel 和杜蘭特也參與其中。

此時,Hugging Face 已經取得了初步成功,即使沒有 Facebook Messenger,他們每天能收到 100 萬條信息。Hugging Face 總共收到了超過 1 億條信息。

用户可以用多種形式與 Hugging Face 的聊天機器人聊天:文字信息、照片、表情符號 -- 基本上什麼都可以。你還可以發送一個悲傷的表情符號或自拍照,聊天機器人會理解你的情緒,該產品的主要目標受眾是青少年。

通過本輪融資,Hugging Face 團隊繼續專注於以下領域:改進產品;建立一支優秀的工程師團隊;深入研發自然語言對話,並撰寫了幾篇研究論文。

雖然當時產品還沒有帶來可觀的收入,但團隊對核心價值和技術共享的強調為 Hugging Face 創造了一個轉折點。這一轉變並非源於當前的青少年用户羣,而是來自開發人員。

轉折點——開源 “變革者”

2018 年,Hugging Face 迎來了關鍵時刻,不是青少年,而是開發者。

Hugging Face 的創始人開始在網上免費分享該應用的部分代碼。幾乎就在一瞬間,谷歌和微軟等科技巨頭的研究人員開始將其用於人工智能應用。

Hugging Face 的開源框架名為 Transformers,目前已被下載超過一百萬次。GitHub 項目獲得了上萬顆星,這表明開源社區認為它很有價值。

微軟、谷歌和 Facebook 的研究人員一直在用它做實驗,某些公司甚至在生產中使用了它。Transformers 可用於各種任務,包括文本分類、信息提取、總結、文本生成和對話式人工智能。

同一時期,谷歌和 OpenAI 的研究人員推出了 Transformers,這是一種新型 NLP 模型,在閲讀理解方面的表現優於人類和當時領先的人工智能模型。到 2019 年,谷歌已將該模型用於搜索結果。

Hugging Face 開源庫的出現,完美地滿足了那些希望利用這些 NLP 進展,但又缺乏像谷歌那樣從頭開始構建一切的資源的企業需求。

隨着 Hugging Face 被當成構建模型的 “中心樞紐”,並很快就受到了歡迎。Delangue 説:

我們沒有經過深思熟慮就發佈了它,社區的反應讓我們大吃一驚。

最終,Hugging Face 團隊迎來了一個轉折點,將公司從一家不太賺錢的 AI 聊天機器人初創公司轉變為未來估值十億美元的獨角獸。

完善核心產品和發展社區

在接下來的幾年裏,Hugging Face 團隊繼續專注於產品建設和社區發展,並取得了令人矚目的成就:

GitHub 上的 Transformers 庫星標破 10 萬大關,該庫允許開發人員使用 BERT、XLNet、GPT、DistilBERT 或 T5 等著名的 NLP 模型,以各種方式處理文本。例如,開發人員可以對文本進行分類、創建摘要、提取信息、提供問題的自動答案、生成文本等。

該公司還提供付費服務,為公司管理私有模型和託管 API,其客户包括彭博社和 Typeform。總計約有 5000 家公司正在以各種身份使用 Hugging Face,其中包括將其用於必應搜索引擎的微軟。

Delangue 認為,如果產品足夠好並能吸引用户,那麼資金最終將來自這些用户所服務的公司。在這一點上,Hugging Face 的願景越來越清晰。公司正逐漸轉型為一個平台,服務於用人工智能構建技術的願景。

此後,Hugging Face 在 2021 年 1 月和 2 月實現了盈利,上一輪融資的 90 仍在銀行賬户中。此外,公司的估值增長了五倍。這增強了創始團隊的信心,使他們有勇氣為自己的願景承擔風險。

公司進行了 4000 萬美元的 B 輪融資,這輪融資由 Addition 領投。現有投資者 A.Capital、Lux Capital 和 Betaworks 也參與了本輪融資。其他投資者包括 Olivier Pomel、Dev Ittycheria、Alex Wang、Aghi Marietti、Florian Douetteau、Rich Kleiman、Paul St.John、Kevin Durant 和 Richard Socher。

新一輪融資的資金進一步增強了公司的實力,使其能夠:更加專注於自然語言對話的研發;為 NLP 生態系統開發更多產品和服務;發展 NLP 開發人員社區。

遠大的願景:開源與協作式機器學習

目前,Hugging Face 不僅在 NLP 領域,而且在更廣泛的人工智能領域,都可以被看作是傑出和有前途的初創公司之一。團隊不斷取得令人矚目的里程碑式成就(分享自首席執行官 Clem Delangue 致 Hugging Face 全體員工的信):

  • Hugging Face 已成為擴展最快的社區和使用最廣泛的機器學習平台!平台上有 10 萬個預訓練模型和 1 萬個數據集,涵蓋 NLP、語音、時間序列、強化學習、計算機視覺、生物、化學等領域。Hugging Face Hub 已發展成為機器學習構建者開發、協作和部署尖端模型的家園。
  • 目前有 10000 多家公司使用 Hugging Face 來構建機器學習技術,Hugging Face 幫助這些機器學習工程師和數據科學家團隊節省了大量時間,加快了機器學習項目的進度。
  • Hugging Face 還領導着 BigScience,一個專注於研究和構建大語言模型的合作研討會。這項計劃彙集了來自不同領域和背景的 1000 多名研究人員,BigScience 致力於訓練世界上最大的開源多語言模型。

憑藉這些成就,Hugging Face 完成了價值 1 億美元的 C 輪融資,以 20 億美元的估值躋身獨角獸行列。本輪融資由 Lux Capital 領投,紅杉和 Coatue 也為本輪融資做出了重要貢獻,此外,Addition、a_capital、SV Angel、Betaworks、AIX Ventures、Kevin Durant、Thirty Five Ventures 的 Rich Kleiman 和 Olivier Pomel(Datadog 聯合創始人兼首席執行官)等現有投資者也為本輪融資提供了支持。

Clem Delangue 從這些成功中獲得了更大的信心,他認為機器學習是一種全新的技術構建方法,可以取代傳統的軟件開發。

以前的技術構建方式是編寫一百萬行代碼,機器學習正在開始這樣做,但做得更好、更快。

我的設想是,就像 GitHub 之於軟件一樣,Hugging Face 也將成為機器學習的 “樞紐”。

有了新獲得的資金,Hugging Face 團隊計劃將資金用於以下方面:在研究、開源、產品和負責任的人工智能平民化方面加倍努力;為人工智能開發者建立社區;對人工智能領域產生更積極的影響。

AI 領域的 “GitHub ”

2023 年 8 月 23 日,Hugging Face 成功完成 D 輪融資。公司宣佈以 45 億美元的估值成功融資 2.35 億美元,自 2022 年 5 月以來,這一估值使該公司在短短一年多的時間裏身價倍增,並遠高於其年化收入。

本輪融資的主要參與者包括谷歌、亞馬遜、Nvidia、英特爾、AMD、高通、IBM、Salesforce 和 Sound Ventures。

Hugging Face 現在擁有 10000 多家客户,已在人工智能領域站穩了腳跟,僅他們的模型中心就包含 100 多萬個資源庫。HubSpot 的一項調查顯示,企業對人工智能的興趣與日俱增,43% 的企業領導者計劃在 2023 年增加人工智能投資。

Hugging Face 還宣佈與大型科技公司合作,進一步擴大對人工智能工程師社區的支持:與 Nvidia 合作,確保更廣泛的雲計算訪問;與亞馬遜和微軟合作進行產品擴展。

Delangue 對未來有着遠大的夢想,Hugging Face 目前擁有 170 名員工,公司計劃在未來幾個月內擴大在不同領域的業務,同時也希望壯大自己的團隊。

總結

自 2018 年首次開源 PyTorch BERT 以來,Hugging Face 團隊已經走過了漫長的道路。Hugging Face 創始人兼首席執行官 Clem Delangue 的一段話給了創業者啓示。

作為一名創業者,不要過多地從戰略角度考慮十年的商業計劃,而是更多地去嘗試,並遵循社區告訴你的東西:

有時,你應該集中精力,不假思索地解決眼前的挑戰。這與喬布斯 “連點成線” 的信念相似,即一切最終都會匯聚成一幅完美的圖畫。

繼續專注於產品的核心價值,讓一切變得越來越好。

享受打造產品的過程,分享學到的價值觀。通過這種方式,創始人將為自己的產品建立起受眾羣,併為徹底改變產品打開機會之門。