
周鴻禕路演聊 AI,分析師、基金經理瘋狂湧入,電話會被擠爆

進門財經路演工具在 chatgpt 概念板塊上引起了極大的關注,許多券商、公募、私募、資管和保險等機構參加了此次路演。其中,民生證券邀請了 360 的周鴻禕作為嘉賓。周表示,場景和數據是 AI 技術的關鍵,算力不是最關鍵的問題。此外,數據的質量對於訓練 AI 技術也至關重要,需要大量的知識量數據來訓練,而聊天語料少於 5%。搜索引擎可以優化數據抓取能力,進行工程化的索引和人工標註的調優。AI 提升各個產業的能力是生產力工具,可以為各個行業賦能。最後,周還回答了一個奇怪的問題:小孩長大後應該學習什麼專業?他表示,應該學習符合自己興趣和能力的專業。
大家好,昨夜的機構路演,擠爆了。券商分析師,基金經理都在聽。
19 日晚間,圈內最大的事件,就是大家都在聽 AI 的電話會會議,直接把 app 幹爆了,投資者湧入進門財經券商路演直播間,一度導致進門財經 APP 宕機。據瞭解,進門財經定位是專業投資機構的路演工具,一般是券商、公募、私募、資管、保險等等機構的人用。可以想象,現在的市場熱點全在 chatgpt 概念板塊上。
民生證券還請來了 360 紅衣教主的周鴻禕。據説參會人數超過千人!
泰勒找來了這場路演紀要。其中第三個問題把泰勒笑噴了,有人問周鴻禕,以後小孩長大了應該會學什麼專業嗎?週迴答:這個問題很奇怪,該學什麼專業學什麼專業啊
Q:上游哪些場景很關鍵?
A:算力不是最關鍵的問題,場景和數據是關鍵。我們二線隊伍,賬上 200 多億人民幣,之前國家搞了很多超算中心,沒事情幹,現在發現配了 GPU 就有東西看。Transformer 算法是谷歌發明的,實現靠的是大力出奇跡,幾千億參數。這是個工程問題。從 1 到 n中國能做的很快,openai中國做的很快,谷歌和 meta 會很尷尬。Meta 開源了他的大語言模型,技術的 knowhow 會快速傳播。關鍵的東西,第一是數據,有知識量的數據做訓練,聊天的語料不包括知識 chatgpt 中文語料佔了不到 5%,大量知識在外文期刊裏面,只用中文訓練語料是不夠的。很多機構説用了很大的參數,但是不敢拿出來説,大概率是數據不夠。還需要人類的槍花反饋學習和調優,激發 GPT 理解人類的查詢意圖,這個是問題的關鍵。還有個很重要的是場景,微軟放棄了自己的小娜的研究,全力幫助 AI,在場景化上可以讓大家看到人工智能有什麼場景。搜索引擎一直在做 NLP,自然語言處理,大家都在跟蹤使用,搜索引擎在獲取海量數據方面優勢。我們和百度抓取的網頁在千億萬億的規模,需要清洗辣雞網頁進行工程化的索引。我們搜索引擎要抓取英文的維基百科和語料,對於我們是現成的。初創公司可能會卡在工程化的初始階段,這個對工程化的要求比較高。還有人工標註的調優,微軟做了很多貢獻,搜索引擎幫助很大。360 搜索份額佔比 30%,百度佔比 60%。微軟幫助 openai 佔據了很多的場景,下一步可能會把 teams(視頻會議)等 TO B 的場景做結合。
Q:以後會不會很多行業不存在了,機器把人替代了?
A:我不是很認同。我認為這是個洗牌的機會,如果你不重視他,抓上這班車就不行。我們企業內部要起每個部門都用 AI 提升我們的能力,用 AI 的大語言模型賦能,這樣會成為我們手裏有力的競爭武器。GPT4 的知識能力和考試的能力已經超越了每一個地球人,GPT 可能是用 3.5 和 4 互相訓練。我們也考慮過這種,用 bert 這種理解性的模型進行反饋和獎勵。這是個生產力工具,是能給各個產業賦能的,關鍵是你需要找到相應的場景和場景化的能力。
Q:以後小孩長大了應該會學什麼專業嗎?
A:這個問題很奇怪,該學什麼專業學什麼專業啊,對 prompt 很敏感。
Q:關於我們 360,行業現在是巨頭扎堆,360 的核心優勢?
A:第一個問題已經講了,第一是數據的能力,不能光用中文的數據,要有全球數據的抓取能力,要能做到對垃圾的判別和清洗。用户上億次搜索的數據,我們和百度有知識問答的欄目,這種涉及用户的真實的使用場景來進行訓練。數據我們有優勢。GPT2 和 bert 是開源的,真要做到上千億上萬億的模型,幾千張 GPU 的顯卡,幾個 T 的數據進行幾個億的訓練,這個對工程化要求很高。第三,搜索引擎我們市場份額是百度的一半。搜索引擎不具備生成性,不會編出林黛玉倒拔垂楊柳的故事,生成式 AI 會無中生有,如果編的結果是不對的普通人很難驗證就很麻煩。我們做泛化,泛化的知識圖譜的搜索,前面的十條二十條結果給大語言模型做提煉,這樣就不會讓生成式 AI 無中生有。我們搜索引擎 dau 有一個億,大語言模型可以做及時的翻譯和推薦,我們這種場景可以很好的讓用户體驗到人工智能的場景,形成商業化的閉環。我在政協叫了個提案,大家忽視的是這個東西真正的破圈了。之前無論是阿爾法狗和蛋白質摺疊,離生活比較遠。得益於微軟工程化產品化的能力。一方面要打造核心技術,全方位最大化的調用公司的資源。大模型的方向已經出來了,要做到大力出奇跡,500 億到 1000 億的參數訓練,用有質量的語料。谷歌現在很尷尬,模型做出來了商業化的場景可能也被微軟搶完了。微軟專注場景和產品化的結合,openai 專注技術,這樣能實現很好的效果。
Q:360 的場景和應用?
A:並行的。360 也在做 TO B,也是我們很重視的機會。我們的安全大腦幫助企業抵禦攻擊。我們的機會是,中國企業不接受公有云,希望有個私有化部署的 GPT 和數據。未來每個企業可能有自己的大腦。只做垂直行業的訓練肯定是不行的(説的就是科大訊飛)。我們離 GPT 還有 24 個月到 36 個月的差距,第一個版本能做到幾百億參數的模型的時候,做到 GPT 的六成的功力,做到企業內部是夠用了。TO B 和 TO G 端是有大量的機會的。面對中小企業端,我們打算推出生成式 AI 的辦公套件和應用。Openai 找了 100 家垂直的 SaaS 公司,會專門訓練垂類的應用。我們這兩年很關注sme(中小企業),中小企業對企業數字化的要求功能明確,少花錢使用簡單,SaaS 更合適,我們去年推面向企業的 SaaS 雲服務,一年 120 萬家客户。我們瀏覽器國內份額最大,做了個 SaaS 商店,我們會找合作伙伴做一些場景。TO C 我們有大量的使用場景,瀏覽器加上 AI 插件變成 AI 個人助力。TO B,TO SME 和 TO C 三十多個場景使用不同的能力,儘快佔據用户的使用場景。
Q:我們會和百度一樣芯片模型全覆蓋的平台嗎?
A:我們肯定不是這個方向。谷歌自己搞過 GPU,也就自己用。訓練最好還是用 A100 和 A800,框架沒必要自己搞,自己搞個框架還要花精力和別的芯片適配。微軟這麼強大微軟只做應用,openai 用的框架也是用的行業通用框架。我不認為產業鏈全都做了是好事。我們堅定的沿着 transformer 框架把模型幹到千億。首先是要佔據應用場景。
Q:百度內測效果不錯,對於 360 未來應用的推廣是不是更有信心了?
A:百度搜索一哥肯定能做好的,微軟的搜索份額比谷歌要小,可以放開手要做創新。百度為什麼做一個聊天機器人我不理解,我要做的話可能更願意和搜索相結合。國內我不認為會和美國一樣一支獨大,頭條和其他互聯網廠商大家不會相互支持,會互相競爭,360 啊微博啊 B 站啊知乎啊小紅書啊美團滴滴等等,他也不敢用巨頭的服務,肯定要自己搞。還是希望在這個模型上做出幾個超級應用。有應用有場景的公司加上模型會有價值。
Q:中國電信佈局了企業版的 chatgpt,對這個的關注提升到了國家戰略的高度,國家的重視會對行業產生什麼影響?
A:國家隊幹這個事肯定不是壞事,互聯網上大家都做過。從目前擁有的數據和團隊能力來看,民營企業和國企都在一個起跑線上。只要不是隻要牌照才能搞大語言模型,這樣都有機會。GPT 是個生產力工具,這將決定未來國際競爭當中的國運。美國人對於大語言模型也有政治正確的要求。
Q:中國和美國比有 24 到 36 個月的時間差?
A:不是和微軟比。GPT4 驗證了我們很多觀點,他的參數量我覺得應該到了萬億,訓練的數據比原來大了 5 到 10 倍。人類反饋強化學習不再是十萬組,而是幾十萬組的答案對,有很強的智能的能力。目前來看多模態是勝過國內的能力的。國內的圖像識別還是傳統的圖像識別,openai 把所有都看做序列,圖像也是序列,他能把圖像組成部分的關係和邏輯相關性總結出來。他在閲讀文檔上的能力國內做不到。他能支持 5 萬字的輸入,表示他的深度記憶能力越強,對上下文的理解越好。GPT3.5 我們認為國內和他的差距 18 個月,gpt4 是 24 個月。雲談了這麼多年,企業上雲的比例也還不高。這比光刻機的難度小多了。
Q:怎麼看 GPT4,會不會取代操作系統成為戰略級的入口?
A:這是兩個概念,需要 host 一個應用需要操作系統,操作系統還是需要的。人工智能沒有突破之前大數據給企業用不好用。Gpt 相當於是發電廠,這個比喻比較貼切。純做 GPT 的公司有點來不及,要麼是有 GPT 豐厚的場景。場景越大爆發性就越大,如果場景很小,就做了個虛擬人掛個 GPT 跟人對話,這個場景就很小。場景未來可能有多家服務提供商。
Q:場景是我們非常關注的點,特斯拉的機器人也是爆款,多模態和機器人的關係?人形機器人是終極目標嗎?
A:我不這麼認為。不考慮機器人的外形,音響之類的用自然語言和人交流這關就是過了。Gpt 能否處理好機械手臂,尋找空間定位也是,出了 GPT 之後傳統的做語言識別的圖像識別的就有問題了。人形機器人有個最大的問題,機械手臂抬起的力量,這和人工智能沒有關係。如果機器人手裏拿不了太重的東西,這可能會成為妨礙。自動駕駛汽車也是個機器人,只不過長了 4 個輪子。GPT 的大語言都可以賦能。你們和智能音箱聊過天,聊兩句就能知道他是個滯脹,gpt 肯定通過了圖靈訓練。橡膠娃娃也是仿真機器人。
Q:GPT4 在物聯網終端的廣泛應用是大趨勢了,邊緣計算的需求?
A:這跟邊緣計算有什麼關係呢?構不成邊緣計算的節點。真正的能力都在雲端,運算都在雲端。
本文作者:泰勒,來源:中國基金報,原文標題:《今晚,爆了!分析師、基金經理瘋狂湧入!“馬英九將赴大陸”!熱搜也爆了:張蘭家族信託被擊穿!》
