騰訊科技訊 早在十年前,Facebook母公司Meta創始人兼首席執行官馬克·扎克伯格(Mark Zuckerberg)就看到了人工智能的樂觀前景,并投入了大量資金開發相關技術,并聘請了富有遠見的人工智能專家楊立昆(Yann LeCun)來領導這項業務。然而,就在人工智能研究公司AI target=_blank class=infotextkey>OpenAI的聊天機器人ChatGPT進入消費者市場幾個月后,Meta卻發現自己在同樣的技術上落伍了。
Meta首席執行官兼創始人扎克伯格對該公司的人工智能工作獲得了更多控制權
大量AI專家離職,小扎獲得更多戰略控制權
多年來,Meta始終在優先考慮學術發現,并免費分享它們,同時努力利用它們的商業潛力。現在,該公司正重新集中資源,在開發可用的人工智能產品和功能,包括自己的聊天機器人。
這是一個艱巨的任務,因為Meta的許多頂級人工智能專家已經離職,而且該公司在扎克伯格所謂的“效率之年”進行了一系列裁員。分析報告顯示,約有三分之一的員工在去年離開了與大語言模型(LLM)相關的研究。大語言模型是為ChatGPT等人工智能系統提供動力的復雜系統。
自那以后,Meta失去了許多人工智能研究人員,他們在去年從事這些和其他關鍵的生成式人工智能項目,許多人認為Meta已經筋疲力盡,或者對Meta失去信心,認為其無法追上競爭對手。據職業社交網站LinkedIn上的資料和知情人士透露,為LLaMA撰寫研究論文的14位作者中,有6位已經離職或宣布將離職。在為OPT撰寫論文的19位共同作者中,也有8位離職。
在OpenAI去年11月發布ChatGPT之后,這些人離職的速度開始加快。有些人是被人工智能創業的狂熱所吸引,這股熱潮推動了包括谷歌在內的硅谷公司人事發生劇烈變動。LinkedIn上的材料顯示,截至今年3月,該網站上提到GPT的招聘信息同比增長了79%。
Meta的一位發言人表示,該公司一直在持續招聘和引進新的人工智能人才。ChatGPT首次亮相后,扎克伯格、首席產品官克里斯·考克斯(Chris Cox)以及首席技術官安德魯·博斯沃思(Andrew Bosworth)一起負責公司所有與人工智能相關的工作。這三位高管現在每周花幾個小時研究人工智能,參加會議并審核人工智能項目。
缺席白宮AI峰會,硬件開發和研發策略失誤
扎克伯格和其他高管稱人工智能是Meta的“第三條腿”,他們認為人工智能與全球連接、虛擬現實和增強現實一樣,對公司的長期增長和相關性至關重要。在人工智能領域落后可能會讓Meta顯得呆滯而遲緩,而不是創造了“快速行動、打破常規”(move fast and break things)、并引領硅谷創新步伐的靈活、積極進取的后起之秀。
今年5月,美國白宮沒有邀請Meta參加人工智能領導人峰會,該峰會被宣傳為“走在人工智能創新前沿的公司”會議。
Meta以前也曾在落后的時候緊急轉向,比如它把Facebook從桌面廣告業務轉變為移動優先廣告業務,或者在2016年在Instagram上推出Stories功能以吸引人們離開Snapchat。Snapchat早在10年前就推出了類似的功能。
Meta還面臨著其他戰略、政治和財務方面的挑戰。長期以來,Meta的人工智能部門始終專注于原創研究,這阻礙了生成式人工智能的發展,比如ChatGPT等能夠生成類似真人撰寫文本和其他內容的系統。高管們在設計運行此類人工智能程序所需的硬件時犯了錯誤,該公司目前正試圖糾正這一錯誤。多年來,對Meta處理用戶數據和侵犯隱私行為的審查,使許多高管猶豫不決,對推出面向消費者的新人工智能產品持謹慎態度。
Meta于2013年開始投資人工智能。扎克伯格和當時的首席技術官邁克·施羅普夫(Mike Schroepfer)曾親自尋求聘請一位人工智能領域的領軍人物來領導其新創立的研究部門,以推進這項技術發展。他們選中了紐約大學教授楊立昆,他因在該領域完成了的突破性工作而享有盛譽。
楊立昆管理Meta的人工智能研究部門已有十年之久,他始終以學術界常見的方式來研究人工智能突破,專注于發表和分享發現
楊立昆始終遵循于傳統的學術和基礎研究,他在創造一種反映他優先事項的文化方面發揮了重要作用,包括雇用科學家而不是工程師,強調學術成果,如研究論文,而不是為公司的最終用戶開發產品。知情人士表示,多年來,這一戰略使Meta的基礎人工智能研究實驗室對頂尖人才極具吸引力,但也影響了該公司將其技術成果商業化的能力。
同時,楊立昆也鼓勵采用一種分散的、自下而上的方法來制定研究方向和配置資源。知情人士稱,研究人員各自推動自己的議程,在不同的方向上追求獨立項目,而不是在全公司范圍內制定更有凝聚力的戰略。Meta在每個項目中將硬件分成小塊:如果有些研究人員得到了比他們需要的更多計算機芯片,他們會把它們用在不必要的任務上,而不是交公。
與此同時,Meta在為其數據中心配備人工智能開發所需的最強大計算機芯片方面進展緩慢。即使公司獲得了更多的這種芯片,它也沒有絕佳的系統來把它們送到工程師和研究人員手中。有些人說,有時會有數千件令人垂涎的昂貴硬件處于閑置狀態,無人使用。
Meta正在對其數據中心進行改造,這可能是造成當前困局的原因之一。Meta在一篇博客文章解釋稱,截至今年5月,該公司最新的人工智能項目超級計算機擁有1.6萬個這樣的芯片。
據知情人士透露,隨著大語言模型在2020年開始顯示出越來越強大的能力,Meta的人工智能研究部門內部的緊張局勢加劇,有人敦促公司認真投資于該行業的新方向。而包括楊立昆在內的人則認為,這些模型是缺乏科學價值的時尚噱頭。有些人說,楊立昆在內部和公開場合都強烈反對大語言模型,他認為它們不會讓人工智能更接近人類的智能水平,這使得持反對意見的研究人員很難獲得這類項目所需的支持和大量資源。
有些Meta研究人員以更少的資源繼續推進大語言模型的研發,在2022年使用大約1000個芯片構建出名為OPT(開放預訓練轉換器)的大語言模型,在2023年使用大約2000個芯片制造出Meta的旗艦模型LLaMA。相比之下,行業標準是使用5000到10000個芯片。最初,Meta允許有限的外部研究人員訪問LLaMA,然后它被泄露到網上,引發了一系列創新,高管們認為這是Meta分享其人工智能技術成果的一個重要例證。
創建生成式AI團隊,訓練AI大模型
扎克伯格本人和其他高管對公司的人工智能戰略有了更多的控制權。他們創建了新的生成式人工智能團隊,直接向首席產品官考克斯匯報工作,他是Meta任職時間最長、最受信任的高管之一。
扎克伯格透露,該團隊正在訓練生成式人工智能模型,這些模型可以生成文本、圖像或音頻等內容,目的是融入“我們的每一款產品”。他曾吹捧Meta的旗艦人工智能語言模型LLaMA,在其代碼泄露后,該模型刺激了原生工具的出現,有朝一日可能與谷歌和OpenAI試圖銷售的產品競爭。
如果Meta成功地將其人工智能技術商業化,可能有助于提高用戶參與度,創造更好的元宇宙,并使該公司對年輕用戶更具吸引力。事實證明,年輕用戶現在越來越難以被吸引到Meta上。但是,如果Meta不能足夠快地利用這項技術,它將面臨失去用戶粘性的風險,因為競爭對手都將一飛沖天,包括一批快速增長的人工智能初創公司。
Meta人工智能研究副總裁喬爾·皮諾(Joelle Pineau)在一份聲明中表示,該公司在人工智能研發方面并未落后,并為其專注于研究和結構進行了辯護,稱這將使Meta走向成功。
皮諾說:“Meta的人工智能研究部門是世界上人工智能研究人員和開放科學的主要目的地之一,其研究成果僅在去年就大幅增加。我們的研究突破為我們的應用家族帶來了一種新的生成式人工智能體驗。無論是過去還是現在,我們都為Meta的人工智能研究人員感到自豪,他們為幫助塑造最先進的人工智能未來做出了巨大貢獻。”
扎克伯格上周宣布推出名為Voicebox的人工智能模型,該模型可以以不同的方式朗讀文本提示,或者通過文本提示來糾正錄音,以消除背景噪音,比如狗叫。Meta沒有透露該研究項目何時向公眾開放。
圖3:位于美國加州門洛帕克的Meta總部
新的生成式人工智能團隊專注于構建可用的產品和工具,而不是進行科學研究。該團隊已經收到了超過2000份內部申請,并迅速聚集了來自不同團隊的數百名員工。知情人士表示,硬件資源已從人工智能研究部門轉移,正被用于訓練新的生成式人工智能模型。
今年3月,扎克伯格表示,“推進人工智能并將其融入我們的每一款產品”是該公司最大的一筆投資。在今年5月舉行的Meta年度股東大會上,扎克伯格表示,公司也希望將這項技術擴展到元宇宙中。
Meta發言人證實,在本月早些時候舉行的全體員工會議上,扎克伯格宣布了該公司目前正在開發的一系列生成式人工智能產品。這些舉措包括為Messenger和WhatsApp引入人工智能代理,用戶可以根據文本提示生成并在聊天中分享人工智能貼紙,以及一項照片生成功能,該功能允許Instagram用戶使用文本提示修改自己的照片,然后在Instagram Stories中分享。
扎克伯格還分享了一些面向員工的內部生成人工智能工具,其中包括一款名為Metamate的辦公助手,它可以從內部資源中提取信息,根據員工的要求執行任務。Meta發言人說,Metamate最近作為試運行項目在大批員工中推出。
扎克伯格稱:“去年,我們在生成人工智能方面看到了許多真正令人難以置信的突破,質的突破。”
面臨廣泛挑戰,對風險容忍度越來越低
不過,Meta仍然面臨著廣泛的挑戰。知情人士表示,在政府和媒體對其用戶隱私做法進行了7年的嚴格審查之后,該公司對風險的容忍度越來越低,這在如何以及何時推出人工智能產品方面造成了影響。Meta在開發和發布大語言模型時不得不考慮其公眾聲譽,這可能會產生錯誤的答案或冒犯性的言論。
據知情人士透露,幾年前,Meta的人工智能研究人員曾開發一款代號為Tamagobot的聊天機器人,該機器人基于一個大語言模型系統的早期版本。其中一名知情人士表示,該團隊對Tamagobot的表現印象深刻,但得出的結論是,在該公司因在2016年總統選舉期間允許虛假信息在其平臺上泛濫而面臨激烈批評的情況下,不值得推出這款機器人。
2022年8月,Meta發布了其聊天機器人BlenderBot 3,也體現了對公眾監督的擔憂。發布不到一周,BlenderBot 3就因發表虛假聲明、攻擊性言論和種族歧視言論而受到嚴厲批評。該系統還稱扎克伯格“令人毛骨悚然,善于操縱”。
Meta發言人表示,在研究結束之前,該項目仍將持續一年多的時間,該公司在整個生命周期中都保持了公開透明的態度。他補充說,Meta已經發布并見證了許多其他項目,這些項目表明該公司愿意承擔風險。
但這種情況在2022年11月再次上演,當時該公司發布了以科學為重點的大語言模型Galactica。該系統因其錯誤和有偏見的答案而遭到科學家批評,在發布三天后就被Meta關閉。但短短兩周后,OpenAI就發布了ChatGPT。(文/金鹿)