要知道 ChatGPT 中的“T”表示的是 Transformer 模型,出自于 Google 研究團(tuán)隊(duì),而現(xiàn)在這一技術(shù)在競爭對(duì)手 OpenAI 的手上發(fā)光發(fā)熱,這令 Google 頗感尷尬。
為應(yīng)對(duì)這一挑戰(zhàn),Google 迅速推出了自己的聊天機(jī)器人Bard,并且開始整合 AI 資源,合并了兩大研究團(tuán)隊(duì) Google Brain 和 DeepMind,創(chuàng)建了 Google DeepMind,由 DeepMind 原 CEO Demis Hassabis 領(lǐng)導(dǎo)。
Hassabis 表示 Google 有 80% 或 90% 的 AI 創(chuàng)新都出自于這兩個(gè)團(tuán)隊(duì)。
在 上個(gè)月的 Google I/O 大會(huì)上,Google CEO Sundar Pichai 官宣了一個(gè)重磅消息:Google DeepMind 正在研究一個(gè)全新的大語言模型,代號(hào)為 Gemini(雙子座),這也是這兩只團(tuán)隊(duì)合并后首次合作的項(xiàng)目。
根據(jù) The information 報(bào)道,有內(nèi)部人士透露 OpenAI 早已經(jīng)悄悄地使用 YouTube 上的內(nèi)容來訓(xùn)練其人工智能模型。
Google 自然不會(huì)忽視這座“金山”,The Information 繼續(xù)爆料稱 Google 的研究團(tuán)隊(duì)也在利用 YouTube 訓(xùn)練 Gemini 模型,并且 Google 能夠比競爭對(duì)手們獲得更完整的內(nèi)容數(shù)據(jù)。
據(jù)統(tǒng)計(jì),YouTube 每分鐘就有 500 小時(shí)的視頻上傳到網(wǎng)站上,Google 可以說是坐在了一座會(huì)源源不斷生產(chǎn)金子的金山上,這或許會(huì)成為 Google 真正的護(hù)城河。
多模態(tài)才是未來
隨著多模態(tài)模型越來越受到重視,未來會(huì)有更多的開發(fā)人員選擇用視頻訓(xùn)練語言模型。AI 教父、Meta AI 首席研究員 Yann LeCun 在近日一條推文中稱:“通過視覺學(xué)習(xí)世界如何運(yùn)轉(zhuǎn)的系統(tǒng),將對(duì)現(xiàn)實(shí)有更深刻的理解”,并稱贊了 Meta 在這一領(lǐng)域的研究成果。
著名風(fēng)投機(jī)構(gòu) A16Z 在最近采訪了四家明星 AI 公司 AnthropicAI、Cohere、Character AI、AI21Labs 的 CEO 和創(chuàng)始人,探討出生成式 AI 當(dāng)前最需要突破的四個(gè)方向,分別是操控、記憶、四肢(訪問瀏覽器等)和多模態(tài)。
這四項(xiàng)關(guān)鍵創(chuàng)新將主導(dǎo) AI 在未來 6-12 個(gè)月的發(fā)展,這也會(huì)影響公司和開發(fā)者改變構(gòu)建產(chǎn)品的方式。
Cohere 的 CEO Aidan Gomez(著名論文《Attention is all you need》的主要作者之一)表示,AI 系統(tǒng)的能力終究是有限的,因?yàn)椴⒎撬械膬?nèi)容都是文本形式,因此多模態(tài)能力對(duì)于大語言模型來說是個(gè)重要的發(fā)展方向,像 GPT-4、 Character.AI 和 Meta 的 ImageBind 等模型已經(jīng)在處理和生成圖像、音頻等內(nèi)容。