ICC訊 說(shuō)到當前這輪人工智能熱潮背后的支持技術(shù),Alphabet旗下的谷歌其實(shí)是發(fā)明者,但其產(chǎn)品的受歡迎程度卻明顯滯后。谷歌希望透過(guò)發(fā)布備受期待的Gemini來(lái)改變這種局面,這是該公司迄今為止構建的“規模最大、功能最強的工人智能模型”。
自從OpenAI去年憑借其對話(huà)式聊天機械人ChatGPT取得巨大成功以來(lái),越來(lái)越多的公司一直在嘗試產(chǎn)生式人工智能,這種技術(shù)可以根據用戶(hù)的要求自動(dòng)執行編碼、總結報告或建立營(yíng)銷(xiāo)活動(dòng)等任務(wù)。在12月6日發(fā)布這款產(chǎn)品前的一次演示會(huì )上,谷歌強調,Gemini是其構建的最靈活的模型,因為它有不同規模的版本,包括一個(gè)可以直接在智能手機上執行的版本。這使它有別于其他競爭對手。
這款人工智能模型是一個(gè)用于支持各種產(chǎn)生式人工智能應用程序的系統,它有三個(gè)不同的版本:Gemini Ultra、Gemini Pro和Gemini Nano。谷歌DeepMind部門(mén)產(chǎn)品副總裁柯林斯(Eli Collins)表示,這種多樣性意味著(zhù)Gemini“能夠在從流動(dòng)裝置到大型數據中心的所有裝置上執行”。
“長(cháng)期以來(lái),我們一直希望構建新一代人工智能模型,其靈感來(lái)自于人們理解這個(gè)世界并與其互動(dòng)的方式——這種人工智能感覺(jué)更像是一個(gè)助人為樂(lè )的合作者,而不是一款智慧軟件,”柯林斯在接受電話(huà)采訪(fǎng)時(shí)說(shuō)道,“Gemini讓我們離這個(gè)愿景又靠近了一步?!?
在這款模型發(fā)布前,該公司對Gemini進(jìn)行了一系列標準的行業(yè)基準檢驗,并表示,在八項測試中有六項結果顯示,Gemini Pro的表現優(yōu)于OpenAI的GPT-3.5。谷歌稱(chēng),在對通用語(yǔ)言理解、推理、數學(xué)和編碼進(jìn)行的八項基準檢驗中,Gemini有七項結果優(yōu)于OpenAI通用模型的最新版本GPT-4。與此同時(shí),谷歌估計,該公司最新的可解釋和產(chǎn)生程序代碼的產(chǎn)生式人工智能產(chǎn)品AlphaCode 2在競爭性程序設計領(lǐng)域超過(guò)了85%的競爭對手。該公司將發(fā)布一份技術(shù)報告,更深入地解釋Gemini的模型架構、訓練過(guò)程和評估情況。
從12月6日開(kāi)始,想要為智能手機和平板計算機編寫(xiě)Gemini支持的應用程序的Android開(kāi)發(fā)人員將能夠注冊使用這款人工智能模型的“nano”版本,該版本可以直接在此類(lèi)裝置上執行。谷歌還表示,將立即在其旗艦手機Pixel 8 Pro上啟用Gemini,它將支持新的產(chǎn)生式人工智能功能,例如從電話(huà)錄音中總結要點(diǎn)。下周,谷歌將透過(guò)其Vertex AI和AI Studio平臺向云客戶(hù)提供Gemini Pro。
Gemini Ultra是最大版本的谷歌人工智能模型,最初將在面向開(kāi)發(fā)者和企業(yè)公司的搶先體驗計劃中推出,有關(guān)該計劃的詳細信息將于下周公布。這個(gè)版本將于明年早些時(shí)候向公眾廣泛推出。
Gemini還能透過(guò)Bard與谷歌的大量應用程序和服務(wù)整合在一起,Bard是該公司的對話(huà)式聊天機械人,是ChatGPT的競爭對手。此前,Bard使用的是谷歌的PaLM 2模型,這是該公司在5月份的年度開(kāi)發(fā)者大會(huì )上宣布的大型語(yǔ)言模型。
在過(guò)去一年中,谷歌一直面臨壓力,既要重塑其核心搜尋業(yè)務(wù),又要應對產(chǎn)生式人工智能程序興起的浪潮。盡管該公司長(cháng)期以來(lái)一直被視為人工智能研究領(lǐng)域的先驅?zhuān)恍┤伺u其管理層在人工智能產(chǎn)品營(yíng)銷(xiāo)方面反應遲緩,尤其是在ChatGPT和影像產(chǎn)生器Dall-E等產(chǎn)品大獲成功之后。自OpenAI于3月份發(fā)布GPT-4以來(lái),谷歌一直在努力重申其在該領(lǐng)域的領(lǐng)導地位,包括將這項新技術(shù)注入其成熟的搜尋業(yè)務(wù)。
Gemini就是該公司面對這種市場(chǎng)壓力給出的答案。谷歌表示,人工智能模型是“天然多模式”,這意味著(zhù)它從一開(kāi)始就經(jīng)過(guò)預先訓練,可以處理使用者給出的基于文字和影像的提示。例如,在一則影片演示中,谷歌展示了家長(cháng)可以透過(guò)上傳某道某數學(xué)題的影像以及在草稿紙上嘗試解題的步驟照片,來(lái)幫助孩子完成家庭作業(yè)。
在演示影片中,谷歌的軟件工程師阿普爾鮑姆表示:“Gemini不僅能解出這些題目,還可以閱讀這些答案并理解哪些是對的,哪些是錯的,并對需要進(jìn)一步澄清的概念作出解釋?!痹摴具€表示,其“搜尋產(chǎn)生體驗”——谷歌利用其產(chǎn)生式人工智能技術(shù)構建的實(shí)驗版本的搜索引擎——將在明年融入Gemini的新功能。
盡管如此,該公司的代表警告說(shuō),Gemini仍然容易“產(chǎn)生幻覺(jué)”,也就是產(chǎn)生式人工智能產(chǎn)生的虛假或捏造的信息??铝炙狗Q(chēng)這種現象為“一個(gè)未解決的研究問(wèn)題”。該公司向記者展示的演示影片是預先錄制的。
柯林斯說(shuō),Gemini“在谷歌所有人工智能模型中擁有最全面的安全評估”。他說(shuō),為了評估Gemini的安全性,谷歌對這款人工智能模型進(jìn)行了對抗性測試,也就是模仿一位試圖利用該程序的壞人給出提示。此次測試包括“真實(shí)毒性提示”,這是艾倫人工智能研究所開(kāi)發(fā)的一項測試,其中包含從網(wǎng)上提取的10萬(wàn)多個(gè)提示,旨在幫助人工智能研究人員檢查大型語(yǔ)言模型中是否存在仇恨言論和政治偏見(jiàn)。
谷歌還強調,這項工具的速度將會(huì )很快。該公司表示,Gemini使用了一種新的底層超級計算器架構和更新的處理芯片,使其比早前較小的模型執行得更快。谷歌正在使用一種新版本的云芯片——Cloud Tensor Processing Units (簡(jiǎn)稱(chēng)TPUs),這是一種內部設計的芯片,和前代產(chǎn)品相比,它訓練現有模型的速度要快2.8倍。谷歌機器學(xué)習副總裁阿明·瓦赫達特說(shuō),這種方法讓谷歌“對未來(lái)標準人工智能基礎設施有了新的認識”。他補充說(shuō),該公司仍然會(huì )使用第三方人工智能芯片來(lái)執行其Gemini模型。
Gemini將被整合到3月份推出的谷歌產(chǎn)生式人工智能聊天機械人Bard當中,使其能夠利用該公司最受歡迎的服務(wù),包括Gmail、地圖、檔案(Docs)和YouTube。此次推出將分為兩個(gè)不同的階段進(jìn)行:從12月6日開(kāi)始,Bard將由Gemini Pro提供支持,它將實(shí)現高階推理、規劃、理解和其他功能。它將能夠在170個(gè)國家和地區以英語(yǔ)執行,但值得注意的是,不包括歐洲或英國,該公司表示它正在和當地監管機構協(xié)商。
明年初,該公司打算發(fā)布Bard Advanced,這款產(chǎn)品將由功能更強大的Gemini Ultra模型提供支持。谷歌表示,它很快將推出一個(gè)值得信賴(lài)的測試程序,以便在向公眾廣泛推出之前改進(jìn)Bard Advanced。谷歌負責Bard產(chǎn)品的副總裁Sissie Hsiao表示,“有了Gemini的加持,Bard正在進(jìn)行迄今為止最大、最好的升級,它將為人們開(kāi)啟創(chuàng )作、互動(dòng)和協(xié)作的新方式?!?