
隨著搜索引擎巨頭谷歌加緊步伐以跟上 ChatGPT 開發(fā)商 OpenAI 的谷歌節(jié)奏,該公司正式推出了最新人工智能模型 Gemini 3。發(fā)布
谷歌母公司Alphabet首席執(zhí)行官孫達爾?皮查伊(Sundar Pichai)在谷歌周二發(fā)布的競爭多篇博客文章中表示,這款新的持續(xù)人工智能模型能讓用戶在解答更復雜問題時獲得更優(yōu)答案,“無需過多提示詞,升級就能得到你需要的谷歌結(jié)果”。
Gemini 3 將整合到 Gemini 應用、發(fā)布谷歌人工智能搜索產(chǎn)品 “AI 模式”(AI Mode)與 “AI 概覽”(AI Overviews)中,競爭同時也會融入其企業(yè)級產(chǎn)品。持續(xù)目前,升級該模型已面向部分訂閱用戶開放,谷歌未來幾周將逐步擴大覆蓋范圍。發(fā)布
此次發(fā)布距谷歌推出 Gemini 2.5 約八個月,競爭距 Gemini 2.0 則有 11 個月。持續(xù)而在 2022 年底通過公開推出 ChatGPT 引爆生成式人工智能熱潮的升級 OpenAI,已于今年 8 月發(fā)布了 GPT-5 模型。
皮查伊在周二的一篇博文中寫道:“短短兩年間,人工智能便從只能讀取文本和圖像,發(fā)展到能夠‘洞察場景’,這實在令人驚嘆。從今天起,我們將以谷歌的規(guī)模推進 Gemini 的落地應用。”
谷歌透露,目前 Gemini 應用的月活躍用戶已達 6.5 億,“AI 概覽” 的月活躍用戶則有 20 億。而 OpenAI 在今年 8 月表示,ChatGPT 的周活躍用戶已突破 7 億。
皮查伊補充稱,這款最新模型 “具備理解深度與細微差別的能力”,且 Gemini 3“能更精準地把握用戶請求背后的語境與意圖,因此無需過多提示詞就能滿足需求”。谷歌方面表示,其旗下其他人工智能模型仍可用于處理較簡單的任務(wù)。
Alphabet及其大型科技同行正投入巨資建設(shè)人工智能研發(fā)基礎(chǔ)設(shè)施,并快速為消費者與企業(yè)打造更多服務(wù)。在上個月發(fā)布的財報中,字母表、Meta、微軟與亞馬遜均上調(diào)了資本支出預期,四家公司今年的資本支出總額預計將超過 3800 億美元。
谷歌旗下人工智能部門 DeepMind 的首席執(zhí)行官德米斯?哈薩比斯(Demis Hassabis)在一份聲明中表示,由 Gemini 3 驅(qū)動的人工智能響應 “將摒棄陳詞濫調(diào)和刻意討好,提供真正有價值的見解 —— 告訴你需要知道的事,而非你想聽的話”。行業(yè)批評人士指出,當前的人工智能聊天機器人往往過于 “諂媚”。
上周,OpenAI 對 GPT-5 進行了兩項更新。該公司表示,其中一項更新讓模型 “更親切、更智能,且更善于遵循指令”,另一項則使其 “在處理簡單任務(wù)時速度更快,應對復雜任務(wù)時更具持續(xù)性”。
此外,谷歌還發(fā)布了名為 “Google Antigravity” 的全新智能體平臺,該平臺能讓開發(fā)者以 “更高階、面向任務(wù)的層面” 進行編程。
谷歌實驗室與 Gemini 部門副總裁喬希?伍德沃德(Josh Woodward)在一場記者簡報會上表示,Gemini 3 是該公司 “有史以來最出色的氛圍編程模型”?!胺諊幊獭保╲ibe coding)指的是一類快速興起的工具領(lǐng)域,開發(fā)者可通過提示詞生成代碼。
谷歌稱,這款新模型將支持 “生成式界面”,能以類似數(shù)字雜志的形式呈現(xiàn)特定答案。例如,谷歌讓 Gemini 完成 “結(jié)合創(chuàng)作背景解讀梵高美術(shù)館的每一件作品” 的任務(wù),最終模型為每幅畫作生成了包含圖像的彩色解讀內(nèi)容。
在 “AI 模式” 中,Gemini 3 將首先向付費訂閱用戶開放。該模型能夠分析用戶提出的問題,并生成包含圖像、表格、網(wǎng)格等視覺元素的排版內(nèi)容。谷歌表示,它可以創(chuàng)建定制化的交互式貸款計算器,或針對復雜物理問題生成交互式模擬演示。
開發(fā)者將可訪問 Gemini API,企業(yè)則能通過 Vertex AI整合 Gemini 3。
谷歌表示,對于企業(yè)客戶而言,Gemini 3 可實現(xiàn)多種功能,例如制作員工入職培訓內(nèi)容、更精準地分析視頻與工廠車間圖像,以及處理采購相關(guān)事務(wù)等。