狙擊Open AI!穀歌一個月內連發“數彈”
作者:探索 來源:探索 瀏覽: 【大 中 小】 發布時間:2025-12-19 20:20:47 評論數:
“為速度而生的數彈前沿智能”,12月18日淩晨,狙擊穀歌發布博客,谷歌個月官宣又一王炸Gemini 3 Flash,內連這是數彈Gemini 3 係列速度最快、性價比最高的狙擊模型,也是谷歌個月但同時,這次被行業關注的內連點在於,這個Flash模型在做到又快又便宜的數彈同時,部分性能甚至能比旗艦模型要好。狙擊
值得注意的谷歌個月是,這也是內連穀歌一個月內在大模型領域的第四次動作更新。

穀歌CEO桑達爾·皮查伊(Sundar Pichai)發帖介紹,Gemini 3 Flash性能和效率均突破了帕累托極限,狙擊它的谷歌個月性能超越了上一代旗艦模型2.5 Pro,同時速度提升了 3 倍,而價格卻低得多。
“Gemini 3 Flash 證明,速度和規模無需以犧牲智能為代價。”在博客中,官方放出豪言。從評測數據來看確實如此。
在用於評估編程能力的基準測試 SWE-bench Verified 中,Gemini 3 Flash 的得分高達 78%,超越了自家的旗艦模型Gemini 3 Pro和Anthropic旗下的Claude Sonnet 4.5;在多模態理解基準 MMMU-Pro 上,Flash得分81.2%,不僅超過 GPT-5.2(79.5%),還甩開 Claude Sonnet 4.5 十幾個百分點。

種種數據表明,這次的Flash模型進步很大,突破了用戶印象裏的輕量化模型:快、便宜,但是性能往往會打折。而Gemini 3 Flash做到了接近旗艦的能力,同時滿足效率和性價比。
根據大模型競技場Imarena.ai的數據,目前Gemini 3 Flash在文本、圖像和編程領域排名前 5,數學和創意寫作類別排名第2,是性價比最高的前沿模型,輸入僅0.5 美元/百萬Tokens,輸出3美元/百萬Tokens。
作為對比,Claude Sonnet 4.5的輸出是15美元/百萬Tokens,GPT-5.2的輸出是14美元/百萬Tokens,是Gemini 3 Flash定價的近5倍。
穀歌表示,在最高思維水平下進行處理時,Gemini 3 Flash 能夠靈活調整其思考時間。對於更複雜的應用場景,它可能需要更長的思考時間,但根據典型流量的測試結果,它平均使用的令牌數量會比上一代的2.5 Pro 少 30%,從而以更高的性能更準確地完成日常任務。
Gemini 3 Flash保留了Gemini 3 在複雜推理、多模態、智能體和編程任務方麵的突破性性能,同時結合了 Flash級別的延遲、效率和成本優勢相結合。“這是迄今為止在智能體工作流程方麵最出色的模型。”穀歌稱。
一位開發者用Gemini 3 Flash和“兩個性價比之王”做了Python對比測試,其中一個是OpenAI的性價比版本GPT-5Mini、一個是國產開源之光DeepSeek-V3.2。
結果顯示,成本上三個模型差不多,但是速度上Gemini 3 Flash隻要9秒,而GPT-5 Mini、DeepSeek-V3.2分別用了35秒和41秒,同時效果上Gemini 3 Flash勝出,這是一個平衡了速度和性能的模型。
“更快、更便宜、還能免費用,這才是獨立開發者和小團隊真正需要的東西。”一位獨立開發者發文表示,如果之前是用 GPT-4o或Gemini 3 Pro跑應用,換成Gemini 3 Flash,成本預計能直接降50%-70%。
從今天起,Gemini 3 Flash將麵向所有用戶推出,即便是免費用戶也能用上,在Gemini App 裏,Gemini 3 Flash 會替代2.5 Flash成為新的默認模型,而Gemini 3 Pro則是留給用戶處理高難度數學和代碼問題的一個選擇。
上個月,穀歌推出了Gemini 3 Pro和Gemini 3 Deep Think,獲得了廣泛的市場認可,並反超OpenAI成為大模型領域的領先者。博客提到,自發布以來,內部的API 每天處理超過1萬億個tokens。用戶經常使用 Gemini 3 進行代碼模擬,學習複雜的主題,構建和設計交互式遊戲,並理解各種類型的多模態內容。
憑借性價比和性能,此次推出的Flash預計將受到更大程度上的歡迎,穀歌表示,Flash一直是內部最受歡迎的版本,此前的Flash 2和 Flash 2.5 處理著數百萬開發者構建的數十萬個應用程序中數萬億個tokens。
“Flash模型真正為開發者量身打造,而 Flash3則讓他們無需再在速度和智能之間做出妥協。”穀歌又一張王牌露出,留給OpenAI應戰的時間不多了。
