免费AAAAAAA片,亚洲色在线观看多人轮换

C114
通信人家園
English
公眾號(hào)矩陣

投稿
舉報(bào)

量子大觀

通信人家園

C114通信網(wǎng)

光通信觀察

DVBCN中廣5G

2025/4/18 15:09

谷歌首推Gemini 2.5 Flash：成本爆降600%

快科技鹿角

據(jù)報(bào)道，谷歌發(fā)布了突破性混合推理模型Gemini 2.5 Flash，該模型創(chuàng)新性地引入可調(diào)節(jié)"思考預(yù)算"功能，在保持高性能的同時(shí)顯著降低使用成本。

在閉源思考模式下，其成本僅為0.6美元/百萬(wàn)tokens，相比全功能思考模式（3.5美元/百萬(wàn)tokens）大幅降低600%。值得注意的是，即便在基礎(chǔ)模式下運(yùn)行，其性能依然超越前代Gemini 2.0 Flash。

性能表現(xiàn)方面，Gemini 2.5 Flash在大模型排行榜中以1392分ELO評(píng)分高居第二，僅次于GPT-4.5-preview，與Grok-3表現(xiàn)相當(dāng)。

具體任務(wù)測(cè)試中，該模型展現(xiàn)出顯著優(yōu)勢(shì)：在GPQA知識(shí)問(wèn)答中，24K思考預(yù)算可帶來(lái)6%的性能提升；在LiveCodeBench代碼基準(zhǔn)測(cè)試中，16K思考預(yù)算時(shí)達(dá)到最佳表現(xiàn)。

對(duì)比測(cè)試結(jié)果顯示，Gemini 2.5 Flash在多模態(tài)推理和數(shù)學(xué)任務(wù)上明顯優(yōu)于Claude 3.7 Sonnet，綜合性能與OpenAI最新o4-mini模型不相上下。在模擬人類綜合能力的"人類最后一次考試"基準(zhǔn)測(cè)試中，該模型以12.1%的高分位列第二，再次印證其強(qiáng)大實(shí)力。

此次發(fā)布的Gemini 2.5 Flash通過(guò)創(chuàng)新的"思考預(yù)算"機(jī)制，在性能與成本之間實(shí)現(xiàn)了突破性平衡，為AI應(yīng)用開發(fā)提供了更靈活、更經(jīng)濟(jì)的選擇。

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊

0 VS 0

寫得不太好

相關(guān)鏈接

測(cè)試 OpenAI AI

谷歌更新 Gemini 2.5 Pro 預(yù)覽版模型至 06-05 版本，多項(xiàng) AI 性能基準(zhǔn)測(cè)試評(píng)分提升
IT之家漾仔6-6
谷歌 CEO 皮查伊：公司在加大投入 AI 的同時(shí)將繼續(xù)擴(kuò)招工程師
IT之家清源6-5
谷歌推送 Android 16 QPR1 Beta 1.1 更新，修復(fù)崩潰與界面顯示等問(wèn)題
IT之家遠(yuǎn)洋6-5
繼小米玄戒之后谷歌加入自研Soc陣營(yíng)：基帶外掛三星
快科技振亭6-4

特別策劃