谷歌公司于近日正式揭曉了其最新的AI技術進展,宣布在Google AI Studio和Vertex AI平臺上,以Gemini API的形式推出Gemini 2.5 Flash預覽版模型。這一創(chuàng)新舉措為開發(fā)者們帶來了更為強大的AI工具。
據(jù)悉,用戶不僅能夠通過Gemini應用內的便捷模型選擇器直接使用這一預覽版模型,還能結合Canvas工具,進一步優(yōu)化文檔和代碼編輯體驗。這一整合不僅提升了效率,也拓寬了AI技術在文檔處理和代碼優(yōu)化方面的應用邊界。
Gemini 2.5 Flash作為谷歌精心打造的混合推理模型,其最大亮點在于其“動態(tài)且可控”的計算能力。這意味著開發(fā)者可以根據(jù)實際查詢請求的復雜程度,靈活調整處理時間,從而在保證精度的同時,優(yōu)化性能表現(xiàn)。這一特性使得Gemini 2.5 Flash在應對高容量和實時性要求極高的應用場景時,展現(xiàn)出了非凡的潛力。
谷歌官方強調,Gemini 2.5 Flash特別適用于客戶服務和文檔解析等需要快速響應和高精度的場景。在博客文章中,谷歌表示:“這款專為低延遲和成本效益優(yōu)化的工作型模型,是構建響應式虛擬助手和實時總結工具的理想選擇。”
在定價方面,谷歌也給出了極具競爭力的方案。Gemini 2.5 Flash模型對于每100萬tokens的輸入費用為0.15美元,每100萬tokens的輸出(不含推理)費用為0.6美元,而包含推理的輸出費用則為3.5美元。這一價格策略無疑將吸引大量開發(fā)者嘗試并采用這一先進的AI模型。
作為業(yè)界首款全混合推理模型,Gemini 2.5 Flash賦予了開發(fā)者前所未有的靈活性。他們可以根據(jù)實際需求開啟或關閉推理功能,從而在響應質量、成本和延遲之間找到最佳平衡點。與Anthropic和Grok等前沿模型相比,Gemini 2.5 Flash在保持高性能的同時,提供了更為經(jīng)濟高效的解決方案。