Gemini 3.5 Flash 評測:Google I/O 2026 最快 AI 模型全面解析

Google 在 I/O 2026 帶來了年度最受矚目的 AI 模型更新,Gemini 3.5 Flash 是這次大會的核心亮點。2026 年 5 月 19 日正式發布,速度比同級模型快 4 倍,比上一代 Gemini 3.1 Pro 便宜約 40%。本文從規格、基準測試到定價全面拆解,幫你判斷它是否値得納入你的工作流程。
Gemini 3.5 Flash 是什麼?
Gemini 3.5 Flash 是 Google DeepMind 最新的效率優先語言模型,已成為 Gemini App 與 Google 搜尋 AI Mode 的預設模型。它在程式碼生成和代理任務基準測試上超越舊版 Gemini 3.1 Pro,同時大幅降低成本。
模型支援 100 萬 token 的上下文視窗,可接受文字、圖片、音訊和影片作為輸入。動態思考功能預設開啟,讓它在處理複雜任務時接近推理模型的水準,無需切換額外模式。
核心規格一覽
| 規格 | 詳情 |
|---|---|
| 發布日期 | 2026 年 5 月 19 日(Google I/O 2026) |
| 上下文視窗 | 輸入 1,048,576 / 輸出 65,536 tokens |
| 支援模態 | 文字、圖片、音訊、影片 → 文字輸出 |
| 知識截止日期 | 2026 年 1 月 |
| 速度 | 比同級前沿模型快約 4 倍 |
| 動態思考 | 預設開啟 |
| 工具呼叫 | 函式呼叫、結構化輸出、程式碼執行、搜尋 |
Gemini 3.5 Flash 基準測試:與 Claude 和 GPT-5.5 的比較
Gemini 3.5 Flash 在代理工具使用基準測試中,116 個模型排名第 3,平均得分 97.3。在三項最受關注的評估中全面領先:
| 基準測試 | Gemini 3.5 Flash | Claude Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| MCP Atlas(代理任務) | 83.6% | 79.1% | 75.3% |
| Terminal-Bench 2.1(程式碼) | 76.2% | ~72% | ~71% |
| CharXiv 推理 | 84.2% | — | — |
需注意:在長篇寫作品質方面,Claude Opus 4.7 仍在獨立基準研究的盲測中領先(偉好率 47% vs. Gemini 的7 24%)。如果寫作是你的核心需求,這個差距値得列入考量。
定價:Gemini 3.5 Flash 費用一覽
| 計費項目 | 價格 |
|---|---|
| 輸入(每 100 萬 tokens) | $1.50 |
| 輸出(每 100 萬 tokens) | $9.00 |
| 快取輸入 | $0.15 |
| 非全球區域 | $1.65 / $9.90 |
對於大量呼叫的應用(客服機器人、程式碼審查流程、文件處理),比 Gemini 3.1 Pro 便宜約 40% 的成本優勢相當顯著。完整 API 定價可參考 Google DeepMind 官方頁面。
Gemini 3.5 Flash 最適合哪些場景?
百萬 token 上下文視窗加上頂岖的代理任務分數,讓它特別適合:
- 長文件分析 — 法律文書、技術手冊、跟數百頁的研究報告
- 代理式程式開發 — 多步驟程式碼生成、除錯與重構迴圈
- MCP 工作流程 — 對延遲敏感的工具呼叫管線
- 多模態任務 — 同時分析圖片、影片片段或音訊檔案
- 高流量 API — 以 token 成本為首要考量的應用
現在就能試用 Gemini 3.5 Flash
你可以透過 Google AI Studio(提供免費方案)或 Gemini API 使用 Gemini 3.5 Flash,它也是 Gemini App 的全新預設模型。
若想把 Gemini 3.5 Flash 和 Claude、ChatGPT 等主流模型放在同一介面並排比較,iMini AI 的對話介面已整合 Gemini,無需 API 金鑰,是找到最適合任務模型的最快方式。

總結
在代理式程式開發、工具呼叫工作流程和長上下文分析方面,Gemini 3.5 Flash 是目前市場上最快的前沿模型,速度、成本與能力的組合在這個價位無可比擬。
需要最佳寫作品質?Claude 仍有優勢。需要在大規模結構化任務中兼顧速度與智能?Gemini 3.5 Flash 是 2026 年的答案。前往 iMini AI 免費試用,與所有頂尖模型並排對比。


