AI 模型大戰白熱化：MiniMax 價格戰、Anthropic 衝刺 IPO 與 Qwen3.6 登陸 Ollama

2026-06-02 frank

2026 年 6 月初，全球 AI 模型競賽進入了前所未有的白熱化階段。從中國新創企業發動的價格戰，到美國科技巨頭的資本擴張，再到開源社群的快速迭代，各大模型陣營正透過效能突破與成本壓縮來爭奪市場主導權。本文將為您彙整過去 24 小時內，來自各大官方來源、Ollama 以及 OpenRouter 的最新模型動態。

MiniMax M3 發動價格戰：以 5% 成本挑戰 GPT-5.5

中國 AI 新創公司 MiniMax 正式發佈了其最新旗艦模型 M3，這款原生多模態模型在業界投下了一顆震撼彈。M3 模型支援高達 100 萬 token 的上下文長度，並採用了創新的稀疏注意力（Sparse Attention）機制，使其在處理長文本時的速度提升了 15.6 倍 [1]。

在效能表現上，MiniMax M3 在 SWE-Bench Pro 測試中取得了 59.0% 的成績，成功超越了 OpenAI 的 GPT-5.5 以及 Google 的 Gemini 3.1 Pro [1]。然而，最引人注目的並非其效能，而是其極具破壞性的定價策略。M3 模型的促銷價格為每百萬輸入 token 0.30 美元，每百萬輸出 token 1.20 美元，這僅相當於 GPT-5.5 成本的 5% 到 10% [1]。

目前，MiniMax M3 已經在 OpenRouter 上架，並於昨日同步更新至 Ollama 模型庫，預計在未來 10 天內將進一步開源其模型權重（open weights） [1]。

Anthropic 估值逼近兆美元，秘密提交 IPO 申請

在資本市場方面，Anthropic 展現了驚人的成長動能。該公司剛剛完成了高達 650 億美元的 Series H 輪融資，使其投後估值達到了 9,650 億美元，正式超越 OpenAI 成為全球估值最高的 AI 新創公司 [2]。

伴隨這輪巨額融資，Anthropic 已向美國證券交易委員會（SEC）秘密提交了 S-1 上市草稿，目標在今年秋季完成首次公開募股（IPO） [2]。根據外媒報導，Anthropic 的營收成長極為迅猛，預計第二季營收將達到 109 億美元，實現環比翻倍；其年化收入更預計在下月底突破 500 億美元大關，相較於去年 7 月的 40 億美元，在短短一年內成長了 12.5 倍 [2]。

Claude Opus 4.8 稱霸編碼測試，推出快速模式

在技術實力方面，Anthropic 依然保持領先。距離上一代模型發佈僅 41 天，Anthropic 就推出了 Claude Opus 4.8。這款新模型在 SWE-Bench Pro 測試中創下了 69.2% 的歷史新高，穩居目前最強編碼代理人模型的寶座 [3]。

為了滿足不同開發場景的需求，Claude Opus 4.8 特別推出了「快速模式（Fast Mode）」。在該模式下，模型的生成速度提升了 2 倍，而價格則大幅降低至標準版的約三分之一（輸入 $10/M，輸出 $50/M） [3]。目前，Claude Opus 4.8 及其快速模式均已在 OpenRouter 上線供開發者使用。

阿里巴巴 Qwen 家族雙箭齊發

阿里巴巴的 Qwen 團隊在今日也帶來了兩項重大更新，進一步鞏固其在開源與閉源市場的雙重佈局。

首先是開源領域的 Qwen3.6。這款模型今日正式登陸 Ollama，提供了 27B 和 35B 兩個尺寸版本。Qwen3.6 支援視覺、工具呼叫與思考能力，並具備 256K 的上下文窗口。其最大的亮點在於大幅升級了代理人編碼（Agentic Coding）能力，能夠更流暢地處理前端工作流程與倉庫級別的程式碼推理 [4]。此外，新增的「思考保留（Thinking Preservation）」功能，使其能完美支援 Claude Code、Codex App 以及 OpenCode 等開發工具 [4]。

其次是閉源領域的 Qwen3.7-Plus。這款今日發佈的多模態互動 AI 系統，整合了文字、編碼與生產力功能。它具備強大的跨模態任務處理能力，能夠感知真實環境、讀取螢幕畫面，甚至導航圖形使用者介面（GUI） [5]。受此消息激勵，阿里巴巴股價今日上漲超過 6% [5]。

各大平台最新模型上架總覽

為了讓開發者掌握最新資源，以下整理了 Ollama 與 OpenRouter 兩大平台在過去一週內的重點模型更新：

平台	模型名稱	更新時間	亮點特色
Ollama	qwen3.6 (27B/35B)	今日	強化代理人編碼，支援 OpenCode，新增思考保留功能
Ollama	minimax-m3	昨日	1M 上下文，原生多模態，極致性價比
Ollama	granite4.1	1週前	IBM 企業級模型，提供 3B/8B/30B 多種尺寸
OpenRouter	MiniMax M3	5月31日	$0.30/$1.20 極低定價，1M 上下文
OpenRouter	StepFun Step 3.7 Flash	5月28日	$0.20/$1.15，256K 上下文
OpenRouter	Claude Opus 4.8 (Fast)	5月27日	$10/$50，速度翻倍的頂級編碼模型
OpenRouter	Google Gemini 3.5 Flash	5月19日	$1.50/$9，1M 上下文，支援音訊與視訊輸入

隨著模型能力的快速迭代與推理成本的持續下降，2026 年下半年的 AI 應用開發預期將迎來新一波的爆發期。無論是選擇本地部署的開源模型，還是依賴雲端 API 的前沿大模型，開發者都擁有了前所未有的豐富選擇。

參考資料

[1] VentureBeat. “MiniMax M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro on key benchmark performance for just 5-10% of the cost.” https://venturebeat.com/technology/minimax-m3-debuts-eclipsing-gpt-5-5-and-gemini-3-1-pro-on-key-benchmark-performance-for-just-5-10-of-the-cost

[2] Fortune. “Anthropic confidentially files for IPO after a $965 billion valuation.” https://fortune.com/2026/06/01/anthropic-confidentially-files-ipo-965-billion-valuation/

[3] DataCamp. “Gemini 3.5 Flash vs GPT-5.5: Benchmarks, Features, Use Cases.” https://www.datacamp.com/blog/gemini-3-5-flash-vs-gpt-5-5

[4] Ollama Library. “qwen3.6.” https://ollama.com/library/qwen3.6

[5] GuruFocus. “Alibaba (9988.HK) Launches Qwen3.7-Plus AI Model, Stock Surges Over 6%.” https://www.gurufocus.com/news/8895032/alibaba-9988hk-launches-qwen37plus-ai-model-stock-surges-over-6