AI你我的未來

AI 模型大戰白熱化:MiniMax 價格戰、Anthropic 衝刺 IPO 與 Qwen3.6 登陸 Ollama

AI 模型大戰白熱化

2026 年 6 月初,全球 AI 模型競賽進入了前所未有的白熱化階段。從中國新創企業發動的價格戰,到美國科技巨頭的資本擴張,再到開源社群的快速迭代,各大模型陣營正透過效能突破與成本壓縮來爭奪市場主導權。本文將為您彙整過去 24 小時內,來自各大官方來源、Ollama 以及 OpenRouter 的最新模型動態。

MiniMax M3 發動價格戰:以 5% 成本挑戰 GPT-5.5

中國 AI 新創公司 MiniMax 正式發佈了其最新旗艦模型 M3,這款原生多模態模型在業界投下了一顆震撼彈。M3 模型支援高達 100 萬 token 的上下文長度,並採用了創新的稀疏注意力(Sparse Attention)機制,使其在處理長文本時的速度提升了 15.6 倍 [1]。

在效能表現上,MiniMax M3 在 SWE-Bench Pro 測試中取得了 59.0% 的成績,成功超越了 OpenAI 的 GPT-5.5 以及 Google 的 Gemini 3.1 Pro [1]。然而,最引人注目的並非其效能,而是其極具破壞性的定價策略。M3 模型的促銷價格為每百萬輸入 token 0.30 美元,每百萬輸出 token 1.20 美元,這僅相當於 GPT-5.5 成本的 5% 到 10% [1]。

目前,MiniMax M3 已經在 OpenRouter 上架,並於昨日同步更新至 Ollama 模型庫,預計在未來 10 天內將進一步開源其模型權重(open weights) [1]。

Anthropic 估值逼近兆美元,秘密提交 IPO 申請

在資本市場方面,Anthropic 展現了驚人的成長動能。該公司剛剛完成了高達 650 億美元的 Series H 輪融資,使其投後估值達到了 9,650 億美元,正式超越 OpenAI 成為全球估值最高的 AI 新創公司 [2]。

伴隨這輪巨額融資,Anthropic 已向美國證券交易委員會(SEC)秘密提交了 S-1 上市草稿,目標在今年秋季完成首次公開募股(IPO) [2]。根據外媒報導,Anthropic 的營收成長極為迅猛,預計第二季營收將達到 109 億美元,實現環比翻倍;其年化收入更預計在下月底突破 500 億美元大關,相較於去年 7 月的 40 億美元,在短短一年內成長了 12.5 倍 [2]。

Claude Opus 4.8 稱霸編碼測試,推出快速模式

在技術實力方面,Anthropic 依然保持領先。距離上一代模型發佈僅 41 天,Anthropic 就推出了 Claude Opus 4.8。這款新模型在 SWE-Bench Pro 測試中創下了 69.2% 的歷史新高,穩居目前最強編碼代理人模型的寶座 [3]。

為了滿足不同開發場景的需求,Claude Opus 4.8 特別推出了「快速模式(Fast Mode)」。在該模式下,模型的生成速度提升了 2 倍,而價格則大幅降低至標準版的約三分之一(輸入 $10/M,輸出 $50/M) [3]。目前,Claude Opus 4.8 及其快速模式均已在 OpenRouter 上線供開發者使用。

阿里巴巴 Qwen 家族雙箭齊發

阿里巴巴的 Qwen 團隊在今日也帶來了兩項重大更新,進一步鞏固其在開源與閉源市場的雙重佈局。

首先是開源領域的 Qwen3.6。這款模型今日正式登陸 Ollama,提供了 27B 和 35B 兩個尺寸版本。Qwen3.6 支援視覺、工具呼叫與思考能力,並具備 256K 的上下文窗口。其最大的亮點在於大幅升級了代理人編碼(Agentic Coding)能力,能夠更流暢地處理前端工作流程與倉庫級別的程式碼推理 [4]。此外,新增的「思考保留(Thinking Preservation)」功能,使其能完美支援 Claude Code、Codex App 以及 OpenCode 等開發工具 [4]。

其次是閉源領域的 Qwen3.7-Plus。這款今日發佈的多模態互動 AI 系統,整合了文字、編碼與生產力功能。它具備強大的跨模態任務處理能力,能夠感知真實環境、讀取螢幕畫面,甚至導航圖形使用者介面(GUI) [5]。受此消息激勵,阿里巴巴股價今日上漲超過 6% [5]。

各大平台最新模型上架總覽

為了讓開發者掌握最新資源,以下整理了 Ollama 與 OpenRouter 兩大平台在過去一週內的重點模型更新:

平台 模型名稱 更新時間 亮點特色
Ollama qwen3.6 (27B/35B) 今日 強化代理人編碼,支援 OpenCode,新增思考保留功能
Ollama minimax-m3 昨日 1M 上下文,原生多模態,極致性價比
Ollama granite4.1 1週前 IBM 企業級模型,提供 3B/8B/30B 多種尺寸
OpenRouter MiniMax M3 5月31日 $0.30/$1.20 極低定價,1M 上下文
OpenRouter StepFun Step 3.7 Flash 5月28日 $0.20/$1.15,256K 上下文
OpenRouter Claude Opus 4.8 (Fast) 5月27日 $10/$50,速度翻倍的頂級編碼模型
OpenRouter Google Gemini 3.5 Flash 5月19日 $1.50/$9,1M 上下文,支援音訊與視訊輸入

隨著模型能力的快速迭代與推理成本的持續下降,2026 年下半年的 AI 應用開發預期將迎來新一波的爆發期。無論是選擇本地部署的開源模型,還是依賴雲端 API 的前沿大模型,開發者都擁有了前所未有的豐富選擇。


參考資料

[1] VentureBeat. “MiniMax M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro on key benchmark performance for just 5-10% of the cost.” https://venturebeat.com/technology/minimax-m3-debuts-eclipsing-gpt-5-5-and-gemini-3-1-pro-on-key-benchmark-performance-for-just-5-10-of-the-cost

[2] Fortune. “Anthropic confidentially files for IPO after a $965 billion valuation.” https://fortune.com/2026/06/01/anthropic-confidentially-files-ipo-965-billion-valuation/

[3] DataCamp. “Gemini 3.5 Flash vs GPT-5.5: Benchmarks, Features, Use Cases.” https://www.datacamp.com/blog/gemini-3-5-flash-vs-gpt-5-5

[4] Ollama Library. “qwen3.6.” https://ollama.com/library/qwen3.6

[5] GuruFocus. “Alibaba (9988.HK) Launches Qwen3.7-Plus AI Model, Stock Surges Over 6%.” https://www.gurufocus.com/news/8895032/alibaba-9988hk-launches-qwen37plus-ai-model-stock-surges-over-6