LargitData — 企業情報與風險 AI 平台

部落格 — LargitData AI 與大數據技術文章

養龍蝦(OpenClaw)選哪個模型好?18 款模型實戰評測

  • 大數軟體
  • AI Agent評測 開源LLM 本地模型 Qwen3 LLM基準測試 agentic編碼 local_agentic_llm 開源AI 企業AI選型
  • March 20, 2026, 2:14 p.m.
養龍蝦(OpenClaw)選哪個模型好?18 款模型實戰評測

local_agentic_llm 是大數軟體發布的開源 AI Agent 基準測試框架,透過 OpenRouter API 評估 18 款語言模型(15 款開源)在 Agentic Coding 與 OpenClaw 技能建構情境的實際表現。第 1 名 qwen3-coder-flash 以 55/60 分領先(寫程式滿分 30/30),第 2 名 qwen3.5-27b 共 51 分,並列第 3 名 GLM-5、qwen3.5-122b、Kimi-K2.5 各 50 分。qwen3.5 家族稱霸 OpenClaw(G2)前 4 名,得分 26-27 分。性價比最高為 Gemini 3 Flash 與 qwen3.5-27b(G1 均達 25 分,費用僅 $0.09-0.10/次)。本文解析完整排行榜、四象限成本分析與六大任務通過率,協助企業選出最適 AI Agent 模型。

閱讀更多

揮別 2025,迎向 2026:有了 AI Agent ,我們真的更有效率了嗎?

  • 大數軟體
  • Agent 2025AI趨勢 2026AI預測 VibeCoding ClaudeCode 邊緣運算 企業AI 生成式AI RAGi
  • Jan. 4, 2026, 5 p.m.
揮別 2025,迎向 2026:有了 AI Agent ,我們真的更有效率了嗎?

回顧 2025 年的 AI 發展,從年初 Manus 的橫空出世,到年底 Meta 以超過 20 億美元將其收購;從 Claude Code 重新定義開發者工作流,到 MoE 架構讓小模型也能挑戰巨頭。種種跡象都指向同一個方向:AI 正從「會回答問題」走向「會把事情做完」。 然而到了年末反思時,我們必須誠實面對一個問題:Agent 元年是否只是一個新的口號? 本文將回顧 2025 年的關鍵發展,並對 2026 年提出我們的判斷。

閱讀更多