早晚報

🤖 Together AI推無服務器推理平臺,Sakana AI與NVIDIA提速大模型

2026年5月10日 · 早報 · 14 條頭條 · 5:48

無服務器模型白菜價,稀疏大模型提速兩成,AI玩具嘴炮翻車,字幕眼鏡實時開掛,影視SIGGRAPH狂點生成式技能……

今日 Top 3 頭條

  1. AI行業新聞

    🤖 Together AI 無服務器模型上線:DeepSeek-V4-Pro 512k 上下文,輸入 2.1$/M、輸出…

    Together AI 文檔披露,其無服務器推理平臺已上線 DeepSeek-V4-Pro 等 20+ 模型,輸入 2.1$/M、輸出 4.4$/M,緩存輸入低至 0.2$/M。對開發者意味著零預留、零最低消費即可跑大模型,原型與低併發生…

    來源
  2. AI技術

    🤖 十億參數模型提速20%,Sakana AI×NVIDIA推TwELL格式

    Sakana AI聯合NVIDIA發佈TwELL稀疏格式與定製CUDA內核,在十億參數級大模型上實現推理提速逾20%,並降低峰值內存與能耗。對開發者意味著可在同硬件上跑更大模型或更高併發,為邊緣部署與綠色算力打開新空間。

    來源
  3. AI行業新聞

    🤖 AI自信卻出錯?意圖混沌測試讓代理上線前現原形

    VentureBeat披露Sayali Patil文章,指出2026年企業AI部署中,觀測代理因誤判批處理觸發回滾致系統停擺4小時,主因是LLM非確定性與多代理“毒輸入”疊加。對開發者而言,意圖驅動混沌測試把度量標準從“任務完成”改為“意…

    來源

+9 條頭條

  • 🤖 Palantir CEO:AI 既是產品也是靶子,業務或被模型取代
  • 🤖 直降919美元!戴森360 Vis Nav掃地機器人僅279.99美元
  • 🤖 1500家企業競逐AI兒童玩具,低價潮下內容失控引監管呼聲
  • 🤖 WIRED評2026最佳實時字幕眼鏡:Even Realities G2奪冠
  • 🤖 SIGGRAPH 2026首發議程:曼達洛人、阿凡達3、玩具5等視效黑科技
  • 🤖 Redis 之父推 ds4,本地跑 DeepSeek V4 推理提速 Apple Silicon
  • 🤖 2026北京車展19款最燃新車:電動+AI中國領跑
  • 🤖 2026九大規範驅動AI工具:AWS Kiro、BMAD、GSD領銜
  • 🤖 Palantir 6億英鎊英國大單推手:歷史系畢業的遊說高手莫斯利
解鎖完整 12 條頭條 + 深度分析 →免費試用 3 天 · 隨時取消
查看所有歷史早晚報 →