← 早晚报

🤖 Together AI推无服务器推理平台,Sakana AI与NVIDIA提速大模型

2026年5月10日 · 早报 · 14 条头条 · 5:48

无服务器模型白菜价,稀疏大模型提速两成,AI玩具嘴炮翻车,字幕眼镜实时开挂,影视SIGGRAPH狂点生成式技能……

今日 Top 3 头条

  1. AI行业新闻

    🤖 Together AI 无服务器模型上线:DeepSeek-V4-Pro 512k 上下文,输入 2.1$/M、输出…

    Together AI 文档披露,其无服务器推理平台已上线 DeepSeek-V4-Pro 等 20+ 模型,输入 2.1$/M、输出 4.4$/M,缓存输入低至 0.2$/M。对开发者意味着零预留、零最低消费即可跑大模型,原型与低并发生…

    来源
  2. AI技术

    🤖 十亿参数模型提速20%,Sakana AI×NVIDIA推TwELL格式

    Sakana AI联合NVIDIA发布TwELL稀疏格式与定制CUDA内核,在十亿参数级大模型上实现推理提速逾20%,并降低峰值内存与能耗。对开发者意味着可在同硬件上跑更大模型或更高并发,为边缘部署与绿色算力打开新空间。

    来源
  3. AI行业新闻

    🤖 AI自信却出错?意图混沌测试让代理上线前现原形

    VentureBeat披露Sayali Patil文章,指出2026年企业AI部署中,观测代理因误判批处理触发回滚致系统停摆4小时,主因是LLM非确定性与多代理“毒输入”叠加。对开发者而言,意图驱动混沌测试把度量标准从“任务完成”改为“意…

    来源

+9 条头条

  • 🤖 Palantir CEO:AI 既是产品也是靶子,业务或被模型取代
  • 🤖 直降919美元!戴森360 Vis Nav扫地机器人仅279.99美元
  • 🤖 1500家企业竞逐AI儿童玩具,低价潮下内容失控引监管呼声
  • 🤖 WIRED评2026最佳实时字幕眼镜:Even Realities G2夺冠
  • 🤖 SIGGRAPH 2026首发议程:曼达洛人、阿凡达3、玩具5等视效黑科技
  • 🤖 Redis 之父推 ds4,本地跑 DeepSeek V4 推理提速 Apple Silicon
  • 🤖 2026北京车展19款最燃新车:电动+AI中国领跑
  • 🤖 2026九大规范驱动AI工具:AWS Kiro、BMAD、GSD领衔
  • 🤖 Palantir 6亿英镑英国大单推手:历史系毕业的游说高手莫斯利
解锁完整 12 条头条 + 深度分析 →免费试用 3 天 · 随时取消