作者:欧易 发布时间:2025-05-15 03:26:00
字节跳动Seed团队推出视觉-语言多模态大模型Seed1.5-VL,预训练数据超3Ttokens,具备强大的多模态理解和推理能力。其性能媲美谷歌Gemini 2.5 Pro,在60个评测基准中拿下38项最优成绩。Seed1.5-VL在视觉任务上表现出色,尤其在GUI代理任务中有亮眼表现。同时,模型优化了架构设计,降低了推理成本,适合交互式应用,能完成复杂任务如信息收集和游戏操作。
尽管优势明显,Seed1.5-VL仍存在局限性。在细粒度视觉感知和高层次推理任务中表现不稳定,视频推理能力也有待提升。目前该模型已在火山引擎开放API体验。多模态技术成为大厂竞争焦点,谷歌、OpenAI相继发布新模型,国内厂商也加速布局。券商看好AI主题投资,认为Agent能力的提升将带动算力需求增长,建议关注相关领域机会。
字节跳动推出多模态大模型Seed1.5-VL性能强劲
gate.io官网下载 · 2025-05-15 03:26:00
中美削减关税,中国股市评级被上调
gate.io官网下载 · 2025-05-15 03:26:00
AI平台Manus开放注册,任务效率引发对比热议
gate.io官网下载 · 2025-05-15 03:26:00
印度拟对美商品加征关税以示反制
gate.io官网下载 · 2025-05-15 03:26:00
DRAM价格暴涨,AI需求成主因
gate.io官网下载 · 2025-05-15 03:26:00
来伊份回应蜜枣粽质量问题
gate.io官网下载 · 2025-05-15 03:26:00