美团开源多模态AI模型LongCat-Flash-Omni,实现全模态实时交互
摘要:美团于2025年11月开源其多模态大模型LongCat-Flash-Omni,该模型采用560B总参数、27B激活参数的MoE架构,在Omni-Bench等综合基准测试中达到开源SOTA水平,并与闭源模型Gemini-2.5-Pro性能相当。作为首个支持全模态实时交互的开源模型,其文本、图像、音频及视频处理能力均位居前列,目前已上线LongCat应用及Web端供免费体验。
关键点: • 开源多模态模型达到SOTA水平 • 支持全模态实时交互 • 采用高效MoE架构 • 覆盖文本图像音频视频 • 已在多平台开放体验
