豆包上线实时视频通话功能,多场景 AI 交互更智能

豆包 APP 近日推出实时视频通话功能,用户在对话界面开启视频后,可与 AI 基于真实场景实时互动问答,将视觉理解能力从图片拓展至动态视频场景。该功能依托最新视觉理解模型,具备内容识别、推理描述等能力,同步接入联网搜索确保信息时效,支持用户在旅行、参观等场景中通过镜头获取即时知识服务 —— 例如在故宫拍摄宫殿可了解历史典故,在博物馆对准展品能获取背景解析,

甚至可通过视频分析榴莲果壳刺密度、颜色等特征,辅助判断果肉成熟度。功能操作便捷,用户在豆包 App 点击 “对话 – 视频通话” 即可启动,且电脑端同步支持共享画面,实现多平台覆盖。此次升级打破传统图文交互局限,以 “边看边聊” 模式降低使用门槛,展现 AI 在视觉交互领域的实用化突破,为生活服务、知识获取等场景提供智能化辅助工具。

表情
豆包

豆包

0.0分

豆包是字节跳动旗下北京春田知韵科技有限公司(抖音子公司)开发的AI 对话产品,核心技术基于字节自研的云雀大模型。其定位为多场景智能助手,覆盖 C 端用户与 B 端企业服务,具备以下核心特点:

文章目录