欢迎来到科站长!

资讯

当前位置: 主页 > 软件下载 > 资讯

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通

时间:2025-03-27 14:51:51|栏目:资讯|点击:

3月27日消息,阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。

该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通

据介绍,Qwen2.5-Omni采用Thinker-Talker双核架构。

其中,Thinker 模块如同大脑,负责处理文本、音频、视频等多模态输入,生成高层语义表征及对应文本内容。

而Talker模块则类似发声器官,以流式方式接收Thinker实时输出的语义表征与文本,流畅合成离散语音单元。

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通

测试中,Qwen2.5-Omni在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通


上一篇:专家称未来机器人能替人类生孩子:如果道德伦理允许就完全没问题

栏    目:资讯

下一篇:李云飞:比亚迪兆瓦闪充、三万转电机技术过于先进 很多人不相信

本文标题:通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通

本文地址:https://fushidao.cc/ruanjianxiazai/1932.html

广告投放 | 联系我们 | 版权申明

申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:257218569 | 邮箱:257218569@qq.com

Copyright © 2018-2025 科站长 版权所有冀ICP备14023439号