阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。
这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。
QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。
其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!
上一篇:每周上班不超44小时 真双休!专家:幸福是给员工涨工资
栏 目:资讯
本文标题:阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
本文地址:https://fushidao.cc/ruanjianxiazai/1738.html
您可能感兴趣的文章
- 03-06《六姊妹》成2025年首部爆款电视剧 登顶收视率之王
- 03-06只要6元 《王者荣耀》阿轲化蝶舞皮肤今晚0点秒杀
- 03-06阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
- 03-06每周上班不超44小时 真双休!专家:幸福是给员工涨工资
- 03-061548匹马力小米SU7 Ultra 一般人到底如何驾驭
- 03-06小米15 Ultra拿下MWC 2025“Best in Show”大奖:国产超高端被全球认可
- 03-06微软造出了惊到宇宙的量子计算机 我怀疑他们被诈骗了
- 03-06《双影奇境》M站评分升至91!合作游戏巅峰之作
- 03-06中国联通首款纯国产Wi-Fi 7智能路由器VS057发布:海思主控芯片、2.5G网口
- 03-06英伟达发布572.70 WHQL驱动:支持RTX 5070、修复显卡黑屏问题


阅读排行
- 1《六姊妹》成2025年首部爆款电视剧 登顶收视率之王
- 2只要6元 《王者荣耀》阿轲化蝶舞皮肤今晚0点秒杀
- 3阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
- 4每周上班不超44小时 真双休!专家:幸福是给员工涨工资
- 51548匹马力小米SU7 Ultra 一般人到底如何驾驭
- 6小米15 Ultra拿下MWC 2025“Best in Show”大奖:国产超高端被全球
- 7微软造出了惊到宇宙的量子计算机 我怀疑他们被诈骗了
- 8《双影奇境》M站评分升至91!合作游戏巅峰之作
- 9中国联通首款纯国产Wi-Fi 7智能路由器VS057发布:海思主控芯片、2.5G网口
- 10英伟达发布572.70 WHQL驱动:支持RTX 5070、修复显卡黑屏问题
推荐教程
- 05-11office2019+visio2019+project2019最新激活密钥和激活方法
- 11-29潘粤明新剧《白夜破晓》豆瓣开分仅7.0:对不起大家7年等待
- 05-11Office 2019产品密钥在哪里输入?如何关联Microsoft帐户?
- 11-29营销号编造抖音电商一年GMV超2万亿元!官方辟谣
- 05-11office 2010永久的密钥 office 2010 密钥
- 07-04比尔盖茨最新预言:耳机和眼镜才是AI硬件重点
- 11-29美团回应骑手吐口水:虚假摆拍!已永久限制接单
- 11-29《黑神话:悟空》百事联名可乐曝光!四妹拥有专属瓶身
- 05-30如何管好微信支付的“自动续费” 官方一文看懂
- 11-29传吉利高管曾寄刀给博世总裁希望降价 官方辟谣:不是砍价的刀