您的当前位置:首页 > 休闲 > 通义千问开源320亿参数模型,已实现7款大语言模型全开源 正文
时间:2025-08-05 11:14:37 来源:网络整理 编辑:休闲
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外
4月7日消息,通义阿里云通义千问开源320亿参数模型Qwen1.5-32B,千问全开可最大限度兼顾性能、开源款效率和内存占用的亿参语言源平衡,为企业和开发者提供更高性价比的数模实现模型选择。目前,型已通义千问共开源了7款大语言模型,模型在海内外开源社区累计下载量突破300万。通义
通义千问此前已开源5亿、千问全开18亿、开源款40亿、亿参语言源70亿、数模实现140亿和720亿参数的型已6款大语言模型并均已升级至1.5版本,其中,模型几款小尺寸模型可便捷地在端侧部署,通义720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
雷峰网(公众号:雷峰网)
《沙丘3》已开拍 全片使用IMAX摄影机拍摄、撞车《复联6》2025-08-05 11:03
央广网:中粮集团:预计2018年解决下属专业化公司体制问题2025-08-05 10:23
经济日报:央企实现首季“开门红”2025-08-05 10:15
家居电商生死战:谁先用DeepSeek+奇兵到家,谁先吃掉市场!2025-08-05 10:13
韦德2创里程碑演孤胆英雄 罚球线一步战斧劈扣2025-08-05 10:07
2015年哪家超两亿体量照明企业将倒下2025-08-05 09:38
2015年哪家超两亿体量照明企业将倒下2025-08-05 09:29
联想推新版YOGA Pro 16 Aura AI元启 U9+5070国补8999元2025-08-05 09:08
2017郑州空气哪天好?4组定点图全看到2025-08-05 08:37
《滁州市2024年购房补贴操作细则》印发_2025-08-05 08:31
汉阴农商银行开展庆祝“三八”国际劳动妇女节主题活动2025-08-05 10:45
我市启动2025年高考录取通知书投递工作_2025-08-05 10:42
古天乐回应最近戴墨镜:右眼视网膜穿了两个洞2025-08-05 10:35
泰新鲜青见柠檬&椰子水,从原料到终端,全链路打造旺季爆品!2025-08-05 10:03
阿修罗撤档停映是怎么回事?阿修罗撤档停映真相揭秘2025-08-05 10:02
欧露丝太空舱床垫:ABS太空缓冲科技助您好睡眠2025-08-05 09:49
【凉山交通】道路阻断信息2025-08-05 09:36
光明日报:2017年,国企改革要啃哪些“硬骨头”2025-08-05 09:14
若交易甜瓜只愿去骑士快船 仍信纽约能扭转颓势2025-08-05 08:42
木质家具防蛀虫的有效方法-2025-08-05 08:34