您的当前位置:首页 > 休闲 > 通义千问开源320亿参数模型,已实现7款大语言模型全开源 正文
时间:2025-08-05 11:14:36 来源:网络整理 编辑:休闲
4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外
4月7日消息,通义阿里云通义千问开源320亿参数模型Qwen1.5-32B,千问全开可最大限度兼顾性能、开源款效率和内存占用的亿参语言源平衡,为企业和开发者提供更高性价比的数模实现模型选择。目前,型已通义千问共开源了7款大语言模型,模型在海内外开源社区累计下载量突破300万。通义
通义千问此前已开源5亿、千问全开18亿、开源款40亿、亿参语言源70亿、数模实现140亿和720亿参数的型已6款大语言模型并均已升级至1.5版本,其中,模型几款小尺寸模型可便捷地在端侧部署,通义720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
雷峰网(公众号:雷峰网)
活性污泥法的工艺原理(活性污泥法的优缺点及用途)2025-08-05 10:29
啤酒生产废水处理设备介绍(啤酒厂废水处理工艺)2025-08-05 10:20
防范短视频沉迷,还需加强“青少年关怀”2025-08-05 10:17
梁洛施30岁复出!为李泽楷生了三个孩子却没结婚心酸过往令人心疼2025-08-05 10:07
莫拉蒂:球队好心态,教练高水平2025-08-05 10:02
3•15年度报告2025-08-05 09:27
钉钉再造AI新生态:平台跑出准确率超90%的妇科专业大模型2025-08-05 09:20
施巴 Sebamat GmbH 美丽来自健康肌肤!2025-08-05 09:17
悉尼歌剧院部署Auracast广播音频技术2025-08-05 08:58
梁洛施30岁复出!为李泽楷生了三个孩子却没结婚心酸过往令人心疼2025-08-05 08:32
王子邓丽欣恋情公开,方力申回应疑对女方找到另一半有点失落2025-08-05 10:57
厦门关区首票“安智贸”空运进口货物顺利通关2025-08-05 10:54
鄂豫皖消费维权将协同发展2025-08-05 10:48
《神之水滴》“第二使徒”:宝马庄园红葡萄酒2025-08-05 10:28
2025年短期意外险测评,这几款意外医疗0免赔、100%报销2025-08-05 10:28
“小米家具”精灵树再出击 迎接万亿级租房经济到来2025-08-05 10:20
法索内:马扎里是肯定的选择,不是赌博2025-08-05 10:08
端午假期 “2小时高铁圈”短途游受欢迎2025-08-05 09:46
家装市场潜力大 地板企业要把握这商机2025-08-05 08:50
与国内没区别 小米之家日本首店3月22日开业2025-08-05 08:29