5月9日,全球权威AI基准测试平台Artificial Analysis公布了最新一期大模型榜单,阿里通义千问Qwen3(简称千问3)智能水平位列全球前五,开源第一;同时千问3是所有顶尖模型中价格最低的,推理成本不到DeepSeek-R1 的三分之一,是Claude 3.7 的二十分之一。据悉,千问3开源一周以来,全球下载量超过330万次,是近期最火热的开源大模型之一。
大模型评测数据(采访对象供图)
据了解,Artificial Analysis是由著名AI科学家吴恩达领衔的独立AI基准测试和分析平台。该平台整合了多个权威测试集,覆盖推理与知识、科学推理、竞赛数学、代码生成等核心智能评估领域,是业界公认的最权威、最有影响力的AI大模型测评之一。Artificial Analysis的最新测评显示,千问3智能水平比肩o3、Grok3-mini-Reasoning(high)等顶级闭源模型,超过英伟达Llama3.1-Nemotron-Ultra、DeepSeek-R1、DeepSeek-V3-0324,斩获全球开源模型冠军。
大模型评测数据(采访对象供图)
除了性能,Artificial Analysis还对顶级大模型的API平均价格进行了分析排名,结果显示,千问3在各平台上的平均推理成本为0.3美元/百万Tokens,而DeepSeek R1为1美元,Claude 3.7 Sonnet 则高达6美元,千问3是所有顶级大模型中推理价格最便宜的。行业曾测算,千问3的部署成本也极低,仅为同等性能模型的1/3。
自4月29日开源以来,千问3全球下载量已超330万次,产业链上下游纷纷适配及接入千问3 ,包括英伟达、英特尔、高通、联发科、AMD、ARM、壁仞科技等多家头部芯片厂商,北上津杭等十余地算力平台,以及华为昇腾、百度千帆、中科曙光等多家AI公司及大模型服务平台。
截至目前,千问3已斩获Artificial Analysis、LiveBench、LiveCodeBench、SuperClue等国内外多个榜单的全球开源冠军、国产模型冠军。据了解,阿里通义已开源200多个模型,全球下载量超过3亿次,千问的衍生模型数量逾10万,远超美国Llama,是全球第一开源模型。
“转载请注明出处”