IDC《AI大模型技术能力评估报告2023》:百度获算法模型、行业覆盖唯一满分(百度供图)
国产AI大模型“百模大战”在今年全面打响,而百度推出的“文心一言”是国内率先推出的对标“ChatGPT”的AI大模型。近日,国际信息技术和消费科技咨询权威机构“IDC”发布首个大模型评估报告《AI大模型技术能力评估报告2023》,重点调研了9家中国市场主流大模型技术厂商,其中文心大模型3.5,以12项指标7个满分,综合平分排名第一。
“非常不谦虚的说,新的版本文心一言能力已经超过ChatGPT 3.5。”对于文心一言现在的实力,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜充满信心。
就在5月份,百度上线了新的底座模型——文心大模型3.5。最新数据显示,百度的飞桨平台上已经有750万开发者。吴甜解释,根据工信部的调研数据,中国的软件从业人员大约是800万-1000万。“我想说,750万的AI开发者已经是非常大的开发人群。”
百度副总裁吴甜(百度供图)
此次的IDC评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。
当前大模型正处于快速发展阶段,产品技术能力、行业应用能力显得尤为重要。产品技术能力中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。在行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。
百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。AI大模型已经从拼参数发展到拼应用,进入大规模可复制的产业落地阶段。百度文心大模型源于产业实践,服务于产业实践,百度联合国家电网、浦发银行、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位,合作发布了11个行业大模型,是业内最早和广泛深入推动行业大模型的厂商。
目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。
以能源电力为例,在全球最大的公用事业企业——国家电网有限公司,面向复杂电网的专业场景,基于百度文心大模型,百度与智研院联合训练电力行业大模型,在电网设备、客服等实际业务场景进行试点验证,可以显著增强电网运营的精细化、自动化、智能化水平。百度也和深圳燃气联合发布了燃气行业大模型,破解燃气企业运营场景繁杂、安全风险识别困难等难题。
“转载请注明出处”