浙江创新力量闪耀国际舞台。当地时间7月8日至11日,2025年人工智能向善全球峰会(AI for Good Global Summit)在瑞士日内瓦召开。潮新闻记者获悉,会议期间,《人工智能向善创新实践案例集》(AI for Good Innovate for Impact use cases)发布,来自浙江之江实验室的两项科学模型成果GeoGPT及OneAstronomy收录其中。
中国工程院院士、之江实验室主任王坚在峰会现场领奖 本文图片由之江实验室供图
值得一提的是,之江实验室主导打造的地学AI大模型GeoGPT,从全球200多个参评案例中脱颖而出,荣获国际电信联盟(ITU)颁发的“人工智能向善创新实践优秀案例奖”,展示了浙江在“AI+科学”前沿领域的创新实力与全球影响力。
相关负责人表示,此次获奖和入选的成果,是之江实验室践行开放科学理念、积极参与全球科技治理、推动人工智能与科学研究深度融合的标志性实践样本。
“浙江智造”解决全球科研痛点,效率飙升
据了解,获奖的GeoGPT是一个开源、非营利的地学领域AI大模型。它融合了深时地球海量数据与智能算法,集成了深度检索分析、文献阅读与数据抽取、地质图问答与生成、知识图谱构建等强大功能,并提供了智能体开发平台。
截至目前,GeoGPT已吸引来自135个国家的4万余名地球科学研究者注册使用,帮助众多该领域的科研人员提升了研究效率。
之江实验室科学模型成果在日内瓦对外展示
GeoGPT的应用解决了科研中的实际痛点。例如,如何将海量无脊椎动物古化石数据从《无脊椎动物专著》等纸质载体抽取出来,是古生物领域面临的一大挑战。GeoGPT团队与普渡大学James Ogg教授团队合作开发大模型数据智能抽取工具,相比人工提取及传统算法节省了75%的时间。目前已完成3卷专著、约2000页文本的自动化数据抽取与人工校验。这些结构化数据已成功汇入Treatise在线化石数据库并向全球开放,标志着该领域首批大规模化石数据成功实现线上化。
由之江实验室与中国科学院国家天文台共同打造的OneAstronomy及系列天文科学计算模型,则在处理分析复杂天文数据、探索宇宙起源方面展现出巨大潜力。天文科学计算模型之一恒星光谱模型SpecCLIP已经从郭守敬望远镜(LAMOST)1000多万条中低分辨率光谱和盖亚空间天文台(GAIA)2亿多条超低分辨率光谱数据中发现了8000多颗贫金属星候选体([Fe/H]小于-4.0),而此前人类发现的[Fe/H]小于-4.0的恒星一共仅有50多颗。通过研究这些贫金属星,天文学家能够去推断早期银河系的样貌。
开放共享,“浙江样本”参与全球科技治理
今年4月27日,GeoGPT正式面向全球开放使用,同时开源了三个核心模型及训练数据源列表。
“只有在国际上坚持开放以后,才可以真正介入科技治理的问题。GeoGPT和OneAstronomy非常好地践行了开放科学理念,同时通过GeoGPT的全球开放以及治理委员会的工作,我们也可以真正在实践上去体会如何参与国际科技治理。”中国工程院院士、之江实验室主任王坚在峰会期间表示。
王坚与GeoGPT治理委员会联席主席John Ludden,Richard J
GeoGPT的全球开放有力支撑了联合国可持续发展目标。例如,其基于微藻物种分类的算法,能高效识别有害藻类、预警赤潮,监测效率较人工提升1000倍;还能评估全球变暖对微藻分布的影响,为水生态保护和灾害预防提供关键科学依据。
“我们进入了开放资源创新(Open Resource Innovation)的时代,这里的开放资源不再局限于传统的以代码为核心的开源,而是涵盖数据、方法论等多方面内容。”王坚表示,我们需要面向全世界提供服务的科技公共产品,发挥AI所有的能力,让每个人的创造力在科学研究中充分地体现。
剑指“科学理解”,浙里锻造AI“最强大脑”
“人工智能已经成为一个方法论、一种‘通用语言’,科学、技术、工程的创新都绕不开它。”王坚表示,“不要把人工智能当成一个简单的工具,它不仅改变科学研究的方法,甚至改变你提问题的方法。”
为推动AI突破当前“描述世界”的浅层认知模式,向真正“理解科学”的深层认知范式演进,在打造GeoGPT、OneAstronomy等领域AI模型的同时,之江实验室正在科学基础模型领域发力——打造021 Large Science Model(021 LSM)。
之江实验室科研人员向参观者介绍021 Large Science Model
“基础模型是人工智能的皇冠,是人工智能发展的技术底座。”王坚认为,推动“人工智能+科学”,在基础模型上取得突破十分关键。之江实验室研发的021 LSM采用MoE混合训练框架,注重科学知识的丰富性和推理能力的提升,旨在实现深度科学推理与自主知识发现,为科学问题的解决提供全新的技术框架。当前,021 LSM使用了15T Tokens的训练数据,包含了STEM 174个专业领域,参数规模达到236B。
当前,我们进入了“计算密集、数据驱动、基于模型”的第三范式,也可以称之为“计算范式”(computing paradigm)。这种范式正加速各个领域的科技创新突破。之江实验室正聚焦智能计算,通过算力、数据、模型体系化的创新,为推动“人工智能+科学”提供核心动力,并期待与全球科学家携手,以人工智能延展人的创造力,解决人类社会面临的共性挑战。
“转载请注明出处”