浩瀚的银河系,几千亿颗恒星演绎着宇宙起源的故事。它们在人类难以触及的地方,散发神秘的光芒,吸引全球科学家孜孜不倦地探索……
每天,之江实验室天文计算研究中心高级研究专员唐晓瑜,都会望向茫茫银河。“几千亿颗恒星中,人类掌握光谱数据的仅有2亿颗。”这位出生于1990年的科学家从不掩饰自己的野心——认识那些陌生的恒星。
算法工程师出身的唐晓瑜,仰望星空的底气来自上个月之江实验室发布的一款名为SpecCLIP的恒星光谱大模型。记者好奇,大模型并不是精密的望远镜仪器,仅靠电脑屏幕上跳动的计算机字符,如何触及动辄几万光年外的浩瀚星空?
唐晓瑜带我们探索了一个神秘的世界。她用随身携带的笔记本电脑,打开中国科学院国家天文台郭守敬望远镜(LAMOST)的网站,随机拷贝下由望远镜观测到的一颗恒星的温度、视向速度(RV)、表面重力加速度等数据,又把这些数据“喂”进SpecCLIP恒星光谱大模型。不到一秒钟,恒星的半径、年龄、有效温度等信息就被精准测算了出来。
这个“一眨眼”的速度,基于大模型算法架构,比传统算法快了整整一万多倍。唐晓瑜形容,利用郭守敬望远镜、欧洲盖亚(GAIA)空间探测器观测的数据,就好比站在巨人的肩膀上探索星空,有了AI大模型的赋能,他们看得比以往更清晰。
之江实验室高级研究专员唐晓瑜正在分享天文基础模型构建方法。 之江实验室供图
SpecCLIP恒星光谱大模型紧紧“抓”住恒星的一个特性:铁氢比。顾名思义,就是恒星内铁与氢的比例,它是推测恒星年龄的重要依据。低铁氢比的恒星通常更古老,形成于金属尚未大量核合成并扩散的宇宙早期。在过去大半个世纪,全世界大型望远镜发现的铁氢比小于-4(金属含量为太阳的万分之一)的恒星总共只有50多颗。
SpecCLIP恒星光谱大模型在短短一个月里,从郭守敬望远镜1000多万条中低分辨率光谱和盖亚空间探测器2亿多条超低分辨率光谱数据中,发现了8148颗古老恒星候选体。
“这意味着那些恒星没有演化很久,带着很早期的宇宙记忆,我们能够据此去推断银河系婴儿时期的样貌。”中国科学院国家天文台、中国科学院大学副教授黄样说。
难以想象,能够处理海量银河系数据的SpecCLIP恒星光谱大模型,由一支仅有五六名年轻科研人员的团队打造,他们当中有对数据着迷的算法专家,也有天体物理学家。
同样生于1990年的之江实验室天文计算研究中心研究专家冯毅,擅长在天文中引入智能计算技术,破解数据筛选和分析难题,让天文数据处理“拨开云雾见月明”。“大模型的引入,为海量天文数据分析开辟了新的思路,能够高效探索宇宙动态演化和瞬变现象,揭示海量数据中蕴含的科学规律。”他说。
“现代天文学发展到今天,越来越需要交叉学科的介入。”黄样告诉记者,去年10月,国家天文台就携之江实验室同步发布了天文大语言模型AstroOne,SpecCLIP恒星光谱大模型也成为其中的重要一员。除此之外,AstroOne还包括用于快速捕捉极端瞬变源的Falco、精确预测太阳活动的SolarGPT以及实时识别伽玛射线暴等高能瞬变源的GRBs X射线探测模型。
国家天文台与尚属年轻的之江实验室牵手,瞄准的就是这支年轻队伍“初生牛犊”的闯劲。
中国科学院国家天文台研究员陈孝钿正在分享AstroOne示范应用。 之江实验室供图
每周一、三、五,之江实验室6号楼的会议室里,都有一群有志青年聚在一起,聚焦世界科技前沿,开展头脑风暴。讲台上,一位青年学者分享近期AI大模型的研究心得,身后有一条醒目的横幅:“热烈讨论、不懂就问、会了就牛、持续学习,成就卓越。”
这群年轻人是之江实验室“种子班”成员。在交叉学科需求越来越强烈的趋势下,“种子班”作为之江实验室体制机制改革的产物应运而生。目前,实验室已举办大模型“种子班”13期,其中包括两期与国家天文台合作开办的天文大模型培训班。AstroOne正是诞生在朝气蓬勃的“种子班”里。
“实验室涉及的高效能计算、太空计算等关键技术,通过单一学科研究中心已经难以突破。”中国工程院院士、之江实验室主任王坚告诉记者,当前,我们迎来了计算驱动的科学革命,其特征是计算密集、数据驱动、模型融合相协同。他相信,和国家天文台等高能级平台的牵手,能激发青年科学家的更大潜力。
之江实验室高级研究专员张骥在分享多模态太阳模型。 之江实验室供图
AstroOne天文模型现在已共享给全国乃至全球的科学家,截至目前已有清华大学、紫金山天文台、新疆天文台、洛桑联邦理工学院、俄罗斯空间研究所等机构的注册用户,并逐渐在国际天文学社区内形成一定影响力。一位来自俄罗斯的同行这样评价:“对在中国能有一个实验室有那么多人聚焦在‘AI+天文’领域感到非常惊喜。”
银河系里,遥远而古老的恒星依旧发光发热,等待着被人们发现。之江实验室里,这群仰望星空的年轻人,也期待着他们的智慧能够在现代天文学的进程中,留下恒久的光和热。
“转载请注明出处”