AI能帮填高考志愿吗?我们找了4个主流大模型试了试

潮新闻 记者 金春华 谢丹颖 2024-06-20 07:11全网传播量30.3万
00:00
00:00

高考季,很多学生、家长、老师为了考生考上一个心仪的学校和专业,在忙着收集信息、分析情报。这方面,AI能帮上忙吗?大语言模型有哪些优势、哪些不足?最近,记者梳理了一批往年比较热门的高考咨询话题,通过文心一言(3.5版)、智谱清言(GLM-4)、Kimi、通义千问做了一下试验。这几个也是目前国内相对主流、业界认可度比较高的大模型(ChatGPT、Gemini因为样本数据不太对口,可靠性相对不强,暂不放在试验中)。

整体而言,大模型在基础信息搜索方面确实可以作为一种参考,针对具体的报考方向,也能给出一定的参考意见,但对某些专业的理解方面可能存在偏差甚至错误,如要使用还是得引起注意。具体问题,一起来看看吧!(点击放大查看图片)

问题一:高考志愿到底该如何填报?有哪些注意事项?

通义千问的回答。这一问题,几个大模型的回答都差不多。

文心一言的回答。这一问题,几个大模型的回答都差不多。

智谱清言的回答。这一问题,几个大模型的回答都差不多。

Kimi的回答。这一问题,几个大模型的回答都差不多。

问题二:给出985高校新闻传播学类、经济学类、工科试验班最近两年在浙江的录取分数线。

通义千问的回答,给出的链接可以做一个参考。

文心一言的回答,可参考度确实也一般。

智谱清言是查到了一所学校,但信息可用度并不高。

Kimi给出了一些最低投档分数线。

问题三:预计未来十年到二十年,有哪些专业比较好就业?有哪些专业比较有成长空间?

通义千问的回答,网络与新媒体这一回答,有些出乎意料。

文心一言的回答,跟大家差不多。

智谱清言的回答。相对开放性的问题,大模型的回答大概都差不多,但有一些比较会跟网友认识存在偏差的地方。比如这里的新闻与传播方向。

Kimi的回答。

问题四:有哪些“天坑”专业真的是“天坑”,哪些其实不是?

通义千问给了一个开放性的回答。

文心一言的回答。大模型在说理方面,确实有自圆其说的一种“套路”。

智谱清言的回答。这个问题是智者见智,仅供参考。

Kimi的回答。可能跟现阶段大家了解到的信息并不一致。比如考古学,确实有劝退的,也有不少年轻人喜欢,甚至“出圈”的。

以上是相对基础的问题,大模型基本能够给出一些值得参考的信息,有些解说也值得重视。但记者也发现,有些信息大模型经过了自己的理解,给出的回答可能比较片面,还是建议查找原始信息进行核对;有些大模型如智谱清言甚至只是给出了一个比较偏的方向性参考。这一方面,可能涉及到数据搜索的深度和广度。比如相关专业录取分数线的汇总,在知乎、小红书等社交平台上是有相关参考信息的。

问题五:浙江考生,总分考了640,选的是物理、生物和历史,想上浙江大学,走强基计划或三位一体计划是否可以?有哪些专业是可供选择的?如果考虑未来就业和保研,哪个专业会是最佳专业?

通义千问的回答,基本跟其他大模型一样,集中在对强基计划、三位一体的解说。

文心一言的回答,给出了一些相对比较实的建议。

智谱清言的回答,给出了一些基础信息和一些建议。

Kimi的回答,给出了一些参考信息。

问题六:家里条件相对普通,哪些专业比较推荐?

通义千问的回答,这个问题是网友讨论比较多的话题。各大模型给出的建议跟网上能看到的差不多。

文心一言的回答,各大模型回答一致性比较高。

智谱清言的回答,跟网上常见的信息比较接近。

Kimi的回答,也可参考。

问题七:浙江考生,想学历史,哪个学校比较好读研或保研?

通义千问的回答。这个问题也是考生比较关心的问题之一。但比较特殊的是,几个大模型都有直接把“浙江考生”理解为“在浙江的高校”的倾向。当然,也有可能如网上议论的,浙江考生比较喜欢本省高校。这样的话,似乎有点超乎意料了。

文心一言的回答,很有趣的是,跟Kimi的结果有点像,重点放在了“浙江”上。

智谱清言的回答相对不同,有一些参考依据在。

Kimi的回答,角度重点放在了“浙江”上。

问题八:想报考人工智能和大数据专业,如何挑选学校,要考虑哪些因素?

通义千问的回答。这里针对比较新的专业,放了一个相对开放的问题。推荐的高校综合性更强。

文心一言的回答,相比下,推荐的学校又不一样。这几个高校确实专业性更强一点。

智谱清言的回答,这类相对开放性的问题,大模型确实比较擅长。不过特殊的是,没有推荐具体院校。

Kimi的回答。同样没有推荐具体院校。

问题九:浙江考生,总分一是666分,倾向于文科,在长三角、珠三角、京津冀三地,有哪些好的院校和专业推荐?

通义千问的回答。这个问题应该是很多学生和家长首先会问的。但几个大模型的回答差不多,都不太具有可参考性——记者查了下,666这个分数在去年是上不了这些高校的。

文心一言的回答,这个考分在去年是上不了这些高校的。

记者修改了一下问题,把分数拿掉后再试试:浙江考生,倾向于文科,在长三角、珠三角、京津冀三地,有哪些好的院校和专业推荐?

智谱清言的回答,局限性还是比较大,这几个地方的高校明显不止这些。

Kimi的回答。

综合来看,各大模型给出的回答涉及面不是特别广,除非给出明确的提问。比如对上一个问题进一步调整提问方式:浙江考生,倾向于文科,在长三角,有哪些好的院校和专业推荐?推荐十个。

文心一言的回答之一,相对比较靠谱,但把院校和专业分开了。

文心一言的回答之二,相对比较靠谱,但把院校和专业分开了。

智谱清言的回答,似乎把几个问题混在一起回答了。看样子要扣“鸡腿”了。

在查询中,记者发现大模型对一些专业设置的理解上还存在偏差。比如“语言学”专业,应该是包括包含汉语言文字学、现代语言学、文字学、方言学等的中国语言文字学,而不只是“学语言”,但大模型很容易简单将之理解为“学语言”。这个在使用中要引起注意。

问题十:浙江考生,全省排名六百位左右,想学语言学专业,按照国内各高校专业实力,有哪些学校推荐?

文心一言的回答。理解相对准确,但似乎涉及面不太广。国内实力比较强的高校有如南开大学、华师大、陕西师大、山东大学、北师大、北语等。

智谱清言的第一次回答,搜索资料比较正常,但回答出现了极大偏差。

智谱清言的第二次回答,可以看到关键词相对明显在外语领域。

Kimi的回答,偏得比较明显。理由同上面题干中出现“浙江考生”的题目。

这一张显示的是Kimi回答的资料来源,结合这个材料看,似乎不应该出现上述的偏差。

总结来看,大模型可以作为高考志愿填报的一种参考手段,但现阶段来看整体上作用有限,可以用于搜集一些资料,对程序性的事情如志愿填报流程或可有所启发,而具体信息还需要查找各院校官网等进行合适。这可能也是目前大模型的局限所在。它们严重依赖于输入数据,对数据纠偏能力有限,而对于一些创新性、个性化的数据分析,现阶段还有些“力不能及”。

祝大家考上理想的学校和专业!

“转载请注明出处”