当 AI 能考上一本,十年寒窗苦读还有意义吗?

这两天被一条新闻刷屏,就是极客公园做的一个测试,找了九个大模型(GPT-4o、字节豆包、文心 4.0、百小应、通义千问、Kimi、腾讯元宝、MiniMax)测试 2024 年高考试卷,结果有四个大模型文科成绩上了一本线,整体表现最强的是 GPT-4o(文科 562 分),国内模型中表现最好的是字节的豆包(文科 542.5)。相比文科,AI 大模型们理科最高仅 478.5 分,且数学测试全部不及格,最高分仅 70。

家里有亲戚朋友参加高考的话,就知道上个一本线也没有那么容易,如果我第一次参加高考的时候看到这新闻,估计要怀疑人生了。十年寒窗苦读,最后还不如一个 AI 的成绩,学习还有意义吗?

AI 的能力在很多方面已经超过了人类的平均水平

极客公园没有公布他们用的 Prompt,当从结果上来看,可信度还是比较高的,尤其是文科方面,语文、英语、历史这些科目,对于 AI 来说,由于已经训练过了互联网几乎所有的公开资料,所以这个成绩并不意外。而且数学的表现目前也不够好,都没有及格,这完全符合现阶段 AI 的能力水平。

但如果对比去年 AI 的能力水平,但明显进步是巨大的,去年最强的是 GPT-4,但是没有多模态能力,也就是很多要依赖图像声音的题目是没法做的,而去年国产的大模型最高也就是 GPT-3.5 的水平,而今年像豆包这样的模型都已经接近了 GPT-4o 的能力水平。

OpenAI 的 CTO Mira Murati 在前不久的一次访谈中说过:“如果你观察一下我们的进步轨迹,像 GPT-3 这样的系统,大概可以说智能水平相当于一个幼儿。而像 GPT-4 这样的系统更像是高中生的智能水平。在未来几年,我们期望看到针对特定任务的博士级别的智能。”

可以预见不久的将来,AI 的高考分数到达重点线,最终成为高考状元都是可以预期的。就像围棋,现在只有人类胜过 AI 才能成为新闻。

AI 解决的是智能的问题,学习的意义在于学会如何去解决问题和甄别结果

AI 现在能力很强,AI 迅速的帮助人类拉平了能力之间的差距,但是 AI 无法弥补的是如何驾驭 AI 的能力,如何利用 AI 的能力去解决问题。还有 AI 的幻觉问题,如果自身没有一定知识积累,很容易被 AI 误导。

而学习的意义,恰恰在于通过学习知识,掌握学习知识和技能的能力,利用学到的知识和技能,去解决工作和生活中的问题。并且可以分辨出来 AI 的幻觉,不被 AI 误导。

在 ChatGPT 之前,我花了很多年时间,学习了编程知识,学习了如何检索资料的能力,但是在 ChatGPT 出现后,AI 可以很快写出不错的代码,可以高效的检索出资料,似乎我学的这些曾引以为傲的本领都不值钱了。

这让我想起 Tinyfool 讲过的一个故事:“冯骥才的神鞭,后来被改编成电影,神鞭是个受欺负的穷人后来学会绝技可以用鞭子战斗,打败了很多坏人。然后一次被枪打断他的辫子。他就沉沦了一段时间,最后他也学会了枪。重点不是辫子和枪,而是人。”

我觉得我这些年积累的最有价值的不是编程的知识,检索资料的能力,而是每当有新技术出现,能去快速学习和掌握的学习能力,所以当 ChatGPT 出来,我马上大量的借助 AI 帮我写代码,帮我检索资料,而且由于以前的基础,我可以很快解决 AI 生成代码的问题,借助以前的搜索技巧,快速的验证 AI 检索出来资料的正确性。

AI 是学习的好帮手

可能很多人还记得当年围棋界的“人机大战”,Google 的 AlphaGo 打败了人类最强的围棋手,而现在,围棋界在大量借助 AI 辅助训练。训练 AI 承担了教练、陪练、棋友等多重角色。

大语言模型之后,可能已经改变了包括我在内的很多人的学习习惯,相当于给我们提供了一个一对一的私教,有什么问题可以随时咨询 AI 即时得到反馈。

既然现在 AI 能在高考中超过一本线,那就意味着它也可以被用来辅导学习,就像人类在围棋上被 AI 打败了,但反过来也可以借助 AI 辅助训练提升我们的围棋水平。

但这里面的主要问题在于,虽然现在 AI 已经很强能做很多事,但每个人都能获取到 AI 的能力吗?会不会 AI 的出现,也加速了教育资料和智能资源的不平等?

就像我昨天收到一条留言:“多少人干正事用不了(GPT),他们拿来消遣”。还有昨天 OpenAI 大量发送警告邮件要封禁一些国家的 API 访问权限。

这些事确实也不是我们个人能左右的,好在国内模型的能力进展速度不错,从这次大模型高考测试中也可以看出离 GPT-4o 的差距也在不断缩小,像 Coze 这样的产品其实是可以免费试用的,而且能力也不错。

希望未来大家都能享受到 AI 带来的便利,借助 AI 辅助学习,提升自己,帮助自己解决问题。