随着Deepseek等高性能人工智能模型的出现,一场激烈的人工智能竞赛正在全球范围内响起。根据加拿大人工智能研究所5月7日发布的2025年人工智能指数报告,中国高性能人工智能模型的数量和质量不断增加,这对美国的领先水平构成了挑战,顶级模型之间的性能差距正在缩小。
人工智能模型的性能正在迅速提高,它们之间的竞争也越来越激烈。图片来源:Gatty
调查人员利用过去两年“聊天机器人试验场排行榜”的信息,收集了用户对各种聊天机器人性能的投票数据。数据显示,2024年初,排名第一的模型比排名第十的模型高出约12%,而2025年初,这一差距仅缩小到5%。报告指出,“前沿领域正变得越来越有竞争力——越来越拥挤”。
值得注意的是,该报告认为,生成人工智能模型的平均值仍在增加,它们使用了更多的决策变量、更强的计算能力和更多的培训数据集。然而,开发人员也证明,更小、更简洁的模型也可以取得优异的效果。
Bart,美国康奈尔大学 Selman说,看到像中国的DeepSeek这样相对较小、成本较低的项目证明自己具有竞争力是一件令人鼓舞的事情。“我预测,我们将看到一些由五人或两人组成的团队提出的新算法思想将带来变化。这是一件好事。我们不希望世界上只有少数大型企业控制它。”
目前,美国仍然是最重要的模型制造商。2024年发布了40个模型。相比之下,中国发布了15个模型,欧洲发布了3个模型。
美国以前在模型质量方面的领先优势已经逐渐消失。作为中国发表人工智能论文和专利最多的国家,中国现在可以在性能上与美国竞争。“也许在2015年,中国为自己设定了一条成为人工智能领域顶尖参与者的道路。他们通过在教学方面的投资实现了这一目标,并开始取得成果。”Selman说。
此外,在2022年ChatGPT公开发布后,开发人员将大部分精力投入到通过扩大系统规模来提高性能上。许多公司也在发布小型模型,它们的训练速度更快,响应速度更快,使用的能量也比大型模型少。例如,在2022年,MMLU上得分超过60%的最小模型使用了540亿个参数,而在2024年,只有38亿个参数可以达到相同的分数。
尽管在许多常见的基准测试中有了显著的改进,但生成式人工智能仍然存在一些问题,如隐性偏见或导出虚假信息。Selman说:"有时他们犯的基本错误让我感到非常惊讶。"
赞一个