“大模型已经成为当前人工智能的巅峰,但是也存在着一些固有的缺陷。”中国工程院院士、同济大学校长郑庆华如是说。
由中国人工智能学会主办的第十三届吴文俊人工智能科学技术奖颁奖典礼暨2023中国人工智能产业年会于2024年4月14日闭幕,全国人工智能领域的专家、学者等共同参会。
2023中国人工智能产业年会。受访者供图
郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干缺陷。?
郑庆华总结了大模型存在的四大固有缺陷。缺陷一是过度消耗数据和算力。大模型的参数量已达到万亿级别,训练数据规模和算力消耗与参数规模成正比。
缺陷二是灾难性遗忘。在新任务上训练会损害之前任务的性能;在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。
缺陷三是黑盒模型逻辑推理能力弱,大模型缺乏“分而治之”能力,在处理需要逻辑、数值推理等复杂问题时表现不佳,无法举一反三、触类旁通。
缺陷四是大模型不知道自己错了,也不知道为啥错,更做不到知错就改。以GPT4求解算术运算题的实例为例,对于在1381和1453之间选两个随机数相乘的结果给出了错误答案,被指出错误后,无法定位是语料,还是训练等原因,更无从修正。
具身智能被业内称为“人工智能的下一个浪潮”,此次大会特别设立“人形机器人与具身智能专题论坛”。
上海交通大学电子信息与电气工程学院教授卢策吾介绍,具身智能作为具有自身体验的智能,具有非常重要广泛的应用前景,是大模型实现的主战场之一。我国在具身智能领域拥有坚实的机器人硬件制造基础和广阔的应用场景。
具身智能通过智能体与环境的交互获取信息、理解问题、做出决策,相当于为实体机器人安上“大脑”。哈尔滨工业大学副校长刘挺认为,大模型所欠缺的与物理环境的交互性,或许可以用“具身智能”来填补。