大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
人工智能(AI)大模型的诞生,让2023年成为人类历史上一个重要年份——通用人工智能元年。这意味着以智能革命为代表的第四次工业革命已然到来,人类站到了智能时代的门槛上。
人类所经历的前三次工业革命,都令人类文明实现了新的飞跃,也对世界格局产生了深远影响。长远来看,人工智能在很多方面的智慧能力将可能超过人类,但目前通用人工智能还需迈过多道门槛,才能真正实现强人工智能。
(相关资料图)
日前,中国科学技术大学知识计算实验室提出了新的知识模型“知识方程”,并以此为基础建立新型专家系统,通过与深度学习的结合,尝试突破现有通用人工智能的技术瓶颈。
——编者
(图片来源:视觉中国)
人工智能(AI)诞生至今只有短短60多年,但其发展经历了几度跌宕起伏。近年来,深度学习技术为AI带来了新的革命,其中包括我们熟悉的AlphaGo、ChatGPT等。
当前AI技术在很多任务上取得了超越人类的成效,包括人脸识别、语音识别、字符识别等,在机器翻译、问答和医疗诊断等领域也交出了令人相对满意的答卷。可以说,AI已经迈入能够大规模落地应用的阶段。
不过,当我们试图将人工智能再向前推进,就会发现要克服其现有缺陷,还有待技术模式的创新与突破。
当下大模型面临4个关键缺陷
OpenAI公司推出的ChatGPT是一个AI聊天机器人程序,更是一个人工智能自动生成内容(AIGC)的工具。作为一个对话系统,ChatGPT具备出色的多功能性,无论是畅聊多种话题、解答数学题,还是提供礼品选择建议、制定行程规划,都可从容应对。因此,从某种意义上来说,ChatGPT具备了广泛的应用潜力和灵活性,可以说是一个通用人工智能(AGI)程序。
尽管在某些方面(例如逻辑和语义理解等)的评测表明,ChatGPT并非在所有领域都比现有的最佳模型更强大,但现有的最佳模型可能只是针对特定任务而设计,而ChatGPT则是一个通用模型。
其实,多年前人们就认识到大模型的巨大潜力,但其实际发展速度仍比预想中快了许多。ChatGPT大模型甫一问世,很快就在应用层面受到极大关注。半年后,中国就涌现出了百余个大模型。
目前,大模型的应用主要分为生成式人工智能(AIGC)、大模型辅助工具、个人智能交互3类。其中,个人智能交互尤其值得关注。任何真正能促进交互的技术和产品都能产生巨大价值。这种交互不仅包括“人—人”(通过机器),也包括“人—机”,甚至包括“机—机”。而人工智能,包括大模型,有望在这方面取得颠覆性突破。
(图片来源:视觉中国)
然而,目前大模型的应用之路并不如想象的那么顺利。根本原因在于,虽然大模型很强大,但仍然在技术上存在一些关键缺陷。
首先,大模型有时会犯事实性错误,也就是可靠性问题(俗称“幻觉”)。例如,它会弄错诗词作者。从原理看,大模型的答案选择基于概率,所以很难保证百分百正确。这一问题在目前许多领域的大模型中都存在,也是大模型面临的最重要的挑战之一。
第二,大模型的数学和逻辑推理能力仍然需要加强。虽然GPT-4在某些考试中表现优异,但在面对一些精心设计的逻辑推理问题时,大模型的回答与随机答案相差无几。因为在进行深度推理时,即便大模型每一步的预测准确率都高达95%,但是当推理到20步时,最终的准确率将会是的20次方,即不到36%,这是一个无法令人满意的结果。
第三,大模型的形式语义理解能力有待提升。虽然大模型在一定程度上能够实现语义理解,但要想真正从意义和形式上完全理解语言背后的意义,还有很大的改进空间。
最后,大模型作为一个黑盒模型,存在一些通用弱点。比如,其可解释性、可调试的能力较弱等。
通向强人工智能或需另辟蹊径
大模型开启了通用人工智能落地应用的窗口。但正如前文所说,技术上的一些关键缺陷意味着它与通用强人工智能之间尚有很大距离。要缩短这个距离,至少有两条不同路径值得探索。
第一条路径就是继续沿着大模型现有的发展路线向前走。AI诞生不过60多年,GPT真正开始训练至今也只有5年。如果让大模型再发展5年、50年、500年,它会取得怎样的进步?这是一个值得思考的问题。
沿着现有技术路线,大模型的发展在两个关键点上会遇到一定的挑战。
其一,更多的参数。参数量的增加,会让大模型的能力提升。摩尔定律表明,计算能力每18个月到24个月翻一番,而目前大模型的参数量正以三四个月翻番的速度增长。因此,计算能力很快会跟不上模型的发展需求。而且,尽管参数量呈指数级增长,但其效果只呈线性增长。
其二,更多的数据。优质训练数据的增加,也会让大模型的能力提升。然而,GPT-4已经利用了大部分目前我们能够获取到的高质量文本数据。因此,可供大模型训练的数据即将达到瓶颈。
所以,要在大模型体系内解决这些问题,就需要发展新的颠覆性技术,来突破结构化信息、陈述性事实、长链条推理、深度语义理解等方面遇到的瓶颈。
(图片来源:pixabay)
另一条通往通用强人工智能的路径则有很大不同。
当前AI正在经历从感知智能向认知智能的范式转变。众所周知,人类拥有两套推理系统,即直觉思考的快系统和理性思考的慢系统。快系统是一种底层、快速、下意识、不加思索便可即刻得到结论的推理方式,就像人们在家里闭着眼睛也能找到洗手间的位置;而当我们面对陌生环境,想要找洗手间时,则需要依赖慢系统进行慎思,这种推理相对较慢、能耗较高,但更精确。
目前的大模型更多涉及到的是快系统层面的推理,慢系统推理能力表现还不佳。所以,人们自然而然就会想到,能否将这两个系统结合起来。
事实上,上一波AI浪潮就是由专家系统驱动的。专家系统是一种类似于人类慢系统的推理方式,它以符号的方式把专家的知识输入机器,再通过自动推理,使得机器能够像专家一样自动回答问题。
专家系统与大模型各有所长。前者在精确度、可解释性、逻辑推理能力、语义理解能力等方面表现更佳,而后者在通用性、泛化性、不确定性知识、学习能力等方面更具优势。因此,专家系统与大模型有机结合,正好可以取长补短,这或是通往通用强人工智能的一条更好路径。
融合两大推理系统探索未来智能
中国科学家在专家系统与大模型结合的道路上,已经开始了探索。中国科学技术大学知识计算实验室提出了新的知识模型“知识方程”,在此基础上建立起新型专家系统,并将其与深度学习相融合。
简言之,知识方程分为建模和知识2个层面。在建模层面,知识方程将领域对象统一抽象成为个体、概念、算子3类语法元素,它们之间可以相互转换、相互融合。在知识层面,知识方程将所有知识统一表示成为形如“a=b”的知识等式。基于知识方程,我们提出了基于新的数据与知识双轮驱动的、结合大模型与推理引擎的智能信息系统范式。
随着ChatGPT等大语言模型的兴起,在原有以数据库为核心的信息系统之上,大模型可从暗数据库(文本、图像、视频等)中挖掘有效信息,并在一定程度上进行推理与(辅助)决策。
事实上,这是信息系统的一次范式革命。在所有数据中,暗数据占到绝大部分。传统的信息系统必须通过一些手段(包括人工、自然语言处理、计算机视觉技术等),将“暗”数据转换成数据库中的“明”数据才能使用。这种转换往往由于工程和成本等问题,只能处理暗数据中的极小部分。而大模型可以直接基于暗数据得以输出,具有很强的暗数据处理能力。
基于大模型的信息系统类似于人类用于直觉思考的快系统,能在一定程度上直接基于大数据进行推理与决策。但由于大模型目前存在的技术缺陷,在很多应用场景并不能直接满足应用要求。中科大知识计算实验室所提出的大模型增强技术,可构建领域本体与知识库,在此基础上融合大模型与知识推理引擎,研发知识数据双驱动的智能信息系统框架,将思考的快系统与慢系统结合起来。与单纯的大模型相比,该框架具有正确性、可靠性、可解释性、可调试性等优点,能够显著提高大模型在各行各业的应用价值。
除了数据库和暗数据库,该系统还可有效利用知识库的信息。因此,该框架有望引领大模型之后的又一次信息系统范式革命,也将成为智能信息系统的新形态。
从应用角度看,通用强人工智能无论在广度,还是在深度方面,都是现有的大模型技术无法比拟的。从长远来看,人工智能在很多方面的智慧能力可能会超过人类,不仅是计算、记忆和存储等基础智能,还可能包括决策、预测、创新等高阶智能。随着基于计算的大模型和知识推理引擎的不断发展,AI也将越来越接近甚至超越人类,这将在极大程度上推动生产力。
(作者为中国科学技术大学教授、知识计算实验室主任)
作者:周熠
图片:除注明外,均作者提供
编辑:许琦敏
责任编辑:任荃
*文汇独家稿件,转载请注明出处。
标签:
您可能也感兴趣:
今日热点
为您推荐
放得下接得住管得好 宁夏林草局全面实现全程网办
上海市林业总站开展湿地健康水生态调研并召开讨论会
相约在广东飞羽悦瞬间 2022广东候鸟护飞行动正式启动
排行
精彩推送
- 大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
- 9个月来首次下降!7月印度从俄罗斯进口原油量环比下降5.7%【...
- 刚刚!29.9元的“钻戒”卖超10万单,DR回应来了【附天然钻石...
- 危险!危险!日本核污水排海:240天达到中国,1200天覆盖北太...
- 荣耀X50i 手机边充电边看视频有危险吗
- 营造公平竞争的市场环境 市市场监管局将重点清理歧视民营、...
- 营造公平竞争的市场环境 市市场监管局将重点清理歧视民营、...
- 聚焦“8+9”产业 新产业标准化领航工程实施
- 四部门:聚焦八大新兴产业和九大未来产业
- 基本金属价格波动 中国铝业加大资源获取力度
- 聚焦“8+9”产业 新产业标准化领航工程实施
- 我国外交部提出严正交涉 专家:为“经济账”将风险转嫁世界
- 我国外交部提出严正交涉 专家:为“经济账”将风险转嫁世界
- 要把资本资源 多用在科技创新项目上
- 推动经济稳定发展,不断增强市场信心
- 要把资本资源多用在科技创新项目上
- 要把资本资源 多用在科技创新项目上
- 推动经济稳定发展,不断增强市场信心
- 联想拯救者 Go 掌机现身:AMD Z1 Extreme + 8 英寸 2.5K 屏
- 李彦宏:预计年底文心一言会有新版本推出
- 重磅!创投行业税收优惠利好政策延续至2027年底,VC/PE必看
- 开普云:拟以2000万元-4000万元回购公司股份
- 重磅!创投行业税收优惠利好政策延续至2027年底,VC/PE必看
- 三部门联合印发《乡村振兴标准化行动方案》
- 今日中国科学家有哪些著名人物(西游降魔篇人物都有哪些谁饰...
- 又一地官宣免费!高中免费教育,真的要来了?【附民办教育行...
- 四川发布山洪灾害蓝色预警!涉12个县(市、区)
- 百利好全力赞助2023年亚洲乒乓球锦标赛 期待国乒精彩表现
- 民族品牌示范企业评价规范团体标准在京启动
- 占比达到41%!韩国“一人户”家庭即将突破1000万户【附婚恋市...
- 277亿元!快手公布第二季度营收,同比增长27.9%【附短视频行...
- 营利均创历史新高!同程旅行二季度营业收入28.7亿元【附在线...
- 特朗普“预告”24日赴佐治亚州投案
- 希尔顿未来10年规划:在中国再开超730家酒店【附全球酒店行业...
- 民族品牌示范企业评价规范团体标准在京启动
- 新产业标准体系如何建设?四部门划重点
- 新目标!上海嘉定区:力争到2025年智能网联汽车产业规模达300...
- 金山这家企业定制化满足“点单需求”
- 三部门:延续实施上市公司股权激励有关个人所得税政策
- 新产业标准体系如何建设?四部门划重点
- 全国总工会王晓涛被查
- 三部门:延续实施上市公司股权激励有关个人所得税政策
- 多重利好来了!免征个税 涉及创新企业CDR、创投企业合伙人、...
- 外交部:中方欢迎美方将相关中国实体从未经验证清单中移出
- 光峰科技半年报净利润同比增长超60% 积极打造第二增长曲线
- 三部门:对个人投资者转让创新企业CDR取得的差价所得暂免征收...
- 全国总工会王晓涛被查
- 创历史新高!美国工人年薪需求飙升至近8万美元【附人力资源服...
- 全球销量第一!三星电视上半年全球市占率31.2% 【附4K、8K...
- 四部门:到2025年重点领域国际标准转化率超过90%
- 美方宣布将27个中国实体从“未经验证清单”剔除 外交部:中方欢迎
- 超260亿元!IT 2023:中国模型即服务(MaaS)市场规模【附AIGC...
- 工信部等四部门:聚焦新兴产业与未来产业标准化工作 形成“8...
- 三部门:对个人投资者转让创新企业CDR取得的差价所得暂免征收...
- 三部门:对个人投资者转让创新企业CDR取得的差价所得,暂免征...
- 四部门:到2025年重点领域国际标准转化率超过90%
- 未按要求落实实名制和工人工资分账管理相关工作 中国建筑第...
- 三部门:对个人投资者转让创新企业CDR取得的差价所得,暂免征...
- 工信部等四部门印发《新产业标准化领航工程实施方案(2023─2...
- 占全球总量近半!2023年Q1中国新能源轻型汽车销量高达133万辆...
- 高盛预测:到2025年,全球人工智能投资规模或将达到近2000亿...
- 定了!纯AI生成的艺术作品不受版权保护【附网络版权行业市场...
- 股价涨幅超581%,AI板块首只10倍牛股诞生!【附超算行业发展...
- 获英国监管机构批准!博通610亿美元收购VMware【附全球软件行...
- 2023温州鹿城第三期暑期消费券活动商家名单
- 韩系大衰退!北京现代36亿抛售重庆工厂,在华仅剩一家工厂【...
- 日本24日开始核污染水排海,中国海关总署:禁止进口!
- 第二十三届中国国际投资贸易洽谈会将于9月在厦门召开
- 第二十三届中国国际投资贸易洽谈会将于9月在厦门召开
- 同文件名覆盖能找回吗 被覆盖掉的同名文件怎么恢复
- 七夕“烧钱”经济:有情侣花8.2万订房,还连住五晚【附酒店行...
- 年轻人都急了!国家广电总局出手整治电视“套娃”收费现象【...
- 天秦装备:8月21日融资买入431.71万元,融资融券余额7738.87万元
- 商务部:中方要求美方立即取消违反世贸规则的钢铝232措施
- 工信部:共同推动中小微企业在数字时代创新发展
- 铁路部门优化完善12306旅客信息服务功能
- 商务部:中方要求美方立即取消违反世贸规则的钢铝232措施
- 1-7月国有土地使用权出让收入同比下降19.1%
- 商务部条约法律司负责人就世贸组织发布美诉中方针对美钢铝232...
- 工信部:共同推动中小微企业在数字时代创新发展
- 2022年我国经济发展新动能指数比上年增长28.4%
- 挖金客8月22日盘中涨停
- 瑞虎7 PLUS新增1.5T-CVT冠军版 “10万上路”树立行业价值标杆!
- 2022年我国经济发展新动能指数比上年增长28.4%
- 财政部:2023年前7月国有土地使用权出让收入22875亿元,同比下降19.1%
- 河南考核中医人才项目建设成效
- 平壤到北京航班为何被取消?外交部回应
- 商务部等三部门:汽车、家电、家居等要合理增加消费信贷支持
- 个人怎么报考营养师证(个人如何报考营养师)
- 商务部等三部门:汽车、家电、家居等要合理增加消费信贷支持
- 宽信用力度将进一步加大
- 沪深股通|文灿股份8月21日获外资买入0.03%股份
- 宽信用力度将进一步加大
- 前7月全国财政收入达13.9万亿
- 前7月全国财政收入达13.9万亿
- 玉塘街道举办“不七而遇 夕望是你”单身联谊活动
- 本地通话和国内通话有什么区别(本地通话)
- 多地统计政府对民企欠款
- 多地统计政府对民企欠款
- 财政部印发《企业数据资源相关会计处理暂行规定》