【全球时快讯】大语言模型中的涌现现象是不是伪科学?
Datawhale干货
作者:平凡@知乎,诺桑比亚大学,在读博士
【资料图】
今天晚上,花了一点儿时间看了两篇文章:
《Emergent Abilities of Large Language Models》[1]
《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]
这两篇讲的都是emergent behavior,即涌现现象。
大规模神经网络下的涌现现象在机器学习中使用大规模神经网络时,由于增加了参数数量、训练数据或训练步骤等因素,出现了定性上的新能力和性质,这些能力和性质在小规模神经网络中往往是不存在的。
第一篇文章举了这个例子,每个图都可以理解为一个任务,横轴是神经网络的规模,而纵轴是准确率,可以理解为模型的性能。
我们拿图一来看,在10的22次方前,这些模型基本上的性能基本上都很稳定在0附近,而在10的22以后,突然在10的24次方上获得了很大的性能提升,在其他的几个任务上都表现出类似的特征。
意想不到的效果第二篇文章更是有趣,我直接把推特一位博主的评论引用在这里:
作者发现,当我们训练用网络计算同余加法 a+b = ? (mod c) 时,网络在某个时间突然获得了 100% 准确率。分析发现,神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法!这个算法可以证明是正确的, 反人类直觉的。
从这俩例子里面我的感受是,只要数据量足够且真实,且模型没有硬错误的前提下,不断的训练说不定真的能够产生一些意想不到的效果。
还有就是我觉得人类现在积累的知识并不少,但是系统的少,零星的多,如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话,我觉得有很大概率会让它涌现出意想不到的能力。
甚至可能把人类的生产力解放提前很多。
参考
1.https://arxiv.org/pdf/2206.07682.pdf
2.https://arxiv.org/pdf/2301.05217.pdf
标签:
您可能也感兴趣:
为您推荐
放得下接得住管得好 宁夏林草局全面实现全程网办
上海市林业总站开展湿地健康水生态调研并召开讨论会
相约在广东飞羽悦瞬间 2022广东候鸟护飞行动正式启动
排行
精彩推送
- 【全球时快讯】大语言模型中的涌现现象是不是伪科学?
- 柯以敏直播主持人发声:每个人都应该被尊重|当前热讯
- 如何跟喜欢的女生在聊天中聊情感话题?
- 环球聚焦:中国有多少军舰是奇瑞造的(中国有多少军舰)
- 热点在线丨累得什么冷得什么热得什么渴得什么填词语
- 天天快报!我在韩国饭店上班但是电脑怎么结账我不会,求解答,...
- 新动态:招商银行信诺 招商银行信诺保险电话
- 吃喝玩乐的文雅叫法_玩乐令
- 广联科技递表港交所冲刺IPO 汽车后市场红利消退亟待数字化突...
- 【当前热闻】猴吃西瓜原文拼音版 猴吃西瓜原文
- 迈信林:股东拟减持不超1.49%公司股份
- 龙芯中科与甘肃庆阳市达成战略合作
- 当前播报:前瞻全球产业早报:“百城联动”汽车促销将开展
- 每日简讯:满地科技股份(01400)拟折让约16.95%配售最多2亿股...
- 芳香之城传奇百度云_芳香之城传奇_环球快资讯
- 小米集团-W:回购220万股公司股份
- 发力小型纯电SUV市场,沃尔沃EX30开启全球首秀 当前热闻
- 今日快看!越跌越买!315亿大举抄底!
- 环球新消息丨2023全球存储芯片制造商现状与价格行情
- 特斯拉做到了!减少55吨二氧化碳当量不在话下
- 监管出手!多家券商和明星分析师被点名
- lv围巾价格和图片及价格 女士 lv围巾价格 世界微动态
- 天天快报!图灵看市6.8晚-白银多头强势,回踩低多介入
- 公司文化怎么写
- 龙虎榜 | 国光连锁今日涨停 知名游资炒股养家净卖出355.62...
- 天天速看:宝龙地产(01238)前5个月合约销售总额约为150.14亿...
- 截至6月1日当周 美国2022/2023年度大豆出口净销售为20.7万吨...
- 乌衣巷古诗意思20字(乌衣巷古诗意思)
- 娄星区开展人工放流暨生物防治福寿螺活动
- 全球百事通!随着天空变成红色 《暗黑4》的宣发变得不详
- 天天即时看!朱江入职Lucid,美国造车新势力能否成功入局中国...
- 环球时讯:俄罗斯海军两大主力舰队同时展开演习 尹卓:展现...
- 世界即时看!我国首个自营深水油田群累产原油突破1000万吨
- 环球即时看!武汉天河机场今年旅客吞吐量超过千万人次
- 广东空调卖爆了 空调加工车间24小时不停歇_世界热资讯
- 注意,这几处危桥改造
- 易极:6.8原油72.2多单起飞!_观速讯
- 龙虎榜 | 中国出版今日跌停 机构合计净买入2130.4万元
- 广州石化增产高附加值注塑料
- 【短讯】专家初步判断:津南区八里台镇局部地面沉降属于突发...
- 小米手机Redmi手环设备怎么加
- 当前速递!祖根(关于祖根介绍)
- 理想汽车最大功臣退休!全新车型理想W01即将来临_全球讯息
- 日产阳光自动变速箱油多久换一次比较好(日产阳光自动变速箱...
- 天天时讯:丰山集团:可转债转股价格调整为13.73元/股
- 团结湖大厦(关于团结湖大厦的基本详情介绍)
- A股共75只个股发生大宗交易 派特尔溢价率27.65%居首|通讯
- 全球看热讯:亚洲舞王南贤俊(关于亚洲舞王南贤俊的基本详情...
- 方便面市场供给规模分析 2023方便面行业市场发展现状
- 初步了解互联网协议教学设计_就你了解的某一社会现象或社会事...
- 瑞幸门店破万,9.9一杯的咖啡价格战何时是头?
- 春光科技:拟收购控股子公司苏州尚腾剩余45%股权|环球速看料
- 两家房企“面退”倒计时,这些公司也提示退市风险 世界速读
- 格力地产: 关于对上海证券交易所监管工作函部分回复的公告|...
- 消防广播_关于消防广播的介绍 每日视点
- 私募基金行业又现“抢公章”闹剧 睿馨投资遭其法定代表人屡...
- 爱旭股份副总经理卢浩杰:ABC组件可交付效率24% 电池效率年...
- 世界最资讯丨完全备份(关于完全备份介绍)
- 讯息:外交部举办2023年首场“携手央企 对话世界”活动
- 如何拿第一?一汽奔腾NAT青岛节能挑战赛冠军访谈
- 电脑怎么打出加减号上下(加减号上下)-每日焦点
- 焦点资讯:外交部举办2023年首场“携手央企 对话世界”活动
- 软通咨询:通过数字供应链打造企业业务增长新引擎-全球速看料
- 环球资讯:新闻联播:2023年前5个月全国新办涉税经营主体643.5万户
- 图灵看市6.8晚-黄金短期修复、空头将测试前低
- 【全球播资讯】实现30/60目标需要“胡萝卜加大棒”!央行行长...
- 女主多的玄幻小说(女主是红发红眸的玄幻小说)
- 焦点要闻:科创金融如何突破?拉长做深金融服务链
- 新闻联播:2023年前5个月全国新办涉税经营主体643.5万户
- 北京市通信管理局就网络安全问题约谈瑞斯康达
- 环球今头条!法国安纳西发生持刀袭击事件 已致8名儿童受伤
- 天天最新:社区、医院、医保局接力救治耄耋老人
- 热消息:科创金融如何突破?拉长做深金融服务链
- 六安人速看!今天起下调↓↓↓ 焦点报道
- 英国宣布将举办世界首个人工智能峰会 吁加强AI管制
- 世界最新:南通12.2亿成交3宗宅地 总建面36.8万平方米
- 中金料中国今年全年经济增长接近6%
- 斗鱼看不到弹幕最新(斗鱼看不到弹幕) 环球速看料
- 西峡县民政局开展民政服务机构安全生产和惠民政策落实情况大...
- 世界最新:“民企迎新机”系列专栏丨资本市场带来人才、资金...
- microsoft store下载路径更改教程
- 北京市通信管理局就网络安全问题约谈有关企业
- 美国基拉韦火山再度喷发 预计吸引大批游客
- 焦点!以生产运营数字化为抓手 福能股份积极推动数字化转型
- “民企迎新机”系列专栏丨资本市场带来人才、资金助力 深市...
- 保利麓谷林语业主论坛_保利麓谷林语业主论坛
- 利率下调,这些银行还能挖出3%以上利率产品|焦点快播
- 知错能改善莫大焉下句_知错能改善莫大|全球快讯
- 每日简讯:新自拍神器?曝小米14系列将配备4K录制前置镜头
- 贴身兵王小说演播_贴身兵王陆云龙|焦点短讯
- 李晓旭的新决定!对辽篮提出要求,杨鸣万万没想到 独家
- 【天天时快讯】学术头条:辽宁辅助生殖至少17个项目纳入医保
- 周小川:上海国际金融中心建设迈出更大步伐需要提升人民币自...
- 当前焦点!【世界说】世行上调中国经济增长预期 望其助推全球...
- 【世界说】世行上调中国经济增长预期 望其助推全球经济复苏-...
- 视频分割软件有哪些(视频分割软件哪个好)
- 【世界快播报】交付首月狂卖1.4万台,飞度都被比下去了?比亚...
- 网络编辑有什么作用(网络编辑)_热点
- 焦点要闻:建立第五座超级工厂,特斯拉动员中国供应商出海!...
- 扩大超3倍!TikTok今年电商销售目标:200亿美元【附全球电商...