错判「RL 没出路」， LeCun 在手艺路线另有哪些保_欧洲杯竞猜app

电话：020-66888888

错判「RL 没出路」， LeCun 在手艺路线另有哪些保

作者：[db:作者] 发布时间：2025-02-02 08:33

OpenAI 开创成员、研讨迷信家、原特斯拉前 AI 高等总监 Andrey Karpathy 此前有关「悔做 RL」的舆论惹起很多存眷，而他在懊悔的同时对 Yann LeCun 从一开端就不看好强化进修的立场一直准确的说法激发了 AI 社区对另一件事的兴致，即「LeCun 的 AI 策略能否呈现过摇晃？」目次01. LeCun 推重技巧的更替懂得一下？Karpathy 为何「悔做 RL」？LeCun 推重的要害技巧有过多少轮变更？02. 让 LeCun 废弃无监视的 Energy-Based SSL 跟天下模子有什么关联？Energy-Based SSL 跟天下模子有什么关联？03. 目的驱动的 AI 怎样满意 AMI 的须要前提？什么是 Objective-Driven AI？Objective-Driven AI 具有什么特别机制？...01 LeCun 推重技巧的更替懂得一下？1、OpenAI 开创成员、研讨迷信家、原特斯拉前 AI 高等总监 Andrej Karpathy 近期在交际平台上有关「悔做 RL」的批评惹起了极年夜存眷，他将本人在 OpenAI 抉择强化进修而不抉择自回归言语模子的决议描写为「有史以来最年夜、最令人迷惑的研讨生活过错」。① Karpathy 所描写的「弯路」在于他晚期对言语模子的潜力有所意识，但厥后却将研讨重心转向了强化进修，不连续在言语模子这一偏向上深耕。② 在 2015 年前后，事先广泛见解以为 RNN 难以练习，但 Karpathy 在 2015 年的文章《RNN 的分歧理无效性》中探究了轮回神经收集（RNN）的潜力，并经由过程试验展现了 RNN 在文本天生、代码天生等方面的才能。2、Karpathy 提到 Yann LeCun 事先对强化进修持保存立场，并用「蛋糕」比方来阐明强化进修在全部 AI 范畴中的主要位置，而 Karpathy 以为 LeCun 在观点上始终是准确的。3、比拟于 Karpathy 的「懊悔」，著名 AI 学者、图灵奖得主 Yann LeCun 对其所推重的技巧道路非常动摇。在他积年的学术年夜会跟访谈等公然场所分享的观念中，LeCun 一直夸大实现人类程度智能弗成能是监视进修或纯强化进修，他所推重的技巧也在这条主线上逐渐更迭。① 2016 年，LeCun 夸大无监视进修「依据任何可用信息猜测从前、当初或将来的任何局部感知」的才能能够弥补呆板进修不具有猜测才能的空缺，并将其比方为一个蛋糕的主体。② 2019 年，LeCun 用「自监视进修」代替了「无监视进修」，并猜测将来的神经收集是领有大批数据跟超年夜收集的自监视进修。③ 2019 岁终，LeCun 在 SSL 是将来的基本上开端推重能量模子，即 Energy-Based SSL，然后夸大能量模子跟天下模子对下一代 AI 的主要性。④ 2023 年，LeCun 在实现人类程度的 AI 的须要前提清单中增添了 Objective-DrivenAI 架构，与天下模子、能量模子跟其余组件独特形成了自立智能（autonomous intelligence）的年夜框架。02 让 LeCun 废弃无监视的 Energy-Based SSL 跟天下模子有什么关联？Yann LeCun 在 2016 年的 NIPS（当初的 NeuRIPS）年夜会上初次提出了「蛋糕比方」，他将智能（Intelligence）比作一个蛋糕，此中年夜局部蛋糕（主体）是无监视进修，蛋糕上的糖霜（小局部）是监视进修，蛋糕上的樱桃（极小局部）是强化进修（RL）。这个比方在 AI 社区中广为传播，并建立了 LeCun 作为无监视进修的动摇支撑者。1、LeCun 始终在夸大，人类会应用猜测跟推理等才能从可用信息中揣摸将来，而非经由过程挑选大批标志数据来懂得天下。无监视进修或猜测进修能够补充以后 AI 在推理差别工具之间的关联或猜测人类举措等方面的空缺。① 在 2019 年 5 月的 ISSCC 年夜会中，LeCun 开端从新表述他的观念，赐与了自监视进修（SSL）更高的评估，以为这种特别的无监视进修方法是构建人工智能将来的主要要素，并在后续逐渐提出了缭绕 SSL 的一系列新观点。2、相较于对无监视进修/自监视进修的器重，LeCun 在积年的报告跟访谈等场所均表白了对（纯）强化进修方式的不看好。固然该论调连续吸引了很多来自 RL 社区的回击，但他的立场一直不转变。① LeCun 以为强化进修须要过多（Insane Amounts）的试验来进修，存在样本应用率低、适度依附大批练习数据等范围，且仅实现特定目的后赐与嘉奖，缺乏对进程的反应。② LeCun 不否定 RL 的代价，他罗列了 RL 事先在各种游戏中获得的成绩。但是，他以为在简略的虚构天下中无效的 RL 无奈及时且并行地在实在天下中运转，这与人类进修的方法存在明显差别，不实用年夜少数实在天下场景，因而倡议将 RL 视为最后的抉择，即蛋糕上的樱桃。3、2019 年 5 月在 ISSCC 的报告中，LeCun 将下阶段 AI 所需的中心技巧从无监视进修改为了 SSL，后在在该年 9 月，他 UCLA 的报告中重点先容了 Energy-Based SSL，即能量模子（EBM）..... 存眷

上一篇：三星称仍在优化 Exynos 2500 处置器，筹划利用于往

下一篇：没有了

欧洲杯竞猜

新闻中心

公司新闻
行业动态
专题报道

TOP