EN
china-haitai.com

人or猪or狗的Dna播放Scaling Laws起源于1993年?OpenAI总裁:深度学习的根本已揭秘

人工智能的「第一性原理」扩展定律(Scaling Laws),把模型性能与算力等资源投入联系在了一起,是如今人们构建更先进大模型重要的参考标尺。 有关扩展定律的起源,存在很多种说法,有人认为是 2020 年 OpenAI 提出的,有人认为是 2017 年百度发现的,详情可参阅我们之前的报道《遗憾不?原来百度 2017 年就研究过 Scaling Law,连 Anthropic CEO 灵感都来自百度》。 他进一步解释说,这篇论文其实是一篇 NeurIPS 论文。贝尔实验室的研究者「在不同大小的数据集、不同大小的模型上训练了分类器并拟合了幂律」。这让 Morris 不禁感叹:「不敢相信这已经是 32 年前的事了。」 近日,OpenAI 联合创始人、总裁 Greg Brockman 也转发了这一消息,并表示这些结果跨越了多个数量级和几十年的时间,经历了时间的考验,可以说揭示了深度学习的根本。 这篇论文介绍说,基于大规模数据训练分类方法是相当耗费算力的工作。因此,开发高效的程序来可靠地预测分类器是否适合执行给定任务至关重要,这样才能将资源分配给最有潜力的候选分类器,或腾出资源来探索新的候选分类器。 作者提出了一种实用且有原则的预测方法,避免了在整个训练集上训练性能较差的分类器的高成本过程,同时拥有坚实的理论基础。作者证明了所提方法的有效性,以及适用于单层和多层网络。 在该工作中,作者研究了自动分类的算法,随着训练数据逐步增加,分类器的能力(模型出错的概率)被持续标记。在测量了多个数据点后,可以发现模型的错误率对比训练数据的数量,在对数曲线上呈现出了一定的规律。 作者进而得出结论:「经过 12000 种模式的训练后,很明显新网络的表现将优于旧网络…… 如果我们的预测方法能够对网络的测试误差做出良好的定量估计,我们就可以决定是否应该对新架构进行三周的训练。」 这篇论文的一作 Corinna Cortes 已经拥有超过 10 万引用!她与四作 Vladimir Vapnik 也是经典论文《Support-vector networks》(引用量超过了 7.7 万)的两位作者。这篇论文提出了大家熟知的现代意义上的支持向量机。 Corinna Cortes 的职业履历很简单:先在贝尔实验室工作了 14 年,之后于 2003 年加入谷歌,领导 Google Research NY 达 21 年之久。现在她是 NeurIPS 的董事会成员之一。她同时也是一名竞技跑步运动员。 这篇论文的二作 Lawrence D Jackel 是时任的贝尔实验室应用系统研究部门负责人。1988 年 Yann LeCun 加入该实验室后,与他合作完成了多项高引用研究成果,其中包括一篇重要的反向传播论文《Backpropagation applied to handwritten zip code recognition》。 该论文运用信息论的思想,推导出了一类用于调整神经网络规模的实用且近乎最优的方案。通过从网络中移除不重要的权重,可以预期实现多项改进:更好的泛化能力、更少的训练样本需求以及更快的学习和 / 或分类速度。其基本思想是利用二阶导数信息在网络复杂度和训练集误差之间进行权衡。 前文我们已经见到过 Vladimir Vapnik 的名字,即支持向量机的作者之一。除此之外,这位拥有超过 33.5 万引用的大佬还是统计学习领域著名的 Vapnik–Chervonenkis 理论的提出者之一 —— 是的,这个理论就是以他和苏联数学家 Alexey Chervonenkis 的名字命名的。 他曾就读于加州理工学院。大三时,他创办了一家成功的小型软件和电子公司,在安防系统、好莱坞特效、手持电子游戏和视频游戏等多个领域做出了开创性的工作。此外,在读本科期间,他还在加州理工学院创建并教授了一门课程:「微处理器设计」。 他在康奈尔大学的博士研究考察了氢原子气体在仅比绝对零度高千分之几摄氏度的温度下的性质,并表明在这种稀薄的玻色气体中存在量子自旋输运和长寿命的「自旋波」共振。他的其他研究涉及超低噪声测量设备的设计 —— 其中基本的量子力学限制起着重要作用。 Denker 博士加入过 AT&T 贝尔实验室多年时间,曾担任杰出技术人员、部门主管和部门经理等职务。他的研究兴趣包括计算机安全、选举安全、网络电话和神经网络。他还发明了新型低能耗「绝热」计算系统。 John Denker 还拥有商用飞行员、飞行教练和地面教练资格。他是美国联邦航空管理局(FAA)的航空安全顾问。他曾任蒙茅斯地区飞行俱乐部董事会成员,以及美国国家研究委员会商用航空安全委员会成员。 其中证明了一类普适的学习曲线渐近行为,适用于一般的无噪声二分机器或神经网络。结果表明:无论机器的架构如何,其平均预测熵或信息增益 纵观数十年的研究脉络,Scaling Law 的提出并非灵光乍现的顿悟,而是跨越学科、跨越时代的逐步累积。从心理学的学习曲线,到感知器的早期探索,再到 Vapnik、Amari、贝尔实验室的系统化研究,最后发展到 OpenAI 等机构在大规模实验中验证和推广,每一代学者都在为这条「经验定律」添砖加瓦。 今天我们所说的 Scaling Law,看似清晰而坚固,但它背后蕴含的是数十年理论与实践的反复印证。正如 Brockman 所言,它揭示了深度学习的根本,而这一「根本」并不是一蹴而就的,而是科学探索在时间长河中的积累与沉淀。

人or猪or狗的Dna播放
人or猪or狗的Dna播放仲裁听证会最终裁定支持诺丁汉森林。尽管麦克弗森否认偏见,但仲裁委员会认定这是一起“明显偏见”的案件。委员会指出,麦克弗森使用“歇斯底里”一词是“高度贬义的”,并认为一个公正的观察者会认为麦克弗森对俱乐部及其法律代表进行了“不正当、不适当且个人化的攻击”。其实,类似的情况并非个例。厦门大学嘉庚学院就曾因同样的套路而“翻车”。当时,该校的学生在遭遇不公正处分后,将相关的谈话录音公布到了网上。在舆论的压力下,校方不得不连夜撤销了处分决定。人or猪or狗的Dna播放《在床上怎么做才能让男人荷尔蒙提高》里斯-詹姆斯说道:“赛季初期,我们缺少足够比赛来寻找节奏。但今天开了个好头,所以输给塞内加尔后算是取得了积极成果。”他说,练习精准停车入位只是司机们的工作之一,他们还要考虑运送鸽子的过程中,万一遇到发动机不启动、轮胎没气等突发情况,如何以最快速度排除故障。
20250915 ⭕ 人or猪or狗的Dna播放生活得不错啊。路易斯,今夏我们见到很多来自欧洲的顶级前锋登陆英超。想想谢什科,想想哲凯赖什之类的。我们想了解球员要完成这种转变到底有多难。先从你职业生涯早期说起吧。我知道你从梅斯起步,1999年被外租到纽卡斯尔。我回看了当时的更衣室,邓肯-弗格森、阿兰-希勒、皮尔斯,还有主教练古利特。你当时的适应过程怎样?《春香草莓和久久草莓的区别》相比之下,基于CLIP等视觉-语言模型的新型检测方法在处理局部伪造时表现相对更好,特别是在检测面部替换和局部修改方面。这些方法更关注语义层面的一致性,能够发现一些传统方法忽视的逻辑矛盾。但是它们在面对高质量的完全生成视频时反而表现不佳,因为这些视频在语义层面往往非常连贯。
人or猪or狗的Dna播放
📸 侯卫东记者 邓小红 摄
20250915 🔞 人or猪or狗的Dna播放这份成长,离不开兄长肖思远的影响。母亲回忆,思远比弟弟大了8岁,荣基从小就很受哥哥照顾。思远牺牲后,肖荣基便暗下决心要“接哥哥的班”。“当时我们还不愿意他去,怕他吃苦,可他说‘我想去’,跟他哥当年要去边疆一样坚决。”9·1免费观看完整版阿尔卡拉斯与这位塞尔维亚名将的半决赛,定于9月5日在阿瑟·阿什球场举行。而对普通网球爱好者来说,看起来可能根本没有机会进场。为什么?看看票价就明白了:在阿瑟·阿什球场现场观战这场比赛的最低票价,也要1000美元。
人or猪or狗的Dna播放
📸 夏可强记者 张伟 摄
🔞 当你离开足球时,球队参加了夏天的金杯赛,我们进了决赛,输给了墨西哥。你会在外面关注这项赛事吗?还是一旦你不在、或者你受伤,你就不看比赛?男朋友隔着内裤蹭蹭会得妇科病吗
扫一扫在手机打开当前页