每次实验的预算被固定为5分钟,无论使用何种GPU,AI如何修改代码,每次实验都能在相同时间内完成。这样的设计不仅确保了实验的可比性,还让不同的模型、batch size和优化器之间的效果一目了然。
高德纳此前已经解决了 m=3 的基础情况,并将其作为书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解,这使得所需分解法存在的可能性极高。为了寻找通解,Stappers 将这个问题原封不动地交给了 Claude 处理。
但这就是 Andrej Karpathy 今天凌晨开源的新项目 autoresearch 所做的事。项目上线不到几个小时,他在 X(原 Twitter)上的发布帖浏览量突破百万,GitHub 仓库迅速收获超过 2,500 ...
前沿 AI 研究曾经是由「肉身计算机」完成的:人们在吃饭、睡觉、娱乐之间抽时间做研究,并且偶尔通过一种名为「组会」的仪式,用声波互联(也就是交谈)来同步信息。那个时代已经一去不复返了。 如今,研究已经完全成为运行在天空中巨型计算集群上的自治 AI ...
在12小时不间断运行中,AI代理完成了110次代码提交,将模型验证损失从0.862降至0.858。这个看似微小的进步背后,是系统严格执行的优化规则:任何改进必须同时满足损失降低或训练加速的条件。某次提交虽成功降低损失,但因训练时间延长0.7秒被自动回滚,彰显出AI代理对优化目标的精准把控。
阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新 曾几何时,前沿AI研究还靠着一群"碳水化合物计算机"——他们在吃饭睡觉摸鱼的间隙,偶尔通过"组会"仪式用声波互相吼两嗓子,就这么推进着人类的技术边界。那个年代已经一去不返。如今,研究完全被AI智能体接管,它们成群结队地在云端巨型计算集群里狂奔。据说代码已经迭代到了第10205代,但这数字真伪已无从考证——那些代码早已进化为能自我修改的二进制 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果