20260204

20260204
风铃夜行阅读论文
Multimodal Spatial Reasoning in the Large Model Era: A Survey and Benchmarks
mllm的综述。大致了解了概念,有哪些方法,有哪些问题。还未细读(看它所指出的论文来加深印象和理解)。
A Survey of Self-Evolving Agents
自我学习的智能体综述。此前跟朋友一起做了个玩具multiagent打codeforces,最近想到一些有趣的想法想玩,因此来读这篇论文学习并了解这个方向。这篇论文基本只起到分类指引作用,准备之后按图索骥随用随读需要的论文。
LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming?(nips2025)
一个收录算法竞赛题目的bench
关于下面这篇,有趣的是,在读这篇论文一周前,我曾与朋友商量讨论要不要做一下这件事,并且为此思考并尝试与讨论过一些架构的设计。
AutoCode: LLMs as Problem Setters for Competitive Programming(iclr2026)
与前一个文章同作者团队。
multiagent自动出算法题,由是可以作为一个合成数据的利器。
这篇文章所提出的multiagent架构实际上与codeforces polygon平台(人类用于出题的平台)工作流程基本相同。
与以前完全将别人的论文奉为圭臬,方才第三篇论文带着问题来读不同,这篇文章我几乎可以说是带着答案来读的,遗憾之余感觉学习到了很多东西,同一个东西同一个方法我想不到如何变成一篇可行的paper(比如合成数据这个角度),乃至于到iclr这样的顶会。
未来可能会多读几遍这一篇,带着自己的答案与学习的态度来读这篇论文(和它的rubattal过程)可以收获很多。





