20260204

风铃夜行2026-02-042026-02-10

阅读论文

Multimodal Spatial Reasoning in the Large Model Era: A Survey and Benchmarks
mllm的综述。大致了解了概念，有哪些方法，有哪些问题。还未细读（看它所指出的论文来加深印象和理解）。

A Survey of Self-Evolving Agents
自我学习的智能体综述。此前跟朋友一起做了个玩具multiagent打codeforces，最近想到一些有趣的想法想玩，因此来读这篇论文学习并了解这个方向。这篇论文基本只起到分类指引作用，准备之后按图索骥随用随读需要的论文。

LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming?(nips2025)
一个收录算法竞赛题目的bench

关于下面这篇，有趣的是，在读这篇论文一周前，我曾与朋友商量讨论要不要做一下这件事，并且为此思考并尝试与讨论过一些架构的设计。
AutoCode: LLMs as Problem Setters for Competitive Programming(iclr2026)
与前一个文章同作者团队。
multiagent自动出算法题，由是可以作为一个合成数据的利器。
这篇文章所提出的multiagent架构实际上与codeforces polygon平台（人类用于出题的平台）工作流程基本相同。
与以前完全将别人的论文奉为圭臬，方才第三篇论文带着问题来读不同，这篇文章我几乎可以说是带着答案来读的，遗憾之余感觉学习到了很多东西，同一个东西同一个方法我想不到如何变成一篇可行的paper（比如合成数据这个角度），乃至于到iclr这样的顶会。
未来可能会多读几遍这一篇，带着自己的答案与学习的态度来读这篇论文（和它的rubattal过程）可以收获很多。