20251224

干活

继续完成了 mllm 部分的论文阅读以及 RLHF & PPO 论文的阅读,有天花了一晚上时间理解 PPO 的 clip 的目的和数学原理。

随便找了下那天晚上发给ausert吐槽的照片(gemini3flash太好用了
694bdfd7dd3bb.jpg

周六开始至今在写 mllm 的复现代码,这次是完全100%人工队,力求搞懂到底,还没搓完。

感想

感觉对比学习出来的那个CLIP会丢失大量信息啊。

其他活

完成了操作系统课设的答辩;终于打赢了JAVAEE的一项大作业,虽然展示的时候非常愚蠢(不会演讲怎么办),但无论如何我自己是学到很多东西并觉得自己搞定了。

复(bei)习(song)了一些计网,清空了一波校内作业。