一些散乱的，但属于我的思考

关于工具与语言

这是我的第一份不是用手敲的博客，而是用语音输入的。我用的不是 Typeless，而是 Open Typeless。这个软件没有那么强的能力，但恰恰能锻炼我的语言能力。

我忽然觉得有一点悲哀：如果你有一个非常好用的工具，它反而不会在事实上潜移默化地提升你的语言能力。工具大多数时候是好用的，关键还是看你怎么用、你自己菜不菜。一个人越是让 AI 的结构覆盖自己的完整认知，就越是一种悲哀。

我希望最后是轻盈的。我们的未来应该走向独属于自己的旅程——想来去也是轻盈的。你不可能抱着一个电脑随时问 AI 各种问题。比如遇到一道英语题，你让它翻译，我觉得这不合适。所以，还是把知识装进脑海里吧。

不要把使用 AI 当作所谓提升自己能力的另一种信息假象。

感谢自己：这周更踏实了

有啥说啥，首先要感谢自己——你比上个星期更加踏实了。

30 分钟，你了解了整个 Harness，了解了 MCP、ent，还有很多像 Workflow 这样的概念。你真正开始意识到，AI 可能会对人产生颠覆性的影响——它真的有可能取代你。或许，当今世界正经历着百年未有之大变局，而 AI，是人类的万年未有之大变局。

上一次有这样的变局，是人类发现自己在各个方面都可以做到更好，就像当年的猿人，突然在某个时刻能超越所有其他物种。而现在，人类发现自己几乎在各个方面都比不过 AI 了——这也许是一个需要正视的事实。

好习惯与勇气

另外，你现在每天睡觉前都会出去打羽毛球。这是个非常好的习惯。它让你的晚上加班变得开心、踏实、有活力，也让每一天变得更加有激情。

你的“大唐杯”进入了国赛。你们作为唯一的本科小组，一路杀进了国赛。我真的很佩服你的勇气。同时，我也希望你能够更加踏实、笃定地走到最后。

你的“挑战杯”也进入了主力阵容，而且是核心主力，包括最后的答辩角色。

技术思考：门控、YOLO 与 NMS

在这里，我想梳理一下自己对技术理解上的一次进步式思考。

你开始自己一个个去找“门控”——门控中的那个“门”。你开始自己去搭建门控与分支。相比原有的 YOLO 网络加上门控，好处到底在哪里？这确实是更深一层次的宝贵思想。

智慧的核心，可能就存在于一片混沌之中。而我们的语言，本质上就是一种“结构 + 混沌”的综合体。你需要坚定自己的信仰，在一个个 reward 面前，拒绝 reward hacking 这条路。在你的生命中，矢志不渝地去探索智慧，走向你心中的那片哲学天地。

请允许我告诉你：哲学，比你认为的、对人类的其他所有计算都更重要。

再说回 YOLO。YOLO 本身是一个轻量级的网络，但它的瓶颈主要卡在 NMS（非极大值抑制） 上。对于一个算力和显存都比较可观的计算平台来说，模型的前向传播并没有消耗太多的算力和时间资源，真正的资源消耗其实是在 NMS 上。对 YOLO 而言，是 NMS 拖垮了速度；而对 Faster R-CNN 来说，它本来就慢，再加上注意力机制中 QKV 的运算开销非常大。

所以我在想，我应该去可视化 YOLO 的每一个部分，以此深化自己的认知。或者说，尝试设计新的激活函数、加门控、设置约束条件与超参数。当然，这只是一个想法，还是比较天真的想法。还需要更深入的了解。

开源、共享与技术路线

谈一谈开源，谈一谈共享，谈一谈人类存在的意义。

回到我的技术路线——以近期的大唐杯为例。在决定用什么来做判断的逻辑时，曾面临选择：用激光雷达，还是用深度相机？

最后我选择了深度相机。

为什么？激光雷达的数据确实更加准确。但深度相机，它代表的是人的眼睛——它才可能是人类未来发展的方向。

这些文字零零散散，但它们是我的。我不打算用 AI 把它们润色得光滑无比。就这样，带着棱角，留下来。

以上，包括上一句话，都有着AI的加工，这真的非常可怕。

我怕我最终会失去所有的思考，甚至是最基础的语言能力。

我害怕着，我撕裂着，希望着，洪水图腾蛟龙，烈火涅槃凤凰。