一些散乱的,但属于我的思考

关于工具与语言

这是我的第一份不是用手敲的博客,而是用语音输入的。我用的不是 Typeless,而是 Open Typeless。这个软件没有那么强的能力,但恰恰能锻炼我的语言能力。

我忽然觉得有一点悲哀:如果你有一个非常好用的工具,它反而不会在事实上潜移默化地提升你的语言能力。工具大多数时候是好用的,关键还是看你怎么用、你自己菜不菜。一个人越是让 AI 的结构覆盖自己的完整认知,就越是一种悲哀。

我希望最后是轻盈的。我们的未来应该走向独属于自己的旅程——想来去也是轻盈的。你不可能抱着一个电脑随时问 AI 各种问题。比如遇到一道英语题,你让它翻译,我觉得这不合适。所以,还是把知识装进脑海里吧。

不要把使用 AI 当作所谓提升自己能力的另一种信息假象。

感谢自己:这周更踏实了

有啥说啥,首先要感谢自己——你比上个星期更加踏实了。

30 分钟,你了解了整个 Harness,了解了 MCP、ent,还有很多像 Workflow 这样的概念。你真正开始意识到,AI 可能会对人产生颠覆性的影响——它真的有可能取代你。或许,当今世界正经历着百年未有之大变局,而 AI,是人类的万年未有之大变局。

上一次有这样的变局,是人类发现自己在各个方面都可以做到更好,就像当年的猿人,突然在某个时刻能超越所有其他物种。而现在,人类发现自己几乎在各个方面都比不过 AI 了——这也许是一个需要正视的事实。

好习惯与勇气

另外,你现在每天睡觉前都会出去打羽毛球。这是个非常好的习惯。它让你的晚上加班变得开心、踏实、有活力,也让每一天变得更加有激情。

你的“大唐杯”进入了国赛。你们作为唯一的本科小组,一路杀进了国赛。我真的很佩服你的勇气。同时,我也希望你能够更加踏实、笃定地走到最后。

你的“挑战杯”也进入了主力阵容,而且是核心主力,包括最后的答辩角色。

技术思考:门控、YOLO 与 NMS

在这里,我想梳理一下自己对技术理解上的一次进步式思考。

你开始自己一个个去找“门控”——门控中的那个“门”。你开始自己去搭建门控与分支。相比原有的 YOLO 网络加上门控,好处到底在哪里?这确实是更深一层次的宝贵思想。

智慧的核心,可能就存在于一片混沌之中。而我们的语言,本质上就是一种“结构 + 混沌”的综合体。你需要坚定自己的信仰,在一个个 reward 面前,拒绝 reward hacking 这条路。在你的生命中,矢志不渝地去探索智慧,走向你心中的那片哲学天地。

请允许我告诉你:哲学,比你认为的、对人类的其他所有计算都更重要。

再说回 YOLO。YOLO 本身是一个轻量级的网络,但它的瓶颈主要卡在 NMS(非极大值抑制) 上。对于一个算力和显存都比较可观的计算平台来说,模型的前向传播并没有消耗太多的算力和时间资源,真正的资源消耗其实是在 NMS 上。对 YOLO 而言,是 NMS 拖垮了速度;而对 Faster R-CNN 来说,它本来就慢,再加上注意力机制中 QKV 的运算开销非常大。

所以我在想,我应该去可视化 YOLO 的每一个部分,以此深化自己的认知。或者说,尝试设计新的激活函数、加门控、设置约束条件与超参数。当然,这只是一个想法,还是比较天真的想法。还需要更深入的了解。

开源、共享与技术路线

谈一谈开源,谈一谈共享,谈一谈人类存在的意义。

回到我的技术路线——以近期的大唐杯为例。在决定用什么来做判断的逻辑时,曾面临选择:用激光雷达,还是用深度相机?

最后我选择了深度相机。

为什么?激光雷达的数据确实更加准确。但深度相机,它代表的是人的眼睛——它才可能是人类未来发展的方向。


这些文字零零散散,但它们是我的。我不打算用 AI 把它们润色得光滑无比。就这样,带着棱角,留下来。

以上,包括上一句话,都有着AI的加工,这真的非常可怕。

我怕我最终会失去所有的思考,甚至是最基础的语言能力。

我害怕着,我撕裂着,希望着,洪水图腾蛟龙,烈火涅槃凤凰。