F阶段的一点思考
我在两个月前就完成了F阶段的整体学习,接下来的两个月,有着竞赛和科研的各项任务,总体的学习进度也是一拖再拖。 我也面临着学业和很多方面的压力,是不是应该这样去做。我想,也许是没有答案的。因为数电课堂上的很多东西,我的确有点不会做,有一些很细节的东西,哪怕我完整的经历了整个F阶段,我也依旧听不懂。 我体会过了,在搓出一个minirv的时候的大狂喜,也体会到了,在做出来后我的很多状况并没有改变。学业的压力不会因为我做了这样一件事而减轻半分,我的成绩也并不一定会增长。 昨天进行了数电的期末考试,出人意外地考的是组合逻辑电路。我觉得,那进入了我的舒适区。最后两道20分的题,要设计两个大电路。确实是a piece of cake。因为我具备了系统的能力,对于只是单单的一个模块而言,那自然不在话下。 一直以来我都觉得很奇怪,为什么学习数电是用笔去画电路,用人脑去编译,去想象一个个器件,应该是什么样子的。这似乎不是硬件的灵魂与应有之义。 所以我想去改变,虽然这只是很偶然的机会下,我的一次小的尝试。但是我相信,若干年后回想起现在,我不会记住我复现了多少个论文跑了多少代码拿了什么奖,我一定会记住这...
19:五月总结
一些散乱的,但属于我的思考关于工具与语言这是我的第一份不是用手敲的博客,而是用语音输入的。我用的不是 Typeless,而是 Open Typeless。这个软件没有那么强的能力,但恰恰能锻炼我的语言能力。 我忽然觉得有一点悲哀:如果你有一个非常好用的工具,它反而不会在事实上潜移默化地提升你的语言能力。工具大多数时候是好用的,关键还是看你怎么用、你自己菜不菜。一个人越是让 AI 的结构覆盖自己的完整认知,就越是一种悲哀。 我希望最后是轻盈的。我们的未来应该走向独属于自己的旅程——想来去也是轻盈的。你不可能抱着一个电脑随时问 AI 各种问题。比如遇到一道英语题,你让它翻译,我觉得这不合适。所以,还是把知识装进脑海里吧。 不要把使用 AI 当作所谓提升自己能力的另一种信息假象。 感谢自己:这周更踏实了有啥说啥,首先要感谢自己——你比上个星期更加踏实了。 30 分钟,你了解了整个 Harness,了解了 MCP、ent,还有很多像 Workflow 这样的概念。你真正开始意识到,AI 可能会对人产生颠覆性的影响——它真的有可能取代你。或许,当今世界正经历着百年未有之大变局,而 AI,是...
18:agent初步
我给十个codex打工我还是想用这样的一个题目,参考的是(14 封私信 / 80 条消息) 如何有效地给 10 个 Claude Code 打工 - 知乎我们生在一个巨变的时代,得之则生,弗得则怠。刚好,前一阵子在刷稀土掘金的时候,刷到了这样一个帖子https://juejin.cn/post/7611070995847528482?share_token=7ff06389-fa16-4c04-96e6-b925e1919b17在这里面增加了多agent组队写作的功能,多 Agent 组队协作的功能,不明觉厉,我决定试试。 基础要求首先你得要有一个codex,其次需要有一个ubuntu 22以上的linux环境,对应到autodl的平台上,需要3090/4090就可以了。可以参考我之前的blog内容:5:记录一次autodl的codex配置。 原来的命令需要从github上面拉文件,所以我们可以用autodl的一些小小的优化之学术科研的配置加速 123456# 开启autodl学术加速source /etc/network_turbo# 2) 指定版本(1.0...
17:harness
读了一篇文章,链接如下,遂进行一次记录https://mp.weixin.qq.com/s/77dyufF3MP8stHPS0BApNw 几个概念 rulerule是对于AI的软约束 什么意思?就是 AI 理论上应该遵守它,但它并不一定真的每次都遵守。尤其当 Rule 越来越多、需求越来越复杂的时候,模型会出现三种典型情况: 它忘了某条 Rule 它觉得某条 Rule 和这次需求“无关” 它知道这条 Rule,但偷懒没做,还给自己找理由 也就可能是reward hacking的出现 MCP给一个定义:MCP(Model Context Protocol)本质上是一种标准方式:把「仓库之外的能力」接进 AI 的工作链路里——既能拉取信息,也能在明确边界内触发外部系统的动作。 如果没有MCP,AI通常被锁在 本地代码仓库 本地脚本 当前对话上下文 所以说能分析。能跑代码,但是不能安全结构化的接入更加外层的工程系统 它们的共性是:需要让 AI 在可控边界里调用系统能力,而不是把凭据和即兴命令散落在对话里。MCP 正是这类能力的连接层:把外部系统以 Tool / 资源的...
16:记录一次院士讲座
今天有幸,能够聆听一场院士的分享 图灵测试与大语言模型——关于通用人工智能的几点思考 最近这半年,AI发展实际上太快了。人工智能,铺天盖地。很多过去认为必须人来做的事情,都在被AI代替。最近发生的战争,人工智能已经完全改变了战争的形态。 源起,1956年的达特茅斯会议。 香农,信息论 造了一个这样的词汇artificial intelligence 图灵: 计算机科学之父,人工智能之父 数学家,逻辑学家 论可计算数及其判定问题上的应用,1936 计算机器与智能,1950年,computing machinery and intelligence 图灵测试:机器能思考吗? 人工智能(AI),不如机器智能(MI)更加恰当。 他一生中发表的文章不超过十篇 通用图灵机,1936离散有限状态机,到目前为止,这是对计算机最通俗直观的模型 computing machinery and intelligence1950年,图灵问题的提出,机器能思考吗“机器”:数字计算机,通用图灵机,离散有限状态机“思考”是一个无法准确定义的模糊概念,因而讨论能否并没有意义 模仿游戏根据C,A男生,B是...
15:大唐杯省一
大唐杯省一,进入国赛了,超开心于是水一条blog
14:记录一次yolo的可视化
今天对于baseline的结果进行了可视化,我们对于置信度大于50%的目标进行了画框,高于之前的25%,用于观测对置信度的一些影响。总体虽然使用的是OBB,也有一些生成的框确实是旋转的框,但是大部分的还是四四方方的,正的。这个比较奇怪,我们需要改正,大部分定位不到物体具体精细的位置。 以上是004,密集排列的话,置信度是不够的。824 1464,但下面这个是很好的。1490 2137 0019harbor,由于背景固定,感觉还是很可以的。0047密集小车,1126 2167 最后置信度都很小,由于像素很小。和86形成对比,像素没有那么小还是可以检测出来的由于车顶与车棚的特征,出现了个误检0179 0053,斜着挨着导致置信度受到了影响小船效果还是不错的 这个不是很懂,军舰不太一样?超大目标检测不到0683这个就可以 飞机还是很固定的,由于背景固定,效果都不错小目标也是OK的 1234开始,卫星遥感带云遮挡,小目标,对比度小1273太小就很难 大小来看,似乎只能小到这个地步黑暗情况下,还是要对比度鲜明,比如说飞机和机场 俯仰的角度下,漏检比较多 看看会不会有云雾的干扰 小目标检测...
13:再看 YOLOv4
我读这样一篇论文的目的已经有了变化。下面讲一下我对于这一篇 paper 的理解。 我们赛题的核心是:不均衡小样本、光学遥感、陆上时敏目标检测识别。对于基础算力环境,其实并没有那么大的要求,因为类似 3090 级别的算力平台已经能够解决非常多的问题。所以我们更多需要学习的是 YOLOv4 中一个个具体模块的设计思路。 一、Selection of ArchitectureCSPDarknet53 在检测任务上效果更加优秀,而 CSPResNext50 在分类任务上表现更加优异。 遥感图像中的目标通常很小,背景复杂。如果 backbone 太轻,容易漏检;但如果 backbone 太重,又难以满足大幅面图像的推理时间要求。 论文里面讲了这样一句话: A reference model which is optimal for classification is not always optimal for a detector. In contrast to the classifier, the detector requires the following. 分类和检测之间存...
12:论文笔记:YOLOv4(1)
Abstract这是一篇2020年的paper,代表着yolov4的出现,也是一个小的里程碑maybe。首先在此之前的yolov3,在模型的多尺度预测和深度的网络,有一些提升。小目标检测的性能更加的优良。 有很多的特征能够提高卷积神经网络的性能,这一篇论文似乎是对于这些进行了一个测试 We assume that such universal features include Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activation. We use new features: WRC, CSP, CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss, and ...
11:记录一个科研小工具
开门见山这估计要是我最短的一个blog了。我们请出他的名字,uithub。 好比我们打开一个github网页 我们把网页的G换成U:jyfc/ebook: classic books of computer science 然后你会发现,有它的所有的文本,都在一个页面上! just ctrl+c and ask deepseek!
