10:四月总结和vibe coding
工具飞速迭代,我想,有一个朴素地辩证法。我们能发挥出的实力,是自己的内涵+工具的外延。如果工具飞速进步,而我们的大脑不断地萎缩,那我们最后是能够担起大任的吗。显然不是。 所以,核心在于,让自己变得更聪明,而不是让工具变得更智能。外本内末,歧路亡羊。我还是要去走那一条最为艰难的道路 我想,何其有幸,我的确是接触到了一个,很大程度上的,跨时代的一个工具。事实上,我才接触codex没两天,但目前摆在我面前的,是一个前所未有的,工具,它来自karpathy的一个我认为天才的想法: One day, frontier AI research used to be done by meat computers in between eating, sleeping, having other fun, and synchronizing once in a while using sound wave interconnect in the ritual of “group meeting”. That era is long gone. Research is now entire...
9:读经典,attention is all you need
这一篇论文,在2017年以一个标题党的姿态产生,但是当时对它提起注意的人似乎没有那么多。但就是这么一个work,在如今的各种领域之内攻城略地,几乎没有很多人注意到,这开启的是一个AI的新时代,不断攻城略地,从机器翻译到整个NLP,然后在现在,几乎打遍了CV。现在,没有用到transformer的地方已经很少了。 In this work we propose the Transformer, a model architecture eschewing(故意避免) recurrence and instead relying entirely on an attention mechanism to draw global dependencies between input and output. The Transformer allows for significantly more parallelization and can reach a new state of the art in translation quality after being trained ...
8:caformer的复现
概述我们进入OSformer的复现,论文名称为Cross-domain-aware deep unfolding transformer for hyperspectral image super-resolution,提供的源代码https://github.com/Caoxuheng/HIFtool,这是一个高光谱融合方向的一个项目融合包,里面提供了多种方法,大致分为三类:model-based,supervised,unsupervised.我们的OSformer就是基于监督学习的一个方法 数据集在文件夹multispectual image dataset中,我们可以看到一共有如下的五个文件夹,分别是 CAVE chikusei Pavia QB xiongan我们按照文件夹里面的md文件进行下载 bug调试20260225经过了一个春节小长假,调试的进度需要重新找回来。由于我们的笔记本的32G的内存不足以加载需要60G内存的程序,而在Linux中出现killed报错,我们在autodl中新建了一个实例,用以解决问题。autodl的一大好处是,其中的内存有120G,远...
7:论文笔记-Frustratingly Simple Few-Shot Object Detection
由于我的挑战杯是小样本检测,所以我想通过这样一篇文章,对于这个网络和这一个东西有着一个基础的了解 读论文abstract Detecting rare objects from a few examples is an emerging problem. Prior works show metalearning is a promising approach. But, finetuning techniques have drawn scant attention. 从少量样本中完成特征的检测是一个比较难的任务,在这个的研究方法中,元学习得到了广泛的关注,而微调没有引起很多的关注。 We find that fine-tuning only the last layer of existing detectors on rare classes is crucial to the few-shot object detection task. 只是对于现有的探测器的最后一层进行微调,感觉有点意思。 conclusion We proposed a simple two-...
6:论文笔记 Equalization Loss v2 A New Gradient Balance Approach for Long-tailed Object Detection
这是一个 EQLv2 (Equalization Loss v2) 目标检测项目,基于MMDetection v2框架开发并进行了深度定制。该项目主要解决长尾分布(long-tail distribution)下的目标检测问题——即数据集中大量类别具有极少的样本,导致模型在这些稀有类别上的表现极差。考虑到ddl马上到来,我们对于代码进行先行的处理。https://github.com/tztztztztz/eqlv2。 这个项目代码目前支持COCO、LVIS、OpenImages等多个长尾分布的主流的数据集。 首先我们对于项目的结构进行分析如下: 123456789101112131415161718192021222324252627mmdetection-eql/├── configs/ # 配置文件目录(37,200+ tokens,核心)│ ├── end2end/ # EQL/EQLv2 核心配置文件│ │ ├── eqlv2_r50_8x2_1x.py # EQLv2配置│ │ ├── eql_...
5:记录一次autodl的codex配置
记录一次配置首先安装node.js 123apt update apt install -y curl curl -fsSL https://deb.nodesource.com/setup_lts.x | bash -apt-get install -y nodejs 验证是否安装成功 12node -v npm -v 安装codex 12npm i -g @openai/codex --registry=https://registry.npmmirror.comcodex --version 创建配置 123mkdir -p ~/.codexapt update && apt install -y nanonano ~/.codex/config.toml 写以下的配置文件 1234567891011121314151617181920212223242526272829model_provider = "OpenAI" model = "gpt-5.4" model_reasoning_effort = "...
4:读后感——何为好的论文
读后感尼古拉斯-卡里尼,和他的网站:如何赢得最佳论文奖 (或者,关于如何进行重要研究的个人观点) 仅仅做一个记录,来自一个科研的小白。 想出最值得写论文的点子要有好的品味,去挑选一个问题 The single most important skill to develop for high-impact research is good taste in what problems are worth solving. If you have good taste, and you keep writing papers, eventually you’ll write one with exceptionally high impact. But if you have bad taste, you could write a hundred papers and never do anything of consequence. 也许我们可以发一百篇论文,但如果我们的文字不具有品味,不是在一开始就在做一件正确的事,那么也许,我们终其一生,never do anything ...
E1.2 C语言程序设计
把今天认真折叠好,明天自然会有展开的光 常量常量是程序中最基本的元素,有字符常量,整数常量,浮点数常量和枚举常量。字符常量要用单引号括起来,例如上面的'}',单引号只能括一个字符而不能像双引号那样括一串字符。在格式化字符串中%号(Percent Sign)后面加上字母c、d、f分别表示字符型、整型和浮点型的转换说明(Conversion Specification). 1、总结前面介绍的转义序列的规律,想想在printf的格式化字符串中怎么表示一个%字符?写个小程序试验一下。 其它的他多数符号,都是用反斜杠\进行转义,但是对于%而言,是用其本身进行转义,即为%% 123456#include <stdio.h>int main(){int score = 100;printf("小明的准确率是:%d%%\n",score);return 0;} 变量变量(Variable)是编程语言最重要的概念之一,变量是计算机存储器中的一块命名的空间,可以在里面存储一个值(Value),存储的值是可以随时变的,比如这次存...
E1.1,C语言程序设计
程序和编程语言程序(program)告诉计算机如何完成一个计算任务。而程序由一系列的指令(instruction)组成,是指示计算机做某种运算的命令。任何一个程序,都由输入,输出,运算,测试与分支,循环几个操作组成。所以,编写程序就是把任务分解为子任务,子任务再分解为更简单的任务的一个过程。 习题 1、解释执行的语言相比编译执行的语言有什么优缺点? 现在回答这个思考题,根据编译和解释的不同原理,你能否在执行效率和平台无关性等方面做一下比较? 希望读者掌握以概念为中心的阅读思考习惯,每读一节就总结一套概念之间的关系图画在书上空白处。如果读到后面某一节看到一个讲过的概念,但是记不清在哪一节讲过了,没关系,书后的索引可以帮你找到它是在哪一节定义的。 在流程上面,解释不需要经过编译,会具有更高的执行效率。在专用于这个芯片的场景下,这是一种执行速度更快的选择。 但是解释更像是一种translate,是一种one to one的模式,把一个指令解释为另一个可以执行的指令。大多数情况下,机器的执行的情况是不一样的。所以他又一个显著的特征是,输入的编码需要根据机器执行的不同,而去修改而适应设备...
3:三月的总结
日子过得很快,从开学到现在,已经有了两个星期了,这两个星期发生了很多事,也许很多事也会逐渐地忘记。但是,总结和记录也许是时间的锚点,让我们知道,我们从何而来,到何而去;我们的生命地意义是为了什么。我想,对于每一个人而言,这都是一个绕不开地话题。 从应试教育走来,大家往往非常会卷,会刷题。会用一些和自己并不是表里如一的词语和语句,来彰显着自己学识地渊博。但是,究其源,我认为这是一种不自信的体现。这一种不自信很可能不是所谓的人的自信,而是对于自己的道路的自信和理论的自信。 就好像在高考作文中写着”酌古“”观今“”揆诸当下“一样,这一些所谓地高级词汇并不会将我们的生命因此而多姿多彩。上个星期听了”李冉在冥想“的李冉老师,分享的一本书《狂喜之后》,在旅行也好,修行也罢,我们可能会经历那一段极度的狂喜与开心的时候。好像自己整个的心思都是澄澈的,眼里闪着清澈的光。但我们知道,我们并不会因为一次觉悟而发生任何的改变,而是花自开,水自流。照样要与这一个并不美好的现状”周旋久“,但我们要做到的也许是”勿忘我“。不在一场又一场的旅途中慢慢地忘记自己的样子。我想,对开学以来的这半个月做一个总结,告诉我...




