今天有幸，能够聆听一场院士的分享

图灵测试与大语言模型

——关于通用人工智能的几点思考

最近这半年，AI发展实际上太快了。人工智能，铺天盖地。很多过去认为必须人来做的事情，都在被AI代替。最近发生的战争，人工智能已经完全改变了战争的形态。

源起，1956年的达特茅斯会议。

香农，信息论
造了一个这样的词汇artificial intelligence

图灵：

计算机科学之父，人工智能之父
数学家，逻辑学家
论可计算数及其判定问题上的应用，1936
计算机器与智能，1950年，computing machinery and intelligence
图灵测试：机器能思考吗？

人工智能（AI），不如机器智能（MI）更加恰当。

他一生中发表的文章不超过十篇

通用图灵机，1936

离散有限状态机，到目前为止，这是对计算机最通俗直观的模型

computing machinery and intelligence

1950年，图灵
问题的提出，机器能思考吗
“机器”：数字计算机，通用图灵机，离散有限状态机
“思考”是一个无法准确定义的模糊概念，因而讨论能否并没有意义

模仿游戏

根据C，A男生，B是女生要努力帮助C做出正确的判断，就是男生要模仿女生。可重复，可度量的一个过程。
然后把A变成一个图灵机。

双盲对比，双盲比较。连花清瘟胶囊，哪个有用。
分给A,B隔离，看看双方的回复，分别有多少。

图灵猜想的是，人的思考能力可以用欺骗，忽悠水平来表征。所以才能用图灵测试，这是一个很大的前提。

数学家是如何论证的

他举了九个方面，用反证法来证明

宗教，灵魂和思考是上帝赋予的，动物和机器没有灵魂，但是很多动物实际上是有类似于人类的很多情感的。他们真的是会去思考的，他们是拥有情感的，人不是上帝的独宠的
会思考的机器太可怕了，但愿机器都不会思考。但是人类不一定比其他造物都要高出一筹
根据数理逻辑理论，离散状态机的能力是有限的。总存在某些问题，要么机器无法回答，要么机器回答错误。没有任何证据表明人类不受到这个的限制
意识和自我意志。确认机器是否思考的唯一方法就是成为机器并且认为自己正在产生思考。具备思考和没有意识一点不矛盾。而如果你试图去找意识，你就会陷入一个悖论。思考与意识
机器的能力不能学习，however，现在不会有这个说法了。幻觉，reward hacking，七十年前。图灵说大模型不会犯运行错，但是逻辑会犯错
机器没有创新性，它的运行逻辑是固定的。只要有足够的存储容量和计算能力，通过在机器中建立一种“条件反射”的自学习机制，类似RL，创造一种独立思考。可以通过建立机制来解决。
生物，模拟的信号是生物，机器离散的。但是在模仿游戏中，没有什么差别，也可以用随机性制造出与连续机类似的效果
人的行为具有随意性，但是人的行为有着一定的规律性。足够的观察，基于大数据的深度学习DL。
超灵性，超越感知，这些才是机器不能实现的。如果这些真的存在，那么所有的科学都要被颠覆了。科学规律的修修补补就可能无能为力了。

意识的几个要素：

存储能力
处理能力
与其他部分存在清晰的独立性
有意识的系统不能由独立的若干部分组成
信息整合度，产生意识需要有一些条件

四种快乐激素

多巴胺，我想要
内啡肽，我很爽
催产素，我爱你
血清素，我很棒

没有那么牢固，一点化学药品，吸个毒，就变成另外一个人了。

冰山模型显意识，前意识，无意识。本我：快乐，本能，无意识。自我：显意识+前意识。超我：前意识+无意识。

所以本我的快乐是算法制造不出来的。

图灵测试解读

图灵猜想：人的思考能力与欺骗、忽悠水平密切相关，语言是人类的核心特征。语言是核心特征。
现在的人，只来源与偶然的一个基因突变。10万年前，在东非大裂谷的智人FOXP2基因偶然发生了一个微小的突变。突然具备了虚构事物的能力，来开了智能和其他种族的人之间的差异。

线粒体DNA测序，这个基因只能从母亲给女儿。十几万年前的一个夏娃。不太情愿承认了。找亚当，也在非洲。我们都是非洲人。亚当和夏娃都是非洲人。人类从非洲走向全世界。

埃及和美索不达米亚可能是很好的古文明，大概率比我们早。我们是三万年左右，非洲过来的人。那时候北京人那种，已经是早就灭绝了的人，和我们几乎没有什么关系。美洲的印第安人和土著人，和我们还是有一点接近的。我们还有着三万年的传承和血统。但也不是我们聪明，而是我们地形。

标志我们民族的特征，还是靠文化。

蚂蚁的阶级一点都不比人的阶级少。

人类简史

虚构的能力有点意思。想象力和创造力成为了人类的主要特征。
熊来了快跑->熊是我们部落的守护神
幻觉去掉了，大预言模型是一种，没有创造力的东西了。
人本来是不咋地的，就是想象力和创造力。

语言

语言是思维的符号。
——亚里士多德
语言的边界就是思想的边界。
——维特根斯坦

我们的大模型是不能引领世界，很大程度上是这样的原因，是本质的技术路线的区别。标志着哲学技术路线的高地。philosophy。
2026年，anthoropic claude mythos也许已经可以认为是可以通过了“图灵测试”。我们甚至可以大胆宣布2026年是通用人工智能（AGI）的元年。

如果机器可以思考，它的思考方式可能比我们更加智能，那我们还会做什么呢？即使我们能让机器一直处在低下的地位，作为一个物种，我们理应感觉到深深的谦卑。千年，万年不遇的大事。

肉体是让精神没有那么无聊《精神之本质》nature of spirit
整个西方哲学的传统就是柏拉图学说的一系列脚注

LLM 大语言模型

LLM正在成为智能社会的底层操作系统。你可以在它上面干任何事情。普京说：谁成为AI领域的领导者，谁就将成为世界的统治者。比尔盖茨说，它的出现不亚于互联网的出现。

ML=DL+RL，最终肯定是纯视觉胜出。因为没有雷达的规则，而是走在知识图谱的赛道上。难道是BC吗，我们的未来会是BC吗。走纯机器学习，还是知识图谱再加上这些东西。

这是因为没有从模型的方面把这个讲透。

RL你要能够定义一个问题，这一类数据是非常稀少的，里面数据很少。

神经网络有几类，一类是CNN这种，靠监督学习，人工标记。取决于标注数据的质量。而今天讲的是生成式人工智能。今天讲的都是transformer。他们都是有一个特征，没有标准答案，你不同意他就是一个幻觉。

好比你在问“中国打巴西3：0，谁进的球。
现在大预言模型做了非常多的努力

transformer的基本原理：注意力，人的历史，博古观今
transformer for vision：2021
software abstractions for distributed ML 2018
thingKing longer，2022 google

AI比我们有逻辑多了，写的文章生动，就是一个概率论的问题，next token prediction。把全世界所有的知识给压缩进来，大模型的训练本质是一个压缩的问题。post training，后训练。

deepseek：GRPO，准确度比起RPO差一点，但是复杂度快了很多。md：人格与规则，核心；json，系统配置；数据库与日志，有了存储；代码与脚本。

AI for science。我用AI，一天发一篇文章。AI在颠覆我们的一切。

康德的一些哲学，二律倍反，也不是一点够不着广义相对论。爱因斯坦深受康德的指导

什么人不会被代替

提问即观点，问题即答案。
审美见层次，品味定取舍。

到我的博士的时候，我也应该要被AI给代替了。

核心是音乐与体育的熏陶，很开心吧，我不是一个reward hacking的model，我经历了很多的pretrain，所以我会是一个很好的model。

一定要学的

哲学
数学
物理学
神经科学
计算机科学
计算机系统与架构之类的知识
机器学习
CNN,RNN,RESNET,TRANSFORMER,RL,AGENT

我的想法

人类的语言。
可能是没规律的，因为我们讲很多东西没有意义。
但是语言是有内在的规律，虽然比较稀疏。

transformer也是比较引起争议的。
杨立昆，他一直觉得，transformer不是最好的这个模型。
但杨立昆的离去，无疑标志着Meta AI那个充满理想主义的学术时代正式落幕。
transformer会是人类最后的一个模型吗。

难道我们的未来，是behavior cloning。

透过现象看本质，就是本体论
贩卖知识是最不值钱的。

大模型就是一个压缩的过程，我应该去学一下香农的信息论，数学上，三层以上的函数可以去拟合任何的函数。

我也要去看书，去读书，去整理自己的思维，去创造自己的世界

16：记录一次院士讲座