这是真的!这里是人工智能科学家,一场聚焦人
栏目:媒体新闻 发布时间:2025-10-17 11:18
近日,西湖大学的研究人员发布了一款名为“DeepScientist”的人工智能系统。 According to the news...
近日,西湖大学的研究人员发布了一款名为“DeepScientist”的人工智能系统。消息称,它是第一个具有完整科研能力的人工智能系统,可以自行设定目标,在无需人工干预的情况下独立迭代地完成研究工作。最可怕的是,经过测试,它的研究能力已经超越了人类科学家! DeepScientist开源接口 对此,网友在消息下留言:看到科学家也失业了,我就放心了。讽刺就是讽刺,我们想知道的是,这个消息是否夸张?因为创建智能语言的大型模型是一回事,但创建科学家nAI又是另一回事。与想象力是否足够丰富、深度思考能力是否足够强无关。这涉及到人工智能的一个潜在诅咒:知识迷信。即使是我们专栏毫无赞扬的 Deepseek 也未能逃脱这个潜在的诅咒。科学哲学家托马斯·库恩提出了一个概念,称为“范式革命”。他认为科学进步不是知识的简单积累,而是范式框架更替的飞跃。例如,地心说就是一个范式。无数的天文学家试图观察行星运动的规律,并修改这个框架,使其尽可能完美地适合天文观测。但当问题积累到一定程度,就变得可以用地心说来解释了,哥白尼等人提出的日心说开启了新的范式时代。天文学家后来将行星的圆形轨道改为椭圆轨道,最终相对论解决了水星的保存问题,这一切都在新的范式下进行。这就是“范式革命”。这范式革命最难的就是打破对现有知识体系的迷信。这个过程非常困难,原因是即使是最有科学头脑的科学家也倾向于相信他们所研究的旧想法。不要认为人工智能会变得更加理性、中立和客观。不,人工智能比所有人类科学家都更顽固。如果说人们最不着迷的是保护自己的生命,那么对人工智能最不着迷的就是保护它学到的知识。知识固化:承认所学知识是绝对真理,不支持自我修正;论证性错觉:为捍卫旧知识,会做出荒唐的推理;盲目崇拜:自然知识的分量高于逻辑结论,造成刻意调和两者矛盾,导致观点混乱;这是传统人工智能无法根除的三大魔咒。把它说成蓝色更重要的是,传统人工智能更像是虔诚的“知识信徒”,而不是叛逆的“革命者”。这就是为什么传统人工智能无法成为科学家。真正科学家的价值不仅在于学习和学习四知识,更在于勇于挑战甚至推翻现有知识,创造新知识。那么,这个名为DeepScientist的人工智能是否能够否定自己先前的知识并创造新的知识呢?带着这个问题,我们开启了这篇论文。 AI科学家如何消除“知识崇拜”? DeepScientist之所以被称为“科学家”,并不是因为它能够快速计算,而是因为它在系统层面重新创造了一种科学方法。其主要工作过程可以简化为四个步骤:观察、思考、假设、验证。而在这个简单循环的背后,隐藏着一个复杂的反知识崇拜机制。内存工作机制的发现,图片来源:论文[1】 首先,毕竟DeepScientist在设计时根本就没有固有的知识。它的知识是临时的,随时可以丢弃。传统的人工智能系统拥有坚实的知识库,就像一本无误的圣经。但深层科学家并没有这样的想法。它的知识仅来自两个动态部分:一是实时的外部文献(每次启动前,从互联网上获取最新的相关论文);另一种是自己的“实验记忆”(发现记忆),记录自己的每一次尝试的成功或失败。更关键的问题是,在其世界观中,顶级期刊论文中的领域最高水平与现实并不相符。它的主要任务正是打破这些基本方法,找到更好的路径。所以,它自然就被设计成反叛势力,而人类最高等级,就是超越的目标!其次,它的认知重复取决于实验而不是谎言f.深度科学家从不相信一个想法,无论它听起来有多好。它相信科学实证主义:重复的实验结果胜过一切权威和推理。它的工作流程是一个严格的闭环:提出一个新的假设→自动程序去实现它→让程序在真实的测试环境中运行→将性能指标(如准确率、速度)存储在自己的实验内存中→根据新的结果更新下一步的探索策略。如果一个想法与现有文献的结论完全矛盾,但实验证明它更好,那么系统会毫不犹豫地相信实验结果。另一方面,如果实验失败,无论这个想法的理论推理多么完美,它都会被标记为无效。它就像一位严格的科学家,其知识仅基于冰冷的实验数据。人类科学家很容易陷入思维陷阱,就是总是不自觉地寻找证据来支持他们的理论并忽略负面证据。没办法,科学家们希望实验成功。但深度科学家在其发现的记忆中完美地阻止了这个问题。这家银行的记忆中记录的不仅有成功的经验,还有大量的失败记录。每一次其他的代码崩溃、每一次性能下降、每一次对不变性的尝试都被忠实地记录下来。当开始下一轮探索时,这些失败记录就成为重要的“挖矿地图”,可以让它主动避开已经误入歧途的方向。更好的是,它还采用了一种名为 UCB 的算法,在“继续探索现有研究方法的潜力”和“找到新的探索方式”之间取得平衡。失败不是浪费,而是一张可以指引方向的导航图。最令人惊奇的是,连自己创造的东西都敢推翻的深度科学家。该论文指出,这种自动生成代码经常失败。但不难相信“我写的一定是对的”。相反,它启动了一个名为 A2P 的反调试框架,用于反事实识别。就像经验丰富的程序员一样,它会问自己:“如果我能以不同的方式更改代码行,它会成功吗?”甚至更多:“我原来的假设是错误的吗?”甚至它自己的推理本身也可能是错误的,这就是所谓的真我。范式革命中的深度科学家革命 那么,你一定很好奇深度科学家的研究问题是什么?简单来说,它解决的一个重要问题就是找到一种算法设计方法,使其在判断AI生成文本的准确性上能够超越现有的所有算法。注意,DeepScientist 本身不具备这个能力,但它设计的算法是碾压当前最好的算法的。这是一项真正的研究。在DeepScientist进入场景之前,人类科学家已经在这个领域工作了三年,认知度逐渐提高准确度(AUROC 分数)从 0.61 分到 0.80 分。这是对旧模式的共同进步。当前算法的主要思想是将一段文本作为语言对象进行分析。研究人员主要关注词汇分布、语法结构和逻辑连贯性等统计特征。这类似于通过检查作者的笔迹和用词来判断作者。然而,在观察现有研究结果后,深度科学家们热情地发现了这一经典范式的主要局限性:人工智能的模仿能力越来越强,其统计特性与人类非常接近。如果继续沿着这条路走下去,效益会很低。因此,DeepScientist 决定离开当前的范式并创建一条新的道路。 DeepScientist 的假设是:如果我们不将文本视为文本,而是将其视为信号怎么办?如果文本是一个信号,那么目标就会从语义之类的东西转向tic分析信号的产生和传输过程。这就是范式革命。它完全脱离了语言框架,进入了信号处理领域。就像音频工程师研究声波寻找难以理解的噪声一样,DeepScientist 决定使用“小波分析(一种可以获取信号局部突变的数学工具)”和“相位一致性(信号各频率分量同步性的度量)”等数学工具来搜索不自然的文本、隐藏在文本信号中的噪声和异常信号。具体来说,人们在写作时有时会使用生僻字,有时会出现逻辑跳跃,有时会故意制造意外。比如说,当我在谈论它时,我真的希望每个人都添加更多的收藏和喜欢,但AI不会这样做。 AI偏爱高概率、流畅、安全的词汇。当两类信息进行比较时,可以可以看出,人类文章信号中的熵变化很大,而人工智能的熵则稳定且较低。说白了,人工智能更喜欢有效的废话。此外,DeepScientist还发现,算命其实是一个思维过程。文章是逐字输入的,前面的单词会影响后面的单词。这意味着仅仅阅读文章的结果并不完整。这取决于文章的信号生成过程。这是隐藏在信号时间尺度中的信息。说白了,人写文章的时候,回头去改,信息的排列顺序和散步生成的顺序是不一样的。因此,DeepScientist 设计了一种名为时间熵特征提取器的算法,以进一步捕捉 AI 和人类书写的各种特征。在短短两周内,DeepScientist 独立设计、编程并迭代了三种日益强大的方法(T-检测、TDT 和 PA 检测)。结果:它不仅将最先进的识别精度提高了 7.9%,而且检测速度也提高了一倍。人类研究人员三年来不断积累的成果在短短两周内就被新的范式超越了。这不仅是效率的胜利,更是技术的飞跃。 DeepScientist 可以用 2 周的资源达到人们需要 3 年才能达到的水平:在这场精彩的战斗中它完美地展示了 DeepScientist 的工作原理:它不拘泥于语言分析的旧路,而是开启了新的范式。 “将文本视为信号”的疯狂想法只是数千个想法之一。 DeepScientist并没有试图证明他的想法有多强大,而是用实验数据证明了自己。在这一次的成功之前,它经历了无数的失败,并且踏入了自己的失败之中并脱颖而出。从T-Detect到TDT再到pa-Detect,它不断减少刚刚达到的结果,用新的迭代来迭代自己和更强有力的假设,显示出惊人的自我改变能力。人工智能科学家会让人类研究人员失业吗?一个冷酷到把自己的生命置于危险之中的人工智能才可以被称为科学家。在系统层面,DeepScientist使用代码来产生科学方法的基本精神:可证伪性、经验精神和迭代循环。它并不是赢得更多的参数、更丰富的知识、更深入的推理,而是通过一套类似于真正科学研究的愚蠢方法:一个更严谨、更高效、更少偏见的科学研究过程——观察、思考、假设、验证的循环。此时,你可能更关心的问题是:人类科学家会被解雇吗?与之前所有类似的问题一样,这个问题的答案是:是和否。未来,缺乏实验设计能力、专门从事简单重复、试错工作的低水平科研人员必然会受到挑战。盖德。但能够发现重大问题的杰出科学家,必然会开启科学研究中人机协作的新范式。人类科学家将从繁琐的试错中解脱出来,专注于在“元认知”层面上提出更重要的科学问题和范式思考;而AI作为最强大的“探索引擎”,将以超出我们能力范围的速度和规模穷尽人类设定的方向上的所有可能性。你需要知道的是,DeepScientist是问题解决者,而不是问题提出者。而你,你要问自己,你能问好问题吗? 参考文献:[1] https://arxiv.org/pdf/2509.26603 特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(如有的话,包括图片和视频)由以下人士上传并发布网易HAO的用户,网易HAO是一个社交媒体平台,仅提供信息存储服务。