马毅新解智能:DNA为鉴,大模型需减熵 | AIGC.Bar
type
status
date
slug
summary
tags
category
icon
password
网址
在当前人工智能(AI)浪潮席卷全球,大模型(LLM)如雨后春笋般涌现的时代,我们惊叹于机器展现出的强大能力。然而,香港大学计算与数据科学学院院长马毅教授却引导我们进行更深层次的思考:智能的本质究竟是什么?他提出的“DNA是最早的大模型,智能的本质是减熵”的观点,为我们理解AI的发展和未来走向提供了全新的视角。这些深刻的思考,为我们理解当前火热的AI领域,特别是LLM(大模型)的发展,提供了宝贵的视角。更多AI资讯和深度分析,欢迎访问AI门户网站
https://aigc.bar
。智能的起源:DNA——宇宙最早的“大模型”
马毅教授认为,要理解智能,必先回溯其历史。在宇宙的浩瀚背景下,生命是智能最显著的载体。而DNA,作为生命信息的编码者,堪称宇宙间最早的“大模型”。它通过亿万年的进化,不断学习和适应外部世界的规律,将这些“知识”固化在基因序列中,指导生命的繁衍与存续。
这个过程,本质上是一个对抗宇宙熵增的过程。宇宙的自然趋势是无序和混乱(熵增),而智能,从DNA开始,就在不断地从环境中提取信息,形成有序结构,从而在局部实现“减熵”。生命通过学习和适应,将无序的能量和物质转化为有序的生命活动和复杂的生态系统,这正是智能的体现。从这个角度看,无论是古老的DNA,还是如今的chatGPT等先进AI,其核心都在于学习规律、利用规律,以达到某种有序和高效的目标。
当前大模型的“智能”:是真理解还是高级模仿?
面对当下大模型展现出的惊人能力——从流畅对话到复杂编程,甚至进行数学推理——许多人认为AGI(通用人工智能)已曙光初现。但马毅教授对此持谨慎态度。他将逻辑推理能力划分为三个层次:
- 模仿:通过大量数据记忆模式,类似填鸭式学习。
- 理解并严谨运用:真正掌握逻辑方法,能解决新问题。
- 抽象出新规律:如欧几里得建立公理体系,从经验中发现新逻辑。
马毅教授指出,目前的大部分LLM,包括备受瞩目的推理模型,其表现更多停留在第一层次,即高级的模仿。例如,模型可能在训练过的奥数题上表现优异,却在简单的小学数学问题上出错,这表明其并非真正具备严密的逻辑推理能力。所谓的“思维链”(long CoT),也往往需要人工精心设计Prompt(提示词)或通过监督微调(SFT)和强化学习(RL)进行引导生成,并非完全自主的逻辑构建。学术界更关注的是厘清这些方法在系统中具体的作用机制,而非简单追求“炼丹”式的效果。
开源的突破与行业的冷静剂:DeepSeek的启示
对于近期DeepSeek等开源大模型的亮眼表现,马毅教授并不感到意外。他认为,当前大模型在核心技术和方法上并无绝对的护城河,真正的壁垒在于数据、算法优化、试错成本以及在此过程中积累的经验。因此,开源模型凭借其开放性和社区协作的力量,迟早会追赶甚至超越闭源模型。
DeepSeek的成功,在某种程度上像《皇帝的新衣》中的那个孩子,揭示了行业内可能存在的过度包装和炒作。它证明了通过SFT和RL等已知方法,结合优质的基础模型和数据,同样可以达到顶尖水平,并非某些公司掌握了不可告人的“秘密”。正如DeepSeek的例子所揭示的,人工智能的发展路径并非单一,开源社区的力量正在重塑大模型的竞争格局。对于希望深入了解AI新闻和行业动态的读者,
https://aigc.bar
提供了丰富的AI日报和前沿解读。回归本质,展望未来:智能研究的“减熵”之路
马毅教授强调,理解智能的诞生和发展历史,对于指导当前的AI研究至关重要。他本人正致力于探索“白盒大模型”以及能够实现“闭环、反馈、纠错”的机器智能,这代表了对更可解释、更鲁棒、更接近生命智能本质的AI系统的追求。
此外,香港大学面向所有本科新生开设AI通识必修课,由马毅教授亲自讲授智能历史部分,这体现了普及AI认知、培养批判性思维的远见。当AI和大模型日益渗透我们生活的方方面面,理解智能、思考智能,已不再仅仅是研究者和工程师的专利。我们需要更多像马毅教授这样冷静而深刻的声音,引导我们拨开AI产业的迷雾,回归对智能本质的探索。
结论
马毅教授以其深邃的洞察,从DNA的演化到现代大模型的崛起,为我们勾勒出一条智能发展的“减熵”主线。他提醒我们,在为openai、claude等模型的惊人表现欢呼时,更应关注其能力的真实边界和智能的深层机制。无论是学术研究还是产业应用,乃至探讨AI变现的路径,对智能本质的理解都是我们行稳致远的关键。未来AI的发展,或许正需要这种回归本源的思考,才能真正实现从模仿到理解,再到创造的飞跃。欢迎持续关注
https://aigc.bar
,获取最新的AI资讯、Prompt技巧与行业洞察。Loading...