大脑独处时在思考什么?揭秘无监督学习的“自学秘籍”
日期:2025-10-14 14:35:30 / 人气:3

当婴儿凝视旋转的风铃时,他或她的大脑便在悄然破解光影变化的规律。无需奖励或惩罚,这种对世界的理解就已在神经回路中生根发芽——这正是“无监督学习”的生动体现。反观当下最先进的人工智能,要区分“猫”和“狗”的图片,也需要在大量标注数据的“喂养”下才能实现,这种需要引导的学习方式则被称为“有监督学习”。
在神经科学里,有监督学习表现为外部奖惩引导的神经连接强化(如条件反射),而无监督学习是大脑自主提取环境特征(如自发形成对线条、颜色等视觉特征的有序响应)。在机器学习领域,有监督学习是从带标签数据训练预测模型(如分类),无监督学习则是从无标签数据挖掘规律(如聚类)。两种学习方式的核心差异在于:有监督学习依赖外部的明确指引,而无监督学习源于系统内部的自主探索与规律发现。传统观点认为学习需依赖奖励信号或明确反馈,但婴儿大脑的惊人能力正促使神经科学界重新审视这一认知。那么,生物大脑的无监督学习能力到底从何而来?
一、无监督学习:大脑的“预习课”
无监督学习能力并非人类独有。美国霍华德·休斯医学研究所(HHMI)的科学家Marius Pachitariu和Carsen Stringer领导的团队,通过小鼠实验探究了这一机制。他们将小鼠置于可控的虚拟现实(VR)走廊中,墙壁循环播放圆圈、树叶、石头、砖块四种视觉纹理图像,设置两组学习路径对比:
- 无监督学习组:小鼠预先在无奖励情况下自由探索视觉纹理,再进入任务学习训练;
- 任务学习组:小鼠直接进入奖励训练,学习将特定纹理与奖励关联。
研究人员用双光子介观显微镜对小鼠视觉皮层成像,记录九万个神经元活动。结果发现,任务组小鼠2周训练后,内侧高级视觉区HVA的神经元对奖励相关纹理产生强烈选择性响应;而无监督学习组相同脑区也出现几乎一致的神经可塑性变化。这意味着,无需任务反馈或监督,小鼠视觉皮层能主动对环境视觉信息分类、编码,形成高效神经表征,如同大脑在正式“课程”前先做了“预习”,为后续学习搭建好“知识框架”。
进一步研究显示,监督学习并非毫无作用。通过RasterMap分析发现,前侧HVA区域的神经元簇在奖励时出现强烈抑制,具有预测奖励信号的作用。这揭示了大脑学习的分工:无监督暴露在内侧视觉区构建刺激表征,任务学习依赖前侧脑区的监督信号(关联刺激与奖励),类似学生自学后老师指出重点,二者结合实现高效学习。
为区分神经元响应是对空间位置敏感(空间可塑性)还是视觉特征敏感(视觉可塑性),研究人员引入含相似视觉特征但空间配置不同的新刺激。结果显示,小鼠忽略纹理空间位置,仅对纹理类别产生响应,与人类“无论猫在左或右都能认出”的能力一致,证明视觉可塑性假说更能解释其行为。
二、从预习到强化:大脑的高效学习模式
大脑中无监督学习与有监督学习如何协同?研究团队假设无监督预训练能加速后续任务学习。实验让新小鼠群经历10天无奖励预训练,再进入5天奖励任务训练。结果显示,经自然纹理预训练的小鼠在任务第一天就展现出明显区分能力,而无预训练组仍随机反应;接受光栅预训练的组别学习曲线与无预训练组重合,说明学习加速依赖特定视觉特征。
这种“无监督预习+监督强化”模式与人类学习规律高度吻合——如走进陌生城市时默默记住地标(无监督),后续用导航时能更快理解路线。此外,先前研究揭示海马体神经元活动模式随学习分化,初期对相似虚拟走廊反应相似,后期形成独特神经活动模式,构建“认知地图”。视觉皮层不同区域分工明确:无结构化探索依赖无监督学习,目标导向学习依赖有监督学习,双轨制学习是生物适应复杂环境的核心密码。
三、科学意义与跨学科启示
视觉皮层无监督学习的发现,刷新了对大脑功能的认知,也为神经科学与人工智能架起桥梁。传统“强化学习”理论认为学习需奖励信号强化神经连接,但该研究证明视觉皮层特征提取可在无奖励下完成——内侧HVA区域神经元通过统计纹理出现概率,形成稳定类别表征,打破“无奖励无学习”的框架。婴儿快速掌握语言、识别面孔,可能正是得益于这种预装的无监督学习模块。
这一机制与AI领域突破呼应:2018年BERT模型通过无监督预训练(掩码语言建模)革新自然语言处理,与视觉皮层自主提取纹理特征过程相似。神经科学发现为AI无监督学习提供生物合理性验证,“内侧HVA优先编码抽象特征”规律可启发设计更高效的特征提取网络;AI的“预测编码”理论(如自编码器)也反过来解释神经可塑性——视觉皮层神经元可能通过预测视觉输入、修正误差实现无监督学习。
这些发现具有实际应用价值:医学领域可设计特定视觉刺激方案,强化自闭症患者内侧HVA的自主学习能力,帮助其理解复杂视觉信号;计算机领域模仿“无监督预习+监督微调”模式,可降低AI对标注数据的依赖,如让自动驾驶系统先在虚拟环境自主学习路况(无监督),再通过少量人类标注优化决策(监督),减少训练成本。
四、有待解决的科学谜题
- 神经可塑性的分子基础?虽证实无奖励刺激下小鼠视觉皮层可产生神经可塑性变化,但具体神经环路机制不清,如哪些突触可塑性规则主导无监督学习,是否依赖特定神经调质。
- 跨物种与高阶认知的普适性如何?研究聚焦小鼠部分脑区,人类感知学习涉及更复杂皮层,内侧HVA的视觉优先编码规则是否适用于灵长类颞下皮层?无监督预训练能否加速抽象概念学习?
- 无监督学习能力的年龄限制?发育期感觉暴露依赖关键期可塑性,成年小鼠的无监督学习是否有敏感期?婴儿期是视觉无监督学习黄金期,如何延缓其随年龄增长的衰退?
五、大脑“自学能力”的深层启示
深夜研读文献时浮现的童年记忆、会议室中落在绿植上的目光——这些“走神”瞬间,或许正是大脑无意识探索、提取规律的无监督学习体现。从进化视角看,无监督学习是生物的“生存智慧”,在原始环境中无需等待奖励信号就能识别天敌或食物,是适应复杂环境的前提。
反观现代社会,我们过度依赖“奖励驱动”学习模式(如幼儿贴纸奖励、成人绩效考评),可能抑制大脑自主学习能力,如同依赖导航削弱空间记忆。对AI而言,模仿生物无监督学习范式是突破当前困境的关键——当AI能像婴儿一样自主探索世界规律,“好奇心”不再依赖人类设计的奖励函数,或许才能实现“通用人工智能”的梦想。
从旋转的风铃到复杂的城市街道,从视觉皮层的神经元到AI的深度网络,无监督学习的故事告诉我们:真正的学习,源于对世界本身的好奇与探索,这是生物进化赋予我们的最珍贵的“自学秘籍”。
参考文献:
1. Stringer,Carsen,et al.""Rastermap:a discovery method for neural population recordings."" Nature Neuroscience 28.1(2025):201-212.
2. Wen,John H.,et al.""One-shot entorhinal maps enable flexible navigation in novel environments."" Nature 635.8040(2024):943-950.
3. 02/12/25|Mapmaking in the mind:new research details how the brain builds mental maps of the world,https://www.janelia.org/
4. Zhong,Lin,et al.""Unsupervised pretraining in biological neural networks."" Nature(2025):1-8.
5. 06/23/25|Zoning out could be beneficial—and may actually help us learn faster,https://www.janelia.org/
作者:意昂体育
新闻资讯 News
- 资本下乡与农民进城:中国村庄社...10-14
- 国庆堵车众生相:当"逆行自由"成...10-14
- 大脑独处时在思考什么?揭秘无监...10-14
- AI时代的教育重构:从“固定赛道...10-14