视网膜上的电影工厂_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 心理 • 人文

视网膜上的电影工厂

admin  发表于 2017年12月10日

撰文 弗兰克·韦伯林 (Frank Weblin)

   博通德·罗斯卡(Botond Roska)

翻译 周林文

 

人类有着非同一般的视觉能力,但我们对此早已习以为常,很少会有人会想一想:我们究竟是怎样看见东西的?几十年来,科学家们习惯于把我们的视觉处理系统比作摄像机:眼睛的晶状体把入射光聚焦在视网膜上的一组光感受器上,在这里将光子转化为电信号,然后沿着视神经输送到大脑,在那里接受处理和加工。但在最近的研究中,我们发现这样的比喻还不够贴切。实际上,视网膜会对视觉信息做大量的预处理工作,而后才把一系列尚未完成的影像传输给大脑,以解读这些视觉信息的内容。

这一惊人的结论,是在我们研究了兔子视网膜之后得出的(兔子的视网膜与人类的很相似,我们对火蜥蜴的研究也得出了同样的结论)。视网膜似乎是大脑延伸到外周神经系统的一部分,是大脑直接接触外部世界的窗口。视网膜怎样“制作”出那些传向大脑视觉中心的影像?现实世界如此丰富多彩,这些影像是怎么体现的呢?影像本身是否带有某些含义,可以帮助大脑分析一个场景呢?我们的研究工作将逐步解开视觉之谜,上述问题只不过是冰山一角。

在视网膜深处有一群特殊的神经细胞,它们会将一个视觉画面分割成12条类似于影轨(movie track)的东西,每条影轨都收录了一幅粗略的影像,描绘外界景观的某一个抽象特征。视网膜会不断更新这些影像,并源源不断地传送给大脑。例如,一条影轨的内容是一幅勾勒物体轮廓的“素描画”,另一条影轨携带的信息则与物体的运动方向有关,还有的影轨负责收集光线、阴影等信息,有些影轨传输的信息目前难以归类。

在视神经内,每条影轨都有“专用”神经纤维,它们把影轨传输到大脑的高级视觉中心,在这里进行更加复杂、更加精密的处理和加工。(人类的听觉系统具有相似的结构:每条听神经传送一系列特定的音调,然后由大脑把它们组合起来。)科学家在研究视觉皮层时发现,诸如运动、颜色和形状等特征在皮层上的不同部位进行处理,任何一个部位受损,我们对事物某一特征的认识就会产生缺陷。但是大脑感知到的这些特征,最初都来自视网膜上的影像。

视网膜是怎样“描绘”传给大脑的电脉冲图像的呢?随着研究的不断深入,对于影像是怎样生成的,我们渐渐有了一些头绪,但还不能给出一个完整的模型。大脑要真实地反映视觉世界,需要接受神经细胞投射出的12幅影像,因为这些影像包含了大脑需要的全部信息。不过,我们仍然不知道影像中的信息是如何被整合起来的。这些影像可能只是基本的素材,需要大脑在上面添加内容。

尽管兔子的视网膜上似乎捕捉了一个场景中的所有视觉信息,比如一张餐桌、一个瀑布或一张表情丰富的脸,但好像还是丢失了一些关键的信息——人们对场景的感受、态度,以及关注的焦点,这些东西都没有体现出来。或许,兔子视网膜的功能要远逊于人类的视网膜,它无法呈现人类所能捕捉到的全部图像信息——人类视网膜呈现的“高清晰度”影像包含了情感之类的信息,不过具体的方式还有待研究。

显然,视网膜上的影像形成了一种天然的视觉语言。今天,解读视觉语言有着非常重要的意义:全世界有很多研究团队都在开发人造视觉感受器,希望用它帮助盲人重见光明。科学家的设想是,把感受器放在视神经的前端代替视网膜。这项工作已经取得了些许进展,但效果还不够理想,只能传输一些模糊不清的基本图形。在美国南加州大学的多恩利眼科研究所,人造视觉感受器的人体试验已经展开,韦恩州立大学医学院也即将展开类似的研究。就目前来看,我们离最终目标也许还很遥远,但这一阶段的成功将是一个台阶,站在“台阶”上,科学家们可以开发出足以乱真的人造视觉感受器,能像真正的视网膜一样,为大脑提供活动图像,并将天然的视觉语言融合进去。接下来的挑战便是,如何将每一幅抽象图形与视神经里相应的神经纤维“挂上钩”。

开发出有效的视网膜代替装置,需要详细了解天然的视觉语言,同时,这样做也有助于科学家解开更多的视觉之谜:眼睛和大脑怎样合作,从而得到清晰的图像?错觉怎样蒙骗了我们的眼睛?眼球怎样“追踪”快速移动的物体?电视、电脑或汽车影院的屏幕显示的图像难免有缺憾,我们的眼睛又是怎样弥补这些缺憾的?我们希望,对视网膜预处理能力的研究,是迈向终极目标的坚实一步。

 

视网膜的结构

视网膜的结构不仅复杂而且极其精细,其中包含了多种视觉细胞,正是这些细胞间的“交流与合作”,我们才能看见精彩的世界。

 

视网膜复杂的结构成就了它惊人的能力。早在一个世纪以前,伟大的西班牙解剖学家桑迪亚哥·拉蒙·y·卡哈尔(Santiago Ramón y Cajal)就首次提出了视网膜通路的经典模型。此后,这一模型不仅被各种教科书反复引用,许多科学家还通过艰辛的试验,不断为它补充生理学上的细节。视网膜是透明的(右图①),由一层层的神经元构成(右图②)。离晶状体最远的一层是视锥和视杆细胞,它们吸收入射光线,将光线转换为神经细胞的活动。与视锥和视杆细胞相连的是10种不同的神经细胞——双极细胞(Bipolar Cells),这些神经细胞有一条专门传输信号的“手臂”(轴突,axon),能伸进中央的“内网状层”(Inner Plexiform layer)。网状层看上去又分成了相互平行的10层。每种双极细胞的轴突只向其中的少数几层传输信号。

在网状层的最内侧(右图③),有12种不同的神经节细胞(紫色)。大多数种类的神经节细胞的手指(树突,dendrite)会伸进不同的细胞层,在那里接收来自双极细胞(绿色)的兴奋性信号。神经节细胞输出的影像,由视神经传送到大脑的不同区域进行分析。有些神经节树突的分支会广泛延伸,到处散播信息,还有些分支只会在小范围内延伸,传送高分辨率的信息;有些会对双极细胞释放神经递质(信号分子)的频率增高作出反应,而有些则会对这一频率的降低作出反应。

不过,双极细胞传送给每一层神经节细胞的信息,都不足以拼凑成12幅影像。双极细胞发出的信号受到多种小型神经细胞——无长突细胞(灰色)的调控。一些无长突细胞在一个细胞层内起横向作用,阻止该层中相隔较远的双极细胞进行信息交流。另一些无长突细胞在细胞层之间,纵向抑制信息交流,这样就避免了不同影像的相互干扰,使每一层细胞专注于自己的任务,以免发生交叉记录信息的情况。采用这种方式,无长突细胞收集和释放信号来协调不同的影轨。德国法兰克福马普大脑研究所的海因茨·瓦斯勒(Heinz Wassle)、海德堡马普医学研究所的托马斯·尤勒(Thomas Euler),以及美国马萨诸塞州综合医院的理查德·马斯兰(Richard Masland)已经找出了至少27种不同的无长突细胞(他们还找到了10种双极细胞和12种神经节细胞)。

我们看到的每一样东西,都随着时间的推移而被视觉系统记录下来。即使是三维空间里的一个静止不动的黑点,也会在我们的视网膜里形成一部“电影”,因为视网膜在连续地观察这个黑点。视网膜上有多种神经节细胞,每种都传输着不同的影像。但和电影院里的不同,神经节细胞里的影像不是一帧一帧地拍出来的,而是连续的信号流。

双极细胞和无长突细胞之间的交流,会同时被各组神经节细胞记录下来,拼凑成解读视觉世界的的数据。当我们阅读、找东西、辨认人面孔和四处走动时,不同的影像组合是大脑唯一能获得的视觉信息。他们形成了基本的“视觉语言”,这种语言有独特的词汇和语法,其中蕴含着神经系统用于解读视觉图像的词汇系统。

 

一束光线引发的反应

科学家希望利用光束实验观察视网膜上神经细胞的电活动。他们用一束正方形光线照射视网膜,结果,被光线照射到的以及一些没有被照射到的细胞都作出了反应,而且反应时间和反应方式都不一样,这是什么原因呢?

 

视网膜有着复杂的功能活动,而我们对这些活动的描述是以实验为基础的。我们可以用一个细小的中空玻璃针头,窥探单个神经节细胞内部的运作过程。利用微小的针头,我们向神经节细胞注射了黄色染料。染料进入某个细胞后,会迅即扩散至该细胞的所有树突,于是我们就可以看到这些树突延伸到了哪些细胞层。同时,细针头还可以作为电极来记录细胞的电活动,其中既有来自双极细胞的兴奋性信号,又有来自长突细胞的抑制性信号。

神经节细胞传输给视神经的影像是什么样子的?为了有一个直观的感受,我们先从简单的试验开始:首先,当一束方形光线射到兔子的视网膜上时(下视网膜上的电影工厂 (1).png图①),线性排列的神经节细胞有什么样的反应?这是一束边长为600微米的正方形光线,落在了视网膜上一个的特定区域,持续照射了几秒钟的时间。

在这段时间里,我们依次记录了12种神经节细胞接收到的兴奋性和抑制性信号。每一种细胞都有独特的反应模式,反应的强度也各不相同。在下面的方格中(下图②),一个方格代表一秒钟,颜色代表的则是一种细胞中信号电流的强度。

有趣的是,在图上所示的这类神经节细胞中,虽然被光线照到的细胞都有反应,但它们的活动并没有贯穿整个光照过程。而当光照结束后,照射区域之外的一些细胞开始活跃起来。在图片中,这表现为在1秒钟之后产生的两个斑块(蓝色)。在时间坐标为两秒左右,被光照到的区域又出现了微弱活动的迹象,在图上显示出了第3块活动区域。

我们该怎样解释这个现象?如果在整整一秒内,所有细胞都在输出信号,那么整个过程都应该显示出活跃的图形,填满图中相应的方格(下图③)。而实际上,信号输出被过滤了;光线照射到的区域都发生了反应,但在时间上却很短,大约只持续了十分之一秒,并且是在光照开始之后的十分之一秒才开始起反应。神经节细胞的反应不仅稍微有些滞后,而且它们的反应时间显然只是在记录入射光线由弱变强的刻化情况。或许这种神经节细胞只负责记录光照的开始,而不是整个光照过程。那两个在光照结束后出现的斑块,也许只是传达某种“关闭”信号。在两秒区出现的第3个蓝色斑块代表了什么信号我们还不清楚。

12种神经节细胞中的每一种都会输出一个独特的信号,反映视觉世界的一个方面。不过在这个输出信号中,既有来自于双极细胞的兴奋性信号,也夹杂着无长突细胞的抑制性信号。两种信号相互综合、抵消之后才能形成最终的输出信号。下面的方格图④、⑤、⑥表示了另一类神经节细胞(与前面所讲的不是同一种细胞)接收两种输入信号后,产生输出信号的过程。

就这样,每种神经节细胞都会沿着视神经,给大脑发送一幅时空影像,每一幅影像都是一对兴奋性和抑制性信号相互综合的独特产物(右图⑦)。12种神经节细胞会随着时间推移,连续为大脑发送12幅这样的影像(为了便于掌控实验过程,我们只记录了其中的7幅)。一束简单的方形光线却引发了不可思议的复杂反应。

 

眼睛的“滤镜”

在视网膜上,每种神经节细胞都像是一个滤镜,每种“滤镜”都对一个特定的面部特征和动作非常敏感;每种神经节细胞都有自己独特的解读这个世界的方式。

 视网膜上的电影工厂 (2).png

当然,我们的目标是要知道一组神经节细胞怎样从视觉世界中提取有意义的信息。因为视网膜习惯处理的信息,远比一道光束有趣得多、复杂得多。我们很想知道,当一个自然场景跃入眼帘的时候,比如看到一个正在说话的人,视网膜会作何反应?那12幅影像分别会是什么样的?是不是每一幅影像都只提取特定的信息,彼此的功能互不重叠呢?

观测视网膜处理方形光束的实验过程尽管看上去简单明了,但是要在活兔子的视网膜上放置多根电极,来记录神经节细胞在一秒钟内的活动是极其困难的,更不用说持续时间更长、情况更加复杂的自然场景了。在随后的工作中,我们把来自光束实验的数据输入到一台计算机中,模拟著名的人工视网膜芯片——“细胞神经网络”(Cellular Neural Network),这是由美国加利福尼亚大学伯克利分校的蔡少堂(Leon Chua)和布达佩斯匈牙利国家科学院的塔马斯·罗斯卡(Tamás Roska)研制出来的(塔马斯是本文作者罗斯卡的父亲)。在计算机系统中,方形光束被转化为12幅由兴奋性和抑制性信号构成的时空图片,和真正视网膜中所产生的影像十分相似。

得到的结果让我们备受鼓舞。我们让韦伯林坐在相机前,说一分钟的话,再把这个自然场景输给编好程序的视网膜芯片。匈牙利布达佩斯技术经济大学的戴维·巴尔亚(David Balya)专门为这个实验编写的模拟器,随即产生了7种神经节细胞的影像数据(左图①)。

为了证明芯片的模拟是准确的,我们还让活兔子看一张说话人的脸孔,检测视网膜上一些神经元的反应。我们很快就发现,每种神经节细胞都像是一个滤镜,从外界场景中提取一个特定的时空图像,并将这些信息编排成独特的电影传送给大脑。我们给计算机产生的图像赋予了不同的颜色,以便将它们区分开来。

例如,一个“滤镜”(橙色)只提取一张面孔的轮廓线条,以素描的形式再现这一场面。而另一个“滤镜”(紫色)着重提取眼睛和鼻子下的阴影。第3个“滤镜”(浅褐色)提取的则是强光区域,而不是阴影或轮廓。当然,对于这12种“滤镜”各自提取哪一类信息,我们得出的结论未必正确。遗憾的是,我们不能把实验中记录下来的图像打印出来,因为这些都是连续的动态影像,就像电影一样。

我们的实验证明,每种神经节细胞都对一个特定的面部特征和动作非常敏感,都能用独特的方式解读这个世界。人们能看到这个精彩的世界,12种神经节细胞居功至伟。但是,每一种细胞到底做了哪些贡献呢?给神经节细胞产生的每一种图像都标上颜色,也许有助于我们解决这个问题。我们把7个图像信息组合成一部精彩的“电影”。在韦伯林说话时,不同时刻的4帧画面(左图②)再现了当时的情景:嘴唇如何一张一合,脸的朝向怎样变化等。有些图像时隐时现,让他看起来有些像幽灵。这就是视网膜产生的、大脑所接收的图像。

我们的“电影”只能大致模拟视网膜产生的图像。不过,这些电影让我们清楚地知道,在人类眼球的后面,那层薄得像纸一样的神经组织在传出信号之前,已经把外界景观分解成12个不同的组分了。这些组分相互独立,被完整地传送到不同的大脑视觉区域,一些区域会产生知觉,一些则不会。神经科学面临的挑战,就是了解大脑怎样解读这些信息包,如何产生美妙、流畅、完整的视觉图像以再现视觉世界。


全部评论

你的评论