寄托天下 寄托天下
查看: 14840|回复: 7
打印 上一主题 下一主题

[生物医学] Life science 几个领域介绍 [复制链接]

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
楼主
发表于 2004-7-25 10:20:23 |只看该作者

Life science 几个领域介绍(偶的收藏)

加个索引:
No. 1 生物信息学 by 陈润生
No. 2 人类脑计划
No. 3 蛋白质折叠 by 王志珍
No. 4 新世纪中推动生物科学发展的"Bio-X" by 张志鸿
No. 5 后基因组时代的交叉科学:从“Bio-X”到“X Biology”by 吴家睿
No. 6 生命科学发展战略
No. 7 概率革命 by 王幼军




No.1      生物信息学

    什么是生物信息学

    生物信息学( B ioinformatics)是一门新兴的交叉学科。很多人会认为:生物信息学既涉及生物又涉及物理,一定是一个内容十分广泛的学科领域。其实它的内涵十分具体,范围非常明确。生物信息学是伴随基因组研究而产生的,因此它的研究内容就紧随着基因组研究而发展。

    广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。

    具体地说,生物信息学是把基因组 D NA序列信息分析作为源头,找到基因组序列中代表蛋白质和 R NA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在 D NA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。

    生物信息学还利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。

    基因组信息学、蛋白质的结构计算与模拟以及药物设计,这三者紧密地围绕着遗传信息传递的中心法则,因而必然有机地连接在一起。

    为什么基因组研究需要依赖生物信息学呢?首先伴随着基因组研究,相关信息出现了爆炸性增长,迫切需要对海量生物信息进行处理。自1995年科学家破译了全长为180万核苷酸的嗜血流感杆菌基因组以来,到目前已有大约60个微生物和若干真核生物,如:酵母、线虫、果蝇、拟南芥的完整基因组完成测序。至2001年的春天,科学家又公布了人类基因组的绝大部分序列,即:人类基因组的工作草图。这些成就意味着基因组的研究将全面进入信息提取和数据分析的崭新阶段。根据国际数据库的统计,1999年12月DNA碱基数目为30亿,2000年4月DNA碱基数目是60亿,现在这一数目已达140亿,大约每14个月翻一番。同时,电子计算机芯片对于数字处理能力的增长也相当于每18个月翻一番。因此,计算机能够有效地管理和运行海量数据。

    但是,更为本质的原因是基因组数据的复杂性。所谓某种生物的基因组就是指该生物所有遗传物质的总和。生物的遗传物质是一类称为脱氧核糖核酸(DNA)的生物大分子,它是由4种核苷酸串接起来组成的,通常用字符 A、 T、 G、 C代表。通俗地说,生物的遗传密码就是这4个字符连接起来的线状长链。这种链往往很长,比如:人的遗传密码就含有32亿个字符,将它们堆起来就构成了一部100多万页、每页有3000字符的“天书”。这本“天书”包含了人体的结构和功能以及生命活动过程的大量信息,却仅仅由4个字符组成,既无词法,又无句法,还没有标点符号,看起来每一页都是相似的。如何读懂它是个极大的难题。基因组研究最终是要把生物学问题转化成对数字符号的处理问题。要解决这样的问题就必须发展新的分析理论、方法、技术、工具,就必须依赖计算机的信息处理。

    从事生物信息学研究应具备多方面的科学基础。首先,它需要一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统;同时,生物信息学需要强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展。最后,它要与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。因此,从事生物信息学研究的人员也必须具备多学科交叉的知识。

    我国生物信息学的研究和应用有一定的基础,因而有望取得突破性成果,这对于增强我国在基础研究领域的实力,在某些方面占据国际领先地位是十分重要的。生物信息学成果的应用也会产生巨大的社会效益和经济效益。

    当前主要研究内容

    一.获取人和各种生物的完整基因组

    基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码有32亿个碱基,而现在的 D NA测序仪每个反应只能读取几百到上千个碱基。也就是说,要得到人的全部遗传密码首先要把人的基因组打碎,测完一个个小段的序列后再把它们重新拼接起来。

    但是,我们很容易想象:如果把一本书撕成大小一样的碎片,就再也无法把它们重新正确地拼接起来,这是因为撕的同时丢失了书的上下文联系。这该如何办呢?我们可以取两本一样的书,按照不同的撕法把它们分头打碎。通过不同碎片互相参照,找到相同的单词,就可以部分恢复书的上下文联系。撕的书越多,恢复的上下文联系也越多。因此要获得人的整套遗传密码就不能把人的32亿碱基只测一遍,往往要测很多遍。比如,今年初在《自然》、《科学》两杂志上公布的人类基因组工作草图报道,它含有约29亿碱基,其物理图谱覆盖率为96%,序列覆盖率为94%。有大于90%的连续序列群已大于10万碱基;有约25%的连续序列群已等于或大于千万碱基。在这些序列中发现了3-4万个编码蛋白质的基因。得到这样的图就是相当于把人类基因组测了大约5遍才实现的。要作到这一点就需要把几千万个小片段通过比对再连接起来,这就是常说的基因组序列数据的拼接和组装。

    在基因组大规模测序的每一个环节都与信息分析紧密相关。从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接、填补序列间隙,到重复序列标识、读框预测和基因标注,每一步都是紧密依赖生物信息学的软件和数据库的。其中,序列拼接和填补序列间隙是最为关键的首要难题。其困难不仅来自它巨大的海量数据,而且在于它含有高度重复的序列。为此,这一过程特别需要把实验设计和信息分析时刻联系在一起。另一方面,必须按照不同步骤的要求,发展适当的算法及相应的软件,以应对各种复杂的问题。国际上很多著名的基因组研究中心,都有自己的拼接和组装策略,并且这样的工作都是在超级计算机上完成的。

    有了完整基因组,人类对自身的认识就更为细致、更为精确。比如:发现在我们的基因组中真正编码蛋白质(称为外显子)等的部分很少,只占1.1%;外显子与外显子之间的区域(称为内含子)占了24%;而基因与基因之间的间隔序列却占了75%,也就是说在人类基因组中不编码蛋白质的区域占了绝大部分。发现人类编码蛋白的基因较之其它生物体的基因更为复杂,有更为丰富的剪接方式。发现基因组中片段重复现象很普遍,这反映了人类复杂的进化历史。发现人的第13号染色体比较稳定,而男性的第12号染色体和女性的第16号染色体是易变的,等等。

    二.发现新基因和新的单核苷酸多态性

    发现新基因是当前国际上基因组研究的热点,使用生物信息学的方法是发现新基因的重要手段。比如:啤酒酵母完整基因组所包含的约6000个基因,大约60%是通过信息分析得到的。(1)基因的电脑克隆

    利用 E ST数据库发现新基因也被称为基因的电脑克隆。 E ST序列是基因表达的短 c DNA序列,它们携带着完整基因的某些片段的信息。到2001年10月,GenBank的EST数据库中人类 E ST序列已超过380万条,它大约覆盖了人类基因的90%以上。

    我国早在1996年就开始了通过电脑克隆寻找新基因的研究。它的原理非常简单,就是找到属于同一基因的所有 E ST片段,再把它们连接起来。由于 E ST序列是全世界很多实验室随机产生的,所以属于同一基因的很多 E ST序列间必然有大量重复小片段,利用这些小片段作为标志就可以把不同的 E ST连起来,直到发现了它们的全长,这样我们就可以说通过电脑克隆找到了一个基因。如果这个基因以前未曾发现过,那我们就找到了一个新基因。但是进行电脑克隆程序设计是复杂的,计算量是巨大的。

    (2)从基因组 D NA序列中预测新基因

    从基因组序列预测新基因,本质上是把基因组上编码蛋白质的区域和非编码蛋白质的区域区分开来。对于理论方法来讲就是要找到在编码区和非编码区哪些数学、物理学特征是不一样的。将这些序列与已知基因数据库进行比较,就可以发现新的基因了。

    发现了新基因就会使我们对生命活动的认识加深一步。据1999年12月2日《自然》杂志,人的第22号染色体数据已鉴定出679个基因,其中55%的基因是未知的。有35种疾病与该染色体突变相关,像免疫系统疾病、先天性心脏病和精神分裂症。但是,要将人类的所有基因及其相应的蛋白质以及与它们相关的功能完整而正确地整合到一个索引中,依然是一个十分重要、十分艰巨的任务。国际人类基因组协作组正着手建立完整的“整合基因索引”及与之相关的“整合蛋白索引”。

    (3)发现单核苷酸多态( S NP)

    有的人吸烟喝酒却长寿,也有人自幼就病痛缠身;同一种治疗肿瘤的药物对一些人非常有效,对另一些人则完全无效。这是为什么?答案是他们基因组中存在的差异。这种差异很多表现为单个碱基上的变异,也就是单核苷酸的多态性( S NP)。

    现在普遍认为 S NP研究是人类基因组计划走向应用的重要步骤。这主要是因为 S NP将提供一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。 S NP在基因组中分布相当广泛,近来的研究表明在人类基因组中每300碱基对就出现一次。大量存在的 S NP位点,使人们有机会发现与各种疾病,包括肿瘤相关的基因组突变;从实验操作来看,通过 S NP发现疾病相关基因突变要比通过家系来得容易;有些 S NP并不直接导致疾病基因的表达,但由于它与某些疾病基因相邻,而成为重要的标记。 S NP在基础研究中也发挥了巨大的作用,近年来对 Y染色体 S NP的分析,使得在人类进化、人类种群的演化和迁徙领域取得了一系列重要成果。

    三.基因组中非编码蛋白质

    区域的结构与功能研究

    近年来的研究表明,在细菌这样的微生物中,非编码蛋白质的区域只占整个基因组序列的10%到20%。随着生物的进化,非编码区越来越多,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分。这表明:这些非编码序列必定具有重要的生物功能。普遍的认识是,它们与基因的表达调控有关。

    对人类基因组来说,迄今为止,人们真正掌握规律的只有 D NA上的编码蛋白质的区域(基因),最新资料说明这部分序列只占基因组的1.1%。仅占人类基因组1.1%的编码区的相关研究已经缔造了数十名诺贝尔奖获得者,98%非编码区蕴含的成果数量将是十分可观的,因此寻找这些区域的编码特征、信息调节与表达规律是未来相当长时间内的热点课题,是取得重要成果的源泉。

    四.在基因组水平研究生物进化

    近几年来,随着基因组序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈。首先发现同一种群基于不同分子序列所重构出的进化树可能不同。同时,对“垂直进化”和“水平演化”之间关系的讨论正逐渐引起人们的重视。也就是近年来发现了基因的“横向迁移现象”。即:基因可以在同时存在的种群间迁移,其结果虽可导致序列差异,但这种差异与进化无关。甚至,对人类基因组的分析发现,有几十个人的基因只与细菌基因相似,而在果蝇、线虫中都不存在。如果以人的这些基因序列来研究进化将会得到荒谬的结论。所以在当前的分子进化研究中必须选择垂直进化的分子作为样本。特别是:在分子进化分析中,“相似性”和“同源性”是两个不同的概念。相似性只反映两者类似,并不包含任何与进化相关的暗示。同源性则是与共同祖先相关的相似性。

    五.完整基因组的比较研究

    在后基因组时代,完整基因组数据越来越多,有了这些资料人们就能对若干重大生物学问题进行分析研究,如:生命是从哪里起源的?生命是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物体至少需要多少基因?这些基因是如何使生物体活起来的?等等。这些重大的问题只有在基因组水平上才能回答。举例来说,鼠和人的基因组大小相似,都含有约30亿碱基对,基因的数目也类似,且大部同源。可是鼠和人差异却如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为0.1%;人猿间差别约为1%。但他们表型间的差异十分显著。因此,这种差异不仅应从基因、 D NA序列找原因,也应考虑到整个基因组、考虑染色体组织上的差异。这一工作开创了比较基因组学。

    科学家们发现:全部基因可以按照功能和系统发生分为若干类,其中包括与复制、转录、翻译、分子伴娘、能量产生、离子转运、各种代谢相关的基因。这一工作也为蛋白质分类提供了新的途径。同时,科学家们通过几个完整基因组的比较,统计出维持生命活动所需要的最少基因的个数为250个左右。同样,当我们比较鼠和人的基因组就会发现,尽管两者基因组大小和基因数目类似,但基因组的组织却差别很大。例如存在于鼠1号染色体上的基因已分布到人的1、2、5、6、8、13、18号7个染色体上了。研究表明在同一界中,某些核糖体蛋白排列顺序的差异能反映出物种间的亲缘关系,亲缘关系越近,基因排列顺序越接近。这样就可以通过比较基因的排列顺序来研究物种间的系统发育关系。

    我国从1998年开始就开展了微生物完整基因组的大规模测序和分析工作。现在正进行和已完成的有:我国自行鉴定的 T hermotogales科的高温真细菌、泉生热袍菌;福氏痢疾杆菌;钩端螺旋体出血黄疸型赖株;表皮葡萄球菌;菊花黄单胞菌。我国科学家在完成人类基因组的1%测序工作的同时,最近又完成了具有4.3亿碱基对的水稻基因组的“工作草图”。这些数据将为我国在这一领域的研究提供最直接的素材。

    六.从功能基因组到系统生物学

    在不同的组织中表达基因的数目差别是很大的,脑中基因表达的数目最多,约有3-4万个转录子,有的组织中只有几十或几百个基因表达。同一组织在不同的个体生长发育阶段,表达基因的种类、数量也是不同的,有些基因是在幼年时期表达的,有些是中年阶段表达的,有些要到老年时期才表达。我们不仅需要了解基因的序列,还要了解基因的功能,也就是要了解在不同的时间、不同的组织中基因的表达谱。这就是通常所说的功能基因组研究。

    为了得到基因的表达谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是在核酸层次上的基因芯片(或称 D NA芯片)技术和在蛋白质层次上的大规模蛋白质分离和序列鉴定技术,也称蛋白质组技术。由于芯片上样品点的密度很大,可以达到每片几十万,因此表达谱数据挖掘和知识发现就成了该研究成功与否的关键。无论是生物芯片还是蛋白质组技术的发展,都更强烈地依赖于生物信息学的理论、技术与数据库。下一步,功能基因组研究将朝着复杂系统的方向发展,即:探讨生物系统中各部分、各层次的相互作用,从而进入系统生物学的领域。

    七.蛋白质结构模拟与药物设计

    蛋白的空间结构模拟和药物设计已有二三十年的历史。随着人类基因组研究的飞速发展,这一领域面临着新的态势,即:找到人类3—4万个基因的碱基序列是指日可待的事,因而确定它们表达产物的氨基酸顺序也会逐渐实现,此时预测这些蛋白的空间结构,进而实现针对性的药物设计,就成了迫在眉睫的任务。这也是大规模的计算问题。

    八.生物信息学的应用与发展研究

    生物信息学的研究结果不仅具有重要的理论价值,也可直接应用到工农业生产和医疗实践当中去。因此,生物信息学相关的分析与应用算法、软件和数据库,都具有重要的经济价值,最终都会形成商品,提供经济和社会效益。

    (1)疾病相关的基因信息及相关算法和软件开发

    很多疾病与基因突变或基因多态有关,有人估计与癌症相关的原癌基因约有1000个,抑癌基因约有100个。约有6000种以上的人类疾患与各种人类基因的变化相关联。更多的疾病是环境(包括致病微生物)与人类基因(基因产物)相互作用的结果。随着人类基因组计划的深入,当我们知道了人类全部基因在染色体上的位置、它们的序列特征(包括 S NPs)以及它们表达规律和产物( R NA和蛋白质)特征以后,人们就可以有效地判定各种疾患的分子机制,进而发展合适的诊断和治疗手段。为此,有两项生物信息学工作是重要的:一是构建与疾病相关的人类基因信息数据库(包括 S NP数据库),二是发展有效地分析基因分型数据的生物信息学算法,特别是将 S NP数据与疾病和致病因素相关的计算方法。

    (2)建立与动、植物良种繁育相关的基因组数据库,发展分子标记辅助育种技术

    根据不同物种间的进化距离和功能基因的同源性,可以比较容易地找到各种家畜、经济作物与其经济效益相关的基因,并进一步认识它们发育、生长和抗逆的各种途径和机制。在此基础上,利用相关的基因组分子标记,可以加快育种的速度,对它们按照人们的愿望加以改造。

    (3)研究与发展药物设计软件和基于生物信息的分子生物学技术

    人类基因组信息为药物发展提供了新的候选分子和新的候选药靶基因。同时,分子生物学常用的表达载体、 P CR和杂交引物以及各种试剂盒(包括 D NA芯片)的设计必须依赖于核酸的序列信息。基因组信息学提供的大量信息为这类技术的发展提供了广阔的天地。

    最近两、三年来,美国一些最著名的大学,如哈佛大学、普林斯顿大学、斯坦福大学、伯克利加州大学等都投资几千万到一亿多美元成立了生物学、物理学、数学等学科交叉的新中心,诺贝尔奖获得者朱棣文领导的斯坦福大学的中心还命名为 B io-X。1999年6月3日,美国 N IH的一个顾问小组建议在生物计算领域设立总额为数亿美元的重大科研基金,并成立5到20个计算中心以处理海量的基因组相关信息。

    生物信息学的发展,不仅导致生物学、物理学、数学、计算机科学等多种科学文化的融合,也必将造就一批新的从事交叉学科研究的科学工作者。科学家们普遍相信本世纪最初的若干年是人类基因组研究取得辉煌成果的时代,也是它创造巨大的经济效益和社会效益的时代。让我们作为见证人欣赏生物信息学的蓬勃发展吧!

    中国科学院生物物理研究所 陈润生

    ●作者简介

    陈润生男,中国科学院生物物理研究所研究员、博士生导师。曾任中国生物物理学会副理事长;现为国际人类基因组组织( H UGO)会员;国际数据库组织( C ODATA)生物大分子专业组委员;国际纯粹及应用生物物理学会( I UPAB)生物信息学专业委员会委员。从1980年以来主要从事蛋白质空间结构模拟和分子设计以及基因组信息学方面的研究工作。1996年10月在日本筑波召开的第十五届国际科学技术数据委员会( CO DATA)大会上,由于在基因组信息学方面的研究成果获得“小谷正雄”奖(生物领域)。
    The origin of intelligence!

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
沙发
发表于 2004-7-25 10:21:43 |只看该作者 |倒序浏览
人类脑计划

    人类脑计划是继人类基因组计划之后又一国际性的科研计划。近年来, N ature、Science、Trends in Neuroscience等著名学术期刊对人类脑计划与神经信息学纷纷进行了报道。他们认为人类脑计划比基因组计划更大,囊括了更加广泛的内容,是一项更加伟大的工程。

    1996年,以美国为首的神经信息学工作组建立,其目的是组织和协调全世界神经科学和信息学家共同研究脑、开发脑、保护脑和创造脑。根据规定,成员国之间可利用电子网络寻求研究协作伙伴,进行数据交换和科研协作,可以免费使用通用神经信息学数据库和信息工具,承担科研任务,同享科研成果和脑研究资源。

    2001年7月,唐一源教授应美国国立卫生研究院神经信息学部主任、全球人类脑计划负责人考斯陆博士的邀请,访问美国 N IH人类脑计划与神经信息学总部,并做专题报告“中华人类脑计划与神经信息学的进展”,使考斯陆博士及美国其他科学家认识到中国的实力和决心。于是考斯陆博士发出专函:“同意中国唐一源、唐孝威和尹岭博士参加始建于2000年的经济合作与发展全球科学论坛神经信息学工作组”。考斯陆博士认为中国专家参加这一活动具有极其重要的意义,这将有助于中国在这一领域的研究与国际发展保持同步,中国的参与将会对全球神经信息学的形成和发展产生重大影响。

    2001年10月4—5日,我国科学家赴瑞典参加了人类脑计划的第四次工作会议,成为参加此计划的第20个成员国。中国科学家表示,要积极配合国际神经信息网络及数据库,建立中国独特的神经信息平台、电子网络和信息数据库,才能在合作中不受制于人,更好地和国外科学家协作,共享科研成果和国际资源。

   

    揭示大脑的奥秘是新世纪人类面临的最大挑战

    生命是什么?“人活着”是怎么一回事?大脑如何思维?数不清的疑问浮现在人类的脑海中。人之所以成为万物之灵,有别于其它物种,是因为人类有极其复杂的大脑,它是千百万年进化的结晶。在过去的六亿年中,生物体通过进化产生出由大量神经元相互联结而形成的神经网络,解决了在不断变化的复杂环境中人脑如何处理各种复杂信息的问题。尤其是人的高级认知功能的高度发展,使得人类成为万物之首,具备了主宰世界的能力。科学研究发现,一个成人大脑重约3.3磅,体积1.5公升,脑内有上千亿个神经细胞,还有超过10(上角14,即10的14次方)个神经突触。大脑是生物体内结构和功能最复杂的组织,是接受外界信号、产生感觉、形成意识、进行逻辑思维、发出指令产生行为的指挥部,它掌管着人类每天的语言、思维、感觉、情绪、运动等高级活动。人脑也是极为精巧和完善的信息处理系统,是人体内外环境信息获得、存储、处理、加工和整合的中枢。

    由于人脑的结构和功能极其复杂,需要从分子、细胞、系统、全脑和行为等不同层次进行研究和整合,才有可能揭示其奥秘。为此,世界各国投入了大量的人力和财力进行专门研究,美国把九十年代最后十年定为“脑的十年”,欧洲确定了“脑的二十年研究计划”,日本将21世纪视为“脑科学世纪”,脑科学的研究热潮遍布全球。科学家们提出了“认识脑、保护脑、创造脑”三大目标,人们相信脑科学的研究成果将为人类更好地了解自己、保护自己、防治脑疾病和开发大脑潜能等方面做出重要的贡献,“了解大脑、认识自身”是21世纪的科学面临的最大挑战。

   

    海量脑研究的数据呼唤新的学科

    1970年至2000年的30年间,美国神经科学学会的会员人数增长了近30倍,2000年达到28,000人左右,每年年会的论文摘要增长了近100倍,2000年已达到15,000篇左右,遍布神经科学研究的各个领域。以往有关脑的研究包括神经解剖、神经生理、神经病理、神经生化、神经免疫、神经电生理、神经心理等,已经获得了大量有关动物脑和人脑的实验数据和研究结果。近年来分子神经生物学研究从基因水平来揭示人脑的奥秘,先进的基因芯片技术在每秒钟就可以得到大量的实验数据。脑功能成像( f MRI、PET等)的应用使我们能够从活体和整体水平来研究脑,好比窥探脑的窗口,可以在无创伤条件下了解到人的思维、行为活动时脑的功能活动。这些新方法、新技术极大增强了我们从微观与宏观两个水平上进行脑研究的能力,同时也产生了海量的实验数据。没有哪个科学家、实验室能够掌握所有的信息并独立地进行脑的全面研究。

    面对这样的信息爆炸,我们应该怎么办?我们以往的科研模式是否需要变革?答案只有一个:新的需要产生新的学科,新的模式产生新的突破。神经科学家面临的重要问题之一,就是能否灵活有效地管理数据,最大限度地利用实验数据,减少不必要的重复性研究和人力、物力的浪费。

    计算机和信息技术的飞速发展为我们提供了解决方案,信息工具的应用为我们解决这一问题创造了条件。所以,建立全球神经信息数据库和神经信息电子网络,已经迫在眉睫。神经科学家和信息学家都在呼吁,应加强神经科学和信息学的合作和相互渗透,采用一种新的研究模式,即实验数据→数学理论→计算机模拟和预测→生物学实验验证→数学模型与验证后的理论,往往可以达到事半功倍的作用,大大加快脑的研究进程。

   

    人类脑计划与神经信息学的缘起

    曼哈顿计划、阿波罗登月计划和人类基因组计划是划时代的三大科学工程,它们给整个人类社会带来了深远的影响。人类基因组计划是生物实验结果和信息学的完美结合,人类基因库将为人类健康、疾病诊断、药物开发、生态平衡和生物学研究作出不可估量的贡献。许多科学家认为,在人类基因组计划之后应该是人类蛋白质组计划和人类脑计划。

    人类脑计划包括神经科学和信息学相互结合的研究,其核心内容是神经信息学。脑科学和信息学是当今国际科学研究的两大热点,神经信息学是这两大学科相结合的新兴的边缘学科。其目标是利用现代化信息工具,使神经科学家和信息学家能够将脑的结构和功能研究结果联系起来,建立神经信息学数据库和有关神经系统所有数据的全球知识管理系统,将不同层次有关脑的研究数据进行检索、比较、分析、整合、建模和仿真,绘制出脑功能、结构和神经网络图谱,从而解决目前神经科学所面临的海量数据问题,从基因到行为各个水平加深人类对大脑的理解,达到“认识脑、保护脑和创造脑”的目标。

    人脑的复杂性远远超出了我们目前的认识能力,传统的细胞生物学等的实验室研究对于解决人脑对复杂信息的获取、处理与加工及高级认知功能的机制,犹如只见树木不见森林。神经信息学工具和数据库的应用,使得我们可能从有限的实验数据中找出神经信息获取、处理和整合的规律和法则,提出在各种刺激条件下,脑内信息加工的数学模型的实验假设和用计算机模拟脑内神经信息网络。可以说,人类脑计划近20年的发展历程处处与神经信息学紧密相连。

    1997年人类脑计划在美国正式启动,美国20多家著名的大学和研究所参加了这个研究计划。50多位神经信息学的课题负责人得到该项目的基金资助。他们充分利用神经科学和信息科学的优势条件进行研究,相互间建立合作关系,利用电子网络互通信息,运用数据库进行资源共享。

    1996年在巴黎的政府间实体———经济合作发展组织(OECD)的科学论坛批准建立以美国为领头国家的神经信息学工作组,参与国包括美国、英国、德国、法国、瑞典、挪威、瑞士、澳大利亚、日本等19个国家,欧洲委员会也作为正式成员参加。其目的是组织和协调全世界神经科学和信息学家共同研究脑、开发脑、保护脑和创造脑。根据规定,成员国之间可利用电子网络寻求研究协作伙伴,进行数据交换和科研协作,可以免费使用通用神经信息学数据库和信息工具,承担科研任务,同享科研成果和脑研究资源。

    美国国立精神卫生研究院副主任,美国国立卫生研究院神经信息学部主任——考斯陆博士是全球人类脑计划的负责人。考斯陆博士是一名神经药理学家,他在神经科学、心理学和药理学等领域出版了多本著作,发表了100多篇科研论文,还得到了十几个不同的荣誉和奖章。考斯陆博士创建 N IH第一个神经科学项目,并出任 N IMH基础与临床神经科学部主任。几年前他又创建了著名的人类脑计划并出任 N IH该机构主任,该机构目前已资助数千万美元专项科研经费用于人类脑计划和神经信息学的研究。美国的几个著名大学,如哈佛大学、耶鲁大学、加州大学、康乃尔大学等都承担了人类脑计划的研究课题。

    没有一个国家能独立完成“人类脑计划”这项巨大的工程,它需要像人类基因组计划那样开展国际间的大规模协作。目前,国际性的神经信息合作组织已在全球召开了4次工作会议,共同策划“全球性人类脑计划和神经信息学”。具体已提出几项重大建议:创建全球性的神经信息学电子网络,开发先进的神经信息学工具、方法和数据库,通过数据资源共享和建模仿真来了解神经系统的结构和功能,推动科学进步。

   

    加入人类脑计划共享神经信息资源

    许多科学家认为,我国的神经信息学的总体研究水平落后于发达国家,今后10年是神经信息学快速发展的阶段,也是竞争性最强的阶段。我们加入越晚,失去的机会就越多,造成的损失就越大。由于我们没有足够的时间和财力去开发研制自己的数据库和信息工具,即使研制出来,也得不到国际上的承认,难以与国际接轨。如果购买或租用国外的信息工具,不但造成经济损失,而且中国在这方面的研究会永远处于被动状态。

    同时,神经科学研究日益深入和专业化,几乎没有哪一个科研人员能够精通脑科学的全部领域。显然,以往通过发表论文或参加会议来进行学术交流的形式已严重制约了科研思路和成果的产生。而国际人类脑计划中的神经信息电子网络可以为研究人员提供信息交流的快速工具,成员国的科学家可以利用神经信息电子网络进行数据交换、分析、整合、建模等工作。参加国际的合作会极大促进国内有关工作的进行。不过,所有这一切都必须有一个大前提———加入国际性神经信息合作组织,参加国际人类脑计划的研究工作。

    在人类基因组计划这个宏伟的全球性科研大计划中,我国科学家经过艰苦卓绝的努力,克服了重重困难,争取到1%的测序任务。然而,就是这1%产生了巨大的政治和经济效益,再一次向世界宣告,中国科学家具有做出世界一流科研成果的能力,使中国跻身于人类基因组计划的行列,站到了这一研究领域的前沿,并理所当然地分享人类基因组计划的研究成果。

    唐一源教授与美国 N IH神经信息学部主任、国际人类脑计划与神经信息学工作组织总负责人考斯陆博士一直保持着紧密的联系。经过持续不懈的努力,考斯陆博士终于同意唐一源教授作为特邀代表,首次参加在日本理化研究所举行的“全球科学论坛神经信息学工作组”第三次会议。唐一源教授在这次会议上,首次向全世界19个国家的代表介绍了中国在本领域的工作,引起强烈反响。同时应邀访问美国几个重要的“人类脑计划与神经信息学”研究基地,与负责人广泛交流探讨,探索国际合作研究项目,参与人类脑计划。此举使考斯陆博士及美国其他科学家认识到中国的实力和决心,于是考斯陆博士发出专函:“同意中国唐一源、唐孝威和尹岭博士参加始建于2000年的经济合作与发展全球科学论坛神经信息学工作组”。考斯陆博士认为中国专家参加这一活动具有极其重要的意义,这将有助于中国在这一领域的研究与国际发展保持同步,中国的参与将会对全球神经信息学的形成和发展产生重大影响。

    考斯陆博士应唐一源教授邀请访问中国,在大连理工大学、解放军301医院、168次香山科学会议分别做了“人类脑计划及其资助机会”的科学报告,引起强烈反响。同时国家自然基金委、科技部等有关部门的领导非常重视和关注人类脑计划与神经信息在国内的发展,分别会见了考斯陆博士并进行了友好协商,支持中国参与全球人类脑计划。在国家科技部、自然基金委、301医院、大连理工大学、浙江大学、中国科学院等单位领导的支持下,经国内本领域科学家的共同努力,2001年9月,中国正式成为参与人类脑计划与神经信息学研究的第20个国家,意味着中国在这一研究领域已经和国际接轨。

   

    凭中国特色加入国际人类脑计划

    在国家自然科学基金委和科技部的大力支持下,我国脑科学在基础和临床研究方面取得了不少科研成果,在某些领域达到了国际先进水平。解放军301医院、大连理工大学、浙江大学、中科院等单位积极参与并组织关于中华人类脑计划和神经信息学的工作,在近一年中,先后召开了两次“中华人类脑计划和神经信息学”的专家研讨会,专家们就许多关键的问题进行了深入探讨。今年9月,由国内40余位神经、化学、数学、信息等方面的专家会聚香山,召开了题为“人类脑计划与神经信息学”的第168次香山科学会议,专家们认真讨论了国内外脑研究的状况、我们如何应对国际形势等问题,一个关键性的问题已逐渐明朗———凭中国特色加入国际人类脑计划。

    在美国人类脑计划的资助下,美国各相关科研机构已初步汇集和建立了各种神经信息数据库和信息处理工具,并正与超级计算机中心、欧洲联盟等联网合作,建立全球神经信息工作平台,该系统有数据质量控制的标准和规定,也有一系列数据检索、分析、整合、建模等工具。目前人类脑计划开展的国际大合作,使用通用数据库,统一格式、统一标准,将脑的结构和功能、微观和宏观的研究结果联系起来,绘制出健康和疾病状态下脑的功能、结构、神经网络、细胞和分子生物学的“图谱”。成员国的科学家们可以在数据库中进行搜索、比较、分析和整合,并进行数学模拟和仿真计算,这将十分有利于理论假设的形成和研究者之间的电子合作,也可以避免不必要的重复性研究。

    我国专家在深入探讨、反复论证后,大家普遍认为,在浩大的人类脑计划中,中国不可能处处涉足,必须发挥自己的长处,利用我们人类脑资源丰富和计算机信息学研究方面的一定优势,在具有中国特色的传统医学(如针刺等)、汉语认知与特殊感知觉的神经信息学研究等领域深入开展工作。将具有中国特色的人类脑计划和神经信息学研究项目加入全球人类脑计划之中,建立中国独特的神经信息平台、电子网络和信息数据库,才能在合作中不受制于人,更好地和国外科学家协作,共享科研成果和国际资源。

    开展中国特色的人类脑计划与神经信息学研究,无疑将大大加深人类对大脑的认识和自身的认识。可以预料,像人类基因组计划一样,在国家的支持下,引进新的科研协作和风险投资运行模式,通过国内本领域的专家齐心协力、联合攻关,以开放的新模式吸纳社会资源,从研究、产业等几个方面同时启动,必将会极大推动人类对自身的认识,造福全人类。
    The origin of intelligence!
回应
0

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
板凳
发表于 2004-7-25 10:22:50 |只看该作者

Introduction of Protein Folding (zz)

蛋白质的折叠:破译“第二遗传密码”

    您知道蛋白质折叠吗?这是一个很新的词。新到什么程度?您可以上网到著名的不列颠百科全书网站检索一下proteinfolding(即蛋白质折叠),还没有相应的解释。

    您知道“蛋白质折叠病”吗?疯牛病、老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些肿瘤、白内障等等都是“折叠病”。就是相关蛋白质的三维空间结构异常。这种三维空间结构异常是由于致病蛋白质分子通过分子间作用感染正常蛋白质而造成的。请注意,致病蛋白质分子与正常蛋白质分子的构成完全相同,只是空间结构不同。

    您知道蛋白质折叠有多复杂吗?美国“科学美国人”曾经载文称,用当今最快的计算机模拟计算蛋白质折叠,要花一百年!而当今最快的计算机已经达到每秒几万亿甚至十几万亿次浮点运算的高速了。

    对于生命奥秘的探索,将贯穿新世纪乃至新千年人类的历史。而蛋白质折叠,就是其中的一大课题。

    请您认真阅读王志珍研究员的这篇文章。不要害怕肽键、肽链、分子伴侣这类专业名词,因为它们与您、您的健康息息相关。读完这篇文章,这些专业名词将成为您的朋友。

    提要

    研究蛋白质的折叠,是生命科学领域的前沿课题之一。蛋白质是一种生物大分子,基本上是由20种氨基酸以肽键连接成肽链。肽链在空间卷曲折叠成为特定的三维空间结构,包括二级结构和三级结构二个主要层次。有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构。所以蛋白质分子有非常特定的复杂的空间结构。

    通过“蛋白质结构预测”破译“第二遗传密码”,是蛋白质研究最后几个尚未揭示的奥秘之一。天津大学和中国科学院生物物理所的科学家已经做出了优秀的研究成果。他们预测,蛋白质的种类虽然成千上万,但它们的折叠类型却只有有限的650种左右。我国科学家在分子伴侣和折叠酶方面有特色的研究成果,也已经赢得了国际同行的注意。

    外界环境的变化可以导致蛋白质空间结构的破坏和生物活性的丧失,但却并不破坏它的一级结构(氨基酸序列),这称为蛋白质的变性。变性的蛋白质往往成为一条伸展的肽链,在一定的条件下可以重新折叠成原有的空间结构并恢复原有的活性。对蛋白质变性作用的认识是我国科学家吴宪在三十年代首先提出的。

    蛋白质异常的三维空间结构可以引发疾病,疯牛病、老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些肿瘤、白内障等等都是“折叠病”。造成疯牛病的Prion病蛋白可以感染正常蛋白而在蛋白质之间传染。研究蛋白质的折叠问题不仅具有重大的科学意义,而且在医学和在生物工程领域具有极大的应用价值。

   

    1分子生物学的中心法则

    五十年代初运用X射线衍射技术解出了生命遗传物质脱氧核糖核酸(DNA)分子的三维空间结构,阐明了生物遗传的分子基础,揭示了这个最主要的生命活动的本质,从而开创了在分子水平上认识生命现象的新学科———分子生物学。分子生物学的出现是经典生物学转变成近代生物学的里程碑。

    尽管自然界的生物物种千千万万,生命现象繁杂纷飞,在分子水平研究生命,使我们认识到各种生命现象的基本原理却是高度一致的!从最简单的单细胞生物到最高等的人类,它们最基本最重要的组成物质都是蛋白质和核酸。核酸是生物体遗传信息的携带者,所有生物体能世代相传,就是依靠核酸分子可以精确复制的性质。蛋白质则是生命活动的主要承担者。所有的生命活动,呼吸、运动、消化……甚至感知、思维和学习,无一例外是依靠蛋白质来完成的。

    蛋白质是一种生物大分子,基本上是由20种氨基酸以肽键连接成肽链。肽键连接成肽链称为蛋白质的一级结构。不同蛋白质其肽链的长度不同,肽链中不同氨基酸的组成和排列顺序也各不相同。肽链在空间卷曲折叠成为特定的三维空间结构,包括二级结构和三级结构二个主要层次。有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构。所以蛋白质分子有非常特定的复杂的空间结构。每一种蛋白质分子都有自己特有的氨基酸的组成和排列顺序,由这种氨基酸排列顺序决定它的特定的空间结构,这就是荣获诺贝尔奖的著名的Anfinsen原理。蛋白质分子只有处于它自己特定的三维空间结构情况下,才能获得它特定的生物活性;三维空间结构稍有破坏,就很可能会导致蛋白质生物活性的降低甚至丧失。

    二十世纪生物学领域最重要的成就之一,是继DNA双螺旋结构的发现总结出分子生物学的中心法则,揭示生命遗传信息传递的方向和途径。近半个世纪以来对阐明中心法则有关问题有杰出贡献而获得诺贝尔奖的学者先后多达34位。分子生物学的中心法则简单表达如下:

    分子生物学的中心法则中,DNA和核糖核酸(RNA)的复制、DNA转录成RNA、RNA逆转录成DNA以及以信使RNA为模板翻译成多肽链的过程和机制基本上已经阐明。但从多肽链折叠成蛋白质的过程,即所谓“新生肽的折叠”问题,是中心法则至今留下的空白,又是从“遗传信息”到“生物功能”的关键环节,有待我们在21世纪去解决。

    2蛋白质折叠与“折叠病”

    人们对由于基因突变造成蛋白质分子中仅仅一个氨基酸残基的变化就引起疾病的情况已有所了解,即所谓“分子病”,如地中海镰刀状红血球贫血症就是因为血红蛋白分子中第六位的谷氨酸突变成了颉氨酸。现在则发现蛋白质分子的氨基酸序列没有改变,只是其结构或者说构象有所改变也能引起疾病,那就是所谓“构象病”,或称“折叠病”。

    大家都知道的疯牛病,它是由一种称为Prion的蛋白质的感染引起的,这种蛋白质也可以感染人而引起神经系统疾病。在正常机体中,Prion是正常神经活动所需要的蛋白质,而致病Prion与正常Prion的一级结构完全相同,只是空间结构不同。这一疾病的研究涉及到许多生物学的基本问题。一级结构完全相同的蛋白质为什么会有不同的空间结构,这与Anfinsen原理是否矛盾?显然这里有蛋白质的能量和稳定性问题。

    从来认为蛋白结构的变化来自于序列的变化,而序列的变化来自于基因的变化,生命信息从核酸传递到蛋白。而致病Prion的信息已被诺贝尔奖获得者普鲁辛纳证明不是来自基因的变化,致病蛋白Prion导致正常蛋白Prion转变为致病的折叠状态是通过蛋白分子间的作用而感染!这种相互作用的本质和机制是什么?仅仅改变了折叠状态的分子又如何导致严重的疾病?这些问题都不能用传统的概念给予满意的解释,因此在科学界引起激烈的争论,有关研究的强度和竞争性也随之大大增强。

    由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些肿瘤、白内障等等。由于分子伴侣在蛋白质折叠中至关重要的作用,分子伴侣本身的突变显然会引起蛋白质折叠异常而引起折叠病。随着蛋白质折叠研究的深入,人们会发现更多疾病的真正病因和更针对性的治疗方法,设计更有效的药物。现在发现有些小分子可以穿越细胞作为配体与突变蛋白结合,从而使原已失去作战能力的突变蛋白逃逸“蛋白质质量控制系统”而“带伤作战”。这种小分子被称为“药物分子伴侣”,有希望成为治疗“折叠病”的新药。

    新生肽的折叠问题或蛋白质折叠问题不仅具有重大的科学意义,除了上面提到的在医学上的应用价值外,在生物工程上具有极大的应用价值。基因工程和蛋白工程已经逐渐发展成为产值以数十亿美元计的大产业,进入21世纪后,还将会有更大的发展。但是当前经常遇到的困难,是在简单的微生物细胞内引入异体DNA后所合成的多肽链往往不能正确折叠成为有生物活性的蛋白质而形成不溶解的包含体或被降解。这一“瓶颈”问题的彻底解决有待于对新生肽链折叠更多的认识。

    3蛋白质折叠和“第二遗传密码”

    蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定三维空间结构形成的规律、稳定性和与其生物活性的关系。在概念上有热力学的问题和动力学的问题;蛋白质在体外折叠和在细胞内折叠的问题;有理论研究和实验研究的问题。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构?既然前者决定后者,一级结构和空间结构之间肯定存在某种确定的关系,这是否也像核苷酸通过“三联密码”决定氨基酸顺序那样有一套密码呢?有人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。

    如果说“三联密码”已被破译而实际上已成为明码,那么破译“第二遗传密码”正是“蛋白质结构预测”从理论上最直接地去解决蛋白质的折叠问题,这是蛋白质研究最后几个尚未揭示的奥秘之一。“蛋白质结构预测”属于理论方面的热力学问题。就是根据测得的蛋白质的一级序列预测由Anfinsen原理决定的特定的空间结构。蛋白质氨基酸序列,特别是编码蛋白质的核苷酸序列的测定现在几乎已经成为常规技术,从互补DNA(cDNA)序列可以根据“三联密码”推定氨基酸序列,这些在上一世纪获得重大突破的分子生物学技术,大大加速了蛋白质一级结构的测定。目前蛋白质数据库中已经存有大约17万个蛋白的一级结构,但是测定了空间结构的蛋白大约只有1.2万个,这中间有许多是很相似的同源蛋白,而真正不同的蛋白只有1000多个。随着人类基因组计划的胜利完成,解读了人类DNA的全序列,蛋白质一级结构的数据增长必定会出现爆炸的态势,而空间结构测定的速度远远滞后,因此二者之间还会形成更大的距离,这就更需要进行蛋白质结构的预测。

    由于蛋白质分子结构本身的极端复杂性决定了结构预测不可能一蹴而就。目前结构预测的方法大致可分为两大类。一类是假设蛋白质分子天然构象处于热力学最稳定,能量最低状态,考虑蛋白质分子中所有原子间的相互作用以及蛋白质分子与溶剂之间的相互作用,采用分子力学的能量极小化方法,计算出蛋白质分子的天然空间结构。第二类方法是找出数据库中已有的蛋白质的空间结构与其一级序列之间的联系总结出一定的规律,逐级从一级序列预测二级结构,再建立可能的三维模型,根据总结出的空间结构与其一级序列之间的规律,排除不合理的模型,再根据能量最低原理得到修正的结构。这也就是所谓“基于知识的预测方法”。但是,第一类方法遇到在数学上难以解决的多重极小值问题,而逐级预测又受到二级结构预测精度的限制。因此必须解决这些困难,或者发展新的方法,将基于知识的预测方法与计算化学以及统计物理学结合起来,才有希望能破译“第二遗传密码”。

    另一方面,和以往只能利用存入蛋白质数据库的数据进行预测相比,人类DNA的全序列的测定给予蛋白质结构预测更自然的、信息量更大得多的数据库,因此可用基于同源性的重复循环技术非常可靠地灵敏地进行结构预测。已经有人根据基因组的数据用统计方法重新估计了蛋白质折叠类型数目大约为1000种,这和早期的理论估计是一致的。显然,人类基因全序列的揭示必然为蛋白质结构预测、蛋白质相互作用的预测以及单核苷酸多态性的分子表型预测开辟前所未有的广阔天地。天津大学和中国科学院生物物理所的科学家已经活跃在蛋白质结构预测领域,并做出了优秀的研究成果。他们预测,蛋白质的种类虽然成千上万,但它们的折叠类型却只有有限的650种左右。

    蛋白质折叠第二个根本的科学问题是具有完整一级结构的多肽链又是如何折叠成为它特定的高级结构?这是一个折叠的动力学的问题,长期以来,主要用体外的实验方法研究,虽然已有四五十年,但至今尚未解决。我们知道,多数蛋白质在体外是不稳定的,外界环境的变化,如温度、酸度等,都可以导致其空间结构的破坏和生物活性的丧失,但却并不破坏它的一级结构,这称为蛋白质的变性。对蛋白质变性作用的认识是我国科学家吴宪在三十年代基于他在国内的工作首先提出来的,长期以来已经为国际上广泛接受。变性的蛋白质往往成为一条伸展的肽链,由于一级结构仍然完整,根据Anfin?sen原理它应该可以在一定的条件下重新折叠成原有的空间结构并恢复原有的活性。这就是长时间来在体外研究蛋白质折叠的基本模型。

    现在知道,绝大多数蛋白质从一条伸展的肽链,折叠成有其特定结构的、有活性的蛋白质,并不是一步完成的,而要经过许多折叠的中间状态。含有多个亚基的蛋白质分子,亚基间的相互作用使之组装成复杂蛋白分子。研究人员用实验方法,特别是近年来发展的快速测定方法去追踪蛋白质重折叠的全过程,尽可能捕捉折叠过程中的每一个中间状态。不同阶段的折叠速度不同,有的比较慢,比较容易发现和捕捉;但有的非常快,必须要有特殊的设备配合各种测试技术去进行研究。最近有人尝试大幅度降低温度使折叠速度减慢而得以追踪。最终,人们要定量地描述整个折叠的动态过程,拍出一部蛋白质折叠的电影来,但这必然要经过一个长时间的艰苦的工作。

    4细胞内的蛋白质折叠

    尽管多年来体外蛋白质折叠研究为揭示蛋白质折叠的本质提供了大量信息,但细胞内蛋白质的生物合成,一个广义的蛋白质折叠问题,是一个比试管内蛋白质折叠复杂得多的多的过程。蛋白质的多肽链都是在细胞内的一种由多种蛋白质和核糖核酸所组成的被称为核糖体的复合物上,以信使核糖核酸为模板,从氨基末端开始,按照三联密码,一个氨基酸一个氨基酸加上去而合成出来的。现在比较一致的看法认为,这种新合成出来的多肽链(称为新生肽)在合成过程中长度不断增加,并在延伸的同时也在进行着折叠,而不是在合成完成脱离核糖体后再自发折叠成为蛋白质。所以上面介绍的在体外用变性伸展肽链的重折叠研究蛋白质折叠的模型看来并不是研究细胞内蛋白质折叠的理想模型。由于每个信使核糖核酸可以同时携带多个核糖体,而每个核糖体上的多肽链的延伸程度又是不同的,所以核糖体上的多肽链的合成同步化是目前研究新生肽折叠的关键问题,但一直没有解决。

    我们实验室暂时绕过这个障碍,制备一系列从氨基末端开始具有不同长度的肽段,比较研究它们的构象作为模型,对新生肽在合成延伸的同时也在进行着折叠的观点已经提供了大量信息。从核糖体上合成出来的肽链还需经过与翻译同时进行的和翻译完成后的化学加工,如形成二硫键,完成糖基化作用、羟基化作用、磷酸化作用等化学修饰。化学修饰往往与肽链的折叠密切相关,没有化学修饰的肽链往往不能完成正确折叠。

    新生肽还要被运送到细胞的特定部位,“各就各位”才能发挥它特定的生物功能:例如进入细胞核中的核蛋白与DNA组成染色体;进入线粒体的蛋白参与能量代谢;组成膜的蛋白以及分泌到细胞外的蛋白必须进入内质网,先进行加工再继续转运等等。这些转运都有一个穿越膜结构,甚至是多次越膜的过程。有完整空间结构的蛋白分子是不能越膜的,因此在转运过程中折叠过多的分子必须解开折叠后才能越膜。此外,多亚基蛋白必须进行组装。有些蛋白质,如一些酶和激素,以前体形式合成后还要经过水解除去某一段序列后才能成熟为有活性的分子。所有这些都包含在新生肽成熟为功能蛋白的全过程中,每一步都涉及新生肽链的构象变化、折叠和调整。

    在试管中做蛋白质折叠实验的条件往往人为简化或不得不简化,与新生肽在细胞内折叠的条件有质的或量的差别。所有的细胞中都存在着大量的蛋白质、核酸、多糖等各种生物大分子,它们大约占用细胞容积的20-30%,总浓度高达每升80-200克,因此任何一种大分子都处于一个充满其他大分子的“拥挤”环境中,使得任何一个大分子的实际可及空间大大减少,这种情况对所有大分子之间的反应在热力学和动力学上都有很大的影响。最近,有人呼吁,在体外研究蛋白质折叠必须考虑模拟细胞内的“拥挤”环境。我们实验室在这方面的研究已经得到国际同行的注意。此外,某一种蛋白在某一时刻在细胞内的局部浓度可以非常高,这样高浓度的蛋白质在试管中必然发生聚集而不可能完成折叠。所以,在体外进行的实验,为了提高蛋白折叠效率,并且有利于进行分析,实验所用的蛋白浓度总是很低的;温度也常在37摄氏度以下,有时低到10摄氏度以下,以减缓反应速度。溶液成分也尽量简单,便于分析。 5分子伴侣蛋白和折叠酶

    最近15年来,由于发现一些蛋白质的折叠必须在另一些蛋白质存在时才能正确完成的现象,对蛋白质折叠的概念产生了革命性的全新认识,“自发折叠”的经典概念发生了转变和更新,这是蛋白质折叠研究中的大事。现在认为新生肽在细胞内的折叠和成熟在多数情况下是不能自发完成的,而是需要别的蛋白质帮助的。这个新概念并不与Anfinsen原理相矛盾,而是在动力学的观点上完善了Anfinsen学说。一个在热力学上可以成立的反应由于动力学的能障等问题在实际上未必可以完成,但在别的蛋白质帮助下可以克服能障而得以进行。

    目前已认识到的在细胞内帮助新生肽链折叠的蛋白有二类:一类称为分子伴侣蛋白,另一类是催化与折叠直接有关的化学反应的酶,又称折叠酶。分子伴侣显然是一种具有新功能的蛋白,近年来已经鉴定到越来越多新的分子伴侣蛋白或已知蛋白的新的分子伴侣活性。它们的精细三维结构、结构与功能的关系、它们帮助生物大分子折叠的机制都在活跃的研究之中;特别是有些蛋白的分子伴侣活性和在同一分子上的其他生物活性之间的关系以及在生命活动中的协作和调控更引起人们的兴趣。现在发现,不仅蛋白质的折叠需要分子伴侣的帮助,DNA分子和RNA分子的折叠也往往需要分子伴侣的帮助,因为功能DNA和RNA分子,特别是它们与蛋白质形成的复合物都要有一定的构象。DNA和RNA分子本身具有较大的刚性,不容易折叠或在折叠过程中容易发生折叠错误,因此需要DNA分子伴侣或RNA分子伴侣帮助它们折叠而形成特定的构象。另一方面,不仅蛋白质,现在发现有一些核酸和磷脂也能发挥分子伴侣的作用;更有趣的是最近发现核糖体也有分子伴侣活性。有些生物大分子在成熟过程中需要一系列的分子伴侣在不同的阶段给予帮助才能完成最终的折叠。另外,有一些小分子物质对某些蛋白质在体外的折叠有帮助作用,被称之为“化学分子伴侣”。我国科学家在分子伴侣和折叠酶方面的有特色的研究成果已经赢得了国际同行的注意。

    新生肽在细胞中折叠和成熟的过程由于转录或翻译出现了错误,或受到各种环境刺激而损伤,并非能百分之百地完成。为提高蛋白质生物合成的效率,处理掉不能继续正确折叠的或错误折叠的“次品”或“废品”,防止这些“垃圾”的堆积而危害正常生命活动,生命的进化使细胞获得了一种“蛋白质质量控制系统”。这种系统是由分子伴侣和靠消耗三磷酸腺苷的能量而发挥作用的特定的蛋白水解酶组成。分子伴侣帮助新生肽正确折叠;而特定的蛋白水解酶把不能继续正确折叠的或错误折叠的“垃圾”水解成小分子。这里的科学问题是质量控制系统到底如何进行质量控制?有人借用了医院里诊断病人应该送到哪种病房作什么治疗的机制(triage)来描述细胞的蛋白质质量控制体系的作用机理。关键是如何“诊断”和区分什么样的新生肽“病人”可以送到分子伴侣“病房”进行治疗和拯救,而什么样的新生肽“病人”已“无可救药”,只能送给蛋白水解酶去处理。细胞内新生肽“病人”的命运主要是由分子伴侣处理“病人”的能力和速度在动力学上来决定的。尚未治好的新生肽“病人”可能获得再治疗的机会,但也可能不幸送到蛋白水解酶那里去了;还有一种可能性就是形成聚集,聚集体是抗水解的。如果形成有规则的聚集体,即所谓“淀粉样纤维”。一些神经系统退化疾病,如老年性痴呆症、帕金森氏病、亨廷顿氏病就是由此造成的。

    在21世纪,人类在解决了新生肽折叠的问题,解决了基因调控的问题后,应该就可以说全面地最终地阐明了分子生物学的中心法则,那时人类对自身的认识又将有一个新的飞跃。
    作者:中国科学院生物物理研究所生物大分子国家重点实验室 王志珍
    作者简介

    王志珍,女,中国科学院生物物理研究所生物大分子国家重点实验室研究员、博士生导师。曾在胰岛素和胰岛素受体的结构与功能关系以及胰岛素作用机制方面做过研究。近年来主要从事蛋白质折叠、折叠酶和分子伴侣方面的研究。曾获国家自然科学二等奖,中国科学院自然科学一等奖、二等奖等,获“国家有突出贡献的中青年专家”称号。
    The origin of intelligence!

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
地板
发表于 2004-7-25 10:24:06 |只看该作者

Introduction of Bio-X (zz)

新世纪中推动生物科学发展的"Bio-X"
刊载于:生物物理学报,17(1):1-9, 2001
张志鸿
(复旦大学生命科学学院生理学和生物物理学系,立人实验室, 上海 200433 )  
(* 本文版权属作者所有,要使用本文请征得作者同意。)

摘 要
近二年国际上正掀起建立以生物科学为中心的交叉学科研究中心或研究所等实体的热潮。其中最引人注目的是美国斯坦福大学以诺贝尔物理学奖获得者朱棣文教授等人组建的"Bio-X" 研究中心。Bio-X中的Bio 为生物学,X泛指物理学、化学、工程学、医学等其它学科。在新世纪到来之时,生物科学中有不少迅速发展的领域迫切需要多学科交叉共同研究和参与,特别是:后基因组、基于同步辐射的结构生物学、单分子测量、纳米技术、
脑科学、生物医学工程等。
关键词:Bio-X;交叉学科;后基因组;单分子测量;脑科学
中图分类号:Q6 文献标识码:A 文章编号:1000-6737(2001)01-0001-09
收稿日期:2000-09-20
作者简介:张志鸿,1940年出生,教授,博士,电话: (021)65643673,E-mail: zhzhang@fudan.edu.cn


在人类以往的历史上,生物科学像现在这样的蓬勃发展并吸引如此众多非生命科学的交叉和渗透还未曾有过。现在,生物学研究正越来越定量化,不仅在方法和手段上更趋复杂和先进,而且需要多学科的知识,许多激动人心的发现和成果往往出现在这些交叉的前沿。前年,Nature杂志曾刊登标题为“物理学能否提供另一次生物学革命?”的编辑部文章[1],认为目前物理学和生物学家已认识到彼此交叉和渗透的重要性和必要性,他们之间在文化、机构、概念及语言等诸方面的壁垒正被打破。以美国为例,这二年正掀起建立以生物科学为中心的交叉学科研究中心或研究所等实体的热潮[2]。其中最引人注目的是斯坦福大学以诺贝尔物理学奖获得者朱棣文教授等人组建的“Bio-X” 研究中心[3,4]。Bio-X中的X泛指物理学、化学、工程学、医学等其它学科。其目标是:将在基础、应用和临床科学中的边缘研究结合一起,进行从分子到机体各个层次的生物物理学研究,以实现新的发现和技术创新。此外,该中心也希望将这些新开发的技术应用于生物技术工业,并为硅谷创造新的辉煌。去年下半年“Bio-X” 研究中心已正式立项启动资助项目,首先集中于五个领域:组织工程(干细胞研究);单分子分析和分子结构;认知和系统神经科学;从分子到人体的成像;生物计算。加州伯克莱分校、芝加哥大学同样投巨资于生物学和物理学交叉学科的建设;哈佛大学组建了“基因组学和蛋白质组学中心”;普林斯顿大学设立了跨学科的“基因组学分析研究所”;此外,加州理工学院、麻省理工学院等也都有建立和生物科学交叉的综合性学科的具体计划。

回顾本世纪后半叶生物科学的发展,很多重要的、里程碑的成果都离不开物理学、化学等学科的直接贡献。如,X射线晶体衍射对DNA双螺旋结构的确定、各种先进设备用于精确和高通量的基因测序、数学和计算机技术对基因组测定的整合和分析等极大地推动了分子生物学和最近“人类基因组计划”的发展;X射线晶体衍射、多维 NMR、二维电镜技术、计算机科学等在结构生物学的出现和进展中的地位是不言而喻的;根据物理化学原理提出的兴奋膜的离子基础及模型、膜片钳技术、Hopfield神经网络理论模型等大大充实了神经生物学的内涵; f-MRI (Functional Magnetic Resonance Imaging)、PET (Positron-emission Tomography)、脑功能光学成像、复杂系统的数学模型、信息处理和控制论、人工智能等已使我们对脑的研究发展成为受到人们极为关注的脑科学;化学渗透偶联假设、X射线晶体学、物理化学中的电荷分离原理、各种时间分辨波谱分析技术等使在生物能量转换的原初机制研究中有好多位诺贝尔奖金获得者的出现;流动镶嵌模型、各种凝聚态物理学技术等从根本上改变了人们对生物膜结构的认识。但另一方面,生物科学也对其它学科的发展作出了相当大的贡献。涉及到的方面有:不可逆过程热力学、自组织和耗散结构理论的发展;神经计算机的研究和开发、基于生物学理论的计算机算法(生物进化、神经网络理论、核酸碱基配对等);第三代同步辐射装置、NMR、PET、基因测序仪、新型质谱仪、各类电镜等众多大型、精密装置和仪器的开发;控制论和自动化技术;生物材料、生物传感器;生物技术和制药;论理学等。此外,还促使诞生了一批新学科,包括:生物物理学、生物数学、神经科学、结构生物学、生物信息学、组合化学、生物无机化学、生物医学工程学、生物力学、组织工程学等。

在新世纪中,这种学科之间的相互交叉和协同研究更显得必要和迫切。生物科学无论在分子、细胞或整体、生态系统各个结构层次上的实验数据都爆炸性地累积,如何加以定量分析和整合、如何从分子水平上阐明生物大分子之间动态的相互作用、如何对结果模型和理论化等都需要其它学科直接提供理论、概念、研究方法和实验手段。再则,近代生物科学已是新的高科技产业的滋生基地,为此也需其它自然科学和工程学的支持。根据目前的发展趋势,生物科学中如下的研究领域迫切需要多学科交叉共同研究和参与。

1后基因组 ¾ 随着“人类基因组计划”的迅速进展,尤其是人类基因组工作草图的提前公布,现在我们已经大步跨入了后基因组时代。几年来,已有30多种生物的基因组被完全测序,还有约100种正在进行中。可是,仅仅几十亿碱基序列并不能告诉我们: 所有这些基因在做什么?细胞如何工作?怎样由细胞形成机体?是什么错误导致疾病?衰老是怎样发生的?如何针对性的开发药物?这些便是后基因组时代要回答和解决的问题。“蛋白质组学”(Proteomics) 也正是在这种形势和需求下出现并越来越受到广泛的关注[5,6]。它主要研究细胞内所有蛋白质在生命过程中的表达、蛋白质之间的相互作用、翻译后的各种修饰等。这些生命过程重要的性质单从基因水平上是无法知道的。如,经翻译后的各种修饰,一个基因序列有可能产生20多种结构不同的蛋白质。体内各种蛋白质的表达、功能的发挥和活动规律要受到时间、空间、环境等因素的调控,这些只有用“蛋白质组学”的概念和技术才能解决。以啤酒酵母为例,根据蛋白质组学建立的“酵母蛋白质数据库”已有约6000种蛋白质,包含的结构和功能信息有:等电点、分子量、氨基酸组成、结构域、翻译后修饰、亚细胞定位、功能类别、酶活性、和其它蛋白质的相互作用、和疾病的关系、和人相关蛋白质的同源性、突变表型等。依据蛋白质组图谱可使我们追踪细胞内一条信号途径中各个蛋白质分子是如何相互作用的,一条信号途径的改变又是如何影响其它途径的。大多数疾病都是由多因子参与而发生,因而这显然很适宜于临床医学中关于病因、疾病特异标志等研究。为找寻有效的药靶,很多药厂、公司正积极地进入此领域,其方法是确认与药物选择性作用的蛋白质。蛋白质组学研究中蛋白质的确定、表征和功能描述三大过程中首先面临的是将细胞内成千种蛋白质分离开,目前都是用二维凝胶电泳法;接着是用质谱、HPLC、N-末端氨基酸序列分析等方法对蛋白质进行表征。在记录和分析蛋白质表达谱、正常异常的差异确定、数据库及数据整合等过程中不但涉及数据自动采集和成像技术,还要依赖于生物信息学的理论和分析。在确定蛋白质功能时,除了酶活性分析、受体结合分析、细胞内定位(绿色荧光蛋白融合法)、酵母双杂交及基因剔除等生物学方法外,X射线晶体学、 多维NMR、质谱、生物信息学等都是强有力的技术。由于蛋白质的化学组成和结构比起DNA要更复杂和多样,技术的难度是可想而知的。目前人们正在积极研究和开发各种微量、快速、高通量和高自动化的技术,特别是基于芯片的自动化技术,如将各种抗体置于微阵列上进行未知蛋白质的分析,这种技术用于疾病诊断也非常有用。另一努力克服的难点是如何将疏水性的膜蛋白从膜上分离出来进行分析,因为许多受体、离子通道等起重要生理功能的蛋白质都是膜蛋白。最近,美国著名的参与人类基因组研究的Celera公司已宣布要建立工业化规模的“人类蛋白质组计划”,他们迫切要解决的是开发和目前通用的二维电泳技术相结合的新工艺,以满足工业化规模、高通量的需要[7]。哈佛大学的“化学和细胞生物学研究所”的一个研究策略是基于化学的理论和方法研究蛋白质组学。人类在1900年用阿斯匹林治疗头疼,但到1972年才知道阿斯匹林所抑制的酶,然后再是得到编码该酶的基因。类似地,他们提出“化学遗传学”的新概念[8]:首先化学合成众多的易穿透膜的有机小分子来干扰蛋白质,通过对细胞内信号途径的改变来了解蛋白质的功能。这种技术不但有望能用以确认未知蛋白质,而且用来开发药物非常有用。这也是哈佛大学“基因组学和蛋白质组学中心”的三项重点研究内容之一,其它二项分别是从基因组数据中研究行为的遗传、进化和疾病的起源;发展包括DNA芯片、计算机算法等的新技术。因而该中心体现了生物学、化学、工程学和计算机学的交叉[9]。

2 基于同步辐射的结构生物学 ¾ 翻开当今国际上生命科学中各分支领域的著名杂志,一个和10多年前显著的不同处是出现了不少三维空间结构的生物大分子模型图。原因是要搞清生命过程的本质,一个根本的前提是必须要了解蛋白质、核酸等大分子具有原子分辨率的空间结构以及这种结构又如何与其生物学功能相联系的。由此诞生了“结构生物学”这一新的研究前沿。最近,随着人类基因组测序的完成,对未知基因表达产物¾ 蛋白质的结构和功能的了解已成为新的热点。因而,对蛋白质空间结构的研究是后基因组时代很重要的方面。关于测定技术,目前80%以上的生物大分子结构是用X射线衍射法得到的。过去的十多年里,同步辐射技术的发展大大推动了结构生物学的研究进展[10]。根据国际蛋白质数据库(PDB)资料,70年代每年登录的生物大分子空间结构数约20个,但到1999年一年中新登录的数目已增加到2636个。其中相当部分具有重要生物学功能的生物大分子结构是用同步辐射X射线测得的,1996年正式发表的新结构中,有44%是在同步辐射装置上完成的,此比例近年来更高。 同步辐射X射线特别适用于那些分子量大 (可至数百万)、晶体小(几十微米)的超分子复合体及膜蛋白。如近几年已报道的与能量转换有关的细胞色素c氧化酶等膜蛋白复合体、参与信号转导的G蛋白和其效应器的复合体、多种基因转录因子和DNA复合体、帮助蛋白质折叠的分子伴侣、HIV包膜蛋白和受体蛋白复合体等。在离子通道的空间结构上,1998年报道了二个激动人心的成果:上半年的钾离子通道和下半年的机械敏感性离子通道[11, 12]。1999年Science杂志则将测得细胞内合成蛋白质工厂的核糖体结构列为当年十大科技突破之一。2000年则得到了2.4?高分辨率的核糖体50S大亚基三维结构,它包括2833个核苷酸 (RNA) 和27个蛋白质[13]。从该精细结构的一个惊人发现是,催化肽键合成反应的活性位点完全被rRNA所包围,蛋白质组分的主要作用只是使结构稳定。因而,不是以前认为的RNA只起骨架而蛋白质行使催化的功能。为此,1989年诺贝尔化学奖获得者Thomas Cech 在同期Science刊物上以“核糖体是一种核酶(ribozyme)”为题发表了展望性的评论。去年另一个激动人心的结构生物学成果是获得了一种“G蛋白偶联受体(GPCR)”¾ 视紫红质的晶体结构[14]。GPCRs 是一类非常重要的转导信号的膜受体,在线虫基因组中占5%,可能占我们人类基因组的3%。该结构的解明对我们进一步了解受体被激活后7次跨膜螺旋是如何运动的、G蛋白三聚体又是怎样被激活的等重要问题起着关键作用。

这种结构的测定给新药设计提供了分子结构基础,有力促进了“基于结构的药物设计”或“合理的药物设计”的发展。国际上目前最著名的治疗AIDS病的蛋白水解酶抑制剂就是这样诞生的。用同步辐射白光Laue法测定肌红蛋白结合和释放CO的150微微秒的动态结构例子则使我们能“看”到生命活动的“过程”。 “基于同步辐射的结构生物学”之所以有这样大的发展,一个关键点是涉及遗传工程、低温结晶、高灵敏的探测技术、数据处理的计算机硬件和软件等技术上的飞速进步和第三代同步辐射装置的出现。基于同步辐射X射线的高亮度、高通量、高准直度等特性,还能在非结晶的状态利用X射线吸收谱获悉生物大分子中金属活性中心附近的详细特征;用小角散射法探测溶液中大分子的动态和静态大小及形状、追踪蛋白质折叠过程;X射线显微镜则提供了一种新的细胞及细胞器活体成图象法。正在上海筹建的“上海同步辐射装置”,设计能量为3.5GeV,在世界第三代同步辐射装置中位居第四,可以期待在推动结构生物学和其它生命科学的发展中该项设施将起着重要的作用。

3 单分子测量¾ 科学的发展已使我们能从单分子水平进行生命过程的定量研究,从而更能阐明生命的微观活动规律。人们通过溶液中生物化学反应所得到的是众多分子相互作用的统计结果,有时难以揭示分子动力学的过程。一个很令人信服的例子是关于生物膜上离子通道的发现。早在50年代从神经等可兴奋性膜的电活动记录信号上推测有离子通道的存在,而后又应用物理学中的相关函数分析法从统计学的角度对离子通道作了表征。但只是到了80年代末,发明了“膜片钳位”技术,对一个蛋白质分子进行测量并纪录到了流过单个离子通道的电流后,才从真正意义上使离子通道具体化,此项技术随即获诺贝尔奖,神经生物学也随之发生了突飞猛进的发展。近几年来,激光钳、原子力显微术(AFM)、荧光标记等物理学技术在此领域中大放异彩[15]。如用激光钳方法操纵单个“马达蛋白”研究它在细胞内交通网络(微管)上的运动规律。用激光钳和显微录象术研究RNA聚合酶分子和DNA链相互作用的过程则让我们更好地了解基因转录的分子机理。以前为研究蛋白质的折叠,首先是用加热或化学变性剂使蛋白质解折叠,目前则可通过AFM或激光钳方法实现并进行所需力的测量。最近德国学者[16]将AFM针尖粘在嗜盐菌膜上细菌视紫红质蛋白的C-末端(位于胞质侧),当针尖向上回缩时,受到机械力拉伸蛋白质发生分段式解折叠,测量出该膜蛋白七次跨膜的各个螺旋锚定在膜中的力在100至200pN之间,并探测到了单个螺旋解折叠的途径。日本学者擅长用荧光标记方法观测肌肉收缩、鞭毛运动,特别是用实验证实了ATP合酶(FoF1-ATPase)是一种旋转酶或旋转马达的假设[17]。他们将FoF1-ATPase的催化单位F1中的b 亚基粘附在玻片上,F1中g 亚基末端粘附一条有荧光标记的长的肌动蛋白纤维,当溶液中加入ATP后即可从荧光显微镜下观察到肌动蛋白纤维的旋转。这种旋转以120度阶跃式进行,令人信服地证实了ATP合成时通过g 亚基旋转带动与其有相互作用的b 亚基构象变换的推测。而且,实验中,估算了肌动蛋白纤维旋转需克服约80 pN·nm 的溶液凝滞力,这相当于一个ATP分子在生理条件下水解所释放的自由能,因而分子马达F1-ATPase的能量转换效率几近100%。国内外不少实验室用AFM操纵DNA和蛋白质分子已取得许多成绩。去年,朱棣文等报道了他们用物理学上的“荧光能量转移”方法在荧光显微镜下对一种四膜虫RNA分子(核酶)的催化和折叠过程进行了单分子研究[18]。在和底物作用时RNA分子结构域间发生相对运动,使荧光给体和受体间距离作相应改变,记录和分析这两种荧光基团荧光强度随时间的变化,得到催化反应的速率常数并确认了几种折叠的中间态。荧光能量转移法结合AFM、激光钳、膜片钳等技术,在单分子水平上研究DNA-蛋白质相互作用、DNA分子螺旋的机械特性、各种核酸酶分子在聚合或解聚过程中的构象变化和位移、单通道开启和关闭过程中蛋白质的构象变化等也开始有报道[15]。

4 纳米技术 ¾ 生物大分子用作新型纳米材料现已越来越受到重视。有人将直径约13纳米的金微粒粘附上一定碱基序列的DNA链,当在溶液中这些DNA链和互补的碱基序列结合后就形成DNA链的网络,使得其上的微粒间距拉近,结果由于金粒的表面等离子波共振现象,体系的颜色从原来的红色变为蓝色[19]。显然,这种方法对医生用于检测病原体是非常简单和价廉的。哈佛大学的研究者[20,21]将一种细菌的离子通道(a -溶血素)组装在人工双分子层脂质膜上,当在膜两侧加上电压后使通道打开,同时在电场作用下单链的 DNA或RNA分子通过1.5纳米宽的离子通道,由于不同碱基有不一样的物理和化学特性(如大小、电荷密度)以及通道内非常小的电荷分布改变会引起离子通量甚大的变化,因而当核酸链通过通道的过程中随碱基序列的不同可以记录到单通道电流随时间改变的不同式样。这是一种完全新的“纳米孔测序”技术,目前的速度已达每毫秒1个碱基。假如设计一片含500个这种孔道的芯片,那么从一个人的细胞中读出完整人类基因组的碱基序列只需二个小时,对于病毒则几秒种就行,相比之下,目前的通用测序法在国际合作的基础上也要约二年。材料化学界,也正在探索用生物大分子具有分子识别的特性来将无机材料组装成有序、复杂的结构。一个例子是去年报道的特定的多肽分子能特异性结合在半导体表面,这种结合和半导体的晶体定向、组成等有关[22]。他们首先通过噬菌体显示文库提供约109不同的由12个氨基酸组成的多肽,然后测定与GaAs(100)、GaAs(111)、InP(100)、Si(100)等单晶半导体的结合效应,筛选出了只与GaAs不与Si、而且只与(100)GaAs晶面不与 (111)GaAs晶面结合的多肽。基于这样的结果,我们可使纳米级材料超出通常物理方法按大规模平行的方式组装成一种新型的基于分子的电子器件。显然,在生物诊断领域中也很有开发前景。事实上,某些生物体早已用到了这种原理。如,鲍鱼外壳的形成是以某些蛋白质为模板才使方解石结晶成硬壳;北极鱼体内的抗冻蛋白则防止了冰晶的生长。有些研究组已经开始探讨如何将此种生物专一性相互作用的原理用于形成新结构的工程材料、将分子材料组装成功能性的生物无机结构。去年8月, Bell 实验室和牛津大学的研究者开发了第一个DNA马达[23],他们设计的思路来源于肌肉收缩及细胞中物质运动时的蛋白质分子马达。该DNA马达由三条DNA单链组成:36个碱基的A链,各有42个碱基的B链和C链。A链两端分别和B链、C链的部分互补杂交,其中间的4个碱基未配对形成铰链。B链和C链的另部分(24个碱基)未杂交,在两端可自由悬摆。因而,整个形状如一把张开的V型镊子,这是DNA马达的“开启”状态。当另一条DNA单链(F链,56个碱基)加入时,它和B链、C链的两条悬臂杂交,导致镊子呈“闭合” 状态。若再加入和F链完全互补的另一条DNA单链,则使DNA马达又回复到“开启”状态。作者在A链的两末端分别用二种荧光染料分子标记,根据“荧光能量转移”原理,从荧光强度的数据和变化即能知道两条悬臂的距离以及镊子开启、闭合的状态。这是一种纳米级器件,可用以开发有几十亿半导体元件的计算机芯片(现今半导体技术只能有几百万个),因而用此技术可制造比当今快1,000倍的计算机。在制作DNA马达时的每一步都是靠DNA的彼此识别,在试管中唯一成分是DNA。另外,DNA不仅是结构材料,而且也作为“燃料”( F链),马达能自给自足,不需要另外的化学试剂。DNA马达的自身装配是另一重要特点。

5 脑科学 ¾ 深蕴奥秘的脑是有待人类攻克的科学堡垒。随着生命科学的飞速进步和其它学科提供的众多理论和方法,现在我们对脑的认识已较前有着质的飞跃,但面临的问题和困难还非常多。目前,人们正在对各种脑功能成象技术、神经网络模型、信息处理和加工、发育神经生物学、学习与记忆、神经退行性疾病的分子病理学、人工智能、复杂系统的数学问题等方面进行着积极的研究,不少国家都投以巨资实施脑科学规划。脑科学的研究可以在从分子到整体各个层次上展开,只有众学科合力攻关才能见效。 最近,美国Bell实验室、MIT 和瑞士的学者在Nature杂志刊登了一篇在硅片上实施神经电路的文章(并配以封面图)[24]。很久以来人们一直在辩论,脑对世界的反应是模拟式的还是数字式的?该篇论文从神经元之间的兴奋和抑制相互作用的原理,提出了“带整流的对称网络理论”并建立了数学模型,然后搭建了相当于16个兴奋神经元环状网络和中间一个抑制神经元的突触联接电路。在这种人工神经元网络上的实验结果表明,在同一处给以输入多个刺激,系统的输出线性增加;但在不同处输入多个刺激时,网络只选择对输入较强的刺激有反应,而输入的较弱的刺激受到抑制。在生物学意义上这和视觉对外界的反应相一致。这表明,脑能同时工作在模拟放大和数字选择两种状态,不像传统电路要么工作于数字状态(如计算机),要么工作于模拟状态(如放大器)。但文章在建立了数学模型时为了网络的稳定性假设了突触联接的对称性,即A神经元到B 神经元联接的强度必需和B神经元到A 神经元联接的强度相等,在神经生物学中难以讲得通,显然今后要拓展到非对称的突触联接。

6 DNA微阵列 ¾ 20世纪后半叶,基因的调节和功能分析大多是对一个个基因分别进行研究的。大约10年前情况开始发生变化,使得我们现在能较迅速和大量地获得众多基因的数据,其中一个主要工具是DNA微阵列的开发[25-27]。DNA微阵列的理论基础是核酸互补链间的碱基配对或杂交,这是早就有的技术。DNA微阵列的新颖和创新处在于将核酸以密集并能精确定位的阵列方式附着在固态基质(通常是玻璃)上,这就使得同时进行众多微量样品的筛选成为可能。DNA微阵列有不同的叫法,如DNA芯片、基因芯片、基因阵列等。它最主要功能是能用来确定基因序列和确定基因表达水平,所以在基因疾病诊断、药物开发和毒性分析、病原分析等应用方面非常有前景。这也就不难理解为什么现在国内外已有不少生物技术公司和研究单位对其积极开发和激烈竞争,因而造成DNA微阵列的方法也多种多样。大致上沿着二条途径发展:(1) 核酸在芯片表面按点阵式固定,然后和带标记的待测样品反应;(2) 在基质表面原位合成20-25碱基的寡核苷酸,再与标记的cDNA等样品杂交。目前在一片1-2 cm的玻片上已能有数千上万个已知序列的基因,可见发展之快。DNA微阵列技术除了生物样品的制备外,还涉及到芯片组装、数据读出、数据分析的信息学软件等。具体方法上包括:用机械手或光刻技术、压电印刷等装DNA微阵列;通过激光共焦显微镜扫描已杂交的芯片;用荧光或放射性同位素标记法读出数据(也可根据质谱读出)等。研究者现在更关心于实验设计、数据分析、微量、基因组分析、表达谱的医学应用等,可以期待,人们即使用一个细胞也能测量出几乎每一个基因的表达水平。

除以上几个方面外,在生物科学的其它众多领域中这种多学科的交叉也非常广泛和深入。可以列举的研究领域还有:

¨ 计算生物学 ¾ 研究复杂生物网络中序列、结构和功能之间的关系。目前最为关注的是生物信息学,它已成为基因组学分析中的最重要的技术,其内容集中在算法、模拟、数据库构建与分析、大范围基因序列的获取、SNP (single nucleotide polymorphism) 分析、蛋白质结构预测、药物分子研究等;

¨ 蛋白质折叠 ¾ 用各种技术测定蛋白质折叠的动力学、蛋白质折叠的理论和预测、蛋白质折叠和疾病的关系等;

¨ 细胞内的信号和交通系统 ¾ 细胞对外界各种刺激响应的分子机理、各条信号途径的时间和空间的动态过程及相互作用、细胞内大分子复合体运动规律的定量研究等;

¨ 生物医学工程 ¾ 特别是组织工程、生物力学、医学测量和成像技术等。

我们对这一发展潮流除予以充分注意外,也应积极推动和大力发展。一方面,优先鼓励“Bio-X”交叉学科的研究,对若干具有我国特色的项目组织力量攻关;另方面也可在若干所大学、研究单位设立“Bio-X”的实体;再有一个重要方面是积极培育和扶持青年力量,包括在大学对大学生和研究生设立相关专业、系统开展有关的讲座和科学报告等。我们在鼓励生物学家要应用当今各种先进科学知识和技术的同时,更热切期待目前从事非生命科学领域的研究者渗透和融入到生物科学的前沿中来。
    The origin of intelligence!

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
5
发表于 2004-7-25 10:25:39 |只看该作者

Postgenomics: From "Bio-X" to "X Biology" (zz)

后基因组时代的交叉科学:从“Bio-X”到“X Biology”
吴家睿
(中国科学院上海生命科学研究院生物化学与细胞生物学研究所,上海 200031)

近年来,随着“人类基因组计划”的实施,生命科学进入了一个“后基因组”(post-genome)时代。在这样一个时代,生命科学关注的范围越来越大,涉及的问题越来越复杂,采用的技术越来越高。这一切使得科学界兴起了一个数学、物理、化学、工程学、计算机科学等非生物学学科与生命科学相互交叉的潮流;出现了一批新型的多学科交叉的研究机构,如美国斯坦福大学的“BIO-X”中心。同时,在这个过程中诞生了许多新的交叉学科。
无独有偶,这种非生物学与生物学交叉的潮流在上个世纪初也出现过。从19世纪末到20世纪初之间,物理学和化学有了很大的发展和完善。那时的科学家相信自然界存在着统一的规律,一切事物都应该遵循,生命也不例外。在这些物理学家和化学家的眼里,生命和非生命一样,都可以通过物理和化学的定律来研究和解释;生物体不存在什么不能被还原为物理化学描述的属性或特征。20世纪40年代,奥地利物理学家薛定谔写下了《生命是什么》一书,从物理学的角度对生命现象进行了详细的阐叙。今天生命科学中的许多重要概念,如“遗传密码”就是那本书里首次提出的。在那段时间,许多物理学家、化学家和数学家纷纷转入到生命科学研究领域,如美国化学家鲍林和物理学家德尔布吕克。在50年代,德尔布吕克的学生沃森和英国晶体学家克里克提出了DNA双螺旋模型。从此,生命科学从过去的描述性学科转变成为实验科学,并形成了许多新的分支学科。
比较两个世纪两次围绕着生命科学兴起的多学科交叉的潮流,我们可以看到许多相似之处,也可以发现明显的不同。也许一个最重要的区别是体现在对新兴学科的命名上。在前基因组时代,其生命科学的交叉学科是以表示数学、物理、化学等学科的名词作为词干,结合上一个代表生命的前缀“Bio-”(源于希腊语“bios”),即“Bio-X”(“X”代表一个学科)。而在后基因组时代诞生的新学科则是以生物学作为词干,其它非生物学学科作为形容词来组成一个复合名词,即“X Biology”(见表一)。
上述讨论并非咬文嚼字,而是希望人们不仅要知其然,还要知其所以然。否则,就有可能陷入16世纪英国思想家弗兰西斯?培根所指出过的一种阻碍人类思考的“市场偶像”,“因为人是通过议论而联结的,语词按照常人的理解使用。因此,选词错误或不当会严重妨碍理解……”。二十世纪的逻辑实证主义和语言哲学也对语言在人类认知中的作用和影响给予了充分的注意。英国哲学家维特根斯坦曾在《哲学研究》中说过,“每个词都有一种意义,这种意义和词相互关联,意义就是词所代表的对象”。
因此,这两种命名系统的不同值得我们深究。对于“Bio-X”而言,我们可以从分析“Biochemistry”入手。根据《大英百科全书》上的定义,“生物化学”是“涉及发生在植物、动物和微生物的化学物质和过程的科学研究领域”。由此可见,“生物化学”被理解为是化学的一个分支,如同“无机化学”一样,都是研究化学物质和过程,只不过前者是以生物体为研究材料,后者是以无机物为研究对象。这里要补充一点,在出现“Biochemistry”之前,早已有了“Biology”这一术语*。所以,可以这样推论,科学家在给这门新学科命名时,是有意识的不采用“Biology”,而是把“Bio-”和“chemistry”结合在一起,组成“Biochemistry”这个新词。
实际上,“Biochemistry”这类术语的形成正是二十世纪初“还原论”思想的一个具体体现。这种还原论思想有两个方面的涵义。首先是认识论方面。在还原论者看来,生命是一种复合体,可以通过分析的方法分解为各元素(成份)和它们的联系。生命被认为是一个线性系统,对低层次事物的理解和基本规律的阐述可以被递推到高层次的事物和活动;也就是说,如果揭示了生物体的组成分子如蛋白质、核酸的结构与功能,就能够了解细胞的活动规律,最终就能在个体水平上解释生命现象。“还原论”的另一层涵义是本体论方面:生命与非生命没有本质上的不同,它们都遵循着统一的物理化学规律;生命从根本上说只是一架精密的机器而已。按照这样的观点,生命体和非生命体的差别只是体现在结构的复杂程度上。
在上个世纪的下半叶,生命科学研究在还原论的指导下,取得了惊人的成绩,成为自然科学发展最快,影响最大的领域。但是,随着对生命的认识的推进,尤其是基因组计划开展以后,科学家的视野已逐渐扩展到生物体内成千上万基因或蛋白质间的相互作用和活动网络。越来越多的科学家认识到,生命并非是过去还原论者想象的那种图象。相反,它是一个复杂的非线性系统,其系统行为是生物体内各种分子相互作用“突生”的一种新属性,是无法从系统的各个组成部分的孤立行为中预测出来的;在生物体不同层次之间的行为不能进行简单的线性递推。也就是说,整体大于部分。
在科学家认识演化的基础上,在20世纪末又一次兴起了多学科交叉的潮流。但这一次唱主角的不再是物理学或化学,而是生物学。所以“Biology”成了词干,而其它学科都成了“形容词”。出现了一种新的命名方式,“X-Biology”。这一表达方式一方面强调生命是一个特定的研究对象,不再是物理学或化学等学科的附属品。另一方面它也强调了非生命学科对生命科学研究的重要性。当前的生物学研究越来越定量化,技术也越来越复杂。新技术的引进常常会带来研究上巨大的突破。所以,在目前这些新兴的交叉学科中,核心是从技术的层面引入非生物学学科。例如,过去的遗传学研究依赖于对单个基因突变的分析,而今天的化学遗传学(Chemical Genetics)则试图利用组合化学产生的巨量的小分子化合物研究基因的功能。这门学科的创始人之一,美国哈佛大学教授斯耐伯曾这样说过:“我们的目标是为每一个基因找到相应的小分子化合物,用它们来分析细胞和有机体的功能。”
有意思的是,在这一次生命科学与其它学科交叉的运动中,扮演主要角色的许多是从事生命科学的研究人员。他们推动了生命科学的进步,也深切地感受到了二十世纪实验生物科学的局限性。正如美国科学院院长,生物学家阿尔伯特在一篇评述文章所说:“对控制生命系统的热力学和动力学因子的深刻的理解,以及把化学和物理学最新发展作为恰当的工具的能力,将是成功的关键。”
由此我们可以断言,这二种对生命科学相关的交叉学科的命名方式体现出人们对生命现象的不同理解和对研究生命的方法的不同要求。


前基因组时代
Bio-X
后基因组时代
X Biology

Biochemistry
Biophysics
Biomathematics
Bioengineering
Chemical Biology
(Chemical Genetics)
Mathematical Biology
Computational Biology
Systems Biology




* 据笔者考证,“Biology”一词的首次使用大约是在19世纪初,而“Biochemistry”则可能是在20世纪初才出现。
(本文发表在《科学》2002年第1期,21-22。)
    The origin of intelligence!

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
6
发表于 2004-7-25 10:27:46 |只看该作者

The Development Strategy of Life Science in China

生命科学发展战略

摘要:20世纪生命科学取得了两次革命性进展。分子生物学的成熟和计算机科学的发展,使人类有能力破译自身的全部密码,由此于1990年启动了“人类基因组计划”。它和“曼哈顿工程”和“阿波罗登月计划”并称20世纪的三大科学计划。到2003年,人类基因组30亿个碱基的序列将全部被测定,接着人类将进入破译遗传密码、研究5-10个基因功能的后基因组时代。该调研报告简要回顾了生命科学20世纪所取得的重大进展和突破,以及新出现的发展趋势和科学热点,并从生物学、农学、医学和生物技术四个方面,阐述了我国生命科学21世纪的发展方向与重点研究领域。   

    20世纪生命科学取得了两次革命性进展,第一次是孟德尔遗传定律的再发现和摩尔根的基因论,第二次是沃森和克里克的DNA双螺旋模型及随后分子生物学飞速发展。分子生物学的成熟和计算机科学的发展,使人类有能力破译自身的全部密码,由此于1990年启动了“人类基因组计划”。它和“曼哈顿工程”和“阿波罗登月计划”并称20世纪绵三大科学计划。到2003年,人类基因组30亿个碱基的序列将全部被测定,接着人类将进入破译遗传密码、研究5-10个基因功能的后基因组时代。那时,包括人自身在内的生命活动的最本质的过程和规律将被阐明。生物信息学不仅在破译遗传密码中发挥了根本作用,还将对蛋白质等生物大分子进行结构模拟和药物设计。在21世纪生命活动的基本过程和规律已经澄清,这为生物技术的腾飞提供了原动力。正在发展的生物信息技术、生物芯片技术、胚胎干细胞等关键技术,加上已经成熟的克隆技术、转基因技术等不仅使生物技术产业成为21世纪最重要的产业,也将深刻改变人类的医疗卫生、农业、人口和食品状况,同时生命科学生物技术的发展也向人类社会和伦理道德提出了严峻的挑战。
    生命科学是研究生命活动的过程、规律以及生命体与环境相互作用规律的科学
    二、生物学
    分子生物学本身在下世纪仍将继续保持蓬勃发展的势头。结构分子生物学将从生物大分子到细胞之间的层次切入。单个生物大分子功能自组装和操纵的研究,将与纳米技术、生物芯片技术等高新技术汇集起来,模拟天然细胞器的功能,发展各种用途分子机械。细胞的两个信息系统,即染色体上的遗传信息系统与细胞质内信号系统(受体、信号传递分子)之间的关系和相互作用将研究细胞生长、分化和功能活动的焦点,并得到迅速发展。
    20世纪生物学最宏伟的《人类基因组计划》从1990年起的顺利实施,大大加速了生命科学各方面的发展。下世纪初,人和其他模式生物(微生物、线虫、果蝇、斑马鱼、拟南芥菜、水稻等)基因组作图和测序将陆续完成。分子生物学研究的重点也将从基因组扩展到蛋白质组。在这种发展形势下,生物学正进入“后基因组时代”(postgenome era),或者说功能基因组时代。
    从总体看来,以基因组研究为核心,在方法学上分析与综合想结合,比较和实验相结合,微观与宏观相结合,来探讨生命的本质和起源,遗传、发育和进化的理论大综合,以及阐明脑高级功能活动,将是下一世纪生物学基础理论研究的大趋势。
    我国生物学在某些方面达到了世界先进水平,如人工合成有活性的胰岛素和tRNA等。改革开放20年来,发展速度更为空前。在学科布局和专业设置上,新建了分子生物学、细胞生物学、神经生物学、生物技术等一批新学科和专业,并创办了相应的研究所(室),为国家培养了大量研究和教学人才。1987年开始实施的《国家高技术研究发展计划,生物技术领域》(简称“863”计划)对促进大学分子生物学实验室装备现代化和实验技术的发展也起了很大作用。面对下世纪世界将进入全球化知识经济时代的形势,我国政府在1997年提出《国家重点基础研究发展规划》(简称(“973”规划),加大了对基础研究投入。瞄准国家目标和国际前沿,在农业、人口与健康、资源和环境等方面逐步实施一批与生物学有关的重大项目。
    然而,我国生物学基础研究总体上落后的状况,并没有得到根本的改善。面对国际生命学已进入后基因组时代,我国生物学基础研究与国际的差距还有更加拉大的危险。
    重点发展方向展望
    21世纪初期对我国生物学在下世纪的发展具有重要的意义。基因组和脑研究将是下世纪初国际竞争的焦点。
    (1)基因组研究
    人类基因组计划预计在2003年获得完全序列图。届时,人类10万个基因的信息及相应的染色体位置将被阐明,成为医学和生物制药产业知识和技术创新的源泉。这是人类自实现登月以来的又一伟大科学创举。目前该计划已揭开了新的面:从基因组与环境相互作用的高度阐明基因组的功能,亦即功能基因组学。为此,需要发展能够在基因组整体水平获取功能信息大规模、并行化分析技术,如生物芯片,以及对数据进行储存、分析、加工和传输的生物信息学。基因组研究的重点将会是:
    ①人类和模式生物的基因组DNA测序。
    ②功能基因组学研究:基因组多样性研究;基因组的表达调控和蛋白产物的功能;比较基因组研究;疾病基因组学研究;作物基因组学研究。
    (2)遗传语言破译
    生物信息学是适应人类基因组信息分析的需要而出现的一门与信息科学、数学、计算机科学等交叉的新兴学科。《人类基因组计划》在完成基因组全部序列(30亿碱基对)测序后,下一步更艰巨的任务是读懂基因组的工作语言--遗传语言破译。这是下世纪自然科学面临的最大挑战之一。其前沿研究领域有:
    1、人基因组信息结构复杂性;序列(特别是非编码区)信息分析;
    2、基因组结构与遗传语言:语法和词法分析;
    3、大规模基因表达谱分析,相关算法、软件研究;基因表达调控网络研究;
    4、基因组信息相关的蛋白质功能分析;
    5、生物信息学中新理论、新方法、新技术和新软件研究。
    在当前基因组信息爆发的时代,建立超大规模计算系统,发展全新的生物信息学的理论、方法,分析这些数据,从中获得生物体结构、功能的相关信息基因组研究取得成果的决定性步骤。
    (3)生物大分子的功能与结构基础
    蛋白质是细胞结构、功能和活性的最主要负责分子。生物大分子之间的相互作用是基因复制和表达调控、信息传递、蛋白质合成、细胞器组装等的基础。阐明生物大分子的功能与结构将从分子水平深入了解细胞生命活动的分子基础,进而更深入的阐明生命的本质。
    1、酶、信号转导分子、细胞骨架蛋白、病毒蛋白等重要蛋白质,特别是膜蛋白、糖蛋白及多分子体系的结构与功能;
    2、光合中心的结构与光合作用超快过程;
    3、RNA功能多样性及其结构特性;
    4、生物大分子相互识别的结构基础(蛋白质-蛋白质;蛋白质-核酸;蛋白质-复合糖类);
    5、蛋白质空间结构预测与分子设计;
    6、大分子自装配与细胞基本结构体系的自组织。
    (4)细胞活动的分子机制及遗传控制
    (一)细胞信息系统及其调控
    染色体构造在细胞周期和发育过程中的动态变化控制着基因按程序表达,由此调节细胞的生命活动。另方面,细胞质内信号系统(受体、信号传递分子等)又将来自内外环境的信号传递到核内,反馈调节染色质的构造和基因的活动。细胞的这两个信号系统的相互作用是细胞生长、分化和功能活动的关键。
    1、基因组DNA荷载的遗传程序,在染色体上的构建方式和操作规则;
    2、染色体(质)在间期核和发育中的动态结构与基因的功能活动;
    3、染色质结构的修饰(DNA甲基化,组蛋白乙酸化、异染色质化)与基因表达程序的组
    编和重组编(精、卵细胞的“印迹”、分化和去分化、全能性的改变和恢复);
    4、细胞发育、分化的信号分子和信号传递通路,以及细胞内各种信号通路(生长、分化、
    凋亡、衰老和变等)的整合。
    (二)发育的细胞和分子机制及遗传控制
    高等动物的构造和功能无论如何复杂,其发育的基本环节仍可归为细胞的生长、分化和凋亡。发育过程的特点是按严格时空秩序进行的一连串细胞间相互作用的因果锁链。而细胞生长、分化的基础是细胞专一的基因的表达调控。发育研究既是生物学问题,又是医学和农业问题。对于生育控制、畸胎和肿瘤发生及组织再生以及农作物产量和品质都有重要意义。
    1、细胞周期和生长的调控;
    2、精子和卵的发生、成熟、受精、着床的分子机制和基因控制;
    3、图式形成、形态发生、诱导作用和器官发生的基因控制;
    4、胚胎干细胞全能性和定向分化的诱导;
    5、植物发育(育性、形态发生和株形等)的分子机制和基因控制。
    (三)生物防御系统的细胞和分子基础
    由于医学和生物学上的重要性,哺乳动物和人的免疫系统的细胞和分子基础已有很深入的研究,分子和细胞免疫已成为目前生物学前沿的热点。植物对病毒、真菌和昆虫等有害生物的侵袭也表现出不同程度的防御能力。但目前国际上对植物防御系统的细胞和分子基础的研究还很初步,缺乏系统的了解。这方面的基础研究对植物保护和抗性育种等农业问题重要性是显而易见的。
    1、免疫细胞的发育、凋亡和调控;
    2、新的功能性免疫分子及其受体(包括分化抗原、粘附分子、细胞因子、拮抗因子等);
    3、自身免疫病发病机理及防治基础研究;
    4、植物防御系统:外源分子的识别,信号传递和防御分子;
    5、防御基因(抗真菌等)的分离和抗性育种的基础研究。
    (5)脑研究
    脑研究是生命科学的重大前沿,受到各政府和社会的高度重视。当前研究的前沿和主要趋势是在分子、细胞和整体水平对脑功能和疾病进行综合研究,并从脑的发育过程了解脑的构造原理。脑影象学技术(PET/fMRI等)能实时显示脑功能活动各部位间的时空关系,对从整体上了解脑功能活动也有重要作用。
    1、视觉、痛觉、神经信息传递、加工、整合及调控;
    2、脑功能活动的细胞和分子基础,包括突触可塑性的分子基础,各种脑细胞的基因表达谱和蛋白质谱等;
    3、脑的发育和老化;中枢神经的再生和修复;神经元的变性和凋亡;
    4、脑的高级功能(学习、记忆、语言、行为)的脑机制及其影象学研究;
    5、脑复杂性的计算生物学、建模及脑功能的非线性动力学研究
    (6)生物多样性及其可持续利用
    生物多样性是人类赖以生存的基础,突出表现在两个方面:第一涉及人类生存环境,第二涉及生物资源的可持续利用。其重点研究领域是:
    1、我国动植物和微生物基础资料和数据的采集和编研;
    2、生物资源的动态变化和可持续利用的对策;
    3、生物多样性的生态系统功能;
    4、受损生态系统结构和功能及恢复和重建的生态学基础;
    5、极端环境下生物物种(动植物和微生物)的适应机理;
    6、我国濒危动植物保护的理论和方法;
    7、种质库、DNA库和NDA文库的建立和长期保存的科学问题。
    (7)生命起源和进化
    生命起源和进化是哲学和生物学共同关心的大问题。目前正在举的进化发育生物学对各门典型动植物的基因组和发育机制的比较研究将阐明形体结构图式形态进化机制,微进化与巨进化的关系,在分子水平促进遗传、发育和进化的理论综合。
    1、前生命化学进化中核酸和蛋白质的共起源;
    2、真核细胞起源问题;
    3、动、植物形态发育的分子机制与形态进货;
    4、基因组进货机制和规律;
    5、动、植物分子进化和分子系统学;
    6、进化过程和机制--进化论的研究。
    三、农学
    90年代以来,上的动植物育种已进入分子水平。朝着快速改变动植物基因型的方向发展,动植物育种的一次新的革命正在到来。根据美英等西文发达国家政府和世界粮农组织的预测,21世纪全球农业的90%品种将通过分子育种手段育成,而品种对整个农业生产的贡献率亦将超过50%。
    80年代兴起了对作物--土壤系统的水肥运行的作用机理及其调控的研究。国际土壤学会将“优化水分养分循环,减少水肥投入,提高资源利用效率,促进农业持续发展”列为重要基础研究领域。近年来,人们已开始研究营养素对特异生物活性物质基因表达各环节的作用。研究营养对基因表达作用是当今动植物营养的发展趋势和研究前沿。
    病原茵的致病机理和植物抗病机理的研究是植物保护研究中一大特点,近来有关防卫体系的研究集中在防卫基因的表达调控上。
    土地资源生产能力持续利用研究是90年代响应可持续发展战略而开展起来的。可持续土地利用的核心是现代土地利用方式对土地资源生产潜力的影响。在研究草原退化,土地荒漠化方面,国际上非常重视选择可对比类型进行长期定位观测。
    针对中国21世纪可持续发展和食物安全以及高产、优质、高效、低耗的现代农业持续发展战略,以科学、合理地利用农业资源、保护生态环境提高农业综合生产力为主要目标,增强我国农业科技自身发展的后劲,使我国农业基础科学达到同期世界先进水平。
    未来的基础农学学科前沿主要是分子生物学和生物信息学。随着现代遗传学和信息论的发展,以及分子生物技术和计算机技术等高新技术的不断改进,将促进以NDA全序列测定为主的基因组学研究的重大突破;在基因组水平上,以特定生命活动为目标,深入探讨相关基因的结构与功能、基因的表达与调控、信息网络与传递等生命科学问题将成为基础农学学科新的前沿和热点。
    基础农学学科的主要发展方向是:
    1、标记、分离、克隆与生殖发育相关的重要产量性状基因、重要品质性状基因以及与抗逆相关的功能基因,培育高产、优质、抗逆的新型动植物品种(系);
    2、研究动植物养分高效利用的代谢生理及分子生物学基础;
    3、动植物病虫害防御技术体系;
    4、研究不同农、林、牧、渔业生态区的资源优化配置与合理布局,解析不同生态系统的结构与功能、退化生态系统的恢复与重建的原理与途径。
    优先发展领域:
    1、动植物重要经济性状的功能基因组学与比较基因组学;
    2、动植物杂交与杂种优势的遗传学基础;
    3、动植物高产、优质、抗逆和养分高效利用的遗传学基础;
    4、动植物遗传资源核心种质构建、新基因发掘与有效利用;
    5、作物抗逆性与水分、养分高效利用;
    6、植物病虫害致致害性变异与寄主防卫分子机制;
    7、重要疫病病原致病性深化的分子机制和宿主免疫机理;
    8、农业资源、环境和生态的系统模型及优化治理;
    9、土壤质量演变规律与土地资源的持续利用。
    四、医学
    近几个世纪以来,基础医学的发展不断由现象向本质,由宏观向微观深入。但是,近年来,人们逐渐认识到,要了解人体这一自然界中最复杂的系统,不仅需要“分析”,而且需要“综合”。正是这种分析与综合一致的思维和学科间渗透交叉推动着基础医学过去、现在和未来的发展。
    重大疾病,如恶性肿瘤、心脑血管疾病、感染性疾病、神经精神病、创伤和消化系统疾病等一直是医学研究的方向与重点。另外,机体正常结构、功能(健康状态)的维持与调节机制也是未来医学研究的重要方面。
    建国以来,我国医学发展举世瞩目,平均预期寿命已从35岁增至69岁。自50年代以来,从沙眼病毒分离到针刺镇痛,从多型肝炎病毒克隆到疾病基因组学研究,无一不浸透着我国基础医学工作者的心血。但不可否认,我国医学研究距国际先进水平还有差距。随着发达国家在本领域投入不断加大,这种差距可能还会加大。
    前沿与学科发展优先领域
    (一)肿瘤、心脑血管病等重大疾病发生发展及其干预措施的分子与细胞机制
    1、重要功能基因与重大疾病相关基因结构、功能与表达调控的研究;
    2、重大疾病相关的蛋白质组学和蛋白、多防结构与功能的研究;
    3、生物信息学、基因芯片、基因治疗及组织工程等高新技术在重大疾病诊断、治疗中的应用;
    4、干细胞(胚胎干细胞、造血干细胞神经干细胞等)的建系及分化。
    (二)神经、免疫、内分泌调节系统在健康状态维持与疾病发生发展中的作用
    5、神经损伤与功能紊乱的病理机理及干预措施;
    6、神经退行性疾病病因学与诊断、治疗技术区;
    7、重要免疫细胞发育分化及其在免疫耐受与免疫应答调节中的作用;
    8、新型免疫调节分子的发现及功能研究:
    9、神经-内分泌-免疫调节网络失调与疾病的关系。
    (三)自然与社会因素对健康的影响及其致病机理
    1、重要感染性疾病病原体致病机理相关的基因组学与蛋白质组学;
    2、新病原体致病机理与干预措施;
    3、外源性化学物的致病机理及监测、预防与诊治技术;
    4、社会-心理因素与健康。
    (四)药物在分子、细胞与整体调节水平的作用机理
    1、药物基因组与蛋白组学研究;
    2、以细胞信号转导途径为靶点的创新药物研究;
    3、多糖、类脂、核酸等生物大分子与药物相互作用研究;
    4、新的内源性活性物质的药理学研究
    (五)中医药学理论体系与实践方法的发展研究
    1、中医学理论在现代医学、生物学研究中的应用;
    2、中草药复方活性成份的药理学研究
    五、生物技术
    本世纪70年代在生命科学领域取得了两项对人类生活和经济活动具有深刻影响技扫术突破,一个是重组DNA技术,一个是淋巴细胞杂交瘤技术。这两项革命性技术的出现,带动了生物技术的迅猛发展,逐步形成了一个全新的现代生物技术群及新兴产业。
    自1982年世界上第一个基因工程药物重组人胰岛素上市以来,经过近20年的发展,世界范围的生物技术产业正在蓬勃兴起,作为高效益、高风险的新兴产业,生物技术产业正在猛烈的冲击着世界经济,并产生巨大的社会和经济效益。生物技术本身可以发展成为具有巨大市场前景的新兴产业,同时可通过提供源头技术和产品,对传统产业进行技术改造和产品更新换代,提高传统产业的经济效益。
    世界生物技术本身发展的总体趋势是:生物技术在经历了第一次浪潮(医药和保健领域)后,迎来了第二次浪潮,即重点发展:(1)农业生物技术;(2)环境生物技术;(3)生物制造和生物处理工艺及能源研究;(4)海洋生物技术研究。目前生物技术的应用已遍及农业食品、医药卫生、化工环保、生物资源、能源和海洋开发等各个领域,显示了它对解决人类所面临的食品、健康、资源、能源和环境等重大问题的巨大作用和市场潜力。
    我国与西方发达国家相比,仍存在较大差距,大约为5-10年。但值得指出的是,我国生物技术研究与开发已在两系法杂交稻、抗虫转基因棉花和玉米、基因工程药物和疫苗、人血液代用品、人重大疾病相关基因研究和动物乳腺生物反应器、农作物组织培养和基因转移、家畜胚胎分隔和试管牛、羊等方面形成自己的特色和优势,并具备与世界发达国家整体竞争与抗衡的能力。
    但是,我国生物技术产品缺乏创新,基本属于仿制,极易丧失发展后劲。因此,我国应高度重视产品和技术的创新,抢占二十一世纪生命科学的制高点。我们必须深刻认识到生命科学的发展和生物技术的发展是相铺相成的,为了迎接生命科学世纪的挑战。更好地参与新世纪激烈的生物技术产业的竞争,必须大力发展关键的生物技术,如,
    (1)基因组学技术;
    (2)生物信息技术;
    (3)基因克隆、重组、表达技术;
    (4)动植物体细胞克隆技术;
    (5)生物芯片技术、微阵列技术(Microarray)和生物传感器的基础研究;
    (6)人工组织与器官研制技术。
    并带动农业生物技术、医药生物技术、环境生物技术、海洋生物技术和工业生物技术的高速发展。
    六、结语
    生命科学由于其对科学发展、社会进步和经济建设具有极其重要的作用,在20世纪得到了空前的重视,取得了丰硕的成果。面向2l世纪,“人类基因组计划”的完成和深入发展,将有可能从更深层次上了解人体生长、发育、正常生理活动和各种疾病的病因及发病机理,并提出防治策略、途径和方法。全球生态环境和生物多样性的保护和利用,对人类生存和世界经济的可持续发展有关键的意义,成为我国赖以实行可持续发展国策和“中国2l世纪议程”的科学基础。生命科学的研究也与国家安全紧密相关,比如基因武器将可能对人类造成不堪设想的危害。生命科学的进步也向数学、物理、化学以及技术科学提出许多新问题、新概念和新的研究领域。生命科学与信息科学、材料科学等的交叉,产生的智能科学和技术,将在下世纪推动智能产业的发展。建议国家和有关部门制定相应的政策和措施,使我国在生命科学世纪的竞争中占有越来越重要的地位。
    (1)基本科学资料的积累、整理和现代化管理;
    (2)制定全国基因组研究和应用的整体规划并加强领导;
    (3)建立农业重大科学工程中心;
    (4)保护医学资源和建立支持条件平台;
    (5)加快建立生物技术风险投资机制和加强知识产权保护;
    (6)加强生物安全性的研究与管理。
    The origin of intelligence!

使用道具 举报

Rank: 5Rank: 5

声望
1
寄托币
6316
注册时间
2003-8-6
精华
3
帖子
12
7
发表于 2004-7-25 10:30:14 |只看该作者

The Statistics Revolution (zz)

审视概率革命
王幼军

 
 

  "概率"这个术语常常具有理论与经验的两重含义,在理论方面主要指概率论以及建立在概率论基础上的统计原理的研究;在经验方面指概率统计原理和方法应用于各个领域的实践。十九世纪以来,概率和统计被广泛地应用于人类的各个知识领域,由此导致这些领域的知识更新和研究方法的重大转变。1914年法国数学家艾米尔.波雷耳在题为《概率》一书中把这种变化称为一场"人们没有意识到的科学革命"。20世纪80年代初期人们更明确地把概率统计所引起的变化称为一场"概率革命"
  概率统计思想带来的各方面的变化是有目共睹的,但是把这种变化称为革命却在西方国家引起了一场热烈讨论,其焦点是十九世纪以来是否可以说发生了概率革命以及怎样理解概率革命。这一讨论反映了一般科学哲学对于数学哲学的影响。参与其中的学者大多依据两种不同的关于科学革命的理论诠释概率革命。第一个理论是托马斯.库恩(Kuhn)的科学革命,库恩于1962年出版的《科学革命的结构》中首先对科学革命提出了最初的理解。另一个是伯纳德.科恩(Cohn)的革命,他于1985年出版《科学中的革命》中对哥白尼以来的种种科学革命作出历史分析,并进一步提出科学革命的四阶段说以及判断科学革命的四条标准。库恩的革命与科恩的革命从根本上说是不同的,它们关于革命的概念有着本质的区别,一个是"科学革命",一个是"科学中的革命",这两个概念并不是文体风格的变化,而是在为研究科学的历史时所提供的两种不同观念的审视方法。两种理论都为概率革命的理解提供了丰富的思想内涵,此文将分别对此作一简略介绍和评说。我们会看到仅从科学革命的角度来探讨概率革命有一定的局限性,在本文的最后一部分将给出作者对于概率革命的主要特征的理解。

一、科恩关于概率革命的观点
  
  在诸多关于概率革命的讨论中,科恩本人的观点尤其引人注目。他在《科学中的革命》中提出判断科学革命的四条标准[1]:第一条是见证人的证言,见证人包括当时的科学家、哲学家、政治学家、新闻工作者、文学家等甚至受过教育的一般人。第二条是后来叙述该学科发生了革命的历史文献。第三条是历史学家、特别是科学史学家和哲学史家的评判。第四条是当代从事该领域研究的科学家的普遍意见。当科恩尝试把这四条标准来判断十九世纪以来概率论和统计学的发展时却遇到了一个问题:即找不到一个完全符合四条革命标准的事件--不管是对当时的观察者、还是参加者,都没有发现有关于概率统计的革命宣言能与拉瓦锡的同时代人对于化学革命的评论相对比,或者与丰特奈尔等对牛顿革命的评论、达尔文及其追随者关于进化论影响的评论等典型的革命事件相对比。也没有在概率论和统计史学家的评述中发现关于革命的舆论。因此前三个关于革命的标准并不适合于"概率革命"。那么这是不是说十九世纪以来并不存在一场由概率思想引起的革命了呢?科恩说不[1],还有第四条标准可应用于概率统计革命,即当今科学家们的一般评论:二十世纪的物理学家、生物学家、心理学家和社会学家、甚至数学家等几乎无一不认识到概率的思想和方法给他们所研究的学科带来的变化已经形成了与过去的思想和传统的明显决裂,没有比用革命更好的词汇来描述这种变化的特征。科恩在其《科学中的革命》中不止一次提到由概率的的引入而为科学带来的的变化。
  其次,科恩一再强调理解"概率革命"不适合在本体论的意义上,而是更应当侧重探讨概率思想在具体科学领域中应用意义上的革命。正如他所说"定量的统计推理的引进导致了自然科学以及十九世纪和二十世纪的社会科学中的思维和方法的根本性的一系列变化。这场革命最引人注目地展现在A.凯特勒的'道德统计学'的工作中。此外作为概率统计引入的结果之一还有医药和公共健康领域的思维方法和基础的转化。这不是在概率论学科之中的传统的革命意义上的'概率革命',而是指由于把概率的思想和方法引入社会的思想和分析、以及医学和公共健康领域而引起的一场革命"。[2]
  最后,科恩认为要回答某一事件是否是一场革命,还有一个强有力的方法就是对公众反对这种新思想的强烈程度加以分析。因为具有革命性的思想大都与旧的思想是相冲突,甚至是不相容的。这一点在十九世纪概率统计的方法广泛应用于自然和社会科学时表现的尤为明显。实证主义哲学家奥古斯特.孔德在《实证哲学教程》一书中对J.伯努利、孔多塞等人把概率论和统计学运用到社会学中的行动大加抨击。约翰.斯图亚特.穆勒也反对概率论及其运用的有效性,当他在《逻辑体系》中说"分析概率论的滥用是数学的真正耻辱"时就表明了他自己的立场。许多科学家、哲学家或者是直接反对概率论和统计学在科学上的运用,或者是对它们的运用表示强烈的怀疑。现代实验生理学的奠基人克劳得.贝尔纳是一位典型代表。贝尔纳在《临床医学绪论》明确提出统计学的运用会"带来空想科学,而不能产生有活力的实验科学,即那些能根据一定的法则控制现象的科学。"
  所以,尽管科恩认为不能从他所定义的一般科学革命的意义上理解"概率革命",但是他最后还是提出了一个多少有些自相矛盾的结论--概率革命是存在的。19世纪由于概率思想和统计方法的应用,社会科学和某些自然科学出现的变化显示出革命性的力量,这一点是任何人也不能够否定的。科恩进一步从他的革命科学的四阶段理论出发,认为在19世纪末统计力学发展以前,那种革命仅是纸面上的革命,直到20世纪初期,以物理学和生物学为开端,概率的思想的引进几乎引起了所有科学发生了质的变化,从而才开始了一场象牛顿的物理学革命、拉瓦锡的化学革命这种意义上的革命。

二、用库恩观点审视概率革命

  当科恩从应用的角度分析概率革命的同时,许多人却尝试着用库恩的理论来解释概率和统计学革命。在库恩诸多的科学革命的观点中,他在"科学革命是什么"和"测量在现代自然科学中的作用"两篇文章中提出的观点最多被人们用来讨论概率革命。
  1988年库恩在"科学革命是什么"的一文[3]中提出的观点是对《科学革命的结构》中所提出的"反常--危机--革命"模式的发展和补充。在这篇文章中,库恩提出了科学革命的三个特征,这些特征不是确定科学革命的精确标准,但它们却是库恩判断某些事件为革命的非常重要的线索。第一个特征是"一系列事件以某种方式结合在一起的转变。"在描述了他最终理解了亚里士多德的《物理学》的经历之后,他写到"细碎片断的知识突然地归门别类,并且以一种新的方式结合在一起,这是我将认为是革命性变化的第一个一般的特征……尽管革命留下了大量的碎片需要整理,但核心的变化却不能经历逐步的过程,而是一步完成的"。在《科学革命的结构》中他曾把这个变化比作心理学式的格式塔转化。第二个特征是他早期论述过的范式的转化及其不可通约性的替换。在这篇文章中库恩这样表述:"革命的特征就是对科学描述和分类的综合变化。这种变化不仅与分类的标准有关,而且也是对对象及其在原来类中的位置的分配方式的再调整,因为这种再调整经常涉及到相互交叉定义的类,所以这种改造必须是全盘的。"第三个特征是"模式、语义或者类推的重要变化??一种在什么与什么是相似的,和什么与什么是不同的这种意义上的变化"
  根据上述特征,在十九世纪初到二十世纪三十年代,可以在概率论及其它的应用中找到许多可以作为革命的侯选事件,例如1844年,凯特勒在读高低地区5738名士兵胸围的直径的总结时突然产生了这样一个想法:生物种类的某种特点的分布恰恰好象聚集于一个客观存在的平均值的误差分布一样。这个发现给人们带来一种惊讶的刺激:广泛的人类现象突然被想象为有规律的东西--作为隶属于概率的计算。尽管这些事件或许未必完全符合三个条件,但是都在某种程度上显示了上述特征。
  在另一篇题为"测量在现代自然科学中的作用"文章中,库恩又提出了"第二次科学革命"的概念[4]:"在1800和1850年之间,在自然科学的许多方面的研究特点有一个重要的变化,特别是在以物理学而闻名的一系列领域内。这个变化就是培根的自然科学的数学化,也既是我称之为第二次科学革命的一个重要的特点"。他强调指出数学化仅仅是第二次科学革命所展示的重要特点之一,还有其它的一些方面重大变化,如19世纪前半叶出现的科学事业规模的大幅度扩展、科学组织规范的重大变化、科学教育的完全重新改造等。这些变化几乎与数学化同样重要的方式影响到全部科学。因此,为了解释19世纪数学化的新科学有别于其他时期的科学还需要某些其它因素。
  哈肯(Ian. Hacking)进一步发展了库恩的观点。他发现第一次科学革命和第二次科学革命等这样的大革命的一个基本特点是它们植根和流行于一个转变了的文化实践和机构的广大范围中。由 此 他 提 出 了一个"拇指法则"(rule of thumb)[5]:每一场大革命必须伴随着新一类机构的产生,这种机构能够集中体现由革命所创造的新的方向。例如,伴随着十七世纪的科学革命立即出现了伦敦皇家学会,并且许多国家的科学院相继成立,如伦敦、巴黎、柏林、彼得堡等。伴随着库恩所称的第二次科学革命也出现了引人注目的机构的成立,1831年,英国科学促进会(简称为BAAS)成立。和原来的皇家学会相比,BAAS是一个更开放、更诚实、运作更有序的机构,它充分向广大会员开放,通过联合地方组织,在不同的城市每年召开会议以"促进科学的发展"。继BAAS以后,类似的组织在其他国家也相继成立,最终通过这些组织的活动整个国家变成科学运动的一部分。
  哈肯发现他的拇指法则可以很好地应用于概率论和统计学。首先是在1830年左右许多统计学会建立起来。第一个建立的是1832年在不列颠科学促进会中附设的统计学部。后来在国际统计活动家凯特勒的促使下,于1835年又成立了有名的伦敦统计学会,此后英国又在曼切斯特、利物瀑、里兹等第先后建立了这类统计学会。而且在一般的科学协会内部也纷纷设置统计分会。其他国家也纷纷模仿英国建立自己的统计学会。1851年在伦敦成立了第一个国际统计组织--国际统计协会,1853年由比利时政府邀请于布鲁塞尔召开第一次会议,此后会议每隔二、三年在欧洲的各大都市轮流召开。从此统计便成了世界性的共同事业。其次国家统计局的建立。在十九世纪以前有许多收集数据的国家办公室,它们主要关心的是税收和征召新兵的数量等数据,这些数据都是保密的,只属于国王或大臣的私人所有。然而,十九世纪出现的国家统计局通过出版年签的方式使大部分数据公开化。所以从统计学对社会的影响程度来说,各个国家统计局的建立是比统计协会更重要的事件。哈肯认为一场大革命必需与社会本质的变革相联系,而国家的某些重大的机构的出现则是社会发生变革的一种象征。尽管一个新的机构并不能造成一场革命,但是,它可以作为评判科学革命的一个必要条件,所以,拇指法则可以作为我们衡量概率的革命性的一个强有力的条件。

三、概率革命的重要的特征--人类思维观念的转变

  综上所述,我们可以看到,上述对于概率革命的理解主要取决于人们对于"科学革命"的理解.而科学革命可以用不同的方式进行定义和表征,作为一个历史概念,它的丰富的涵义为概率革命的探讨提供了不同的方法和丰富的内涵。然而,这些解释均未对这场科学运动作出完备的历史理解和描述,更不足以揭示这场革命的本质特征,即它所导致的人类思维观念的转变。
 从十九世纪初到二十世纪三十年代,概率论尤其是以概率论为基础的统计学的发展和应用异常迅速,这种发展最终导致了人们关于自然、社会和认识人类自身的观念的彻底改变。这种改变最主要表现在三个方面。首先是自然观的改变。在十九世纪初,人们还认为我们所处的世界是一个由严格的因果原理所控制的世界,这种观点也称为决定论。然而到了1936年随着物理学中量子力学的产生,人们认为世界不再是确定性的,但世界也不是完全杂乱无章、无任何规律可谈,而是充满了是有规律可循到的偶然性,这种规律就是概率的原理;其次是人们认识观念的变化:人们所经验的大部分知识包括自然、社会和心理领域等都可以用概率的模型表示出来的观点已成为人们的共识;最后,这种认识观念也影响到每一个人的行为方式:只有当一个行为所产生后果的概率计算出来时,人们才认为这个行动是理性的,信念伴随着概率。于是,风险分析和决策论成为公众判断实际行动的一个重要标准。在现代人的信念体系中,几乎每一个组成部分都以某种方式受着概率统计思想的影响,这种转变是怎样发生的呢?它并非是由某一个人的工作所引起,也不像大多数政治革命那样是在短时间内发生的一场剧变,以下几个主要的转折点可以给我们展示这个转变过程的一个简略而清晰的轮廓。
  首先,拉普拉斯的分析概率论拉开了概率革命的序幕。1812年他的《分析概率论》的出版把概率论推向了一个新的水平。它首先把数学分析系统地运用于概率论,由此导致了概率论发生了质的飞跃。拉普拉斯以前的概率论只能处理诸如赌博中的有限事件的组合问题,自从数学分析引入之后,概率论就可以处理无限个事件发生的问题或者连续的问题,由此才能建立起比较严格的大数定理、中心极限定理、正态分布理论等法则。而这些法则的发现使得概率论走出赌桌旁、应用于比赌博的输赢复杂得多的社会现象提供了可能,并使建立在概率论基础上的统计学的产生成为可能。
  第二个转折点是社会统计工作的展开。自从1789年法国革命以后,法国以及其他一些先后建立起的新兴资产阶级政府讲究"务实的新步伐",各国政府迫切需要有关工农业生产、交通邮电、国际贸易、金融保险等方面的统计资料,以反映国情和国力的实际情况。同时,也迫切需要各种有关人口、消费、犯罪、罢工等方面的统计资料以反映社会生活的变动情况。在1820-1840年间,印刷的数据大量涌现,怎样收集、整理利用、解释、分析数字整理成为统计学家的任务。所以统计学所形成的冲击首先不在自然科学领域,而是即将成为社会科学的领域。当时有一句话是"自然科学要实验,社会科学要统计",所有的社会科学的研究,如果不借助于统计,没有数字说话,就被认为是不完整的科学。如英国于1832年在不列颠科学促进会中附设的统计学部干脆规定:统计学只限于研究人类社会中可以用数字表现的事实。为此,他们只取有关社会与经济现象的数量资料,运用数学方法予以研究,力求社会与经济现象的数量化。这种对数字的崇拜尽管有些狂热,但是它首次使得人类能够从数学的角度审视自身行为、并把它们置于概率论模型下进行研究。
  第三,对数据的规则性的信任也是人类思维观念转化中的一个里程碑。这个转化以凯特勒的工作为标志。凯特勒所处的时代正是经典的自然科学领域结出辉煌硕果的时期,许多研究社会科学的学者常常把自然科学中的方法全盘照抄。凯特勒把拉普拉斯的概率论拿来解释社会现象。凯特勒从研究当时法国、比利时、英国的司法机关的汇编出发,并在1829年和1831年分别发表了两篇研究报告,引起了社会的轰动[6]。在报告中他指出,每年犯罪的次数大体不变,不仅如此,各种类型的犯罪也有惊人的重复性。凯特勒还分析了人的"自由意志"的其他表现,如结婚、自杀等,也得到同样的结果。由此得出"统计数据是有规律的"结论,凯特勒本人以及他的同时代人为这些惊人的分析所震动。从此人们认识到看起来纷繁杂乱的人类社会和自然界一样也是按某种规律运行的,不过人类社会所遵从的规律是概率的规律,任何偶然都是可以"驯服"的。
  第四个转折点是统计法则的独立。如果说凯特勒所做的目标还是寻找隐藏在随机现象中的确定性的因果结构,那么从1875年左右则有了新的变化,这种变化以高尔顿的工作为标志。高尔顿发现了这样一个事实:在身高、智力等方面杰出的父母却少有杰出的后代,这种现象可以用"向平庸回归"的原理来解释。[7]这种原理可以被看作生物特点服从正态分布这一事实的一个逻辑的结果。若简单地把正态分布归结为隐藏的因果结构与这种解释是不相合适的,高尔顿的统计原理是独立于具体事实的,是数学知识的一部分,然而它们并不具备以往数学知识的绝对性、确定性和因果性。高尔顿打破了数学的应用范围仅限于因果关系范围的自然现象的传统观念,这种观念也动摇了机械决定论的统治地位。
  最后一个导致人类思维观念决定性改变的是非决定论的出现。早在1859年麦克斯韦尔就已断定:首要的自然定律是统计学原理。他将这种思想应用于气体运动学的研究,他提出热力学定律可能只是一条概率性的原理,而不是一条绝对性的真理,并且气体的运动速度可看成是遵从一定统计规律的随机变量。借助于这一定律即可以求出以不同速度运动的分子所占的比率或相对频率。1872年玻耳兹曼改进了麦克斯韦尔的推导方程,并使之在数学上更为严密,因此传统上就将上述定律称之为分子速度的麦克斯韦尔??玻耳兹曼分布。然而上述工作是一种纯粹理论性的创造,并在很长一段时间内未引起人们的重视。直到1905年爱因斯坦等人为布朗运动找到了统计学原理的解释,这种解释后来又为法国的彼林用实验方法所证实,于是理论的统计力学终于变为"现实的"。这些研究工作终于使人们相信概率规律可以是自然界的基本规律。后来发展起来的量子论对决定论形成更大的冲击。根据量子理论人们只能观测到概率,未来的概率是可以测定的,但是观测知识本质上是非决定的。从此人们关于自然的观念包括对自然的认识和研究自然的方法等都发生了巨大的变化。
  总之,从概率的思想走出机会性游戏的范围,到随机的驯服,到决定论的衰落,再到非决定论的兴起这一系列的转变构成了人类的思想观念的巨大转变。超越所有烦琐的哲学讨论,从普通公众对自身以及自身所处的自然界和社会的认识的角度来说,这种变化应当毫无疑问构成一场人类思想发展历史中的最具革命性的变化之一,这正是概率革命所蕴涵的最重要的特征之所在。
    The origin of intelligence!

使用道具 举报

Rank: 2

声望
0
寄托币
63
注册时间
2002-3-7
精华
0
帖子
0
8
发表于 2004-8-7 10:38:32 |只看该作者
3ku

使用道具 举报

RE: Life science 几个领域介绍 [修改]
您需要登录后才可以回帖 登录 | 立即注册

问答
Offer
投票
面经
最新
精华
转发
转发该帖子
Life science 几个领域介绍
https://bbs.gter.net/thread-209011-1-1.html
复制链接
发送
关闭

站长推荐

寄托24周年庆,发祝福送寄托币!
寄托24岁生日,邀请寄托的小伙伴在本命年周年庆发出你对寄托的祝福, 可以是简单的一句“生日快乐”, 送出祝福小伙伴将会有寄托币奖励!

查看 »

报offer 祈福 爆照
回顶部