请
登录
后使用快捷导航
没有帐号?
立即注册
已签到,明天再来
签到领寄托币
GO
寄托家园留学论坛
›
论坛
›
寄托专业学术申请版
›
生农医药版
›
生物信息学的现状与展望 from wangfang data
返回列表
查看:
2126
|
回复:
0
[(微)生物]
生物信息学的现状与展望 from wangfang data
[复制链接]
vendor
UID:2190618
vendor
当前离线
最后登录
2024-2-7
在线时间
94 小时
寄托币
892
声望
31
注册时间
2006-2-23
阅读权限
20
帖子
53
精华
0
积分
190
UID
2190618
初级会员
初级会员, 积分 190, 距离下一级还需 160 积分
声望
31
寄托币
892
注册时间
2006-2-23
精华
0
帖子
53
关注TA
加好友
标签
发消息
电梯直达
楼主
发表于 2007-8-17 17:16:11
|
只看该作者
|
倒序浏览
生物
信息学的现状与展望
(The Current Status and The Prospect of Bioinformatics)
中国科学院院士张春霆
(天津大学生命科学与工程研究院天津300072)
摘要: 本文阐述了生物信息学产生的背景,生物学
数据库
,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学
数据
所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。
关键词:人类基因组计划生物信息学
生物信息学产生的背景
有人说,基于序列的生物学时代已经到来,尽管对"序列生物学"这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命"阿波罗计划"的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构,即
氨基酸
序列的增长。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。
数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。
生物学数据库
《Nucleic Acids Research》杂志连续七年在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期中详细地介绍了115种通用和专用数据库,包括其详尽描述和访问网址。迄今为止,生物学数据库总数已达500个以上。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。应该指出,几乎所有这些数据库对学术研究部门或人员来说都是免费的,可以免费下载或提供免费服务。但是鉴于相当多的数据库的经营者们面临着财务紧缺的境地,这种免费的局面还能维持多久就不得而知了。有的数据库,如SWISS-PROT,已开始向商业用户每年收取数千至数万美元不等的使用费。其它数据库暂时还是免费的,但不知是否永远免费。如果一些重要的数据库对学术研究部门开始收费,这对于我国生物信息学的发展是非常不利的。中国是一个基因信息资源大国,我们应当抓紧建设我国自有的数据库,在世界上做出我们自己的贡献,在平等的基础上与国外共享生物信息资源。
生物信息学的主要研究内容
生物信息学主要包括以下几个主要研究领域,但是限于篇幅,这里仅列出其名称并只做简单介绍。
1. 序列比对(Alignment)。
基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础,非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包--BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
2. 结构比对。
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。已有一些算法。
3. 蛋白质结构预测,包括2级和3级结构预测,是最重要的课题之一。
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
4. 计算机辅助基因识别(仅指蛋白质编码基因)。
基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
5. 非编码区分析和DNA语言研究,是最重要的课题之一。
在人类基因组中,编码部分进展总序列的3~5%,其它通常称为"垃圾"DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
6. 分子进化和比较基因组学,是最重要的课题之一。
早期的工作主要是利用不同物种中同一种基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化。以上研究已经积累了大量的工作。近年来由于较多模式生物基因组测序任务的完成,为从整个基因组的角度来研究分子进化提供了条件。可以设想,比较两个或多个完整基因组这一工作需要新的思路和方法,当然也渴望得到更丰硕的成果。这方面可做的工作是很多的。
7. 序列重叠群(Contigs)装配。
一般来说,根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,这就有一个把大量的较短的序列全体构成了重叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。拼接EST数据以发现全长新基因也有类似的问题。已经证明,这是一个NP-完备性算法问题。
8. 遗传密码的起源。
遗传密码为什么是现在这样的?这一直是一个谜。一种最简单的理论认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物最后的共同祖先里,一直延续至今。不同于这种"冻结"理论,有人曾分别提出过选择优化、化学和历史等三种学说来解释遗传密码。随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材。
9. 基于结构的药物设计。
人类基因组计划的目的之一在于阐明人的约10万种蛋白质的结构、功能、相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其3级结构的基础上,可以利用分子对接算法,在计算机上设计抑制剂分子,作为候选药物。这种发现新药物的方法有强大的生命力,也有着巨大的经济效益。
10. 其他。
如基因表达浦分析,代谢网络分析;基因芯片设计和蛋白质组学
数据分析
等,逐渐成为生物信息学中新兴的重要研究领域。这里不再赘述。
与生物信息学关系密切的数学领域
限于篇幅,仅列出它们的名称。统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;计算数学,如常微分方程数值解法是分子动力学的基本工具;群论,在研究遗传密码和DNA序列的对称性方面有重要应用;组合数学,在分子进化和基因组序列研究中十分有用。原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。
与生物信息学密切相关的计算机科学技术
首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。其它诸如数据整合和可视化、
数据挖掘
(Data Mining)、基于Unix操作系统的各种软件包以及人工智能,和一些重要算法的复杂性研究。
生物信息学工业
生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。它既属于基础研究,以探索生物学自然学自然规律为己任;又属于应用研究,它的许多研究成果可以较快或立即产业化,成为价值很高的产品。生物信息学的这一特点在现有的许多学科中几乎是独一无二的。
这里仅举一个例子来说明生物信息学工业的潜力。据报导,只有50名员工的德国Lion生物信息学公司,将通过扫描公共数据库中的序列来发现500个可能的药物作用靶点,以一亿美元的价格预售给德国Bayer公司。又据报导,生物信息学产业的市场在1998年已经达到10亿美元,而到2002年估计可增长到2000亿美元以上。这是一笔巨大的财富,任何政府的科技决策人都不能对此视而不见。NIH已向美国国会建议投资160亿美元在美国建立5~20个将生物学与计算结合起来的中心。法国议会科技决策评估办公室,最近评估了基因工程、生物信息学和组合化学等学科的应用前景及法国的对策。美国出现了大批的基于生物信息学的公司,实施了许多生物信息学研究计划,主要与药物设计,基因工程药物,生物芯片,代谢工程与化学工程密切相关。生物信息学工业是知识经济的一个典型,潜力巨大。
展望与建议
生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。这种预测是十分困难的,甚至几乎不可能。但是人类科学研究史表明,科学数据的大量积累将导致重大的科学规律的发现。例如:对数百颗天体运行数据的分析导致了开普勒三大定律和万有引力定律的发现;数十种元素和上万种化合物数据的积累导致了元素周期表的发现;氢原子光谱学数据的积累促成了量子理论的提出,为量子力学的建立奠定了基础。历史的经验值得注意,有理由认为,今日生物学数据的巨大积累也将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段,所拥有的条件也大体相同,即使我国有关条件差一些,但差别也不大。因此,这是我国生物学赶超国际先进水平的一个百年一遇的极好机会。机不可失,时不再来,鉴于生物信息学在我国生物信息学和经济发展中的重要意义和其发展的紧迫性,因此,由国家出面组织全国的力量,搞个类似"两弹一星"那样的,但是,规模要小的多,花钱也少的多的生物信息学发展计划,不是不可以考虑的。要充分发挥中央与地方,生物学科研究人员等方方面面的积极性。生物信息学研究投资少,见效快,可充分发挥我国智力资源丰富的长处,是特别适合我国国情的一项研究领域。要在大学里建立生物信息学专业,设立硕士点和博士点,培养专门人才。可以组织一大批数学、物理、化学和计算机科技工作者,在自愿的基础上,学习有关的生物学知识,开展多方面的生物信息学研究。经过十几年或更长的时间的努力,逐渐使我国成为生物信息学研究强国,是完全有可能的。(2000年)
回应
0
使用道具
举报
返回列表
RE: 生物信息学的现状与展望 from wangfang data [
修改
]
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
发表回复
回帖后跳转到最后一页
问答
Offer
投票
面经
Q
【问答】美国读博士的话,一般奖学金有多少呀?
A
差异比较大,有些学校是不发暑假的钱,暑假要钱得开课或者申请funding。UC系的好像是36000一年。
Q
申请时推荐人邮箱填错了,给港中深发了邮箱打电话不回,港中文系统更改了显示已发送但推荐人未收到网推咋办
A
港中文可以和小蜜说换邮箱但不换人,我成功了
Q
低绩点,留当地,求建议。
A
建议你去【寄托offer榜】微信小程序,发个投票,我来帮你扩散一下
Q
【瑞典大四在读申请瑞典硕士需要学信网认证吗?
A
没毕业开不出学历/学位证明,只有在线学籍验证报告,交学校出具的在读证明。至于是否提交验证报告,具体要看学校的要求,有的学校...
more
图宾根大学
经济学
MSc
|
24Fall
|
Offer
California State University, Fresno
Computer Science
MSc
|
24Fall
|
被拒
斯德哥尔摩经济学院
Economic
MSc
|
24Fall
|
AD小奖
HEC Montréal
Operations and Supply Chain Management
MSc
|
24Fall
|
Offer
more
NTU 应经 vs. 昆士兰 金数
双非本经管,本科院校国内认可度上限较高华五左右,但就普遍性来说认可度一般(因此申请较为坎坷 ntu应用经济学11月入学一年毕业,读博导向强,回国认可度更高 昆士兰金数7月入学两年毕业,有可能赶不上需要defer,但似乎课程设置更实用?同时我很希望之后在欧美有predoc和读博机会,也许澳洲更quan的项目更好接触到欧洲商学院资源?同时课程更多学时更长推荐信更好要,气候和生活条件似乎也更好一点。 很纠结,望大神指点迷津
是否应该让APS审核验证我未完成的求学经历?
APS审核告诉我说可以自行选择是否认证博士阶段的求学经历,但是由于是不会再完成的学位,所以之后无法再补审。 我是否应该选择认证? (博士阶段绩点比较高;但是我验毕了一年后才选择退学)
北欧转码-Lund隆德大学还是DTU丹麦技术大学
本科土木 目标:留本校继续读PHD≥留当地找工,但最终(数年后)会想回国进外企,不打算永远留在国外 Lund这个专业感觉找工似乎不如AI专业好找?因为是物理计算机数学的交叉专业。Lund比较学术,但不了解此专业读博的难易程度,感觉很交叉,是去年开的新专业,似乎没有zgr前辈,但学校排名qs前百 DTU这个专业门槛很高,但AI找工似乎在丹麦也不是很明朗,qs121
西班牙卡洛斯三世的商业经济与金融硕士offer和庞培法布拉bsm的会计与财务管理硕士该怎么选
本人目前卡三拿到了商业经济与金融硕士学位的录取,这个是硕博连读的专业。庞培拿到了bsm的会计与财务管理的录取,这个是一年制的硕士。我的打算是将来能找到工作留在西班牙,考虑到这一点,目前本人很纠结,不知道该怎么选对我将来比较有利,想来听听大家的意见!
more
Royal College of Art
innovation design engineering
1.自我介绍2.还申请了什么院校3.介绍一个项目4.有没有最喜欢的IDE项目5.未来研究方向
The Hong Kong Polytechnic University
全球时尚管理硕士
1.从什么渠道了解这个专业2.选择这个专业的原因3.自我介绍4.职业规划5.感兴趣的课程6.反问
The Hong Kong Polytechnic University
TED
1.为什么想来TED2.想成为什么样的设计师3.regeneration design4.反问
Lingnan University
可持续环境分析
1.自我介绍2.why LU?why program3.聊一下你的能力4.有没有相关研究经历5.gap这段时间在做什么6.毕业后的...
more
最新
精华
上海开加油费发票
欧洲DIY申请课程描述分享-适用于信息安全/网络安全/计算机科学等
关于滑铁卢下offer时间
【资讯】2025fall UCAS新增可查询往届学生A-LEVEL成绩
【资讯】澳洲签证认可托福成绩
西餐和红酒爱好群
本科经济统计学申请硕士可以选什么方向
【资讯】法国高商24fall项目
【干货】美国留学费用盘点
2024香港科技大学商学院市场营销系PhD夏令营
【资讯】科廷大学最新消息
能否在申请「授课型」硕士时说我的职业规划是「做学术」
【资讯】澳大利亚国立大学开学季申请日期
关于econ mphil课程匹配度的问题
【资讯】北京师范大学-香港浸会大学联合国际学院(UIC)新增授课型研究生课程
太子學生公寓8月中招女生,超值優惠
瑞典硕士DIY申请攻略之名校介绍——LU隆德大学/LTH隆德工学院
瑞典硕士DIY申请攻略之名校介绍——CTH查尔姆斯理工学院
瑞典硕士DIY申请攻略之名校介绍——KTH皇家理工学院
瑞典硕士DIY申请攻略——申请指南(完全版)
二签sds通过,大龄单身无业。
关于UChi MACRM的一些情况
【干货】教你如何写MBA简历
【经验贴】欧洲申博血泪史:7个全奖博士offer,却gap了两年(附各国签证风险盘点)
普签 / 大龄 / 本科二学位 / DIY
新加坡MBA(NUS, NTU, SMU)申请心得及攻略
GMAT这么有用吗?跟大家讨论讨论我发小的年薪三级跳
【数据库】自用经济跳板评价汇总 23fall申请总结
加拿大法学院JD申请,学习+找工作经验答疑帖
美国ny bar备考经验分享
如何在150小时内通过加州司法考试
【干货】港校MSc上岸PhD的经验分享
0
转发
转发该帖子
生物信息学的现状与展望 from wangfang data
https://bbs.gter.net/thread-724097-1-1.html
复制链接
发送
报offer
祈福
爆照
积分 0, 距离下一级还需 积分
回顶部