已签到,明天再来
签到领寄托币
GO
寄托家园留学论坛
›
论坛
›
寄托专业学术申请版
›
生农医药版
›
生物信息学的现状与展望 from wangfang data
返回列表
查看:
2446
|
回复:
0
[(微)生物]
生物信息学的现状与展望 from wangfang data
[复制链接]
vendor
UID: 2190618
vendor
当前离线
最后登录
2025-3-17
在线时间
95 小时
寄托币
904
声望
31
注册时间
2006-2-23
阅读权限
20
帖子
57
精华
0
积分
202
UID
2190618
初级会员
初级会员, 积分 202, 距离下一级还需 148 积分
声望
31
寄托币
904
注册时间
2006-2-23
精华
0
帖子
57
主页
发消息
发表于 2007-8-17 17:16:11
|
显示全部楼层
生物
信息学的现状与展望
(The Current Status and The Prospect of Bioinformatics)
中国科学院院士张春霆
(天津大学生命科学与工程研究院天津300072)
摘要: 本文阐述了生物信息学产生的背景,生物学
数据库
,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学
数据
所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。
关键词:人类基因组计划生物信息学
生物信息学产生的背景
有人说,基于序列的生物学时代已经到来,尽管对"序列生物学"这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命"阿波罗计划"的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构,即
氨基酸
序列的增长。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。
数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。
生物学数据库
《Nucleic Acids Research》杂志连续七年在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期中详细地介绍了115种通用和专用数据库,包括其详尽描述和访问网址。迄今为止,生物学数据库总数已达500个以上。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。应该指出,几乎所有这些数据库对学术研究部门或人员来说都是免费的,可以免费下载或提供免费服务。但是鉴于相当多的数据库的经营者们面临着财务紧缺的境地,这种免费的局面还能维持多久就不得而知了。有的数据库,如SWISS-PROT,已开始向商业用户每年收取数千至数万美元不等的使用费。其它数据库暂时还是免费的,但不知是否永远免费。如果一些重要的数据库对学术研究部门开始收费,这对于我国生物信息学的发展是非常不利的。中国是一个基因信息资源大国,我们应当抓紧建设我国自有的数据库,在世界上做出我们自己的贡献,在平等的基础上与国外共享生物信息资源。
生物信息学的主要研究内容
生物信息学主要包括以下几个主要研究领域,但是限于篇幅,这里仅列出其名称并只做简单介绍。
1. 序列比对(Alignment)。
基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础,非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包--BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
2. 结构比对。
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。已有一些算法。
3. 蛋白质结构预测,包括2级和3级结构预测,是最重要的课题之一。
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
4. 计算机辅助基因识别(仅指蛋白质编码基因)。
基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
5. 非编码区分析和DNA语言研究,是最重要的课题之一。
在人类基因组中,编码部分进展总序列的3~5%,其它通常称为"垃圾"DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
6. 分子进化和比较基因组学,是最重要的课题之一。
早期的工作主要是利用不同物种中同一种基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化。以上研究已经积累了大量的工作。近年来由于较多模式生物基因组测序任务的完成,为从整个基因组的角度来研究分子进化提供了条件。可以设想,比较两个或多个完整基因组这一工作需要新的思路和方法,当然也渴望得到更丰硕的成果。这方面可做的工作是很多的。
7. 序列重叠群(Contigs)装配。
一般来说,根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,这就有一个把大量的较短的序列全体构成了重叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。拼接EST数据以发现全长新基因也有类似的问题。已经证明,这是一个NP-完备性算法问题。
8. 遗传密码的起源。
遗传密码为什么是现在这样的?这一直是一个谜。一种最简单的理论认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物最后的共同祖先里,一直延续至今。不同于这种"冻结"理论,有人曾分别提出过选择优化、化学和历史等三种学说来解释遗传密码。随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材。
9. 基于结构的药物设计。
人类基因组计划的目的之一在于阐明人的约10万种蛋白质的结构、功能、相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其3级结构的基础上,可以利用分子对接算法,在计算机上设计抑制剂分子,作为候选药物。这种发现新药物的方法有强大的生命力,也有着巨大的经济效益。
10. 其他。
如基因表达浦分析,代谢网络分析;基因芯片设计和蛋白质组学
数据分析
等,逐渐成为生物信息学中新兴的重要研究领域。这里不再赘述。
与生物信息学关系密切的数学领域
限于篇幅,仅列出它们的名称。统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;计算数学,如常微分方程数值解法是分子动力学的基本工具;群论,在研究遗传密码和DNA序列的对称性方面有重要应用;组合数学,在分子进化和基因组序列研究中十分有用。原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。
与生物信息学密切相关的计算机科学技术
首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。其它诸如数据整合和可视化、
数据挖掘
(Data Mining)、基于Unix操作系统的各种软件包以及人工智能,和一些重要算法的复杂性研究。
生物信息学工业
生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。它既属于基础研究,以探索生物学自然学自然规律为己任;又属于应用研究,它的许多研究成果可以较快或立即产业化,成为价值很高的产品。生物信息学的这一特点在现有的许多学科中几乎是独一无二的。
这里仅举一个例子来说明生物信息学工业的潜力。据报导,只有50名员工的德国Lion生物信息学公司,将通过扫描公共数据库中的序列来发现500个可能的药物作用靶点,以一亿美元的价格预售给德国Bayer公司。又据报导,生物信息学产业的市场在1998年已经达到10亿美元,而到2002年估计可增长到2000亿美元以上。这是一笔巨大的财富,任何政府的科技决策人都不能对此视而不见。NIH已向美国国会建议投资160亿美元在美国建立5~20个将生物学与计算结合起来的中心。法国议会科技决策评估办公室,最近评估了基因工程、生物信息学和组合化学等学科的应用前景及法国的对策。美国出现了大批的基于生物信息学的公司,实施了许多生物信息学研究计划,主要与药物设计,基因工程药物,生物芯片,代谢工程与化学工程密切相关。生物信息学工业是知识经济的一个典型,潜力巨大。
展望与建议
生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。这种预测是十分困难的,甚至几乎不可能。但是人类科学研究史表明,科学数据的大量积累将导致重大的科学规律的发现。例如:对数百颗天体运行数据的分析导致了开普勒三大定律和万有引力定律的发现;数十种元素和上万种化合物数据的积累导致了元素周期表的发现;氢原子光谱学数据的积累促成了量子理论的提出,为量子力学的建立奠定了基础。历史的经验值得注意,有理由认为,今日生物学数据的巨大积累也将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段,所拥有的条件也大体相同,即使我国有关条件差一些,但差别也不大。因此,这是我国生物学赶超国际先进水平的一个百年一遇的极好机会。机不可失,时不再来,鉴于生物信息学在我国生物信息学和经济发展中的重要意义和其发展的紧迫性,因此,由国家出面组织全国的力量,搞个类似"两弹一星"那样的,但是,规模要小的多,花钱也少的多的生物信息学发展计划,不是不可以考虑的。要充分发挥中央与地方,生物学科研究人员等方方面面的积极性。生物信息学研究投资少,见效快,可充分发挥我国智力资源丰富的长处,是特别适合我国国情的一项研究领域。要在大学里建立生物信息学专业,设立硕士点和博士点,培养专门人才。可以组织一大批数学、物理、化学和计算机科技工作者,在自愿的基础上,学习有关的生物学知识,开展多方面的生物信息学研究。经过十几年或更长的时间的努力,逐渐使我国成为生物信息学研究强国,是完全有可能的。(2000年)
使用道具
举报
返回列表
RE: 生物信息学的现状与展望 from wangfang data [
修改
]
高级模式
B
Color
Image
Link
Quote
Code
Smilies
|
添加附件
点击附件文件名添加到帖子内容中
描述
发表回复
回帖后跳转到最后一页
问答
Offer
投票
面经
Q
【问答】港科大广州分校的PHD如何?
A
据说没有留学认定,港中深和港科广好像都没有。
Q
有没有本专业绩点不高,成功转到经济学或者商科方向的学长学姐呢?
A
这是直接申博还是申硕呢?其实点进来之前光看题目我想说比如荷兰某些学校的经济学或者商科的硕士,如果转跨可能需要先修个pre-ma...
Q
【问答】申请米理和都理需要考gre吗?
A
欧陆匹配比较重要,GRE看官网的项目要求
Q
24fall港中文jd申请
A
成功率挺大的,建议你看看教授情况,和同专业的教授多聊聊,也许有帮助
Q
请教同学们美本大三可以转去哪些亚洲或中东地区的学校直接申请硕士就读吗?
A
除了新加坡,留学都小众。自己多动手吧
more
丹麦技术大学
HCAI
MSc
|
26Fall
|
被拒
亚琛工业大学
软件工程硕士 Master of Software Engineering
MSc
|
25Fall
|
Offer
查尔姆斯理工大学
MSc Sound and Vibration
MSc
|
26Fall
|
被拒
格拉斯哥大学
MSc Computing Science
MSc
|
26Fall
|
Con Offer
more
港校offer选择与决策
我是中9本科,加权均分84,一段科研,有一篇论文产出,还有一段实习,我未来打算进大厂做后端开发。 我现在有港科大的大数据offer,留位费10w,交了我就不会选择其它学校了,留位费的ddl是10.25,我有必要等港中文的ie,cs,或者直接放弃这个offer,然后我去申请港大的cs或者ntu的cs,uu觉得怎么样做比较好?
欧洲Econ项目选择
经历了一个颇为艰难的25fall申请,勉强拿到了几个offer,想求助一下选校的问题。本人坚定未来读博,目标是欧洲PhD。下面是拿到的几个offer,希望各位前辈大佬给点宝贵的意见。 1. Bonn econ msc(2yr):波恩的声誉很好,实力很强,但是这貌似不是一个跳板项目?每届大概有一百多人,据说必须卷到1.5以上才能有好点的申请结果。此外,bonn前两天发了一个招聘ra的邮件,只要五个人,不知道概率怎么样。 2. Collegio Carlo Alberto master econ (1yr):都灵的一个跳板项目,cohort很小,往年基本都是意大利学生,能推到tse这种很好的PhD。但是好像没有中国人的案例,不知道会不会像其他意大利项目那样中国人和本地人申请结果差距很大。 3. Nottingham econ mres/PhD (1+4):整合制项目,只要第一年及格就能升PhD,诺丁汉的econ实力也不错。过去是有一部分学生能拿奖,问题是supervisor教授告诉我,这两年诺丁汉已经取消了奖学金……如果要去,就只能当成一年的mres跳板硕,但不知道推力怎么样。据学长说,今年有国人这样做,拿到了qmul的带奖PhD,不过可能是个例。 bg:985国贸本,港三一年硕+1yr full-time ra,gpa普通,无发表。
德国econ录取选择
波恩和曼海姆econ的选择,目前个人不排斥读博也不排斥就业,所以很纠结. 曼海姆是选课较为自由,据说就业支持好,校友资源较好,靠近法兰克福; 波恩传统econ学术路线,走学术的话上限较高。 喜欢偏向计量统计一些的方向。
kth cs or 索邦 digit?
本人倾向找工,大概率不读博,下面是各方面的考量: 1?? 当地认可度:kth 在北欧的认可度肯定是第一档;索邦之上在法国还有工程师,本地认可度会有影响 2?? 回国:俩学校 qs 差不多 3?? 专业:索邦的 digit 是 network 方向,而且听说偏理论,可能没有什么对口工作?kth选个软工 track 找个 sde 工作应该还可以 4?? 语言:学了一年法语,再学一年差不多B2,但是瑞典毕竟可以通行英语... 5?? 留学体验:索邦在巴黎市中心,生活肯定会比斯京好很多
more
香港中文大学
timeline: 11.15- 12.18面试-12.23 offer时长:5分钟【那天面试官前面人比较多,晚了几分钟】工具:Zoom 提...
麻省理工学院
我这边正在找在海外的华人做跨境电商代理,我们的产品有 衣服鞋子,首饰,玩具。陶瓷,枫叶雕刻这些。(海外...
香港大学
HKU教育学硕士Med网申时材料准备相对比较简单 有一段时间可以持续修改11月中旬递交 12月左右过期不能再...
杜克大学
给我面试的是Oleg,一开始就告诉我受邀面试的都是finalist,然后恭喜我进入最后阶段!他还告诉我这个面试不...
more
最新
精华
嗖嗖嗖送狗
好老婆工会给你
新人报道多多关照
新人来报到啦~
11.24 19:00 | 港教大 全球高等教育文学硕士线上宣讲会等你了解!
【征稿】2026年纺织工程国际研讨会 (CTSE-S)( EI Compendex)
【征稿】2026年未来通信技术国际研讨会(FCT 2026)
招聘外贸订单对接员
招聘外贸运营专员
2025年最新最全多邻国测试的全面介绍,看完这篇文章就够了!
高管营销CMO课2025排行榜:北京大学项目正规权威首选
多邻国英语测试究竟是什么?
多邻国考试前电脑如何设置?要关闭哪些程序?
11.20 19:00 | 7大热门计算机类课程教授亲临现场!港城大计算学院线上宣讲重磅来袭
港中文比较及公众史学|让历史“活”起来的跨界玩家
闭眼入的正规研修班,北大 CMO 项目:最硬核的底层逻辑 + 实战工具
25fall econ phd经验总结 以及关于hku ars的情况
phd选校-选导师-材料准备-面试全流程分享
50个小时GRE出分321自学经验
七大步骤手把手教你DIY申请香港研究生
从普通211工科到美国Econ PhD
UT Ausitn MA Econ 就读体验
六级540-首考101-备考托福经验
非法本(财务)申请cuhk llm(cbl)经验贴
开源了一份超全DIY申请总结攻略!来自24fall几十位学长学姐的礼物
【申请心得】我的政治学、传播学、计算社会科学美国硕士项目申请心得
瑞典硕士DIY申请攻略之名校介绍——SU斯德哥尔摩大学
瑞典硕士DIY申请攻略之名校介绍——CTH查尔姆斯理工学院
网上核实永居+walkin申请特区护照+walkin注销户口(广州)+申请回乡证
关于hku的两个跳板项目(theory/advanced research)
普签 / 大龄 / 本科二学位 / DIY
毕业工签踩大雷 - unauthorized work before submitting PGWP - 附解决办法
0
0
转发
转发该帖子
生物信息学的现状与展望 from wangfang data
https://bbs.gter.net/thread-724097-1-1.html
复制链接
发送
积分 , 距离下一级还需 积分
回顶部