生物统计与生物信息的区别与联系是什么呢?

如题所述

嗯,我博士的院系为生物统计与计算生物学系,从开始进入生物信息这个领域,同时伴随而来的名词有:生物信息学,计算生物学,系统生物学,生物统计学~我没有严格考证过这些名词的由来,就我五年的博士生活中的学习过程,谈一下这些学科的异同吧。
我上过生物系的生物信息学,计算机系的生物信息学,生物系的生物统计学,生物系的计算生物学,旁听过医学院的生物统计学和流行病学,旁听过生物系的人类进化遗传学,旁听过数学系的系统生物学,自学过数学系的概率论~~在学习过程中,学到的是:
*生物学的生物信息学:首先是讲进化,做序列比对,blast,构建进化树;然后,讲基因功能,基因功能富集分析等。侧重的是,将进化中的生物学原理,参数如何设置,软件如何使用,如何将这些软件应用到生物学问题。
*计算机系的生物信息学:首先讲的也是进化,但是,讲的是算法设计;然后讲了很多马尔科夫链,HMM模型,序列比对中的blosum62矩阵是怎么来的,如何加快计算效率,如何降低空间存储等等。侧重的是,如何设计合理的算法,给生物学的人使用。
*生物学的生物统计学:就是系统的讲统计学,从描述数据,到假设检验,到参数估计,印象中,讲假设检验的篇幅很多,每个检验,都会有生物学的案例,让我们明确什么是H0,什么是Ha,然后p-value的解释是什么,参数估计讲的很少。回过头看看,觉得讲的还是很浅显的,但是它是生物学专业必修课,全院学生对我们实验室助教出的题目,都是怨声载道(还记得一个小插曲,为了防止抄袭,我们给每个人发的题目是一样的,但是原始数据中部分不一样,哈哈,钓上钩的真不少。。。)另外,我们让学生使用的工具是R,但是我第一次学的时候,教的是minitab 。。。我经常在生统课程帮导师上一节实践课,主要讲的是表达数据分析流程,找差异表达基因什么的。
*生物系的计算生物学:这个是我觉得很有收获的课程,记得刚开始讲的也是蛋白质家族进化,后来是机器学习算法,聚类和分类,再后来,由于老师本身是做miRNA靶序列预测的,所以讲了很多HMM模型等。通过这个课程,我可以开始写一些小的机器学习算法程序,也可以做一些算法设计。和计算机系的生物信息学课程不一样的是,他还是以生物学问题出发,但是,开始有了一种设计“黑匣子”的感觉,比如,筛选一个gene group,做癌症分型,输入的是这个gene group的基因表达量,输出的是分型结果,详细的算法和模型在“黑匣子”里面。这个还是很有成就感的。(后来,学数学的lg说,这不就是数学建模嘛。。。)
*旁听过的医学院的生物统计学和流行病学:在国外交流的时候旁听的,本以为自己统计学很好,但是,蒙圈了,首先,他们用SAS,然后,他们研究的问题太难了,有些术语我到现在都没搞清楚,什么非线性纵向数据模型,复杂的参数估计等等~让我明白的一点是,生物学的生统,就是给平时用用的基本检验而已,真正的生统,水好深。。。数学功底要强。
*自学过的数学系的概率论:于是,我开始自学数学系的概率论,但是,和我想象的又不一样,概率论,很多都是生物学的生统内容的深层次数学基础,可能我也只读了一本最浅显的吧,讲各种分布的来源,数学期望,偏差估计等,另外,还有中心极限定理的证明,确实,很多都是以为浅显易懂的道理的严格数学证明,虽然,对我一个生物背景的人没啥用,但是,有一种非常舒服的恍然大悟的感觉。
*旁听过生物系的人类进化遗传学:院长的课程,面对生物系的学生,但是院长当年数学特别牛,所以,如果数学基础不好,做群体遗传学,略吃亏。具体内容很久远了,不记得了,基本上是做祖源追溯,进化中的时间估计等。
*旁听过数学系的系统生物学:数学系的暑期课程,厚着脸皮去了,但是,我竟然听懂了大约60%吧,我印象很深刻的是,讲了回归中的penalty function,然后我学了LASSO回归;后来学了SVM中的核函数;还有Gibbs samping,MCMC;还有时间序列中的Granger因果推断等等。另外,系统生物学我读过一本书,是做网络的,用ODE的方法构建有向网络。很有意思。

可能是我对生物信息学这个领域的概念很模糊,所以,各种课程都去了解了一下,来自于数学系、生物系、计算机系、医学院等等,哎,学了这个多,各个方面的技术都是略懂些皮毛吧,但是到现在也没想清楚自己真正想做什么~~呵呵

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-11-28

生物统计学(Biostatisics)和生物信息学(Bioinformatics)是两个较为相近的专

业,都是通过数学、统计、计算机的方法来研究生物学的问题。但是两者还

是有区别。

生物统计学(Biostatistics)的重点在于 statistics,也就是说从描述数据,到假设

检验,到参数估计,都是统计学的知识,只是以生物学为案例。主要处理可

转化为矩阵的生物数据,多使用 R、SAS、Matlab,如 GWAS 模型。该专业

通常开设在 Public Health 学院,多数都会与其他学院有联合授课。

生物信息学(Bioinformatics) 通常开在生物系或者计算机系。生物系的生物信

息学主要研究进化,做序列比对,blast,构建进化树;其次是研究基因功能,

基因功能富集分析等。侧重的是,将进化中的生物学原理,参数如何设置,

软件如何使用,如何将这些软件应用到生物学问题。计算机系的生物信息学

研究的是进化的算法设计,会涉及多马尔科夫链,HMM 模型,序列比对中的

blosum62 矩阵是怎么来的,如何加快计算效率,如何降低空间存储等等。侧

重的是,如何设计合理的算法,给生物学的人使用。简而言之,生物信息学

的重点是 computer science,主要处理序列数据,多使用 Perl、Python、C,如

序列拼接。

本回答被网友采纳
第2个回答  2017-11-28

生物信息是数学,生物知识与计算机软件结合的交叉学科(注意学科顺序),生物信息侧重于算法研究,用于研究解释各种组学(基因,蛋白,转录组学等)数据的变化特征,其学科特点还是做基础研究,多挖掘出点新东西,即使这些新东西没经过验证。
生物统计是卫生生物领域与统计理论知识相结合的交叉学科,侧重将理论应用到实际领域,学科特点是用一些模型来解释各变异,非常看重p值,侧重验证有无统计学意义。比较侧重于根据实际情况调整模型,使之拟合,用于解释实际。 目前国内较少有生物统计这一二级学科,一般生物统计归入卫生统计或医学统计,也有的院校将生物统计归入生物信息系,不过归后的学科方向比生物统计更深更窄,变成遗传统计学。
生物信息和生物统计的区别类似于数学与统计学的区别。