基因组注释 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释。
基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。从基因组序列预测新基因,现阶段主要是3 种方法的结合:
(1)分析mRNA 和EST数据以直接得到结果;
(2)通过相似性比对从已知基因和蛋白质序列得到间接证据;
(3)基于各种统计模型和算法从头预测。
对预测出的基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基因注释:
(1)序列数据库相似性搜索;
(2)序列模体搜索;
(3)直系同源序列聚类分析。
扩展资料:
基因注释重大突破:
1、中国科学院水生生物研究所葛峰研究员学科组利用蛋白基因组学的研究策略和方法,成功对单细胞光合真核生物三角褐指藻的基因组进行了深度注释,完成了三角褐指藻的蛋白质组精细图谱,并建立了完整的真核生物基因组深度注释实验技术和分析流程。
该研究成果的取得,有望进一步推动蛋白基因组学在生命和健康领域特别是精准医学方面的应用。
2、美国加州大学旧金山分校研究人员发现,GABP蛋白的一种特定成分GABP-β1L,是与端粒酶逆转录酶(TERT)启动子突变相关的胶质母细胞瘤细胞不受控制地分裂、繁殖的关键。
他们10日在《肿瘤细胞》杂志上发表论文称,新发现提供了一个很有前途的用药靶点,对未来胶质母细胞瘤及其他多种与TERT启动子突变相关癌症的治疗具有重要意义。
参考资料来源:百度百科-基因组注释