人类基因组计划(HGP)在2001年宣布对人类的全基因组进行了测序,获得了近乎完整的人类DNA。人类估计有大约20,000个编码蛋白质的基因,占人类基因组的1.5%,剩余的98.5%都为非编码序列。然而非编码区广泛存在于真核生物中,且众多的非编码区在生命活动中具有非常广泛的调控作用。因此一项名为ENCODE-“DNA元件百科全书”的计划(encyclopedia of dna elements)于2003年9月由美国国立人类基因组研究所启动,开始了对基因组剩余部分(非编码区)的解析的工作。全世界11个国家80家科研机构35个小组的研究人员通过了十几年的奋斗产生了许多令人惊讶的发现,提供了详尽的非编码功能单位的功能图谱,并表示在98%的非编码基因中有87%是功能性的。