基因组组装:把测序得到的许多短DNA片段(reads)通过重叠关系、配对信息等算法手段拼接起来,重建出尽可能完整的基因组序列(通常先得到连续序列 contigs,再进一步连接成 scaffolds)。在不同语境下也可指这一整套流程与结果。
/ˈdʒiːnoʊm əˈsɛmbli/
Genome assembly can take hours or even days, depending on the data size.
基因组组装可能需要数小时甚至数天,取决于数据量大小。
Accurate genome assembly is essential for identifying genes, structural variants, and evolutionary relationships across species.
高质量的基因组组装对于鉴定基因、结构变异以及比较不同物种的进化关系至关重要。
genome 来自 gene(基因) + -ome(整体、全体),表示“某物的全部集合”;assembly 来自 “assemble(组装、集合)”,原义与“聚集、装配”相关。合在一起,genome assembly 字面义就是“把基因组(序列)组装起来”。