基因組組裝是指將遺傳序列中的許多小片段整合成一個連貫的整體,代表一個有機體的整個基因組。這是生物信息學領域的一個主要焦點,為此,有各種各樣的基因組計劃。基因組組裝已經被用來分析許多物種的基因組,包括人類、植物...
基因組組裝是指將遺傳序列中的許多小片段整合成一個連貫的整體,代表一個有機體的整個基因組。這是生物信息學領域的一個主要焦點,為此,有各種各樣的基因組計劃。基因組組裝已經被用來分析許多物種的基因組,包括人類、植物、動物和細菌。

一個基因組可以被壓縮成一個大染色體,也可以分裂成多個。分析一個生物體的基因是一個漫長的過程,基因組組裝是第一步,許多其他的分析方法都是建立在成功組裝的基礎上的,沒有它基因的鑒定就無法進行,即使在基因被發現之前,成功的基因組組裝仍然可以為以后的分析產生許多有用的信息,包括基因組的大小、結構和基因的結構一般組成。

基因組組裝是生物信息學領域的一個主要焦點,為此目的存在著各種各樣的基因組計劃。基因組組裝的過程就像在沒有圖片或有用形狀作為指導的情況下把一個拼圖拼在一起。當遇到第一個基因組片段時,稱為原始讀取,很少有任何跡象表明某個片段的去向,甚至是它如何定位。每一個片段的編碼方式都類似于四個DNA堿基,縮寫為a、C、G,基因組可以被壓縮成一個大的染色體或分裂成許多染色體。也不能保證某些原始讀數不是同一基因組區域的重復,這就意味著沒有第一眼看上去那么獨特,基因組結構的一般知識在開始組裝過程時是非常寶貴的盡管不同物種之間的基因組明顯不同,但特定基因組類型遵循一定的規則,這些規則可以應用于將同一類型的另一個基因組組合在一起。例如,如果某一特定類型的有機體在發現基因的附近總是有一個特定的模式,那么人們可以合理地假設,在組裝時另一種與之類似的有機體,發現這種模式會向附近的基因發出信號。在更大的范圍內,許多細菌的基因組都有一條圓形染色體,因此我們可以合理地預期,一種新細菌的所有原始讀數都會以某種方式組合在一條染色體上。以這種方式應用一般遺傳知識可以使研究人員將開始對成千上萬的數據進行分析。還有許多其他方法可以用于基因組組裝,包括計算預測和人工比較。不管是哪種方法,基因組組裝是一項耗時且困難的大型工作,因為它是生物體未來許多基因分析的基礎,因此幾乎沒有出錯的余地。