TWI564742B - Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media - Google Patents

Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media Download PDF

Info

Publication number
TWI564742B
TWI564742B TW103129043A TW103129043A TWI564742B TW I564742 B TWI564742 B TW I564742B TW 103129043 A TW103129043 A TW 103129043A TW 103129043 A TW103129043 A TW 103129043A TW I564742 B TWI564742 B TW I564742B
Authority
TW
Taiwan
Prior art keywords
chromosome
predetermined
ratio
internal reference
relative
Prior art date
Application number
TW103129043A
Other languages
English (en)
Other versions
TW201608405A (zh
Inventor
xiao yu Pan
sheng pei Chen
Xi Zeng
xu chao Li
Chun Lei Zhang
Jing Guo
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to TW103129043A priority Critical patent/TWI564742B/zh
Publication of TW201608405A publication Critical patent/TW201608405A/zh
Application granted granted Critical
Publication of TWI564742B publication Critical patent/TWI564742B/zh

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

確定胎兒染色體非整倍性的方法、系統和計算機可讀介質
本發明涉及生物醫學領域,具體的,涉及產前診斷領域,更具體的,本發明涉及確定胎兒染色體非整倍性的方法、系統和計算機可讀介質。
染色體(chromosome)是細胞內具有遺傳性質的物質,因易被鹼性染料染成深色而命名。正常人的體細胞內含有23對染色體,這些染色體均具有一定的形態和結構,對人的正常形態和生理功能具有重要的意義。染色體發生結構或數目的異常,均可導致基因表達異常和機體發育異常。臨床上常見的染色體數目異常主要為21三體綜合症(Down syndrome,DS)、18三體綜合症(Edwards syndrome)、13三體綜合症(Patau syndrome),以及一些性染色體數目異常,如45XO(Turner’s Syndrome)、47XXX、47XXY(Klinefelter syndrome)、47XYY(XYY syndrome)。染色體異常約占出生人口的1/160,不僅患者本身常伴有嚴重疾病,同時也給家庭和社會帶來極大的精神和經濟負擔。因此,針對適齡孕婦的普遍篩查及產前診斷具有積極的社會意義。
然而,目前針對染色體非整倍性的診斷仍有待改進。
本發明旨在至少在一定程度上解決上述技術問題之一或至少提供一種有用的商業選擇。為此,本發明的一個目的在於提出一種能夠有效診斷胎兒是否具有染色體非整倍性(Chromosome Aneuploidy)的手段。
在本發明的第一方面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的方法。根據本發明的實施例,該方法包括:從包含胎兒核酸和母體核酸的樣品中獲得樣品核酸唯一比對測序數據集(Sequencing data set);針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。由於理論上,定位到某條染色體上的測序數據(Sequencing data)的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的方法,在本發明中可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
在本發明的第二方面,本發明提出了一種計算機可讀介質。根據本發明的實施例,所述計算機可讀介質上存儲有指令,所述指令適於被處理器執行以便通過下列步驟確定胎兒針對預定染色體是否存在非整倍性:從包含胎兒核酸和母體核酸的樣品中獲得樣品核酸唯一比對測序數據集;針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,利用本發明的實施例的計算機可讀介質,在本發明中可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
在本發明的協力廠商面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的系統。根據本發明的實施例,該系統包括:包括:測序裝置,所述測序裝置適於對包含胎兒核酸和母體核酸的樣品進行測序,以便獲得樣品核酸的唯一比對測序數據集;分析裝置,所述分析裝置與所述測序裝置 相連,並且所述分析裝置適於:針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的系統,能夠有效地實施前面所述的確定胎兒是否存在非整倍性的方法,可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
在本發明的第四方面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的系統。根據本發明的實施例,該系統包括:測序裝置,所述測序裝置適於針對待檢測樣品和多個對照樣品進行核酸測序,以便獲得各樣品的測序數據,其中,所述待檢測樣品包含待測胎兒的核酸,所述對照樣品包含正常胎兒核酸;以及前面所述的計算機可讀介質。
由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的系統,能夠有效地實施前面所述的確定胎兒是否存在非整倍性的方法,可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐瞭解到。
本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中: 圖1顯示了用於確定胎兒染色體非整倍性的系統的結構示意圖;圖2顯示了根據本發明一個實施例的T13 samples zscore檢驗圖;圖3顯示了根據本發明一個實施例的T18 samples zscore檢驗圖;以及圖4顯示了根據本發明一個實施例的T21 samples zscore檢驗圖。
下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用於解釋本發明,而不能理解為對本發明的限制。
在本發明中,除非另有明確的規定和限定,術語“安裝”、“相連”、“連接”、“固定”等術語應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件內部的連通。對於本領域的普通技術人員而言,可以根據具體情況理解上述術語在本發明中的具體含義。除非另有說明,“多個”的含義是兩個或兩個以上。
確定胎兒針對預定染色體是否存在非整倍性的方法
在本發明的第一方面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的方法。根據本發明的實施例,該方法包括:
S1:獲得樣品核酸唯一比對測序數據集
在該步驟中,從包含胎兒核酸(Fetal nucleic acids)和母體核酸(Maternal nucleic acids)的樣品中獲得樣品核酸唯一比對測序數據集。根據本發明的實施例,所採用的待檢測樣品的類型並不受特別限制。具體的,所採用的待檢測樣品包含待測胎兒的核酸,例如可以採用包含待測胎兒的核酸和孕婦核酸的孕婦血液樣品,例如孕婦血漿。根據本發明的實施例,所採用的核酸的類型並不受特別限制,可以是去氧核糖核酸(DNA),也可以是核糖核酸(RNA),優選DNA。本領域技術人員可以理解,對於RNA,可以通過常規手段將其轉換為具有相應序列的DNA,進行後續檢測和分析。根據本發明的實施例,樣本的來源並不受 特別限制。根據本發明的示例,可以採用孕婦血漿作為樣本,從而可以從其中提取DNA序列,進而可以對胎兒DNA狀態進行檢測和分析。根據本發明的實施例,可以使用的樣本的類型包括但不限於孕婦血、孕婦血清、孕婦血漿、胎盤組織、絨毛組織、羊水細胞、絨毛祖細胞、胎兒臍帶血、胎兒臍帶血清和胎兒臍帶血漿,優選孕婦血漿。
根據本發明的實施例,可以通過下列步驟獲得唯一比對測序集:首先,對包含胎兒核酸和母體核酸的樣品核酸進行測序,以便獲得測序數據;接下來,將所得到的測序數據與人類參照基因組序列進行比對,以便獲得由多個唯一比對測序數據構成的樣品核酸唯一比對測序數據集。
根據本發明的實施例,進一步包括從生物樣本提取核酸例如DNA的步驟。根據本發明的實施例,可以採用鹽析法、過柱法和SDS法等常規核酸提取方法從生物樣本提取核酸例如DNA。根據本發明的實施例,為了對所獲得的核酸進行測序,以DNA為例,可以對其進行隨機打斷。根據本發明的實施例,隨機打斷處理可以通過採用酶切、霧化、超聲和HydroShear法的至少之一進行。
優選地,採用HydroShear法(當含有DNA的溶液通過較小面積的通道時,流體加速,產生的力使DNA突然斷裂,流速和通道大小決定DNA片段的大小,具體原理和方法參見Life Sciences Wiki公司的HydroShear說明書),將DNA分子打斷為比較集中的一定大小的片段。根據本發明的實施例,經過隨機打斷的主帶分佈在200~300bp範圍內,即優選DNA片段的長度為200~300bp。需要說明的是,當待測樣本為血漿DNA時,由於血漿DNA天然地以片段化DNA形式存在,因此無需打斷。根據本發明的實施例,可以採用的測序裝置的類型並不受特別限制。根據本發明的具體實施例,考慮到儀器便攜性的優勢以及高通量性能,測序是通過選自Roche/454 GS Junior、Illumina/MiSeq以及Life Tecnologies/Ion Torrent PGM的至少之一進行的。由此,能夠利用這些測序裝置的高通量(所得到的測序產量可以達到1G)、深度測序的特點,進一步提高確定染色體數目異常的效率。測序類型可以為single-end(單向)測序或者Pair-end(雙 向)測序。在本發明的一個實施方案中,所述的測序方法為Illumina/MiSeq,測序類型為單向測序,測序得到的結果為50bp大小的片段(reads)。由此,可以進一步提高後續分析的效率。由此,可以降低測序成本,並且可以極大縮小測序時間,從而提高確定胎兒性別的效率。
本領域技術人員可以根據所採用的測序平臺(Sequencing platform)來選擇適當的測序文庫(Sequencing library)構建方法,簡言之,構建測序文庫的方法可以包括:首先,將待檢測的核酸樣本進行片段後,以便得到DNA片段;在得到DNA片段之後,對DNA片段進行平端化處理和末端添加鹼基A,並連接接頭,以便得到具有接頭的DNA片段;以及對具有接頭的DNA進行擴增,得到擴增產物即測序文庫。
根據本發明的實施例,可以在構建測序文庫的過程中,在測序文庫中引入標籤序列Index,例如可以在接頭中引入Index,或者在擴增過程中引入標籤序列Index。由此,可以通過針對不同的樣本採用不同的標籤序列,從而實現同時對多個檢測樣本進行測序。根據本發明的實施例,可以採用的標籤序列長度為4-12bp,由此不會影響添加標籤序列Index的DNA分子的其他功能。
根據本發明的實施例,本發明中,所採用的人類的參照基因組序列(Reference genome sequence)是人類基因組序列經過遮罩掉重複序列後所得到的參考序列,例如NCBI數據庫中最新版本的人類基因組參考序列。在本發明的具體實施例中,參照基因組序列是NCBI數據庫中的人類基因組參考序列。
根據本發明的實施例,可以通過任何一種序列比對程式進行序列比對(Sequence Alignment),例如本領域技術人員可獲得的短寡核苷酸分析包(Short Oligo nucleotide Analysis Package,SOAP)和BWA比對(Burrows-Wheeler Aligner)的至少之一進行,將測序數據與參考基因組序列進行比對,得到測序數據在參考基因組上的位置。進行序列比對可以使用程式提供的預設參數進行,或者由本領域技術人員根據需要對參數進行選擇。在本發明的具體實施例中,所採用的比對軟體是SOAP aligner/soap2。
在本文中所使用的術語“唯一比對測序數據”(Uniquely aligned sequencing reads or uniquely aligned sequencing data)是指在將測序數據與參照基因組序列進行比對時,在參考基因組序列上僅有唯一位置的序列,以Unique reads表示。在本發明的實施例中,為了避免重複序列的干擾,需要去除那些定位于人類基因組參考序列中的串聯重複及轉座重複位置的DNA序列,只統計那些可以定位到基因組唯一位置的DNA序列,即唯一比對測序數據。唯一比對測序數據能夠將來自胎兒相關生物樣品的DNA分子經打斷並測序後的各DNA序列定位於特定染色體。
根據本發明的實施例,在比對之前,可以對測序數據進行去除低品質測序數據以及去除含有接頭的測序數據,由此,可以進一步提高後續處理的效率和準確性。具體的,去除低品質測序數據的策略為:當一條測序數據中測序品質值小於或等於5的鹼基數目占這條測序數據總鹼基數目的50%以上時,則認為這條測序數據為低品質測序數據,低品質的測序數據將被去除。去除含接頭的測序數據的策略:當一條測序數據中含有一段接頭序列時,則認為這條測序數據是含接頭的測序數據。含有接頭的測序數據將被去除。
S2:確定染色體的相對比對率
在獲得唯一比對測序數據集之後,可以針對所得到的唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率。根據本發明的實施例,相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的。根據本發明的實施例,可以基於公式 計算各樣品中每條染色體的相對比對率CRi,其中,CR表示相對比對率,i代表染色體號,TNi代表比對到i號染色體的測序數據的條數,WN表示唯一比對測序數據集中所包含的唯一比對測序數據的數目M,LENi表示i號染色體的長度,G表示人類全基因組的總長度。
s3:確定預定染色體的度量值及內參染色體
根據本發明的實施例,可以針對不同的預定染色體採用不同的內參染色體,例如,如果預定染色體為18號染色體,則內參染色體為8號染色體。如果預定染色體為13號染色體,則內參染色體為4號染色體。如果預定染色體為21號染色體,則不使用內參染色體。
根據本發明的實施例,可以採用的度量值為預定染色體的相對比對率與擬合的所述內參染色體的相對比對率的比值。根據本發明的實施例,所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。所述擬合關係可以為根據最小二乘法確定的擬合關係。根據本發明進一步的實施例,所述擬合關係為,CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR。選擇上述度量值和擬合關係的情況下,所述預定染色體為18號染色體時,所述內參染色體為8號染色體。所述預定染色體為13號染色體時,所述內參染色體為4號染色體。
根據本發明的實施例,所述預定染色體為21號染色體且不使用內參染色體,所述度量值為預定染色體的相對比對率。
根據具體的實施例,擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。根據一些示例,擬合關係可以為根據最小二乘法確定的擬合關係。具體的,擬合關係可以為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率, CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
根據本發明的實施例,度量值和內參染色體可以是通過下列步驟確定的:選擇一組候選度量值和一組候選內參染色體;確定每個候選內參染色體對應下的各個候選度量值的數值;確定各個候選度量值在對照樣品間的變異係數,選擇變異係數最小的候選度量值及其對應的候選內參染色體。
根據本發明的實施例,變異係數可以按照CV=sd/mean來確定。sd表示各個數值的標準差,mean表示各個數值的平均值。
由此,根據本發明的具體實施例,一組候選度量值可以為所述預定染色體的相對比對率、所述預定染色體的相對比對率與內參染色體的相對比對率的比值和所述預定染色體的相對比對率與擬合的內參染色體的相對比對率的比值,其中,擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。根據本發明的實施例,擬合關係可以為根據最小二乘法確定的擬合關係,具體的,擬合關係可以為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
根據本發明的實施例,一組候選內參染色體可以是預定染色體之外的所有染色體。
S4:確定胎兒針對預定染色體是否存在非整倍性。
在該步驟中,在確定預定染色體的度量值及內參染色體之後,可以基於預定 染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
根據本發明的實施例,所述預定閾值是通過對對照樣品的度量值進行統計檢驗確定的。這裡所採用的對照樣品可以為正常胎兒的相應孕婦樣品,例如孕婦血漿樣品。例如對對照樣品進行平行分析和處理之後所得的度量值可以作為閾值,具體的,統計檢驗可以為Z-score檢驗。根據本發明的實施例,預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的95%置信區間,優選預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的99%置信區間。
NCR T 表示經上述方法選定的度量值,meanc和sdc分別表示對照樣品中NCR T 數值的平均值和標準差。zscore值的計算公式如下:zscore=(NCR T -mean c )/sd c
根據本發明的實施例,zscore符合標準正態分佈。在置信區間為[-3,3]的情況下,可達到99.9%的置信度。即:當所述zsore值小於-3時,所述胎兒針對所述預定染色體存在缺失。當所述zsore值大於3時,所述胎兒針對所述預定染色體存在三體型。即,當zscore取值為[-3,3]時,被測樣本正常,不存在染色體非整倍性,例如T21/T18/T13;當zscore取值為(負無窮,-3)時,被測樣本存在染色體缺失,例如21號/18號/13號染色體缺失;當zscore取值為(3,正無窮)時,則被測樣本存在染色體三體型的染色體非整倍性,例如T21/T18/T13。由此,調整zscore的閾值可以進一步提高染色體非整倍性分析的效率和準確性。研究人員應理解,所算得的zscore的大小不僅能定性的判斷被測樣本是否存在染色體數目異常,例如T21/T18/T13,也可以定量的給出被測樣本的染色體數目異常,例如T21/T18/T13的嚴重程度。
由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的方法,在本發明中可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
計算機可讀介質(Computer readable medium)
在本發明的第二方面,本發明提出了一種計算機可讀介質。根據本發明的實施例,所述計算機可讀介質上存儲有指令,所述指令適於被處理器執行以便通過下列步驟確定胎兒針對預定染色體是否存在非整倍性:從包含胎兒核酸和母體核酸的樣品中獲得樣品核酸唯一比對測序數據集;針對唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,利用本發明的實施例的計算機可讀介質,在本發明中可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。
需要說明的是,前面針對確定胎兒染色體非整倍性的方法的特徵和優點所進行的描述,也適用於該計算機可讀介質,在此不再贅述。
另外,需要說明的是,在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是用於實現邏輯功能的可執行指令的定序列表,可以具體實現在任何計算機可讀介質中,以供指令執行系統、裝置或設備(如基於計算機的系統、包括處理器的系統或其他可以從指令執行系統、裝置或設備取指令並執行指令的系統)使用,或結合這些指令執行系統、裝置或設備而使用。就本說明書而言,“計算機可讀介質”可以是任何可以包含、存儲、通信、傳播或傳輸程式以供指令執行系統、裝置或設備或結合這些指令執行系統、裝置或設備而使用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個佈線的電連接部(電子裝置),可擕式計算機盤盒(磁 裝置),隨機存取記憶體(RAM),唯讀記憶體(ROM),可擦除可編輯唯讀記憶體(EPROM或閃速記憶體),光纖裝置,以及可擕式光碟唯讀記憶體(CDROM)。另外,計算機可讀介質甚至可以是可在其上列印所述程式的紙或其他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必要時以其他合適方式進行處理來以電子方式獲得所述程式,然後將其存儲在計算機記憶體中。
應當理解,本發明的各部分可以用硬體、軟體、固件或它們的組合來實現。在上述實施方式中,多個步驟或方法可以用存儲在記憶體中且由合適的指令執行系統執行的軟體或固件來實現。例如,如果用硬體來實現,和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現:具有用於對數據信號實現邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用積體電路,可程式設計閘陣列(PGA),現場可程式設計閘陣列(FPGA)等。
本技術領域的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步驟是可以通過程式來指令相關的硬體完成,所述的程式可以存儲於一種計算機可讀存儲介質中,該程式在執行時,包括方法實施例的步驟之一或其組合。
此外,在本發明各個實施例中的各功能單元可以集成在一個處理模組中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模組中。上述集成的模組既可以採用硬體的形式實現,也可以採用軟體功能模組的形式實現。所述集成的模組如果以軟體功能模組的形式實現並作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。
確定胎兒針對預定染色體是否存在非整倍性的系統
在本發明的協力廠商面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的系統。參考圖1,根據本發明的實施例,該系統包括:測序裝置100、和分析裝置200。根據本發明的實施例,測序裝置100適於針對待檢測樣品進行核酸測序,以便獲得各樣品的測序數據,其中,待檢測樣品包含待測胎 兒的核酸,以便獲得由多個唯一比對測序數據構成的唯一比對測序數據集。分析裝置200與測序裝置100相連,並且適於通過下列步驟進行確定胎兒是否存在染色體非整倍性:針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的系統,能夠有效地實施前面所述的確定胎兒是否存在非整倍性的方法,可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。需要說明的是,前面針對確定胎兒染色體非整倍性的方法以及可讀介質的特徵和優點所進行的描述,也適用於該系統,在此不再贅述。
需要說明的是,前面所述的比對裝置和分析裝置的功能可以由前面所述的計算機可讀介質來執行。在本發明的第四方面,本發明提出了一種確定胎兒針對預定染色體是否存在非整倍性的系統。根據本發明的實施例,該系統包括:測序裝置,所述測序裝置適於對包含胎兒核酸和母體核酸的樣品進行測序,以便獲得樣品核酸的唯一比對測序數據集;以及前面所述的計算機可讀介質。
由於理論上,定位到某條染色體上的測序數據的總數與該染色體的長度以及染色體在生物樣本中的含量成比例,由此,根據本發明的實施例的系統,能夠有效地實施前面所述的確定胎兒是否存在非整倍性的方法,可以通過引入內參染色體,並且通過對測序數據的數目進行運算,能夠實現有效地確定胎兒是否具有非整倍性。需要說明的是,前面針對確定胎兒染色體非整倍性的 方法以及可讀介質的特徵和優點所進行的描述,也適用於該系統,在此不再贅述。
下面將結合實施例對本發明的方案進行解釋。本領域技術人員將會理解,下面的實施例僅用於說明本發明,而不應視為限定本發明的範圍。實施例中未注明具體技術或條件的,按照本領域內的文獻所描述的技術或條件(例如參考J.薩姆布魯克等著,黃培堂等譯的《分子克隆實驗指南》,第三版,科學出版社)或者按照產品說明書進行。實施例中未注明具體條件者,按照常規條件或製造商建議的條件進行。所用試劑或儀器未注明生產廠商者,均為可以通過市場獲得的常規產品。所使用的測序用的接頭和標籤序列來源於Illumina公司的Multiplexing Sample Preparation Oligonutide Kit。
實施例1
1、樣本來源
樣品的來源為孕婦的血漿,包括100正常的對照樣品和176例待測樣品,總計276例樣品。
2、前期實驗
前期實驗部分包括以下步驟:提取DNA,製備樣本文庫。
按照TiangenDP327-02Kit操作流程提取上述例血漿樣品的DNA,所提取DNA按照修改後的Illumina/Solexa標準建庫流程進行建庫,在主帶集中於170bp的DNA分子兩端被加上測序所用接頭,每個樣本被加上不同的標籤序列,然後與flowcell表面互補接頭雜交。通過flowcell表面連接有一層單鏈引物,DNA片段變成單鏈後通過與晶片表面的引物鹼基互補被一端“固定”在晶片上;另外一端(5’或3’)隨機和附近的另外一個引物互補,也被“固定”住,形成“橋(bridge)”,反復30輪擴增,每個單分子得到了約1000倍擴增,成為單克隆DNA簇。然後在IlluminaHiseq2000上通過單末端測序,得到長度為約50bp的DNA片段序列。
具體而言,將獲自上述血漿樣品的約10ng的DNA,進行修改後的 Illumina/Solexa標準流程建庫,具體流程參照產品說明書(http://www.illumina.com/提供的Illumina/Solexa標準建庫說明書)。經2100Bioanalyzer(Agilent)確定DNA文庫大小及插入片段為約170bp,QPCR精確定量後可上機測序。
3、測序(Sequencing)
本實施例中,對於獲自上述276例血漿的DNA樣本按照Illumina/Solexa官方公佈的ClusterStation和Hiseq2000(SEsequencing)說明書進行操作,使每個樣品得到約1G數據量進行上機測序,每個樣本根據所述標籤序列區分。
4、生物資訊學分析(Bioinformatics Analysis)
1)去除低品質測序數據以及去除含接頭的測序數據
拿到待測組樣品和對照組樣品的下機數據後,分別去除兩組樣品數據中低品質測序數據以及含接頭的測序數據。在本步驟中,對待測組和對照組的下機數據的處理方法是一致的。
去除低品質測序數據的策略:當一條測序數據中測序品質值小於或等於5的鹼基數目占這條測序數據總鹼基數目的50%以上時,則認為這條測序數據為低品質測序數據,低品質的測序數據將被去除。
去除含接頭的測序數據的策略:當一條測序數據中含有一段接頭序列時,則認為這條測序數據是含接頭的測序數據。含有接頭的測序數據將被去除。
2)對對照組和待測組數據進行,soap2比對,去重複,計算相對比對率
本步驟實際包含兩部分,一部分是對對照組樣品數據進行soap2比對,去重複,計算各染色體的比對率;另一部分是對待測組樣品數據進行soap2比對,去重複,計算各染色體的比對率。其中對於soap2比對和去重複的具體處理步驟,待測組和對照組是一致的;所不同的是,計算各染色體的比對率,具體來說就是對照組需要計算所有染色體比對率,而待測組只需要計算目標染色體及其相對應的內參染色體的相對比對(即21號染色體、18號染色體、13號染色體、21號染色體內參染色體、18號染色體的內參染色體、13號染色體的內參染色體)。如果沒有內參則只需要計算目標染色體自身的相對比對率CR。
運用soap2軟體(獲自soap.genomics.org.cn)將進行過去污染處理的測序所 得DNA序列與NCBI數據庫中版本36(hg18;NCBIBuild36)的人類基因組參考序列進行不容錯比對,得到所測序DNA序列在所述基因組上的定位。比對完之後,利用比對結果去除PCR重複。去除PCR重複的策略是:如果兩條測序數據的比對上人類基因組的起始位置相同,則認為這兩條測序數據發生了PCR重複,去掉其中的一條測序數據。同理,對於兩條以上的測序數據發生的PCR重複,也採用同樣的方法處理,即去掉重複的測序數據,只保留一條。
去除比對結果中的PCR重複測序數據之後,利用剩下的測序數據的比對結果計算每條染色體的相對比對率CRi,公式如下:
其中CR表示相對比對率,i代表染色體號,TNi代表比對到i號染色體的測序數據的條數,WN表示比對到人類全基因組的測序數據的總條數,LENi表示i號染色體的長度(即i號染色體上鹼基數目),G表示人類全基因組的總長度(即人類核基因組中所有染色體的鹼基數目之和)。以上統計量都是對於單個樣品而言的。
3)選擇內參染色體和度量值
以NCRT表示度量值,選擇下列三組參數為候選度量值:NCR T =CR T /CR R
NCR T =CR T
NCR T =CR T /CR R.fitted
針對每條預定染色體,其它任一條染色體都作為候選內參染色體。
計算各個候選內參染色體對應的候選度量值的數值。
然後計算各數值的變異係數(CV),選擇CV值最小的候選度量值和對應的內參染色體的組合。最後確定:18號染色體的內參染色體為8號染色體,相應的度量值選擇NCR T =CR T /CR R.fitted
13號染色體的內參染色體為4號染色體,相應的度量值選擇NCR T =CR T /CR R.fitted
21號染色體不用內參染色體,相應的度量值選擇NCR T =CR T
4)zscore檢驗
根據步驟4選定的NCRT和內參染色體,利用下述公式計算21號/18號/13號染色體的zscore值:zscore=(NCR T -mean c )/sd c ,meanc和sdc分別表示對照樣品中NCR T 數值的平均值和標準差。
利用21號染色體的zscore判斷是否存在T21;利用18號染色體的zscore判斷是否存在T18;利用13號染色體的zscore判斷是否存在T13。具體實施是通過zscore(-3,3)的大小判斷改被測樣品是否存在T21/T18/T13。判斷的原則是:即當zscore取值為[-3,3]時,被測樣本正常,不存在T21/T18/T13;當zscore取值為(負無窮,-3)時,被測樣本存在21號/18號/13號染色體缺失;當zscore取值為(3,正無窮)時,被測樣本存在T21/T18/T13。
5)統計特異性(Specificity)與敏感性(Sensitivity)。
將被測樣品的zscore檢驗結果與其實際核型進行比較,確定每一樣品檢驗結果正確與否,統計所有被測樣品的特異性和敏感性(表1)。實際核型是用Gbanding方法檢出的。
在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、 “示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
儘管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發明的限制,本領域的普通技術人員在不脫離本發明的原理和宗旨的情況下在本發明的範圍內可以對上述實施例進行變化、修改、替換和變型。

Claims (66)

  1. 一種確定胎兒針對預定染色體是否存在非整倍性的方法,其特徵在於,包括:從包含胎兒核酸和母體核酸的樣品中獲得樣品核酸唯一比對測序數據集;針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
  2. 如申請專利範圍第1項所述的方法,其中,所述包含胎兒核酸和母體核酸的樣品為孕婦血漿。
  3. 如申請專利範圍第1項所述的方法,其中,所述預定閾值是通過對對照樣品的度量值進行統計檢驗確定的。
  4. 如申請專利範圍第3項所述的方法,其中,所述統計檢驗為Z-score檢驗。
  5. 如申請專利範圍第3項所述的方法,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的95%置信區間。
  6. 如申請專利範圍第5項所述的方法,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的99%置信區間。
  7. 如申請專利範圍第1項所述的方法,其中,所述唯一比對測序集是通過下列步驟獲得的:對包含胎兒核酸和母體核酸的樣品核酸進行測序,以便獲得測序數據;以及將所述測序數據與人類參照基因組序列進行比對,以便獲得由多個唯一比對測序數據構成的所述樣品核酸唯一比對測序數據集。
  8. 如申請專利範圍第1-7項中任一項所述的方法,其中,所述度量值為所述預定染色體的相對比對率與擬合的所述內參染色體的相對比對率的比值,所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。
  9. 如申請專利範圍第8項所述的方法,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  10. 如根據申請專利範圍第9項所述的方法,其中,所述擬合關係為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  11. 如申請專利範圍第10項所述的方法,其中,所述預定染色體為18號染色體,所述內參染色體為8號染色體。
  12. 如申請專利範圍第10項所述的方法,其中,所述預定染色體為13號染色體,所述內參染色體為4號染色體。
  13. 如申請專利範圍第1-7項中任一項所述的方法,其中,所述預定染色體為21號染色體且不使用內參染色體,所述度量值為預定染色體的相對比對率。
  14. 如申請專利範圍第1-7項中任一項所述的方法,其中,通過下列步驟確定所述度量值和內參染色體:選擇一組候選度量值和一組候選內參染色體;確定每個候選內參染色體對應下的各個候選度量值的數值;確定各個候選度量值在對照樣品間的變異係數,選擇變異係數最小的候選度量值及其對應的候選內參染色體。
  15. 如申請專利範圍第14項所述的方法,其中,所述一組候選度量值為所述預定染色體的相對比對率、所述預定染色體的相對比對率與內參染色體的相對比對率的比值和所述預定染色體的相對比對率與擬合的內參染色體的相對 比對率的比值;所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。
  16. 如申請專利範圍第15項所述的方法,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  17. 如申請專利範圍第16項所述的方法,其中,所述擬合關係為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  18. 如申請專利範圍第1項所述的方法,其中,基於公式確定各樣品中每條染色體的相對比對率CRi,其中,CR表示相對比對率,i代表染色體號,TNi代表唯一比對到i號染色體的測序數據的數目,WN表示唯一比對測序數據集中所包含的唯一比對測序數據的數目M,LENi表示i號染色體的長度,G表示人類全基因組的總長度。
  19. 如申請專利範圍第1項所述的方法,其中,所述預定染色體為常染色體。
  20. 如申請專利範圍第19項所述的方法,其中,所述預定染色體為21號染色體、18號染色體以及13號染色體的至少之一。
  21. 如申請專利範圍第1項所述的方法,其中,所述預定染色體為性染色體。
  22. 如申請專利範圍第1項所述的方法,其中,在進行比對之前,進一步包括:去除低品質的測序數據以及含有接頭的測序數據。
  23. 一種確定胎兒針對預定染色體是否存在非整倍性的系統,其特徵在於,包括:測序裝置,所述測序裝置適於對包含胎兒核酸和母體核酸的樣品進行測序,以便獲得樣品核酸的唯一比對測序數據集; 分析裝置,所述分析裝置與所述測序裝置相連,並且所述分析裝置適於:針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
  24. 如申請專利範圍第23項所述的系統,其中,所述包含胎兒核酸和母體核酸的樣品為孕婦血漿。
  25. 如申請專利範圍第23項所述的系統,其中,所述預定閾值是通過對對照樣品的度量值進行統計檢驗確定的。
  26. 如申請專利範圍第25項所述的系統,其中,所述統計檢驗為Z-score檢驗。
  27. 如申請專利範圍第25項所述的系統,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的95%置信區間。
  28. 如申請專利範圍第27項所述的系統,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的99%置信區間。
  29. 如申請專利範圍第23項所述的系統,其中,所述唯一比對測序集是通過下列步驟獲得的:對包含胎兒核酸和母體核酸的樣品核酸進行測序,以便獲得測序數據;以及將所述測序數據與人類參照基因組序列進行比對,以便獲得由多個唯一比對測序數據構成的所述樣品核酸唯一比對測序數據集。
  30. 如申請專利範圍第23-29項中任一項所述的系統,其中,所述度量值為所述預定染色體的相對比對率與擬合的所述內參染色體的相對比對率的比值,所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比 對率和內參染色體的相對比對率的擬合關係確定。
  31. 如申請專利範圍第30項所述的系統,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  32. 如申請專利範圍第31項所述的系統,其中,所述擬合關係為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  33. 如申請專利範圍第32項所述的系統,其中,所述預定染色體為18號染色體,所述內參染色體為8號染色體。
  34. 如申請專利範圍第32項所述的系統,其中,所述預定染色體為13號染色體,所述內參染色體為4號染色體。
  35. 如申請專利範圍第23-29項中任一項所述的系統,其中,所述預定染色體為21號染色體且不使用內參染色體,所述度量值為預定染色體的相對比對率。
  36. 如申請專利範圍第23-29項中任一項所述的系統,其中,通過下列步驟確定所述度量值和內參染色體:選擇一組候選度量值和一組候選內參染色體;確定每個候選內參染色體對應下的各個候選度量值的數值;確定各個候選度量值在對照樣品間的變異係數,選擇變異係數最小的候選度量值及其對應的候選內參染色體。
  37. 如申請專利範圍第36項所述的系統,其中,所述一組候選度量值為所述預定染色體的相對比對率、所述預定染色體的相對比對率與內參染色體的相對比對率的比值和所述預定染色體的相對比對率與擬合的內參染色體的相對比對率的比值;所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。
  38. 如申請專利範圍第37項所述的系統,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  39. 如申請專利範圍第38項所述的系統,其中,所述擬合關係為CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  40. 如申請專利範圍第23項所述的系統,其中,基於公式確定各樣品中每條染色體的相對比對率CRi,其中,CR表示相對比對率,i代表染色體號,TNi代表唯一比對到i號染色體的測序數據的數目,WN表示唯一比對測序數據集中所包含的唯一比對測序數據的數目M,LENi表示i號染色體的長度,G表示人類全基因組的總長度。
  41. 如申請專利範圍第23項所述的系統,其中,所述預定染色體為常染色體。
  42. 如申請專利範圍第41項所述的系統,其中,所述預定染色體為21號染色體、18號染色體以及13號染色體的至少之一。
  43. 如申請專利範圍第23項所述的系統,其中,所述預定染色體為性染色體。
  44. 如申請專利範圍第23項所述的系統,其中,在進行比對之前,進一步包括:去除低品質的測序數據以及含有接頭的測序數據。
  45. 一種計算機可讀介質,所述計算機可讀介質上存儲有指令,所述指令適於被處理器執行以便通過下列步驟確定胎兒針對預定染色體是否存在非整倍性:從包含胎兒核酸和母體核酸的樣品中獲得樣品核酸唯一比對測序數據集;針對所述唯一比對測序數據集,分別確定預定染色體的相對比對率和至多一條內參染色體的相對比對率,其中,所述相對比對率是基於唯一比對測 序數據集中唯一比對至預定染色體的測序數據量與預定染色體長度的關係確定的;基於所述預定染色體的相對比對率和內參染色體的相對比對率,確定所述預定染色體的度量值;以及基於所述預定染色體的度量值與預定閾值的關係,確定胎兒針對預定染色體是否存在非整倍性。
  46. 如申請專利範圍第45項所述的計算機可讀介質,其中,所述預定閾值是通過對對照樣品的度量值進行統計檢驗確定的。
  47. 如申請專利範圍第46項所述的計算機可讀介質,其中,所述統計檢驗為Z-score檢驗。
  48. 如申請專利範圍第47項所述的計算機可讀介質,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的95%置信區間。
  49. 如申請專利範圍第48項所述的計算機可讀介質,其中,所述預定閾值中正常值範圍是對照樣品的度量值經統計檢驗的99%置信區間。
  50. 如申請專利範圍第45項所述的計算機可讀介質,其中,所述唯一比對測序集是通過下列步驟獲得的:對包含胎兒核酸和母體核酸的樣品核酸進行測序,以便獲得測序數據;以及將所述測序數據與人類參照基因組序列進行比對,以便獲得由多個唯一比對測序數據構成的所述樣品核酸唯一比對測序數據集。
  51. 如申請專利範圍第45-50項中任一項所述的計算機可讀介質,其中,所述度量值為所述預定染色體的相對比對率與擬合的所述內參染色體的相對比對率的比值,所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。
  52. 如申請專利範圍第51項所述的計算機可讀介質,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  53. 如申請專利範圍第52項所述的計算機可讀介質,其中,所述擬合關係為, CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  54. 如申請專利範圍第53項所述的計算機可讀介質,其中,所述預定染色體為18號染色體,所述內參染色體為8號染色體。
  55. 如申請專利範圍第53項所述的計算機可讀介質,其中,所述預定染色體為13號染色體,所述內參染色體為4號染色體。
  56. 如申請專利範圍第45項所述的計算機可讀介質,其中,所述預定染色體為21號染色體且不使用內參染色體,所述度量值為預定染色體的相對比對率。
  57. 如申請專利範圍第45項所述的計算機可讀介質,其中,通過下列步驟確定所述度量值和內參染色體:選擇一組候選度量值和一組候選內參染色體;確定每個候選內參染色體對應下的各個候選度量值的數值;確定各個候選度量值在對照樣品間的變異係數,選擇變異係數最小的候選度量值及其對應的候選內參染色體。
  58. 如申請專利範圍第57項所述的計算機可讀介質,其中,所述一組候選度量值為所述預定染色體的相對比對率、所述預定染色體的相對比對率與內參染色體的相對比對率的比值和所述預定染色體的相對比對率與擬合的內參染色體的相對比對率的比值;所述擬合的內參染色體的相對比對率是基於對照樣品中預定染色體的相對比對率和內參染色體的相對比對率的擬合關係確定。
  59. 如申請專利範圍第58項所述的計算機可讀介質,其中,所述擬合關係為根據最小二乘法確定的擬合關係。
  60. 如申請專利範圍第59項所述的計算機可讀介質,其中,所述擬合關係為 CR R.fitted =α*CR R +β,其中,,n表示對照樣品的數目,CRT為預定染色體的相對比對率,CRR為內參染色體的相對比對率,CRR.fitted為擬合的內參染色體的相對比對率,X為各個對照樣品中的CRRY為各個對照樣品中的CRR
  61. 如申請專利範圍第45項所述的計算機可讀介質,其中,基於公式確定各樣品中每條染色體的相對比對率CRi,其中,CR表示相對比對率,i代表染色體號,TNi代表唯一比對到i號染色體的測序數據的數目,WN表示唯一比對測序數據集中所包含的唯一比對測序數據的數目M,LENi表示i號染色體的長度,G表示人類全基因組的總長度。
  62. 如申請專利範圍第45項所述的計算機可讀介質,其中,所述預定染色體為常染色體。
  63. 如申請專利範圍第62項所述的計算機可讀介質,其中,所述預定染色體為21號染色體、18號染色體以及13號染色體的至少之一。
  64. 如申請專利範圍第45項所述的計算機可讀介質,其中,所述預定染色體為性染色體。
  65. 如申請專利範圍第45項所述的計算機可讀介質,其中,在進行比對之前,進一步包括:去除低品質的測序數據以及含有接頭的測序數據。
  66. 一種確定胎兒針對預定染色體是否存在非整倍性的系統,其特徵在於,包括:測序裝置,所述測序裝置適於對包含胎兒核酸和母體核酸的樣品進行測序,以便獲得樣品核酸的唯一比對測序數據集;以及申請專利範圍第45-65項中任一項所述的計算機可讀介質。
TW103129043A 2014-08-22 2014-08-22 Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media TWI564742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW103129043A TWI564742B (zh) 2014-08-22 2014-08-22 Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103129043A TWI564742B (zh) 2014-08-22 2014-08-22 Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media

Publications (2)

Publication Number Publication Date
TW201608405A TW201608405A (zh) 2016-03-01
TWI564742B true TWI564742B (zh) 2017-01-01

Family

ID=56084773

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103129043A TWI564742B (zh) 2014-08-22 2014-08-22 Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media

Country Status (1)

Country Link
TW (1) TWI564742B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060252068A1 (en) * 2005-03-18 2006-11-09 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
TW200700558A (en) * 2005-03-18 2007-01-01 Univ Hong Kong Chinese A method for the detection of chromosomal aneuploidies
TW201313895A (zh) * 2011-09-21 2013-04-01 Bgi Shenzhen Co Ltd 確定單細胞染色體非整倍性的方法和系統

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060252068A1 (en) * 2005-03-18 2006-11-09 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
TW200700558A (en) * 2005-03-18 2007-01-01 Univ Hong Kong Chinese A method for the detection of chromosomal aneuploidies
TW201313895A (zh) * 2011-09-21 2013-04-01 Bgi Shenzhen Co Ltd 確定單細胞染色體非整倍性的方法和系統

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Lau, Tze Kin, et al. "Noninvasive prenatal diagnosis of common fetal chromosomal aneuploidies by maternal plasma DNA sequencing." The Journal of Maternal-Fetal & Neonatal Medicine 25.8 (2012): 1370-1374. *

Also Published As

Publication number Publication date
TW201608405A (zh) 2016-03-01

Similar Documents

Publication Publication Date Title
US11031100B2 (en) Size-based sequencing analysis of cell-free tumor DNA for classifying level of cancer
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
RU2593708C2 (ru) Способ и система выявления вариации числа копий в геноме
BR112013020220B1 (pt) Método para determinar o estado de ploidia de um cromossomo em um feto em gestação
WO2020192680A1 (en) Determining linear and circular forms of circulating nucleic acids
JP2021531016A (ja) 無細胞dna損傷分析およびその臨床応用
WO2014075228A1 (zh) 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
TWI564742B (zh) Methods for determining the aneuploidy of fetal chromosomes, systems and computer-readable media
WO2014153755A1 (zh) 确定胎儿染色体非整倍性的方法、系统和计算机可读介质
WO2014101126A1 (zh) 确定胎儿性别的方法、系统和计算机可读介质