TWI594143B - Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result - Google Patents

Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result Download PDF

Info

Publication number
TWI594143B
TWI594143B TW105111265A TW105111265A TWI594143B TW I594143 B TWI594143 B TW I594143B TW 105111265 A TW105111265 A TW 105111265A TW 105111265 A TW105111265 A TW 105111265A TW I594143 B TWI594143 B TW I594143B
Authority
TW
Taiwan
Prior art keywords
gene
node
genes
nodes
matrix
Prior art date
Application number
TW105111265A
Other languages
English (en)
Other versions
TW201737137A (zh
Inventor
Sher Singh
Hung Ching Sung
Yu Sing Chen
Original Assignee
Univ Nat Taiwan Normal
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Taiwan Normal filed Critical Univ Nat Taiwan Normal
Priority to TW105111265A priority Critical patent/TWI594143B/zh
Application granted granted Critical
Publication of TWI594143B publication Critical patent/TWI594143B/zh
Publication of TW201737137A publication Critical patent/TW201737137A/zh

Links

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖以呈現基因晶片分析結果的方法
本發明關於一種呈現基因晶片分析結果的方法,特別是關於一種利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖,以呈現基因晶片分析結果的方法。
過去基因晶片分析實驗因受限於實驗晶片數量不夠,故大多應用僅在於找出某種特定疾病或環境因子的相關影響基因。在呈現基因晶片分析結果上,一般採用的視覺化圖示包含分群熱圖(Clustered Heat Map)、箱型圖(Boxplot)、直方圖(Histogram)以及各種點狀資料散佈圖。這些視覺化圖形的目的在於控管實驗晶片的品質狀態,或呈現表現量具有顯著差異基因(DEG,Differential Expressed Genes)。基因網路圖(Gene Network)則僅在將這些列舉基因的相關註解資訊加以綜合呈現時才會予以使用。故所使用的網路圖無論係節點座標、節點圖樣、節線樣式,所對應的參考數據中只有基因名單係來自晶片實驗,其它包含基因交互調控、蛋白質交互作用等數據則大多只能來自一些大型資料庫所蒐集的文獻整合資訊。
近年隨著基因晶片價格漸趨下降,單次實驗晶片使用數量始有上升趨勢;而基因晶片數據標準化演算法技術成熟,亦促使大型晶片數據統整資料庫如雨後春筍般建立於網際網路中。基因晶片所提供的每一種基因在各不同生物個體中的表現量資訊,從此不再侷限於找出各種風險因子下表現異常的基因,而能進一步應用於探討基因體學中各基因間正負向調控關聯,並進行量化。然而現今尚無研究報告將基因晶片數據所提供的基因關聯資訊列入其呈現結果的網路視覺化圖示中,故無法完全發揮基因晶片價值。
有鑒於此,本發明提出一種利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖,以呈現基因晶片分析結果的方法。該方法能滿足前述的需求。
本段文字提取和編譯本發明的某些特點。其它特點將被揭露於後續段落中。其目的在涵蓋附加的申請專利範圍之精神和範圍中,各式的修改和類似的排列。
為了滿足以上需求,本發明揭露了一種利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖以呈現基因晶片分析結果的方法,該方法包括步驟:A.提供複數個已進行檢測基因的基因晶片,並選取複數個檢測基因,其中該些基因晶片分別用於一實驗組與一對照組;B.依照一表現量選擇方法,於該些基因晶片中選擇關於選取基因的表現量; C.依據選取基因在各基因晶片中的表現量高低分布情形,計算兩兩基因間的表現量相關度,並以一表現量相關度矩陣表示前述結果;D.以一理想距離計算公式對該表現量相關度矩陣計算得一理想相對距離矩陣;E.視每一選取基因為至少一節點,並為每一節點決定一初始座標;F.將兩兩初始座標相減,其結果以一位置差向量矩陣表示;G.計算每一節點與周遭其它節點之歐幾里得距離,得一歐幾里得距離矩陣;H.以一推拉力向量計算公式對該位置差向量矩陣、理想距離矩陣及歐幾里得距離矩陣進行計算,以得一推拉力向量矩陣;I.為每一節點加總所有推拉力向量矩陣中對應的數值,以成為該節點的校正移動向量;J.按照前一步驟計算所得的校正移動向量移動對應節點至新的座標;K.以一虛擬內動能公式計算移動後所有節點的總虛擬內動能;L.判斷虛擬內動能是否小於一定值;若否,則重複步驟G到步驟K,直到虛擬內動能小於該定值;及M.依照最後節點所處座標之相對位置,顯示對應選取基因之顯示圖案於一顯示裝置上,其中該顯示圖案能顯示出該節點對應基因的表現量是在實驗組或對照組中較顯著。
前述之方法,進一步包含一步驟I1於步驟I之後:I1.提供一縮減因子,以該縮減因子與該些校正移動向量相乘,以得到更新校正移動向量。該縮減因子的選擇方式可為指定一個絕對值小於等於1的常數,或指定為各個節點所對應校正移動向量的絕對值倒數再乘以一定值。
依照本發明的精神,該表現量選擇方法可為選擇對應同一基因的多個探針組中之最大表現量、將對應同一個基因的多個探針組的表現量加總平均,或將晶片中對應同一個基因的多組探針組中的各總表現訊號量,分別以不同節點表現量表示。該兩兩基因間的表現量相關度以皮爾森相關係數、斯皮爾曼相關係數、組成分分析圖座標之歐幾里得距離(Euclidean Distance in PCA Graph),或機械學習預測率(Prediction of Machine Learning)表示。
最好,理想距離計算公式為:dideal[i,j]=1-|cor[i,j]|,其中cor[i,j]表示選取基因中,第i個基因與第j個基因的表現量相關度;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離。該初始座標決定方法包含隨機亂數擺放、等距離直線擺放、圓圈圖形擺放。該歐幾里得距離由以下公式所計算得出:,其中dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座標系內橫軸位置,y表示於座標系內縱軸位置。該推拉力向量計算公式為,其中為對應第i個基因的節點與第j個基因的節點間的推拉力向量;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離;dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座標系內橫軸位置,y表示於座標系內縱軸位置。該虛擬內動能公式為: ,其中Vi為每個節點相對於一特定參考點之相對速度向量,n表示所有節點的總數,mi為第i節點的節點質量,Kinner為移動後所有節點的總虛擬內動能,而該特定參考點座標設為座標系原點,並設各節點質量(mi)為1。
本發明所揭露的方法,其中該相對速度向量可為校正移動向量。該顯示圖案可以不同顏色表示對應基因的表現量是在實驗組或對照組中較明顯。相同的顯示圖案,外觀尺寸越大者,代表該節點對應基因在各基因晶片的表現量的變異係數越大。對任二不同的節點,若其代表的基因間的表現量相關度大於一定值,對應的顯示圖案間以一虛線相連;若其代表的基因間曾有相關的研究文獻或實驗紀錄,對應的顯示圖案間以一實線相連。
本發明藉由引進節點虛擬內動能至基因晶片分析結果中,遞迴動態計算各節點的最後顯現位置,並由不同顯示圖案與連接線條,視覺化顯現各節點,成功地解決現有技術無法將基因晶片數據所提供的基因關聯資訊列入其呈現結果的網路視覺化圖示之缺憾。
第1圖,其係為本發明所提出利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖以呈現基因晶片分析結果的方法之流程圖。
第2圖為數個基因在不同的基因晶片中的表現量的分佈的示例。
第3圖顯示依照本發明的一表現量相關度矩陣與一理想相對距離矩陣。
第4圖顯示每一節點的初始座標。
第5圖顯示一位置差向量矩陣。
第6圖顯示一歐幾里得距離矩陣。
第7圖顯示一推拉力向量矩陣。
第8圖顯示對該推拉力向量矩陣之運算結果。
第9圖顯示每一節點的第一次校正後的新座標。
第10圖顯示個節點總擬內動能之計算。
第11圖為一基因晶片分析結果呈現的畫面例子。
第12圖為另一基因晶片分析結果呈現的畫面例子。
本發明將藉由下述之較佳實施例及其配合圖式,做進一步之詳細說明,以下各實施例所皆知實驗數據係為便於解釋本案技術特徵,並非用以限制其可實施之態樣。
請參閱第1圖,其係為本發明所提出”利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖以呈現基因 晶片分析結果的方法”之流程圖。本方法將以一簡化的生物基因晶片分析結果為例來說明,而經節點化後的所有節點所組成的系統是用來計算的主體。
本發明的第一個步驟是提供複數個已進行檢測基因的生物晶片,並選取複數個檢測基因,其中該些基因晶片分別用於一實驗組與一對照組(S01)。在前述例子中,分析所使用的基因晶片為Affymetrix公司型號Human Genome u133a,針對人體腦部組織採樣體液進行20組分析,其中10組基因晶片來自躁鬱症病患樣本(實驗組),另外10片則來自健康樣本(對照組)。該基因晶片的各探針組係由為數眾多之相同DNA片段所組成的DNA陣列;相異的探針組對應不同的DNA片段,而所有的DNA陣列共組成基因晶片的測試主體。該基因晶片的探針組會與樣本體液中的特定RNA片段結合,因而發出表現訊號。然而,探針組中的每一個DNA片段(探針)不一定有對應的RNA片段可以結合(可能是該RNA片段數量少或與不是標的的RNA片段結合),所以總表現訊號量對不同的基因都會有所不同。藉由分析具有代表性的總表現訊號量(以下稱為表現量),可以得到各樣本中各基因的現況。要說明的是,本發明不限於使用在人體腦部組織相關疾病的基因檢測結果呈現,任何人或動植物的病理或基因研究所得的基因晶片數據,都可以藉由該方法來呈現分析結果;此外,本發明也不 限定使用的基因晶片,只要能達成以上目的,並提供有效的表現量,任何形式的基因晶片都可以被使用。
由於實驗中人為操作以及基因晶片本身製成的優劣等因素,造成每張基因晶片表現訊號值未成常態分佈,此時需要運用套裝演算法依照「探針組訊號選擇」、「訊號過濾」、「背景值調整」、「數據標準化」步驟來消除雜訊,此程序稱為基因晶片的「前置處理」。在本例中,這些表現量訊號以MAS5的方式進行前置處理運算。一般來說,有許多方式可以處理以上需求,比如RMA、GCRMA、MAS5、DCHIP。但對本發明而言,最好以MAS5演算法為之。
檢測基因的選取方法有很多種,在本例中是選取「顯著差異基因」,即根據每個探針組於實驗組和對照組兩組樣本中的表現訊號量,使用student-t公式計算p-value做為顯著差異程度參考,選擇某個數值以下(比如0.01)的基因進行分析。此外,業界常用的AUC、Fold change等方法也可以被使用,甚至可依照操作者的經驗與相關文獻,直接選取「特定的基因」。本發明並不限定檢測基因的選取方法。
本發明的第二個步驟是依照一表現量選擇方法,於該些基因晶片中選擇關於選取基因的表現量(S02)。由於探針(DNA片段)本身並不長,故在實作中很有可能許多探針組會同時黏結到某一特定RNA片段,或是基因晶片的設計就是好幾個探針組用來偵測同一RNA片段。對同一基因來說, 其結果可能是某些特定的探針組的總表現訊號量很大,某些探針組的總表現訊號量很小或不顯訊號,如何選擇一個適合的表現量用來代表一個基因是很重要的。在本例中,該表現量選擇方法為選擇對應同一基因的多個探針組中之最大表現量。一般來說,該方法也可以是將對應同一個基因的多個探針組的表現量加總平均。一種比較特別的作法,可以將晶片中對應同一個基因的多組探針組中的各總表現訊號量,分別以不同節點表現量表示。也就是在以下的步驟中,同一個位置在運算一開始時有著不同的節點,該些節點各具不同的表現量,最後所獲得的節點位置都是對應基因的可能狀況。
接著,依據選取基因在各基因晶片中的表現量高低分布情形,計算兩兩基因間的表現量相關度,並以一表現量相關度矩陣表示前述結果(S03)。關於此步驟,請參閱第2圖。該圖為數個基因在不同的基因晶片中的表現量的分佈的示例。圖中的橫軸為不同的基因晶片,以其序號先後排列前10個來自實驗組,後10個來自對照組。縱軸為表現量,相同的基因之表現量以相同的符號表示,並以直線繪示於鄰近的表現量間。可以看出這些基因的特性:第一、某些基因的表現量在實驗組中較在對照組中來得明顯(如實心圓形所代表的基因);第二、某些基因的表現量在對照組中較在實驗組中來得明顯(如空心菱形與實心菱形所代表的基因);第三、某些基因的表現量不會因為在實驗組中或在對照組中有明顯差異(如空 心圓形所代表的基因);第四、某些基因間的表現量分佈成高度正相關性(如空心菱形與實心菱形所代表的基因);第五、某些基因間的表現量分佈成高度負相關性(如空心菱形與實心圓形所代表的基因);及第六、某些基因間的表現量分佈成無相關性或低度相關性(如空心圓形與實心圓形所代表的基因)。表現量相關度即是以一統計數字描述前述第四到第六點的相關性。在本例中,該兩兩基因間的表現量相關度以皮爾森相關係數表示。實作上,斯皮爾曼相關係數、組成分分析圖座標之歐幾里得距離(Euclidean Distance in PCA Graph),或機械學習預測率(Prediction of Machine Learning)也是可資使用的表示方式。
在本例中,在個基因晶片中選擇了五個基因的表現量進行運算,該些基因分別是EIF3A、HLA-DPB1、ZFP36L2、CBX1及PEX19。依照兩兩對應的方式排列,表現量相關度矩陣如第3圖上方的矩陣所示。其中對照相同基因的欄位以1.000表示。
接著,以一理想距離計算公式對該表現量相關度矩陣計算得一理想相對距離矩陣(S04)。該理想距離計算公式為:dideal[i,j]=1-|cor[i,j]|,其中cor[i,j]表示選取基因中,第i個基因與第j個基因的表現量相關度;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離。依照兩兩對應的方式排列,理想相對距離矩陣第3圖下方的矩陣所示。比如在EIF3A 欄與HLA-DPB1列的交會欄位之表現量相關度為-0.832,經理想距離計算公式計算後,在理想相對距離矩陣相對欄位的數據就成了0.168。要注意的是理想距離計算公式是用來將表現量相關度虛擬成供計算的理想距離,而理想距離是用來描述將基因節點化後,各節點間的關係(遠近距離),故理想距離本身是無因次的。
接著,視每一選取基因為至少一節點,並為每一節點決定一初始座標(S05),此步驟及前述的基因節點化。決定初始座標的方式有很多種,在本例中是隨機亂數擺放,其結果如第4圖所示。此外,等距離直線擺放(將各節點等距放置在坐標系中的一直線上)或圓圈圖形擺放(將各節點隨意放置在坐標系中的一圓圈圖形上)都是可以採用的方法。應注意的是,為求簡化計算,擺放的座標最好侷限在某一區域中,比如由(0,0)、(0,1)、(1,1)與(1,0)所圍成的正方形區域中,座標數字最好不要太大,或小數點後有效數字太多。
在完成座標初始後,將兩兩初始座標相減,其結果以一位置差向量矩陣表示(S06),該位置差向量矩陣顯示於第5圖中。接著,計算每一節點與周遭其它節點之歐幾里得距離,得一歐幾里得距離矩陣(S07)。該歐幾里得距離由以下公式所計算得出:,其中dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座 標系內橫軸位置,y表示於座標系內縱軸位置。對應的歐幾里得距離矩陣如第6圖所示。
接下來的步驟是以一推拉力向量計算公式對該位置差向量矩陣、理想距離矩陣及歐幾里得距離矩陣進行計算,以得一推拉力向量矩陣(S08)。該推拉力向量計算公式為,其中為對應第i個基因的節點與第j個基因的節點間的推拉力向量;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離;dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座標系內橫軸位置,y表示於座標系內縱軸位置。依照本發明的精神,推拉力向量是以虛擬化節點間的作用力,以單一向量表示之。計算所得的推拉力向量矩陣如第7圖所示。
下一步驟是為每一節點加總所有推拉力向量矩陣中對應的數值,以成為該節點的校正移動向量()(S09)。此步驟之計算結果列於第8圖中的列中。而在進行下一步驟之前,依照本發明的精神,可對前述的校正移動向量進行等比同向調整,也就是提供一縮減因子,以該縮減因子與該些校正移動向量相乘,以得到更新校正移動向量()。調整校正移動向量可以加速整個節點系統更快地達到接近虛擬力量平衡的狀態。該縮減因子的選擇方式可為指定一個絕對值小於等於1的常數(可依照操作者的經驗),或指定為各個節點所對應校正移動向量的絕對值倒數再乘以一定值。在 本例中取該縮減因子為0.2,其計算結果列於第8圖中的列中。
接著,按照前一步驟計算所得的校正移動向量移動對應節點至新的座標(S10)。每一節點的新座標,可以以下公式表示:,其中(x,y)i為任一節點i的原座標(此時為初始座標),(,)i即該節點i的新座標。當然也可以使用經縮減因子調整過的更新校正移動向量來計算得到新座標,如第9圖所示。
接下來的步驟,以一虛擬內動能公式計算移動後所有節點的總虛擬內動能(S11)。這裡所謂的虛擬內動能公式為: ,其中Vi為每個節點相對於一特定參考點之相對速度向量,n表示所有節點的總數,mi為第i節點的節點質量,Kinner為移動後所有節點的總虛擬內動能。本發明是引入系統節點間虛擬內動能,取節點間某情況下的動態平衡、或最終平衡時的節點位置做為呈現基因資訊的相對位置。由於節點是虛設的,故上述公式也是無因次的。為求計算簡化起見,該特定參考點座標設為座標系原點,並設各節點質量(mi)為1,相對速度向量以校正移動向量或更新校正移動向量代替,即,或。相關計算結果列於第10圖中。
至此,本發明已完成一次位移計算並獲得一個虛擬內動能。依照本發明的精神,此時要判斷虛擬內動能是否小於一定值,若否則重複步驟S07到步驟S11,直到虛擬內動能小於該定值(S12)。舉例而言,該定值可設為0.5(視選取基因數量多少,可由操作者選取),當虛擬內動能小於該虛擬內動能時即停止以上遞迴計算。當然,也有可能虛擬內動能在後一輪計算中會大於前一輪的計算值,而整體來說卻是震盪地縮小。操作者也可以針對該定值,採連續觀察結果決定停止遞迴計算。比如連續100次遞迴計算得到的虛擬內動能小於0.5。
本發明的最後一個步驟是依照最後節點所處座標之相對位置,顯示對應選取基因之顯示圖案於一顯示裝置上,其中該顯示圖案能顯示出該節點對應基因的表現量是在實驗組或對照組中較顯著(S13)。由以上的說明可知,本發明是藉由電腦計算而能呈現其最終結果,故該顯示裝置可為LCD螢幕、觸控螢幕,或是投影機投射的屏幕。本例最後的結果如第11圖所示。每一節點會於其相對位置上,並標明其所代表的基因名稱。斜線圓形所代表的是該基因的表現量在實驗組中較顯著(量值較大),而點圓形所代表的是該基因的表現量在對照組中較顯著。
依照本發明的精神,顯示圖案間可進一步加入許多不同的表現方式,藉以呈現更多分析結果。請見第12圖,該圖為另一個基因晶片分析結果呈現的畫面例子。在這例子中,用來分析的基因較多(11個)。斜線圓形實際上代表的是紅色圓球,點圓形所代表的是藍色圓球。也就是說,可以用不同顏色的顯示圖案以表示對應基因的表現量是在實驗組或對照組中較明顯。另外,相同的顯示圖案,外觀尺寸越大者,代表該節點對應基因在各基因晶片的表現量的變異係數越大。例如基因EIF3A的顯示圖案外觀尺寸較基因CABP2來得大,代表基因EIF3A在各基因晶片中的表現量的變異係數,比基因CABP2來得大,也就是分散情形較大。
在不複雜的基因分析結果中,比如各基因表現量分佈的相關性高,表現量也相差不多,理論上最後畫面中越接近的基因,其表現量相關度越接近1,且各節點的外觀相似,距離相近或是彼此重疊。但由於實際的表現量分佈狀況非常複雜,表現量的變異也大,故很難由節點間相對距離得知任二基因間的表現量相關度。所以,可以設一基因間的表現量相關度的定值,比如0.75,當任二不同的節點代表的基因間的表現量相關度大於0.75,對應的顯示圖案間以一虛線相連(如基因ADNB2,與CBX1)。又可對任二不同的節點,若其代表的基因間曾有相關的研究文獻或實驗紀錄,對應的顯示圖案 間以一實線相連,比如基因UBC與基因CKAP2。箭頭與橫槓可分別表示是研究文獻或實驗紀錄。
雖然本發明已以實施方式揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。

Claims (16)

  1. 一種利用節點彼此自動排斥與吸引加總向量來校正基因互動網路圖以呈現基因晶片分析結果的方法,包括步驟:A.提供複數個已進行檢測基因的基因晶片,並選取複數個檢測基因,其中該些基因晶片分別用於一實驗組與一對照組;B.依照一表現量選擇方法,於該些基因晶片中選擇關於選取基因的表現量;C.依據選取基因在各基因晶片中的表現量高低分布情形,計算兩兩基因間的表現量相關度,並以一表現量相關度矩陣表示前述結果;D.以一理想距離計算公式對該表現量相關度矩陣計算得一理想相對距離矩陣;E.視每一選取基因為至少一節點,並為每一節點決定一初始座標;F.將兩兩初始座標相減,其結果以一位置差向量矩陣表示;G.計算每一節點與周遭其它節點之歐幾里得距離,得一歐幾里得距離矩陣;H.以一推拉力向量計算公式對該位置差向量矩陣、理想距離矩陣及歐幾里得距離矩陣進行計算,以得一推拉力向量矩陣; I.為每一節點加總所有推拉力向量矩陣中對應的數值,以成為該節點的校正移動向量;J.按照前一步驟計算所得的校正移動向量移動對應節點至新的座標;K.以一虛擬內動能公式計算移動後所有節點的總虛擬內動能;L.判斷虛擬內動能是否小於一定值;若否,則重複步驟G到步驟K,直到虛擬內動能小於該定值;及M.依照最後節點所處座標之相對位置,顯示對應選取基因之顯示圖案於一顯示裝置上,其中該顯示圖案能顯示出該節點對應基因的表現量是在實驗組或對照組中較顯著。
  2. 如申請專利範圍第1項所述之方法,進一步包含一步驟I1於步驟I之後:I1.提供一縮減因子,以該縮減因子與該些校正移動向量相乘,以得到更新校正移動向量。
  3. 如申請專利範圍第2項所述之方法,其中該縮減因子的選擇方式為指定一個絕對值小於等於1的常數,或指定為各個節點所對應校正移動向量的絕對值倒數再乘以一定值。
  4. 如申請專利範圍第1項所述之方法,其中該表現量選擇方法為選擇對應同一基因的多個探針組中之最大表現量、將對應同一個基因的多個探針組的表現量加總平均,或將晶片中對應同一個基因的多組探針組中的各總表現訊號量,分 別以不同節點表現量表示。
  5. 如申請專利範圍第1項所述之方法,其中該兩兩基因間的表現量相關度以皮爾森相關係數、斯皮爾曼相關係數、組成分分析圖座標之歐幾里得距離(Euclidean Distance in PCA Graph),或機械學習預測率(Prediction of Machine Learning)表示。
  6. 如申請專利範圍第1項所述之方法,其中該理想距離計算公式為:dideal[i,j]=1-|cor[i,j]|,其中cor[i,j]表示選取基因中,第i個基因與第j個基因的表現量相關度;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離。
  7. 如申請專利範圍第1項所述之方法,其中該初始座標決定方法包含隨機亂數擺放、等距離直線擺放、圓圈圖形擺放。
  8. 如申請專利範圍第1項所述之方法,其中該歐幾里得距離由以下公式所計算得出:,其中dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座標系內橫軸位置,y表示於座標系內縱軸位置。
  9. 如申請專利範圍第1項所述之方法,其中該推拉力向量計算公式為,其中為對應第i個基因的節點與第j個基因的節點間的推拉力向量;dideal[i,j]表示對應第i個基因與第j個基因的節點間的理想距離;dreal[i,j]表示對應第i個基因與第j個基因的節點間的歐幾里得距離;x表示於座標系內橫軸位置,y表示於座標系內縱軸位置。
  10. 如申請專利範圍第1項所述之方法,其中該虛擬內動能公式為:其中Vi為每個節點相對於一特定參考點之相對速度向量,n表示所有節點的總數,mi為第i節點的節點質量,Kinner為移動後所有節點的總虛擬內動能。
  11. 如申請專利範圍第10項所述之方法,其中該特定參考點座標設為座標系原點,並設各節點質量(mi)為1。
  12. 如申請專利範圍第10項所述之方法,其中該相對速度向量為校正移動向量。
  13. 如申請專利範圍第1項所述之方法,其中該顯示圖案以不同顏色表示對應基因的表現量是在實驗組或對照組中較明顯。
  14. 如申請專利範圍第1項所述之方法,其中相同的顯示圖案,外觀尺寸越大者,代表該節點對應基因在各基因晶片的表現量的變異係數越大。
  15. 如申請專利範圍第1項所述之方法,其中對任二不同的節點,若其代表的基因間的表現量相關度大於一定值,對應的顯示圖案間以一虛線相連。
  16. 如申請專利範圍第1項所述之方法,其中對任二不同的節點,若其代表的基因間曾有相關的研究文獻或實驗紀錄,對應的顯示圖案間以一實線相連。
TW105111265A 2016-04-11 2016-04-11 Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result TWI594143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW105111265A TWI594143B (zh) 2016-04-11 2016-04-11 Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105111265A TWI594143B (zh) 2016-04-11 2016-04-11 Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result

Publications (2)

Publication Number Publication Date
TWI594143B true TWI594143B (zh) 2017-08-01
TW201737137A TW201737137A (zh) 2017-10-16

Family

ID=60189309

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105111265A TWI594143B (zh) 2016-04-11 2016-04-11 Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result

Country Status (1)

Country Link
TW (1) TWI594143B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050175228A1 (en) * 2002-08-01 2005-08-11 Michael Elashoff Method and system for managing and querying gene expression data according to quality
TW200636535A (en) * 2004-12-20 2006-10-16 China Synthetic Rubber Corp Universal reference standard for normalization of microarray gene expression profiling data
CN101950326A (zh) * 2010-09-10 2011-01-19 重庆大学 基于Hurst指数的DNA序列相似性检测方法
TW201227352A (en) * 2010-12-23 2012-07-01 Nat Univ Chung Hsing Algorithm for automatic data clustering
CN104699804A (zh) * 2015-03-20 2015-06-10 浙江工业大学 一种基于基因表达式编程的n中心点分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050175228A1 (en) * 2002-08-01 2005-08-11 Michael Elashoff Method and system for managing and querying gene expression data according to quality
TW200636535A (en) * 2004-12-20 2006-10-16 China Synthetic Rubber Corp Universal reference standard for normalization of microarray gene expression profiling data
CN101950326A (zh) * 2010-09-10 2011-01-19 重庆大学 基于Hurst指数的DNA序列相似性检测方法
TW201227352A (en) * 2010-12-23 2012-07-01 Nat Univ Chung Hsing Algorithm for automatic data clustering
CN104699804A (zh) * 2015-03-20 2015-06-10 浙江工业大学 一种基于基因表达式编程的n中心点分类方法

Also Published As

Publication number Publication date
TW201737137A (zh) 2017-10-16

Similar Documents

Publication Publication Date Title
Tomic et al. SIMON, an automated machine learning system, reveals immune signatures of influenza vaccine responses
CN109642869A (zh) 用于坞内测定的方法、系统和试剂盒
Li et al. Comprehensive 3D phenotyping reveals continuous morphological variation across genetically diverse sorghum inflorescences
WO2006083330A1 (en) A method for the manipulation, storage, modeling, visualization and quantification of datasets
Genaev et al. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image-processing technique
WO2008029635A1 (fr) Processeur d'images de cellules et procédé de traitement d'images de cellules
JP2012175946A (ja) 細胞培養環境評価方法及びその装置
CN107533587B (zh) 用于估计样本中的分类单位内的微生物的量的方法和装置
CN107766695B (zh) 一种获取外周血基因模型训练数据的方法及装置
Manacorda et al. Arabidopsis phenotyping through geometric morphometrics
Arunasri et al. Mycobiome changes in the vitreous of post fever retinitis patients
TWI594143B (zh) Method for Correcting Gene Interaction Network Map with Node Exclusion and Attraction Summation Vectors to Present Gene Chip Analysis Result
WO2002001477A1 (fr) Procede de traitement de donnees d'expression genique et programmes de traitement
Veldhuis et al. Practical aspects of the cellular force inference toolkit (CellFIT)
CN110246543A (zh) 基于二代测序技术利用单样本检测拷贝数变异的方法和计算机系统
WO2021219979A1 (en) Method of diagnosing a biological entity, and diagnostic device
Mir et al. Harnessing genomics through phenomics
KR101003175B1 (ko) 상호 연관 지도 작성법을 이용한 다목적 활용 가능 유전자 판별법
JP2007087125A (ja) 生命情報の可視化方法、可視化プログラム及び記憶媒体
US20050026199A1 (en) Method for identifying biomarkers using Fractal Genomics Modeling
JP2017063652A (ja) 細胞評価装置および方法並びにプログラム
Warman et al. Deep learning-based high-throughput phenotyping can drive future discoveries in plant reproductive biology
JP7405235B2 (ja) 学習装置、学習方法、及び、プログラム
Xiong et al. Chord: Identifying doublets in single-cell rna sequencing data by an ensemble machine learning algorithm
Bheda et al. Microfluidics for single-cell lineage tracking over time to characterize transmission of phenotypes in Saccharomyces cerevisiae