TWI507908B - Fast search method of biological virus sequence immune locus - Google Patents

Fast search method of biological virus sequence immune locus Download PDF

Info

Publication number
TWI507908B
TWI507908B TW103111788A TW103111788A TWI507908B TW I507908 B TWI507908 B TW I507908B TW 103111788 A TW103111788 A TW 103111788A TW 103111788 A TW103111788 A TW 103111788A TW I507908 B TWI507908 B TW I507908B
Authority
TW
Taiwan
Prior art keywords
biological virus
virus sequence
biological
sequence
target
Prior art date
Application number
TW103111788A
Other languages
English (en)
Other versions
TW201537376A (zh
Inventor
Yu Jen Hu
Original Assignee
Univ Chaoyang Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Chaoyang Technology filed Critical Univ Chaoyang Technology
Priority to TW103111788A priority Critical patent/TWI507908B/zh
Priority to US14/482,506 priority patent/US20150278439A1/en
Publication of TW201537376A publication Critical patent/TW201537376A/zh
Application granted granted Critical
Publication of TWI507908B publication Critical patent/TWI507908B/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Organic Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)

Description

生物病毒序列免疫位點快速搜尋方法
本發明是有關於一種搜尋方法,特別是指一種生物病毒序列免疫位點快速搜尋方法。
由世界衛生組織(WHO)的技術報告可知,自1930年以來的疫苗研發製造流程中,在進行電泳分析及純化蛋白實驗過程中,如果想要順利在生物病毒序列中找出可當作疫苗的免疫位點,往往就像是買樂透,只能期望會中獎而無法預期一定會有中獎的好結果。目前世界衛生組織雖然已經有固定的實驗步驟流程以及系統性的實驗操作模式,但是研究及藥品開發人員還是無法預期在生物病毒序列中的哪一個區段位點才是較關鍵的生物病毒功能變異性位置,即比較可能具有作用專一性反應的區域。因此,在實驗室中進行生物病毒疫苗研發製造的實驗過程就如同數學中買彩卷中獎的機率問題,運氣好的科學家經過一次實驗就成功,運氣不好的科學家可能重複類似的步驟多年,仍然難以得到好結果。因此,有必要尋求快速解決方法,以減少實驗開發時間及成本。
因此,本發明之目的,即在提供一種利用電腦程式的輔助以縮小生化實驗範圍的生物病毒序列免疫位點快速搜尋方法。
於是,本發明生物病毒序列免疫位點快速搜尋方法,適用一目標生物病毒序列,該目標生物病毒序列包括多個基因段,該方法包含下列步驟:
(A)提供多個與該目標生物病毒序列相關的相關生物病毒序列,每一相關生物病毒序列相對應地包括該等基因段。
(B)根據該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,藉由一第一分群演算法輸出一第一關係圖,並藉由一第二分群演算法輸出一第二關係圖,該第一關係圖包括一對應該目標生物病毒序列的基因段的目標端點,及多個分別對應該等相關生物病毒序列的基因段的相關端點,該第二關係圖包括一對應該目標生物病毒序列的基因段的目標端點,及多個分別對應該等相關生物病毒序列的基因段的相關端點。
(C)由該第一關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基因段中至少一者的第一生物病毒序列基因段集合,並由該第二關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基 因段中至少一者的第二生物病毒序列基因段集合。
(D)根據該第一生物病毒序列基因段集合及該第二生物病毒序列基因段集合,決定一待測生物病毒序列基因段集合。
(E)對該待測生物病毒序列基因段集合中的該目標生物病毒的基因段及該等相關生物病毒序列的基因段進行比對,以決定至少一免疫位點。
本發明之功效在於:利用第一分群演算法及第二分群演算法相配合,對該等與該目標生物病毒序列相關的相關生物病毒序列進行運算,找出至少一需要進行生化實驗的免疫位點區段所在以縮減需要從生物病毒全序列來進行生化實驗的範圍。
101~105‧‧‧步驟
本發明之其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是一流程圖,說明本發明生物病毒序列免疫位點快速搜尋方法的步驟流程;圖2是一樹狀圖,說明一較佳實施例中的一第一關係圖;及圖3是一樹狀圖,說明該較佳實施例中的一第二關係圖。
參閱圖1,本發明生物病毒序列免疫位點快速搜 尋方法之較佳實施例,適用一目標生物病毒序列,該目標生物病毒序列包括多個基因段,在本較佳實施例中,該目標生物病毒序列以H7N9流感病毒為例,H7N9流感病毒中包括PB2、PB2-F1、PB1、PA、HA、NP、NA、M1、M2、NS1及NS2共11個基因段。本較佳實施例中將會提及其中的聚合酶鹼性蛋白2基因段(PB2基因段)、神經氨酸酶基因段(NA基因段),及血凝素基因段(HA基因段)。該方法包含下列步驟:首先,在步驟101,根據該目標生物病毒序列的該等基因段中至少一者,及多個未篩選生物病毒序列中相對應的該等基因段,藉由一前處理分群演算法以決定該等相關生物病毒序列。在本步驟中,由NCBI資料庫中將所有的生物病毒序列先找到與A型流感相關的170條未篩選生物病毒序列,根據每一條未篩選生物病毒序列的PB2基因段,使用前處理分群演算法進行分群,以提供多個與該目標生物病毒序列相關的相關生物病毒序列,每一相關生物病毒序列相對應地包括該等基因段。本例中該分群演算法為非加權群組平均演算法(UPGMA),進行分群後得到與目標生物病毒序列H7N9較為相關的13條相關生物病毒序列,包括H1N1、H1N2、H2N2、H3N2、H3N8、H5N1、H5N2、H5N3、H7N1、H7N2、H7N3、H7N7,及H10N7。
然後,在步驟102,根據該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,藉由一第一分群演算法輸出一第一關係 圖,並藉由一第二分群演算法輸出一第二關係圖。在本較佳實施例中,該第一分群演算法為利用Clustalx軟體進行的非加權群組平均演算法(UPGMA),該第二分群演算法為利用PHYLIP軟體進行的最大概似估計演算法(ML)。在本步驟中,根據前述由PB2基因段計算出的演化關係而得到的共14條序列,包括該目標生物病毒序列H7N9及13條相關生物病毒序列,再取用該14條序列的HA基因段,利用非加權群組平均演算法產生第一關係圖,並利用最大概似估計演算法產生一第二關係圖。
要注意的是,該第一分群演算法(非加權群組平均演算法)的輸入為該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,即目標生物病毒序列H7N9的HA基因段及其他13條相關生物病毒序列的HA基因段。而該第二分群演算法(最大概似估計演算法)的輸入與該第一分群演算法的輸入相異,該第二分群演算法的輸入為該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,經過一等長度處理而產生具有相同的長度的序列。由於非加權群組平均演算法對輸入資料的容許度較大,適合進行較概略性的分析,因此,與之搭配的第二分群演算法特別選用需要精密計算而較費時的最大概似估計演算法,也因此,第二分群演算法的輸入需要經過一等長度處理使每一輸入的序列長度相同。所以,第二分群演算法的輸入為目標生物病毒序列H7N9的HA基因段及其他 13條相關生物病毒序列的HA基因段利用最佳排比演算法(Alignment Algorithm),或者稱為生物病毒序列排比演算法,根據14條HA基因段而產生的14條長度相同的序列。
參閱圖1、圖2及圖3,輸出的該第一關係圖(圖2)包括一對應該目標生物病毒序列(H7N9)的HA基因段的目標端點,及多個分別對應該等生物病毒序列的基因段的相關端點,該第二關係圖(圖3)包括一對應該目標生物病毒序列(H7N9)的基因段的目標端點,及多個分別對應該等生物病毒序列的基因段的相關端點。
然後,在步驟103,由該第一關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基因段中至少一者的第一生物病毒序列基因段集合,並由該第二關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基因段中至少一者的第二生物病毒序列基因段集合。由本例中的圖2可以發現與目標生物病毒序列H7N9的HA基因段在一定距離內的相關生物病毒序列基因段有H7N7 HA、H7N1 HA、H7N3 HA、H7N2 HA,因此該第一生物病毒序列基因段集合包括H7N9 HA、H7N7 HA、H7N1 HA、H7N3 HA及H7N2 HA。由圖3可知與目標生物病毒序列H7N9的HA基因段一定距離內的相關生物病毒序列HA基因段的是H7N7 HA、H7N3 HA、H7N2 HA、H7N1 HA,因此決定該第二生物病毒序列基因段集合包括H7N9 HA、 H7N7 HA、H7N3 HA、H7N2 HA及H7N1 HA。
接著,在步驟104,根據該第一生物病毒序列基因段集合及該第二生物病毒序列基因段集合,決定一待測生物病毒序列基因段集合。在本步驟中,將第一生物病毒序列基因段集合及第二生物病毒序列基因段集合取交集,由於本例中該第一生物病毒序列基因段集合及第二生物病毒序列基因段集合的內容剛好相同,因此該待測生物病毒序列基因段集合的內容亦為H7N9 HA、H7N7 HA、H7N1 HA、H7N3 HA及H7N2 HA。
然後,在該步驟105,對該待測生物病毒序列基因段集合中的該目標生物病毒的基因段及該等相關生物病毒序列的基因段進行比對,以決定至少一個免疫位點。在此步驟中,先採用Needleman-Wunsch演算法對該待測生物病毒序列基因段集合中H7N9、H7N7、H7N1、H7N3及H7N2的HA基因段進行全序列插補比對調整,經過比對插補後共找出523個可能免疫位點,詳列如下:15,17,24,25,29,31,34,35,36,37,38,39,40,41,42,43,44,46,48,50,52,53,54,55,56,57,60,62,69,72,75,84,90,94,99,102,105,111,123,126,128,129,132,133,135,141,144,147,150,153,159,165,166,167,168,169,171,172,174,175,177,178,179,180,182,183,186,189,190,192,193,194,195,204,205,207,208,209,210,213,216,219,221,225,228,234,237,238,240,241,243,245,246,249,252,261,264,270,273,276,280,281,282,283,285,289,291,294,300,301,303,304,306,314,315,321,324,327,330,333 ,335,336,340,341,342,352,354,355,363,366,369,370,372,373,374,375,378,381,384,389,390,397,405,411,414,417,420,429,435,438,439,441,447,450,452,453,457,462,468,477,486,490,492,495,498,501,502,507,511,513,516,519,522,525,531,535,537,540,542,546,547,549,552,554,555,556,558,564,571,573,580,582,585,588,591,593,597,598,599,600,602,603,606,609,615,618,621,624,630,632,636,637,639,648,649,651,654,657,660,666,669,672,675,676,677,678,681,684,687,690,693,694,696,697,698,699,700,701,702,703,704,705,706,707,708,709,710,711,712,713,714,715,716,717,718,719,720,721,723,726,729,732,735,741,742,744,747,748,750,756,765,768,773,786,798,799,802,804,810,813,814,816,819,822,823,825,828,829,831,835,837,845,846,849,851,852,853,855,859,861,862,863,868,869,870,873,874,881,882,885,891,894,897,901,903,906,907,908,909,910,912,915,918,921,927,930,931,932,933,936,937,939,942,945,951,954,955,957,963,966,969,970,971,972,975,978,979,981,982,987,993,998,999,1002,1005,1008,1011,1012,1013,1014,1017,1021,1022,1023,1029,1032,1038,1041,1044,1047,1050,1056,1059,1062,1071,1077,1080,1081,1083,1086,1095,1101,1113,1119,1120,1122,1131,1134,1137,1149,1152,1155,1161,1167,1170,1176,1182,1185,1188,1191,1195,1196,1197,1203,1206,1209,1212,1218,1219,1221,1230,1233,1238,1242,1243,1245,1249,1251,1257,1260,1263,1266,1269,1272,1278,1279,1284,1285,1287,129 3,1296,1297,1299,1305,1308,1311,1317,1318,1320,1321,1324,1326,1335,1341,1344,1350,1356,1359,1373,1380,1383,1386,1389,1392,1394,1395,1397,1398,1404,1407,1410,1413,1422,1428,1434,1437,1440,1443,1449,1452,1455,1464,1465,1467,1470,1475,1476,1479,1482,1485,1494,1500,1503,1505,1506,1507,1515,1516,1517,1518,1522,1524,1525,1530,1545,1551,1554,1558,1560,1563,1566,1569,1572,1578,1579,1581,1584,1585,1587,1602,1614,1615,1617,1623,1638,1639,1641,1644,1650,1653,1654,1656,1673。相較於原本需要對HA基因段的1706個可能免疫位點進行生化實驗,在使用本方法之後僅需要對其中30.66%進行實驗,大幅縮減了實驗成本。
值得注意的是,若將實驗中的血凝素基因段(HA基因段)改採用神經氨酸酶基因段(NA基因段),亦可以得到類似的結果。
綜上所述,本發明對目標生物病毒序列及相關生物病毒序列利用一第一分群演算法及一第二分群演算法共同找出待測生物病毒序列基因段集合,再進行比對以取代人工實驗過程找出可能免疫位點並縮小免疫位點找尋實驗範圍,故確實能達成本發明之目的。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍,即大凡依本發明申請專利範圍及專利說明書內容所作之簡單的等效變化與修飾,皆仍屬本發明專利涵蓋之範圍內。
101~105‧‧‧步驟

Claims (9)

  1. 一種生物病毒序列免疫位點快速搜尋方法,適用一目標生物病毒序列,該目標生物病毒序列包括多個基因段,該方法包含下列步驟:(A)提供多個與該目標生物病毒序列相關的相關生物病毒序列,每一相關生物病毒序列相對應地包括該等基因段;(B)根據該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,藉由一第一分群演算法輸出一第一關係圖,並藉由一第二分群演算法輸出一第二關係圖,該第一關係圖包括一對應該目標生物病毒序列的基因段的目標端點,及多個分別對應該等相關生物病毒序列的基因段的相關端點,該第二關係圖包括一對應該目標生物病毒序列的基因段的目標端點,及多個分別對應該等相關生物病毒序列的基因段的相關端點;(C)由該第一關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基因段中至少一者的第一生物病毒序列基因段集合,並由該第二關係圖中與該目標端點鄰近的該等相關端點中至少一者,決定一包括該目標生物病毒序列的基因段及該等相關生物病毒序列的基因段中至少一者的第二生物病毒序列基因段集合; (D)根據該第一生物病毒序列基因段集合及該第二生物病毒序列基因段集合,決定一待測生物病毒序列基因段集合;及(E)對該待測生物病毒序列基因段集合中的該目標生物病毒的基因段及該等相關生物病毒序列的基因段進行比對,以決定至少一免疫位點。
  2. 如請求項1所述的生物病毒序列免疫位點快速搜尋方法,其中在該步驟(A),根據該目標生物病毒序列的該等基因段中至少一者,及多個未篩選生物病毒序列中相對應的該等基因段,藉由一前處理分群演算法以決定該等相關生物病毒序列。
  3. 如請求項2所述的生物病毒序列免疫位點快速搜尋方法,其中在該步驟(A),該基因段為聚合酶鹼性蛋白2基因段。
  4. 如請求項1所述的生物病毒序列免疫位點快速搜尋方法,其中在該步驟(B),該基因段為神經氨酸酶基因段。
  5. 如請求項1所述的生物病毒序列免疫位點快速搜尋方法,其中在該步驟(B),該基因段為血凝素基因段。
  6. 如請求項1所述的生物病毒序列免疫位點快速搜尋方法,其中在該步驟(B),該第一分群演算法的輸入與該第二分群演算法的輸入相異,該第一分群演算法的輸入為該目標生物病毒序列的該等基因段中至少一者,及該等相關生物病毒序列中相對應的該等基因段,該第二分群演算法的輸入為該目標生物病毒序列的該等基因段中 至少一者,及該等相關生物病毒序列中相對應的該等基因段,經過一等長度處理而具有相同長度的序列。
  7. 如請求項6所述的生物病毒序列免疫位點快速搜尋方法,其中該等長度處理使用最佳排比演算法。
  8. 如請求項6所述的生物病毒序列免疫位點快速搜尋方法,其中該第一分群演算法為非加權群組平均演算法。
  9. 如請求項6所述的生物病毒序列免疫位點快速搜尋方法,其中該第二分群演算法為最大概似估計演算法。
TW103111788A 2014-03-28 2014-03-28 Fast search method of biological virus sequence immune locus TWI507908B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW103111788A TWI507908B (zh) 2014-03-28 2014-03-28 Fast search method of biological virus sequence immune locus
US14/482,506 US20150278439A1 (en) 2014-03-28 2014-09-10 Method for quick-search of loci-of-interest in a gene sequence of a target biological virus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103111788A TWI507908B (zh) 2014-03-28 2014-03-28 Fast search method of biological virus sequence immune locus

Publications (2)

Publication Number Publication Date
TW201537376A TW201537376A (zh) 2015-10-01
TWI507908B true TWI507908B (zh) 2015-11-11

Family

ID=54190758

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103111788A TWI507908B (zh) 2014-03-28 2014-03-28 Fast search method of biological virus sequence immune locus

Country Status (2)

Country Link
US (1) US20150278439A1 (zh)
TW (1) TWI507908B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185552B1 (en) * 1998-03-19 2001-02-06 3Com Corporation Method and apparatus using a binary search engine for searching and maintaining a distributed data structure
TW539983B (en) * 2000-12-21 2003-07-01 Ind Tech Res Inst Method, system, and program of searching for a pair of fragments from two data sequences
US6934703B2 (en) * 2000-06-02 2005-08-23 Nokia Mobile Phones Ltd. Method for searching for data in at least two databases, and database system having at least two databases
US7246107B2 (en) * 2003-01-10 2007-07-17 International Business Machines Corporation System and method for creating a data file for use in searching a database
TWI329427B (en) * 2006-09-28 2010-08-21 Univ Nat Chiao Tung Data query method and data coding method thereof
TWI341990B (en) * 2005-06-10 2011-05-11 Asustek Comp Inc Method and apparatus for searching data
TWI410816B (zh) * 2009-01-07 2013-10-01 Mediatek Singapore Pte Ltd 在一資料庫中搜尋至少一個位置資料集的方法及資料搜尋系統

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185552B1 (en) * 1998-03-19 2001-02-06 3Com Corporation Method and apparatus using a binary search engine for searching and maintaining a distributed data structure
US6934703B2 (en) * 2000-06-02 2005-08-23 Nokia Mobile Phones Ltd. Method for searching for data in at least two databases, and database system having at least two databases
TW539983B (en) * 2000-12-21 2003-07-01 Ind Tech Res Inst Method, system, and program of searching for a pair of fragments from two data sequences
US7246107B2 (en) * 2003-01-10 2007-07-17 International Business Machines Corporation System and method for creating a data file for use in searching a database
TWI341990B (en) * 2005-06-10 2011-05-11 Asustek Comp Inc Method and apparatus for searching data
TWI329427B (en) * 2006-09-28 2010-08-21 Univ Nat Chiao Tung Data query method and data coding method thereof
TWI410816B (zh) * 2009-01-07 2013-10-01 Mediatek Singapore Pte Ltd 在一資料庫中搜尋至少一個位置資料集的方法及資料搜尋系統

Also Published As

Publication number Publication date
US20150278439A1 (en) 2015-10-01
TW201537376A (zh) 2015-10-01

Similar Documents

Publication Publication Date Title
Furuse et al. Evolution of the M gene of the influenza A virus in different host species: large-scale sequence analysis
Van den Hoecke et al. Analysis of the genetic diversity of influenza A viruses using next-generation DNA sequencing
Vemula et al. Current approaches for diagnosis of influenza virus infections in humans
Lu et al. Reassortment patterns of avian influenza virus internal segments among different subtypes
Barba et al. Historical perspective, development and applications of next-generation sequencing in plant virology
Haß et al. The role of swine as “mixing vessel” for interspecies transmission of the influenza A subtype H1N1: a simultaneous Bayesian inference of phylogeny and ancestral hosts
Goh et al. Protein intrinsic disorder and influenza virulence: the 1918 H1N1 and H5N1 viruses
Shen et al. Evolutionary trends of A (H1N1) influenza virus hemagglutinin since 1918
Neverov et al. Intrasubtype reassortments cause adaptive amino acid replacements in H3N2 influenza genes
Kampmann et al. A simple method for the parallel deep sequencing of full influenza A genomes
Dollman et al. Detection, mapping, and proteotyping of SARS-CoV-2 coronavirus with high resolution mass spectrometry
de Silva et al. A comprehensive analysis of reassortment in influenza A virus
EP2189919A1 (en) Method and system for building a phylogeny from genetic sequences and using the same for recommendation of vaccine strain candidates for the influenza virus
Shaltout et al. Information gain as a feature selection method for the efficient classification of influenza based on viral hosts
Tsai et al. Influenza genome diversity and evolution
Woolthuis et al. Long-term adaptation of the influenza A virus by escaping cytotoxic T-cell recognition
Yu et al. Viral genome phylogeny based on Lempel–Ziv complexity and Hausdorff distance
Moattari et al. In silico functional and structural characterization of H1N1 influenza a viruses hemagglutinin, 2010–2013, Shiraz, Iran
Yurovsky et al. Flurf, an automated flu virus reassortment finder based on phylogenetic trees
Suzuki Predictability of antigenic evolution for H3N2 human influenza A virus
Liu et al. Conservation region finding for influenza A viruses by machine learning methods of N-linked glycosylation sites and B-cell epitopes
Phanich et al. Glycan binding and specificity of viral influenza neuraminidases by classical molecular dynamics and replica exchange molecular dynamics simulations
Tripathi et al. Antiviral innate immunity through the lens of systems biology
TWI507908B (zh) Fast search method of biological virus sequence immune locus
Sun et al. Large-scale analysis of B-cell epitopes on influenza virus hemagglutinin–implications for cross-reactivity of neutralizing antibodies