TW202321695A - 用於診斷非酒精性脂肪肝炎(nash)或肝細胞癌(hcc)的生物標記 - Google Patents
用於診斷非酒精性脂肪肝炎(nash)或肝細胞癌(hcc)的生物標記 Download PDFInfo
- Publication number
- TW202321695A TW202321695A TW110143754A TW110143754A TW202321695A TW 202321695 A TW202321695 A TW 202321695A TW 110143754 A TW110143754 A TW 110143754A TW 110143754 A TW110143754 A TW 110143754A TW 202321695 A TW202321695 A TW 202321695A
- Authority
- TW
- Taiwan
- Prior art keywords
- leu
- ser
- val
- glu
- gly
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N2030/022—Column chromatography characterised by the kind of separation mechanism
- G01N2030/027—Liquid chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2440/00—Post-translational modifications [PTMs] in chemical analysis of biological material
- G01N2440/38—Post-translational modifications [PTMs] in chemical analysis of biological material addition of carbohydrates, e.g. glycosylation, glycation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/08—Hepato-biliairy disorders other than hepatitis
- G01N2800/085—Liver diseases, e.g. portal hypertension, fibrosis, cirrhosis, bilirubin
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
- G01N30/7233—Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Urology & Nephrology (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Food Science & Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
Abstract
本文所述之實施態樣概括地關於通過疾病進展來分析肽結構以診斷及/或治療疾病狀態發展之技術。與主題申請案中所述技術有關之方法的非限制性實例可包括接收對應於自受試者所獲得的生物學樣品之肽結構數據、識別肽結構輪廓且診斷在疾病進展內的疾病狀態。該實例可進一步包括得出與疾病狀態有關之診斷輸出。在至少一些例子中,該肽結構輪廓可包括醣基化肽、無醣基化肽或兩者。
Description
本揭示概括地關於診斷及/或治療脂肪肝疾病(FLD)進展狀態之方法及系統。本揭示更特別地關於分析自受試者所獲得的生物學樣品中所檢測之一組肽結構的量化數據,用於與疾病進展有關的受試者的疾病狀態(例如健康、NASH、HCC)之診斷評定、及/或治療受試者。
與相關專利申請案交叉參考
本申請案請求在2021年9月30日申請之美國臨時專利申請案第63/251,021號及在2020年11月25日申請之美國臨時專利申請案第63/118,486號之優先權,將每一者以其完整內容併入本文以供參考。
蛋白醣基化及其他轉譯後修飾在實際上所有的人類生理學方面扮演極其重要的角色。不出所料,錯誤或改變的蛋白醣基化時常伴隨各種疾病狀態。異常的醣基化識別提供受影響的受試者早期檢測、干預及治療的機會。當前的生物標記識別方法(諸如在蛋白體學及基因體學領域中開發之方法)可用於檢測特定疾病(諸如癌症)之指標且用於區別特定類型的癌症與其他的非癌性疾病。然而,使用醣蛋白體分析未於先前用於成功地識別疾病過程。再者,醣蛋白體分析未於先前用於成功地識別與疾病進展有關的疾病狀態。
醣蛋白分析在幾個層面上充滿挑戰。例如,由於不同的糖苷鍵、分枝型態及/或具有相同質量的多種單醣,使肽中的單一聚醣組成物可含有大量的異構物結構。另外,共享相同的肽骨架之多個聚醣的存在可導致來自各種醣型之檢測信號,與無醣基化肽相比,使彼等個別的豐度降低。因此,開發可識別在肽片段上的聚醣結構之演算法仍難以捉摸。
鑑於上述情況,對涉及醣蛋白之位點特異性分析以獲得關於蛋白醣基化型態之訊息的改進之分析方法有需求,該方法又可提供可用於識別疾病過程之量化訊息。本揭示係藉由將位點特異性醣蛋白分析與機器學習及先進的質譜儀器組合以量化分析肽結構來解決此及其他需要,該肽結構指示特定的疾病狀態,包括但不限於NASH和HCC。
非酒精性脂肪肝疾病(NAFLD或FLD)為肥胖及代謝症候群之全球流行的副產疾病。FLD係通過脂肪堆積及發炎階段而進展成NASH且一小部分的NASH患者進展成HCC。以高度準確性認知患者的 FLD 階段能容許開業醫師訂制用於個別患者之治療且達成更好的結果。然而,當前的診斷技術不具有明確預測FLD階段之必要的準確性(例如患者是否只有脂肪堆積、NASH或 HCC)。因此,可能希望具有能夠區分該等狀態與健康狀態之方法及系統。
在一或多個實施態樣中,其提供用於分類有關與脂肪肝疾病(FLD)進展相關聯的多種狀態的生物學樣品之方法。該方法包括接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。將自一組肽結構之肽結構數據所識別之量化數據輸入機器學習模式(machine learning model)中。該組肽結構包括自表1中的多個肽結構所識別之至少一個肽結構。量化數據係使用機器學習模式分析以得出疾病指標。基於疾病指標而得出診斷輸出,其分類作為驗證與FLD進展相關聯的多種狀態之對應狀態的生物學樣品。
在一或多個實施態樣中,其提供用於訓練模式之方法,該模式診斷具有與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者的受試者。該方法包括接收被診斷具有與FLD進展相關的多種狀態的多位受試者之肽結構組的量化數據。量化數據包含多位受試者之多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之對應狀態。使用量化數據訓練機器學習模式以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態。
在一或多個實施態樣中,其提供用於檢測存在於生物學樣品中與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者之方法。該方法包括接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。肽結構數據係使用監督式機器學習模式分析,基於選自表1中所識別之肽結構群組的至少3個肽結構得出疾病指標。以回應於確定疾病指標落在與對應狀態相關聯的選定範圍內來檢測與FLD進展相關聯的多種狀態之對應狀態的存在。
在一或多個實施態樣中,其提供將生物學樣品分類成對應於與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者之方法。該方法包括使用訓練數據訓練監督式機器學習模式。訓練數據包含多個訓練受試者的多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之狀態。接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。將自一組肽結構之肽結構數據所識別之量化數據輸入已經訓練之監督式機器學習模式中。該組肽結構包括至少一個在表1中所識別之肽結構。量化數據係使用監督式機器學習模式分析以得出評分。確定評分落在與FLD進展相關聯的多種狀態之對應狀態相關聯的選定範圍內。得出該診斷輸出,其中診斷輸出指示生物學樣品驗證對應的狀態。多種狀態包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC狀態。
在一或多個實施態樣中,其提供用於治療患者的非酒精性脂肪肝炎(NASH)疾患之方法以降低、停止或逆轉NASH疾患進展成肝細胞癌中至少一者。該方法包括接收來自患者的生物學樣品。使用多反應監測質譜(MRM-MS)系統確定在表1中所識別之生物學樣品中之各肽結構的量。使用機器學習模式分析各肽結構的量以得出疾病指標。基於疾病指標而得出診斷輸出,其分類作為驗證患者具有NASH疾患的生物學樣品。將奧貝膽酸(Obeticholic acid)(OCA)或其衍生物投予患者。投予包含每天以10至25 mg之範圍經靜脈內或口服中至少一者投予。
在一或多個實施態樣中,其提供用於治療患者的肝細胞癌(HCC)疾患之方法。該方法包括接收來自患者的生物學樣品。使用多反應監測質譜(MRM-MS)系統確定在表1中所識別之生物學樣品中之各肽結構的量。使用機器學習模式分析各肽結構的量以得出疾病指標。基於疾病指標而得出診斷輸出,其分類作為驗證患者具有HCC疾患的生物學樣品。投予治療,其中治療包括下列中至少一者:對患者投予索拉非尼(Sorafenib)或其衍生物,該投予包含每天以775至825 mg之範圍經靜脈內或口服中至少一者投予;對患者投予樂伐替尼(Lenvatinib)或其衍生物,該投予包含當患者體重<60 kg時以7.5至8.5 mg/天之範圍及當患者體重>60 kg時以11.5至12.5 mg/天之範圍經靜脈內或口服中至少一者投予;對患者投予尼沃魯單抗(Nivolumab)或其衍生物,該投予包含以0.75至1.25 mg/kg之範圍經靜脈內或口服中至少一者投予;對患者投予瑞戈非尼(Regorafenib)或其衍生物,該投予包含以150至170 mg/天之範圍經口服投予;對患者投予卡博替尼(Cabozantinib)或其衍生物,該投予包含以50至70 mg/天之範圍經靜脈內或口服中至少一者投予;或對患者投予雷莫蘆單抗(Ramucirumab)或其衍生物,該投予包含以8至12 mg/kg之範圍經靜脈內或口服中至少一者投予。
在一或多個實施態樣中,其提供用於設計治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法。該方法包括以回應於確定自受試者所獲得的生物學樣品使用本文所揭示之方法中任一或多者的一部分或全部驗證出疾病狀態而設計用於治療受試者之治療劑。
在一或多個實施態樣中,其提供用於規劃治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含以回應於確定自受試者所獲得的生物學樣品使用本文所揭示之方法中任一或多者的一部分或全部驗證出疾病狀態而得出用於治療受試者之治療計劃。
在一或多個實施態樣中,其提供用於治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含基於確定自受試者所獲得的生物學樣品使用本文所揭示之方法中任一或多者的一部分或全部驗證出疾病狀態而對受試者投予治療劑以治療受試者。
在一或多個實施態樣中,其提供用於治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含基於確定受試者對使用本文所揭示之方法中任一或多者的一部分或全部之治療的回應而選擇治療受試者之治療劑。
在一或多個實施態樣中,其提供用於分析來自患者的樣品中之一組肽結構之方法。該方法包括(a)自患者獲得樣品;(b)準備樣品以形成包含一組肽結構之備好的樣品;(c)將備好的樣品輸入使用液相層析系統的監測質譜系統中;(d)檢測與該組肽結構之各肽結構締合的一組產物離子;且(e)使用監測質譜系統得出該組產物離子的量化數據。該組肽結構包括至少一個選自表4中所識別之肽結構PS-1至PS-53之肽結構。該組肽結構包括具有下列為特徵之肽結構:(i)具有質量-電荷(m/z)比在作為對應於肽結構的表4中之前驅離子所列出之m/z比的±1.5內之前驅離子;及(ii)具有m/z比在作為對應於肽結構的表4中之第一產物離子所列出之m/z比的±1.0內之產物離子。
在一或多個實施態樣中,其提供組成物,該組成物包含表1中所識別之肽結構PS-1至PS-53中至少一者。
在一或多個實施態樣中,其提供組成物,該組成物包含肽結構或產物離子。肽結構或產物離子包含與SEQ ID NOS:23-52中任一者具有至少90%之序列一致性的胺基酸序列,其對應於表1中之肽結構PS-1至PS-53。產物離子係選自由表4中所識別之產物離子所組成之群組的離子,包括落在經確認之m/z範圍內之產物離子。
在一或多個實施態樣中,其提供組成物,該組成物包含選自由表4中所識別之肽結構PS-1至PS-53所組成之群組的醣肽結構。醣肽結構包含表5中所識別作為對應於醣肽結構之胺基酸肽序列;及表1中所識別作為對應於醣肽結構之聚醣結構,其中聚醣結構係在表1中所識別之對應位置上連結至胺基酸肽序列之殘基。聚醣結構具有聚醣組成物。
在一或多個實施態樣中,其提供組成物,該組成物包含選自表1中所識別之多個肽結構之肽結構。肽結構具有作為對應於表1中的肽結構所識別之單一同位素質量。肽結構包含表1中所識別作為對應於肽結構之SEQ ID NOS:23-52之胺基酸序列。
在一或多個實施態樣中,其提供套組,該套組包含至少一種用於量化至少一個表1中所識別之肽結構之劑以進行本文所揭示之方法中任一或多者的一部分或全部。
在一或多個實施態樣中,其提供套組,該套組包含醣肽標準物、緩衝劑或一組肽序列中至少一者以進行本文所揭示之方法中任一或多者的一部分或全部。該組肽序列之肽序列係由對應於表1中所定義的SEQ ID NOS:23-52中之一者識別。
在一或多個實施態樣中,系統包含一或多個數據處理器;及含有指令之非暫時性電腦可讀儲存媒體,當在一或多個數據處理器上執行時,該媒體使一或多個數據處理器執行本文所揭示之方法中任一或多者的一部分或全部。
在一或多個實施態樣中,其提供可明確地體現於非暫時性機器可讀儲存媒體中的電腦程式產品,其包括配置之指令,使一或多個數據處理器執行本文所揭示之方法中任一或多者的一部分或全部。
詳細說明
I. 綜述
本文所述之實施態樣認定醣蛋白體為新興領域,其可用於具有各種類型疾病的受試者之總體診斷及/或治療。醣蛋白體旨在確定給出之樣品(例如血液樣品、細胞、組織等)中的聚醣及醣基化蛋白質之位置、特質及數量。蛋白醣基化為最常見且最複雜的蛋白質轉譯後修飾形式之一且可影響蛋白質結構、構形及功能。例如,醣蛋白可在重要的生物學過程中扮演至關重要的角色,諸如細胞傳訊、宿主-病原體相互作用及免疫反應和疾病。因此,醣蛋白對診斷不同類型的疾病可為重要的。醣蛋白對區別疾病內的階段(例如FLD階段)亦可為重要的。
儘管蛋白醣基化提供關於癌症、其他疾病及疾病之階段確定的有用訊息,但是蛋白醣基化的分析可為困難的,因為聚醣通常不能以當前可用的方法追溯至蛋白質來源位點。醣蛋白分析通常可出於幾個原因而具有挑戰性。例如,因為不同的糖苷鍵、分枝及許多具有相同質量的單醣,所以在肽中的單一聚醣組成物可能含有大量的異構物結構。再者,共享相同的肽序列之多個聚醣的存在可能引起質譜(MS)信號分裂成各種醣型,與非醣基化(無醣基化)肽相比,使彼等個別的豐度降低。
但是為了理解各種疾病狀況及疾病進展且更準確地診斷特定的疾病狀態,對執行醣蛋白分析及不僅識別聚醣且亦識別在蛋白質內之連結位點(例如附著胺基酸殘基)可為重要的。因此,對提供用於位點特異性醣蛋白分析以獲得關於蛋白醣基化型態的詳細訊息之方法有需求,該方法能夠提供關於疾病狀態之訊息。此訊息可用於區分疾病狀態與其他狀態、診斷受試者具有或不具有疾病狀態、確定受試者具有疾病狀態的可能性或其組合。此分析可用於區分例如(非限制)非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC狀態(其可包括非酒精性FLD疾病狀態、對照狀態、健康狀態、無肝疾病狀態或良性肝腫塊狀態中至少一者)中之二或更多者。
因此,本文所述之實施態樣提供用於分析受試者的蛋白質及特別為醣蛋白之各種方法及系統。在一或多個實施態樣中,訓練機器學習模式以分析肽結構數據及得出疾病指標,其提供與一或多種疾病有關的訊息。例如,在各種實施態樣中,肽結構數據包含肽結構之量化量度(例如豐度或濃度數據)。肽結構可以無醣基化肽序列(例如較大的親體蛋白質之肽或肽片段)或醣基化肽序列定義。醣基化肽序列(亦稱為醣肽結構)可為具有連接至肽序列之連結位點(例如胺基酸殘基)的聚醣結構之肽序列,該連接可經由例如胺基酸殘基的特定原子而發生。醣基化肽的非限制性實例包括經N連結之醣肽和經O連結之醣肽。
本文所述之實施態樣認定自受試者所獲得的生物學樣品中之選定的肽結構之豐度可用於確定受試者具有特定的疾病狀態(例如FLD階段)的可能性。
分析生物學樣品中的肽序列及醣基化肽序列之豐度可提供更準確的方式區分在FLD內進展的狀態。與集中於分析太大而無法經由質譜法解析之醣蛋白的醣蛋白分析相比,此類型的肽結構分析可能更有助於得出準確的診斷。再者,可能有太多以醣蛋白之可能的蛋白質形式要考慮。又再者,與幾乎不提供關於哪些蛋白質及各種聚醣結構附著至哪些胺基酸殘基位點的訊息之醣體學分析相比,以本文的各種實施態樣所述之方式分析肽結構數據可能更有助於得出準確的診斷。
下文說明提供用於研究、診斷及/或治療(例如治療的設計、規劃及/或製造)與FLD相關聯的疾病狀態(例如NASH狀態、HCC狀態等)的本文所述之方法及系統的示例性實施。如本文所使用之各種術語的說明及實例提供於以下的章節II中。
II. 術語之示例性說明
術語「一(ones)」意指超過一。
如本文所使用之術語「多數」可為2、3、4、5、6、7、8、9、10或更多。
如本文所使用之術語「組」意指一或多個。例如,一組項目包括一或多個項目。
當與項目列表一起使用時,如本文所使用之短語「…中至少一者」意指可使用所列出的項目中之一或多者的不同組合且可能僅需要列表的項目中之一者。項目可為特定的對象、事物、步驟、操作、過程或類別。換言之,「…中至少一者」意指可使用來自列表的項目之任何組合或任何數個項目,但可能不需要列表中的所有項目。例如(非限制),「項目A、項目B或項目C中至少一者」意指項目A;項目A及項目B;項目B;項目A、項目B及項目C;項目B及項目C;或項目A及C。在一些例子中,「項目A、項目B或項目C中至少一者」意指但不限於項目A中之兩者、項目B中之一者及項目C中之十者;項目B中之四者及項目C中之七者;或一些其他適合的組合。
如本文所使用之「實質上」意指足以運用於意欲目的。術語「實質上」因此容許與絕對或完美狀態、尺寸、測量、結果或類似者微小、微不足道的變化,諸如能為本領域的普通技能者所期望,但不明顯地影響整體性能。當使用有關數值或可以數值表示的參數或特徵時,「實質上」意指在百分之十以內。
如本文所使用之術語「胺基酸」通常係指包括胺基(例如-NH2)、羧基(-COOH)及基於特定的胺基酸改變之側鏈基團(R)的任何有機化合物。胺基酸可使用肽鍵連結。
如本文所使用之術語「烷基化」通常係指烷基自一個分子轉移至另一分子。在各種實施態樣中,使用烷基化與還原之半胱胺酸反應以防止在執行還原後重新形成二硫鍵。
如本文所使用之術語「連結位點」或「醣基化位點」通常係指使聚醣或聚醣結構之糖分子直接結合(例如共價結合)至肽、多肽或蛋白質之胺基酸的位置。例如,連結位點可為胺基酸殘基且聚醣結構可經由胺基酸殘基之原子連結。醣基化類型的非限制性實例可包括經N連結之醣基化、經O連結之醣基化、經C連結之醣基化、經S連結之醣基化和醣化。
如本文所使用之術語「生物學樣品」、「生物學試樣」或「生物試樣」通常係指藉由典型地自受試者取樣而採取的試樣,以便為試樣來源之代表。生物學樣品可為整體、特定組織、細胞類型或關注的類別或子類別之生物體的代表。生物學樣品可包括巨分子。生物學樣品可包括小分子。生物學樣品可包括病毒。生物學樣品可包括細胞或細胞衍生物。生物學樣品可包括胞器。生物學樣品可包括細胞核。生物學樣品可包括來自細胞群的稀有細胞。生物學樣品可包括任何類型的細胞,包括而不限於原核細胞、真核細胞、細菌、真菌、植物、哺乳動物或其他動物細胞類型、黴漿菌、正常組織細胞、腫瘤細胞或任何其他細胞類型,無論是否衍生自單細胞或多細胞生物體。生物學樣品可包括細胞成分。生物學樣品可包括核苷酸(例如ssDNA、dsDNA、RNA)、胞器、胺基酸、肽、蛋白質、碳水化合物、醣蛋白或其任何組合。生物學樣品可包括基質(例如凝膠或聚合物基質),該基質包含細胞或來自細胞的一或多種成分(例如細胞珠),諸如來自細胞的DNA、RNA、胞器、蛋白質或其任何組合。生物學樣品可自受試者的組織獲得。生物學樣品可包括硬化細胞。此等硬化細胞可包括或可不包括細胞壁或細胞膜。生物學樣品可包括細胞的一或多種成分,但可不包括細胞的其他成分。此等成分的實例可包括細胞核或胞器。生物學樣品可包括活細胞。活細胞能夠被培養。
如本文所使用之術語「生物標記」通常係指自受試者取得作為樣品之任何可測量的物質,其存在為某種現象的指示。此等現象的非限制性實例可包括疾病狀態、狀況或暴露於化合物或環境條件。在本文所述之各種實施態樣中,生物標記可用於診斷目的(例如診斷疾病狀態、健康狀態、無症狀狀態、有症狀狀態等)。術語「生物標記」可與術語「標記」互換使用。
如本文所使用之術語「變性」通常係指失去以其天然狀態存在的四級結構、三級結構及二級結構的任何分子。非限制性實例包括暴露於外部化合物或環境條件(諸如酸、鹼、溫度、壓力、輻射等)之蛋白質或核酸。
如本文所使用之術語「變性蛋白質」通常係指失去以其天然狀態存在的四級結構、三級結構及二級結構之蛋白質。
如本文所使用之術語「消化」或「酶消化」通常係指分解聚合物(例如在切割位點切割多肽)。蛋白質可使用胰蛋白酶消化方案消化以準備用於質譜法。若通道被限制於切割位點,則蛋白質可使用其他蛋白酶消化以準備用於質譜法。
如本文所使用之術語「免疫檢查點抑制劑治療劑」及「免疫檢查點抑制劑藥物」通常係指可靶向免疫檢查點分子(例如必須活化(或去活化)以啟動免疫反應之免疫細胞上的分子)之藥物或治療劑。免疫檢查點抑制劑治療劑的非限制性實例可包括帕博利珠單抗(pembrolizumab)、尼沃魯單抗和西米普利單抗(cemiplimab)。
如本文所使用之術語「疾病進展」係指疾病自無疾病或不太晚期(例如嚴重)的疾病形式進展至較晚期(例如嚴重)的疾病形式。疾病進展可包括任何數個階段的疾病。
如本文所使用之術語「疾病狀態」通常係指影響生物體之結構或功能的狀況。疾病狀態之原因的非限制性實例可包括病原體、免疫系統功能障礙、由老化引起的細胞損傷、由其他因素(例如創傷和癌症)引起的細胞損傷。疾病狀態可包括例如疾病進展的階段。例如,FLD之進展可能自健康至脂肪堆積和發炎(脂肪肝)、至非酒精性脂肪肝炎(NASH)、至纖維變性及至肝硬化的階段。在一些例子中,進展可能自NASH惡化至肝細胞癌(HCC)。疾病狀態可包括疾病的任何狀態,無論是有症狀或無症狀。疾病狀態可引起受試者之結構或功能的輕微、中度或嚴重破壞。
如本文所使用之術語「聚醣」或「多醣」兩者通常係指醣接合物之碳水化合物殘基,諸如醣肽、醣蛋白、醣脂或蛋白聚醣之碳水化合物部分。聚醣可包括單醣。
如本文所使用之術語「醣肽」或「醣多肽」通常係指包含至少一個聚醣殘基之肽或多肽。在各種實施態樣中,醣肽包含經共價附著至胺基酸殘基的側鏈(亦即R基團)之碳水化合物部分(例如一或多個聚醣)。
如本文所使用之術語「醣蛋白」通常係指具有至少一個與其鍵結的聚醣殘基之蛋白質。在一些實例中,醣蛋白為具有至少一個與其共價鍵結的寡醣鏈之蛋白質。醣蛋白的實例包括但不限於脂蛋白元C-III(APOC3)、α-1-抗胰凝乳蛋白酶(antichymotrypsin)(AACT)、艾芙米(afamin)(AFAM)、α-1-酸性醣蛋白1 & 2(AGP12)、脂蛋白元B-100(APOB)、脂蛋白元D(APOD)、補體C1s次組分(complement C1s subcomponent)(C1S)、鈣蛋白酶(calpain)-3(CAN3)、叢生蛋白(clusterin)(CLUS)、補體組分C8A鏈(CO8A)、α-2-HS-醣蛋白(FETUA)、血紅素結合素(HPT)、免疫球蛋白重鏈恆定γ 1(IgG1)、免疫球蛋白J鏈(IgJ)、血漿微血管增滲素(KLKB1)、血清對氧磷酶(paraoxonase)/芳基酯酶1(PON1)、凝血酶原(THRB)、血清運鐵蛋白(serotransferrin)(TRFE)、蛋白質unc-13同系物A(UN13A)和鋅-α-2-醣蛋白(ZA2G)。如本文所使用之醣肽係指醣蛋白之片段,除非另有相反的指定。
如本文所使用之術語「液相層析術」通常係指用於分離樣品成為部分之技術。液相層析術可用於分離、識別及量化組分。
如本文所使用之術語「質譜法」通常係指用於識別分子之分析技術。在本文所述之各種實施態樣中,質譜法可涉及蛋白質之特徵化及測序。
如本文所使用之術語「m/z」或「質量-電荷比」通常係指來自質譜儀的輸出值。在各種實施態樣中,m/z可代表給出之離子的質量與其攜帶的基本電荷數之間的關係。在m/z中的「m」代表質量及「z」代表電荷。在一些實施態樣中,m/z可顯示於質譜的x軸上。
如本文所使用之術語「肽」通常係指由肽鍵連結之胺基酸。肽可包括介於10與50個殘基之間的胺基酸鏈。肽可包括少於10個殘基的胺基酸鏈,包括寡肽、二肽、三肽和四肽。肽可包括超過50個殘基的鏈且可稱為「多肽」或「蛋白質」。
術語「蛋白質」或「多肽」或「肽」在本文可互換使用且通常係指包括至少三個胺基酸殘基之分子。蛋白質可包括由肽鍵連結在一起的胺基酸序列所組成之聚合物鏈。蛋白質可使用胰蛋白酶消化方案消化以準備用於質譜法。若通道被限制於切割位點,則蛋白質可使用其他蛋白酶消化以準備用於質譜法。
如本文所使用之術語「肽結構」通常係指肽或其一部分或醣肽或其一部分。在本文所述之各種實施態樣中,肽結構可包括在序列中包含至少兩個胺基酸之任何分子。
如本文所使用之術語「還原」通常係指由物質獲得電子。在本文所述之各種實施態樣中,糖可直接結合至蛋白質,由此還原與其結合之胺基酸。此等還原反應可以醣基化發生。在各種實施態樣中,可使用還原破壞兩個半胱胺酸之間的二硫鍵。
如本文所使用之術語「樣品」通常係指來自關注的受試者之樣品且可包括受試者的生物學樣品。樣品可包括細胞樣品。樣品可包括細胞系或細胞培養樣品。樣品可包括一或多種細胞。樣品可包括一或多種微生物。樣品可包括核酸樣品或蛋白質樣品。樣品亦可包括碳水化合物樣品或脂質樣品。樣品可衍生自另一樣品。樣品可包括組織樣品,諸如生檢、粗針穿刺生檢(core biopsy)、針吸取物或細針吸取物。樣品可包括流體樣品,諸如血液樣品、尿液樣品或唾液樣品。樣品可包括皮膚樣品。樣品可包括頰內拭子(cheek swab)。樣品可包括血漿或血清樣品。樣品可包括無細胞(cell-free或cell free)樣品。無細胞樣品可包括細胞外多核苷酸。樣品可源於血液、血漿、血清、尿液、唾液、黏膜分泌物、痰液、糞便或淚液。樣品可源於紅血球或白血球。樣品可源於排泄物、脊髓液、CNS液、胃液、羊水、囊液、腹膜液、骨髓、膽汁、其他體液、自生檢所獲得的組織、皮膚或毛髮。
如本文所使用之術語「序列」通常係指包括可組合以產生聚合物的一維單體之生物序列。序列的非限制性實例包括核苷酸序列(例如ssDNA、dsDNA和RNA)、胺基酸序列(例如蛋白質、肽和多肽)及碳水化合物(例如包括C
m (H
2O)
n 之化合物)。
如本文所使用之術語「受試者」通常係指動物,諸如哺乳動物(例如人類)或禽類(例如鳥),或其他生物體,諸如植物。例如,受試者可包括脊椎動物、哺乳動物、囓齒動物(例如小鼠)、靈長類動物、猿猴或人類。動物可包括但不限於農場動物、運動動物和寵物。受試者可包括健康或無症狀的個體、具有或疑似具有疾病(例如癌症)或對疾病易感性的個體及/或需要治療或疑似需要治療的個體。受試者可為患者。受試者可包括微生物體或微生物(例如細菌、真菌、古細菌、病毒)。
如本文所使用之「模式」可包括一或多種演算法、一或多種數學技術、一或多種機器學習演算法或其組合。
如本文所使用之「機器學習」可為使用演算法實踐分列解析數據、從中學習且接著確定或預測關於世界上的某事物。機器學習係使用可自數據學習而不依賴基於規則之編程的演算法。機器學習演算法可包括參數模式、非參數模式、深度學習模式、類神經網路、線性判別分析模式、二次判別分析模式、支援向量機、隨機森林演算法、最近鄰演算法、組合式判別分析模式、k平均數叢聚(k-means clustering)演算法、監督模式、無監督模式、邏輯迴歸模式、多變量迴歸模式、懲罰式多變量迴歸模式或另一類型的模式。
如本文所使用之「人工類神經網路」或「類神經網路」(NN)可指模擬人工節點或神經元的互連群組之數學演算法或計算模式,其係基於聯結論(connectionistic)計算方法處理訊息。亦可稱為神經網(neural net)之類神經網路可使用一或多層非線性單元預測接收之輸入的輸出。除了輸出層以外,一些類神經網路包括一或多個隱藏層。使用各隱藏層之輸出作為網路中的下一層之輸入,亦即下一個隱藏層或輸出層。網路之各層係自接收之輸入依照各組參數之現時值得出輸出。在各種實施態樣中,「類神經網路」之引用可為之一或多個類神經網路之引用。
類神經網路可以兩種方式處理訊息:當其受訓時,其處於訓練模式,且當其以所學付諸實踐時,其處於推理(或預測)模式。類神經網路係通過反饋過程(例如後向傳播)學習,其容許網路調整中間隱藏層中的個別節點之加權因數(修飾其行為),使得輸出與訓練數據之輸出匹配。換言之,類神經網路係藉由饋入訓練數據(學習實例)學習且最終學習如何得到正確的輸出,即使其呈示新的範圍或一組輸入。類神經網路可包括例如(非限制)前饋類神經網路(FNN)、遞迴類神經網路(RNN)、模組類神經網路(MNN)、卷積類神經網路(CNN)、殘差類神經網路(Residual Neural Network)(ResNet)、常微分方程式類神經網路(神經ODE)或另一類型的類神經網路中至少一者。
如本文所使用之「標的醣肽分析物」可指肽結構(例如醣基化或無醣基化/非醣基化)、肽結構之一部分、肽結構之子結構(例如聚醣或醣基化位點)、與檢測分子(例如信號分子、標示或標籤)相關聯的以上列出之結構和子結構中之一或多者的產物或可以質譜法測量之胺基酸序列。
如本文所使用之「肽數據集」可與「肽結構數據」互換使用且可指來自所得質譜法運行之肽或與肽有關的任何數據。肽數據集可包含使用質譜法自樣品或生物學樣品所獲得的數據。肽數據集可包含與NGEP外標準有關的數據、與內標準有關的數據及與樣品之標的醣肽分析物有關的數據。肽數據集可自源於單次運行之分析得到。在一些實施態樣中,肽數據集可包括一或多個肽之原始豐度及質量電荷比。
如本文所使用之「非醣基化內源肽」(「NGEP」)亦可稱為無醣基化肽,其可指不包含聚醣分子之肽結構。在各種實施態樣中,NGEP及標的醣肽分析物可源於相同的受試者。在各種實施態樣中,NGEP可經同位素標示以準備用於質譜分析。
如本文所使用之「轉移(transition)」可指或識別肽結構。在一些實施態樣中,轉移可指與前驅離子及產物或片段離子相關聯的m/z值之特定配對。
如本文所使用之「非醣基化內源肽」(「NGEP」)可指不包含聚醣分子之肽結構。在各種實施態樣中,NGEP及標的醣肽分析物可衍生自相同的蛋白質序列。在一些實施態樣中,NGEP及標的醣肽分析物可衍生自或包括相同的肽序列。在各種實施態樣中,NGEP可經同位素標示以準備用於質譜分析。
如本文所使用之「豐度值」可指「豐度」或與豐度相關聯的量化值。
如本文所使用之「豐度」可指使用質譜法所得出的量化值。在各種實施態樣中,量化值可與生物學樣品中存在的特定肽結構(例如生物標記)的量有關。在一些實施態樣中,該量可能與樣品中存在的其他結構有關(例如相對豐度)。在一些實施態樣中,量化值可包含使用質譜法得到的離子量。在一些實施態樣中,量化值可與m/z值(例如在x軸上的豐度及在y軸上的m/z)相關聯。在其他的實施態樣中,量化值可以原子質量單位表示。
如本文所使用之「相對豐度」可指二或更多個豐度的比較。在各種實施態樣中,比較可包含一個肽結構與總數量的肽結構比較。在一些實施態樣中,比較可包含一個肽醣型(例如兩個相同的肽以一或多個聚醣區別)與一組肽醣型比較。在一些實施態樣中,比較可包含具有特定m/z的數個離子與所檢測之總數量的離子比較。在各種實施態樣中,相對豐度可以比表示。在其他的實施態樣中,相對豐度可以百分比表示。相對豐度可呈示於質譜圖的y軸上。
如本文所使用之「內標準」可指可內含在(例如摻入)與進行質譜分析之標的醣肽分析物相同的樣品中之某物。內標準可用於校準目的。另外,內標準可用於本文所述之系統及方法中。在一些態樣中,內標準可基於m/z相似性及/或滯留時間來選擇,且若特定的標準太貴或不可用,則可為「替代物」。內標準可經重標示或未經重標示。
III.示例性工作流程之綜述
圖1為依照一或多個實施態樣用於檢測使用於診斷及/或治療與疾病狀態相關聯的肽結構之示例性工作流程100的示意圖。工作流程100可包括各種操作,包括例如樣品收集102、樣品攝入104、樣品準備和處理106、數據分析108及輸出生成110。
樣品收集102可包括例如獲得一或多位受試者(諸如受試者114)之生物學樣品112。生物學樣品112可採用經由一或多種取樣方法所獲得的試樣形式。生物學樣品112可為整體或特定組織、細胞類型或其他關注的類別或子類別之受試者114的代表。生物學樣品112可以許多不同方式中任一者獲得。在各種實施態樣中,生物學樣品112包括經由抽血所獲得的全血樣品116。在其他的實施態樣中,生物學樣品112包括一組等分樣品118,其包括例如血清樣品、血漿樣品、血液細胞(例如白血球(WBC)、紅血球(RBC)樣品)、另一類型的樣品或其組合。生物學樣品112可包括核苷酸(例如ssDNA、dsDNA、RNA)、胞器、胺基酸、肽、蛋白質、碳水化合物、醣蛋白或其任何組合。
在各種實施態樣中,單次運行可分析樣品(例如包含肽分析物之樣品)、外標準(例如血清樣品之NGEP)及內標準。如此,外標準、內標準及標的醣肽分析物之豐度值(例如豐度或原始豐度)可在同一運行中以質譜法測定。
在各種實施態樣中,外標準可在分析樣品前分析。在各種實施態樣中,外標準可在樣品之間獨立地運行。在一些實施態樣中,外標準可在每1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20次或更多次實驗後分析。在各種實施態樣中,外標準數據可用於本文所述之一些或所有的標準化系統及方法中。在附加的實施態樣中,可處理空白樣品以防止管柱結垢。
樣品攝入104可包括一或多個各種操作,諸如等分、登記、處理、儲存、解凍及/或其他類型的操作。在一或多個實施態樣中,當生物學樣品112包括全血樣品116時,樣品攝入104包括等分全血樣品116以形成一組等分樣品,接著可細等分(sub-aliquoted)以形成一組樣品120。
樣品準備和處理106可包括例如一或多個操作以形成一組肽結構122。在各種實施態樣中,該組肽結構122可包括已經歷消化且可準備好用於分析之未摺疊蛋白質的各種片段。
再者,樣品準備和處理106可包括例如基於一組肽結構122之數據擷取124。例如,數據擷取124可包括使用例如但不限於液相層析/質譜(LC/MS)系統。
數據分析108可包括例如肽結構分析126。在一些實施態樣中,數據分析108亦包括輸出生成110。在其他的實施態樣中,輸出生成110可被認為不同於數據分析108的操作。輸出生成110可包括例如基於肽結構分析126的結果而得出最終輸出128。在各種實施態樣中,最終輸出128可用於確定與脂肪肝疾病相關聯的狀態之研究、診斷及/或治療。
在各種實施態樣中,最終輸出128係由一或多個輸出所組成。最終輸出128可採用各種形式。例如,最終輸出128可為包括例如診斷輸出、治療輸出(例如治療設計輸出、治療計劃輸出或其組合)、分析之數據(例如相對化和標準化)或其組合的報告。在一些實施態樣中,報告可包含作為 NGEP 濃度值及標準化豐度值之函數的標的醣肽分析物濃度。在一些實施態樣中,最終輸出128可為警報(例如可視化警報、語音警報等)、通知(例如可視化通知、語音通知、電子郵件通知等)、電子郵件輸出或其組合。在一些實施態樣中,最終輸出128可發送至遠端系統130用於處理。遠端系統130可包括例如電腦系統、伺服器、處理器、雲端計算平台、雲端儲存、膝上型電腦、平板電腦、智慧型手機、一些其他類型的移動式計算設備或其組合。
在其他的實施態樣中,工作流程100可視需要地排除本文所述操作中之一或多者及/或可視需要地包括本文所述操作以外的一或多個其他步驟或操作(例如除了及/或代替那些本文所述者)。因此,工作流程100可以用於例如FLD之研究、診斷及/或治療的許多不同方式中任一者實施。
IV.肽結構之檢測及量化
圖2A和2B為依照一或多個實施態樣的樣品準備和處理106之工作流程的示意圖。圖2A和2B係以繼續參考圖1來說明。樣品準備和處理106可包括例如圖2A中所示之準備工作流程200及圖2B中所示之數據擷取124。
IV.A. 樣品準備及處理
圖2A為依照一或多個實施態樣之準備工作流程200的示意圖。準備工作流程200可用於準備樣品,諸如圖1中用於經由數據擷取124分析的一組樣品120之樣品。例如,此分析可經由質譜法(例如LC-MS)執行。在各種實施態樣中,準備工作流程200可包括變性和還原202、烷基化204及消化206。
呈其天然形式的聚合物(諸如蛋白質)通常可折疊以包括二級、三級及/或其他更高級結構。此等更高級結構可使蛋白質功能化以完成在受試者中的任務(例如賦予酶活性)。再者,聚合物的此等更高級結構可經由聚合物內的胺基酸之側鏈之間的各種相互作用來維持。此等相互作用可包括半胱胺酸殘基之間的離子鍵結、疏水性相互作用、氫鍵結及二硫鍵。然而,當使用包括質譜法之分析系統及方法時,可能希望使此等聚合物(例如肽/蛋白質分子)去摺疊以獲得序列訊息。在一些實施態樣中,使聚合物去摺疊可包括使聚合物變性,其可包括例如使聚合物線性化。
在一或多個實施態樣中,變性和還原202可用於破壞樣品(例如圖1中的一組樣品120之一)中的一或多個蛋白質(例如多肽和肽)的更高級結構(例如二級、三級、四級等)。變性和還原202包括例如變性程序和還原程序。在一些實施態樣中,變性程序可使用例如熱變性執行,其中使用熱作為變性劑。熱變性可破壞離子鍵結、疏水性相互作用及/或氫鍵結。
在一或多個實施態樣中,變性程序可包括使用一或多種變性劑、溫度(例如熱)或兩者。一或多種該等變性劑可包括例如但不限於離液鹽(chaotropic salt)(例如脲、胍)、界面活性劑(例如十二烷基硫酸鈉(SDS)、β-辛基葡糖苷、Triton X-100)或其組合中任何幾種。在一些例子中,當樣品準備工作流程進一步包括清除程序時,此等變性劑可與熱組合使用。
所得一或多種變性(例如去摺疊、線性化)蛋白質接著可經歷進一步的處理以準備分析。例如,可執行其中應用一或多種還原劑之還原程序。在各種實施態樣中,還原劑可產生鹼性pH。還原劑可採用例如(非限制)二硫蘇糖醇(DTT)、三(2-羧乙基)膦(TCEP)或一些其他還原劑之形式。還原劑可還原(例如切割)一或多種變性蛋白質的半胱胺酸殘基之間的二硫鍵以形成一或多種還原蛋白質。
在各種實施態樣中,起因於變性和還原202的一或多種還原蛋白質可經歷防止例如一或多種還原蛋白質的半胱胺酸殘基之間的二硫鍵重新形成之過程。此過程可使用烷基化204實施以形成一或多種烷基化蛋白質。例如,可使用烷基化204添加乙醯胺基團至各半胱胺酸殘基上的硫中,以防止二硫鍵聯重新形成。在各種實施態樣中,乙醯胺基團可藉由一或多種烷基化劑與還原蛋白質反應來添加。一或多種烷基化劑可包括例如一或多種乙醯胺鹽。烷基化劑可採用例如碘乙醯胺(IAA)、2-氯乙醯胺、一些其他類型的乙醯胺鹽或一些其他類型的烷基化劑之形式。
在一些實施態樣中,烷基化204可包括淬滅程序。淬滅程序可使用一或多種還原劑(例如上述還原劑中之一多者)執行。
在各種實施態樣中,經由烷基化204所形成的一或多種烷基化蛋白質接著可經歷消化206以準備用於分析(例如質譜分析)。蛋白質之消化206可包括切割在一或多個切割位點上或周圍(例如可為一或多個胺基酸殘基之位點205)的蛋白質。例如(非限制),烷基化蛋白質可在離胺酸或精胺酸殘基的羧基側鏈上切割。此類型的切割可分解蛋白質成為不同的片段,其包括一或多個肽結構(例如醣基化或無醣基化)。
在各種實施態樣中,消化206可使用一或多種蛋白分解觸媒執行。例如,酶可用於消化206。在一些實施態樣中,酶採用胰蛋白酶之形式。在其他的實施態樣中,可使用除了或代替胰蛋白酶的一或多種其他類型的酶(例如蛋白酶)。一或多種該等其他酶包括但不限於LysC、LysN、AspN、GluC和ArgC。在一些實施態樣中,消化206可使用經甲苯磺醯基苯基丙胺醯基氯甲基酮(TPCK)處理之胰蛋白酶、胰蛋白酶的一或多個工程化形式、胰蛋白酶的一或多個其他調配物或其組合來執行。在一些實施態樣中,消化206可以多步驟執行,各步驟涉及使用一或多種消化劑。例如,可執行二級消化、三級消化等。在一或多個實施態樣中,使用胰蛋白酶消化血清樣品。在一或多個實施態樣中,使用胰蛋白酶/LysC雞尾酒消化血漿樣品。
在一些實施態樣中,消化206進一步包括淬滅程序。淬滅程序可藉由酸化樣品(例如至pH <3)來執行。在一些實施態樣中,可使用甲酸執行此酸化。
在各種實施態樣中,準備工作流程200進一步包括消化後程序207。消化後程序207可包括例如清除程序。清除程序可包括例如移除樣品中起因於消化206的多餘組分。例如,多餘組分可包括但不限於無機離子、界面活性劑等。在一些實施態樣中,消化後程序207進一步包括添加經重標示之肽內標準的程序。
儘管準備工作流程200已經有關自基於血液之生物學樣品112(例如全血樣品、血漿樣品、血清樣品等)建立或獲取之樣品說明,但是樣品準備工作流程200可類似地實施於其他類型的樣品(例如淚液、尿液、組織、間質液、痰液等)以產生一組肽結構122。
IV.B. 肽結構識別及量化
圖2B為依照一或多個實施態樣之數據擷取124的示意圖。在各種實施態樣中,數據擷取124可在圖2A中所述之樣品準備200後開始。在各種實施態樣中,數據擷取124可包含量化208、質量控制210及峰值積分和標準化212。
在各種實施態樣中,肽及醣肽之靶向量化208可合併使用液相層析-質譜LC/MS儀器。例如,可使用LC-MS/MS或串接的MS。LC/MS(例如LC-MS/MS)通常可組合液相層析(LC)之物理分離能力與質譜法(MS)之質量分析能力。根據本文所述之一些實施態樣,此技術容許自LC管柱分離之消化肽通過介面送入MS離子源中。
在各種實施態樣中,任何LC/MS設備可併入本文所述之工作流程中。在各種實施態樣中,適合於識別及靶向量化208之儀器或儀器系統可包括例如三段四極桿LC/MS
TM。在各種實施態樣中,靶向量化208係使用多反應監測質譜法(MRM-MS)執行。
在本文所述之各種實施態樣中,可評定特定蛋白質或肽的識別及相關量。在本文所述之各種實施態樣中,可評定特定聚醣的識別及相關量。在本文所述之各種實施態樣中,特定聚醣可與蛋白質或肽上的醣基化位點匹配且測量豐度值。
在一些例子中,靶向量化208包括使用與適當的分段相關聯的特定碰撞能量以一致地看到豐富的產物離子。醣肽結構可能具有比無醣基化肽結構更低的碰撞能量。當分析包括醣肽結構的樣品時,與一般的蛋白體學分析相比,可降低電源電壓及氣體溫度。
在各種實施態樣中,可設置質量控制210程序以優化數據質量。在各種實施態樣中,可設置僅容許誤差在超出預期值之可接受範圍內的量度。在各種實施態樣中,使用統計模式(例如使用Westgard 規則)可幫助質量控制210。例如,質量控制210可包括例如評定每一樣品或各質量控制樣品(例如儲集之血清消化物)中的代表性肽結構(例如醣基化及/或無醣基化)及摻入的內標準之滯留時間及豐度。
可執行峰值積分和標準化212以處理已得出之數據且將數據轉變成分析格式。例如,峰值積分和標準化212可包括將檢測選定的肽結構之各種產物離子的豐度數據轉換成該肽結構之單一量化度量(例如相對量、調整量、標準化量、相對濃度、調整濃度、標準化濃度等)。在一些實施態樣中,峰值積分和標準化212可使用美國專利公開案第2020/0372973A1號及/或美國專利公開案第2020/0240996A1號所述技術中之一或多者執行,將該等公開案以彼之全文併入本文以供參考。
V. 用於肽結構數據分析之示例性系統
V.A. 用於肽結構數據分析之分析系統
圖3為依照一或多個實施態樣之分析系統300的方塊圖。分析系統300可用於既檢測且分析已與各種FLD狀態相關聯的各個肽結構。分析系統300為一個實施可用於執行圖1中的數據分析108之系統的實例。因此,分析系統300係以繼續參考如圖1、2A及/或2B所述之工作流程100來說明。
分析系統300可包括計算平台302及數據儲存304。在一些實施態樣中,分析系統300亦包括顯示系統306。計算平台302可採用各種形式。在一或多個實施態樣中,計算平台302包括單一電腦(或電腦系統)或相互通訊的多個電腦。在其他實例中,計算平台302採用雲端計算平台之形式。
數據儲存304及顯示系統306可分別與計算平台302通訊。在一些實例中,數據儲存304、顯示系統306或兩者可認為是計算平台302的一部分或以其他方式與其整合。因此,在一些實例中,計算平台302、數據儲存304及顯示系統306可為相互通訊的獨立組件,但在其他實例中,可將該等組件的一些組合整合在一起。在該等不同組件之間的通訊可使用有線通訊線路、無線通訊線路、光通訊線路或其組合中任何幾種線路來實施。
分析系統300包括例如肽結構分析器308,其可使用硬體、軟體、韌體或其組合來實施。在一或多個實施態樣中,肽結構分析器308係使用計算平台302來實施。
肽結構分析器308接收肽結構數據310用於處理。肽結構數據310可為例如自圖1、2A和2B中的樣品準備和處理106輸出之肽結構數據。因此,肽結構數據310可對應於以生物學樣品112所識別之一組肽結構122且由此可對應於生物學樣品112。
肽結構數據310可作為輸入發送至肽結構分析器308中,自數據儲存304或一些其他類型的儲存(例如雲端儲存器)中檢索,自雲端儲存存取或以一些其他方式獲得。在一些例子中,肽結構數據310可回應於(例如直接或間接地基於)接收由使用者經由輸入設備進入之使用者輸入而自數據儲存304檢索。
肽結構數據310可包括用於多個肽結構的量化數據。例如,肽結構數據310可包括用於多個肽結構之各肽結構的一組量化量度。用於肽結構的量化度量可選擇為相對量、調整量、標準化量、相對豐度、調整豐度及標準化豐度中之一者。在一些例子中,用於肽結構的量化度量可選自相對濃度、調整濃度及標準化濃度中之一者。在此方式中,肽結構數據310可提供有關生物學樣品112的關於多個肽結構之豐度訊息。
在一些實施態樣中,一組肽結構312之肽結構包含以肽序列定義之醣基化肽結構或醣肽結構及附著至肽序列之連結位點的聚醣結構。例如,肽結構可為醣肽或一部分的醣肽。在一些實施態樣中,一組肽結構312之肽結構包含以肽序列定義之無醣基化肽結構。例如,肽結構可為肽或一部分的肽且可稱為量化肽。
一組肽結構312可基於模式314之訓練而被識別為與症狀性疾病狀態最有預測性或最相關的肽結構。在一或多個實施態樣中,一組肽結構312包括以下表1中所識別之肽結構中至少一、至少二、至少三、至少四、至少五、至少六、至少七、至少八、至少九、至少十、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52或全部53個。自表1所選擇之包含在一組肽結構312中之肽結構的數量可以例如所欲準確度水平為基礎。在一或多個實施態樣中,自表1選擇40個包含在一組肽結構312中之肽結構。
在表1中,「PS-ID No.」識別肽結構的標示或索引;「肽結構(PS)名稱」識別肽結構的名稱;「Prot. SEQ ID NO.」識別與肽結構相關聯的蛋白質(例如自其衍生出肽結構)之序列ID;「Pep. SEQ ID No.」識別肽結構之肽序列的肽SEQ ID NO.;「單一同位素質量」識別肽結構以道耳頓(Da)計的單一同位素質量;「Linking Site Pos. in Prot. Seq.」識別有關蛋白質序列連結對應的聚醣結構之位點位置;「Linking Site Pos. in Pep. Seq.」識別有關肽序列連結對應的聚醣結構之位點位置;及「GL NO.」識別對應的聚醣結構的標示或索引。關於醣肽結構,肽結構的名稱包括與肽結構相關聯的蛋白質之縮寫,對應有關蛋白質之蛋白質序列的連結位點位置的第一號碼及識別連結至蛋白質之聚醣的第二號碼。關於無醣基化肽結構,肽結構的名稱包括與肽結構相關聯的蛋白質之縮寫及肽結構之對應的肽序列。
在一或多個實施態樣中,一組肽結構312僅包括自α-2-大球蛋白(A2MG)分段之肽結構且因此僅包括A2MG醣型。在一或多個實施態樣中,一組肽結構312僅包括自α-1-酸性醣蛋白1(AGP1)分段之肽結構且因此僅包括AGP1醣型。在一或多個實施態樣中,一組肽結構312僅包括自血紅素結合素(HPT)分段之肽結構且因此僅包括HPT醣型。在一或多個實施態樣中,一組肽結構312僅包括自補體因子H(CFAH)分段之肽結構且因此僅包括CFAH醣型。在一或多個實施態樣中,一組肽結構312僅包括自α-1-抗胰蛋白酶(A1AT)分段之肽結構且因此僅包括A1AT醣型。在一些實施態樣中,一組肽結構312僅包括自A2MG、AGP1、HPT、CFAH或A1AT中至少一者分段之肽結構。
肽結構分析器308包括經配置以接收肽結構數據310用於處理之模式314。模式314可以許多不同方式中任一者實施。模式314可使用模式、函數、方程式、演算法及/或其他數學技術中任何幾種實施。
在一或多個實施態樣中,模式314包括機器學習模式316,其本身可由機器學習模式及/或演算法中任何幾種所組成。例如,機器學習模式316可包括而不限於參數模式、非參數模式、深度學習模式、類神經網路、線性判別分析模式、二次判別分析模式、支援向量機、隨機森林演算法、近鄰演算法(例如k-最近鄰演算法)、組合式判別分析模式、k平均數叢聚演算法、無監督模式、邏輯迴歸模式、多變量迴歸模式、懲罰式多變量迴歸模式或其他類型的模式中至少一者。在各種實施態樣中,模式314包括機器學習模式316,其包含上述模式或演算法中任何幾種或組合。
在各種實施態樣中,模式314分析對應一組肽結構312的部分(例如一些或全部)肽結構數據310以得出疾病指標318,其分類作為驗證與FLD進展相關聯的多種狀態320之對應狀態的生物學樣品112。疾病指標318可採用各種形式。在一或多個實施態樣中,疾病指標318為指示生物學樣品112之對應狀態分類的評分。例如,每一狀態320可與用於評分之不同的值範圍相關聯。若評分落在與狀態320之特定狀態相關聯的選定範圍內,則評分指示生物學樣品112驗證該特定狀態。因此,評分提供作為對應於該特定狀態的生物學樣品112之分類。
在其他的實施態樣中,疾病指標318包括指示受試者(例如圖1中的受試者114)落在與FLD進展相關聯的狀態320之一內的機率之評分。例如,疾病指標318可包括一或多個評分,每一評分可指示生物學樣品112是否驗證與FLD進展相關聯的狀態320之對應狀態。在一些實例中,疾病指標318包括與FLD進展相關聯的每一狀態320之評分。評分越高指示生物學樣品112驗證對應狀態的機率越高。
在各種實施態樣中,機器學習模式316採用迴歸模式320之形式。迴歸模式320可包括例如至少一種LASSO迴歸模式(或LASSO正則化模式),其經訓練以計算疾病指標318。迴歸模式320可經訓練以識別一組肽結構312之肽結構的加權係數。
肽結構分析器308可基於以模式314輸出之疾病指標318而得出最終輸出128。在其他的實施態樣中,最終輸出128可為以模式314得出之輸出。
在一些實施態樣中,最終輸出128包括疾病指標318。在其他的實施態樣中,最終輸出128包括診斷輸出324及/或治療輸出326。診斷輸出324可包括例如基於疾病指標318識別以生物學樣品112驗證的狀態320之分類。治療輸出326可包括例如確認治療受試者之治療劑、用於治療劑之設計或用於投予治療劑之治療計劃中至少一者。在一些實施態樣中,治療劑可為免疫檢查點抑制劑。
在一些實例中,最終輸出128可發送至遠端系統130用於處理。在其他的實施態樣中,最終輸出128可顯示在顯示系統306中的圖形使用者介面328上供人工操作員察看。當最終輸出128指示受試者隨著疾病(例如FLD)之疾病進展而呈陽性狀態(例如NASH、HCC)時,人工操作員可使用最終輸出128以診斷及/或治療受試者。
V.B. 電腦實施系統
圖4為依照各種實施態樣之電腦系統的方塊圖。電腦系統400可為一種實施以上圖3所述之計算平台302的實例。
在一或多個實例中,電腦系統400可包括用於傳達訊息之匯流排402或其他通訊機制及用於處理訊息的與匯流排402耦合之處理器404。在各種實施態樣中,電腦系統400亦可包括記憶體,其可為隨機存取記憶體(RAM) 406或其他動態儲存設備,與匯流排402耦合以確定由處理器404執行之指令。記憶體亦可用於儲存在執行由處理器404執行之指令期間的臨時變量或其他中間訊息。在各種實施態樣中,電腦系統400可進一步包括唯讀記憶體(ROM) 408或與匯流排402耦合之其他靜態儲存設備 以儲存用於處理器404之靜態訊息及指令。可提供儲存設備410,諸如磁碟或光碟,且與匯流排402耦合以儲存訊息及指令。
在各種實施態樣中,電腦系統400可經由匯流排402與顯示器412(諸如陰極射線管(CRT)或液晶顯示器(LCD))耦合,對電腦使用者顯示訊息。輸入設備414(包括文數字鍵和其他鍵)可與匯流排402耦合以傳達訊息及命令選擇至處理器404。另一類型的使用者輸入設備為游標控制器416,諸如滑鼠、操縱桿、軌跡球、手勢輸入設備、基於凝視之輸入設備或游標方向鍵,用於傳達指引訊息和命令選擇至處理器404及用於控制顯示器 412上的游標移動。此輸入設備414通常在兩個軸,第一軸(例如x)及第二軸(例如y)上具有兩個自由度,其容許設備指定在平面上的位置。然而,應理解本文亦考慮容許三維(例如x、y和z)游標移動之輸入設備414。
與本發明指導之特定實施一致,結果可由電腦系統400回應執行在RAM 406中含有的一或多個指令之一或多個序列的處理器404提供。此等指令可自另一電腦可讀媒體或電腦可讀儲存媒體(諸如儲存設備410)讀入RAM 406中。執行在RAM 406中含有的指令順序可使處理器404執行本文所述之過程。另一選擇地,可使用固線式電路代替軟體指令或與軟體指令組合以實施本發明之教導。因此,本發明指導之實施不限於硬體電路與軟體的任何特定組合。
如本文所使用之術語「電腦可讀媒體」(例如數據儲存(data store)、數據儲存(data storage)、儲存設備、數據儲存設備等)或「電腦可讀儲存媒體」係指參與提供指令至用於執行的處理器404之任何媒體。此種媒體可採用許多形式,包括但不限於非易失性媒體(non-volatile media)、易失性媒體(volatile media)和傳輸媒體。非易失性媒體的實例可包括但不限於光碟、固態硬碟、磁碟,諸如儲存設備410。易失性媒體的實例可包括但不限於動態記憶體,諸如RAM 406。傳輸媒體的實例可包括但不限於同軸電纜、銅線和光纖,包括構成匯流排402的線。
電腦可讀媒體的常見形式包括例如電腦可讀的軟碟(floppy disk)、軟碟(flexible disk)、硬碟、磁帶或任何其他磁性媒體、CD-ROM、任何其他光學媒體、打孔卡片、紙帶、具有孔洞型態的任何其他物理媒體、RAM、PROM和EPROM、FLASH-EPROM、任何其他記憶體晶片或匣或任何其他有形媒體。
除了電腦可讀媒體以外,指令或數據可作為信號提供在包括在通訊裝置或系統中的傳輸媒體上,以提供一或多個指令順序至用於執行的電腦系統400之處理器404。例如,通訊裝置可包括具有指令及數據指示信號的收發器。指令及數據經配置而使一或多個處理器實施本揭示中概述的功能。數據通訊傳輸連線的代表性實例可包括但不限於電話數據機連線、廣域網路(WAN)、區域網路(LAN)、紅外數據連線、NFC連線、光通訊連線等。
應認知本文所述之方法、流程圖、圖表及伴隨的揭示內容公開可使用作為分立設備之電腦系統400或在共享電腦處理資源的分散式網路(諸如雲端計算網路)上實施。
本文所述之方法可取決於應用而以各種方式實施。例如,該等方法可在硬體、韌體、軟體或其任何組合中實施。用於硬體實施之處理單元可在一或多個特定應用積體電路(ASIC)、數位信號處理器(DSP)、數位信號處理設備(DSPD)、可程式邏輯設備(PLD)、場域可程式閘陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子設備、經設計以執行本文所述之功能的其他電子單元或其組合內實施。
在各種實施態樣中,本發明教導之方法可作為韌體及/或軟體程式及以習知的程式語言(諸如C、C++、Python等)編寫之應用程序實施。若作為韌體及/或軟體實施,則本文所述之實施態樣可在非暫時性電腦可讀媒體上實施,該媒體儲存使電腦執行上述方法之程式。應理解本文所述之各種工具(engine)可提供在電腦系統(諸如電腦系統400)上,由此使處理器404能執行由該等工具所提供的分析及確定,受制於由記憶體組件RAM 406、ROM、408中任何一者或其組合或儲存設備410及經由輸入設備414所提供的使用者輸入所提供的指令。
VI. 與基於肽結構數據分析之診斷有關的示例性方法
VI.A. 通用方法
圖5為用於分類自受試者所獲得的生物學樣品有關與脂肪肝(FLD)進展相關聯的多種狀態之過程的流程圖。過程500可使用例如如圖1、2A和2B中所述之至少一部分的工作流程100及/或如圖3中所述之分析系統300實施。可使用過程500得出診斷輸出,諸如圖3中的診斷輸出324。
步驟502包括接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。肽結構數據可為例如一個實施圖3中的肽結構數據310的實例。肽結構數據可包括多個肽結構之各肽結構的量化數據。肽結構數據可能已使用例如(非限制)多反應監測質譜法(MRM-MS)得出。在一或多個實施態樣中,肽結構數據包括多個肽結構的量化數據。肽結構的此量化數據可包括例如(非限制)肽結構的豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。在一或多個實施態樣中,量化數據包含肽結構的標準化豐度。
在一或多個實施態樣中,肽結構數據係自生物學樣品建立的樣品得出。例如,生物學樣品可使用還原、烷基化及酶消化準備,以形成備好的樣品。備好的樣品包括多個肽結構,得出其肽結構數據且接著於步驟502中接收。
步驟504包括將自一組肽結構之肽結構數據所識別之量化數據輸入機器學習模式中。在一些實施態樣中,該組肽結構包括自以上表1中的多個肽結構所識別之至少一個肽結構。在各種實施態樣中,至少一個肽結構包含以肽序列定義之醣肽結構及在肽序列之連結位點上連結至肽序列之聚醣結構,如表1中所識別。
量化數據可包括例如多個肽結構之各肽結構的一或多個量化量度。肽結構的量化量度可為例如但不限於相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度。在此方式中,以給出之肽結構的量化數據提供在生物學樣品中之肽結構的豐度指示。在一或多個實施態樣中,量化數據包含肽結構的標準化豐度。機器學習模式可為例如監督式機器學習模式。
步驟506包括使用機器學習模式分析量化數據以得出疾病指標。在各種實施態樣中,得出之疾病指標可包括生物學樣品是否驗證與FLD進展相關聯的狀態之指示。例如,疾病指標可指示生物學樣品是否有可能對NASH或HCC為陽性或有可能為健康的或非NASH/HCC(例如可能為良性肝腫塊之指示)。在各種實施態樣中,疾病指標包含生物學樣品驗證NASH狀態之機率或生物學樣品驗證HCC狀態之機率。在一或多個實施態樣中,機器學習模式可得出生物學樣品分類成NASH狀態陽性、HCC狀態陽性或健康(或NASH/HCC)狀態陽性之輸出。在各種實施態樣中,疾病指標可為評分。
步驟508包括基於疾病指標得出診斷輸出,該疾病指標分類作為驗證與FLD進展相關聯的多種狀態之對應狀態的生物學樣品。在各種實施態樣中,多種狀態可包括NASH狀態及肝細胞癌(HCC)狀態。在一些實施態樣中,多種狀態可包括非NASH/HCC狀態,該非NASH/HCC狀態包含健康狀態、良性肝腫塊狀態、無肝疾病狀態或一些其他類型的非NASH/HCC狀態中至少一者。
當疾病指標為評分時,步驟508可包括確定評分落在與多種狀態之對應狀態相關聯的選定範圍內(例如對非NASH/HCC狀態為介於0.0與0.05之間,對NASH狀態為介於0.05與0.4之間及對HCC狀態為介於0.4與1.0之間)。在一些實施態樣中,步驟506可包括確定生物學樣品係基於確定分數落在與對應狀態相關聯的選定範圍內來驗證對應狀態。
在一或多個實施態樣中,在步驟508中得出診斷輸出包括得出作為識別對應狀態之報告的一部分之診斷輸出。在一些實施態樣中,步驟508亦可包括基於診斷輸出或疾病指標中至少一者得出治療輸出。在一些實施態樣中,治療輸出包含確認治療受試者之治療、用於治療之設計、用於治療之製造計劃或用於投予治療之治療計劃中至少一者。
用於被診斷具有NASH的受試者之治療可包括例如奧貝膽酸(OCA)、曲匹氟索(Tropifexor)、艾拉非諾(Elafibranor)、賽格列扎(Saroglitazar)、阿雷美秋(Aramchol)、希馬魯肽(Semaglutide)、替西帕肽(Tirzepatide)、考他杜肽(Cotadutide)、NGM282、MSDC-0602K、瑞美替倫(Resmetirom)、仙尼維洛(Cenicriviroc)、瑟隆色替(Selonsertib)、艾瑞卡桑(Emricasan)、西姆珠單抗(Simtuzumab)和GR-MD-02中至少一者之治療劑量。用於被診斷具有NASH的受試者之治療可包括例如阿特珠單抗(Atezolizumab)、貝伐珠單抗(Bevacizumab)、索拉非尼、樂伐替尼、尼沃魯單抗、瑞戈非尼、卡博替尼、培美替尼(Pemigatinib)、雷莫蘆單抗或帕博利珠單抗中至少一者之治療劑量。
圖6為用於檢測存在於生物學樣品中與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者之過程的流程圖。過程600可使用例如如圖1、2A和2B中所述之至少一部分的工作流程100中及/或如圖3中所述之分析系統300實施。
步驟602包括接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。肽結構數據可能已使用例如多反應監測質譜法(MRM-MS)製備好的樣品得出。肽結構數據可包括肽結構組之各肽結構的量化數據。多個肽結構之肽結構的量化數據可包括相對量、調整量、標準化量、相對濃度、調整濃度、標準化濃度或另一量化度量中至少一者。
步驟604包括使用監督式機器學習模式分析肽結構數據,基於選自自表1中所識別之肽結構群組的至少3個肽結構得出疾病指標。在一或多個實施態樣中,監督式機器學習模式包含邏輯迴歸模式。
在各種實施態樣中,至少3個肽結構包括以肽序列定義之醣肽結構及在肽序列之連結位點上連結至肽序列之聚醣結構,如表1中所識別,以肽序列為如表1中所定義之SEQ ID NOS:23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52中之一者。
在一或多個實施態樣中,至少3個肽結構僅包括自α-2-大球蛋白(A2MG)分段之肽結構。在一或多個實施態樣中,至少3個肽結構僅包括自α-1-酸性醣蛋白1(AGP1)分段之肽結構。在一或多個實施態樣中,至少3個肽結構僅包括自血紅素結合素(HPT)分段之肽結構。在一或多個實施態樣中,至少3個肽結構僅包括自補體因子H(CFAH)分段之肽結構。在一或多個實施態樣中,至少3個肽結構僅包括自α-1-抗胰蛋白酶(A1AT)分段之肽結構。
在各種實施態樣中,步驟604可包括計算生物學樣品之肽結構輪廓,其識別至少3個肽結構之各肽結構的加權值。在一些實施態樣中,至少3個肽結構之肽結構的加權值可為自肽結構數據所識別之肽結構的量化度量與肽結構的加權係數之乘積。至少3個肽結構之對應肽結構的加權係數可指示對應肽結構對疾病指標的相對重要性。在一或多個實施態樣中,分析肽結構數據包含使用肽結構輪廓計算疾病指標。疾病指標可為例如指示由生物學樣品驗證之多種狀態中的哪一狀態之評分。
在一或多個實施態樣中,監督式機器學習模式使用3種不同的模式得出最終疾病指標。該三種模式可分別為例如用於分析特定狀態相對於其他狀態的肽結構量化數據之迴歸模式。例如,該3種迴歸模式之各者可用於區分多種狀態之給出狀態與多種狀態之其他狀態。
在一或多個實施態樣中,步驟604之至少3個肽結構可選自以下表2中所識別之那些肽結構,其中表2包括在表1中所識別之肽結構子集。表2進一步識別與區分NASH狀態相對於其他狀態(例如HCC狀態及對照狀態)、HCC狀態相對於其他狀態(例如NASH狀態及對照狀態)及對照狀態相對於其他狀態(例如NASH狀態及HCC狀態)相關聯的加權係數。
在表2中,「PS-ID No.」識別肽結構的標示或索引;「肽結構(PS)名稱」識別肽結構的名稱;「Prot. SEQ ID NO.」識別與肽結構相關聯的蛋白質(例如自其衍生出肽結構)之序列ID;「Pep. SEQ ID No.」識別肽結構之肽序列的肽SEQ ID NO.;「Coeff.(Control v. Rest)」識別對照狀態相對於其他狀態之間的加權係數;「Coeff.(NASH v. Rest)」識別NASH相對於其他狀態之間的加權係數;及「Coeff.(HCC v. Rest)」識別HCC相對於其他狀態之間的加權係數。
步驟606包括以回應於確定疾病指標落在與對應狀態相關聯的選定範圍內來檢測與FLD進展相關聯的多種狀態之對應狀態的存在。在一些實施態樣中,多種狀態包括至少兩種選自由非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態或非NASH/HCC狀態(例如非酒精性脂肪肝疾病狀態、對照狀態、健康狀態、良性肝腫塊狀態、無肝疾病狀態)所組成之群組的狀態。
在一或多個實施態樣中,對應狀態為非NASH/HCC狀態且與非NASH/HCC狀態相關聯的疾病指標之選定範圍係介於0.00與約0.05之間。在一些實施態樣中,對應狀態為NASH狀態且與NASH狀態相關聯的疾病指標之選定範圍係介於0.05與0.4之間。在一些實施態樣中,對應狀態為HCC狀態且與HCC狀態相關聯的疾病指標之選定範圍係介於0.4與1.0之間。
在一或多個實施態樣中,過程600可進一步包括得出包括基於對受試者所檢測的對應狀態之診斷的報告。報告可包括例如疾病指標。
VI.B. 訓練模式
圖7為用於訓練模式以得出作為屬於或驗證與FLD進展相關聯的多種狀態中之一者的生物學樣品分類之過程的流程圖。過程700可使用例如如圖3中所述之分析系統300實施。在一或多個實施態樣中,可執行過程700以訓練在圖3中的模式314。
步驟702包括接收被診斷具有與FLD進展相關的多種狀態的多位受試者之肽結構組的量化數據,其中量化數據包含多位受試者之多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之對應狀態。
在一或多個實施態樣中,多個肽結構輪廓包含第一數量之肽結構的標準化豐度數據。在一或多個實施態樣中,被診斷具有多種狀態的多位受試者之該肽結構組的量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
步驟704包括使用量化數據訓練監督式機器學習模式以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態。在各種實施態樣中,監督式機器學習模式包含邏輯迴歸模式。在一或多個實施態樣中,邏輯迴歸模式可為LASSO正則化模式。多種狀態可包括例如NASH狀態、HCC狀態或非NASH/HCC狀態中至少一者。
在一或多個實施態樣中,步驟704可包括例如訓練監督式機器學習模式,基於來自以上表1或表2中所識別之肽結構列表之至少3個肽結構的量化數據來確定狀態。
經選擇用於訓練之肽結構可為自例如差異性表現分析所識別之肽結構,該分析係使用初始訓練數據與第一部分被診斷具有NASH的多位受試者、第二部分被診斷具有HCC的多位受試者及第三部分被診斷具有非NASH/HCC狀況(例如健康狀態、良性肝腫塊狀態、無肝疾病狀態等)的多位受試者之肽結構的量化數據比較來執行。
例如,可執行比較,以比較第一部分具有NASH的受試者相對於第三部分具有非NASH/HCC狀況(例如對照狀態)的受試者之間、比較第二部分具有HCC的受試者相對於第一部分具有NASH的受試者之間及/或比較第一部分具有NASH的受試者相對於第二部分具有HCC的受試者之間的肽結構量化數據。在一些實施態樣中,可將比較標準化且互相比較。
在章節VI中所述之示例性方法可用於診斷患有FLD的受試者。此診斷可用於確定治療受試者之方法。本文所述之實施態樣能夠更快且更準確診斷NASH相對於HCC的狀態。能夠更快且準確地診斷在FLD進展中自NASH惡化至HCC的受試者(或患者),能夠更快地治療受試者,其可導致受試者更希望的治療結果。再者,能夠更快且更準確地確定受試者何時自NASH惡化至HCC,可特別有用於減少住院的需求且避免死亡。
圖8為依照一或多個實施態樣用於分類作為對應於與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者的生物學樣品之過程的流程圖。過程800可使用如圖1、2A及/或2B中所述之至少一部分的工作流程100及/或如圖3中所述之分析系統300實施。
步驟802包括使用訓練數據訓練監督式機器學習模式。在一或多個實施態樣中,訓練數據包含多位訓練受試者的多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之對應狀態。
步驟804包括接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據。
步驟806包括將自一組肽結構之肽結構數據所識別之量化數據輸入已經訓練之監督式機器學習模式中。在一些實施態樣中,該組肽結構包括至少一個在表1中所識別之肽結構。
步驟808包括使用監督式機器學習模式分析量化數據以得出評分。
步驟810包括確定評分落在與FLD進展相關聯的多種狀態之對應狀態相關聯的選定範圍內。
步驟812包括得出診斷輸出,其指示生物學樣品驗證對應狀態。在一些實施態樣中,多種狀態包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC(例如對照物或健康)狀態。
VII. 用於治療之示例性方法
VII.A. 治療NASH
圖9為依照一或多個實施態樣用於治療受試者的NASH之過程的流程圖。過程900可使用如圖1、2A及/或2B所述之至少一部分的工作流程100及/或如圖3中所述之分析系統300至少部分實施。
步驟902包括接收生物學樣品。生物學樣品可為自患者所獲得的樣品。
步驟904包括使用MRM-MS系統確定在預定列表中所識別之各肽結構的量。預定列表可為例如表1中所識別之列表或表2中所識別之列表。
步驟906包括使用機器學習模式分析各肽結構的量以得出疾病指標。
步驟908包括基於疾病指標得出診斷輸出,該疾病指標分類作為驗證患者具有NASH(或NASH疾患)的生物學樣品。
步驟910包括對患者經由靜脈內或口服投予治療中至少一者投予治療劑量之NASH治療。治療可包含一或多種治療劑或其衍生物。
治療可包括例如(非限制)至少一種選自由下列所組成之群組的化合物或其衍生物:奧貝膽酸(OCA)、曲匹氟索、艾拉非諾、賽格列扎、阿雷美秋、希馬魯肽、替西帕肽、考他杜肽、NGM282、MSDC-0602K、瑞美替倫、仙尼維洛、瑟隆色替、艾瑞卡桑、西姆珠單抗和GR-MD-02。在一或多個實施態樣中,奧貝膽酸(OCA)之治療劑量可包括每天10至25 mg之範圍內的劑量。
過程900可包括一或多個附加步驟。例如,過程900可進一步包括回應於確定自受試者所獲得的生物學樣品驗證NASH而設計用於治療受試者之治療劑。過程900可包括回應於確定自受試者所獲得的生物學樣品驗證NASH而得出用於治療受試者之治療計劃。
VII.B. 治療HCC
圖10為依照一或多個實施態樣用於治療受試者的HCC之過程的流程圖。過程1000可使用如圖1、2A及/或2B所述之至少一部分的工作流程100及/或如圖3中所述之分析系統300至少部分實施。
步驟1002包括接收生物學樣品。生物學樣品可為自患者所獲得的樣品。
步驟1004包括使用MRM-MS系統確定在預定列表中所識別之各肽結構的量。預定列表可為例如表1中所識別之列表或表2中所識別之列表。
步驟1006包括使用機器學習模式分析各肽結構的量以得出疾病指標。
步驟1008包括基於疾病指標得出診斷輸出,該疾病指標分類作為驗證患者具有HCC的生物學樣品。
步驟1010包括對患者經由靜脈內或口服投予治療中至少一者投予治療劑量之HCC治療。治療可包含一或多種治療劑或其衍生物。
治療可包括例如(非限制)至少一種選自由下列所組成之群組的化合物或其衍生物:阿特珠單抗、貝伐珠單抗、索拉非尼(例如索拉非尼甲苯磺酸鹽)、樂伐替尼(例如樂伐替尼甲磺酸鹽)、尼沃魯單抗、瑞戈非尼、卡博替尼(例如卡博替尼-S-蘋果酸鹽)、培美替尼、雷莫蘆單抗或帕博利珠單抗。在一或多個實施態樣中,步驟1010包括對患者經由靜脈內或口服投予中至少一者投予每天775至825 mg之範圍的索拉非尼或其衍生物。在一或多個實施態樣中,步驟1010包括對患者經由靜脈內或口服投予中至少一者投予樂伐替尼或其衍生物,當患者體重<60 kg時以7.5至8.5 mg/天之範圍投予及當患者體重>60 kg時以11.5至12.5 mg/天之範圍投予。在一或多個實施態樣中,步驟1010包括對患者經由靜脈內或口服投予中至少一者投予0.75至1.25 mg/kg之範圍的尼沃魯單抗或其衍生物。在一或多個實施態樣中,步驟1010包括對患者經由口服投予150至170 mg/天之範圍的瑞戈非尼或其衍生物。在一或多個實施態樣中,步驟1010包括對患者經由靜脈內或口服投予中至少一者投予50至70 mg/天之範圍的卡博替尼或其衍生物。在一或多個實施態樣中,步驟1010包括對患者經由靜脈內或口服投予中至少一者投予8至12 mg/kg之範圍的雷莫蘆單抗或其衍生物。
過程1000可包括一或多個附加步驟。例如,過程1000可進一步包括回應於確定自受試者所獲得的生物學樣品驗證HCC而設計用於治療受試者之治療劑。過程1000可包括回應於確定自受試者所獲得的生物學樣品驗證HCC而得出用於治療受試者之治療計劃。
VIII. 肽結構及產物離子組成物、套組及試劑
本揭示之態樣包括組成物,其包含表1中所列出之肽結構中之一或多者。在一些實施態樣中,組成物包含表1中所列出之多個肽結構。在一些實施態樣中,組成物包含表1中所列出之肽結構中之1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52或全部53個。在一些實施態樣中,組成物包含與表1中所列出之SEQ ID NOS:23-52中任一者具有至少80%之序列一致性的胺基酸序列之肽結構,諸如至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%之序列一致性。
本揭示之態樣包括組成物,其包含具有限定之電荷及/或限定之質量對電荷(m/z)比的一或多種前驅離子,如以下表4中所列出。本揭示之態樣包括組成物,其包含具有限定之質量對電荷(m/z)比的一或多個產物離子,該等產物離子係藉由將本文所述之肽結構(例如表1中列出之肽結構)在質譜系統中轉化成氣相離子而產生。肽結構轉化成氣相可使用多種技術中任一者發生,包括但不限於基質輔助雷射脫附游離(matrix assisted laser desorption ionization)(MALDI);電子游離(EI);電噴灑游離(ESI);大氣壓力化學游離(APCI);及/或大氣壓力光游離(APPI)。
本揭示之態樣包括組成物,其包含自本文所述之肽結構(例如表1中列出之肽結構)中之一或多者產生的一或多種產物離子。在一些實施態樣中,組成物包含表4中列出之一組產物離子,其具有選自對表4中之各肽結構所提供之列表的m/z比。
在一些實施態樣中,組成物包含表1中所識別之肽結構PS-1至PS-53中至少一者。
在一些實施態樣中,組成物包含肽結構或產物離子。肽結構或產物離子包含與如以下表5中所識別之SEQ ID NOS:23-52中任一者具有至少90%之序列一致性的胺基酸序列,其對應於表1中的肽結構PS-1至PS-53。
在一些實施態樣中,產物離子係選自由表4中所識別之產物離子所組成之群組的離子,包括落在表4中所識別之m/z比的經確認之m/z範圍內之產物離子,且以具有前驅離子具有在表4中所識別之m/z比的經確認之m/z範圍內的m/z比為特徵。產物離子m/z比的第一範圍可為±0.5。產物離子m/z比的第二範圍可為±0.8。產物離子m/z比的第三範圍可為±1.0。前驅離子m/z比的第一範圍可為±1.0;前驅離子m/z比的第二範圍可為(±1.5)。因此,組成物可包括具有落在表4中所識別之產物離子m/z比的第一範圍(±0.5)、第二範圍(±0.8)或第三範圍(±1.0)中至少一者內的m/z比之產物離子,且可以具有前驅離子具有落在表4中所識別之前驅離子m/z比的第一範圍(±0.5)、第二範圍(±1.0)或第三範圍(±1.0)中至少一者內的m/z比為特徵。
在表4中,「PS-ID No.」識別肽結構的標示或索引;「肽結構(PS)名稱」識別肽結構的名稱;「R;「RT(min)」識別最少滯留時間;「Coll. Energy」識別碰撞能量;「Precur. m/z」識別前驅離子m/z比;「Precur. Charge」識別前驅離子電荷;「1
stProd. m/z」識別第一產物離子m/z比;「1
stProd. Charge」識別第一產物離子電荷;「2
ndProd. m/z」識別第二產物離子m/z比;「2
ndProd. Charge」識別第二產物離子電荷。
表6識別來自表1的 SEQ ID NOS:1-22之蛋白質。表6識別蛋白質SEQ ID NOS:1-22之各者對應的蛋白質縮寫及蛋白質名稱。再者,表6識別蛋白質SEQ ID NOS:1-22之各者對應的Uniprot ID。
表7識別及定義表1中所包括的聚醣結構。表7識別與特定聚醣相關聯的一或多個聚醣結構的圖形表示及表1中所包括的各聚醣結構之組成物的編碼表示。如本文所使用之4位數GL NO.為表示己糖數量、HexNAc數量、海藻糖數量及神經胺糖酸數量的稱號。
本揭示之態樣包括套組及使用說明,該套組包含一或多種組成物,各組成物包含一或多個可用作為檢定標準的本揭示之肽結構。依照本文所述之一或多個實施態樣的套組可包括指示套組內容物之意欲用途的標示。如本文所使用有關套組之術語「標示」包括在套組上或與套組一起供應或以其他方式附隨套組的任何書寫或記錄之資料。
如本文所述之肽結構及由此產生之轉移可用於診斷及治療FLD內的各種疾病狀態,包括而不限於NASH和HCC。轉移包括前驅離子及至少一種產物離子群組。如本文所述,在表1中之肽結構以及彼等對應的前驅離子及產物離子群組(該等離子具有限定之m/z比或落在本文所識別之m/z範圍內的m/z比)可用於基於質譜法之分析以診斷及加速疾病治療,例如NASH和HCC。
本揭示之態樣包括用於分析如本文所述之一或多個肽結構之方法。在一些實施態樣中,該方法包含處理來自患者的樣品以產生備好的樣品,可將其輸入使用例如液相層析系統(例如高效能液相層析系統(HPLC))之質譜系統(例如反應監測質譜系統)中。在特定的實施態樣中,處理樣品可包含執行下列中之一或多者:變性程序、還原程序、烷基化程序及消化程序。變性和還原程序可與例如圖2中的變性和還原202類似的方式實施。烷基化程序可與例如圖2中的烷基化程序204類似的方式實施。消化程序可與例如圖2中的消化程序206類似的方式實施。
在一些實施態樣中,用於分析一或多個肽結構之方法包含檢測以質譜系統(例如反應監測質譜系統)得出的一組產物離子,其中一或多種產物離子可對應於已輸入質譜系統中的一或多個肽結構中各者。如本文所述,各肽結構可轉化成具有如表4中所提供的限定之m/z比或在表4中所提供的經識別之m/z比範圍內的m/z比之一組產物離子。在一些實施態樣中,該方法包含得出使用質譜系統所檢測的一或多種產物離子之量化(例如豐度)數據。
在一些實施態樣中,該方法進一步包含使用量化數據及已使用監督式及/或非監督式機器學習訓練之模式得出診斷輸出。在特定的實施態樣中,反應監測質譜系統可包括多/選定之反應監測質譜法(MRM/SRM-MS)以檢測一或多種產物離子及得出量化數據。
IX. 代表性實驗結果
IX.A. 樣品準備及質譜數據生成
圖11為依照一或多個實施態樣用於實驗之樣品群體的表格。用於得出實驗結果的樣品包括血清樣品,其來自23位具有經生檢證實之NASH診斷的患者(10位男性,13位女性;Indivumed AG, Hamburg, Germany)、20位具有HCC診斷的患者(16位男性,4位女性;6位I期,8位II期,6位III期,2位IV期;Indivumed AG)及自iSpecimen, Palleon Pharmaceuticals Inc.與史丹福人類免疫監測中心(Human Immune Monitoring Center)(HIMC)獲得的56位沒有肝病史的健康受試者(對照者,26位男性,30位女性)。具有NASH和HCC的患者之臨床診斷係以經由穿刺生檢或在手術時獲得的肝組織之組織病理學特徵為基礎。
圖12為依照一或多個實施態樣用於驗證之樣品群體的表格。驗證樣品群體係由來自28位被診斷具有良性肝腫塊狀態的對照受試者(16位男性,12位女性)及28位被診斷具有HCC的受試者(20位男性,8位女性)之血清樣品所組成,全部皆自Indivumed AG獲得。患者之臨床診斷係以經由穿刺生檢或在手術時獲得的肝組織之組織病理學特徵為基礎。
在分析前,將血清樣品以DTT還原且以IAA烷基化,隨後在37℃之水浴中以胰蛋白酶消化18小時。在培育後,將甲酸添加至各樣品中至1%之最終濃度以淬滅消化。
將消化之血清樣品注入使用液相層析系統(例如高效能液相層析(HPLC)系統)之三段四極桿質譜儀(MS)中。肽結構(醣基化及無醣基化)之分離係使用70-min二元梯度執行。三段四極桿MS係以動態多反應監測(dMRM)模式操作。樣品係以有關基本表型的隨機方式注入,且儲集之參考血清消化物在整個運行期間與每隔10個樣品位置之研究樣品穿插注入。
對代表總共73種高豐度血清醣蛋白之肽結構執行MRM 分析。轉移列表係由來自各醣蛋白之醣肽結構以及無醣基化肽結構所組成。使用python程式庫Scikit-learn(https://scikit-learn.org/stable/)統計分析且構建機器學習模式。
肽結構之標準化豐度數據係使用以下公式得出:
標準化豐度=
(在樣品中之肽結構的原始豐度/來自相同醣蛋白之對應無醣基化肽的原始豐度)/在側翼儲集之參考血清樣品中之相同醣肽或肽的平均相對豐度
相對豐度經計算為任何給出之醣肽的原始豐度對所有醣肽的原始豐度總和之比。
IX.B. 分析肽結構數據(例如豐度數據)及確認其診斷能力
圖13為依照一或多個實施態樣描述之經由質譜法所識別及量化之選定的肽結構之平均標準化豐度的圖之圖解。如描述,肽結構之平均標準化豐度的變化在自對照狀態進展至NASH狀態至HCC狀態之單一方向上增加或減少。此豐度數據顯示此等肽結構可用於區分對照狀態、NASH狀態及HCC狀態。
圖14為依照一或多個實施態樣之選定的A2MG肽結構之標準化豐度的圖之圖解。
圖15為依照一或多個實施態樣之選定的AGP1肽結構之標準化豐度的圖之圖解。
圖16為依照一或多個實施態樣之選定的HPT肽結構之標準化豐度的圖之圖解。
圖17為依照一或多個實施態樣之選定的CFAH肽結構之標準化豐度的圖之圖解。
圖18為依照一或多個實施態樣之選定的A1AT肽結構之標準化豐度的圖之圖解。
圖14至18圖解單一醣蛋白(例如A2MG、AGP1、HPT、CFAH、A1AT)之肽結構以及此等醣蛋白組合之肽結構可用於診斷受試者何時自非NASH/HCC(例如健康狀態)進展至NASH或自NASH進展至HCC。
使用各種肽結構(例如那些在表2中所識別之肽結構)之標準化豐度訓練第一迴歸模式(例如模式1)以得出受試者的疾病指標。疾病指標係以評分(例如機率評分)得出,其中能夠以評分落入的範圍診斷或分類成非NASH/HCC狀態(例如對照狀態)、NASH狀態或HCC狀態。
IX.C. 驗證
圖19為圖解依照一或多個實施態樣區分對照狀態、NASH狀態與HCC狀態的疾病指標能力之驗證的標繪圖。如描述,約0.0至約0.05之疾病指標通常準確分類成對照狀態;約0.05至約0.4之疾病指標通常準確分類成NASH狀態;及約0.5至約1.00之疾病指標通常準確分類成HCC狀態。
圖20為依照一或多個實施態樣區分訓練組及測試組兩者的NASH狀態與HCC狀態之接收者操作特徵(ROC)曲線的標繪圖。對來自NASH和HCC患者兩者的樣品之標準化豐度執行留一交叉驗證(Leave one out cross validation)(LOOCV)。對所有的樣品反覆地訓練具有(LASSO)正則化之邏輯迴歸模式,除了在反覆中留下一個樣品。接著使用經訓練之模式預測留下的樣品。如圖20中所示,發現訓練組之ROC曲線下面積(AUROC)為0.99,而發現測試組之AUROC為0.89。
IX.C.1. 使用第二樣品群體驗證
為了驗證肽結構區分HCC與其他狀態的能力,使用第二迴歸模式(模式2)分析第二樣品群體(參見圖12)。使用一組較小的肽結構訓練模式2以區分HCC與良性肝腫塊狀態。例如,用作為對照的受試者為具有良性肝腫塊狀態診斷的個體。這能夠直接評定不同的肽結構豐度對HCC之判別能力。
以10個肽結構(8個醣肽結構及2個肽結構)進行分析。10個肽結構全部與A2MG相關聯。模式2係使用最小絕對緊縮與選擇算子(LASSO)正則化及LOOCV建構。
圖21為依照一或多個實施態樣有關對照(例如健康)狀態相對於HCC及良性肝腫塊狀態相對於HCC之該10個肽結構的標準化豐度的標繪圖。
圖22為依照一或多個實施態樣區分訓練組及測試組兩者的HCC與良性肝腫塊狀態之接收者操作特徵(ROC)曲線的標繪圖。發現訓練組之ROC曲線下面積(AUROC)為0.85,而發現測試組之AUROC為0.77。發現發現組(例如與用於模式1相同的組)之AUROC為0.85。
使用經訓練以區分HCC與一或多種其他狀態的經訓練之迴歸模式測試三位代表性患者。表9提供對各患者確定之各種肽結構的標準化豐度。基於標準化豐度計算之該等患者的疾病指標提供在表 9 的底部。疾病指標為指示受試者具有HCC的概度之機率評分。使用疾病指標分類出僅患者3具有HCC,其為正確的診斷。
X. 實施態樣之詳述
實施態樣1. 一種分類有關與脂肪肝疾病(FLD)進展相關聯的多種狀態的生物學樣品之方法,該方法包含:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據;將自一組肽結構之肽結構數據所識別之量化數據輸入機器學習模式中,其中該組肽結構包括自表1中的多個肽結構所識別之至少一個肽結構;使用機器學習模式分析量化數據以得出疾病指標;且基於疾病指標得出診斷輸出,該疾病指標分類作為驗證與FLD進展相關聯的多種狀態之對應狀態的生物學樣品。
實施態樣2. 實施態樣1之方法,其中疾病指標包含評分且其中得出診斷輸出包含:確定評分落在與多種狀態之對應狀態相關聯的選定範圍內;且確定生物學樣品係回應於確定評分落在與對應狀態相關聯的選定範圍內而驗證對應狀態。
實施態樣3. 實施態樣1或實施態樣2之方法,其中多種狀態包括非酒精性脂肪肝炎(NASH)狀態和肝細胞癌(HCC)狀態。
實施態樣4. 實施態樣1至3中任一者之方法,其中多種狀態包括非NASH/HCC狀態,該非NASH/HCC狀態包含健康狀態、無肝疾病狀態或良性肝腫塊狀態中至少一者。
實施態樣5. 實施態樣1至4中任一者之方法,其中至少一個肽結構包含以肽序列定義之醣肽結構及在肽序列之連結位點上連結至肽序列之聚醣結構,如表1中所識別,以肽序列為如表1中所定義之SEQ ID NOS:23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52中之一者。
實施態樣6. 實施態樣1至5中任一者之方法,其進一步包含:使用訓練數據訓練機器學習模式,其中訓練數據包含 多位受試者之多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之診斷狀態。
實施態樣7. 實施態樣6之方法,其進一步包含:(1) 使用初始訓練數據與下列中至少一者比較來執行差異性表現分析:第一部分被診斷具有NASH的多位受試者相對於第二部分被診斷具有HCC的多位受試者;第一部分被診斷具有NASH的多位受試者相對於第三部分被分配為對照狀態的多位受試者;或第二部分被診斷具有HCC的多位受試者相對於第三部分被分配為對照狀態的多位受試者;且(2)基於差異性表現分析識別肽結構群組,用作為FLD進展之預後標記,其中肽結構群組於表1中識別;且(3)基於所識別之肽結構群組形成訓練數據。
實施態樣8. 實施態樣7之方法,其中對照狀態包含健康狀態、無肝疾病狀態或良性肝腫塊狀態中至少一者。
實施態樣9. 實施態樣1至8中任一者之方法,其中機器學習模式包含邏輯迴歸模式。
實施態樣10. 實施態樣1至9中任一者之方法,其中該組肽結構之肽結構的量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
實施態樣11. 實施態樣1至9中任一者之方法,其中該組肽結構的量化數據包含該組肽結構之各肽結構的標準化豐度。
實施態樣12. 實施態樣1至11中任一者之方法,其中肽結構數據係使用多反應監測質譜法(MRM-MS)得出。
實施態樣13. 實施態樣1至11中任一者之方法,其中肽結構數據係使用液相層析/質譜(LC/MS)系統得出。
實施態樣14. 實施態樣1至13中任一者之方法,其進一步包含:建立來自生物學樣品的樣品;且使用還原、烷基化及酶消化來準備樣品以形成備好的樣品,其包括該組肽結構。
實施態樣15. 實施態樣14之方法,其進一步包含:使用多反應監測質譜法(MRM-MS)自備好的樣品得出肽結構數據。
實施態樣16. 實施態樣1至15中任一者之方法,其中生物學樣品包含血液、血清或血漿中至少一者。
實施態樣17. 實施態樣1至16中任一者之方法,其中得出診斷輸出包含:得出識別對應狀態的報告。
實施態樣18. 實施態樣1至17中任一者之方法,其進一步包含:基於診斷輸出或疾病指標中至少一者得出治療輸出。
實施態樣19. 實施態樣18之方法,其中治療輸出包含確認治療受試者之治療、用於治療之設計、用於治療之製造計劃或用於投予治療之治療計劃中至少一者。
實施態樣20. 實施態樣19之方法,其中對應狀態為NASH狀態且其中治療包含奧貝膽酸(OCA)、曲匹氟索、艾拉非諾、賽格列扎、阿雷美秋、希馬魯肽、替西帕肽、考他杜肽、NGM282、MSDC-0602K、瑞美替倫、仙尼維洛、瑟隆色替、艾瑞卡桑、西姆珠單抗或GR-MD-02中至少一者。
實施態樣21. 實施態樣19之方法,其中對應狀態為HCC狀態且其中治療包含阿特珠單抗、貝伐珠單抗、索拉非尼、樂伐替尼、尼沃魯單抗、瑞戈非尼、卡博替尼、培美替尼、雷莫蘆單抗或帕博利珠單抗中至少一者。
實施態樣22. 實施態樣1至18中任一者之方法,其中對應狀態為非酒精性脂肪肝炎(NASH)且進一步包含:得出用於受試者之治療計劃,其中治療計劃確認一組生活型態修正、一組飲食修正、咖啡、維生素E、減少卡路里、減少鹽攝入量、減少糖攝入量或一組降低膽固醇的藥物中至少一者。
實施態樣23. 實施態樣1至18中任一者之方法,其中對應狀態為NASH狀態,且其中診斷輸出識別生物學樣品對對應狀態為陽性且進一步包含:對受試者投予治療劑量的治療劑,治療劑係選自由下列所組成之群組:奧貝膽酸(OCA)、曲匹氟索、艾拉非諾、賽格列扎、阿雷美秋、希馬魯肽、替西帕肽、考他杜肽、NGM282、MSDC-0602K、瑞美替倫、仙尼維洛、瑟隆色替、艾瑞卡桑、西姆珠單抗和GR-MD-02。
實施態樣24. 實施態樣1至18中任一者之方法,其中對應狀態為HCC狀態,且其中診斷輸出識別生物學樣品對對應狀態為陽性且進一步包含:對受試者投予治療劑量的治療劑,治療劑係選自由下列所組成之群組:阿特珠單抗、貝伐珠單抗、索拉非尼、樂伐替尼、尼沃魯單抗、瑞戈非尼、卡博替尼、培美替尼、雷莫蘆單抗或帕博利珠單抗。
實施態樣25. 一種訓練模式以診斷具有與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者的受試者之方法,該方法包含:接收被診斷具有與FLD進展相關的多種狀態的多位受試者之肽結構組的量化數據,其中量化數據包含多位受試者之多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之對應狀態;且使用量化數據訓練機器學習模式以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態。
實施態樣26. 實施態樣25之方法,其中機器學習模式包含邏輯迴歸模式。
實施態樣27. 實施態樣26之方法,其中邏輯迴歸模式包含LASSO迴歸模式。
實施態樣28. 實施態樣25至27中任一者之方法,其中訓練機器學習模式包含:使用對應於該肽結構組之子集的一組肽結構之量化數據的一部分訓練機器學習模式,以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態。
實施態樣29. 實施態樣28之方法,其進一步包含:使用多位受試者的量化數據執行差異性表現分析。
實施態樣30. 實施態樣29之方法,進一步包含:基於經計算作為差異性表現分析的一部分之倍數變化、偽發現率或p值中至少一者識別作為相關的多個肽結構之子集的該組肽結構,以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態。
實施態樣31. 實施態樣25至30中任一者之方法,其中多種狀態進一步包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態或健康狀態中至少一者。
實施態樣32. 實施態樣25至31中任一者之方法,其中被診斷具有多種狀態的多位受試者之該肽結構組的量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
實施態樣33. 實施態樣25至31中任一者之方法,其中被診斷具有多種狀態的多位受試者之該肽結構組的量化數據包含標準化豐度。
實施態樣34. 實施態樣25至33中任一者之方法,其中生物學樣品包含血液、血清或血漿中至少一者。
實施態樣35. 實施態樣25至34中任一者之方法,其中量化數據係使用液相層析/質譜(LC/MS)系統得出。
實施態樣36. 實施態樣25至35中任一者之方法,其中量化數據係使用多反應監測質譜法(MRM-MS)得出。
實施態樣37. 一種檢測存在於生物學樣品中與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者之方法,該方法包含:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據;使用監督式機器學習模式分析肽結構數據,基於選自表1中所識別之肽結構群組的至少3個肽結構得出疾病指標;且以回應於確定疾病指標落在與對應狀態相關聯的選定範圍內來檢測與FLD進展相關聯的多種狀態之對應狀態的存在。
實施態樣38. 實施態樣37之方法,其中至少3個肽結構之肽結構包含以肽序列定義之醣肽結構及在肽序列之連結位點上連結至肽序列之聚醣結構,如表1中所識別,以肽序列為如表1中所定義之SEQ ID NOS:23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52或52中之一者。
實施態樣39. 實施態樣37或實施態樣38之方法,其中監督式機器學習模式包含邏輯迴歸模式。
實施態樣40. 實施態樣37至39中任一者之方法,其中監督式機器學習模式包含懲罰式多變量邏輯迴歸模式。
實施態樣41. 實施態樣37至40中任一者之方法,其中肽結構數據包含量化數據。
實施態樣42. 實施態樣41之方法,其中肽結構群組之肽結構的量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
實施態樣43. 實施態樣41之方法,其中量化數據包含標準化豐度。
實施態樣44. 實施態樣37至43中任一者之方法,其中疾病指標為機率評分。
實施態樣45. 實施態樣37至44中任一者之方法,其進一步包含:得出包括基於對受試者所檢測的對應狀態之診斷的報告。
實施態樣46. 實施態樣37至45中任一者之方法,其中多種狀態包括至少兩種選自由非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC狀態所組成之群組的狀態。
實施態樣47. 實施態樣37至46中任一者之方法,其中分析肽結構數據包含:使用與至少3個肽結構之各肽結構相關聯的加權係數計算疾病指標,至少3個肽結構之對應肽結構的加權係數指示對應肽結構對疾病指標的相對重要性。
實施態樣48. 實施態樣37至46中任一者之方法,其中分析肽結構數據包含:計算生物學樣品之肽結構輪廓,其識別至少3個肽結構之各肽結構的加權值,其中至少3個肽結構之肽結構的加權值為自肽結構數據所識別之肽結構的量化度量與肽結構的加權係數之乘積,且使用肽結構輪廓計算疾病指標。
實施態樣49. 實施態樣37至48中任一者之方法,其中對應狀態為非NASH/HCC狀態且其中與非NASH/HCC狀態相關聯的選定範圍係介於0.00與0.05之間。
實施態樣50. 實施態樣37至48中任一者之方法,其中對應狀態為非酒精性脂肪肝炎(NASH)狀態且與NASH狀態相關聯的選定範圍係介於0.05與0.4之間。
實施態樣51. 實施態樣37至48中任一者之方法,其中對應狀態為肝細胞癌(HCC)狀態且與HCC狀態相關聯的選定範圍係介於0.4與1.0之間。
實施態樣52. 實施態樣37至51中任一者之方法,其進一步包含:建立來自生物學樣品的樣品;且使用還原、烷基化及酶消化來準備樣品以形成備好的樣品,其包括一組肽結構。
實施態樣53. 實施態樣52之方法,其進一步包含:使用多反應監測質譜法(MRM-MS)自備好的樣品得出肽結構數據。
實施態樣54. 實施態樣37至52中任一者之方法,其中肽結構數據係使用液相層析術/質譜(LC/MS)系統得出。
實施態樣55. 實施態樣37至52中任一者之方法,其中肽結構數據係使用多反應監測質譜法(MRM-MS)得出。
實施態樣56. 實施態樣37至55中任一者之方法,其中生物學樣品包含血液、血清或血漿中至少一者。
實施態樣57. 實施態樣37至56中任一者之方法,其進一步包含:基於疾病指標得出治療輸出。
實施態樣58. 實施態樣57之方法,其中治療輸出包含確認治療受試者之治療、用於治療之設計、用於治療之製造計劃或用於投予治療之治療計劃中至少一者。
實施態樣59. 實施態樣58之方法,其中對應狀態為NASH狀態且其中治療包含奧貝膽酸(OCA)、曲匹氟索、艾拉非諾、賽格列扎、阿雷美秋、希馬魯肽、替西帕肽、考他杜肽、NGM282、MSDC-0602K、瑞美替倫、仙尼維洛、瑟隆色替、艾瑞卡桑、西姆珠單抗和GR-MD-02中至少一者。
實施態樣60. 實施態樣58之方法,其中對應狀態為HCC狀態且其中治療包含阿特珠單抗、貝伐珠單抗、索拉非尼、樂伐替尼、尼沃魯單抗、瑞戈非尼、卡博替尼、培美替尼、雷莫蘆單抗或帕博利珠單抗中至少一者。
實施態樣61. 實施態樣37至57中任一者之方法,其中對應狀態為NASH狀態且進一步包含:對受試者投予治療劑量的治療劑,治療劑係選自由下列所組成之群組:奧貝膽酸(OCA)、曲匹氟索、艾拉非諾、賽格列扎、阿雷美秋、希馬魯肽、替西帕肽、考他杜肽、NGM282、MSDC-0602K、瑞美替倫、仙尼維洛、瑟隆色替、艾瑞卡桑、西姆珠單抗和GR-MD-02。
實施態樣62. 實施態樣37至57中任一者之方法,其中對應狀態為HCC狀態且進一步包含:對受試者投予治療劑量的治療劑,治療劑係選自由下列所組成之群組:阿特珠單抗、貝伐珠單抗、索拉非尼、樂伐替尼、尼沃魯單抗、瑞戈非尼、卡博替尼、培美替尼、雷莫蘆單抗或帕博利珠單抗。
實施態樣63. 一種分類生物學樣品成為對應於與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者,該方法包含:使用訓練數據訓練監督式機器學習模式,其中訓練數據包含多位訓練受試者的多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之狀態;接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據;將自一組肽結構之肽結構數據所識別之量化數據輸入已經訓練之監督式機器學習模式中,其中該組肽結構包括至少一個在表1中所識別之肽結構;使用監督式機器學習模式分析量化數據以得出評分;確定評分落在與FLD進展相關聯的多種狀態之對應狀態相關聯的選定範圍內;且得出診斷輸出,其指示生物學樣品驗證對應狀態,其中多種狀態包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC狀態。
實施態樣64. 一種治療患者的非酒精性脂肪肝炎(NASH)疾患以降低、停止或逆轉NASH疾患進展成肝細胞癌中至少一者之方法,該方法包含:接收來自患者的生物學樣品;使用多反應監測質譜(MRM-MS)系統確定在表1中所識別之生物學樣品中之各肽結構的量;使用機器學習模式分析各肽結構的量以得出疾病指標;基於疾病指標而得出診斷輸出,其分類作為驗證患者具有NASH疾患的生物學樣品;且對患者投予奧貝膽酸(OCA)或其衍生物,投予包含每天以10至25 mg之範圍經靜脈內或口服投予中至少一者。
實施態樣65. 實施態樣64之方法,其進一步包含:準備生物學樣品以形成包含一組肽結構之備好的樣品;且將備好的樣品輸入使用液相層析系統之MRM-MS系統中。
實施態樣66. 一種治療患者的肝細胞癌(HCC)疾患之方法,該方法包含:接收來自患者的生物學樣品;使用多反應監測質譜(MRM-MS)系統確定在表1中所識別之生物學樣品中之各肽結構的量;使用機器學習模式分析各肽結構的量以得出疾病指標;基於疾病指標而得出診斷輸出,其分類作為驗證患者具有HCC疾患的生物學樣品;且投予下列中至少一者:
對患者投予索拉非尼或其衍生物,該投予包含每天以775至825 mg之範圍經靜脈內或口服投予中至少一者;
對患者投予樂伐替尼或其衍生物,該投予包含當患者體重<60 kg時以7.5至8.5 mg/天之範圍及當患者體重>60 kg時以11.5至12.5 mg/天之範圍經靜脈內或口服投予中至少一者;
對患者投予尼沃魯單抗或其衍生物,該投予包含以0.75至1.25 mg/kg之範圍經靜脈內或口服投予中至少一者;
對患者投予瑞戈非尼或其衍生物,該投予包含以150至170 mg/天之範圍經口投予;
對患者投予卡博替尼或其衍生物,該投予包含以50至70 mg/天之範圍經靜脈內或口服投予中至少一者;或
對患者投予雷莫蘆單抗或其衍生物,該投予包含以8至12 mg/kg之範圍經靜脈內或口服投予中至少一者。
實施態樣67. 實施態樣66之方法,其進一步包含:準備生物學樣品以形成包含一組肽結構之備好的樣品;且將備好的樣品輸入使用液相層析系統之MRM-MS系統中用於分析。
實施態樣68. 一種設計治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含:以回應於確定自受試者所獲得的生物學樣品使用實施態樣1至63中任一者之方法的一部分或全部驗證出疾病狀態而設計用於治療受試者之治療劑。
實施態樣69. 一種規劃治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含:以回應於確定自受試者所獲得的生物學樣品使用實施態樣1至63中任一者之方法的一部分或全部驗證出疾病狀態而得出用於治療受試者之治療計劃。
實施態樣70. 一種治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含:基於確定自受試者所獲得的生物學樣品使用實施態樣1至63中任一者之方法的一部分或全部驗證出疾病狀態而對受試者投予治療劑以治療受試者。
實施態樣71. 一種治療被診斷具有與脂肪肝疾病(FLD)進展相關聯的疾病狀態的受試者之方法,該方法包含:基於確定受試者回應於使用實施態樣1至63中任一者之方法之治療而選擇治療受試者之治療劑。
實施態樣72. 一種分析來自患者的樣品中之一組肽結構之方法,該方法包含
(a)自患者獲得樣品;
(b)準備樣品以形成包含該組肽結構之備好的樣品;
(c)將備好的樣品輸入使用液相層析系統之質譜系統中;
(d)使用質譜系統檢測與該組肽結構之各肽結構締合的一組產物離子,
其中該組肽結構包括至少一個選自表4中所識別之肽結構 PS-1至PS-53之肽結構;
其中該組肽結構包括具有下列為特徵之肽結構:
(i)具有質量-電荷(m/z)比在表4中作為對應於肽結構的前驅離子所列出之m/z比的±1.5內之前驅離子;及
(ii)具有m/z比在表4中作為對應於肽結構的第一產物離子所列出之m/z比的±1.0內之產物離子;且
(e)使用質譜系統得出該組產物離子的量化數據。
實施態樣73. 實施態樣72之方法,其中前驅離子之質量-電荷(m/z)比係在表4中作為對應於肽結構的前驅離子所列出之m/z比的±1.0內。
實施態樣74. 實施態樣72之方法,其中前驅離子之質量-電荷(m/z)比係在表4中作為對應於肽結構的前驅離子所列出之m/z比的±0.5內。
實施態樣75. 實施態樣72之方法,其中產物離子之質量-電荷(m/z)比係在表4中作為對應於肽結構的前驅離子所列出之m/z比的±0.8內。
實施態樣76. 實施態樣72之方法,其中產物離子之質量-電荷(m/z)比係在表4中作為對應於肽結構的前驅離子所列出之m/z比的±0.5內。
實施態樣77. 實施態樣72至76中任一者之方法,其進一步包含:使用量化數據及已訓練以檢測與脂肪肝疾病(FLD)進展相關聯的疾病狀態存在之機器學習模式得出診斷輸出。
實施態樣78. 實施態樣72至77中任一者之方法,其中質譜系統包含使用多反應監測質譜法(MRM-MS)或選定之反應監測質譜法(SRM-MS)中至少一者之反應監測質譜系統以檢測該組產物離子及得出量化數據。
實施態樣79. 實施態樣72至78中任一者之方法,其中液相層析系統為高效能液相層析系統。
實施態樣80. 實施態樣72至79中任一者之方法,其中樣品包含血漿樣品。
實施態樣81. 實施態樣72至80中任一者之方法,其中樣品包含血清樣品。
實施態樣82. 實施態樣72至81中任一者之方法,其中樣品包含血液樣品。
實施態樣83. 實施態樣72至82中任一者之方法,其中準備樣品包含下列中至少一者:使樣品中的一或多種蛋白質變性以形成一或多種變性蛋白質;使樣品中的一或多種變性蛋白質還原以形成一或多種還原蛋白質;使樣品中的一或多種蛋白質使用烷基化劑烷基化以防止在一或多種還原蛋白質中重新形成二硫鍵,以形成一或多種烷基化蛋白質;或使樣品中的一或多種烷基化蛋白質使用蛋白分解觸媒消化以形成包含該組肽結構之備好的樣品。
實施態樣84. 一種組成物包含表1中所識別之肽結構PS-1至PS-53中至少一者。
實施態樣85. 一種組成物包含肽結構或產物離子,其中:肽結構或產物離子包含與SEQ ID NOS:23-52中任一者具有至少90%之序列一致性的胺基酸序列,其對應於表1中的肽結構PS-1至PS-53;且產物離子係選自由表4中所識別之產物離子所組成之群組的離子,包括落在經確認之m/z範圍內的產物離子。
實施態樣86. 一種組成物包含選自表4中所識別之肽結構PS-1至PS-53所組成之群組的醣肽結構,其中醣肽結構包含:在表5中所識別作為對應於醣肽結構之胺基酸肽序列;及表1中所識別作為對應於醣肽結構之聚醣結構,其中聚醣結構係在表1中所識別之對應位置上連結至胺基酸肽序列之殘基,其中聚醣結構具有聚醣組成物。
實施態樣87. 實施態樣86之組成物,其中聚醣組成物於表7中識別。
實施態樣88. 實施態樣86或實施態樣87之組成物,其中醣肽結構具有表4中所識別作為對應於醣肽結構之具有電荷的前驅離子。
實施態樣89. 實施態樣86至88中任一者之組成物,其中醣肽結構具有前驅離子,其具有的m/z比在表4中作為對應於醣肽結構的前驅離子所列出之m/z比的±1.5內。
實施態樣90. 實施態樣86至88中任一者之組成物,其中醣肽結構具有前驅離子,其具有的m/z比在表4中作為對應於醣肽結構的前驅離子所列出之m/z比的±1.0內。
實施態樣91. 實施態樣86至88中任一者之組成物,其中醣肽結構具有前驅離子,其具有的m/z比在表4中作為對應於醣肽結構的前驅離子所列出之m/z比的±0.5內。
實施態樣92. 實施態樣86至91中任一者之組成物,其中醣肽結構具有產物離子,其具有的m/z比在表4中作為對應於醣肽結構的第一產物離子所列出之m/z比的±1.0內。
實施態樣93. 實施態樣86至91中任一者之組成物,其中醣肽結構具有產物離子,其具有的m/z比在表4中作為對應於醣肽結構的第一產物離子所列出之m/z比的±0.8內。
實施態樣94. 實施態樣86至91中任一者之組成物,其中醣肽結構具有產物離子,其具有的m/z比在表4中作為對應於醣肽結構的第一產物離子所列出之m/z比的±0.5內。
實施態樣95. 實施態樣86至94中任一者之組成物,其中醣肽結構具有表1中所識別作為對應於醣肽結構之單一同位素質量。
實施態樣96. 一種組成物包含選自表1中所識別之多個肽結構之肽結構,其中:肽結構具有表1中所識別作為對應於肽結構之單一同位素質量;且肽結構包含表1中所識別作為對應於肽結構的SEQ ID NOS:23-52之肽結構。
實施態樣97. 實施態樣96之組成物,其中肽結構具有表4中所識別作為對應於肽結構之具有電荷的前驅離子。
實施態樣98. 實施態樣96或實施態樣97之組成物,其中肽結構具有前驅離子,其具有的m/z比在表4中作為對應於肽結構的前驅離子所列出之m/z比的±1.5內。
實施態樣99. 實施態樣96或實施態樣97之組成物,其中肽結構具有前驅離子,其具有的m/z比在表4中作為對應於肽結構的前驅離子所列出之m/z比的±1.0內。
實施態樣100. 實施態樣96或實施態樣97中任一者之組成物,其中肽結構具有前驅離子,其具有的m/z比在表4中作為對應於肽結構的前驅離子所列出之m/z比的±0.5內。
實施態樣101. 實施態樣96至100中任一者之組成物,其中肽結構具有產物離子,其具有的m/z比在表4中作為對應於肽結構的第一產物離子所列出之m/z比的±1.0內。
實施態樣102. 實施態樣96至100中任一者之組成物,其中肽結構具有產物離子,其具有的m/z比在表4中作為對應於肽結構的第一產物離子所列出之m/z比的±0.8內。
實施態樣103. 實施態樣96至100中任一者之組成物,其中肽結構具有產物離子,其具有的m/z比在表4中作為對應於肽結構的第一產物離子所列出之m/z比的±0.5內。
實施態樣104. 一種套組包含至少一種用於量化表1中所識別之至少一個肽結構之劑以進行實施態樣1至83中任一者之方法的一部分或全部。
實施態樣105. 一種套組包含醣肽標準物、緩衝劑或一組肽序列中至少一者,以進行實施態樣1至83中任一者之方法的一部分或全部,該組肽序列之肽序列係由對應於表1中所定義的SEQ ID NOS:23-52中之一者識別。
實施態樣106. 一種系統包含:一或多個數據處理器;及含有指令之非暫時性電腦可讀儲存媒體,當在一或多個數據處理器上執行時,該媒體使一或多個數據處理器執行實施態樣1至83中任一者之方法的一部分或全部。
實施態樣107. 一種可明確地體現於非暫時性機器可讀儲存媒體中的電腦程式產品,其包括配置之指令而使一或多個數據處理器執行實施態樣1至83中任一者之方法的一部分或全部。
再者,實施態樣可包括上述實施態樣1至107中任一或多者的一部分或全部。例如,實施態樣可包括來自以任何組合使用之實施態樣1至107中任何一或多者的一或多個特性。
XI. 額外的考量
在本文件中的章節與小節之間的任何標題及/或子標題僅以改進可讀性為目的而納入且不意味著特性不能跨章節及小節組合。因此,章節及小節不說明單獨的實施態樣。
儘管本發明之教導係結合各種實施態樣說明,但不意欲使本發明之教導受限於該等實施態樣。相反地,本發明之教導包含由那些熟習本技術領域者認知的各種替代物、修改物及等效物。本發明之說明提供較佳的示例性實施態樣且不意欲限制本揭示之範圍、應用性或配置。再者,本發明較佳的示例性實施態樣之說明提供那些熟習本技術領域者能實施各種實施態樣之說明。
應理解可對元素的功能及安排進行各種變化而不脫離所附申請專利範圍提出之精神及範圍。因此,此等修改及變化被認為是在所附申請專利範圍提出之範圍內。再者,已使用之術語及語意被用作為說明而非限制之術語,且在使用此等術語及語意時無意排除所顯示及說明之特性或其部分的任何等效物,但應認定各種修改有可能在所請求之本發明範圍內。
在說明各種實施態樣時,說明書可能已呈示方法及/或過程作為特定的步驟順序。然而,在方法或過程不依賴於本文所提出之特定的步驟順序的程度上,不應使方法或過程受限於所述之特定的步驟順序,且熟習本技術領域者可輕易地認知順序可改變且仍歸屬於各種實施態樣之精神及範圍內。
本揭示之一些實施態樣包括一系統,其包括一或多個數據處理器。在一些實施態樣中,系統包括含有指令之非暫時性電腦可讀儲存媒體,當在一或多個數據處理器上執行時,該媒體使一或多個數據處理器執行本文所揭示之一或多個方法的一部分或全部及/或一或多個過程的一部分或全部。本揭示之一些實施態樣包括明確地體現於非暫時性機器可讀儲存媒體中的電腦程式產品,其包括配置之指令而使一或多個數據處理器執行本文所揭示之一或多個方法的一部分或全部及/或一或多個過程的一部分或全部。
本發明之說明給出具體的細節以提供對實施態樣的理解。然而,應理解實施態樣可無需該等具體的細節來實行。例如,為了不使實施態樣受到非必要的細節混淆,可將電路、系統、網路、過程及其他組件以方塊圖形式中的組件顯示。在其他的情況下,為了避免實施態樣受到非必要的細節混淆,可顯示熟知的電路、過程、演算法、結構及技術。
100:工作流程
102:樣品收集
104:樣品攝入
106:樣品準備和處理
108:數據分析
110:輸出生成
112:生物學樣品
114:受試者
116:全血樣品
118:一組等分樣品
120:一組樣品
122:一組肽結構
124:數據擷取
126:肽結構分析
128:最終輸出
130:遠端系統
200:準備工作流程
202:變性和還原
204:烷基化
205:胺基酸殘基之位點
206:消化
207:消化後程序
208:量化
210:質量控制
212:峰值積分和數據標準化
300:分析系統
302:計算平台
304:數據儲存
306:顯示系統
308:肽結構分析器
310:肽結構數據
312:一組肽結構
314:模式
316:機器學習模式
318:疾病指標
320:多種狀態
324:診斷輸出
326:治療輸出
328:圖形使用者介面
400:電腦系統
402:匯流排
404:處理器
406:隨機存取記憶體
408:唯讀記憶體
410:儲存設備
412:顯示器
414:輸入設備
416:游標控制器
500:過程
502:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據
504:將自一組肽結構之肽結構數據所識別之量化數據輸入機器學習模式中
506:使用機器學習模式分析量化數據以得出疾病指標
508:基於疾病指標得出診斷輸出,該疾病指標分類作為驗證與FLD進展相關聯的多種狀態之對應狀態的生物學樣品
600:過程
602:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據
604:使用監督式機器學習模式分析肽結構數據,基於選自自表1中所識別之肽結構群組的至少3個肽結構得出疾病指標
606:以回應於確定疾病指標落在與對應狀態相關聯的選定範圍內來檢測與FLD進展相關聯的多種狀態之對應狀態的存在
700:過程
702:接收被診斷具有與FLD進展相關的多種狀態的多位受試者之肽結構組的量化數據,其中量化數據包含多位受試者之多個肽結構輪廓且識別多個肽結構輪廓之各肽結構輪廓的多種狀態之對應狀態
704:使用量化數據訓練監督式機器學習模式以確定來自受試者的生物學樣品對應於多種狀態中的哪一狀態
800:過程
802:使用訓練數據訓練監督式機器學習模式
804:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據
806:將自一組肽結構之肽結構數據所識別之量化數據輸入已經訓練之監督式機器學習模式中
808:使用監督式機器學習模式分析量化數據以得出評分
810:確定評分落在與FLD進展相關聯的多種狀態之對應狀態相關聯的選定範圍內
812:得出診斷輸出,其指示生物學樣品驗證對應狀態,其中多種狀態包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC(例如對照物或健康)狀態
900:過程
902:接收生物學樣品
904:使用MRM-MS系統確定在預定列表中所識別之各肽結構的量
906:使用機器學習模式分析各肽結構的量以得出疾病指標
908:基於疾病指標得出診斷輸出,該疾病指標分類作為驗證患者具有NASH的生物學樣品
910:對患者經由靜脈內或口服投予治療中至少一者投予治療劑量之治療
1000:過程
1002:包括接收生物學樣品
1004:使用MRM-MS系統確定在預定列表中所識別之各肽結構的量
1006:使用機器學習模式分析各肽結構的量以得出疾病指標
1008:基於疾病指標得出診斷輸出,該疾病指標分類作為驗證患者具有HCC的生物學樣品
1010:對患者經由靜脈內或口服投予治療中至少一者投予治療劑量之治療
本揭示係結合附圖予以說明:
[圖1]為依照一或多個實施態樣用於檢測使用於診斷及/或治療與疾病狀態相關聯的肽結構之示例性工作流程的示意圖。
[圖2A]為依照一或多個實施態樣之準備工作流程的示意圖。圖係以出現順序分別揭示SEQ ID NOS 53和54。
[圖2B]為依照一或多個實施態樣之數據擷取的示意圖。
[圖3]為依照一或多個實施態樣之分析系統的方塊圖。
[圖4]為依照各種實施態樣之電腦系統的方塊圖。
[圖5]為依照一或多個實施態樣用於評估自受試者所獲得的生物學樣品有關FLD進展之過程的流程圖。
[圖6]為依照一或多個實施態樣用於檢測與FLD進展相關聯的疾病狀態存在之過程的流程圖。
[圖7]為依照各種實施態樣用於訓練監督式機器學習模式以確定生物學樣品對應於多種狀態中的哪一狀態之過程的流程圖。
[圖8]為依照一或多個實施態樣用於分類作為對應於與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者的生物學樣品之過程的流程圖。
[圖9]為依照一或多個實施態樣用於治療受試者的NASH之過程的流程圖。
[圖10]為依照一或多個實施態樣用於治療受試者的HCC之過程的流程圖。
[圖11]為依照一或多個實施態樣用於實驗之樣品群體的表格。
[圖12]為依照一或多個實施態樣用於驗證之樣品群體的表格。
[圖13]為依照一或多個實施態樣所描述之經由質譜法所識別及量化之選定的肽結構之平均標準化豐度的圖之圖解。
[圖14]為依照一或多個實施態樣之選定的A2MG肽結構之標準化豐度的圖之圖解。
[圖15]為依照一或多個實施態樣之選定的AGP1肽結構之標準化豐度的圖之圖解。
[圖16]為依照一或多個實施態樣之選定的HPT肽結構之標準化豐度的圖之圖解。
[圖17]為依照一或多個實施態樣之選定的CFAH肽結構之標準化豐度的圖之圖解。
[圖18]為依照一或多個實施態樣之選定的A1AT肽結構之標準化豐度的圖之圖解。
[圖19]為圖解依照一或多個實施態樣區分對照狀態、NASH狀態與HCC狀態的疾病指標能力之驗證的標繪圖。
[圖20]為依照一或多個實施態樣用於區分訓練組及測試組兩者的NASH狀態與HCC狀態之接收者操作特徵(ROC)曲線的標繪圖。
[圖21]為依照一或多個實施態樣有關對照(例如健康)狀態相對於HCC及良性肝腫塊狀態相對於HCC之該10個肽結構的標準化豐度的標繪圖。
[圖22]為依照一或多個實施態樣用於區分訓練組及測試組兩者的HCC與良性肝腫塊狀態之接收者操作特徵(ROC)曲線的標繪圖。
<![CDATA[<110> 美商芬恩生物科學公司 (VENN BIOSCIENCES CORPORATION)]]> <![CDATA[<120> 用於診斷非酒精性脂肪肝炎(NASH)]]> 或肝細胞癌(HCC)的生物標記 <![CDATA[<130> 61375.6TW01]]> <![CDATA[<140> TW 110143754]]> <![CDATA[<141> 2021-11-24]]> <![CDATA[<150> 63/251,021]]> <![CDATA[<151> 2021-09-30]]> <![CDATA[<150> 63/118,486]]> <![CDATA[<151> 2020-11-25]]> <![CDATA[<160> 54 ]]> <![CDATA[<170> PatentIn version 3.5]]> <![CDATA[<210> 1]]> <![CDATA[<211> 418]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 1]]> Met Pro Ser Ser Val Ser Trp Gly Ile Leu Leu Leu Ala Gly Leu Cys 1 5 10 15 Cys Leu Val Pro Val Ser Leu Ala Glu Asp Pro Gln Gly Asp Ala Ala 20 25 30 Gln Lys Thr Asp Thr Ser His His Asp Gln Asp His Pro Thr Phe Asn 35 40 45 Lys Ile Thr Pro Asn Leu Ala Glu Phe Ala Phe Ser Leu Tyr Arg Gln 50 55 60 Leu Ala His Gln Ser Asn Ser Thr Asn Ile Phe Phe Ser Pro Val Ser 65 70 75 80 Ile Ala Thr Ala Phe Ala Met Leu Ser Leu Gly Thr Lys Ala Asp Thr 85 90 95 His Asp Glu Ile Leu Glu Gly Leu Asn Phe Asn Leu Thr Glu Ile Pro 100 105 110 Glu Ala Gln Ile His Glu Gly Phe Gln Glu Leu Leu Arg Thr Leu Asn 115 120 125 Gln Pro Asp Ser Gln Leu Gln Leu Thr Thr Gly Asn Gly Leu Phe Leu 130 135 140 Ser Glu Gly Leu Lys Leu Val Asp Lys Phe Leu Glu Asp Val Lys Lys 145 150 155 160 Leu Tyr His Ser Glu Ala Phe Thr Val Asn Phe Gly Asp Thr Glu Glu 165 170 175 Ala Lys Lys Gln Ile Asn Asp Tyr Val Glu Lys Gly Thr Gln Gly Lys 180 185 190 Ile Val Asp Leu Val Lys Glu Leu Asp Arg Asp Thr Val Phe Ala Leu 195 200 205 Val Asn Tyr Ile Phe Phe Lys Gly Lys Trp Glu Arg Pro Phe Glu Val 210 215 220 Lys Asp Thr Glu Glu Glu Asp Phe His Val Asp Gln Val Thr Thr Val 225 230 235 240 Lys Val Pro Met Met Lys Arg Leu Gly Met Phe Asn Ile Gln His Cys 245 250 255 Lys Lys Leu Ser Ser Trp Val Leu Leu Met Lys Tyr Leu Gly Asn Ala 260 265 270 Thr Ala Ile Phe Phe Leu Pro Asp Glu Gly Lys Leu Gln His Leu Glu 275 280 285 Asn Glu Leu Thr His Asp Ile Ile Thr Lys Phe Leu Glu Asn Glu Asp 290 295 300 Arg Arg Ser Ala Ser Leu His Leu Pro Lys Leu Ser Ile Thr Gly Thr 305 310 315 320 Tyr Asp Leu Lys Ser Val Leu Gly Gln Leu Gly Ile Thr Lys Val Phe 325 330 335 Ser Asn Gly Ala Asp Leu Ser Gly Val Thr Glu Glu Ala Pro Leu Lys 340 345 350 Leu Ser Lys Ala Val His Lys Ala Val Leu Thr Ile Asp Glu Lys Gly 355 360 365 Thr Glu Ala Ala Gly Ala Met Phe Leu Glu Ala Ile Pro Met Ser Ile 370 375 380 Pro Pro Glu Val Lys Phe Asn Lys Pro Phe Val Phe Leu Met Ile Glu 385 390 395 400 Gln Asn Thr Lys Ser Pro Leu Phe Met Gly Lys Val Val Asn Pro Thr 405 410 415 Gln Lys <![CDATA[<210> 2]]> <![CDATA[<211> 495]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 2]]> Met Ser Met Leu Val Val Phe Leu Leu Leu Trp Gly Val Thr Trp Gly 1 5 10 15 Pro Val Thr Glu Ala Ala Ile Phe Tyr Glu Thr Gln Pro Ser Leu Trp 20 25 30 Ala Glu Ser Glu Ser Leu Leu Lys Pro Leu Ala Asn Val Thr Leu Thr 35 40 45 Cys Gln Ala His Leu Glu Thr Pro Asp Phe Gln Leu Phe Lys Asn Gly 50 55 60 Val Ala Gln Glu Pro Val His Leu Asp Ser Pro Ala Ile Lys His Gln 65 70 75 80 Phe Leu Leu Thr Gly Asp Thr Gln Gly Arg Tyr Arg Cys Arg Ser Gly 85 90 95 Leu Ser Thr Gly Trp Thr Gln Leu Ser Lys Leu Leu Glu Leu Thr Gly 100 105 110 Pro Lys Ser Leu Pro Ala Pro Trp Leu Ser Met Ala Pro Val Ser Trp 115 120 125 Ile Thr Pro Gly Leu Lys Thr Thr Ala Val Cys Arg Gly Val Leu Arg 130 135 140 Gly Val Thr Phe Leu Leu Arg Arg Glu Gly Asp His Glu Phe Leu Glu 145 150 155 160 Val Pro Glu Ala Gln Glu Asp Val Glu Ala Thr Phe Pro Val His Gln 165 170 175 Pro Gly Asn Tyr Ser Cys Ser Tyr Arg Thr Asp Gly Glu Gly Ala Leu 180 185 190 Ser Glu Pro Ser Ala Thr Val Thr Ile Glu Glu Leu Ala Ala Pro Pro 195 200 205 Pro Pro Val Leu Met His His Gly Glu Ser Ser Gln Val Leu His Pro 210 215 220 Gly Asn Lys Val Thr Leu Thr Cys Val Ala Pro Leu Ser Gly Val Asp 225 230 235 240 Phe Gln Leu Arg Arg Gly Glu Lys Glu Leu Leu Val Pro Arg Ser Ser 245 250 255 Thr Ser Pro Asp Arg Ile Phe Phe His Leu Asn Ala Val Ala Leu Gly 260 265 270 Asp Gly Gly His Tyr Thr Cys Arg Tyr Arg Leu His Asp Asn Gln Asn 275 280 285 Gly Trp Ser Gly Asp Ser Ala Pro Val Glu Leu Ile Leu Ser Asp Glu 290 295 300 Thr Leu Pro Ala Pro Glu Phe Ser Pro Glu Pro Glu Ser Gly Arg Ala 305 310 315 320 Leu Arg Leu Arg Cys Leu Ala Pro Leu Glu Gly Ala Arg Phe Ala Leu 325 330 335 Val Arg Glu Asp Arg Gly Gly Arg Arg Val His Arg Phe Gln Ser Pro 340 345 350 Ala Gly Thr Glu Ala Leu Phe Glu Leu His Asn Ile Ser Val Ala Asp 355 360 365 Ser Ala Asn Tyr Ser Cys Val Tyr Val Asp Leu Lys Pro Pro Phe Gly 370 375 380 Gly Ser Ala Pro Ser Glu Arg Leu Glu Leu His Val Asp Gly Pro Pro 385 390 395 400 Pro Arg Pro Gln Leu Arg Ala Thr Trp Ser Gly Ala Val Leu Ala Gly 405 410 415 Arg Asp Ala Val Leu Arg Cys Glu Gly Pro Ile Pro Asp Val Thr Phe 420 425 430 Glu Leu Leu Arg Glu Gly Glu Thr Lys Ala Val Lys Thr Val Arg Thr 435 440 445 Pro Gly Ala Ala Ala Asn Leu Glu Leu Ile Phe Val Gly Pro Gln His 450 455 460 Ala Gly Asn Tyr Arg Cys Arg Tyr Arg Ser Trp Val Pro His Thr Phe 465 470 475 480 Glu Ser Glu Leu Ser Asp Pro Val Glu Leu Leu Val Ala Glu Ser 485 490 495 <![CDATA[<210> 3]]> <![CDATA[<211> 1474]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 3]]> Met Gly Lys Asn Lys Leu Leu His Pro Ser Leu Val Leu Leu Leu Leu 1 5 10 15 Val Leu Leu Pro Thr Asp Ala Ser Val Ser Gly Lys Pro Gln Tyr Met 20 25 30 Val Leu Val Pro Ser Leu Leu His Thr Glu Thr Thr Glu Lys Gly Cys 35 40 45 Val Leu Leu Ser Tyr Leu Asn Glu Thr Val Thr Val Ser Ala Ser Leu 50 55 60 Glu Ser Val Arg Gly Asn Arg Ser Leu Phe Thr Asp Leu Glu Ala Glu 65 70 75 80 Asn Asp Val Leu His Cys Val Ala Phe Ala Val Pro Lys Ser Ser Ser 85 90 95 Asn Glu Glu Val Met Phe Leu Thr Val Gln Val Lys Gly Pro Thr Gln 100 105 110 Glu Phe Lys Lys Arg Thr Thr Val Met Val Lys Asn Glu Asp Ser Leu 115 120 125 Val Phe Val Gln Thr Asp Lys Ser Ile Tyr Lys Pro Gly Gln Thr Val 130 135 140 Lys Phe Arg Val Val Ser Met Asp Glu Asn Phe His Pro Leu Asn Glu 145 150 155 160 Leu Ile Pro Leu Val Tyr Ile Gln Asp Pro Lys Gly Asn Arg Ile Ala 165 170 175 Gln Trp Gln Ser Phe Gln Leu Glu Gly Gly Leu Lys Gln Phe Ser Phe 180 185 190 Pro Leu Ser Ser Glu Pro Phe Gln Gly Ser Tyr Lys Val Val Val Gln 195 200 205 Lys Lys Ser Gly Gly Arg Thr Glu His Pro Phe Thr Val Glu Glu Phe 210 215 220 Val Leu Pro Lys Phe Glu Val Gln Val Thr Val Pro Lys Ile Ile Thr 225 230 235 240 Ile Leu Glu Glu Glu Met Asn Val Ser Val Cys Gly Leu Tyr Thr Tyr 245 250 255 Gly Lys Pro Val Pro Gly His Val Thr Val Ser Ile Cys Arg Lys Tyr 260 265 270 Ser Asp Ala Ser Asp Cys His Gly Glu Asp Ser Gln Ala Phe Cys Glu 275 280 285 Lys Phe Ser Gly Gln Leu Asn Ser His Gly Cys Phe Tyr Gln Gln Val 290 295 300 Lys Thr Lys Val Phe Gln Leu Lys Arg Lys Glu Tyr Glu Met Lys Leu 305 310 315 320 His Thr Glu Ala Gln Ile Gln Glu Glu Gly Thr Val Val Glu Leu Thr 325 330 335 Gly Arg Gln Ser Ser Glu Ile Thr Arg Thr Ile Thr Lys Leu Ser Phe 340 345 350 Val Lys Val Asp Ser His Phe Arg Gln Gly Ile Pro Phe Phe Gly Gln 355 360 365 Val Arg Leu Val Asp Gly Lys Gly Val Pro Ile Pro Asn Lys Val Ile 370 375 380 Phe Ile Arg Gly Asn Glu Ala Asn Tyr Tyr Ser Asn Ala Thr Thr Asp 385 390 395 400 Glu His Gly Leu Val Gln Phe Ser Ile Asn Thr Thr Asn Val Met Gly 405 410 415 Thr Ser Leu Thr Val Arg Val Asn Tyr Lys Asp Arg Ser Pro Cys Tyr 420 425 430 Gly Tyr Gln Trp Val Ser Glu Glu His Glu Glu Ala His His Thr Ala 435 440 445 Tyr Leu Val Phe Ser Pro Ser Lys Ser Phe Val His Leu Glu Pro Met 450 455 460 Ser His Glu Leu Pro Cys Gly His Thr Gln Thr Val Gln Ala His Tyr 465 470 475 480 Ile Leu Asn Gly Gly Thr Leu Leu Gly Leu Lys Lys Leu Ser Phe Tyr 485 490 495 Tyr Leu Ile Met Ala Lys Gly Gly Ile Val Arg Thr Gly Thr His Gly 500 505 510 Leu Leu Val Lys Gln Glu Asp Met Lys Gly His Phe Ser Ile Ser Ile 515 520 525 Pro Val Lys Ser Asp Ile Ala Pro Val Ala Arg Leu Leu Ile Tyr Ala 530 535 540 Val Leu Pro Thr Gly Asp Val Ile Gly Asp Ser Ala Lys Tyr Asp Val 545 550 555 560 Glu Asn Cys Leu Ala Asn Lys Val Asp Leu Ser Phe Ser Pro Ser Gln 565 570 575 Ser Leu Pro Ala Ser His Ala His Leu Arg Val Thr Ala Ala Pro Gln 580 585 590 Ser Val Cys Ala Leu Arg Ala Val Asp Gln Ser Val Leu Leu Met Lys 595 600 605 Pro Asp Ala Glu Leu Ser Ala Ser Ser Val Tyr Asn Leu Leu Pro Glu 610 615 620 Lys Asp Leu Thr Gly Phe Pro Gly Pro Leu Asn Asp Gln Asp Asn Glu 625 630 635 640 Asp Cys Ile Asn Arg His Asn Val Tyr Ile Asn Gly Ile Thr Tyr Thr 645 650 655 Pro Val Ser Ser Thr Asn Glu Lys Asp Met Tyr Ser Phe Leu Glu Asp 660 665 670 Met Gly Leu Lys Ala Phe Thr Asn Ser Lys Ile Arg Lys Pro Lys Met 675 680 685 Cys Pro Gln Leu Gln Gln Tyr Glu Met His Gly Pro Glu Gly Leu Arg 690 695 700 Val Gly Phe Tyr Glu Ser Asp Val Met Gly Arg Gly His Ala Arg Leu 705 710 715 720 Val His Val Glu Glu Pro His Thr Glu Thr Val Arg Lys Tyr Phe Pro 725 730 735 Glu Thr Trp Ile Trp Asp Leu Val Val Val Asn Ser Ala Gly Val Ala 740 745 750 Glu Val Gly Val Thr Val Pro Asp Thr Ile Thr Glu Trp Lys Ala Gly 755 760 765 Ala Phe Cys Leu Ser Glu Asp Ala Gly Leu Gly Ile Ser Ser Thr Ala 770 775 780 Ser Leu Arg Ala Phe Gln Pro Phe Phe Val Glu Leu Thr Met Pro Tyr 785 790 795 800 Ser Val Ile Arg Gly Glu Ala Phe Thr Leu Lys Ala Thr Val Leu Asn 805 810 815 Tyr Leu Pro Lys Cys Ile Arg Val Ser Val Gln Leu Glu Ala Ser Pro 820 825 830 Ala Phe Leu Ala Val Pro Val Glu Lys Glu Gln Ala Pro His Cys Ile 835 840 845 Cys Ala Asn Gly Arg Gln Thr Val Ser Trp Ala Val Thr Pro Lys Ser 850 855 860 Leu Gly Asn Val Asn Phe Thr Val Ser Ala Glu Ala Leu Glu Ser Gln 865 870 875 880 Glu Leu Cys Gly Thr Glu Val Pro Ser Val Pro Glu His Gly Arg Lys 885 890 895 Asp Thr Val Ile Lys Pro Leu Leu Val Glu Pro Glu Gly Leu Glu Lys 900 905 910 Glu Thr Thr Phe Asn Ser Leu Leu Cys Pro Ser Gly Gly Glu Val Ser 915 920 925 Glu Glu Leu Ser Leu Lys Leu Pro Pro Asn Val Val Glu Glu Ser Ala 930 935 940 Arg Ala Ser Val Ser Val Leu Gly Asp Ile Leu Gly Ser Ala Met Gln 945 950 955 960 Asn Thr Gln Asn Leu Leu Gln Met Pro Tyr Gly Cys Gly Glu Gln Asn 965 970 975 Met Val Leu Phe Ala Pro Asn Ile Tyr Val Leu Asp Tyr Leu Asn Glu 980 985 990 Thr Gln Gln Leu Thr Pro Glu Ile Lys Ser Lys Ala Ile Gly Tyr Leu 995 1000 1005 Asn Thr Gly Tyr Gln Arg Gln Leu Asn Tyr Lys His Tyr Asp Gly 1010 1015 1020 Ser Tyr Ser Thr Phe Gly Glu Arg Tyr Gly Arg Asn Gln Gly Asn 1025 1030 1035 Thr Trp Leu Thr Ala Phe Val Leu Lys Thr Phe Ala Gln Ala Arg 1040 1045 1050 Ala Tyr Ile Phe Ile Asp Glu Ala His Ile Thr Gln Ala Leu Ile 1055 1060 1065 Trp Leu Ser Gln Arg Gln Lys Asp Asn Gly Cys Phe Arg Ser Ser 1070 1075 1080 Gly Ser Leu Leu Asn Asn Ala Ile Lys Gly Gly Val Glu Asp Glu 1085 1090 1095 Val Thr Leu Ser Ala Tyr Ile Thr Ile Ala Leu Leu Glu Ile Pro 1100 1105 1110 Leu Thr Val Thr His Pro Val Val Arg Asn Ala Leu Phe Cys Leu 1115 1120 1125 Glu Ser Ala Trp Lys Thr Ala Gln Glu Gly Asp His Gly Ser His 1130 1135 1140 Val Tyr Thr Lys Ala Leu Leu Ala Tyr Ala Phe Ala Leu Ala Gly 1145 1150 1155 Asn Gln Asp Lys Arg Lys Glu Val Leu Lys Ser Leu Asn Glu Glu 1160 1165 1170 Ala Val Lys Lys Asp Asn Ser Val His Trp Glu Arg Pro Gln Lys 1175 1180 1185 Pro Lys Ala Pro Val Gly His Phe Tyr Glu Pro Gln Ala Pro Ser 1190 1195 1200 Ala Glu Val Glu Met Thr Ser Tyr Val Leu Leu Ala Tyr Leu Thr 1205 1210 1215 Ala Gln Pro Ala Pro Thr Ser Glu Asp Leu Thr Ser Ala Thr Asn 1220 1225 1230 Ile Val Lys Trp Ile Thr Lys Gln Gln Asn Ala Gln Gly Gly Phe 1235 1240 1245 Ser Ser Thr Gln Asp Thr Val Val Ala Leu His Ala Leu Ser Lys 1250 1255 1260 Tyr Gly Ala Ala Thr Phe Thr Arg Thr Gly Lys Ala Ala Gln Val 1265 1270 1275 Thr Ile Gln Ser Ser Gly Thr Phe Ser Ser Lys Phe Gln Val Asp 1280 1285 1290 Asn Asn Asn Arg Leu Leu Leu Gln Gln Val Ser Leu Pro Glu Leu 1295 1300 1305 Pro Gly Glu Tyr Ser Met Lys Val Thr Gly Glu Gly Cys Val Tyr 1310 1315 1320 Leu Gln Thr Ser Leu Lys Tyr Asn Ile Leu Pro Glu Lys Glu Glu 1325 1330 1335 Phe Pro Phe Ala Leu Gly Val Gln Thr Leu Pro Gln Thr Cys Asp 1340 1345 1350 Glu Pro Lys Ala His Thr Ser Phe Gln Ile Ser Leu Ser Val Ser 1355 1360 1365 Tyr Thr Gly Ser Arg Ser Ala Ser Asn Met Ala Ile Val Asp Val 1370 1375 1380 Lys Met Val Ser Gly Phe Ile Pro Leu Lys Pro Thr Val Lys Met 1385 1390 1395 Leu Glu Arg Ser Asn His Val Ser Arg Thr Glu Val Ser Ser Asn 1400 1405 1410 His Val Leu Ile Tyr Leu Asp Lys Val Ser Asn Gln Thr Leu Ser 1415 1420 1425 Leu Phe Phe Thr Val Leu Gln Asp Val Pro Val Arg Asp Leu Lys 1430 1435 1440 Pro Ala Ile Val Lys Val Tyr Asp Tyr Tyr Glu Thr Asp Glu Phe 1445 1450 1455 Ala Ile Ala Glu Tyr Asn Ala Pro Cys Ser Lys Asp Leu Gly Asn 1460 1465 1470 Ala <![CDATA[<210> 4]]> <![CDATA[<211> 423]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 4]]> Met Glu Arg Met Leu Pro Leu Leu Ala Leu Gly Leu Leu Ala Ala Gly 1 5 10 15 Phe Cys Pro Ala Val Leu Cys His Pro Asn Ser Pro Leu Asp Glu Glu 20 25 30 Asn Leu Thr Gln Glu Asn Gln Asp Arg Gly Thr His Val Asp Leu Gly 35 40 45 Leu Ala Ser Ala Asn Val Asp Phe Ala Phe Ser Leu Tyr Lys Gln Leu 50 55 60 Val Leu Lys Ala Pro Asp Lys Asn Val Ile Phe Ser Pro Leu Ser Ile 65 70 75 80 Ser Thr Ala Leu Ala Phe Leu Ser Leu Gly Ala His Asn Thr Thr Leu 85 90 95 Thr Glu Ile Leu Lys Gly Leu Lys Phe Asn Leu Thr Glu Thr Ser Glu 100 105 110 Ala Glu Ile His Gln Ser Phe Gln His Leu Leu Arg Thr Leu Asn Gln 115 120 125 Ser Ser Asp Glu Leu Gln Leu Ser Met Gly Asn Ala Met Phe Val Lys 130 135 140 Glu Gln Leu Ser Leu Leu Asp Arg Phe Thr Glu Asp Ala Lys Arg Leu 145 150 155 160 Tyr Gly Ser Glu Ala Phe Ala Thr Asp Phe Gln Asp Ser Ala Ala Ala 165 170 175 Lys Lys Leu Ile Asn Asp Tyr Val Lys Asn Gly Thr Arg Gly Lys Ile 180 185 190 Thr Asp Leu Ile Lys Asp Leu Asp Ser Gln Thr Met Met Val Leu Val 195 200 205 Asn Tyr Ile Phe Phe Lys Ala Lys Trp Glu Met Pro Phe Asp Pro Gln 210 215 220 Asp Thr His Gln Ser Arg Phe Tyr Leu Ser Lys Lys Lys Trp Val Met 225 230 235 240 Val Pro Met Met Ser Leu His His Leu Thr Ile Pro Tyr Phe Arg Asp 245 250 255 Glu Glu Leu Ser Cys Thr Val Val Glu Leu Lys Tyr Thr Gly Asn Ala 260 265 270 Ser Ala Leu Phe Ile Leu Pro Asp Gln Asp Lys Met Glu Glu Val Glu 275 280 285 Ala Met Leu Leu Pro Glu Thr Leu Lys Arg Trp Arg Asp Ser Leu Glu 290 295 300 Phe Arg Glu Ile Gly Glu Leu Tyr Leu Pro Lys Phe Ser Ile Ser Arg 305 310 315 320 Asp Tyr Asn Leu Asn Asp Ile Leu Leu Gln Leu Gly Ile Glu Glu Ala 325 330 335 Phe Thr Ser Lys Ala Asp Leu Ser Gly Ile Thr Gly Ala Arg Asn Leu 340 345 350 Ala Val Ser Gln Val Val His Lys Ala Val Leu Asp Val Phe Glu Glu 355 360 365 Gly Thr Glu Ala Ser Ala Ala Thr Ala Val Lys Ile Thr Leu Leu Ser 370 375 380 Ala Leu Val Glu Thr Arg Thr Ile Val Arg Phe Asn Arg Pro Phe Leu 385 390 395 400 Met Ile Ile Val Pro Thr Asp Thr Gln Asn Ile Phe Phe Met Ser Lys 405 410 415 Val Thr Asn Pro Lys Gln Ala 420 <![CDATA[<210> 5]]> <![CDATA[<211> 599]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 5]]> Met Lys Leu Leu Lys Leu Thr Gly Phe Ile Phe Phe Leu Phe Phe Leu 1 5 10 15 Thr Glu Ser Leu Thr Leu Pro Thr Gln Pro Arg Asp Ile Glu Asn Phe 20 25 30 Asn Ser Thr Gln Lys Phe Ile Glu Asp Asn Ile Glu Tyr Ile Thr Ile 35 40 45 Ile Ala Phe Ala Gln Tyr Val Gln Glu Ala Thr Phe Glu Glu Met Glu 50 55 60 Lys Leu Val Lys Asp Met Val Glu Tyr Lys Asp Arg Cys Met Ala Asp 65 70 75 80 Lys Thr Leu Pro Glu Cys Ser Lys Leu Pro Asn Asn Val Leu Gln Glu 85 90 95 Lys Ile Cys Ala Met Glu Gly Leu Pro Gln Lys His Asn Phe Ser His 100 105 110 Cys Cys Ser Lys Val Asp Ala Gln Arg Arg Leu Cys Phe Phe Tyr Asn 115 120 125 Lys Lys Ser Asp Val Gly Phe Leu Pro Pro Phe Pro Thr Leu Asp Pro 130 135 140 Glu Glu Lys Cys Gln Ala Tyr Glu Ser Asn Arg Glu Ser Leu Leu Asn 145 150 155 160 His Phe Leu Tyr Glu Val Ala Arg Arg Asn Pro Phe Val Phe Ala Pro 165 170 175 Thr Leu Leu Thr Val Ala Val His Phe Glu Glu Val Ala Lys Ser Cys 180 185 190 Cys Glu Glu Gln Asn Lys Val Asn Cys Leu Gln Thr Arg Ala Ile Pro 195 200 205 Val Thr Gln Tyr Leu Lys Ala Phe Ser Ser Tyr Gln Lys His Val Cys 210 215 220 Gly Ala Leu Leu Lys Phe Gly Thr Lys Val Val His Phe Ile Tyr Ile 225 230 235 240 Ala Ile Leu Ser Gln Lys Phe Pro Lys Ile Glu Phe Lys Glu Leu Ile 245 250 255 Ser Leu Val Glu Asp Val Ser Ser Asn Tyr Asp Gly Cys Cys Glu Gly 260 265 270 Asp Val Val Gln Cys Ile Arg Asp Thr Ser Lys Val Met Asn His Ile 275 280 285 Cys Ser Lys Gln Asp Ser Ile Ser Ser Lys Ile Lys Glu Cys Cys Glu 290 295 300 Lys Lys Ile Pro Glu Arg Gly Gln Cys Ile Ile Asn Ser Asn Lys Asp 305 310 315 320 Asp Arg Pro Lys Asp Leu Ser Leu Arg Glu Gly Lys Phe Thr Asp Ser 325 330 335 Glu Asn Val Cys Gln Glu Arg Asp Ala Asp Pro Asp Thr Phe Phe Ala 340 345 350 Lys Phe Thr Phe Glu Tyr Ser Arg Arg His Pro Asp Leu Ser Ile Pro 355 360 365 Glu Leu Leu Arg Ile Val Gln Ile Tyr Lys Asp Leu Leu Arg Asn Cys 370 375 380 Cys Asn Thr Glu Asn Pro Pro Gly Cys Tyr Arg Tyr Ala Glu Asp Lys 385 390 395 400 Phe Asn Glu Thr Thr Glu Lys Ser Leu Lys Met Val Gln Gln Glu Cys 405 410 415 Lys His Phe Gln Asn Leu Gly Lys Asp Gly Leu Lys Tyr His Tyr Leu 420 425 430 Ile Arg Leu Thr Lys Ile Ala Pro Gln Leu Ser Thr Glu Glu Leu Val 435 440 445 Ser Leu Gly Glu Lys Met Val Thr Ala Phe Thr Thr Cys Cys Thr Leu 450 455 460 Ser Glu Glu Phe Ala Cys Val Asp Asn Leu Ala Asp Leu Val Phe Gly 465 470 475 480 Glu Leu Cys Gly Val Asn Glu Asn Arg Thr Ile Asn Pro Ala Val Asp 485 490 495 His Cys Cys Lys Thr Asn Phe Ala Phe Arg Arg Pro Cys Phe Glu Ser 500 505 510 Leu Lys Ala Asp Lys Thr Tyr Val Pro Pro Pro Phe Ser Gln Asp Leu 515 520 525 Phe Thr Phe His Ala Asp Met Cys Gln Ser Gln Asn Glu Glu Leu Gln 530 535 540 Arg Lys Thr Asp Arg Phe Leu Val Asn Leu Val Lys Leu Lys His Glu 545 550 555 560 Leu Thr Asp Glu Glu Leu Gln Ser Leu Phe Thr Asn Phe Ala Asn Val 565 570 575 Val Asp Lys Cys Cys Lys Ala Glu Ser Pro Glu Val Cys Phe Asn Glu 580 585 590 Glu Ser Pro Lys Ile Gly Asn 595 <![CDATA[<210> 6]]> <![CDATA[<211> 201]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 6]]> Met Ala Leu Ser Trp Val Leu Thr Val Leu Ser Leu Leu Pro Leu Leu 1 5 10 15 Glu Ala Gln Ile Pro Leu Cys Ala Asn Leu Val Pro Val Pro Ile Thr 20 25 30 Asn Ala Thr Leu Asp Gln Ile Thr Gly Lys Trp Phe Tyr Ile Ala Ser 35 40 45 Ala Phe Arg Asn Glu Glu Tyr Asn Lys Ser Val Gln Glu Ile Gln Ala 50 55 60 Thr Phe Phe Tyr Phe Thr Pro Asn Lys Thr Glu Asp Thr Ile Phe Leu 65 70 75 80 Arg Glu Tyr Gln Thr Arg Gln Asp Gln Cys Ile Tyr Asn Thr Thr Tyr 85 90 95 Leu Asn Val Gln Arg Glu Asn Gly Thr Ile Ser Arg Tyr Val Gly Gly 100 105 110 Gln Glu His Phe Ala His Leu Leu Ile Leu Arg Asp Thr Lys Thr Tyr 115 120 125 Met Leu Ala Phe Asp Val Asn Asp Glu Lys Asn Trp Gly Leu Ser Val 130 135 140 Tyr Ala Asp Lys Pro Glu Thr Thr Lys Glu Gln Leu Gly Glu Phe Tyr 145 150 155 160 Glu Ala Leu Asp Cys Leu Arg Ile Pro Lys Ser Asp Val Val Tyr Thr 165 170 175 Asp Trp Lys Lys Asp Lys Cys Glu Pro Leu Glu Lys Gln His Glu Lys 180 185 190 Glu Arg Lys Gln Glu Glu Gly Glu Ser 195 200 <![CDATA[<210> 7]]> <![CDATA[<211> 99]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 7]]> Met Gln Pro Arg Val Leu Leu Val Val Ala Leu Leu Ala Leu Leu Ala 1 5 10 15 Ser Ala Arg Ala Ser Glu Ala Glu Asp Ala Ser Leu Leu Ser Phe Met 20 25 30 Gln Gly Tyr Met Lys His Ala Thr Lys Thr Ala Lys Asp Ala Leu Ser 35 40 45 Ser Val Gln Glu Ser Gln Val Ala Gln Gln Ala Arg Gly Trp Val Thr 50 55 60 Asp Gly Phe Ser Ser Leu Lys Asp Tyr Trp Ser Thr Val Lys Asp Lys 65 70 75 80 Phe Ser Glu Phe Trp Asp Leu Asp Pro Glu Val Arg Pro Thr Ser Ala 85 90 95 Val Ala Ala <![CDATA[<210> 8]]> <![CDATA[<211> 188]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 8]]> Met Phe His Gln Ile Trp Ala Ala Leu Leu Tyr Phe Tyr Gly Ile Ile 1 5 10 15 Leu Asn Ser Ile Tyr Gln Cys Pro Glu His Ser Gln Leu Thr Thr Leu 20 25 30 Gly Val Asp Gly Lys Glu Phe Pro Glu Val His Leu Gly Gln Trp Tyr 35 40 45 Phe Ile Ala Gly Ala Ala Pro Thr Lys Glu Glu Leu Ala Thr Phe Asp 50 55 60 Pro Val Asp Asn Ile Val Phe Asn Met Ala Ala Gly Ser Ala Pro Met 65 70 75 80 Gln Leu His Leu Arg Ala Thr Ile Arg Met Lys Asp Gly Leu Cys Val 85 90 95 Pro Arg Lys Trp Ile Tyr His Leu Thr Glu Gly Ser Thr Asp Leu Arg 100 105 110 Thr Glu Gly Arg Pro Asp Met Lys Thr Glu Leu Phe Ser Ser Ser Cys 115 120 125 Pro Gly Gly Ile Met Leu Asn Glu Thr Gly Gln Gly Tyr Gln Arg Phe 130 135 140 Leu Leu Tyr Asn Arg Ser Pro His Pro Pro Glu Lys Cys Val Glu Glu 145 150 155 160 Phe Lys Ser Leu Thr Ser Cys Leu Asp Ser Lys Ala Phe Leu Leu Thr 165 170 175 Pro Arg Asn Gln Glu Ala Cys Glu Leu Ser Asn Asn 180 185 <![CDATA[<210> 9]]> <![CDATA[<211> 583]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 9]]> Met Lys Leu Leu His Val Phe Leu Leu Phe Leu Cys Phe His Leu Arg 1 5 10 15 Phe Cys Lys Val Thr Tyr Thr Ser Gln Glu Asp Leu Val Glu Lys Lys 20 25 30 Cys Leu Ala Lys Lys Tyr Thr His Leu Ser Cys Asp Lys Val Phe Cys 35 40 45 Gln Pro Trp Gln Arg Cys Ile Glu Gly Thr Cys Val Cys Lys Leu Pro 50 55 60 Tyr Gln Cys Pro Lys Asn Gly Thr Ala Val Cys Ala Thr Asn Arg Arg 65 70 75 80 Ser Phe Pro Thr Tyr Cys Gln Gln Lys Ser Leu Glu Cys Leu His Pro 85 90 95 Gly Thr Lys Phe Leu Asn Asn Gly Thr Cys Thr Ala Glu Gly Lys Phe 100 105 110 Ser Val Ser Leu Lys His Gly Asn Thr Asp Ser Glu Gly Ile Val Glu 115 120 125 Val Lys Leu Val Asp Gln Asp Lys Thr Met Phe Ile Cys Lys Ser Ser 130 135 140 Trp Ser Met Arg Glu Ala Asn Val Ala Cys Leu Asp Leu Gly Phe Gln 145 150 155 160 Gln Gly Ala Asp Thr Gln Arg Arg Phe Lys Leu Ser Asp Leu Ser Ile 165 170 175 Asn Ser Thr Glu Cys Leu His Val His Cys Arg Gly Leu Glu Thr Ser 180 185 190 Leu Ala Glu Cys Thr Phe Thr Lys Arg Arg Thr Met Gly Tyr Gln Asp 195 200 205 Phe Ala Asp Val Val Cys Tyr Thr Gln Lys Ala Asp Ser Pro Met Asp 210 215 220 Asp Phe Phe Gln Cys Val Asn Gly Lys Tyr Ile Ser Gln Met Lys Ala 225 230 235 240 Cys Asp Gly Ile Asn Asp Cys Gly Asp Gln Ser Asp Glu Leu Cys Cys 245 250 255 Lys Ala Cys Gln Gly Lys Gly Phe His Cys Lys Ser Gly Val Cys Ile 260 265 270 Pro Ser Gln Tyr Gln Cys Asn Gly Glu Val Asp Cys Ile Thr Gly Glu 275 280 285 Asp Glu Val Gly Cys Ala Gly Phe Ala Ser Val Thr Gln Glu Glu Thr 290 295 300 Glu Ile Leu Thr Ala Asp Met Asp Ala Glu Arg Arg Arg Ile Lys Ser 305 310 315 320 Leu Leu Pro Lys Leu Ser Cys Gly Val Lys Asn Arg Met His Ile Arg 325 330 335 Arg Lys Arg Ile Val Gly Gly Lys Arg Ala Gln Leu Gly Asp Leu Pro 340 345 350 Trp Gln Val Ala Ile Lys Asp Ala Ser Gly Ile Thr Cys Gly Gly Ile 355 360 365 Tyr Ile Gly Gly Cys Trp Ile Leu Thr Ala Ala His Cys Leu Arg Ala 370 375 380 Ser Lys Thr His Arg Tyr Gln Ile Trp Thr Thr Val Val Asp Trp Ile 385 390 395 400 His Pro Asp Leu Lys Arg Ile Val Ile Glu Tyr Val Asp Arg Ile Ile 405 410 415 Phe His Glu Asn Tyr Asn Ala Gly Thr Tyr Gln Asn Asp Ile Ala Leu 420 425 430 Ile Glu Met Lys Lys Asp Gly Asn Lys Lys Asp Cys Glu Leu Pro Arg 435 440 445 Ser Ile Pro Ala Cys Val Pro Trp Ser Pro Tyr Leu Phe Gln Pro Asn 450 455 460 Asp Thr Cys Ile Val Ser Gly Trp Gly Arg Glu Lys Asp Asn Glu Arg 465 470 475 480 Val Phe Ser Leu Gln Trp Gly Glu Val Lys Leu Ile Ser Asn Cys Ser 485 490 495 Lys Phe Tyr Gly Asn Arg Phe Tyr Glu Lys Glu Met Glu Cys Ala Gly 500 505 510 Thr Tyr Asp Gly Ser Ile Asp Ala Cys Lys Gly Asp Ser Gly Gly Pro 515 520 525 Leu Val Cys Met Asp Ala Asn Asn Val Thr Tyr Val Trp Gly Val Val 530 535 540 Ser Trp Gly Glu Asn Cys Gly Lys Pro Glu Phe Pro Gly Val Tyr Thr 545 550 555 560 Lys Val Ala Asn Tyr Phe Asp Trp Ile Ser Tyr His Val Gly Arg Pro 565 570 575 Phe Ile Ser Gln Tyr Asn Val 580 <![CDATA[<210> 10]]> <![CDATA[<211> 449]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 10]]> Met Met Lys Thr Leu Leu Leu Phe Val Gly Leu Leu Leu Thr Trp Glu 1 5 10 15 Ser Gly Gln Val Leu Gly Asp Gln Thr Val Ser Asp Asn Glu Leu Gln 20 25 30 Glu Met Ser Asn Gln Gly Ser Lys Tyr Val Asn Lys Glu Ile Gln Asn 35 40 45 Ala Val Asn Gly Val Lys Gln Ile Lys Thr Leu Ile Glu Lys Thr Asn 50 55 60 Glu Glu Arg Lys Thr Leu Leu Ser Asn Leu Glu Glu Ala Lys Lys Lys 65 70 75 80 Lys Glu Asp Ala Leu Asn Glu Thr Arg Glu Ser Glu Thr Lys Leu Lys 85 90 95 Glu Leu Pro Gly Val Cys Asn Glu Thr Met Met Ala Leu Trp Glu Glu 100 105 110 Cys Lys Pro Cys Leu Lys Gln Thr Cys Met Lys Phe Tyr Ala Arg Val 115 120 125 Cys Arg Ser Gly Ser Gly Leu Val Gly Arg Gln Leu Glu Glu Phe Leu 130 135 140 Asn Gln Ser Ser Pro Phe Tyr Phe Trp Met Asn Gly Asp Arg Ile Asp 145 150 155 160 Ser Leu Leu Glu Asn Asp Arg Gln Gln Thr His Met Leu Asp Val Met 165 170 175 Gln Asp His Phe Ser Arg Ala Ser Ser Ile Ile Asp Glu Leu Phe Gln 180 185 190 Asp Arg Phe Phe Thr Arg Glu Pro Gln Asp Thr Tyr His Tyr Leu Pro 195 200 205 Phe Ser Leu Pro His Arg Arg Pro His Phe Phe Phe Pro Lys Ser Arg 210 215 220 Ile Val Arg Ser Leu Met Pro Phe Ser Pro Tyr Glu Pro Leu Asn Phe 225 230 235 240 His Ala Met Phe Gln Pro Phe Leu Glu Met Ile His Glu Ala Gln Gln 245 250 255 Ala Met Asp Ile His Phe His Ser Pro Ala Phe Gln His Pro Pro Thr 260 265 270 Glu Phe Ile Arg Glu Gly Asp Asp Asp Arg Thr Val Cys Arg Glu Ile 275 280 285 Arg His Asn Ser Thr Gly Cys Leu Arg Met Lys Asp Gln Cys Asp Lys 290 295 300 Cys Arg Glu Ile Leu Ser Val Asp Cys Ser Thr Asn Asn Pro Ser Gln 305 310 315 320 Ala Lys Leu Arg Arg Glu Leu Asp Glu Ser Leu Gln Val Ala Glu Arg 325 330 335 Leu Thr Arg Lys Tyr Asn Glu Leu Leu Lys Ser Tyr Gln Trp Lys Met 340 345 350 Leu Asn Thr Ser Ser Leu Leu Glu Gln Leu Asn Glu Gln Phe Asn Trp 355 360 365 Val Ser Arg Leu Ala Asn Leu Thr Gln Gly Glu Asp Gln Tyr Tyr Leu 370 375 380 Arg Val Thr Thr Val Ala Ser His Thr Ser Asp Ser Asp Val Pro Ser 385 390 395 400 Gly Val Thr Glu Val Val Val Lys Leu Phe Asp Ser Asp Pro Ile Thr 405 410 415 Val Thr Val Pro Val Glu Val Ser Arg Lys Asn Pro Lys Phe Met Glu 420 425 430 Thr Val Ala Glu Lys Ala Leu Gln Glu Tyr Arg Lys Lys His Arg Glu 435 440 445 Glu <![CDATA[<210> 11]]> <![CDATA[<211> 1744]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 11]]> Met Arg Leu Leu Trp Gly Leu Ile Trp Ala Ser Ser Phe Phe Thr Leu 1 5 10 15 Ser Leu Gln Lys Pro Arg Leu Leu Leu Phe Ser Pro Ser Val Val His 20 25 30 Leu Gly Val Pro Leu Ser Val Gly Val Gln Leu Gln Asp Val Pro Arg 35 40 45 Gly Gln Val Val Lys Gly Ser Val Phe Leu Arg Asn Pro Ser Arg Asn 50 55 60 Asn Val Pro Cys Ser Pro Lys Val Asp Phe Thr Leu Ser Ser Glu Arg 65 70 75 80 Asp Phe Ala Leu Leu Ser Leu Gln Val Pro Leu Lys Asp Ala Lys Ser 85 90 95 Cys Gly Leu His Gln Leu Leu Arg Gly Pro Glu Val Gln Leu Val Ala 100 105 110 His Ser Pro Trp Leu Lys Asp Ser Leu Ser Arg Thr Thr Asn Ile Gln 115 120 125 Gly Ile Asn Leu Leu Phe Ser Ser Arg Arg Gly His Leu Phe Leu Gln 130 135 140 Thr Asp Gln Pro Ile Tyr Asn Pro Gly Gln Arg Val Arg Tyr Arg Val 145 150 155 160 Phe Ala Leu Asp Gln Lys Met Arg Pro Ser Thr Asp Thr Ile Thr Val 165 170 175 Met Val Glu Asn Ser His Gly Leu Arg Val Arg Lys Lys Glu Val Tyr 180 185 190 Met Pro Ser Ser Ile Phe Gln Asp Asp Phe Val Ile Pro Asp Ile Ser 195 200 205 Glu Pro Gly Thr Trp Lys Ile Ser Ala Arg Phe Ser Asp Gly Leu Glu 210 215 220 Ser Asn Ser Ser Thr Gln Phe Glu Val Lys Lys Tyr Val Leu Pro Asn 225 230 235 240 Phe Glu Val Lys Ile Thr Pro Gly Lys Pro Tyr Ile Leu Thr Val Pro 245 250 255 Gly His Leu Asp Glu Met Gln Leu Asp Ile Gln Ala Arg Tyr Ile Tyr 260 265 270 Gly Lys Pro Val Gln Gly Val Ala Tyr Val Arg Phe Gly Leu Leu Asp 275 280 285 Glu Asp Gly Lys Lys Thr Phe Phe Arg Gly Leu Glu Ser Gln Thr Lys 290 295 300 Leu Val Asn Gly Gln Ser His Ile Ser Leu Ser Lys Ala Glu Phe Gln 305 310 315 320 Asp Ala Leu Glu Lys Leu Asn Met Gly Ile Thr Asp Leu Gln Gly Leu 325 330 335 Arg Leu Tyr Val Ala Ala Ala Ile Ile Glu Ser Pro Gly Gly Glu Met 340 345 350 Glu Glu Ala Glu Leu Thr Ser Trp Tyr Phe Val Ser Ser Pro Phe Ser 355 360 365 Leu Asp Leu Ser Lys Thr Lys Arg His Leu Val Pro Gly Ala Pro Phe 370 375 380 Leu Leu Gln Ala Leu Val Arg Glu Met Ser Gly Ser Pro Ala Ser Gly 385 390 395 400 Ile Pro Val Lys Val Ser Ala Thr Val Ser Ser Pro Gly Ser Val Pro 405 410 415 Glu Val Gln Asp Ile Gln Gln Asn Thr Asp Gly Ser Gly Gln Val Ser 420 425 430 Ile Pro Ile Ile Ile Pro Gln Thr Ile Ser Glu Leu Gln Leu Ser Val 435 440 445 Ser Ala Gly Ser Pro His Pro Ala Ile Ala Arg Leu Thr Val Ala Ala 450 455 460 Pro Pro Ser Gly Gly Pro Gly Phe Leu Ser Ile Glu Arg Pro Asp Ser 465 470 475 480 Arg Pro Pro Arg Val Gly Asp Thr Leu Asn Leu Asn Leu Arg Ala Val 485 490 495 Gly Ser Gly Ala Thr Phe Ser His Tyr Tyr Tyr Met Ile Leu Ser Arg 500 505 510 Gly Gln Ile Val Phe Met Asn Arg Glu Pro Lys Arg Thr Leu Thr Ser 515 520 525 Val Ser Val Phe Val Asp His His Leu Ala Pro Ser Phe Tyr Phe Val 530 535 540 Ala Phe Tyr Tyr His Gly Asp His Pro Val Ala Asn Ser Leu Arg Val 545 550 555 560 Asp Val Gln Ala Gly Ala Cys Glu Gly Lys Leu Glu Leu Ser Val Asp 565 570 575 Gly Ala Lys Gln Tyr Arg Asn Gly Glu Ser Val Lys Leu His Leu Glu 580 585 590 Thr Asp Ser Leu Ala Leu Val Ala Leu Gly Ala Leu Asp Thr Ala Leu 595 600 605 Tyr Ala Ala Gly Ser Lys Ser His Lys Pro Leu Asn Met Gly Lys Val 610 615 620 Phe Glu Ala Met Asn Ser Tyr Asp Leu Gly Cys Gly Pro Gly Gly Gly 625 630 635 640 Asp Ser Ala Leu Gln Val Phe Gln Ala Ala Gly Leu Ala Phe Ser Asp 645 650 655 Gly Asp Gln Trp Thr Leu Ser Arg Lys Arg Leu Ser Cys Pro Lys Glu 660 665 670 Lys Thr Thr Arg Lys Lys Arg Asn Val Asn Phe Gln Lys Ala Ile Asn 675 680 685 Glu Lys Leu Gly Gln Tyr Ala Ser Pro Thr Ala Lys Arg Cys Cys Gln 690 695 700 Asp Gly Val Thr Arg Leu Pro Met Met Arg Ser Cys Glu Gln Arg Ala 705 710 715 720 Ala Arg Val Gln Gln Pro Asp Cys Arg Glu Pro Phe Leu Ser Cys Cys 725 730 735 Gln Phe Ala Glu Ser Leu Arg Lys Lys Ser Arg Asp Lys Gly Gln Ala 740 745 750 Gly Leu Gln Arg Ala Leu Glu Ile Leu Gln Glu Glu Asp Leu Ile Asp 755 760 765 Glu Asp Asp Ile Pro Val Arg Ser Phe Phe Pro Glu Asn Trp Leu Trp 770 775 780 Arg Val Glu Thr Val Asp Arg Phe Gln Ile Leu Thr Leu Trp Leu Pro 785 790 795 800 Asp Ser Leu Thr Thr Trp Glu Ile His Gly Leu Ser Leu Ser Lys Thr 805 810 815 Lys Gly Leu Cys Val Ala Thr Pro Val Gln Leu Arg Val Phe Arg Glu 820 825 830 Phe His Leu His Leu Arg Leu Pro Met Ser Val Arg Arg Phe Glu Gln 835 840 845 Leu Glu Leu Arg Pro Val Leu Tyr Asn Tyr Leu Asp Lys Asn Leu Thr 850 855 860 Val Ser Val His Val Ser Pro Val Glu Gly Leu Cys Leu Ala Gly Gly 865 870 875 880 Gly Gly Leu Ala Gln Gln Val Leu Val Pro Ala Gly Ser Ala Arg Pro 885 890 895 Val Ala Phe Ser Val Val Pro Thr Ala Ala Ala Ala Val Ser Leu Lys 900 905 910 Val Val Ala Arg Gly Ser Phe Glu Phe Pro Val Gly Asp Ala Val Ser 915 920 925 Lys Val Leu Gln Ile Glu Lys Glu Gly Ala Ile His Arg Glu Glu Leu 930 935 940 Val Tyr Glu Leu Asn Pro Leu Asp His Arg Gly Arg Thr Leu Glu Ile 945 950 955 960 Pro Gly Asn Ser Asp Pro Asn Met Ile Pro Asp Gly Asp Phe Asn Ser 965 970 975 Tyr Val Arg Val Thr Ala Ser Asp Pro Leu Asp Thr Leu Gly Ser Glu 980 985 990 Gly Ala Leu Ser Pro Gly Gly Val Ala Ser Leu Leu Arg Leu Pro Arg 995 1000 1005 Gly Cys Gly Glu Gln Thr Met Ile Tyr Leu Ala Pro Thr Leu Ala 1010 1015 1020 Ala Ser Arg Tyr Leu Asp Lys Thr Glu Gln Trp Ser Thr Leu Pro 1025 1030 1035 Pro Glu Thr Lys Asp His Ala Val Asp Leu Ile Gln Lys Gly Tyr 1040 1045 1050 Met Arg Ile Gln Gln Phe Arg Lys Ala Asp Gly Ser Tyr Ala Ala 1055 1060 1065 Trp Leu Ser Arg Asp Ser Ser Thr Trp Leu Thr Ala Phe Val Leu 1070 1075 1080 Lys Val Leu Ser Leu Ala Gln Glu Gln Val Gly Gly Ser Pro Glu 1085 1090 1095 Lys Leu Gln Glu Thr Ser Asn Trp Leu Leu Ser Gln Gln Gln Ala 1100 1105 1110 Asp Gly Ser Phe Gln Asp Pro Cys Pro Val Leu Asp Arg Ser Met 1115 1120 1125 Gln Gly Gly Leu Val Gly Asn Asp Glu Thr Val Ala Leu Thr Ala 1130 1135 1140 Phe Val Thr Ile Ala Leu His His Gly Leu Ala Val Phe Gln Asp 1145 1150 1155 Glu Gly Ala Glu Pro Leu Lys Gln Arg Val Glu Ala Ser Ile Ser 1160 1165 1170 Lys Ala Asn Ser Phe Leu Gly Glu Lys Ala Ser Ala Gly Leu Leu 1175 1180 1185 Gly Ala His Ala Ala Ala Ile Thr Ala Tyr Ala Leu Thr Leu Thr 1190 1195 1200 Lys Ala Pro Val Asp Leu Leu Gly Val Ala His Asn Asn Leu Met 1205 1210 1215 Ala Met Ala Gln Glu Thr Gly Asp Asn Leu Tyr Trp Gly Ser Val 1220 1225 1230 Thr Gly Ser Gln Ser Asn Ala Val Ser Pro Thr Pro Ala Pro Arg 1235 1240 1245 Asn Pro Ser Asp Pro Met Pro Gln Ala Pro Ala Leu Trp Ile Glu 1250 1255 1260 Thr Thr Ala Tyr Ala Leu Leu His Leu Leu Leu His Glu Gly Lys 1265 1270 1275 Ala Glu Met Ala Asp Gln Ala Ser Ala Trp Leu Thr Arg Gln Gly 1280 1285 1290 Ser Phe Gln Gly Gly Phe Arg Ser Thr Gln Asp Thr Val Ile Ala 1295 1300 1305 Leu Asp Ala Leu Ser Ala Tyr Trp Ile Ala Ser His Thr Thr Glu 1310 1315 1320 Glu Arg Gly Leu Asn Val Thr Leu Ser Ser Thr Gly Arg Asn Gly 1325 1330 1335 Phe Lys Ser His Ala Leu Gln Leu Asn Asn Arg Gln Ile Arg Gly 1340 1345 1350 Leu Glu Glu Glu Leu Gln Phe Ser Leu Gly Ser Lys Ile Asn Val 1355 1360 1365 Lys Val Gly Gly Asn Ser Lys Gly Thr Leu Lys Val Leu Arg Thr 1370 1375 1380 Tyr Asn Val Leu Asp Met Lys Asn Thr Thr Cys Gln Asp Leu Gln 1385 1390 1395 Ile Glu Val Thr Val Lys Gly His Val Glu Tyr Thr Met Glu Ala 1400 1405 1410 Asn Glu Asp Tyr Glu Asp Tyr Glu Tyr Asp Glu Leu Pro Ala Lys 1415 1420 1425 Asp Asp Pro Asp Ala Pro Leu Gln Pro Val Thr Pro Leu Gln Leu 1430 1435 1440 Phe Glu Gly Arg Arg Asn Arg Arg Arg Arg Glu Ala Pro Lys Val 1445 1450 1455 Val Glu Glu Gln Glu Ser Arg Val His Tyr Thr Val Cys Ile Trp 1460 1465 1470 Arg Asn Gly Lys Val Gly Leu Ser Gly Met Ala Ile Ala Asp Val 1475 1480 1485 Thr Leu Leu Ser Gly Phe His Ala Leu Arg Ala Asp Leu Glu Lys 1490 1495 1500 Leu Thr Ser Leu Ser Asp Arg Tyr Val Ser His Phe Glu Thr Glu 1505 1510 1515 Gly Pro His Val Leu Leu Tyr Phe Asp Ser Val Pro Thr Ser Arg 1520 1525 1530 Glu Cys Val Gly Phe Glu Ala Val Gln Glu Val Pro Val Gly Leu 1535 1540 1545 Val Gln Pro Ala Ser Ala Thr Leu Tyr Asp Tyr Tyr Asn Pro Glu 1550 1555 1560 Arg Arg Cys Ser Val Phe Tyr Gly Ala Pro Ser Lys Ser Arg Leu 1565 1570 1575 Leu Ala Thr Leu Cys Ser Ala Glu Val Cys Gln Cys Ala Glu Gly 1580 1585 1590 Lys Cys Pro Arg Gln Arg Arg Ala Leu Glu Arg Gly Leu Gln Asp 1595 1600 1605 Glu Asp Gly Tyr Arg Met Lys Phe Ala Cys Tyr Tyr Pro Arg Val 1610 1615 1620 Glu Tyr Gly Phe Gln Val Lys Val Leu Arg Glu Asp Ser Arg Ala 1625 1630 1635 Ala Phe Arg Leu Phe Glu Thr Lys Ile Thr Gln Val Leu His Phe 1640 1645 1650 Thr Lys Asp Val Lys Ala Ala Ala Asn Gln Met Arg Asn Phe Leu 1655 1660 1665 Val Arg Ala Ser Cys Arg Leu Arg Leu Glu Pro Gly Lys Glu Tyr 1670 1675 1680 Leu Ile Met Gly Leu Asp Gly Ala Thr Tyr Asp Leu Glu Gly His 1685 1690 1695 Pro Gln Tyr Leu Leu Asp Ser Asn Ser Trp Ile Glu Glu Met Pro 1700 1705 1710 Ser Glu Arg Leu Cys Arg Ser Thr Arg Gln Arg Ala Ala Cys Ala 1715 1720 1725 Gln Leu Asn Asp Phe Leu Gln Glu Tyr Gly Thr Gln Gly Cys Gln 1730 1735 1740 Val <![CDATA[<210> 12]]> <![CDATA[<211> 934]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 12]]> Met Ala Arg Arg Ser Val Leu Tyr Phe Ile Leu Leu Asn Ala Leu Ile 1 5 10 15 Asn Lys Gly Gln Ala Cys Phe Cys Asp His Tyr Ala Trp Thr Gln Trp 20 25 30 Thr Ser Cys Ser Lys Thr Cys Asn Ser Gly Thr Gln Ser Arg His Arg 35 40 45 Gln Ile Val Val Asp Lys Tyr Tyr Gln Glu Asn Phe Cys Glu Gln Ile 50 55 60 Cys Ser Lys Gln Glu Thr Arg Glu Cys Asn Trp Gln Arg Cys Pro Ile 65 70 75 80 Asn Cys Leu Leu Gly Asp Phe Gly Pro Trp Ser Asp Cys Asp Pro Cys 85 90 95 Ile Glu Lys Gln Ser Lys Val Arg Ser Val Leu Arg Pro Ser Gln Phe 100 105 110 Gly Gly Gln Pro Cys Thr Ala Pro Leu Val Ala Phe Gln Pro Cys Ile 115 120 125 Pro Ser Lys Leu Cys Lys Ile Glu Glu Ala Asp Cys Lys Asn Lys Phe 130 135 140 Arg Cys Asp Ser Gly Arg Cys Ile Ala Arg Lys Leu Glu Cys Asn Gly 145 150 155 160 Glu Asn Asp Cys Gly Asp Asn Ser Asp Glu Arg Asp Cys Gly Arg Thr 165 170 175 Lys Ala Val Cys Thr Arg Lys Tyr Asn Pro Ile Pro Ser Val Gln Leu 180 185 190 Met Gly Asn Gly Phe His Phe Leu Ala Gly Glu Pro Arg Gly Glu Val 195 200 205 Leu Asp Asn Ser Phe Thr Gly Gly Ile Cys Lys Thr Val Lys Ser Ser 210 215 220 Arg Thr Ser Asn Pro Tyr Arg Val Pro Ala Asn Leu Glu Asn Val Gly 225 230 235 240 Phe Glu Val Gln Thr Ala Glu Asp Asp Leu Lys Thr Asp Phe Tyr Lys 245 250 255 Asp Leu Thr Ser Leu Gly His Asn Glu Asn Gln Gln Gly Ser Phe Ser 260 265 270 Ser Gln Gly Gly Ser Ser Phe Ser Val Pro Ile Phe Tyr Ser Ser Lys 275 280 285 Arg Ser Glu Asn Ile Asn His Asn Ser Ala Phe Lys Gln Ala Ile Gln 290 295 300 Ala Ser His Lys Lys Asp Ser Ser Phe Ile Arg Ile His Lys Val Met 305 310 315 320 Lys Val Leu Asn Phe Thr Thr Lys Ala Lys Asp Leu His Leu Ser Asp 325 330 335 Val Phe Leu Lys Ala Leu Asn His Leu Pro Leu Glu Tyr Asn Ser Ala 340 345 350 Leu Tyr Ser Arg Ile Phe Asp Asp Phe Gly Thr His Tyr Phe Thr Ser 355 360 365 Gly Ser Leu Gly Gly Val Tyr Asp Leu Leu Tyr Gln Phe Ser Ser Glu 370 375 380 Glu Leu Lys Asn Ser Gly Leu Thr Glu Glu Glu Ala Lys His Cys Val 385 390 395 400 Arg Ile Glu Thr Lys Lys Arg Val Leu Phe Ala Lys Lys Thr Lys Val 405 410 415 Glu His Arg Cys Thr Thr Asn Lys Leu Ser Glu Lys His Glu Gly Ser 420 425 430 Phe Ile Gln Gly Ala Glu Lys Ser Ile Ser Leu Ile Arg Gly Gly Arg 435 440 445 Ser Glu Tyr Gly Ala Ala Leu Ala Trp Glu Lys Gly Ser Ser Gly Leu 450 455 460 Glu Glu Lys Thr Phe Ser Glu Trp Leu Glu Ser Val Lys Glu Asn Pro 465 470 475 480 Ala Val Ile Asp Phe Glu Leu Ala Pro Ile Val Asp Leu Val Arg Asn 485 490 495 Ile Pro Cys Ala Val Thr Lys Arg Asn Asn Leu Arg Lys Ala Leu Gln 500 505 510 Glu Tyr Ala Ala Lys Phe Asp Pro Cys Gln Cys Ala Pro Cys Pro Asn 515 520 525 Asn Gly Arg Pro Thr Leu Ser Gly Thr Glu Cys Leu Cys Val Cys Gln 530 535 540 Ser Gly Thr Tyr Gly Glu Asn Cys Glu Lys Gln Ser Pro Asp Tyr Lys 545 550 555 560 Ser Asn Ala Val Asp Gly Gln Trp Gly Cys Trp Ser Ser Trp Ser Thr 565 570 575 Cys Asp Ala Thr Tyr Lys Arg Ser Arg Thr Arg Glu Cys Asn Asn Pro 580 585 590 Ala Pro Gln Arg Gly Gly Lys Arg Cys Glu Gly Glu Lys Arg Gln Glu 595 600 605 Glu Asp Cys Thr Phe Ser Ile Met Glu Asn Asn Gly Gln Pro Cys Ile 610 615 620 Asn Asp Asp Glu Glu Met Lys Glu Val Asp Leu Pro Glu Ile Glu Ala 625 630 635 640 Asp Ser Gly Cys Pro Gln Pro Val Pro Pro Glu Asn Gly Phe Ile Arg 645 650 655 Asn Glu Lys Gln Leu Tyr Leu Val Gly Glu Asp Val Glu Ile Ser Cys 660 665 670 Leu Thr Gly Phe Glu Thr Val Gly Tyr Gln Tyr Phe Arg Cys Leu Pro 675 680 685 Asp Gly Thr Trp Arg Gln Gly Asp Val Glu Cys Gln Arg Thr Glu Cys 690 695 700 Ile Lys Pro Val Val Gln Glu Val Leu Thr Ile Thr Pro Phe Gln Arg 705 710 715 720 Leu Tyr Arg Ile Gly Glu Ser Ile Glu Leu Thr Cys Pro Lys Gly Phe 725 730 735 Val Val Ala Gly Pro Ser Arg Tyr Thr Cys Gln Gly Asn Ser Trp Thr 740 745 750 Pro Pro Ile Ser Asn Ser Leu Thr Cys Glu Lys Asp Thr Leu Thr Lys 755 760 765 Leu Lys Gly His Cys Gln Leu Gly Gln Lys Gln Ser Gly Ser Glu Cys 770 775 780 Ile Cys Met Ser Pro Glu Glu Asp Cys Ser His His Ser Glu Asp Leu 785 790 795 800 Cys Val Phe Asp Thr Asp Ser Asn Asp Tyr Phe Thr Ser Pro Ala Cys 805 810 815 Lys Phe Leu Ala Glu Lys Cys Leu Asn Asn Gln Gln Leu His Phe Leu 820 825 830 His Ile Gly Ser Cys Gln Asp Gly Arg Gln Leu Glu Trp Gly Leu Glu 835 840 845 Arg Thr Arg Leu Ser Ser Asn Ser Thr Lys Lys Glu Ser Cys Gly Tyr 850 855 860 Asp Thr Cys Tyr Asp Trp Glu Lys Cys Ser Ala Ser Thr Ser Lys Cys 865 870 875 880 Val Cys Leu Leu Pro Pro Gln Cys Phe Lys Gly Gly Asn Gln Leu Tyr 885 890 895 Cys Val Lys Met Gly Ser Ser Thr Ser Glu Lys Thr Leu Asn Ile Cys 900 905 910 Glu Val Gly Thr Ile Arg Cys Ala Asn Arg Lys Met Glu Ile Leu His 915 920 925 Pro Gly Lys Cys Leu Ala 930 <![CDATA[<210> 13]]> <![CDATA[<211> 584]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 13]]> Met Phe Ala Val Val Phe Phe Ile Leu Ser Leu Met Thr Cys Gln Pro 1 5 10 15 Gly Val Thr Ala Gln Glu Lys Val Asn Gln Arg Val Arg Arg Ala Ala 20 25 30 Thr Pro Ala Ala Val Thr Cys Gln Leu Ser Asn Trp Ser Glu Trp Thr 35 40 45 Asp Cys Phe Pro Cys Gln Asp Lys Lys Tyr Arg His Arg Ser Leu Leu 50 55 60 Gln Pro Asn Lys Phe Gly Gly Thr Ile Cys Ser Gly Asp Ile Trp Asp 65 70 75 80 Gln Ala Ser Cys Ser Ser Ser Thr Thr Cys Val Arg Gln Ala Gln Cys 85 90 95 Gly Gln Asp Phe Gln Cys Lys Glu Thr Gly Arg Cys Leu Lys Arg His 100 105 110 Leu Val Cys Asn Gly Asp Gln Asp Cys Leu Asp Gly Ser Asp Glu Asp 115 120 125 Asp Cys Glu Asp Val Arg Ala Ile Asp Glu Asp Cys Ser Gln Tyr Glu 130 135 140 Pro Ile Pro Gly Ser Gln Lys Ala Ala Leu Gly Tyr Asn Ile Leu Thr 145 150 155 160 Gln Glu Asp Ala Gln Ser Val Tyr Asp Ala Ser Tyr Tyr Gly Gly Gln 165 170 175 Cys Glu Thr Val Tyr Asn Gly Glu Trp Arg Glu Leu Arg Tyr Asp Ser 180 185 190 Thr Cys Glu Arg Leu Tyr Tyr Gly Asp Asp Glu Lys Tyr Phe Arg Lys 195 200 205 Pro Tyr Asn Phe Leu Lys Tyr His Phe Glu Ala Leu Ala Asp Thr Gly 210 215 220 Ile Ser Ser Glu Phe Tyr Asp Asn Ala Asn Asp Leu Leu Ser Lys Val 225 230 235 240 Lys Lys Asp Lys Ser Asp Ser Phe Gly Val Thr Ile Gly Ile Gly Pro 245 250 255 Ala Gly Ser Pro Leu Leu Val Gly Val Gly Val Ser His Ser Gln Asp 260 265 270 Thr Ser Phe Leu Asn Glu Leu Asn Lys Tyr Asn Glu Lys Lys Phe Ile 275 280 285 Phe Thr Arg Ile Phe Thr Lys Val Gln Thr Ala His Phe Lys Met Arg 290 295 300 Lys Asp Asp Ile Met Leu Asp Glu Gly Met Leu Gln Ser Leu Met Glu 305 310 315 320 Leu Pro Asp Gln Tyr Asn Tyr Gly Met Tyr Ala Lys Phe Ile Asn Asp 325 330 335 Tyr Gly Thr His Tyr Ile Thr Ser Gly Ser Met Gly Gly Ile Tyr Glu 340 345 350 Tyr Ile Leu Val Ile Asp Lys Ala Lys Met Glu Ser Leu Gly Ile Thr 355 360 365 Ser Arg Asp Ile Thr Thr Cys Phe Gly Gly Ser Leu Gly Ile Gln Tyr 370 375 380 Glu Asp Lys Ile Asn Val Gly Gly Gly Leu Ser Gly Asp His Cys Lys 385 390 395 400 Lys Phe Gly Gly Gly Lys Thr Glu Arg Ala Arg Lys Ala Met Ala Val 405 410 415 Glu Asp Ile Ile Ser Arg Val Arg Gly Gly Ser Ser Gly Trp Ser Gly 420 425 430 Gly Leu Ala Gln Asn Arg Ser Thr Ile Thr Tyr Arg Ser Trp Gly Arg 435 440 445 Ser Leu Lys Tyr Asn Pro Val Val Ile Asp Phe Glu Met Gln Pro Ile 450 455 460 His Glu Val Leu Arg His Thr Ser Leu Gly Pro Leu Glu Ala Lys Arg 465 470 475 480 Gln Asn Leu Arg Arg Ala Leu Asp Gln Tyr Leu Met Glu Phe Asn Ala 485 490 495 Cys Arg Cys Gly Pro Cys Phe Asn Asn Gly Val Pro Ile Leu Glu Gly 500 505 510 Thr Ser Cys Arg Cys Gln Cys Arg Leu Gly Ser Leu Gly Ala Ala Cys 515 520 525 Glu Gln Thr Gln Thr Glu Gly Ala Lys Ala Asp Gly Ser Trp Ser Cys 530 535 540 Trp Ser Ser Trp Ser Val Cys Arg Ala Gly Ile Gln Glu Arg Arg Arg 545 550 555 560 Glu Cys Asp Asn Pro Ala Pro Gln Asn Gly Gly Ala Ser Cys Pro Gly 565 570 575 Arg Lys Val Gln Thr Gln Ala Cys 580 <![CDATA[<210> 14]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 14]]> Met Ser Ala Leu Gly Ala Val Ile Ala Leu Leu Leu Trp Gly Gln Leu 1 5 10 15 Phe Ala Val Asp Ser Gly Asn Asp Val Thr Asp Ile Ala Asp Asp Gly 20 25 30 Cys Pro Lys Pro Pro Glu Ile Ala His Gly Tyr Val Glu His Ser Val 35 40 45 Arg Tyr Gln Cys Lys Asn Tyr Tyr Lys Leu Arg Thr Glu Gly Asp Gly 50 55 60 Val Tyr Thr Leu Asn Asp Lys Lys Gln Trp Ile Asn Lys Ala Val Gly 65 70 75 80 Asp Lys Leu Pro Glu Cys Glu Ala Asp Asp Gly Cys Pro Lys Pro Pro 85 90 95 Glu Ile Ala His Gly Tyr Val Glu His Ser Val Arg Tyr Gln Cys Lys 100 105 110 Asn Tyr Tyr Lys Leu Arg Thr Glu Gly Asp Gly Val Tyr Thr Leu Asn 115 120 125 Asn Glu Lys Gln Trp Ile Asn Lys Ala Val Gly Asp Lys Leu Pro Glu 130 135 140 Cys Glu Ala Val Cys Gly Lys Pro Lys Asn Pro Ala Asn Pro Val Gln 145 150 155 160 Arg Ile Leu Gly Gly His Leu Asp Ala Lys Gly Ser Phe Pro Trp Gln 165 170 175 Ala Lys Met Val Ser His His Asn Leu Thr Thr Gly Ala Thr Leu Ile 180 185 190 Asn Glu Gln Trp Leu Leu Thr Thr Ala Lys Asn Leu Phe Leu Asn His 195 200 205 Ser Glu Asn Ala Thr Ala Lys Asp Ile Ala Pro Thr Leu Thr Leu Tyr 210 215 220 Val Gly Lys Lys Gln Leu Val Glu Ile Glu Lys Val Val Leu His Pro 225 230 235 240 Asn Tyr Ser Gln Val Asp Ile Gly Leu Ile Lys Leu Lys Gln Lys Val 245 250 255 Ser Val Asn Glu Arg Val Met Pro Ile Cys Leu Pro Ser Lys Asp Tyr 260 265 270 Ala Glu Val Gly Arg Val Gly Tyr Val Ser Gly Trp Gly Arg Asn Ala 275 280 285 Asn Phe Lys Phe Thr Asp His Leu Lys Tyr Val Met Leu Pro Val Ala 290 295 300 Asp Gln Asp Gln Cys Ile Arg His Tyr Glu Gly Ser Thr Val Pro Glu 305 310 315 320 Lys Lys Thr Pro Lys Ser Pro Val Gly Val Gln Pro Ile Leu Asn Glu 325 330 335 His Thr Phe Cys Ala Gly Met Ser Lys Tyr Gln Glu Asp Thr Cys Tyr 340 345 350 Gly Asp Ala Gly Ser Ala Phe Ala Val His Asp Leu Glu Glu Asp Thr 355 360 365 Trp Tyr Ala Thr Gly Ile Leu Ser Phe Asp Lys Ser Cys Ala Val Ala 370 375 380 Glu Tyr Gly Val Tyr Val Lys Val Thr Ser Ile Gln Asp Trp Val Gln 385 390 395 400 Lys Thr Ile Ala Glu Asn 405 <![CDATA[<210> 15]]> <![CDATA[<211> 340]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 15]]> Ala Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Asp Ser Thr 1 5 10 15 Pro Gln Asp Gly Asn Val Val Val Ala Cys Leu Val Gln Gly Phe Phe 20 25 30 Pro Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Asn Val 35 40 45 Thr Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr 50 55 60 Thr Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Pro Asp Gly 65 70 75 80 Lys Ser Val Thr Cys His Val Lys His Tyr Thr Asn Ser Ser Gln Asp 85 90 95 Val Thr Val Pro Cys Arg Val Pro Pro Pro Pro Pro Cys Cys His Pro 100 105 110 Arg Leu Ser Leu His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser 115 120 125 Glu Ala Asn Leu Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly 130 135 140 Ala Thr Phe Thr Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly 145 150 155 160 Pro Pro Glu Arg Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu 165 170 175 Pro Gly Cys Ala Gln Pro Trp Asn His Gly Glu Thr Phe Thr Cys Thr 180 185 190 Ala Ala His Pro Glu Leu Lys Thr Pro Leu Thr Ala Asn Ile Thr Lys 195 200 205 Ser Gly Asn Thr Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser 210 215 220 Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg 225 230 235 240 Gly Phe Ser Pro Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln 245 250 255 Glu Leu Pro Arg Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro 260 265 270 Ser Gln Gly Thr Thr Thr Tyr Ala Val Thr Ser Ile Leu Arg Val Ala 275 280 285 Ala Glu Asp Trp Lys Lys Gly Glu Thr Phe Ser Cys Met Val Gly His 290 295 300 Glu Ala Leu Pro Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Met Ala 305 310 315 320 Gly Lys Pro Thr His Ile Asn Val Ser Val Val Met Ala Glu Ala Asp 325 330 335 Gly Thr Cys Tyr 340 <![CDATA[<210> 16]]> <![CDATA[<211> 330]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 16]]> Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys 1 5 10 15 Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr 65 70 75 80 Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys 100 105 110 Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro 115 120 125 Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys 130 135 140 Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp 145 150 155 160 Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu 165 170 175 Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu 180 185 190 His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn 195 200 205 Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly 210 215 220 Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu 225 230 235 240 Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr 245 250 255 Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn 260 265 270 Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe 275 280 285 Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn 290 295 300 Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr 305 310 315 320 Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys 325 330 <![CDATA[<210> 17]]> <![CDATA[<211> 326]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 17]]> Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg 1 5 10 15 Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr 20 25 30 Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser 35 40 45 Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser 50 55 60 Leu Ser Ser Val Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr 65 70 75 80 Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys 85 90 95 Thr Val Glu Arg Lys Cys Cys Val Glu Cys Pro Pro Cys Pro Ala Pro 100 105 110 Pro Val Ala Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp 115 120 125 Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp 130 135 140 Val Ser His Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly 145 150 155 160 Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn 165 170 175 Ser Thr Phe Arg Val Val Ser Val Leu Thr Val Val His Gln Asp Trp 180 185 190 Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro 195 200 205 Ala Pro Ile Glu Lys Thr Ile Ser Lys Thr Lys Gly Gln Pro Arg Glu 210 215 220 Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn 225 230 235 240 Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile 245 250 255 Ser Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr 260 265 270 Thr Pro Pro Met Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys 275 280 285 Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys 290 295 300 Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu 305 310 315 320 Ser Leu Ser Pro Gly Lys 325 <![CDATA[<210> 18]]> <![CDATA[<211> 453]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 18]]> Gly Ser Ala Ser Ala Pro Thr Leu Phe Pro Leu Val Ser Cys Glu Asn 1 5 10 15 Ser Pro Ser Asp Thr Ser Ser Val Ala Val Gly Cys Leu Ala Gln Asp 20 25 30 Phe Leu Pro Asp Ser Ile Thr Phe Ser Trp Lys Tyr Lys Asn Asn Ser 35 40 45 Asp Ile Ser Ser Thr Arg Gly Phe Pro Ser Val Leu Arg Gly Gly Lys 50 55 60 Tyr Ala Ala Thr Ser Gln Val Leu Leu Pro Ser Lys Asp Val Met Gln 65 70 75 80 Gly Thr Asp Glu His Val Val Cys Lys Val Gln His Pro Asn Gly Asn 85 90 95 Lys Glu Lys Asn Val Pro Leu Pro Val Ile Ala Glu Leu Pro Pro Lys 100 105 110 Val Ser Val Phe Val Pro Pro Arg Asp Gly Phe Phe Gly Asn Pro Arg 115 120 125 Lys Ser Lys Leu Ile Cys Gln Ala Thr Gly Phe Ser Pro Arg Gln Ile 130 135 140 Gln Val Ser Trp Leu Arg Glu Gly Lys Gln Val Gly Ser Gly Val Thr 145 150 155 160 Thr Asp Gln Val Gln Ala Glu Ala Lys Glu Ser Gly Pro Thr Thr Tyr 165 170 175 Lys Val Thr Ser Thr Leu Thr Ile Lys Glu Ser Asp Trp Leu Gly Gln 180 185 190 Ser Met Phe Thr Cys Arg Val Asp His Arg Gly Leu Thr Phe Gln Gln 195 200 205 Asn Ala Ser Ser Met Cys Val Pro Asp Gln Asp Thr Ala Ile Arg Val 210 215 220 Phe Ala Ile Pro Pro Ser Phe Ala Ser Ile Phe Leu Thr Lys Ser Thr 225 230 235 240 Lys Leu Thr Cys Leu Val Thr Asp Leu Thr Thr Tyr Asp Ser Val Thr 245 250 255 Ile Ser Trp Thr Arg Gln Asn Gly Glu Ala Val Lys Thr His Thr Asn 260 265 270 Ile Ser Glu Ser His Pro Asn Ala Thr Phe Ser Ala Val Gly Glu Ala 275 280 285 Ser Ile Cys Glu Asp Asp Trp Asn Ser Gly Glu Arg Phe Thr Cys Thr 290 295 300 Val Thr His Thr Asp Leu Pro Ser Pro Leu Lys Gln Thr Ile Ser Arg 305 310 315 320 Pro Lys Gly Val Ala Leu His Arg Pro Asp Val Tyr Leu Leu Pro Pro 325 330 335 Ala Arg Glu Gln Leu Asn Leu Arg Glu Ser Ala Thr Ile Thr Cys Leu 340 345 350 Val Thr Gly Phe Ser Pro Ala Asp Val Phe Val Gln Trp Met Gln Arg 355 360 365 Gly Gln Pro Leu Ser Pro Glu Lys Tyr Val Thr Ser Ala Pro Met Pro 370 375 380 Glu Pro Gln Ala Pro Gly Arg Tyr Phe Ala His Ser Ile Leu Thr Val 385 390 395 400 Ser Glu Glu Glu Trp Asn Thr Gly Glu Thr Tyr Thr Cys Val Val Ala 405 410 415 His Glu Ala Leu Pro Asn Arg Val Thr Glu Arg Thr Val Asp Lys Ser 420 425 430 Thr Gly Lys Pro Thr Leu Tyr Asn Val Ser Leu Val Met Ser Asp Thr 435 440 445 Ala Gly Thr Cys Tyr 450 <![CDATA[<210> 19]]> <![CDATA[<211> 638]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 19]]> Met Ile Leu Phe Lys Gln Ala Thr Tyr Phe Ile Ser Leu Phe Ala Thr 1 5 10 15 Val Ser Cys Gly Cys Leu Thr Gln Leu Tyr Glu Asn Ala Phe Phe Arg 20 25 30 Gly Gly Asp Val Ala Ser Met Tyr Thr Pro Asn Ala Gln Tyr Cys Gln 35 40 45 Met Arg Cys Thr Phe His Pro Arg Cys Leu Leu Phe Ser Phe Leu Pro 50 55 60 Ala Ser Ser Ile Asn Asp Met Glu Lys Arg Phe Gly Cys Phe Leu Lys 65 70 75 80 Asp Ser Val Thr Gly Thr Leu Pro Lys Val His Arg Thr Gly Ala Val 85 90 95 Ser Gly His Ser Leu Lys Gln Cys Gly His Gln Ile Ser Ala Cys His 100 105 110 Arg Asp Ile Tyr Lys Gly Val Asp Met Arg Gly Val Asn Phe Asn Val 115 120 125 Ser Lys Val Ser Ser Val Glu Glu Cys Gln Lys Arg Cys Thr Asn Asn 130 135 140 Ile Arg Cys Gln Phe Phe Ser Tyr Ala Thr Gln Thr Phe His Lys Ala 145 150 155 160 Glu Tyr Arg Asn Asn Cys Leu Leu Lys Tyr Ser Pro Gly Gly Thr Pro 165 170 175 Thr Ala Ile Lys Val Leu Ser Asn Val Glu Ser Gly Phe Ser Leu Lys 180 185 190 Pro Cys Ala Leu Ser Glu Ile Gly Cys His Met Asn Ile Phe Gln His 195 200 205 Leu Ala Phe Ser Asp Val Asp Val Ala Arg Val Leu Thr Pro Asp Ala 210 215 220 Phe Val Cys Arg Thr Ile Cys Thr Tyr His Pro Asn Cys Leu Phe Phe 225 230 235 240 Thr Phe Tyr Thr Asn Val Trp Lys Ile Glu Ser Gln Arg Asn Val Cys 245 250 255 Leu Leu Lys Thr Ser Glu Ser Gly Thr Pro Ser Ser Ser Thr Pro Gln 260 265 270 Glu Asn Thr Ile Ser Gly Tyr Ser Leu Leu Thr Cys Lys Arg Thr Leu 275 280 285 Pro Glu Pro Cys His Ser Lys Ile Tyr Pro Gly Val Asp Phe Gly Gly 290 295 300 Glu Glu Leu Asn Val Thr Phe Val Lys Gly Val Asn Val Cys Gln Glu 305 310 315 320 Thr Cys Thr Lys Met Ile Arg Cys Gln Phe Phe Thr Tyr Ser Leu Leu 325 330 335 Pro Glu Asp Cys Lys Glu Glu Lys Cys Lys Cys Phe Leu Arg Leu Ser 340 345 350 Met Asp Gly Ser Pro Thr Arg Ile Ala Tyr Gly Thr Gln Gly Ser Ser 355 360 365 Gly Tyr Ser Leu Arg Leu Cys Asn Thr Gly Asp Asn Ser Val Cys Thr 370 375 380 Thr Lys Thr Ser Thr Arg Ile Val Gly Gly Thr Asn Ser Ser Trp Gly 385 390 395 400 Glu Trp Pro Trp Gln Val Ser Leu Gln Val Lys Leu Thr Ala Gln Arg 405 410 415 His Leu Cys Gly Gly Ser Leu Ile Gly His Gln Trp Val Leu Thr Ala 420 425 430 Ala His Cys Phe Asp Gly Leu Pro Leu Gln Asp Val Trp Arg Ile Tyr 435 440 445 Ser Gly Ile Leu Asn Leu Ser Asp Ile Thr Lys Asp Thr Pro Phe Ser 450 455 460 Gln Ile Lys Glu Ile Ile Ile His Gln Asn Tyr Lys Val Ser Glu Gly 465 470 475 480 Asn His Asp Ile Ala Leu Ile Lys Leu Gln Ala Pro Leu Asn Tyr Thr 485 490 495 Glu Phe Gln Lys Pro Ile Cys Leu Pro Ser Lys Gly Asp Thr Ser Thr 500 505 510 Ile Tyr Thr Asn Cys Trp Val Thr Gly Trp Gly Phe Ser Lys Glu Lys 515 520 525 Gly Glu Ile Gln Asn Ile Leu Gln Lys Val Asn Ile Pro Leu Val Thr 530 535 540 Asn Glu Glu Cys Gln Lys Arg Tyr Gln Asp Tyr Lys Ile Thr Gln Arg 545 550 555 560 Met Val Cys Ala Gly Tyr Lys Glu Gly Gly Lys Asp Ala Cys Lys Gly 565 570 575 Asp Ser Gly Gly Pro Leu Val Cys Lys His Asn Gly Met Trp Arg Leu 580 585 590 Val Gly Ile Thr Ser Trp Gly Glu Gly Cys Ala Arg Arg Glu Gln Pro 595 600 605 Gly Val Tyr Thr Lys Val Ala Glu Tyr Met Asp Trp Ile Leu Glu Lys 610 615 620 Thr Gln Ser Ser Asp Gly Lys Ala Gln Met Gln Ser Pro Ala 625 630 635 <![CDATA[<210> 20]]> <![CDATA[<211> 698]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 20]]> Met Arg Leu Ala Val Gly Ala Leu Leu Val Cys Ala Val Leu Gly Leu 1 5 10 15 Cys Leu Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu 20 25 30 His Glu Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val 35 40 45 Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr 50 55 60 Leu Asp Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr 65 70 75 80 Leu Asp Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu 85 90 95 Lys Pro Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr 100 105 110 Phe Tyr Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met 115 120 125 Asn Gln Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser 130 135 140 Ala Gly Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu 145 150 155 160 Pro Arg Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser 165 170 175 Cys Ala Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu 180 185 190 Cys Pro Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser 195 200 205 Gly Ala Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val 210 215 220 Lys His Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp 225 230 235 240 Gln Tyr Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu 245 250 255 Tyr Lys Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala 260 265 270 Arg Ser Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln 275 280 285 Ala Gln Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe 290 295 300 Ser Ser Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly 305 310 315 320 Phe Leu Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr 325 330 335 Glu Tyr Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu 340 345 350 Ala Pro Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His 355 360 365 His Glu Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys 370 375 380 Ile Glu Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile 385 390 395 400 Met Asn Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr 405 410 415 Ile Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn 420 425 430 Lys Ser Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Ile 435 440 445 Ala Val Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys 450 455 460 Gly Lys Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn 465 470 475 480 Ile Pro Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp 485 490 495 Glu Phe Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser 500 505 510 Leu Cys Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn 515 520 525 Asn Lys Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val 530 535 540 Glu Lys Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn 545 550 555 560 Thr Gly Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys 565 570 575 Asp Tyr Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu 580 585 590 Tyr Ala Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr 595 600 605 Arg Lys Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln 610 615 620 His Leu Phe Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu 625 630 635 640 Phe Arg Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys 645 650 655 Leu Ala Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu 660 665 670 Glu Tyr Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser 675 680 685 Leu Leu Glu Ala Cys Thr Phe Arg Arg Pro 690 695 <![CDATA[<210> 21]]> <![CDATA[<211> 478]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 21]]> Met Ala Pro Leu Arg Pro Leu Leu Ile Leu Ala Leu Leu Ala Trp Val 1 5 10 15 Ala Leu Ala Asp Gln Glu Ser Cys Lys Gly Arg Cys Thr Glu Gly Phe 20 25 30 Asn Val Asp Lys Lys Cys Gln Cys Asp Glu Leu Cys Ser Tyr Tyr Gln 35 40 45 Ser Cys Cys Thr Asp Tyr Thr Ala Glu Cys Lys Pro Gln Val Thr Arg 50 55 60 Gly Asp Val Phe Thr Met Pro Glu Asp Glu Tyr Thr Val Tyr Asp Asp 65 70 75 80 Gly Glu Glu Lys Asn Asn Ala Thr Val His Glu Gln Val Gly Gly Pro 85 90 95 Ser Leu Thr Ser Asp Leu Gln Ala Gln Ser Lys Gly Asn Pro Glu Gln 100 105 110 Thr Pro Val Leu Lys Pro Glu Glu Glu Ala Pro Ala Pro Glu Val Gly 115 120 125 Ala Ser Lys Pro Glu Gly Ile Asp Ser Arg Pro Glu Thr Leu His Pro 130 135 140 Gly Arg Pro Gln Pro Pro Ala Glu Glu Glu Leu Cys Ser Gly Lys Pro 145 150 155 160 Phe Asp Ala Phe Thr Asp Leu Lys Asn Gly Ser Leu Phe Ala Phe Arg 165 170 175 Gly Gln Tyr Cys Tyr Glu Leu Asp Glu Lys Ala Val Arg Pro Gly Tyr 180 185 190 Pro Lys Leu Ile Arg Asp Val Trp Gly Ile Glu Gly Pro Ile Asp Ala 195 200 205 Ala Phe Thr Arg Ile Asn Cys Gln Gly Lys Thr Tyr Leu Phe Lys Gly 210 215 220 Ser Gln Tyr Trp Arg Phe Glu Asp Gly Val Leu Asp Pro Asp Tyr Pro 225 230 235 240 Arg Asn Ile Ser Asp Gly Phe Asp Gly Ile Pro Asp Asn Val Asp Ala 245 250 255 Ala Leu Ala Leu Pro Ala His Ser Tyr Ser Gly Arg Glu Arg Val Tyr 260 265 270 Phe Phe Lys Gly Lys Gln Tyr Trp Glu Tyr Gln Phe Gln His Gln Pro 275 280 285 Ser Gln Glu Glu Cys Glu Gly Ser Ser Leu Ser Ala Val Phe Glu His 290 295 300 Phe Ala Met Met Gln Arg Asp Ser Trp Glu Asp Ile Phe Glu Leu Leu 305 310 315 320 Phe Trp Gly Arg Thr Ser Ala Gly Thr Arg Gln Pro Gln Phe Ile Ser 325 330 335 Arg Asp Trp His Gly Val Pro Gly Gln Val Asp Ala Ala Met Ala Gly 340 345 350 Arg Ile Tyr Ile Ser Gly Met Ala Pro Arg Pro Ser Leu Ala Lys Lys 355 360 365 Gln Arg Phe Arg His Arg Asn Arg Lys Gly Tyr Arg Ser Gln Arg Gly 370 375 380 His Ser Arg Gly Arg Asn Gln Asn Ser Arg Arg Pro Ser Arg Ala Thr 385 390 395 400 Trp Leu Ser Leu Phe Ser Ser Glu Glu Ser Asn Leu Gly Ala Asn Asn 405 410 415 Tyr Asp Asp Tyr Arg Met Asp Trp Leu Val Pro Ala Thr Cys Glu Pro 420 425 430 Ile Gln Ser Val Phe Phe Phe Ser Gly Asp Lys Tyr Tyr Arg Val Asn 435 440 445 Leu Arg Thr Arg Arg Val Asp Thr Val Asp Pro Pro Tyr Pro Arg Ser 450 455 460 Ile Ala Gln Tyr Trp Leu Gly Cys Pro Ala Pro Gly His Leu 465 470 475 <![CDATA[<210> 22]]> <![CDATA[<211> 298]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 22]]> Met Val Arg Met Val Pro Val Leu Leu Ser Leu Leu Leu Leu Leu Gly 1 5 10 15 Pro Ala Val Pro Gln Glu Asn Gln Asp Gly Arg Tyr Ser Leu Thr Tyr 20 25 30 Ile Tyr Thr Gly Leu Ser Lys His Val Glu Asp Val Pro Ala Phe Gln 35 40 45 Ala Leu Gly Ser Leu Asn Asp Leu Gln Phe Phe Arg Tyr Asn Ser Lys 50 55 60 Asp Arg Lys Ser Gln Pro Met Gly Leu Trp Arg Gln Val Glu Gly Met 65 70 75 80 Glu Asp Trp Lys Gln Asp Ser Gln Leu Gln Lys Ala Arg Glu Asp Ile 85 90 95 Phe Met Glu Thr Leu Lys Asp Ile Val Glu Tyr Tyr Asn Asp Ser Asn 100 105 110 Gly Ser His Val Leu Gln Gly Arg Phe Gly Cys Glu Ile Glu Asn Asn 115 120 125 Arg Ser Ser Gly Ala Phe Trp Lys Tyr Tyr Tyr Asp Gly Lys Asp Tyr 130 135 140 Ile Glu Phe Asn Lys Glu Ile Pro Ala Trp Val Pro Phe Asp Pro Ala 145 150 155 160 Ala Gln Ile Thr Lys Gln Lys Trp Glu Ala Glu Pro Val Tyr Val Gln 165 170 175 Arg Ala Lys Ala Tyr Leu Glu Glu Glu Cys Pro Ala Thr Leu Arg Lys 180 185 190 Tyr Leu Lys Tyr Ser Lys Asn Ile Leu Asp Arg Gln Asp Pro Pro Ser 195 200 205 Val Val Val Thr Ser His Gln Ala Pro Gly Glu Lys Lys Lys Leu Lys 210 215 220 Cys Leu Ala Tyr Asp Phe Tyr Pro Gly Lys Ile Asp Val His Trp Thr 225 230 235 240 Arg Ala Gly Glu Val Gln Glu Pro Glu Leu Arg Gly Asp Val Leu His 245 250 255 Asn Gly Asn Gly Thr Tyr Gln Ser Trp Val Val Val Ala Val Pro Pro 260 265 270 Gln Asp Thr Ala Pro Tyr Ser Cys His Val Gln His Ser Ser Leu Ala 275 280 285 Gln Pro Leu Val Val Pro Trp Glu Ala Ser 290 295 <![CDATA[<210> 23]]> <![CDATA[<211> 16]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 23]]> Tyr Leu Gly Asn Ala Thr Ala Ile Phe Phe Leu Pro Asp Glu Gly Lys 1 5 10 15 <![CDATA[<210> 24]]> <![CDATA[<211> 33]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 24]]> Glu Gly Asp His Glu Phe Leu Glu Val Pro Glu Ala Gln Glu Asp Val 1 5 10 15 Glu Ala Thr Phe Pro Val His Gln Pro Gly Asn Tyr Ser Cys Ser Tyr 20 25 30 Arg <![CDATA[<210> 25]]> <![CDATA[<211> 11]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 25]]> Ala Ile Gly Tyr Leu Asn Thr Gly Tyr Gln Arg 1 5 10 <![CDATA[<210> 26]]> <![CDATA[<211> 14]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 26]]> Thr Glu His Pro Phe Thr Val Glu Glu Phe Val Leu Pro Lys 1 5 10 <![CDATA[<210> 27]]> <![CDATA[<211> 19]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 27]]> Val Ser Asn Gln Thr Leu Ser Leu Phe Phe Thr Val Leu Gln Asp Val 1 5 10 15 Pro Val Arg <![CDATA[<210> 28]]> <![CDATA[<211> 33]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 28]]> Ile Ile Thr Ile Leu Glu Glu Glu Met Asn Val Ser Val Cys Gly Leu 1 5 10 15 Tyr Thr Tyr Gly Lys Pro Val Pro Gly His Val Thr Val Ser Ile Cys 20 25 30 Arg <![CDATA[<210> 29]]> <![CDATA[<211> 22]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 29]]> Gly Cys Val Leu Leu Ser Tyr Leu Asn Glu Thr Val Thr Val Ser Ala 1 5 10 15 Ser Leu Glu Ser Val Arg 20 <![CDATA[<210> 30]]> <![CDATA[<211> 32]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 30]]> Ser Leu Gly Asn Val Asn Phe Thr Val Ser Ala Glu Ala Leu Glu Ser 1 5 10 15 Gln Glu Leu Cys Gly Thr Glu Val Pro Ser Val Pro Glu His Gly Arg 20 25 30 <![CDATA[<210> 31]]> <![CDATA[<211> 56]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 31]]> Ala Ser Val Ser Val Leu Gly Asp Ile Leu Gly Ser Ala Met Gln Asn 1 5 10 15 Thr Gln Asn Leu Leu Gln Met Pro Tyr Gly Cys Gly Glu Gln Asn Met 20 25 30 Val Leu Phe Ala Pro Asn Ile Tyr Val Leu Asp Tyr Leu Asn Glu Thr 35 40 45 Gln Gln Leu Thr Pro Glu Ile Lys 50 55 <![CDATA[<210> 32]]> <![CDATA[<211> 20]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 32]]> Phe Asn Leu Thr Glu Thr Ser Glu Ala Glu Ile His Gln Ser Phe Gln 1 5 10 15 His Leu Leu Arg 20 <![CDATA[<210> 33]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 33]]> Asp Ile Glu Asn Phe Asn Ser Thr Gln Lys 1 5 10 <![CDATA[<210> 34]]> <![CDATA[<211> 24]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 34]]> Gln Ile Pro Leu Cys Ala Asn Leu Val Pro Val Pro Ile Thr Asn Ala 1 5 10 15 Thr Leu Asp Gln Ile Thr Gly Lys 20 <![CDATA[<210> 35]]> <![CDATA[<211> 15]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 35]]> Gln Asp Gln Cys Ile Tyr Asn Thr Thr Tyr Leu Asn Val Gln Arg 1 5 10 15 <![CDATA[<210> 36]]> <![CDATA[<211> 19]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 36]]> Phe Ser Glu Phe Trp Asp Leu Asp Pro Glu Val Arg Pro Thr Ser Ala 1 5 10 15 Val Ala Ala <![CDATA[<210> 37]]> <![CDATA[<211> 23]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 37]]> Thr Glu Leu Phe Ser Ser Ser Cys Pro Gly Gly Ile Met Leu Asn Glu 1 5 10 15 Thr Gly Gln Gly Tyr Gln Arg 20 <![CDATA[<210> 38]]> <![CDATA[<211> 10]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 38]]> Asn Gly Thr Ala Val Cys Ala Thr Asn Arg 1 5 10 <![CDATA[<210> 39]]> <![CDATA[<211> 14]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 39]]> Leu Ala Asn Leu Thr Gln Gly Glu Asp Gln Tyr Tyr Leu Arg 1 5 10 <![CDATA[<210> 40]]> <![CDATA[<211> 11]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 40]]> Gly Leu Asn Val Thr Leu Ser Ser Thr Gly Arg 1 5 10 <![CDATA[<210> 41]]> <![CDATA[<211> 7]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 41]]> Val Leu Asn Phe Thr Thr Lys 1 5 <![CDATA[<210> 42]]> <![CDATA[<211> 14]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 42]]> Gly Gly Ser Ser Gly Trp Ser Gly Gly Leu Ala Gln Asn Arg 1 5 10 <![CDATA[<210> 43]]> <![CDATA[<211> 13]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 43]]> Asn Leu Phe Leu Asn His Ser Glu Asn Ala Thr Ala Lys 1 5 10 <![CDATA[<210> 44]]> <![CDATA[<211> 16]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 44]]> Val Val Leu His Pro Asn Tyr Ser Gln Val Asp Ile Gly Leu Ile Lys 1 5 10 15 <![CDATA[<210> 45]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 45]]> Thr Pro Leu Thr Ala Asn Ile Thr Lys 1 5 <![CDATA[<210> 46]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 46]]> Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 1 5 <![CDATA[<210> 47]]> <![CDATA[<211> 9]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 47]]> Glu Glu Gln Phe Asn Ser Thr Phe Arg 1 5 <![CDATA[<210> 48]]> <![CDATA[<211> 21]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 48]]> Gly Leu Thr Phe Gln Gln Asn Ala Ser Ser Met Cys Val Pro Asp Gln 1 5 10 15 Asp Thr Ala Ile Arg 20 <![CDATA[<210> 49]]> <![CDATA[<211> 19]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 49]]> Leu Gln Ala Pro Leu Asn Tyr Thr Glu Phe Gln Lys Pro Ile Cys Leu 1 5 10 15 Pro Ser Lys <![CDATA[<210> 50]]> <![CDATA[<211> 13]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 50]]> Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys 1 5 10 <![CDATA[<210> 51]]> <![CDATA[<211> 8]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 51]]> Asn Gly Ser Leu Phe Ala Phe Arg 1 5 <![CDATA[<210> 52]]> <![CDATA[<211> 18]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 智人]]> <![CDATA[<400> 52]]> Asp Ile Val Glu Tyr Tyr Asn Asp Ser Asn Gly Ser His Val Leu Gln 1 5 10 15 Gly Arg <![CDATA[<210> 53]]> <![CDATA[<211> 7]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列的說明:]]> 合成肽 <![CDATA[<400> 53]]> Glu Cys Asp Met His Tyr Lys 1 5 <![CDATA[<210> 54]]> <![CDATA[<211> 7]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列的說明:]]> 合成肽 <![CDATA[<220>]]> <![CDATA[<221> MOD_RES]]> <![CDATA[<222> (2)..(2)]]> <![CDATA[<223> 烷基化-Cys]]> <![CDATA[<400> 54]]> Glu Cys Asp Met His Tyr Lys 1 5
500:過程
502:接收對應於自受試者所獲得的生物學樣品中的一組醣蛋白之肽結構數據
504:將自一組肽結構之肽結構數據所識別之量化數據輸入機器學習模式中
506:使用機器學習模式分析量化數據以得出疾病指標
508:基於疾病指標得出診斷輸出,該疾病指標分類作為驗證與FLD進展相關聯的多種狀態之對應狀態的生物學樣品
Claims (20)
- 一種分類有關與脂肪肝疾病(FLD)進展相關聯的多種狀態的生物學樣品之方法,該方法包含: 接收對應於自受試者所獲得的該生物學樣品中的一組醣蛋白之肽結構數據; 將自一組肽結構之該肽結構數據所識別之量化數據輸入機器學習模式(machine learning model)中,其中該組肽結構包括自表1中的多個肽結構所識別之至少一個肽結構; 使用該機器學習模式分析該量化數據以得出疾病指標;且 基於該疾病指標得出診斷輸出,該疾病指標分類作為驗證與該FLD進展相關聯的該多種狀態之對應狀態的生物學樣品。
- 如請求項1之方法,其中該疾病指標包含評分且其中得出該診斷輸出包含: 確定該評分落在與該多種狀態之該對應狀態相關聯的選定範圍內;且 確定該生物學樣品係回應於確定評分落在該與對應狀態相關聯的選定範圍內而驗證該對應狀態。
- 如請求項1之方法,其中該多種狀態包括非酒精性脂肪肝炎(NASH)狀態和肝細胞癌(HCC)狀態。
- 如請求項1之方法,其中該多種狀態包括非NASH/HCC狀態,該非NASH/HCC狀態包含健康狀態、無肝疾病狀態或良性肝腫塊狀態中至少一者。
- 如請求項1之方法,其中該至少一個肽結構包含以肽序列定義之醣肽結構及在該肽序列之連結位點上連結至該肽序列之聚醣結構,如表1中所識別,以該肽序列為如表1中所定義之SEQ ID NOS:23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52中之一者。
- 如請求項1之方法,其中該組肽結構之肽結構的該量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
- 如請求項1之方法,其中該肽結構數據係使用多反應監測質譜法(MRM-MS)得出。
- 一種訓練模式以診斷具有與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者的受試者之方法,該方法包含: 接收被診斷具有與該FLD進展相關的該多種狀態之多位受試者的肽結構組之量化數據,其中該量化數據包含該多位受試者的多個肽結構輪廓且識別該多個肽結構輪廓之各肽結構輪廓的該多種狀態之對應狀態;且 使用該量化數據訓練機器學習模式以確定來自該受試者的生物學樣品對應於該多種狀態中的哪一狀態。
- 如請求項8之方法,其中訓練該機器學習模式包含: 使用對應於該肽結構組之子集的一組肽結構之量化數據的一部分訓練該機器學習模式,以確定來自該受試者的該生物學樣品對應於該多種狀態中的哪一狀態。
- 如請求項9之方法,其進一步包含: 使用該多位受試者的該量化數據執行差異性表現分析(differential expression analysis)。
- 如請求項10之方法,其進一步包含: 基於經計算作為該差異性表現分析的一部分之倍數變化、偽發現率或p值中至少一者識別作為相關於確定來自該受試者的生物學樣品對應於該多種狀態中的哪一狀態的該肽結構組之該子集的該組肽結構。
- 如請求項8之方法,其中該多種狀態進一步包括非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態或健康狀態中至少一者。
- 一種檢測存在於生物學樣品中與脂肪肝疾病(FLD)進展相關聯的多種狀態中之一者之方法,該方法包含: 接收對應於自受試者所獲得的該生物學樣品中的一組醣蛋白之肽結構數據; 使用監督式機器學習模式分析該肽結構數據,以基於選自表1中所識別之肽結構群組的至少3個肽結構得出疾病指標;且 以回應於確定該疾病指標落在與該對應狀態相關聯的選定範圍內來檢測與該FLD進展相關聯的該多種狀態之對應狀態的存在。
- 如請求項13之方法,其中該至少3個肽結構之肽結構包含以肽序列定義之醣肽結構及在該肽序列之連結位點上連結至該肽序列之聚醣結構,如表1中所識別,以該肽序列為如表1中所定義之SEQ ID NOS:23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52或52中之一者。
- 如請求項13之方法,其中該監督式機器學習模式包含邏輯迴歸模式(logistic regression model)。
- 如請求項13之方法,其中該監督式機器學習模式包含懲罰式多變量邏輯迴歸模式。
- 如請求項13之方法,其中該肽結構數據包含量化數據,該肽結構群組之肽結構的該量化數據包含豐度、相對豐度、標準化豐度、相對量、調整量、標準化量、相對濃度、調整濃度或標準化濃度中至少一者。
- 如請求項13之方法,其中該疾病指標為機率評分。
- 如請求項13之方法,其進一步包含: 得出包括基於對該受試者所檢測的該對應狀態之診斷的報告。
- 如請求項13之方法,其中該多種狀態包括至少兩種選自由非酒精性脂肪肝炎(NASH)狀態、肝細胞癌(HCC)狀態和非NASH/HCC狀態所組成之群組的狀態。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063118486P | 2020-11-25 | 2020-11-25 | |
US63/118,486 | 2020-11-25 | ||
US202163251021P | 2021-09-30 | 2021-09-30 | |
US63/251,021 | 2021-09-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202321695A true TW202321695A (zh) | 2023-06-01 |
Family
ID=81756272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110143754A TW202321695A (zh) | 2020-11-25 | 2021-11-24 | 用於診斷非酒精性脂肪肝炎(nash)或肝細胞癌(hcc)的生物標記 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11774459B2 (zh) |
EP (1) | EP4252007A2 (zh) |
JP (1) | JP2023554166A (zh) |
CA (1) | CA3198807A1 (zh) |
TW (1) | TW202321695A (zh) |
WO (1) | WO2022115574A2 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070099251A1 (en) * | 2005-10-17 | 2007-05-03 | Institute For Systems Biology | Tissue-and serum-derived glycoproteins and methods of their use |
JP5322556B2 (ja) | 2008-09-19 | 2013-10-23 | 株式会社Mcbi | 新規非アルコール性脂肪性肝疾患バイオマーカーおよび該バイオマーカーを用いた非アルコール性脂肪性肝疾患の検出方法 |
CN111148844A (zh) | 2017-09-01 | 2020-05-12 | 韦恩生物科技股份公司 | 鉴定和使用糖肽作为诊断和治疗监测的生物标记物 |
US20200240996A1 (en) | 2017-10-18 | 2020-07-30 | Venn Biosciences Corporation | Identification and use of biological parameters for diagnosis and treatment monitoring |
CN111123238A (zh) | 2018-10-31 | 2020-05-08 | 三赢科技(深圳)有限公司 | 镜头模组及应用其的电子设备 |
-
2021
- 2021-11-24 TW TW110143754A patent/TW202321695A/zh unknown
- 2021-11-24 WO PCT/US2021/060776 patent/WO2022115574A2/en active Application Filing
- 2021-11-24 JP JP2023555119A patent/JP2023554166A/ja active Pending
- 2021-11-24 US US17/535,018 patent/US11774459B2/en active Active
- 2021-11-24 EP EP21899100.8A patent/EP4252007A2/en active Pending
- 2021-11-24 CA CA3198807A patent/CA3198807A1/en active Pending
-
2023
- 2023-08-23 US US18/454,159 patent/US20240118290A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022115574A3 (en) | 2022-08-18 |
JP2023554166A (ja) | 2023-12-26 |
US20240118290A1 (en) | 2024-04-11 |
US20220187317A1 (en) | 2022-06-16 |
WO2022115574A2 (en) | 2022-06-02 |
CA3198807A1 (en) | 2022-06-02 |
US11774459B2 (en) | 2023-10-03 |
EP4252007A2 (en) | 2023-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220310230A1 (en) | Biomarkers for determining an immuno-onocology response | |
TW202321695A (zh) | 用於診斷非酒精性脂肪肝炎(nash)或肝細胞癌(hcc)的生物標記 | |
US20230112866A1 (en) | Biomarkers for clear cell renal cell carcinoma | |
CN116456895A (zh) | 用于诊断非酒精性脂肪性肝炎(nash)或肝细胞癌(hcc)的生物标志物 | |
US20230055572A1 (en) | Biomarkers for diagnosing ovarian cancer | |
US20230104536A1 (en) | Systems and methods for glycopeptide concentration determination, normalized abundance determination, and lc/ms run sample preparation | |
JP2023514809A (ja) | 卵巣癌を診断するためのバイオマーカー | |
WO2023075591A1 (en) | Ai-driven glycoproteomics liquid biopsy in nasopharyngeal carcinoma | |
TW202314729A (zh) | 用於診斷及治療covid之胜肽結構的檢測 | |
TW202322148A (zh) | 用於診斷及治療敗血症之胜肽結構的檢測 | |
AU2022399828A1 (en) | Diagnosis of pancreatic cancer using targeted quantification of site-specific protein glycosylation | |
WO2023089597A2 (en) | Predicting sarcoma treatment response using targeted quantification of site-specific protein glycosylation | |
WO2023019093A2 (en) | Detection of peptide structures for diagnosing and treating sepsis and covid | |
CA3239488A1 (en) | Diagnosis of pancreatic cancer using targeted quantification of site-specific protein glycosylation | |
WO2024059750A2 (en) | Diagnosis of ovarian cancer using targeted quantification of site-specific protein glycosylation | |
WO2023154943A1 (en) | De novo glycopeptide sequencing | |
JP2024522064A (ja) | 卵巣癌を診断するためのバイオマーカー | |
JP7493815B2 (ja) | 卵巣癌を診断するためのバイオマーカー | |
CN117561449A (zh) | 用于测定免疫肿瘤学反应的生物标志物 | |
WO2023154967A2 (en) | Diagnosis of colorectal cancer using targeted quantification of site-specific protein glycosylation | |
WO2023147601A2 (en) | Biomarkers for diagnosing preeclampsia | |
WO2023193016A2 (en) | Biomarkers for determining a cancer disease state, response to immuno-oncology, stages of fibrosis in non-alcoholic steatohepatitis, or application of age or sex related biomarker panel for quality control | |
Bauer et al. | Predicting SUMOylation sites |