JP2020533688A - Hla組織照合およびそのための方法 - Google Patents

Hla組織照合およびそのための方法 Download PDF

Info

Publication number
JP2020533688A
JP2020533688A JP2020513829A JP2020513829A JP2020533688A JP 2020533688 A JP2020533688 A JP 2020533688A JP 2020513829 A JP2020513829 A JP 2020513829A JP 2020513829 A JP2020513829 A JP 2020513829A JP 2020533688 A JP2020533688 A JP 2020533688A
Authority
JP
Japan
Prior art keywords
hla
type
allele
donor
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020513829A
Other languages
English (en)
Inventor
スーン−シオン,パトリック
Original Assignee
ナント ホールディングス アイピー,エルエルシー
ナント ホールディングス アイピー,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナント ホールディングス アイピー,エルエルシー, ナント ホールディングス アイピー,エルエルシー filed Critical ナント ホールディングス アイピー,エルエルシー
Publication of JP2020533688A publication Critical patent/JP2020533688A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Genetics & Genomics (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Materials For Medical Uses (AREA)

Abstract

企図される系および方法は、移植および特に幹細胞および実質臓器移植片に適切な移植照合データベースを確立するために高精度イン・シリコHLA分析を使用する。

Description

本願は、2017年9月6日出願の米国特許仮出願第62/554,655号に対する優先権を主張する。
本発明の分野は、特にイン・シリコHLA判定に関連するので、移植前の組織照合のためのシステムおよび方法である。
次の記載は、本発明を理解する際に有用であり得る情報を含む。これは、本明細書中で提供される何れの情報も、今回請求される発明に対する先行技術であるかまたはそれに関連すること、または具体的もしくは明確に言及される何れかの刊行物が先行技術であることを認めるものではない。
HLAタイピングは、現在も様々な実質臓器および幹細胞の移植の実施において重大な意味を持っており、患者のHLA型を判定するために当技術分野で公知である様々なシステムおよび方法がある。最も一般的には、HLAタイピングは、湿式化学/血清学的方法を使用して、または核酸分析および特にシーケンシングもしくはPCRに基づく方法を介して行われる。このような方法は、多くの場合、満足できるものであり、比較的正確な結果を提供する。しかし、最も一般的な方法は、特に大集団を分析しようとする場合、多大な時間を要し、比較的高価であることが多い。
従来方法と関連する欠点の少なくとも一部に対処するために、一般的には米国特許出願公開第2011/0117553号に記載のような未処理血液試料を使用して、ネステッド/タンデムPCRを使用し得る。米国特許出願公開第2003/0165884号で教示されるようなハイスループット判定に適切な、さらに他の方法において、増幅と遺伝子座特異的な捕捉プローブの組み合わせが使用される。同様に、米国特許第7917297号は、迅速分析を可能にするための、固相上での別個の捕捉ヌクレオチドの様々なアレイを記載する。残念ながら、HLAアレル間のハイブリッド形成の差異は非常に小さいことが多いので、このようなシステムでは一般的には高精度HLA判定が可能とはならない。本明細書中で特定される刊行物および特許明細書は全て、それぞれ個々の刊行物または特許明細書が参照により組み込まれることを具体的かつ個別に示されるかのように、同程度まで参照により組み込まれる。組み込まれる参考文献中の用語の定義または使用が本明細書中で提供されるその用語の定義と一致しないかまたは矛盾する場合、本明細書中で提供されるその用語の定義が適用され、参考文献中のその用語の定義は適用されない。
より最近、例えば米国特許出願公開第2016/0125128号で論じられるように、HLA型の判定のためのエクソームシーケンシングデータを使用するコンピュータにより実行される方法が記載された。また他の例において、De Bruijnグラフを使用したコンピュータ分析を記載する米国特許出願第2015/0110754号および国際公開第2017/035392号で教示されるように、最も可能性が高いHLA型を判定するために配列データ上の確率的な分析が使用される。特に、これらの方法は比較的速いが、より大きな試料集団にわたって使用されたことはない。
したがって、当技術分野で公知のHLAタイピングに対する様々なシステムおよび方法があるにもかかわらず、HLAタイピングおよび特にイン・シリコHLAタイピングのための改善されたシステムおよび実行を提供することが依然として求められている。
本発明の主題は、ドナー/レシピエントマッチの同定に役立つバイオインフォマティクスデータベースを提供するために、大きな試料集団にわたりHLA分析が行われる装置、システムおよび方法を提供する。例えば、骨髄幹細胞移植片が液性腫瘍に対して必要とされる場合、全ての骨髄および臍帯血ドナーの完全かつ詳細なHLA分析が最初に確立される。次に、この独特なデータベースは、骨髄または臍帯血提供を必要とするあらゆるレシピエントに対するバイオインフォマティクスユニバーサルエンジンとなり得る。別の例において、実質臓器移植に対して、HLA型を判定するために、移植待機中の全レシピエントの完全な事前の配列分析が行われる。ドナー臓器が入手可能になったら、このデータベースは、少数および希少アレルを含め、最も粒度の細かいHLAレベルでユニバーサル照合エンジンになり得る。したがって、本明細書中で提示されるシステムおよび方法は、ドナーおよび/またはレシピエントの大集団にわたり高精度かつ包括的レベルでドナーおよびレシピエントの迅速照合を提供する。
本発明の主題の一態様において、発明者は、各試料が臍帯血または骨髄試料である複数のドナー試料に対してオミクスデータを得る段階およびドナー登録簿を得るためにイン・シリコアルゴリズムを使用してドナー試料のそれぞれに対してHLA型を判定するさらなる段階を含む、ドナー組織をレシピエント組織と照合する方法を企図する。また別の段階において、ドナー登録簿を使用して、ドナー試料(例えば臍帯血)の1つを、マッチングHLA型保有レシピエントと適合するものとして同定する。
同様に、本発明の主題の別の態様において、発明者は、各レシピエントが実質臓器レシピエントである複数のレシピエントに対してオミクスデータを得る段階およびレシピエント登録簿を得るためにイン・シリコアルゴリズムを使用して各レシピエントに対してHLA型を判定するさらなる段階を含む、ドナー組織をレシピエント組織と照合する方法を企図する。さらに別の段階において、マッチングHLA型を有するドナー臓器(例えば肺、肝臓、心臓または皮膚)と適合するものとしてレシピエントの1名を同定するためにレシピエント登録簿が使用される。
企図される方法に対するオミクスデータに関して、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび/またはRNAシーケンシングデータが特に好ましく、少なくとも4桁の深度に対してHLA型が判定されることがさらに好ましい。本発明の主題を限定するものではないが、イン・シリコアルゴリズムはDe Bruijnグラフおよび参照配列を使用する。最も一般的には、参照配列は、アレル頻度が少なくとも1%である少なくとも1個のHLA型に対するアレル、少なくとも1個のHLA型に対して少なくとも10個の異なるアレルを含み、および/または少なくとも2個の別個のHLA型に対するアレルを含む。したがって、適切なHLA型は、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型およびHLA−DQB−1型のうち1個以上を含む。
同様の数値が同様の構成成分を示す添付の図面とともに、本発明の主題の様々な目的、特性、態様および利点は、好ましい実施形態の次の詳細な記載からより明らかとなる。
図1は、公開データセットから患者データに対する予想され公開されているHLA結果を列挙する表である(1000ゲノムプロジェクト;対象NA19238、NA19239およびNA19240)。 図2は、実際の患者データに対するイン・シリコ予想およびラボ検証HLA結果を列挙する表である。 図3は、実際の患者データに対するロングリードシーケンシングにより得られるイン・シリコ予想およびHLA結果を列挙する表である。 図4は、イン・シリコ予想および実際の患者データに対するロングリードシーケンシングにより得られるHLA結果を列挙する表である。
発明者は、ドナー組織または移植待機中のレシピエントの何れかからのオミクスデータのみを必要とする概念的に単純かつ迅速な方法において包括的な徹底的バイオインフォマティクスユニバーサルHLA照合エンジン/データベースが確立され得ることを企図される。実際に、HLA照合以外の目的のために意図されるオミクスデータベースまたはソースからオミクスデータが得られ得ること(例えば疾患発症に対する可能性の判定またはファミリー/祖先判定のため)およびこのようなデータベースおよびソースがオミクスデータプロバイダーに対してさらなる値を生成させるためにオミクスデータを使用し得ることに留意すべきである。異なる角度から見ると、移植事象より前にドナーまたはレシピエントのHLA型がうまく判定されることが理解されるはずである。したがって、オミクスデータ取得時に細胞または臓器を提供する意図がない個人にさえも、直ちに潜在的なドナーまたはレシピエントとして同定し、接触し得る。
したがって、発明者は、一般に、移植片ドナーおよびレシピエントに対するユニバーサルデータハブとして適切なHLAライブラリを作成するための様々なオミクスデータの使用を企図する。これに関連して、多岐にわたる理由、医学その他などのために、オミクスデータが現在求められ、入手されることを認識しなければならない。増加の一途をたどるこのようなオミクス情報量は、現在、HLA情報に対する広いスペクトルのソースとなっている。例えば、健康評価用に祖先または民族性を判定するために(例えば遺伝関連疾患に対するリスクを予想するために)、疫学の文脈における集団/民族性分析のため、および一連の個別化治療(例えば癌免疫療法)において、重犯罪人、囚人などの特定の集団を同定および/または監視するために、オミクスデータが要求されるかまたは作成される。
結果として、オミクスデータのタイプはかなり多様化し、全ゲノムシーケンシング、エクソームシーケンシング、トランスクリプトームシーケンシングおよび標的化シーケンシングを含むことに留意すべきである。この文脈において、現在のシーケンシングは、殆ど独占的に具体的なゴール(例えば体細胞突然変異または生殖系列突然変異の同定、疾患の診断、民族性部分の決定など)に対して導かれる目的であることを認識すべきである。企図されるシステムおよび方法は有利に、HLA型を同定するためにオミクスデータを別の目的で使用することを可能にし、これはオミクスデータを提供した個体の利益のため、および/またはその個体とのHLAマッチを有する別の個体の利益のためであり得る。当然ではあるが、オミクス分析は、細胞または組織ドナーとなる、および/または細胞または組織レシピエントとなることを事前に意図する個人の群にも限定され得ることに留意されたい。したがって、代表的なドナーとしては、骨髄または幹細胞ドナー、血小板ドナー、臓器ドナーが挙げられ、一方で代表的なレシピエントとしては、臓器機能障害または臓器不全(例えば慢性進行性疾患ゆえ)の可能性が上昇しているか、または幹細胞移植片(例えば骨髄消失後)を必要とすることが見込まれる、急性移植片レシピエントおよび個人が挙げられる。
当技術分野で公知であるオミクスデータに対して多くのソースがあり、既知のソースは全て本明細書中での使用に適切とみなされる。例えば、企図されるオミクスデータは特に、健康組織または病的組織からの全ゲノム、エクソームシーケンシングおよび/またはトランスクリプトームシーケンシングデータを含む。本発明の主題の他の態様において、部分的オミクスデータのみが得られ得る。選択肢の中でもとりわけ、このような部分的データは、6番染色体および特に6p21.3の位置に限定されるデータを含む。結果的に、HLA予測を行うために、オミクスデータのイン・シリコ分析は非常に柔軟性があり得、実際にDNAおよびRNAオミクス分析からのデータ(例えばRNAseqデータ、エクソームシーケンシング、全ゲノムシーケンシング)またはDNAおよびRNAの両方の組み合わせを取り込み得ることに留意すべきである。さらに、以下で詳細に示されるようなイン・シリコ分析は高精度であり非常に速く、全ての26種類のHLA型において予測を得るための稼働時間は一般的に5分未満である。またさらに、以下で詳細にまた記されるように予想するために一連の参照HLAに対して新しいHLAアレルが自明に付加され得る。最後に、企図されるシステムおよび方法は一般に、正確な結果を生み出すために集団に基づくヒューリスティクスを必要としないことを理解するべきである。
潜在的な移植片ドナーに対するHLA型の判定に関して、ドナーが試験されるときにHLAマッチがある第三者に組織を提供するというドナーの意志があるかまたはない状況で判定を行い得ることに留意すべきである。一部の個体が常にドナーとして利用可能であることを望み得る一方で、他の個体は、最初の判断の僅か数か月または数年後にこのような利用可能性を検討し得る。例えば、一部のドナーは、子供に対して実施される再生医療での使用の可能性のためにその子供の臍帯血組織を保存し得、その子供は、ある時点で、HLA型が同じであるかまたは適合するレシピエントとの照合を支援するためにその組織(またはHLA型情報)が使用され得ることを判断し得る。別の例において、個体は、HLA判定以外の目的(例えば、父子鑑定、SNP分析、疾患リスク素因、家族計画、個別化医療、個別化フィットネス、個別化栄養摂取など)のために個体のゲノム、エクソームおよび/またはトランスクリプトームを判定するシーケンシングサービスに会員登録する。例えば、シーケンシングサービス(Otogenetics,Dante Labs,23andme,Ancestry,MyHeritage,FamilyTreeDNAなど)。このようなサービスは、マッチングまたは適合HLA型を有する1名以上の他の個体が同定される場合に会員登録者に通知されることを可能にするためのさらなるインセンティブHLA判定として提供し得る。したがって、オミクスデータに対する特に適切なソースとしては、ゲノム、エクソームおよび/またはトランスクリプトームをシーケンシングする、臨床サービス(すなわち疾患の処置の目的)および非臨床の民間サービス(すなわち疾患の処置以外の目的)が挙げられる。
さらに他の実施形態において、血液または他の臓器バンクは、おそらく組織ドナーの同定と一緒に、保存される組織に対してオミクス分析を行い得る。このような場合、血液または臓器/組織バンクも、1つ以上のHLAマッチまたはHLA適合性を決定するために接触され得るHLAリポジトリまたはHLAデータソースに相当し得る。同様に、医療システム(政府または民間)または保険代理店が、メンバーまたは登録者のオミクスデータを決定し、保存し、および/またはそれにアクセスする場合、HLA型の判定のためにこのようなオミクスデータを容易に分析し得る。したがって、医学的手順の必要またはHLA型を判定しようとする個体に接触する必要なく判定され得るHLAデータの二次的ソースとして増加の一途をたどる包括的オミクスデータ量を使用し得ることが理解されるべきである。
同様に、潜在的な移植片レシピエントに対するHLA型の判定に関して、潜在的なレシピエントが、移植片を急に必要としないか、または必要とすることさえも予想されないことが企図される。実際に、何れの者も、ライフスタイル、疾患および/または処置の何れかの結果として、移植片を必要とすることが起こり得る。例えば、様々なライフスタイルの選択肢(例えば薬物使用、過剰な西洋式のダイエットなど)により臓器不全のリスクが向上し、一方で肝炎、慢性腎臓病、糖尿病などの疾患において臓器機能障害不全の発症率が向上している。他方、ある種の癌処置(および特に従来の化学療法)の結果、骨髄機能不全などの臓器障害が起こり得る。さらに他の例において、再生医療における進歩は、幹細胞および/または前駆細胞由来の人工臓器の可能性を秘めている。このような細胞は一般的にはレシピエントから取り出されないので、組織拒絶を回避するためにHLA照合が最も重要である。したがって、移植の必要性が生じる場合のみレシピエントを試験する必要はないが、HLA試験が先制的に行われ得る。例えば、任意の先制的サービスとして、または医師もしくはクリニックへの訪問時に、HLA試験を行い得る(一般的には疾患の徴候および症状により必要とされる。)。最も一般的には、このような訪問は、臓器機能障害または臓器不全へとエスカレートし得る状態と、または最終的に移植を必要とする状態と関係があり得る。同様に、状態は、化学療法および/または骨髄消失など、臓器または組織に傷害を与えるかまたは死滅させる処置を必要とし得る。
したがって、HLA型の判定のための企図される方法が多くの組織(健康または病的)由来であり得、特に臍帯血、全血、幹細胞、口内スワブなどを含むことを理解すべきである。実際に、全てのドナー組織は、本明細書中での使用のために適切とみなされる。したがって、適切なドナー組織としては、新鮮な液性組織(例えば骨髄吸引液、単離幹細胞)、新鮮な固形組織(例えば、皮膚組織、角膜、腎臓、肺、心臓など)およびさらに保存または培養液性組織(例えば、場合によっては遺伝子改変および/または培養または冷凍保存されている、凍結組織切片、FFPE物質、NK細胞、T細胞)が挙げられる。さらに、HLA分析は、ドナー組織において行われる必要がないが、HLA適合レシピエント発見時または死亡時に1つ以上の組織および/または臓器を提供することに同意しているドナーにおいても行われ得ることが企図される。したがって、潜在的ドナーも含むように照合データベースを拡大し得る。
例えば、液性腫瘍に対する一連の処置において骨髄幹細胞移植が必要とされる場合、HLAデータベースにおける骨髄および/または臍帯血ドナーの完全かつ詳細なHLA記録が必要とされ得る。上記のように、このようなデータベースは、骨髄または臍帯血提供を必要とするあらゆるレシピエントに対するバイオインフォマティクスユニバーサルエンジンとなり得る。別の例において(例えば実質臓器移植において)、レシピエントのHLA型を判定するために移植待機中の全レシピエントの完全な事前の配列分析を行い得る。次にこのような情報をデータベースにおいて保存し得る。ドナー臓器が入手可能になったら、データベースは、少ないかまたは希少なアレルを含め、最も粒度が小さいHLAレベルのユニバーサル照合エンジンになり得る。
容易に理解されるように、HLAデータベースを情報学的にシーケンシング施設、配列分析施設、クリニック、(臍帯)血液バンク、(幹)細胞バンクおよび/または移植クリニックなどと連結し得るか、または複数のコンピュータにわたり分配し得る。例えば、オミクスデータを受信するためにオミクスデータベースを検索するか、またはオミクスデータベースと情報学的に連結されるコンピュータにおいて遠隔オミクス分析を開始するサービスセンターにおいてHLAデータベースを中心に据え得る。同様に、HLA分析は、シーケンシング施設、配列分析施設、クリニック、(臍帯)血液バンク、(幹)細胞バンクおよび/または移植クリニックでも行われ得、HLAデータベースに結果が報告され得る。
この文脈において、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラまたは個々にもしくは集合的に操作する他のタイプの計算装置を含め、計算装置のあらゆる適切な組み合わせを含めるために、コンピュータを対象とする何れかの言語が読まれるべきであることに留意すべきである。計算装置が、実体的な一時的でない、コンピュータ読み取り可能記憶媒体(例えばハードドライブ、ソリッドステートドライブ、RAM、フラッシュ、ROMなど)に保存されるソフトウェアの指示を実行するために構成されるプロセッサを含むことを理解すべきである。ソフトウェアの指示は、好ましくは開示される装置に関して、以下で論じられるような役割、責任または他の機能を提供するように計算装置を構成する。特に好ましい実施形態において、様々なサーバ、システム、データベースまたはインターフェースは、おそらくHTTP、HTTPS、AES、公開−プライベート鍵交換、ウェブサービスAPI、既知の金融取引プロトコールまたは他の電子情報交換方法に基づく標準化プロトコールまたはアルゴリズムを使用してデータを交換する。データ交換は、好ましくは、パケット交換ネットワーク、インターネット、LAN、WAN、VPNまたは他のタイプのパケット交換ネットワークを通じて行われる。
例えば、以下でさらに記載されるようにオミクスデータを使用してHLA型に対して組織および臓器ドナー試料を試験し得、試料または臓器取得時にこのような試験を行い得ることが企図される。あるいは、および特に、ドナーが既に遺伝子検査(例えば全ゲノムシーケンシング、エクソームシーケンシングなど)を受けている場合、既にこのようなデータを保存するデータベースからもオミクス情報が引き出され得る。結果的に、組織または臓器取得のポイントは分析のポイントとは異なり得ることが理解されるべきである。例えば、組織が臍帯血、骨髄または幹細胞である場合、組織の一部に対して直接オミクス試験を行い得る。一方で、臓器が実質臓器である場合、臓器からの試料に対して、またはドナーの血液に対して試験を行い得る。一方で、レシピエントが組織または臓器移植の待機中である場合、以下で論じるようにレシピエントをHLA型について試験し得、HLA情報をデータベースに保存し得る。したがって、HLA試験/分析および組織または臓器回収の場所は同じであり得るかまたは異なる場所であり得ることに留意する。結果的に、HLA照合リクエストは、様々な場所、例えばクリニック、診療所、研究室、癌研究グループ、民間シーケンシング実体などから提出され得、これはシーケンシングセンターおよび/またはHLA分析サービスと物理的または情報学的に配置され得る。
またさらに企図される態様において、さらなる収入の流れを提供するためにシーケンシングまたはオミクス処理センターに対する付属的サービスとしてHLA分析が提案され得る。このような場合、HLAデータベースは、特定の資格の役割として(例えば、組織のメンバー、登録者レベル、アクセス権など)1つ以上の団体によりアクセスされ得る中央登録簿であり得る。さらに、このような中央登録簿は、レシピエントおよび/またはドナー組織の全ゲノム情報を使用し得るか、または限定されるオミクス情報のみ、一般的にはHLA位置に関連する配列情報(染色体6p21.3)、を使用し得ることが企図される。
結果として、HLAマッチは、シーケンシング施設、癌研究グループ、クリニック、診療所、配列分析施設、(臍帯)血液バンク、(幹)細胞バンク、移植クリニックおよび/またはHLAデータベースなど、何らかの1つ以上の場所で同定され得る。HLAマッチは、一般的には、HLAアレルのうち少なくとも1個、または少なくとも2個、または少なくとも3個または少なくとも4個または少なくとも5個または少なくとも6個が、少なくとも2桁、より一般的には少なくとも4桁および最も一般的には少なくとも6桁の同一性を有する場合、マッチまたは関連HLA型とみなされる。HLAアレルに対する典型例は、特異的なタイプをそれぞれが有する、HLA−Aアレル、HLA−Bアレル、HLA−Cアレル、HLA−DRB−1アレルおよびHLA−DQB−1アレルのうち1個以上を含むHLA型を含む。
HLA型が多くの方式で判定され得る一方で、それらのうち全てまたは殆ど全てがかなりの時間および施設を必要とする。さらに、アレル特異的なPCR反応を使用する標的化HLA判定が行われる場合でさえも、塩基組成および融点の非常に小さな差異ゆえに、精度は望ましいレベルに満たないことが多い。したがって、多くの従来のHLAタイピング法は、2または4桁超までHLA型を分解しない。さらに、従来のHLAタイピング法は、実際に、希少なHLA型について試験する態勢が整っていないことが多く、このように、照合性能を制限する傾向がある。またさらに、従来のHLA試験は、移植レシピエントに関して切迫した移植の目的のためにのみ行われる。同様に、ドナーが組織提供(それ自身または他者に対して)に同意しているかまたはそうでなければ既に考えている場合、HLA試験は、一般的には殆どのドナーに対して行われる。これらの難問に対処するために、発明者は現在、条件(すなわち特異的な個体がドナーであるかまたはレシピエントであるか、または個体が細胞もしくは臓器提供を考えているかまたは同意しているか)に関わらず、あらゆる個体からの利用可能なオミクスデータを使用して、HLAデータベースが作成され得ることを企図する。このように、顕著により広いドナーおよびレシピエント範囲でユニバーサルHLAデータベースを作成し得る。
最も有利には、様々な密接に関連する配列の高精度アライメントを得るために、多岐にわたるHLAアレル配列(例えば、HLA−Aアレル配列、HLA−Bアレル配列、HLA−Cアレル配列、HLA−DRB−1アレル配列およびHLA−DQB−1アレル配列)に対する既知の配列情報を含む合成参照配列と一緒にBruijnグラフに基づく方法を使用して、個体からのオミクス配列が処理される分析モジュールにおいて、全ゲノム、エクソームおよび/またはトランスクリプトーム配列データなどの既存のオミクスデータが処理される。各HLA型が多数の、多くの場合は非常に類似したアレルを有するので、および昔からのアライメント法は配列の類似性が高度である場合、顕著に差別化できないことが多いので、DNAおよび/またはRNAシーケンシング情報からのHLA判定に対してこのような分析が特に有利であることが理解されるはずである。
実際に、HLAアレル同定は、分子診断において最も複雑な分析学的問題の中でも複雑である。第1に、現在、12個の発現されるClass IおよびII遺伝子座で、世界中の集団において1300を超えるアレルが存在することが知られている。さらに、これらのアレルのコードポリペプチドは、1つ以上のアミノ酸置換により互いに異なり、その結果、実質的な多型が生じる。例えば、HLA−B遺伝子座は400個を超える既知のアレルを有する。第2に、新しいアレルが既知の配列に継続的に付加され、標準的スキームがあっという間に陳旧なものになる。第3に、臨床研究室は、異なる臨床状況に対する様々な分解レベルでアレル同定を提供することが求められることが多い(例えば、腎臓移植には血清学的または低分解能タイピングが十分である一方で、血縁関係のない骨髄移植に対しては高分解能アレルレベルタイピングが要求される。)。これらの難問全てを混乱させるのは、個体が父母両方由来のアレルを有する、およびアレル間の差異は非常に小さいもののみであることが多い(例えば4個のアミノ酸のうち、1、2、3個の変化)という事実である。以下の表1は、具体例としてHLAアレルの多様性を例示する。
Figure 2020533688
したがって、配列特異的なオリゴヌクレオチドプローブハイブリッド形成または配列特異的プライマーPCRなどのハイブリッド形成に基づく方法に対するエラー頻度は比較的高い。同様に、PCR産物の直接シーケンシングによってハイブリッド形成に付随する難問が排除される一方で、配列リードの分析は、特に大規模グループの試料を処理しなければならない場合、依然として長時間を要する。これに関して、de Bruijnグラフ要素(および重み付け)の構造化およびランキングにより、従来からのデータ方式および処理スキーム(例えばマルチ配列アライメントアルゴリズム)と比較した場合、精度およびスピードが大きく向上するので、本明細書中で提示されるシステムおよび方法は全体的なスピードおよび精度、ならびにコンピュータ機能を向上させることに留意すべきである。さらに、発明者により解決された問題がバイオインフォマティクスの分野に特異的であり、オミクス情報の計算なくして存在しないことを理解しなければならない。最後に、分析エンジンにより行われるタスクは、コンピュータシステムの支援なく、ヒトの寿命内で理論的に行われ得ないことを認識すべきである。
典型例において、オミクスデータベース(例えばクリニック、癌研究グループ、民間ゲノム分析会社などから)またはシーケンシング施設もしくは機器により、染色体6p21.3(またはHLAアレルが見られる位置付近またはその位置の何らかの他の位置)に対する比較的多数の患者配列リードマッピングが提供される。最も一般的には、配列リードはNextGenシーケンシング(例えばIllumina Solexa、Roche 454 sequencer、Ion Torrent sequencerなど)を介して作製され、約100〜300塩基の長さを有し、リードの品質、アライメント情報、配向、位置などを含め、メタデータを含む。適切なフォーマットとしては、SAM、BAM、FASTA、GARなどが挙げられ、患者配列リードが少なくとも5x、より一般的には少なくとも10x、さらにより一般的には少なくとも20x、最も一般的には少なくとも30xの被覆度の深度を提供することが一般に好ましい。患者配列リードに加えて、企図される方法は、既知および別個のHLAアレルの複数の配列を含む1つ以上の参照配列をさらに使用する。
例えば、典型的な参照配列は、そのHLA型の複数のHLA−アレルを伴う少なくとも1つのHLA型の配列セグメントを含む合成(対応するヒトまたは他の哺乳動物同等物なし)配列であり得る。例えば、適切な参照配列は、HLA−Aの少なくとも50個の異なるアレルに対する既知のゲノム配列の一群を含む。あるいは、またはさらに、参照配列は、HLA−Aの少なくとも50個の異なるアレルに対する既知のRNA配列の一群も含み得る。当然ではあるが、以下で詳細にさらに論じるように、参照配列はHLA−Aの50個のアレルに限定されないが、HLA型およびアレルの数/組成に関して代替的な組成物を有し得る。HLA型は一般的には従来の方式で表される。例えば、特定のHLA遺伝子に対するHLA型は、HLA−A24:02:01:02Lとして記され得、第1文字目はHLA遺伝子を示し、24:02はタイプおよびサブタイプを示し、:01は同義置換を示し、02は非コード領域での置換を示す。最後の文字はタンパク質発現を示す。合成参照物に対する適切なHLAアレル配列は、全ての既知の配列を含み、IPD−IMGT/HLA(URL:ebi.ac.uk/ipd/imgt/hla/)からアクセスし得る。
最も一般的には、参照配列は、コンピュータ可読方式であり、データベースまたは他のデータ保存装置から提供される。例えば、適切な参照配列フォーマットとしては、FASTA、FASTQ、EMBL、GCGまたはGenBank方式が挙げられ、公開データリポジトリ(例えばIMGT、International ImMunoGeneTics information systemまたはAllele Frequency Net Database、EUROSTAM,www.allelefrequencies.net)のデータから直接得られ得るかまたは構築され得る。あるいは、参照配列は、アレル頻度、民族アレル分布、一般的または希少アレル型などの1つ以上の所定の基準に基づき、個別の既知のHLA−アレルからも構築され得る。
参照配列を使用して、患者配列リードは現在、国際公開第2017/035392号(およびその米国国内段階同等物)でも記載されるように最良適合があるアレルを同定するために、de Bruijnグラフを通じてスレッド化され得る。この文脈において、各個体が各HLA型に対して2個のアレルを保有すること、およびこれらのアレルが非常に類似しているものであり得る、または一部の場合では同一でさえもあり得ることに留意すべきである。このような高度の類似性は、従来からのアライメントスキームの場合はかなりの問題となる。発明者は、今回、配列リードを比較的小さなk−マー(一般的には10〜20塩基の長さを有する)に分解することにより、およびアレルの配列とマッチする配列リードのk−マーに基づいて、各アレルに対して各患者配列リードがボート(vote)(「定量的リードサポート」)を提供するウェイテッドボート(weighted vote)過程を実行することにより、de Bruijnグラフが構築されるアプローチを使用して、HLAアレルおよび非常に密接に関連するアレルでさえも分解され得ることを発見した。そしてアレルに対する累積的に最大のボート(vote)は、最も可能性高く予測されるHLAアレルを示す。さらに、以下でより詳細にまた示されるように、全体的被覆度およびそのアレルに対する被覆度の深度を計算するために、アレルに対するマッチである各断片も使用されることが一般に好ましい。
同じHLA型に対する第2のアレルの同定のために、発明者は、さらなる検討事項から最上位HLA−アレルが除去される、および調整された(スケーリングされた)ボート(vote)を使用して、残っているアレルが再ランキングされる場合、比較的類似した第2のアレルさえも、よりヒューリスティックなアプローチにおいて分解され得ることを発見した。より具体的には、再ランキングは、最上位アレルとマッチがあったk−マーに対するボート(vote)値が再ランキングボート(vote)において低下するように行われる。このような調整ボーティング(voting)は、最上位アレルと類似する遺伝子型に対するウェイテッドボート(weighted vote)を低下させ(しかし削除せず)、したがって遺伝学的に関係性がより小さいアレルにより大きい重みを与える。同時に、同様のアレルは無視されない。ランキングは、全体的な被覆度および被覆度の深度を考慮することによりさらに精密化し得る。例えば、第1の再ランキングアレルは、第2の再ランキングアレルよりも実質的に低い全体的被覆度および被覆度の深度でより高く得点し得る。このような場合、第2の再ランキングアレルは、正確なアレルである可能性がさらに大きくなり得る。次に、最上位再ランキングアレルは、同じHLA型に対する第2のアレルである。当然ではあるが、および上記のように、再ランキングは、全体的被覆度および被覆度の深度を考慮し得、全体的被覆度および/または被覆度の深度が、使用者が定めた閾値未満になる場合、アレルの失格にさえつながり得る(例えば94%未満の全体的被覆度および/または10x未満の被覆度の深度)。さらに、ボート(vote)としてのk−マーの照合を使用することによってまた、特定のボート(vote)における特有のk−マーの同定が可能になり、これは、特定のボート(vote)が正確な予想であると思われるかまたはそうでないかのさらなる指針となり得る。
当然ではあるが、分析およびHLA予想が特定のHLA型に限定される必要はないが、HLA−E、HLA−F、HLA−G、HLA−H、HLA−J、HLA−K、HLA−L、HLA−V、HLA−DQA1、HLA−DMA、HLA−DMB、HLA−DOA、HLA−DOB、HLA−DPA1、HLA−DPB1、HLA−DRA、HLA−DRB345、HLA−MICA、HLA−MICB、HLA−TAP1、HLA−TAP2およびさらに新しく発見されたHLA型およびそれらの対応するアレルを含め、全てのHLA型およびアレル変異体が本明細書中で企図されることが理解されるはずである。さらに、分析が単一のHLA型に限定される必要はないが、複数のHLA型が本明細書中での使用に適切であることが理解されるはずである。結果的に、参照配列は、個々のHLA型に対するアレルの一群とともに、2、3、4個またはそれを超えるHLA型を含み得る。各HLA型が多数のアレルを有するので、参照配列において既知のアレルの全てが含まれる必要はないことが企図される。例えば、参照配列は、少なくとも0.1%または少なくとも0.5%または少なくとも1%または少なくとも2%または少なくとも5%のアレル頻度など、特定の閾値を上回るアレル頻度を有するアレルを含み得る。したがって、および異なる角度から見て、適切な参照配列は、少なくとも1つのHLA型に対する、少なくとも10、または少なくとも30、または少なくとも50、または少なくとも100、または少なくとも200、または少なくとも500、またはさらにより多くの異なるアレルを含み得る。
同様に、患者配列リードの性質およびタイプがかなり変動し得ることが理解されるはずである。例えば、企図される患者配列リードは、DNAおよびRNA配列を含み、これらのそれぞれは、当技術分野で公知の全ての方法を使用して得られ得る。さらに、このような配列リードは、データ記憶装置(例えばデータベース)から、またはシーケンシング装置から提供され得る。例えば、DNA配列リードはNGSシーケンシング機器由来であり得、RNA配列はrtPCRシーケンシング装置由来あり得る。したがって、患者配列リードの長さは、一般的には、20塩基よりも長く、より一般的には50塩基よりも長く、最も一般的には100塩基よりも長いが、一般には5,000塩基よりも短いか、または3,000塩基よりも短いか、または1,000塩基よりも短い。結果的に、企図される患者配列リードは、100〜500塩基または150〜1,000塩基の長さを有し得る。
計算時間およびデータ保存および/または記憶要求を低下させるために、患者配列リードが、HLA型遺伝子が位置するゲノム領域に対して予め選択されることがさらに好ましい。例えば、染色体6p21.3にマッピングされる患者配列リードが特に企図される。同様に、患者配列リードもまた、HLAアレル遺伝子座が知られるゲノムに対する可能性のある位置を示す1つ以上のアノテーションに基づいて選択され得る。あるいは、アノテーションはまた、HLAアレルであるものとしての配列の確率を直接参照し得る。
患者配列リードの長さにかかわらず、患者配列リードが、比較的短い長さのk−マーに分解されることが一般的に好ましく、特に好ましい長さは、一般的には10〜30である。特に、このような短いk−マー長により、特にこのようなk−マーを含有する断片に対するウェイテッドボート(weighted vote)ゆえに、バリアント呼び出しにおいて分解能および精度をより高くできる。したがって、k−マーの長さは一般的には10〜30または15〜35または20〜40である。異なる角度から見て、k−マーは好ましくは60未満、さらにより好ましくは50未満、最も好ましくは40未満の長さを有するが、5より長く、より一般的には8より長く、最も一般的には10より長い。したがって、例えば適切なk−マーは、患者配列リードの長さの5%〜15%の長さを有する。
ランキングおよび複合マッチスコアに関して、殆どの好ましい態様において、患者配列リードに存在する全てのk−マーに基づいてマッチスコアが生成されること、および各ボーティング(voting)(すなわち照合)k−マーが同一のボーティング(voting)力を有することに留意すべきである。結果として、患者配列リードは、参照配列における各アレルに対して特定の定量的なリードサポートを有する。さらに、殆どの例において、ゲノム中の各位置が>1のシーケンシング深度を有するので、および各患者配列リードがアレルの全長の断片のみをカバーするので、各アレルは、複数の患者配列リードから複数のボート(vote)を受け取り得る。最も一般的には、アレルに対するボート(vote)は全て、そのアレルに対する複合マッチスコアに到達するために付加される。次に、各アレルに対する複合マッチスコアがランキングおよびさらなる分析のために使用される。
しかし、本発明の主題の代替的な態様において、1つ以上の具体的な目的を達成するために、スコア化および複合スコアの計算をまた改変し得ることに留意すべきである。例えば、断片に対するマッチスコアは、照合k−マーの全てから計算する必要はないが、k−マーの無作為な数または選択のみをカウントし得る。一方で、完全マッチ未満であるk−マー(例えば14/15マッチ)は、ボーティングライト(voting right)が与えられ得、おそらくボーティングウェイト(voting weight)はより低い。同様に、および特に、メタデータが入手可能である場合、リード品質が特定の閾値を下回るk−マーおよび/または患者配列リードに対してボーティングウェイト(voting weight)を減少させ得る。一方で、低シーケンシング深度が存在する場合、ボート(vote)は特定の断片に対して大きな比率を占め得る。また別の企図される態様において、特にリード深度が比較的高い場合(例えば少なくとも15xまたは少なくとも20xまたは少なくとも30x)、同じ位置に対する患者配列リードが、ボート(vote)に基づいて、削除され得るかまたは含まれ得る。結果として、複合マッチスコアは、入手可能なボート(vote)全てに、またはアレルに対して入手可能なボート(vote)の一部にのみ基づき得る。
ランキングが一般的には累積的なマッチスコアに依存する一方で、少なくとも1つの因子を使用してランキングがまた補正され得ることを認識すべきである。このような補正因子としては、利用可能な場合、被覆される部分、シーケンシング深度、特有のk−マーの量およびその部分のメタデータが挙げられる。例えばアレルの被覆度が所定の閾値を下回る場合(例えば96%未満または94%未満または92%未満など)および/またはシーケンシング深度が所定の閾値を下回る場合(例えば15x未満、または12x未満、または10x未満など)、ボーティングウェイト(voting weight)をアレルに対して減少させ得る。一方で、特有のk−マーのパーセンテージが所定の閾値を上回る(例えば2%上回るかまたは5%上回るかまたは10%上回る)場合、例えばアレルに対してボーティングウェイト(voting weight)を増加させることもできる。
最上位アレルは、一般的には、ある一定のHLA型に対する最初に予想されるアレルであり、一方で第2位のアレルは、同じHLA型に対する第2のアレルであり得る。しかし、特に最上位に続くランクの多くが同様の複合マッチスコアを有する場合、スコア化が必要に応じてさらに改善され得るかまたは精密化され得ることに留意するべきである。(例えばそれらのスコアのかなりの部分が高度に共有された一連のk−マー由来である)。ある好ましい例において、最上位k−マーとマッチする(完全に、または少なくとも90%、または少なくとも95%、または少なくとも97%、または少なくとも99%の類似度の何れか)k−マーの重みを補正因子により減少させる、再計算を含むスコア精密化手順を実行し得る。このような補正因子は、何らかの所定量によりボート(vote)の価値を低くし得る。最も一般的には、補正因子は、10%、または20〜40%、または40〜60%、またはそれより大きくボート(vote)の価値を低くする。これは、最上位アレルと同様である遺伝子型に対するウェイテッドボート(weighted vote)を減少させる効果を有し、異なっている遺伝子型を比較的より重要にする。したがって、第1のアレルが、全シーケンシングデータからの最大の殆どのサポートに基づいて同定され、一方で第2のアレルは、第2のアレルがデータセットにおいてサポートを有するか否か(例えば、高度調整ウェイテッドボート(weighted vote)および遺伝子型被覆度)またはゲノムが第1の遺伝子型に対してホモ接合であるか否か(例えば高度未加工ウェイテッドボート(weighted vote)、非常に低い調整ウェイテッドボート(weighted vote)、妥当な被覆度を有する他のアレルなし)を決定するために、未加工ウェイテッドボート(weighted vote)、調整したウェイテッドボート(weighted vote)の両方および被覆度を使用してよりヒューリスティクスに基づくアプローチで同定されることに留意すべきである。異なる角度から見て、再ランキングにより、有利に、最上位アレルと同様のアレルの存在下でさえも第2のアレルのより正確な差別化が可能になる。さらに、このような方法によってまた、ホモ接合HLA型の容易な同定も可能になる。さらに、このような方法は、ハッシュ表の使用を必要とせず、HLA型への配列リードの構築なく、適切なHLAアレルの同定を可能にすることが理解されるはずである。またさらに、企図されるシステムおよび方法によってもまた、DNAおよび/またはRNAデータの使用が可能になる。
結果的に、上記の方法およびシステムが、100個体を超えるかまたは200個体を超えるかまたは500個体を超えるかまたは1,000個体を超えるかまたは5,000個体を超えるかまたは10,000個体を超えるかまたはそれを超える分析のためにオミクスデータが存在するかまたは利用可能である場合、様々なオミクスデータからの大規模HLA判定に特に適切であることが理解されるはずである。分析の結論時に、各個体のHLA型をHLAデータベース中に保存し、これは、オミクスデータを提供したかまたはそれを利用可能にした団体およびHLA適合またはHLA同一である記録または個体の発見に関心がある第三者を含め、複数の団体によりアクセスされ得る。このようなHLA適合またはHLA同一記録または個体は様々な目的に対して使用され得る。主に、HLAマッチは細胞移植または臓器移植に有用であるが、家族関係の判定、民族性の判定、血液または組織試料の同一性の判定(例えば科学捜査での使用)などにも有用である。
実施例
HLA予想を検証するために、1000ゲノムプロジェクトから3つの独立した既知の患者記録および試料を得て(NA19238、NA19239およびNA19240)、次に上で論じたようにHLA型を予想した。注目すべきことに、および予想外に、上記のようなDe Bruijnグラフ法を使用したHLA判定および予想は、図1で見られ得るように、HLA−C(NA19238に対して)、DRB1(NA19239に対して)およびHLA−C(NA19240に対して)を除き、ほぼ完全にマッチした。特に、この3つの食い違いは、公開された記録における不正確なデータとして説明され得る。ここで与えられるHLA予測法から、3つの個々のデータベースでの5HLAの多様なパネルにわたり100%の精度が明らかになった。データによると、「公開」C18:01に対するサポートはなく、一方で、予測C18:02に対しては実質的なサポートがある。さらに、メンデル遺伝は、両アレル上の「公開」DRB113:01が不可能であることを示す(NA19238およびNA19239がNA19240の親であると仮定)。
またさらなる実験において、発明者は、20個の実際の患者試料に対してHLA−A、HLA−B、HLA−C、HLA−DRBおよびHLA−DBQハロタイプを予測し、配列特異的オリゴヌクレオチド(SSO)および配列特異的プライマー(SSP)法を使用して契約研究室で予想HLA型を検証した。図2から導き出され得るように、全20個の患者試料にわたる予測精度は100%であった。同様に、さらなる40名の患者を分析し、ロングレンジシーケンシング(PacBio SMRTシーケンシング)を使用して、予想HLA型を検証した。特に、図3および4から分かり得るように、不調和であったのは4つの予想のみであり、一方で7つの予想は配列決定不能のために確定できなかった。全てのデータのうち残る97.4%は予想HLA型と合致した。
容易に理解されるように、予想HLA型は、データベースにおいて保存され得、何れかのドナーHLA型、および特に骨髄ドナー、幹細胞ドナー、臍帯血ドナーなどおよび/または心臓、肝臓、肺、腎臓、皮膚もしくは膵臓移植待機中の患者などの移植レシピエントに相当し得る。
本明細書中で使用される場合、および文脈から別段の指示がない限り、「〜とカップリングされる(coupled to)」という用語は、直接的カップリング(互いにカップリングされる2つの要素が互いに接触)および間接的カップリング(少なくとも1つのさらなる要素が2つの要素の間に位置)の両方を含むものとする。したがって、「〜とカップリングされる(coupled to)」および「〜とともにカップリングされる(coupled with)」は、同義的に使用される。さらに、本明細書中で開示される本発明の代替的要素または実施形態の群分けは、制限するものとして解釈されるべきものではない。各群のメンバーは、個々に、または群の他のメンバーまたは本明細書中で見られる他の要素との何らかの組み合わせで言及され、請求され得る。群の1つ以上のメンバーが、便宜および/または特許性の理由で群に含まれ得るかまたは群から削除され得る。何らかのこのような包含または削除が起こる場合、本明細書は、明細書中で、変更され、それにより添付の特許請求の範囲で使用される全マーカッシュグループの記載が満たされるものとしてその群を含有するとみなされる。
本明細書中の発明の概念から逸脱することなく、既に記載のもの以外のさらに多くの変更が可能であることは当業者にとって明らかであるはずである。したがって、本発明の主題は、添付の特許請求の範囲を除き、限定されるものではない。さらに、明細書および特許請求の範囲の両方の解釈において、全ての用語は、内容と合致する最も広い可能な方式で解釈されるべきである。特に、「含む(comprises)」および「含むこと(comprising)」という用語は、包括的な方式で、要素、構成成分または段階を指すものとして解釈されるべきであり、これにより、言及される要素、構成成分または段階が、明らかに言及されない他の要素、構成成分または段階とともに、存在し得るか、または利用され得るか、または組み合わせられ得ることが示される。明細書特許請求の範囲が、A、B、C…およびNからなる群から選択される何かのうち少なくとも1つを指す場合、その文章は、A+NまたはB+Nなどでなく、その群から1つのみの要素を必要とすると解釈されるべきである。

Claims (20)

  1. ドナー組織をレシピエント組織と照合する方法であって、
    それぞれが臍帯血または骨髄の試料である複数のドナー組織試料に対するオミクスデータを得て;
    イン・シリコアルゴリズムを使用して前記オミクスデータから前記ドナー組織試料のそれぞれに対してHLA型を決定し;
    前記複数のドナー組織試料に対するそれぞれのHLA型を保存するドナー登録簿を作成し;
    前記ドナー登録簿において、前記ドナー組織試料の1つを、マッチングHLA型保有レシピエントと適合性があるものとして同定すること
    を含む、方法。
  2. 前記オミクスデータが、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび/またはRNAシーケンシングデータである、請求項1に記載の方法。
  3. 前記HLA型が少なくとも4桁の深度に対して決定される、請求項1に記載の方法。
  4. 前記イン・シリコアルゴリズムが、De Bruijnグラフおよび少なくとも1つの既知のHLA型に対する複数のアレルを含む参照配列を使用する、請求項1に記載の方法。
  5. 前記参照配列が、アレル頻度が少なくとも1%である少なくとも1個のHLA型に対するアレルを含む、請求項4に記載の方法。
  6. 前記参照配列が、少なくとも1個のHLA型に対して少なくとも10個の異なるアレルを含む、請求項4に記載の方法。
  7. 前記参照配列が、少なくとも2個の別個のHLA型に対するアレルを含む、請求項4に記載の方法。
  8. 前記HLA型が、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型およびHLA−DQB−1型のうち少なくとも3個である、請求項1に記載の方法。
  9. 前記マッチングHLA型が血清型判定により判定される、請求項1に記載の方法。
  10. 前記ドナー試料が臍帯血である、請求項1に記載の方法。
  11. ドナー組織をレシピエント組織と照合する方法であって、
    それぞれが実質臓器に対するレシピエントである複数の移植片レシピエントに対するオミクスデータを得て;
    イン・シリコアルゴリズムを使用して前記オミクスデータから前記移植片レシピエントのそれぞれに対するHLA型を決定し;
    複数の前記移植片レシピエントに対する個々のHLA型を保存するレシピエント登録簿を作成し;
    前記レシピエント登録簿において、マッチングHLA型を有するドナー臓器と適合するものとして前記レシピエントの1名を同定すること
    を含む、方法。
  12. 前記オミクスデータが、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび/またはRNAシーケンシングデータである、請求項11に記載の方法。
  13. 前記HLA型が少なくとも4桁の深度に対して決定される、請求項11に記載の方法。
  14. 前記イン・シリコアルゴリズムがDe Bruijnグラフおよび参照配列を使用する、請求項11に記載の方法。
  15. 前記参照配列が、アレル頻度が少なくとも1%である少なくとも1個のHLA型に対するアレルを含む、請求項14に記載の方法。
  16. 前記参照配列が、少なくとも1個のHLA型に対して少なくとも10個の異なるアレルを含む、請求項14に記載の方法。
  17. 前記参照配列が少なくとも2個の別個のHLA型に対するアレルを含む、請求項14に記載の方法。
  18. 前記HLA型が、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型またはHLA−DQB−1型である、請求項11に記載の方法。
  19. 前記HLA型が、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型およびHLA−DQB−1型のうち少なくとも3個である、請求項11に記載の方法。
  20. 前記ドナー臓器が、肺、肝臓、心臓または皮膚である、請求項11に記載の方法。
JP2020513829A 2017-09-06 2018-09-05 Hla組織照合およびそのための方法 Pending JP2020533688A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762554655P 2017-09-06 2017-09-06
US62/554,655 2017-09-06
PCT/US2018/049560 WO2019050958A2 (en) 2017-09-06 2018-09-05 CORRESPONDENCE OF HLA FABRIC AND ASSOCIATED METHODS

Publications (1)

Publication Number Publication Date
JP2020533688A true JP2020533688A (ja) 2020-11-19

Family

ID=65634487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020513829A Pending JP2020533688A (ja) 2017-09-06 2018-09-05 Hla組織照合およびそのための方法

Country Status (8)

Country Link
US (3) US11646103B2 (ja)
EP (1) EP3679577A4 (ja)
JP (1) JP2020533688A (ja)
KR (1) KR20200051714A (ja)
CN (1) CN111213210A (ja)
AU (1) AU2018330415A1 (ja)
CA (1) CA3074734A1 (ja)
WO (1) WO2019050958A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023190248A1 (ja) * 2022-03-29 2023-10-05 合同会社H.U.グループ中央研究所 対照ゲノム配列の生成方法、装置およびプログラム、ならびに目的アレル配列の解析方法、装置およびプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201121308D0 (en) 2011-12-12 2012-01-25 Cell Medica Ltd Process
HRP20221303T1 (hr) 2012-02-09 2022-12-23 Baylor College Of Medicine SMJESE PEPTIDA ZA NASTAJANJE MULTIVIRUSNIH CITOTOKSIČNIH T-LIMFOCITA(CTLs) ŠIROKE SPECIFIČNOSTI
IL298359A (en) 2015-09-18 2023-01-01 Baylor College Medicine Immunogenic detection of antigen from a pathogen and adjustment of effective clinical treatment
CA3074734A1 (en) 2017-09-06 2019-03-14 Nant Holdings Ip, Llc Hla tissue matching and methods therefor
CN114502180A (zh) * 2019-07-29 2022-05-13 贝勒医学院 抗原特异性t细胞库及其制备和治疗使用方法
CN111798924B (zh) * 2020-07-07 2024-03-26 博奥生物集团有限公司 一种人类白细胞抗原分型方法及装置
KR102475292B1 (ko) * 2020-09-03 2022-12-08 주식회사 엔젠바이오 Hla 유전자 증폭용 조성물 및 이의 용도
CN113817725B (zh) * 2021-10-15 2024-05-14 西安浩瑞基因技术有限公司 Hla基因扩增引物、试剂盒、测序文库构建方法及测序方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5702885A (en) * 1990-06-27 1997-12-30 The Blood Center Research Foundation, Inc. Method for HLA typing
US6670124B1 (en) 1999-12-20 2003-12-30 Stemcyte, Inc. High throughput methods of HLA typing
US20040091936A1 (en) * 2002-05-24 2004-05-13 Michael West Bank of stem cells for producing cells for transplantation having HLA antigens matching those of transplant recipients, and methods for making and using such a stem cell bank
US7917297B2 (en) 2003-08-01 2011-03-29 New York University Methods, software arrangements, storage media, and systems for genotyping or haplotyping polymorphic genetic loci or strain identification
US8771951B2 (en) 2009-11-16 2014-07-08 Genomics Usa, Inc. Methods for PCR and HLA typing using raw blood
CN103025865A (zh) * 2010-05-06 2013-04-03 干细胞医药有限公司 用于个性化医疗的干细胞库
US10120974B2 (en) * 2012-11-08 2018-11-06 Umc Utrecht Holding B.V. Method for prediction of an immune response against mismatched human leukocyte antigens
US10176294B2 (en) 2013-03-15 2019-01-08 The Broad Institute, Inc. Accurate typing of HLA through exome sequencing
CA2917878C (en) * 2013-03-15 2021-03-02 Memorial Sloan-Kettering Cancer Center Methods and algorithm for selecting allogeneic hematopoietic cell donor based on kir and hla genotypes
EP2994539A1 (en) * 2013-05-08 2016-03-16 Roche Diagnostics GmbH Non-invasive early detection of solid organ transplant rejection by quantitative analysis of mixtures by deep sequencing of hla gene amplicons using next generation systems
EP3058095B1 (en) * 2013-10-15 2019-12-25 Regeneron Pharmaceuticals, Inc. High resolution allele identification
KR102211461B1 (ko) * 2015-08-25 2021-02-03 난토믹스, 엘엘씨 고-정확도 변이 판정을 위한 시스템들 및 방법들
AU2017217877A1 (en) * 2016-02-12 2018-08-16 Nant Holdings Ip, Llc High-throughput identification of patient-specific neoepitopes as therapeutic targets for cancer immunotherapies
WO2018170046A1 (en) * 2017-03-14 2018-09-20 Orig3N, Inc. Hla-indexed repository of ipscs and ipsc-derived stem cells, and related systems and methods
CA3074734A1 (en) 2017-09-06 2019-03-14 Nant Holdings Ip, Llc Hla tissue matching and methods therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023190248A1 (ja) * 2022-03-29 2023-10-05 合同会社H.U.グループ中央研究所 対照ゲノム配列の生成方法、装置およびプログラム、ならびに目的アレル配列の解析方法、装置およびプログラム

Also Published As

Publication number Publication date
US20210134392A1 (en) 2021-05-06
WO2019050958A2 (en) 2019-03-14
US20230245723A1 (en) 2023-08-03
KR20200051714A (ko) 2020-05-13
EP3679577A4 (en) 2021-06-02
CN111213210A (zh) 2020-05-29
US11948663B2 (en) 2024-04-02
WO2019050958A3 (en) 2019-05-02
US11646103B2 (en) 2023-05-09
US20240177804A1 (en) 2024-05-30
EP3679577A2 (en) 2020-07-15
CA3074734A1 (en) 2019-03-14
AU2018330415A1 (en) 2020-03-19

Similar Documents

Publication Publication Date Title
JP2020533688A (ja) Hla組織照合およびそのための方法
JP6883180B2 (ja) 高正確度変異体コールのためのシステムおよび方法
Levin et al. Association of HLA-DRB1 with sarcoidosis susceptibility and progression in African Americans
Chalazan et al. Association of rare genetic variants and early-onset atrial fibrillation in ethnic minority individuals
Tallon et al. Single molecule sequencing and genome assembly of a clinical specimen of Loa loa, the causative agent of loiasis
Castelli et al. Evaluation of computational methods for the reconstruction of HLA haplotypes
JP2017521801A (ja) 移植におけるアロ反応性を予測する方法及びシステム
Ba et al. Surfing the big data wave: omics data challenges in transplantation
Tram et al. Identification of DPB1 permissive unrelated donors is highly likely
Blue et al. Variation in cilia protein genes and progression of lung disease in cystic fibrosis
Bentham et al. The development of genome-wide association studies and their application to complex diseases, including lupus
Arthur et al. Joint testing of donor and recipient genetic matching scores and recipient genotype has robust power for finding genes associated with transplant outcomes
Bossé Genome-wide expression quantitative trait loci analysis in asthma
JP6700376B2 (ja) 有意性が未知のバリアントに優先順位をつけるシステム及び方法
US20190130996A1 (en) Human haplotyping system and method
Guo et al. Identification of putative effector genes across the GWAS Catalog using molecular quantitative trait loci from 68 tissues and cell types
EP3588506A1 (en) Systems and methods for genomic and genetic analysis
Zhang et al. Typing and copy number determination for HLA‐DRB3,‐DRB4 and‐DRB5 from next‐generation sequencing data
JP2007535305A (ja) 分子毒性モデリングのための方法
Texis et al. COVID-19 relevant genetic variants confirmed in an admixed population
KR102507088B1 (ko) 인간 백혈구 항원의 타입 결정 방법 및 이를 통한 의료 개인화 방법
Sarwar et al. Genomic analysis of left ventricular remodeling
US20240294984A1 (en) Methods and systems for allele typing
Assyuhada et al. Population genetics and human health in the genomic era
Tandoh et al. Hepatitis B infection outcome is associated with novel human leukocyte antigen variants in Ghanaian cohort

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20210224

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210308