JP2020533688A

JP2020533688A - Ｈｌａ組織照合およびそのための方法

Info

Publication number: JP2020533688A
Application number: JP2020513829A
Authority: JP
Inventors: スーン−シオン，パトリック
Original assignee: ナントホールディングスアイピー，エルエルシー
Priority date: 2017-09-06
Filing date: 2018-09-05
Publication date: 2020-11-19
Also published as: US20210134392A1; WO2019050958A2; US20230245723A1; KR20200051714A; EP3679577A4; CN111213210A; US11948663B2; WO2019050958A3; US11646103B2; US20240177804A1; EP3679577A2; CA3074734A1; AU2018330415A1

Abstract

企図される系および方法は、移植および特に幹細胞および実質臓器移植片に適切な移植照合データベースを確立するために高精度イン・シリコＨＬＡ分析を使用する。

Description

本願は、２０１７年９月６日出願の米国特許仮出願第６２／５５４，６５５号に対する優先権を主張する。

本発明の分野は、特にイン・シリコＨＬＡ判定に関連するので、移植前の組織照合のためのシステムおよび方法である。

次の記載は、本発明を理解する際に有用であり得る情報を含む。これは、本明細書中で提供される何れの情報も、今回請求される発明に対する先行技術であるかまたはそれに関連すること、または具体的もしくは明確に言及される何れかの刊行物が先行技術であることを認めるものではない。

ＨＬＡタイピングは、現在も様々な実質臓器および幹細胞の移植の実施において重大な意味を持っており、患者のＨＬＡ型を判定するために当技術分野で公知である様々なシステムおよび方法がある。最も一般的には、ＨＬＡタイピングは、湿式化学／血清学的方法を使用して、または核酸分析および特にシーケンシングもしくはＰＣＲに基づく方法を介して行われる。このような方法は、多くの場合、満足できるものであり、比較的正確な結果を提供する。しかし、最も一般的な方法は、特に大集団を分析しようとする場合、多大な時間を要し、比較的高価であることが多い。

従来方法と関連する欠点の少なくとも一部に対処するために、一般的には米国特許出願公開第２０１１／０１１７５５３号に記載のような未処理血液試料を使用して、ネステッド／タンデムＰＣＲを使用し得る。米国特許出願公開第２００３／０１６５８８４号で教示されるようなハイスループット判定に適切な、さらに他の方法において、増幅と遺伝子座特異的な捕捉プローブの組み合わせが使用される。同様に、米国特許第７９１７２９７号は、迅速分析を可能にするための、固相上での別個の捕捉ヌクレオチドの様々なアレイを記載する。残念ながら、ＨＬＡアレル間のハイブリッド形成の差異は非常に小さいことが多いので、このようなシステムでは一般的には高精度ＨＬＡ判定が可能とはならない。本明細書中で特定される刊行物および特許明細書は全て、それぞれ個々の刊行物または特許明細書が参照により組み込まれることを具体的かつ個別に示されるかのように、同程度まで参照により組み込まれる。組み込まれる参考文献中の用語の定義または使用が本明細書中で提供されるその用語の定義と一致しないかまたは矛盾する場合、本明細書中で提供されるその用語の定義が適用され、参考文献中のその用語の定義は適用されない。

より最近、例えば米国特許出願公開第２０１６／０１２５１２８号で論じられるように、ＨＬＡ型の判定のためのエクソームシーケンシングデータを使用するコンピュータにより実行される方法が記載された。また他の例において、ＤｅＢｒｕｉｊｎグラフを使用したコンピュータ分析を記載する米国特許出願第２０１５／０１１０７５４号および国際公開第２０１７／０３５３９２号で教示されるように、最も可能性が高いＨＬＡ型を判定するために配列データ上の確率的な分析が使用される。特に、これらの方法は比較的速いが、より大きな試料集団にわたって使用されたことはない。

したがって、当技術分野で公知のＨＬＡタイピングに対する様々なシステムおよび方法があるにもかかわらず、ＨＬＡタイピングおよび特にイン・シリコＨＬＡタイピングのための改善されたシステムおよび実行を提供することが依然として求められている。

本発明の主題は、ドナー／レシピエントマッチの同定に役立つバイオインフォマティクスデータベースを提供するために、大きな試料集団にわたりＨＬＡ分析が行われる装置、システムおよび方法を提供する。例えば、骨髄幹細胞移植片が液性腫瘍に対して必要とされる場合、全ての骨髄および臍帯血ドナーの完全かつ詳細なＨＬＡ分析が最初に確立される。次に、この独特なデータベースは、骨髄または臍帯血提供を必要とするあらゆるレシピエントに対するバイオインフォマティクスユニバーサルエンジンとなり得る。別の例において、実質臓器移植に対して、ＨＬＡ型を判定するために、移植待機中の全レシピエントの完全な事前の配列分析が行われる。ドナー臓器が入手可能になったら、このデータベースは、少数および希少アレルを含め、最も粒度の細かいＨＬＡレベルでユニバーサル照合エンジンになり得る。したがって、本明細書中で提示されるシステムおよび方法は、ドナーおよび／またはレシピエントの大集団にわたり高精度かつ包括的レベルでドナーおよびレシピエントの迅速照合を提供する。

本発明の主題の一態様において、発明者は、各試料が臍帯血または骨髄試料である複数のドナー試料に対してオミクスデータを得る段階およびドナー登録簿を得るためにイン・シリコアルゴリズムを使用してドナー試料のそれぞれに対してＨＬＡ型を判定するさらなる段階を含む、ドナー組織をレシピエント組織と照合する方法を企図する。また別の段階において、ドナー登録簿を使用して、ドナー試料（例えば臍帯血）の１つを、マッチングＨＬＡ型保有レシピエントと適合するものとして同定する。

同様に、本発明の主題の別の態様において、発明者は、各レシピエントが実質臓器レシピエントである複数のレシピエントに対してオミクスデータを得る段階およびレシピエント登録簿を得るためにイン・シリコアルゴリズムを使用して各レシピエントに対してＨＬＡ型を判定するさらなる段階を含む、ドナー組織をレシピエント組織と照合する方法を企図する。さらに別の段階において、マッチングＨＬＡ型を有するドナー臓器（例えば肺、肝臓、心臓または皮膚）と適合するものとしてレシピエントの１名を同定するためにレシピエント登録簿が使用される。

企図される方法に対するオミクスデータに関して、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび／またはＲＮＡシーケンシングデータが特に好ましく、少なくとも４桁の深度に対してＨＬＡ型が判定されることがさらに好ましい。本発明の主題を限定するものではないが、イン・シリコアルゴリズムはＤｅＢｒｕｉｊｎグラフおよび参照配列を使用する。最も一般的には、参照配列は、アレル頻度が少なくとも１％である少なくとも１個のＨＬＡ型に対するアレル、少なくとも１個のＨＬＡ型に対して少なくとも１０個の異なるアレルを含み、および／または少なくとも２個の別個のＨＬＡ型に対するアレルを含む。したがって、適切なＨＬＡ型は、ＨＬＡ−Ａ型、ＨＬＡ−Ｂ型、ＨＬＡ−Ｃ型、ＨＬＡ−ＤＲＢ−１型およびＨＬＡ−ＤＱＢ−１型のうち１個以上を含む。

同様の数値が同様の構成成分を示す添付の図面とともに、本発明の主題の様々な目的、特性、態様および利点は、好ましい実施形態の次の詳細な記載からより明らかとなる。

図１は、公開データセットから患者データに対する予想され公開されているＨＬＡ結果を列挙する表である（１０００ゲノムプロジェクト；対象ＮＡ１９２３８、ＮＡ１９２３９およびＮＡ１９２４０）。図２は、実際の患者データに対するイン・シリコ予想およびラボ検証ＨＬＡ結果を列挙する表である。図３は、実際の患者データに対するロングリードシーケンシングにより得られるイン・シリコ予想およびＨＬＡ結果を列挙する表である。図４は、イン・シリコ予想および実際の患者データに対するロングリードシーケンシングにより得られるＨＬＡ結果を列挙する表である。

発明者は、ドナー組織または移植待機中のレシピエントの何れかからのオミクスデータのみを必要とする概念的に単純かつ迅速な方法において包括的な徹底的バイオインフォマティクスユニバーサルＨＬＡ照合エンジン／データベースが確立され得ることを企図される。実際に、ＨＬＡ照合以外の目的のために意図されるオミクスデータベースまたはソースからオミクスデータが得られ得ること（例えば疾患発症に対する可能性の判定またはファミリー／祖先判定のため）およびこのようなデータベースおよびソースがオミクスデータプロバイダーに対してさらなる値を生成させるためにオミクスデータを使用し得ることに留意すべきである。異なる角度から見ると、移植事象より前にドナーまたはレシピエントのＨＬＡ型がうまく判定されることが理解されるはずである。したがって、オミクスデータ取得時に細胞または臓器を提供する意図がない個人にさえも、直ちに潜在的なドナーまたはレシピエントとして同定し、接触し得る。

したがって、発明者は、一般に、移植片ドナーおよびレシピエントに対するユニバーサルデータハブとして適切なＨＬＡライブラリを作成するための様々なオミクスデータの使用を企図する。これに関連して、多岐にわたる理由、医学その他などのために、オミクスデータが現在求められ、入手されることを認識しなければならない。増加の一途をたどるこのようなオミクス情報量は、現在、ＨＬＡ情報に対する広いスペクトルのソースとなっている。例えば、健康評価用に祖先または民族性を判定するために（例えば遺伝関連疾患に対するリスクを予想するために）、疫学の文脈における集団／民族性分析のため、および一連の個別化治療（例えば癌免疫療法）において、重犯罪人、囚人などの特定の集団を同定および／または監視するために、オミクスデータが要求されるかまたは作成される。

結果として、オミクスデータのタイプはかなり多様化し、全ゲノムシーケンシング、エクソームシーケンシング、トランスクリプトームシーケンシングおよび標的化シーケンシングを含むことに留意すべきである。この文脈において、現在のシーケンシングは、殆ど独占的に具体的なゴール（例えば体細胞突然変異または生殖系列突然変異の同定、疾患の診断、民族性部分の決定など）に対して導かれる目的であることを認識すべきである。企図されるシステムおよび方法は有利に、ＨＬＡ型を同定するためにオミクスデータを別の目的で使用することを可能にし、これはオミクスデータを提供した個体の利益のため、および／またはその個体とのＨＬＡマッチを有する別の個体の利益のためであり得る。当然ではあるが、オミクス分析は、細胞または組織ドナーとなる、および／または細胞または組織レシピエントとなることを事前に意図する個人の群にも限定され得ることに留意されたい。したがって、代表的なドナーとしては、骨髄または幹細胞ドナー、血小板ドナー、臓器ドナーが挙げられ、一方で代表的なレシピエントとしては、臓器機能障害または臓器不全（例えば慢性進行性疾患ゆえ）の可能性が上昇しているか、または幹細胞移植片（例えば骨髄消失後）を必要とすることが見込まれる、急性移植片レシピエントおよび個人が挙げられる。

当技術分野で公知であるオミクスデータに対して多くのソースがあり、既知のソースは全て本明細書中での使用に適切とみなされる。例えば、企図されるオミクスデータは特に、健康組織または病的組織からの全ゲノム、エクソームシーケンシングおよび／またはトランスクリプトームシーケンシングデータを含む。本発明の主題の他の態様において、部分的オミクスデータのみが得られ得る。選択肢の中でもとりわけ、このような部分的データは、６番染色体および特に６ｐ２１．３の位置に限定されるデータを含む。結果的に、ＨＬＡ予測を行うために、オミクスデータのイン・シリコ分析は非常に柔軟性があり得、実際にＤＮＡおよびＲＮＡオミクス分析からのデータ（例えばＲＮＡｓｅｑデータ、エクソームシーケンシング、全ゲノムシーケンシング）またはＤＮＡおよびＲＮＡの両方の組み合わせを取り込み得ることに留意すべきである。さらに、以下で詳細に示されるようなイン・シリコ分析は高精度であり非常に速く、全ての２６種類のＨＬＡ型において予測を得るための稼働時間は一般的に５分未満である。またさらに、以下で詳細にまた記されるように予想するために一連の参照ＨＬＡに対して新しいＨＬＡアレルが自明に付加され得る。最後に、企図されるシステムおよび方法は一般に、正確な結果を生み出すために集団に基づくヒューリスティクスを必要としないことを理解するべきである。

潜在的な移植片ドナーに対するＨＬＡ型の判定に関して、ドナーが試験されるときにＨＬＡマッチがある第三者に組織を提供するというドナーの意志があるかまたはない状況で判定を行い得ることに留意すべきである。一部の個体が常にドナーとして利用可能であることを望み得る一方で、他の個体は、最初の判断の僅か数か月または数年後にこのような利用可能性を検討し得る。例えば、一部のドナーは、子供に対して実施される再生医療での使用の可能性のためにその子供の臍帯血組織を保存し得、その子供は、ある時点で、ＨＬＡ型が同じであるかまたは適合するレシピエントとの照合を支援するためにその組織（またはＨＬＡ型情報）が使用され得ることを判断し得る。別の例において、個体は、ＨＬＡ判定以外の目的（例えば、父子鑑定、ＳＮＰ分析、疾患リスク素因、家族計画、個別化医療、個別化フィットネス、個別化栄養摂取など）のために個体のゲノム、エクソームおよび／またはトランスクリプトームを判定するシーケンシングサービスに会員登録する。例えば、シーケンシングサービス（Ｏｔｏｇｅｎｅｔｉｃｓ，ＤａｎｔｅＬａｂｓ，２３ａｎｄｍｅ，Ａｎｃｅｓｔｒｙ，ＭｙＨｅｒｉｔａｇｅ，ＦａｍｉｌｙＴｒｅｅＤＮＡなど）。このようなサービスは、マッチングまたは適合ＨＬＡ型を有する１名以上の他の個体が同定される場合に会員登録者に通知されることを可能にするためのさらなるインセンティブＨＬＡ判定として提供し得る。したがって、オミクスデータに対する特に適切なソースとしては、ゲノム、エクソームおよび／またはトランスクリプトームをシーケンシングする、臨床サービス（すなわち疾患の処置の目的）および非臨床の民間サービス（すなわち疾患の処置以外の目的）が挙げられる。

さらに他の実施形態において、血液または他の臓器バンクは、おそらく組織ドナーの同定と一緒に、保存される組織に対してオミクス分析を行い得る。このような場合、血液または臓器／組織バンクも、１つ以上のＨＬＡマッチまたはＨＬＡ適合性を決定するために接触され得るＨＬＡリポジトリまたはＨＬＡデータソースに相当し得る。同様に、医療システム（政府または民間）または保険代理店が、メンバーまたは登録者のオミクスデータを決定し、保存し、および／またはそれにアクセスする場合、ＨＬＡ型の判定のためにこのようなオミクスデータを容易に分析し得る。したがって、医学的手順の必要またはＨＬＡ型を判定しようとする個体に接触する必要なく判定され得るＨＬＡデータの二次的ソースとして増加の一途をたどる包括的オミクスデータ量を使用し得ることが理解されるべきである。

同様に、潜在的な移植片レシピエントに対するＨＬＡ型の判定に関して、潜在的なレシピエントが、移植片を急に必要としないか、または必要とすることさえも予想されないことが企図される。実際に、何れの者も、ライフスタイル、疾患および／または処置の何れかの結果として、移植片を必要とすることが起こり得る。例えば、様々なライフスタイルの選択肢（例えば薬物使用、過剰な西洋式のダイエットなど）により臓器不全のリスクが向上し、一方で肝炎、慢性腎臓病、糖尿病などの疾患において臓器機能障害不全の発症率が向上している。他方、ある種の癌処置（および特に従来の化学療法）の結果、骨髄機能不全などの臓器障害が起こり得る。さらに他の例において、再生医療における進歩は、幹細胞および／または前駆細胞由来の人工臓器の可能性を秘めている。このような細胞は一般的にはレシピエントから取り出されないので、組織拒絶を回避するためにＨＬＡ照合が最も重要である。したがって、移植の必要性が生じる場合のみレシピエントを試験する必要はないが、ＨＬＡ試験が先制的に行われ得る。例えば、任意の先制的サービスとして、または医師もしくはクリニックへの訪問時に、ＨＬＡ試験を行い得る（一般的には疾患の徴候および症状により必要とされる。）。最も一般的には、このような訪問は、臓器機能障害または臓器不全へとエスカレートし得る状態と、または最終的に移植を必要とする状態と関係があり得る。同様に、状態は、化学療法および／または骨髄消失など、臓器または組織に傷害を与えるかまたは死滅させる処置を必要とし得る。

したがって、ＨＬＡ型の判定のための企図される方法が多くの組織（健康または病的）由来であり得、特に臍帯血、全血、幹細胞、口内スワブなどを含むことを理解すべきである。実際に、全てのドナー組織は、本明細書中での使用のために適切とみなされる。したがって、適切なドナー組織としては、新鮮な液性組織（例えば骨髄吸引液、単離幹細胞）、新鮮な固形組織（例えば、皮膚組織、角膜、腎臓、肺、心臓など）およびさらに保存または培養液性組織（例えば、場合によっては遺伝子改変および／または培養または冷凍保存されている、凍結組織切片、ＦＦＰＥ物質、ＮＫ細胞、Ｔ細胞）が挙げられる。さらに、ＨＬＡ分析は、ドナー組織において行われる必要がないが、ＨＬＡ適合レシピエント発見時または死亡時に１つ以上の組織および／または臓器を提供することに同意しているドナーにおいても行われ得ることが企図される。したがって、潜在的ドナーも含むように照合データベースを拡大し得る。

例えば、液性腫瘍に対する一連の処置において骨髄幹細胞移植が必要とされる場合、ＨＬＡデータベースにおける骨髄および／または臍帯血ドナーの完全かつ詳細なＨＬＡ記録が必要とされ得る。上記のように、このようなデータベースは、骨髄または臍帯血提供を必要とするあらゆるレシピエントに対するバイオインフォマティクスユニバーサルエンジンとなり得る。別の例において（例えば実質臓器移植において）、レシピエントのＨＬＡ型を判定するために移植待機中の全レシピエントの完全な事前の配列分析を行い得る。次にこのような情報をデータベースにおいて保存し得る。ドナー臓器が入手可能になったら、データベースは、少ないかまたは希少なアレルを含め、最も粒度が小さいＨＬＡレベルのユニバーサル照合エンジンになり得る。

容易に理解されるように、ＨＬＡデータベースを情報学的にシーケンシング施設、配列分析施設、クリニック、（臍帯）血液バンク、（幹）細胞バンクおよび／または移植クリニックなどと連結し得るか、または複数のコンピュータにわたり分配し得る。例えば、オミクスデータを受信するためにオミクスデータベースを検索するか、またはオミクスデータベースと情報学的に連結されるコンピュータにおいて遠隔オミクス分析を開始するサービスセンターにおいてＨＬＡデータベースを中心に据え得る。同様に、ＨＬＡ分析は、シーケンシング施設、配列分析施設、クリニック、（臍帯）血液バンク、（幹）細胞バンクおよび／または移植クリニックでも行われ得、ＨＬＡデータベースに結果が報告され得る。

この文脈において、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラまたは個々にもしくは集合的に操作する他のタイプの計算装置を含め、計算装置のあらゆる適切な組み合わせを含めるために、コンピュータを対象とする何れかの言語が読まれるべきであることに留意すべきである。計算装置が、実体的な一時的でない、コンピュータ読み取り可能記憶媒体（例えばハードドライブ、ソリッドステートドライブ、ＲＡＭ、フラッシュ、ＲＯＭなど）に保存されるソフトウェアの指示を実行するために構成されるプロセッサを含むことを理解すべきである。ソフトウェアの指示は、好ましくは開示される装置に関して、以下で論じられるような役割、責任または他の機能を提供するように計算装置を構成する。特に好ましい実施形態において、様々なサーバ、システム、データベースまたはインターフェースは、おそらくＨＴＴＰ、ＨＴＴＰＳ、ＡＥＳ、公開−プライベート鍵交換、ウェブサービスＡＰＩ、既知の金融取引プロトコールまたは他の電子情報交換方法に基づく標準化プロトコールまたはアルゴリズムを使用してデータを交換する。データ交換は、好ましくは、パケット交換ネットワーク、インターネット、ＬＡＮ、ＷＡＮ、ＶＰＮまたは他のタイプのパケット交換ネットワークを通じて行われる。

例えば、以下でさらに記載されるようにオミクスデータを使用してＨＬＡ型に対して組織および臓器ドナー試料を試験し得、試料または臓器取得時にこのような試験を行い得ることが企図される。あるいは、および特に、ドナーが既に遺伝子検査（例えば全ゲノムシーケンシング、エクソームシーケンシングなど）を受けている場合、既にこのようなデータを保存するデータベースからもオミクス情報が引き出され得る。結果的に、組織または臓器取得のポイントは分析のポイントとは異なり得ることが理解されるべきである。例えば、組織が臍帯血、骨髄または幹細胞である場合、組織の一部に対して直接オミクス試験を行い得る。一方で、臓器が実質臓器である場合、臓器からの試料に対して、またはドナーの血液に対して試験を行い得る。一方で、レシピエントが組織または臓器移植の待機中である場合、以下で論じるようにレシピエントをＨＬＡ型について試験し得、ＨＬＡ情報をデータベースに保存し得る。したがって、ＨＬＡ試験／分析および組織または臓器回収の場所は同じであり得るかまたは異なる場所であり得ることに留意する。結果的に、ＨＬＡ照合リクエストは、様々な場所、例えばクリニック、診療所、研究室、癌研究グループ、民間シーケンシング実体などから提出され得、これはシーケンシングセンターおよび／またはＨＬＡ分析サービスと物理的または情報学的に配置され得る。

またさらに企図される態様において、さらなる収入の流れを提供するためにシーケンシングまたはオミクス処理センターに対する付属的サービスとしてＨＬＡ分析が提案され得る。このような場合、ＨＬＡデータベースは、特定の資格の役割として（例えば、組織のメンバー、登録者レベル、アクセス権など）１つ以上の団体によりアクセスされ得る中央登録簿であり得る。さらに、このような中央登録簿は、レシピエントおよび／またはドナー組織の全ゲノム情報を使用し得るか、または限定されるオミクス情報のみ、一般的にはＨＬＡ位置に関連する配列情報（染色体６ｐ２１．３）、を使用し得ることが企図される。

結果として、ＨＬＡマッチは、シーケンシング施設、癌研究グループ、クリニック、診療所、配列分析施設、（臍帯）血液バンク、（幹）細胞バンク、移植クリニックおよび／またはＨＬＡデータベースなど、何らかの１つ以上の場所で同定され得る。ＨＬＡマッチは、一般的には、ＨＬＡアレルのうち少なくとも１個、または少なくとも２個、または少なくとも３個または少なくとも４個または少なくとも５個または少なくとも６個が、少なくとも２桁、より一般的には少なくとも４桁および最も一般的には少なくとも６桁の同一性を有する場合、マッチまたは関連ＨＬＡ型とみなされる。ＨＬＡアレルに対する典型例は、特異的なタイプをそれぞれが有する、ＨＬＡ−Ａアレル、ＨＬＡ−Ｂアレル、ＨＬＡ−Ｃアレル、ＨＬＡ−ＤＲＢ−１アレルおよびＨＬＡ−ＤＱＢ−１アレルのうち１個以上を含むＨＬＡ型を含む。

ＨＬＡ型が多くの方式で判定され得る一方で、それらのうち全てまたは殆ど全てがかなりの時間および施設を必要とする。さらに、アレル特異的なＰＣＲ反応を使用する標的化ＨＬＡ判定が行われる場合でさえも、塩基組成および融点の非常に小さな差異ゆえに、精度は望ましいレベルに満たないことが多い。したがって、多くの従来のＨＬＡタイピング法は、２または４桁超までＨＬＡ型を分解しない。さらに、従来のＨＬＡタイピング法は、実際に、希少なＨＬＡ型について試験する態勢が整っていないことが多く、このように、照合性能を制限する傾向がある。またさらに、従来のＨＬＡ試験は、移植レシピエントに関して切迫した移植の目的のためにのみ行われる。同様に、ドナーが組織提供（それ自身または他者に対して）に同意しているかまたはそうでなければ既に考えている場合、ＨＬＡ試験は、一般的には殆どのドナーに対して行われる。これらの難問に対処するために、発明者は現在、条件（すなわち特異的な個体がドナーであるかまたはレシピエントであるか、または個体が細胞もしくは臓器提供を考えているかまたは同意しているか）に関わらず、あらゆる個体からの利用可能なオミクスデータを使用して、ＨＬＡデータベースが作成され得ることを企図する。このように、顕著により広いドナーおよびレシピエント範囲でユニバーサルＨＬＡデータベースを作成し得る。

最も有利には、様々な密接に関連する配列の高精度アライメントを得るために、多岐にわたるＨＬＡアレル配列（例えば、ＨＬＡ−Ａアレル配列、ＨＬＡ−Ｂアレル配列、ＨＬＡ−Ｃアレル配列、ＨＬＡ−ＤＲＢ−１アレル配列およびＨＬＡ−ＤＱＢ−１アレル配列）に対する既知の配列情報を含む合成参照配列と一緒にＢｒｕｉｊｎグラフに基づく方法を使用して、個体からのオミクス配列が処理される分析モジュールにおいて、全ゲノム、エクソームおよび／またはトランスクリプトーム配列データなどの既存のオミクスデータが処理される。各ＨＬＡ型が多数の、多くの場合は非常に類似したアレルを有するので、および昔からのアライメント法は配列の類似性が高度である場合、顕著に差別化できないことが多いので、ＤＮＡおよび／またはＲＮＡシーケンシング情報からのＨＬＡ判定に対してこのような分析が特に有利であることが理解されるはずである。

実際に、ＨＬＡアレル同定は、分子診断において最も複雑な分析学的問題の中でも複雑である。第１に、現在、１２個の発現されるＣｌａｓｓＩおよびＩＩ遺伝子座で、世界中の集団において１３００を超えるアレルが存在することが知られている。さらに、これらのアレルのコードポリペプチドは、１つ以上のアミノ酸置換により互いに異なり、その結果、実質的な多型が生じる。例えば、ＨＬＡ−Ｂ遺伝子座は４００個を超える既知のアレルを有する。第２に、新しいアレルが既知の配列に継続的に付加され、標準的スキームがあっという間に陳旧なものになる。第３に、臨床研究室は、異なる臨床状況に対する様々な分解レベルでアレル同定を提供することが求められることが多い（例えば、腎臓移植には血清学的または低分解能タイピングが十分である一方で、血縁関係のない骨髄移植に対しては高分解能アレルレベルタイピングが要求される。）。これらの難問全てを混乱させるのは、個体が父母両方由来のアレルを有する、およびアレル間の差異は非常に小さいもののみであることが多い（例えば４個のアミノ酸のうち、１、２、３個の変化）という事実である。以下の表１は、具体例としてＨＬＡアレルの多様性を例示する。

したがって、配列特異的なオリゴヌクレオチドプローブハイブリッド形成または配列特異的プライマーＰＣＲなどのハイブリッド形成に基づく方法に対するエラー頻度は比較的高い。同様に、ＰＣＲ産物の直接シーケンシングによってハイブリッド形成に付随する難問が排除される一方で、配列リードの分析は、特に大規模グループの試料を処理しなければならない場合、依然として長時間を要する。これに関して、ｄｅＢｒｕｉｊｎグラフ要素（および重み付け）の構造化およびランキングにより、従来からのデータ方式および処理スキーム（例えばマルチ配列アライメントアルゴリズム）と比較した場合、精度およびスピードが大きく向上するので、本明細書中で提示されるシステムおよび方法は全体的なスピードおよび精度、ならびにコンピュータ機能を向上させることに留意すべきである。さらに、発明者により解決された問題がバイオインフォマティクスの分野に特異的であり、オミクス情報の計算なくして存在しないことを理解しなければならない。最後に、分析エンジンにより行われるタスクは、コンピュータシステムの支援なく、ヒトの寿命内で理論的に行われ得ないことを認識すべきである。

典型例において、オミクスデータベース（例えばクリニック、癌研究グループ、民間ゲノム分析会社などから）またはシーケンシング施設もしくは機器により、染色体６ｐ２１．３（またはＨＬＡアレルが見られる位置付近またはその位置の何らかの他の位置）に対する比較的多数の患者配列リードマッピングが提供される。最も一般的には、配列リードはＮｅｘｔＧｅｎシーケンシング（例えばＩｌｌｕｍｉｎａＳｏｌｅｘａ、Ｒｏｃｈｅ４５４ｓｅｑｕｅｎｃｅｒ、ＩｏｎＴｏｒｒｅｎｔｓｅｑｕｅｎｃｅｒなど）を介して作製され、約１００〜３００塩基の長さを有し、リードの品質、アライメント情報、配向、位置などを含め、メタデータを含む。適切なフォーマットとしては、ＳＡＭ、ＢＡＭ、ＦＡＳＴＡ、ＧＡＲなどが挙げられ、患者配列リードが少なくとも５ｘ、より一般的には少なくとも１０ｘ、さらにより一般的には少なくとも２０ｘ、最も一般的には少なくとも３０ｘの被覆度の深度を提供することが一般に好ましい。患者配列リードに加えて、企図される方法は、既知および別個のＨＬＡアレルの複数の配列を含む１つ以上の参照配列をさらに使用する。

例えば、典型的な参照配列は、そのＨＬＡ型の複数のＨＬＡ−アレルを伴う少なくとも１つのＨＬＡ型の配列セグメントを含む合成（対応するヒトまたは他の哺乳動物同等物なし）配列であり得る。例えば、適切な参照配列は、ＨＬＡ−Ａの少なくとも５０個の異なるアレルに対する既知のゲノム配列の一群を含む。あるいは、またはさらに、参照配列は、ＨＬＡ−Ａの少なくとも５０個の異なるアレルに対する既知のＲＮＡ配列の一群も含み得る。当然ではあるが、以下で詳細にさらに論じるように、参照配列はＨＬＡ−Ａの５０個のアレルに限定されないが、ＨＬＡ型およびアレルの数／組成に関して代替的な組成物を有し得る。ＨＬＡ型は一般的には従来の方式で表される。例えば、特定のＨＬＡ遺伝子に対するＨＬＡ型は、ＨＬＡ−Ａ^＊２４：０２：０１：０２Ｌとして記され得、第１文字目はＨＬＡ遺伝子を示し、２４：０２はタイプおよびサブタイプを示し、：０１は同義置換を示し、０２は非コード領域での置換を示す。最後の文字はタンパク質発現を示す。合成参照物に対する適切なＨＬＡアレル配列は、全ての既知の配列を含み、ＩＰＤ−ＩＭＧＴ／ＨＬＡ（ＵＲＬ：ｅｂｉ．ａｃ．ｕｋ／ｉｐｄ／ｉｍｇｔ／ｈｌａ／）からアクセスし得る。

最も一般的には、参照配列は、コンピュータ可読方式であり、データベースまたは他のデータ保存装置から提供される。例えば、適切な参照配列フォーマットとしては、ＦＡＳＴＡ、ＦＡＳＴＱ、ＥＭＢＬ、ＧＣＧまたはＧｅｎＢａｎｋ方式が挙げられ、公開データリポジトリ（例えばＩＭＧＴ、ＩｎｔｅｒｎａｔｉｏｎａｌＩｍＭｕｎｏＧｅｎｅＴｉｃｓｉｎｆｏｒｍａｔｉｏｎｓｙｓｔｅｍまたはＡｌｌｅｌｅＦｒｅｑｕｅｎｃｙＮｅｔＤａｔａｂａｓｅ、ＥＵＲＯＳＴＡＭ，ｗｗｗ．ａｌｌｅｌｅｆｒｅｑｕｅｎｃｉｅｓ．ｎｅｔ）のデータから直接得られ得るかまたは構築され得る。あるいは、参照配列は、アレル頻度、民族アレル分布、一般的または希少アレル型などの１つ以上の所定の基準に基づき、個別の既知のＨＬＡ−アレルからも構築され得る。

参照配列を使用して、患者配列リードは現在、国際公開第２０１７／０３５３９２号（およびその米国国内段階同等物）でも記載されるように最良適合があるアレルを同定するために、ｄｅＢｒｕｉｊｎグラフを通じてスレッド化され得る。この文脈において、各個体が各ＨＬＡ型に対して２個のアレルを保有すること、およびこれらのアレルが非常に類似しているものであり得る、または一部の場合では同一でさえもあり得ることに留意すべきである。このような高度の類似性は、従来からのアライメントスキームの場合はかなりの問題となる。発明者は、今回、配列リードを比較的小さなｋ−マー（一般的には１０〜２０塩基の長さを有する）に分解することにより、およびアレルの配列とマッチする配列リードのｋ−マーに基づいて、各アレルに対して各患者配列リードがボート（ｖｏｔｅ）（「定量的リードサポート」）を提供するウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）過程を実行することにより、ｄｅＢｒｕｉｊｎグラフが構築されるアプローチを使用して、ＨＬＡアレルおよび非常に密接に関連するアレルでさえも分解され得ることを発見した。そしてアレルに対する累積的に最大のボート（ｖｏｔｅ）は、最も可能性高く予測されるＨＬＡアレルを示す。さらに、以下でより詳細にまた示されるように、全体的被覆度およびそのアレルに対する被覆度の深度を計算するために、アレルに対するマッチである各断片も使用されることが一般に好ましい。

同じＨＬＡ型に対する第２のアレルの同定のために、発明者は、さらなる検討事項から最上位ＨＬＡ−アレルが除去される、および調整された（スケーリングされた）ボート（ｖｏｔｅ）を使用して、残っているアレルが再ランキングされる場合、比較的類似した第２のアレルさえも、よりヒューリスティックなアプローチにおいて分解され得ることを発見した。より具体的には、再ランキングは、最上位アレルとマッチがあったｋ−マーに対するボート（ｖｏｔｅ）値が再ランキングボート（ｖｏｔｅ）において低下するように行われる。このような調整ボーティング（ｖｏｔｉｎｇ）は、最上位アレルと類似する遺伝子型に対するウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）を低下させ（しかし削除せず）、したがって遺伝学的に関係性がより小さいアレルにより大きい重みを与える。同時に、同様のアレルは無視されない。ランキングは、全体的な被覆度および被覆度の深度を考慮することによりさらに精密化し得る。例えば、第１の再ランキングアレルは、第２の再ランキングアレルよりも実質的に低い全体的被覆度および被覆度の深度でより高く得点し得る。このような場合、第２の再ランキングアレルは、正確なアレルである可能性がさらに大きくなり得る。次に、最上位再ランキングアレルは、同じＨＬＡ型に対する第２のアレルである。当然ではあるが、および上記のように、再ランキングは、全体的被覆度および被覆度の深度を考慮し得、全体的被覆度および／または被覆度の深度が、使用者が定めた閾値未満になる場合、アレルの失格にさえつながり得る（例えば９４％未満の全体的被覆度および／または１０ｘ未満の被覆度の深度）。さらに、ボート（ｖｏｔｅ）としてのｋ−マーの照合を使用することによってまた、特定のボート（ｖｏｔｅ）における特有のｋ−マーの同定が可能になり、これは、特定のボート（ｖｏｔｅ）が正確な予想であると思われるかまたはそうでないかのさらなる指針となり得る。

当然ではあるが、分析およびＨＬＡ予想が特定のＨＬＡ型に限定される必要はないが、ＨＬＡ−Ｅ、ＨＬＡ−Ｆ、ＨＬＡ−Ｇ、ＨＬＡ−Ｈ、ＨＬＡ−Ｊ、ＨＬＡ−Ｋ、ＨＬＡ−Ｌ、ＨＬＡ−Ｖ、ＨＬＡ−ＤＱＡ１、ＨＬＡ−ＤＭＡ、ＨＬＡ−ＤＭＢ、ＨＬＡ−ＤＯＡ、ＨＬＡ−ＤＯＢ、ＨＬＡ−ＤＰＡ１、ＨＬＡ−ＤＰＢ１、ＨＬＡ−ＤＲＡ、ＨＬＡ−ＤＲＢ３４５、ＨＬＡ−ＭＩＣＡ、ＨＬＡ−ＭＩＣＢ、ＨＬＡ−ＴＡＰ１、ＨＬＡ−ＴＡＰ２およびさらに新しく発見されたＨＬＡ型およびそれらの対応するアレルを含め、全てのＨＬＡ型およびアレル変異体が本明細書中で企図されることが理解されるはずである。さらに、分析が単一のＨＬＡ型に限定される必要はないが、複数のＨＬＡ型が本明細書中での使用に適切であることが理解されるはずである。結果的に、参照配列は、個々のＨＬＡ型に対するアレルの一群とともに、２、３、４個またはそれを超えるＨＬＡ型を含み得る。各ＨＬＡ型が多数のアレルを有するので、参照配列において既知のアレルの全てが含まれる必要はないことが企図される。例えば、参照配列は、少なくとも０．１％または少なくとも０．５％または少なくとも１％または少なくとも２％または少なくとも５％のアレル頻度など、特定の閾値を上回るアレル頻度を有するアレルを含み得る。したがって、および異なる角度から見て、適切な参照配列は、少なくとも１つのＨＬＡ型に対する、少なくとも１０、または少なくとも３０、または少なくとも５０、または少なくとも１００、または少なくとも２００、または少なくとも５００、またはさらにより多くの異なるアレルを含み得る。

同様に、患者配列リードの性質およびタイプがかなり変動し得ることが理解されるはずである。例えば、企図される患者配列リードは、ＤＮＡおよびＲＮＡ配列を含み、これらのそれぞれは、当技術分野で公知の全ての方法を使用して得られ得る。さらに、このような配列リードは、データ記憶装置（例えばデータベース）から、またはシーケンシング装置から提供され得る。例えば、ＤＮＡ配列リードはＮＧＳシーケンシング機器由来であり得、ＲＮＡ配列はｒｔＰＣＲシーケンシング装置由来あり得る。したがって、患者配列リードの長さは、一般的には、２０塩基よりも長く、より一般的には５０塩基よりも長く、最も一般的には１００塩基よりも長いが、一般には５，０００塩基よりも短いか、または３，０００塩基よりも短いか、または１，０００塩基よりも短い。結果的に、企図される患者配列リードは、１００〜５００塩基または１５０〜１，０００塩基の長さを有し得る。

計算時間およびデータ保存および／または記憶要求を低下させるために、患者配列リードが、ＨＬＡ型遺伝子が位置するゲノム領域に対して予め選択されることがさらに好ましい。例えば、染色体６ｐ２１．３にマッピングされる患者配列リードが特に企図される。同様に、患者配列リードもまた、ＨＬＡアレル遺伝子座が知られるゲノムに対する可能性のある位置を示す１つ以上のアノテーションに基づいて選択され得る。あるいは、アノテーションはまた、ＨＬＡアレルであるものとしての配列の確率を直接参照し得る。

患者配列リードの長さにかかわらず、患者配列リードが、比較的短い長さのｋ−マーに分解されることが一般的に好ましく、特に好ましい長さは、一般的には１０〜３０である。特に、このような短いｋ−マー長により、特にこのようなｋ−マーを含有する断片に対するウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）ゆえに、バリアント呼び出しにおいて分解能および精度をより高くできる。したがって、ｋ−マーの長さは一般的には１０〜３０または１５〜３５または２０〜４０である。異なる角度から見て、ｋ−マーは好ましくは６０未満、さらにより好ましくは５０未満、最も好ましくは４０未満の長さを有するが、５より長く、より一般的には８より長く、最も一般的には１０より長い。したがって、例えば適切なｋ−マーは、患者配列リードの長さの５％〜１５％の長さを有する。

ランキングおよび複合マッチスコアに関して、殆どの好ましい態様において、患者配列リードに存在する全てのｋ−マーに基づいてマッチスコアが生成されること、および各ボーティング（ｖｏｔｉｎｇ）（すなわち照合）ｋ−マーが同一のボーティング（ｖｏｔｉｎｇ）力を有することに留意すべきである。結果として、患者配列リードは、参照配列における各アレルに対して特定の定量的なリードサポートを有する。さらに、殆どの例において、ゲノム中の各位置が＞１のシーケンシング深度を有するので、および各患者配列リードがアレルの全長の断片のみをカバーするので、各アレルは、複数の患者配列リードから複数のボート（ｖｏｔｅ）を受け取り得る。最も一般的には、アレルに対するボート（ｖｏｔｅ）は全て、そのアレルに対する複合マッチスコアに到達するために付加される。次に、各アレルに対する複合マッチスコアがランキングおよびさらなる分析のために使用される。

しかし、本発明の主題の代替的な態様において、１つ以上の具体的な目的を達成するために、スコア化および複合スコアの計算をまた改変し得ることに留意すべきである。例えば、断片に対するマッチスコアは、照合ｋ−マーの全てから計算する必要はないが、ｋ−マーの無作為な数または選択のみをカウントし得る。一方で、完全マッチ未満であるｋ−マー（例えば１４／１５マッチ）は、ボーティングライト（ｖｏｔｉｎｇｒｉｇｈｔ）が与えられ得、おそらくボーティングウェイト（ｖｏｔｉｎｇｗｅｉｇｈｔ）はより低い。同様に、および特に、メタデータが入手可能である場合、リード品質が特定の閾値を下回るｋ−マーおよび／または患者配列リードに対してボーティングウェイト（ｖｏｔｉｎｇｗｅｉｇｈｔ）を減少させ得る。一方で、低シーケンシング深度が存在する場合、ボート（ｖｏｔｅ）は特定の断片に対して大きな比率を占め得る。また別の企図される態様において、特にリード深度が比較的高い場合（例えば少なくとも１５ｘまたは少なくとも２０ｘまたは少なくとも３０ｘ）、同じ位置に対する患者配列リードが、ボート（ｖｏｔｅ）に基づいて、削除され得るかまたは含まれ得る。結果として、複合マッチスコアは、入手可能なボート（ｖｏｔｅ）全てに、またはアレルに対して入手可能なボート（ｖｏｔｅ）の一部にのみ基づき得る。

ランキングが一般的には累積的なマッチスコアに依存する一方で、少なくとも１つの因子を使用してランキングがまた補正され得ることを認識すべきである。このような補正因子としては、利用可能な場合、被覆される部分、シーケンシング深度、特有のｋ−マーの量およびその部分のメタデータが挙げられる。例えばアレルの被覆度が所定の閾値を下回る場合（例えば９６％未満または９４％未満または９２％未満など）および／またはシーケンシング深度が所定の閾値を下回る場合（例えば１５ｘ未満、または１２ｘ未満、または１０ｘ未満など）、ボーティングウェイト（ｖｏｔｉｎｇｗｅｉｇｈｔ）をアレルに対して減少させ得る。一方で、特有のｋ−マーのパーセンテージが所定の閾値を上回る（例えば２％上回るかまたは５％上回るかまたは１０％上回る）場合、例えばアレルに対してボーティングウェイト（ｖｏｔｉｎｇｗｅｉｇｈｔ）を増加させることもできる。

最上位アレルは、一般的には、ある一定のＨＬＡ型に対する最初に予想されるアレルであり、一方で第２位のアレルは、同じＨＬＡ型に対する第２のアレルであり得る。しかし、特に最上位に続くランクの多くが同様の複合マッチスコアを有する場合、スコア化が必要に応じてさらに改善され得るかまたは精密化され得ることに留意するべきである。（例えばそれらのスコアのかなりの部分が高度に共有された一連のｋ−マー由来である）。ある好ましい例において、最上位ｋ−マーとマッチする（完全に、または少なくとも９０％、または少なくとも９５％、または少なくとも９７％、または少なくとも９９％の類似度の何れか）ｋ−マーの重みを補正因子により減少させる、再計算を含むスコア精密化手順を実行し得る。このような補正因子は、何らかの所定量によりボート（ｖｏｔｅ）の価値を低くし得る。最も一般的には、補正因子は、１０％、または２０〜４０％、または４０〜６０％、またはそれより大きくボート（ｖｏｔｅ）の価値を低くする。これは、最上位アレルと同様である遺伝子型に対するウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）を減少させる効果を有し、異なっている遺伝子型を比較的より重要にする。したがって、第１のアレルが、全シーケンシングデータからの最大の殆どのサポートに基づいて同定され、一方で第２のアレルは、第２のアレルがデータセットにおいてサポートを有するか否か（例えば、高度調整ウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）および遺伝子型被覆度）またはゲノムが第１の遺伝子型に対してホモ接合であるか否か（例えば高度未加工ウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）、非常に低い調整ウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）、妥当な被覆度を有する他のアレルなし）を決定するために、未加工ウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）、調整したウェイテッドボート（ｗｅｉｇｈｔｅｄｖｏｔｅ）の両方および被覆度を使用してよりヒューリスティクスに基づくアプローチで同定されることに留意すべきである。異なる角度から見て、再ランキングにより、有利に、最上位アレルと同様のアレルの存在下でさえも第２のアレルのより正確な差別化が可能になる。さらに、このような方法によってまた、ホモ接合ＨＬＡ型の容易な同定も可能になる。さらに、このような方法は、ハッシュ表の使用を必要とせず、ＨＬＡ型への配列リードの構築なく、適切なＨＬＡアレルの同定を可能にすることが理解されるはずである。またさらに、企図されるシステムおよび方法によってもまた、ＤＮＡおよび／またはＲＮＡデータの使用が可能になる。

結果的に、上記の方法およびシステムが、１００個体を超えるかまたは２００個体を超えるかまたは５００個体を超えるかまたは１，０００個体を超えるかまたは５，０００個体を超えるかまたは１０，０００個体を超えるかまたはそれを超える分析のためにオミクスデータが存在するかまたは利用可能である場合、様々なオミクスデータからの大規模ＨＬＡ判定に特に適切であることが理解されるはずである。分析の結論時に、各個体のＨＬＡ型をＨＬＡデータベース中に保存し、これは、オミクスデータを提供したかまたはそれを利用可能にした団体およびＨＬＡ適合またはＨＬＡ同一である記録または個体の発見に関心がある第三者を含め、複数の団体によりアクセスされ得る。このようなＨＬＡ適合またはＨＬＡ同一記録または個体は様々な目的に対して使用され得る。主に、ＨＬＡマッチは細胞移植または臓器移植に有用であるが、家族関係の判定、民族性の判定、血液または組織試料の同一性の判定（例えば科学捜査での使用）などにも有用である。

実施例
ＨＬＡ予想を検証するために、１０００ゲノムプロジェクトから３つの独立した既知の患者記録および試料を得て（ＮＡ１９２３８、ＮＡ１９２３９およびＮＡ１９２４０）、次に上で論じたようにＨＬＡ型を予想した。注目すべきことに、および予想外に、上記のようなＤｅＢｒｕｉｊｎグラフ法を使用したＨＬＡ判定および予想は、図１で見られ得るように、ＨＬＡ−Ｃ（ＮＡ１９２３８に対して）、ＤＲＢ１（ＮＡ１９２３９に対して）およびＨＬＡ−Ｃ（ＮＡ１９２４０に対して）を除き、ほぼ完全にマッチした。特に、この３つの食い違いは、公開された記録における不正確なデータとして説明され得る。ここで与えられるＨＬＡ予測法から、３つの個々のデータベースでの５ＨＬＡの多様なパネルにわたり１００％の精度が明らかになった。データによると、「公開」Ｃ^＊１８：０１に対するサポートはなく、一方で、予測Ｃ^＊１８：０２に対しては実質的なサポートがある。さらに、メンデル遺伝は、両アレル上の「公開」ＤＲＢ１^＊１３：０１が不可能であることを示す（ＮＡ１９２３８およびＮＡ１９２３９がＮＡ１９２４０の親であると仮定）。

またさらなる実験において、発明者は、２０個の実際の患者試料に対してＨＬＡ−Ａ、ＨＬＡ−Ｂ、ＨＬＡ−Ｃ、ＨＬＡ−ＤＲＢおよびＨＬＡ−ＤＢＱハロタイプを予測し、配列特異的オリゴヌクレオチド（ＳＳＯ）および配列特異的プライマー（ＳＳＰ）法を使用して契約研究室で予想ＨＬＡ型を検証した。図２から導き出され得るように、全２０個の患者試料にわたる予測精度は１００％であった。同様に、さらなる４０名の患者を分析し、ロングレンジシーケンシング（ＰａｃＢｉｏＳＭＲＴシーケンシング）を使用して、予想ＨＬＡ型を検証した。特に、図３および４から分かり得るように、不調和であったのは４つの予想のみであり、一方で７つの予想は配列決定不能のために確定できなかった。全てのデータのうち残る９７．４％は予想ＨＬＡ型と合致した。

容易に理解されるように、予想ＨＬＡ型は、データベースにおいて保存され得、何れかのドナーＨＬＡ型、および特に骨髄ドナー、幹細胞ドナー、臍帯血ドナーなどおよび／または心臓、肝臓、肺、腎臓、皮膚もしくは膵臓移植待機中の患者などの移植レシピエントに相当し得る。

本明細書中で使用される場合、および文脈から別段の指示がない限り、「〜とカップリングされる（ｃｏｕｐｌｅｄｔｏ）」という用語は、直接的カップリング（互いにカップリングされる２つの要素が互いに接触）および間接的カップリング（少なくとも１つのさらなる要素が２つの要素の間に位置）の両方を含むものとする。したがって、「〜とカップリングされる（ｃｏｕｐｌｅｄｔｏ）」および「〜とともにカップリングされる（ｃｏｕｐｌｅｄｗｉｔｈ）」は、同義的に使用される。さらに、本明細書中で開示される本発明の代替的要素または実施形態の群分けは、制限するものとして解釈されるべきものではない。各群のメンバーは、個々に、または群の他のメンバーまたは本明細書中で見られる他の要素との何らかの組み合わせで言及され、請求され得る。群の１つ以上のメンバーが、便宜および／または特許性の理由で群に含まれ得るかまたは群から削除され得る。何らかのこのような包含または削除が起こる場合、本明細書は、明細書中で、変更され、それにより添付の特許請求の範囲で使用される全マーカッシュグループの記載が満たされるものとしてその群を含有するとみなされる。

本明細書中の発明の概念から逸脱することなく、既に記載のもの以外のさらに多くの変更が可能であることは当業者にとって明らかであるはずである。したがって、本発明の主題は、添付の特許請求の範囲を除き、限定されるものではない。さらに、明細書および特許請求の範囲の両方の解釈において、全ての用語は、内容と合致する最も広い可能な方式で解釈されるべきである。特に、「含む（ｃｏｍｐｒｉｓｅｓ）」および「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」という用語は、包括的な方式で、要素、構成成分または段階を指すものとして解釈されるべきであり、これにより、言及される要素、構成成分または段階が、明らかに言及されない他の要素、構成成分または段階とともに、存在し得るか、または利用され得るか、または組み合わせられ得ることが示される。明細書特許請求の範囲が、Ａ、Ｂ、Ｃ…およびＮからなる群から選択される何かのうち少なくとも１つを指す場合、その文章は、Ａ＋ＮまたはＢ＋Ｎなどでなく、その群から１つのみの要素を必要とすると解釈されるべきである。

Claims

ドナー組織をレシピエント組織と照合する方法であって、
それぞれが臍帯血または骨髄の試料である複数のドナー組織試料に対するオミクスデータを得て；
イン・シリコアルゴリズムを使用して前記オミクスデータから前記ドナー組織試料のそれぞれに対してＨＬＡ型を決定し；
前記複数のドナー組織試料に対するそれぞれのＨＬＡ型を保存するドナー登録簿を作成し；
前記ドナー登録簿において、前記ドナー組織試料の１つを、マッチングＨＬＡ型保有レシピエントと適合性があるものとして同定すること
を含む、方法。
前記オミクスデータが、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび／またはＲＮＡシーケンシングデータである、請求項１に記載の方法。
前記ＨＬＡ型が少なくとも４桁の深度に対して決定される、請求項１に記載の方法。
前記イン・シリコアルゴリズムが、ＤｅＢｒｕｉｊｎグラフおよび少なくとも１つの既知のＨＬＡ型に対する複数のアレルを含む参照配列を使用する、請求項１に記載の方法。
前記参照配列が、アレル頻度が少なくとも１％である少なくとも１個のＨＬＡ型に対するアレルを含む、請求項４に記載の方法。
前記参照配列が、少なくとも１個のＨＬＡ型に対して少なくとも１０個の異なるアレルを含む、請求項４に記載の方法。
前記参照配列が、少なくとも２個の別個のＨＬＡ型に対するアレルを含む、請求項４に記載の方法。
前記ＨＬＡ型が、ＨＬＡ−Ａ型、ＨＬＡ−Ｂ型、ＨＬＡ−Ｃ型、ＨＬＡ−ＤＲＢ−１型およびＨＬＡ−ＤＱＢ−１型のうち少なくとも３個である、請求項１に記載の方法。
前記マッチングＨＬＡ型が血清型判定により判定される、請求項１に記載の方法。
前記ドナー試料が臍帯血である、請求項１に記載の方法。
ドナー組織をレシピエント組織と照合する方法であって、
それぞれが実質臓器に対するレシピエントである複数の移植片レシピエントに対するオミクスデータを得て；
イン・シリコアルゴリズムを使用して前記オミクスデータから前記移植片レシピエントのそれぞれに対するＨＬＡ型を決定し；
複数の前記移植片レシピエントに対する個々のＨＬＡ型を保存するレシピエント登録簿を作成し；
前記レシピエント登録簿において、マッチングＨＬＡ型を有するドナー臓器と適合するものとして前記レシピエントの１名を同定すること
を含む、方法。
前記オミクスデータが、エクソームシーケンシングデータ、全ゲノムシーケンシングデータおよび／またはＲＮＡシーケンシングデータである、請求項１１に記載の方法。
前記ＨＬＡ型が少なくとも４桁の深度に対して決定される、請求項１１に記載の方法。
前記イン・シリコアルゴリズムがＤｅＢｒｕｉｊｎグラフおよび参照配列を使用する、請求項１１に記載の方法。
前記参照配列が、アレル頻度が少なくとも１％である少なくとも１個のＨＬＡ型に対するアレルを含む、請求項１４に記載の方法。
前記参照配列が、少なくとも１個のＨＬＡ型に対して少なくとも１０個の異なるアレルを含む、請求項１４に記載の方法。
前記参照配列が少なくとも２個の別個のＨＬＡ型に対するアレルを含む、請求項１４に記載の方法。
前記ＨＬＡ型が、ＨＬＡ−Ａ型、ＨＬＡ−Ｂ型、ＨＬＡ−Ｃ型、ＨＬＡ−ＤＲＢ−１型またはＨＬＡ−ＤＱＢ−１型である、請求項１１に記載の方法。
前記ＨＬＡ型が、ＨＬＡ−Ａ型、ＨＬＡ−Ｂ型、ＨＬＡ−Ｃ型、ＨＬＡ−ＤＲＢ−１型およびＨＬＡ−ＤＱＢ−１型のうち少なくとも３個である、請求項１１に記載の方法。
前記ドナー臓器が、肺、肝臓、心臓または皮膚である、請求項１１に記載の方法。