WO2022131328A1

WO2022131328A1 - 多型座位の信号の信頼性値の算出方法

Info

Publication number: WO2022131328A1
Application number: PCT/JP2021/046513
Authority: WO
Inventors: 起範金; 崇紀杉元
Original assignee: 株式会社seeDNA
Priority date: 2020-12-16
Filing date: 2021-12-16
Publication date: 2022-06-23
Also published as: US20230227897A1; JP7121440B1; KR20230012033A; JPWO2022131328A1; EP4266315A1

Abstract

本発明の解決すべき課題はｃｆｆＤＮＡ、ｃｔＤＮＡ，ｄｄｃｆＤＮＡのような副次核酸を微小な割合で含む混合核酸サンプルの分析データにおける、副次核酸の存在を示す信号の信頼性を評価する新規の技術を提供することである。上記課題の解決手段は、分析データに含まれる少なくとも副次成分信号強度及び副次成分混入率を含む数値群について線形結合をした結果得られた合成変数と信頼性値について回帰分析を行い、信頼性値を算出するためのモデル関数を求めることである。

Description

多型座位の信号の信頼性値の算出方法

　本発明はＳＮＰｓなどの解析データのデータ処理に関する。

　親子関係の存在・不存在が不明瞭であることは法律的、家族関係などに大きな影響を及ぼす。妊娠している女性の胎内にいる胎児の実父が誰であるのか確信が持てない場合、正しい実父を決定するいくつかの方法がある。
　１つの方法としては、出産まで待ち、子と擬父のゲノムＤＮＡを解析してこれらを比較する方法が挙げられる。しかし、子の出生前にその実父を知りたいというニーズは多い。出生前に親子関係を鑑別する方法としては、絨毛診断や羊水穿刺によって回収した遺伝物質を解析する方法が挙げられるが、これらは侵襲性であり、流産リスクがあるという問題がある。

　上述した侵襲性の診断方法の問題に鑑み、血液に混入した循環無細胞ＤＮＡ（ｃｅｌｌ－ｆｒｅｅ　ＤＮＡ，ｃｆＤＮＡ）を解析する方法を親子鑑定に応用することが行われている。母親の血液循環に混入した胎児由来の遺伝物質である胎児循環無細胞ＤＮＡ（Ｃｅｌｌ－ｆｒｅｅ　ｆｅｔａｌ　ＤＮＡ，ｃｆｆＤＮＡ）の分析を行うことにより、非侵襲的出生前親子鑑定（Ｎｏｎ－Ｉｎｖａｓｉｖｅ　Ｐｒｅｎａｔａｌ　Ｐａｔｅｒｎｉｔｙ　Ｔｅｓｔ，ＮＩＰＰＴ）を実施することが可能となる（例えば特許文献１）。

　ただしｃｆｆＤＮＡの分析には解決しなければならない重要な課題がある。母体血には胎児由来の遺伝物質の他、母親由来の遺伝物質も当然に含まれており、後者の方が前者に比して圧倒的に量が多い。したがって、ｃｆＤＮＡの解析により得られる胎児の遺伝物質の存在を示す信号は微弱なものとなる。そのため、ｃｆＤＮＡの解析により得られた胎児の遺伝物質の存在を示唆する信号が、本当に胎児の遺伝物質に由来するものなのか、それともノイズであるのかを判別することは極めて困難である。

　また、ｃｆＤＮＡの分析技術の応用分野としては上記の出生前遺伝学的検査の他、癌スクリーニング検査や抗癌治療の経過の評価検査などを含む癌検査が挙げられる。癌細胞が免疫によって破壊されたり、自ら細胞死（アポトーシス）を起こしたり、また、血中を循環する循環腫瘍細胞（ＣＴＣ）が何らかの影響によって血中で破壊されたりすると、癌細胞のゲノムＤＮＡが血中に漏出することになる。この癌細胞に由来するｃｆＤＮＡは特別にｃｔＤＮＡ　（ｃｉｒｃｕｌａｔｉｎｇ　ｔｕｍｏｒ　ＤＮＡ）と呼ばれることもある。一方で癌細胞のゲノムＤＮＡには、特異的な一塩基変異が発生することが知られている。癌に関連する変異が生じる多型座位の配列解析をすることによって、癌の早期発見が可能になるものと期待されている（例えば特許文献２）。
　これらの知見を組合せ、血中を循環するｃｆＤＮＡを抽出し、癌に関連する変異が生じる多型座位を解析することで癌検査が可能となる。
　ただ、ｃｆＤＮＡの大部分は検査対象者自身の正常型のゲノムＤＮＡに由来し、癌細胞由来のｃｆＤＮＡが含まれる割合は極微小である。そのため、上記の出生前遺伝学的検査と同様に、ｃｆＤＮＡの解析により得られた癌に関連する変異の存在を示唆する信号が、本当に癌細胞のゲノムＤＮＡに由来するものなのか、それともノイズであるのかを判別することが極めて困難であるという問題がある。

　さらに、ｃｆＤＮＡの分析技術の応用分野として移植臓器の定着のモニタリングなどが挙げられる。免疫抑制剤などの改善により成功率の向上は見られるものの、拒絶反応の問題は未だ移植臓器の長期定着にとって大きな問題である。拒絶反応により移植臓器が障害されたり、壊死に至ったりすると、移植臓器を構成する細胞から血中にゲノムＤＮＡが漏出する。この移植臓器由来のｃｆＤＮＡ（特別にｄｄｃｆＤＮＡと呼ばれることもある）が移植臓器障害のバイオマーカーとして期待されている。具体的には、ドナーとレシピエントの個人識別が可能な一塩基置換（ＳＮＰｓ）を選定し、次世代シーケンサーなどを利用してレシピエントの血液中に漏出する極微量のｄｄｃｆＤＮＡの定量を行う方法である（例えば特許文献３）。
　ただ、ｃｆＤＮＡの大部分はレシピエントのゲノムＤＮＡに由来し、ｄｄｃｆＤＮＡが含まれる割合は極微小であるため、上記の出生前遺伝学的検査と同様に、ｃｆＤＮＡの解析により得られたｄｄｃｆＤＮＡの存在を示唆する信号が、本当に移植臓器のゲノムＤＮＡに由来するものなのか、それともノイズであるのかを判別することが極めて困難であるという問題がある。

特表２０１４－５０２８４５号公報再表２０１７－０９４８０５号公報特表２０２０－５２９６４８号公報

　本発明の解決すべき課題はｃｆｆＤＮＡ、ｃｔＤＮＡ，ｄｄｃｆＤＮＡのような副次核酸を微小な割合で含む混合核酸サンプルの分析データにおける、副次核酸の存在を示す信号の信頼性を評価する新規の技術を提供することにある。

　上記課題を解決する本発明は以下の通りである。

［１］　以下の工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ａ１）及び（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ａ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度
　　（Ａ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率

［工程Ａ－３－１］
　前記工程Ａ－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
［工程Ａ－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［２］　前記合成変数が、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群について主成分分析を行うことで生成し得る合成変数であることを特徴とする、［１］に記載の方法。

［３］　前記工程Ａ－３－１及び工程Ａ－４－１においてモデル関数の作成のために用いる前記合成変数が、工程Ａ－２において生成した１以上の合成変数のうち、最も寄与率が高い合成変数であることを特徴とする、［２］に記載の方法。

［４］　前記工程Ａ―２が、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群について主成分分析を行い、１つ以上の主成分を合成変数として生成する工程であることを特徴とする、［１］～［３］の何れかに記載の方法。

［５］　前記工程Ａ－２が、前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含み、さらに以下の（Ａ３）～（Ａ５）から選ばれる１又は２以上を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程であることを特徴とする、［１］～［４］の何れかに記載の方法。
　　（Ａ３）前記主要核酸に由来する、特定の多型座位の一のアレルの存在を示す主要成分信号強度。
　　（Ａ４）前記特定の多型座位のアレルに起因する信号強度総和に対する前記主要成分信号強度の割合である、主要成分混入率。
　　（Ａ５）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。

［６］　前記工程Ａ－２が、前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び（Ａ２）を含み、さらに以下の（Ａ３）～（Ａ５）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程であることを特徴とする、［１］～［５］の何れかに記載に記載の方法。
　　（Ａ３）前記主要核酸に由来する、特定の多型座位の一のアレルの存在を示す主要成分信号強度。
　　（Ａ４）前記特定の多型座位のアレルに起因する信号強度総和に対する前記主要成分信号強度の割合である、主要成分混入率。
　　（Ａ５）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。

［７］　前記回帰分析が最小二乗法であることを特徴とする、［１］～［６］の何れかに記載の方法。

［８］　前記合成変数を表す１次斉次多項式において、副次成分信号強度又は副次成分混入率が最大に重みづけされることを特徴とする、［１］～［７］の何れかに記載の方法。

［９］　前記工程Ａ－２において線形結合する数値群に含まれる数値は、標準化された数値であることを特徴とする、［１］～［８］の何れかに記載の方法。

［１０］　前記工程Ａ－２において、２つ以上の合成変数を生成し、
　前記工程Ａ－３－１において、前記２つ以上の合成変数のそれぞれについて、信頼性値の付与を行い、
　前記工程Ａ－４－１において、前記２つ以上の合成変数のそれぞれを説明変数とする互いに独立した２以上のモデル関数を作成し、
　さらに、前記２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数を作成する工程を備えることを特徴とする、［１］～［９］の何れかに記載の方法。

［１１］　以下の工程Ａ－１、工程Ａ－３－２及び工程Ａ－４－２を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ－３－２］
　前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度を複数に区分し、各区分に含まれる前記副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記副次成分信号強度に対応する確率として付与する工程。
［工程Ａ－４－２］
　前記各区分に含まれる前記副次成分信号強度と、前記各区分に含まれる前記副次成分信号強度に対応する確率について回帰分析を行い、前記副次成分信号強度を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［１２］　以下の工程Ａ－１、工程Ａ－３－３及び工程Ａ－４－３を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ－３－３］
　前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合である副次成分混入率を複数に区分し、各区分に含まれる前記副次成分混入率に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記副次成分混入率に対応する確率として付与する工程。
［工程Ａ－４－３］
　前記各区分に含まれる前記副次成分混入率と、前記各区分に含まれる前記副次成分混入率に対応する確率について回帰分析を行い、前記副次成分混入率を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［１３］　前記モデル関数が、シグモイド関数であることを特徴とする、［１］～［１２］の何れかに記載の方法。

［１４］　前記モデル関数が、２個の媒介変数を有するシグモイド関数であることを特徴とする、［１］～［１３］の何れかに記載の方法。

［１５］　［１］～［１０］の何れかに記載の方法で作成したモデル関数と、
　［１１］に記載の方法で作成したモデル関数と、
　［１２］に記載の方法で作成したモデル関数と、
　からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。

［１６］　［１］～［１０］の何れかに記載の方法で作成したモデル関数と、
　［１１］に記載の方法で作成したモデル関数、及び／又は、［１２］に記載の方法で作成したモデル関数と、
　を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。

［１７］　［１］～［１０］の何れかに記載の方法で作成したモデル関数と、
　［１１］に記載の方法で作成したモデル関数と、
　［１２］に記載の方法で作成したモデル関数と、
　を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。

［１８］　前記多型座位が、一塩基多型を含む座位であることを特徴とする、［１］～［１７］の何れかに記載の方法。

［１９］　前記データセットが、塩基配列解析、デジタルＰＣＲ、マイクロアレイ、リアルタイムＰＣＲ又は質量分析により取得されたデータであることを特徴とする、［１］～［１８］の何れかに記載の方法。

［２０］　前記データセットが塩基配列解析により取得されたデータであり、
　前記副次成分信号強度が、配列タグのカウント数、リード数、イオン濃度又は電気信号であることを特徴とする、［１］～［１８］の何れかに記載の方法。

［２１］　前記データセットがデジタルＰＣＲにより取得されたデータであり、
　前記副次成分信号強度が、蛍光が観察されたウェル数であることを特徴とする、［１］～［１８］の何れかに記載の方法。

［２２］　前記データセットがマイクロアレイにより取得されたデータであり、
　前記副次成分信号強度が、蛍光強度であることを特徴とする、［１］～［１８］の何れかに記載の方法。

［２３］　前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_１－１、工程Ａ_１－２、工程Ａ_１－３－１及び工程Ａ_１－４－１であることを特徴とする、［１］～［１１］の何れかに記載の方法。
［工程Ａ_１－１］
　母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸と、を含む循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ_１―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、
前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_１－３－１］
　前記工程Ａ_１－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで異型であるアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を真とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで同型であるアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を偽とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を真とする。）
［工程Ａ_１－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［２４］　前記主要寄与体が健常人であり、前記副次寄与体が癌細胞であり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_２－１、工程Ａ_２－２、工程Ａ_２－３－１及び工程Ａ_２－４－１であることを特徴とする［１］～［１０］の何れかに記載の方法。
［工程Ａ_２－１］
　前記健常人に関する遺伝情報を含む主要核酸を含有する健常人より採取した核酸サンプルに、癌に関連する多型座位において癌関連変異が導入された前記多型座位の塩基配列情報を含む複数の核酸断片からなる副次核酸を添加することで人工的に調製した混合核酸サンプルの測定により得られるデータを含むデータセットであり、
　前記主要核酸における正常型のアレルの存在を示す信号と、前記副次核酸における前記変異を含むアレルの存在を示す信号と、を含むデータセットを用意する工程。
［工程Ａ_２－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_２－３－１］
　前記工程Ａ_２－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加した場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は真とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は偽とする。
　前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加していない場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は偽とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は真とする。）
［工程Ａ_２－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［２５］　以下の工程Ａ_２´－１、工程Ａ_２´－２、工程Ａ_２´－３－１及び工程Ａ_２´－４－１を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ_２´－１］
　健常人に関する遺伝情報を含む主要核酸を含有する健常人より採取した核酸サンプルに、癌に関連する単一の多型座位において癌関連変異が導入された前記単一の多型座位の塩基配列情報を含む複数の核酸断片からなる副次核酸を添加することで人工的に調製した、前記副次核酸の含有割合が互いに異なる複数の混合核酸サンプルの測定により得られるデータを含むデータセットであり、
　前記主要核酸における正常型のアレルの存在を示す信号と、前記副次核酸における前記変異を含むアレルの存在を示す信号と、を含むデータセットを用意する工程。
［工程Ａ_２´－２］
　前記データセットに含まれるデータのうち、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された前記単一の多型座位に関する、少なくとも以下の（Ａ１´）及び（Ａ２´）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ａ１´）前記副次核酸に由来する前記単一の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ａ２´）前記単一の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率

［工程Ａ_２－３－１］
　前記工程Ａ_２´－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加した場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は真とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は偽とする。
　前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加していない場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は偽とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は真とする。）
［工程Ａ_２－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［２６］　前記主要寄与体が臓器移植のレシピエントであり、前記副次寄与体が移植臓器であり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_３－１、工程Ａ_３－２、工程Ａ_３－３－１及び工程Ａ_３－４－１であることを特徴とする、［１］～［１０］の何れかに記載の方法。
［工程Ａ_３－１］
　レシピエントに関する遺伝情報を含む主要核酸と、移植臓器に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ_３－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_３－３－１］
　前記工程Ａ_３－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。（但し、レシピエントが有していないアレルであって、かつ、ドナーがホモ接合若しくはヘテロ接合で有しているアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を真とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。
　レシピエント及びドナーの何れもが有していないアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、前記副次成分信号を偽とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、前記副次成分信号を真とする。）
［工程Ａ_３－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。

［２７］　モデル関数にその説明変数を入力することで、信頼性値を算出する信頼性値の算出方法であり、
　前記モデル関数が、
　　［１］～［２６］の何れかに記載の方法で求めた前記モデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
であり、
　前記説明変数が、以下の工程Ｂ－１で用意するデータセットに含まれる以下の（Ｂ１）、（Ｂ２）及び以下の工程Ｂ－２で求めた合成変数から選ばれる１又は２以上の数値であることを特徴とする、信頼性値の算出方法。
［工程Ｂ－１］
　主要寄与体に関する遺伝情報を含む主要核酸を含み、副次寄与体に関する遺伝情報を含む副次核酸を含む若しくは含み得る混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ｂ１）及び（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ｂ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｂ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。

（ただし、式１中、Ａ１は１５．４～１５．６、ｘ０１は－０．８～－０．６である。）

（ただし、式２中、Ａ２は１．８～２．０であり、ｘ０２は２．５～２．７である。）

（ただし、式３中、Ａ３は９．３～９．５であり、ｘ０３は０．５～０．７である。）

［２８］　前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_１－１及び工程Ｂ_１－２であることを特徴とする、［２７］に記載の方法。
［工程Ｂ_１－１］
　母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸と、を含む循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_１―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、
前記母親においてホモ接合であり、かつ、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。

［２９］　前記複数の多型座位が、ヒト個人識別で用いられる多型座位であり、
　非侵襲的出生前親子鑑定のために信頼性値を算出する方法であることを特徴とする、［２８］に記載の方法。

［３０］　前記主要寄与体が検査対象者であり、前記副次寄与体が癌細胞であり、前記混合核酸サンプルが前記検査対象者から採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_２－１及び工程Ｂ_２－２であることを特徴とする、［２７］に記載の方法。
［工程Ｂ_２－１］
　検査対象者に関する遺伝情報を含む主要核酸を含み、癌細胞に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、癌に関連する複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_２―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、正常型のアレルの存在を示す信号と、変異型のアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。

［３１］　前記工程Ｂ_２－２において、前記データセットに含まれるデータから、前記複数の多型座位の中で、検査対象者において変異型のアリルをホモ接合又はヘテロ接合として有している多型座位に関するデータを除外し、
　除外後に残った前記データセットに含まれるデータのうち、前記複数の多型座位の中で、正常型のアレルの存在を示す信号と、変異型のアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成することを特徴とする、［３０］に記載の方法。

［３２］　前記主要寄与体が臓器移植のレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_３－１及び工程Ｂ_３－２であることを特徴とする、［２７］に記載の方法。
［工程Ｂ_３－１］
　レシピエントに関する遺伝情報を含む主要核酸を含み、移植臓器に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_３－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。

［３３］　前記複数の多型座位が、ヒト個人識別で用いられる多型座位であり、
　移植臓器の定着のモニタリングのために信頼性値を算出する方法であることを特徴とする、［３２］に記載の方法。

［３４］　［２７］～［３３］の何れかに記載の方法による信頼性値の算出に適さないデータを除外するための除外条件を設定する方法であり、以下の工程Ｃ－１－１、工程Ｃ－２－１、工程Ｃ－３－１及び工程Ｃ－４－１を備えることを特徴とする除外条件の設定方法。
［工程Ｃ－１－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。（但し、前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルである、又は
　前記主要寄与体がレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルである。）
［工程Ｃ－２－１］
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも以下の（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群を線形結合させて得られる合成変数のうち、最も寄与率が高い合成変数を生成する工程。
　　（Ｃ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｃ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。
　　（Ｃ３）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。

［工程Ｃ－３－１］
　前記工程Ｃ－２－１における前記線形結合により得られた前記合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程。
［工程Ｃ－４－１］
　信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ１として設定する工程。
（除外条件Ｃ１）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、最も寄与率が高い合成変数が、前記工程Ｃ－３－１で設定した前記閾値未満に該当するデータセットは除去する。

［３５］　［２７］～［３３］の何れかに記載の方法による信頼性値の算出に適さないデータを除外するための除外条件を設定する方法であり、以下の工程Ｃ－１－２及び工程Ｃ－２－２、工程Ｃ－３－２及び工程Ｃ－４－２を備えることを特徴とする除外条件の設定方法。
［工程Ｃ－１－２］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
（但し、前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであるか、
又は
　前記主要寄与体がレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルである。）
［工程Ｃ－２－２］
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも以下の（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群を線形結合させて得られる合成変数のうち、一番目又は二番目に寄与率が高い合成変数を生成する工程。
　　（Ｃ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｃ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。
　　（Ｃ３）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。
［工程Ｃ－３－２］
　前記工程Ｃ－２－２における前記線形結合により得られた前記合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程。
［工程Ｃ－４－２］
　信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ２として設定する工程。
（除外条件Ｃ２）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、一番目又は二番目に寄与率が高い合成変数が、前記工程Ｃ－３－２で設定した前記閾値未満に該当するデータセットは除去する。

［３６］　前記多型座位が、ヒト個人識別で用いられる一塩基多型座位であることを特徴とする、［３４又は３５］に記載の方法。

［３７］　移植臓器の定着のモニタリングのための方法であることを特徴とする、［３４］～［３６］の何れかに記載の方法。

［３８］　前記外れ値は、［２７］～［３３］の何れかに記載の方法によって信頼性値を算出したときに、
　前記副次核酸に由来する特定のアレルが前記混合核酸サンプルに含まれているにも関わらず、当該アレルの存在を示す信号の信頼性値が０．８未満として算出されてしまう場合における当該アレルに関する数値、及び／又は
　前記副次核酸に由来する特定のアレルが前記混合核酸サンプルに含まれていないにも関わらず、当該アレルの存在を示す信号の信頼性値が０．２以上として算出されてしまう場合における当該アレルに関する数値であることを特徴とする、［３４］～［３７］の何れかに記載の方法。

［３９］　前記外れ値は、前記合成変数の平均値から、その標準偏差の２倍以上離れた数値であることを特徴とする、［３４］～［３８］の何れかに記載の方法。

［４０］　前記工程Ｂ－１において、
　［３４］に記載の方法で特定した除外条件Ｃ１及び／又は［３５］に記載の方法で特定した除外条件Ｃ２に該当するデータセットを除去した後に残ったデータセットを用意することを特徴とする、［３２］又は［３３］に記載の方法。

［４１］　モデル関数にその説明変数を入力することで、信頼性値を算出する信頼性値の算出方法であり、
　前記モデル関数が、
　　［１］～［２６］の何れかに記載の方法で求めた前記モデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
であり、
　前記説明変数が、以下の工程Ｂ_４－１で用意するデータセットに含まれる以下の（Ｂ１）、（Ｂ２）及び以下の工程Ｂ_４－２で求めた合成変数から選ばれる１又は２以上の数値であることを特徴とする、信頼性値の算出方法。
［工程Ｂ_４－１］
　母親に関する遺伝情報を含む主要核酸と、前記母親の胎内にいる胎児に関する遺伝情報を含む副次核酸と、が含まれる、前記母親から採取された循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、疾患に関連する複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_４―２］
　前記データセットに含まれるデータから、前記複数の多型座位の中で、母親において変異型のアリルをヘテロ接合として有している多型座位に関するデータを除外し、
　除外後に残った前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ｂ１）及び（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ｂ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｂ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。

［４２］　疾患リスクを評価する非侵襲的出生前検査のために信頼性値を算出する方法であることを特徴とする、［４１］に記載の方法。

［４３］　［１］～［４２］の何れかに記載の方法をコンピュータに実行させるためのプログラム。

［４４］　［４３］に記載のプログラムを記録した記録媒体。

［４５］　［１］～［２６］の何れかに記載の方法で作成されたモデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
が記録された記憶媒体。

［４６］　［１］～［２６］の何れかに記載の方法で作成されたモデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
　が記録された記憶部と、［２７］～［３３］及び［４０］～［４２］の何れかに記載の方法を実行する処理部と、を備える、信頼性値算出システム。

［４７］　前記記憶部に、［３４］に記載の方法で作成された除外条件Ｃ１及び／又は［３５］に記載の方法で作成された除外条件Ｃ２が記録されており、
　前記処理部は、［４０］に記載の方法を実行することを特徴とする、［４６］に記載の信頼性値算出システム。

　本発明のモデル関数の作成方法によれば、ｃｆｆＤＮＡ、ｃｔＤＮＡ，ｄｄｃｆＤＮＡのような副次核酸を微小な割合で含む混合核酸サンプルの分析データにおける、副次成分信号の信頼性値を算出するためのモデル関数を作成することができる。

　また、本発明の信頼性値の算出方法によれば、ｃｆｆＤＮＡ、ｃｔＤＮＡ，ｄｄｃｆＤＮＡのような副次核酸を微小な割合で含む混合核酸サンプルの分析データにおける、副次成分信号の信頼性値を算出することができる。

　また、本発明の除外条件の設定方法によれば、前記モデル関数に入力すべき説明変数のデータを絞るため、データセットのうち除外すべきものを判定する除外条件を設定することができる。

モデル関数ｆ１（ｘ１）を示すシグモイド曲線を示す。縦軸の「確率」は信頼性値、横軸の「主成分１」は主成分分析により得られた第１主成分である。図中の白抜きのデータポイントは回帰分析に用いた信頼性値と第１主成分を示す。モデル関数ｆ２（ｘ２）を示すシグモイド曲線を示す。縦軸の「確率」は信頼性値、横軸の「胎児マイナーカウント」は副次成分信号強度絶対値である。図中の白抜きのデータポイントは回帰分析に用いた信頼性値と副次成分信号強度絶対値を示す。モデル関数ｆ３（ｘ３）を示すシグモイド曲線を示す。縦軸の「確率」は信頼性値、横軸の「胎児マイナーフリークエンシー」は副次成分混入率である。図中の白抜きのデータポイントは回帰分析に用いた信頼性値と副次成分混入率を示す。試験例２で算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図である。左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓに関する信頼性値を集計したものである。右は父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する信頼性値を集計したものである。除外条件１の検討のために作成された主成分分析により得られた各主成分をｙ軸、信頼性値をｘ軸にプロットした散布図である。左から第１主成分、第２主成分、第３主成分、第４主成分、第５主成分をｙ軸にとった散布図を示す。除外条件２の検討のために作成された主成分分析により得られた各主成分をｙ軸、信頼性値をｘ軸にプロットした散布図である。左から第１主成分、第２主成分、第３主成分、第４主成分、第５主成分をｙ軸にとった散布図を示す。試験例４において算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図である。左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓに関する信頼性値を集計したものである。右は父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する信頼性値を集計したものである。試験例５において算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図である。左は父母がそれぞれホモ接合で有している互いに異型と同型のＳＮＰｓに関する信頼性値を数で集計したものである。右はそれぞれ異なるＮＧＳターゲットパネル解析となる試験例２と試験例５で算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の割合を示したものである。試験例６において生まれた子供の解析から確定されたＳＮＰｓ遺伝型に対する信頼性値（Ｆｉｄｅｌｉｔｙ）を集計したグラフである。　副次成分信号存在に対する真偽を示す父の遺伝型を考慮せず、母ホモＳＮＰｓ信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を数で集計したものである。試験例２と試験例８において算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図である。左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓに関する信頼性値を集計したものである（胎児遺伝型の正解はヘテロ接合）。右は父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する信頼性値である。試験例６と試験例９において算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図である。左は母がホモ接合で有しており、かつ、新生児がヘテロ接合で有しているＳＮＰｓに関する信頼性値を集計したものである。右は母がホモ接合で有しており、かつ、新生児がホモ接合で有しているＳＮＰｓに関する信頼性値である。

　以下、本発明のモデル関数の作成方法、信頼性値の算出方法、除外条件の設定方法の順に具体的な実施形態の説明を加える。なお、本発明の範囲は以下に説明した具体的な実施形態に限定されない。

＜１＞モデル関数の作成方法
　以下、本発明のモデル関数の作成方法の実施形態について詳述する。「＜１－１＞概要」の項目においては、本発明のモデル関数の作成方法の概要説明を加え、「＜１－２＞出生前遺伝学的検査」の項目においては出生前遺伝学的検査への応用例についての具体的な説明を加え、「＜１－３＞癌検査」の項目においては癌検査への応用例について具体的な説明を加え、「＜１－４＞移植臓器の定着のモニタリング」の項目においては、移植臓器の定着のモニタリングへの応用例について具体的な説明を加える。

＜１－１＞概要
　本発明のモデル関数の作成方法は、工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１を必須工程として含む。以下、順に説明する。

［工程Ａ－１］
　工程Ａ－１は、混合核酸サンプルの測定により得られるデータセットを用意する工程である。
　「混合核酸サンプル」とは、複数の寄与体に関する遺伝情報を含むサンプルである。この情報とはＤＮＡにコードされた遺伝情報の他、ＲＮＡにコードされた遺伝情報を含む。
混合核酸サンプルとしては、ｃｆＤＮＡ、ｃｆＲＮＡを含むサンプルが挙げられ、具体的には、全血、血漿、血清、尿が挙げられ、より好ましくは全血、血漿、血清が挙げられる。

　混合核酸サンプルには、主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸とが含まれる。また、混合核酸サンプルにおける主要核酸と副次核酸の存在比率は、主要寄与体や副次寄与体のステータスによって変動し得る。

　ここでいう「主要寄与体」とは、出生前遺伝学的検査の場合には母親、癌検査の場合には検査対象者、移植臓器のモニタリングにおいてはレシピエントが該当する。つまり、「主要寄与体」とは混合核酸サンプルの取得由来である個体のことをいう。
　また、「主要核酸」とは前記主要寄与体に関する遺伝情報を含む核酸である。主要核酸には、出生前遺伝学的検査の場合には母親ゲノムＤＮＡ若しくはその断片又は母親ゲノムＤＮＡからの転写物であるＲＮＡ（母親由来のｃｆＤＮＡ又はｃｆＲＮＡ）、癌検査の場合には検査対象者のゲノムＤＮＡ若しくはその断片又は検査対象者のゲノムＤＮＡからの転写物であるＲＮＡ（検査対象者由来のｃｆＤＮＡ又はｃｆＲＮＡ）、移植臓器のモニタリングにおいてはレシピエントのゲノムＤＮＡ若しくはその断片又はレシピエントのゲノムＤＮＡからの転写物であるＲＮＡ（レシピエント由来のｃｆＤＮＡ又はｃｆＲＮＡ）が該当する。

　また「副次寄与体」とは、出生前遺伝学的検査の場合には胎児、癌検査の場合には癌細胞、移植臓器のモニタリングにおいては移植臓器が該当する。つまり、「副次寄与体」とは主要寄与体の体内に存在する、主要寄与体の本来の遺伝情報とは異なる遺伝情報を有する個体、組織又は細胞のことをいう。
　また、「副次核酸」とは前記副次寄与体に関する遺伝情報を含む核酸である。副次核酸には、出生前遺伝学的検査の場合には胎児ゲノムＤＮＡ若しくはその断片又は胎児ゲノムＤＮＡからの転写物であるＲＮＡ（胎児由来のｃｆＤＮＡ又はｃｆＲＮＡ）、癌検査の場合には癌細胞のゲノムＤＮＡ若しくはその断片又は癌細胞のゲノムＤＮＡからの転写物であるＲＮＡ（癌細胞由来のｃｆＤＮＡ又はｃｆＲＮＡ）、移植臓器のモニタリングにおいては移植臓器のゲノムＤＮＡ若しくはその断片又はドナーのゲノムＤＮＡからの転写物であるＲＮＡ（移植臓器由来のｃｆＤＮＡ又はｃｆＲＮＡ）が該当する。

　なお、本発明のモデル関数の作成方法は、あくまでもモデル関数を作成することが目的であるため、主要核酸及び副次核酸を含む混合核酸サンプルは人工的なものであっても構わない。例えば、主要核酸を含む血液に、副次核酸を模した核酸をスパイク（添加）することにより、混合核酸サンプルを調製してもよい。

　工程Ａ－１で用意するデータセットには、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットが含まれる。ここで、データセットに含まれる多型座位の数は特に限定されず、好ましくは５以上、より好ましくは１０以上、さらに好ましくは１５以上、さらに好ましくは１８以上である。

　このデータセットは、多型座位における各アレルを区別して検出できる分析手段によって得られたものであれば特に限定されない。当該分析手段としては、好ましくは多型座位における一塩基置換（ＳＮＰｓ）を区別して検出できる分析手段が挙げられる。
　分析手段としては、例えば、ＳＮＰｓの検出に使用される塩基配列解析、デジタルＰＣＲ、マイクロアレイ、リアルタイムＰＣＲなどが挙げられる。

　塩基配列解析の具体的な手段としては次世代シーケンサー（ＮＧＳ）が挙げられる。次世代シーケンサーは、クローン的に増幅された分子及び単一核酸分子の大量の並列配列決定を可能にする配列決定方法である。本発明においては、何れのＮＧＳシステムを採用しても構わない。例えばパイロシーケンシング（ＧＳ　Ｊｕｎｉｏｒ（Ｒｏｃｈｅ社）など）、可逆的色素ターミネーターを使用する合成によるシーケンシング（ＭｉＳｅｑ（Ｉｌｌｕｍｉｎａ社）など）、ライゲーションによるシーケンシング（ＳｅｑＳｔｕｄｉｏ　Ｇｅｎｅｔｉｃ　Ａｎａｌｙｚｅｒ（Ｔｈｅｒｍｏ　Ｆｉｓｈｅｒ　ＳＣＥＮＴＩＦＩＣ社）など）、イオン半導体シーケンシング（Ｉｏｎ　Ｐｒｏｔｏｎ　Ｓｙｓｔｅｍ（Ｔｈｅｒｍｏ　Ｆｉｓｈｅｒ　ＳＣＥＮＴＩＦＩＣ社）など）、ＣＭＯＳ（相補型金属酸化膜半導体）チップによるシーケンシング（ｉＳｅｑ　１００　Ｓｙｓｔｅｍ（Ｉｌｌｕｍｉｎａ社）など）などが挙げられる。
　次世代シーケンサーによって読み込んだ配列データを解析し、多型座位における特定の配列（特定のＳＮＰｓ）を有するアレルのリード数を、当該アレルの存在を示す信号として解釈することができる。
　また、次世代シーケンサーに供するライブラリーの調製段階において、核酸分子を個別に識別可能にするバーコード配列（Ｕｎｉｑｕｅ　Ｍｏｌｅｃｕｌａｒ　Ｉｄｅｎｔｉｆｉｅｒｓ（ＵＭＩ），Ｕｎｉｑｕｅ　Ｍｏｌｅｃｕｌａｒ　Ｔａｇ（ＵＭＴ））を解析対象の核酸断片に連結させた場合、多型座位における特定の配列（特定のＳＮＰｓ）を有するアレルであることを特定するＵＭＴのカウント数を当該アレルの存在を示す信号として解釈することができる。
　本発明における分析手段として次世代シーケンサーを採用する場合、あらかじめ既知である多型座位を特異的に増幅するターゲットシーケンス法を採用することが好ましい。

　デジタルＰＣＲは、１ウェルあたりに核酸分子が１分子入るか、入らないかという程度となるように多数のウェルへサンプルを分配して個別にＰＣＲを行う方法である。ターゲット配列を含むウェルではＰＣＲ増幅が進んで蛍光シグナルが検出されるが、ターゲット配列を含まないウェルではＰＣＲ増幅が進まず、蛍光シグナルは検出されない。ＰＣＲ後、各ウェルでシグナル増幅の「ある（＋）／なし（－）」を判別し、シグナルの「ある（＋）」ウェル数をターゲットのコピー数として算出する。
　デジタルＰＣＲにＳＮＰｓなどの変異を精度よく判別可能なプローブ（ＴａｑＭａｎＲプローブやサイクリングプローブなど）を組み合わせれば、特定の配列（特定のＳＮＰｓ）を有するアレルが増幅されたウェルのみで蛍光が観察される。アレルごとに異なる発光波長を有する蛍光標識プローブを設計すれば、一つの多型座位に存在する異なるアレルを蛍光色によってそれぞれ区別して検出することができる。特定のアレルに対応する蛍光シグナルの「ある（＋）」ウェル数を当該アレルの存在を示す信号として解釈することができる。

　マイクロアレイは、既知の配列を有するＤＮＡ、ＤＮＡ断片、ｃＤＮＡ、オリゴヌクレオチド、ＲＮＡまたはＲＮＡ断片などの核酸をプローブとして、数百個～数十万個まで配列して固相化させ、プローブに相補的な配列を有する核酸がハイブリダイズした際に、これを蛍光標識により検出する方法である。ＳＮＰｓタイピングを行うマイクロアレイを特にＳＮＰアレイともいう。
　一つの座位に複数のアレルが想定される場合、各アレルを別個に固相化することで、これらを区別して検出することが可能となる。特定のアレルが固相化されたポイントにおける蛍光強度を当該アレルの存在を示す信号として解釈することができる。

　リアルタイムＰＣＲは、ＰＣＲによる核酸の増幅量に応じて生じる蛍光を分光蛍光光度計によりリアルタイムでモニターし解析する方法である。リアルタイムＰＣＲにＳＮＰｓなどの変異を精度よく判別可能なプローブ（ＴａｑＭａｎＲプローブやサイクリングプローブなど）を組み合わせることが好ましい。アレルごとに異なる発光波長を有する蛍光標識プローブを設計すれば、一つの多型座位に存在する異なるアレルを蛍光色によってそれぞれ区別して検出することができる。
　リアルタイムＰＣＲによりデータセットを得ようとする場合、測定効率を向上させる観点からマルチプレックスＰＣＲを採用することが好ましい。マルチプレックスＰＣＲは、複数組のプライマーを使用し、複数のターゲット配列を一つの反応系中で一度に増幅する方法である。
　リアルタイムＰＣＲにおいては、特定のアレルに対応する蛍光シグナルの強度を当該アレルの存在を示す信号として解釈することができる。

　質量分析は、分子をイオン化し、その質量荷電比（ｍ/ｚ）を測定することによってイオンや分子の質量を測定する分析法である。本来は分子の質量を測定する方法であるが、特定の条件（特定のプライマーを使用してＰＣＲを実施した場合や、特定の制限酵素で核酸分子を切断した場合など）で調製した核酸分子の質量が計測できれば、その質量をデータベースと照合することで、検出された核酸分子の塩基配列を同定することができる。このことから、質量分析はジェノタイピングに広く応用されている。
　質量分析においては、特定のアレルを含む塩基配列に特有のｍ／ｚにおけるイオン強度を当該アレルの存在を示す信号として解釈することができる。

　工程Ａ－１で用意するデータセットは、上述したアレルの存在を示す信号の真偽が既知であることを要する。つまり、ある特定のアレルの存在を示す信号が検出された場合に、当該アレルの塩基配列を含む主要核酸又は副次核酸が混合核酸サンプルに含まれているか否かが既知であることを要する。

　なお、工程Ａ－１はデータセットを用意する工程である。したがって、データセットを一次的に取得するための核酸分析の工程は、本発明の必須要素でない。言い換えると、工程Ａ－１の具体的な実施態様として、本発明の実施者自身が核酸分析によって一次的にデータを取得することで上記データセットを用意する形態も当然に含まれるが、これに限られない。工程Ａ－１の具体的な実施態様には、本発明の実施者以外の者が核酸分析によって一次的に取得したデータセットを二次的に取得することで上記データセットを用意する形態も当然に含まれる。

［工程Ａ―２］
　工程Ａ－２は、上述のデータセットに含まれるデータについて主成分分析を行う工程である。具体的には、前記データセットに含まれるデータのうち、複数の多型座位の中で、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、以下の（Ａ１）及び（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する。

　（Ａ１）は副次成分信号強度である。副次成分信号強度とは、副次核酸に由来する、特定の多型座位のアレルの存在を示す信号の強度である。
　混合核酸サンプルの分析で互いに区別されて検出された２種類のアレルの存在を示す信号が、それぞれ主要核酸と副次核酸のどちらに由来するのか確認することは容易である。
　循環無細胞核酸サンプルにおいては、ほとんどの場合、副次核酸よりも主要核酸の方が多く含まれるため、必然的に副次成分信号強度は、上述の主要成分信号強度よりも弱くなる。このような場合にはその内の信号強度が弱い方を副次成分信号強度とみなすことができる。
　一方、例えば妊娠後期における母親由来核酸と胎児由来核酸の比率、また、癌が進行している場合の患者由来核酸と癌由来核酸の比率は、通常の場合と逆転していることがある。つまり、循環無細胞核酸サンプルにおける副次核酸の量が主要核酸の量と同等又はそれ以上となる場合があり得る。このような特殊な場合には、ジェノタイピングによって主要寄与体の遺伝型を予め特定しておき、混合核酸サンプルの分析結果と比較すればよい。これによって、混合核酸サンプルの分析によって互いに区別されて検出された２種類のアレルの存在を示す信号が、それぞれ主要核酸と副次核酸のどちらに由来するのか判断できる。

　データセットを一次的に取得した際に使用された測定手段の種類やその後のソフトウェアなどによるデータ処理によって、副次成分信号強度を表す単位や表現などは多岐に渡る。本発明においては副次核酸に由来する特定の多型座位のアレルの存在を示す信号強度を反映する数値の全てを包含して「副次成分信号強度」と呼ぶ。つまり、当該信号強度を直接的に表す数値の他、当該数値に定数を乗じた数値や、当該数値の累乗値及び累乗根など当該信号強度を反映する全ての数値が「副次成分信号強度」に含まれる。

　例えば、副次成分信号強度の元データを標準化した数値も「副次成分信号強度」との文言に含まれる。標準化の詳細は後述する。

　また、検出された他のパラメータに基づき副次成分信号強度の元データを加工して得られた数値も「副次成分信号強度」という文言に含まれる。副次成分信号強度の元データの加工のために用いられる「他のパラメータ」としてはノイズが挙げられる。ノイズの定義は後述の通りである。

　例えば、副次成分信号強度の元データから、解析の対象である複数の多型座位におけるノイズ強度又はその平均値を引いた数値も、「副次成分信号強度」として扱うことができる。ノイズ強度の平均値を求める際の母数は、ノイズが検出された多型座位の数であっても、解析対象とした全ての多型座位の数であってもよい。

　具体的には、ノイズが検出された多型座位及びノイズが検出されなかった多型座位の区別なく、一律に副次成分信号強度の元データから前記ノイズ強度の平均値を差し引く実施形態としてもよい。
　また、ノイズが検出された特定の多型座位についてのみ、副次成分信号強度の元データから前記ノイズ強度の平均値を差し引く実施形態としてもよい。
　また、ノイズが検出された特定の多型座位の副次成分信号強度から、当該特定の多型座位について検出されたノイズ強度を差し引く実施形態としてもよい。

　また、前記特定の多型座位のアレルの存在を示す副次成分信号強度を、前記複数の多型座位におけるノイズ強度の平均値により割った数値を「副次成分信号強度」として扱う実施形態としてもよい。
　つまり以下の式で表される数値を「副次成分信号強度」として扱う実施形態としてもよい。
　　（副次成分信号強度）／（ノイズ強度の平均値）

　この通り「副次成分信号強度」というとき、これは１種類の数値のみを表すものではなく複数種類の数値を包含している。したがって、工程Ａ－２において線形結合の対象となる数値群には、１種類の「副次成分信号強度」のみが含まれている形態であってもよいし、２種以上の「副次成分信号強度」が含まれていてもよい。

　（Ａ２）は副次成分混入率である。副次成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合である。つまり、「副次成分混入率＝副次成分信号強度／信号強度総和」という数式で表すことができる。

　上記（Ａ１）における説明と同様の理由から、副次成分混入率を表す単位や表現などは多岐に渡る。本発明においては特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合を反映する数値の全てを包含して「副次成分混入率」と呼ぶ。つまり、当該割合を直接的に表す数値の他、当該数値に定数を乗じた数値や、当該数値の累乗値及び累乗根など当該割合を反映する全ての数値が「副次成分混入率」に含まれる。

　例えば、副次成分混入率の元データを標準化した数値も「副次成分混入率」との文言に含まれる。標準化の詳細は後述する。

　また、検出された他のパラメータに基づき副次成分混入率の元データを加工して得られた数値も「副次成分混入率」という文言に含まれる。副次成分混入率の元データの加工のために用いられる「他のパラメータ」としてはノイズが挙げられる。ノイズの定義は後述の通りである。

　例えば、副次成分混入率の元データから、解析の対象である複数の多型座位における信号強度総和に対するノイズ強度の割合（ノイズ混入率）又はその平均値を引いた数値も、「副次成分混入率」として扱うことができる。ノイズ混入率の平均値を求める際の母数は、ノイズが検出された多型座位の数であっても、解析対象とした全ての多型座位の数であってもよい。

　具体的には、ノイズが検出された多型座位及びノイズが検出されなかった多型座位の区別なく、一律に副次成分混入率の元データから前記ノイズ混入率の平均値を差し引く実施形態としてもよい。
　また、ノイズが検出された特定の多型座位についてのみ、副次成分混入率の元データから前記ノイズ混入率の平均値を差し引く実施形態としてもよい。
　また、ノイズが検出された特定の多型座位の副次成分混入率から、当該特定の多型座位について検出されたノイズ強度のノイズ混入率を個別に差し引く実施形態としてもよい。

　また、前記特定の多型座位の副次成分混入率を、複数の多型座位におけるノイズ強度の平均値により割った数値を「副次成分混入率」として扱う実施形態としてもよい。
　つまり以下の式で表される数値を「副次成分混入率」として扱う実施形態としてもよい。
　　（副次成分混入率）／（ノイズ強度の平均値）

　この通り「副次成分混入率」というとき、これは１種類の数値のみを表すものではなく複数種類の数値を包含している。したがって、工程Ａ－２において線形結合の対象となる数値群には、１種類の「副次成分混入率」のみが含まれている形態であってもよいし、２種以上の「副次成分混入率」が含まれていてもよい。

　工程Ａ－２において線形結合の対象となる数値群には、上述の（Ａ１）及び（Ａ２）以外の数値が含まれていてもよい。つまり、特定の多型座位に関する（Ａ１）及び（Ａ２）の他、当該特定の多型座位に関する種々の測定値ないし算出値を含む数値群に対して線形結合を行う。
　以下に線形結合の対象となる数値群に含めてもよい数値（Ａ３）～（Ａ５）について説明を加える。なお、以下に掲げる（Ａ３）～（Ａ５）から選ばれる１種のみを前記数値群に含めてもよいし、任意に選択された２種以上の数値を前記数値群に含めてもよい。また、（Ａ３）～（Ａ５）の全てを前記数値群に含めてもよい。

　（Ａ３）は主要成分信号強度である。主要成分信号強度とは、主要核酸に由来する、特定の多型座位の一のアレルの存在を示す信号の強度である。
　上述の通り循環無細胞核酸サンプルにおいては、ほとんどの場合、副次核酸よりも主要核酸の方が多く含まれるため、必然的に主要成分信号強度は、上述の副次成分信号強度よりも弱くなる。このような場合にはその内の信号強度が強い方を主要成分信号強度とみなすことができる。
　一方、例えば妊娠後期における母親由来核酸と胎児由来核酸の比率、また、癌が進行している場合の患者由来核酸と癌由来核酸の比率は、通常の場合と逆転していることがある。つまり、循環無細胞核酸サンプルにおける副次核酸の量が主要核酸の量と同等又はそれ以上となる場合があり得る。このような特殊な場合には、ジェノタイピングによって主要寄与体の遺伝型を予め特定しておき、混合核酸サンプルの分析結果と比較すればよい。これによって、混合核酸サンプルの分析によって互いに区別されて検出された２種類のアレルの存在を示す信号が、それぞれ主要核酸と副次核酸のどちらに由来するのか判断できる。

　上記（Ａ１）の説明と同様の理由により、当該信号強度を直接的に表す数値の他、当該数値に定数を乗じた数値や、当該数値の累乗値及び累乗根など当該信号強度を反映する全ての数値が「主要成分信号強度」に含まれる。工程Ａ－２において線形結合の対象となる数値群には、１種類の「主要成分信号強度」のみが含まれている形態であってもよいし、２種以上の「主要成分信号強度」が含まれていてもよい。

　（Ａ４）は主要成分混入率である。主要成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する主要成分信号強度の割合である。つまり、「主要成分混入率＝主要成分信号強度／信号強度総和」という数式で表すことができる。
　上記（Ａ２）の説明と同様の理由により、当該割合を直接的に表す数値の他、当該数値に定数を乗じた数値や、当該数値の累乗値及び累乗根など当該信号強度を反映する全ての数値が「主要成分混入率」に含まれる。工程Ａ－２において線形結合の対象となる数値群には、１種類の「主要成分混入率」のみが含まれている形態であってもよいし、２種以上の「主要成分混入率」が含まれていてもよい。

　（Ａ５）はノイズである。
　生物学的、遺伝学的または試験系上の理由から、ある特定の一塩基多型座位において塩基「Ａ」または塩基「Ｇ」を示す信号は観察され得るが、塩基「Ｔ」及び塩基「Ｃ」を示す信号は観察し得ない状況を考える。このような状況としては、特定の一塩基多型座位において父親が「Ａ」をホモ接合で保有し、母親が「Ｇ」をホモ接合で保有する場合における、胎児の前記特定の一塩基多型を観察する状況が例として挙げられる（当該特定の一塩基多型座位において胎児が「Ｔ」及び「Ｃ」を保有していることは通常考えられない）。このような状況において、本来は観察し得ない塩基である「Ｔ」及び「Ｃ」を示す信号が観察された場合、この信号を「ノイズ」であると本発明では定義する。
　つまり、ノイズは、特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるものであり、「信号強度総和－（主要成分信号強度＋副次成分信号強度）」の数式で表すことができる。

　上述の通り工程Ａ－１で用意するデータセットは複数の多型座位に関するデータの集合である。そのため、いうまでもないが、工程Ａ－１で用意するデータセットには、特定の多型座位に関する上記（Ａ１）及び（Ａ２）並びに他の数値データを一組とするデータが複数組含まれることになる。

　なお、線形接合の対象となる数値群に含まれる数値データは標準化されていることが好ましい。標準化データは以下の式で求めることができる。
　　標準化データ＝［（元データ）－（平均値）］／（標本標準偏差）

　「主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位」とは、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号が混在していない多型座位をいう。

　例えば、出生前遺伝学的検査の場合、ある特定の多型座位において、母親がアレルＡとアレルＢをヘテロ接合として有している場合には、父親の遺伝型の如何に関わらず、ｃｆＤＮＡの解析の結果、母親のゲノムＤＮＡに由来するアレルＡとアレルＢの信号が必ず検出されてしまう。アレルＡとアレルＢの信号の何れかには、胎児のｃｆｆＤＮＡに起因する信号が混じっているはずであるが、これを母親のゲノムＤＮＡに由来する信号と区別することができない。このようなデータを解析の基礎に加えるとモデル関数の精度が落ちてしまう。

　また、癌検査の場合、検査対象者が先天的に癌に関連する変異をホモ接合又はヘテロ接合として有していた場合、当該変異は必ずｃｔＤＮＡにも含まれるため、検査対象由来の信号と癌細胞由来の信号とが混じることになる。このようなデータを解析の基礎に加えるとモデル関数の精度が落ちてしまう。

　また、移植臓器の定着のモニタリングの場合、ある特定の多型座位において、レシピエントがアレルＡとアレルＢをヘテロ接合として有している場合には、ドナーの遺伝型の如何に関わらず、ｃｆＤＮＡの解析の結果、レシピエントのゲノムＤＮＡに由来するアレルＡとアレルＢの信号が必ず検出されてしまう。アレルＡとアレルＢの信号の何れかには、ドナーのｃｆｆＤＮＡに起因する信号が混じっているはずであるが、これをレシピエントのゲノムＤＮＡに由来する信号と区別することができない。このようなデータを解析の基礎に加えるとモデル関数の精度が落ちてしまう。

　以上のことから工程Ａ－２においては、データ解析の対象とする多型座位を「主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位」に限定している。工程Ａ－２の解析対象とする多型座位は、副次核酸に由来するアレルの存在を示す信号に、主要核酸に由来するアレルの存在を示す信号が混じっている可能性が無い多型座位と言い換えてもよい。

　工程Ａ－２では上述した数値群を対象として線形結合させて１つ以上の合成変数を生成する。線形結合の手段としては主成分分析が好ましく例示できる。なお、別手段で生成した合成変数であっても構わない。別手段で生成する合成変数であっても、これが主成分分析で生成し得る合成変数であることが好ましい。

　線形結合により生成された合成変数は以下の１次斉次多項式により表される。なお、ｎはデータセットに含まれる数値のうち、線形結合の対象である数値群に含まれる数値の種類の数を表す２以上の整数である。Ｘｎは線形結合の対象である数値群に含まれる数値である。ａ１ｎは線形結合を行う数値を重みづける係数である。
　　Ｚ１＝ａ１１Ｘ１＋ａ１２Ｘ２＋・・・＋ａ１ｎＸｎ
　本発明の好ましい実施形態では、合成変数を表す１次斉次多項式において、副次成分信号強度又は副次成分混入率が最大に重みづけされる。

　生成できる合成変数の数は、線形結合の対象となる数値群に含まれる数値の種類が多いほど増加する。工程Ａ－２で生成する合成変数の数は特に限定されない。

　少なくとも（Ａ１）及び（Ａ２）を含む数値群の線形結合によって合成変数を生成する実施形態について説明したが、前記数値群の非線形結合によって合成変数を生成する実施形態としてもよい。ここで、非線形結合とは、各数値のべき乗、各数値同士の積、商及びこれらの数値を指数に持つ関数等を指す。

　工程Ａ－２の線形結合により得られた合成変数は、信頼性値と相関する関係にある。この相関関係を利用してモデル関数を作成するのであるが、その具体的な工程として、本発明は以下の工程Ａ－３－１と工程Ａ－４－１を有する。

［工程Ａ－３－１］
　工程Ａ－３－１は、線形結合により生成された合成変数に信頼性値を割り当てる工程である。
　工程Ａ－３－１に供する合成変数は特に限定されないが、線形結合の対象となった数値群を最もよく反映する合成変数が好ましく挙げられる。言い換えると線形結合の対象となった数値群に対して最も高い寄与率を示す合成変数が好適に例示できる。これは主成分分析における第１主成分に相当するものである。

　工程Ａ－３－１においては、まず、線形結合により生成した合成変数を複数に区分する。つまり、合成変数をその数値の大きさに応じて複数に区分する。
　区分の方法は特に制限されない。合成変数の大きさに応じて等間隔に区分をしてもよいが、各区分の全てに生成された合成変数が包含されるように区分することが好ましい。さらに好ましい形態では、合成変数の大きさに応じて直線的に区分をするのではなく、指数的に区分をすることが好ましい。なぜならば、生成した合成変数と確率を曲線回帰するとシグモイド曲線となるからである。

　区分の数は限定されないが、好ましくは３区分以上、より好ましくは５区分以上、さらに好ましくは７区分以上、さらに好ましくは１０区分以上、さらに好ましくは１２区分以上、さらに好ましくは１５区分以上、さらに好ましくは１８区分以上に分ける。

　次に、各区分に含まれる合成変数に対応する副次成分信号強度のうちこれが真であった割合を求める。つまり、各区分に含まれる全ての合成変数のうち、真であった副次成分信号強度に対応する合成変数の割合を求める。本明細書においては、この割合を「確率」と呼ぶ。
　なお、副次成分信号強度は、副次核酸における当該多型座位に存在する特定のアレルの存在を示唆するものである。この副次成分信号強度による示唆通り、実際に副次核酸に当該特定のアレルが存在する場合には、これを「真」とする。

　合成変数の各区分における確率を求めた後、これを各区分に含まれる合成変数に対応する確率として付与する。具体的には、各区分を代表する一の合成変数の値に当該区分における確率を割り当てる。この工程により、合成変数と確率の散布図が作成可能な状態となる。

［工程Ａ－４－１］
　工程Ａ－４－１においては、上述した各区分に含まれる合成変数と、各区分に含まれる合成変数に対応する確率について回帰分析を行う。これにより合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める。

　「確率」と「信頼性値」は対応関係にある。本明細書においては、モデル関数を作成するために用いられるパラメータを「確率」と呼び、モデル関数に説明変数を入力することで算出されるパラメータを「信頼性値」と呼ぶ。

　工程Ａ－４－１における回帰分析の手法は特に限定されないが、最小二乗法が好ましく例示できる。
　モデル関数はシグモイド関数となる。合成変数が主成分分析における第１主成分である場合、モデル関数は以下の式１で表すことができる。

　なお、本発明においては、上記式１の場合に限らず、２個の媒介変数を有するシグモイド関数の形式で信頼性値を算出するためのモデル関数を作成することが好ましい。式１における媒介変数はＡ１とｘ０１が該当する。

　式１中、Ａ１は好ましくは１５．４～１５．６であり、より好ましくは１５．５である。また、ｘ０１は好ましくは－０．８～－０．６であり、より好ましくは－０．９である。なお、小数点第２位を四捨五入したときに上記数値に該当するものは、ここで規定した数値範囲内に含まれるものとする。

　上述の方法により取得したモデル関数は極めて汎用性が高い。工程Ａ－１で用意したデータセットの取得条件とは異なる条件で一次的に取得したデータセットの解析にも応用できる。例えば、工程Ａ－１で用意したデータセットの取得条件との間で、サンプル量や濃度の違い、解析した多型座位の違い、信号の種類（リード数やＵＭＴカウント）の違いがある条件で一次的に取得したデータセットにおける信頼性値の算出に、当該モデル関数を応用できる。
　つまり、別の条件で取得されたデータセットについて信頼性値の算出をしたい場合に、当該別の条件について改めてモデル関数を作成する必要が無い。いったん本発明の方法によりモデル関数を作成しておけば、別条件で取得されたデータセットの解析にも転用できる。

　さらには、モデル関数の作成の基礎としたデータセットとは異なる種類の検査によって得られたデータセットの解析にも応用できる。例えば、出生前遺伝学的検査に関するデータセットに基づいて作成したモデル関数は、癌検査や移植臓器の定着のモニタリングにおいて取得されたデータセットの解析に転用することができる。

　なお、モデル関数の作成のために用いた、線形結合に供した数値群に含まれる数値の種類及びその個数と、モデル関数への入力値とする合成変数を生成するための線形結合に供した数値群に含まれる数値の種類及びその個数は、一致していることが好ましい。

　以上、合成変数と信頼性値との相関関係に基づくモデル関数の作成方法について説明したが、本発明はこれに留まらず、別の指標を説明変数とする信頼性値を算出するためのモデル関数を提供することができる。本発明は、後述するモデル関数ｆ２（ｘ２）、ｆ３（ｘ３）を作成する方法にも関する。以下、それぞれのモデル関数を作成する方法について詳述する。

　まずモデル関数ｆ２（ｘ２）を作成する方法について説明する。この方法は、工程Ａ－１、工程Ａ－３－２及び工程Ａ－４－２を備える。工程Ａ－１の内容については上述した通りである。以下、工程Ａ－３－２及び工程Ａ－４－２について説明する。

［工程Ａ－３－２］
　工程Ａ－３－２においては、まず上述の（Ａ１）副次成分信号強度を複数に区分する。つまり、（Ａ１）副次成分信号強度をその数値の大きさに応じて複数に区分する。
　区分の方法は特に制限されない。副次成分信号強度の大きさに応じて等間隔に区分をしてもよいが、各区分の全てに副次成分信号強度が包含されるように区分することが好ましい。さらに好ましい形態では、副次成分信号強度の大きさに応じて直線的に区分をするのではなく、指数的に区分をすることが好ましい。なぜならば、副次成分信号強度と信頼性値を曲線回帰するとシグモイド曲線となるからである。

　次に、各区分に含まれる副次成分信号強度に対応する副次成分信号強度のうちこれが真であった割合を求める。つまり、各区分に含まれる全ての副次成分信号強度の数値のうち、真であった副次成分信号強度の割合を求める。本明細書においては、この割合を「確率」と呼ぶ。
　なお、副次成分信号強度は、副次核酸における当該多型座位に存在する特定のアレルの存在を示唆するものである。この副次成分信号強度による示唆通り、実際に副次核酸に当該特定のアレルが存在する場合には、これを「真」とする。

　副次成分信号強度の各区分における確率を求めた後、これを各区分に含まれる副次成分信号強度に対応する確率として付与する。具体的には、各区分を代表する一の副次成分信号強度の値に当該区分における確率を割り当てる。この工程により、副次成分信号強度と確率の散布図が作成可能な状態となる。

［工程Ａ－４－２］
　工程Ａ－４－２においては、上述した各区分に含まれる副次成分信号強度と、各区分に含まれる副次成分信号強度に対応する確率について回帰分析を行う。これにより副次成分信号強度を説明変数ｘ２、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数ｆ２（ｘ２）を求める。工程Ａ－４－２における回帰分析の手法は特に限定されないが、最小二乗法が好ましく例示できる。
　モデル関数ｆ２（ｘ２）はシグモイド関数となり、以下の式２で表すことができる。

　上述の方法により取得したモデル関数ｆ２（ｘ２）は極めて汎用性が高く、いったん本発明の方法によりモデル関数ｆ２（ｘ２）を作成しておけば、別条件で取得されたデータセットの解析にも転用できる。また、モデル関数ｆ２（ｘ２）の作成の基礎としたデータセットとは異なる種類の検査によって得られたデータセットの解析にも応用できる。

　式２中、Ａ２は好ましくは１．８～２．０であり、より好ましくは１．９である。また、ｘ０２は好ましくは２．５～２．７であり、より好ましくは２．６である。なお、小数点第２位を四捨五入したときに上記数値に該当するものは、ここで規定した数値範囲内に含まれるものとする。

　次にモデル関数ｆ３（ｘ３）を作成する方法について説明する。この方法は以下の工程Ａ－３－３及び工程Ａ－４－３を備える。

［工程Ａ－３－３］
　工程Ａ－３－３においては、まず上述の（Ａ２）副次成分混入率を複数に区分する。つまり、（Ａ２）副次成分混入率をその数値の大きさに応じて複数に区分する。　区分の方法は特に制限されない。副次成分混入率の大きさに応じて等間隔に区分をしてもよいが、各区分の全てに副次成分混入率が包含されるように区分することが好ましい。
　さらに好ましい形態では、副次成分混入率の大きさに応じて直線的に区分をするのではなく、指数的に区分をすることが好ましい。なぜならば、副次成分混入率と確率を曲線回帰するとシグモイド曲線となるからである。

　次に、各区分に含まれる副次成分混入率に対応する副次成分信号強度のうちこれが真であった割合を求める。つまり、各区分に含まれる全ての副次成分混入率の数値のうち、真であった副次成分混入率の割合を求める。本明細書においては、この割合を「確率」と呼ぶ。
　なお、副次成分混入率はその算出根拠として副次成分信号強度を含むが、この副次核酸における当該多型座位に存在する特定のアレルの存在を示唆するものである。この副次成分混入率の算出根拠である副次核酸信号強度による示唆通り、実際に副次核酸に当該特定のアレルが存在する場合には、これを「真」とする。

　副次成分混入率の各区分における確率を求めた後、これを各区分に含まれる副次各成分混入率に対応する確率として付与する。具体的には、各区分を代表する一の副次成分混入率の値に当該区分における確率を割り当てる。この工程により、副次成分混入率と信頼性値の散布図が作成可能な状態となる。

［工程Ａ－４－３］
　工程Ａ－４－３においては、上述した各区分に含まれる副次成分混入率と、各区分に含まれる副次成分混入率に対応する確率について回帰分析を行う。これにより副次成分混入率を説明変数ｘ３、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数ｆ３（ｘ３）を求める。工程Ａ－４－３における回帰分析の手法は特に限定されないが、最小二乗法が好ましく例示できる。
　モデル関数ｆ３（ｘ３）はシグモイド関数となり、以下の式３で表すことができる。

　式３中、Ａ３は好ましくは９．３～９．５であり、より好ましくは９．４である。また、ｘ０３は好ましくは０．５～０．７であり、より好ましくは０．６である。なお、小数点第２位を四捨五入したときに上記数値に該当するものは、ここで規定した数値範囲内に含まれるものとする。

　上述した複数のモデル関数はそれぞれ単独でデータセットに含まれる副次成分信号強度の信頼性を評価するのに有用である。しかし、作成した複数のモデル関数を互いに乗じることで、より有用なモデル関数を作成することができる。

　例えば、工程Ａ－２において、２つ以上の合成変数を生成し、工程Ａ－３－１において、その２つ以上の合成変数のそれぞれについて、信頼性値の付与を行う。次いで工程Ａ－４－１において、２つ以上の合成変数のそれぞれを説明変数とする互いに独立した２以上のモデル関数を作成する。この２以上のモデル関数を互いに乗じることで、乗算で表されるモデル関数を作成する実施の形態としても構わない。

　また、以下の３つのモデル関数から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数を作成してもよい。本発明の好ましい形態では、以下の３つのモデル関数の全てを互いに乗じて、乗算により表されるモデル関数を作成してもよい。
　・工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１によって作成したモデル関数
　・工程Ａ－１、工程Ａ－３－２及び工程Ａ－４－２によって作成したモデル関数
　・工程Ａ－１、工程Ａ－３－３及び工程Ａ－４－３によって作成したモデル関数

　本発明の好ましい実施の形態では、以下の式４に示すように、上述したモデル関数ｆ１（ｘ１）、モデル関数ｆ２（ｘ２）、モデル関数ｆ３（３）を互いに乗じて作成したモデル関数を用いる。

＜１－２＞出生前遺伝学的検査
　次いで出生前遺伝学的検査より得られたデータセットからモデル関数の作成を行う実施形態について説明する。なお、「＜１－１＞概要」の項目において説明した事項は本実施形態にも妥当する。そのため、説明が重複する部分については適宜省略しながら本実施形態について説明する。

　本実施形態においては、主要寄与体には母親、副次寄与体には母親の胎内にいる胎児、混合核酸サンプルには母親から採取された循環無細胞核酸サンプルが該当する。
　「＜１－１＞概要」の項目において説明した工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１は、本実施形態における工程Ａ_１－１、工程Ａ_１－２、工程Ａ_１－３－１及び工程Ａ_１－４－１に相当する。以下、各工程について説明する。

［工程Ａ_１－１］
　工程Ａ_１－１は、循環無細胞核酸サンプルの測定により得られるデータセットを用意する工程である。循環無細胞核酸サンプルには、母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸が含まれている。通常、循環無細胞核酸サンプルには、主要核酸が副次核酸よりも多く含まれる。一方、妊娠後期にはその含有比率が逆転することもある。

　このデータセットには、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号が含まれる。多型座位としては、ヒト個人識別（Ｈｕｍａｎ　Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ，ＨＩＤ）で用いられる一塩基多型（ＳＮＰｓ）のある座位が好ましく挙げられる。ＨＩＤで用いられる既知のＳＮＰｓはデータベース化されており、これらのＳＮＰｓのある多型座位を任意に選択することができる。

　なお、各アレルの存在を示す信号の真偽は既知であることが必要である。信号の真偽を既知の状態とする手段としては、出生後の子について確定的な遺伝子検査を行う方法が挙げられる。また、実父と母親について確定的な遺伝子検査を行った結果、ある多型座位において父母共にホモ接合として同型又は異型のアレルを有している場合には、当該多型座位における胎児のアレル型を確定的に特定することができる。

［工程Ａ_１―２］
　工程Ａ_１－２は、データセットに含まれるデータのうち、複数の多型座位の中で、母親においてホモ接合であり、父親においてホモ接合であり、かつ、主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び（Ａ２）の数値について、線形結合を行う工程である。
　母親においてホモ接合であり、父親においてホモ接合である多型座位に絞っているため、主要成分信号強度と副次成分信号強度の両方に母親ゲノムＤＮＡ由来の信号が寄与することはあり得ない。

［工程Ａ_１－３－１］
　工程Ａ_１－３－１は、線形結合により生成した合成変数に信頼性値を割り当てる工程であり、上述した工程Ａ－３－１の説明内容が全て妥当する。なお、副次成分信号強度の真偽については以下の通り判別する。

　母親においてホモ接合であり、父親（実父）においてホモ接合であり、かつ、母親と父親とで異型であるアレルについては、父親由来のアレルに起因する副次成分信号が、母親がホモ接合で有するアレルとは区別されて検出されるはずである。
　したがって、前記アレルについて、主要成分信号と区別されて副次成分信号が検出された場合、当該副次成分信号を真とする。
　また、前記アレルについて、主要成分信号と区別されて副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。これは、副次成分信号が非検出であったという結果が偽であるということである。

　一方、母親においてホモ接合であり、父親（実父）においてホモ接合であり、かつ、母親と父親とで同型であるアレルについては、父親由来のアレルは母親がホモ接合で有するアレルと区別して検出することはできない。
　したがって、前記アレルについて主要成分信号と区別されて副次成分信号が検出された場合、当該副次成分信号を偽とする。
　また、主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を真とする。これは、副次成分信号が非検出であったという結果が真であるということである。

［工程Ａ_１－４－１］
　工程Ａ_１－４－１はモデル関数を求める工程であり、上述した工程Ａ－４－１の説明内容が全て妥当する。

　また、当然ながら本実施形態においても、副次成分信号強度を説明変数ｘ２とするモデル関数ｆ２（ｘ２）、副次成分混入率を説明変数ｘ３とするモデル関数ｆ３（ｘ３）を求めることが好ましい。本実施形態においてモデル関数を求める具体的態様は、上述した工程Ａ－４－２及び工程Ａ－４－３に関する説明が妥当する。
　また、本実施形態においても、作成した複数のモデル関数を互いに乗じて、乗算で表されるモデル関数を作成してもよい。その具体的な実施形態は上述した通りである。

＜１－３＞癌検査
　次いで癌検査より得られたデータセットからモデル関数の作成を行う実施形態について説明する。なお、「＜１－１＞概要」の項目において説明した事項は本実施形態にも妥当する。そのため、説明が重複する部分については適宜省略しながら本実施形態について説明する。

　本実施形態においては、主要寄与体は癌に関連する変異が観察される多型座位において正常型のアレルを有する健常人、副次寄与体は癌細胞が該当する。

　なお、本実施形態において、混合核酸サンプルは、健常人に関する遺伝情報を含む主要核酸を含有する健常人より採取した核酸サンプルに、癌に関連する変異が導入された多型座位の塩基配列情報を含む複数の核酸断片からなる副次核酸をスパイク（添加）することで人工的に調製したものである。
　より具体的には、健常人から採取された循環無細胞核酸サンプルに、癌に関連する変異型のアレルの配列を含む核酸断片をスパイクして人工的に調製した混合核酸サンプルが好ましく挙げられる。
　混合核酸サンプルは、健常人より採取した核酸サンプルに、人工的に合成した核酸断片をスパイクすることで調製してもよい。
　また、健常人より採取した核酸サンプルに、癌細胞株若しくは癌組織、又はその核酸抽出物をスパイクすることで混合核酸サンプルを調製してもよい。

　混合核酸サンプルは、癌検査の検査対象者の循環無細胞核酸サンプルを模したものである。混合核酸サンプルにおける主要核酸と副次核酸の混合比率は特に制限されないが、混合核酸サンプルには、主要核酸が副次核酸よりも多く含まれるように調整することが好ましい。言い換えると、副次核酸における特定の座位に起因する信号が、主要核酸における当該座位に起因する信号よりも小さくなるように、副次核酸をスパイクすることが好ましい。
　したがって、スパイクする副次核酸は主要核酸に対して、遺伝子のコピー数として好ましくは５０％未満、より好ましくは４０％以下、さらに好ましくは３０％以下、さらに好ましくは２０％以下、さらに好ましくは１０％以下とする。

　スパイクする核酸断片は、癌に関連する変異が含まれていればその断片長は特に制限されないが、好ましくは５０～５００ｂｐ、より好ましくは１００～３００ｂｐ、さらに好ましくは１２０～２００ｂｐのものが好適に例示できる。

　癌に関連する変異、特に一塩基置換変異が観察される多型座位は多数知られており、これらはデータベース化されている。スパイクする核酸断片としては、これら既知の癌関連一塩基置換変異のうちから任意のものを複数選択することができる。

　「＜１－１＞概要」の項目において説明した工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１は、本実施形態における工程Ａ_２－１、工程Ａ_２－２、工程Ａ_２－３－１及び工程Ａ_２－４－１に相当する。以下、各工程について説明する。

［工程Ａ_２－１］
　工程Ａ_２－１は、上述した副次核酸がスパイクされた混合核酸サンプルの測定により得られるデータを含むデータセットを用意する工程である。
　なお、工程Ａ_２－１において用意するデータセットには、副次核酸がスパイクされておらず主要核酸のみを含む核酸サンプルの測定により得られるデータも含まれていてもよい。

　このデータセットには、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号が含まれる。多型座位としては、癌に関連することが知られている一塩基多型（ＳＮＰｓ）のある座位が好ましく挙げられる。癌に関連するＳＮＰｓはデータベース化されており、これらのＳＮＰｓのある多型座位を任意に選択することができる。

［工程Ａ_２－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び（Ａ２）の数値について、線形結合を行う工程である。

［工程Ａ_２－３－１］
　工程Ａ_２－３－１は、線形結合により得られた合成変数に信頼性値を割り当てる工程であり、上述した工程Ａ－３－１の説明内容が全て妥当する。なお、副次成分信号強度の真偽については以下の通り判別する。

　前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルにスパイクした場合には、該核酸断片について副次成分信号が検出されるはずである。
　したがって、この場合、該核酸断片について副次成分信号が検出された場合、当該副次成分信号は真とする。
　また、該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は偽とする。これは、副次成分信号が非検出であったという結果が真であるということである。

　一方、前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加していない場合には、該核酸断片について副次成分信号は検出されないはずである。
　したがって、この場合、該核酸断片について副次成分信号が検出されたとき、当該副次成分信号は偽とする。
　また、この場合、該核酸断片について副次成分信号が検出されなかったとき、当該副次成分信号は真とする。これは、副次成分信号が非検出であったという結果が真であるということである。

［工程Ａ_２－４－１］
　工程Ａ_２－４－１はモデル関数を求める工程であり、上述した工程Ａ－４－１の説明内容が全て妥当する。

　また、当然ながら本実施形態においても、副次成分信号強度を説明変数ｘ２とするモデル関数ｆ２（ｘ２）、副次成分混入率を説明変数ｘ２とするモデル関数ｆ２（ｘ２）を求めることが好ましい。本実施形態においてモデル関数を求める具体的態様は、上述した工程Ａ－４－２及び工程Ａ－４－３に関する説明が妥当する。
　また、本実施形態においても、作成した複数のモデル関数を互いに乗じて、乗算で表されるモデル関数を作成してもよい。その具体的な実施形態は上述した通りである。

　また、癌検査より得られたデータセットからモデル関数の作成を行う別の実施形態について説明する。本実施形態の特徴は、単一の多型座位に関するデータに基づきモデル関数の作成を行う点にある。
　具体的には、以下の工程Ａ_２´－１、工程Ａ_２´－２及び上述の工程Ａ_２－３－１及び工程Ａ_２－４－１を含む。以下詳述するが、上述した他の実施形態についての説明が妥当する事項については説明を省略する。

［工程Ａ_２´－１］
　工程Ａ_２´－１は、上述した副次核酸が互いに異なる含有割合でスパイクされた複数の混合核酸サンプルの測定により得られるデータセットを用意する工程である。工程Ａ_２－１との違いは、副次核酸が互いに異なる含有割合でスパイクされた複数の混合核酸サンプルを用意する点にある。
　また、上述した工程Ａ_２－１は複数の多型座位に関するデータが含まれる一方、工程Ａ２´－１のデータセットにおいては、主要核酸及び副次核酸における、単一の多型座位における各アレルの存在を示す信号が含まれていればよい点でも相違する。
　つまり、工程Ａ_２´－１は、単一の多型座位に関するデータを用意すればよい一方、副次核酸の含有割合が互いに異なる複数の混合核酸サンプルに関するデータを用意する点に特徴がある。

［工程Ａ_２´－２］
　工程Ａ_２´－２は、データセットに含まれるデータのうち、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された単一の多型座位に関する、少なくとも以下の（Ａ１´）及び（Ａ２´）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程である。
　　（Ａ１´）前記副次核酸に由来する前記単一の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ａ２´）前記単一の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率

　なお、（Ａ１´）と（Ａ２´）は、工程Ａ_２´－１で用意するデータが単一の多型座位に関するデータであることから表現上の差異が生じているに過ぎず、その本質は上で説明した（Ａ１）と（Ａ２）と同一である。

　続く工程Ａ_２－３－１及び工程Ａ_２－４－１は上述した通りであるため、詳細な説明は省略する。

　なお、工程Ａ_２´－１、工程Ａ_２´－２及び上述の工程Ａ_２－３－１及び工程Ａ_２－４－１を含む実施形態は、検量線を作成する一般的な手法が無いマイクロアレイやデジタルＰＣＲ、塩基配列決定手段（特に次世代シーケンサー）により取得されたデータからモデル関数を作成する場合に有用である。

＜１－４＞移植臓器の定着のモニタリング
　次いで移植臓器の定着のモニタリングより得られたデータセットからモデル関数の作成を行う実施形態について説明する。なお、「＜１－１＞概要」の項目において説明した事項は本実施形態にも妥当する。そのため、説明が重複する部分については適宜省略しながら本実施形態について説明する。

　本実施形態においては、主要寄与体が臓器移植のレシピエント、副次寄与体がドナーから移植される移植臓器に該当する。

　本実施形態における混合核酸サンプルは、レシピエントに関する遺伝情報を含む主要核酸と、移植臓器に関する遺伝情報を含む副次核酸を含む。混合核酸サンプルにおいては、主要核酸が副次核酸よりも多く含まれる。なお当然のことながら移植臓器に関する遺伝情報はドナーに関する遺伝情報と一致する。
　なお、混合核酸サンプルは、移植後のレシピエントから取得したサンプル、具体的には循環無細胞核酸サンプルであってもよい。
　または、レシピエントから取得したレシピエント由来の主要核酸と、ドナー又は移植臓器から取得したドナー由来の副次核酸を人工的に混合することで調製してもよい。この場合、主要核酸に起因する信号が副次核酸に起因する信号よりも強く検出されるように、主要核酸に対して副次核酸をコピー数として好ましくは５０％未満、より好ましくは４０％以下、さらに好ましくは３０％以下、さらに好ましくは２０％以下、さらに好ましくは１０％以下の割合で混合する。

　「＜１－１＞概要」の項目において説明した工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１は、本実施形態における工程Ａ_３－１、工程Ａ_３－２、工程Ａ_３－３－１及び工程Ａ_３－４－１に相当する。以下、各工程について説明する。

［工程Ａ_３－１］
　工程Ａ_３－１は、上述した混合核酸サンプルの測定により得られるデータセットを用意する工程である。
　このデータセットには、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号が含まれる。多型座位としては、ヒト個人識別（Ｈｕｍａｎ　Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ，ＨＩＤ）で用いられる一塩基多型（ＳＮＰｓ）のある座位が好ましく挙げられる。ＨＩＤで用いられる既知のＳＮＰｓはデータベース化されており、これらのＳＮＰｓのある多型座位を任意に選択することができる。

　なお、各アレルの存在を示す信号の真偽は既知であることが必要である。信号の真偽を既知の状態とする手段としては、レシピエントとドナーそれぞれのゲノムＤＮＡを解析することでそれぞれの遺伝型を特定する方法が挙げられる。これによりレシピエントとドナーの双方が有していないアレルの存在を示す信号が得られた場合には、これが偽であると判別できる。

　また、レシピエントから取得したレシピエント由来の主要核酸と、ドナー又は移植臓器から取得したドナー由来の副次核酸を人工的に混合することで調製した混合核酸サンプルについてのデータセットであれば、レシピエントが有しておらず、ドナーがヘテロ接合又はホモ接合として有しているアレルの存在を示す信号が得られたとき、これを真であると判別することができる。

　工程Ａ_３－１で用意するデータセットに、レシピエントの遺伝情報を有する主要核酸のみを含む核酸サンプルに関するデータを含めることも有用である。当該核酸サンプルにはドナーに由来する副次核酸が含まれていないため、レシピエントが有していないがドナーが有しているアレルの存在を示す信号が得られたとき、これを偽であると判別することができる。

［工程Ａ_３－２］
　工程Ａ_３－２は、データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び（Ａ２）の数値について、線形結合を行う工程である。
　具体的には、ある多型座位において、レシピエントが特定のアレルをホモ接合として有している場合には、当該特定のアレル以外の別のアレルの存在を示す副次成分信号強度には、レシピエントのアレルに起因する信号が混じることはあり得ない。この場合には、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号は区別して検出される。

［工程Ａ_３－３－１］
　工程Ａ_３－３－１は線形結合により生成された合成変数に信頼性値を割り当てる工程であり、上述した工程Ａ－３－１の説明内容が全て妥当する。なお、副次成分信号強度の真偽については以下の通り判別する。

　レシピエントが有していないアレルであって、かつ、ドナーがホモ接合若しくはヘテロ接合で有しているアレルについては、レシピエントが有するアレルと区別されてドナーが有しているアレルに由来する副次成分信号が検出されるはずである。
　したがって、前記アレルについて、主要成分信号と区別されて副次成分信号が検出された場合、当該副次成分信号を真とする。
　また、前記アレルについて、主要成分信号と区別されて副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。これは、副次成分信号が非検出であったという結果が偽であるということである。

　一方、レシピエント及びドナーの何れもが有していないアレルについては、レシピエントが有するアレルと区別されて副次成分信号が検出されることは無い。
　したがって、前記アレルについて、主要成分信号と区別されて副次成分信号が検出された場合、当該副次成分信号を偽とする。
　また、前記アレルについて、主要成分信号と区別されて副次成分信号が検出されなかった場合、当該副次成分信号を真とする。これは、副次成分信号が非検出であったという結果が真であるということである。

［工程Ａ_３－４－１］
　工程Ａ_３－４－１はモデル関数を求める工程であり、上述した工程Ａ－４－１の説明内容が全て妥当する。

＜２＞信頼性の算出方法
　本発明は信頼性の算出方法にも関する。以下、本発明の信頼性の算出方法の具体的な実施態様について説明する。なお、上述したモデル関数の作成方法の説明の内容のうち本発明の信頼性の算出方法の説明に妥当する部分については適宜省略する。

　本発明の信頼性の算出方法は、モデル関数にその説明変数を入力することで、信頼性値を算出する信頼性値の算出方法である。ここでいうモデル関数とは、上述の方法で求めたモデル関数、式１～３の何れかのモデル関数、又は式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数が挙げられる。

　モデル関数に入力すべき数値は、それぞれのモデル関数において説明変数とされているものである。具体的には、以下の工程Ｂ－１で用意するデータセットに含まれる以下の（Ｂ１）、（Ｂ２）及び以下の工程Ｂ－２で求めた合成変数から選ばれる１又は２以上の数値を説明変数としてモデル関数に入力する。

　本発明の信頼性の算出方法は以下の工程Ｂ－１を備える。また、モデル関数に入力すべき数値が合成変数である場合には、以下の工程Ｂ－２によって合成変数を生成する。
　以下、工程Ｂ－１、工程Ｂ－２及び工程Ｂ－３－１を備える実施形態について説明する。

［工程Ｂ－１］
　工程Ｂ－１は、主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸とを含む混合核酸サンプルの測定により得られるデータセットを用意する工程である。当該混合核酸サンプルには、主要核酸が副次核酸よりも多く含まれる。そして、当該データセットには、主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号が含まれる。

　前記データセットの取得方法は特に限定されない。後述する分析手段を利用して一次的に取得しても構わないし、第三者が一次的に取得したものを二次的に取得しても構わない。
　データセットは、多型座位における各アレルを区別して検出できる分析手段によって得られたものであれば特に限定されない。当該分析手段としては、好ましくは多型座位における一塩基置換（ＳＮＰｓ）を区別して検出できる分析手段が挙げられる。

　分析手段としては、例えば、ＳＮＰｓの検出に使用される次世代シーケンサーや、デジタルＰＣＲ、マイクロアレイ、マルチプレキシングＰＣＲ、質量分析などが挙げられる。これらの具体的な内容については「＜１＞モデル関数の作成方法」の項目で説明した通りである。

　混合核酸サンプルの種類も限定されない。例えば、出生前遺伝学的検査のために取得された妊婦の血液等から取得された循環無細胞核酸サンプル（ｃｆＤＮＡ、ｃｆＲＮＡ）や、癌検査のために取得された検査対象者の血液等から取得された循環無細胞核酸サンプル（ｃｆＤＮＡ、ｃｆＲＮＡ）や、移植臓器の定着のモニタリングのために取得されたレシピエントの血液等から取得された循環無細胞核酸サンプル（ｃｆＤＮＡ、ｃｆＲＮＡ）が好ましく挙げられる。

　なお、本発明の信頼性の算出方法におけるデータセットには、複数の多型座位における各アレルの存在を示す信号が含まれるが、この「複数の多型座位」は、モデル関数の作成の基礎として使用された「複数の多型座位」と同一である必要は無く、その重複度も限定は無い。

　当該重複度は、モデル関数の作成の基礎として使用された「複数の多型座位」を基準として、好ましくは８０％以下であってもよいし、より好ましくは７０％以下であってもよいし、さらに好ましくは６０％以下であってもよいし、さらに好ましくは５０％以下であってもよい。

　また、当該重複度は、モデル関数の作成の基礎として使用された「複数の多型座位」を基準として、０％であってもよいし、好ましくは１０％以上であってもよいし、さらに好ましくは２０％以上であってもよいし、さらに好ましくは３０％以上であってもよいし、さらに好ましくは４０％以上であってもよい。

［工程Ｂ―２］
　工程Ｂ－２は、前記データセットに含まれるデータのうち、複数の多型座位の中で、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、以下の（Ｂ１）及び（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程である。

　（Ｂ１）は副次成分信号強度である。副次成分信号強度とは、副次核酸に由来する、特定の多型座位のアレルの存在を示す信号の強度である。その定義や具体的態様については上記（Ａ１）に関する説明がそのまま妥当する。

　（Ｂ２）は副次成分混入率である。副次成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合である。つまり、「副次成分混入率＝副次成分信号強度／信号強度総和」という数式で表すことができる。その定義や具体的態様については上記（Ａ２）に関する説明がそのまま妥当する。

　工程Ｂ－２において線形結合の対象となる数値群には、上述の（Ｂ１）及び（Ｂ２）以外の数値が含まれていてもよい。つまり、特定の多型座位に関する（Ｂ１）及び（Ｂ２）の他、当該特定の多型座位に関する種々の測定値ないし算出値を含む数値群に対して線形結合を行う。
　以下に線形結合の対象となる数値群に含めてもよい数値（Ｂ３）～（Ｂ５）について説明を加える。なお、以下に掲げる（Ｂ３）～（Ｂ５）から選ばれる１種のみを前記数値群に含めてもよいし、任意に選択された２種以上の数値を前記数値群に含めてもよい。また、（Ｂ３）～（Ｂ５）の全てを前記数値群に含めてもよい。

　（Ｂ３）は主要成分信号強度である。主要成分信号強度とは、主要核酸に由来する、特定の多型座位の一のアレルの存在を示す信号の強度である。その定義や具体的態様については上記（Ａ３）に関する説明がそのまま妥当する。

　（Ｂ４）は主要成分混入率である。主要成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する主要成分信号強度の割合である。つまり、「主要成分混入率＝主要成分信号強度／信号強度総和」という数式で表すことができる。その定義や具体的態様については上記（Ａ１）に関する説明がそのまま妥当する。

　（Ｂ５）はノイズである。その定義や具体的態様については上記（Ａ１）に関する説明がそのまま妥当する。

　上述の通り工程Ｂ－１で用意するデータセットは複数の多型座位に関するデータの集合である。そのため、いうまでもないが、工程Ｂ－１で用意するデータセットには、特定の多型座位に関する上記（Ｂ１）及び（Ｂ２）並びに他の数値データを一組とするデータが複数組含まれることになる。

　なお、線形接合の対象となる数値群に含まれる数値データは標準化されていることが好ましい。「標準化」とは周知の通り、複数あるデータの平均をゼロ、分散が1になるように変換することであり、「基準化」や「正規化」と呼ばれることもある。標準化データは以下の式で求めることができる。
　　標準化データ＝［（元データ）－（平均値）］／（標本標準偏差）

　例えば、出生前遺伝学的検査の場合、ある特定の多型座位において、母親がアレルＡとアレルＢをヘテロ接合として有している場合には、父親の遺伝型の如何に関わらず、ｃｆＤＮＡの解析の結果、母親のゲノムＤＮＡに由来するアレルＡとアレルＢの信号が必ず検出されてしまう。アレルＡとアレルＢの信号の何れかには、胎児のｃｆｆＤＮＡに起因する信号が混じっているはずであるが、これを母親のゲノムＤＮＡに由来する信号と区別することができない。このようなデータは本発明の分析対象から除外する。

　また、癌検査の場合、検査対象者が先天的に癌に関連する変異をホモ接合又はヘテロ接合として有していた場合、当該変異は必ずｃｔＤＮＡにも含まれるため、検査対象由来の信号と癌細胞由来の信号とが混じることになる。このようなデータは本発明の分析対象から除外する。

　また、移植臓器の定着のモニタリングの場合、ある特定の多型座位において、レシピエントがアレルＡとアレルＢをヘテロ接合として有している場合には、ドナーの遺伝型の如何に関わらず、ｃｆＤＮＡの解析の結果、レシピエントのゲノムＤＮＡに由来するアレルＡとアレルＢの信号が必ず検出されてしまう。アレルＡとアレルＢの信号の何れかには、ドナーのｃｆｆＤＮＡに起因する信号が混じっているはずであるが、これをレシピエントのゲノムＤＮＡに由来する信号と区別することができない。このようなデータは本発明の分析対象から除外する。

　以上のことから工程Ｂ－２においては、データ解析の対象とする多型座位を「主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位」に限定している。工程Ｂ－２の解析対象とする多型座位は、副次核酸に由来するアレルの存在を示す信号に、主要核酸に由来するアレルの存在を示す信号が混じっている可能性が無い多型座位と言い換えてもよい。

　工程Ｂ－２では上述した数値群を対象として線形結合させて１つ以上の合成変数を生成する。線形結合の手段としては主成分分析が好ましく例示できる。なお、別手段で生成した合成変数であっても構わない。別手段で生成する合成変数であっても、これが主成分分析で生成し得る合成変数であることが好ましい。

　生成できる合成変数の数は、線形結合の対象となる数値群に含まれる数値の種類が多いほど増加する。工程Ｂ－２で生成する合成変数の数は特に限定されない。

　以上のようにして得た数値をモデル関数に入力することで信頼性値を算出する工程が、以下の工程Ｂ－３－１～工程Ｂ－３－４である。

［工程Ｂ－３－１］
　工程Ｂ－３－１は、工程Ｂ－２における線形結合により生成した合成変数を、その合成変数を説明変数、信頼性値を目的変数とする上述したモデル関数に入力し、信頼性値を算出する工程である。なお、モデル関数の作成のために用いた、線形結合に供した数値群に含まれる数値の種類及びその個数と、モデル関数への入力値とする合成変数を生成するための線形結合に供した数値群に含まれる数値の種類及びその個数は、一致していることが好ましい。

　また、本発明は、上述の工程Ｂ－１及び以下の工程Ｂ－３－２を含むことを特徴とする、信頼性値の算出方法にも関する。

［工程Ｂ－３－２］
　工程Ｂ－３－２は、前記（Ｂ１）の副次成分信号強度を、上述したモデル関数ｆ２（ｘ２）に入力し、信頼性値を算出する工程である。データセットに一次的に含まれる副次成分信号強度をモデル関数ｆ２（ｘ２）に入力するという操作で簡便にデータの信頼性値を算出することができる。

　また、本発明は、上述の工程Ｂ－１及び以下の工程Ｂ－３－３を含むことを特徴とする、信頼性値の算出方法にも関する。
［工程Ｂ－３－３］
　工程Ｂ－３－３は、前記（Ｂ２）の前記副次成分混入率を、上述したモデル関数ｆ３（ｘ３）に入力し、信頼性値を算出する工程である。副次成分混入率をモデル関数ｆ３（ｘ３）に入力するという操作で簡便にデータの信頼性値を算出することができる。

　また、本発明は上述の工程Ｂ－１及び下記工程Ｂ－３´を備えることを特徴とする、信頼性値の算出方法にも関する。
［工程Ｂ－３´］
　工程Ｂ－３´は、以下の３種の数値から選ばれる変数を、その変数を説明変数とし、かつ、信頼性値を目的変数とする、乗算で表されるモデル関数に入力して、信頼性値を算出する工程である。
　　（ｉ）上記工程Ｂ－２で生成した合成変数。
　　（ｉｉ）前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（ｉｉｉ）前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。

　なお、ここでいう乗算で表されるモデル関数とは、上述した通り以下の３つのモデル関数から選択される２以上のモデル関数を互いに乗じることで、乗算で表されるモデル関数である。
　・工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１によって作成したモデル関数
　・工程Ａ－１、工程Ａ－３－２及び工程Ａ－４－２によって作成したモデル関数
　・工程Ａ－１、工程Ａ－３－３及び工程Ａ－４－３によって作成したモデル関数

　本発明の好ましい実施形態では、上記ｆ１（ｘ１）、ｆ２（ｘ２）、ｆ３（ｘ３）のそれぞれの説明変数に相当する変数を式４で表されるモデル関数に入力し、信頼性値を算出する。

　以下、本発明の信頼性値の算出方法の更に詳細な実施形態について説明する。具体的には、非侵襲的出生前親子鑑定、癌検査、移植臓器の定着のモニタリング、そして疾患リスクを評価する非侵襲的出生前検査の順に説明する。

＜２－１＞非侵襲的出生前親子鑑定のために信頼性値を算出する方法
　まず、非侵襲的出生前親子鑑定のために信頼性値を算出する方法について説明する。本項目においては上記＜２＞に記載した事項が妥当するため、説明が重複する部分については適宜省略する。

　本実施形態においては、主要寄与体が母親、副次寄与体が母親の胎内にいる胎児、混合核酸サンプルが母親から採取された循環無細胞核酸サンプルに相当する。
　そして、上で説明した工程Ｂ－１、工程Ｂ－２及び工程Ｂ－３－１は、それぞれ以下に説明する工程Ｂ_１－１、工程Ｂ_１－２及び工程Ｂ_１－３－１に相当する。

［工程Ｂ_１－１］
　工程Ｂ_１－１は、母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸と、を含む循環無細胞核酸サンプルの測定により得られるデータセットを用意する工程である。当該データセットは、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットである。
　ここでいう前記複数の多型座位は、ヒト個人識別（ＨＩＤ）で用いられる多型座位であることが好ましい。

［工程Ｂ_１―２］
　工程Ｂ_１―２は、データセットに含まれるデータのうち、複数の多型座位の中で、母親においてホモ接合であり、かつ、主要核酸に由来するアレルの存在を示す信号と、副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程である。なお、擬父における前記多型座位の遺伝型は、ホモ接合であってもヘテロ接合であってもよい。

［工程Ｂ_１－３－１］
　工程Ｂ_１－３－１は、工程Ｂ_１－２で生成した合成変数を、その合成変数を説明変数とするモデル関数に入力し、信頼性値を算出する工程である。

＜２－２＞癌検査のために信頼性値を算出する方法
　次に癌検査のために信頼性値を算出する方法について説明する。本項目においても上記＜２＞に記載した事項が妥当するため、説明が重複する部分については適宜省略する。

　本実施形態においては、主要寄与体は検査対象者、副次寄与体は癌細胞、混合核酸サンプルは検査対象者から採取された循環無細胞核酸サンプルに相当する。　また、上記工程Ｂ－１、工程Ｂ－２及び工程Ｂ－３－１は、それぞれ下で説明する工程Ｂ２－１、工程Ｂ_２－２及び工程Ｂ_２－３－１に相当する。

［工程Ｂ_２－１］
　工程Ｂ_２－１は、検査対象者に関する遺伝情報を含む主要核酸を含み、癌細胞に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、癌に関連する複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程である。
　ここで「副次核酸を含み得る」とは、循環無細胞核酸サンプルに副次核酸が含まれる可能性を完全に否定できない状況のことをいう。

［工程Ｂ_２―２］
　工程Ｂ_２―２は、データセットに含まれるデータのうち、複数の多型座位の中で、正常型のアレルの存在を示す信号と、変異型のアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程である。
　正常型のアリルとは癌に罹患していない健常人において通常みられるアレルのことであり、変異型のアリルとは癌に関連があるとされる変異が導入されたアリルのことをいう。

　工程Ｂ_２－２においては、前記データセットに含まれるデータから、前記複数の多型座位の中で、検査対象者において変異型のアリルをホモ接合又はヘテロ接合として有している多型座位に関するデータを除外することが好ましい。このように検査対象者において先天的に有している変異型アリルのある多型座位に関するデータを除くことによって、副次成分信号が、検査対象者自身に由来する主要成分信号と混ざって検出されたデータが除外される。これによって算出する信頼性値の精度が向上する。

［工程Ｂ_２－３－１］
　工程Ｂ_２－３－１は、工程Ｂ_２－２で生成した合成変数を、その合成変数を説明変数とするモデル関数に入力し、信頼性値を算出する工程である。

＜２－３＞移植臓器の定着のモニタリングのために信頼性値を算出する方法
　次に移植臓器の定着のモニタリングのために信頼性値を算出する方法について説明する。本項目においても上記＜２＞に記載した事項が妥当するため、説明が重複する部分については適宜省略する。

　本実施形態においては、主要寄与体は臓器移植のレシピエント、副次寄与体は移植臓器、混合核酸サンプルはレシピエントから採取された循環無細胞核酸サンプルに相当する。
　また、上述した工程Ｂ－１、工程Ｂ－２及び工程Ｂ－３－１は、それぞれ以下に説明する工程Ｂ_３－１、工程Ｂ_３－２及び工程Ｂ_３－３－１に相当する。

［工程Ｂ_３－１］
　工程Ｂ_３－１は、レシピエントに関する遺伝情報を含む主要核酸を含み、移植臓器に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットを用意する工程である。当該データセットには、主要核酸及び副次核酸における、複数の多型座位における各アレルの存在を示す信号が含まれる。　ここでいう複数の多型座位は、ヒト個人識別（ＨＩＤ）で用いられる多型座位であることが好ましい。

［工程Ｂ_３－２］
　工程Ｂ_３－２は、データセットに含まれるデータのうち、前記複数の多型座位の中で、
前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存
在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び
前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程である。

［工程Ｂ_３－３－１］
　工程Ｂ_３－３－１は、工程Ｂ_３－２で生成した合成変数を、その合成変数を説明変数と
するモデル関数に入力し、信頼性値を算出する工程である。

＜２－４＞疾患リスクを評価する非侵襲的出生前検査のために信頼性値を算出する方法
　次に疾患リスクを評価する非侵襲的出生前検査のために信頼性値を算出する方法について説明する。本項目においても上記＜２＞に記載した事項が妥当するため、説明が重複する部分については適宜省略する。

　本実施形態においては、主要寄与体が母親、副次寄与体が母親の胎内にいる胎児、混合核酸サンプルが母親から採取された循環無細胞核酸サンプルに相当する。
　そして、上で説明した工程Ｂ－１、工程Ｂ－２及び工程Ｂ－３－１は、それぞれ以下に説明する工程Ｂ_４－１、工程Ｂ_４－２及び工程Ｂ_４－３－１に相当する。

［工程Ｂ_４－１］
　工程Ｂ_４－１では、母親に関する遺伝情報を含む主要核酸と、母親の胎内にいる胎児に関する遺伝情報を含む副次核酸とを含む、前記母親から採取された循環無細胞核酸サンプルの測定により得られるデータセットを用意する。当該データセットには、主要核酸及び副次核酸における、疾患に関連する複数の多型座位における各アレルの存在を示す信号が含まれる。

［工程Ｂ_４―２］
　工程Ｂ_４―２では、まずデータセットに含まれるデータから、前記複数の多型座位の中で、母親において変異型のアリルをヘテロ接合として有している多型座位に関するデータを除外する。

　そして、除外後に残ったデータセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する。

［工程Ｂ_４－３－１］
　工程Ｂ_４－３－１は、前記工程Ｂ－２で生成した前記合成変数を、その合成変数を説明変数とするモデル関数に入力し、信頼性値を算出する工程である。

＜３＞除外条件の設定方法
　上述した信頼性値の算出方法によれば、データセットに含まれる副次核酸における特定の多型座位における特定のアレルの存在を示す信号の信頼性（Ｆｉｄｅｌｉｔｙ）を評価することができる。
　ただ、上述した信頼性値の算出方法は、副次核酸に由来する特定のアレルが混合核酸サンプルに含まれているにも関わらず、当該アレルの存在を示す信号の信頼性値が低く算出されてしまうケースがある。反対に副次核酸に由来する特定のアレルが混合核酸サンプルに含まれていないにも関わらず、当該アレルの存在を示す信号の信頼性値が高く算出されてしまうケースがある。このような例外結果は、分析対象となるデータセットに外れ値が含まれていることに起因する。これらの例外結果を除外することができれば、より高精度に信頼性値の算出が可能となる。
　本発明の除外条件の設定方法は、モデル関数に入力すべき説明変数のデータを絞るため、データセットのうち除外すべきものを判定する除外条件を設定する方法に関する。本発明の除外条件の設定方法は、特に出生前遺伝学的検査に関するものである。

　具体的には、父母がそれぞれホモ接合で有している互いに異型の遺伝子座についての副次成分信号強度の信頼性値が、好ましくは０．８未満、より好ましくは０．９未満、さらに好ましくは０．９９未満、さらに好ましくは０．９９９未満のものを除外するように、除外条件を設定することが好ましい。
　また、父母がそれぞれホモ接合で有している互いに同型の遺伝子座についての副次成分信号強度の信頼性値が、好ましくは０．２以上、より好ましくは０．１以上、さらに好ましくは０．０１以上、さらに好ましくは０．００１以上のものを除外するように、除外条件を設定することが好ましい。

　以下、本発明の除外条件の設定方法について実施形態ごとに説明を加える。

＜３－１＞除外条件の設定方法（実施形態１）
　本発明の除外条件の設定方法の一つの実施形態は、以下の工程Ｃ－１－１、工程Ｃ－２－１、工程Ｃ－３－１及び工程Ｃ－４－１を備える。本実施形態により設定する除外条件は、上述した移植臓器の定着のモニタリングのために信頼性値を算出する方法に適用することができる。

［工程Ｃ－１－１］
　工程Ｃ－１－１は、主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの測定により得られるデータセットを用意する工程である。当該データセットには、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットが含まれる。なお、前記信号の真偽は既知である。

　前記多型座位としては、ヒト個人識別（ＨＩＤ）で用いられる一塩基多型座位が好適に例示できる。

　なお、主要寄与体、副次寄与体、混合核酸サンプルは、以下の何れかに該当する。
　（ｉ）前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルである。
　（ｉｉ）前記主要寄与体がレシピエントであり、前記副次寄与体が前記移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルである。

［工程Ｃ－２－１］
　工程Ｃ－２－１は、工程Ｃ－１－１で用意したデータセットのうち特定の条件に当てはまる多型座位に関する数値を含む数値群を線形結合させて得られる合成変数のうち、最も寄与率が高い合成変数を生成する工程である。最も寄与率が高い合成変数とは、主成分分析を行う場合には第１主成分が該当する。

　工程Ｃ－２－１では、母親においてホモ接合であり、父親においてホモ接合であり、かつ、母親と父親とで異型であるアレル、または、レシピエントにおいてホモ接合であり、
移植臓器のドナーにおいてホモ接合であり、かつ、レシピエントとドナーとで異型であるアレルの存在する多型座位に関する、少なくとも以下の（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群について線形結合を行う。

　（Ｃ１）は副次成分信号強度である。副次成分信号強度とは、副次核酸に由来する、特定の多型座位のアレルの存在を示す信号の強度である。その定義や具体的態様については上記（Ａ１）に関する説明がそのまま妥当する。

　（Ｃ２）は副次成分混入率である。副次成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合である。つまり、「副次成分混入率＝副次成分信号強度／信号強度総和」という数式で表すことができる。その定義や具体的態様については上記（Ａ２）に関する説明がそのまま妥当する。

　（Ｃ３）はノイズである。ノイズは、特定の多型座位のアレルに起因する信号強度総和から、主要成分信号強度及び副次成分信号強度を差し引いて求められる数値である。その定義や具体的態様については上記（Ａ５）に関する説明がそのまま妥当する。

　工程Ｃ－２－１において線形結合の対象となる数値群には、上述の（Ｃ１）、（Ｃ２）及び（Ｃ３）以外の数値が含まれていてもよい。つまり、特定の多型座位に関する（Ｃ１）、（Ｃ２）及び（Ｃ３）の他、当該特定の多型座位に関する種々の測定値ないし算出値を含む数値群に対して線形結合を行う。
　以下に線形結合の対象となる数値群に含めてもよい数値（Ｃ４）～（Ｃ５）について説明を加える。なお、以下に掲げる（Ｃ４）～（Ｃ５）から選ばれる１種のみを前記数値群に含めてもよいし、任意に選択された２種以上の数値を前記数値群に含めてもよい。また、（Ｃ４）～（Ｃ５）の全てを前記数値群に含めてもよい。

　（Ｃ４）は主要成分信号強度である。主要成分信号強度とは、主要核酸に由来する、特定の多型座位の一のアレルの存在を示す信号の強度である。その定義や具体的態様については上記（Ａ３）に関する説明がそのまま妥当する。

　（Ｃ５）は主要成分混入率である。主要成分混入率とは、特定の多型座位のアレルに起因する信号強度総和に対する主要成分信号強度の割合である。つまり、「主要成分混入率＝主要成分信号強度／信号強度総和」という数式で表すことができる。その定義や具体的態様については上記（Ａ１）に関する説明がそのまま妥当する。

　ここで、データセットは複数の多型座位に関するデータの集合である。そのため、いうまでもないが、当該データセットには、特定の多型座位に関する上記（Ｃ１－１）～（Ｃ５－１）の数値データを一組とするデータが複数組含まれることになる。
　なお、線形接合の対象となる数値群に含まれる数値データは標準化されていることが好ましい。

　なお、モデル関数の作成のために用いた、線形結合に供した数値群に含まれる数値の種類及びその個数と、工程Ｃ－２－１において合成変数を生成するための線形結合に供する数値群に含まれる数値の種類及びその個数は、一致していることが好ましい。

［工程Ｃ－３－１］
　工程Ｃ－３－１は、工程Ｃ－２－１における線形結合により得られた合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程である。その具体的な態様は特に限定されない。

　なお、前記外れ値は、本発明の方法で作成したモデル関数に入力して信頼性値を算出したときに異常な値を示す数値のことである。
　具体的には、副次核酸に由来する特定のアレルが混合核酸サンプルに含まれているにも関わらず、当該アレルの存在を示す信号の信頼性値が、好ましくは０．６未満、より好ましくは０．７未満、さらに好ましくは０．８未満として算出されてしまう場合における当該アレルに関する数値を外れ値として扱うことができる。
　また、副次核酸に由来する特定のアレルが混合核酸サンプルに含まれていないにも関わらず、当該アレルの存在を示す信号の信頼性値が、好ましくは０．４以上、より好ましくは０．３以上、さらに好ましくは０．２以上として算出されてしまう場合における当該アレルに関する数値を外れ値として扱うことができる。

　また、合成変数の平均値から、その標準偏差の好ましくは２倍以上、より好ましくは３倍以上、さらに好ましくは４倍以上、さらに好ましくは５倍以上の値をもって離れた数値を外れ値として扱うこともできる。

　工程Ｃ－３－１の具体的態様として以下の方法が挙げられる。
　まず、前記合成変数について仮の閾値を設定し、以下の仮の除外条件Ｃ１を設定する。
（仮の除外条件Ｃ１）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、最も寄与率が高い合成変数が、仮の閾値未満に該当するデータセットは除去する。

　そして、解析対象であるデータセットにこの仮の除外条件Ｃ１を適用し、除外されずに残ったデータセットについて、上述の信頼性値の算出方法の発明を適用し、信頼性値を算出する。この算出された信頼性値の結果から例外結果が除外されているか否かを検定する。例外結果が除外されていない場合や、事実を正確に反映した信頼性値の結果が過剰に除外されている場合には、再び仮の除外条件を再設定し、上記と同様に検定を繰り返し、最適な条件を特定する。

　工程Ｃ－３－１は、後述する工程Ｃ－３－１－１及び工程Ｃ－３－１－２を含む形態としてもよい。

［工程Ｃ－３－１－１］
　工程Ｃ－３－１－１は、上述した本発明の方法により作成したモデル関数に、工程Ｃ－２－１における線形結合により生成した合成変数、（Ｃ１）副次成分信号強度、（Ｃ２）副次成分混入率及び（Ｃ３）ノイズのうち説明変数として必要な数値を入力して、信頼性値を算出する工程である。
　信頼性値の算出に用いるモデル関数は、「＜１＞モデル関数の作成方法」の項目で説明したモデル関数であれば特に限定されない。好ましくは上述の式１～４の何れかで表されるモデル関数に説明変数を入力して、信頼性値を算出する。

［工程Ｃ－３－１－２］
　次いで工程Ｃ－３－１－２では、工程Ｃ－２－１における線形結合により生成した合成変数と、工程Ｃ－３－１－１で算出した信頼性値と、をプロットした散布図を作成する。例えば、縦軸に合成変数、横軸に信頼性値をプロットした散布図においては、横方向（信頼性値が広がる方向）に分散するデータポイントの集合（言い換えると合成変数の値の分散は小さく、信頼性値の値の分散が大きい集合）と、縦方向（合成変数が広がる方向）に分散するデータポイントの集合（言い換えると合成変数の値の分散が大きく、信頼性値の値の分散が小さい集合）が観察される。
　このうち、信頼性値が広がる方向に分散するデータポイントの集合（横方向に延びる集合）を除外候補として特定する。
　一方、合成変数が広がる方向に分散するデータポイントの集合（縦方向に延びる集合）を非除外候補として特定する。
　そして、除外候補の一部又は全部を除外するように前記合成変数の値に閾値を設定する。

　除外されるデータポイントの割合が、除外候補の全データポイント（非除外候補と重複している部分も除外候補に含む）のうち、好ましくは５０％以上、より好ましくは６０％以上、さらに好ましくは７０％以上、さらに好ましくは８０％以上、さらに好ましくは９０％以上、さらに好ましくは９５％以上となるように、合成変数に閾値を設定する。

［工程Ｃ－４－１］
　工程Ｃ－４－１は、信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ１として設定する工程である。

（除外条件Ｃ１）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、最も寄与率が高い合成変数が、前記工程Ｃ－３－１で設定した前記閾値未満に該当するデータセットは除去する。

　除外後に残ったデータセットに対して上述した本発明の信頼性値の算出方法を適用することで、例外結果が低減された高精度な信頼性値算出結果を得ることができる。

＜３－２＞除外条件の設定方法（実施形態２）
　本発明の除外条件の設定方法の一つの実施形態は、以下の工程Ｃ－１－２及び工程Ｃ－２－２、工程Ｃ－３－２及び工程Ｃ－４－２を備える。

［工程Ｃ－１―２］
　工程Ｃ－１－２は、主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの測定により得られるデータセットを用意する工程である。当該データセットには、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットが含まれる。なお、前記信号の真偽は既知である。

［工程Ｃ－２－２］
　工程Ｃ－２－２は、工程Ｃ－１－２で用意したデータセットのうち特定の条件に当てはまる多型座位に関する数値を含む数値群を線形結合させて得られる合成変数のうち、一番目又は二番目に寄与率が高い合成変数を生成する工程である。一番目に寄与率が高い合成変数とは、主成分分析を行う場合には第１主成分が該当する。二番目に寄与率が高い合成変数とは、主成分分析を行う場合には第２主成分が該当する。

　工程Ｃ－２－２では、母親においてホモ接合であり、父親においてホモ接合であり、かつ、母親と前記父親とで同型であるアレル、または、レシピエントにおいてホモ接合であり、移植臓器のドナーにおいてホモ接合であり、かつ、レシピエントとドナーとで同型であるアレルの存在する多型座位に関する、少なくとも上述した（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群について線形結合を行う。なお、線形結合の対象となる数値群には（Ｃ１）、（Ｃ２）及び（Ｃ３）以外の数値が含まれていてもよく、例えば上述した（Ｃ４）～（Ｃ５）が挙げられる。その他、工程Ｃ－２－２の具体的態様については、上述した工程Ｃ－２－１における説明が妥当する。

　なお、モデル関数の作成のために用いた、線形結合に供した数値群に含まれる数値の種類及びその個数と、工程Ｃ－２－２において合成変数を生成するための線形結合に供する数値群に含まれる数値の種類及びその個数は、一致していることが好ましい。

［工程Ｃ－３－２］
　工程Ｃ－３－２は、工程Ｃ－２－２における線形結合により生成された合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程である。その具体的な態様は特に限定されない。外れ値の定義については、上述した工程Ｃ－３－１における説明が妥当する。

　工程Ｃ－３－２の具体的態様として具体的には以下の方法が挙げられる。
　まず、前記合成変数について仮の閾値を設定し、以下の仮の除外条件Ｃ２を設定する。
（仮の除外条件Ｃ２）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、一番目又は二番目に寄与率が高い合成変数が、仮の閾値未満に該当するデータセットは除去する。

　そして、解析対象であるデータセットにこの仮の除外条件Ｃ２を適用し、除外されずに残ったデータセットについて、上述の信頼性値の算出方法の発明を適用し、信頼性値を算出する。この算出された信頼性値の結果から例外結果が除外されているか否かを検定する。例外結果が除外されていない場合や、事実を正確に反映した信頼性値の結果が過剰に除外されている場合には、再び仮の除外条件を再設定し、上記と同様に検定を繰り返し、最適な条件を特定する。

　工程Ｃ－３－２は、後述する工程Ｃ－３－２－１及び工程Ｃ－３－２－２を含む形態としてもよい。

［工程Ｃ－３－２－１］
　工程Ｃ－３－２－１は、上述した本発明の方法により作成したモデル関数に、工程Ｃ－２－２における線形結合により生成した合成変数、（Ｃ１）副次成分信号強度、（Ｃ２）の副次成分混入率及び（Ｃ３）ノイズのうち説明変数として必要な数値を入力して、信頼性値を算出する工程である。
　信頼性値の算出に用いるモデル関数は、「＜１＞モデル関数の作成方法」の項目で説明したモデル関数であれば特に限定されない。好ましくは上述の式１～４の何れかで表されるモデル関数に説明変数を入力して、信頼性値を算出する。

［工程Ｃ－３－２－２］
　次いで工程Ｃ－３－２－２では、工程Ｃ－２－２における線形結合により生成した合成変数と、工程Ｃ－３－２－１で算出した信頼性値と、をプロットした散布図を作成する。例えば、縦軸に合成変数、横軸に信頼性値をプロットした散布図においては、横方向（信頼性値が広がる方向）に分散するデータポイントの集合（言い換えると合成変数の値の分散は小さく、信頼性値の値の分散が大きい集合）と、縦方向（合成変数が広がる方向）に分散するデータポイントの集合（言い換えると合成変数の値の分散が大きく、信頼性値の値の分散が小さい集合）が観察される。
　このうち、合成変数が広がる方向に分散するデータポイントの集合（縦方向に延びる集合）を除外候補として特定する。
　一方、信頼性値が広がる方向に分散するデータポイントの集合（横方向に延びる集合）を非除外候補として特定する。
　そして、除外候補の一部又は全部を除外するように合成変数の値に閾値を設定する。

［工程Ｃ－４－２］
　工程Ｃ－４－２は、信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ２として設定する工程である。

（除外条件Ｃ２）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸とを含む、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、一番目又は二番目に寄与率が高い合成変数が、前記工程Ｃ－３－２で設定した前記閾値未満に該当するデータセットは除去する。

＜４＞除外条件を適用して信頼性値を算出する方法
　本発明は、上述の除外条件の設定方法により設定した除外条件Ｃ１及び／又は除外条件Ｃ２を上記「＜２－３＞移植臓器の定着のモニタリングのために信頼性値を算出する方法」における工程Ｂ_２－１で用意するデータセットに適用して、除外されずに残ったデータセットについて、それぞれの信頼性値の算出方法の発明を適用し、信頼性値を算出する方法にも関する。

　適用する除外条件は、除外条件Ｃ１と除外条件Ｃ２の何れか一方でもよいし両方であってもよい。なお、工程Ｂ_１－２または工程Ｂ_３－２において線形結合の対象とする数値群に含まれる数値の種類が、好ましくは１０種類以上、より好ましくは２０種類以上、さらに好ましくは３０種類以上である場合には、除外条件Ｃ１のみを適用するだけで、非常に精度の高い信頼性値の算出が可能となる。

　本発明の実施の形態は、除外条件Ｃ１及び／又は除外条件Ｃ２を適用する他は上記「＜２－３＞移植臓器の定着のモニタリングのために信頼性値を算出する方法」の項目で説明した内容をそのまま適用することができる。

　データセットに除外条件を適用しているため、これら入力値からは外れ値が除外されている。そのため、モデル関数により算出される信頼性値として例外結果が出力されてしまう問題を大きく低減することができる。

＜５＞プログラム
　本発明は、上述したモデル関数の作成方法、信頼性値の算出方法、除外条件の設定方法から選ばれる１又は２以上の方法をコンピュータに実行させるためのプログラムにも関する。コンピュータ内のプロセッサがハードディスク装置等の内蔵記憶装置に格納された本発明のプログラムに従って動作することにより、上述したモデル関数の作成方法、信頼性値の算出方法、除外条件の設定方法から選ばれる１又は２以上の方法を実行するように構成することができる。

＜６＞記憶媒体
　本発明は上述のプログラムを記録した記憶媒体にも関する。また、本発明は、上述した方法で作成されたモデル関数が記録された記憶媒体にも関する。記憶媒体としては、半導体メモリ、ハードディスク、磁気記憶媒体、光記憶媒体等、コンピュータにより読み出しが可能な記憶媒体が制限なく挙げられる。

＜７＞信頼性値算出システム
　本発明は、上述のモデル関数が記録された記憶部と、上述の信頼性値の算出方法を実行する処理部と、を備える、信頼性値算出システムにも関する。以下、本発明の信頼性値算出システムの好ましい実施形態について説明する。　

　処理部は分析装置によって取得された鑑定対象となるデータセットをデータ処理する構成である。処理部は、例えば、記憶部に格納されたプログラム（上述の信頼性値の算出方法を実行するプログラム）を読みだして実行することで、信頼性値の算出に必要なデータ処理を実現する演算装置（計算機と称されてもよい）であってもよい。処理部は、データ処理の実行主体としての側面を有する。処理部として、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＭＰＵ（Ｍｉｃｒｏ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）やＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）などが挙げられる。なお、処理部は、二以上のコアを含むマルチコアプロセッサであってもよい。

　記憶部は、処理部で実行される各種データ処理に係るデータやプログラムを記憶保持するように構成される回路である。記憶部は、不揮発性記憶装置と揮発性記憶装置の両方あるいは一方を少なくとも含んで構成される。例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）などが挙げられる。記憶部は、主記憶装置及び補助記憶装置などの各種記憶装置を総称したものである。プログラムは、予め記憶部に格納されていてもよいし、通信回路を介して接続された装置（サーバなど）からダウンロードされて記憶部に格納されてもよい。

　本実施形態の信頼性値算出システムは、上記工程Ｂ－１で用意したデータセットを入力する入力部を備える。入力部に入力した前記データセットは前記処理部に供される。前記処理部は記憶部に記憶された、上述の信頼性値の算出方法を実行するためのプログラムを読み出し、当該プログラムに従って、同じく記憶部に記憶されたモデル関数に前記データセットに含まれる又は前記データセットから生成した説明変数を入力して信頼性値を算出する。

　また本発明の好ましい実施の形態では、前記記憶部に上述の除外方法の設定方法により作成された除外条件Ｃ１及び／又は除外条件Ｃ２が記録されている。さらに好ましくは本実施形態の信頼性値算出システムは、上記工程Ｂ－１で用意したデータセットを入力する入力部を備える。
　本実施形態では、入力部に入力した前記データセットは前記処理部に供される。前記処理部は記憶部に記憶された上述の除外条件Ｃ１及び／又は除外条件Ｃ２を読み出し、当該条件をデータセットに適用して、信頼性値の算出に適さないデータを除外する。処理部は、上述の信頼性値の算出方法を実行するためのプログラムを読み出し、当該プログラムに従って、同じく記憶部に記憶されたモデル関数に除外条件適用後に残った前記データセットに含まれる又は前記データセットから生成される説明変数を入力して信頼性値を算出する。

＜試験例１＞モデル関数の作成
　母親の口腔粘膜サンプル（母親の遺伝情報のみを含む）、父親の口腔粘膜サンプル（父親の遺伝情報のみを含む）及び、母親ｐｌａｓｍａサンプル（母親及び、胎児の微量遺伝子を含む）を分析した次世代シーケンサー（ＮＧＳ）による遺伝子配列検査データを１組のデータセットとし、全２００組のデータセットを用意した。ＮＧＳは既知の１８４個のＳＮＰｓのある多型座位についてターゲットシーケンスを行ったものである。データセットには、３６，８００個（２００組×１８４個）のＳＮＰｓに関するデータが含まれている。

　用意したデータセットに含まれる母親全血の解析データのうち、母親及び父親ともにホモ接合である多型座位に関するものだけを抽出した。これにより、１０，４１５個のＳＮＰｓに関するデータセットに絞られた。この抽出したデータセットに含まれる以下の５因子について主成分分析を行った。
（１）主要成分信号強度絶対値［胎児Ｃｏｕｎｔ　Ｍａｊｏｒ］
（２）副次成分信号強度絶対値［胎児Ｃｏｕｎｔ　ｍｉｎｏｒ］
（３）主要成分の混入率（＝（１）／シグナル強度総和）［胎児Ｆｒｅｑ．　Ｍａｊｏｒ］
（４）副次成分の混入率（＝（２）／シグナル強度総和）［胎児Ｆｒｅｑ．　ｍｉｎｏｒ］
（５）ノイズ（＝シグナル強度総和－［（１）＋（２）］）［胎児ｅｒｒｏｒ］

　なお、上記（１）～（５）のデータを標準化した後に主成分分析を行った。
＊（標準化データ）＝［（生データ）－（平均値）］／（標本標準偏差）

　結果、第１主成分が信頼性値と高い相関を示す指標と成ることが明らかとなった。

　以下に記載する方法により各モデル関数を作成した。なお、モデル関数の作成には副次成分信号強度の真偽判定することが必要であるが、以下の規則に従って設定した正解に基づいて真偽判定を行った。
　　・父母の遺伝型がホモ且つ同型なら、胎児遺伝型はホモ（副次成分信号強度は偽）
　　・父母の遺伝型がホモ且つ異型なら、胎児遺伝型はヘテロ（副次成分信号強度は真）

モデル関数ｆ１（ｘ１）の作成
　主成分分析により得られた第１主成分をその大きさに応じて２０に区分した。次に、各区分に含まれる第１主成分に対応する副次成分信号強度のうちこれが真であった割合（確率）を求めた。そして各区分に含まれる第１主成分の代表値に、当該区分における確率を割り当てた。こうして得た第１主成分と信頼性値について最小二乗法を用いて回帰分析を行い、第１主成分を説明変数、信頼性値（Ｆｉｄｅｌｉｔｙ）を目的変数とするモデル関数ｆ１（ｘ１）を得た。回帰分析の寄与率（Ｒ２）は０．９９以上と極めて良好であった。
　図１にモデル関数ｆ１（ｘ１）を示すシグモイド曲線を示す。また、下の式５にモデル関数ｆ１（ｘ１）の式を示す。

モデル関数ｆ２（ｘ２）の作成
　副次成分信号強度絶対値をその大きさに応じて２０に区分した。次に、各区分に含まれる副次成分信号強度絶対値のうちこれが真であった割合（確率）を求めた。そして各区分における副次成分信号強度絶対値の代表値に、当該区分における確率を割り当てた。こうして得た副次成分信号強度絶対値と確率について最小二乗法を用いて回帰分析を行い、副次成分信号強度絶対値を説明変数、信頼性値（Ｆｉｄｅｌｉｔｙ）を目的変数とするモデル関数ｆ２（ｘ２）を得た。回帰分析の寄与率（Ｒ^２）は０．９９以上と極めて良好であった。
　図２にモデル関数ｆ２（ｘ２）を示すシグモイド曲線を示す。また、下の式６にモデル関数ｆ２（ｘ２）の式を示す。

モデル関数ｆ３（ｘ３）の作成
　副次成分の混入率をその大きさに応じて２０に区分した。次に、各区分に含まれる副次成分混入率に対応する副次成分信号強度のうちこれが真であった割合（確率）を求めた。そして各区分に含まれる副次成分混入率の代表値に、当該区分における確率を割り当てた。こうして得た副次成分混入率と確率について最小二乗法を用いて回帰分析を行い、副次成分混入率を説明変数、信頼性値（Ｆｉｄｅｌｉｔｙ）を目的変数とするモデル関数ｆ３（ｘ３）を得た。回帰分析の寄与率（Ｒ^２）は０．９９以上と極めて良好であった。
　図３にモデル関数ｆ３（ｘ３）を示すシグモイド曲線を示す。また、下の式７にモデル関数ｆ３（ｘ３）の式を示す。

モデル関数ｆ（ｘ１，ｘ２，ｘ３）の作成
　ｆ１（ｘ１）、ｆ２（ｘ２）、ｆ３（ｘ３）を乗じて、以下の式４で表されるモデル関数ｆ（ｘ１，ｘ２，ｘ３）を作成した。

＜試験例２＞信頼性値の算出
　式４のモデル関数ｆ（ｘ１，ｘ２，ｘ３）を用いて、当該モデル関数の作成に使用した２００セットのデータの信頼性を算出し結果の検証を行った。すなわち、混合核酸サンプルにおけるＳＮＰｓに係る座位についての第１主成分、副次成分信号強度絶対値、副次成分混入率をモデル関数ｆ（ｘ１，ｘ２，ｘ３）に入力し、その信頼性値を算出した。なお、信頼性値の算出においては、（１）と（２）の合計値が３００未満のものは除外した８，１４８ＳＮＰｓに対して信頼性値（Ｆｉｄｅｌｉｔｙ）を計算した。

　算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を図４示す。
　左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓに関する信頼性値を集計したものである（胎児遺伝型の正解はヘテロ接合）。
　右は父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する信頼性値を集計したものである（胎児遺伝型の正解はホモ接合）。

　図４に示すように、本発明の方法によれば、精度よくＳＮＰｓに関する信号の信頼性を評価できる。

＜試験例３＞除外条件の検討
　図４左（父母ホモ・異型）の集計においては、計算された信頼性値は０．1９未満の値を示すものが分布し、一定数の例外事例が確認された。また、図４右（父母ホモ・同型）の集計においては、０．９以上の値を示すものが分布し、一定数の例外事例が確認された。
　胎児遺伝型の正解がヘテロ接合であるにも関わらず算出された信頼性値が低いもの（例えば信頼性値０．１未満）、また胎児遺伝型の正解がホモ接合であるにも関わらず算出された信頼性値が高いもの（例えば信頼性値０．９以上）などの例外結果を除外するため、以下の方法で除外条件の詳細検討を行った。

除外条件１
　父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓ（正解の胎児遺伝型はヘテロ接合）に関する混合核酸サンプルの分析により得られたＳＮＰｓ（全３，１９６個）について、上記（１）～（５）のパラメータに対して主成分分析を行った。
　一方で、主成分分析を行った（１）～（５）のパラメータに基づき上記モデル関数ｆ（ｘ１，ｘ２，ｘ３）を利用して信頼性値を算出した。
　次いで、主成分分析により得られた各主成分をｙ軸、信頼性値をｘ軸にプロットした散布図を作成した（図５）。データの分散が最大であった第１主成分の散布図に示すように、ｘ軸方向に延びるデータポイントの集合とｙ軸方向に延びるデータポイントの集合の２つが見られる。このうちのｘ軸方向に延びるデータポイントの集合を除外すべき外れ値であるものとして第１主成分につき－１．９の位置に閾値を設定した。この閾値に基づき以下の除外条件１を設定した。
（除外条件１）
データセットのうち、父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓについての上記（１）～（５）の第１主成分が－１．９未満のものは除外する。

除外条件２
　父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する除外条件の適切な設定ができるか否か検討を行った。
　父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓ（正解の胎児遺伝型はホモ接合）に関する混合核酸サンプルの分析により得られたＳＮＰｓ（全４，９５２個）について、上記（１）～（５）のパラメータに対して主成分分析を行った。
　一方で、主成分分析を行った（１）～（５）のパラメータに基づき上記モデル関数ｆ（ｘ１，ｘ２，ｘ３）を利用して信頼性値を算出した。
　次いで、主成分分析により得られた各主成分をｙ軸、信頼性値をｘ軸にプロットした散布図を作成した（図６）。
　データの分散が最大であった第１主成分の散布図に示すように、ｘ軸方向に延びるデータポイントの集合とｙ軸方向に延びるデータポイントの集合の２つが見られる。このうちのｙ軸方向に延びるデータポイントの集合を除外すべき外れ値であるものとして第１主成分につき６の位置に閾値を設定した。この閾値に基づき以下の除外条件２を設定した。
（除外条件２）
データセットのうち、父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓについての上記（１）～（５）の第１主成分が６以上のものは除外する。
　

＜試験例４＞信頼性値の再集計
　２００テストデータセットを用いた試験例３において設定した除外条件１、２に該当するＳＮＰｓに関するデータをデータセットから除外したうえで、試験例１と同手順で信頼性値を算出した（残ったＳＮＰｓの数：８，０８１）。
　算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を図７に示す。
　左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓに関する信頼性値を集計したものである（胎児遺伝型の正解はヘテロ接合）。
　右は父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓに関する信頼性値を集計したものである（胎児遺伝型の正解はホモ接合）。

　図７の左は除外条件１を適用した後にデータについての信頼性値の分布図である。図７の右は除外条件２を適用した後にデータについての信頼性値の分布図である。図７に示すように除外条件１又は２の適用の結果、例外的事例数が有意に除外され妥当性の向上が認められた。

＜試験例５＞異なるＮＧＳターゲットパネルに対する妥当性の検証
　本発明の妥当性を検証するため別途準備した１６組データセットを用いて以下の検討を行った。試験例１に示した１８４ＳＮＰｓターゲットパネルとは異なる、１３２ＳＮＰｓのターゲットパネルの解析結果である。
　母親の口腔粘膜サンプル、父親の口腔粘膜サンプル、母親ｐｌａｓｍａサンプル及び新生児の口腔粘膜サンプルを分析したＮＧＳによる遺伝子配列検査データを１組のデータセットとし、試験例１～３とは別途１６組のデータセットを用意した。ＮＧＳは既知の１３２個のＳＮＰｓのある多型座位についてターゲットシーケンスを行ったものである。すなわち、用意したデータセットには、２，１１２個（１６組×１３２個）のＳＮＰｓに関するデータが含まれている。
　なお、本試験例で解析する１３２個のＳＮＰｓは、試験例１～３で解析した１８４個のＳＮＰｓに完全に重複するものではなく、７１個のＳＮＰｓは試験例１～３で解析したＳＮＰｓとは別のＳＮＰｓである。
　このデータセットのうち、父母ともにホモ接合として有するＳＮＰｓを抽出し５３１個のＳＮＰｓの信頼性値を算出した。

　１６テストデータセットから算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を図８に示す。
　左は父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓ（胎児遺伝型の正解はヘテロ接合）と、父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓ（胎児遺伝型の正解はホモ接合）に関する信頼性値を集計したものである。
　父母がそれぞれホモ接合で有している互いに異型のＳＮＰｓについては、１７６個のＳＮＰｓ中１７５個で０．９以上の信頼性値を示した。また、父母がそれぞれホモ接合で有している互いに同型のＳＮＰｓについては、３５５個のＳＮＰｓ中０．５以上の信頼性値を示すＳＮＰが１個だけ存在した。

　右は試験例１とは異なるターゲットパネルのＦｉｄｅｌｉｔｙ分布図を割合で表示したものである。
　２００テストデータセット（１８４ＳＮＰｓのターゲットパネル）から算出されたモデル関数を、１６テストデータセット（１３２ターゲットパネル）の解析に用いたが同様のＦｉｄｅｌｉｔｙ分布図が得られた。
これらの結果より、本発明のＦｉｄｅｌｉｔｙ算出方法は同じ試験システムを用いる場合、ターゲットパネルの種類に関係なく正確であることが確認された。

＜試験例６＞副次成分信号の真偽が不明なＳＮＰｓに対する妥当性の検証
　試験例５で用いた１６セットのデータの内、母がホモ接合で有している９５１ＳＮＰｓのＦｉｄｅｌｉｔｙ分布を新生児遺伝型がヘテロとホモに集計し図９にまとめた。
　なお、図９で示した全てのＳＮＰｓは胎児Ｃｏｕｎｔ　Ｍａｊｏｒと胎児Ｃｏｕｎｔ　ｍｉｎｏｒの合計３００以上である。

　図９から明らかなように、父母の遺伝型を用いた胎児遺伝型の推定形は出生後に確定された子の遺伝型と一致した。新生児ホモＳＮＰｓの９９．６％（５７５ＳＮＰｓの内５７３ＳＮＰｓ）は０．２以下の低いＦｉｄｅｌｉｔｙを示し、新生児ヘテロＳＮＰｓの９９．４％（３７６ＳＮＰｓの内３７４ＳＮＰｓ）は０．８以上の高いＦｉｄｅｌｉｔｙを示した。

　従って、試験例１のモデル関数を用いたＦｉｄｅｌｉｔｙ算出方法によれば、副次成分信号存在に対する真偽を示す父の遺伝型が分からない場合であっても、正確なＦｉｄｅｌｉｔｙの計算ができる。
これらの結果より、本発明の妥当性が確認された。

＜試験例７＞モデル関数の作成（その２）
　試験例１で使用したものと同一のデータセットについて、母親及び父親ともにホモ接合である多型座位に関するものだけを抽出した。この抽出したデータセットに含まれる以下の表１に示す１３因子について主成分分析を行った。表１に主成分分析の結果得られた第１主成分に関する固有ベクトルを示す。

　表１に示した１３因子のうち（１）～（５）の内容は試験例１で説明した通りである。なお、表１における変数の表記として、「ｍａｊｏｒ」が含まれるものは主要成分信号に関するデータであり、「ｍｉｎｏｒ」が含まれるものは副次成分信号に関するデータである。また、表１における変数の表記として、「ｃｏｕｎｔ」が含まれるものは信号強度に関するデータであり、「ｆｒｅｑ」又は「ｆｒｅｑｕｅｎｃｙ」が含まれるものは信号強度の割合に関するデータである。
　すなわち、表１における変数の表記として「ｍｉｎｏｒ」及び「ｃｏｕｎｔ」の両方が含まれる数値は、本発明でいう「副次成分信号強度」に該当する。
　また、表１における変数の表記として「ｍｉｎｏｒ」及び「ｆｒｅｑ」若しくは「ｆｒｅｑｕｅｎｃｙ」の両方が含まれる数値は、本発明でいう「副次成分混入率」に該当する。

　なお、表１の（７）は、前記特定の多型座位のアレルの存在を示す副次成分信号強度を、複数の多型座位におけるノイズの平均値により割った数値である。
　また、表１の（９）は、前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率を、複数の多型座位におけるノイズの平均値により割った数値である。

　主成分分析により得られた第１主成分を基に試験例１と同様の手順によって、当該第１主成分ｘ１を説明変数、信頼性値を目的変数とするモデル関数ｆ１（ｘ１）を作成した。回帰分析の寄与率（Ｒ^２）は０．９９以上と極めて良好であった。
　このｆ１（ｘ１）と上述のｆ２（ｘ２）及びｆ３（ｘ３）を乗じて、上記式４で表されるモデル関数ｆ（ｘ１，ｘ２，ｘ３）を作成した。

＜試験例８＞信頼性値の算出（その２）
　試験例１で使用したものと同一のデータセットに含まれる表１に示す１３因子について主成分分析を行った。主成分分析によって得られた第１主成分、副次成分信号強度絶対値及び副次成分混入率を試験例７で作成したモデル関数ｆ（ｘ１，ｘ２，ｘ３）に入力し、信頼性値を算出した。５因子、又は１３因子について主成分分析を行い算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を図１０に示す。
　図１０に示すように、本試験例でも、例外的結果がほぼ見られない極めて精度の高い結果が得られた。この結果より、試験例７で作成したモデル関数の妥当性と精度の高さが証明された。

＜試験例９＞妥当性の検証（その２）
　試験例６で用意したものと同一のデータセットを用意しデータセットに含まれる表１に示す１３因子について主成分分析を行った。主成分分析によって得られた第１主成分、副次成分信号強度絶対値及び副次成分混入率を試験例７で作成したモデル関数ｆ（ｘ１，ｘ２，ｘ３）に入力し、信頼性値を算出した。５因子、又は１３因子について主成分分析を行い算出した信頼性値（Ｆｉｄｅｌｉｔｙ）の分布図を図１１に示す。
　図１１に示すように、本試験例で副次成分信号存在に対する真偽を示す父の遺伝型が分からない場合も、例外的結果がほぼ見られない極めて精度の高い結果が得られた。この結果より、試験例７で作成したモデル関数の妥当性と精度の高さが証明された。

　本発明は出生前遺伝学的検査、癌スクリーニング検査、移植臓器定着モニタリング、感染症検査、法医学に応用できる。

Claims

　以下の工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ａ１）及び（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ａ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度
　　（Ａ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率

［工程Ａ－３－１］
　前記工程Ａ－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
［工程Ａ－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　前記合成変数が、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群について主成分分析を行うことで生成し得る合成変数であることを特徴とする、請求項１に記載の方法。
　前記工程Ａ－３－１及び工程Ａ－４－１においてモデル関数の作成のために用いる前記合成変数が、工程Ａ－２において生成した１以上の合成変数のうち、最も寄与率が高い合成変数であることを特徴とする、請求項２に記載の方法。
　前記工程Ａ―２が、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群について主成分分析を行い、１つ以上の主成分を合成変数として生成する工程であることを特徴とする、請求項１～３の何れか一項に記載の方法。
　前記工程Ａ－２が、前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含み、さらに以下の（Ａ３）～（Ａ５）から選ばれる１又は２以上を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程であることを特徴とする、請求項１～４の何れか一項に記載の方法。
　　（Ａ３）前記主要核酸に由来する、特定の多型座位の一のアレルの存在を示す主要成分信号強度。
　　（Ａ４）前記特定の多型座位のアレルに起因する信号強度総和に対する前記主要成分信号強度の割合である、主要成分混入率。
　　（Ａ５）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。
　前記工程Ａ－２が、前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び（Ａ２）を含み、さらに以下の（Ａ３）～（Ａ５）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程であることを特徴とする、請求項１～５の何れか一項に記載に記載の方法。
　　（Ａ３）前記主要核酸に由来する、特定の多型座位の一のアレルの存在を示す主要成分信号強度。
　　（Ａ４）前記特定の多型座位のアレルに起因する信号強度総和に対する前記主要成分信号強度の割合である、主要成分混入率。
　　（Ａ５）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。
　前記回帰分析が最小二乗法であることを特徴とする、請求項１～６の何れか一項に記載の方法。
　前記合成変数を表す１次斉次多項式において、副次成分信号強度又は副次成分混入率が最大に重みづけされることを特徴とする、請求項１～７の何れか一項に記載の方法。
　前記工程Ａ－２において線形結合する数値群に含まれる数値は、標準化された数値であることを特徴とする、請求項１～８の何れか一項に記載の方法。
　前記工程Ａ－２において、２つ以上の合成変数を生成し、
　前記工程Ａ－３－１において、前記２つ以上の合成変数のそれぞれについて、信頼性値の付与を行い、
　前記工程Ａ－４－１において、前記２つ以上の合成変数のそれぞれを説明変数とする互いに独立した２以上のモデル関数を作成し、
　さらに、前記２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数を作成する工程を備えることを特徴とする、請求項１～９の何れか一項に記載の方法。
　以下の工程Ａ－１、工程Ａ－３－２及び工程Ａ－４－２を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ－３－２］
　前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度を複数に区分し、各区分に含まれる前記副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記副次成分信号強度に対応する確率として付与する工程。
［工程Ａ－４－２］
　前記各区分に含まれる前記副次成分信号強度と、前記各区分に含まれる前記副次成分信号強度に対応する確率について回帰分析を行い、前記副次成分信号強度を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　以下の工程Ａ－１、工程Ａ－３－３及び工程Ａ－４－３を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ－３－３］
　前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、特定の多型座位のアレルに起因する信号強度総和に対する副次成分信号強度の割合である副次成分混入率を複数に区分し、各区分に含まれる前記副次成分混入率に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記副次成分混入率に対応する確率として付与する工程。
［工程Ａ－４－３］
　前記各区分に含まれる前記副次成分混入率と、前記各区分に含まれる前記副次成分混入率に対応する確率について回帰分析を行い、前記副次成分混入率を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　前記モデル関数が、シグモイド関数であることを特徴とする、請求項１～１２の何れか一項に記載の方法。
　前記モデル関数が、２個の媒介変数を有するシグモイド関数であることを特徴とする、請求項１～１３の何れか一項に記載の方法。
　請求項１～１０の何れか一項に記載の方法で作成したモデル関数と、
　請求項１１に記載の方法で作成したモデル関数と、
　請求項１２に記載の方法で作成したモデル関数と、
　からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。
　請求項１～１０の何れか一項に記載の方法で作成したモデル関数と、
　請求項１１に記載の方法で作成したモデル関数、及び／又は、請求項１２に記載の方法で作成したモデル関数と、
　を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。
　請求項１～１０の何れか一項に記載の方法で作成したモデル関数と、
　請求項１１に記載の方法で作成したモデル関数と、
　請求項１２に記載の方法で作成したモデル関数と、
　を互いに乗じ、乗算で表されるモデル関数を作成する工程を備える、モデル関数の作成方法。
　前記多型座位が、一塩基多型を含む座位であることを特徴とする、請求項１～１７の何れか一項に記載の方法。
　前記データセットが、塩基配列解析、デジタルＰＣＲ、マイクロアレイ、リアルタイムＰＣＲ又は質量分析により取得されたデータであることを特徴とする、請求項１～１８の何れか一項に記載の方法。
　前記データセットが塩基配列解析により取得されたデータであり、
　前記副次成分信号強度が、配列タグのカウント数、リード数、イオン濃度又は電気信号であることを特徴とする、請求項１～１８の何れか一項に記載の方法。
　前記データセットがデジタルＰＣＲにより取得されたデータであり、
　前記副次成分信号強度が、蛍光が観察されたウェル数であることを特徴とする、請求項１～１８の何れか一項に記載の方法。
　前記データセットがマイクロアレイにより取得されたデータであり、
　前記副次成分信号強度が、蛍光強度であることを特徴とする、請求項１～１８の何れか一項に記載の方法。
　前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_１－１、工程Ａ_１－２、工程Ａ_１－３－１及び工程Ａ_１－４－１であることを特徴とする、請求項１～１１の何れか一項に記載の方法。
［工程Ａ_１－１］
　母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸と、を含む循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ_１―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、
前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_１－３－１］
　前記工程Ａ_１－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで異型であるアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を真とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで同型であるアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を偽とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を真とする。）
［工程Ａ_１－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　前記主要寄与体が健常人であり、前記副次寄与体が癌細胞であり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_２－１、工程Ａ_２－２、工程Ａ_２－３－１及び工程Ａ_２－４－１であることを特徴とする請求項１～１０の何れか一項に記載の方法。
［工程Ａ_２－１］
　前記健常人に関する遺伝情報を含む主要核酸を含有する健常人より採取した核酸サンプルに、癌に関連する多型座位において癌関連変異が導入された前記多型座位の塩基配列情報を含む複数の核酸断片からなる副次核酸を添加することで人工的に調製した混合核酸サンプルの測定により得られるテータを含むデータセットであり、
　前記主要核酸における正常型のアレルの存在を示す信号と、前記副次核酸における前記変異を含むアレルの存在を示す信号と、を含むデータセットを用意する工程。
［工程Ａ_２－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_２－３－１］
　前記工程Ａ_２－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加した場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は真とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は偽とする。
　前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加していない場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は偽とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は真とする。）
［工程Ａ_２－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　以下の工程Ａ_２´－１、工程Ａ_２´－２、工程Ａ_２´－３－１及び工程Ａ_２´－４－１を含むことを特徴とする、副次成分信号の信頼性値を算出するためのモデル関数の作成方法。
［工程Ａ_２´－１］
　健常人に関する遺伝情報を含む主要核酸を含有する健常人より採取した核酸サンプルに、癌に関連する単一の多型座位において癌関連変異が導入された前記単一の多型座位の塩基配列情報を含む複数の核酸断片からなる副次核酸を添加することで人工的に調製した、前記副次核酸の含有割合が互いに異なる複数の混合核酸サンプルの測定により得られるデータを含むデータセットであり、
　前記主要核酸における正常型のアレルの存在を示す信号と、前記副次核酸における前記変異を含むアレルの存在を示す信号と、を含むデータセットを用意する工程。
［工程Ａ_２´－２］
　前記データセットに含まれるデータのうち、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された前記単一の多型座位に関する、少なくとも以下の（Ａ１´）及び（Ａ２´）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ａ１´）前記副次核酸に由来する前記単一の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ａ２´）前記単一の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率

［工程Ａ_２－３－１］
　前記工程Ａ_２´－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。
（但し、前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加した場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は真とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は偽とする。
　前記変異が導入された前記多型座位の塩基配列情報を含む核酸断片を混合核酸サンプルに添加していない場合であって、
　該核酸断片について副次成分信号が検出された場合には、当該副次成分信号は偽とし、
　該核酸断片について副次成分信号が検出されなかった場合には、当該副次成分信号は真とする。）
［工程Ａ_２－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　前記主要寄与体が臓器移植のレシピエントであり、前記副次寄与体が移植臓器であり、前記工程Ａ－１、工程Ａ－２、工程Ａ－３－１及び工程Ａ－４－１が、それぞれ工程Ａ_３－１、工程Ａ_３－２、工程Ａ_３－３－１及び工程Ａ_３－４－１であることを特徴とする、請求項１～１０の何れか一項に記載の方法。
［工程Ａ_３－１］
　レシピエントに関する遺伝情報を含む主要核酸と、移植臓器に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
［工程Ａ_３－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ａ１）及び前記（Ａ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
［工程Ａ_３－３－１］
　前記工程Ａ_３－２で生成された合成変数を複数に区分し、各区分に含まれる前記合成変数に対応する副次成分信号強度のうちこれが真であった割合を各区分に含まれる前記合成変数に対応する確率として付与する工程。（但し、レシピエントが有していないアレルであって、かつ、ドナーがホモ接合若しくはヘテロ接合で有しているアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、当該副次成分信号を真とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、当該副次成分信号を偽とする。
　レシピエント及びドナーの何れもが有していないアレルについて、
　主要成分信号と区別されて前記副次成分信号が検出された場合、前記副次成分信号を偽とし、
　主要成分信号と区別されて前記副次成分信号が検出されなかった場合、前記副次成分信号を真とする。）
［工程Ａ_３－４－１］
　前記各区分に含まれる前記合成変数と、前記各区分に含まれる前記合成変数に対応する確率について回帰分析を行い、前記合成変数を説明変数、信頼性値を目的変数とする、信頼性値を算出するためのモデル関数を求める工程。
　モデル関数にその説明変数を入力することで、信頼性値を算出する信頼性値の算出方法であり、
　前記モデル関数が、
　　請求項１～２６の何れか一項に記載の方法で求めた前記モデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
であり、
　前記説明変数が、以下の工程Ｂ－１で用意するデータセットに含まれる以下の（Ｂ１）、（Ｂ２）及び以下の工程Ｂ－２で求めた合成変数から選ばれる１又は２以上の数値であることを特徴とする、信頼性値の算出方法。
［工程Ｂ－１］
　主要寄与体に関する遺伝情報を含む主要核酸を含み、副次寄与体に関する遺伝情報を含む副次核酸を含む若しくは含み得る混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ｂ１）及び（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ｂ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｂ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。

（ただし、式１中、Ａ１は１５．４～１５．６、ｘ０１は－０．８～－０．６である。）

（ただし、式２中、Ａ２は１．８～２．０であり、ｘ０２は２．５～２．７である。）

（ただし、式３中、Ａ３は９．３～９．５であり、ｘ０３は０．５～０．７である。）
　前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_１－１及び工程Ｂ_１－２であることを特徴とする、請求項２７に記載の方法。
［工程Ｂ_１－１］
　母親に関する遺伝情報を含む主要核酸と、胎児に関する遺伝情報を含む副次核酸と、を含む循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_１―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、
前記母親においてホモ接合であり、かつ、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　前記複数の多型座位が、ヒト個人識別で用いられる多型座位であり、
　非侵襲的出生前親子鑑定のために信頼性値を算出する方法であることを特徴とする、請求項２８に記載の方法。
　前記主要寄与体が検査対象者であり、前記副次寄与体が癌細胞であり、前記混合核酸サンプルが前記検査対象者から採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_２－１及び工程Ｂ_２－２であることを特徴とする、請求項２７に記載の方法。
［工程Ｂ_２－１］
　検査対象者に関する遺伝情報を含む主要核酸を含み、癌細胞に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、癌に関連する複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_２―２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、正常型のアレルの存在を示す信号と、変異型のアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　前記工程Ｂ_２－２において、前記データセットに含まれるデータから、前記複数の多型座位の中で、検査対象者において変異型のアリルをホモ接合又はヘテロ接合として有している多型座位に関するデータを除外し、
　除外後に残った前記データセットに含まれるデータのうち、前記複数の多型座位の中で、正常型のアレルの存在を示す信号と、変異型のアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成することを特徴とする、請求項３０に記載の方法。
　前記主要寄与体が臓器移植のレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルであり、前記工程Ｂ－１及び工程Ｂ－２が、それぞれ工程Ｂ_３－１及び工程Ｂ_３－２であることを特徴とする、請求項２７に記載の方法。
［工程Ｂ_３－１］
　レシピエントに関する遺伝情報を含む主要核酸を含み、移植臓器に関する遺伝情報を含む副次核酸を含み得る、循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_３－２］
　前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも前記（Ｂ１）及び前記（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　前記複数の多型座位が、ヒト個人識別で用いられる多型座位であり、
　移植臓器の定着のモニタリングのために信頼性値を算出する方法であることを特徴とする、請求項３２に記載の方法。
　請求項２７～３３の何れか一項に記載の方法による信頼性値の算出に適さないデータを除外するための除外条件を設定する方法であり、以下の工程Ｃ－１－１、工程Ｃ－２－１、工程Ｃ－３－１及び工程Ｃ－４－１を備えることを特徴とする除外条件の設定方法。
［工程Ｃ－１－１］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。（但し、前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルである、又は
　前記主要寄与体がレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルである。）
［工程Ｃ－２－１］
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも以下の（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群を線形結合させて得られる合成変数のうち、最も寄与率が高い合成変数を生成する工程。
　　（Ｃ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｃ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。
　　（Ｃ３）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。［工程Ｃ－３－１］
　前記工程Ｃ－２－１における前記線形結合により得られた前記合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程。
［工程Ｃ－４－１］
　信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ１として設定する工程。
（除外条件Ｃ１）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで異型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで異型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び（Ｃ３）を含む数値群を線形結合させて得られた、最も寄与率が高い合成変数が、前記工程Ｃ－３－１で設定した前記閾値未満に該当するデータセットは除去する。
　請求項２７～３３の何れか一項に記載の方法による信頼性値の算出に適さないデータを除外するための除外条件を設定する方法であり、以下の工程Ｃ－１－２及び工程Ｃ－２－２、工程Ｃ－３－２及び工程Ｃ－４－２を備えることを特徴とする除外条件の設定方法。
［工程Ｃ－１－２］
　主要寄与体に関する遺伝情報を含む主要核酸と、副次寄与体に関する遺伝情報を含む副次核酸と、が含まれる、混合核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、複数の多型座位における各アレルの存在を示す信号を含むデータセット（但し、前記信号の真偽は既知である）を用意する工程。
（但し、前記主要寄与体が母親であり、前記副次寄与体が前記母親の胎内にいる胎児であり、前記混合核酸サンプルが前記母親から採取された循環無細胞核酸サンプルであるか、
又は
　前記主要寄与体がレシピエントであり、前記副次寄与体が移植臓器であり、前記混合核酸サンプルが前記レシピエントから採取された循環無細胞核酸サンプルである。）
［工程Ｃ－２－２］
　前記母親においてホモ接合であり、父親においてホモ接合であり、かつ、前記母親と前記父親とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも以下の（Ｃ１）、（Ｃ２）及び（Ｃ３）を含む数値群を線形結合させて得られる合成変数のうち、一番目又は二番目に寄与率が高い合成変数を生成する工程。
　　（Ｃ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｃ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。
　　（Ｃ３）前記特定の多型座位のアレルに起因する信号強度総和から、前記主要成分信号強度及び前記副次成分信号強度を差し引いて求められるノイズ。
［工程Ｃ－３－２］
　前記工程Ｃ－２－２における前記線形結合により得られた前記合成変数の外れ値の一部又は全部を除外するように前記合成変数の値に閾値を設定する工程。
［工程Ｃ－４－２］
　信頼性を算出するためのモデル関数に入力するデータセットから除外すべき条件を以下の除外条件Ｃ２として設定する工程。
（除外条件Ｃ２）
　母親又はレシピエントに関する遺伝情報を含む主要核酸と、胎児又は移植臓器に関する遺伝情報を含む副次核酸と、が含まれる混合核酸サンプルの分析により得られたデータセットのうち、
　母親においてホモ接合であり、擬父においてホモ接合であり、かつ、前記母親と前記擬父とで同型であるアレル、又は
　前記レシピエントにおいてホモ接合であり、前記移植臓器のドナーにおいてホモ接合であり、かつ、前記レシピエントと前記ドナーとで同型であるアレル、の存在する多型座位に関する、少なくとも前記（Ｃ１）、前記（Ｃ２）及び前記（Ｃ３）を含む数値群を線形結合させて得られた、一番目又は二番目に寄与率が高い合成変数が、前記工程Ｃ－３－２で設定した前記閾値未満に該当するデータセットは除去する。
　前記多型座位が、ヒト個人識別で用いられる一塩基多型座位であることを特徴とする、請求項３４又は３５に記載の方法。
　移植臓器の定着のモニタリングのための方法であることを特徴とする、請求項３４～３６の何れか一項に記載の方法。
　前記外れ値は、請求項２７～３３の何れか一項に記載の方法によって信頼性値を算出したときに、
　前記副次核酸に由来する特定のアレルが前記混合核酸サンプルに含まれているにも関わらず、当該アレルの存在を示す信号の信頼性値が０．８未満として算出されてしまう場合における当該アレルに関する数値、及び／又は
　前記副次核酸に由来する特定のアレルが前記混合核酸サンプルに含まれていないにも関わらず、当該アレルの存在を示す信号の信頼性値が０．２以上として算出されてしまう場合における当該アレルに関する数値であることを特徴とする、請求項３４～３７の何れか一項に記載の方法。
　前記外れ値は、前記合成変数の平均値から、その標準偏差の２倍以上離れた数値であることを特徴とする、請求項３４～３８の何れか一項に記載の方法。
　前記工程Ｂ－１において、
　請求項３４に記載の方法で特定した除外条件Ｃ１及び／又は請求項３５に記載の方法で特定した除外条件Ｃ２に該当するデータセットを除去した後に残ったデータセットを用意することを特徴とする、請求項３２又は３３に記載の方法。
　モデル関数にその説明変数を入力することで、信頼性値を算出する信頼性値の算出方法であり、
　前記モデル関数が、
　　請求項１～２６の何れか一項に記載の方法で求めた前記モデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
であり、
　前記説明変数が、以下の工程Ｂ_４－１で用意するデータセットに含まれる以下の（Ｂ１）、（Ｂ２）及び以下の工程Ｂ_４－２で求めた合成変数から選ばれる１又は２以上の数値であることを特徴とする、信頼性値の算出方法。
［工程Ｂ_４－１］
　母親に関する遺伝情報を含む主要核酸と、前記母親の胎内にいる胎児に関する遺伝情報を含む副次核酸と、が含まれる、前記母親から採取された循環無細胞核酸サンプルの測定により得られるデータセットであり、前記主要核酸及び前記副次核酸における、疾患に関連する複数の多型座位における各アレルの存在を示す信号を含むデータセットを用意する工程。
［工程Ｂ_４―２］
　前記データセットに含まれるデータから、前記複数の多型座位の中で、母親において変異型のアリルをヘテロ接合として有している多型座位に関するデータを除外し、
　除外後に残った前記データセットに含まれるデータのうち、前記複数の多型座位の中で、前記主要核酸に由来するアレルの存在を示す信号と、前記副次核酸に由来するアレルの存在を示す信号と、が区別して検出された多型座位に関する、少なくとも以下の（Ｂ１）及び（Ｂ２）を含む数値群を線形結合させ、１つ以上の合成変数を生成する工程。
　　（Ｂ１）前記副次核酸に由来する特定の多型座位のアレルの存在を示す副次成分信号強度。
　　（Ｂ２）前記特定の多型座位のアレルに起因する信号強度総和に対する前記副次成分信号強度の割合である副次成分混入率。

（ただし、式１中、Ａ１は１５．４～１５．６、ｘ０１は－０．８～－０．６である。）

（ただし、式２中、Ａ２は１．８～２．０であり、ｘ０２は２．５～２．７である。）

（ただし、式３中、Ａ３は９．３～９．５であり、ｘ０３は０．５～０．７である。）
　疾患リスクを評価する非侵襲的出生前検査のために信頼性値を算出する方法であることを特徴とする、請求項４１に記載の方法。
　請求項１～４２の何れか一項に記載の方法をコンピュータに実行させるためのプログラム。
　請求項４３に記載のプログラムを記録した記録媒体。
　請求項１～２６の何れか一項に記載の方法で作成されたモデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
が記録された記憶媒体。

（ただし、式１中、Ａ１は１５．４～１５．６、ｘ０１は－０．８～－０．６である。）

（ただし、式２中、Ａ２は１．８～２．０であり、ｘ０２は２．５～２．７である。）

（ただし、式３中、Ａ３は９．３～９．５であり、ｘ０３は０．５～０．７である。）
　請求項１～２６の何れか一項に記載の方法で作成されたモデル関数、
　　以下の式１～３の何れかのモデル関数、又は
　　以下の式１～３で表されるモデル関数からなる群から選択される２以上のモデル関数を互いに乗じ、乗算で表されるモデル関数
　が記録された記憶部と、請求項２７～３３及び４０～４２の何れか一項に記載の方法を実行する処理部と、を備える、信頼性値算出システム。

（ただし、式１中、Ａ１は１５．４～１５．６、ｘ０１は－０．８～－０．６である。）

（ただし、式２中、Ａ２は１．８～２．０であり、ｘ０２は２．５～２．７である。）

（ただし、式３中、Ａ３は９．３～９．５であり、ｘ０３は０．５～０．７である。）
　前記記憶部に、請求項３４に記載の方法で作成された除外条件Ｃ１及び／又は請求項３５に記載の方法で作成された除外条件Ｃ２が記録されており、
　前記処理部は、請求項４０に記載の方法を実行することを特徴とする、請求項４６に記載の信頼性値算出システム。