JP2023102988A

JP2023102988A - 情報処理システム、情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP2023102988A
Application number: JP2022003785A
Authority: JP
Inventors: 和明横山; Kazuaki Yokoyama
Original assignee: University of Tokyo NUC
Current assignee: University of Tokyo NUC
Priority date: 2022-01-13
Filing date: 2022-01-13
Publication date: 2023-07-26
Also published as: WO2023136297A1

Abstract

【課題】病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性を向上させること。【解決手段】被検体が有する、癌のドライバー変異を選定する分析装置１を含む情報処理システムの学習部は、所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の学習情報セットを用いて機械学習を実行し、所定の配列変異を入力すると、当該配列変異が目的配列変異である可能性の度合いのランクを出力するＡＩモデルを生成又は更新する。ＡＩ等の機械学習の手法が適用された図２のレスキューフィルタ部５５は、モデルから出力される可能性の度合いが一定以上である配列変異を、高ランクに分類しなおす。【選択図】図２

Description

本発明は、情報処理システム、情報処理装置、情報処理方法、及びプログラムに関する。

従来より、体細胞の遺伝情報に含まれる塩基配列の突然変異により、疾病が生じる場合があることは広く知られている。近年では、種々の体細胞変異に関して、どのような疾病に関係するかといった情報が収集されてデータベースに記録されており、広く利用されている（非特許文献１参照）。

また、近年、網羅的な塩基配列解析技術（例えば次世代シークエンサ）の進歩により、一回の変異の分析で検出される変異は、検体あたり数百から数百万と、膨大な量となっており、当該変異一つ一つにつき、人為的にその結果の解釈を行うのは効率的でなく、現実的でもない。そこで分析結果の人間による解釈を補助する装置が要望されている。

ＣＯＳＭＩＣＲｅｌｅａｓｅｖ９４ｉｓｌｉｖｅ！、［ｏｎｌｉｎｅ］、２０２１年３月２８日、［令和３年１０月８日検索］、インターネット＜ＵＲＬ：https://cosmic-blog.sanger.ac.uk/Release-v94/＞

しかしながら、上述の従来のデータベースには、単に、その症例において生じていた変異が記録されているに過ぎなかった。そのため、データベースを利用して塩基配列の変異を分析するだけでは、そのデータベースに記録された変異が生じているか否かを判断できるものの、がんなどの病気の形成や進行に直接影響する変異（例えばがんに対するドライバー変異）であるか否かは断定できなかった。
即ち、変異の分析結果の解釈には、他に考慮すべき事項が多岐にわたるため、ドライバー変異であるか否かを判定することは困難であった。
そこで、本出願人は、病気の発生や進行に影響する変異である可能性の程度を提示する分析装置を実現するための技術を特許出願している（国際出願番号ＰＣＴ／ＪＰ２０２０／０３７４９９明細書参照）。
しかしながら、このような分析装置よりもさらに、病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性を向上させることが要望されている。

本発明は、このような状況に鑑みてなされたものであり、病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性を向上させることを目的とする。

上記目的を達成するため、本発明の一態様の情報処理システムは、
被検体が有する、有害リスクのある目的配列変異を選定する情報処理システムであって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習を実行することで、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルを生成又は更新する学習手段と、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリング手段と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段と、
を備える。

本発明の一態様の情報処理装置は、本発明の一態様の情報処理システムを構成する情報処理装置である。
本発明の一態様の情報処理方法及びプログラムの夫々は、本発明の一態様の情報処理システムに対応する方法及びプログラムの夫々である。

本発明によれば、病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性を向上させることができる。

本発明の情報処理装置の一実施形態に係る分析装置のハードウェア構成の一例を示すブロック図である。図１の分析装置の機能的構成の一例を示すブロック図である。図２の分析装置に受け入れられる変位塩基配列情報の構成例を示している。図２の分析装置から出力される分析結果情報の構成例を示している。図２の分析装置のうち共通フィルタ部の詳細な機能的構成の一例を示すブロック図である。図２の分析装置のうちシードジーンフィルタ部の詳細な機能的構成の一例を示すブロック図である。図２の分析装置のうちシードジーンフィルタ部を採用することの意義を説明する模式図である。図２の分析装置のうちシードジーンフィルタ部及びレスキューフィルタへのパラメータ入力における画面例を示す図である。図６の機能的構成を有する分析装置における分析処理の流れの一例を説明するフローチャートである。図９の分析処理のうち共通フィルタ処理の流れの詳細を説明するフローチャートである。図９の分析処理のうちシードジーンフィルタ処理の流れの詳細を説明するフローチャートである。図９の分析処理のうちレスキューフィルタ処理の流れの詳細を説明するフローチャートである。図２の分析装置のうち共通フィルタ部の詳細な機能的構成のうち図５と異なる一例を示すブロック図である。図１３の機能的構成を有する共通フィルタ部による共通フィルタ処理の流れの詳細を説明するフローチャートである。図１２のレスキューフィルタ処理において機械学習により生成又は更新されるＡＩモデルを用いる場合において、当該ＡＩモデルを用いた推論の例について説明する図である。図１２のレスキューフィルタ処理において機械学習により生成又は更新されるＡＩモデルを用いる場合において、当該ＡＩモデルの更新の例について説明する図である。

以下、本発明の実施形態について、図面を用いて説明する。
図１は、本発明の情報処理装置の一実施形態に係る分析装置のハードウェア構成の一例を示すブロック図である。

分析装置１は、分析の対象となる個体と、個体から得た検体とを識別する検体識別情報とともに、当該検体の遺伝情報からシーケンスアライメントにより抽出された、塩基配列の変異箇所及び変異の内容を含む変異状態（配列変異）を表す変異塩基配列情報を受け入れる。変異状態（配列変異）は、一塩基の変異であってもよく、複数の遺伝子に及ぶ染色体の転座等の構造変異であってもよい。具体的に変異箇所及び変異の内容とは、変異のあった位置（リファレンスとなるゲノム情報と比較した場合に、染色体上の一方側から何番目の塩基であるかを示す情報等）と、あるべき塩基がどの塩基に変異しているのかを表す情報を含むものである。ＮＧＳ解析に必要なリファレンスとなるゲノム情報には、例えばヒトにおいては、ＧＲＣｈ３８（ｈｇ３８）やＧＲＣｈ３７（ｈｇ１９）が用いられる。

分析装置１は、受け入れた変異塩基配列情報が表す変異状態（配列変異）ごとに、予め定められた複数の分類条件を満たすか否かにより、受け入れた変異塩基配列情報に含まれる変異状態（配列変異）ごとに暫定ランクに分類する。
そして、分析装置１は、この変異状態（配列変異）ごとに分類された暫定ランクに基づいて、変異状態（配列変異）ごとの病的である可能性の程度を上述の分類条件とは異なる分類条件を満たすか否かにより、設定された暫定ランクを変更することで、分類しなおす。この分析装置１の動作については後に詳しく述べる。

分析装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３と、バス１４と、入出力インターフェース１５と、入力部１６と、出力部１７と、記憶部１８と、通信部１９と、ドライブ２０とを備えている。

ＣＰＵ１１は、ＲＯＭ１２に記録されているプログラム、又は、記憶部１８からＲＡＭ１３にロードされたプログラムに従って各種の処理を実行する。
ＲＡＭ１３には、ＣＰＵ１１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

ＣＰＵ１１、ＲＯＭ１２及びＲＡＭ１３は、バス１４を介して相互に接続されている。このバス１４にはまた、入出力インターフェース１５も接続されている。入出力インターフェース１５には、入力部１６、出力部１７、記憶部１８、通信部１９及びドライブ２０が接続されている。

入力部１６は、例えばキーボード等により構成され、各種情報を入力する。
出力部１７は、液晶等のディスプレイやスピーカ等により構成され、各種情報を画像や音声として出力する。
記憶部１８は、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等で構成され、各種データを記憶する。
通信部１９は、インターネットを含むネットワークＮを介して他の装置（例えば図示せぬ分析結果を閲覧する端末の情報処理装置等）との間で通信を行う。

ドライブ２０には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア３１が適宜装着される。ドライブ２０によってリムーバブルメディア３１から読み出されたプログラムは、必要に応じて記憶部１８にインストールされる。
また、リムーバブルメディア３１は、記憶部１８に記憶されている各種データも、記憶部１８と同様に記憶することができる。

このような図１の分析装置１の各種ハードウェアと各種ソフトウェアとの協働により、各種処理の実行が可能になる。
以下、図２を参照して、本実施形態の分析装置１がこのような各種処理を実行するための機能的構成について説明する。
図２は、図１の分析装置の機能的構成の一例を示すブロック図である。

図２に示すように、分析装置１においては、データ受入部５１と、設定受入部５２と、共通フィルタ部５３と、シードジーンフィルタ部５４と、レスキューフィルタ部５５と、ランク決定部５６と、分析結果出力部５７とが機能する。

データ受入部５１は、分析の対象となる検体の遺伝情報からシーケンスアライメントにより抽出された、塩基配列の変異状態（配列変異）を表す変異塩基配列情報を受け入れる。

図３は、図２の分析装置に受け入れられる変位塩基配列情報の構成例を示している。
図３に示すように、変位塩基配列情報は、変異状態（配列変異）毎（同図中各行毎）に、当該変異状態（配列変異）の塩基配列が見い出された染色体の番号（Ｃｈｒ）と、開始位置（Ｓｔａｒｔ）と、終了位置（Ｅｎｄ）と、本来あるべき塩基配列（Ｒｅｆ）と、抽出された変異している塩基配列（以下、「配列変異」と呼ぶ）（Ａｌｔ）と、配列変異の割合（アレル頻度：ＡＦ）とを少なくとも関連付けた情報である。
本例の変位塩基配列情報においては、変異状態（配列変異）毎（同図中各行毎）に、これらの情報に対してさらに、深度（ｄｅｐｔｈ）や変異状態（配列変異）のカウント数（ＡｌｔＣｏｕｎｔ）等、品質に関係する指標等が関連付けられている。なお、塩基配列の長さは「１」（この場合、塩基配列の情報はＡ，Ｔ，Ｃ，Ｇのいずれかの塩基を表す情報となる）であってもよい。

またこの変異塩基配列情報には、個体の症例等に関する情報（病名や治療歴、腫瘍割合などの情報）が含まれてもよい。

また、このデータ受入部５１は、同じ個体から、分析の対象とする変異塩基配列情報を抽出したタイミングとは異なるタイミング（複数あってもよい）で抽出された変異塩基配列情報（時系列情報）を受け入れてもよい。この場合は、データ受入部５１は、分析の対象とする時点の変異塩基配列情報の指定の入力を受けておく。

設定受入部５２は、分析の設定を受け入れる。この設定は、例えば、共通フィルタ部５３において、どのフィルタを用いるかという設定や、パラメータの設定を含む。
なお、シードジーンフィルタ部５４及びレスキューフィルタ部５５の夫々における設定は、本実施形態の理解を容易なものとすべく本例ではシードジーンフィルタ部５４及びレスキューフィルタ部５５の夫々において行われるものとするが、この設定受入部５２において行われてもよい。
この共通フィルタ部５３の設定の具体例は、次の共通フィルタ部５３の構成とともに説明する。

本実施の形態では、共通フィルタ部５３の動作により、変異の分析結果の解釈に影響する種々の情報に基づく、病的である可能性（例えばドライバー変異である可能性）に関する評価が一次的に行われる。この評価結果は、後述する４段階のランクＭＹＣ１乃至ＭＹＣ４のうち何れかにより表される。
一次的にと記載したのは、本例では、共通フィルタ部５３の評価に対してさらに、シードジーンフィルタ部５４やレスキューフィルタ部５５において再評価（ランクの見直し）が行われるからである。
ここで、解釈に影響する情報には、（１）分析の際に得られる当該変異の付帯情報、及び（２）文献やデータベースに収載された変異に関連する情報、が含まれる。このうち（１）分析の際に得られる当該変異の付帯情報には、（ａ）検出精度や信頼性の情報（変異が検出エラーでない確率）、（ｂ）変異のアレル頻度（同一変異を持つ細胞集団の全体に占める割合に関連する指標）、（ｃ）時系列情報、すなわち同一症例の他の時点での検体において繰り返して当該変異が検出されているか否か、などがある。

また、（２）文献やデータベースに収載された変異に関連する情報には、当該変異が疾患のドライバー変異として記載されているか否か（あるいはどの程度の頻度で記述がされているか）を表す情報が含まれる。ＳＮＰ（ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍ）データベースにも登録がある場合、変異アレルはどの程度の対立アレル頻度で、当該人種においてＳＮＰとして報告されているかという情報が文献やデータベースに収載されていてもよい。さらには、機能予測として、当該変異がコード化されたたんぱく質の立体構造や機能に影響を与えるか、例えばがんの病態形成に関わるとして実験などにより示されているか予測されているか否かを表す情報などが文献やデータベースに収載されていてもよい。

共通フィルタ部５３は、データ受入部５１が受け入れた複数の変異状態（配列変異）（時系列情報を受け入れたときには、そのうち分析の対象として指定された変異塩基配列情報に含まれる変異状態（配列変異）、以下、「分析対象とする変異状態（配列変異）」と呼ぶ）毎に、予め定められた複数の分類基準の夫々に基づいて、その変異状態（配列変異）を、ランクＭＹＣ１乃至ＭＹＣ４のうち何れかに分類することで、一次的な評価を行う。
なお、共通フィルタ部５３の詳細な構成例については、図５や図１３を参照して後述する。

ここで、ランクＭＹＣ１及びランクＭＹＣ２が、配列変異がドライバー変異の可能性が高い、即ちドライバー変異候補であると評価されたことを示すランクである。
ランクＭＹＣ１の方が、ランクＭＹＣ２よりも高確率で真のドライバー変異である可能性が高いことを示している。
ランクＭＹＣ３は、配列変異がドライバー変異の可能性が低い（それ故にドライバー変異候補としては取り扱わない）と評価されたことを示すランクである。即ち、ランクＭＹＣ３は、配列変異が有害でない変異と評価されたことを示すランクである。
ランクＭＹＣ４は、配列変異がドライバー変異の可能性はほぼ０であるという評価、即ち既知のＳＮＰ、ｅｒｒｏｒが起こりやすい領域の変異であることを示すランクである。

このようなデータ受入部５１が受け入れた複数の変異状態（配列変異）毎に４段階のランクＭＹＣ１乃至ＭＹＣ４に分類される理由は次の通りである。即ち、当該複数の変異状態（配列変異）の個数はあまりに多数（例えば数万から数億個）であるため、専門医等のユーザが真のドライバー変異を見つけ出す作業を効率的に行うことができるようにするためである。
具体的には、専門家等のユーザが、ランクＭＹＣ１又はランクＭＹＣ２に分類された変異状態（配列変異）に的を絞って、真のドライバー変異を見つけ出す作業を行うことができるようにするためである。
ここで、上述したように、ランクＭＹＣ１の変異状態（配列変異）の方が真のドライバー変異の可能性が高いという定義をしているため、専門家等のユーザにとっては、ランクＭＹＣ１の変異状態（配列変異）に特に的を絞った方が効率的である。
しかしながら、詳細については後述するが、共通フィルタ部５３は、全てのがんや遺伝病で共通な分類基準を用いたフィルタにより構成されている。したがって、共通フィルタ部５３による一次的な評価では、癌腫や遺伝病の種類によっては、ランクＭＹＣ２の配列変異の中に真のドライバー変異が多く含まれていたり、逆に、ランクＭＹＣ１の配列変異の中に偽陽性が多く含まれている場合がある。この点の詳細については、図７を用いて後述する。
したがって、共通フィルタ部５３の一次的な評価結果をそのまま採用してしまうと、ランクＭＹＣ１の変異状態（配列変異）に特に的を絞ったとしても、専門家等のユーザは、真のドライバー変異を適切に見つけ出すことは困難であり、結局のところランクＭＹＣ２の変異状態（配列変異）もランクＭＹＣ１と同等に確認しなければならない。
そこで、複数の癌腫や遺伝病の種類のうちユーザが着目すべき種類にとっての真のドライバーがランクＭＹＣ１に集積されるように、共通フィルタ部５３によりランクＭＹＣ１又はランクＭＹＣ２に分類された１以上の変異状態（配列変異）を対象として再評価（再分類）を行うフィルタが、シードジーンフィルタとして本実施形態では採用されている。

このシードジーンフィルタを搭載する機能ブロックが、シードジーンフィルタ部５４である。
即ち、シードジーンフィルタ部５４は、共通フィルタ部５３による一次的な評価としてランクＭＹＣ１又はＭＹＣ２に分類された１以上の変異状態（配列変異）毎に、複数の癌腫や遺伝病の種類のうちユーザが着目すべき種類に応じてユーザにより設定された分類基準を用いて、その変異状態（配列変異）を、ランクＭＹＣ１又はＭＹＣ２のうち何れかに再分類することで、再評価を行う。
なお、シードジーンフィルタ部５４の詳細例については、図６乃至図８を参照して後述する。

一方、共通フィルタ部５３による一次的な評価としてランクＭＹＣ３に分類された１以上の変異状態（配列変異）や、シードジーンフィルタ部５４によりランクＭＹＣ２に再分類された１以上の変異状態（配列変異）（ランクＭＹＣ２が維持されたものも含む）の中にも、真のドライバー変異が含まれている可能性がある。
そこで、このような真のドライバー変異を専門家等のユーザが見逃さないようにするためのフィルタが、レスキューフィルタとして本実施形態では採用されている。

このレスキューフィルタを搭載する機能ブロックが、レスキューフィルタ部５５である。
即ち、レスキューフィルタ部５５は、共通フィルタ部５３による一次的な評価としてランクＭＹＣ３に分類された１以上の変異状態（配列変異）、及び、シードジーンフィルタ部５４によりランクＭＹＣ２に再分類された１以上の変異状態（配列変異）（ランクＭＹＣ２が維持されたものも含む）毎に、その変異状態（配列変異）を、ランクＭＹＣ３若しくはＭＹＣ２に維持するか、又はランクＭＹＣ１に再分類することで、再評価を行う。
ここで、レスキューフィルタ部５５の分類手法は、特に限定されず、共通フィルタ部５３やシードジーンフィルタ部５４で採用されたものとは異なる分類基準を用いて分類するルールベースの手法でもよいし、機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法でもよい。
なお、レスキューフィルタ部５５の詳細については、図８等を参照して後述する。

ランク決定部５６は、共通フィルタ部５３、シードジーンフィルタ部５４、又はレスキューフィルタ部５５が出力する複数の変異状態（配列変異）毎のランク（ランクＭＹＣ１乃至ＭＹＣ４のうちの何れか）に従い、変異状態（配列変異）毎の病的である可能性の程度を表すランク値を決定する。ランク決定部５６は、複数の変異状態（配列変異）の夫々に対して、各ランク値を関連付けた情報（以下、「分析結果情報」と呼ぶ）を生成して、分析結果出力部５７に提供する。
なお、この病的である可能性の程度を表すランク値は、ランクＭＹＣ１乃至ＭＹＣ４に基づいて新たに演算された値であってもよいが、ここでは説明の便宜上、ランクＭＹＣ１乃至ＭＹＣ４がそのまま採用されるものとする。

分析結果出力部５７は、分析結果情報を、図１の出力部１７（例えばディスプレイ）から出力したり、通信部１９から図示せぬ他装置に対して送信することで出力する。

図４は、図２の分析装置から出力される分析結果情報の構成例を示している。
図４に示すように、分析結果情報は、変異状態（配列変異）毎（同図中各行毎）に、当該変異状態（配列変異）の塩基配列が見い出された染色体の番号（Ｃｈｒ）と、開始位置（Ｓｔａｒｔ）と、終了位置（Ｅｎｄ）と、本来あるべき塩基配列（Ｒｅｆ）と、配列変異（Ａｌｔ）と、ランク値（ＭＹＣ）とを少なくとも関連付けた情報である。

図４の例の分析結果情報には、さらに、変異状態（配列変異）毎（同図中各行毎）に、判断に関する記録情報Ｒも関連付けられている。
判断に関する記録情報Ｒとは、共通フィルタ部５３、シードジーンフィルタ部５４、及びレスキューフィルタ部５５の夫々のうち、対象の変異状態（配列変異）の分析に用いられたフィルタについて、どのような分類がなされたのか（各フィルタ毎のパラメータ設定や分類基準に基づく判定内容等）を表す情報である。
専門家等のユーザは、ランク値（ＭＹＣ）のみならず、この判断に関する記録情報Ｒを併せて参照することで、例えば病原性ありと評価されたときに（ランクＭＹＣ１に分類されたときに）、その判断の理由が、主に時系列フィルタの判断に基づくものであるか、データベースフィルタ等の判断に基づくものであるかを区別して扱うことができる。また、専門家等のユーザは、共通フィルタ部５３により元々ランクＭＹＣ１と分類されたものであるのか、それとも、シードジーンフィルタ部５４やレスキューフィルタ部５５の再分類によりランクＭＹＣ１となったものであるのか等を認識することができる。このことは、専門家等のユーザにとって変異の性質の理解に役立つ。

以上、図２を参照して、図１の分析装置１の機能的構成の一例について説明した。
さらに以下、図５乃至図８を参照して、図２の分析装置１のうち、共通フィルタ部５３、シードジーンフィルタ部５４、及びレスキューフィルタ部５５の夫々について、その詳細な機能的構成を順次説明していく。

図５は、図２の分析装置のうち共通フィルタ部の詳細な機能的構成の一例を示すブロック図である。
図５において、共通フィルタ部５３には、基本フィルタ５３１と、時系列フィルタ５３２と、データベースフィルタ５３３と、機能予測フィルタ５３４と、クオリティフィルタ５３５とが設けられている。

ここで基本フィルタ５３１は、分析の対象とする変異状態（配列変異）が良性であると判断できる場合に、良性変異であることを表すランク（例えばランクＭＹＣ４）を設定する。また、基本フィルタ５３１は、分析の対象とする変異状態（配列変異）が良性であると判断できなければ、良性変異でないことを表すランク（例えばランクＭＹＣ３）を設定する。

ここで良性と判断できる場合とは、がん化等を引き起こす既知の変異の塩基配列と変異状態（配列変異）に対応する変異した塩基配列との重複部分が比較的短い重複部分である場合、変異状態（配列変異）が表す変異の位置する領域がイントロン領域である場合、ＳＮＰデータベース等のように異常がない変異を蓄積したデータベースに変異状態（配列変異）が登録されている場合、又はＧＤＩ（ＧｅｎｅＤａｍａｇｅＩｎｄｅｘ）に基づいて変異状態（配列変異）が良性と判断できる場合等が相当する。

ここでＧＤＩは、各遺伝子について健常人にどれだけダメージが蓄積されているかを表す指標であり、人によって大きいダメージを受けていても（多様性があっても）、変異によって病的になると考えられない遺伝子である可能性を示す。

基本フィルタ５３１は、設定受入部５２から、がん化等を引き起こす既知の変異の塩基配列と変異状態（配列変異）に対応する変異した塩基配列との重複部分の長さの閾値、ＳＮＰであるか否かを判断するデータベースを特定する情報、データベースごとのパラメータ（良性か否かを判断する基準となる良性判断閾値、又はデータベースにＳＮＰである確率などとして登録された値と比較される）の少なくともいずれかの設定を受け入れる。基本フィルタ５３１は、受け入れた設定に基づいて、分析の対象とする変異状態（配列変異）が良性であるか否かを判断する。

具体的には例えば、基本フィルタ５３１は、配列変異が文節的重複（ｓｅｇｍｅｎｔａｌｄｕｐｌｉｃａｔｉｏｎ）と呼ばれる部位（以下、「文節的重複領域」と適宜呼ぶ）に位置する場合、良性変異であることを表すランクを設定する。
ここで、文節的重複は、染色体の１０ｋｂ乃至３００ｋｂのまとまった領域において、脊椎動物の進化の過程で遺伝子が複製されて隣り合う部位で遺伝子重複するか、あるいは全く離れた別のゲノム上で遺伝子重複したものである。そして、配列変異が文節的重複領域に位置する場合、当該配列変異は、シークエンス結果のリファレンスへのマッピング時に生じた検出エラーの結果であり、偽陽性の可能性が高い事が知られている。
そこで、上述したように、配列変異が文節的重複と呼ばれる部位に位置する場合、基本フィルタ５３１は、良性変異であることを表すランクを設定する。
より具体的には、基本フィルタ５３１は、配列変異が文節的重複領域に位置し、当該文節的重複領域の指標がどの程度相同であるかを示す指標が閾値を超える場合は、上述の検出エラーである可能性が高い為、良性変異であることを表すランクを設定する。
また例えば、基本フィルタ５３１は、変異状態（配列変異）が表す変異の位置する領域がイントロン領域であれば、良性変異であることを表すランクを設定する。

さらに基本フィルタ５３１は、上記２つの条件を満たさなくとも、指定されたＳＮＰデータベースを検索した結果に基づいて、良性変異であることを表すランクを設定してもよい。基本フィルタ５３１は、例えば、検索によって変異状態（配列変異）が表す変異がＳＮＰデータベースに登録され、かつ、そのＳＮＰである確率として登録された値が、当該ＳＮＰデータベースについて予め定められた良性判断閾値を超えている場合、良性変異であることを表すランクを設定する。

また基本フィルタ５３１は、ここまでの条件を満たさない場合であっても、当該変異状態（配列変異）が存在する遺伝子のＧＤＩを参照して、予め定められたＧＤＩ閾値より大きい場合に、良性変異であることを表すランクを設定する。

これにより分析装置１は、例えばがんのドライバー変異となり得ない（あるいはその可能性が十分低い）遺伝子を予めふるいわけることが可能となる。

またこの基本フィルタ５３１では、設定受入部５２から予め定めた、良性と判断するための複数の条件のうち、どの条件を利用するか（あるいはすべての条件を利用せず、基本フィルタ５３１としての動作をせずに、すべての変異状態（配列変異）についてランクをランクＭＹＣ３に設定して処理をパスするか否か）の設定を受け入れてもよい。

この例では基本フィルタ５３１は、利用すると設定された条件に限って、当該条件を満たすか否かを判断することとなる。

時系列フィルタ５３２は、基本フィルタ５３１が処理をパスした（ランクＭＹＣ３が設定された）場合に、分析の対象とする変異状態（配列変異）に対応する、時系列情報に含まれる変異状態（配列変異）の情報を参照して、異なるタイミングで抽出した時系列情報においても同じ変異があったか否かを判断する。

時系列フィルタ５３２は、分析の対象とする変異状態（配列変異）と、時系列情報に含まれる対応する変異状態（配列変異）とを用い、同じ変異が存在する場合に、問題とするべき変異があるものとしてランク（例えば現在のランクから第１として「１」を引く）を設定してクオリティフィルタ５３５に処理をパスする。第１所定量は、例えば、変異状態（配列変異）にかかるランクから１回の演算において減算又は加算される最小値である。ここでの例では基本フィルタ５３１が処理をパスしているので、当初のランクはランクＭＹＣ３であり、ここで時系列フィルタ５３２が問題とするべき変異があるものとしたときには、このランクＭＹＣ３から第１所定量として「１」を引いてランクをランクＭＹＣ２と設定することとなる。

一方、時系列フィルタ５３２は、分析の対象とする変異状態（配列変異）と、時系列情報に含まれる対応する変異状態（配列変異）とを用い、同じ変異が存在しないときには、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスする。

なお、時系列フィルタ５３２は、設定受入部５２から深度や、その他のシーケンスクオリティ、変異アレル頻度等に関する閾値の設定を受けていてもよい。例えば時系列情報に含まれる対応する変異状態（配列変異）に係る深度がここで設定された閾値（例えば「２０」）を超えない場合には、時系列フィルタ５３２は、同じ変異状態（配列変異）があったか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスする。

さらに本実施の形態の例では、この時系列フィルタ５３２は、データ受入部５１が時系列情報を受け入れていない場合（変異塩基配列情報としては、分析の対象とする変異塩基配列情報だけを受け入れている場合）には、同じ変異状態（配列変異）があるか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスしてもよい。

また設定受入部５２から時系列フィルタ５３２を利用しない設定が入力されている場合、時系列フィルタ５３２は、同じ変異状態（配列変異）があるか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスする。

データベースフィルタ５３３は、分析の対象とする変異状態（配列変異）が、予め定められた問題とするべき変異に関する情報を蓄積したデータベース（例えばＣＯＳＭＩＣＣａｎｃｅｒＤａｔａｂａｓｅなど）に登録されているか否かを、当該データベースのサーバへ変異状態（配列変異）に関する情報を送信して調べ、登録されている場合に、問題とするべき変異があるものとしてランク（例えば現在のランクから第１所定量として「１」を引く）を設定して、クオリティフィルタ５３５に処理をパスする。ここでの例では、分析の対象とする変異状態（配列変異）について、基本フィルタ５３１が処理をパスし、さらに時系列フィルタ５３２においてランクをそのままとした状態で処理がパスされたときに、このデータベースフィルタ５３３が判断をすることとなるので、データベースフィルタ５３３は、その際のランクＭＹＣ３から第１所定量として「１」を引いて、ランクをランクＭＹＣ２に設定した上で、クオリティフィルタ５３５に処理をパスすることとなる。

またこのデータベースフィルタ５３３は、分析の対象とする変異状態（配列変異）が、上記問題とするべき変異に関する情報を蓄積したデータベースに登録されていなかった場合に、ランクをそのままに設定して機能予測フィルタ５３４に処理をパスする。ここでの例では、このときのランクはランクＭＹＣ３のままとなる。

なお、このデータベースフィルタ５３３は、上記問題とするべき変異に関する情報を蓄積したデータベースとして、どのようなデータベースを利用するかの設定を、設定受入部５２から受け入れておく。

この設定では、複数のデータベースを用いるべき旨の指示がされてもよく、この場合、データベースフィルタ５３３は、分析の対象とする変異状態（配列変異）が、上記問題とするべき変異に関する情報を蓄積したデータベースのいずれかに登録されていた場合に、問題とするべき変異があるものとしてランクを設定する。

機能予測フィルタ５３４は、変異の病原性を評価したデータベースを参照して、分析の対象とする変異状態（配列変異）に係る変異が、病原性のあるものとしてデータベースに登録されている場合に、病原性の変異があるものとしてランク（例えば現在のランクから第１所定量として「１」を引く）を設定して、クオリティフィルタ５３５に処理をパスする。

ここで変異の病原性を評価したデータベースとしては、ＳＩＦＴや、ＰｏｌｙＰｈｅｎ２など広く知られたものがある。また、これらのデータベースのうちには、病原性の有無について多段階で評価しているものがあるが、このような場合は、この機能予測フィルタ５３４は、例えば病原性の疑いがあるとの判断段階にある場合に、病原性の変異があるものとしてランク（例えば現在のランクから第１所定量として「１」を引く）を設定して、クオリティフィルタ５３５に処理をパスするものとする。

ここでの例では、分析の対象とする変異状態（配列変異）について、基本フィルタ５３１が処理をパスし、時系列フィルタ５３２においてランクをそのままとした状態で処理がパスされ、さらにデータベースフィルタ５３３においてもランクがそのままの状態で処理がパスされたときに、この機能予測フィルタ５３４が判断をすることとなるので、機能予測フィルタ５３４は、その際のランクＭＹＣ３から第１所定量として「１」を引いて、ランクをランクＭＹＣ２に設定した上で、クオリティフィルタ５３５に処理をパスすることとなる。

またこの機能予測フィルタ５３４は、変異の病原性を評価したデータベースを参照して、分析の対象とする変異状態（配列変異）に係る変異が、病原性のあるものとしてデータベースに登録されていなければ（または登録されていても不明であるとか、良性ないし良性と推定される場合として登録されている場合）、ランクをそのままに設定してクオリティフィルタ５３５に処理をパスする。ここでの例では、このときのランクはＭＹＣ３のままとなる。

なお、この機能予測フィルタ５３４においても、どのようなデータベースを利用するかの設定を、設定受入部５２から受け入れておくものとする。

クオリティフィルタ５３５は、分析の対象とする変異状態（配列変異）をシーケンスしたときの深度や、その他の、分析の対象とする変異状態（配列変異）のシーケンス処理の品質を評価する。この品質の指標については、深度のほか、変異状態（配列変異）のカウント数など、広く知られた指標があり、クオリティフィルタ５３５は、これらを組み合わせて（あるいはその組み合わせを、設定受入部５２から受け入れ、当該受け入れた指標の組み合わせに従って）品質の評価を行う。なお、クオリティフィルタ５３５は、複数の指標を組み合わせる場合は、すべての指標により、品質が十分高いとの条件を満たす場合に、品質が十分であると判断することとする。

クオリティフィルタ５３５は、この評価により、分析の対象とする変異状態（配列変異）のシーケンス処理の品質が十分である（十分高い）と判断したときに、判断が適性であるとしてランク（例えば現在のランクから第１所定量として「１」を引く）を設定して、シードジーンフィルタ部５４やレスキューフィルタ部５５、ランク決定部５６に当該ランクを出力する。またこのクオリティフィルタ５３５は、分析の対象とする変異状態（配列変異）のシーケンス処理の品質が十分である（十分高い）と判断できないときには、ランクをそのままに設定してシードジーンフィルタ部５４やレスキューフィルタ部５５、ランク決定部５６に当該ランクを出力する。

以上、図５を参照して、図２の分析装置１のうち共通フィルタ部５３の詳細な機能的構成について説明した。
次に、図６乃至図８を参照して、図２の分析装置１のうちシードジーンフィルタ部５４の詳細な機能的構成について説明する。

図６は、図２の分析装置のうちシードジーンフィルタ部の詳細な機能的構成の一例を示すブロック図である。
図６において、シードジーンフィルタ部５４には、シードジーンフィルタ５４１と、パラメータ設定受入部５４２と、シードジーン情報取得部５４３とが設けられている。

シードジーンフィルタ５４１は、共通フィルタ部５３による一次的な評価としてランクＭＹＣ１又はＭＹＣ２に分類された１以上の変異状態（配列変異）毎に、所定の分類基準を用いて、その変異状態（配列変異）を、ランクＭＹＣ１又はＭＹＣ２のうち何れかに再分類するフィルタである。
ここで、ランクＭＹＣ１に再分類されること（ランクＭＹＣ１を維持することを含む）を、以下、「アップグレード」と呼ぶ。これに対して、ランクＭＹＣ２に再分類されること（ランクＭＹＣ１を維持することを含む）を、以下、「ダウングレード」と呼ぶ。
具体的には例えば、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ２に分類されている場合、当該分類対象が分類基準を満たすときにはランクＭＹＣ１にアップグレードさせ、当該分類対象が分類基準を満たさないときにはランクＭＹＣ２にダウングレード（維持）させる。
また例えば、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ１に分類されている場合、当該分類対象が分類基準を満たすときにはランクＭＹＣ１にアップグレード（維持）させ、当該分類対象が分類基準を満たさないときにはランクＭＹＣ２にダウングレードさせる。
なお、分類基準は、本例では理解を容易なものとするために、分類対象がランクＭＹＣ１に分類されている場合もランクＭＹＣ２に分類されている場合にも同一種類が採用されているが、特にこれに限定されない。例えば、分類対象がランクＭＹＣ１に分類されている場合には第１種分類基準が採用される一方、分類対象がランクＭＹＣ２に分類されている場合にも第２種分類基準が採用されるようにしてもよい。
また、図８を参照して後述するように、シードジーンフィルタ５４１は、専門家等のユーザの設定により、アップグレードとダウングレードのうち一方のみを行うフィルタとして機能させることもできる。

パラメータ設定受入部５４２は、シードジーンフィルタ５４１の分類基準を設定するためのパラメータを受け入れる。例えばパラメータ設定受入部５４２は、複数の癌腫や遺伝病の種類のうちユーザが着目すべき種類に応じて当該ユーザにより指定されたパラメータを受け入れる。そして、パラメータ設定受入部５４２は、受け入れたパラメータに基づいて、シードジーンフィルタ５４１の分類基準を設定する。
例えば、複数の癌腫や遺伝病の種類のうちユーザが着目すべき種類にとって適切な「データベース又はリスト」を示すパラメータが、パラメータ設定受入部５４２により受け入れられる場合がある。このような場合、例えば、パラメータにより示される「データベース又はリスト」に登録されているという基準が、シードジーンフィルタ５４１の分類基準としてパラメータ設定受入部５４２により設定される。
さらに例えば、複数の癌腫や遺伝病の種類のうちユーザが着目すべき種類を示すパラメータが、パラメータ設定受入部５４２により受け入れられる場合がある。このような場合、例えば、上述の「データベース又はリスト」において、パラメータにより示される癌腫や遺伝病の種類のものとして登録されているという基準が、シードジーンフィルタ５４１の分類基準としてパラメータ設定受入部５４２により設定される。
さらに例えば、上述の「データベース又はリスト」における最低登録数を示すパラメータ等が、パラメータ設定受入部５４２により受け入れられる場合がある。このような場合、例えば、上述の「データベース又はリスト」に登録されている件数が、パラメータにより示される最低登録数以上であるという基準が、シードジーンフィルタ５４１の分類基準としてパラメータ設定受入部５４２により設定される。
なお、パラメータの設定の詳細な具体例については、図８を参照して後述する。

シードジーン情報取得部５４３は、シードジーンフィルタ５４１において分類対象の変異状態（配列変異）が分類基準を満たすか否かを判断するために用いる情報を、シードジーン情報として採用する。
シードジーン情報としては、「データベース又はリスト」自体、或いは、当該「データベース又はリスト」に対する検索結果等が採用される。
即ち例えば、データベースには、ある癌腫や遺伝病の種類の症例において報告（サンプル）された変異について、リファレンスゲノム上における座標（位置）と当該変異に関する統計情報と、その症例に関する情報とが含まれている。具体的には例えば、報告された変異について、全サンプルのうち、「所定遺伝子の所定座標の塩基が、他の塩基（何れの塩基）に変異していた」という報告（サンプル）がいくつ存在したか、という統計情報が、含まれる。
また例えば、リストには、ある癌腫や遺伝病の種類の症例において報告（サンプル）された変異がサンプル毎の情報として含まれる。
このように、データベース又はリストには、所定の癌腫や遺伝病の種類における報告（サンプル）として、「所定遺伝子の所定座標の塩基が異なる他の塩基（何れの塩基）に変化していた」という情報や、「遺伝子がいつ・どこではたらくかを決める配列（発現調節配列）の塩基が異なる他の塩基（何れの塩基）に変化していた」という情報が含まれる。発現調節配列には例えばエンハンサーやプロモーター、非タンパクコードＲＮＡなどが含まれる。
つまり、このようなシードジーン情報に含まれる当該遺伝子（塩基配列）や発現調節配列における所定座標の塩基の変異の情報と、判断材料の配列変異とが比較される。
即ち、シードジーンフィルタ５４１は、シードジーン情報を用いて、分類対象の変異状態（配列変異）が分類基準を満たすか否かを判定し、分類基準を満たす場合にはアップグレードをし、分類基準を満たさない場合にはダウングレードをする。

このようなシードジーンフィルタ部５４を採用することで、次のような第１乃至第３のメリットを生ずることが可能になる。
即ち、第１のメリットは、癌腫や遺伝病の種類を問わず、日本国の薬事承認申請においては、パラメータ設定受入部５４２により受け入れられる可能性のあるパラメータの設定の承認だけ行えばよいというものである。
第２のメリットは、シードジーン情報のアップデートが容易というものである。
第３のメリットは、専門家等のユーザの（パラメータ等の）設定による（シードジーンフィルタ５４１を用いた）再解析が容易であるというものである。

さらに、このようなシードジーンフィルタ部５４を採用することの技術的意義について、図７を参照して説明する。
図７は、図２の分析装置のうちシードジーンフィルタ部を採用することの意義を説明する模式図である。
図７の左方の棒グラフは、共通フィルタ部５３による一次的な評価の結果として、ランクＭＹＣ１及びランクＭＹＣ２の配列変異の個数を示すものである。
共通フィルタ部５３による一次的な評価の結果をそのまま採用すると、ランクＭＹＣ１の配列変異の個数が多くなる（その分だけ、専門家等のユーザの解釈が非効率になる）という課題が生じる。
即ち、上述したように、共通フィルタ部５３による一次的な評価では、癌腫や遺伝病の種類によっては、ランクＭＹＣ２の配列変異の中に真のドライバー変異が多く含まれていたり、逆に、ランクＭＹＣ１の配列変異の中に偽陽性が多く含まれている場合がある。
したがって、共通フィルタ部５３の一次的な評価結果をそのまま採用してしまうと、ランクＭＹＣ１の変異状態（配列変異）に特に的を絞ったとしても、専門家等のユーザは、真のドライバー変異を適切に見つけ出すことは困難であり、結局のところランクＭＹＣ２の変異状態（配列変異）もランクＭＹＣ１と同等に確認しなければならない、という課題が生じる。
この課題が生じる要因は、上述したように、共通フィルタ部５３は、全てのがんや遺伝病で共通な分類基準を用いたフィルタにより構成されており、癌腫や遺伝病の種類のうち、専門家等のユーザにとって着目する種類において重要な遺伝子や発現調節配列に重みづけができていないためである。

シードジーンフィルタ部５４は、この課題を解決するために採用されている。
即ち、図７の右方の棒グラフは、共通フィルタ部５３による一次的な評価の結果に対して、さらに、シードジーンフィルタ部５４による再評価した結果を示している。
上述したように、シードジーンフィルタ部５４は、癌腫や遺伝病の種類のうち、専門家等のユーザにとって着目する種類に応じてユーザにより指定されたパラメータを用いて、分類基準を設定すると共に、シードジーン情報を取得する。シードジーンフィルタ５４１は、図７の左方に示されるランクＭＹＣ１及ぶＭＹＣ２の変異状態（配列変異）の夫々を分類対象に順次設定して、シードジーン情報を用いて、分類対象が分類基準を満たすか否かを判定し、分類基準を満たす場合にはアップグレードをし、分類基準を満たさない場合にはダウングレードをする。
その結果、図７の右方の棒グラフに示すように、癌腫や遺伝病の種類のうち、専門家等のユーザにとって着目する種類にとっての真のドライバー変異がランクＭＹＣ１に集積されるようになる。
これにより、専門家等のユーザは、ランクＭＹＣ１を重点的に確認すれば良いので、真のドライバー変異を見逃すことを減少させることができる。

図８は、図２の分析装置のうちシードジーンフィルタ部及びレスキューフィルタ部へのパラメータ入力における画面例を示す図である。

図８の画面例において、領域ＳＵＧは、シードジーンフィルタ５４１のアップグレードのための分類基準を設定するためのパラメータを、専門家等のユーザが指定操作するためのものである。
領域ＳＵＧには、３つの観点から、シードジーンフィルタ５４１のアップグレードのための分類基準を設定するためのパラメータを、専門家等のユーザが指定操作することができる。

１つ目の観点の分類基準の設定は、図８中「１」と表記されたものであり、データベースとしてＣＯＳＭＩＣを用いた分類基準を設定するというものである。
専門家等のユーザは、１つ目の観点での分類基準の設定を所望する場合、図８中「１」と表記された右方のボックスをチェックする操作をする。
この第１の観点では、２つのパラメータの指定が可能である。
１つ目のパラメータの指定は指定欄Ａ１によりなされる。
指定欄Ａ１は、ＣＯＳＭＩＣにおけるカットオフ値（最低登録件数）を、専門家等のユーザが指定（入力操作）する欄である。パラメータ設定受入部５４２は、ＣＯＳＭＩＣに当該カットオフ値（最低登録件数）以上登録されているという分類基準を、シードジーンフィルタ５４１のアップグレードのための分類基準として設定する。
２つめのパラメータの指定は指定欄Ａ２によりなされる。
指定欄Ａ２は、分類基準として採用する対象を、全癌腫にするのか、それとも、専門家等のユーザが指定する癌腫でＣＯＳＭＩＣに登録されたものに限定するのかを、専門家等のユーザが指定（入力操作）する欄である。
専門家等のユーザは、全癌腫を所望する場合、「Ａｌｌｃａｎｃｅｒｓ」と記載された左方のボックスをチェックする操作をする。この場合、パラメータ設定受入部５４２は、ＣＯＳＭＩＣに登録されている全癌腫を対象として上述のカットオフ値（最低登録件数）以上登録されているという分類基準を、シードジーンフィルタ５４１のアップグレードのための分類基準として設定する。
これに対して、専門家等のユーザは、癌腫の指定を所望する場合、「Ｓｐｅｃｉｆｉｃｔｉｓｓｕｔｙｐｅ」と記載された左方のボックスをチェックする操作をし、さらに、その下方の欄に記載されている複数の癌腫の中から１以上を指定する。この場合、パラメータ設定受入部５４２は、専門家等のユーザにより指定された１以上の癌腫のうち何れかでＣＯＳＭＩＣに登録されているものを対象として上述のカットオフ値（最低登録件数）以上登録されているという分類基準を、シードジーンフィルタ５４１のアップグレードのための分類基準として設定する。

２つ目の観点の分類基準の設定は、図８中「２」と表記されたものであり、データベース又はリストとしてＣＯＳＭＩＣ以外を用いた分類基準を設定するというものである。
専門家等のユーザは、２つ目の観点での分類基準の設定を所望する場合、図８中「２」と表記された右方のボックスをチェックする操作をする。
この第２の観点では、専門家等のユーザは、指定欄Ａ３により、重みづけをする遺伝子（例えば、ガイドラインにある遺伝子）又はがんのデータベースをパラメータとして指定する。この場合、パラメータ設定受入部５４２は、専門家等のユーザにより指定された「重みづけをする遺伝子（例えば、ガイドラインにある遺伝子）又はがんのデータベース」に登録されているという分類基準を、シードジーンフィルタ５４１のアップグレードのための分類基準として設定する。

３つ目の観点の分類基準の設定は、図８中「３」と表記されたものであり、専門家等のユーザ自身が指定する遺伝子を用いた分類基準を設定するというものである。
専門家等のユーザは、３つ目の観点での分類基準の設定を所望する場合、図８中「３」と表記された右方のボックスをチェックする操作をする。
この第３の観点では、専門家等のユーザは、指定欄Ａ４により、当該ユーザ自身が重みづけをする遺伝子を指定する。この場合、パラメータ設定受入部５４２は、専門家等のユーザ自身により指定された重みづけをする遺伝子や発現調節配列に該当するという分類基準を、シードジーンフィルタ５４１のアップグレードのための分類基準として設定する。

シードジーンフィルタ５４１のアップグレードのための分類基準の一例として、３つの観点の分類基準について説明した。これら３つの観点の分類基準は排他的なものではなく、２以上組み合わせて指定することが可能である。２つ以上の分類基準が指定された場合（「１」乃至「３」の右方のボックスのうち２つ以上がチェックされた場合）、ＯＲ条件、即ち２つ以上の分類基準のうち少なくとも１つが満たす場合には満たすと判定されるという条件が採用される。
具体的には、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ２に分類されている場合、当該分類対象が２つ以上の分類基準のうち少なくとも１つを満たすときにはランクＭＹＣ１にアップグレードさせる。同様に、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ１に分類されている場合、当該分類対象が２つ以上の分類基準のうち少なくとも１つを満たすときにはランクＭＹＣ１にアップグレード（維持）させる。

なお、図８の画面例において、領域ＳＤＧは、シードジーンフィルタ５４１のダウングレードの機能を発揮させるために、専門家等のユーザが指定操作するためのものである。
即ち、シードジーンフィルタ５４１のダウングレードの機能を発揮させるためには、専門家等のユーザは、図８中「４」と表記された右方のボックスをチェックする操作をする。
この場合、上述の３つの観点の分類基準のうち１以上が指定されている（「１」乃至「３」の右方のボックスのうち１つ以上がチェックされている）場合、１以上の分類基準の何れも満たさないときにはダウングレードの対象になる。
即ち、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ２に分類されている場合、当該分類対象が１以上の分類基準のうち何れも満たさないときにはランクＭＹＣ２にダウングレード（維持）させる。同様に、シードジーンフィルタ５４１は、分類対象の変異状態（配列変異）がランクＭＹＣ１に分類されている場合、当該分類対象が１以上の分類基準の何れも満たさないときにはランクＭＹＣ２にダウングレードさせる。

ここで、図８の画面例において、領域ＲＳは、レスキューフィルタ部５５の分類基準を設定するためのパラメータを、専門家等のユーザが指定操作するためのものである。
専門家等のユーザは、複数のデータベース又はリストのうち１以上をパラメータとして指定する。この場合、レスキューフィルタ部５５は、専門家等のユーザにより指定された１以上のデータベース又はリストのうち何れかに登録されているという分類基準を、レスキューフィルタ部５５の分類基準として設定する。
即ち、レスキューフィルタ部５５は、共通フィルタ部５３による一次的な評価としてランクＭＹＣ３に分類された１以上の変異状態（配列変異）、及び、シードジーンフィルタ部５４によりランクＭＹＣ２に再分類された１以上の変異状態（配列変異）（ランクＭＹＣ２が維持されたものも含む）の夫々を分類対象として順次設定する。
レスキューフィルタ部５５は、分類対象の変異状態（配列変異）が分類基準を満たす場合にはランクＭＹＣ１に再分類し、分類基準を満たさない場合にはランクＭＹＣ３若しくはＭＹＣ２を維持する。

なお、図８の画面例で設定されるレスキューフィルタ部５５は、ルールベースの手法が採用されたものである。
ただし、レスキューフィルタ部５５の分類手法は、特にこれに限定されず、上述のように、機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法が採用されてもよい。以下、この手法が採用された場合のレスキューフィルタ部５５について説明する。

図示はしないが、学習装置は、所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習を実行する。これにより、学習装置は、ランクＭＹＣ２若しくはＭＹＣ３の所定の配列変異を入力すると、ランクＭＹＣ１として再分類して出力するか又はランクＭＹＣ２若しくはＭＹＣ３で維持して出力するモデル（例えばＡＩモデル）を生成又は更新する。
ここで、更新するとは、学習情報セットを追加して再学習することを意味する。また、学習装置は、分析装置１の一部として設けられてもよいし、分析装置１とは異なる装置として設けられてもよい。

例えば、公共データベースとしては、ＣｌｉｎＶａｒ（ヒトゲノムの多様性と関連する疾患、遺伝疾患についてのデータベース）や上述のＣＯＳＭＩＣを採用することができる。
また例えば、ヒト遺伝子多型のデータベースとして、ｄｂｓｎｐを採用することができる。
また例えば、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベースとして、ＤＧＩｄを採用することができる。
また例えば、薬物応答のデータベースとして、ＰｈａｒｍＧＫＢやＯｎｃｏＫＢを採用することができる。

この場合、レスキューフィルタ部５５は、共通フィルタ部５３による一次的な評価としてランクＭＹＣ３に分類された１以上の変異状態（配列変異）、及び、シードジーンフィルタ部５４によりランクＭＹＣ２に再分類された１以上の変異状態（配列変異）（ランクＭＹＣ２が維持されたものも含む）の夫々を分類対象として順次設定する。
レスキューフィルタ部５５は、分類対象の変異状態（配列変異）を、上述の学習装置により生成又は更新されたモデル（ＡＩモデル等）に入力し、当該モデルの出力がランクＭＹＣ１であると場合にはランクＭＹＣ１に再分類し、それ以外の場合にはランクＭＹＣ３若しくはＭＹＣ２を維持する。

以上、図６乃至図８を参照して、分析装置１の機能的構成について説明した。
次に、図９以降の図面を参照して、分析装置１の処理について説明する。

図９は、図６の機能的構成を有する分析装置における分析処理の流れの一例を説明するフローチャートである。

ステップＳ１において、設定受入部５２やパラメータ設定受入部５４２は、パラメータ等の設定を受け入れる。

ステップＳ２において、データ受入部５１は、分析の対象となる検体の遺伝情報からシーケンスアライメントにより抽出された変異塩基配列情報のうち、所定の変異状態（配列変異データ）を処理対象として決定する。

ステップＳ３において、共通フィルタ部５３は、処理対象の配列変異データに対して共通フィルタ処理を施すことで、当該処理対象の暫定ランクを出力する。
なお、共通フィルタ処理の詳細は、図１０を用いて説明する。

ステップＳ４において、分析装置１は、処理対象の配列変異データの暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ４であるか否かを判定する。

暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ４である場合には、ステップＳ４において「ＹＥＳ」と判定されて、処理はステップＳ９に進む。
ステップＳ９において、ランク決定部５６は、処理対象の配列変異データの暫定ランクとして、ランクＭＹＣ４を記録する。その後処理はステップＳ１０に進む。なお、ステップＳ１０以降の処理は後述する。

これに対して、暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ１乃至３の何れかである場合には、ステップＳ４において「ＮＯ」と判定されて、処理はステップＳ５に進む。
ステップＳ５において、分析装置１は、処理対象の配列変異データの暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ３であるか否かを判定する。

暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ３である場合には、ステップＳ５において「ＹＥＳ」と判定されて、処理はステップＳ８に進む。ステップＳ８の処理については後述する。

これに対して、暫定ランク（共通フィルタ部５３の出力）がランクＭＹＣ１又は２である場合には、ステップＳ５において「ＮＯ」と判定されて、処理はステップＳ６に進む。
ステップＳ６において、シードジーンフィルタ部５４は、処理対象の配列変異データに対して、シードジーンフィルタ処理を施す。
なお、シードジーンフィルタ処理の詳細は、図１１を用いて説明する。

ステップＳ７において、分析装置１は、処理対象の配列変異データの暫定ランク（シードジーンフィルタ部５４の出力）がランクＭＹＣ２であるか否かを判定する。

暫定ランク（シードジーンフィルタ部５４の出力）がランクＭＹＣ１である場合には、ステップＳ７において「ＮＯ」と判定されて、処理はステップＳ９に進む。
ステップＳ９において、ランク決定部５６は、処理対象の配列変異データの暫定ランクとして、ランクＭＹＣ１を記録する。その後処理はステップＳ１０に進む。なお、ステップＳ１０以降の処理は後述する。

これに対して、暫定ランク（シードジーンフィルタ部５４の出力）がランクＭＹＣ２である場合には、ステップＳ７において「ＹＥＳ」と判定されて、処理はステップＳ８に進む。

このようにして、シードジーンフィルタ部５４の出力結果としての暫定ランクがランクＭＹＣ２（ステップＳ７「ＹＥＳ」）か、又は、共通フィルタ部５３の出力結果としての暫定ランクがランクＭＹＣ３（ステップＳ５「ＹＥＳ」）の場合、ステップＳ８において、レスキューフィルタ部５５は、処理対象の配列変異データに対してレスキューフィルタ処理を実行する。
なお、レスキューフィルタ処理の詳細は、図１２を用いて説明する。
ステップＳ９において、ランク決定部５６は、処理対象の配列変異データの暫定ランクとして、レスキューフィルタ部５５の出力結果（ランクＭＹＣ１、ランクＭＹＣ２、又はランクＭＹＣ３）を記録する。

このようにして、ステップＳ９において処理対象の配列変異データの暫定ランクが記録されると、処理はステップＳ１０に進む。

ステップＳ１０において、分析装置１は、全ての配列変異データについてランクを記録したか否かを判定する。
ランクが記録されていない配列変異データが存在する場合には、ステップＳ１０において「ＮＯ」と判定されて、処理はステップＳ２に戻され、それ以降の処理が繰り返される。
このようにして、ステップＳ２乃至Ｓ１０「ＮＯ」のループ処理が繰り返された結果、全ての配列変異データのランクが記録された場合には、ステップＳ１０において「ＹＥＳ」と判定されて、処理はステップＳ１１に進む。

ステップＳ１１において、分析結果出力部５７は、分析結果情報を生成して、図１の出力部１７（例えばディスプレイ）から出力したり、通信部１９から図示せぬ他装置に対して送信することで出力する。
これにより、分析処理は終了となる。

さらに、以下、分析処理のうち、ステップＳ３の共通フィルタ処理、ステップＳ６のシードジーンフィルタ処理、及びステップＳ８のレスキューフィルタ処理の夫々の詳細について、その順に説明する。

図１０は、図９の分析処理のうちステップＳ３の共通フィルタ処理の流れの詳細を説明するフローチャートである。

ステップＳ２１において、基本フィルタ５３１は、処理対象の配列変異データについて、基本フィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）が基本フィルタの条件により病原性の可能性なしである場合には、ステップＳ２１において「ＮＯ」と判定されて、暫定ランクがランクＭＹＣ４に設定されて、処理はステップＳ２７に進む。
ステップＳ２７において、共通フィルタ部５３は、共通フィルタ部としての暫定のランクを出力する。
これにより、図９のステップＳ３の共通フィルタ処理は終了し、処理はステップＳ４に進む。

処理対象の変異状態（配列変異）が基本フィルタの条件により病原性の可能性ありである場合には、ステップＳ２１において「ＹＥＳ」と判定されて、暫定ランクがランクＭＹＣ３に設定されて、処理はステップＳ２２に進む。

ステップＳ２２において、時系列フィルタ５３２は、処理対象の配列変異データについて、時系列フィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）が時系列フィルタの条件により病原性の可能性ありである場合には、ステップＳ２２において「ＹＥＳ」と判定されて、暫定ランクがランクＭＹＣ２に設定されて、処理はステップＳ２５に進む。なお、ステップＳ２５以降の処理は後述する。
処理対象の変異状態（配列変異）が時系列フィルタの条件により病原性の可能性ありである場合には、ステップＳ２２において「ＮＯ」と判定されて、暫定ランクがランクＭＹＣ３に設定されて、処理はステップＳ２３に進む。

ステップＳ２３において、データベースフィルタ５３３は、処理対象の配列変異データについて、データベースフィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）がデータベースフィルタの条件により病原性の可能性ありである場合には、ステップＳ２３において「ＹＥＳ」と判定されて、暫定ランクがランクＭＹＣ２に設定されて、処理はステップＳ２５に進む。なお、ステップＳ２５以降の処理は後述する。
処理対象の変異状態（配列変異）が時系列フィルタの条件により病原性の可能性ありである場合には、ステップＳ２３において「ＮＯ」と判定されて、暫定ランクがランクＭＹＣ３に設定されて、処理はステップＳ２４に進む。

ステップＳ２４において、機能予測フィルタ５３４は、処理対象の配列変異データについて、機能フィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）が機能フィルタの条件により病原性の可能性ありである場合には、ステップＳ２４において「ＹＥＳ」と判定されて、暫定ランクがランクＭＹＣ２に設定されて、処理はステップＳ２５に進む。
処理対象の変異状態（配列変異）が機能フィルタの条件により病原性の可能性ありである場合には、ステップＳ２４において「ＮＯ」と判定されて、暫定ランクがランクＭＹＣ３に設定されて、処理はステップＳ２５に進む。

ステップＳ２５において、クオリティフィルタ５３５は、クオリティは十分か否かを判定する。
ステップＳ２１乃至Ｓ２４の処理の結果（基本フィルタ５３１、時系列フィルタ５３２、データベースフィルタ５３３及び機能予測フィルタ５３４のフィルタ結果）のクオリティが十分である場合には、ステップＳ２５において「ＹＥＳ」と判定されて、処理はステップＳ２６に進む。
ステップＳ２６において、クオリティフィルタ５３５は、クオリティは十分と判断されたため、暫定ランクから第１所定量である「１」を引く。

ステップＳ２１乃至Ｓ２４の処理の結果（基本フィルタ５３１、時系列フィルタ５３２、データベースフィルタ５３３及び機能予測フィルタ５３４のフィルタ結果）のクオリティが十分でない場合には、ステップＳ２５において「ＮＯ」と判定されて、処理はステップＳ２７に進む。

ステップＳ２７において、共通フィルタ部５３は、共通フィルタ部としての暫定のランクを出力する。
これにより、図９のステップＳ３の共通フィルタ処理は終了し、処理はステップＳ４に進む。

図１１は、図９の分析処理のうちシードジーンフィルタ処理の流れの詳細を説明するフローチャートである。
ステップＳ４１において、シードジーンフィルタ部５４は、処理対象の配列変異データについて、暫定ランクがランクＭＹＣ１か否かを判定する。
暫定ランクがランクＭＹＣ１である場合には、ステップＳ４１において「ＹＥＳ」と判定されて、処理はステップＳ４２に進む。
暫定ランクがランクＭＹＣ２である場合には、ステップＳ４１において「ＮＯ」と判定されて、処理はステップＳ４５に進む。ステップＳ４５以降処理については後述する。

ステップＳ４２において、シードジーンフィルタ５４１は、処理対象の配列変異データについて、アップグレードのための分類基準を満たすか否かを判定する。
処理対象の変異状態（配列変異）がアップグレードのための分類基準を満たす場合には、ステップＳ４２において「ＹＥＳ」と判定されて、処理はステップＳ４３に進む。
ステップＳ４３において、シードジーンフィルタ５４１は、暫定ランクをＭＹＣ１で維持（アップグレード）する。そして、処理は、ステップＳ４８に進む。ステップＳ４８の処理については後述する。

処理対象の変異状態（配列変異）がアップグレードのための分類基準を満たさない場合には、ステップＳ４２において「ＮＯ」と判定されて、処理はステップＳ４４に進む。
ステップＳ４４において、シードジーンフィルタ５４１は、暫定ランクをＭＹＣ２に変更（ダウングレード）する。そして、処理は、ステップＳ４８に進む。ステップＳ４８の処理については後述する。

ステップＳ４５において、シードジーンフィルタ５４１は、処理対象の配列変異データについて、アップグレードのための分類基準を満たすか否かを判定する。

処理対象の変異状態（配列変異）がアップグレードのための分類基準を満たす場合には、ステップＳ４５において「ＹＥＳ」と判定されて、処理はステップＳ４６に進む。
ステップＳ４６において、シードジーンフィルタ５４１は、暫定ランクをＭＹＣ２で維持（ダウングレード）する。そして、処理は、ステップＳ４８に進む。ステップＳ４８の処理については後述する。

処理対象の変異状態（配列変異）がアップグレードのための分類基準を満たさない場合には、ステップＳ４５において「ＮＯ」と判定されて、処理はステップＳ４７に進む。
ステップＳ４７において、シードジーンフィルタ５４１は、暫定ランクをＭＹＣ１に変更（アップグレード）する。そして、処理は、ステップＳ４８に進む。

ステップＳ４８において、シードジーンフィルタ部５４は、シードジーンフィルタ部としての暫定のランクを出力する。
これにより、図９のステップＳ６の共通フィルタ処理は終了し、処理はステップＳ７に進む。

図１２は、図９の分析処理のうちステップＳ８のレスキューフィルタ処理の流れの詳細を説明するフローチャートである。
ステップＳ６１において、レスキューフィルタ部５５は、処理対象の配列変異データについて、レスキューフィルタ条件を満たすか否かを判定する。
処理対象の変異状態（配列変異）がレスキューフィルタ条件を満たさない場合には、ステップＳ６１において「ＮＯ」と判定されて、処理はステップＳ６２に進む。
ステップＳ６２において、レスキューフィルタ部５５は、暫定ランクをランクＭＹＣ３又はＭＹＣ２で維持（ダウングレード）する。そして、処理は、ステップＳ６４に進む。ステップＳ６４の処理については後述する。

処理対象の変異状態（配列変異）がレスキューフィルタ条件を満たす場合には、ステップＳ６１において「ＹＥＳ」と判定されて、処理はステップＳ６３に進む。
ステップＳ６３において、レスキューフィルタ部５５は、暫定ランクをＭＹＣ１に変更（アップグレード）する。そして、処理は、ステップＳ６４に進む。

ステップＳ６４において、レスキューフィルタ部５５は、レスキューフィルタ部としての暫定のランクを出力する。
これにより、図９のステップＳ８のレスキューフィルタ処理は終了し、処理はステップＳ９に進む。

なお、以上のレスキューフィルタ処理は、ルールベースの手法が採用されたレスキューフィルタ部５５の処理例である。
即ち、機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法が採用された場合には、レスキューフィルタ処理は、処理対象の配列データを当該モデルに入力して、当該モデルの出力をランクとして出力するといった単純な処理になる。

以上、本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものとみなす。

例えば、共通フィルタ部５３は、図５の例に特に限定されず、次のような構成を有する各種各様な形態を取ることができる。具体的には例えば、共通フィルタ部５３は、図１３に示すような構成を取ることもできる。

図１３は、図２の分析装置のうち共通フィルタ部５３の詳細な機能的構成のうち図５と異なる一例を示すブロック図である。

図１３の例の共通フィルタ部は、以下のような変異状態（配列変異）の分析において有用である。従って、以下のような変異状態（配列変異）を分析するものとして、説明する。
まず前提として、特定の組み合わせの２つの遺伝子が染色体の転座や逆位等に起因して融合することにより、がん細胞の増殖を引き起こすことが知られている。例えば、ＢＣＲ遺伝子とＡＢＬ遺伝子とが染色体の転座により融合したＢＣＲ－ＡＢＬ融合遺伝子は、白血病細胞を増殖させることが知られている。

共通フィルタ部５３は、基本フィルタ５３１と、時系列フィルタ５３２と、融合遺伝子フィルタ５３６と、保存位置フィルタ５３７と、構造フィルタ５３８と、クオリティフィルタ５３９とを有する。
また、特定の組み合わせの２つの候補遺伝子が融合した融合遺伝子においてドライバー変異を引き起こすことが知られている複数の組み合わせの候補遺伝子がコード化された塩基配列が融合遺伝子ごとにそれぞれ、記憶部１８の一領域記憶されている。例えば、ＢＣＲ遺伝子とＡＢＬ遺伝子とがコード化された塩基配列が記憶部１８の一領域に記憶されている。
即ち、分析装置１は以下の情報を取得し、情報処理に用いることができる。

分析装置１は、特定の組み合わせの候補遺伝子が融合した融合遺伝子（以下、第１融合遺伝子）においてドライバー変異候補となる２つの候補遺伝子の塩基配列を第１融合遺伝子ごとに取得する。図１３の共通フィルタ部５３が採用された例では、分析装置１は、記憶部１８に記憶されている複数の第１融合遺伝子に含まれる２つの候補遺伝子のそれぞれの塩基配列を第１融合遺伝子ごとに記憶部１８から取得する。

また、外部サーバ（図示せず）が複数の第１融合遺伝子の候補遺伝子がコード化された塩基配列を記憶していてもよい。分析装置１は、通信部１９を介して、外部サーバから第１融合遺伝子の２つの候補遺伝子がコード化された塩基配列を第１融合遺伝子ごとに取得してもよい。

特定の候補遺伝子と他の遺伝子とが融合した融合遺伝子ががん細胞の増殖を引き起こすことがある。例えば、ＡＬＫ遺伝子が他の遺伝子と融合した融合遺伝子は、がん細胞の増殖を引き起こすことが知られている。記憶部１８には、他の遺伝子と融合した融合遺伝子（以下、第２融合遺伝子ともいう）においてドライバー変異候補となる複数の候補遺伝子の塩基配列が記憶されている。

分析装置１は、他の遺伝子と融合した第２融合遺伝子においてドライバー変異候補となる候補遺伝子の塩基配列を取得する。例えば、分析装置１は、複数の第２融合遺伝子の候補遺伝子の塩基配列を記憶部１８から取得する。分析装置１は、通信部１９を介して、複数の第２融合遺伝子の候補遺伝子の塩基配列を外部サーバから取得してもよい。

分析装置１は、異なる生物種のゲノムの間において保存された塩基配列である保存配列の位置を示す保存配列位置情報を取得する。例えば、分析装置１は、保存配列位置情報を記憶部１８から取得する。分析装置１は、通信部１９を介して、保存配列位置情報を外部サーバから取得してもよい。

基本フィルタ５３１は、一塩基多型に特有の処理を実行しない点を除いて、図２と同様である。基本フィルタ５３１は、分析の対象とする変異状態が、良性であると判断できる場合に、良性変異であることを表すランク（例えばランクＭＹＣ４）を設定して、次のフィルタとして設定されたフィルタにその結果を出力する。また、基本フィルタ５３１は、分析の対象とする変異状態が、良性であると判断できなければ、良性変異でないことを表すランク（例えばランクＭＹＣ３）を設定し、次のフィルタとして設定されたフィルタに処理をパスする。

基本フィルタ５３１は、設定受入部５２からがん化等を引き起こす既知の変異の塩基配列と変異状態に対応する変異した塩基配列との重複部分の長さの閾値を特定する情報と、データベースごとのパラメータ（良性か否かを判断する基準となる良性判断閾値などとして登録された値と比較される）の設定を受け入れて、当該設定に基づいて分析の対象とする変異状態が、良性であるか否かを判断する。

具体的に基本フィルタ５３１は、がん化等を引き起こす既知の変異の塩基配列と変異状態に対応する変異した塩基配列との重複部分が予め定めた長さの閾値より短い重複部分である場合は良性変異であることを表すランクを設定する。また基本フィルタ５３１は、そうでなくても、変異状態が表す、変異の位置する領域がイントロン領域であれば、良性変異であることを表すランクを設定する。

さらに基本フィルタ５３１は、上記２つの条件を満たさなくとも、指定されたデータベースを検索し、検索によって変異状態が表す変異がデータベースに登録され、かつ、その変異である確率として登録された値が、当該データベースについて予め定められた良性判断閾値を超えている場合、良性変異であることを表すランクを設定する。

時系列フィルタ５３２は、分析の対象とする変異状態に対応するランクから減算する値が図５の共通フィルタ部５３の例と異なることや、時系列フィルタ５３２による演算後のランクの出力先が図５の共通フィルタ部５３の例と異なることを除いて、図５の共通フィルタ部５３の例と同様である。時系列フィルタ５３２は、分析の対象とする変異状態に対応する、時系列情報に含まれる変異状態の情報を参照して、異なるタイミングで抽出した時系列情報においても同じ変異があったか否かを判断する。

時系列フィルタ５３２は、分析の対象とする変異状態と、時系列情報に含まれる対応する変異状態とを用い、同じ変異が存在する場合に、病的である可能性があるものとして分析の対象とする変異状態に対応するランク（例えばランクから第２所定量として「２」を引く）を決定してクオリティフィルタ５３９に処理をパスする。ここでの例では基本フィルタ５３１が処理をパスしているので、当初のランクはランクＭＹＣ３であり、ここで時系列フィルタ５３２が病的である可能性があるものとしたときには、このランクＭＹＣ３から第２所定量として「２」を引いてランクをランクＭＹＣ１と設定することとなる。第２所定量は、第１所定量より大きい値である。

一方、時系列フィルタ５３２は、分析の対象とする変異状態と、時系列情報に含まれる対応する変異状態とを用い、同じ変異が存在しないときには、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスする。

なお、時系列フィルタ５３２は、設定受入部５２から深度や、その他のシーケンスクオリティ、変異アレル頻度等に関する閾値の設定を受けていてもよい。例えば時系列情報に含まれる対応する変異状態に係る深度がここで設定された閾値（例えば「２０」）を超えない場合には、時系列フィルタ５３２は、同じ変異状態があったか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスする。

さらに、この時系列フィルタ５３２は、図５の共通フィルタ部５３の例と同様に、データ受入部５１が時系列情報を受け入れていない場合（変異塩基配列情報としては、分析の対象とする変異塩基配列情報だけを受け入れている場合）には、同じ変異状態があるか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、データベースフィルタ５３３へ処理をパスしてもよい。

また設定受入部５２から時系列フィルタ５３２を利用しない設定が入力されている場合、時系列フィルタ５３２は、同じ変異状態があるか否かを判断することなく、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、融合遺伝子フィルタ５３６へ処理をパスする。

以下、変異塩基配列情報に含まれるいずれかの変異状態に対応する変異している塩基配列を変異塩基配列ともいう。融合遺伝子フィルタ５３６は、分析装置１が取得した第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれているか否かを判定する。より詳しくは、融合遺伝子フィルタ５３６は、分析装置１が取得した複数の第１融合遺伝子について、第１融合遺伝子の２つの候補遺伝子がコード化された２つの塩基配列と、変異塩基配列に含まれる少なくとも一部の塩基配列との類似度が２つとも閾値以上であるか否かを第１融合遺伝子ごとに判定する。類似度は、例えば２つの塩基配列のアライメントが一致する割合により表される。２つの塩基配列のアライメントが一致する割合が閾値以上である場合に、２つの塩基配列が類似すると判定される。

一例としては、融合遺伝子フィルタ５３６は、分析装置１が取得したＢＣＲ遺伝子とＡＢＬ遺伝子とが融合したＢＣＲ－ＡＢＬ第１融合遺伝子においてＢＣＲ遺伝子がコード化された塩基配列と、変異塩基配列における対応する塩基配列との類似度を求める。次に、融合遺伝子フィルタ５３６は、ＢＣＲ－ＡＢＬ第１融合遺伝子においてＡＢＬ遺伝子がコード化された塩基配列と、変異塩基配列における対応する塩基配列との類似度を求める。

融合遺伝子フィルタ５３６は、求めた２つの類似度が２つとも閾値以上であるか否かを判定する。閾値は、例えば、第１融合遺伝子がコード化されたタンパク質の活性と、変異塩基配列が示すタンパク質の活性とが同様であることが想定される値である。

融合遺伝子フィルタ５３６は、求めた２つの類似度が２つとも閾値以上である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定する。

一方、融合遺伝子フィルタ５３６は、求めた２つの類似度のうち、少なくとも一方の類似度が閾値未満である場合に、分析装置１が取得した別の第１融合遺伝子について同様の判定を繰り返す。融合遺伝子フィルタ５３６は、分析装置１が取得した全ての第１融合遺伝子について、求めた２つの類似度の少なくとも一方が閾値未満である場合に、どの第１融合遺伝子についても、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていないと判定する。

また、融合遺伝子フィルタ５３６は、分析装置１が取得した第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との間の類似度がそれぞれ６５％以上１００％以下である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。好ましくは、融合遺伝子フィルタ５３６は、第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との間の類似度がそれぞれ８０％以上１００％以下である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

また、融合遺伝子フィルタ５３６は、複数の第１融合遺伝子の候補遺伝子の組み合わせを記憶している外部サーバへ、分析対象の変異状態に対応する変異塩基配列を送信してもよい。融合遺伝子フィルタ５３６は、外部サーバのデータベースに登録されている第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子の融合遺伝子が変異塩基配列に含まれているか否かを調べる。融合遺伝子フィルタ５３６は、外部サーバのデータベースに登録されている複数の第１融合遺伝子のうち、いずれかの第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子の融合遺伝子が変異塩基配列に含まれていることを示す通知を外部サーバから受信した場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

融合遺伝子フィルタ５３６は、分析装置１が取得した第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれているか否かを判定する。より詳しくは、融合遺伝子フィルタ５３６は、分析装置１が取得した複数の第２融合遺伝子について、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれる融合遺伝子の一方の遺伝子の塩基配列との類似度を第２融合遺伝子ごとに求める。融合遺伝子フィルタ５３６は、求めた類似度が閾値以上であるか否かを判定する。閾値は、第２融合遺伝子がコード化されたタンパク質の活性と、変異塩基配列が示すタンパク質の活性とが同様であることが想定される値である。

融合遺伝子フィルタ５３６は、求めた類似度が閾値以上である場合に、分析装置１が取得した第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子を変異塩基配列が含むと判定する。融合遺伝子フィルタ５３６は、求めた類似度が閾値未満である場合に、分析装置１が取得した別の第２融合遺伝子の候補遺伝子について同様の判定を繰り返す。融合遺伝子フィルタ５３６は、分析装置１が取得した全ての第２融合遺伝子について、求めた類似度が閾値未満である場合に、どの第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子も変異塩基配列が含んでいないと判定する。

また、融合遺伝子フィルタ５３６は、分析装置１が取得した第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度が６５％以上１００％以下である場合に、第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。好ましくは、融合遺伝子フィルタ５３６は、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度が８０％以上１００％以下である場合に、第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

また、融合遺伝子フィルタ５３６は、複数の第２融合遺伝子を記憶している外部サーバへ、変異塩基配列を送信してもよい。融合遺伝子フィルタ５３６は、外部サーバのデータベースに登録されている複数の第２融合遺伝子の候補遺伝子のいずれかと類似する遺伝子の融合遺伝子を変異塩基配列が含んでいるか否かを調べる。融合遺伝子フィルタ５３６は、登録されている複数の第２融合遺伝子の候補遺伝子のいずれかと類似する遺伝子の融合遺伝子を変異塩基配列が含んでいることを示す通知を外部サーバから受信した場合に、第２融合遺伝子の候補遺伝子と類似する遺伝子を変異塩基配列が含んでいると判定してもよい。

融合遺伝子フィルタ５３６は、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれているか否かの判定結果によりランクを決定する。例えば、融合遺伝子フィルタ５３６は、分析装置１が取得した複数の第１融合遺伝子のいずれかについて、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定した場合に、病的である可能性があるものと、分析の対象とする変異状態に対応するランクを決定して（例えばランクから第２所定量として「２」を引く）クオリティフィルタ５３９に処理をパスする。

このようにして、融合遺伝子フィルタ５３６は、ドライバー変異である可能性が比較的高いことが知られている第１融合遺伝子の２つの候補遺伝子の塩基配列を参照して、変異状態が病的である可能性の程度をランクにより精度よく推定することができる。

融合遺伝子フィルタ５３６は、第２融合遺伝子の候補遺伝子の塩基配列と類似する塩基配列の遺伝子が他の遺伝子と融合した融合遺伝子を変異塩基配列が含むか否かの判定結果によりランクを決定する。例えば、融合遺伝子フィルタ５３６は、分析装置１が取得した複数の第２融合遺伝子のいずれかの候補遺伝子と類似する遺伝子を変異塩基配列が含むと判定した場合に、病的な可能性があるものと分析の対象とする変異状態に対応するランクを決定して（例えばランクから第１所定量として「１」を引く）保存位置フィルタ５３７に処理をパスする。

融合遺伝子フィルタ５３６は、分析装置１が取得した第１融合遺伝子の２つの候補遺伝子とそれぞれ類似する候補遺伝子の融合遺伝子が変異塩基配列に含まれていないと判定した場合や、第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子を変異塩基配列が含んでいないと判定した場合に、ランクをそのままに設定（ここでは当初のランクがランクＭＹＣ３であるので、そのままランクＭＹＣ３に設定）して、保存位置フィルタ５３７へ処理をパスする。

融合遺伝子の２つの候補遺伝子の組み合わせの一方が記憶部１８に登録されていない場合であっても、特定の候補遺伝子を含む第２融合遺伝子についてはドライバー変異となる可能性があることが知られている。融合遺伝子フィルタ５３６は、第２融合遺伝子の候補遺伝子の塩基配列を参照することにより、変異状態が病的である可能性の程度をランクにより精度よく提示することができる。

異なる生物種のゲノムの間において保存された保存配列は、細胞の生理活性に重要な役割を果たしていることが多い。このため、保存配列の位置に変異が生じている場合、変異状態が病的である可能性が比較的高くなる。保存位置フィルタ５３７は、異なる生物種のゲノムの間において保存された塩基配列である保存配列の位置が、変異状態の変異箇所に含まれるか否かによりランクを決定する。より詳しくは、保存位置フィルタ５３７は、分析装置１が取得した保存配列位置情報が示す保存配列の位置が、変異箇所に含まれるか否かを判定する。

保存位置フィルタ５３７は、変異箇所に保存配列の位置が含まれると判定した場合に、病的である可能性があるものと分析の対象とする変異状態に対応するランクを決定して（例えばランクから第１所定量として「１」を引く）、構造フィルタ５３８に処理をパスする。一方、保存位置フィルタ５３７は、変異箇所に保存配列の位置が含まれていないと判定した場合に、ランクをそのままに設定して、構造フィルタ５３８へ処理をパスする。このようにして、保存位置フィルタ５３７は、保存配列の位置を示す情報を利用して、この変異箇所に対応する変異状態が病的である可能性の程度をランクにより精度よく提示することができる。

また、染色体の転座や重要な遺伝子の欠失、複数の遺伝子に及ぶ変異等の構造変異が生じている場合、これらの構造変異が病的である可能性は比較的高いことが知られている。構造フィルタは、変異塩基配列情報が表す変異状態が染色体の転座等の構造変異であるか否かを判定する。

構造フィルタ５３８は、変異塩基配列情報が表す変異状態が染色体の転座であるか否かを判定し、この判定結果によりランクを決定する。構造フィルタ５３８は、変異塩基配列情報が示す変異状態に含まれる変異の内容や変異箇所を参照して、染色体の転座が生じているか否かを判定する。また、構造フィルタ５３８は、変異状態に対応する変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定することにより、変異状態が染色体の転座であるか否かを判定してもよい。

構造フィルタ５３８は、変異塩基配列情報が表す変異状態が複数の遺伝子に及ぶ変異であるか否かを判定し、この判定結果によりランクを決定する。構造フィルタ５３８は、変異塩基配列情報が示すいずれかの変異状態に含まれる変異の内容や変異箇所を参照して、複数の遺伝子に及ぶ変異が生じているか否かを判定する。構造フィルタ５３８は、変異状態に対応する変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定することにより、変異状態が複数の遺伝子に及ぶ変異であるか否かを判定してもよい。

記憶部１８には、細胞のがん化等に関与する複数の登録遺伝子を示す情報が予め登録されている。登録遺伝子を示す情報は、例えば、登録遺伝子を識別するための識別情報や登録遺伝子の染色体上の位置を示す情報である。構造フィルタ５３８は、変異塩基配列情報が表す変異状態が登録遺伝子の欠失であるか否かを判定し、この判定結果によりランクを決定してもよい。構造フィルタ５３８は、変異塩基配列情報が示すいずれかの変異状態に含まれる変異の内容や変異箇所を参照して、記憶部１８に登録されている複数の登録遺伝子のいずれかが欠失したか否かを判定する。

記憶部１８には、細胞のがん化等に関与する遺伝子の発現を制御するエンハンサーの染色体上の位置情報が予め登録されている。構造フィルタ５３８は、転座、逆位、欠失等が生じていると判定した場合において、変異塩基配列情報が表す変異状態が記憶部１８に登録されているがん遺伝子が、記憶部１８に登録されているエンハンサーの近傍に位置する脱制御異常であるか否かを判定し、この判定結果によりランクを決定してもよい。

記憶部１８には、遺伝子領域のゲノムにおける向き（５’→３’，３’→５’）の情報が予め登録されている。構造フィルタ５３８は、転座や欠失等により、変異塩基配列情報が表す変異状態が第１融合遺伝子や第２融合遺伝子等の融合遺伝子を形成すると判定した場合において融合遺伝子を形成する２つの遺伝子を第一候補遺伝子及び第二候補遺伝子とすると、第一候補遺伝子と第二候補遺伝子の向きがそれぞれ同一の方向であるか（例えば、第一候補遺伝子５’→３’で第二候補遺伝子も５’→３’方向、もしくは、第一候補遺伝子３’→５’で第二候補遺伝子３’→５’の組み合わせであるか）を判定し、機能的な融合遺伝子が形成されるかの有無を判定し、この判定結果によりランクを決定してもよい。

記憶部１８には、遺伝子領域のアミノ酸翻訳（コドン）やＲＮＡのスプライシングに関わる配列情報が予め登録されている。構造フィルタ５３８は、転座や欠失等により、変異塩基配列情報が表す変異状態が融合遺伝子を形成すると判定した場合において、上記項目の情報を元に機能的な融合遺伝子が形成されるかの有無を判定し、この判定結果によりランクを決定してもよい。

また、構造フィルタ５３８は、変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定する。構造フィルタ５３８は、特定した塩基配列のゲノム上の位置と、記憶部１８に登録されている複数の登録遺伝子の位置とを比較することにより、いずれかの登録遺伝子の欠失が生じたか否かを判定してもよい。

構造フィルタ５３８は、転座が生じていると判定した場合に、病的である可能性があるものとして分析の対象とする変異状態に対応するランクを決定する。例えば、構造フィルタ５３８は、変異状態に対応するランクから第１所定量として「１」を引く。一方、転座が生じていないと判定した場合に、分析の対象とする変異状態に対応するランクをそのままとする。

構造フィルタ５３８は、複数の遺伝子に及ぶ変異が生じていると判定した場合に、病的である可能性があるものとして分析の対象とする変異状態に対応するランク（例えば変異状態に対応するランクから第１所定量として「１」を引く）を決定する。一方、構造フィルタ５３８は、複数の遺伝子に及ぶ構造変異が生じていないと判定した場合に、変異状態に対応するランクをそのままとする。

構造フィルタ５３８は、記憶部１８に登録されている複数の登録遺伝子のいずれかが欠失していると判定した場合に、分析の対象とする変異状態に対応するランクから第１所定量をさらに引いてクオリティフィルタ５３９に処理をパスする。一方、構造フィルタ５３８は、記憶部１８に登録されている複数の遺伝子がいずれも欠失していないと判定した場合に、分析の対象とする変異状態に対応するランクをそのままとし、クオリティフィルタ５３９に処理をパスする。このようにして、構造フィルタ５３８は、染色体の転座や複数の遺伝子に及ぶ変異、細胞のがん化等に関与する遺伝子の欠失等の構造変異が生じているか否かを判定することにより、変異状態が病的である可能性の程度をランクにより精度よく提示することができる。

図１４は、図１３の機能的構成を有する共通フィルタ部による共通フィルタ処理の流れの詳細を説明するフローチャートである。
ステップＳ８１において、基本フィルタ５３１は、処理対象の配列変異データについて、基本フィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）が基本フィルタの条件により病原性の可能性ありではない場合には、ステップＳ８１において「ＮＯ」と判定されて、処理はステップＳ８９に進む。
ステップＳ８９において、共通フィルタ部５３は、共通フィルタ部としての暫定のランクを出力する。
これにより、図１４のステップＳ３の共通フィルタ処理は終了し、処理はステップＳ４に進む。

処理対象の変異状態（配列変異）が基本フィルタの条件により病原性の可能性ありである場合には、ステップＳ８１において「ＹＥＳ」と判定されて、処理はステップＳ８２に進む。

ステップＳ８２において、時系列フィルタ５３２は、処理対象の配列変異データについて、時系列フィルタの条件により病原性の可能性ありか否かを判定する。
処理対象の変異状態（配列変異）が時系列フィルタの条件により病原性の可能性ありである場合には、ステップＳ８２において「ＹＥＳ」と判定されて、処理はステップＳ８７に進む。なお、ステップＳ８７以降の処理は後述する。
処理対象の変異状態（配列変異）が基本フィルタの条件により病原性の可能性ありではない場合には、ステップＳ８２において「ＮＯ」と判定されて、処理はステップＳ８３に進む。

ステップＳ８３において、融合遺伝子フィルタ５３６は、処理対象の配列変異データについて、第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含むか否かを判定する。
処理対象の変異状態（配列変異）が第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含むである場合には、ステップＳ８３において「ＹＥＳ」と判定されて、処理はステップＳ８７に進む。なお、ステップＳ８７以降の処理は後述する。
処理対象の変異状態（配列変異）が第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含むではない場合には、ステップＳ８３において「ＮＯ」と判定されて、処理はステップＳ８４に進む。

ステップＳ８４において、融合遺伝子フィルタ５３６は、処理対象の配列変異データについて、第２融合遺伝子の候補遺伝子に類似する遺伝子の融合遺伝子を含むかを判定する。

ステップＳ８５において、保存位置フィルタ５３７は、処理対象の配列変異データについて、変位箇所に保存配列の位置が含まれるかを判定する。

ステップＳ８６において、構造フィルタ５３８は、処理対象の配列変異データについて、各種の構造変位を含むか否かを判定する。

ステップＳ８７において、クオリティフィルタ５３９は、クオリティは十分か否かを判定する。
ステップＳ８１乃至Ｓ８６の処理の結果（基本フィルタ５３１、時系列フィルタ５３２、融合遺伝子フィルタ５３６、保存位置フィルタ５３７及び構造フィルタ５３８のフィルタ結果）のクオリティが十分である場合には、ステップＳ８７において「ＹＥＳ」と判定されて、処理はステップＳ８８に進む。
ステップＳ８８において、クオリティフィルタ５３９において、クオリティは十分と判断されたため、暫定ランクから第１所定量である「１」を引く。

ステップＳ８１乃至Ｓ８６の処理の結果（基本フィルタ５３１、時系列フィルタ５３２、融合遺伝子フィルタ５３６、保存位置フィルタ５３７及び構造フィルタ５３８のフィルタ結果）のクオリティが十分でない場合には、ステップＳ８７において「ＮＯ」と判定されて、処理はステップＳ８９に進む。

ステップＳ８９において、共通フィルタ部５３は、共通フィルタ部としての暫定のランクを出力する。
これにより、図９のステップＳ３の共通フィルタ処理は終了し、処理はステップＳ４に進む。

例えば、上述の実施形態において、共通フィルタ部５３に対して、シードジーンフィルタ部５４やレスキューフィルタ部５５が採用されたが、特にこれに限定されない。即ち、共通フィルタ部５３のみを採用した場合に比較して、病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性を向上させることができるフィルタであれば足り、例えば次のようなフィルタ部を採用することができる。

即ち、まず前提として、共通フィルタ部５３は、次のような構成を取れば足りる。
即ち、被検体が有する、有害リスクのある目的配列変異を選定する分析装置１に含まれる共通フィルタ部５３は、被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、第１分類基準に基づいて、目的配列変異と選定される可能性が一番高い高カテゴリ（例えばＭＹＣ１）と、当該可能性がそれより低い１以上の低カテゴリ（例えばＭＹＣ２、ＭＹＣ３、ＭＹＣ４）の夫々とのうち何れかに分類する。

この場合、例えば、共通フィルタ部５３の後段に、ルールベースの手法を採用したフィルタ部として、次のような分類基準設定部と第２フィルタリング部とを有する構成を採用することができる。
即ち、分類基準設定部は、高カテゴリに分類するための第１分類基準とは異なる分類基準であって、データベース又はリストに登録されているという分類基準を、第２分類基準（例えばシードジーンフィルタ５４１の分類基準や、ルールベースの手法を採用したレスキューフィルタ部５５の分類基準）として設定する。
第２フィルタリング部は、共通フィルタ部５３により低カテゴリに分類された配列変異のうち、第２分類基準を満たす配列変異を、高カテゴリに分類しなおす。

また例えば、共通フィルタ部５３の後段に、ＡＩ等の機械学習の手法を採用したフィルタ部として、次のような第２フィルタリング部とを有する構成を採用することができる。
まず前提として、図示せぬ学習装置は、所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の学習情報セットを用いる所定の機械学習を実行することで、所定の配列変異を入力すると、当該配列変異が目的配列変異である可能性の度合い（例えばランクＭＹＣ１乃至ＭＹＣ４）を出力するモデル（例えばＡＩモデル）を生成又は更新する。
ここで、更新するとは、学習情報セットを追加して再学習することを意味する。また、学習装置は、分析装置１の一部として設けられてもよいし、分析装置１とは異なる装置として設けられてもよい。
この場合、第２フィルタリング部は、共通フィルタ部５３により低カテゴリに分類された配列変異のうち、当該モデルから出力される可能性の度合いが一定以上である配列変異を、高カテゴリに分類しなおす。

ここで、上述したように、レスキューフィルタ部５５に機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法が採用された場合、レスキューフィルタ処理は、処理対象の配列データを当該モデルに入力して、当該モデルの出力をより高いランクとして出力するといった処理とすることもできる。
以下、図１５及び図１６を用いて、機械学習により得られたＡＩモデル等を用いた推論や当該ＡＩモデルの生成又は更新の例について説明する。

図１５は、図１２のレスキューフィルタ処理において機械学習により生成又は更新されるＡＩモデル等を用いる場合において、当該ＡＩモデルを用いた推論の例について説明する図である。
ＡＩモデルを用いた推論における入力や出力には、例えば、図１５に示す表に示すように、「ＭＹＣ（ＡＩ補正後）」、「ＡＩ推定による変異の病原性」、「ルールベースのＭＹＣ（補正前）」、「Ｃｈｒ」、「座標」、「Ｒｅｆｅｒｅｎｃｅ配列」、「変異配列」の項目が存在する。
「Ｃｈｒ」の項目は、図３等の説明で上述した、変異状態（配列変異）の塩基配列が見い出された染色体の番号である。
「座標」の項目は、図６等の説明で上述した、リファレンスゲノム上における座標（位置）である。
「Ｒｅｆｅｒｅｎｃｅ配列」の項目は、リファレンスゲノム上における上述の「座標」における塩基配列（図１５の例では１つの塩基）である。
「変異配列」の項目は、検体の遺伝情報からシーケンスアライメントにより抽出された塩基配列の変異箇所（上述の座標）における塩基配列（図１５の例では１つの塩基）である。

上述したように、レスキューフィルタ部５５には、これらの情報が入力され、共通フィルタ部５３やシードジーンフィルタ部５４で採用されたものとは異なる分類基準を用いてルールベースの手法により分類することができる。
ここで、図１５における、「ルールベースのＭＹＣ（補正前）」の項目は、レスキューフィルタ部５５により共通フィルタ部５３やシードジーンフィルタ部５４で採用されたものとは異なる分類基準を用いてルールベースの手法により分類された結果のランクである。

さらに、レスキューフィルタ部５５は、機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法を採用することができる。
なお、レスキューフィルタ部５５が採用する機械学習により得られたモデル（ＡＩモデル等）の出力は、各種各様なものを採用することができるが、ここでは、ランクを補正するために変異の病原性が有るか否かの指標を「ＭＹＣ（ＡＩ補正後）」を出力するものとする。
ここで、図１５における「ＡＩ推定による変異の病原性」は、専門家にみたてたモデルであって、機械学習により得られたモデル（ＡＩモデル等）による、変異の病原性の有無である。即ち例えば、上述の「Ｃｈｒ」、「座標」、「Ｒｅｆｅｒｅｎｃｅ配列」、「変異配列」の情報が入力され、変異の病原性の有無を推定して出力する、所定のルールベースの手法（専門家の判断基準をルールとした手法等）がモデルとして生成される。その結果、「ＡＩ推定による変異の病原性」が有りと判断された変異については、「ルールベースのＭＹＣ（補正前）」から所定量である「１」が引かれた「ＭＹＣ（ＡＩ補正後）」が、レスキューフィルタ部５５から出力される。
このように、レスキューフィルタ部５５では、機械学習により得られたモデル（ＡＩモデル等）を用いて分類する手法により、「ＭＹＣ（ＡＩ補正後）」が推論結果として出力することができる。
なお、例えば、レスキューフィルタ部５５が採用する機械学習により得られたモデル（ＡＩモデル等）は、「ＡＩ推定による変異の病原性」を出力するものではなく、「ＭＹＣ（ＡＩ補正後）」を出力するように学習されてもよい。

図１６は、図１２のレスキューフィルタ処理において機械学習により生成又は更新されるＡＩモデルを用いる場合において、当該ＡＩモデルの更新の例について説明する図である。
即ち、図１６における、「ＭＹＣ（専門家確認後）」の項目は、図１５に含まれる各種情報を、専門家が判断や精密検査の結果を反映する等して確認した後、即ち、専門家の判断が反映された結果のランクＭＹＣである。
図１６に示す表の４行目（項目名を含めると５行目）においては、「ＭＹＣ（専門家確認後）」と、「ＭＹＣ（ＡＩ補正後）」とが異なっている。
そこで、機械学習により得られたモデル（ＡＩモデル等）は、入力情報ＩＤが入力された場合に、出力情報ＩＬが出力されるように学習（機械学習により得られたモデル（ＡＩモデル等）の更新）を行うことができる。これにより、レスキューフィルタ部５５は、機械学習により得られたモデル（ＡＩモデル等）は、「ＭＹＣ（専門家確認後）」を再現するように学習される。即ち、機械学習により得られたモデル（ＡＩモデル等）が採用されたレスキューフィルタ部５５の精度が向上する。換言すれば、機械学習により得られたモデル（ＡＩモデル）を利用することにより、図１２のレスキューフィルタ処理の精度を向上させることができるようになる。

以上、レスキューフィルタ部５５において、機械学習により生成又は更新されるＡＩモデル等を用いる場合において、当該ＡＩモデルを用いた推論を行うことで精度を向上させることができることについて説明した。
以下、さらに、シードジーンフィルタ処理、即ち、シードジーンフィルタ部５４における処理において、機械学習により生成又は更新されるＡＩモデル等が用いられる例について、説明する。

即ち、シードジーンフィルタ処理において、機械学習により生成また更新されるＡＩモデル等が用いられてもよい。
例えば、モデル（ＡＩモデル等）は、臨床情報及び専門家により確認後のランクＭＹＣに基づいて、シードジーンフィルタ処理において用いられる閾値（カットオフ値）やパラメータに関して最適化するための補正値の提案をするための学習がなされて生成されてもよい。

モデル（ＡＩモデル等）は、臨床情報として、共通フィルタ部５３による暫定のランク及びシードジーン情報取得部５４３により取得されるシードジーン情報を学習データの少なくとも一部として用いることができる。
また、モデル（ＡＩモデル等）は、図１６における「ＭＹＣ（専門家確認後）」の情報を学習データの少なくとも一部として用いることができる。
これにより、モデル（ＡＩモデル等）は、シードジーンフィルタ処理において用いられる閾値（カットオフ値）やパラメータに関して最適化するための補正値を出力することができる。専門家等のユーザは、モデル（ＡＩモデル等）により提案された補正値を確認し、実際にシードジーンフィルタ処理において用いられる閾値（カットオフ値）やパラメータとしてどのような値を用いるのかを判断する。即ち、専門家等のユーザは、モデル（ＡＩモデル）により提案された補正値を検討した上で、例えば、図８の例の画面例に入力するパラメータを決定する。
これにより、モデル（ＡＩモデル等）の提案により、専門家等のユーザは、より好適であると考えられるシードジーンフィルタ処理において用いられる閾値（カットオフ値）やパラメータを採用することができるようになる。

また、これにより、専門医に馴染みのあるルールベースＡＩ、且つ、機械学習のいいとこ取りの折衷型ＡＩが実装されると言える。換言すれば、シードジーンフィルタ処理におけるランクＭＹＣの付与そのものはルールベースにより行われ、そのパラメータは説明可能なパラメータとなっている。そして、そのパラメータの補正値がモデル（ＡＩモデル等）により、行われる。
従来、ＡＩモデルを用いた処理については、どのような根拠でその処理（例えば、フィルタリングの処理）が行われたのかの説明可能性が担保されず、ブラックボックスとなることが通常であった。
しかしながら、上述したモデル（ＡＩモデル等）は、説明可能な閾値（カットオフ値）やパラメータに関して最適化するための補正値を出力することで、これを解消することができるのである。
これにより、人間と同じ方法での、説明可能性（ルールベース）を担保したフィルタリングによる解釈の作業効率の改善と、モデル（ＡＩモデル等）によるルール（特徴量）の改善によるフィルタリング精度の向上が実現される。

また、図４に示すシステム構成、図５に示す分析装置１のハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されない。

また、図６に示す機能ブロック図は、例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システムに備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは、特に図６の例に限定されない。

また、機能ブロックの存在場所も、図６に限定されず、任意でよい。
例えば、図６の例において、上述の処理は分析装置１側で行われる構成となっているが、これに限定されず、図示せぬ他の情報処理装置側で処理の少なくとも一部が行われてもよい。
即ち、分析処理の実行に必要となる機能ブロックは、分析装置１側が備える構成となっているが、これは例示に過ぎない。分析装置１側に配置された機能ブロックの少なくとも一部を、図示せぬ情報処理装置側が備える構成としてもよい。

また、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
また、１つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。

一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。
また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバの他汎用のスマートフォンやパーソナルコンピュータであってもよい。

このようなプログラムを含む記録媒体は、装置本体とは別に配布される図示せぬリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態で提供される記録媒体等で構成される。

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。

以上まとめると、本発明が適用される情報処理システムは、次のような構成を取れば足り、各種各様な実施形態を取ることができる。

即ち、本発明が適用される情報処理装置は、
被検体が有する、有害リスクのある目的配列変異（例えばがんのドライバー変異）を選定する情報処理装置（例えば、図２の分析装置１）であって、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、第１分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリ（例えば、明細書中のランクＭＹＣ１）と、当該可能性がそれより低い１以上の低カテゴリ（例えば、明細書中のランクＭＹＣ２乃至ＭＹＣ４）の夫々とのうち何れかに分類する第１フィルタリング手段（例えば、図２や図５の共通フィルタ部５３）と、
前記高カテゴリに分類するための前記第１分類基準とは異なる分類基準であって、データベース又はリストに登録されているという分類基準を、第２分類基準として設定する分類基準設定手段（例えば、図２のシードジーンフィルタ部５４の図６のパラメータ設定受入部５４２や、ルールベースの手法を採用した図２のレスキューフィルタ部５５の一部）と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記第２分類基準を満たす配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段（例えば、図２のシードジーンフィルタ部５４の図６のシードジーンフィルタ５４１やルールベースの手法を採用した図２のレスキューフィルタ部５５のレスキューフィルタ）と、
を備えれば足りる。
これにより、第１フィルタリング手段によるフィルタリングの結果のうち、目的配列変異と選定される可能性が一番高い高カテゴリに分類されたものの低カテゴリに分類されるべき配列変異が低いカテゴリに分類されなおし、目的配列変異と選定される可能性が低いカテゴリに分類されたものの高いカテゴリに分類されるべき配列変異が高いカテゴリに分類される。その結果、病気の発生や進行に影響する変異である可能性の程度の分析効率や利便性が向上される。

さらに、前記分類基準設定手段は、
前記第２分類基準を設定するためのパラメータとして前記データベースの最低登録件数（例えば図８の指定欄Ａ１に入力されるＣＯＳＭＩＣの登録検体数のカットオフ値）を入力し、
当該データベースに前記最低登録件数以上登録されているという分類基準を、前記第２分類基準として設定する、ことができる。

さらに、前記分類基準設定手段は、
前記第２分類基準を設定するためのパラメータとして特定データベース又は特定リスト（例えば図８の指定欄Ａ３や領域ＲＳで入力するデータベースや重み付けをする遺伝子が含まれているガイドライン）を入力し、
前記特定データベース又は前記特定リストに登録されているという分類基準を、前記第２分類基準として設定する、ことができる。

さらに、前記分類基準設定手段は、
前記第２分類基準を設定するためのパラメータとして所定の疾患（例えば図８の指定欄Ａ２においてユーザが指定する癌腫）を入力し、
前記所定の疾患に関するデータベース又はリストに登録されているという分類基準と、データベース又はリストにおいて前記所定の疾患に関する配列変異として登録されているという分類基準とのうち少なくとも一方を、前記第２分類基準として設定する、ことができる。

さらに、前記分類基準手段は、
前記第２分類基準を設定するためのパラメータとして、特定核酸を示す情報又は当該特定核酸の配列（例えば図８の指定欄Ａ４に入力する、ユーザ指定の重みづけをする配列や、ユーザ指定の特定配列（例えば遺伝子や、マイクロＲＮＡ、非翻訳領域や、プロモーター・エンハンサーといった転写制御エレメントなどの調節領域など。特に、ヒトではｇｅｎｏｍｉｃｃｏｏｒｄｉｎａｔｅｓと呼ばれるｈｇ１９やＧＲＣＨ３８／ｈｇ３８）上での位置情報）を入力し、
前記特定核酸の配列変異に該当するか、若しくは、前記データベース又は前記リストに登録されているという分類基準を、前記第２分類基準として設定する、ことができる。

さらに、前記第２フィルタリング手段は、さらに、前記第１フィルタリング手段により前記高カテゴリに分類された前記配列変異のうち、前記第２分類基準を満たさない配列変異を、前記低カテゴリに分類しなおす（例えば明細書でいう「ダウングレード」をする）、ことができる。

また、本発明が適用される情報処理システムは、
被検体が有する、有害リスクのある目的配列変異を選定する情報処理システム（図２の分析装置１を含む情報処理システム）であって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習を実行することで、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデル（例えばＡＩモデル）を生成又は更新する学習手段と、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリ（例えばＭＹＣ１）と、当該可能性がそれより低い１以上の低カテゴリ（例えばＭＹＣ２、ＭＹＣ３、ＭＹＣ４）の夫々とのうち何れかに分類する第１フィルタリング手段（例えば、図２や図５の共通フィルタ部５３）と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段（例えばＡＩ等の機械学習の手法が適用された図２のレスキューフィルタ部５５）と、
を備えれば足りる。

さらに、被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置（例えば図２の分析装置１）であって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習が実行された結果として得られる、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルが所定の記憶媒体に記憶されている場合において、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリング手段（例えば、図２や図５の共通フィルタ部５３）と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段（例えば、例えばＡＩ等の機械学習の手法が適用された図２のレスキューフィルタ部５５）と、
を備えることができる。

１・・・分析装置、１１・・・ＣＰＵ、１８・・・記憶部、２０・・・ドライブ、３１・・・リムーバルメディア、５１・・・データ受入部、５２・・・設定受入部、５３・・・共通フィルタ部、５４・・・シードジーンフィルタ部、５５・・・レスキューフィルタ部、５６・・・ランク決定部、５７・・・分析結果出力部、５３１・・・基本フィルタ、５３２・・・時系列フィルタ、５３３・・・データベースフィルタ、５３４・・・機能予測フィルタ、５３５・・・クオリティフィルタ、５４１・・・シードジーンフィルタ、５４２・・・パラメータ設定受入部、５４３・・・シードジーン情報取得部

Claims

被検体が有する、有害リスクのある目的配列変異を選定する情報処理システムであって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習を実行することで、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルを生成又は更新する学習手段と、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリング手段と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段と、
を備える情報処理システム。
被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置であって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習が実行された結果として得られる、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルが所定の記憶媒体に記憶されている場合において、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリング手段と、
前記第１フィルタリング手段により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリング手段と、
を備える情報処理装置。
被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置が実行する情報処理方法であって、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習が実行された結果として得られる、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルが所定の記憶媒体に記憶されている場合において、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリングステップと、
前記第１フィルタリングステップの処理により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリングステップと、
を含む情報処理方法。
被検体が有する、有害リスクのある目的配列変異を選定するコンピュータに、
所定の核酸について、有害リスクのある既知の配列変異を示す情報、並びに、公共データベース、ヒト遺伝子多型のデータベース、薬物と遺伝子の相互作用及び創薬可能なゲノム資源に関するデータベース、及び薬物応答のデータベースのうちの少なくとも一部の変異の臨床的意義情報を学習情報セットとして、複数の当該学習情報セットを用いる所定の機械学習が実行された結果として得られる、所定の配列変異を入力すると、当該配列変異が前記目的配列変異である可能性の度合いを出力するモデルが所定の記憶媒体に記憶されている場合において、
前記被検体に含まれる核酸を配列決定して特定された複数の配列変異の夫々を、所定の分類基準に基づいて、前記目的配列変異と選定される可能性が一番高い高カテゴリと、当該可能性がそれより低い１以上の低カテゴリの夫々とのうち何れかに分類する第１フィルタリングステップと、
前記第１フィルタリングステップの処理により前記低カテゴリに分類された前記配列変異のうち、前記モデルから出力される前記可能性の度合いが一定以上である配列変異を、前記高カテゴリに分類しなおす第２フィルタリングステップと、
を含む制御処理を実行させるプログラム。