WO2023181370A1

WO2023181370A1 - 情報処理装置、情報処理方法、及び情報処理プログラム

Info

Publication number: WO2023181370A1
Application number: PCT/JP2022/014507
Authority: WO
Inventors: 和明横山
Original assignee: 国立大学法人東京大学
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-09-28

Abstract

遺伝情報に関する情報処理装置、情報処理方法、及び情報処理プログラムに関する。　被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置であって、前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング部２と、所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて、前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール部３と、を有する情報処理装置、情報処理方法、及び情報処理プログラムを提供する。

Description

情報処理装置、情報処理方法、及び情報処理プログラム

　本発明は、塩基配列の情報処理装置、情報処理方法、及び情報処理プログラムに関する。

　従来、体細胞の遺伝情報に含まれる塩基配列の突然変異に起因して疾病が生じる場合があることは広く知られている。例えば、遺伝子内に生じた一塩基多型（ＳＮＰ）や構造多型（ＳＶ）などの変異は、がんなどの疾病の原因となり得る。近年では、体細胞における種々の塩基配列の変異がどのような疾病に関係するかといった情報がデータベースに記録されており、幅広く利用されている（非特許文献１参照）。

　また、近年、網羅的な塩基配列解析技術（例えば次世代シーケンサー（ＮＧＳ））の進歩により、個人レベルにおける全ゲノムの解析が可能となったことから、一回の変異の分析で検出される変異は、検体あたり数百～数百万と膨大な量となっており、それぞれの変異につき、人為的にその結果の解釈を行うのは効率的でなく、現実的でもない。そこで分析結果の人間による解釈を補助する装置が要望されている。

COSMIC Release v94 is live!、[online]、２０２１年３月２８日、[令和３年１０月８日検索]、インターネット<URL: https://cosmic-blog.sanger.ac.uk/Release-v94/>

　上述のデータベースを利用し、検体の塩基配列を解析することにより、その検体の塩基配列に変異が生じているか否かを判断することができる。しかしながら、それだけの情報で、塩基配列に存在する変異が疾病に直接影響するもの（例えば、がんに対するドライバー変異）であると簡単に判断することはできない。塩基配列の変異が疾病に直接影響すると判断するためには、当該変異以外にも考慮すべき項目が多岐にわたるためである。ところが、そのような多岐にわたる項目を考慮し、検体の塩基配列の変異がどの程度疾病の発生に影響する可能性があるかについて、分析することは行われていなかった。

　そこで、本出願人は、塩基配列の変異が病気の発生や進行に影響する可能性の程度を提示する分析装置を実現するための技術を特許出願している（国際出願番号ＰＣＴ／ＪＰ２０２０／０３７４９９明細書参照）。

　本発明は、塩基配列の変異が病気の発生や進行に影響する可能性の程度を、より正確に提示することを目的とする。

　上記課題を解決する本発明の一態様に係る情報処理装置は、被検体が有する、塩基配列上の有害リスクのある目的配列変異を選定する情報処理装置であって、前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング部と、所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて、前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール部と、を有する情報処理装置を有する。

　本発明の一態様に係る情報処理方法は、被検体が有する、塩基配列上の有害リスクのある目的配列変異を選定する方法であって、前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング工程と、所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール工程と、を有する。

　本発明の一態様に係る情報処理プログラムは、コンピュータを上記の情報処理装置として機能させるように構成される。

　本発明によれば、塩基配列の変異が病気の発生や進行に影響する可能性の程度を、より正確に提示することができる。

本発明の一実施形態に係る情報処理装置の構成例を示すブロック図である。本発明の一実施形態に係る情報処理装置の各機能の例を表す機能ブロック図である。本発明の一実施形態に係る情報処理装置のフィルタリング部の例を表す機能ブロック図である。本発明の一実施形態に係る情報処理装置に入力される塩基配列情報の例を表す説明図である。本発明の一実施形態に係る情報処理装置のフィルタ処理部の例を表す機能ブロック図である。本発明の一実施形態に係る情報処理装置が出力する出力情報の一例を表す説明図である。本発明の一実施形態に係る情報処理装置のコントロール部の例を表す機能ブロック図である。本発明の一実施形態に係る情報処理装置のフィルタリング部の動作例を表す流れ図である。本発明の一実施形態に係る情報処理装置のフィルタ処理部の動作例を表す流れ図である。本発明の一実施形態に係る情報処理装置のコントロール部及び調整部の動作例を表す流れ図である。本発明の第２の実施形態に係る情報処理装置のフィルタ処理部の例を表す機能ブロック図である。本発明の第２の実施形態に係る情報処理装置のフィルタ処理部の動作例を表す流れ図である。

　以下、本発明の一実施形態について添付図面を参照して詳細に説明する。ただし、この実施形態は例であり、本発明はこれに限定されるものではない。

　本発明の第１の実施形態について図面を参照しながら説明する。

　情報処理装置１は、塩基配列上の有害リスクのある目的配列変異を選定する情報処理装置１であって、情報処理の対象となる個体や検体（以下、被検体ともいう）に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング部２を有する。加えて、情報処理装置１は、所属すべきカテゴリが既知である配列変異を含む塩基配列を、分類基準の少なくとも１つに基づいて、有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を当該所属すべきカテゴリと対比するコントロール部３を有する。この情報処理装置１のフィルタリング部２及びコントロール部３については後に詳しく述べる。

　本明細書において、「配列変異」は、変異の位置や種類を含む、塩基配列の変異の状態を意味する。配列変異は、例えば、一塩基の変異であってもよく、複数の遺伝子に及ぶ染色体の転座等の構造変異であってもよい。

　当該配列変異を表す情報を含む情報を「塩基配列情報」と呼ぶ。塩基配列情報は、配列変異を表す情報として、変異のあった位置（リファレンスとなるゲノム情報と比較した場合の染色体上の位置（例えば、リファレンスとなる塩基配列の一方側から何番目の塩基であるかを示す情報）など）において、本来あるべき塩基や塩基配列がどのような塩基や塩基配列に変異しているのかを表す情報を含んでもよい。リファレンスとなるゲノム情報とは例えば、ＮＧＳ解析に必要なゲノム情報であり、ヒトにおいては、ＧＲＣｈ３８（ｈｇ３８）やＧＲＣｈ３７（ｈｇ１９）が挙げられる。加えて、塩基配列情報は、配列変異を表す情報として、シーケンスアライメントにより抽出された情報を含んでもよい。

　また、塩基配列情報は、塩基配列を次世代シーケンサーなどでシーケンシングすることによって取得された情報であってもよい。塩基配列は、被検体から得られた核酸であってもよいし、人工的に合成されたものであってもよい。塩基配列情報には、シーケンシングによって取得される情報として、例えば、ＦＡＳＴＱ形式、ＳＡＭ（Ｓｅｑｕｅｎｃｅ　Ａｌｉｇｎｍｅｎｔ　Ｍａｐ）形式、ＢＡＭ形式のファイルが含まれてもよい。

　本明細書における有害リスクとは、がんを含む疾患が生じる可能性を意味する。例えば、有害リスクがある配列変異とは、その塩基配列の変異によりがんなどの疾患が生じる可能性があることを意味し、有害リスクがない配列変異とは、その可能性がない塩基配列の変異を意味する。なお、情報処理装置１による選定を目的とする配列変異を、特に「目的配列変異」という。

　図１は、情報処理装置１の概略構成を示すブロック図である。図１に示すように、情報処理装置１は、それぞれ制御部１１、記憶部１２、通信部１３、表示部１４、操作受付部１５、ドライブ１６と、を備えている。各構成要素は、バス１８を介して相互に通信可能に接続されている。

　制御部１１は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）を備え、プログラムに従い、各構成要素の制御や各種の演算処理を実行する。

　記憶部１２は、予め各種プログラムや各種データを記憶するＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、作業領域として一時的にプログラムやデータを記憶するＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、各種プログラムや各種データを記憶するハードディスク等を備える。

　通信部１３は、インターネットを含むネットワークＮを介して他の装置（例えば図示せぬ分析結果を閲覧する端末の情報処理装置等）との間で通信を行う。

　表示部１４は、液晶等のディスプレイやスピーカ等により構成され、各種情報を画像や音声として出力する。

　操作受付部１５は、タッチセンサーや、マウス等のポインティングデバイス、キーボード等を備え、ユーザの各種操作を受け付ける。なお、表示部１４及び操作受付部１５は、表示部１４としての表示面に、操作受付部１５としてのタッチセンサーを重畳することによって、タッチパネルを構成してもよい。操作受付部１５は、ドライブ１６を有していてもよい。

　ドライブ１６には、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなる、リムーバブルメディア１７が適宜装着され得る。ドライブ１６によってリムーバブルメディア１７から読み出されたプログラムは、必要に応じて記憶部１２にインストールされる。

　また、リムーバブルメディア１７は、記憶部１２に記憶されている各種データも、記憶部１２と同様に記憶することができる。

　このような図１の情報処理装置１の各種ハードウェアと各種ソフトウエアとの協働により、各種処理の実行が可能になる。

　図２は、本実施形態に係る情報処理装置１の制御部１１の機能構成を示すブロック図である。図２に示すように、情報処理装置１の制御部１１は、プログラムを読み込んで処理を実行することによって、フィルタリング部２やコントロール部３、調整部４として機能する。

　＜フィルタリング部＞
　フィルタリング部２は、被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類する。図３は、情報処理装置１においてフィルタリング部２に関わる各種処理を実行するための機能的構成の一例を示すブロック図である。図３に示すように、フィルタリング部２においては、第１データ受入部２１と、第１設定受入部２２と、第１フィルタ処理部２３と、カテゴリ決定部２４と、分析結果出力部２５とが機能する。
（第１データ受入部）
　第１データ受入部２１は、被検体に含まれる核酸を配列決定して特定された１以上の配列変異を含む塩基配列情報を受け入れる。以下、第１データ受入部２１が受け入れた塩基配列情報を、第１塩基配列情報ともいう。当該第１塩基配列情報には、配列変異を表す情報に加えて、情報処理の対象となる個体及び、当該個体から得た検体を識別する検体識別情報などが含まれてもよい。

　図４は、図３の情報処理装置１に第１データ受入部２１で受け入れられる第１塩基配列情報の構成例を示している。

　図４に示すように、第１塩基配列情報は、配列変異毎（同図中各行毎）に、当該配列変異の塩基配列が見出された染色体の番号（Ｃｈｒ）と、開始位置（Ｓｔａｒｔ）と、終了位置（Ｅｎｄ）と、本来あるべき塩基配列（Ｒｅｆ）と、抽出された変異している塩基配列（Ａｌｔ）と、変異している塩基配列の割合（アレル頻度：ＡＦ）とを少なくとも関連付けた情報である。これらに加え、後述する第２データ受入部３１で受け入れられた塩基配列情報には、後述する所属すべきカテゴリに関する情報が含まれている。

　本例の第１塩基配列情報においては、配列変異毎（同図中各行毎）に、これらの情報に対してさらに、深度（ｄｅｐｔｈ）や配列変異のカウント数（ＡｌｔＣｏｕｎｔ）等、品質に関係する指標等が関連付けられている。なお、塩基配列の長さは「１」（この場合、塩基配列の情報はＡ，Ｔ，Ｃ，Ｇのいずれかの塩基を表す情報となる）であってもよい。

　また第１塩基配列情報には、個体の症例等に関する情報（病名や治療歴、腫瘍割合などの情報）が含まれてもよい。

　また、第１データ受入部２１においては、同じ被検体から、異なるタイミング（複数あってもよい）で抽出された塩基配列に関する情報（時系列情報）を受け入れてもよい。この場合は、第１データ受入部２１は、分析の対象とする塩基配列情報の時系列の入力を受けてもよい。

　（第１設定受入部）
　第１設定受入部２２は、第１データ受入部２１にて受け入れた塩基配列情報を分析するための設定を受け付ける。この設定は、例えば、後述するフィルタ処理部に用いるフィルタの種類の設定や、各フィルタにおける分類基準の設定を含む。

　（フィルタ処理部）
　本実施の形態では、フィルタ処理部の動作により、塩基配列の変異の分析結果の解釈に影響する種々の情報に基づく、有害リスクの程度の評価が行われる。この有害リスクの程度の評価結果は、後述するカテゴリＭＹＣ１～ＭＹＣ４のうちいずれかにより表される。

　ここで、解釈に影響する情報には、（１）分析の際に得られる当該変異の付帯情報、及び（２）文献やデータベースに収載された変異に関連する情報、が含まれる。このうち（１）分析の際に得られる当該変異の付帯情報には、（ａ）検出精度や信頼性の情報（例えば、変異が検出エラーでない確率）、（ｂ）変異のアレル頻度（例えば、同一変異を持つ細胞集団の全体に占める割合に関連する指標）、（ｃ）時系列情報（例えば、すなわち同一症例の他の時点での検体において繰り返して当該変異が検出されているか否か）、などがある。

　また、（２）文献やデータベースに収載された変異に関連する情報には、当該変異が疾患のドライバー変異として記載されているか否か（あるいはどの程度の頻度で記述がされているか）を表す情報が含まれる。ＳＮＰ（ｓｉｎｇｌｅ　ｎｕｃｌｅｏｔｉｄｅ　ｐｏｌｙｍｏｒｐｈｉｓｍ）データベースにも登録がある場合、変異アレルはどの程度の対立アレル頻度で、当該人種においてＳＮＰとして報告されているかという情報が文献やデータベースに収載されていてもよい。さらには、機能予測として、当該変異がコード化されたたんぱく質の立体構造や機能に影響を与えるか、例えばがんの病態形成に関わるとして実験などにより示されているか予測されているか否かを表す情報などが文献やデータベースに収載されていてもよい。

　（第１フィルタ処理部）
　第１フィルタ処理部２３は、第１データ受入部２１が受け入れた塩基配列情報に含まれる配列変異を、予め定められた１つ以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリであるＭＹＣ１、ＭＹＣ２、ＭＹＣ３、及びＭＹＣ４のうちいずれかに分類する。なお、第１フィルタ処理部２３の詳細な構成例については、図５を参照して後述する。

　ここで、ＭＹＣ１及びＭＹＣ２は有害リスクが高いカテゴリである。例えば、ＭＹＣ１及びＭＹＣ２は、塩基配列の変異がドライバー変異である可能性が高い。ＭＹＣ１の方が、ＭＹＣ２よりも有害リスクが高く、高確率で真のドライバー変異である可能性が高いことを示している。

　ＭＹＣ３は、ＭＹＣ１及びＭＹＣ２よりも有害リスクが低いカテゴリである。例えば、ＭＹＣ３は、塩基配列における変異がドライバー変異である可能性が低い（それ故にドライバー変異候補としては取り扱わない）と評価されたことを示すカテゴリである。即ち、ＭＹＣ３は、配列変異が有害でない変異と評価されたことを示すカテゴリである。

　ＭＹＣ４は、ＭＹＣ３よりも有害リスクが低いカテゴリである。ＭＹＣ４は、例えば、塩基配列の変異がドライバー変異の可能性はほぼ０であるという評価や、既知のＳＮＰ、ｅｒｒｏｒが起こりやすい領域の変異であることを示すカテゴリである。

　図５は、第１フィルタ処理部２３の詳細な機能的構成の一例を示すブロック図である。図５において、第１フィルタ処理部２３には、基本フィルタ２３１と、時系列フィルタ２３２と、データベースフィルタ２３３と、機能予測フィルタ２３４と、クオリティフィルタ２３５とが設けられている。

　〈基本フィルタ〉
　基本フィルタ２３１は、分析の対象とする配列変異が良性であると判断できる場合に、良性変異であることを表すカテゴリ（例えばＭＹＣ４）を設定する。また、基本フィルタ２３１は、分析の対象とする配列変異が良性であると判断できなければ、有害リスクありとし、良性変異でないことを表すカテゴリ（例えばＭＹＣ３）を設定する。

　ここで良性と判断できる場合とは、がん化等を引き起こす既知の変異の塩基配列と、配列変異に対応する塩基配列と、の重複部分が比較的短い重複部分である場合、配列変異が表す変異の位置する領域がイントロン領域である場合、ＳＮＰデータベース等のように異常がない変異を蓄積したデータベースに配列変異が登録されている場合、又はＧＤＩ（Ｇｅｎｅ　Ｄａｍａｇｅ　Ｉｎｄｅｘ）に基づいて配列変異が良性と判断できる場合等が相当する。

　ここでＧＤＩは、各遺伝子について健常人にどれだけダメージが蓄積されているかを表す指標であり、人によって大きいダメージを受けていても（多様性があっても）、変異によって有害リスクを有すると考えられない遺伝子である可能性を示す。

　基本フィルタ２３１は、第１設定受入部２２から、がん化等を引き起こす既知の変異の塩基配列と配列変異に対応する変異した塩基配列との重複部分の長さの閾値、ＳＮＰであるか否かを判断するデータベースを特定する情報、データベースごとのパラメータ（良性か否かを判断する基準となる良性判断閾値、又はデータベースにＳＮＰである確率などとして登録された値と比較される）の少なくともいずれかの設定を受け入れる。基本フィルタ２３１は、受け入れた設定に基づいて、分析の対象とする配列変異が良性であるか否かを判断する。

　例えば、基本フィルタ２３１は、配列変異が、文節的重複（ｓｅｇｍｅｎｔａｌ　ｄｕｐｌｉｃａｔｉｏｎ）と呼ばれる部位に位置する場合は、良性変異であることを表すカテゴリを設定する。文節的重複は、染色体の１０～３００ｋｂのまとまった領域において、脊椎動物の進化の過程で、遺伝子が複製されて隣り合う部位で遺伝子重複するか、あるいは全く離れた別のゲノム上で遺伝子重複したものである。配列変異が文節的重複に位置する場合、シークエンス結果のリファレンスへのｍａｐｐｉｎｇ時に生じた検出エラーであり、偽陽性の可能性が高いと考えられる。従って、配列変異が文節的重複領域に位置している場合は良性変異とみなす処理を施す。具体的には、配列変異がこの文節的重複領域に位置し、当該文節的重複領域の指標が閾値を超える場合は、エラーの可能性が高いため、良性変異であることを表すカテゴリを設定する。また基本フィルタ２３１は、配列変異が表す変異の位置する領域がイントロン領域であれば、良性変異であることを表すカテゴリを設定する。

　さらに基本フィルタ２３１は、上記２つの条件を満たさなくとも、指定されたＳＮＰデータベースを検索した結果に基づいて、良性変異であることを表すカテゴリを設定してもよい。基本フィルタ２３１は、例えば、検索によって配列変異が表す変異がＳＮＰデータベースに登録され、かつ、そのＳＮＰである確率として登録された値が、当該ＳＮＰデータベースについて予め定められた良性判断閾値を超えている場合、良性変異であることを表すカテゴリを設定する。

　また基本フィルタ２３１は、ここまでの条件を満たさない場合であっても、当該配列変異が存在する遺伝子のＧＤＩを参照して、予め定められたＧＤＩ閾値より大きい場合に、良性変異であることを表すカテゴリを設定する。

　これにより情報処理装置１は、例えばがんのドライバー変異となり得ない（あるいはその可能性が十分低い）遺伝子を予めふるいわけることが可能となる。

　またこの基本フィルタ２３１では、第１設定受入部２２から予め定めた、良性と判断するための複数の条件から、どの条件を利用するか（あるいは全ての条件を利用せず、基本フィルタ２３１としての動作をせずに、全ての配列変異についてカテゴリをＭＹＣ３に設定して処理をパスするか否か）の設定を受け入れてもよい。

　この例では基本フィルタ２３１は、利用すると設定された条件に限って、当該条件を満たすか否かを判断することとなる。

　〈時系列フィルタ〉
　時系列フィルタ２３２は、基本フィルタ２３１が処理をパスした（ＭＹＣ３が設定された）場合に、分析の対象とする配列変異に対応する、時系列情報に含まれる配列変異の情報を参照して、異なるタイミングで抽出した時系列情報においても同じ変異があったか否かを判断する。

　時系列フィルタ２３２は、分析の対象とする配列変異と、時系列情報に含まれる対応する配列変異とを用い、同じ変異が存在する場合に、問題とするべき変異があるものとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定してクオリティフィルタ２３５に処理をパスする。第１所定量は、例えば、配列変異に係るカテゴリから１回の演算において減算又は加算される最小値である。ここでの例では基本フィルタ２３１が処理をパスしているので、当初のカテゴリはＭＹＣ３であり、ここで時系列フィルタ２３２が問題とするべき変異があるものとしたときには、このＭＹＣ３から第１所定量として「１」を引いてカテゴリをＭＹＣ２と設定することとなる。

　一方、時系列フィルタ２３２は、分析の対象とする配列変異と、時系列情報に含まれる対応する配列変異とを用い、同じ変異が存在しないときには、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ２３３へ処理をパスする。

　なお、時系列フィルタ２３２は、第１設定受入部２２から深度や、その他のシーケンスクオリティ、変異アレル頻度等に関する閾値の設定を受けていてもよい。例えば時系列情報に含まれる対応する配列変異に係る深度がここで設定された閾値（例えば「２０」）を超えない場合には、時系列フィルタ２３２は、同じ配列変異があったか否かを判断することなく、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ２３３へ処理をパスする。

　さらに本実施の形態の例では、この時系列フィルタ２３２は、第１データ受入部２１で受け入れた第１塩基配列情報に時系列情報が含まれていない場合には、同じ配列変異があるか否かを判断することなく、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ２３３へ処理をパスしてもよい。

　また、第１設定受入部２２から時系列フィルタ２３２を利用しない設定が入力されている場合、時系列フィルタ２３２は、同じ配列変異があるか否かを判断することなく、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ２３３へ処理をパスする。

　〈データベースフィルタ〉
　データベースフィルタ２３３は、分析の対象とする配列変異が、予め定められた問題とするべき変異に関する情報を蓄積したデータベース（例えばＣＯＳＭＩＣ　Ｃａｎｃｅｒ　Ｄａｔａｂａｓｅなど）に登録されているか否かを、当該データベースのサーバと通信することにより調べる。当該配列変異がデータベースに登録されている場合、問題とするべき変異がある（有害リスクがある）ものとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定して、クオリティフィルタ２３５に処理をパスする。ここで各フィルタによる一連の処理の例を挙げると、分析の対象とする配列変異について、基本フィルタ２３１が有害リスクがあるとして処理をパスし、時系列フィルタ２３２においてカテゴリをそのままとした状態で処理がパスした場合に、データベースフィルタ２３３が有害リスクがあると判断をすると、データベースフィルタ２３３は、ＭＹＣ３から第１所定量として「１」を引いて、カテゴリをＭＹＣ２に設定した上で、クオリティフィルタ２３５に処理をパスする。

　また、データベースフィルタ２３３は、分析の対象とする配列変異が、上記問題とするべき変異に関する情報を蓄積したデータベースに登録されていなかった場合に、カテゴリをそのままに設定して機能予測フィルタ２３４に処理をパスする。ここでの例では、このときのカテゴリはＭＹＣ３のままとなる。

　なお、このデータベースフィルタ２３３は、上記問題とするべき変異に関する情報を蓄積したデータベースとして、どのようなデータベースを利用するかの設定を、第１設定受入部２２から受け入れておく。

　この設定では、複数のデータベースを用いるべき旨の指示がされてもよく、この場合、データベースフィルタ２３３は、分析の対象とする配列変異が、上記問題とするべき変異に関する情報を蓄積したデータベースのいずれかに登録されていた場合に、問題とするべき変異があるものとしてカテゴリを設定する。

　〈機能予測フィルタ〉
　機能予測フィルタ２３４は、変異の有害リスクを評価したり予測したりするプログラム(機械学習プログラムを含む)や、有害リスクの評価結果や予測値を公開したデータベースを参照する。そして、分析の対象とする配列変異が、有害リスクのあるものとしてプログラムやデータベースに登録されている場合に、有害リスクのある変異を有するものとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定し、クオリティフィルタ２３５に処理をパスする。

　ここで変異の有害リスクを評価したプログラムとしては、ＳＩＦＴや、ＰｏｌｙＰｈｅｎ２、ＳｎｐＥｆｆ、ＶＥＰなど広く知られたものがある。また、これらのプログラムやデータベースには、有害リスクの有無についてスコアによる閾値を設けたり、多段階で評価しているものがある。例えば、これらのプログラムやデータベースにおいて有害リスクの有無が判断段階にある場合にも、この機能予測フィルタ２３４は、有害リスクあるものとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定して、クオリティフィルタ２３５に処理をパスするものとする。

　また、機能予測フィルタ２３４は、上述したプログラムやデータベースを参照することで、重要な遺伝子発現に関わるプロモーターの欠失や重複、重要な遺伝子のスプライシングの異常をもたらす欠失や挿入、重要な遺伝子発現制御に重要なｎｏｎｃｏｄｉｎｇ　ＲＮＡの欠失や挿入などが引き起こされるかを予測しても良い。これらのプログラムにおいて有害リスクの有無が判断段階にある場合に、この機能予測フィルタ２３４は、有害リスクあるものとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定して、クオリティフィルタ２３５に処理をパスしても良い。

　ここで各フィルタによる一連の処理の例を挙げると、分析の対象とする配列変異について、基本フィルタ２３１が有害リスクありとして処理をパスし、時系列フィルタ２３２においてカテゴリをそのままとした状態で処理がパスされ、さらにデータベースフィルタ２３３においてもカテゴリがそのままの状態で処理がパスされたときに、この機能予測フィルタ２３４が有害リスクありと判断した場合、機能予測フィルタ２３４は、その際のＭＹＣ３から第１所定量として「１」を引いて、カテゴリをＭＹＣ２に設定した上で、クオリティフィルタ２３５に処理をパスすることとなる。

　またこの機能予測フィルタ２３４は、変異の有害リスクを評価したデータベースを参照して、分析の対象とする配列変異に係る変異が、有害リスクがあるものとしてデータベースに登録されていなければ（又は登録されていても不明であるとか、良性又は良性と推定される場合として登録されている場合）、カテゴリをそのままに設定してクオリティフィルタ２３５に処理をパスする。ここでの例では、このときのカテゴリはＭＹＣ３のままとなる。

　なお、この機能予測フィルタ２３４においても、どのようなデータベースを利用するかの設定を、第１設定受入部２２から受け入れておくものとする。

　〈クオリティフィルタ〉
　クオリティフィルタ２３５は、分析の対象とする配列変異をシーケンスしたときの深度や、各塩基に対するクオリティスコア（例えば、Ｐｈｒｅｄクオリティスコア）、リファレンスゲノムへのマッピングクオリティスコア、がん細胞と正常細胞の変異コールにおける統計学的検定（Ｆｉｓｈｅｒ検定など）の統計値、塩基配列を両側から読むペアエンドリードにける変異をサポートするリード配列のいずれかの側への偏り具合などの指標を用いることでシーケンス処理の品質を評価する。この品質の指標については、深度のほか、配列変異のカウント数など、広く知られた指標があり、クオリティフィルタ２３５は、これらを組み合わせて（あるいはその組み合わせを、第１設定受入部２２から受け入れ、当該受け入れた指標の組み合わせに従って）品質の評価を行う。なお、クオリティフィルタ２３５は、複数の指標を組み合わせる場合は、全ての指標により、品質が十分高いとの条件を満たす場合に、品質が十分であると判断することとする。

　クオリティフィルタ２３５は、この評価により、分析の対象とする配列変異のシーケンス処理の品質が十分である（十分高い）と判断したときに、判断が適性であるとしてカテゴリ（例えば現在のカテゴリから第１所定量として「１」を引く）を設定して、カテゴリ決定部２４に当該カテゴリを出力する。またこのクオリティフィルタ２３５は、分析の対象とする配列変異のシーケンス処理の品質が十分である（十分高い）と判断できないときには、カテゴリをそのままに設定してカテゴリ決定部２４に当該カテゴリを出力する。

　なお、各フィルタに設けられた分類基準の少なくとも１つは、変更又は取捨選択が可能である。さらに、分類基準の少なくとも１つを変更又は選択した後に、フィルタリング部２及びコントロール部３を実行することも可能である。これにより、情報処理装置１は、配列変異が有する有害リスクをより正確に判定することができる。

　（カテゴリ決定部）
　カテゴリ決定部２４は、フィルタ処理部が出力する１以上の配列変異毎のカテゴリ（ＭＹＣ１～ＭＹＣ４のうちのいずれか）に従い、配列変異毎の有害リスクの程度を表すカテゴリ値を決定する。カテゴリ決定部２４は、複数の配列変異のそれぞれに対して、各カテゴリ値を関連付けた情報（以下、「分析結果情報」と呼ぶ）を生成して、分析結果出力部２５に提供する。

　なお、この有害リスクの程度を表すカテゴリ値は、ＭＹＣ１～ＭＹＣ４に基づいて新たに演算された値であってもよいが、ここでは説明の便宜上、ＭＹＣ１～ＭＹＣ４がそのまま採用されるものとする。

　（分析結果出力部）
　分析結果出力部２５は、分析結果情報を、図１の表示部１４（例えばディスプレイ）から出力したり、通信部１３から図示せぬ他装置に対して送信したりすることで出力する。

　図６は、情報処理装置１から出力される分析結果情報の構成例を示している。図６に示すように、分析結果情報は、配列変異毎（同図中各行毎）に、当該配列変異の塩基配列が位置する染色体の番号（Ｃｈｒ）と、開始位置（Ｓｔａｒｔ）と、終了位置（Ｅｎｄ）と、本来あるべき塩基配列（Ｒｅｆ）と、配列変異（Ａｌｔ）と、カテゴリ値（ＭＹＣ）とを少なくとも関連付けた情報である。

　図６の例の分析結果情報には、さらに、配列変異毎（同図中各行毎）に、判断に関する記録情報Ｒも関連付けられている。

　判断に関する記録情報Ｒとは、フィルタ処理部のうち、対象の配列変異の分析に用いられたフィルタについて、どのような分類がなされたのか（各フィルタのパラメータ設定や分類基準に基づく判定内容等）を表す情報である。

　上述のように、第１データ受入部２１が受け入れた塩基配列情報中の変異が、有害リスクを示す４段階のＭＹＣ１～ＭＹＣ４に分類されることにより、多数存在する（例えば数万から数億個）変異の中から、専門医等のユーザが、有害リスクの高い変異、例えば真のドライバー変異を見つけ出す作業を効率的に行うことができるようになる。例えば、専門家等のユーザは、ＭＹＣ１やＭＹＣ２に分類された配列変異に的を絞って、真のドライバー変異を見つけ出す作業を行うことができるようになる。

　＜コントロール部＞
　一方で、情報処理装置１による分類の信頼性を高めるためには、上述した分類処理が適切に実施されているかを確認する必要がある。そこで本実施形態に係る情報処理装置１は、所属すべきカテゴリが既知である配列変異を含む塩基配列を、上述の分類基準の少なくとも１つに基づいてカテゴリの各々へ分類し、その分類の結果を所属すべきカテゴリと対比するコントロール部３を有する。当該対比の結果が一致していた場合は、情報処理装置１の分類処理が適切に実施されていることを確認できる。一方で、当該対比の結果が一致していない場合は、情報処理装置１による分類処理が適切に実施されていない可能性があることを確認できる。

　本実施形態に係るコントロール部３は、所属すべきカテゴリが既知を含む塩基配列である配列変異を、分類基準の少なくとも１つに基づいて、有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を所属すべきカテゴリと対比する。

　図７は、情報処理装置１においてコントロール部３に関わる各種処理を実行するための機能的構成の一例を示すブロック図である。図７に示すように、コントロール部３においては、第２データ受入部３１と、第２設定受入部３２と、第２フィルタ処理部３３と、対比部３４と、対比結果出力部３５と、が機能する。

　（第２データ受入部）
　第２データ受入部３１は、所属すべきカテゴリが既知である１つ以上の配列変異を含む塩基配列を表す情報を含んだ塩基配列情報（以下、第２塩基配列情報ともいう）を受け入れる。ここで、所属すべきカテゴリが既知である配列変異を含む塩基配列には、所属すべきカテゴリが既知である配列変異と、所属すべきカテゴリが既知であるが変異を有さない塩基配列と、を含む。所属すべきカテゴリとは、上述した有害リスクの程度に応じたカテゴリであるＭＹＣ１、ＭＹＣ２、ＭＹＣ３、及びＭＹＣ４のいずれかである。

　第２データ受入部３１で受け入れられる第２塩基配列情報の構成例は、図４に示した第１データ受入部２１で受け入れられる第１塩基配列情報の構成例と同等であるため説明を割愛するが、第２データ受入部３１で受け入れられた塩基配列情報には、各配列変異の所属すべきカテゴリに関する情報が含まれている。

　一実施形態において、所属すべきカテゴリが既知である配列変異を含む塩基配列は、所属すべきカテゴリが異なる２種以上であってもよい。コントロール部３にて、所属すべきカテゴリが異なる２種以上の塩基配列についてフィルタ処理を行うことにより、後述する対比部３４による対比の結果がより詳細なものとなり、フィルタ処理の精度をより詳細に把握できることとなる。

　また、一実施形態において、コントロール部３に分類される所属すべきカテゴリが異なる２種以上の塩基配列は、特定の疾患の原因となる（有害リスクのある）配列変異と、特定の疾患の原因とならない（有害リスクのない）塩基配列と、を含んでもよい。ここで、特定の疾患の原因とならない塩基配列には、有害リスクのない配列変異と、変異を有さない塩基配列と、を含む。例えば、特定のがんの原因となる配列変異を含む塩基配列と、その特定のがんの原因となる配列変異を含まない塩基配列をコントロール部３にて処理する。これにより、有害リスクがある場合とない場合の両方について第２フィルタ処理部３３の判定機能が正常に働いているかを判断することが可能となる。

　また、第２塩基配列情報には、次世代シーケンサー等から出力される、ＶＣＦ（Ｖａｒｉａｎｔ　Ｃａｌｌ　Ｆｏｒｍａｔ）形式、ＦＡＳＴＱ形式、ＳＡＭ（Ｓｅｑｕｅｎｃｅ　Ａｌｉｇｎｍｅｎｔ　Ｍａｐ）形式、及びＢＡＭ（Ｂｉｎａｒｙ　Ａｌｉｇｎｍｅｎｔ　Ｍａｐ）形式などのファイルが含まれ得る。ＶＣＦ形式は、塩基の変異データの保存する際に利用するファイル形式であり、シーケンシングデータをリファレンス配列にマッピングしたとき、リファレンス配列上の塩基とそこにマッピングされたシーケンシングデータ上の塩基などの情報が記載されている。ＦＡＳＴＱ形式のファイルには、塩基配列と、塩基ごとのベースコールのクオリティと、が含まれている。ＳＡＭ形式のファイルは、ＦＡＳＴＱのリード配列をリファレンスとなる配列にマッピングした結果を示したファイルであり、ＢＡＭ形式のファイルは、ＢＡＭ形式はＳＡＭ形式をコンピュータが処理しやすいように圧縮した形式である。

　これらのファイルは任意の配列変異を含む塩基配列を表すものであってもよく、このようなファイルをコントロール部３に供することにより、当該任意の配列変異をより正確に分類することが可能となる。より具体的には、例えば、任意の配列変異が遺伝子において変異が集中するホットスポットである場合、当該ホットスポットの情報を含んだ上記のファイルを、コントロール部３に供することにより、当該ホットスポットにおける変異をより正確に分類することが可能となる。これによりフィルタリング部２における当該ホットスポットにおける変異の分類もより確実に行うことができる。

　また、一実施形態において、被検体が有する塩基配列上の有害リスクのある目的配列変異が特定の疾患のドライバー変異である場合には、所属すべきカテゴリが異なる２種以上の塩基配列は、当該特定の疾患のドライバー変異となる配列変異と、当該特定の疾患のドライバー変異とならない塩基配列と、を含んでもよい。例えば、患者から取得した検体が有する塩基配列上の目的配列変異が、ある白血病のドライバー変異である場合には、当該白血病のドライバー変異である配列変異と、当該白血病のドライバー変異を含まない塩基配列をコントロール部３にて処理する。これにより、情報処理装置１が当該特定の疾患のドライバー変異について正確に分類しているかを把握することが可能となる。

　（第２設定受入部）
　第２設定受入部３２は、第２データ受入部３１にて受け入れた第２塩基配列情報を分析するための設定を受け付ける。この設定は、例えば、後述する第２フィルタ処理部３３において、どのような分類基準に基づいたフィルタを用いるかという設定を含む。

　コントロール部３では、フィルタリング部２と同様に、第２データ受入部３１にて受け入れた塩基配列情報が第２フィルタ処理部３３の動作により、変異の分析結果の解釈に影響する種々の情報に基づく、有害リスク（例えばドライバー変異である可能性）に関する評価が行われる。この評価結果も、フィルタリング部２による評価結果と同様に、カテゴリＭＹＣ１～ＭＹＣ４のうちいずれかに分類される。第２フィルタ処理部３３による評価（分類）の方法や解釈に影響する情報は、フィルタリング部２と同様であるため、説明を割愛する。

　（第２フィルタ処理部）
　第２フィルタ処理部３３は、第２データ受入部３１が受け入れた塩基配列情報に含まれる所属すべきカテゴリが既知である配列変異を含む塩基配列を、少なくとも１つの分類基準に基づいて、有害リスクの程度に応じたカテゴリであるＭＹＣ１、ＭＹＣ２、ＭＹＣ３、及びＭＹＣ４のうちいずれかに分類する。ＭＹＣ１、ＭＹＣ２、ＭＹＣ３、及びＭＹＣ４は、第１フィルタ処理部２３の欄で説明した通りである。また、本明細書では説明の便宜のため、第２フィルタ処理部３３を、第１フィルタ処理部２３と分けて記載したが、第２フィルタ処理部３３に用いられる各分類基準及び各フィルタは、第１フィルタ処理部２３と共通であってもよく、第２フィルタ処理部３３と第１フィルタ処理部２３とが共通のフィルタ処理部であってもよい。

　（対比部）
　対比部３４は、第２データ受入部３１が受け入れた塩基配列情報における変異毎に、第２フィルタ処理部３３が出力するカテゴリ（ＭＹＣ１～ＭＹＣ４のうちのいずれか）と、既知の有害リスクの程度に応じたカテゴリ（ＭＹＣ１～ＭＹＣ４のうちのいずれか）を対比する。また、対比部３４は、各変異の対比の結果を、対比結果出力部３５に提供する。

　なお、この対比結果を表す値は、ＭＹＣ１～ＭＹＣ４に基づいて新たに演算された値であってもよいが、ここでは説明の便宜上、ＭＹＣ１～ＭＹＣ４がそのまま採用されるものとする。

　（対比結果出力部）
　対比結果出力部３５は、対比部３４による対比結果に関する情報を、図１の表示部１４（例えばディスプレイ）から出力したり、通信部１３から図示せぬ他の装置に対して送信したりすることで出力する。

　＜調整部＞
　一実施形態に係る情報処理装置１は、コントロール部３における対比の結果に基づいて、フィルタリング部２及び／又はコントロール部３における分類基準及び／又はフィルタリング部２における分類の結果を調整する調整部４を有していてもよい。当該調整部４を有することにより、情報処理装置１は、フィルタ処理における基準等の較正を実施することができるため、被検体が有する塩基配列における変異の有害リスクの程度をより正確に分類することができる。

　例えば、コントロール部３における対比部３４での対比の結果、ある配列変異について、フィルタ処理部が出力するカテゴリと、既知の有害リスクの程度に応じたカテゴリと、が異なる場合は、フィルタ処理部において配列変異の有害リスクの程度が正確に分類されていないこととなる。このような場合に、調整部４は、フィルタ処理部の各フィルタの分類基準等を対比結果に基づいて較正することにより、フィルタ処理部が出力するカテゴリが、既知のカテゴリと一致するようにする。

　また、調整部４は、コントロール部３における対比部３４の対比の結果、ある配列変異について、フィルタ処理部が出力するカテゴリと、既知の有害リスクの程度に応じたカテゴリと、が一致しない場合は、フィルタリング部２の分類結果を採用せずに、調整部４による調整が終了した後に、再度フィルタリング部２による分類処理を行うようにすることもできる。また、調整部４は、コントロール部３における対比部３４の対比の結果に基づき、生じた問題の内容をエラーメッセージで表示する機能を有していてもよい。例えば、フィルタ処理のどの段階で問題が生じたかを表示することができる。

　また、コントロール部３で分類する配列変異は、所属すべきカテゴリが既知の配列変異を含む核酸の標準組成物を配列決定したものであってもよい。すなわち、所属すべきカテゴリが既知の配列変異を含む核酸の標準組成物を、次世代シーケンサー等のシーケンシング装置によるシーケンスで配列決定し、その配列決定の結果の情報をコントロール部３による処理に供してもよい。コントロール部３にて、標準組成物を配列決定した結果の情報を分類し、当該分類の結果を本来標準組成物が所属すべき既知のカテゴリと比較することにより、配列決定の条件（例えば、シーケンシング装置での配列決定やシーケンシングの前処理工程など）が正しかったか否かの確認をすることができる。

　この際、当該標準組成物についての配列決定の条件と、被検体に含まれる核酸を配列決定する条件と、が同じであってもよい。例えば、上記の標準組成物を次世代シーケンサー等にてシーケンシングする際の条件と、患者等に由来する被検体に含まれる核酸をシーケンシングする際の条件と、は同じであってもよい。上述した通り、所属すべきカテゴリが既知の標準組成物を配列決定した結果をコントロール部３に供することにより、配列決定の条件が正しかったか否かを確認できる。そのため、被検体に含まれる核酸と標準組成物との配列決定の条件を同じものにすることにより、被検体に含まれる核酸の配列決定の条件が正しかったか否かも併せて確認することができる。

　以下、調整部４における各フィルタの調整について具多的な例を挙げて説明するが、調整部４における調整はこれに限られるものではない。

　《基本フィルタの調整の例》
　調整部４は、基本フィルタ２３１において、がん化等を引き起こす既知の変異の塩基配列と、配列変異に対応する塩基配列と、の重複部分の長さの閾値を調整することができる。例えば、基本フィルタ２３１は、配列変異がこの文節的重複領域に位置し、当該文節的重複領域の指標が閾値を超える場合は、エラーの可能性が高いため、良性変異であることを表すカテゴリを設定するが、この閾値を調整することができる。これにより、基本フィルタ２３１がカテゴリを設定する分類基準を調整することができる。

　また、調整部４は、基本フィルタ２３１で使用されるＳＮＰデータベースを変更することができる。また、調整部４は、基本フィルタ２３１において複数のＳＮＰデータベースを用いるように設定することもできる。また、基本フィルタ２３１においては、配列変異が表す変異が、ＳＮＰデータベースに登録され、かつ、ＳＮＰである確率として当該データベースに登録された値が、基本フィルタ２３１における良性判断閾値を超えている場合、良性変異であることを表すカテゴリを設定するが、調整部４は基本フィルタ２３１における良性判断閾値を変更することができる。当該調整によっても、基本フィルタ２３１が良性変異であるとのカテゴリを設定する分類基準を調整することができる。

　また、基本フィルタ２３１では、当該配列変異が存在する遺伝子のＧＤＩを参照して、予め定められたＧＤＩ閾値より大きい場合に、良性変異であることを表すカテゴリを設定するが、調整部４はこのＧＤＩ閾値を調整することもできる。当該調整によっても、調整部４は、基本フィルタ２３１がカテゴリを設定する分類基準を調整することができる。

　また、調整部４は、第１設定受入部２２等で予め定めた良性と判断するための複数の条件から、利用する条件（あるいは全ての条件を利用せず、基本フィルタ２３１としての動作をせずに、全ての配列変異についてカテゴリをＭＹＣ３に設定して処理をパスするか否か）を変更することもできる。

　《時系列フィルタの調整の例》
　時系列フィルタ２３２は、分析の対象とする配列変異と、時系列情報に含まれる対応する配列変異とを用い、同じ変異が存在する場合に、問題とするべき変異があるものとしてカテゴリを設定する。ここで、例えば、時系列情報が複数含まれる場合に、調整部４は、コントロール部３で時系列フィルタ２３２に用いた時系列情報とは別の時系列情報を用いるように調整することができる。

　また、時系列フィルタ２３２が深度や、その他のシーケンスクオリティ、変異アレル頻度等に関する閾値の設定を予め受け付けている場合、調整部４はこれらの設定を調整することができる。例えば、時系列情報に含まれる対応する配列変異に係る深度の閾値を変更することで、時系列フィルタ２３２が分類するカテゴリを調整することも可能である。

　《データベースフィルタの調整の例》
　データベースフィルタ２３３は、分析の対象とする配列変異が変異に関する情報を蓄積したデータベースに登録されているか否かを、当該データベースのサーバへ配列変異に関する情報を送信して調べる。そして、登録されている場合は、問題とするべき変異があるものとしてカテゴリを設定する。調整部４は、このデータベースフィルタ２３３において、使用するデータベースを変更することができる。これにより、調整部４はデータベースフィルタ２３３が設定するカテゴリを調整することも可能となる。

　《機能予測フィルタの調整の例》
　機能予測フィルタ２３４は、変異の有害リスクを評価したプログラムやデータベースを参照し、分析の対象とする配列変異が、有害リスクのあるものとしてデータベースに登録されている場合に、有害リスクのある変異があるものとしてカテゴリを設定する。調整部４は、参照したものとは別のプログラムやデータベースを参照するように設定することができ、これにより、機能予測フィルタ２３４が設定するカテゴリを調整することができる。

　《クオリティフィルタの調整の例》
　クオリティフィルタ２３５は、分析の対象とする配列変異をシーケンスしたときの深度や、各塩基に対するクオリティスコア（例えば、Ｐｈｒｅｄクオリティスコア）、リファレンスゲノムへのマッピングクオリティスコア、がん細胞と正常細胞の変異コールにおける統計学的検定（Ｆｉｓｈｅｒ検定など）、ペアエンドリードにおける変異のサポートリードの偏り具合の統計値などの品質に関する指標を用いて、分析の対象とする配列変異のシーケンス処理の品質を評価する。調整部４は、シーケンスの品質を表すこれらの指標の評価基準を変更することにより、クオリティフィルタ２３５の設定するカテゴリを調整することができる。

　以上、調整部４による各フィルタにける分類基準の調整方法を述べた。なお、一実施形態に係る情報処理装置１は、調整部４においてこれら分類基準の少なくとも１つを変更又は選択した後に、フィルタリング部２及びコントロール部３による処理を再度実行する再実行部を有していてもよい。これにより、較正された分類基準やフィルタを用いた分類が可能となるため、情報処理装置１の分類の精度が向上する。

　次に、図８以降の図面を参照して、情報処理装置１の処理について説明する。

　図８は、図３の機能的構成を有する情報処理装置１のフィルタリング部２における一連の流れの例を説明するフローチャートである。

　ステップＳ１において、第１設定受入部２２は、塩基配列情報を分析するための設定を受け付ける。ここで第１フィルタ処理部２３において、どのような分類基準に基づいたフィルタを用いるかという設定も受け入れる。

　ステップＳ２において、第１データ受入部２１は、分析の対象となる被検体の遺伝情報からシーケンスアライメントにより抽出された塩基配列情報のうち、所定の配列変異を処理対象として決定する。

　ステップＳ３において、第１フィルタ処理部２３は、処理対象の配列変異に対してフィルタ処理を施すことで、当該処理対象のカテゴリを出力する。第１フィルタ処理部２３におけるフィルタ処理の詳細については、図９を用いて別途説明する。

　続いてステップＳ４において、情報処理装置１は、全ての配列変異についてカテゴリを記録したか否かを判定する。

　カテゴリが記録されていない配列変異が存在する場合には、ステップＳ４において「ＮＯ」と判定されて、処理はステップＳ２に戻され、それ以降の処理が繰り返される。このようにして、ステップＳ２～Ｓ４「ＮＯ」のループ処理が繰り返された結果、全ての配列変異のカテゴリが記録された場合には、ステップＳ４において「ＹＥＳ」と判定されて、処理はステップＳ５に進む。

　ステップＳ５において、分析結果出力部２５は、分析結果情報を生成して、図１の表示部１４（例えばディスプレイ）から出力したり、通信部１３から図示せぬ他装置に対して送信したりすることで出力する。これにより、分析処理は終了となる。

　以下に、ステップＳ３のフィルタ処理の詳細について、図９のフローチャートを用いて説明する。

　ステップＳ３１において、基本フィルタ２３１は、処理対象の配列変異について、基本フィルタ２３１の条件により有害リスクありか否かを判定する。

　処理対象の配列変異が基本フィルタ２３１の条件により有害リスクなしである場合には、ステップＳ３１において「ＮＯ」と判定されて、カテゴリがＭＹＣ４に設定されて、処理はステップＳ３７又はステップ３５に進む。

　ステップＳ３７に進んだ場合、第１フィルタ処理部２３は、第１フィルタ処理部２３としてのカテゴリを出力する。これにより、図９のステップＳ３のフィルタ処理は終了し、処理はステップＳ４に進む。なお、ステップＳ３５に進んだ場合の処理は後述する。

　処理対象の配列変異が基本フィルタ２３１の条件により有害リスクありである場合には、ステップＳ３１において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ３２に進む。

　ステップＳ３２において、時系列フィルタ２３２は、処理対象の配列変異について、時系列フィルタ２３２の条件により有害リスクありか否かを判定する。処理対象の配列変異が時系列フィルタ２３２の条件により有害リスクありである場合には、ステップＳ３２において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ２に設定されて、処理はステップＳ３５に進む。なお、ステップＳ３５以降の処理は後述する。

　処理対象の配列変異が時系列フィルタ２３２の条件により有害リスクなしである場合には、ステップＳ３２において「ＮＯ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ３３に進む。

　ステップＳ３３において、データベースフィルタ２３３は、処理対象の配列変異について、データベースフィルタ２３３の条件により有害リスクありか否かを判定する。

　処理対象の配列変異がデータベースフィルタ２３３の条件により有害リスクありである場合には、ステップＳ３３において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ２に設定されて、処理はステップＳ３５に進む。なお、ステップＳ３５以降の処理は後述する。

　処理対象の配列変異が時系列フィルタ２３２の条件により有害リスクなしである場合には、ステップＳ３３において「ＮＯ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ３４に進む。

　ステップＳ３４において、機能予測フィルタ２３４は、処理対象の配列変異について、機能予測フィルタ２３４の条件により有害リスクありか否かを判定する。

　処理対象の配列変異が機能予測フィルタ２３４の条件により有害リスクありである場合には、ステップＳ３４において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ２に設定されて、処理はステップＳ３５に進む。

　処理対象の配列変異が機能予測フィルタ２３４の条件により有害リスクなしである場合には、ステップＳ３４において「ＮＯ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ３５に進む。

　ステップＳ３５において、クオリティフィルタ２３５は、クオリティは十分か否かを判定する。

　ステップＳ３１～Ｓ３４の処理の結果（基本フィルタ２３１、時系列フィルタ２３２、データベースフィルタ２３３及び機能予測フィルタ２３４のフィルタ結果）のクオリティが十分である場合には、ステップＳ３５において「ＹＥＳ」と判定されて、処理はステップＳ３６に進む。ステップＳ３６において、クオリティフィルタ２３５は、クオリティは十分と判断されたため、カテゴリから第１所定量である「１」を引く。

　ステップＳ３１～Ｓ３４の処理の結果（基本フィルタ２３１、時系列フィルタ２３２、データベースフィルタ２３３及び機能予測フィルタ２３４のフィルタ結果）のクオリティが十分でない場合には、ステップＳ３５において「ＮＯ」と判定されて、処理はステップＳ３７に進む。

　ステップＳ３７において、第１フィルタ処理部２３は、カテゴリを出力する。これにより、図９のステップＳ３のフィルタ処理は終了し、処理はステップＳ４に進む。

　図１０は、図７の機能的構成を有する情報処理装置１のコントロール部３及び調整部４における一連の流れの例を説明するフローチャートである。

　ステップＳ１ｃにおいて、第２設定受入部３２は、所属すべきカテゴリが既知の配列変異を含む塩基配列に関する第２塩基配列情報を分析するための設定を受け付ける。ここで第２フィルタ処理部３３において、どのような分類基準に基づいたフィルタを用いるかという設定も受け入れる。

　ステップＳ２ｃにおいて、第２データ受入部３１は、分析の対象とする塩基配列を決定する。塩基配列が複数ある場合は、複数の変異の中から、分析の対象となる塩基配列を選択し決定する。なお、図１０では、コントロール部３の分析対象とする塩基配列が、所属するカテゴリが既知である配列変異である場合を示すが、コントロール部３では、所属すべきカテゴリが既知であり、変異を有さない塩基配列を分析対象とすることもできる。

　ステップＳ３ｃにおいて、第２フィルタ処理部３３は、処理対象の配列変異に対してフィルタ処理を施すことで、当該処理対象のカテゴリを出力する。第２フィルタ処理部３３におけるフィルタ処理は、図９を用いて説明した第１フィルタ処理部２３におけるフィルタ処理と同様であるため説明を割愛する。

　第２塩基配列情報に、複数の配列変異が含まれている場合は、ステップＳ４ｃにおいて、情報処理装置１は、全ての配列変異についてカテゴリを記録したか否かを判定する。カテゴリが記録されていない配列変異が存在する場合には、ステップＳ４ｃにおいて「ＮＯ」と判定されて、処理はステップＳ２ｃに戻され、それ以降の処理が繰り返される。

　このようにして、ステップＳ２ｃ～Ｓ４ｃ「ＮＯ」のループ処理が繰り返された結果、全ての配列変異のカテゴリが記録された場合には、ステップＳ４ｃにおいて「ＹＥＳ」と判定されて、処理はステップＳ５ｃに進む。

　続いて、ステップＳ５ｃにおいて、第２データ受入部３１が受け入れた第２塩基配列情報における配列変異について、第２フィルタ処理部３３が出力したカテゴリ（ＭＹＣ１～ＭＹＣ４のうちのいずれか）と、既知の所属すべきカテゴリ（ＭＹＣ１～ＭＹＣ４のうちのいずれか）を対比する。対比の結果、フィルタ処理部が出力したカテゴリと、既知の所属すべきカテゴリとの整合性が取れている場合（例えば、これらが一致していた場合）は、整合性が取れている旨の結果を出力し、コントロール部３による処理は終了する。

　一方、対比の結果、第２塩基配列情報における配列変異について、フィルタ処理部が出力したカテゴリと、既知の所属すべきカテゴリとの整合性が取れていない場合（例えば、これらが一致していない場合）は、ステップＳ６ｃにおいて調整部４は、分類基準又はカテゴリの各々への分類の結果を調整する。調整部４における調整方法についての詳細は調整部４の欄で述べる。

　調整後、第２塩基配列情報に含まれる配列変異に対して、ステップＳ２ｃ～Ｓ５ｃの処理を再度実施し、フィルタ処理部が出力したカテゴリと、既知の有害リスクの程度に応じたカテゴリとの対比結果の整合性が取れた場合は、コントロール部３による処理は終了する。なお、対比結果の整合性が取れない場合は、上記のステップＳ２ｃ～Ｓ６ｃの処理を繰り返し行い、整合性が取れた時点でコントロール部３による処理が終了してもよい。

　なお、コントロール部３による処理が終了した後に、フィルタリング部２による処理が実行されてもよい。

　以上、本発明の一実施形態について説明したが、本発明は、上述の実施形態（第１の実施形態とも呼ぶ）に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものとみなす。

　例えば、フィルタ処理部は、図５に示した第１フィルタ処理部２３及び第２フィルタ処理部３３の例に特に限定されず、異なるフィルタ構成を有する各種各様な形態を取ることができる。以下に、本発明に係る情報処理装置１の第２の実施形態として、図１１のブロック図に示す構成を有する第３フィルタ処理部４３を採用した情報処理装置１について説明する。なお、情報処理装置１の第２の実施形態は、下記に説明する構成（例えば、第３フィルタ処理部４３と、それを調整する調整部４）以外は、上述の第１の実施形態と同様の構成を有するため、第１の実施形態と同様の構成についての説明は割愛する。

　図１１の例の第３フィルタ処理部４３は、以下のような配列変異の分析において有用である
　まず前提として、特定の組み合わせの２つの遺伝子が染色体の転座や逆位等に起因して融合することにより、がん細胞の増殖を引き起こすことが知られている。例えば、ＢＣＲ遺伝子とＡＢＬ遺伝子とが染色体の転座により融合したＢＣＲ－ＡＢＬ融合遺伝子は、白血病細胞を増殖させることが知られている。

　第３フィルタ処理部４３は、基本フィルタ２３１と、時系列フィルタ２３２と、融合遺伝子フィルタ２３６と、保存位置フィルタ２３７と、構造フィルタ２３８と、クオリティフィルタ２３５とを有する。

　また、特定の組み合わせの２つの候補遺伝子が融合した融合遺伝子においてドライバー変異を引き起こすことが知られている複数の組み合わせの候補遺伝子がコード化された塩基配列が融合遺伝子ごとにそれぞれ、記憶部１２の一領域記憶されている。例えば、ＢＣＲ遺伝子とＡＢＬ遺伝子とがコード化された塩基配列が記憶部１２の一領域に記憶されている。

　即ち、情報処理装置１は以下の情報を取得し、情報処理に用いることができる。

　情報処理装置１は、特定の組み合わせの候補遺伝子が融合した融合遺伝子（以下、第１融合遺伝子）においてドライバー変異候補となる２つの候補遺伝子の塩基配列を第１融合遺伝子ごとに取得する。図１１の第３フィルタ処理部４３が採用された例では、情報処理装置１は、記憶部１２に記憶されている複数の第１融合遺伝子に含まれる２つの候補遺伝子のそれぞれの塩基配列を第１融合遺伝子ごとに記憶部１２から取得する。

　また、外部サーバ（図示せず）が複数の第１融合遺伝子の候補遺伝子がコード化された塩基配列を記憶していてもよい。情報処理装置１は、通信部１３を介して、外部サーバから第１融合遺伝子の２つの候補遺伝子がコード化された塩基配列を第１融合遺伝子ごとに取得してもよい。

　特定の候補遺伝子と他の遺伝子とが融合した融合遺伝子が、がん細胞の増殖を引き起こすことがある。例えば、ＡＬＫ遺伝子が他の遺伝子と融合した融合遺伝子は、がん細胞の増殖を引き起こすことが知られている。記憶部１２には、他の遺伝子と融合した融合遺伝子（以下、第２融合遺伝子ともいう）においてドライバー変異候補となる複数の候補遺伝子の塩基配列が記憶されている。

　情報処理装置１は、他の遺伝子と融合した第２融合遺伝子においてドライバー変異候補となる候補遺伝子の塩基配列を取得する。例えば、情報処理装置１は、複数の第２融合遺伝子の候補遺伝子の塩基配列を記憶部１２から取得する。情報処理装置１は、通信部１３を介して、複数の第２融合遺伝子の候補遺伝子の塩基配列を外部サーバから取得してもよい。

　情報処理装置１は、異なる生物種のゲノムの間において保存された塩基配列である保存配列の位置を示す保存配列位置情報を取得する。例えば、情報処理装置１は、保存配列位置情報を記憶部１２から取得する。情報処理装置１は、通信部１３を介して、保存配列位置情報を外部サーバから取得してもよい。

　〈基本フィルタ〉
　基本フィルタ２３１は、一塩基多型に特有の処理を実行しない点を除いて、図５に示すフィルタ処理部と同様である。基本フィルタ２３１は、分析の対象とする配列変異が、良性であると判断できる場合に、良性変異であることを表すカテゴリ（例えばＭＹＣ４）を設定して、次のフィルタとして設定されたフィルタにその結果を出力する。また、基本フィルタ２３１は、分析の対象とする配列変異が、良性であると判断できなければ、良性変異でないことを表すカテゴリ（例えばＭＹＣ３）を設定し、次のフィルタとして設定されたフィルタに処理をパスする。

　基本フィルタ２３１は、第１設定受入部２２からがん化等を引き起こす既知の変異の塩基配列と配列変異に対応する変異した塩基配列との重複部分の長さの閾値を特定する情報と、データベースごとのパラメータ（良性か否かを判断する基準となる良性判断閾値などとして登録された値と比較される）の設定を受け入れて、当該設定に基づいて分析の対象とする配列変異が、良性であるか否かを判断する。

　具体的に基本フィルタ２３１は、がん化等を引き起こす既知の変異の塩基配列と配列変異に対応する変異した塩基配列との重複部分が予め定めた長さの閾値より短い重複部分である場合は良性変異であることを表すカテゴリを設定する。また基本フィルタ２３１は、そうでなくても、配列変異が表す、変異の位置する領域がイントロン領域であれば、良性変異であることを表すカテゴリを設定する。

　さらに基本フィルタ２３１は、上記２つの条件を満たさなくとも、指定されたデータベースを検索し、検索によって配列変異が表す変異がデータベースに登録され、かつ、その変異である確率として登録された値が、当該データベースについて予め定められた良性判断閾値を超えている場合、良性変異であることを表すカテゴリを設定する。

　〈時系列フィルタ〉
　時系列フィルタ２３２は、分析の対象とする配列変異に対応するカテゴリから減算する値が図５のフィルタ処理部の例と異なることや、時系列フィルタ２３２による演算後のカテゴリの出力先が図５のフィルタ処理部の例と異なることを除いて、図５のフィルタ処理部の例と同様である。時系列フィルタ２３２は、分析の対象とする配列変異に対応する、時系列情報に含まれる配列変異の情報を参照して、異なるタイミングで抽出した時系列情報においても同じ変異があったか否かを判断する。

　時系列フィルタ２３２は、分析の対象とする配列変異と、時系列情報に含まれる対応する配列変異とを用い、同じ変異が存在する場合に、有害リスクがあるものとして分析の対象とする配列変異に対応するカテゴリ（例えばカテゴリから第２所定量として「２」を引く）を決定して構造フィルタ２３８に処理をパスする。ここでの例では基本フィルタ２３１が処理をパスしているので、当初のカテゴリはＭＹＣ３であり、ここで時系列フィルタ２３２が有害リスクありとしたときには、このＭＹＣ３から第２所定量として「２」を引いてカテゴリをＭＹＣ１と設定することとなる。第２所定量は、第１所定量より大きい値である。

　さらに、この時系列フィルタ２３２は、図５のフィルタ処理部の例と同様に、第１データ受入部２１が時系列情報を受け入れていない場合には、同じ配列変異があるか否かを判断することなく、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、データベースフィルタ２３３へ処理をパスしてもよい。

　また第１設定受入部２２から時系列フィルタ２３２を利用しない設定が入力されている場合、時系列フィルタ２３２は、同じ配列変異があるか否かを判断することなく、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、融合遺伝子フィルタ２３６へ処理をパスする。

　〈融合遺伝子フィルタ〉
　以下、塩基配列情報に含まれるいずれかの配列変異に対応する塩基配列を変異塩基配列ともいう。融合遺伝子フィルタ２３６は、情報処理装置１が取得した第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれているか否かを判定する。より詳しくは、融合遺伝子フィルタ２３６は、情報処理装置１が取得した複数の第１融合遺伝子について、第１融合遺伝子の２つの候補遺伝子がコード化された２つの塩基配列と、変異塩基配列に含まれる少なくとも一部の塩基配列との類似度が２つとも閾値以上であるか否かを第１融合遺伝子ごとに判定する。類似度は、例えば２つの塩基配列のアライメントが一致する割合により表される。２つの塩基配列のアライメントが一致する割合が閾値以上である場合に、２つの塩基配列が類似すると判定される。

　一例としては、融合遺伝子フィルタ２３６は、情報処理装置１が取得したＢＣＲ遺伝子とＡＢＬ遺伝子とが融合したＢＣＲ－ＡＢＬ第１融合遺伝子においてＢＣＲ遺伝子がコード化された塩基配列と、変異塩基配列における対応する塩基配列との類似度を求める。次に、融合遺伝子フィルタ２３６は、ＢＣＲ－ＡＢＬ第１融合遺伝子においてＡＢＬ遺伝子がコード化された塩基配列と、変異塩基配列における対応する塩基配列との類似度を求める。

　融合遺伝子フィルタ２３６は、求めた２つの類似度が２つとも閾値以上であるか否かを判定する。閾値は、例えば、第１融合遺伝子がコード化されたタンパク質の活性と、変異塩基配列が示すタンパク質の活性とが同様であることが想定される値である。

　融合遺伝子フィルタ２３６は、求めた２つの類似度が２つとも閾値以上である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定する。

　一方、融合遺伝子フィルタ２３６は、求めた２つの類似度のうち、少なくとも一方の類似度が閾値未満である場合に、情報処理装置１が取得した別の第１融合遺伝子について同様の判定を繰り返す。融合遺伝子フィルタ２３６は、情報処理装置１が取得した全ての第１融合遺伝子について、求めた２つの類似度の少なくとも一方が閾値未満である場合に、どの第１融合遺伝子についても、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていないと判定する。

　また、融合遺伝子フィルタ２３６は、情報処理装置１が取得した第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との間の類似度がそれぞれ６５％以上１００％以下である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。好ましくは、融合遺伝子フィルタ２３６は、第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との間の類似度がそれぞれ８０％以上１００％以下である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

　また、融合遺伝子フィルタ２３６は、複数の第１融合遺伝子の候補遺伝子の組み合わせを記憶している外部サーバへ、分析対象の配列変異に対応する変異塩基配列を送信してもよい。融合遺伝子フィルタ２３６は、外部サーバのデータベースに登録されている第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子の融合遺伝子が変異塩基配列に含まれているか否かを調べる。融合遺伝子フィルタ２３６は、外部サーバのデータベースに登録されている複数の第１融合遺伝子のうち、いずれかの第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子の融合遺伝子が変異塩基配列に含まれていることを示す通知を外部サーバから受信した場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

　融合遺伝子フィルタ２３６は、情報処理装置１が取得した第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれているか否かを判定する。より詳しくは、融合遺伝子フィルタ２３６は、情報処理装置１が取得した複数の第２融合遺伝子について、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれる融合遺伝子の一方の遺伝子の塩基配列との類似度を第２融合遺伝子ごとに求める。融合遺伝子フィルタ２３６は、求めた類似度が閾値以上であるか否かを判定する。閾値は、第２融合遺伝子がコード化されたタンパク質の活性と、変異塩基配列が示すタンパク質の活性とが同様であることが想定される値である。

　融合遺伝子フィルタ２３６は、求めた類似度が閾値以上である場合に、情報処理装置１が取得した第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子を変異塩基配列が含むと判定する。融合遺伝子フィルタ２３６は、求めた類似度が閾値未満である場合に、情報処理装置１が取得した別の第２融合遺伝子の候補遺伝子について同様の判定を繰り返す。融合遺伝子フィルタ２３６は、情報処理装置１が取得した全ての第２融合遺伝子について、求めた類似度が閾値未満である場合に、どの第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子も変異塩基配列が含んでいないと判定する。

　また、融合遺伝子フィルタ２３６は、情報処理装置１が取得した第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度が６５％以上１００％以下である場合に、第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。好ましくは、融合遺伝子フィルタ２３６は、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度が８０％以上１００％以下である場合に、第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれていると判定してもよい。

　また、融合遺伝子フィルタ２３６は、複数の第２融合遺伝子を記憶している外部サーバへ、変異塩基配列を送信してもよい。融合遺伝子フィルタ２３６は、外部サーバのデータベースに登録されている複数の第２融合遺伝子の候補遺伝子のいずれかと類似する遺伝子の融合遺伝子を変異塩基配列が含んでいるか否かを調べる。融合遺伝子フィルタ２３６は、登録されている複数の第２融合遺伝子の候補遺伝子のいずれかと類似する遺伝子の融合遺伝子を変異塩基配列が含んでいることを示す通知を外部サーバから受信した場合に、第２融合遺伝子の候補遺伝子と類似する遺伝子を変異塩基配列が含んでいると判定してもよい。

　融合遺伝子フィルタ２３６は、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれているか否かの判定結果によりカテゴリを決定する。例えば、融合遺伝子フィルタ２３６は、情報処理装置１が取得した複数の第１融合遺伝子のいずれかについて、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定した場合に、有害リスクがあるものとして、分析の対象とする配列変異に対応するカテゴリを決定して（例えばカテゴリから第２所定量として「２」を引く）構造フィルタ２３８に処理をパスする。

　このようにして、融合遺伝子フィルタ２３６は、ドライバー変異である可能性が比較的高いことが知られている第１融合遺伝子の２つの候補遺伝子の塩基配列を参照して、配列変異の有害リスクの程度をカテゴリにより精度よく推定することができる。

　融合遺伝子フィルタ２３６は、第２融合遺伝子の候補遺伝子の塩基配列と類似する塩基配列の遺伝子が他の遺伝子と融合した融合遺伝子を変異塩基配列が含むか否かの判定結果によりカテゴリを決定する。例えば、融合遺伝子フィルタ２３６は、情報処理装置１が取得した複数の第２融合遺伝子のいずれかの候補遺伝子と類似する遺伝子を変異塩基配列が含むと判定した場合に、有害リスクがあるものと分析の対象とする配列変異に対応するカテゴリを決定して（例えばカテゴリから第１所定量として「１」を引く）保存位置フィルタ２３７に処理をパスする。

　融合遺伝子フィルタ２３６は、情報処理装置１が取得した第１融合遺伝子の２つの候補遺伝子とそれぞれ類似する候補遺伝子の融合遺伝子が変異塩基配列に含まれていないと判定した場合や、第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子を変異塩基配列が含んでいないと判定した場合に、カテゴリをそのままに設定（ここでは当初のカテゴリがＭＹＣ３であるので、そのままＭＹＣ３に設定）して、保存位置フィルタ２３７へ処理をパスする。

　融合遺伝子の２つの候補遺伝子の組み合わせの一方が記憶部１２に登録されていない場合であっても、特定の候補遺伝子を含む第２融合遺伝子についてはドライバー変異となる可能性があることが知られている。融合遺伝子フィルタ２３６は、第２融合遺伝子の候補遺伝子の塩基配列を参照することにより、配列変異の有害リスクの程度をカテゴリにより精度よく提示することができる。

　〈保存位置フィルタ〉
　異なる生物種のゲノムの間において保存された保存配列は、細胞の生理活性に重要な役割を果たしていることが多い。このため、保存配列の位置に変異が生じている場合、配列変異の有害リスクが比較的高くなる。保存位置フィルタ２３７は、異なる生物種のゲノムの間において保存された塩基配列である保存配列の位置が、配列変異の変異箇所に含まれるか否かによりカテゴリを決定する。ここで、保存位置フィルタ２３７は、保存の程度を示す値（ＧＥＲＰやｐｈｙｌｏｐ　ＰｈａｓｔＣｏｎｓなどの保存度の予測ツールの出力値）に基づいた閾値を設け、当該閾値を上回る保存配列のみを、分類に用いることができる。

　保存位置フィルタ２３７は、変異箇所に保存配列の位置が含まれると判定した場合に、有害リスクがあるものと分析の対象とする配列変異に対応するカテゴリを決定して（例えばカテゴリから第１所定量として「１」を引く）、構造フィルタ２３８に処理をパスする。一方、保存位置フィルタ２３７は、変異箇所に保存配列の位置が含まれていないと判定した場合に、カテゴリをそのままに設定して、構造フィルタ２３８へ処理をパスする。このようにして、保存位置フィルタ２３７は、保存配列の位置を示す情報を利用して、この変異箇所に対応する配列変異の有害リスクの程度をカテゴリにより精度よく提示することができる。

　また、染色体の転座や重要な遺伝子の欠失、複数の遺伝子に及ぶ変異等の構造変異が生じている場合、これらの構造変異の有害リスクは比較的高いことが知られている。構造フィルタ２３８は、塩基配列情報が表す配列変異が染色体の転座等の構造変異であるか否かを判定する。

　〈構造フィルタ〉
　構造フィルタ２３８は、塩基配列情報が表す配列変異が染色体の転座であるか否かを判定し、この判定結果によりカテゴリを決定する。構造フィルタ２３８は、塩基配列情報が示す配列変異に含まれる変異の内容や変異箇所を参照して、染色体の転座が生じているか否かを判定する。また、構造フィルタ２３８は、配列変異に対応する変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定することにより、配列変異が染色体の転座であるか否かを判定してもよい。

　構造フィルタ２３８は、塩基配列情報が表す配列変異が複数の遺伝子に及ぶ変異であるか否かを判定し、この判定結果によりカテゴリを決定する。構造フィルタ２３８は、塩基配列情報が示すいずれかの配列変異に含まれる変異の内容や変異箇所を参照して、複数の遺伝子に及ぶ変異が生じているか否かを判定する。構造フィルタ２３８は、配列変異に対応する変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定することにより、配列変異が複数の遺伝子に及ぶ変異であるか否かを判定してもよい。

　記憶部１２には、細胞のがん化等に関与する複数の登録遺伝子を示す情報が予め登録されている。登録遺伝子を示す情報は、例えば、登録遺伝子を識別するための識別情報や登録遺伝子の染色体上の位置を示す情報である。構造フィルタ２３８は、塩基配列情報が表す配列変異が登録遺伝子の欠失であるか否かを判定し、この判定結果によりカテゴリを決定してもよい。構造フィルタ２３８は、塩基配列情報が示すいずれかの配列変異に含まれる変異の内容や変異箇所を参照して、記憶部１２に登録されている複数の登録遺伝子のいずれかが欠失したか否かを判定する。

　記憶部１２には、細胞のがん化等に関与する遺伝子の発現を制御するエンハンサーの染色体上の位置情報が予め登録されている。構造フィルタ２３８は、転座、逆位、欠失等が生じていると判定した場合において、塩基配列情報が表す配列変異が記憶部１２に登録されているがん遺伝子が、記憶部１２に登録されているエンハンサーの近傍に位置する脱制御異常であるか否かを判定し、この判定結果によりカテゴリを決定してもよい。

　記憶部１２には、遺伝子領域のゲノムにおける向き（５’→３’，３’→５’）の情報が予め登録されている。構造フィルタ２３８は、転座や欠失等により、塩基配列情報が表す配列変異が第１融合遺伝子や第２融合遺伝子等の融合遺伝子を形成すると判定した場合において融合遺伝子を形成する２つの遺伝子を第一候補遺伝子及び第二候補遺伝子とすると、第一候補遺伝子と第二候補遺伝子の向きがそれぞれ同一の方向であるか（例えば、第一候補遺伝子５’→３’で第二候補遺伝子も５’→３’方向、もしくは、第一候補遺伝子３’→５’で第二候補遺伝子３’→５’の組み合わせであるか）を判定し、機能的な融合遺伝子が形成されるかの有無を判定し、この判定結果によりカテゴリを決定してもよい。

　記憶部１２には、遺伝子領域のアミノ酸翻訳（コドン）やＲＮＡのスプライシングに関わる配列情報が予め登録されている。構造フィルタ２３８は、転座や欠失等により、塩基配列情報が表す配列変異が融合遺伝子を形成すると判定した場合において、上記項目の情報に基づき、機能的な融合遺伝子が形成されるかの有無を判定し、この判定結果によりカテゴリを決定してもよい。

　また、構造フィルタ２３８は、変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定する。構造フィルタ２３８は、特定した塩基配列のゲノム上の位置と、記憶部１２に登録されている複数の登録遺伝子の位置とを比較することにより、いずれかの登録遺伝子の欠失が生じたか否かを判定してもよい。

　構造フィルタ２３８は、転座が生じていると判定した場合に、有害リスクがあるものとして分析の対象とする配列変異に対応するカテゴリを決定する。例えば、構造フィルタ２３８は、配列変異に対応するカテゴリから第１所定量として「１」を引く。一方、転座が生じていないと判定した場合に、分析の対象とする配列変異に対応するカテゴリをそのままとする。

　構造フィルタ２３８は、複数の遺伝子に及ぶ変異が生じていると判定した場合に、有害リスクがあるものとして分析の対象とする配列変異に対応するカテゴリ（例えば配列変異に対応するカテゴリから第１所定量として「１」を引く）を決定する。一方、構造フィルタ２３８は、複数の遺伝子に及ぶ構造変異が生じていないと判定した場合に、配列変異に対応するカテゴリをそのままとする。

　構造フィルタ２３８は、記憶部１２に登録されている複数の登録遺伝子のいずれかが欠失していると判定した場合に、分析の対象とする配列変異に対応するカテゴリから第１所定量をさらに引いて構造フィルタ２３８に処理をパスする。一方、構造フィルタ２３８は、記憶部１２に登録されている複数の遺伝子がいずれも欠失していないと判定した場合に、分析の対象とする配列変異に対応するカテゴリをそのままとし、構造フィルタ２３８に処理をパスする。このようにして、構造フィルタ２３８は、染色体の転座や複数の遺伝子に及ぶ変異、細胞のがん化等に関与する遺伝子の欠失等の構造変異が生じているか否かを判定することにより、配列変異の有害リスクの程度をカテゴリにより精度よく提示することができる。

　図１２は、図１１の機能的構成を有する第３フィルタ処理部４３によるフィルタ処理の流れの詳細を説明するフローチャートである。

　ステップＳ４１において、基本フィルタ２３１は、処理対象の配列変異について、基本フィルタ２３１の条件により有害リスクありか否かを判定する。処理対象の配列変異が基本フィルタ２３１の条件により有害リスクなしの場合には、ステップＳ４１において「ＮＯ」と判定されて、カテゴリがＭＹＣ４に設定されて、処理はステップＳ４９に進む。

　ステップＳ４９において、第３フィルタ処理部４３は、カテゴリを出力する。

　処理対象の配列変異が基本フィルタ２３１の条件により有害リスクありである場合には、ステップＳ４１において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ４２に進む。

　ステップＳ４２において、時系列フィルタ２３２は、処理対象の配列変異について、時系列フィルタ２３２の条件により有害リスクありか否かを判定する。

　処理対象の配列変異が時系列フィルタ２３２の条件により有害リスクありである場合には、ステップＳ４２において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ２に設定されて、処理はステップＳ４７に進む。なお、ステップＳ４７以降の処理は後述する。

　処理対象の配列変異が時系列フィルタ２３２の条件により有害リスクなしの場合には、ステップＳ４２において「ＮＯ」と判定されて、カテゴリがＭＹＣ３に設定されて、処理はステップＳ４３に進む。

　ステップＳ４３において、融合遺伝子フィルタ２３６は、処理対象の配列変異について、第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含むか否かを判定する。

　処理対象の配列変異が第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含む場合（すなわち、有害リスクありの場合）には、ステップＳ４３において「ＹＥＳ」と判定されて、カテゴリがＭＹＣ２に設定され、処理はステップＳ４７に進む。なお、ステップＳ４７以降の処理は後述する。

　処理対象の配列変異が第１融合遺伝子の２つの候補遺伝子に類似する遺伝子の融合遺伝子を含まない場合（すなわち、有害リスクなしの場合）には、ステップＳ４３において「ＮＯ」と判定されて、カテゴリがＭＹＣ３に設定され、処理はステップＳ４４に進む。

　ステップＳ４４において、融合遺伝子フィルタ２３６は、処理対象の配列変異について、第２融合遺伝子の候補遺伝子に類似する遺伝子の融合遺伝子を含むかを判定する。

　ステップＳ４５において、保存位置フィルタ２３７は、処理対象の配列変異について、変異箇所に保存配列の位置が含まれるかを判定する。

　ステップＳ４６において、構造フィルタ２３８は、処理対象の配列変異について、各種の構造変異を含むか否かを判定する。ステップＳ４４～Ｓ４６の各フィルタにおいて、有害リスクありと判断された場合は、カテゴリがＭＹＣ２に設定される。一方で、有害リスクなしと判断された場合は、カテゴリがＭＹＣ３に設定される。

　ステップＳ４７において、クオリティフィルタ２３５は、クオリティは十分か否かを判定する。

　ステップＳ４１～Ｓ４６の処理の結果（基本フィルタ２３１、時系列フィルタ２３２、融合遺伝子フィルタ２３６、保存位置フィルタ２３７及び構造フィルタ２３８のフィルタ処理の結果）のクオリティが十分である場合には、ステップＳ４７において「ＹＥＳ」と判定されて、処理はステップＳ４８に進む。ステップＳ４７において、クオリティは十分と判断されたため、カテゴリから「１」を引く。

　ステップＳ４１～Ｓ４６の処理の結果（基本フィルタ２３１、時系列フィルタ２３２、融合遺伝子フィルタ２３６、保存位置フィルタ２３７及び構造フィルタ２３８のフィルタ結果）のクオリティが十分でない場合には、ステップＳ４７において「ＮＯ」と判定されて、処理はステップＳ４９に進む。この場合、ステップＳ４７において、クオリティは十分ではないと判断されたため、カテゴリから「１」を引かない。

　下記に、第２の実施形態における第３フィルタ処理部４３の各フィルタに対する調整部４による調整方法の例を述べる。なお、基本フィルタ２３１、時系列フィルタ２３２及びクオリティフィルタ２３５の調整の例については、第１の実施形態と同様であるため説明を割愛する。

　《融合遺伝子フィルタの調整例》
　上述したように、融合遺伝子フィルタ２３６の一実施形態では、第１融合遺伝子の２つの候補遺伝子がコード化された２つの塩基配列と、変異塩基配列に含まれる少なくとも一部の塩基配列との類似度が２つとも閾値以上である場合に、融合遺伝子が変異塩基配列に含まれていると判定する。ここで調整部４は、当該閾値を調整することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。

　また、上述したように、融合遺伝子フィルタ２３６の一実施形態では、情報処理装置１が取得した第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との間の類似度がそれぞれ６５％以上１００％以下である場合に、第１融合遺伝子の２つの候補遺伝子にそれぞれ類似する２つの遺伝子が融合した融合遺伝子が変異塩基配列に含まれていると判定することができる。ここで調整部４は、判定に関わる類似度の割合の範囲を調整することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。例えば、第１融合遺伝子の２つの候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子の２つの遺伝子の塩基配列との類似度がそれぞれ７５％以上１００％以下である場合に融合遺伝子が変異塩基配列に含まれていると判定するとすることもできるし、８５％以上１００％以下である場合に融合遺伝子が変異塩基配列に含まれていると判定するとすることもできる。

　また、上述したように、融合遺伝子フィルタ２３６の一実施形態では、複数の第１融合遺伝子の候補遺伝子の組み合わせを記憶している外部サーバへ、分析対象の配列変異に対応する変異塩基配列を送信し、外部サーバにおける調査結果に基づき、融合遺伝子が変異塩基配列に含まれていると判定することができる。ここで調整部４は、使用する外部サーバを変更することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。

　また、上述した通り、融合遺伝子フィルタ２３６の一実施形態では、情報処理装置１が取得した複数の第２融合遺伝子について、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれる融合遺伝子の一方の遺伝子の塩基配列との類似度を第２融合遺伝子ごとに求める。そして、融合遺伝子フィルタ２３６は、求めた類似度が閾値以上である場合に、情報処理装置１が取得した第２融合遺伝子の候補遺伝子と類似する遺伝子の融合遺伝子を変異塩基配列が含むと判定する。ここで調整部４は、当該類似度の閾値を調整することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。

　また、上述したように融合遺伝子フィルタ２３６の一実施形態では、情報処理装置１が取得した第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度が６５％以上１００％以下である場合に、第２融合遺伝子の候補遺伝子の塩基配列に類似する塩基配列の遺伝子と他の遺伝子とが融合した融合遺伝子が変異塩基配列に含まれていると判定することができる。ここで調整部４は、判定に関わる類似度の割合の範囲を調整することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。例えば、第２融合遺伝子の候補遺伝子の塩基配列と、変異塩基配列に含まれている融合遺伝子における一方の遺伝子の塩基配列との間の類似度がそれぞれ７５％以上１００％以下である場合に融合遺伝子が変異塩基配列に含まれていると判定するとすることもできるし、８５％以上１００％以下である場合に融合遺伝子が変異塩基配列に含まれていると判定するとすることもできる。

　また、上述したように融合遺伝子フィルタ２３６の一実施形態では、複数の第２融合遺伝子を記憶している外部サーバへ、変異塩基配列を送信し、外部サーバにおける調査の結果に基づき、第２融合遺伝子の候補遺伝子と類似する遺伝子を変異塩基配列が含んでいると判定してもよい。ここで調整部４は、使用する外部サーバを変更することにより、融合遺伝子フィルタ２３６による判定結果を調整することができる。

　《保存位置フィルタの調整例》
　保存位置フィルタ２３７は、情報処理装置１が取得した保存配列位置情報が示す保存配列の位置が、変異箇所に含まれるか否かを判定するが、保存配列であるか否かの判断に用いるために設定した閾値を変更することにより、保存位置フィルタ２３７の分類基準や判定結果を調整することができる。

　《構造フィルタの調整例》
　構造フィルタ２３８は、塩基配列情報が示す配列変異に含まれる変異の内容や変異箇所を参照して、染色体の構造多型（例えば、転座、欠損、挿入など）が生じているか否かを判定するが、調整部４は参照する変異の内容や変異個所を変更することにより、構造フィルタ２３８による判定結果を調整することができる。また、構造フィルタ２３８は、配列変異に対応する変異塩基配列を複数の塩基配列に分割し、分割した塩基配列ごとにゲノム上の位置を特定することにより、配列変異が染色体の転座であるか否かを判定してもよい。これに対し、調整部４は、分割の単位を変更することにより、構造フィルタ２３８による判定結果を調整することができる。

　また、構造フィルタ２３８の一実施形態では、転座、逆位、欠失等が生じていると判定した場合において、塩基配列情報が表す配列変異が、がん遺伝子のエンハンサーの近傍に位置する脱制御異常であるか否かを判定し、この判定結果によりカテゴリを決定してもよい。ここで、調整部４は、脱制御異常であると構造フィルタ２３８が判断する基準を調整することで、判定結果を調整することができる。

　以上、本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものとみなす。

　また、図１に示すシステム構成、図２に示す情報処理装置１の制御部１１の構成は、本発明の目的を達成するための例示に過ぎず、特に限定されない。

　また、図２、図３、図５、図７及び図１１に示す機能ブロック図は、例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理装置１に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは、特にこれらの図の例に限定されない。

　また、機能ブロックの存在場所も、図２、図３、図５、図７及び図１１に限定されず、任意でよい。例えば、図２の例において、上述の処理は情報処理装置１側で行われる構成となっているが、これに限定されず、図示していない他の情報処理装置側で処理の少なくとも一部が行われてもよい。即ち、分析処理の実行に必要となる機能ブロックは、情報処理装置１側が備える構成となっているが、これは例示に過ぎない。情報処理装置１側に配置された機能ブロックの少なくとも一部を、図示せぬ他の情報処理装置側が備える構成としてもよい。

　上述した実施形態に係るシステムにおける各種処理を行う手段及び方法は、専用のハードウェア回路、又はプログラムされたコンピュータのいずれによっても実現することが可能である。上記プログラムは、例えば、フレキシブルディスク及びＣＤ－ＲＯＭ等のコンピュータ読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピュータが読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部１２に転送され記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、システムの一機能としてその装置のソフトウエアに組み込まれてもよい。

　なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

　また、本発明の一実施形態は、所属すべきカテゴリが既知の配列変異を含む核酸を含有し、上述した情報処理装置１で用いられる標準核酸組成物を含みえる。また、所属すべきカテゴリが既知の配列変異を含むデータであって、上述の情報処理装置１で用いられる標準核酸データをも含みえる。

　また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。

　本発明は、下記態様および形態を包含する。

　［１］被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置であって、
　前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング部と、
　所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて、前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール部と、を有する情報処理装置。

　［２］前記コントロール部における対比の結果に基づいて、前記分類基準及び／又は前記フィルタリング部における分類の結果を調整する調整部を含む、［１］に記載の情報処理装置。

　［３］前記所属すべきカテゴリが既知である配列変異を含む塩基配列は、所属すべきカテゴリが異なる２種以上である、［１］又は［２］に記載の情報処理装置。

　［４］前記所属すべきカテゴリが異なる２種以上の塩基配列は、特定の疾患の原因となる配列変異と、前記特定の疾患の原因とならない塩基配列と、を含む、［３］に記載の情報処理装置。

　［５］前記目的配列変異は、特定の疾患のドライバー変異であり、
　前記２種以上の配列変異は、前記特定の疾患の原因となる配列変異と、前記特定の疾患の原因とならない配列変異と、を含む、［４］に記載の情報処理装置。

　［６］前記分類基準は、変更又は取捨選択が可能である、［１］～［５］のいずれかに記載の情報処理装置。

　［７］前記分類基準を変更又は選択した後に、前記フィルタリング部及び前記コントロール部を実行する、［６］に記載の情報処理装置。

　［８］前記コントロール部で分類する塩基配列は、所属すべきカテゴリが既知の配列変異を含む核酸の標準組成物を配列決定したものである、［１］～［７］のいずれかに記載の情報処理装置。

　［９］前記標準組成物についての配列決定の条件と、前記被検体に含まれる核酸を配列決定する条件と、が同じである、［８］に記載の情報処理装置。

　［１０］被検体が有する、有害リスクのある目的配列変異を選定する方法であって、
　前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング工程と、
　所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール工程と、を有する情報処理方法。

　［１１］コンピュータを［１］～［９］のいずれかに記載の情報処理装置として機能させるための情報処理プログラム。

　［１２］所属すべきカテゴリが既知の配列変異を含む核酸を含有し、［１］～［９］のいずれかに記載の情報処理装置で用いられる標準核酸組成物。

　［１３］所属すべきカテゴリが既知の配列変異を含むデータであって、［１］～［９］のいずれかに記載の情報処理装置で用いられる標準核酸データ。

　本発明の情報処理装置は、塩基配列の変異が病気の発生や進行に影響する可能性についての分析を実施する装置において、より正確な分析結果を提示することが可能であるため、医療分野や生命科学分野などの広い分野に適応可能であり、産業上有用である。

　１・・・情報処理装置、
　２・・・フィルタリング部、
　３・・・コントロール部、
　４・・・調整部、
　１１・・・制御部、
　１２・・・記憶部、
　１３・・・通信部、
　１４・・・表示部、
　１５・・・操作受付部、
　１６・・・ドライブ、
　１７・・・リムーバブルメディア
　１８・・・バス
　２１・・・第１データ受入部、
　２２・・・第１設定受入部、
　２３・・・第１フィルタ処理部、
　２４・・・カテゴリ決定部、
　２５・・・分析結果出力部、
　３１・・・第２データ受入部、
　３２・・・第２設定受入部、
　３３・・・第２フィルタ処理部、
　３４・・・対比部、
　３５・・・対比結果出力部、
　４３・・・第３フィルタ処理部
　２３１・・・基本フィルタ、
　２３２・・・時系列フィルタ、
　２３３・・・データベースフィルタ、
　２３４・・・機能予測フィルタ、
　２３５・・・クオリティフィルタ、
　２３６・・・融合遺伝子フィルタ、
　２３７・・・保存位置フィルタ、
　２３８・・・構造フィルタ。

Claims

　被検体が有する、有害リスクのある目的配列変異を選定する情報処理装置であって、
　前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング部と、
　所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて、前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール部と、を有する情報処理装置。
　前記コントロール部における対比の結果に基づいて、前記分類基準及び／又は前記フィルタリング部における分類の結果を調整する調整部を含む、請求項１に記載の情報処理装置。
　前記所属すべきカテゴリが既知である配列変異を含む塩基配列は、所属すべきカテゴリが異なる２種以上である、請求項１又は２に記載の情報処理装置。
　前記所属すべきカテゴリが異なる２種以上の塩基配列は、特定の疾患の原因となる配列変異と、前記特定の疾患の原因とならない塩基配列と、を含む、請求項３に記載の情報処理装置。
　前記目的配列変異は、特定の疾患のドライバー変異であり、
　前記２種以上の配列変異は、前記特定の疾患の原因となる配列変異と、前記特定の疾患の原因とならない配列変異と、を含む、請求項４に記載の情報処理装置。
　前記分類基準は、変更又は取捨選択が可能である、請求項１～５のいずれか１項に記載の情報処理装置。
　前記分類基準を変更又は選択した後に、前記フィルタリング部及び前記コントロール部を実行する、請求項６に記載の情報処理装置。
　前記コントロール部で分類する塩基配列は、所属すべきカテゴリが既知の配列変異を含む核酸の標準組成物を配列決定したものである、請求項１～７のいずれか１項に記載の情報処理装置。
　前記標準組成物についての配列決定の条件と、前記被検体に含まれる核酸を配列決定する条件と、が同じである、請求項８に記載の情報処理装置。
　被検体が有する、有害リスクのある目的配列変異を選定する方法であって、
　前記被検体に含まれる核酸を配列決定して特定された１以上の配列変異を、１以上の分類基準に基づいて、有害リスクの程度に応じたカテゴリの各々へ分類するフィルタリング工程と、
　所属すべきカテゴリが既知である配列変異を含む塩基配列を、前記分類基準の少なくとも１つに基づいて前記有害リスクの程度に応じたカテゴリの各々へ分類し、その分類の結果を前記所属すべきカテゴリと対比するコントロール工程と、を有する情報処理方法。
　コンピュータを請求項１～９のいずれか１項に記載の情報処理装置として機能させるための情報処理プログラム。
　所属すべきカテゴリが既知の配列変異を含む核酸を含有し、請求項１～９のいずれか１項に記載の情報処理装置で用いられる標準核酸組成物。
　所属すべきカテゴリが既知の配列変異を含むデータであって、請求項１～９のいずれか１項に記載の情報処理装置で用いられる標準核酸データ。