WO2010064413A1

WO2010064413A1 - 薬剤の作用・副作用予測システムとそのプログラム

Info

Publication number: WO2010064413A1
Application number: PCT/JP2009/006520
Authority: WO
Inventors: 岡正朗; 浜本義彦; 硲彰一; 藤田悠介; 恒富亮一
Original assignee: 国立大学法人山口大学
Priority date: 2008-12-01
Filing date: 2009-12-01
Publication date: 2010-06-10
Also published as: JPWO2010064413A1; JP5436446B2; US20110288783A1

Abstract

　薬剤の作用・副作用などの予測目的に応じて、関連すると考えられる遺伝子型を組合せることにより予測のための判別式を自動生成し、高い信頼性で予測することが可能な薬剤の作用・副作用予測システムとそのプログラムを提供することである。　薬剤の作用又は副作用に関与する可能性のある遺伝子について生ずる遺伝子型の組合せ毎に、作用又は副作用の有無に関する症例(１０)を対応させる解析テーブル(１１)を生成する症例解析テーブル生成部(５)と、解析テーブル(１１)における遺伝子とそれに対する遺伝子型の組合せ(遺伝子条件)のうち少なくとも１つを選択して、作用・副作用の有・無の症例数についての占有率を演算する信頼度解析部(６)と、占有率の演算を行った遺伝子条件から該当するもの抽出して判別式を生成する判別式生成部(７)と、判別式を用いて予測を行う予測部(４)を有する。

Description

薬剤の作用・副作用予測システムとそのプログラム

　本発明は、薬剤の作用又は副作用に関与する可能性のある遺伝子における遺伝子型の組合せ毎に、薬剤投与によって生ずる作用又は副作用の有無に関するデータを集め、その薬剤に対する作用又は副作用の発生に関する判別式を遺伝子型の組合せによって構築し、その判別式の精度を高めつつ、適用範囲を広げることで薬剤に対する作用・副作用を高い信頼性と汎用性をもって予測するシステムとそのプログラムに関する。

　がん治療の困難性はその多様性にあるといわれており、がん治療のための個別化医療が求められている。がん治療のために抗がん剤を投与する際に、個人によってその効果や副作用の有無が異なる。最悪の場合には効果はないが副作用のみがある場合も起こりうる。したがって、抗がん剤などの薬剤を投与する際に、薬剤の作用や副作用を正確に予測することは、薬剤の投与などの診断方法を決定する上で極めて重要である。
　抗がん剤の副作用の予測に関して、遺伝子型と副作用の関連性についての数多くの研究がなされている。従来の遺伝子型と抗がん剤の副作用との関連性についての研究では、単独あるいは高々２つの遺伝子型の組合せまでしか考慮されておらず、３つ以上の組合せとの関連性はあまり調査されていない（非特許文献１）。
　また、遺伝子多型の代わりに、遺伝子の発現量による診断方法も研究されている。特許文献１では、３８４個の候補遺伝子から個別にマンホイットニーのU検定により有効な遺伝子５２個を抽出し、抽出した５２個の遺伝子の発現量から予測スコアを算出し、スコア値により診断する方法が述べられている。しかしながら、遺伝子単独での診断性能は低くても、組み合せたときの診断性能が高い遺伝子を抽出できない。また、スコア式を１つ設計しているが、遺伝子や遺伝子多型の複雑な問題では、１つのスコア式だけでは高い診断性能が得られない場合もある。
　また、症例データベースを利用した支援診断システムも開発されている。
　特許文献２に開示される「診療支援システム」ではオペレータが、遺伝子型、年齢、性別などから、検索キーを指定して、データベース上の該当するデータを検索し、該当する症例データの一覧を集計し、抗がん剤の作用・副作用に関する統計データや関連性の高い症例データを医師に提供することができる。しかしながら、検索キーはオペレータが指定する必要があり、検索に用いる有効な検索キーがわからない場合には、信頼性の高い予測をすることは困難である。

佐井，澤田，南：日本人がん患者のイリノテカン個別化治療実現に向けて：ＵＧＴ１Ａ１遺伝子多型（＊２８および＊６）の意義について，ＹＡＫＵＧＡＫＵ　ＺＡＳＳＨＩ，１２８（４），２００８．

特開２００３－６１６７８号公報特開２００５－２０２５４７号公報

　患者１人１人は多様な背景を持っているため、薬剤の作用・副作用を正確に予測することは困難である。また、作用・副作用のメカニズムは複雑であり、従来のように単独あるいは高々２つの遺伝子型を用いるだけでは薬剤の作用・副作用の予測は困難である。より多くの因子の組合せを用いて薬剤の作用・副作用を予測することができれば、より信頼性や汎用性の高い診断が可能になる。
　また、従来の症例データベースを利用した支援診断システムではオペレータが検索キーを指定して、データベースの該当するデータを検索し、関連する症例を検索することにより抗がん剤の作用・副作用を予測する必要がある。しかしながら、検索キーはオペレータが指定する必要があり、予測に有効な検索キーが明らかでない場合には、信頼性の高い予測をすることは困難である。目的に合った判別式を自動構築できれば、オペレータが検索式を作成する必要もなくなり、効率的に信頼性や汎用性の高いデータを利用することができる。

　本発明はかかる従来の事情に対処してなされたものであり、薬剤の作用・副作用などの予測目的に応じて、関連すると考えられる遺伝子型を組合せることにより予測のための判別式を自動生成し、高い信頼性と汎用性で予測することが可能な薬剤の作用・副作用予測システムとそのプログラムを提供することを目的とする。
　また、本発明による解析は、遺伝子型のほかに、性別や年齢、遺伝子の発現量なども因子として用いることが可能である。

　上記目的を達成するため、請求項１記載の発明である薬剤の作用・副作用予測システムは、薬剤の作用又は副作用に関与する遺伝子型の組合せ（以下、遺伝子条件という）毎に、前記作用又は副作用の有無に関する症例を対応させる解析テーブルを生成する症例解析テーブル生成部と、
　前記解析テーブルにおける遺伝子条件のうち少なくとも１つを選択して、前記作用又は副作用の有又は無の症例数についての占有率を演算する信頼度解析部と、前記占有率に対する所望のしきい値を基準として、前記信頼度解析部において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成する判別式生成部と、薬剤の作用又は副作用の有無に関する検体の遺伝子型に関するデータを前記判別式に含まれる遺伝子条件毎に比較照合して、前記判別式と整合することにより前記検体の前記薬剤の作用又は副作用の有無に関する予測を行う予測部と、を有するものである。
　上記構成の薬剤の作用・副作用予測システムでは、症例解析テーブル生成部が薬剤に対する作用・副作用の有無に関する症例について遺伝子条件毎に対応させたテーブル（一覧表）を生成する作用を有し、信頼度解析部は、そのテーブルから遺伝子条件のうち少なくとも１つを選択して作用・副作用の有・無の症例数についての占有率を演算する作用を有する。判別式生成部は、この占有率に対するしきい値を基準として該当する遺伝子条件を抽出する作用と判別式を生成する作用を有する。この判別式に含まれる遺伝子条件が、薬剤に対する作用・副作用の有・無に関する予測のための情報となるものである。

　また、請求項２に記載の発明である薬剤の作用・副作用予測システムは、請求項１記載の薬剤の作用・副作用予測システムにおいて、前記判別式生成部は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記信頼度解析部において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成するものである。
　この薬剤の作用・副作用予測システムにおいては、判別式生成部が、占有率に対する所望のしきい値のみならず、症例数の有・無に対するしきい値をも基準として遺伝子条件を抽出する作用を有する。

　そして、請求項３に記載の発明である薬剤の作用・副作用予測システムは、請求項２記載の薬剤の作用・副作用予測システムにおいて、前記判別式生成部において抽出された遺伝子条件のうち，前記占有率に対する所望の前記しきい値に該当する遺伝子条件であって，かつ前記症例数に対する所望の前記しきい値に該当している遺伝子条件のうち，前記判別式生成部で生成された判別式に加えることで、加えられた後の全体の判別式における，前記占有率又は症例数が増加する前記遺伝子条件を選択して前記判別式に追加する機能及び／又は、前記生成された判別式から減ずることで、減じた後の全体の判別式における，前記占有率又は症例数が増加する遺伝子条件を選択して削除する機能を、備えた判別式最適化部と、を有するものである。
　この薬剤の作用・副作用予測システムにおいては、請求項２に記載の発明の作用に加えて、判別式最適化部が、判別式生成部によって抽出された遺伝子条件の中から、判別式に加えることで占有率が演算された判別式における占有率又は症例数が増加する遺伝子条件を選択して判別式に加える作用を有したり、また、逆に、判別式最適化部が、判別式生成部によって抽出された遺伝子条件の中から、減ずることで減じた後の全体の判別式における占有率又は症例数が増加する遺伝子条件を選択して削除する作用を有する。

　さらに、請求項４に記載の発明である薬剤の作用・副作用予測システムは、請求項２又は請求項３に記載の薬剤の作用・副作用予測システムにおいて、前記生成された判別式に含まれる遺伝子条件のうち、一の遺伝子条件における前記占有率及び症例数と、他の遺伝子条件における前記占有率及び症例数とが共通する場合に、前記他の遺伝子条件を前記生成された判別式から削除する判別式最適化部を有するものである。
　上記構成の薬剤の作用・副作用予測システムでは、請求項２又は請求項３に記載の発明の作用に加えて、判別式最適化部は異なる判別式において占有率が演算された遺伝子条件における占有率及び症例数が共通した場合に、いずれか一方の判別式を生成された判別式から削除する作用を有する。

　請求項５に記載の発明である薬剤の作用・副作用予測システムは、請求項３又は請求項４に記載の薬剤の作用・副作用予測システムにおいて、前記判別式最適化部は、予めデータベースに格納された前記薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件（以下、医学的知見条件という）を読み出して、前記抽出された遺伝子条件を探索し、前記抽出された遺伝子条件がその医学的知見条件を含む場合にその医学的知見条件を差し引くようにする機能と、前記抽出された遺伝子条件に含まれていない場合に、前記医学的知見条件を加えるようにする機能とを有するものである。
　上記構成の薬剤の作用・副作用予測システムの作用は上記の請求項３又は請求項４に記載の発明の作用に加えて、判別式最適化部が、医学的知見条件を追加あるいは削除するように作用する。

　請求項６に記載の発明である薬剤の作用・副作用予測システムは、請求項２乃至５のいずれか１項に記載の薬剤の作用・副作用予測システムにおいて、前記症例解析テーブル生成部は、前記検体の遺伝子条件に関するデータを薬剤の作用又は副作用の有無に関して分類しながら解析テーブルに追加し、前記信頼度解析部は、前記解析テーブルを読み出して前記遺伝子条件のうちすくなくとも１つを選択して前記占有率を演算し、前記判別式生成部は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記遺伝子条件を抽出して、この遺伝子条件を単独で、あるいは組合せで前記判別式を生成し、前記予測部は、生成された判別式における全体の占有率をその検体が前記薬剤の作用又は副作用の有無に関して分類される信頼度の推定値として予測するものである。
　上記構成の薬剤の作用・副作用予測システムでは、請求項２乃至請求項５のいずれか１項に記載の発明の作用に加えて、予測部が検体の，薬剤の作用又は副作用の有無に関する推定値を予測として演算する作用を有する。

　請求項７に記載の発明である薬剤の作用・副作用予測プログラムは、コンピュータによって、薬剤の作用・副作用を予測するために実行されるプログラムであって、コンピュータに、薬剤の作用又は副作用に関わる遺伝子条件毎に、前記作用又は副作用の有無に関する症例を対応させる解析テーブルを生成する症例解析テーブル生成工程と、前記解析テーブルにおける遺伝子条件から形成される遺伝子条件のうち少なくとも１つを選択して、前記作用又は副作用の有又は無の症例数についての占有率を演算する信頼度解析工程と、前記占有率に対する所望のしきい値を基準として、前記信頼度解析工程において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成する判別式生成工程と、薬剤の作用又は副作用の有無に関する検体の遺伝子条件に関するデータを前記判別式に含まれる遺伝子条件毎に比較照合して、前記判別式と整合することにより前記検体の前記薬剤の作用又は副作用の有無に関する予測を行う予測工程と、を実行させるものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項１に記載される発明と同様である。

　請求項８に記載の発明である薬剤の作用・副作用予測プログラムは、請求項７記載の薬剤の作用・副作用予測プログラムにおいて、前記判別式生成工程は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記信頼度解析工程において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件と単独で、あるいは組み合わせて判別式を生成するものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項２に記載の発明と同様である。

　請求項９に記載の発明である薬剤の作用・副作用予測プログラムは、請求項８に記載の薬剤の作用・副作用予測プログラムにおいて、前記判別式生成工程において抽出された遺伝子条件のうち，前記占有率に対する所望の前記しきい値に該当する遺伝子条件であって，かつ前記症例数に対する所望の前記しきい値に該当している遺伝子条件のうち，前記判別式生成工程で生成された判別式に加えることで、加えられた後の全体の判別式における，前記占有率又は症例数が増加する前記遺伝子条件を選択して前記判別式に追加するステップ及び／又は、前記生成された判別式から減ずることで、減じた後の全体の判別式における，前記占有率又は症例数が増加する遺伝子条件を選択して削除するステップを、備えた判別式最適化工程と、を有するものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項３に記載の発明と同様である。

　請求項１０に記載の発明である薬剤の作用・副作用予測プログラムは、請求項８又は請求項９に記載の薬剤の作用・副作用予測プログラムにおいて、前記生成された判別式に含まれる遺伝子条件のうち、一の遺伝子条件における前記占有率及び症例数と、他の遺伝子条件における前記占有率及び症例数とが共通する場合に、前記他の遺伝子条件を前記生成された判別式から削除する判別式最適化工程を有するものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項４に記載の発明と同様である。

　請求項１１に記載の発明である薬剤の作用・副作用予測プログラムは、請求項９又は請求項１０に記載の薬剤の作用・副作用予測プログラムにおいて、前記判別式最適化工程は、予めデータベースに格納された前記薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件（以下、医学的知見条件という）を読み出して、前記抽出された遺伝子条件を探索し、前記抽出された遺伝子条件がその医学的知見条件を含む場合にその医学的知見条件を差し引くようにするステップと、前記抽出された遺伝子条件に含まれていない場合に、前記医学的知見条件を加えるようにするステップとを有するものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項５に記載の発明と同様である。

　請求項１２に記載の発明である薬剤の作用・副作用予測プログラムは、請求項８乃至請求項１１に記載の薬剤の作用・副作用予測プログラムにおいて、前記症例解析テーブル生成工程は、前記検体の遺伝子条件に関するデータを薬剤の作用又は副作用の有無に関して分類しながら解析テーブルに追加し、前記信頼度解析工程は、前記解析テーブルを読み出して前記条件のうち少なくとも１つを選択して前記占有率を演算し、前記判別式生成工程は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記遺伝子条件を抽出して、この遺伝子条件を単独で、あるいは組合せで前記判別式を生成し、前記予測工程は、生成された判別式における全体の占有率をその検体が前記薬剤の作用又は副作用の有無に関して分類される信頼度の推定値として予測するものである。
　このように構成される薬剤の作用・副作用予測プログラムにおいては、その作用は請求項６に記載の発明と同様である。

　本発明の薬剤の作用・副作用予測システムでは、薬剤の作用・副作用などの予測目的に応じて、多くの遺伝子条件と症例を組み合わせることにより判別式を自動生成し、高い信頼性と汎用性を発揮しながら予測することが可能である。
　予測に用いる判別式は症例に関するデータを基に自動生成されるため、薬剤と作用・副作用に関する専門的な知識を持たないオペレータであっても容易に予測を行うことができる。遺伝子条件に用いる因子としては遺伝子型を考えた。
　本発明による薬剤の作用・副作用予測システムでは、従来の少数の因子を組み合わせた遺伝子条件や、より多数の因子を組み合わせた遺伝子条件を組み合わせて判別式を生成できるため、従来の予測性能を上回る予測システムを実現できる。また、複数の遺伝子条件をＯＲ演算により組合せることにより判別式を生成するため、汎用性の高い予測システムを設計することができる。また、症例データベースに蓄積されているデータの統計にもとづき、予測結果に対して個別に信頼度を提示することができる。さらに、単に工学的に因子を組み合わせて判別式を設計するだけでなく、医学的な知見を導入することにより、より信頼性の高い判別式を設計することができる。

　特に、請求項３及び請求項９に記載の発明では、判別式を構成する遺伝子条件の追加及び／又は削除を一定の論理で実行することで、一旦生成された判別式がカバーする症例数と占有率を向上させることができるので、より高い信頼性と汎用性を兼ね備えた判別式による薬剤に対する作用・副作用の有無に関する予測を行うことが可能となる。
　また、特に請求項４及び請求項１０では、重複した遺伝子条件式を排除して効率的な判別式を生成することができる。さらに、特に請求項５及び請求項１１では、医学的見地条件を反映した判別式を生成することができ、これを反映した予測が可能である。特に請求項６及び請求項１２では、予測が何らかの理由によってできない場合に検体のデータを基に推定を行うことができる。

本発明の実施の形態に係る薬剤の作用・副作用予測システムの概念図である。本実施の形態に係る薬剤の作用・副作用予測システムに用いられる遺伝子型に関する因子、遺伝子条件、判別式の関係を示す概念図である。本実施の形態に係る薬剤の作用・副作用予測システムによる判別式生成の流れを示すフローチャートである。本実施の形態に係る薬剤の作用・副作用予測システムの判別式最適化部によって実行される組合せ最適化の手順を示すフローチャートである。本実施の形態に係る薬剤の作用・副作用予測システムを用いて実行される、遺伝子条件の組合せ最適化による遺伝子条件の組合せ数と性能の推移の例を示す本実施の形態に係る薬剤の作用・副作用予測システムにおいて、Ａ，Ｂ２つの遺伝子型（Ｈｏｍｏ、Ｈｅｔｅｒｏ、Ｗｉｌｄ）を考慮した場合の遺伝子型の組合せと副作用の有無の症例を対応させた概念図である。本実施の形態に係る薬剤の作用・副作用予測システムにおいて判定保留となった場合の信頼度の推定方法を示す概念図である。

　１…薬剤の作用・副作用予測システム
　２…判別式設計部　
　３…データベース　
　４…予測部
　５…症例解析テーブル生成部
　６…信頼度解析部
　７…判別式生成部
　８…判別式最適化部
　１０…症例データ
　１１…解析テーブル
　１２…判別式データ　
　１３…分類結果　
　１４…予測結果　
　１５…患者
　１６…医学的知見条件

　以下に、本発明の最良の実施の形態に係る薬剤の作用・副作用予測システムを図１乃至図７に基づき説明する。
　図１は、本発明の実施の形態に係る薬剤の作用・副作用予測システムの構成図である。
　本実施の形態に係る薬剤の作用・副作用予測システム１は、大きく分けて判別式設計部２、予測部４及びデータベース３から構成される。
　さらに、判別式設計部２は、症例解析テーブル生成部５と信頼度解析部６と判別式生成部７、判別式最適化部８からなる。
　また、データベース３には、既に医療機関あるいは研究機関などで蓄積された薬剤の作用又は副作用についての有又は無などのデータをはじめ、そのデータを取得した患者（検体）等に関する性別、年齢、住所、薬剤投与履歴（少なくとも薬剤の名称、投与量、投与時期・期間を含む）等の属性データを含む症例データ１０、症例解析テーブル生成部５において生成される解析テーブル１１、判別式生成部７において生成された判別式データ１２、医学的知見条件１６が、判別式設計部２から読み出し可能に格納されている。なお、医学的知見条件１６とは、薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件であって、臨床的に信頼性の高い条件あるいは信頼性の低い条件として予めデータベース３に格納されるかあるいは判別式設計部２の判別式最適化部８に入力されるものをいう。また、症例データ１０については、データベース３に直接入力されて格納されてもよいし、判別式設計部２の症例解析テーブル生成部５に入力して解析テーブル１１を生成する際にデータベース３に格納するようにしてもよい。予めデータベース３に格納される場合には、症例解析テーブル生成部５はデータベース３から症例データ１０を読み出して解析テーブル１１を生成する。

　予測部４では、所望の判別式データ１２をデータベース３から読み出して、薬剤投与における作用あるいは副作用の有・無に関する予測を望む患者１５に関する遺伝子型の組合せデータ（遺伝子条件データ）の入力を受けて、あるいは予めデータベース３に格納しておいて、これを読み込み、この判別式における遺伝子型の組合せと比較照合することで、判別式との整合性を分類し、その結果を分類結果１３として生成し、この分類結果１３を踏まえて予測結果１４として出力する。
　予測結果１４の出力方法については、図１に記載していないものの、液晶ディスプレイ装置などの表示装置や他の機器への送信などを可能とする送信装置などを薬剤の作用・副作用予測システム１に含めて予測部４に接続するか、あるいは別個独立に設けて使用時に薬剤の作用・副作用予測システム１との間でインターフェースを設けて接続するとよい。
　本実施の形態に係る薬剤の作用・副作用予測システム１においては、例えば、ｎ種類の遺伝子についてその各々について生ずるａ種類の遺伝子型及び遺伝子型の指定なしを加えて得られる組合せ（（ａ＋１）^ｎ－１）通りを遺伝子条件として用意し、これらの遺伝子条件を組み合わせることにより判別式を生成する。
　従って、症例データ１０なども遺伝子条件として用意される組合せに応じて収集されることになる。

　図２に本実施の形態に係る薬剤の作用・副作用予測システムに用いられる遺伝子型に関する因子、遺伝子条件、判別式の関係を示す。
　図２を参照しながら、遺伝子型に関する因子、遺伝子条件、判別式のそれぞれを説明する。
　まず、「因子」であるが、図２には遺伝子型の一例が示されている。本実施の形態における遺伝子にはそれぞれ”Ｈｏｍｏ“、”Ｈｅｔｅｒｏ“,”Ｗｉｌｄ“の３種類の型があり、これらのいずれをも”指定しない“の場合も含めて４種類ある。
　このような場合における「遺伝子条件」の組合せを列挙すると、遺伝子条件１として、遺伝子Ａの型がＨｏｍｏで、遺伝子Ｂの型は指定なし、他の因子の指定もなしから始まり、遺伝子条件２で遺伝子Ａの型をＨｅｔｅｒｏとして、遺伝子Ｂの型及び他の因子の指定をなしとし、すべての組合せを検討してそれぞれを遺伝子条件としている。このような遺伝子条件としての組合せは前述のとおり、（ａ＋１）^ｎ－１となる。
　症例データ１０は、薬剤に対する作用・副作用の有・無を患者毎にまとめたものであるが、このような遺伝子条件毎に対応させ、まとめたものが解析テーブル１１となるのである。そして、遺伝子条件にこれらの作用・副作用の有・無を対応させたものそれぞれの単体あるいはそれぞれの単体を組み合わせた複合体であって、その目的が薬剤の作用・副作用の有・無の予測であるものを判別式とし、そのデータを判別式データ１２としている。図２に示される「判別式」は、遺伝子条件１’と遺伝子条件２’の組合せをもって１つの判別式とするものである。

　図１を参照しながらもう少し説明を加えると、このような判別式は、まず、症例解析テーブル生成部５が、これらの「遺伝子条件」に対して、薬剤に対する作用・副作用の有・無に関する患者１５毎の症例データ１０を対応させて、解析テーブル１１を生成し、信頼度解析部６が、解析テーブル１１において、少なくとも１の「遺伝子条件」に対する信頼度（占有率）を解析し、判別式生成部７が、その信頼度の度合いによって「判別式」として生成することで得られるものである。判別式生成部７によって生成された判別式は、判別式データ１２としてデータベース３に読み出し可能に格納される。
　信頼の度合いとは、判別式は遺伝子条件の束あるいは複合体であるが、判別式に含まれる遺伝子条件個々の信頼度（占有率）を演算し、個々の遺伝子条件の抽出に該当する症例数を含めて設けられたしきい値との関係を意味するものである。また、そのしきい値を満足するものをまとめて、判別式とするものである。あるいは、遺伝子条件個々の信頼度（占有率）は問題とせず、全体としての信頼度（占有率）を演算することで、遺伝子条件全体としての信頼度（占有率）と該当する症例数をしきい値とすることもでき、その信頼度を満足する遺伝子条件の束（複合体）を判別式としてもよい。あるいは、最も簡単なのは、信頼度（占有率）や症例数に対するしきい値を設けることなく、すべての遺伝子条件を束ねて、それを判別式とする方法も考えられる。

　このような判別式の生成の例について、図３を参照しながら詳細に説明する。
　図３は、本実施の形態に係る薬剤の作用・副作用予測システム１による判別式生成の流れを示すフローチャートである。本図においては、因子として、ｎ種類の遺伝子についてその各々について生ずるａ種類の遺伝子型と遺伝子型の指定なしを考慮した組合せを用いる。
　本実施の形態に係る薬剤の作用・副作用予測システム１の症例解析テーブル生成部５では、ステップＳ１として、ｎ種類の遺伝子についてその各々について生ずるａ種類の遺伝子型及び遺伝子型の指定なしを加えて得られる組合せ（（ａ＋１）^ｎ－１）通りを「遺伝子条件」として生成する。
　症例解析テーブル生成部５で生成される遺伝子条件には遺伝子型の指定なしが含まれる場合があるため、遺伝子条件の中にはｎ未満の遺伝子からなる遺伝子条件も含まれることになる。従って、ｎ未満の遺伝子からなる遺伝子条件が、作用・副作用の有・無に関する分類に有効である場合には、その遺伝子条件を判別式に用いることができる。
　例えば、ｎ種類の遺伝子のうち、１番目と２番目と３番目のみが分類に有効であるような場合は、４番目からｎ番目の遺伝子型については、「指定なし」が対応する場合が該当することになり、指定なしを加えて構成することでｎ未満の遺伝子を含めてすべての遺伝子の遺伝子型について遺伝子条件を生成することが可能なのである。

　次に、症例解析テーブル生成部５は、ステップＳ２として、症例データ１０の入力を受けるか、あるいはデータベース３に予め格納された症例データ１０を読み出して、遺伝子条件毎に作用または副作用の有・無に関する症例数を調査（チェック）する。このとき、各症例は複数の遺伝子条件に該当する場合、すなわち重複する場合も含まれる。このようにして症例解析テーブル生成部５は、「遺伝子条件」を生成しながら、症例データ１０をそれらの遺伝子条件毎に調査して該当するものを対応させて解析テーブル１１を生成する。生成された解析テーブル１１は、データベース３に格納される。
　なお、薬剤の作用・副作用の有・無の組合せは４通りあるが、このいずれの症例数について調査するかは、用途に応じて予め症例解析テーブル生成部５に対して設定しておくか、表示装置等に対して、いずれの調査を実行するかを表示させ、その中から症例解析テーブル生成部５に対して入力可能としておくとよい。

　さらに、ステップＳ３では、信頼度解析部６による占有率の演算が実行される。この占有率とは、症例を、作用なし，作用あり，副作用なし，副作用ありなどに分類した際の、その分類ラベルに含まれる症例数の全体の症例数に対する占有率を意味しており、分類結果に対する信頼性を示す機能を有している。例えば、「副作用なし」という分類ラベルの場合において、ある「遺伝子条件」に５症例が該当し、その中で４症例に副作用がない場合には、この遺伝子条件での「副作用なし」の分類ラベルにおける占有率は８０％となる。したがって、占有率を演算することで、「遺伝子条件」に該当する症例数がｐ以上であり、分類ラベルについての占有率がｒ％以上である遺伝子条件を有効な遺伝子条件として選択するというような判断が可能となる。なお、症例数をｐ以上とすることで、その遺伝子条件に該当する症例数のカバー率を上げることができ汎用性の機能を発揮させることができる。
　信頼度解析部６は、症例解析テーブル生成部５によって生成された解析テーブル１１をそのまま症例解析テーブル生成部５からあるいはデータベース３に格納された解析テーブル１１を読み出して占有率を演算する。

　次のステップＳ４では、分類に有効な遺伝子条件を抽出する。この分類に有効な遺伝子条件は、判別式生成部７によって抽出される。判別式生成部７は、例えば前述のとおり症例数がｐ以上であり、分類ラベルの占有率がｒ以上である遺伝子条件を有効な遺伝子条件として抽出することができる。また、判別式生成部７はこの抽出された遺伝子条件を組み合わせて判別式とするのである。
　具体的には、図１には図示されていない表示装置等に症例数のしきい値としての「ｐ」や占有率のしきい値としての「ｒ」の入力を促すような画面を表示して、これらの数値を薬剤の作用・副作用予測システム１に対して入力することで判別式生成部７がそれらの数値に合致する「遺伝子条件」を選択したり、予め所望の「ｐ」や「ｒ」としての値をデータベース３に格納しておき、これを自動的に読み出したり、複数の所望の「ｐ」や「ｒ」を格納しておきパラメータとして選択可能に読み出すことができるようにしておいて、これに合致する「遺伝子条件」を選択し、これらを組み合わせて「判別式」を生成するのである。しきい値は、症例数と占有率の両方を常に選択するものではなく、いずれか一方のみでもよいが、遺伝子条件の抽出の精度と適用範囲を考慮すれば、これを組み合わせることが望ましい。また、このしきい値の値は、薬剤の種類や症例データに含まれる症例数にも影響するため、一概にどの程度が望ましいということは言えず、適宜、利用者が目的や薬剤の種類、症例データの多少によって所望に決定するとよい。
　この選択される「遺伝子条件」は、単体でもよいし、上述のようにそれらを組み合わせてもよい。その分類ラベルにおける、すなわち、一定の目的における遺伝子条件単体あるいは複数の遺伝子条件を組み合わせた複合体が、前述のとおり、「判別式」となるのである。判別式生成部７は、このようにして得られた判別式を判別式データ１２として、読み出し可能にデータベース３に格納する。
　「判別式」に含まれる「遺伝子条件」の数は、一定ではなく、遺伝子の種類や遺伝子型の種類によっても変動するものであり、さらに、症例数や占有率によっても変動する。また、同じ症例数や占有率を備えていても、「判別式」を構成する「遺伝子条件」の組合せは一定ではなく、これを整理することも可能である（ステップＳ５）。すなわち、同じ症例数や占有率を備える場合には、一般的には判別式を構成する遺伝子条件は少ない方が望ましい。

　このことについて、具体的な例を挙げて説明する。
　二つの遺伝子型からなる遺伝子条件Ｐとこの遺伝子条件Ｐに三つ目の遺伝子型を組み合わせた遺伝子条件Ｑとが、該当する症例数および占有率で等しい場合には、遺伝子条件Ｐと遺伝子条件Ｑは判別式を構成する遺伝子条件としては冗長である。したがって、このような場合には遺伝子型数が多い遺伝子条件Ｑを、判別式を構成する遺伝子条件の候補から除外する。例えば、遺伝子条件Ｒ（（遺伝子Ａ（Ｈｏｍｏ））かつ（遺伝子Ｂ（Ｈｏｍｏ）））に該当する症例が５例で、遺伝子条件Ｓ（（遺伝子Ａ（Ｈｏｍｏ））かつ（遺伝子Ｂ（Ｈｏｍｏ）かつ（遺伝子Ｃ（Ｈｏｍｏ）））に該当する症例が同じ５例であるとき、この２つの遺伝子条件は冗長であると見なす。この場合には、因子（遺伝子の遺伝子型）の組合せ数が多い遺伝子条件Ｓを有効な遺伝子条件の集合から削除する。このような演算は、判別式を構成する遺伝子条件を判別式最適化部８によって探索することで実行可能である。
　さらに、有効な遺伝子条件の集合の中から、必要に応じて、臨床的に信頼性の高い遺伝子条件や臨床的には信頼性の低い遺伝子条件を取捨選択するようにしておくとよい（ステップＳ６）。ここでは医学的な知見にもとづき遺伝子条件を選択する。予め薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件（医学的知見条件１６）をデータベース３に格納しておき、これを判別式最適化部８が読み出した上で、判別式最適化部８による探索を実施して、判別式がその医学的知見条件１６を含む場合には、その医学的知見条件１６を差し引くようにしたり（医学的知見条件１６が臨床的に信頼性の低い条件の場合）、あるいは、判別式に含まれていない場合に、その医学的知見条件１６を加えるようにする（医学的知見条件１６が臨床的に信頼性の高い条件の場合）とよい。判別式に含まれていない場合にその医学的知見条件１６に加える場合には、常に加えるようにしたり、所定の要件を満たす場合に加えるようにしたり、加える要件を予め判別式最適化部８内に設定しておくか、医学的知見条件１６の中に含めておいて、医学的知見条件１６をデータベース３から読み出すことで、判別式最適化部８内に作用するようにしておくとよい。
　なお、医学的知見条件１６とは、具体的には、例えば、以下のような知見に関する条件をいうが、これらに限定されるものではなく、また、下記の知見も現在における知見であり、修正される可能性もあり必ずしも普遍ではない。
　１）イリノテカンの投与においてＵＧＴ１Ａ１＊２８（ＴＡ７／ＴＡ７）の遺伝子型をもつ場合には副作用が生じる。
　２）Ｗｉｌｄタイプを持つ場合には副作用がない。
　３）Ｈｏｍｏタイプを持つ場合には副作用がある。
　例えば、２）、３）の逆の遺伝子条件が判別式に含まれている場合には、副作用の有無についてそれぞれ疑わしい場合が存在する。そこで、医学的知見条件の導入としては、副作用なしの判別式の生成では、Ｈｏｍｏタイプが含まれる遺伝子条件を削除し、副作用ありの判別式の生成ではＷｉｌｄタイプが含まれる遺伝子条件を削除するということが考えられる。
　なお、これらは副作用についての知見であり、作用の予測に関しては当てはまるとは言えないものである。

　本実施の形態においては、判別式を構成する冗長な遺伝子条件の削除、医学的知見遺伝子条件１６を削除あるいは追加を便宜上、判別式最適化部８が実行するとしたが、判別式生成部７等が実行してもよく、言うなれば、薬剤の作用・副作用予測システム１に判別式を最適化する要素を設けておき、これによって実行されるものであればよい。また、その名称も限定するものではない。さらに、判別式を構成する冗長な遺伝子条件の削除、医学的知見条件１６の削除あるいは追加をこの順序で説明したが、この順序で実行する必要は必ずしもなく、逆の順序に行ってもよいし、医学的知見条件１６の削除・追加は選択的に（オプションとして）実行されるものでもあってもよい。
　後述する組合せ最適化による判別式の生成では、該当数が多く冗長性が低い遺伝子条件を組み合わせて、少ない遺伝子条件数で信頼性の高い判別式を生成することができる。
　判別式最適化部８と医学的知見条件１６を用いて、最適化前に臨床的に信頼性の高い条件として選択することにより、該当数が少ないが臨床的に信頼性が高い条件を判別式に組み込むことができる。一方、症例データ１０の中では分類ラベルについての占有率が高いが臨床的には信頼性が低い条件があれば、組合せ最適化の前の段階で削除することができる。
　例えば、データベース３に格納された症例データ１０に対しては有効であるとされる遺伝子条件が実際に医学的な知見からは信頼性が低いと判断される場合には、この遺伝子条件は判別式に用いるべきではない。一方、ある遺伝子型の組合せをもつ症例は統計的に見れば少ないが、この遺伝子型の組合せをもつ場合には高い確率で副作用がある遺伝子型の組合せが有効な遺伝子条件として選ばれている場合、この遺伝子条件は該当する症例数が低いため判別式に組み込まれない可能性がある。このような遺伝子条件は遺伝子条件の組合せを考慮せずに判別式に用いることが考えられる。このような遺伝子条件に関するデータも医学的知見条件１６に含めておくとよい。

　次に、ステップＳ７の遺伝子条件の組合せ最適化による判別式の生成では、選択された有効な遺伝子条件を組み合わせて、指定された信頼度Ｒ（＞ｒ）％以上の判別式を設計する。このとき、組合せ最適化処理が必要ない場合には、指定された信頼度Ｒ％以上の全遺伝子条件を組み合わせて判別式とすることも可能である。組合せ最適化により、最適化しない場合と比較して信頼性が高まる場合がある。判別式に使用する遺伝子条件の数が減少する場合はあるが、組合せ最適化により症例データベースの症例に対する正分類数（該当数）や占有率は減少しないようにする。なお、この遺伝子条件の組合せ最適化は、判別式最適化部８によって実行される。
　次に、ステップＳ７の組合せ最適化による信頼度Ｒ％以上の判別式の設計方法を説明する。
　判別式は、分類ラベルについての占有率がＲ％以上である条件をＯＲ演算により組み合わせて設計する。組合せ最適化では、分類ラベルについての占有率がＲ％以上である条件（以下、候補条件という）を組み合わせることで、判別式に該当する症例数が多く、分類ラベルについての占有率が高くなるような組合せを探索する。組合せ探索においては、第一に該当する症例数、第二に分類ラベルついての占有率により遺伝子条件の組合せ（判別式）を評価し、特徴選択アルゴリズムＳＦＦＳ（Ｓｅｑｕｅｎｔｉａｌ　Ｆｏｒｗａｒｄ　Ｆｌｏａｔｉｎｇ　Ｓｅａｒｃｈ）により組合せを探索する。

　図４に本実施の形態に係る薬剤の作用・副作用予測システムの判別式最適化部によって実行される組合せ最適化の手順を示す。この組合せ最適化の手順は、図３ではステップＳ７として示されるものである。図４で、Ｙは全候補遺伝子条件の集合、Ｘ_ｋは判別式に含まれるｋ個の遺伝子条件の集合、ｄは初期の遺伝子条件数、Ｊは判別式の評価関数、ｄ_２は最適化終了時の組合せ数を表す。
　まず、判別式最適化部８及び医学的知見条件１６の導入により判別式に使用する遺伝子条件がｄ個選択されている場合には、ｄ個の組合せを初期の組合せとし、使用する遺伝子条件が選択されていない場合には初期の組合せを空集合（ｄ＝０）とする（ステップＴ１）。次に、全候補遺伝子条件集合Ｙから既に選択されている遺伝子条件集合Ｘ_ｋに含まれない遺伝子条件の中で、遺伝子条件集合Ｘ_ｋに追加することにより判別式（遺伝子条件集合Ｘ_ｋ）の性能が最大になる遺伝子条件ｙ_ｊ ^＊を探索する（ステップＴ２）。さらに、ステップＴ２で選択された遺伝子条件ｙ_ｊ ^＊を判別式（遺伝子条件集合Ｘ_ｋ）に追加し（ステップＴ３）、選択された遺伝子条件数を表す変数ｋを１増加する（ステップＴ４）。
　具体的には、候補条件の追加は、判別式最適化部８において実行されるが、この判別式最適化部８では、既に選択されているｋ個の遺伝子条件の組合せに対して、候補条件を１個追加することで生成されるｋ＋１個の遺伝子条件の組合せを新たな判別式とするとき、新たな判別式に該当する分類ラベルの症例数（該当数）を最大とする候補条件の中で、分類ラベルについての占有率を最大とする候補条件を探索し（ステップＴ２）、これをｋ個の遺伝子条件の組合せに追加し（ステップＴ３）、ｋ＋１個の条件の組合せからなる新たな判別式を生成する（ステップＴ４）のである。
　本願でいう判別式の性能とは、図５に示されるが、第１に該当数（正分類数）をいい、第２に占有率をいう。第１、第２とは優先順位を意味しており、判別式最適化部８では、前述のとおり第１に分類ラベルの該当数を最大とする遺伝子条件を探索し、その後、第２にその中で分類ラベルの占有率を最大とする候補条件を探索するようにしている。
　これは、判別式の信頼性（精度）のみならず、ある程度の汎用性を重視しているためである。従って、汎用性を犠牲にしてもなお信頼性の向上を目的とする場合には、性能としての優先順位を逆にしてもよい。

　次に、判別式最適化部８によって遺伝子条件を追加した後に、同じく判別式最適化部８を用いて、組合せの中から遺伝子条件を削除することにより以前の組合せより性能が向上する判別式が存在するかを探索する。
　既に選択された遺伝子条件集合Ｘ_ｋの中で、遺伝子条件集合Ｘ_ｋから削除することにより判別式の性能が最大になる遺伝子条件ｙ＾_ｊ ^＊を探索し（ステップＴ５）、このステップＴ５で選択された遺伝子条件ｙ＾_ｊ ^＊を削除することにより、以前のｋ－１個の遺伝子条件からなる判別式（遺伝子条件集合Ｘ_ｋ－１）より性能が上回るか否かを判定する（ステップＴ６）。性能が上回る場合にはステップＴ７に進み、そうでない場合には、ステップＴ９に進む。
　具体的には、遺伝子条件の削除は、判別式最適化部８において実行されるが、既に選択されているｋ個の遺伝子条件の組合せの中から、削除候補条件を１個削除することで生成されるｋ－１個の遺伝子条件の組合せを判別式候補とする中で、判別式候補に該当する分類ラベルの症例数を最大とし、分類ラベルについての占有率を最大とする削除候補条件を探索し（ステップＴ５）、これを削除したときの判別式候補が、以前のｋ－１個の遺伝子条件の組合せからなる判別式より、該当する分類ラベルの症例数を上回る場合、あるいは該当する分類ラベルの症例数が同数であり、分類ラベルについての占有率で上回る場合であるかを判定し（ステップＴ６）、そのような場合に削除候補条件を組合せから削除し、ｋ－１個の遺伝子条件の組合せを更新する（ステップＴ７）。その他の場合には、ステップＴ９へ進むのである。

　なお、ステップＴ６では、ｋ－１個の遺伝子条件からなる判別式を比較の対象としているが、これはステップＴ４でｋを１つインクリメントしてｋ＝ｋ＋１としていることから、ステップＴ３までのｋ個と同値となる。
　ステップＴ７では、ステップＴ５で選択された遺伝子条件ｙ＾_ｊ ^＊を遺伝子条件集合Ｘ_ｋから削除する。ステップＴ８では、選択された遺伝子条件数を表す変数ｋを１減少する。
　ステップＴ９では、遺伝子条件の組合せ数ｋが指定されたしきい値ｄ_２に達したか否かを判定する。遺伝子条件の組合せ数ｋが指定されたしきい値ｄ_２に達したとき最適化を終了する。それ以外の場合にはステップＴ２に進む。
　このように図３に示されるステップＳ７では、初期の組合せ（ｋ＝ｄ）に対して、候補条件の追加あるいは削除を繰り返すことにより、判別式に用いる遺伝子条件の組合せを最適化する。
　遺伝子条件の削除が行われた場合には、更に遺伝子条件を削除することでより性能の高い判別式が生成される可能性があるため、判別式最適化部８によって遺伝子条件の削除を繰り返し行う。遺伝子条件の削除が行われなかった場合には、判別式最適化部８によって遺伝子条件の追加を行う。
　なお、遺伝子条件の削除では、予め医学的知見条件１６の導入により、組合せに含まれる医学的知見条件１６を削除の候補に含めるか含めないかを個別に設定しておくことにより、最適化の工程の中で医学的知見条件１６を判別式最適化部８によって削除する可能性を持たせるかを指定することができる。

　判別式最適化部８によって、追加と削除を適宜繰り返した後、遺伝子条件の組合せ数が指定されたしきい値ｄ_２に達したとき組合せ最適化を終了する（ステップＴ９）が、このしきい値は、最適化の工程を実行する際に外部から入力するようにしてもよいし、予めデータベース３にしきい値に関するデータあるいは複数のしきい値に関するデータテーブルを格納しておき、最適化工程を実行する際に、そのデータを読み出したり、あるいはデータテーブルを表示装置に示して判別式最適化部８によって選択可能にしておいてもよい。
　最後に、各組合せ数での判別式の中で、該当する分類ラベルの症例数が最大であり、分類ラベルについての占有率が最大であるもののうち、遺伝子条件の組合せ数が最小である判別式を最終的に判別式として決定する。このような判別式の決定要件は予めデータベース３に格納しておくか、判別式最適化部８に格納しておくとよい。
　本実施の形態においては、遺伝子条件の追加及び削除を判別式最適化部８が実行しているが、追加と削除を例えば、それぞれ第１及び第２の判別式最適化部を備えて別個独立に実行するようにしてもよいことは言うまでもない。

　図５に本実施の形態に係る薬剤の作用・副作用予測システム１の判別式最適化部８を用いて実行される、遺伝子条件の組合せ最適化による遺伝子条件の組合せ数と性能の推移の例を示す。
　まず、医学的知見によりｄ個の遺伝子条件が選択されている型（組合せ）を図５の丸１で示す。このｄ個の組合せに対して組み合わせたとき性能が最高となるような遺伝子条件を１つ追加し丸２の組合せに推移する。ここで、性能とは、図５中に記載されるとおり、その遺伝子条件の組合せに該当する症例数が多い場合、すなわち汎用性に優れる場合と、その遺伝子条件の組合せに該当する症例数（分類ラベルの症例数）の全体に対する占有率が高い場合、すなわち精度に優れる場合の両方が含まれる。
　この丸２では、遺伝子条件を１つ削除しても性能が向上しないため、削除せず、さらに遺伝子条件を１つ追加して丸３の組合せに推移する。図５では、性能が高い「条件の組合せ」が存在しないことを×で表す。丸３の組合せから遺伝子条件を１つ削除することにより丸２の組合せより性能が向上するため、遺伝子条件を１つ削除して丸４の組合せに推移する。このとき、遺伝子条件を削除するときは、判別式における遺伝子条件の組合せ数が同じ場合である丸４は丸２より性能が高いことは保証されているが、遺伝子条件の組合せ数が異なる判別式（例えば、丸３と丸４）の問題としていない。そのため、丸４は丸３より性能が高い場合もあり、低い場合もあり、図６では例えば丸４を丸３の右上に表記し、丸２と丸４の性能の差を不等号で示している。
　この丸４では、さらに遺伝子条件を削除しても性能は向上しないため、遺伝子条件を１つ追加して丸５の組合せに推移する。さらに追加と削除を繰り返していくと、丸１１の組合せでは、どの遺伝子条件を追加しても性能が向上しない。このような場合には、追加する遺伝子条件単独で分類ラベルについての占有率が高いものを優先して組合せに追加していく。追加しても性能が向上しない状況においても連続して遺伝子条件を追加することにより、初期に近い段階で追加された遺伝子条件を削除すると性能が向上する場合がある。そのため、遺伝子条件の組合せ数が予め指定した終了条件ｋ＝ｄ_２となるまで追加と削除を繰り返していく。この例では、性能が最高であり、かつ組合せ数が最小である丸１１の組合せを判別式として採用する。

　次に、２つの遺伝子型を用いて薬剤の「副作用あり」を分類するための判別式の生成を図６に示す例を用いて説明する。図６は、（ａ）は本実施の形態に係る薬剤の作用・副作用予測システムにおいて、Ａ，Ｂ２つの遺伝子型（Ｈｏｍｏ、Ｈｅｔｅｒｏ、Ｗｉｌｄ）を考慮した場合の遺伝子型の組合せと副作用の有無の症例を対応させた概念図であり、（ｂ）は占有率を７０％以上として副作用有りの遺伝子条件を判別式として生成した状態を示す概念図である。
　図６に示される例では、判別式のための遺伝子型の組合せ（遺伝子条件）の総数は、（（３＋１）^２－１＝１５）通りとなる。判別式の生成に用いる症例データ１０は２０例であり、図６中では副作用があった症例を○、副作用がなかった症例を×で示す。まず、薬剤の作用・副作用予測システム１の信頼度解析部６が、１５通りの遺伝子条件について、各々の分類ラベルとして、「副作用あり」・「副作用なし」の該当症例数を調べ、「副作用あり」についての占有率を計算する。各遺伝子条件の該当症例数と占有率を表１に示す。なお、遺伝子の型（遺伝子型）を示す欄に「－」で示されているのは、遺伝子型の指定がないことを意味している。
　次に、判別式生成部７が、該当数ｎ＝１以上でかつ副作用ありについての占有率ｒ＝７０％以上の遺伝子条件を、有効な遺伝子条件として選択する。この選択された有効な遺伝子条件を示すのが、表１における丸印であり、また、図６（ｂ）にハッチングで示される部分である。

　ここでは、判別式最適化部８による医学的知見条件１６の導入を省略し、有効な遺伝子条件として選択されている４つの遺伝子条件から、判別式最適化部８による組合せ最適化を行い、信頼度Ｒ＝７０％以上の副作用なしの判別式を生成する。
　まず、判別式最適化部８によって、判別式生成部７において抽出された遺伝子条件から、一つ目の遺伝子条件として遺伝子条件１（遺伝子Ａ（Ｈｏｍｏ））が選ばれる。次に、判別式最適化部８は、この遺伝子条件と組み合わせて正分類数が最大となる遺伝子条件１１（遺伝子Ａ（Ｈｅｔｅｒｏ）かつ遺伝子Ｂ（Ｈｅｔｅｒｏ））を判別式に加える。アルゴリズム上はさらに遺伝子条件の追加と削除（判別式最適化部８による）を繰り返し、組合せ数４まで計算可能であるが、この例では、遺伝子条件１と遺伝子条件１１の組合せによる判別式が最高性能をもつため、以下の説明を省略する。
　したがって、遺伝子Ａの型と遺伝子Ｂの型から生成した副作用ありの判別式（信頼度７０％以上）は、（（遺伝子Ａ（Ｈｏｍｏ））または（遺伝子Ａ（Ｈｅｔｅｒｏ）かつ遺伝子Ｂ（Ｈｅｔｅｒｏ）））となる。この例で用いた症例２０例に対して生成した判別式により副作用あり（信頼度７０％以上）を予測すると、２０例中１０例が副作用ありと予測される。
　このとき副作用ありと分類された１０例のうち９例は実際に副作用があり、１例では副作用は生じないものであった。

　本実施の形態に係る薬剤の作用・副作用予測システム１の予測部４では、作用・副作用の予測の対象となる患者１５に対して、判別式設計部２で構築した判別式データ１２を用いて、作用・副作用の予測を行う。
　分類ラベルＡ・Ｂ（例えば、副作用あり・副作用なし）について、信頼度を変えて生成した複数の判別式（以下、判別式は判別式データ１２と同等の意味で用いる場合がある）を予測に用いる。信頼度の異なる判別式を複数用いて予測を行うことにより、患者１５個人に対して確信度をつけた汎用性の高い予測が可能となる。
　信頼度をＲ_１、Ｒ_２、…、Ｒ_ｍ１（Ｒ_１＞Ｒ_２＞…＞Ｒ_ｍ１）、Ｒ_１、Ｒ_２、…、Ｒ_ｍ２（Ｒ_１＞Ｒ_２＞…＞Ｒ_ｍ２）、とするとき、判別式Ａ（Ｒ_１）、判別式Ａ（Ｒ_２）、…、判別式Ａ（Ｒ_ｍ１）、判別式Ｂ（Ｒ_１）、判別式Ｂ（Ｒ_１）、…、判別式Ｂ（Ｒ_ｍ２）を用いる。
　例えば、データベース３の症例データ１０中で該当する症例数が少ない信頼度１００％の判別式（ここでは、判別式を遺伝子条件と置き換えても同じ意味になる）は、該当する症例数が少ないため汎用性が比較的低いと考えられるが、この判別式に該当する場合には信頼性の高い分類結果１３が得られるため、確信度の高い診断をするために有効な判別式である。
　一方、データベース３の症例データ１０中で該当する症例数が比較的多い信頼度７０％の判別式は、信頼度１００％の判別式と比べると、確信度は低いが汎用性の高い診断をするために有効な判別式である。本願では、複数の判別式を予測に用いるが、それぞれの判別式の遺伝子条件に該当するか否かを調査した結果を分類結果１３といい、このうち、患者１５の判定として採用したものを予測結果１４という。
　予測対象となる患者１５に関する遺伝子及び遺伝子型の組合せのデータを分類Ａ、分類Ｂについて信頼度が高い順に判別式に該当するかを調べていき、患者が判別式の遺伝子条件に該当するとき、その判別式の信頼度を分類結果１３の信頼度とする。このとき、分類Ａと分類Ｂのいずれかの判別式にのみ該当する場合にはその分類結果１３を採用し、分類Ａと分類Ｂのいずれの判別式にも該当する場合は信頼度の高い分類結果１３を採用する。また、分類Ａと分類Ｂのいずれにも該当し、該当する判別式の信頼度が等しい場合や、分類Ａと分類Ｂのいずれの判別式にも該当しない場合には、判定保留とする。

　例えば、副作用の有無を予測する場合に、「副作用あり」の判別式を信頼度１００％、８０％以上、７０％以上で設計し、「副作用なし」の判別式を信頼度１００％、８０％以上、７０％以上で設計したとする。患者Ｃが「副作用あり」の判別式（信頼度８０％以上）に該当し、「副作用なし」ではいずれの判別式にも該当しない場合に、患者Ｃに対する予測は「信頼度８０％以上で副作用あり」となり、患者Ｄが副作用ありの判別式（信頼度７０％以上）と「副作用なし」の判別式（信頼度８０％以上）に該当した場合に、患者Ｄに対する予測は「信頼度８０％以上で副作用なし」となり、患者Ｅが「副作用あり」の判別式（信頼度７０％以上）と「副作用なし」の判別式（信頼度７０％以上）に該当した場合に、患者Ｅに対する予測は「判定保留」となり、患者Ｆは「副作用あり」、「副作用なし」のいずれの判別式にも該当しない場合に、患者Ｆに対する予測は「判定保留」となる。
　また、判定保留となる患者Ｘに対しては、図７に示すように、いずれかの分類ラベルと仮定して症例データベースに仮登録し、仮定した分類ラベルの判別式を再設計し直すことにより、仮定した分類ラベルについての信頼度を推定することができる。図７は、本実施の形態に係る薬剤の作用・副作用予測システムにおいて判定保留となった場合の信頼度の推定方法を示す概念図である。この機能は、予測部４が、症例解析テーブル生成部５、信頼度解析部６及び判別式生成部７と共に作用することで発揮されるものである。

　例えば、副作用の有無の予測を行う場合には、患者Ｘを「副作用あり」と仮定して「副作用あり」についての判別式を再設計したとき、患者Ｘが「副作用あり」と分類される最大の占有率を与える判別式における占有率を、患者Ｘが「副作用あり」である信頼度とする。
　具体的には、予測部４において判定保留となった場合に、表示装置などにその旨を表示させると同時に、推定を行うか否かの判断と、推定を行う場合にさらに分類ラベルとして「作用あり」、「作用なし」、「副作用あり」、「副作用なし」のいずれかの選択を促す表示をして、その表示を選択した場合には、その分類ラベルの表示に従って、症例解析テーブル生成部５は、その患者のデータをその分類ラベルの症例データ１０として解析テーブル１１に追加する。また、症例解析テーブル生成部５はその解析テーブル１１をデータベース３に読み出し可能に格納する。
　その後、信頼度解析部６が解析テーブル１１を読み出して占有率を演算し、判別式生成部７は先に説明した抽出遺伝子条件と同様にして判別式の生成を行う。予測部４は、このようにして生成された判別式の中で以下の２つのケースのうち、いずれかによって信頼度を推定する。
　１）該当する症例数がｐ以上（ｐは１より大）で、最大の占有率を与える遺伝子条件（この「遺伝子条件」は、単独の「判別式」として考えられる。）
　２）該当する症例数がｐ以上かつ占有率がｒ以上である遺伝子条件により生成した判別式
　１）の遺伝子条件における占有率、あるいは２）の判別式における全体の占有率をその患者がその分類に該当する信頼度として選択し、この推定結果を予測結果として表示装置等に出力するものである。
　なお、信頼度解析部６によって演算された結果は、解析テーブル１１に反映されてデータベース３に読み出し可能に格納され、また、判別式生成部７によって生成された判別式も判別式データ１２として読み出し可能にデータベース３に格納される。予測部４によって選択された判別式とその占有率もデータベース３に読み出し可能に格納される。

　一方、患者Ｘを「副作用なし」と仮定して「副作用なし」についての判別式を再設計したとき、患者Ｘが「副作用なし」と分類される最大の占有率を与える判別式における占有率を、患者Ｘが「副作用なし」である信頼度とする。このとき患者Ｘに対する「副作用あり」の信頼度と「副作用なし」の信頼度を比較し、信頼度が高い方へ患者Ｘを分類することにより、いずれの判別式にも該当しない患者に対する予測が可能である。また、分類されるときの信頼度が低い場合には、分類せずに「判定保留」とすることも可能である。このときの信頼度についてのしきい値は、予めデータベース３に格納されてもよいし、先に判定保留となって推定を行うか否かの判断の選択を促す表示をする際に、入力を促すようにしてもよいし、予測部４自体に設定値として記憶させておいてもよい。
　なお、本実施の形態においては、システム発明として説明したが、図１に示されるシステムを汎用のコンピュータと捉え、これを動作させるプログラムとして、図３に示すフローチャートを実行させることを考えると、上述の説明はコンピュータが各工程を実行しながら、解析テーブル１１から判別式データ１２を生成し、薬剤の作用・副作用の有無に関する予測結果を出力するするプログラムについての実施の形態の説明として成立するものであり、このプログラムについての実施の形態に係る作用、効果については先に説明した薬剤の作用・副作用予測システムに係る実施の形態に係る作用、効果と同様である。

　次に、抗がん剤イリノテカンを投与したときの作用・副作用の予測を実施例１として示す。
　イリノテカンを投与した７１例の症例データを用いて、ＵＧＴ１Ａ１＊２８、ＵＧＴ１Ａ１＊６、ＵＧＴ１Ａ９＊２２、ＵＧＴ１Ａ７－Ｎ１２９Ｋ、ＵＧＴ１Ａ１＊６０、ＵＧＴ１Ａ７－５７Ｔ／Ｇの６遺伝子の型により作用・副作用予測のための判別式を設計した。
　対象とした遺伝子はいずれもＨｏｍｏ、Ｈｅｔｅｒｏ、Ｗｉｌｄの３つの型をもつため、全組合せ数は（（３＋１）^６－１）＝４０９５通りとなる。
　副作用については好中球減少あるいは白血球減少についての評価グレード０－２を「副作用なし」、グレード３、４を「副作用あり」としてラベル付けし、作用については腫瘍縮小効果についての評価がＣＲ、ＰＲの場合に「効果あり」、ＳＤ、ＰＤの場合に「効果なし」としてラベル付けした。７１例中、３７例（５２．１％）が「副作用なし」、３４例（４７．９％）が「副作用あり」であり、また、２３例（３３．３％）は「効果あり」、４６例（６６．７％）が「効果なし」、残り２例は「評価できず」であった。副作用の予測では、「副作用なし」、「副作用あり」ともに信頼度を１００％、８０％以上、７０％以上と設定して判別式を生成し、作用の予測では「効果あり」では信頼度１００％、８０％以上、「効果なし」では信頼度１００％、８０％以上、７０％以上、５０％以上のそれぞれで判別式を生成した。表２乃至表８に有効な遺伝子条件の一覧と最適化結果の一例を示す。また、７３例に対する予測結果を表９に示す。
　表２を例にして、表の見方を説明する。表２には、イリノテカンが有効に作用する「効果あり」を予測するための有効な遺伝子条件と、それらの組合せ最適化結果が示されている。表の一行は「効果あり」の占有率７０％以上の遺伝子条件と７１例中の該当数（ＣＲ／ＰＲ：効果あり、ＳＤ／ＰＤ：効果なしおよびその合計）、および占有率（ＣＲ／ＰＲ：効果ありおよびＳＤ／ＰＤ：効果なし）を示している。遺伝子条件は、左から順に６個の遺伝子ＵＧＴ１Ａ１＊２８、ＵＧＴ１Ａ１＊６，ＵＧＴ１Ａ９＊２２、ＵＧＴ１Ａ７－Ｎ１２９Ｋ、ＵＧＴ１Ａ１＊６０、ＵＧＴ１Ａ７－５７Ｔ／Ｇの遺伝子型をＷｉｌｄ、Ｈｅｔｅｒｏ、Ｈｏｍｏあるいは空欄（指定なし）で表している。例えば、１番目の遺伝子条件は、ＵＧＴ１Ａ１＊６がＧ／Ａであり、かつＵＧＴ１Ａ９＊２２がＴ１０／１０であることを示しており、この遺伝子条件でのＣＲ／ＰＲの該当数が１例で、ＳＤ／ＰＤの該当数が０例であり、その占有率が１００．０％（ＣＲ／ＰＲ）と０．０％（ＳＤ／ＰＤ）であることを示している。また、２４番目の遺伝子条件は、ＵＧＴ１Ａ７Ｎ１２９ＫがＧ／Ｇであり、かつＵＧＴ１Ａ１＊６０がＴ／Ｇであり、かつＵＧＴ１Ａ７－５７Ｔ／ＧがＴ／Ｇであることを示しており、この遺伝子条件でのＣＲ／ＰＲの該当数が３例で、ＳＤ／ＰＤの該当数が１例であり、その占有率が７５．０％（ＣＲ／ＰＲ）と２５．０％（ＳＤ／ＰＤ）であることを示している。また、２４式をＯＲ演算で組み合わせたときには、ＣＲ／ＰＲの該当数が７例で、ＳＤ／ＰＤの該当数が１例であり、その占有率が８７．５％（ＣＲ／ＰＲ）と１２．５％（ＳＤ／ＰＤ）であることを示している。さらにこの２４式を占有率７０％以上、８０％以上および１００％で最適化すると、７０％以上での最適化では遺伝子条件４式が選択され、この判別式によるＣＲ／ＰＲの該当数が７例で、ＳＤ／ＰＤの該当数が１例であり、その占有率が８７．５％（ＣＲ／ＰＲ）と１２．５％（ＳＤ／ＰＤ）であり、８０％以上での最適化では遺伝子条件４式が選択され、この判別式によるＣＲ／ＰＲの該当数が７例で、ＳＤ／ＰＤの該当数が１例であり、その占有率が８７．５％（ＣＲ／ＰＲ）と１２．５％（ＳＤ／ＰＤ）であり、１００％での最適化では遺伝子条件５式が選択され、この判別式によるＣＲ／ＰＲの該当数が５例で、ＳＤ／ＰＤの該当数が０例であり、その占有率が１００．０％（ＣＲ／ＰＲ）と０．０％（ＳＤ／ＰＤ）であることを示している。

　次に、実施例１について、６個の遺伝子に１ｓｔ　ｌｉｎｅと２ｎｄ　ｌｉｎｅでの、抗がん剤イリノテカンを投与したときの作用・副作用予測を実施例２として示す。症例データや分類方法などは実施例１と同様であり、１ｓｔ　ｌｉｎｅと２ｎｄ　ｌｉｎｅの症例データを別にして、各々で判別式を生成する。表１０乃至表１６に１ｓｔ　ｌｉｎｅで有効な遺伝子条件の一覧と最適化結果の一例を、表１７乃至表２３に２ｎｄ　ｌｉｎｅで有効な遺伝子条件の一覧と最適化結果の一例を示す。また、７３例に対する予測結果を表２４に示す。

　実施例１と比較して、１ｓｔ　ｌｉｎｅと２ｎｄ　ｌｉｎｅを分けることにより、予測性能が向上している。薬剤の作用・副作用の予測に、遺伝子型以外の遺伝子条件を与えることにより予測性能が向上する。本発明によれば、例えば、性別、他の疾病の有無、年齢層などにより分けることにより、予測性能が高い判別式を生成することができる。

　以上説明したように、本発明の請求項１乃至請求項１２に記載された発明は、医療分野、バイオインフォマティクス分野における利用が可能であり、医薬品メーカーにおける新規医薬品研究開発や、これらのメーカーあるいは大学等を含めて研究機関における医薬品の作用・副作用に関する試験・研究、さらには医療機関における臨床・医療活動に利用可能である。

Claims

薬剤の作用又は副作用に関わる遺伝子型の組合せ（以下、遺伝子条件という）毎に、前記作用又は副作用の有無に関する症例を対応させる解析テーブル（１１）を生成する症例解析テーブル生成部（５）と、
　前記解析テーブル（１１）における遺伝子条件のうち少なくとも１つを選択して、前記作用又は副作用の有又は無の症例数についての占有率を演算する信頼度解析部（６）と、
　前記占有率に対する所望のしきい値を基準として、前記信頼度解析部（６）において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成する判別式生成部（７）と、
　薬剤の作用又は副作用の有無に関する検体の遺伝子型に関するデータを前記判別式に含まれる遺伝子条件毎に比較照合して、前記判別式と整合することにより前記検体の前記薬剤の作用又は副作用の有無に関する予測を行う予測部（４）と、
　を有することを特徴とする薬剤の作用・副作用予測システム（１）。
　前記判別式生成部（７）は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記信頼度解析部（６）において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成することを特徴とする請求項１記載の薬剤の作用・副作用予測システム（１）。
　前記判別式生成部（７）において抽出された遺伝子条件のうち，前記占有率に対する所望の前記しきい値に該当する遺伝子条件であって，かつ前記症例数に対する所望の前記しきい値に該当している遺伝子条件のうち，前記判別式生成部（７）で生成された判別式に加えることで、加えられた後の全体の判別式における，前記占有率又は症例数が増加する前記遺伝子条件を選択して前記判別式に追加する機能及び／又は、前記生成された判別式から減ずることで、減じた後の全体の判別式における，前記占有率又は症例数が増加する遺伝子条件を選択して削除する機能を、備えた判別式最適化部と、を有することを特徴とする請求項２に記載の薬剤の作用・副作用予測システム（１）。
　前記生成された判別式に含まれる遺伝子条件のうち、一の遺伝子条件における前記占有率及び症例数と、他の遺伝子条件における前記占有率及び症例数とが共通する場合に、前記他の遺伝子条件を前記生成された判別式から削除する判別式最適化部を有することを特徴とする請求項２又は請求項３に記載の薬剤の作用・副作用予測システム（１）。
　前記判別式最適化部は、予めデータベースに格納された前記薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件（以下、医学的知見条件（１６）という）を読み出して、前記抽出された遺伝子条件を探索し、前記抽出された遺伝子条件がその医学的知見条件（１６）を含む場合にその医学的知見条件（１６）を差し引くようにする機能と、前記抽出された遺伝子条件に含まれていない場合に、前記医学的知見条件（１６）を加えるようにする機能とを有することを特徴とする請求項３又は請求項４に記載の薬剤の作用・副作用予測システム（１）。
　前記症例解析テーブル生成部（５）は、前記検体の遺伝子条件に関するデータを薬剤の作用又は副作用の有無に関して分類しながら解析テーブル（１１）に追加し、
　前記信頼度解析部（６）は、前記解析テーブル（１１）を読み出して前記遺伝子条件のうちすくなくとも１つを選択して前記占有率を演算し、
　前記判別式生成部（７）は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記遺伝子条件を抽出して、この遺伝子条件を単独で、あるいは組合せて前記判別式を生成し、
　前記予測部（４）は、生成された判別式における全体の占有率をその検体が前記薬剤の作用又は副作用の有無に関して分類される信頼度の推定値として予測することを特徴とする請求項２乃至請求項５のいずれか１項に記載の薬剤の作用・副作用予測システム（１）。
　コンピュータによって、薬剤の作用・副作用を予測するために実行されるプログラムであって、
　コンピュータに、薬剤の作用又は副作用に関わる遺伝子条件毎に、前記作用又は副作用の有無に関する症例を対応させる解析テーブル（１１）を生成する症例解析テーブル生成工程と、
　前記解析テーブル（１１）における遺伝子条件のうち少なくとも１つを選択して、前記作用又は副作用の有又は無の症例数についての占有率を演算する信頼度解析工程と、
　前記占有率に対する所望のしきい値を基準として、前記信頼度解析工程において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件を単独で、あるいは組合せて判別式を生成する判別式生成工程と、
　薬剤の作用又は副作用の有無に関する検体の遺伝子条件に関するデータを前記判別式に含まれる遺伝子条件毎に比較照合して、前記判別式と整合することにより前記検体の前記薬剤の作用又は副作用の有無に関する予測を行う予測工程と、を実行させることを特徴とする薬剤の作用・副作用予測プログラム。
　前記判別式生成工程は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記信頼度解析工程において前記占有率の演算を行った前記遺伝子条件から該当する遺伝子条件を抽出し、この抽出された遺伝子条件と単独で、あるいは組合せて判別式を生成することを特徴とする請求項７記載の薬剤の作用・副作用予測プログラム。
　前記判別式生成工程において抽出された遺伝子条件のうち，前記占有率に対する所望の前記しきい値に該当する遺伝子条件であって，かつ前記症例数に対する所望の前記しきい値に該当している遺伝子条件のうち，前記判別式生成工程で生成された判別式に加えることで、加えられた後の全体の判別式における，前記占有率又は症例数が増加する前記遺伝子条件を選択して前記判別式に追加するステップ及び／又は、前記生成された判別式から減ずることで、減じた後の全体の判別式における，前記占有率又は症例数が増加する遺伝子条件を選択して削除するステップを、備えた判別式最適化工程と、を有することを特徴とする請求項８に記載の薬剤の作用・副作用予測プログラム。
　前記生成された判別式に含まれる遺伝子条件のうち、一の遺伝子条件における前記占有率及び症例数と、他の遺伝子条件における前記占有率及び症例数とが共通する場合に、前記他の遺伝子条件を前記生成された判別式から削除する判別式最適化工程を有することを特徴とする請求項８又は請求項９に記載の薬剤の作用・副作用予測プログラム。
　前記判別式最適化工程は、予めデータベースに格納された前記薬剤の作用・副作用の有・無に関する医学的な知見に基づく条件（以下、医学的知見条件（１６）という）を読み出して、前記抽出された遺伝子条件を探索し、前記抽出された遺伝子条件がその医学的知見条件（１６）を含む場合にその医学的知見条件（１６）を差し引くようにするステップと、前記抽出された遺伝子条件に含まれていない場合に、前記医学的知見条件（１６）を加えるようにするステップとを有することを特徴とする請求項９又は請求項１０に記載の薬剤の作用・副作用予測プログラム。
　前記症例解析テーブル生成工程は、前記検体の遺伝子条件に関するデータを薬剤の作用又は副作用の有無に関して分類しながら解析テーブル（１１）に追加し、
　前記信頼度解析工程は、前記解析テーブル（１１）を読み出して前記遺伝子条件のうち少なくとも１つを選択して前記占有率を演算し、
　前記判別式生成工程は、前記占有率に対する所望のしきい値及び前記症例数の有又は無に対する所望のしきい値を基準として、前記遺伝子条件を抽出して、この遺伝子条件を単独で、あるいは組合せて前記判別式を生成し、
　前記予測工程は、生成された判別式における全体の占有率をその検体が前記薬剤の作用又は副作用の有無に関して分類される信頼度の推定値として予測することを特徴とする請求項８乃至請求項１１のいずれか１項に記載の薬剤の作用・副作用予測プログラム。