JPWO2004046997A1

JPWO2004046997A1 - 塩基配列関連情報を用いた情報処理システム

Info

Publication number: JPWO2004046997A1
Application number: JP2004553203A
Authority: JP
Inventors: 加藤　孝昌; 孝昌加藤; 森本　健郎; 健郎森本; 松尾　仁司; 仁司松尾; 伴　秀行; 伴　　秀行; 徹久光; 卓也神山
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2002-11-20
Filing date: 2003-11-19
Publication date: 2006-03-16
Anticipated expiration: 2023-11-19
Also published as: EP1569154A4; WO2004046997A1; JP4266008B2; EP1569154A1; US20060041389A1

Abstract

個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び／又は当該意味情報に関連する情報を提供するシステムを構築する。所定の個体に関する塩基配列関連情報を受け取るステップａと、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置から、前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップｂとを有する。

Description

本発明は、例えば通信回線網を介して情報を提供する情報処理システムに関する。

現在、ヒトを始めとする各種生物のゲノム塩基配列が急速に決定されており、様々なデータベースにゲノム塩基配列情報が蓄積されている。例えば、インターネット等の情報通信網を介して、各種研究機関や研究者がデータベースに蓄積されたゲノム塩基配列情報を利用できるようなシステムの構築がなされつつある。
同時に、このようなゲノム塩基配列情報に含まれる塩基配列を用いて、ゲノム創薬の研究や遺伝情報の解析等が盛んに行われており、一塩基多型に代表されるような個体間における塩基配列の相違が注目されている。一般に、個体間における塩基配列の相違とは、所定の塩基の相違が個体種中１％以上の頻度で存在すると定義される多型と、所定の塩基の相違が個体種中１％未満であるバリエーションとを意味している。特に、多型には、個体間における１個の塩基の相違である一塩基多型（ＳＮＰ；ＳｉｎｇｌｅＮｕｃｌｅｏｔｉｄｅＰｏｌｙｍｏｒｐｈｉｓｍ）、１から数十塩基（数千塩基の場合もある）が欠失又は挿入している挿入／欠失多型、２から数十塩基を１単位とする配列の繰り返し回数が相違するＶＮＴＲ（ＶａｒｉａｂｌｅＮｕｍｂｅｒｏｆＴａｎｄｅｍＲｅｐｅａｔ）やマイクロサテライト多型（繰り返し配列が２〜４塩基程度のもの）が知られている。
このような多型は、個体間におけるタンパク質のアミノ酸配列の相違や、個体間における所定の遺伝子に関する発現効率の相違等に影響を及ぼすことがある。このような影響により、例えば、所定の疾病に対する罹患可能性が個体間で異なったり、所定の薬剤に対する感受性が個体間で異なることが知られている。
ところが、多型等の個体間における塩基配列情報の相違を有効に利用して、各個体にとって有益な意味情報を提供するようなシステムは構築されていないのが現状である。

そこで、本発明は、このような現状に鑑み、個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び／又は当該意味情報に関連する情報を提供するシステムを構築することを目的とする。
上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する塩基配列関連情報を受け取った後、個体毎に塩基配列関連情報群を有する記憶装置から前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定する方法である。本方法によれば、塩基配列関連情報群を特定することによって、前記受け取った塩基配列関連情報が帰属する個体を特定することもまたできる。
また、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する個体関連情報を受け取り、特定した塩基配列関連情報群若しくは個体と、前記受け取った個体関連情報とを関連付けて記憶することで、当該個体関連情報と個体に関する塩基配列関連情報群とを関連付けることができる。
なお、本発明に係る塩基配列に関する情報処理方法において、塩基配列関連情報群を特定する際には、例えば、予め決まった位置情報に対応する塩基配列関連情報を受け取り、当該受け取った塩基配列関連情報を用いることができる。また、本発明に係る塩基配列に関する情報処理方法においては、所定の個体に関する塩基配列関連情報の受け取りと、当該受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定すまで繰り返すこともできる。
さらに、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関して個体関連情報を受け取ることによって、当該所定の個体に関する塩基配列関連情報群と個体関連情報とを関連付けたデータベースを構築することもできる。
本発明に係る塩基配列に関する情報処理方法は、前記データベースに含まれる複数の個体に関する複数の個体関連情報及び複数の個体に関する塩基配列関連情報群を統計的に処理することで、塩基配列関連情報を意味づける意味情報及び／又は当該意味情報に関連する情報を創出することができる。このとき、当該複数の個体に関する塩基配列関連情報群は、前記データベースに含まれていても、含まれていなくても良い。また、統計的に処理した結果と複数の個体に関する複数の個体関連情報とを用いて更に統計的に処理することによって、意味情報及び／又は当該意味情報に関連する情報を創出してもよい。
一方、本発明に係る塩基配列に関する情報処理方法は、創出された塩基配列関連情報を意味づける意味情報及び／又は当該意味情報に関連する情報を受け取り、受け取った意味情報及び／又は当該意味情報に関連する情報を用いて、物品及び／又はサービスの要求情報に応じた意味情報及び／又は当該意味情報に関連する情報を提供するための記憶装置の記憶内容を構築することもできる。
なお、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及び記憶装置等のハードウェアを備えるコンピュータに、各ステップを実行させるプログラムとして実現することができる。また、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及び記憶装置等のハードウェアを備えるコンピュータに、各ステップを実行させるプログラムを記録した記録媒体として実現することもできる。さらに、本発明に係る塩基配列に関する情報処理方法は、各ステップを実行する制御装置、送受信装置及び記憶装置等のハードウェアを備える情報処理装置として実現することもできる。
その他、本発明は、請求項各項に記載されている通りの構成を有するものである。
本明細書は本願の優先権の基礎である日本国特許出願２００２−３３６９１６号の明細書および／または図面に記載される内容を包含する。

図１は、本発明を適用した情報処理システムの構成を概略的に示す概略構成図である。
図２は、共用コンピュータの構成を概略的に示す概略構成図である。
図３は、メインＤＢに記録されたデータの一例を示す構成図である。
図４は、統計解析用コンピュータの構成を概略的に示す概略構成図である。
図５は、ゲノム関連情報ＤＢに記録されたデータの一例を示す構成図である。
図６は、個体関連情報ＤＢに記録されたデータの一例を示す構成図である。
図７は、個人用コンピュータの構成を概略的に示す概略構成図である。
図８は、ゲノム関連情報記録媒体に記録されたデータの一例を示す構成図である。
図９は、個体関連情報とゲノム関連情報とを関連連付ける情報処理システムにおいて、統計解析用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図１０は、個体関連情報収集画面の一例として示す画面イメージである。
図１１は、ゲノム関連情報ＤＢの全データから、多型番地における各多型パターンの出現頻度を算出したデータの一例を示す構成図である。
図１２は、ゲノム関連情報ＤＢと個体関連情報ＤＢとを用いて、個体関連情報について多型番地毎の各多型パターンの出現頻度を算出したデータの一例を示す構成図である。
図１３は、図１１及び図１２に示したデータから、個体関連情報について多型番地毎の各多型パターンの割合値を算出したデータの一例を示す構成図である。
図１４は、図１３に示したデータから、個体関連情報について多型番地毎の各多型パターンの相対値を算出したデータの一例を示す構成図である。
図１５は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図１６は、図１５の続きであり、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図１７は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの他の処理を示すフローチャートである。
図１８は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの更に他の処理を示すフローチャートである。

符号の説明

１…通信回線網、２…共用コンピュータ、３…個人用コンピュータ、ＳＴ…統計解析用コンピュータ

以下、図面を参照して本発明を詳細に説明する。
本発明を適用した実施の形態として、利用者に対して所定の疾病の罹患可能性等の意味情報を提供する情報処理システムにおいて、当該意味情報を創出するシステムについて説明する。すなわち、情報処理システムは、利用者に対して提供する罹患可能性等の意味情報を、個体に関する情報（以下、個体関連情報）から創出するシステムである。
以下の説明においては、個体関連情報から意味情報を創出する情報処理システムについて説明するが、説明の都合上、簡略化したモデルとして説明する。情報処理システムは、図１に示すように、インターネット等の通信回線網１と、通信回線網１に接続された共用コンピュータ２と、通信回線網１に接続された少なくとも１以上の個人用コンピュータ３と、通信回線網１に接続された統計解析用コンピュータＳＴとを備え、通信回線網１を介して共用コンピュータ２と個人用コンピュータ３と統計解析用コンピュータＳＴとの間のデータ通信を可能としている。
共用コンピュータ２は、図２に示すように、当該共用コンピュータ２の動作を全て制御するＣＰＵ４と、情報及びプログラムの実行指示等を入力できるキーボード及びマウス等の入力装置５と、ディスプレイ装置等の表示装置６と、一時的な情報及び書き換え不可能な情報等が記録されるメモリー７と、各種データを格納しているデータベース８と、これらメモリー７及びデータベース８に対して所定の情報を書き込む記録装置９と、通信回線網１を介して個人用コンピュータ３との間で情報の送受信を行う送受信装置１７とから構成されている。
共用コンピュータ２におけるメモリー７は、それぞれ異なる種類の情報を記録するメモリー部Ａ１０及びメモリー部Ｂ１１と、例えば個人用コンピュータ３や表示装置６に表示させる画像データを記録した画面メモリー１２と、本システムを動作させるための処理プログラム１３とから構成されている。なお、共用コンピュータ２においては、画面メモリー１２及び処理プログラム１３等を内部のメモリー７に有さず、通信回線網１を介して共用コンピュータ２と接続された外部記憶装置（図示せず）に有するものであってもよい。
共用コンピュータ２におけるデータベース８（記憶装置）は、多型番地、多型パターン及び意味情報が記録されたメインＤＢ１４と、メモリー部Ａ１０に記録された情報を保存する保管用ＤＢ−Ａ１５と、メモリー部Ｂ１１に記録された情報を保存する保管用ＤＢ−Ｂ１６とから構成されている。メインＤＢ１４は、図３に示すように、多型番地と、当該多型番地で取りうる複数の多型パターンと、当該複数の多型パターンそれぞれを意味づける意味情報とが関連付けられて記録されている。また、メインＤＢ１４には、複数の多型番地における多型パターンの組合せ（例えば、ハプロタイプ）を意味づける意味情報が記録されていても良い。
ここで、「多型番地（位置情報）」とは、少なくとも、塩基配列における多型が存在する位置を意味する。なお、一般的に多型とは、例えば、いわゆるＳＮＰ（ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍ）、ＲＦＬＰ（ｒｅｓｔｒｉｃｔｉｏｎｆｒａｇｍｅｎｔｌｅｎｇｔｈｏｆｐｏｌｙｍｏｒｐｈｉｓｍ）、ＶＮＴＲ（ｖａｒｉａｂｌｅｎｕｍｂｅｒｏｆｔａｎｄｅｍｒｅｐｅａｔ）、マイクロサテライト等を含んでいる。しかし、本明細書において使用する「多型」は、これらに限定されず、個体種中１％未満の頻度でしか存在しない塩基及び塩基配列の変化（バリエーション）も含む意味とする。したがって、「多型番地」は、個体種中１％未満の頻度でしか存在しない塩基及び塩基配列の変化を示す、塩基配列における位置も含む意味である。すなわち、「多型番地」とは、数値、文字及び記号等を組み合わせて、多型等を示す位置を表すものである。多型番地は、特に限定されないが、例えば、染色体番号と多型が存在する遺伝子を表す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせにより表記することもできるし、多型が存在する遺伝子を示す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせであってもよい。
また、多型番地は、多型毎に付与される多型固有の表記であっても良い。多型番地として多型固有の表記を使用する場合、多型番地は塩基配列中の位置を直接的には示さないが、多型固有の表記に基づいて間接的に位置を知ることができる。したがって、「多型番地」は、多型固有の表記も含む意味である。
「多型パターン（塩基配列関連情報）」とは、個体間において相違する塩基配列の情報であり、少なくとも、多型における塩基又は塩基配列のパターンを含む意味である。さらに「多型パターン」は、多型に限らず、個体種中１％未満の頻度でしか存在しない塩基及び塩基配列のパターンも含む意味である。
例えば、Ａ又はＧを取ることが知られている多型番地において、「多型パターン」は、「Ａ」及び「Ｇ」のいずれかで表される。また、「多型パターン」は、相同染色体におけるヘテロ接合体又はホモ接合体を示すものであってもよい。この場合、例えば、Ａ又はＧを取ることが知られている多型番地において、「多型パターン」は、「ＡＡ」、「ＧＧ」及び「ＡＧ」のいずれかで表現できる。さらに、「多型パターン」は、所定の多型番地で取りうるパターンを直接的に表記するものではなく、間接的に表記するものであっても良い。すなわち、「多型パターン」は、例えば、Ａ又はＧを取ることが知られている多型番地において「Ａ」を取る場合に「アレル１」とし、「Ｇ」を取る場合に「アレル２」と表記してもよい。また、「多型パターン」が上述したように「ＡＡ」、「ＧＧ」及び「ＡＧ」のいずれかで表現できる場合、例えば、「ＡＡ」で表現できるときに「α」、「ＧＧ」で表現できるときに「β」、「ＡＧ」で表現できるときに「γ」と表記してもよい。その他「多型パターン」の表記例としては、多型がマイクロサテライトの場合には「繰り返し数」を表す数値で、多型が挿入、欠失型の場合には「有／無」を表す記号で表記してもよい。
また更に、各多型番地における「多型パターン」は、所定の規則や取り決めに従って、例えば、「多型１」、「多型２」、「多型３」等と表記されても良い。例えば、各多型番地において、「多型パターン」がとり得る頻度の高い順に、「多型１」、「多型２」、「多型３」と表記できる。この場合、例えば、各多型番地におけるそれぞれの「多型１」は必ずしも同じ内容を表すものではない。すなわち、例えば、ある多型番地の「多型１」は最もとり得る頻度が高い「ＡＡ」を表し、別の多型番地「多型１」は最もとり得る頻度が高い「ＧＧ」を表すことになる。なお、本実施の形態においては、「多型パターン」を「多型１」、「多型２」及び「多型３」等のいずれかで表記する方法を使用している。ところで、本システムにおいては、多型パターンは、暗号化されていても暗号化されていなくても差し支えない。
ここで、「意味情報」とは、「多型パターン」に関連づけられた情報であり、例えば、薬剤に対する応答性、薬剤に対する副作用、疾患及び障害に対するリスク、体質・性質、体質・性質等に基づく生活習慣アドバイス、タンパク質相互作用など、「多型パターン」の相違に起因する様々な情報を意味する。
なお、「意味情報」としては、「多型パターン」の相違に起因する様々な情報を直接表しても良く、また、当該情報を意味する記号などを用いて間接的に表しても良い。「意味情報」は、ゲノム・遺伝子に関する研究が進むことにより種類が増加するとともに訂正が行われる種類の情報であり、常にバージョンアップすることが好ましい。すなわち、「意味情報」は、ゲノム・遺伝子の研究成果を用いてデータベースを更新することによって、蓄積量が増加・減少してより精度の高いものとなる。
なお、直接「多型パターン」には関連づけられていないが「意味情報」から更に導き出される情報は、「意味情報に関連する情報」である。「意味情報」が「疾患に対するリスク」である場合、当該リスクがある一定の水準を超えたときに、例えば特定の「健康診断検査項目」が導き出される。この特定の「健康診断検査項目」が「意味情報に関連する情報」である。
本実施の形態において意味情報は、図３に示すように、少なくとも、所定の「多型番地」及び「多型パターン」に関連づけられた「多型パターンに対する注釈情報」としてメインＤＢ１４に記録されている。また、意味情報には、所定の「多型番地」に対応する「多型分類」及び「分類（疾患名）」等が関連づけられている。すなわち、所定の「多型番地」が所定の「多型パターン」である場合、疾患名の種類と当該疾患に対する罹患可能性を示す注釈情報（意味情報）を得ることができる。したがって、例えば、意味情報は、複数の多型番地に対応するそれぞれの多型パターンの組み合わせ（例えば、ハプロタイプ）に対して関連付けることもできる。すなわち、複数の多型番地における多型パターンの組み合わせ毎に、所定の疾患に対する異なる罹患可能性を示す注釈情報（意味情報）を関連付けることができる。この場合、複数の多型番地が所定の多型パターンの組み合わせである場合、所定の疾患に対する罹患可能性を示す注釈情報（意味情報）を得ることができる。
また、意味情報には、所定の基準で決定した「公開レベル」を関連づけることもできる。例えば、「公開レベル」を決定する際の基準としては、意味情報、すなわちここでは「分類（疾患名）」の罹患可能性を公開することによる個人に対する不測の不利益等を考慮して定めることができる。詳細には、共用コンピュータ２において、法律、規則又は自らの行動基準若しくは利用者との契約等に鑑みて、公開することが相応しくない意味情報については、公開しないような「公開レベル」を決定することができる。この場合、本システムでは、公開不可を意味する「公開レベル」に関連付けられた罹患可能性を示す注釈情報については、利用者に対して開示することはない。これにより、利用者に対して不測の不利益となりうる意味情報を与えることや、契約者以外に意味情報が開示されることを防止できる。
なお、利用者がインフォームドコンセント等により、所定の「公開レベル」を関連づけた意味情報の開示を容認することにより、利用者に対して、所定の「公開レベル」が関連づけられた意味情報を公開するようなシステムであってもよい。
また、「公開レベル」は、例えば「１，２，３、…」又は「ａ，ｂ，ｃ，…」といった３以上の複数の段階として設定することができる。この場合、共用コンピュータ２側では、利用者の年齢、資格及び利用者との契約の有無等、利用者の種類に応じてレベルを設定することができる。なお、インフォームドコンセント等によって、所定の公開レベル以上（又は未満）の公開レベルに関連付けられた罹患可能性を示す注釈情報のみが利用者側に対して提供されるように、当該利用者側が公開レベルを選択することもできる。
なお、データベース８において、保管用ＤＢ−Ｂ１６には、例えば、本システムを利用する要求者個人の遺伝情報である塩基配列関連情報といったデータを記録することができる。また、保管用ＤＢ−Ａ１５には、例えば、本システムを利用する要求者を特定する情報といったデータを記録することができる。このように、保管用ＤＢ−Ａ１５及び保管用ＤＢ−Ｂ１６に、個人の遺伝情報と個人を特定する情報とを分けて記録することによって、要求者の遺伝情報と、要求者を特定するデータとを関連付け難くなる。
なお、共用コンピュータ２は、データベース８を内部に有するものに限定されず、通信回線網１を介して共用コンピュータ２に接続された外部データベース（図示せず）を有するものであってもよい。また、共用コンピュータ２は、内部に複数のデータベース８を有するものであってもよいし、内部のデータベース８と通信回線網１を介して共用コンピュータ２に接続された外部データベースとを有するものであっても良い。
統計解析用コンピュータＳＴは、図４に示すように、当該統計解析用コンピュータＳＴの動作を全て制御するＣＰＵ３０と、情報及びプログラムの実行指示等を入力できるキーボード、マウス等の入力装置３１と、ディスプレイ装置等の表示装置３２と、一時的な情報及び書換え可能な情報や書換え不可能な情報等が記録されるメモリー３３と、各種データを格納しているデータベース３４と、これらメモリー３３及びデータベース３４に対して所定の情報を書き込む記録装置３５と、通信回線網１を介して共用コンピュータ２及び個人用コンピュータ３との間で情報の送受信を行う送受信装置３６とから構成されている。
統計解析用コンピュータＳＴにおけるメモリー３３は、個人用コンピュータ３から送られた多型パターン等を一時的に記録したり、統計解析結果等を記録するメモリー部３７と、例えば個人用コンピュータ３や共用コンピュータ２や表示装置３２に表示させる画像データを記録した画面メモリー３８と、本システムを動作させ、複数の個人（個体）に関する「個体関連情報」と複数の個人（個体）に関する「ゲノム関連情報」とを用いて、例えば、所定の疾患に対する罹患可能性を示す注釈情報といった意味情報を創出する処理プログラム３９とが記録されている。なお、当該処理プログラム３９によれば、先ず、複数の個人（個体）に関する「ゲノム関連情報」と複数の個人（個体）に関する「個体関連情報」とを集積した後、当該「ゲノム関連情報」と当該「個体関連情報」とを用いて統計的に処理することで、所定の疾患に対する罹患可能性を示す注釈情報（意味情報）等を得ることができる。なお、統計解析用コンピュータＳＴにおいては、処理プログラム３９やメモリー部３７を内部のメモリー３３に有さず、通信回線網１を介して統計解析用コンピュータＳＴに接続された外部記憶装置（図示せず）に有するものであっても良い。
ここで、「個体関連情報」とは、個体の性質、心理的状態、体質、体調、健康状態、病歴、生活習慣、行動・思考パターン、癖及び嗜好等、所定の個体に関するあらゆる情報が含まれる。例えば、個体関連情報としては、予め準備された質問等に対して利用者等の個人（個体）が回答することから得られる情報、或いは、例えば、利用者等が医療機関や検査機関等で検査を受けることによって得られる情報を挙げることができる。
また、「ゲノム関連情報」とは、所定の個体に関する複数の「多型パターン」をそれぞれ所定の「多型番地」に関連付けたデータの群（塩基配列関連情報群）である。
統計解析用コンピュータＳＴにおけるデータベース３４（記憶装置）は、複数の個人（個体）に関する「ゲノム関連情報」を各個人（個体）毎に記録した「ゲノム関連情報ＤＢ４０」（図５に示す）を有している。なお、「ゲノム関連情報ＤＢ４０」に記録された「ゲノム関連情報」は、直接個人（個体）を特定する情報と結びつかないように匿名化されていることが望ましい。
また、データベース３４は、個人用コンピュータ３より受信した「個体関連情報」を各個人（個体）毎に記録した「個体関連情報ＤＢ４１」（図６に示す）を有している。なお、「個体関連情報ＤＢ４１」に記録された「個体関連情報」は、直接個人（個体）を特定する情報と結びつかないように匿名化されていることが望ましい。
なお、統計解析用コンピュータＳＴは、前記データベース３４を内部に有するものに限定されず、通信回線網１を介して統計解析用コンピュータＳＴに接続された外部データベース（図示せず）に対してアクセスするものであっても良い。
個人用コンピュータ３は、図７に示すように、当該個人用コンピュータ３の動作を全て制御するＣＰＵ２０と、情報及びプログラムの実行指示等を入力できるキーボード及びマウス等の入力装置２１と、ディスプレイ装置等の表示装置２２と、一時的な情報及び書き換え可能な情報等が記録されるメモリー２３と、ゲノム関連情報記録媒体２４からデータを読み取る読取り装置２５と、通信回線網１を介して共用コンピュータ２との間で情報の送受信を行う送受信装置２９とから構成されている。なお、個人用コンピュータ３は、通常のコンピュータに限定されず、例えば、携帯電話、個人携帯端末及びその他の移動体通信機器等、いかなる形態であってもよい。
個人用コンピュータ３におけるメモリー２３は、ゲノム関連情報記録媒体２４からの情報等を記録するメモリー部２６を有し、本情報処理システムを動作させる処理プログラム２７が記録されている。
ゲノム関連情報記録媒体２４には、個人のゲノム関連情報２８が記録されている。ゲノム関連情報記録媒体２４としては、例えば、磁気ディスクや磁気カード等の磁気記録媒体、光磁気記録方式や相変化記録方式等を適用した光学式記録媒体、半導体メモリー等を挙げることができる。また、このゲノム関連情報記録媒体２４は、カード状、ディスク状、スティック状、テープ状又はドラム状等いかなる形態であってもよい。さらに、このゲノム関連情報記録媒体２４は、単一の個人（個体）のゲノム関連情報２８を記録したものであってもよいが、複数の個人（個体）に関する複数のゲノム関連情報２８を記録したものであってもよい。
ゲノム関連情報記録媒体２４に含まれるゲノム関連情報２８とは、少なくとも、「多型番地」及び個人（個体）の塩基配列を解析した結果として得られる所定の多型番地における「多型パターン」を意味する。また、ゲノム関連情報２８には、既往症、特徴、カルテ情報、健康診断結果といった各種情報を含んでいてもよい。
ゲノム関連情報記録媒体２４には、ゲノム関連情報２８として、例えば、図８に示すように、データＩとしてゲノム関連情報２８に固有の個別番号「Ｇｎｏ．」（ジーナンバー）及び生年月日等の個人情報を記録し、データＩＩとして多型番地及び多型パターンを記録し、データＩＩＩとして既往症を記録し、データＩＶとして特徴を記録し、データＶとしてカルテ情報等を記録する。すなわち、ゲノム関連情報２８は、データＩ、データＩＩ、データＩＩＩ、データＩＶ及びデータＶから構成されている。データＩ及びデータＩＩには必須の情報が含まれており、データＩＩＩ、データＩＶ及びデータＶには付加的な情報から構成されている。
ゲノム関連情報２８においては、塩基配列上の位置に対応する「多型番地」と、当該多型番地における「多型パターン」とをリンクさせて記録している。また、データＩＩには、所定の多型番地における付加的な情報を「コメント」として、「多型番地」にリンクさせて記録していてもよい。なお、データＩＩには、所定の個体に関する全塩基配列を記録しても良い。データＩＩに全塩基配列を記録した場合であっても、データＩＩ内に「多型番地」及び「多型パターン」が含まれることとなる。
なお、本発明において、個人用コンピュータ３及びゲノム関連情報記録媒体２４は、それぞれ図７及び図８に示したような構成に限定されず、例えば、ゲノム関連情報記録媒体が処理プログラムを有するメモリー部を備え、個人用コンピュータが当該ゲノム関連情報記録媒体を装着して処理プログラムを動作させるような構成であってもよい。この場合、個人用コンピュータは、ゲノム関連情報記録媒体のメモリー部に記録された処理プログラムに従って動作できる。
以上のように構成された情報処理システムにおいては、統計解析用コンピュータＳＴのメモリー３３が有する処理プログラム３９及び個人用コンピュータ３のメモリー２３に記録された処理プログラム２７が例えば、図９に示すようなフローチャートに従って情報処理動作する。なお、図９に示すフローチャートにおいて、「（統）」と記載したステップは統計解析用コンピュータＳＴにおける処理を意味し、「（個）」と記載したステップは個人用コンピュータ３における処理を意味している。
本情報処理システムは、ゲノム関連情報記録媒体２４を所持する各個人が個人用コンピュータ３を用いて通信回線網１を介して統計解析用コンピュータＳＴにアクセスし、各個人（個体）に関する「個体関連情報」を統計解析用コンピュータＳＴの「個体関連情報ＤＢ４１」に、「ゲノム関連情報ＤＢ４０」の中のゲノム関連情報と関連付けて登録するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報２８がそれぞれ記録されたゲノム関連情報記録媒体２４を用い、各個人がゲノム関連情報記録媒体２４にアクセスするようなシステムであってもよい。
このとき、先ず要求者は、ステップ１（Ｓ１）で、通信回線網１を介して統計解析用コンピュータＳＴにアクセスし、統計解析用コンピュータＳＴに対して個体関連情報の登録を行う旨の意思表示を行う。ステップ１では、統計解析用コンピュータＳＴが提供するウェブページにアクセスして前記意思表示を行っても良いし、統計解析用コンピュータＳＴに対して電子メール等を用いてアクセスして前記意思表示を行っても良い。なお、本例においては、要求者が自らの個体関連情報を登録する場合について述べるが、これに限定されず、要求者が自分以外の個人（個体）に関する個体関連情報を登録することもできる。
次に、統計解析用コンピュータＳＴは、前記意思表示を個人用コンピュータ３から受信した後、ステップ２（Ｓ２）で、画面メモリー３８から、図１０に示すような「個体関連情報収集画面」を読み出し、個人用コンピュータ３の表示装置２２に表示する。ステップ２では、統計解析用コンピュータＳＴが提供するウェブページに個人用コンピュータ３がアクセスした状態で個体関連情報収集画面を表示しても良いし、個人用コンピュータ３に対して送信した個体関連情報収集画面データに基づいて個人用コンピュータ３の表示装置２２に表示しても良い。
次に、個人用コンピュータ３は、ステップ３（Ｓ３）で、個体関連情報収集画面に従って、要求者自身の個体関連情報を入力する。すなわち、要求者は、個体関連情報収集画面に表示されている設問に対して回答し、当該個体関連情報収集画面に回答内容を入力する。或いは、要求者は、個体関連情報収集画面に表示されている設問に対する回答を、当該個体関連情報収集画面とは異なる回答用画面に入力しても良い。また、ステップ３では、個体関連情報として利用者（要求者）等が医療機関や検査機関等で検査を受けることによって得た情報を入力しても良い。
次に、個人用コンピュータ３は、ステップ４（Ｓ４）で、個体関連情報収集画面に表示されている設問に対する回答（個体関連情報）を統計解析用コンピュータＳＴに対して送信する。ステップ４では、回答を入力した個体関連情報収集画面データ又は回答を入力した回答用画面データを、通信回線網１を介して送信することで前記設問に対する回答を統計解析用コンピュータＳＴに対して送信することができる。また、ステップ４では、個体関連情報として利用者（要求者）等が医療機関や検査機関等で検査を受けることによって得た情報を統計解析用コンピュータＳＴに対して送信することもできる。
次に、統計解析用コンピュータＳＴは、個人用コンピュータ３から個体関連情報を受信した後、ステップ５（Ｓ５）で、個人用コンピュータ３に対して、複数の多型番地を送信する。ステップ５で送信する複数の多型番地は、既定の多型番地であっても良いし、ランダムに選択した多型番地であっても良い。
次に、個人用コンピュータ３は、統計解析用コンピュータＳＴから複数の多型番地を受信した後、ステップ６（Ｓ６）で、読取り装置２５を駆動してゲノム関連情報記録媒体２４にアクセスする。次に、個人用コンピュータ３は、ステップ７（Ｓ７）で、統計解析用コンピュータＳＴより受信した複数の多型番地について、それぞれ対応する多型パターンを読み出す。そして、個人用コンピュータ３は、ステップ８（Ｓ８）で、ステップ７で読み出した多型パターンを対応する多型番地と関連付けて統計解析用コンピュータＳＴに対して送信する。すなわち、ステップ８では、統計解析用コンピュータＳＴより受信した複数の多型番地それぞれについて、対応する多型パターンを関連付けて送信する。なお、ステップ８で個人用コンピュータ３から統計解析用コンピュータＳＴに送信する際には、「Ｇｎｏ．」のような個人（個体）を特定しうる情報を送信しないことが望ましい。
ところで、本実施の形態では、ステップ５で統計解析用コンピュータＳＴが送信した多型番地を個人用コンピュータ３で受信し、受信した多型番地に対応する多型パターンをステップ８で個人用コンピュータ３が統計解析用コンピュータＳＴに対して送信している。しかしながら、これに限定されず、例えばステップ４において、個人用コンピュータ３が統計解析用コンピュータＳＴに対して「個体関連情報」を送信するとともに、既定の多型番地と当該多型番地に対応する多型パターンとを自発的に統計解析用コンピュータＳＴに対して送信してもよい。この場合は、上述したステップ５〜８までは行われず、ステップ４の後に以下のステップ９以降のステップを同様に行うことになる。
次に、統計解析用コンピュータＳＴは、個人用コンピュータ３から多型番地及び多型パターンを受信した後、ステップ９（Ｓ９）で、ゲノム関連情報ＤＢ４０にアクセスする。なお、ステップ９では、統計解析用コンピュータＳＴがゲノム関連情報ＤＢ４０を有さず、外部の機関がゲノム関連情報ＤＢ４０を有する場合には、通信回線網１を介して当該外部の機関が有するゲノム関連情報ＤＢ４０にアクセスする。
次に、統計解析用コンピュータＳＴは、ステップ１０（Ｓ１０）で、個人用コンピュータ３より受信した複数の多型番地及び多型パターンの組合せに基づいてゲノム関連情報ＤＢ４０を検索し、ゲノム関連情報ＤＢ４０に格納されたゲノム関連情報の中から、受信した複数の多型番地及び多型パターンの組合せを有する個人（個体）に関するゲノム関連情報を特定する。言い換えると、ステップ１０では、ゲノム関連情報ＤＢ４０に登録された複数の個人（個体）に関する複数のゲノム関連情報の中から要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報を特定する。ステップ１０では、例えば、特定した要求者、すなわち個人（個体）に関するゲノム関連情報に対して「整理Ｎｏ．」を付与してもよい。或いは、ステップ１０では、ゲノム関連情報ＤＢ４０に登録している個人（個体）に関するゲノム関連情報に対して予め付与された「整理Ｎｏ．」を抽出しても良い。
次に、統計解析用コンピュータＳＴでは、ステップ１１（Ｓ１１）で、ステップ１０で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報と、個人用コンピュータ３より受信した個体関連情報とを関連付ける。具体的には、ステップ１０で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報に付与した「整理Ｎｏ．」、又はステップ１０で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報について抽出した「整理Ｎｏ．」を、個体関連情報に関連付けて格納した、図６に示すような「個体関連情報ＤＢ４１」を作成する。
或いは、ステップ１０では、統計解析用コンピュータＳＴがゲノム関連情報ＤＢ４０を有する場合には、ゲノム関連情報ＤＢ４０に格納されている要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報に対して、個人用コンピュータ３より受信した個体関連情報を直接関連付けて格納しても良い。
以上、図９に示すフローチャートに従えば、例えば所定の要求者について、当該要求者に関する個体関連情報を、当該要求者に関するゲノム関連情報に関連付けて統計解析用コンピュータＳＴに登録することができる。また、複数の要求者が図９に示すフローチャートに従ってそれぞれ個体関連情報を登録することによって、統計解析用コンピュータＳＴは、複数の個人（個体）に関する個体関連情報を有することとなる。言い換えると、統計解析用コンピュータＳＴは、複数の個体に関するゲノム関連情報についてそれぞれ個体関連情報を関連付けて格納したデータベースを作成することができる。
以上のように、本システムによれば、統計解析用コンピュータＳＴの「ゲノム関連情報ＤＢ４０」に、予め匿名化して記録しておいたゲノム関連情報に対して、後から匿名化した個体関連情報を統計解析用コンピュータＳＴに送信した場合であっても、当該ゲノム関連情報と当該個体関連情報とをリンクさせることができる。
なお、図９に示したフローチャートにおいては、統計解析用コンピュータＳＴは、ステップ５で送信した複数の多型番地について、個人用コンピュータ３より多型パターンを受信し、ステップ１０でゲノム関連情報ＤＢ４０を検索することによって要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報を特定している。しかしながら、本情報処理システムにおいては、要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報の特定に際してこの方法に限定されず、例えば、所定の「多型番地」及び「多型パターン」の組合せを、順次個人用コンピュータ３から統計解析用コンピュータＳＴに対して送信し、統計解析用コンピュータＳＴが要求者の特定を行っても良い。この場合、個人用コンピュータ３から所定の「多型番地」及び「多型パターン」の組合せを統計解析用コンピュータＳＴに対して順次自発的に送信しても良いし、統計解析用コンピュータＳＴから所定の「多型番地」に対応する「多型パターン」の提出を個人用コンピュータ３に対して順次要求し、個人用コンピュータ３が当該要求に対応した「多型パターン」を「多型番地」に関連付けて順次送信しても良い。
詳細には、統計解析用コンピュータＳＴは、要求者に関する１又は複数の「多型番地」及び「多型パターン」の組合せを受け取るステップと、受け取った「多型番地」及び「多型パターン」の組合せと一致する「多型番地」及び「多型パターン」の組合せを有する個体に関するゲノム関連情報をゲノム関連情報ＤＢ４０から検索するステップとを、検索の結果として１の個人（個体）に関するゲノム関連情報を要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報として特定するまで繰り返すことで、ゲノム関連情報ＤＢ４０に含まれる所定の個人（個体）に関するゲノム関連情報を要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報として特定することができる。
一方、統計解析用コンピュータＳＴは、複数の個体に関する複数の個体関連情報を、それぞれゲノム関連情報ＤＢ４０に含まれるゲノム関連情報と関連付けて格納した個体関連情報ＤＢ４１を用いて、当該複数の個体関連情報と当該複数のゲノム関連情報とを統計的に処理して、塩基配列関連情報を意味づける意味情報及び／又は当該意味情報に関連する情報を創出することができる。
ここで統計的処理としては、遺伝統計学的手法として知られている手法を適用した処理を意味し、従来知られている各種プログラム及びアルゴリズムを適用して行うことができる。
以下に一例を示す。まず、ゲノム関連情報ＤＢ４０のその時点における全データ（全「整理Ｎｏ．」に関連付けられた全データ）から、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図１１に示すように、行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図１１では、多型番地「０００００１」における多型パターン「多型１」の出現頻度は１００人中５０人であることを表している。
次に、ゲノム関連情報ＤＢ４０と個体関連情報ＤＢ４１とを用いて、所定の個体関連情報に関して、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。
具体的には、個体関連情報ＤＢ４１から、例えば、「嗜好ａ（例：赤色よりも青色の方が好きだ）」について該当する（結果欄に「○」が付いている）「整理Ｎｏ．」だけを抽出した上で、ゲノム関連情報４０から前記抽出した「整理Ｎｏ．」を検索し、検索したデータのなかから、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図１２に示すように、個体関連情報毎（「嗜好」毎）に行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図１２では、「嗜好ａ」について該当する場合に、多型番地「０００００１」における多型パターン「多型１」の出現頻度は５０人中４５人であることを表している。
次に、図１１に示した出現頻度及び図１２に示した出現頻度の結果を用いて、所定の個体関連情報に該当するか否かに関わらず算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度（図１１）と、所定の個体関連情報に該当する場合に限って算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度（図１２）とを、互いに比較し相対的な値を求める。
具体的には、例えば、図１２に示した出現頻度の結果として、「嗜好ａ」について該当する場合における、多型番地「０００００１」における多型パターン「多型１」の出現頻度は５０人中４５人と表される当該４５人という値を、図１１に示した出現頻度の結果を表す、ゲノム関連情報ＤＢ４０のその時点における全データ（全「整理Ｎｏ．」に関連付けられた全データ）における多型番地「０００００１」における多型パターン「多型１」の出現頻度１００人中５０人の当該５０人で除した割合値（９０％）を、前記相対的な値として求める。同様に、多型番地「０００００１」における多型パターン「多型２」の場合の割合値（１２％）、多型番地「０００００１」における多型パターン「多型３」の場合の割合値（８％）を求める。その結果は、例えば、図１３に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の割合値を並べて示されるマトリックスとして表される。
このときに、もし「嗜好ａ」が多型番地「０００００１」における多型パターンの相違による影響を全く受けないのであれば、上記算出した割合値（相対的な値）は、「多型１」、「多型２」、「多型３」のいずれにおいても同程度の値を示すはずである。この傾向は、図１１及び図１２に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。
なお、図１３に示した結果を求める際には、図１１に示した出現頻度を用いる代わりに、例えば、統計解析用コンピュータＳＴ以外の外部機関が算出（統計的に処理）した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を示すデータ又は当該出現頻度を算出するための元データを用いても良い。この場合は、前記外部機関が当該出現頻度を求める際に基にしたゲノム関連情報に関連する個体の中に、個体関連情報ＤＢ４１に含まれる個体関連情報に関連する個体が含まれていても含まれていなくても良い。
次に、図１３に示した割合値を用いて、各多型番地毎に、当該多型番地において取りうる各多型パターンの相対値を算出する。具体的には、図１３に示した結果では、例えば、「嗜好ａ」において、多型番地「０００００１」の多型パターン「多型１」における割合値は９０％、多型パターン「多型２」における割合値は１２％、多型パターン「多型３」における割合値は８％と表されるが、そのうち最小の割合値を示す多型パターン（「多型３」）の割合値（８％）を基準にして、各多型パターンにおける割合値を「多型３」の割合値（８％）で除す。すなわち多型パターン「多型１」の相対値は１１．２５（＝９０／８）、「多型２」の相対値は１．５（＝１２／８）、「多型３」の相対値は１．０（＝８／８）となり、最小の割合値を示す「多型３」の割合値を基準にした倍率として、各多型パターンの相対値を求める。その結果として、例えば図１４に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の相対値を並べて示されるマトリックスとして表される。
このとき、もし「嗜好ａ」が多型番地「０００００１」における多型パターンの相違による影響を全く受けないのであれば、上記算出した倍率（相対値）は、「多型１」、「多型２」、「多型３」のいずれにおいても１．０に近い値を示すはずである。この傾向は、図１１及び図１２に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。
次に、図１４に示した結果に基づいて、相対値が所定の値を超えた場合に、当該相対値を示す多型番地における多型パターンの相違が、所定の個体関連情報に（該当するか否かに）関係していると判断する。具体的には、例えば、図１４に示した結果において、倍率（相対値）が閾値を超えた場合に、当該倍率を示す多型番地とその倍率とを抽出し、出力する。なお、当該閾値は、例えば、図１４に示した、所定の個体関連情報に該当する場合の全ての相対値を概観したうえで、統計的に算出することができる。
なお、図１４に示した相対値の算出方法によっては、相対値が所定の値を下回った場合に当該相対値の多型番地における多型パターンの相違が、所定の個体関連情報に（該当するか否かに）関係していると判断してもよい。
また、抽出した倍率（相対値）が相対的に大きいほど、当該抽出した倍率を示す多型番地における多型パターンの相違が、所定の個体関連情報に（該当するか否かにおいて）より強く関係していると推定できる。すなわち、所定の個体関連情報に（該当するか否かにおいて）先天的（遺伝的）要素が強いと推定される。
さらにまた、図１１及び図１２に示した出現頻度から図１４に示した結果を得るまでの処理を、複数の個体関連情報について同時に並行して行った場合には、それぞれの個体関連情報について抽出された、それぞれの多型番地とその倍率（相対値）との傾向から、どの個体関連情報とどの個体関連情報とが互いに関連性があるのかが推定できる。
以上のように、図１１及び図１２に示した出現頻度から図１４に示した結果を得て、当該結果から判断を導くまでの処理を行うことにより、今まで先天的（遺伝的）影響との関連性が希薄と思われていた個体関連情報についても遺伝的影響を受けているか否かを調べることができる。すなわち、各人（個体）より入手する様々な種類の個体関連情報を用いることにより、従来、先天的（遺伝的）影響との関連性が希薄と思われた個体の性質等と遺伝との関連性を推定することができる。
また、図１１及び図１２に示した出現頻度から図１４に示した結果を得て、当該結果から判断を導くまでの処理は、所定の個体関連情報（属性）に該当するか否かに拘わらず算出した多型パターン毎の出現頻度を母数（図１１）にしているので、個体関連情報（属性）がどれだけ遺伝の影響を受けているかを定量的に表すことに向いている。これに対して、通常行われる相関解析の方法では、個体関連情報（属性）に該当する集団と該当しない集団とを比較しているので、個体関連情報（属性）が人の性格のように遺伝による影響が比較的少ないと思われるものの場合に遺伝的影響の度合いを表すのが困難となる。すなわち、人の性格のような個体関連情報（属性）の場合、個々人の“かくありたい”という願望などが起因して当該個体関連情報（属性）に該当しているか否かを判断すること自体が難しいため、母数に誤りが含まれることがあり正確に比較することが難しくなるからである。
なお、図１４に示した結果において、倍率（相対値）が閾値を超えた場合に当該倍率を示す多型番地とその倍率とを抽出する際に、図１１、図１２及び図１３に示した出現頻度や割合値及びそれらの算出根拠となった元の数値も抽出して併せて出力することが望ましい。この場合、図１１、図１２及び図１３に示した出現頻度や割合値及びそれらの算出根拠となった元の数値を、図１４に示した結果を使用する側で、データの信憑性を判断する材料として使用することができる。
その後、統計解析用コンピュータＳＴは、図１４に示した結果から抽出した多型番地とその倍率及び／又は併せて抽出した算出根拠となる元の数値を用いることにより、所定の個体関連情報と所定の多型番地との相関関係及び多型パターンの種類による所定の個体関連情報への影響の差異という知見を得ることができる。そして統計解析用コンピュータＳＴは、得た知見を基に意味情報及び／又は当該意味情報に関連する情報を創出することができる。例えば、図１４に示した結果から抽出した「倍率」は、そのまま意味情報として使用することが可能である。
なお、統計解析用コンピュータＳＴは、図１４に示した倍率（相対値）の算出結果及び／又は図１４に示した算出結果から導かれた知見に基づいて創出した意味情報及び／又は当該意味情報に関連する情報を、逐次記録したデータベース（以下、参照用ＤＢと称す）を構築することができる。
また、所定の個体関連情報（性質）に関して所定の多型番地との相関関係が見いだせない場合であっても、以下のようにして、１又は複数の他の個体関連情報（性質）との組合せと所定の多型番地との相関関係を見いだすことができる。
例えば、「多汗症である」という個体関連情報（性質）と相関関係がある多型番地が見いだせなかったとする。また、「多汗症である」性質に関連性がある性質、例えば「よく水分を摂取する」性質及び「塩辛いものを好む」性質については、それぞれ「多型番地０００００１」及び「多型番地０００１０１」に相関関係が見いだされたとする。ここで、所定の性質と他の性質との関連性とは、所定の性質を示す個体が他の性質を示す確率が所定の値、例えば８０％以上であることを意味する。前記関連性は、例えば、所定の性質と他の性質を含むアンケートを実施した集計結果から導き出すことができる。例えば、所定の性質を有すると答えた回答者の中で、他の性質を有すると答えた回答者が８０％以上の場合は、所定の性質と他の性質との間に関連性があるとみなすことができる。
さらに、「よく水分を摂取する」性質を示す個体のうち８０％の個体は、「多型番地０００００１」において「多型１」を有しており、「塩辛いものを好む」性質を示す個体のうち７０％の個体は、「多型番地０００１０１」において「多型２」を有していたとする。
以上の前提条件の基では、「多汗症である」という性質について、「多型番地０００００１」及び「多型番地０００１０１」との間に間接的な相関関係を見いだすことができる。すなわち、「多型番地０００００１」において「多型１」を有し、「多型番地０００１０１」において「多型２」を有する個体のうち、５６％（０．８×０．７＝０．５６）は「多汗症である」性質を示すことが間接的に見いだせる。
以上によって、「多型番地０００００１」において「多型１」を有し、「多型番地０００１０１」において「多型２」を有する場合に、「多汗症である場合が多い（例えば「指数５６」）」という意味情報を創出することができる。さらに、創出した意味情報から、例えば、「生活留意情報」等の当該意味情報に関連する情報を導き出すこともできる。
統計解析用コンピュータＳＴは、以上のようにして、創出した意味情報及び／又は当該意味情報に関連する情報を共用コンピュータ２に提供することができる。共用コンピュータ２は、統計解析用コンピュータＳＴから提供された意味情報に基づいてメインＤＢ１４を構築したり、統計解析用コンピュータＳＴから提供された当該意味情報に関連する情報に基づいて情報提供用データベースを構築することができる。
また、統計解析用コンピュータＳＴは、上述したように創出した意味情報及び／又は当該意味情報に関連する情報等を逐次記録して「参照用ＤＢ」を構築し、当該「参照用ＤＢ」をメインＤＢ１４として使用することによって、自らが共用コンピュータ２として動作することもできる。
共用コンピュータ２は、構築したメインＤＢ１４を用いて、以下のようにして利用者に対して所定の疾病の罹患可能性等の意味情報を提供することができる。すなわち、共用コンピュータ２は、利用者が「物品及び／又はサービスの要求」として、例えば、所定の疾病に関する自分の罹患可能性を教えて欲しいと要求する場合に、当該罹患可能性等の意味情報を提供できる。
なお、本情報処理システムにおいて、「物品及び／又はサービス」としては、所定の疾病の罹患可能性に限定されず、例えば、個人（個体）の体質に適合した医薬品、食品及び嗜好品等の物品や、個人（個体）の体質・性質に適合した情報等のサービスを含む意味である。
共用コンピュータ２が利用者に対して所定の疾病の罹患可能性を提供する情報処理システムにおいては、共用コンピュータ２のメモリー７に記録された処理プログラム１３及び個人用コンピュータ３のメモリー２３に記録された処理プログラム２７が例えば、図１５及び図１６に示すようなフローチャートに従って情報処理動作する。なお、図１５及び図１６に示すフローチャートにおいて、「（共）」と記載したステップは共用コンピュータ２における処理を意味し、「（個）」と記載したステップは個人用コンピュータ３における処理を意味している。
本情報処理システムは、ゲノム関連情報記録媒体２４を所持する各個人が個人用コンピュータ３を用いて通信回線網１を介して共用コンピュータ２にアクセスし、共用コンピュータ２のメインＤＢ１４に記録されている意味情報を利用するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報２８がそれぞれ記録されたゲノム関連情報記録媒体２４を用い、各個人がゲノム関連情報記録媒体２４にアクセスするようなシステムであってもよい。
この場合、先ず、ステップＡ１（ＳＡ１）で、要求者が本システムを利用するにあたり、メモリー２３に記録されている処理プログラム２７を起動する。処理プログラム２７によって、個人用コンピュータ３の読取り装置２５を駆動してゲノム関連情報記録媒体２４にアクセスし、ゲノム関連情報記録媒体２４においてデータＩとして記録されている「Ｇｎｏ．」を読み出す。読み出した「Ｇｎｏ．」は、メモリー部２６に格納する。
次に、ステップＡ２（ＳＡ２）では、処理プログラム２７によって表示装置２２に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ３に入力するとともに、個人用コンピュータ３から通信回線網１を経由して共用コンピュータ２に「大腸がんの罹患可能性」及び「Ｇｎｏ．」を送信する。或いは、個人用コンピュータ３から通信回線網１を経由して共用コンピュータ２に対して、「大腸がんの罹患可能性」及び「Ｇｎｏ．」を書き込む。
次に、ステップＡ３（ＳＡ３）では、共用コンピュータ２が「大腸がんの罹患可能性」及び「Ｇｎｏ．」を受信する。受信した「大腸がんの罹患可能性」及び「Ｇｎｏ．」は、メモリー部Ａ１０に要求情報として格納する。
次に、ステップＡ４（ＳＡ４）では、要求情報を受信すると、メモリー７に記録されている処理プログラム１３を起動してメインＤＢ１４にアクセスする。なお、この処理プログラム１３は、共用コンピュータ２における処理を行うものである。
次に、ステップＡ５（ＳＡ５）では、処理プログラム１３に従って、メインＤＢ１４に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」（大腸がん）と一致するものを抽出する。
ステップＡ６（ＳＡ６）では、メインＤＢ１４に記録されているデータのなかから「大腸がんの罹患可能性」と一致した「分類（疾患名）」（大腸がん）に関連づけられた「多型番地」を読み出す。読み出した「多型番地」は、メモリー部Ａ１０に要求情報に関連づけた位置情報として格納する。すなわち、メモリー部Ａ１０には、所定の「Ｇｎｏ．」に対して「大腸がんの罹患可能性」及び「多型番地」が記録されることとなる。
次に、ステップＡ７（ＳＡ７）では、メモリー部Ａ１０に記録されている「Ｇｎｏ．」及び「多型番地」を個人用コンピュータ３に送信するとともに、送信する「多型番地」に対応する「多型パターン」を提出する命令情報を個人用コンピュータ３に送信する。また、このとき、要求情報の種類によっては、必要に応じて既往症や特徴等の付加的な情報の提出を命令してもよい。
次に、ステップＡ８（ＳＡ８）では、共用コンピュータ２から送信された「Ｇｎｏ．」、「多型番地」及び命令情報を受信する。受信した「Ｇｎｏ．」及び「多型番地」は、メモリー部２６に記録される。
次に、ステップＡ９（ＳＡ９）では、受信した命令情報に従って、ゲノム関連情報記録媒体２４に記録されているデータＩＩにアクセスする。ステップＡ１０（ＳＡ１０）では、処理プログラム２７に従ってゲノム関連情報記録媒体２４に記録されているデータＩＩを検索し、命令された多型番地の多型パターンを読み出し、多型番地と多型パターンとを関連づけてメモリー部２６に記録する。このとき、データＩに対してアクセスし、ステップＡ８で受信した「Ｇｎｏ．」が正しいか否かを確認することが好ましい。また、ステップＡ１０では、多型パターンのほかにデータＩＩＩ、データＩＶ及びデータＶに記録されている付加的な情報も同時に読み出し、必要に応じてメモリー部２６に記録してもよい。
次に、ステップＡ１１（ＳＡ１１）では、メモリー部２６に一時的に記録した多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を、「Ｇｎｏ．」とともに通信回線網１を介して共用コンピュータ２に対して出力する。ステップＡ１２（ＳＡ１２）では、多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を共用コンピュータ２で受信し、受信した多型パターンを多型番地と関連付けてメモリー部Ａ１０に記録する。
また、本例では、ステップＡ７において、共用コンピュータ２が「多型パターン」の提出を命令する命令情報を送出し、ステップＡ１０において、個人用コンピュータ３は命令情報に従って多型パターンをゲノム関連情報記録媒体２４から読み出している。しかしながら、本システムは、ステップＡ７において当該命令情報を送出しないシステムであってもよい。この場合、ステップＡ１０において、個人用コンピュータ３は、処理プログラム２７に従って、ステップＡ８で受信した多型番地に基づいてデータＩＩを検索し、受信した多型番地の多型パターンを読み出す。そして、個人用コンピュータ３は、ステップＡ１１で多型パターン等を共用コンピュータ２に対して出力する。この場合でも、共用コンピュータ２は、ステップＡ１２において、「大腸がんの罹患可能性」と一致した「分類（疾患名）」に関連づけられた「多型番地」の多型パターンを得ることができる。
次に、ステップＡ１３（ＳＡ１３）では、メインＤＢ１４にアクセスし、受信した多型番地及び多型パターンと一致するものを検索する。具体的には、メインＤＢ１４において、一つの多型番地に対して複数の多型パターンが記録されており、受信した多型番地及びその多型パターンがメインＤＢ１４においてどの多型パターンに一致しているのかを検索する。
次に、ステップＡ１４（ＳＡ１４）では、処理プログラム１３に従って、受信した多型パターンと一致した多型パターンに関連づけられている大腸がんに対する罹患可能性を読み出す。すなわち、ステップＡ１４では、要求者が提出した多型番地及び多型パターンに従って、要求者の大腸がんに対する罹患可能性を読み出すことができる。読み出した罹患可能性は、要求者の「Ｇｎｏ．」と関連づけてメモリー部Ａ１０に格納する。このとき、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで格納してもよいし、付加的な情報から得られるその他の情報を要求者の「Ｇｎｏ．」に関連づけて格納しても良い。
次に、ステップＡ１５（ＳＡ１５）では、メモリー部Ａ１０に格納した要求者の「Ｇｎｏ．」及び罹患可能性を意味情報として、通信回線網１を介して個人用コンピュータ３に対して送信する。ステップＡ１６（ＳＡ１６）では、個人用コンピュータ３が要求者の「Ｇｎｏ．」及び罹患可能性（意味情報）を受信する。受信した意味情報は、メモリー部２６に記録される。
次に、ステップＡ１７（ＳＡ１７）では、処理プログラム２７に従って、メモリー部２６に記録された意味情報から大腸がんに対する罹患可能性を表示装置２２に表示する。なお、ステップＡ１５からステップＡ１７の代わりに共用コンピュータ２が処理プログラム１３に従って意味情報を表示する画面を読み出し（作成し）、通信回線網１を経由して個人用コンピュータ３の表示装置２２に表示させることもできる。この場合においても、共用コンピュータ２から個人用コンピュータ３に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体２４に記録したゲノム関連情報２８を用いて大腸がんに対する罹患可能性を得ることができる。
以上のように、本システムにおいては、個人の多型パターンを多型番地と関連づけて記録したゲノム関連情報記録媒体２４を用いることによって、メインＤＢ１４に記録された意味情報を多型番地を介在させて個人が利用することができる。言い換えれば、本システムを利用する個人は、意味情報をゲノム関連情報記録媒体に記録しておく必要はなく、多型番地と多型パターンとを関連づけたゲノム関連情報２８を所有するだけで、様々な意味情報を得ることができる。
特に、意味情報は、上述したように、その種類が増加するとともに訂正が行われるため、メインＤＢ１４を更新することによってより精度が高く、且つ、幅広い情報を含むものとなる。本システムによれば、このような意味情報の増加及び訂正等に追従してメインＤＢ１４を更新することによって、個人が最新の意味情報を利用することができる。
さらに、ゲノム関連情報２８を記録したゲノム関連情報記録媒体２４を用いることによって、利用者は本システムを利用するたび毎にゲノム関連情報を得るための検査をする必要がない。すなわち、利用者は、一旦、ゲノム関連情報記録媒体２４を作製すれば、以降は本システムを利用して最新の意味情報を得ることができる。
ゲノム関連情報２８を記録したゲノム関連情報記録媒体２４を利用者自身が保有する場合、本人のゲノム関連情報２８を外部の機関に委託して保管させる際の不安や当該機関に対する不正アクセスによりゲノム関連情報２８が流出するといった危険性を回避することができる。一方、ゲノム関連情報記録媒体２４に複数の個人に関する複数のゲノム関連情報２８を記録して外部の機関に委託して保管させる場合、個々人がゲノム関連情報記録媒体２４を保有する場合と比較して、ゲノム関連情報記録媒体２４の取り扱いの不手際やゲノム関連情報記録媒体２４の損失といった事態を防止することができる。
特に、この図１５及び図１６に示したフローチャートに従えば、ゲノム関連情報記録媒体２４に記録したゲノム関連情報２８の全てを通信回線網１を介して出力する必要がなく、提出命令を受けた一部のゲノム関連情報２８のみを出力すればよい。したがって、本システムによれば、機密性の高い個人特有の多型番地及び多型パターンの漏洩を防止することができる。
また、この図１５及び図１６に示したフローチャートに従えば、共用コンピュータ２において要求者に提供する意味情報を得ているため、個人用コンピュータ３においてメインＤＢ１４に記録されている情報を取り扱う必要がない。したがって、この図１５及び図１６に示したフローチャートに従えば、個人用コンピュータ３の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができる。さらに、個人用コンピュータ３においてメインＤＢ１４に記録されている情報を取り扱う必要がないため、個人用コンピュータ３の処理プログラム２７を、ゲノム関連情報記録媒体２４を装着するカードドライブ等に併せて規格化しやすくなる。
ところで、本情報処理システムにおいては、共用コンピュータ２のメモリー７に記録された処理プログラム１３及び個人用コンピュータ３のメモリー２３に記録された処理プログラム２７が例えば、図１７に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図１７に示すフローチャートにおいても、「（共）」と記載したステップは共用コンピュータ２における処理を意味し、「（個）」と記載したステップは個人用コンピュータ３における処理を意味している。
ここでは、先ず、ステップＢ１（ＳＢ１）では、要求者が本システムを利用するにあたり、メモリー２３に記録されている処理プログラム２７を起動する。処理プログラム２７によって、個人用コンピュータ３の読取り装置２５を駆動してゲノム関連情報記録媒体２４にアクセスし、ゲノム関連情報記録媒体２４においてデータＩとして記録されている「Ｇｎｏ．」を読み出す。読み出した「Ｇｎｏ．」は、メモリー部２６に格納する。
次に、ステップＢ２（ＳＢ２）では、処理プログラム２７によって表示装置２２に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ３に入力するとともに、個人用コンピュータ３から通信回線網１を経由して共用コンピュータ２に「大腸がんの罹患可能性」及び「Ｇｎｏ．」を送信するとともに、メインＤＢ１４の「分類（疾患名）」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」との提出を要求する。すなわち、要求者は、ステップＢ２において、メインＤＢ１４の「分類（疾患名）」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」とからなる情報を要求する。
次に、ステップＢ３（ＳＢ３）では、共用コンピュータ２が上記要求情報を受信する。共用コンピュータ２は、要求情報を受信すると処理プログラム１３を起動する。そして、ステップＢ４（ＳＢ４）で、処理プログラム１３に従ってメインＤＢ１４にアクセスする。
次に、ステップＢ５（ＳＢ５）では、処理プログラム１３に従って、メインＤＢ１４に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」（大腸がん）と一致するものを抽出する。ステップＢ６（ＳＢ６）では、処理プログラム１３に従って、メインＤＢ１４にアクセスし、「大腸がんの罹患可能性」と一致する「分類（疾患名）」（大腸がん）に関連づけられた「多型番地」、当該多型番地に関連づけられた全ての「多型パターン」及び全ての多型パターンにおける「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部Ａ１０に要求情報に関連づけて格納する。すなわち、メモリー部Ａ１０には、所定の「Ｇｎｏ．」に対して「多型番地」、「多型パターン」及び「罹患可能性」が記録されることとなる。
次に、ステップＢ７（ＳＢ７）では、メモリー部Ａ１０に記録されている「Ｇｎｏ．」、「多型番地」、「多型パターン」及び「罹患可能性」を、通信回線網１を介して個人用コンピュータ３に対して送信する。ステップＢ８（ＳＢ８）では、共用コンピュータ２から送信された「Ｇｎｏ．」、「多型番地」、「多型パターン」及び「罹患可能性」を受信する。受信した「Ｇｎｏ．」、「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部２６に記録される。
次にステップＢ９（ＳＢ９）では、処理プログラム２７に従い、ゲノム関連情報記録媒体２４に記録されているデータＩＩにアクセスする。このとき、ゲノム関連情報記録媒体２４に記録されているデータＩにもアクセスし、受信した「Ｇｎｏ．」が正しいか否かを確認することが好ましい。
次に、ステップＢ１０（ＳＢ１０）では、処理プログラム２７に従って、ゲノム関連情報２８から、受信した「多型番地」と一致する多型番地における多型パターンを抽出する。そして、ステップＢ１０（ＳＢ１０）では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで、抽出した多型パターンと一致するものを検索する。
ステップＢ１１（ＳＢ１１）では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで一致した多型パターンに関連づけられた「罹患可能性」を抽出するとともに、抽出した「罹患可能性」を出力する。これにより、要求者は、大腸がんに対する罹患可能性（意味情報）を得ることができる。このとき、ステップＢ１１では、データＩＩＩ、データＩＶ及びデータＶに記録されている付加的な情報も同時に読み出し、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで出力してもよい。
特に、図１７に示したフローチャートに従えば、ゲノム関連情報記録媒体２４に記録したゲノム関連情報２８を個人用コンピュータ３以外の外部に対して全く出力することがない。すなわち、ゲノム関連情報２８は、ゲノム関連情報記録媒体２４と個人用コンピュータ３との間でのみ、やり取りされる。したがって、本システムによれば、機密性の高い個人特有のゲノム関連情報２８の漏洩をより確実に防止することができる。
ところで、本情報処理システムにおいては、共用コンピュータ２のメモリー７に記録された処理プログラム１３及び個人用コンピュータ３のメモリー２３に記録された処理プログラム２７が例えば、図１８に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図１８に示すフローチャートにおいても、「（共）」と記載したステップは共用コンピュータ２における処理を意味し、「（個）」と記載したステップは個人用コンピュータ３における処理を意味している。
ここでは、先ず、ステップＣ１（ＳＣ１）で、要求者が本システムを利用するにあたり、メモリー２３に記録されている処理プログラム２７を起動する。処理プログラム２７によって、個人用コンピュータ３の読取り装置２５を駆動してゲノム関連情報記録媒体２４にアクセスし、ゲノム関連情報記録媒体２４においてデータＩとして記録されている「Ｇｎｏ．」、データＩＩとして記録されている全ての「多型番地」及び「多型パターン」を読み出す。読み出した「Ｇｎｏ．」、「多型番地」及び「多型パターン」は、メモリー部２６に格納する。
次に、ステップＣ２（ＳＣ２）では、処理プログラム２７によって表示装置２２に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ３に入力するとともに、個人用コンピュータ３から通信回線網１を経由して共用コンピュータ２に「大腸がんの罹患可能性」と、メモリー部２６に記録されている「Ｇｎｏ．」、「多型番地」及び「多型パターン」とを送信する。
次に、ステップＣ３（ＳＣ３）では、共用コンピュータ２が「大腸がんの罹患可能性」、「Ｇｎｏ．」、「多型番地」及び「多型パターン」を受信する。受信した「大腸がんの罹患可能性」は要求情報としてメモリー部Ａ１０に記録され、「Ｇｎｏ．」、「多型番地」及び「多型パターン」も、メモリー部Ａ１０に格納される。共用コンピュータ２は、要求情報を受信すると処理プログラム１３を起動する。そして、ステップＣ４（ＳＣ４）では、処理プログラム１３に従って、メインＤＢ１４にアクセスする。
次に、ステップＣ５（ＳＣ５）では、処理プログラム１３に従って、メインＤＢ１４に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」（大腸がん）と一致するものを抽出する。
ステップＣ６（ＳＣ６）では、処理プログラム１３に従って、メインＤＢ１４にアクセスし、メインＤＢ１４から「大腸がん」に分類された「多型番地」、当該多型番地に対する全ての「多型パターン」、及び当該多型パターンに対する「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部Ａ１０に格納される。
次に、ステップＣ７（ＳＣ７）では、ステップＣ３で受信した「多型番地」及び「多型パターン」に基づいて、ステップＣ６でメモリー部Ａ１０に格納したデータを検索し、受信した「多型パターン」と一致した多型パターンに関連付けられた罹患可能性をメモリー部Ａ１０から抽出する。
ステップＣ８（ＳＣ８）では、ステップＣ７の結果、すなわち、ステップＣ３で受信した情報に含まれる多型パターンがメインＤＢ１４のいずれの多型パターンと一致するかに基づいて抽出した罹患可能性を、通信回線網１を介して個人用コンピュータ３に対して送信する。このとき、共用コンピュータ２は、抽出した罹患可能性を要求者の「Ｇｎｏ．」とともに送信する。
次に、ステップＣ９（ＳＣ９）では、共用コンピュータ２から送信された「Ｇｎｏ．」及び「罹患可能性」（意味情報）を受信する。受信した「Ｇｎｏ．」及び「罹患可能性」は、メモリー部２６に記録される。このとき、ゲノム関連情報記録媒体２４に記録されているデータＩにアクセスし、受信した「Ｇｎｏ．」が正しいか否かを確認することができる。
次に、ステップＣ１０（ＳＣ１０）では、処理プログラム２７に従って、メモリー部２６に記録された意味情報から大腸がんに対する罹患可能性を表示装置２２に表示する。なお、ステップＣ８からステップＣ１０の代わりに、共用コンピュータ２が処理プログラム１３に従って意味情報を表示する画面を読み出し（作成し）、通信回線網１を経由して個人用コンピュータ３の表示装置２２に表示させることもできる。この場合においても、共用コンピュータ２から個人用コンピュータ３に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体２４に記録したゲノム関連情報２８を用いて大腸がんに対する罹患可能性を得ることができる。
特に、図１８に示したフローチャートに従えば、ゲノム関連情報記録媒体２４に記録したゲノム関連情報２８を全て共用コンピュータ２に対して出力し、共用コンピュータ２において要求者に提供する意味情報を得ている。このため、図１８に示したフローチャートに従えば、個人用コンピュータ３と共用コンピュータ２との間での情報の授受が比較的少ない回数で、要求者が意味情報を得ることができる。したがって、この図１８に示したフローチャートに従えば、個人用コンピュータ３の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができるとともに、要求者にとっては非常に簡便に意味情報を得ることができる。
以上、説明したように本システムによれば、ゲノム関連情報記録媒体２４及びメインＤＢ１４において、「多型番地」及びその「多型パターン」のみを規格化しておけば、それ以外の特別なデータの規格化を必要としないので、広範囲な産業に利用することができる。すなわち、物品或いはサービスを提供する側は、ゲノム関連情報記録媒体２４を用いた情報提供に際して、多型パターンに対応する意味情報の規格化や、データ授受処理方法等の統一した規格を必要とせず、様々な方式で情報提供することができる。
さらにまた、本システムによれば、メインＤＢ１４をチェックすることで、第三者或いは第三者機関は共用コンピュータ２に対する監視及び管理を容易に行うことができる。したがって、本システムは、意味情報を提供する側に対する例えば行政的な管理を行うことができるため、意味情報を提供する側の健全性及び倫理管理を行うことができる。
一方、本情報処理システムにおいては、ゲノム関連情報記録媒体からデータＩＩに含まれる情報を除いたもの、すなわちデータＩ及び付加的にデータＩＩＩ〜Ｖのみを有する記憶媒体を用いても良い。この場合、データＩＩに含まれる情報は、通信回線網１を介して個人用コンピュータ３と接続された外部のデータベース（ゲノム関連情報記録媒体）に記録しておく。このようなシステムの場合、例えば、上述したステップＡ１０において、通信回線網１を介して外部のデータベースにアクセスし、命令された多型番地の多型パターンを読み出し、多型番地と多型パターンとを関連づけてメモリー部２６に記録することができる。したがって、このようなシステムであっても、図１５及び図１６に示したフローチャート、図１７に示したフローチャート及び図１８に示したフローチャートと同様に、要求者は意味情報を得ることができる。
さらに、本情報処理システムにおいては、要求者がゲノム関連情報記録媒体２４及び前記ゲノム関連情報記録媒体からデータＩＩに含まれる情報を除いた記録媒体のいずれも有さず、通信回線網１を介して個人用コンピュータ３と接続したゲノム関連情報記録媒体２４を備えるものであっても良い。このようなシステムの場合、要求者は、通信回線網１を介してゲノム関連情報記録媒体２４にアクセスし、ゲノム関連情報記録媒体２４に記録された「多型番地」及び「多型パターン」等の情報を個人用コンピュータ３にダウンロードできる。なお、この場合、ゲノム関連情報記録媒体２４は、複数の個人に関するゲノム関連情報を個人毎（「Ｇｎｏ．」毎）に記録したものであっても良い。
さらにまた、本発明は、上述したような共用コンピュータ２がメインＤＢ１４を有するような構成に限定されず、例えば、共用コンピュータ２と通信回線網１を介して接続されたメインＤＢ１４を備える情報処理システムにも適用される。この場合、共用コンピュータ２は、図１５及び図１６に示したフローチャート、図１７に示したフローチャート或いは図１８に示したフローチャートにおいて、メインＤＢ１４に対して通信回線網１を介してアクセスする。この場合でも、本情報処理システムによれば、図１５及び図１６に示したフローチャート、図１７に示したフローチャート或いは図１８に示したフローチャートに従って要求者が所望の意味情報を得ることができる。
特に、この場合、共用コンピュータ２は、異なる機関又は団体が有する複数のメインＤＢ１４に対して通信回線網１を介してアクセスし、これら複数のメインＤＢ１４に含まれる意味情報を使用して、要求者に対する情報提供を行うことが可能となる。すなわち、本情報処理システムにおいては、図１５及び図１６に示したフローチャートにおけるステップＡ５で、図１７に示したフローチャートにおけるステップＢ５で、或いは図１８に示したフローチャートにおけるステップＣ５で、共用コンピュータ２が大腸がんの罹患可能性に関する情報を意味情報として有する様々なメインＤＢ１４にアクセスする。これにより、本情報処理システムによれば、要求者は、様々なメインＤＢ１４に含まれる情報に基づいて、大腸がんの罹患可能性に関する情報を得ることができる。
また、本システムは、図１５及び図１６に示したフローチャート、図１７に示したフローチャート、或いは図１８に示したフローチャートにおいて、共用コンピュータ２が、いわゆるエージェントに対して、少なくとも個人用コンピュータ３から受け取った要求情報を送信し、意味情報（本例においては、「大腸がんに関する罹患可能性」）を、当該エージェントを介して得るものであってもよい。
本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。

産業上の利用の可能性

以上、詳細に説明したように、本発明によれば、個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び／又は当該意味情報に関連する情報を提供できる情報処理システムを構築することができ、特に、当該意味情報を創出することができる情報処理システムを構築することができる。

Claims

所定の個体に関する塩基配列関連情報を受け取るステップａと、
塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置から、前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップｂと、
を有する塩基配列に関する情報処理方法。
前記ステップａでは、予め決まった位置情報に対応する塩基配列関連情報を受け取ることを特徴とする請求項１記載の情報処理方法。
前記ステップｂで特定した塩基配列関連情報群が複数ある場合には、
所定の個体に関する塩基配列関連情報の受け取りと、複数の塩基配列関連情報群の中で、当該受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すステップｃを更に有することを特徴とする請求項１記載の情報処理方法。
前記所定の個体に関する個体関連情報を受け取るステップｄを更に有し、
前記ステップａ、ステップｂ及びステップｄを複数の個体に関して行い、当該複数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する複数の個体関連情報とをそれぞれ関連付けたデータベースを構築することを特徴とする請求項１記載の情報処理方法。
前記データベースに含まれる複数の個体に関する複数の個体関連情報と、前記データベースに含まれる若しくは含まれない複数の個体に関する複数の塩基配列関連情報群又は当該複数の塩基配列関連情報群を統計的に処理した結果とを統計的に処理して、塩基配列関連情報を意味づける意味情報及び／又は当該意味情報に関連する情報を創出することを特徴とする請求項４記載の情報処理方法。
複数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する複数の個体関連情報とをそれぞれ関連付けて構築されたデータベースに含まれる複数の個体に関する複数の個体関連情報と、前記データベースに含まれる若しくは含まれない複数の個体に関する複数の塩基配列関連情報群又は当該複数の塩基配列関連情報群を統計的に処理した結果とを統計的に処理して創出された塩基配列関連情報を意味づける意味情報及び／又は当該意味情報に関連する情報を取得し、
取得した意味情報及び／又は当該意味情報に関連する情報を用いて、物品及び／又はサービスの要求情報に応じた意味情報及び／又は当該意味情報に関連する情報を提供するための記憶装置の記憶内容を構築することを特徴とする塩基配列に関する情報処理方法。