WO2004046997A1

WO2004046997A1 - 塩基配列関連情報を用いた情報処理システム

Info

Publication number: WO2004046997A1
Application number: PCT/JP2003/014733
Authority: WO
Inventors: Takamasa Kato; Takeo Morimoto; Hitoshi Matsuo; Hideyuki Ban; Toru Hisamitsu; Takuya Kamiyama
Original assignee: Hitachi, Ltd.
Priority date: 2002-11-20
Filing date: 2003-11-19
Publication date: 2004-06-03
Also published as: US20060041389A1; EP1569154A1; JP4266008B2; JPWO2004046997A1; EP1569154A4

Abstract

個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関連する情報を提供するシステムを構築する。　所定の個体に関する塩基配列関連情報を受け取るステップａと、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置から、前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップｂとを有する。

Description

塩基配列関連情報を用いた情報処理システム技術分野

本発明は、例えば通信回線網を介して情報を提供する情報処理システムに関する。背景技術明

現在、ヒトを始めとする各種生物のゲノム塩基配列が急速に決定されており、様々なデータベースにゲノム塩基配列情報が蓄積されている。例えば、インターネ書

ット等の情報通信網を介して、各種研究機関や研究者がデータベースに蓄積されたゲノム塩基配列情報を利用できるようなシステムの構築がなされつつある。

同時に、このようなゲノム塩基配列情報に含まれる塩基配列を用いて、ゲノム創薬の研究や遺伝情報の解析等が盛んに行われており、一塩基多型に代表されるような個体間における塩基配列の相違が注目されている。一般に、個体間における塩基配列の相違とは、所定の塩基の相違が個体種中 1 %以上の頻度で存在すると定義される多型と、所定の塩基の相違が個体種中 1 %未満であるバリエーションとを意味している。特に、多型には、個体間における 1個の塩基の相違である一塩基多型 (SNP； Single Nucleotide Polymorphism) 、 1力ら数十塩基（数千塩基の場合もある）が欠失又は挿入している挿入/欠失多型、 2から数十塩基を 1単位とする配列の繰り返し回数が相違する VNTR (Variable Number of Tandem Repeat) やマイクロサテライト多型（繰り返し配列が 2〜 4塩基程度のもの）が知られている。

このような多型は、個体間におけるタンパク質のアミノ酸配列の相違や、個体間における所定の遺伝子に関する発現効率の相違等に影響を及ぼすことがある。このような影響により、例えば、所定の疾病に対する罹患可能性が個体間で異なったり、所定の薬剤に対する感受性が個体間で異なることが知られている。

ところが、多型等の個体間における塩基配列情報の相違を有効に利用して、各個体にとって有益な意味情報を提供するようなシステムは構築されていないのが現状である。発明の開示

そこで、本発明は、このような現状に鑑み、個体間における塩基配列情報の相違を有効に利用して各個体にとつて有益な意味情報及び/又は当該意味情報に関連する情報を提供するシステムを構築することを目的とする。

上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する塩基配列関連情報を受け取った後、個体毎に塩基配列関連情報群を有する記憶装置から前記受け取つた塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定する方法である。本方法によれば、塩基配列関連情報群を特定することによって、前記受け取った塩基配列関連情報が帰属する個体を特定することもまたできる。

また、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する個体関連情報を受け取り、特定した塩基配列関連情報群若しくは個体と、前記受け取つた個体関連情報とを関連付けて記憶することで、当該個体関連情報と個体に関する塩基配列関連情報群とを関連付けることができる。

なお、本発明に係る塩基配列に関する情報処理方法において、塩基配列関連情報群を特定する際には、例えば、予め決まった位置情報に対応する塩基配列関連情報を受け取り、当該受け取った塩基配列関連情報を用いることができる。また、本発明に係る塩基配列に関する情報処理方法においては、所定の個体に関する塩基配列関連情報の受け取りと、当該受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定すまで繰り返すこともできる。

さらに、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関して個体関連情報を受け取ることによって、当該所定の個体に関する塩基配列関連情報群と個体関連情報とを関連付けたデータベースを構築することもできる。

本発明に係る塩基配列に関する情報処理方法は、前記データベースに含まれる複数の個体に関する複数の個体関連情報及び複数の個体に関する塩基配列関連情報群を統計的に処理することで、塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を創出することができる。このとき、当該複数の個体に関する塩基配列関連情報群は、前記データベースに含まれていても、含まれていなくても良い。また、統計的に処理した結果と複数の個体に関する複数の個体関連情報とを用いて更に統計的に処理することによって、意味情報及び/又は当該意味情報に関連する情報を創出してもよい。

一方、本発明に係る塩基配列に関する情報処理方法は、創出された塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を受け取り、受け取った意味情報及び/又は当該意味情報に関連する情報を用いて、物品及び/又はサ一ビスの要求情報に応じた意味情報及び/又は当該意味情報に関連する情報を提供するための記憶装置の記憶内容を構築することもできる。

なお、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及ぴ記憶装置等のハードウェアを備えるコンピュータに、各ステップを実行させるプログラムとして実現することができる。また、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及び記憶装置等のハードウェアを備えるコンビユータに、各ステップを実行させるプログラムを記録した記録媒体として実現することもできる。さらに、本発明に係る塩基配列に関する情報処理方法は、各ステツプを実行する制御装置、送受信装置及び記憶装置等のハードウアを備える情報処理装置として実現することもできる。

その他、本発明は、請求項各項に記載されている通りの構成を有するものである _c 本明細書は本願の優先権の基礎である日本国特許出願 2002- 336916号の明細書およぴ /または図面に記載される内容を包含する。図面の簡単な説明

図 1は、本発明を適用した情報処理システムの構成を概略的に示す概略構成図でめる。

図 2は、共用コンピュータの構成を概略的に示す概略構成図である。

図 3は、メイン DBに記録されたデータの一例を示す構成図である。

図 4は、統計解析用コンピュータの構成を概略的に示す概略構成図である。

図 5は、ゲノム関連情報 D Bに記録されたデータの一例を示す構成図である。

図 6は、個体関連情報 D Bに記録されたデータの一例を示す構成図である。図 7は、個人用コンピュータの構成を概略的に示す概略構成図である。図 8は、ゲノム関連情報記録媒体に記録されたデータの一例を示す構成図である。図 9は、個体関連情報とゲノム関連情報とを関連連付ける情報処理システムにおいて、統計解析用コンピュータ及ぴ個人用コンピュータでの処理を示すフローチヤートである。

図 1 0は、個体関連情報収集画面の一例として示す面面ィメージである。

図 1 1は、ゲノム関連情報 D Bの全データから、多型番地における各多型パターンの出現頻度を算出したデータの一例を示す構成図である。

図 1 2は、ゲノム関連情報 D Bと個体関連情報 D Bとを用いて、個体関連情報について多型番地毎の各多型パターンの出現頻度を算出したデータの一例を示す構成図である。

図 1 3は、図 1 1及ぴ図 1 2に示したデータから、個体関連情報について多型番地毎の各多型パターンの割合値を算出したデータの一例を示す構成図である。

図 1 4は、図 1 3に示したデータから、個体関連情報について多型番地毎の各多型パタ一ンの相対値を算出したデータの一例を示す構成図である。

図 1 5は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。

図 1 6は、図 1 5の続きであり、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及ぴ個人用コンピュータでの処理を示すフローチヤートである。

図 1 7は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの他の処理を示すフローチャートである。

図 1 8は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及ぴ個人用コンピュータでの更に他の処理を示すフローチヤ一トである。符号の説明

1…通信回線網、 2…共用コンピュータ、 3…個人用コンピュータ、 S T…統計解析用コンピュータ発明を実施するための最良の形態

以下、図面を参照して本発明を詳細に説明する。

本発明を適用した実施の形態として、利用者に対して所定の疾病の罹患可能性等の意味情報を提供する情報処理システムにおいて、当該意味情報を創出するシステムについて説明する。すなわち、情報処理システムは、利用者に対して提供する罹患可能性等の意味情報を、個体に関する情報（以下、個体関連情報）から創出するシステムである。

以下の説明においては、個体関連情報から意味情報を創出する情報処理システムについて説明するが、説明の都合上、簡略化したモデルとして説明する。情報処理システムは、図 1に示すように、インターネット等の通信回線網 1と、通信回線網 1に接続された共用コンピュータ 2と、通信回線網 1に接続された少なくとも 1以上の個人用コンピュータ 3と、通信回線網 1に接続された統計解析用コンピュータ S Tとを備え、通信回線網 1を介して共用コンピュータ 2と個人用コンピュータ 3 と統計解析用コンピュータ S Tとの間のデータ通信を可能としている。

共用コンピュータ 2は、図 2に示すように、当該共用コンピュータ 2の動作を全て制御する CPU 4と、情報及ぴプログラムの実行指示等を入力できるキーボード及びマウス等の入力装置 5と、ディスプレイ装置等の表示装置 6と、一時的な情報及び書き換え不可能な情報等が記録されるメモリー 7と、各種データを格納しているデータベース 8と、これらメモリー 7及びデータベース 8に対して所定の情報を書き込む記録装置 9と、通信回線網 1を介して個人用コンピュータ 3との間で情報の送受信を行う送受信装置 1 7とから構成されている。

共用コンピュータ 2におけるメモリー 7は、それぞれ異なる種類の情報を記録するメモリー部 A 1 0及びメモリー部 B 1 1と、例えば個人用コンピュータ 3や表示装置 6に表示させる画像データを記録した画面メモリー 1 2と、本システムを動作させるための処理プログラム 1 3とから構成されている。なお、共用コンピュータ

2においては、画面メモリー 1 2及ぴ処理プログラム 1 3等を内部のメモリー 7に有さず、通信回線網 1を介して共用コンピュータ 2と接続された外部記憶装置（図示せず）に有するものであってもよい。

共用コンピュータ 2におけるデータベース 8 (記憶装置）は、多型番地、多型パターン及び意味情報が記録されたメイン DB 1 4と、メモリー部 A 1 0に記録された情報を保存する保管用 DB - A 1 5と、メモリー部 B 1 1に記録された情報を保存する保管用 DB-B 1 6とから構成されている。メイン DB 1 4は、図 3に示すように、多型番地と、当該多型番地で取りうる複数の多型パターンと、当該複数の多型パターンそれぞれを意味づける意味情報とが関連付けられて記録されている。また、メイン DB 1 4には、複数の多型番地における多型パターンの組合せ（例えば、ハプロタイプ）を意味づける意味情報が記録されていても良い。

ここで、「多型番地（位置情報）」とは、少なくとも、塩基配列における多型が存在する位置を意味する。なお、一般的に多型とは、例えば、いわゆる SNP (single nucleotide polymorphism; RFLP (restriction fragment length or polymorphism) VNTR (variable number of tandem repeat)、マイクロサテライト等を含んでいる。しかし、本明細書において使用する「多型」は、これらに限定されず、個体種中 1 %未満の頻度でしか存在しない塩基及ぴ塩基配列の変化（バリエーション）も含む意味とする。したがって、「多型番地」は、個体種中 1 %未満の頻度でしか存在しない塩基及び塩基配列の変化を示す、塩基配列における位置も含む意味である。すなわち、「多型番地」とは、数値、文字及び記号等を組み合わせて、多型等を示す位置を表すものである。多型番地は、特に限定されないが、例えば、染色体番号と多型が存在する遺伝子を表す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせにより表記することもできるし、多型が存在する遺伝子を示す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせであってもよい _c また、多型番地は、多型毎に付与される多型固有の表記であっても良い。多型番地として多型固有の表記を使用する場合、多型番地は塩基配列中の位置を直接的には示さないが、多型固有の表記に基づいて間接的に位置を知ることができる。したがって、「多型番地」は、多型固有の表記も含む意味である。

「多型パターン（塩基配列関連情報）」とは、個体間において相違する塩基配列の情報であり、少なくとも、多型における塩基又は塩基配列のパターンを含む意味である。さらに「多型パターン」は、多型に限らず、個体種中 1 %未満の頻度でしか存在しなレ、塩基及び塩基配列のパターンも含む意味である。

例えば、 A又は Gを取ることが知られている多型番地において、「多型パターン」は、「A」及び「G」のいずれかで表される。また、「多型パターン」は、相同染色体におけるヘテロ接合体又はホモ接合体を示すものであってもよい。この場合、例えば、 A又は Gを取ることが知られている多型番地において、「多型パターン」は、「AA」、「G G」及ぴ「A G」のいずれかで表現できる。さらに、「多型パターン」は、所定の多型番地で取りうるパターンを直接的に表記するものではなく、間接的に表記するものであっても良い。すなわち、「多型パターン」は、例えば、 A又は Gを取ることが知られている多型番地において「A」を取る場合に「アレル 1」とし、「G」を取る場合に「アレル 2」と表記してもよレ、。また、「多型パターン」が上述したように「AA」、「G G」及ぴ「A G」のいずれかで表現できる場合、例えば、「AA」で表現できるときに「ひ」、「G G」で表現できるときに「i3」、「A G」で表現できるときに「τ/」と表記してもよい。その他「多型パターン」の表記例としては、多型がマイクロサテライトの場合には「繰り返し数」を表す数値で、多型が揷入、欠失型の場合には「有/無」を表す記号で表記してもよい。

また更に、各多型番地における「多型パターン」は、所定の規則や取り決めに従つて、例えば、「多型 1」、「多型 2」、「多型 3」等と表記されても良い。例えば、各多型番地において、「多型パターン」がとり得る頻度の高い順に、「多型 1」、「多型 2」、「多型 3」と表記できる。この場合、例えば、各多型番地におけるそれぞれの「多型 1」は必ずしも同じ内容を表すものではない。すなわち、例えば、ある多型番地の「多型 1」は最もとり得る頻度が高い「Α Α」を表し、別の多型番地「多型 1」は最もとり得る頻度が高い「G G」を表すことになる。なお、本実施の形態においては、「多型パターン」を「多型 1」、「多型 2」及び「多型 3 j 等のいずれかで表記する方法を使用している。ところで、本システムにおいては、多型パターンは、暗号化されていても暗号化されていなくても差し支えない。ここで、「意味情報」とは、「多型パターン」に関連づけられた情報であり、例えば、薬剤に対する応答性、薬剤に対する副作用、疾患及び障害に対するリスク、体質 ·性質、体質 ·性質等に基づく生活習慣ァドバイス、タンパク質相互作用など、「多型パターン」の相違に起因する様々な情報を意味する。

なお、「意味情報」としては、「多型パターン」の相違に起因する様々な情報を直接表しても良く、また、当該情報を意味する記号などを用いて間接的に表しても良い。「意味情報」は、ゲノム ·遺伝子に関する研究が進むことにより種類が増加するとともに訂正が行われる種類の情報であり、常にパージヨンアップすることが好ましい。すなわち、「意味情報」は、ゲノム ·遺伝子の研究成果を用いてデータベースを更新することによって、蓄積量が増加 '減少してより精度の高いものとなる。

なお、直接「多型パターン」には関連づけられていないが「意味情報」から更に導き出される情報は、「意味情報に関連する情報」である。「意味情報」が「疾患に対するリスク」である場合、当該リスクがある一定の水準を超えたときに、例えば特定の「健康診断検査項目」が導き出される。この特定の「健康診断検査項目」が「意味情報に関連する情報」である。

本実施の形態において意味情報は、図 3に示すように、少なくとも、所定の「多型番地」及び「多型パターン」に関連づけられた「多型パターンに対する注釈情報」としてメイン DB 1 4に記録されている。また、意味情報には、所定の「多型番地」に対応する「多型分類」及び「分類（疾患名）」等が関連づけられている。すなわち、所定の「多型番地」が所定の「多型パターン」である場合、疾患名の種類と当該疾患に対する罹患可能性を示す注釈情報（意味情報）を得ることができる。したがって、例えば、意味情報は、複数の多型番地に対応するそれぞれの多型パターンの組み合わせ（例えば、ハプロタイプ）に対して関連付けることもできる。すなわち、複数の多型番地における多型パターンの組み合わせ毎に、所定の疾患に対する異なる罹患可能性を示す注釈情報（意味情報）を関連付けることができる。この場合、複数の多型番地が所定の多型パターンの組み合わせである場合、所定の疾患に対する罹患可能性を示す注釈情報（意味情報）を得ることができる。

また、意味情報には、所定の基準で決定した「公開レベル」を関連づけることもできる。例えば、「公開レベル」を決定する際の基準としては、意味情報、すなわちここでは「分類（疾患名）」の罹患可能性を公開することによる個人に対する不測の不利益等を考慮して定めることができる。詳細には、共用コンピュータ 2において、法律、規則又は自らの行動基準若しくは利用者との契約等に鑑みて、公開することが相応しくない意味情報については、公開しないような「公開レベル」を決定することができる。この場合、本システムでは、公開不可を意味する「公開レべル」に関連付けられた罹患可能性を示す注釈情報については、利用者に対して開示することはない。これにより、利用者に対して不測の不利益となりうる意味情報を与えることや、契約者以外に意味情報が開示されることを防止できる。

なお、利用者がインフォームドコンセント等により、所定の「公開レベル」を関連づけた意味情報の開示を容認することにより、利用者に対して、所定の「公開レベル」が関連づけられた意味情報を公開するようなシステムであってもよい。

また、「公開レベル」は、例えば「1 , 2 , 3、 ···」又は「a , b， c , ···] といつた 3以上の複数の段階として設定することができる。この場合、共用コンビユータ 2側では、利用者の年齢、資格及び利用者との契約の有無等、利用者の種類に応じてレベルを設定することができる。なお、インフォームドコンセント等によって、所定の公開レベル以上（又は未満）の公開レベルに関連付けられた罹患可能性を示す注釈情報のみが利用者側に対して提供されるように、当該利用者側が公開レベルを選択することもできる。

なお、データベース 8において、保管用 DB- B 1 6には、例えば、本システムを利用する要求者個人の遺伝情報である塩基配列関連情報といったデータを記録することができる。また、保管用 DB-A 1 5には、例えば、本システムを利用する要求者を特定する情報といったデータを記録することができる。このように、保管用 DB-A 1 5及ぴ保管用 DB-B 1 6に、個人の遺伝情報と個人を特定する情報とを分けて記録することによって、要求者の遺伝情報と、要求者を特定するデータとを関連付け難くなる。

なお、共用コンピュータ 2は、データベース 8を内部に有するものに限定されず、通信回線網 1を介して共用コンピュータ 2に接続された外部データベース（図示せず）を有するものであってもよい。また、共用コンピュータ 2は、内部に複数のデータベース 8を有するものであってもよいし、内部のデータベース 8と通信回線網 1を介して共用コンピュータ 2に接続された外部データベースとを有するものであつても良い。

統計祈用コンピュータ S Tは、図 4に示すように、当該統計解析用コンピュータ

S Tの動作を全て制御する CPU 3 0と、情報及ぴプログラムの実行指示等を入力できるキーボード、マウス等の入力装置 3 1と、ディスプレイ装置等の表示装置 3 2と、一時的な情報及び書換え可能な情報や書換え不可能な情報等が記録されるメモリー 3 3と、各種データを格納しているデータベース 3 4と、これらメモリー 3 3及びデータベース 3 4に対して所定の情報を書き込む記録装置 3 5と、通信回線網 1を介して共用コンピュータ 2及び個人用コンピュータ 3との間で情報の送受信を行う送受信装置 3 6とから構成されている。

統計解析用コンピュータ S Tにおけるメモリー 3 3は、個人用コンピュータ 3から送られた多型パターン等を一時的に記録したり、統計解析結果等を記録するメモリー部 3 7と、例えば個人用コンピュータ 3や共用コンピュータ 2や表示装置 3 2 に表示させる画像データを記録した画面メモリー 3 8と、本システムを動作させ、複数の個人（個体）に関する「個体関連情報」と複数の個人（個体）に関する「ゲノム関連情報」とを用いて、例えば、所定の疾患に対する罹患可能性を示す注釈情報といつた意味情報を創出する処理プログラム 3 9とが記録されている。なお、当該処理プログラム 3 9によれば、先ず、複数の個人（個体）に関する「ゲノム関連情報」と複数の個人（個体）に関する「個体関連情報」とを集積した後、当該「ゲノム関連情報」と当該「個体関連情報」とを用いて統計的に処理することで、所定の疾患に対する罹患可能性を示す注釈情報（意味情報）等を得ることができる。なお、統計解析用コンピュータ S Tにおいては、処理プログラム 3 9やメモリー部 3 7を内部のメモリー 3 3に有さず、通信回線網 1を介して統計解析用コンピュータ S Tに接続された外部記憶装置（図示せず）に有するものであっても良い。

ここで、「個体関連情報」とは、個体の性質、心理的状態、体質、体調、健康状態、病歴、生活習慣、行動 ·思考パターン、癖及び嗜好等、所定の個体に関するあらゆる情報が含まれる。例えば、個体関連情報としては、予め準備された質問等に対して利用者等の個人（個体）が回答することから得られる情報、或いは、例えば、利用者等が医療機関や検査機関等で検査を受けることによって得られる情報を挙げることができる。

また、「ゲノム関連情報」とは、所定の個体に関する複数の「多型パターン」をそれぞれ所定の「多型番地」に関連付けたデータの群（塩基配列関連情報群）である。

統計解析用コンピュータ S Tにおけるデータベース 3 4 (記憶装置）は、複数の個人 (個体）に関する「ゲノム関連情報」を各個人（個体）毎に記録した「ゲノム関連情報 D B 4 0」（図 5に示す）を有している。なお、「ゲノム関連情報 D B 4 0」に記録された「ゲノム関連情報」は、直接個人（個体）を特定する情報と結びつかないように匿名化されていることが望ましい。

また、データベース 3 4は、個人用コンピュータ 3より受信した「個体関連情報」を各個人（個体）毎に記録した「個体関連情報 D B 4 1」（図 6に示す）を有している。なお、「個体関連情報 D B 4 1」に記録された「個体関連情報」は、直接個人 (個体）を特定する情報と結びつかない、ように匿名化されていることが望ましい。なお、統計解析用コンピュータ S Tは、前記データベース 3 4を内部に有するものに限定されず、通信回線網 1を介して統計解析用コンピュータ S Tに接続された外部データベース（図示せず）に対してアクセスするものであっても良い。

個人用コンピュータ 3は、図 7に示すように、当該個人用コンピュータ 3の動作を全て制御する CPU 2 0と、情報及ぴプログラムの実行指示等を入力できるキ一ボード及ぴマウス等の入力装置 2 1と、ディスプレイ装置等の表示装置 2 2と、一時的な情報及び書き換え可能な情報等が記録されるメモリー 2 3と、ゲノム関連情報記録媒体 2 4からデータを読み取る読取り装置 2 5と、通信回線網 1を介して共用コンピュータ 2との間で情報の送受信を行う送受信装置 2 9とから構成されている。なお、個人用コンピュータ 3は、通常のコンピュータに限定されず、例えば、携帯電話、個人携帯端末及びその他の移動体通信機器等、いかなる形態であってもよい。

個人用コンピュータ 3におけるメモリー 2 3は、ゲノム関連情報記録媒体 2 4からの情報等を記録するメモリー部 2 6を有し、本情報処理システムを動作させる処理プログラム 2 7が記録されている。

ゲノム関連情報記録媒体 2 4には、個人のゲノム関連情報 2 8が記録されている。ゲノム関連情報記録媒体 2 4としては、例えば、磁気ディスクや磁気カード等の磁気記録媒体、光磁気記録方式や相変化記録方式等を適用した光学式記録媒体、半導体メモリー等を挙げることができる。また、このゲノム関連情報記録媒体 2 4は、カード状、ディスク状、スティック状、テープ状又はドラム状等いかなる形態であつてもよい。さらに、このゲノム関連情報記録媒体 2 4は、単一の個人（個体）のゲノム関連情報 2 8を記録したものであってもよいが、複数の個人（個体）に関する複数のゲノム関連情報 2 8を記録したものであってもよい。

ゲノム関連情報記録媒体 2 4に含まれるゲノム関連情報 2 8とは、少なくとも、「多型番地」及び個人（個体）の塩基配列を解析した結果として得られる所定の多型番地における「多型パターン」を意味する。また、ゲノム関連情報 2 8には、既往症、特徴、カルテ情報、健康診断結果といった各種情報を含んでいてもよい。ゲノム関連情報記録媒体 2 4には、ゲノム関連情報 2 8として、例えば、図 8に示すように、データ Iとしてゲノム関連情報 2 8に固有の個別番号「Gno.」（ジーナンパー）及ぴ生年月日等の個人情報を記録し、データ IIとして多型番地及び多型パターンを記録し、データ IIIとして既往症を記録し、データ IVとして特徴を記録し、データ Vとしてカルテ情報等を記録する。すなわち、ゲノム関連情報 2 8は、データ I、データ II、データ III、データ IV及びデータ Vから構成されている。データ I及びデータ IIには必須の情報が含まれており、データ III、データ IV及びデータ Vには付加的な情報から構成されている。

ゲノム関違情報 2 8においては、塩基配列上の位置に対応する「多型番地」と、当該多型番地における「多型パターン」とをリンクさせて記録している。また、データ IIには、所定の多型番地における付加的な情報を「コメント」として、「多型番地」にリンクさせて記録していてもよい。なお、データ IIには、所定の個体に関する全塩基配列を記録しても良い。データ IIに全塩基配列を記録した場合であっても、データ II内に「多型番地」及び「多型パターン」が含まれることとなる。

なお、本発明において、個人用コンピュータ 3及びゲノム関連情報記録媒体 2 4 は、それぞれ図 7及び図 8に示したような構成に限定されず、例えば、ゲノム関連情報記録媒体が処理プログラムを有するメモリー部を備え、個人用コンピュータが当該ゲノム関連情報記録媒体を装着して処理プログラムを動作させるような構成であってもよい。この場合、個人用コンピュータは、ゲノム関連情報記録媒体のメモリ一部に記録された処理プログラムに従つて動作できる。

以上のように構成された情報処理システムにおいては、統計解析用コンピュータ

S Tのメモリー 3 3が有する処理プログラム 3 9及び個人用コンピュータ 3のメモリー 2 3に記録された処理プログラム 2 7が例えば、図 9に示すようなフローチヤートに従って情報処理動作する。なお、図 9に示すフローチャートにおいて、「（統）」と記載したステップは統計解析用コンピュータ S Tにおける処理を意味し、「（個）」と記載したステップは個人用コンピュータ 3における処理を意味している。

本情報処理システムは、ゲノム関連情報記録媒体 2 4を所持する各個人が個人用コンピュータ 3を用いて通信回線網 1を介して統計解析用コンピュータ S Tにァクセスし、各個人（個体）に関する「個体関連情報」を統計解析用コンピュータ S T の「個体関連情報 D B 4 1」に、「ゲノム関連情報 D B 4 0」の中のゲノム関連情報と関連付けて登録するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報 2 8がそれぞれ記録されたゲノム関連情報記録媒体 2 4を用い、各個人がゲノム関連情報記録媒体 2 4にアクセスするようなシステムであってもよい。このとき、先ず要求者は、ステップ 1 ( S 1 ) で、通信回線網 1を介して統計解析用コンピュータ S Tにアクセスし、統計解析用コンピュータ S Tに対して個体関連情報の登録を行う旨の意思表示を行う。ステップ 1では、統計解析用コンビユータ S Tが提供するゥヱプページにアクセスして前記意思表示を行っても良いし、統計解析用コンピュータ S Tに対して電子メール等を用いてアクセスして前記意思表示を行っても良い。なお、本例においては、要求者が自らの個体関連情報を登録する場合について述べるが、これに限定されず、要求者が自分以外の個人（個体）に関する個体関連情報を登録することもできる。

次に、統計解析用コンピュータ S Tは、前記意思表示を個人用コンピュータ 3から受信した後、ステップ 2 ( S 2 ) で、画面メモリー 3 8から、図 1 0に示すような「個体関連情報収集画面」を読み出し、個人用コンピュータ 3の表示装置 2 2に表示する。ステップ 2では、統計解析用コンピュータ S Tが提供するウェブページに個人用コンピュータ 3がアクセスした状態で個体関連情報収集画面を表示しても良いし、個人用コンピュータ 3に対して送信した個体関連情報収集画面データに基づいて個人用コンピュータ 3の表示装置 2 2に表示しても良い。

次に、個人用コンピュータ 3は、ステップ 3 ( S 3 ) で、個体関連情報収集画面に従って、要求者自身の個体関連情報を入力する。すなわち、要求者は、個体関連情報収集画面に表示されている設問に対して回答し、当該個体関連情報収集画面に回答内容を入力する。或いは、要求者は、個体関連情報収集画面に表示されている設問に対する回答を、当該個体関連情報収集画面とは異なる回答用画面に入力しても良い。また、ステップ 3では、個体関連情報として利用者（要求者）等が医療機関や検査機関等で検査を受けることによって得た情報を入力しても良い。

次に、個人用コンピュータ 3は、ステップ 4 ( S 4 ) で、個体関連情報収集画面に表示されている設問に対する回答（個体関連情報）を統計解析用コンピュータ S Tに対して送信する。ステップ 4では、回答を入力した個体関連情報収集画面データ又は回答を入力した回答用画面データを、通信回線網 1を介して送信することで前記設問に対する回答を統計解析用コンピュータ S Tに対して送信することができる。また、ステップ 4では、個体関連情報として利用者（要求者）等が医療機関や検查機関等で検査を受けることによつて得た情報を統計解析用コンピュータ S Tに対して送信することもできる。

次に、統計解析用コンピュータ S Tは、個人用コンピュータ 3から個体関連情報を受信した後、ステップ 5 ( S 5 ) で、個人用コンピュータ 3に対して、複数の多型番地を送信する。ステップ 5で送信する複数の多型番地は、既定の多型番地であつても良いし、ランダムに選択した多型番地であっても良！/、。

次に、個人用コンピュータ 3は、統計解析用コンピュータ S Tから複数の多型番地を受信した後、ステップ 6 ( S 6 ) で、読取り装置 2 5を駆動してゲノム関連情報記録媒体 2 4にアクセスする。次に、個人用コンピュータ 3は、ステップ 7 ( S 7 ) で、統計解析用コンピュータ S Tより受信した複数の多型番地について、それぞれ対応する多型パターンを読み出す。そして、個人用コンピュータ 3は、ステツプ 8 ( S 8 ) で、ステップ 7で読み出した多型パターンを対応する多型番地と関連付けて統計解析用コンピュータ S Tに対して送信する。すなわち、ステップ 8では、統計解析用コンピュータ S Tより受信した複数の多型番地それぞれについて、対応する多型パターンを関連付けて送信する。なお、ステップ 8で個人用コンピュータ

3から統計解析用コンピュータ S Tに送信する際には、「Gno.」のような個人（個体）を特定しうる情報を送信しないことが望ましい。

ところで、本実施の形態では、ステップ 5で統計解析用コンピュータ S Tが送信した多型番地を個人用コンピュータ 3で受信し、受信した多型番地に対応する多型パターンをステップ 8で個人用コンピュータ 3が統計解析用コンピュータ S Tに対して送信している。しかしながら、これに限定されず、例えばステップ 4において、個人用コンピュータ 3が統計解析用コンピュータ STに対して「個体関連情報」を送信するとともに、既定の多型番地と当該多型番地に対応する多型パターンとを自発的に統計解析用コンピュータ S Tに対して送信してもよい。この場合は、上述したステップ 5〜 8までは行われず、ステップ 4の後に以下のステップ 9以降のステップを同様に行うことになる。

次に、統計解析用コンピュータ STは、個人用コンピュータ 3から多型番地及び多型パターンを受信した後、ステップ 9 (S 9) で、ゲノム関連情報 DB40にァクセスする。なお、ステップ 9では、統計解析用コンピュータ STがゲノム関連情報 DB 40を有さず、外部の機関がゲノム関連情報 DB 40を有する場合には、通信回線網 1を介して当該外部の機関が有するゲノム関連情報 DB 40にアクセスする。

次に、統計解析用コンピュータ S Tは、ステップ 10 (S 10) で、個人用コンピュータ 3より受信した複数の多型番地及ぴ多型パターンの組合せに基づいてゲノム関連情報 D B 40を検索し、ゲノム関連情報 D B 40に格納されたゲノム関連情報の中から、受信した複数の多型番地及ぴ多型パターンの組合せを有する個人（個体）に関するゲノム関連情報を特定する。言い換えると、ステップ 10では、ゲノム関連情報 DB 40に登録された複数の個人（個体）に関する複数のゲノム関連情報の中から要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報を特定する。ステップ 10では、例えば、特定した要求者、すなわち個人（個体）に関するゲノム関連情報に対して「整理 No.」を付与してもよレ、。或いは、ステップ 10では、ゲノム関連情報 DB4

0に登録している個人（個体）に関するゲノム関連情報に対して予め付与された「整理 No.」を抽出しても良い。

次に、統計解析用コンピュータ S Tでは、ステップ 1 1 (S 1 1) で、ステップ

1 0で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報と、個人用コンピュータ 3より受信した個体関連情報とを関連付ける。具体的には、ステップ 1 0で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報に付与した

「整理 No.」、又はステップ 1 0で特定した要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報について抽出した「整理 No. J を、個体関連情報に関連付けて格納した、図 6に示すような「個体関連情報 D B 4 1」を作成する。

或いは、ステップ 1 0では、統計解析用コンピュータ S Tがゲノム関連情報 D B 4 0を有する場合には、ゲノム関連情報 D B 4 0に格納されている要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報に対して、個人用コンピュータ 3より受信した個体関連情報を直接関連付けて格納しても良い。

以上、図 9に示すフローチャートに従えば、例えば所定の要求者について、当該要求者に関する個体関連情報を、当該要求者に関するゲノム関連情報に関連付けて統計解析用コンピュータ S Tに登録することができる。また、複数の要求者が図 9 に示すフローチャートに従ってそれぞれ個体関連情報を登録することによって、統計解析用コンピュータ S Tは、複数の個人（個体）に関する個体関連情報を有することとなる。言い換えると、統計解析用コンピュータ S Tは、複数の個体に関するゲノム関連情報についてそれぞれ個体関連情報を関連付けて格納したデータベースを作成することができる。

以上のように、本システムによれば、統計解析用コンピュータ S丁の「ゲノム関連情報 D B 4 0」に、予め匿名化して記録しておいたゲノム関連情報に対して、後から匿名化した個体関連情報を統計解析用コンピュータ S Tに送信した場合であつても、当該ゲノム関連情報と当該個体関連情報とをリンクさせることができる。

なお、図 9に示したフローチヤ一トにおいては、統計解析用コンピュータ S Tは- ステップ 5で送信した複数の多型番地について、個人用コンピュータ 3より多型パターンを受信し、ステップ 1 0でゲノム関連情報 D B 4 0を検索することによって要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報を特定している。しかしながら、本情報処理システムにおいては、要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報の特定に際してこの方法に限定されず、例えば、所定の「多型番地」及び「多型パターン」の組合せを、順次個人用コンピュータ 3から統計解析用コンビユータ S Tに対して送信し、統計解析用コンピュータ S Tが要求者の特定を行っても良い。この場合、個人用コンピュータ 3から所定の「多型番地」及ぴ「多型パタ一ン」の組合せを統計解析用コンピュータ S Tに対して順次自発的に送信しても良いし、統計解析用コンピュータ S Tから所定の「多型番地」に対応する「多型パターン」の提出を個人用コンピュータ 3に対して順次要求し、個人用コンピュータ 3 が当該要求に対応した「多型パターン」を「多型番地」に関連付けて順次送信しても良い。

詳細には、統計解析用コンピュータ S Tは、要求者に関する 1又は複数の「多型番地」及ぴ「多型パターン」の組合せを受け取るステップと、受け取った「多型番地」及ぴ「多型パターン」の組合せと一致する「多型番地」及び「多型パターン」の組合せを有する個体に関するゲノム関連情報をゲノム関連情報 D B 4 0から検索するステップとを、検索の結果として 1の個人（個体）に関するゲノム関連情報を要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報として特定するまで繰り返すことで、ゲノム関連情報 D B 4 0に含まれる所定の個人（個体）に関するゲノム関連情報を要求者（要求者が送信した「個体関連情報」に関連する個人（個体））に関するゲノム関連情報として特定することができる。

一方、統計解析用コンピュータ S Tは、複数の個体に関する複数の個体関連情報を、それぞれゲノム関連情報 D B 4 0に含まれるゲノム関連情報と関連付けて格納した個体関連情報 D B 4 1を用いて、当該複数の個体関連情報と当該複数のゲノム関連情報とを統計的に処理して、塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を創出することができる。

ここで統計的処理としては、遺伝統計学的手法として知られている手法を適用した処理を意味し、従来知られている各種プログラム及ぴアルゴリズムを適用して行うことができる。

以下に一例を示す。まず、ゲノム関連情報 D B 4 0のその時点における全データ (全「整理 No. Jに関連付けられた全データ）力、ら、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図 1 1に示すように、行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図 1 1では、多型番地「000001」における多型パターン「多型 1」の出現頻度は 100人中 50人であることを表している。

次に、ゲノム関連情報 D B 4 0と個体関連情報 D B 4 1とを用いて、所定の個体関連情報に関して、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。

具体的には、個体関連情報 D B 4 1から、例えば、「嗜好 a (例:赤色よりも青色の方が好きだ）」について該当する (結果欄に「〇」が付いている）「整理 No.」だけを抽出した上で、ゲノム関連情報 4 0から前記抽出した「整理 No.」を検索し、検索したデータのなかから、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図 1 2に示すように、個体関連情報毎（「嗜好」毎）に行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図 1 2では、「嗜好 a」について該当する場合に、多型番地「000001」における多型パターン「多型 1」の出現頻度は 50人中 45人であることを表している。

次に、図 1 1に示した出現頻度及ぴ図 1 2に示した出現頻度の結果を用いて、所定の個体関連情報に該当するか否かに関わらず算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度（図 1 1 ) と、所定の個体関連情報に該当する場合に限って算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度（図 1 2 ) とを、互いに比較し相対的な値を求める。

具体的には、例えば、図 1 2に示した出現頻度の結果として、「嗜好 a」について該当する場合における、多型番地「000001」における多型パターン「多型 1」の出現頻度は 50人中 45人と表される当該 45人という値を、図 1 1に示した出現頻度の結果を表す、ゲノム関連情報 D B 4 0のその時点における全データ（全「整理 No.」に関連付けられた全データ）における多型番地「000001」における多型パターン「多型 1」の出現頻度 100人中 50人の当該 50人で除した割合値（90%) を、前記相対的な値として求める。同様に、多型番地「000001」における多型パターン「多型 2」の場合の割合値（12%) 、多型番地「000001」における多型パターン「多型 3」の場合の割合値 (8%) を求める。その結果は、例えば、図 1 3に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の割合値を並べて示されるマトリツタスとして表される。

このときに、もし「嗜好 a」が多型番地「000001」における多型パターンの相違による影響を全く受けないのであれば、上記算出した割合値（相対的な値）は、「多型 1 J、「多型 2」、「多型 3」のいずれにおいても同程度の値を示すはずである。この傾向は、図 1 1及ぴ図 1 2に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。

なお、図 1 3に示した結果を求める際には、図 1 1に示した出現頻度を用いる代わりに、例えば、統計解析用コンピュータ S T以外の外部機関が算出（統計的に処理）した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を示すデータ又は当該出現頻度を算出するための元データを用いても良い。この場合は、前記外部機関が当該出現頻度を求める際に基にしたゲノム関連情報に関連する個体の中に、個体関連情報 D B 4 1に含まれる個体関連情報に関連する個体が含まれていても含まれていなくても良い。

次に、図 1 3に示した割合値を用いて、各多型番地毎に、当該多型番地において取りうる各多型パターンの相対値を算出する。具体的には、図 1 3に示した結果では、例えば、「嗜好 a」において、多型番地「000001」の多型パターン「多型 1」における割合値は 90%、多型パターン「多型 2」における割合値は 12°ん多型パターン「多型 3」における割合値は 8%と表されるが、そのうち最小の割合値を示す多型パターン

(「多型 3」）の割合値 (8%) を基準にして、各多型パターンにおける割合値を「多型

3」の割合値（8%) で除す。すなわち多型パターン「多型 1」の相対値は 11. 25

(=90/8) 、「多型 2」の相対値は 1. 5 (=12/8) 、「多型 3」の相対値は 1. 0 (=8/8) となり、最小の割合値を示す「多型 3」の割合値を基準にした倍率として、各多型パターンの相対値を求める。その結果として、例えば図 1 4に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の相対値を並べて示されるマトリッタスとして表される。

このとき、もし「嗜好 a」が多型番地「000001」における多型パターンの相違による影響を全く受けないのであれば、上記算出した倍率（相対値）は、「多型 1」、「多型 2」、「多型 3」のいずれにおいても 1. 0に近い値を示すはずである。この傾向は、図 1 1及ぴ図 1 2に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。

次に、図 1 4に示した結果に基づいて、相対値が所定の値を超えた場合に、当該相対値を示す多型番地における多型パターンの相違力所定の個体関連情報に（該当するか否かに）関係していると判断する。具体的には、例えば、図 1 4に示した結果において、倍率（相対値）が閾値を超えた場合に、当該倍率を示す多型番地とその倍率とを抽出し、出力する。なお、当該閾値は、例えば、図 1 4に示した、所定の個体関連情報に該当する場合の全ての相対値を概観したうえで、統計的に算出することができる。

なお、図 1 4に示した相対値の算出方法によっては、相対値が所定の値を下回つた場合に当該相対値の多型番地における多型パターンの相違力 S、所定の個体関連情報に（該当するか否かに）関係していると判断してもよい。

また、抽出した倍率（相対値）が相対的に大きいほど、当該抽出した倍率を示す多型番地における多型パターンの相違が、所定の個体関連情報に（該当するか否かにおいて）より強く関係していると推定できる。すなわち、所定の個体関連情報に（該当するか否かにおいて）先天的（遺伝的）要素が強いと推定される。

さらにまた、図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得るまでの処理を、複数の個体関連情報について同時に並行して行った場合には、それぞれの個体関連情報について抽出された、それぞれの多型番地とその倍率（相対値）との傾向から、どの個体関連情報とどの個体関連情報とが互いに関連性があるのかが推定できる。

以上のように、図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得て、当該結果から判断を導くまでの処理を行うことにより、今まで先天的（遺伝的）影響との関連性が希薄と思われていた個体関連情報についても遺伝的影響を受けているか否かを調べることができる。すなわち、各人（個体）より入手する様々な種類の個体関連情報を用いることにより、従来、先天的（遺伝的）影響との関連性が希薄と思われた個体の性質等と遺伝との関連性を推定することができる。また、図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得て、当該結果から判断を導くまでの処理は、所定の個体関連情報（属性）に該当するか否かに拘わらず算出した多型パタ一ン毎の出現頻度を母数（図 1 1 ) にしているので、個体関連情報（属性）がどれだけ遺伝の影響を受けているかを定量的に表すことに向いている。これに対して、通常行われる相関解析の方法では、個体関連情報（属性）に該当する集団と該当しない集団とを比較しているので、個体関連情報（属性）が人の性格のように遺伝による影響が比較的少ないと思われるものの場合に遺伝的影響の度合いを表すのが困難となる。すなわち、人の性格のような個体関連情報（属性）の場合、個々人の "かくありたい" という願望などが起因して当該個体関連情報（属性）に該当しているか否かを判断すること自体が難しいため、母数に誤りが含まれることがあり正確に比較することが難しくなるからである。

なお、図 1 4に示した結果において、倍率（相対値）が閾値を超えた場合に当該倍率を示す多型番地とその倍率とを抽出する際に、図 1 1、図 1 2及び図 1 3に示した出現頻度や割合値及びそれらの算出根拠となった元の数値も抽出して併せて出力することが望ましい。この場合、図 1 1、図 1 2及び図 1 3に示した出現頻度や割合値及びそれらの算出根拠となった元の数値を、図 1 4に示した結果を使用する側で、データの信憑性を判断する材料として使用することができる。

その後、統計解析用コンピュータ S Tは、図 1 4に示した結果から抽出した多型番地とその倍率及び/又は併せて抽出した算出根拠となる元の数値を用いることにより、所定の個体関連情報と所定の多型番地との相関関係及ぴ多型パターンの種類による所定の個体関連情報への影響の差異という知見を得ることができる。そして統計解析用コンピュータ S Tは、得た知見を基に意味情報及び/又は当

該意味情報に関連する情報を創出することができる。例えば、図 1 4に示した結果から抽出した「倍率」は、そのまま意味情報として使用することが可能である。なお、統計解析用コンピュータ S Tは、図 1 4に示した倍率（相対値）の算出結果及び/又は図 1 4に示した算出結果から導かれた知見に基づいて創出した意味情報及ぴ Z又は当該意味情報に関連する情報を、逐次記録したデータベース（以下、参照用 D Bと称す）を構築することができる。

また、所定の個体関連情報（性質）に関して所定の多型番地との相関関係が見いだせない場合であっても、以下のようにして、 1又は複数の他の個体関連情報（性質）との組合せと所定の多型番地との相関関係を見いだすことができる。

例えば、「多汗症である」という個体関連情報（性質）と相関関係がある多型番地が見いだせなかったとする。また、「多汗症である」性質に関連性がある性質、例えば「よく水分を摂取する」性質及ぴ「塩辛いものを好む」性質については、それぞれ「多型番地 000001」及ぴ「多型番地 000101」に相関関係が見いだされたとする。ここで、所定の性質と他の性質との関連性とは、所定の性質を示す個体が他の性質を示す確率が所定の値、例えば 80%以上であることを意味する。前記関連性は. 例えば、所定の性質と他の性質を含むアンケートを実施した集計結果から導き出すことができる。例えば、所定の性質を有すると答えた回答者の中で、他の性質を有すると答えた回答者が 80%以上の場合は、所定の性質と他の性質との間に関連性があるとみなすことができる。

さらに、「よく水分を摂取する」性質を示す個体のうち 80%の個体は、「多型番地 000001」において「多型 1」を有しており、「塩辛いものを好む」性質を示す個体のうち 70%の個体は、「多型番地 000101」において「多型 2」を有していたとする。

以上の前提条件の基では、「多汗症である」という性質について、「多型番地 000001」及ぴ「多型番地 000101」との間に間接的な相関関係を見いだすことができる。すなわち、「多型番地 000001」において「多型 1」を有し、「多型番地 000101」において「多型 2」を有する個体のうち、 56% (0. 8 X 0. 7 = 0. 56) は「多汗症である」性質を示すことが間接的に見いだせる。

以上によって、「多型番地 000001」において「多型 1」を有し、「多型番地 000101」において「多型 2」を有する場合に、「多汗症である場合が多い（例えば「指数 5 6」）」という意味情報を創出することができる。さらに、創出した意味情報から、例えば、「生活留意情報」等の当該意味情報に関連する情報を導き出すこともできる。

統計解析用コンピュータ S Tは、以上のようにして、創出した意味情報及び/又は当該意味情報に関連する情報を共用コンピュータ 2に提供することができる。共用コンピュータ 2は、統計解析用コンピュータ S Tから提供された意味情報に基づいてメイン DB 1 4を構築したり、統計解析用コンピュータ S Tから提供された当該意味情報に関連する情報に基づいて情報提供用データベースを構築することができる。また、統計解析用コンピュータ S Tは、上述したように創出した意味情報及び/又は当該意味情報に関連する情報等を逐次記録して「参照用 D B」を構築し、当該「参照用 D B」をメイン DB 1 4として使用することによって、自らが共用コンビュータ 2として動作することもできる。

共用コンピュータ 2は、構築したメイン DB 1 4を用いて、以下のようにして利用者に対して所定の疾病の罹患可能性等の意味情報を提供することができる。すなわち、共用コンピュータ 2は、利用者が「物品及び/又はサービスの要求」として、例えば、所定の疾病に関する自分の罹患可能性を教えて欲しいと要求する場合に、当該罹患可能性等の意味情報を提供できる。

なお、本情報処理システムにおいて、「物品及び/又はサービス」としては、所定の疾病の罹患可能性に限定されず、例えば、個人（個体）の体質に適合した医薬品、食品及び嗜好品等の物品や、個人（個体）の体質，性質に適合した情報等のサ一ビスを含む意味である。

共用コンピュータ 2が利用者に対して所定の疾病の罹患可能性を提供する情報処理システムにおいては、共用コンピュータ 2のメモリー 7に記録された処理プログラム 1 3及ぴ個人用コンピュータ 3のメモリー 2 3に記録された処理プログラム 2 7が例えば、図 1 5及び図 1 6に示すようなフローチャートに従って情報処理動作する。なお、図 1 5及ぴ図 1 6に示すフローチャートにおいて、「（共）」と記載したステップは共用コンピュータ 2における処理を意味し、「（個）」と記載したステップは個人用コンピュータ 3における処理を意味している。

本情報処理システムは、ゲノム関連情報記録媒体 2 4を所持する各個人が個人用コンピュータ 3を用いて通信回線網 1を介して共用コンピュータ 2にアクセスし、共用コンピュータ 2のメイン DB 1 4に記録されている意味情報を利用するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報 2 8がそれぞれ記録されたゲノム関連情報記録媒体 2 4を用い、各個人がゲノム関連情報記録媒体 2

4にアクセスするようなシステムであってもよい。

この場合、先ず、ステップ A l (SA1) で、要求者が本システムを利用するにあたり、メモリー 2 3に記録されている処理プログラム 2 7を起動する。処理プロダラム 2 7によって、個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情報記録媒体 2 4にアクセスし、ゲノム関連情報記録媒体 2 4においてデータ Iとして記録されている「Gno.」を読み出す。読み出した「Gno. J は、メモリー部 2 6に格糸内する。

次に、ステップ A 2 (SA2) では、処理プログラム 2 7によって表示装置 2 2に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ 3に入力するとともに、個人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に「大腸がんの罹患可能性」及び「Gno.」を送信する。或いは、個人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に対して、「大腸がんの罹患可能性」及び「Gno.」を書き込む。

次に、ステップ A 3 (SA3) では、共用コンピュータ 2が「大腸がんの罹患可能性」及ぴ「Gno.」を受信する。受信した「大腸がんの罹患可能性」及び「Gno.」は、メモリ一部 A 1 0に要求情報として格納する。

次に、ステップ A 4 (SA4) では、要求情報を受信すると、メモリー 7に記録されている処理プログラム 1 3を起動してメイン DB14にアクセスする。なお、この処理プログラム 1 3は、共用コンピュータ 2における処理を行うものである。

次に、ステップ A 5 (SA5) では、処理プログラム 1 3に従って、メイン DB14に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」 (大腸がん）と一致するものを抽出する。

ステップ A 6 (SA6) では、メイン DB14に記録されているデータのなかから「大腸がんの罹患可能性」と一致した「分類（疾患名）」（大腸がん）に関連づけられた「多型番地」を読み出す。読み出した「多型番地」は、メモリー部 A 1 0に要求情報に関連づけた位置情報として格納する。すなわち、メモリー部 A 1 0には、所定の「Gno.」に対して「大腸がんの罹患可能性」及び「多型番地」が記録されることとなる。

次に、ステップ A 7 (SA7) では、メモリー部 A 1 0に記録されている「Gno.」及ぴ「多型番地」を個人用コンピュータ 3に送信するとともに、送信する「多型番地」に対応する「多型パターン」を提出する命令情報を個人用コンピュータ 3に送信する。また、このとき、要求情報の種類によっては、必要に応じて既往症や特徴等の付加的な情報の提出を命令してもよい。

次に、ステップ A 8 (SA8) では、共用コンピュータ 2から送信された「Gno.」、「多型番地」及び命令情報を受信する。受信した「Gno.」及び「多型番地」は、メモリー部 2 6に記録される。

次に、ステップ A 9 (SA9) では、受信した命令情報に従って、ゲノム関連情報記録媒体 2 4に記録されているデータ IIにアクセスする。ステップ A 1 0 (SA10) では、処理プログラム 2 7に従ってゲノム関連情報記録媒体 2 4に記録されているデータ IIを検索し、命令された多型番地の多型パターンを読み出し、多型番地と多型パタ一ンとを関連づけてメモリー部 2 6に記録する。このとき、データ Iに対してァクセスし、ステップ A 8で受信した「Gno.」が正しいか否かを確認することが好ましい。また、ステップ A 1 0では、多型パターンのほかにデータ III、データ IV及びデータ V に記録されている付加的な情報も同時に読み出し、必要に応じてメモリー部 2 6に記録してもよい。

次に、ステップ A l 1 (SA11) では、メモリー部 2 6に一時的に記録した多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を、

「Gno.」とともに通信回線網 1を介して共用コンピュータ 2に対して出力する。ステツプ A 1 2 (SA12) では、多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を共用コンピュータ 2で受信し、受信した多型パターンを多型番地と関連付けてメモリ一部 A 1 0に記録する。

また、本例では、ステップ A 7において、共用コンピュータ 2が「多型パターン」の提出を命令する命令情報を送出し、ステップ A 1 0において、個人用コンピュータ

3は命令情報に従って多型パターンをゲノム関連情報記録媒体 2 4から読み出している。しかしながら、本システムは、ステップ A 7において当該命令情報を送出しないシステムであってもよい。この場合、ステップ A 1 0において、個人用コンピュータ 3は、処理プログラム 2 7に従って、ステップ A 8で受信した多型番地に基づいてデータ IIを検索し、受信した多型番地の多型パターンを読み出す。そして、個人用コンピュータ 3は、ステップ A 1 1で多型パターン等を共用コンピュータ 2に対して出力する。この場合でも、共用コンピュータ 2は、ステップ A 1 2において、「大腸がんの罹患可能性」と一致した「分類（疾患名）」に関連づけられた「多型番地」の多型パターンを得ることができる。

次に、ステップ A 1 3 (SA13) では、メイン DB 1 4にアクセスし、受信した多型番地及び多型パターンと一致するものを検索する。具体的には、メイン DB 1 4において、一つの多型番地に対して複数の多型パターンが記録されており、受信した多型番地及ぴその多型パターンがメイン DB 1 4においてどの多型パターンに一致しているのかを検索する。

次に、ステップ A 1 4 (SA14) では、処理プログラム 1 3に従って、受信した多型パターンと—致した多型パターンに関連づけられている大腸がんに対する罹患可能性を読み出す。すなわち、ステップ A 1 4では、要求者が提出した多型番地及び多型パターンに従って、要求者の大腸がんに対する罹患可能性を読み出すことができる。読み出した罹患可能性は、要求者の「Gno.」と関連づけてメモリー部 A 1 0に格納する。このとき、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで格納してもよいし、付加的な情報から得られるその他の情報を要求者の「Gno.」に関連づけて格納しても良い。

次に、ステップ A 1 5 (SA15 ) では、メモリー部 A 1 0に格納した要求者の

「Gno.」及ぴ罹患可能性を意味情報として、通信回線網 1を介して個人用コンビュータ 3に対して送信する。ステップ A 1 6 (SA16) では、個人用コンピュータ 3が要求者の「Gno.」及び罹患可能性（意味情報）を受信する。受信した意味情報は、メモリー部 2 6に記録される。

次に、ステップ A 1 7 (SA17) では、処理プログラム 2 7に従って、メモリー部 2

6に記録された意味情報から大腸がんに対する罹患可能性を表示装置 2 2に表示する。なお、ステップ A 1 5からステップ A 1 7の代わりに共用コンピュータ 2が処理プログラム 1 3に従って意味情報を表示する画面を読み出し（作成し）、通信回線網 1を経由して個人用コンピュータ 3の表示装置 2 2に表示させることもできる。この場合においても、共用コンピュータ 2から個人用コンピュータ 3に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体 2 4 に記録したゲノム関連情報 2 8を用いて大腸がんに対する罹患可能性を得ることができる。

以上のように、本システムにおいては、個人の多型パターンを多型番地と関連づけて記録したゲノム関連情報記録媒体 2 4を用いることによって、メイン DB14に記録された意味情報を多型番地を介在させて個人が利用することができる。言い換えれば、本システムを利用する個人は、意味情報をゲノム関連情報記録媒体に記録しておく必要はなく、多型番地と多型パターンとを関連づけたゲノム関連情報 2 8を所有するだけで、様々な意味情報を得ることができる。

特に、意味情報は、上述したように、その種類が増加するとともに訂正が行われるため、メイン DB14を更新することによってより精度が高く、且つ、幅広い情報を含むものとなる。本システムによれば、このような意味情報の増加及ぴ訂正等に追従してメイン DB14を更新することによって、個人が最新の意味情報を利用することができる。

さらに、ゲノム関連情報 2 8を記録したゲノム関連情報記録媒体 2 4を用いることによって、利用者は本システムを利用するたび毎にゲノム関連情報を得るための検査をする必要がない。すなわち、利用者は、ー且、ゲノム関連情報記録媒体 2 4 を作製すれば、以降は本システムを利用して最新の意味情報を得ることができる。ゲノム関連情報 2 8を記録したゲノム関連情報記録媒体 2 4を利用者自身が保有する場合、本人のゲノム関連情報 2 8を外部の機関に委託して保管させる際の不安や当該機関に対する不正アクセスによりゲノム関連情報 2 8が流出するといつた危険性を回避することができる。一方、ゲノム関連情報記録媒体 2 4に複数の個人に関する複数のゲノム関連情報 2 8を記録して外部の機関に委託して保管させる場合、個々人がゲノム関連情報記録媒体 2 4を保有する場合と比較して、ゲノム関連情報記録媒体 2 4の取り扱いの不手際ゃゲノム関連情報記録媒体 2 4の損失といった事態を防止することができる。

特に、この図 1 5及ぴ図 1 6に示したフローチャートに従えば、ゲノム関連情報記録媒体 2 4に記録したゲノム関連情報 2 8の全てを通信回線網 1を介して出力する必要がなく、提出命令を受けた一部のゲノム関連情報 2 8のみを出力すればよレ、。したがって、本システムによれば、機密性の高い個人特有の多型番地及ぴ多型パターンの漏洩を防止することができる。また、この図 1 5及ぴ図 1 6に示したフローチャートに従えば、共用コンビユータ 2において要求者に提供する意味情報を得ているため、個人用コンピュータ 3においてメイン DB 1 4に記録されている情報を取り扱う必要がない。したがって、この図 1 5及び図 1 6に示したフローチャートに従えば、個人用コンピュータ 3の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができる。さらに、個人用コンピュータ 3においてメイン DB 1 4に記録されている情報を取り扱う必要がないため、個人用コンピュータ 3の処理プログラム 2 7を、ゲノム関連情報記録媒体 2 4を装着するカードドライブ等に併せて規格化しやすくなる。

ところで、本情報処理システムにおいては、共用コンピュータ 2のメモリー 7に記録された処理プログラム 1 3及び個人用コンピュータ 3のメモリー 2 3に記録された処理プログラム 2 7が例えば、図 1 7に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図 1 7に示すフローチャートにおいても、「（共）」と記載したステップは共用コンピュータ 2における処理を意味し、「（個）」と記載したステップは個人用コンピュータ 3における処理を意味している。

ここでは、先ず、ステップ B l (SB1) では、要求者が本システムを利用するにあたり、メモリー 2 3に記録されている処理プログラム 2 7を起動する。処理プログラム 2 7によって、個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情報記録媒体 2 4にアクセスし、ゲノム関連情報記録媒体 2 4においてデータ Iとして記録されている「Gno.」を読み出す。読み出した「Gno.」は、メモリー部 2 6に格納する。

次に、ステップ B 2 (SB2) では、処理プログラム 2 7によって表示装置 2 2に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ 3に入力するとともに、個人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に「大腸がんの罹患可能性」及ぴ「Gno.」を送信するとともに、メイン DB14の「分類（疾患名）」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての

「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」との提出を要求する。すなわち、要求者は、ステップ B2において、メイン DB14 の「分類（疾患名）」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」とからなる情報を要求する。

次に、ステップ B3 (SB3) では、共用コンピュータ 2が上記要求情報を受信する。共用コンピュータ 2は、要求情報を受信すると処理プログラム 1 3を起動する。そして、ステップ B4 (SB4) で、処理プログラム 1 3に従ってメイン DB14にアクセスする。

次に、ステップ B5 (SB5) では、処理プログラム 1 3に従って、メイン DB14に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」 (大腸がん）と一致するものを抽出する。ステップ B6 (SB6) では、処理プログラム 1 3に従って、メイン DB14にアクセスし、「大腸がんの罹患可能性」と一致する「分類（疾患名）」（大腸がん）に関連づけられた「多型番地」、当該多型番地に関連づけられた全ての「多型パターン」及び全ての多型パターンにおける「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部 A 1 0に要求情報に関連づけて格納する。すなわち、メモリー部 A 1 0には、所定の「Gno.」に対して「多型番地」、「多型パターン」及び「罹患可能性」が記録されることとなる。

次に、ステップ B 7 (SB7) では、メモリー部 A 1 0に記録されている「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」を、通信回線網 1を介して個人用コンピュータ 3に対して送信する。ステップ B8 (SB8) では、共用コンピュータ 2から送信された「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」を受信する。受信した「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部 2 6に記録される。

次にステツプ B9 (SB9) では、処理プログラム 2 7に従い、ゲノム関連情報記録媒体 2 4に記録されているデータ IIにアクセスする。このとき、ゲノム関連情報記録媒体 2 4に記録されているデータ Iにもアクセスし、受信した「Gno.」が正しいか否かを確認することが好ましい。

次に、ステップ BIO (SB10) では、処理プログラム 2 7に従って、ゲノム関連情報

2 8から、受信した「多型番地」と一致する多型番地における多型パターンを抽出する。そして、ステップ BIO (SB10) では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで、抽出した多型パターンと一致するものを検索する。ステップ Bll (SB11) では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで一致した多型パターンに関連づけられた「罹患可能性」を抽出するとともに、抽出した「罹患可能性」を出力する。これにより、要求者は、大腸がんに対する罹患可能性（意味情報）を得ることができる。このとき、ステップ B11では、データ III、データ IV及びデータ Vに記録されている付加的な情報も同時に読み出し、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで出力してもよい。

特に、図 1 7に示したフローチャートに従えば、ゲノム関連情報記録媒体 2 4に記録したゲノム関連情報 2 8を個人用コンピュータ 3以外の外部に対して全く出力することがない。すなわち、ゲノム関連情報 2 8は、ゲノム関連情報記録媒体 2 4 と個人用コンピュータ 3との間でのみ、やり取りされる。したがって、本システムによれば、機密性の高い個人特有のゲノム関連情報 2 8の漏洩をより確実に防止することができる。

ところで、本情報処理システムにおいては、共用コンピュータ 2のメモリー 7に記録された処理プログラム 1 3及び個人用コンピュータ 3のメモリー 2 3に記録された処理プログラム 2 7が例えば、図 1 8に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図 1 8に示すフローチャートにおいても、「（共）」と記載したステップは共用コンピュータ 2における処理を意味し、「（個）」と記載したステップは個人用コンピュータ 3における処理を意味している。

ここでは、先ず、ステップ C I (SC1) で、要求者が本システムを利用するにあたり、メモリー 2 3に記録されている処理プログラム 2 7を起動する。処理プログラム 2 7によって、個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情報記録媒体 2 4にアクセスし、ゲノム関連情報記録媒体 2 4においてデータ Iとして記録されている「Gno.」、データ IIとして記録されている全ての「多型番地」及び「多型パターン」を読み出す。読み出した「Gno.」、「多型番地」及び「多型パターン」は、メモリー部 2 6に格納する。次に、ステップ C 2 (SC2) では、処理プログラム 2 7によって表示装置 2 2に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」（要求情報）を個人用コンピュータ 3に入力するとともに、個人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に「大腸がんの罹患可能性」と、メモリー部 2 6に記録されている「Gno.」、「多型番地」及び「多型パターン」とを送信する。

次に、ステップ C 3 (SC3) では、共用コンピュータ 2が「大腸がんの罹患可能性」、「Gno.」、「多型番地」及び「多型パターン」を受信する。受信した「大腸がんの罹患可能性」は要求情報としてメモリ一部 A 1 0に記録され、「Gno.」、「多型番地」及ぴ「多型パターン」も、メモリー部 A 1 0に格納される。共用コンピュータ 2は、要求情報を受信すると処理プログラム 1 3を起動する。そして、ステツプ C4 (SC4) では、処理プログラム 1 3に従って、メイン DB14にァク

セスする。

次に、ステップ C5 (SC5) では、処理プログラム 1 3に従って、メイン DB14に記録されている「分類（疾患名）」を検索し、要求された「大腸がんの罹患可能性」 (大腸がん）と一致するものを抽出する。

ステップ C6 (SC6) では、処理プログラム 1 3に従って、メイン DB 1 4にアクセスし、メイン DB 1 4から「大腸がん」に分類された「多型番地」、当該多型番地に対する全ての「多型パターン」、及び当該多型パターンに対する「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部 A 1 0に格納される。

次に、ステップ C 7 (SC7) では、ステップ C3で受信した「多型番地」及び「多型パターン」に基づいて、ステップ C 6でメモリー部 A 1 0に格納したデータを検索し. 受信した「多型パターン」と一致した多型パターンに関連付けられた罹患可能性をメモリー部 A 1 0から抽出する。

ステップ C 8 (SC8) では、ステップ C7の結果、すなわち、ステップ C3で受信した情報に含まれる多型パターンがメイン DB 1 4のレ、ずれの多型パターンと一致するかに基づいて抽出した罹患可能性を、通信回線網 1を介して個人用コンピュータ 3に対して送信する。このとき、共用コンピュータ 2は、抽出した罹患可能性を要求者の「Gno.」とともに送信する。

次に、ステップ C9 (SC9) では、共用コンピュータ 2から送信された「Gno.」及ぴ「罹患可能性」（意味情報）を受信する。受信した「Gno.」及び「罹患可能性」は、メモリー部 2 6に記録される。このとき、ゲノム関連情報記録媒体 2 4に記録されているデータ Iにアクセスし、受信した「Gno.」が正しいか否かを確認することがでさる。

次に、ステップ CIO (SC10) では、処理プログラム 2 7に従って、メモリー部 2 6 に記録された意味情報から大腸がんに対する罹患可能性を表示装置 2 2に表示する。なお、ステップ C 8からステップ C 1 0の代わりに、共用コンピュータ 2が処理プログラム 1 3に従って意味情報を表示する画面を読み出し（作成し）、通信回線網 1を経由して個人用コンピュータ 3の表示装置 2 2に表示させることもできる。この場合においても、共用コンピュータ 2から個人用コンピュータ 3に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体 2 4に記録したゲノム関連情報 2 8を用いて大腸がんに対する罹患可能性を得ることができる。

特に、図 1 8に示したフローチャートに従えば、ゲノム関連情報記録媒体 2 4に記録したゲノム関連情報 2 8を全て共用コンピュータ 2に対して出力し、共用コンピュータ 2において要求者に提供する意味情報を得ている。このため、図 1 8に示したフローチャートに従えば、個人用コンピュータ 3と共用コンピュータ 2との間での情報の授受が比較的少ない回数で、要求者が意味情報を得ることができる。したがって、この図 1 8に示したフローチャートに従えば、個人用コンピュータ 3の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができるとともに、要求者にとっては非常に簡便に意味情報を得ることができる。

以上、説明したように本システムによれば、ゲノム関連情報記録媒体 2 4及ぴメイン DB 1 4において、「多型番地」及びその「多型パターン」のみを規格化しておけば、それ以外の特別なデータの規格化を必要としないので、広範囲な産業に利用することができる。すなわち、物品或いはサービスを提供する側は、ゲノム関連情報記録媒体 2 4を用いた情報提供に際して、多型パターンに対応する意味情報の規格化や、データ授受処理方法等の統一した規格を必要とせず、様々な方式で情報提供することができる。

さらにまた、本システムによれば、メイン DB 1 4をチェックすることで、第三者或レ、は第三者機関は共用コンピュータ 2に対する監視及ぴ管理を容易に行うことができる。したがって、本システムは、意味情報を提供する側に対する例えば行政的な管理を行うことができるため、意味情報を提供する側の健全性及び倫理管理を行うことができる。

一方、本情報処理システムにおいては、ゲノム関連情報記録媒体からデータ IIに含まれる情報を除いたもの、すなわちデータ I及び付加的にデータ III〜Vのみを有する記憶媒体を用いても良い。この場合、データ IIに含まれる情報は、通信回線網 1 を介して個人用コンピュータ 3と接続された外部のデータベース（ゲノム関連情報記録媒体）に記録しておく。このようなシステムの場合、例えば、上述したステツプ A 1 0において、通信回線網 1を介して外部のデータベースにアクセスし、命令された多型番地の多型パターンを読み出し、多型番地と多型パターンとを関連づけてメモリー部 2 6に記録することができる。したがって、このようなシステムであつても、図 1 5及ぴ図 1 6に示したフローチャート、図 1 7に示したフローチャート及ぴ図 1 8に示したフローチャートと同様に、要求者は意味情報を得ることができる。

さらに、本情報処理システムにおいては、要求者がゲノム関連情報記録媒体 2 4 及び前記ゲノム関連情報記録媒体からデータ IIに含まれる情報を除いた記録媒体のいずれも有さず、通信回線網 1を介して個人用コンピュータ 3と接続したゲノム関連情報記録媒体 2 4を備えるものであっても良い。このようなシステムの場合、要求者は、通信回線網 1を介してゲノム関連情報記録媒体 2 4にアクセスし、ゲノム関連情報記録媒体 2 4に記録された「多型番地」及び「多型パターン」等の情報を個人用コンピュータ 3にダウンロードできる。なお、この場合、ゲノム関連情報記録媒体 2 4は、複数の個人に関するゲノム関連情報を個人毎（「Gno.」毎）に記録したものであっても良い。

さらにまた、本発明は、上述したような共用コンピュータ 2がメイン DB 1 4を有するような構成に限定されず、例えば、共用コンピュータ 2と通信回線網 1を介して接続されたメイン DB 1 4を備える情報処理システムにも適用される。この場合、共用コンピュータ 2は、図 1 5及び図 1 6に示したフローチャート、図 1 7に示したフローチヤ一ト或いは図 1 8に示したフローチヤ一トにおいて、メイン DB 1 4に対して通信回線網 1を介してアクセスする。この場合でも、本情報処理システムによれば、図 1 5及び図 1 6に示したフローチャート、図 1 7に示したフローチヤ一ト或いは図 1 8に示したフローチャートに従って要求者が所望の意味情報を得ることができる。

特に、この場合、共用コンピュータ 2は、異なる機関又は団体が有する複数のメイン DB 1 4に対して通信回線網 1を介してアクセスし、これら複数のメイン DB 1 4 に含まれる意味情報を使用して、要求者に対する情報提供を行うことが可能となる。すなわち、本情報処理システムにおいては、図 1 5及び図 1 6に示したフローチヤートにおけるステップ A 5で、図 1 7に示したフローチャートにおけるステップ B 5 で、或いは図 1 8に示したフローチャートにおけるステップ C 5で、共用コンビユータ 2が大腸がんの罹患可能性に関する情報を意味情報として有する様々なメィン DB 1 4にアクセスする。これにより、本情報処理システムによれば、要求者は、様々なメイン DB 1 4に含まれる情報に基づいて、大腸がんの罹患可能性に関する情報を得ることができる。

また、本システムは、図 1 5及び図 1 6に示したフローチヤ一ト、図 1 7に示したフローチャート、或いは図 1 8に示したフローチャートにおいて、共用コンビュータ 2が、いわゆるエージェントに対して、少なくとも個人用コンピュータ 3から受け取った要求情報を送信し、意味情報（本例においては、「大腸がんに関する罹患可能性」）を、当該エージェントを介して得るものであってもよい。

本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。産業上の利用の可能性

以上、詳細に説明したように、本発明によれば、個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関連する情報を提供できる情報処理システムを構築することができ、特に、当該意味情報を創出することができる情報処理システムを構築することができる。

Claims

請求の範囲

1 . 所定の個体に関する塩基配列関連情報を受け取るステップ aと、

塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置から、前記受け取つた塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定するステツプ bと、

を有する塩基配列に関する情報処理方法。

2 . 前記ステツプ aでは、予め決まつた位置情報に対応する塩基配列関連情報を受け取ることを特徴とする請求項 1記載の情報処理方法。

3 . 前記ステップ bで特定した塩基配列関連情報群が複数ある場合には、所定の個体に関する塩基配列関連情報の受け取りと、複数の塩基配列関連情報群の中で、当該受け取つた塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すステップ cを更に有することを特徴とする請求項 1記載の情報処理方法。

4 . 前記所定の個体に関する個体関連情報を受け取るステップ dを更に有し、前記ステップ a、ステップ b及びステップ dを複数の個体に関して行い、当該複数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する複数の個体関連情報とをそれぞれ関連付けたデータベースを構築することを特徴とする請求項 1記載の情報処理方法。

5 . 前記データベースに含まれる複数の個体に関する複数の個体関連情報と、前記データベースに含まれる若しくは含まれなレ、複数の個体に関する複数の塩基配列関連情報群又は当該複数の塩基配列関連情報群を統計的に処理した結果とを統計的に処理して、塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を創出することを特徴とする請求項 4記載の情報処理方法。

6 . 複数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する複数の個体関連情報とをそれぞれ関連付けて構築されたデータベースに含まれる複数の個体に関する複数の個体関連情報と、前記データベースに含まれる若しくは含まれない複数の個体に関する複数の塩基配列関連情報群又は当該複数の塩基配列関連情報群を統言+的に処理した結果とを統計的に処理して創出された塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を取得し、

取得した意味情報及び/又は当該意味情報に関連する情報を用いて、物品及び/又はサービスの要求情報に応じた意味情報及び/又は当該意味情報に関連する情報を提供するための記憶装置の記憶内容を構築することを特徴とする塩基配列に関する情報処理方法。