JP4266008B2 - 塩基配列関連情報を用いた情報処理システム - Google Patents
塩基配列関連情報を用いた情報処理システム Download PDFInfo
- Publication number
- JP4266008B2 JP4266008B2 JP2004553203A JP2004553203A JP4266008B2 JP 4266008 B2 JP4266008 B2 JP 4266008B2 JP 2004553203 A JP2004553203 A JP 2004553203A JP 2004553203 A JP2004553203 A JP 2004553203A JP 4266008 B2 JP4266008 B2 JP 4266008B2
- Authority
- JP
- Japan
- Prior art keywords
- related information
- base sequence
- information
- individual
- sequence related
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 73
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000003672 processing method Methods 0.000 claims description 14
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims 3
- 238000007619 statistical method Methods 0.000 description 63
- 238000004891 communication Methods 0.000 description 38
- 206010009944 Colon cancer Diseases 0.000 description 37
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 35
- 201000010099 disease Diseases 0.000 description 28
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 28
- 238000000034 method Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000008520 organization Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 5
- 208000008454 Hyperhidrosis Diseases 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 230000037315 hyperhidrosis Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 208000029742 colonic neoplasm Diseases 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
同時に、このようなゲノム塩基配列情報に含まれる塩基配列を用いて、ゲノム創薬の研究や遺伝情報の解析等が盛んに行われており、一塩基多型に代表されるような個体間における塩基配列の相違が注目されている。一般に、個体間における塩基配列の相違とは、所定の塩基の相違が個体種中1%以上の頻度で存在すると定義される多型と、所定の塩基の相違が個体種中1%未満であるバリエーションとを意味している。特に、多型には、個体間における1個の塩基の相違である一塩基多型(SNP;Single Nucleotide Polymorphism)、1から数十塩基(数千塩基の場合もある)が欠失又は挿入している挿入/欠失多型、2から数十塩基を1単位とする配列の繰り返し回数が相違するVNTR(Variable Number of Tandem Repeat)やマイクロサテライト多型(繰り返し配列が2〜4塩基程度のもの)が知られている。
このような多型は、個体間におけるタンパク質のアミノ酸配列の相違や、個体間における所定の遺伝子に関する発現効率の相違等に影響を及ぼすことがある。このような影響により、例えば、所定の疾病に対する罹患可能性が個体間で異なったり、所定の薬剤に対する感受性が個体間で異なることが知られている。
ところが、多型等の個体間における塩基配列情報の相違を有効に利用して、各個体にとって有益な意味情報を提供するようなシステムは構築されていないのが現状である。
上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する塩基配列関連情報を受け取った後、個体毎に塩基配列関連情報群を有する記憶装置から前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定する方法である。本方法によれば、塩基配列関連情報群を特定することによって、前記受け取った塩基配列関連情報が帰属する個体を特定することもまたできる。
また、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関する個体関連情報を受け取り、特定した塩基配列関連情報群若しくは個体と、前記受け取った個体関連情報とを関連付けて記憶することで、当該個体関連情報と個体に関する塩基配列関連情報群とを関連付けることができる。
なお、本発明に係る塩基配列に関する情報処理方法において、塩基配列関連情報群を特定する際には、例えば、予め決まった位置情報に対応する塩基配列関連情報を受け取り、当該受け取った塩基配列関連情報を用いることができる。また、本発明に係る塩基配列に関する情報処理方法においては、所定の個体に関する塩基配列関連情報の受け取りと、当該受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定すまで繰り返すこともできる。
さらに、本発明に係る塩基配列に関する情報処理方法は、所定の個体に関して個体関連情報を受け取ることによって、当該所定の個体に関する塩基配列関連情報群と個体関連情報とを関連付けたデータベースを構築することもできる。
本発明に係る塩基配列に関する情報処理方法は、前記データベースに含まれる複数の個体に関する複数の個体関連情報及び複数の個体に関する塩基配列関連情報群を統計的に処理することで、塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を創出することができる。このとき、当該複数の個体に関する塩基配列関連情報群は、前記データベースに含まれていても、含まれていなくても良い。また、統計的に処理した結果と複数の個体に関する複数の個体関連情報とを用いて更に統計的に処理することによって、意味情報及び/又は当該意味情報に関連する情報を創出してもよい。
一方、本発明に係る塩基配列に関する情報処理方法は、創出された塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を受け取り、受け取った意味情報及び/又は当該意味情報に関連する情報を用いて、物品及び/又はサービスの要求情報に応じた意味情報及び/又は当該意味情報に関連する情報を提供するための記憶装置の記憶内容を構築することもできる。
なお、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及び記憶装置等のハードウェアを備えるコンピュータに、各ステップを実行させるプログラムとして実現することができる。また、本発明に係る塩基配列に関する情報処理方法は、制御装置、送受信装置及び記憶装置等のハードウェアを備えるコンピュータに、各ステップを実行させるプログラムを記録した記録媒体として実現することもできる。さらに、本発明に係る塩基配列に関する情報処理方法は、各ステップを実行する制御装置、送受信装置及び記憶装置等のハードウェアを備える情報処理装置として実現することもできる。
その他、本発明は、請求項各項に記載されている通りの構成を有するものである。
本明細書は本願の優先権の基礎である日本国特許出願2002−336916号の明細書および/または図面に記載される内容を包含する。
図2は、共用コンピュータの構成を概略的に示す概略構成図である。
図3は、メインDBに記録されたデータの一例を示す構成図である。
図4は、統計解析用コンピュータの構成を概略的に示す概略構成図である。
図5は、ゲノム関連情報DBに記録されたデータの一例を示す構成図である。
図6は、個体関連情報DBに記録されたデータの一例を示す構成図である。
図7は、個人用コンピュータの構成を概略的に示す概略構成図である。
図8は、ゲノム関連情報記録媒体に記録されたデータの一例を示す構成図である。
図9は、個体関連情報とゲノム関連情報とを関連連付ける情報処理システムにおいて、統計解析用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図10は、個体関連情報収集画面の一例として示す画面イメージである。
図11は、ゲノム関連情報DBの全データから、多型番地における各多型パターンの出現頻度を算出したデータの一例を示す構成図である。
図12は、ゲノム関連情報DBと個体関連情報DBとを用いて、個体関連情報について多型番地毎の各多型パターンの出現頻度を算出したデータの一例を示す構成図である。
図13は、図11及び図12に示したデータから、個体関連情報について多型番地毎の各多型パターンの割合値を算出したデータの一例を示す構成図である。
図14は、図13に示したデータから、個体関連情報について多型番地毎の各多型パターンの相対値を算出したデータの一例を示す構成図である。
図15は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図16は、図15の続きであり、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図17は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの他の処理を示すフローチャートである。
図18は、所定の疾病に対する罹患可能性を提供するシステムにおいて、共用コンピュータ及び個人用コンピュータでの更に他の処理を示すフローチャートである。
本発明を適用した実施の形態として、利用者に対して所定の疾病の罹患可能性等の意味情報を提供する情報処理システムにおいて、当該意味情報を創出するシステムについて説明する。すなわち、情報処理システムは、利用者に対して提供する罹患可能性等の意味情報を、個体に関する情報(以下、個体関連情報)から創出するシステムである。
以下の説明においては、個体関連情報から意味情報を創出する情報処理システムについて説明するが、説明の都合上、簡略化したモデルとして説明する。情報処理システムは、図1に示すように、インターネット等の通信回線網1と、通信回線網1に接続された共用コンピュータ2と、通信回線網1に接続された少なくとも1以上の個人用コンピュータ3と、通信回線網1に接続された統計解析用コンピュータSTとを備え、通信回線網1を介して共用コンピュータ2と個人用コンピュータ3と統計解析用コンピュータSTとの間のデータ通信を可能としている。
共用コンピュータ2は、図2に示すように、当該共用コンピュータ2の動作を全て制御するCPU4と、情報及びプログラムの実行指示等を入力できるキーボード及びマウス等の入力装置5と、ディスプレイ装置等の表示装置6と、一時的な情報及び書き換え不可能な情報等が記録されるメモリー7と、各種データを格納しているデータベース8と、これらメモリー7及びデータベース8に対して所定の情報を書き込む記録装置9と、通信回線網1を介して個人用コンピュータ3との間で情報の送受信を行う送受信装置17とから構成されている。
共用コンピュータ2におけるメモリー7は、それぞれ異なる種類の情報を記録するメモリー部A10及びメモリー部B11と、例えば個人用コンピュータ3や表示装置6に表示させる画像データを記録した画面メモリー12と、本システムを動作させるための処理プログラム13とから構成されている。なお、共用コンピュータ2においては、画面メモリー12及び処理プログラム13等を内部のメモリー7に有さず、通信回線網1を介して共用コンピュータ2と接続された外部記憶装置(図示せず)に有するものであってもよい。
共用コンピュータ2におけるデータベース8(記憶装置)は、多型番地、多型パターン及び意味情報が記録されたメインDB14と、メモリー部A10に記録された情報を保存する保管用DB−A15と、メモリー部B11に記録された情報を保存する保管用DB−B16とから構成されている。メインDB14は、図3に示すように、多型番地と、当該多型番地で取りうる複数の多型パターンと、当該複数の多型パターンそれぞれを意味づける意味情報とが関連付けられて記録されている。また、メインDB14には、複数の多型番地における多型パターンの組合せ(例えば、ハプロタイプ)を意味づける意味情報が記録されていても良い。
ここで、「多型番地(位置情報)」とは、少なくとも、塩基配列における多型が存在する位置を意味する。なお、一般的に多型とは、例えば、いわゆるSNP(single nucleotide polymorphism)、RFLP(restriction fragment length of polymorphism)、VNTR(variable number of tandem repeat)、マイクロサテライト等を含んでいる。しかし、本明細書において使用する「多型」は、これらに限定されず、個体種中1%未満の頻度でしか存在しない塩基及び塩基配列の変化(バリエーション)も含む意味とする。したがって、「多型番地」は、個体種中1%未満の頻度でしか存在しない塩基及び塩基配列の変化を示す、塩基配列における位置も含む意味である。すなわち、「多型番地」とは、数値、文字及び記号等を組み合わせて、多型等を示す位置を表すものである。多型番地は、特に限定されないが、例えば、染色体番号と多型が存在する遺伝子を表す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせにより表記することもできるし、多型が存在する遺伝子を示す記号と当該遺伝子における多型の存在位置を示す数値との組み合わせであってもよい。
また、多型番地は、多型毎に付与される多型固有の表記であっても良い。多型番地として多型固有の表記を使用する場合、多型番地は塩基配列中の位置を直接的には示さないが、多型固有の表記に基づいて間接的に位置を知ることができる。したがって、「多型番地」は、多型固有の表記も含む意味である。
「多型パターン(塩基配列関連情報)」とは、個体間において相違する塩基配列の情報であり、少なくとも、多型における塩基又は塩基配列のパターンを含む意味である。さらに「多型パターン」は、多型に限らず、個体種中1%未満の頻度でしか存在しない塩基及び塩基配列のパターンも含む意味である。
例えば、A又はGを取ることが知られている多型番地において、「多型パターン」は、「A」及び「G」のいずれかで表される。また、「多型パターン」は、相同染色体におけるヘテロ接合体又はホモ接合体を示すものであってもよい。この場合、例えば、A又はGを取ることが知られている多型番地において、「多型パターン」は、「AA」、「GG」及び「AG」のいずれかで表現できる。さらに、「多型パターン」は、所定の多型番地で取りうるパターンを直接的に表記するものではなく、間接的に表記するものであっても良い。すなわち、「多型パターン」は、例えば、A又はGを取ることが知られている多型番地において「A」を取る場合に「アレル1」とし、「G」を取る場合に「アレル2」と表記してもよい。また、「多型パターン」が上述したように「AA」、「GG」及び「AG」のいずれかで表現できる場合、例えば、「AA」で表現できるときに「α」、「GG」で表現できるときに「β」、「AG」で表現できるときに「γ」と表記してもよい。その他「多型パターン」の表記例としては、多型がマイクロサテライトの場合には「繰り返し数」を表す数値で、多型が挿入、欠失型の場合には「有/無」を表す記号で表記してもよい。
また更に、各多型番地における「多型パターン」は、所定の規則や取り決めに従って、例えば、「多型1」、「多型2」、「多型3」等と表記されても良い。例えば、各多型番地において、「多型パターン」がとり得る頻度の高い順に、「多型1」、「多型2」、「多型3」と表記できる。この場合、例えば、各多型番地におけるそれぞれの「多型1」は必ずしも同じ内容を表すものではない。すなわち、例えば、ある多型番地の「多型1」は最もとり得る頻度が高い「AA」を表し、別の多型番地「多型1」は最もとり得る頻度が高い「GG」を表すことになる。なお、本実施の形態においては、「多型パターン」を「多型1」、「多型2」及び「多型3」等のいずれかで表記する方法を使用している。ところで、本システムにおいては、多型パターンは、暗号化されていても暗号化されていなくても差し支えない。
ここで、「意味情報」とは、「多型パターン」に関連づけられた情報であり、例えば、薬剤に対する応答性、薬剤に対する副作用、疾患及び障害に対するリスク、体質・性質、体質・性質等に基づく生活習慣アドバイス、タンパク質相互作用など、「多型パターン」の相違に起因する様々な情報を意味する。
なお、「意味情報」としては、「多型パターン」の相違に起因する様々な情報を直接表しても良く、また、当該情報を意味する記号などを用いて間接的に表しても良い。「意味情報」は、ゲノム・遺伝子に関する研究が進むことにより種類が増加するとともに訂正が行われる種類の情報であり、常にバージョンアップすることが好ましい。すなわち、「意味情報」は、ゲノム・遺伝子の研究成果を用いてデータベースを更新することによって、蓄積量が増加・減少してより精度の高いものとなる。
なお、直接「多型パターン」には関連づけられていないが「意味情報」から更に導き出される情報は、「意味情報に関連する情報」である。「意味情報」が「疾患に対するリスク」である場合、当該リスクがある一定の水準を超えたときに、例えば特定の「健康診断検査項目」が導き出される。この特定の「健康診断検査項目」が「意味情報に関連する情報」である。
本実施の形態において意味情報は、図3に示すように、少なくとも、所定の「多型番地」及び「多型パターン」に関連づけられた「多型パターンに対する注釈情報」としてメインDB14に記録されている。また、意味情報には、所定の「多型番地」に対応する「多型分類」及び「分類(疾患名)」等が関連づけられている。すなわち、所定の「多型番地」が所定の「多型パターン」である場合、疾患名の種類と当該疾患に対する罹患可能性を示す注釈情報(意味情報)を得ることができる。したがって、例えば、意味情報は、複数の多型番地に対応するそれぞれの多型パターンの組み合わせ(例えば、ハプロタイプ)に対して関連付けることもできる。すなわち、複数の多型番地における多型パターンの組み合わせ毎に、所定の疾患に対する異なる罹患可能性を示す注釈情報(意味情報)を関連付けることができる。この場合、複数の多型番地が所定の多型パターンの組み合わせである場合、所定の疾患に対する罹患可能性を示す注釈情報(意味情報)を得ることができる。
また、意味情報には、所定の基準で決定した「公開レベル」を関連づけることもできる。例えば、「公開レベル」を決定する際の基準としては、意味情報、すなわちここでは「分類(疾患名)」の罹患可能性を公開することによる個人に対する不測の不利益等を考慮して定めることができる。詳細には、共用コンピュータ2において、法律、規則又は自らの行動基準若しくは利用者との契約等に鑑みて、公開することが相応しくない意味情報については、公開しないような「公開レベル」を決定することができる。この場合、本システムでは、公開不可を意味する「公開レベル」に関連付けられた罹患可能性を示す注釈情報については、利用者に対して開示することはない。これにより、利用者に対して不測の不利益となりうる意味情報を与えることや、契約者以外に意味情報が開示されることを防止できる。
なお、利用者がインフォームドコンセント等により、所定の「公開レベル」を関連づけた意味情報の開示を容認することにより、利用者に対して、所定の「公開レベル」が関連づけられた意味情報を公開するようなシステムであってもよい。
また、「公開レベル」は、例えば「1,2,3、…」又は「a,b,c,…」といった3以上の複数の段階として設定することができる。この場合、共用コンピュータ2側では、利用者の年齢、資格及び利用者との契約の有無等、利用者の種類に応じてレベルを設定することができる。なお、インフォームドコンセント等によって、所定の公開レベル以上(又は未満)の公開レベルに関連付けられた罹患可能性を示す注釈情報のみが利用者側に対して提供されるように、当該利用者側が公開レベルを選択することもできる。
なお、データベース8において、保管用DB−B16には、例えば、本システムを利用する要求者個人の遺伝情報である塩基配列関連情報といったデータを記録することができる。また、保管用DB−A15には、例えば、本システムを利用する要求者を特定する情報といったデータを記録することができる。このように、保管用DB−A15及び保管用DB−B16に、個人の遺伝情報と個人を特定する情報とを分けて記録することによって、要求者の遺伝情報と、要求者を特定するデータとを関連付け難くなる。
なお、共用コンピュータ2は、データベース8を内部に有するものに限定されず、通信回線網1を介して共用コンピュータ2に接続された外部データベース(図示せず)を有するものであってもよい。また、共用コンピュータ2は、内部に複数のデータベース8を有するものであってもよいし、内部のデータベース8と通信回線網1を介して共用コンピュータ2に接続された外部データベースとを有するものであっても良い。
統計解析用コンピュータSTは、図4に示すように、当該統計解析用コンピュータSTの動作を全て制御するCPU30と、情報及びプログラムの実行指示等を入力できるキーボード、マウス等の入力装置31と、ディスプレイ装置等の表示装置32と、一時的な情報及び書換え可能な情報や書換え不可能な情報等が記録されるメモリー33と、各種データを格納しているデータベース34と、これらメモリー33及びデータベース34に対して所定の情報を書き込む記録装置35と、通信回線網1を介して共用コンピュータ2及び個人用コンピュータ3との間で情報の送受信を行う送受信装置36とから構成されている。
統計解析用コンピュータSTにおけるメモリー33は、個人用コンピュータ3から送られた多型パターン等を一時的に記録したり、統計解析結果等を記録するメモリー部37と、例えば個人用コンピュータ3や共用コンピュータ2や表示装置32に表示させる画像データを記録した画面メモリー38と、本システムを動作させ、複数の個人(個体)に関する「個体関連情報」と複数の個人(個体)に関する「ゲノム関連情報」とを用いて、例えば、所定の疾患に対する罹患可能性を示す注釈情報といった意味情報を創出する処理プログラム39とが記録されている。なお、当該処理プログラム39によれば、先ず、複数の個人(個体)に関する「ゲノム関連情報」と複数の個人(個体)に関する「個体関連情報」とを集積した後、当該「ゲノム関連情報」と当該「個体関連情報」とを用いて統計的に処理することで、所定の疾患に対する罹患可能性を示す注釈情報(意味情報)等を得ることができる。なお、統計解析用コンピュータSTにおいては、処理プログラム39やメモリー部37を内部のメモリー33に有さず、通信回線網1を介して統計解析用コンピュータSTに接続された外部記憶装置(図示せず)に有するものであっても良い。
ここで、「個体関連情報」とは、個体の性質、心理的状態、体質、体調、健康状態、病歴、生活習慣、行動・思考パターン、癖及び嗜好等、所定の個体に関するあらゆる情報が含まれる。例えば、個体関連情報としては、予め準備された質問等に対して利用者等の個人(個体)が回答することから得られる情報、或いは、例えば、利用者等が医療機関や検査機関等で検査を受けることによって得られる情報を挙げることができる。
また、「ゲノム関連情報」とは、所定の個体に関する複数の「多型パターン」をそれぞれ所定の「多型番地」に関連付けたデータの群(塩基配列関連情報群)である。
統計解析用コンピュータSTにおけるデータベース34(記憶装置)は、複数の個人(個体)に関する「ゲノム関連情報」を各個人(個体)毎に記録した「ゲノム関連情報DB40」(図5に示す)を有している。なお、「ゲノム関連情報DB40」に記録された「ゲノム関連情報」は、直接個人(個体)を特定する情報と結びつかないように匿名化されていることが望ましい。
また、データベース34は、個人用コンピュータ3より受信した「個体関連情報」を各個人(個体)毎に記録した「個体関連情報DB41」(図6に示す)を有している。なお、「個体関連情報DB41」に記録された「個体関連情報」は、直接個人(個体)を特定する情報と結びつかないように匿名化されていることが望ましい。
なお、統計解析用コンピュータSTは、前記データベース34を内部に有するものに限定されず、通信回線網1を介して統計解析用コンピュータSTに接続された外部データベース(図示せず)に対してアクセスするものであっても良い。
個人用コンピュータ3は、図7に示すように、当該個人用コンピュータ3の動作を全て制御するCPU20と、情報及びプログラムの実行指示等を入力できるキーボード及びマウス等の入力装置21と、ディスプレイ装置等の表示装置22と、一時的な情報及び書き換え可能な情報等が記録されるメモリー23と、ゲノム関連情報記録媒体24からデータを読み取る読取り装置25と、通信回線網1を介して共用コンピュータ2との間で情報の送受信を行う送受信装置29とから構成されている。なお、個人用コンピュータ3は、通常のコンピュータに限定されず、例えば、携帯電話、個人携帯端末及びその他の移動体通信機器等、いかなる形態であってもよい。
個人用コンピュータ3におけるメモリー23は、ゲノム関連情報記録媒体24からの情報等を記録するメモリー部26を有し、本情報処理システムを動作させる処理プログラム27が記録されている。
ゲノム関連情報記録媒体24には、個人のゲノム関連情報28が記録されている。ゲノム関連情報記録媒体24としては、例えば、磁気ディスクや磁気カード等の磁気記録媒体、光磁気記録方式や相変化記録方式等を適用した光学式記録媒体、半導体メモリー等を挙げることができる。また、このゲノム関連情報記録媒体24は、カード状、ディスク状、スティック状、テープ状又はドラム状等いかなる形態であってもよい。さらに、このゲノム関連情報記録媒体24は、単一の個人(個体)のゲノム関連情報28を記録したものであってもよいが、複数の個人(個体)に関する複数のゲノム関連情報28を記録したものであってもよい。
ゲノム関連情報記録媒体24に含まれるゲノム関連情報28とは、少なくとも、「多型番地」及び個人(個体)の塩基配列を解析した結果として得られる所定の多型番地における「多型パターン」を意味する。また、ゲノム関連情報28には、既往症、特徴、カルテ情報、健康診断結果といった各種情報を含んでいてもよい。
ゲノム関連情報記録媒体24には、ゲノム関連情報28として、例えば、図8に示すように、データIとしてゲノム関連情報28に固有の個別番号「Gno.」(ジーナンバー)及び生年月日等の個人情報を記録し、データIIとして多型番地及び多型パターンを記録し、データIIIとして既往症を記録し、データIVとして特徴を記録し、データVとしてカルテ情報等を記録する。すなわち、ゲノム関連情報28は、データI、データII、データIII、データIV及びデータVから構成されている。データI及びデータIIには必須の情報が含まれており、データIII、データIV及びデータVには付加的な情報から構成されている。
ゲノム関連情報28においては、塩基配列上の位置に対応する「多型番地」と、当該多型番地における「多型パターン」とをリンクさせて記録している。また、データIIには、所定の多型番地における付加的な情報を「コメント」として、「多型番地」にリンクさせて記録していてもよい。なお、データIIには、所定の個体に関する全塩基配列を記録しても良い。データIIに全塩基配列を記録した場合であっても、データII内に「多型番地」及び「多型パターン」が含まれることとなる。
なお、本発明において、個人用コンピュータ3及びゲノム関連情報記録媒体24は、それぞれ図7及び図8に示したような構成に限定されず、例えば、ゲノム関連情報記録媒体が処理プログラムを有するメモリー部を備え、個人用コンピュータが当該ゲノム関連情報記録媒体を装着して処理プログラムを動作させるような構成であってもよい。この場合、個人用コンピュータは、ゲノム関連情報記録媒体のメモリー部に記録された処理プログラムに従って動作できる。
以上のように構成された情報処理システムにおいては、統計解析用コンピュータSTのメモリー33が有する処理プログラム39及び個人用コンピュータ3のメモリー23に記録された処理プログラム27が例えば、図9に示すようなフローチャートに従って情報処理動作する。なお、図9に示すフローチャートにおいて、「(統)」と記載したステップは統計解析用コンピュータSTにおける処理を意味し、「(個)」と記載したステップは個人用コンピュータ3における処理を意味している。
本情報処理システムは、ゲノム関連情報記録媒体24を所持する各個人が個人用コンピュータ3を用いて通信回線網1を介して統計解析用コンピュータSTにアクセスし、各個人(個体)に関する「個体関連情報」を統計解析用コンピュータSTの「個体関連情報DB41」に、「ゲノム関連情報DB40」の中のゲノム関連情報と関連付けて登録するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報28がそれぞれ記録されたゲノム関連情報記録媒体24を用い、各個人がゲノム関連情報記録媒体24にアクセスするようなシステムであってもよい。
このとき、先ず要求者は、ステップ1(S1)で、通信回線網1を介して統計解析用コンピュータSTにアクセスし、統計解析用コンピュータSTに対して個体関連情報の登録を行う旨の意思表示を行う。ステップ1では、統計解析用コンピュータSTが提供するウェブページにアクセスして前記意思表示を行っても良いし、統計解析用コンピュータSTに対して電子メール等を用いてアクセスして前記意思表示を行っても良い。なお、本例においては、要求者が自らの個体関連情報を登録する場合について述べるが、これに限定されず、要求者が自分以外の個人(個体)に関する個体関連情報を登録することもできる。
次に、統計解析用コンピュータSTは、前記意思表示を個人用コンピュータ3から受信した後、ステップ2(S2)で、画面メモリー38から、図10に示すような「個体関連情報収集画面」を読み出し、個人用コンピュータ3の表示装置22に表示する。ステップ2では、統計解析用コンピュータSTが提供するウェブページに個人用コンピュータ3がアクセスした状態で個体関連情報収集画面を表示しても良いし、個人用コンピュータ3に対して送信した個体関連情報収集画面データに基づいて個人用コンピュータ3の表示装置22に表示しても良い。
次に、個人用コンピュータ3は、ステップ3(S3)で、個体関連情報収集画面に従って、要求者自身の個体関連情報を入力する。すなわち、要求者は、個体関連情報収集画面に表示されている設問に対して回答し、当該個体関連情報収集画面に回答内容を入力する。或いは、要求者は、個体関連情報収集画面に表示されている設問に対する回答を、当該個体関連情報収集画面とは異なる回答用画面に入力しても良い。また、ステップ3では、個体関連情報として利用者(要求者)等が医療機関や検査機関等で検査を受けることによって得た情報を入力しても良い。
次に、個人用コンピュータ3は、ステップ4(S4)で、個体関連情報収集画面に表示されている設問に対する回答(個体関連情報)を統計解析用コンピュータSTに対して送信する。ステップ4では、回答を入力した個体関連情報収集画面データ又は回答を入力した回答用画面データを、通信回線網1を介して送信することで前記設問に対する回答を統計解析用コンピュータSTに対して送信することができる。また、ステップ4では、個体関連情報として利用者(要求者)等が医療機関や検査機関等で検査を受けることによって得た情報を統計解析用コンピュータSTに対して送信することもできる。
次に、統計解析用コンピュータSTは、個人用コンピュータ3から個体関連情報を受信した後、ステップ5(S5)で、個人用コンピュータ3に対して、複数の多型番地を送信する。ステップ5で送信する複数の多型番地は、既定の多型番地であっても良いし、ランダムに選択した多型番地であっても良い。
次に、個人用コンピュータ3は、統計解析用コンピュータSTから複数の多型番地を受信した後、ステップ6(S6)で、読取り装置25を駆動してゲノム関連情報記録媒体24にアクセスする。次に、個人用コンピュータ3は、ステップ7(S7)で、統計解析用コンピュータSTより受信した複数の多型番地について、それぞれ対応する多型パターンを読み出す。そして、個人用コンピュータ3は、ステップ8(S8)で、ステップ7で読み出した多型パターンを対応する多型番地と関連付けて統計解析用コンピュータSTに対して送信する。すなわち、ステップ8では、統計解析用コンピュータSTより受信した複数の多型番地それぞれについて、対応する多型パターンを関連付けて送信する。なお、ステップ8で個人用コンピュータ3から統計解析用コンピュータSTに送信する際には、「Gno.」のような個人(個体)を特定しうる情報を送信しないことが望ましい。
ところで、本実施の形態では、ステップ5で統計解析用コンピュータSTが送信した多型番地を個人用コンピュータ3で受信し、受信した多型番地に対応する多型パターンをステップ8で個人用コンピュータ3が統計解析用コンピュータSTに対して送信している。しかしながら、これに限定されず、例えばステップ4において、個人用コンピュータ3が統計解析用コンピュータSTに対して「個体関連情報」を送信するとともに、既定の多型番地と当該多型番地に対応する多型パターンとを自発的に統計解析用コンピュータSTに対して送信してもよい。この場合は、上述したステップ5〜8までは行われず、ステップ4の後に以下のステップ9以降のステップを同様に行うことになる。
次に、統計解析用コンピュータSTは、個人用コンピュータ3から多型番地及び多型パターンを受信した後、ステップ9(S9)で、ゲノム関連情報DB40にアクセスする。なお、ステップ9では、統計解析用コンピュータSTがゲノム関連情報DB40を有さず、外部の機関がゲノム関連情報DB40を有する場合には、通信回線網1を介して当該外部の機関が有するゲノム関連情報DB40にアクセスする。
次に、統計解析用コンピュータSTは、ステップ10(S10)で、個人用コンピュータ3より受信した複数の多型番地及び多型パターンの組合せに基づいてゲノム関連情報DB40を検索し、ゲノム関連情報DB40に格納されたゲノム関連情報の中から、受信した複数の多型番地及び多型パターンの組合せを有する個人(個体)に関するゲノム関連情報を特定する。言い換えると、ステップ10では、ゲノム関連情報DB40に登録された複数の個人(個体)に関する複数のゲノム関連情報の中から要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報を特定する。ステップ10では、例えば、特定した要求者、すなわち個人(個体)に関するゲノム関連情報に対して「整理No.」を付与してもよい。或いは、ステップ10では、ゲノム関連情報DB40に登録している個人(個体)に関するゲノム関連情報に対して予め付与された「整理No.」を抽出しても良い。
次に、統計解析用コンピュータSTでは、ステップ11(S11)で、ステップ10で特定した要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報と、個人用コンピュータ3より受信した個体関連情報とを関連付ける。具体的には、ステップ10で特定した要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報に付与した「整理No.」、又はステップ10で特定した要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報について抽出した「整理No.」を、個体関連情報に関連付けて格納した、図6に示すような「個体関連情報DB41」を作成する。
或いは、ステップ10では、統計解析用コンピュータSTがゲノム関連情報DB40を有する場合には、ゲノム関連情報DB40に格納されている要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報に対して、個人用コンピュータ3より受信した個体関連情報を直接関連付けて格納しても良い。
以上、図9に示すフローチャートに従えば、例えば所定の要求者について、当該要求者に関する個体関連情報を、当該要求者に関するゲノム関連情報に関連付けて統計解析用コンピュータSTに登録することができる。また、複数の要求者が図9に示すフローチャートに従ってそれぞれ個体関連情報を登録することによって、統計解析用コンピュータSTは、複数の個人(個体)に関する個体関連情報を有することとなる。言い換えると、統計解析用コンピュータSTは、複数の個体に関するゲノム関連情報についてそれぞれ個体関連情報を関連付けて格納したデータベースを作成することができる。
以上のように、本システムによれば、統計解析用コンピュータSTの「ゲノム関連情報DB40」に、予め匿名化して記録しておいたゲノム関連情報に対して、後から匿名化した個体関連情報を統計解析用コンピュータSTに送信した場合であっても、当該ゲノム関連情報と当該個体関連情報とをリンクさせることができる。
なお、図9に示したフローチャートにおいては、統計解析用コンピュータSTは、ステップ5で送信した複数の多型番地について、個人用コンピュータ3より多型パターンを受信し、ステップ10でゲノム関連情報DB40を検索することによって要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報を特定している。しかしながら、本情報処理システムにおいては、要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報の特定に際してこの方法に限定されず、例えば、所定の「多型番地」及び「多型パターン」の組合せを、順次個人用コンピュータ3から統計解析用コンピュータSTに対して送信し、統計解析用コンピュータSTが要求者の特定を行っても良い。この場合、個人用コンピュータ3から所定の「多型番地」及び「多型パターン」の組合せを統計解析用コンピュータSTに対して順次自発的に送信しても良いし、統計解析用コンピュータSTから所定の「多型番地」に対応する「多型パターン」の提出を個人用コンピュータ3に対して順次要求し、個人用コンピュータ3が当該要求に対応した「多型パターン」を「多型番地」に関連付けて順次送信しても良い。
詳細には、統計解析用コンピュータSTは、要求者に関する1又は複数の「多型番地」及び「多型パターン」の組合せを受け取るステップと、受け取った「多型番地」及び「多型パターン」の組合せと一致する「多型番地」及び「多型パターン」の組合せを有する個体に関するゲノム関連情報をゲノム関連情報DB40から検索するステップとを、検索の結果として1の個人(個体)に関するゲノム関連情報を要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報として特定するまで繰り返すことで、ゲノム関連情報DB40に含まれる所定の個人(個体)に関するゲノム関連情報を要求者(要求者が送信した「個体関連情報」に関連する個人(個体))に関するゲノム関連情報として特定することができる。
一方、統計解析用コンピュータSTは、複数の個体に関する複数の個体関連情報を、それぞれゲノム関連情報DB40に含まれるゲノム関連情報と関連付けて格納した個体関連情報DB41を用いて、当該複数の個体関連情報と当該複数のゲノム関連情報とを統計的に処理して、塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を創出することができる。
ここで統計的処理としては、遺伝統計学的手法として知られている手法を適用した処理を意味し、従来知られている各種プログラム及びアルゴリズムを適用して行うことができる。
以下に一例を示す。まず、ゲノム関連情報DB40のその時点における全データ(全「整理No.」に関連付けられた全データ)から、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図11に示すように、行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図11では、多型番地「000001」における多型パターン「多型1」の出現頻度は100人中50人であることを表している。
次に、ゲノム関連情報DB40と個体関連情報DB41とを用いて、所定の個体関連情報に関して、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。
具体的には、個体関連情報DB41から、例えば、「嗜好a(例:赤色よりも青色の方が好きだ)」について該当する(結果欄に「○」が付いている)「整理No.」だけを抽出した上で、ゲノム関連情報40から前記抽出した「整理No.」を検索し、検索したデータのなかから、多型番地毎に当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を算出する。算出結果は、例えば、図12に示すように、個体関連情報毎(「嗜好」毎)に行方向に多型番地を並べ、列方向に多型パターン毎の出現頻度を並べて示されるマトリックスとして表される。なお、図12では、「嗜好a」について該当する場合に、多型番地「000001」における多型パターン「多型1」の出現頻度は50人中45人であることを表している。
次に、図11に示した出現頻度及び図12に示した出現頻度の結果を用いて、所定の個体関連情報に該当するか否かに関わらず算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度(図11)と、所定の個体関連情報に該当する場合に限って算出した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度(図12)とを、互いに比較し相対的な値を求める。
具体的には、例えば、図12に示した出現頻度の結果として、「嗜好a」について該当する場合における、多型番地「000001」における多型パターン「多型1」の出現頻度は50人中45人と表される当該45人という値を、図11に示した出現頻度の結果を表す、ゲノム関連情報DB40のその時点における全データ(全「整理No.」に関連付けられた全データ)における多型番地「000001」における多型パターン「多型1」の出現頻度100人中50人の当該50人で除した割合値(90%)を、前記相対的な値として求める。同様に、多型番地「000001」における多型パターン「多型2」の場合の割合値(12%)、多型番地「000001」における多型パターン「多型3」の場合の割合値(8%)を求める。その結果は、例えば、図13に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の割合値を並べて示されるマトリックスとして表される。
このときに、もし「嗜好a」が多型番地「000001」における多型パターンの相違による影響を全く受けないのであれば、上記算出した割合値(相対的な値)は、「多型1」、「多型2」、「多型3」のいずれにおいても同程度の値を示すはずである。この傾向は、図11及び図12に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。
なお、図13に示した結果を求める際には、図11に示した出現頻度を用いる代わりに、例えば、統計解析用コンピュータST以外の外部機関が算出(統計的に処理)した、多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの出現頻度を示すデータ又は当該出現頻度を算出するための元データを用いても良い。この場合は、前記外部機関が当該出現頻度を求める際に基にしたゲノム関連情報に関連する個体の中に、個体関連情報DB41に含まれる個体関連情報に関連する個体が含まれていても含まれていなくても良い。
次に、図13に示した割合値を用いて、各多型番地毎に、当該多型番地において取りうる各多型パターンの相対値を算出する。具体的には、図13に示した結果では、例えば、「嗜好a」において、多型番地「000001」の多型パターン「多型1」における割合値は90%、多型パターン「多型2」における割合値は12%、多型パターン「多型3」における割合値は8%と表されるが、そのうち最小の割合値を示す多型パターン(「多型3」)の割合値(8%)を基準にして、各多型パターンにおける割合値を「多型3」の割合値(8%)で除す。すなわち多型パターン「多型1」の相対値は11.25(=90/8)、「多型2」の相対値は1.5(=12/8)、「多型3」の相対値は1.0(=8/8)となり、最小の割合値を示す「多型3」の割合値を基準にした倍率として、各多型パターンの相対値を求める。その結果として、例えば図14に示すように、個体関連情報毎に行方向に多型番地を並べ、列方向に多型パターン毎の相対値を並べて示されるマトリックスとして表される。
このとき、もし「嗜好a」が多型番地「000001」における多型パターンの相違による影響を全く受けないのであれば、上記算出した倍率(相対値)は、「多型1」、「多型2」、「多型3」のいずれにおいても1.0に近い値を示すはずである。この傾向は、図11及び図12に示した出現頻度を算出する際の母数が大きいほど顕著に表れることが統計学的に知られている。
次に、図14に示した結果に基づいて、相対値が所定の値を超えた場合に、当該相対値を示す多型番地における多型パターンの相違が、所定の個体関連情報に(該当するか否かに)関係していると判断する。具体的には、例えば、図14に示した結果において、倍率(相対値)が閾値を超えた場合に、当該倍率を示す多型番地とその倍率とを抽出し、出力する。なお、当該閾値は、例えば、図14に示した、所定の個体関連情報に該当する場合の全ての相対値を概観したうえで、統計的に算出することができる。
なお、図14に示した相対値の算出方法によっては、相対値が所定の値を下回った場合に当該相対値の多型番地における多型パターンの相違が、所定の個体関連情報に(該当するか否かに)関係していると判断してもよい。
また、抽出した倍率(相対値)が相対的に大きいほど、当該抽出した倍率を示す多型番地における多型パターンの相違が、所定の個体関連情報に(該当するか否かにおいて)より強く関係していると推定できる。すなわち、所定の個体関連情報に(該当するか否かにおいて)先天的(遺伝的)要素が強いと推定される。
さらにまた、図11及び図12に示した出現頻度から図14に示した結果を得るまでの処理を、複数の個体関連情報について同時に並行して行った場合には、それぞれの個体関連情報について抽出された、それぞれの多型番地とその倍率(相対値)との傾向から、どの個体関連情報とどの個体関連情報とが互いに関連性があるのかが推定できる。
以上のように、図11及び図12に示した出現頻度から図14に示した結果を得て、当該結果から判断を導くまでの処理を行うことにより、今まで先天的(遺伝的)影響との関連性が希薄と思われていた個体関連情報についても遺伝的影響を受けているか否かを調べることができる。すなわち、各人(個体)より入手する様々な種類の個体関連情報を用いることにより、従来、先天的(遺伝的)影響との関連性が希薄と思われた個体の性質等と遺伝との関連性を推定することができる。
また、図11及び図12に示した出現頻度から図14に示した結果を得て、当該結果から判断を導くまでの処理は、所定の個体関連情報(属性)に該当するか否かに拘わらず算出した多型パターン毎の出現頻度を母数(図11)にしているので、個体関連情報(属性)がどれだけ遺伝の影響を受けているかを定量的に表すことに向いている。これに対して、通常行われる相関解析の方法では、個体関連情報(属性)に該当する集団と該当しない集団とを比較しているので、個体関連情報(属性)が人の性格のように遺伝による影響が比較的少ないと思われるものの場合に遺伝的影響の度合いを表すのが困難となる。すなわち、人の性格のような個体関連情報(属性)の場合、個々人の“かくありたい”という願望などが起因して当該個体関連情報(属性)に該当しているか否かを判断すること自体が難しいため、母数に誤りが含まれることがあり正確に比較することが難しくなるからである。
なお、図14に示した結果において、倍率(相対値)が閾値を超えた場合に当該倍率を示す多型番地とその倍率とを抽出する際に、図11、図12及び図13に示した出現頻度や割合値及びそれらの算出根拠となった元の数値も抽出して併せて出力することが望ましい。この場合、図11、図12及び図13に示した出現頻度や割合値及びそれらの算出根拠となった元の数値を、図14に示した結果を使用する側で、データの信憑性を判断する材料として使用することができる。
その後、統計解析用コンピュータSTは、図14に示した結果から抽出した多型番地とその倍率及び/又は併せて抽出した算出根拠となる元の数値を用いることにより、所定の個体関連情報と所定の多型番地との相関関係及び多型パターンの種類による所定の個体関連情報への影響の差異という知見を得ることができる。そして統計解析用コンピュータSTは、得た知見を基に意味情報及び/又は当該意味情報に関連する情報を創出することができる。例えば、図14に示した結果から抽出した「倍率」は、そのまま意味情報として使用することが可能である。
なお、統計解析用コンピュータSTは、図14に示した倍率(相対値)の算出結果及び/又は図14に示した算出結果から導かれた知見に基づいて創出した意味情報及び/又は当該意味情報に関連する情報を、逐次記録したデータベース(以下、参照用DBと称す)を構築することができる。
また、所定の個体関連情報(性質)に関して所定の多型番地との相関関係が見いだせない場合であっても、以下のようにして、1又は複数の他の個体関連情報(性質)との組合せと所定の多型番地との相関関係を見いだすことができる。
例えば、「多汗症である」という個体関連情報(性質)と相関関係がある多型番地が見いだせなかったとする。また、「多汗症である」性質に関連性がある性質、例えば「よく水分を摂取する」性質及び「塩辛いものを好む」性質については、それぞれ「多型番地000001」及び「多型番地000101」に相関関係が見いだされたとする。ここで、所定の性質と他の性質との関連性とは、所定の性質を示す個体が他の性質を示す確率が所定の値、例えば80%以上であることを意味する。前記関連性は、例えば、所定の性質と他の性質を含むアンケートを実施した集計結果から導き出すことができる。例えば、所定の性質を有すると答えた回答者の中で、他の性質を有すると答えた回答者が80%以上の場合は、所定の性質と他の性質との間に関連性があるとみなすことができる。
さらに、「よく水分を摂取する」性質を示す個体のうち80%の個体は、「多型番地000001」において「多型1」を有しており、「塩辛いものを好む」性質を示す個体のうち70%の個体は、「多型番地000101」において「多型2」を有していたとする。
以上の前提条件の基では、「多汗症である」という性質について、「多型番地000001」及び「多型番地000101」との間に間接的な相関関係を見いだすことができる。すなわち、「多型番地000001」において「多型1」を有し、「多型番地000101」において「多型2」を有する個体のうち、56%(0.8×0.7=0.56)は「多汗症である」性質を示すことが間接的に見いだせる。
以上によって、「多型番地000001」において「多型1」を有し、「多型番地000101」において「多型2」を有する場合に、「多汗症である場合が多い(例えば「指数56」)」という意味情報を創出することができる。さらに、創出した意味情報から、例えば、「生活留意情報」等の当該意味情報に関連する情報を導き出すこともできる。
統計解析用コンピュータSTは、以上のようにして、創出した意味情報及び/又は当該意味情報に関連する情報を共用コンピュータ2に提供することができる。共用コンピュータ2は、統計解析用コンピュータSTから提供された意味情報に基づいてメインDB14を構築したり、統計解析用コンピュータSTから提供された当該意味情報に関連する情報に基づいて情報提供用データベースを構築することができる。
また、統計解析用コンピュータSTは、上述したように創出した意味情報及び/又は当該意味情報に関連する情報等を逐次記録して「参照用DB」を構築し、当該「参照用DB」をメインDB14として使用することによって、自らが共用コンピュータ2として動作することもできる。
共用コンピュータ2は、構築したメインDB14を用いて、以下のようにして利用者に対して所定の疾病の罹患可能性等の意味情報を提供することができる。すなわち、共用コンピュータ2は、利用者が「物品及び/又はサービスの要求」として、例えば、所定の疾病に関する自分の罹患可能性を教えて欲しいと要求する場合に、当該罹患可能性等の意味情報を提供できる。
なお、本情報処理システムにおいて、「物品及び/又はサービス」としては、所定の疾病の罹患可能性に限定されず、例えば、個人(個体)の体質に適合した医薬品、食品及び嗜好品等の物品や、個人(個体)の体質・性質に適合した情報等のサービスを含む意味である。
共用コンピュータ2が利用者に対して所定の疾病の罹患可能性を提供する情報処理システムにおいては、共用コンピュータ2のメモリー7に記録された処理プログラム13及び個人用コンピュータ3のメモリー23に記録された処理プログラム27が例えば、図15及び図16に示すようなフローチャートに従って情報処理動作する。なお、図15及び図16に示すフローチャートにおいて、「(共)」と記載したステップは共用コンピュータ2における処理を意味し、「(個)」と記載したステップは個人用コンピュータ3における処理を意味している。
本情報処理システムは、ゲノム関連情報記録媒体24を所持する各個人が個人用コンピュータ3を用いて通信回線網1を介して共用コンピュータ2にアクセスし、共用コンピュータ2のメインDB14に記録されている意味情報を利用するシステムである。なお、本情報処理システムは、複数人のゲノム関連情報28がそれぞれ記録されたゲノム関連情報記録媒体24を用い、各個人がゲノム関連情報記録媒体24にアクセスするようなシステムであってもよい。
この場合、先ず、ステップA1(SA1)で、要求者が本システムを利用するにあたり、メモリー23に記録されている処理プログラム27を起動する。処理プログラム27によって、個人用コンピュータ3の読取り装置25を駆動してゲノム関連情報記録媒体24にアクセスし、ゲノム関連情報記録媒体24においてデータIとして記録されている「Gno.」を読み出す。読み出した「Gno.」は、メモリー部26に格納する。
次に、ステップA2(SA2)では、処理プログラム27によって表示装置22に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」(要求情報)を個人用コンピュータ3に入力するとともに、個人用コンピュータ3から通信回線網1を経由して共用コンピュータ2に「大腸がんの罹患可能性」及び「Gno.」を送信する。或いは、個人用コンピュータ3から通信回線網1を経由して共用コンピュータ2に対して、「大腸がんの罹患可能性」及び「Gno.」を書き込む。
次に、ステップA3(SA3)では、共用コンピュータ2が「大腸がんの罹患可能性」及び「Gno.」を受信する。受信した「大腸がんの罹患可能性」及び「Gno.」は、メモリー部A10に要求情報として格納する。
次に、ステップA4(SA4)では、要求情報を受信すると、メモリー7に記録されている処理プログラム13を起動してメインDB14にアクセスする。なお、この処理プログラム13は、共用コンピュータ2における処理を行うものである。
次に、ステップA5(SA5)では、処理プログラム13に従って、メインDB14に記録されている「分類(疾患名)」を検索し、要求された「大腸がんの罹患可能性」(大腸がん)と一致するものを抽出する。
ステップA6(SA6)では、メインDB14に記録されているデータのなかから「大腸がんの罹患可能性」と一致した「分類(疾患名)」(大腸がん)に関連づけられた「多型番地」を読み出す。読み出した「多型番地」は、メモリー部A10に要求情報に関連づけた位置情報として格納する。すなわち、メモリー部A10には、所定の「Gno.」に対して「大腸がんの罹患可能性」及び「多型番地」が記録されることとなる。
次に、ステップA7(SA7)では、メモリー部A10に記録されている「Gno.」及び「多型番地」を個人用コンピュータ3に送信するとともに、送信する「多型番地」に対応する「多型パターン」を提出する命令情報を個人用コンピュータ3に送信する。また、このとき、要求情報の種類によっては、必要に応じて既往症や特徴等の付加的な情報の提出を命令してもよい。
次に、ステップA8(SA8)では、共用コンピュータ2から送信された「Gno.」、「多型番地」及び命令情報を受信する。受信した「Gno.」及び「多型番地」は、メモリー部26に記録される。
次に、ステップA9(SA9)では、受信した命令情報に従って、ゲノム関連情報記録媒体24に記録されているデータIIにアクセスする。ステップA10(SA10)では、処理プログラム27に従ってゲノム関連情報記録媒体24に記録されているデータIIを検索し、命令された多型番地の多型パターンを読み出し、多型番地と多型パターンとを関連づけてメモリー部26に記録する。このとき、データIに対してアクセスし、ステップA8で受信した「Gno.」が正しいか否かを確認することが好ましい。また、ステップA10では、多型パターンのほかにデータIII、データIV及びデータVに記録されている付加的な情報も同時に読み出し、必要に応じてメモリー部26に記録してもよい。
次に、ステップA11(SA11)では、メモリー部26に一時的に記録した多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を、「Gno.」とともに通信回線網1を介して共用コンピュータ2に対して出力する。ステップA12(SA12)では、多型番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を共用コンピュータ2で受信し、受信した多型パターンを多型番地と関連付けてメモリー部A10に記録する。
また、本例では、ステップA7において、共用コンピュータ2が「多型パターン」の提出を命令する命令情報を送出し、ステップA10において、個人用コンピュータ3は命令情報に従って多型パターンをゲノム関連情報記録媒体24から読み出している。しかしながら、本システムは、ステップA7において当該命令情報を送出しないシステムであってもよい。この場合、ステップA10において、個人用コンピュータ3は、処理プログラム27に従って、ステップA8で受信した多型番地に基づいてデータIIを検索し、受信した多型番地の多型パターンを読み出す。そして、個人用コンピュータ3は、ステップA11で多型パターン等を共用コンピュータ2に対して出力する。この場合でも、共用コンピュータ2は、ステップA12において、「大腸がんの罹患可能性」と一致した「分類(疾患名)」に関連づけられた「多型番地」の多型パターンを得ることができる。
次に、ステップA13(SA13)では、メインDB14にアクセスし、受信した多型番地及び多型パターンと一致するものを検索する。具体的には、メインDB14において、一つの多型番地に対して複数の多型パターンが記録されており、受信した多型番地及びその多型パターンがメインDB14においてどの多型パターンに一致しているのかを検索する。
次に、ステップA14(SA14)では、処理プログラム13に従って、受信した多型パターンと一致した多型パターンに関連づけられている大腸がんに対する罹患可能性を読み出す。すなわち、ステップA14では、要求者が提出した多型番地及び多型パターンに従って、要求者の大腸がんに対する罹患可能性を読み出すことができる。読み出した罹患可能性は、要求者の「Gno.」と関連づけてメモリー部A10に格納する。このとき、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで格納してもよいし、付加的な情報から得られるその他の情報を要求者の「Gno.」に関連づけて格納しても良い。
次に、ステップA15(SA15)では、メモリー部A10に格納した要求者の「Gno.」及び罹患可能性を意味情報として、通信回線網1を介して個人用コンピュータ3に対して送信する。ステップA16(SA16)では、個人用コンピュータ3が要求者の「Gno.」及び罹患可能性(意味情報)を受信する。受信した意味情報は、メモリー部26に記録される。
次に、ステップA17(SA17)では、処理プログラム27に従って、メモリー部26に記録された意味情報から大腸がんに対する罹患可能性を表示装置22に表示する。なお、ステップA15からステップA17の代わりに共用コンピュータ2が処理プログラム13に従って意味情報を表示する画面を読み出し(作成し)、通信回線網1を経由して個人用コンピュータ3の表示装置22に表示させることもできる。この場合においても、共用コンピュータ2から個人用コンピュータ3に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体24に記録したゲノム関連情報28を用いて大腸がんに対する罹患可能性を得ることができる。
以上のように、本システムにおいては、個人の多型パターンを多型番地と関連づけて記録したゲノム関連情報記録媒体24を用いることによって、メインDB14に記録された意味情報を多型番地を介在させて個人が利用することができる。言い換えれば、本システムを利用する個人は、意味情報をゲノム関連情報記録媒体に記録しておく必要はなく、多型番地と多型パターンとを関連づけたゲノム関連情報28を所有するだけで、様々な意味情報を得ることができる。
特に、意味情報は、上述したように、その種類が増加するとともに訂正が行われるため、メインDB14を更新することによってより精度が高く、且つ、幅広い情報を含むものとなる。本システムによれば、このような意味情報の増加及び訂正等に追従してメインDB14を更新することによって、個人が最新の意味情報を利用することができる。
さらに、ゲノム関連情報28を記録したゲノム関連情報記録媒体24を用いることによって、利用者は本システムを利用するたび毎にゲノム関連情報を得るための検査をする必要がない。すなわち、利用者は、一旦、ゲノム関連情報記録媒体24を作製すれば、以降は本システムを利用して最新の意味情報を得ることができる。
ゲノム関連情報28を記録したゲノム関連情報記録媒体24を利用者自身が保有する場合、本人のゲノム関連情報28を外部の機関に委託して保管させる際の不安や当該機関に対する不正アクセスによりゲノム関連情報28が流出するといった危険性を回避することができる。一方、ゲノム関連情報記録媒体24に複数の個人に関する複数のゲノム関連情報28を記録して外部の機関に委託して保管させる場合、個々人がゲノム関連情報記録媒体24を保有する場合と比較して、ゲノム関連情報記録媒体24の取り扱いの不手際やゲノム関連情報記録媒体24の損失といった事態を防止することができる。
特に、この図15及び図16に示したフローチャートに従えば、ゲノム関連情報記録媒体24に記録したゲノム関連情報28の全てを通信回線網1を介して出力する必要がなく、提出命令を受けた一部のゲノム関連情報28のみを出力すればよい。したがって、本システムによれば、機密性の高い個人特有の多型番地及び多型パターンの漏洩を防止することができる。
また、この図15及び図16に示したフローチャートに従えば、共用コンピュータ2において要求者に提供する意味情報を得ているため、個人用コンピュータ3においてメインDB14に記録されている情報を取り扱う必要がない。したがって、この図15及び図16に示したフローチャートに従えば、個人用コンピュータ3の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができる。さらに、個人用コンピュータ3においてメインDB14に記録されている情報を取り扱う必要がないため、個人用コンピュータ3の処理プログラム27を、ゲノム関連情報記録媒体24を装着するカードドライブ等に併せて規格化しやすくなる。
ところで、本情報処理システムにおいては、共用コンピュータ2のメモリー7に記録された処理プログラム13及び個人用コンピュータ3のメモリー23に記録された処理プログラム27が例えば、図17に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図17に示すフローチャートにおいても、「(共)」と記載したステップは共用コンピュータ2における処理を意味し、「(個)」と記載したステップは個人用コンピュータ3における処理を意味している。
ここでは、先ず、ステップB1(SB1)では、要求者が本システムを利用するにあたり、メモリー23に記録されている処理プログラム27を起動する。処理プログラム27によって、個人用コンピュータ3の読取り装置25を駆動してゲノム関連情報記録媒体24にアクセスし、ゲノム関連情報記録媒体24においてデータIとして記録されている「Gno.」を読み出す。読み出した「Gno.」は、メモリー部26に格納する。
次に、ステップB2(SB2)では、処理プログラム27によって表示装置22に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」(要求情報)を個人用コンピュータ3に入力するとともに、個人用コンピュータ3から通信回線網1を経由して共用コンピュータ2に「大腸がんの罹患可能性」及び「Gno.」を送信するとともに、メインDB14の「分類(疾患名)」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」との提出を要求する。すなわち、要求者は、ステップB2において、メインDB14の「分類(疾患名)」が大腸がんである「多型番地」と当該「多型番地」に関連付けられた全ての「多型パターン」と当該全ての「多型パターン」それぞれを意味づける「罹患可能性」とからなる情報を要求する。
次に、ステップB3(SB3)では、共用コンピュータ2が上記要求情報を受信する。共用コンピュータ2は、要求情報を受信すると処理プログラム13を起動する。そして、ステップB4(SB4)で、処理プログラム13に従ってメインDB14にアクセスする。
次に、ステップB5(SB5)では、処理プログラム13に従って、メインDB14に記録されている「分類(疾患名)」を検索し、要求された「大腸がんの罹患可能性」(大腸がん)と一致するものを抽出する。ステップB6(SB6)では、処理プログラム13に従って、メインDB14にアクセスし、「大腸がんの罹患可能性」と一致する「分類(疾患名)」(大腸がん)に関連づけられた「多型番地」、当該多型番地に関連づけられた全ての「多型パターン」及び全ての多型パターンにおける「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部A10に要求情報に関連づけて格納する。すなわち、メモリー部A10には、所定の「Gno.」に対して「多型番地」、「多型パターン」及び「罹患可能性」が記録されることとなる。
次に、ステップB7(SB7)では、メモリー部A10に記録されている「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」を、通信回線網1を介して個人用コンピュータ3に対して送信する。ステップB8(SB8)では、共用コンピュータ2から送信された「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」を受信する。受信した「Gno.」、「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部26に記録される。
次にステップB9(SB9)では、処理プログラム27に従い、ゲノム関連情報記録媒体24に記録されているデータIIにアクセスする。このとき、ゲノム関連情報記録媒体24に記録されているデータIにもアクセスし、受信した「Gno.」が正しいか否かを確認することが好ましい。
次に、ステップB10(SB10)では、処理プログラム27に従って、ゲノム関連情報28から、受信した「多型番地」と一致する多型番地における多型パターンを抽出する。そして、ステップB10(SB10)では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで、抽出した多型パターンと一致するものを検索する。
ステップB11(SB11)では、受信した多型番地に関連づけられた全ての「多型パターン」のうちで一致した多型パターンに関連づけられた「罹患可能性」を抽出するとともに、抽出した「罹患可能性」を出力する。これにより、要求者は、大腸がんに対する罹患可能性(意味情報)を得ることができる。このとき、ステップB11では、データIII、データIV及びデータVに記録されている付加的な情報も同時に読み出し、大腸がんに対する罹患可能性を、付加的な情報により補正したかたちで出力してもよい。
特に、図17に示したフローチャートに従えば、ゲノム関連情報記録媒体24に記録したゲノム関連情報28を個人用コンピュータ3以外の外部に対して全く出力することがない。すなわち、ゲノム関連情報28は、ゲノム関連情報記録媒体24と個人用コンピュータ3との間でのみ、やり取りされる。したがって、本システムによれば、機密性の高い個人特有のゲノム関連情報28の漏洩をより確実に防止することができる。
ところで、本情報処理システムにおいては、共用コンピュータ2のメモリー7に記録された処理プログラム13及び個人用コンピュータ3のメモリー23に記録された処理プログラム27が例えば、図18に示すようなフローチャートに従って情報処理動作するものであってもよい。なお、図18に示すフローチャートにおいても、「(共)」と記載したステップは共用コンピュータ2における処理を意味し、「(個)」と記載したステップは個人用コンピュータ3における処理を意味している。
ここでは、先ず、ステップC1(SC1)で、要求者が本システムを利用するにあたり、メモリー23に記録されている処理プログラム27を起動する。処理プログラム27によって、個人用コンピュータ3の読取り装置25を駆動してゲノム関連情報記録媒体24にアクセスし、ゲノム関連情報記録媒体24においてデータIとして記録されている「Gno.」、データIIとして記録されている全ての「多型番地」及び「多型パターン」を読み出す。読み出した「Gno.」、「多型番地」及び「多型パターン」は、メモリー部26に格納する。
次に、ステップC2(SC2)では、処理プログラム27によって表示装置22に表示された画面イメージに基づいて、要求者が提供を受けたい情報、例えば、「大腸がんの罹患可能性」(要求情報)を個人用コンピュータ3に入力するとともに、個人用コンピュータ3から通信回線網1を経由して共用コンピュータ2に「大腸がんの罹患可能性」と、メモリー部26に記録されている「Gno.」、「多型番地」及び「多型パターン」とを送信する。
次に、ステップC3(SC3)では、共用コンピュータ2が「大腸がんの罹患可能性」、「Gno.」、「多型番地」及び「多型パターン」を受信する。受信した「大腸がんの罹患可能性」は要求情報としてメモリー部A10に記録され、「Gno.」、「多型番地」及び「多型パターン」も、メモリー部A10に格納される。共用コンピュータ2は、要求情報を受信すると処理プログラム13を起動する。そして、ステップC4(SC4)では、処理プログラム13に従って、メインDB14にアクセスする。
次に、ステップC5(SC5)では、処理プログラム13に従って、メインDB14に記録されている「分類(疾患名)」を検索し、要求された「大腸がんの罹患可能性」(大腸がん)と一致するものを抽出する。
ステップC6(SC6)では、処理プログラム13に従って、メインDB14にアクセスし、メインDB14から「大腸がん」に分類された「多型番地」、当該多型番地に対する全ての「多型パターン」、及び当該多型パターンに対する「罹患可能性」を読み出す。読み出した「多型番地」、「多型パターン」及び「罹患可能性」は、メモリー部A10に格納される。
次に、ステップC7(SC7)では、ステップC3で受信した「多型番地」及び「多型パターン」に基づいて、ステップC6でメモリー部A10に格納したデータを検索し、受信した「多型パターン」と一致した多型パターンに関連付けられた罹患可能性をメモリー部A10から抽出する。
ステップC8(SC8)では、ステップC7の結果、すなわち、ステップC3で受信した情報に含まれる多型パターンがメインDB14のいずれの多型パターンと一致するかに基づいて抽出した罹患可能性を、通信回線網1を介して個人用コンピュータ3に対して送信する。このとき、共用コンピュータ2は、抽出した罹患可能性を要求者の「Gno.」とともに送信する。
次に、ステップC9(SC9)では、共用コンピュータ2から送信された「Gno.」及び「罹患可能性」(意味情報)を受信する。受信した「Gno.」及び「罹患可能性」は、メモリー部26に記録される。このとき、ゲノム関連情報記録媒体24に記録されているデータIにアクセスし、受信した「Gno.」が正しいか否かを確認することができる。
次に、ステップC10(SC10)では、処理プログラム27に従って、メモリー部26に記録された意味情報から大腸がんに対する罹患可能性を表示装置22に表示する。なお、ステップC8からステップC10の代わりに、共用コンピュータ2が処理プログラム13に従って意味情報を表示する画面を読み出し(作成し)、通信回線網1を経由して個人用コンピュータ3の表示装置22に表示させることもできる。この場合においても、共用コンピュータ2から個人用コンピュータ3に対して意味情報が送信されたものとする。これにより、要求者は、ゲノム関連情報記録媒体24に記録したゲノム関連情報28を用いて大腸がんに対する罹患可能性を得ることができる。
特に、図18に示したフローチャートに従えば、ゲノム関連情報記録媒体24に記録したゲノム関連情報28を全て共用コンピュータ2に対して出力し、共用コンピュータ2において要求者に提供する意味情報を得ている。このため、図18に示したフローチャートに従えば、個人用コンピュータ3と共用コンピュータ2との間での情報の授受が比較的少ない回数で、要求者が意味情報を得ることができる。したがって、この図18に示したフローチャートに従えば、個人用コンピュータ3の情報処理能力が比較的低くても、十分に所望の意味情報を得ることができるとともに、要求者にとっては非常に簡便に意味情報を得ることができる。
以上、説明したように本システムによれば、ゲノム関連情報記録媒体24及びメインDB14において、「多型番地」及びその「多型パターン」のみを規格化しておけば、それ以外の特別なデータの規格化を必要としないので、広範囲な産業に利用することができる。すなわち、物品或いはサービスを提供する側は、ゲノム関連情報記録媒体24を用いた情報提供に際して、多型パターンに対応する意味情報の規格化や、データ授受処理方法等の統一した規格を必要とせず、様々な方式で情報提供することができる。
さらにまた、本システムによれば、メインDB14をチェックすることで、第三者或いは第三者機関は共用コンピュータ2に対する監視及び管理を容易に行うことができる。したがって、本システムは、意味情報を提供する側に対する例えば行政的な管理を行うことができるため、意味情報を提供する側の健全性及び倫理管理を行うことができる。
一方、本情報処理システムにおいては、ゲノム関連情報記録媒体からデータIIに含まれる情報を除いたもの、すなわちデータI及び付加的にデータIII〜Vのみを有する記憶媒体を用いても良い。この場合、データIIに含まれる情報は、通信回線網1を介して個人用コンピュータ3と接続された外部のデータベース(ゲノム関連情報記録媒体)に記録しておく。このようなシステムの場合、例えば、上述したステップA10において、通信回線網1を介して外部のデータベースにアクセスし、命令された多型番地の多型パターンを読み出し、多型番地と多型パターンとを関連づけてメモリー部26に記録することができる。したがって、このようなシステムであっても、図15及び図16に示したフローチャート、図17に示したフローチャート及び図18に示したフローチャートと同様に、要求者は意味情報を得ることができる。
さらに、本情報処理システムにおいては、要求者がゲノム関連情報記録媒体24及び前記ゲノム関連情報記録媒体からデータIIに含まれる情報を除いた記録媒体のいずれも有さず、通信回線網1を介して個人用コンピュータ3と接続したゲノム関連情報記録媒体24を備えるものであっても良い。このようなシステムの場合、要求者は、通信回線網1を介してゲノム関連情報記録媒体24にアクセスし、ゲノム関連情報記録媒体24に記録された「多型番地」及び「多型パターン」等の情報を個人用コンピュータ3にダウンロードできる。なお、この場合、ゲノム関連情報記録媒体24は、複数の個人に関するゲノム関連情報を個人毎(「Gno.」毎)に記録したものであっても良い。
さらにまた、本発明は、上述したような共用コンピュータ2がメインDB14を有するような構成に限定されず、例えば、共用コンピュータ2と通信回線網1を介して接続されたメインDB14を備える情報処理システムにも適用される。この場合、共用コンピュータ2は、図15及び図16に示したフローチャート、図17に示したフローチャート或いは図18に示したフローチャートにおいて、メインDB14に対して通信回線網1を介してアクセスする。この場合でも、本情報処理システムによれば、図15及び図16に示したフローチャート、図17に示したフローチャート或いは図18に示したフローチャートに従って要求者が所望の意味情報を得ることができる。
特に、この場合、共用コンピュータ2は、異なる機関又は団体が有する複数のメインDB14に対して通信回線網1を介してアクセスし、これら複数のメインDB14に含まれる意味情報を使用して、要求者に対する情報提供を行うことが可能となる。すなわち、本情報処理システムにおいては、図15及び図16に示したフローチャートにおけるステップA5で、図17に示したフローチャートにおけるステップB5で、或いは図18に示したフローチャートにおけるステップC5で、共用コンピュータ2が大腸がんの罹患可能性に関する情報を意味情報として有する様々なメインDB14にアクセスする。これにより、本情報処理システムによれば、要求者は、様々なメインDB14に含まれる情報に基づいて、大腸がんの罹患可能性に関する情報を得ることができる。
また、本システムは、図15及び図16に示したフローチャート、図17に示したフローチャート、或いは図18に示したフローチャートにおいて、共用コンピュータ2が、いわゆるエージェントに対して、少なくとも個人用コンピュータ3から受け取った要求情報を送信し、意味情報(本例においては、「大腸がんに関する罹患可能性」)を、当該エージェントを介して得るものであってもよい。
本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。
Claims (8)
- 送受信手段、制御手段を有し、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置と、個体関連情報が個体毎に塩基配列関連情報群に関連付けられて記憶されているデータベースにアクセス可能な第1の情報処理手段と、所定の個体に関する、位置情報と塩基配列関連情報とが関連付けられて記憶されている記憶エリアにアクセス可能な第2の情報処理手段とがネットワークを介して接続されたシステムにおける前記第1の情報処理手段において実行される塩基配列に関する情報処理方法であって、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する個体関連情報を受信するステップaと、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する、位置情報に関連付けられた塩基配列関連情報を受信するステップbと、
前記制御手段が、前記ステップbで受信した塩基配列関連情報に基づいて前記記憶装置を検索して、前記ステップbで受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップcと、
前記制御手段が、前記ステップaで受信した個体関連情報を、前記ステップcで特定した塩基配列関連情報群と関連付けて前記データベースに格納するステップdと、
前記制御手段が、前記ステップdにて新たな情報が格納された前記データベースに含まれる所定の個体関連情報に関連付けられた複数の塩基配列関連情報群と、前記記憶装置に含まれる複数の個体に関するそれぞれの塩基配列関連情報群とを用いて、前記所定の個体関連情報が所定の位置情報における塩基配列関連情報の相違に関連しているか否か判断するステップeとを有する情報処理方法。 - 前記ステップcで特定した塩基配列関連情報群が複数ある場合には、
前記送受信手段及び前記制御手段は、前記所定の個体に関する位置情報に関連付けられた塩基配列関連情報の受信と、複数の塩基配列関連情報群の中で、当該受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すステップfを更に有することを特徴とする請求項1記載の情報処理方法。 - 送受信手段、制御手段を有し、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置と、個体関連情報が個体毎に塩基配列関連情報群に関連付けられて記憶されているデータベースにアクセス可能な第1の情報処理手段と、所定の個体に関する、位置情報と塩基配列関連情報とが関連付けられて記憶されている記憶エリアにアクセス可能な第2の情報処理手段とがネットワークを介して接続されたシステムにおける前記第1の情報処理手段としての情報処理装置であって、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する個体関連情報を受信するように機能させる個体関連情報受信手段と、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する、位置情報に関連付けられた塩基配列関連情報を受信するように機能させる塩基配列関連情報受信手段と、
前記制御手段が、前記塩基配列関連情報受信手段で受信した塩基配列関連情報に基づいて前記記憶装置を検索して、前記塩基配列関連情報受信手段で受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群を特定するように機能させる塩基配列関連情報群特定手段と、
前記制御手段が、前記個体関連情報受信手段で受信した個体関連情報を、前記塩基配列関連情報群特定手段で特定した塩基配列関連情報群と関連付けて前記データベースに格納するように機能させる個体関連情報格納手段と、
前記制御手段が、前記個体関連情報格納手段にて新たな情報が格納された前記データベースに含まれる所定の個体関連情報に関連付けられた複数の塩基配列関連情報群と、前記記憶装置に含まれる複数の個体に関するそれぞれの塩基配列関連情報群とを用いて、前記所定の個体関連情報が所定の位置情報における塩基配列関連情報の相違に関連しているか否か判断するように機能させる判断手段とを備える情報処理装置。 - 前記塩基配列関連情報群特定手段で特定した塩基配列関連情報群が複数ある場合には、
前記送受信手段及び前記制御手段は、前記所定の個体に関する位置情報に関連付けられた塩基配列関連情報の受信と、複数の塩基配列関連情報群の中で、当該受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すように機能させる繰返し手段を更に備えることを特徴とする請求項3記載の情報処理装置。 - 送受信手段、制御手段を有し、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置と、個体関連情報が個体毎に塩基配列関連情報群に関連付けられて記憶されているデータベースにアクセス可能な第1の情報処理手段と、所定の個体に関する、位置情報と塩基配列関連情報とが関連付けられて記憶されている記憶エリアにアクセス可能な第2の情報処理手段とがネットワークを介して接続されたシステムにおける前記第1の情報処理手段に実行させる塩基配列に関する情報処理プログラムであって、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する個体関連情報を受信するステップaと、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する、位置情報に関連付けられた塩基配列関連情報を受信するステップbと、
前記制御手段が、前記ステップbで受信した塩基配列関連情報に基づいて前記記憶装置を検索して、前記ステップbで受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップcと、
前記制御手段が、前記ステップaで受信した個体関連情報を、前記ステップcで特定した塩基配列関連情報群と関連付けて前記データベースに格納するステップdと、
前記制御手段が、前記ステップdにて新たな情報が格納された前記データベースに含まれる所定の個体関連情報に関連付けられた複数の塩基配列関連情報群と、前記記憶装置に含まれる複数の個体に関するそれぞれの塩基配列関連情報群とを用いて、前記所定の個体関連情報が所定の位置情報における塩基配列関連情報の相違に関連しているか否か判断するステップeとを実行させる情報処理プログラム。 - 前記ステップcで特定した塩基配列関連情報群が複数ある場合には、
前記送受信手段及び前記制御手段は、前記所定の個体に関する位置情報に関連付けられた塩基配列関連情報の受信と、複数の塩基配列関連情報群の中で、当該受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すステップfを更に実行させることを特徴とする請求項5記載の情報処理プログラム。 - 送受信手段、制御手段を有し、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置と、個体関連情報が個体毎に塩基配列関連情報群に関連付けられて記憶されているデータベースにアクセス可能な第1の情報処理手段と、所定の個体に関する、位置情報と塩基配列関連情報とが関連付けられて記憶されている記憶エリアにアクセス可能な第2の情報処理手段とがネットワークを介して接続されたシステムにおける前記第1の情報処理手段に実行させる塩基配列に関する情報処理プログラムが記録された記録媒体であって、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する個体関連情報を受信するステップaと、
前記送受信手段がネットワークを介して前記第2の情報処理手段から、前記所定の個体に関する、位置情報に関連付けられた塩基配列関連情報を受信するステップbと、
前記制御手段が、前記ステップbで受信した塩基配列関連情報に基づいて前記記憶装置を検索して、前記ステップbで受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップcと、
前記制御手段が、前記ステップaで受信した個体関連情報を、前記ステップcで特定した塩基配列関連情報群と関連付けて前記データベースに格納するステップdと、
前記制御手段が、前記ステップdにて新たな情報が格納された前記データベースに含まれる所定の個体関連情報に関連付けられた複数の塩基配列関連情報群と、前記記憶装置に含まれる複数の個体に関するそれぞれの塩基配列関連情報群とを用いて、前記所定の個体関連情報が所定の位置情報における塩基配列関連情報の相違に関連しているか否か判断するステップeとを実行させる情報処理プログラムが記録された記録媒体。 - 前記ステップcで特定した塩基配列関連情報群が複数ある場合には、
前記送受信手段及び前記制御手段は、前記所定の個体に関する位置情報に関連付けられた塩基配列関連情報の受信と、複数の塩基配列関連情報群の中で、当該受信した塩基配列関連情報と一致する塩基配列関連情報を含んだ塩基配列関連情報群の特定とを、唯一の塩基配列関連情報群を特定するまで繰り返すステップfを更に実行させることを特徴とする請求項7記載の情報処理プログラムが記録された記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002336916 | 2002-11-20 | ||
JP2002336916 | 2002-11-20 | ||
PCT/JP2003/014733 WO2004046997A1 (ja) | 2002-11-20 | 2003-11-19 | 塩基配列関連情報を用いた情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2004046997A1 JPWO2004046997A1 (ja) | 2006-03-16 |
JP4266008B2 true JP4266008B2 (ja) | 2009-05-20 |
Family
ID=32321822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004553203A Expired - Fee Related JP4266008B2 (ja) | 2002-11-20 | 2003-11-19 | 塩基配列関連情報を用いた情報処理システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20060041389A1 (ja) |
EP (1) | EP1569154A4 (ja) |
JP (1) | JP4266008B2 (ja) |
WO (1) | WO2004046997A1 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11353404A (ja) * | 1998-06-11 | 1999-12-24 | Hitachi Ltd | 電子カルテシステム |
JP2000067139A (ja) * | 1998-08-25 | 2000-03-03 | Hitachi Ltd | 電子カルテシステム |
DE1233365T1 (de) * | 1999-06-25 | 2003-03-20 | Genaissance Pharmaceuticals Inc., New Haven | Verfahren zur herstellung und verwendung von Haplotype Daten |
AU1367201A (en) * | 1999-10-01 | 2001-05-10 | Orchid Biosciences, Inc. | Method and system for providing genotype clinical information over a computer network |
US6640211B1 (en) * | 1999-10-22 | 2003-10-28 | First Genetic Trust Inc. | Genetic profiling and banking system and method |
US20020019746A1 (en) * | 2000-03-16 | 2002-02-14 | Rienhoff Hugh Y. | Aggregating persons with a select profile for further medical characterization |
US20020010552A1 (en) * | 2000-05-26 | 2002-01-24 | Hugh Rienhoff | System for genetically characterizing an individual for evaluation using genetic and phenotypic variation over a wide area network |
JPWO2002025519A1 (ja) * | 2000-09-20 | 2004-01-29 | 株式会社東芝 | 遺伝子による診療情報提供方法、診療情報提供端末及び診療情報受給端末 |
US20050069874A1 (en) * | 2000-11-30 | 2005-03-31 | Kenji Yasuda | Method and system for offering gene analysis information and autentication identification method |
CA2872499C (en) * | 2001-05-25 | 2016-07-05 | Hitachi, Ltd. | Information processing system using nucleotide sequence related information |
-
2003
- 2003-11-19 US US10/535,407 patent/US20060041389A1/en not_active Abandoned
- 2003-11-19 EP EP03774053A patent/EP1569154A4/en not_active Withdrawn
- 2003-11-19 JP JP2004553203A patent/JP4266008B2/ja not_active Expired - Fee Related
- 2003-11-19 WO PCT/JP2003/014733 patent/WO2004046997A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2004046997A1 (ja) | 2006-03-16 |
EP1569154A4 (en) | 2006-09-06 |
WO2004046997A1 (ja) | 2004-06-03 |
EP1569154A1 (en) | 2005-08-31 |
US20060041389A1 (en) | 2006-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Majumder et al. | Direct-to-consumer genetic testing: value and risk | |
TWI363309B (en) | Genetic analysis systems, methods and on-line portal | |
Moore et al. | The challenges of whole-genome approaches to common diseases | |
US20210375392A1 (en) | Machine learning platform for generating risk models | |
US8571810B2 (en) | Information processing system using nucleotide sequence-related information | |
Geransar et al. | Evaluating online direct-to-consumer marketing of genetic tests: informed choices or buyers beware? | |
US20220044761A1 (en) | Machine learning platform for generating risk models | |
WO2022087478A1 (en) | Machine learning platform for generating risk models | |
US20090240441A1 (en) | System and method for analysis and presentation of genomic data | |
Hallett et al. | Random forest and variable importance rankings for correlated survival data, with applications to tooth loss | |
Ramos-Onsins et al. | Mlcoalsim: multilocus coalescent simulations | |
JP4365822B2 (ja) | 塩基配列関連情報を用いた情報処理システム | |
JP4266008B2 (ja) | 塩基配列関連情報を用いた情報処理システム | |
JP3888999B2 (ja) | 塩基配列関連情報を用いた情報処理システム | |
US7831394B2 (en) | Information processing system using nucleotide sequence-related information | |
Irlmeier et al. | Cox regression is robust to inaccurate EHR-extracted event time: an application to EHR-based GWAS | |
Gambin et al. | TIRfinder: a web tool for mining class II transposons carrying terminal inverted repeats | |
JP3677275B2 (ja) | 塩基配列関連情報を用いた情報処理システム | |
Gao et al. | Semiparametric regression analysis of bivariate censored events in a family study of Alzheimer’s disease | |
JP3677258B2 (ja) | 塩基配列関連情報を用いた情報処理システム | |
Ferrada | Gene Families, Epistasis and the Amino Acid Preferences of Protein Homologs | |
Muhammad et al. | An Integrated Framework for Analysis and Prediction of Impact of Single Nucleotide Polymorphism Associated with Human Diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080819 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081017 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090119 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090210 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090212 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4266008 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120227 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130227 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140227 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |