JPWO2006088208A1 - 生体の生理変化の予測方法および装置 - Google Patents

生体の生理変化の予測方法および装置 Download PDF

Info

Publication number
JPWO2006088208A1
JPWO2006088208A1 JP2007503790A JP2007503790A JPWO2006088208A1 JP WO2006088208 A1 JPWO2006088208 A1 JP WO2006088208A1 JP 2007503790 A JP2007503790 A JP 2007503790A JP 2007503790 A JP2007503790 A JP 2007503790A JP WO2006088208 A1 JPWO2006088208 A1 JP WO2006088208A1
Authority
JP
Japan
Prior art keywords
physiological change
expression level
gene
individual
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007503790A
Other languages
English (en)
Inventor
永坂 曜介
曜介 永坂
礼仁 寺本
礼仁 寺本
木村 徹
徹 木村
中川 博之
博之 中川
伊藤 彰
彰 伊藤
速雄 海老瀬
速雄 海老瀬
キャロライン・グラフ
ベンクト・ヴィンブラット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Pharma Co Ltd
Original Assignee
Sumitomo Dainippon Pharma Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Dainippon Pharma Co Ltd filed Critical Sumitomo Dainippon Pharma Co Ltd
Publication of JPWO2006088208A1 publication Critical patent/JPWO2006088208A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】 生体の生理的変化が生じる部位とは異なる部位から採取した試料などを用いて、当該生理的変化を高い精度で予測する。【解決手段】 第1生体群(生理的変化を生じる個体)および第2生体群(生じない個体)に属する各個体から生体組織を採取する(ステップP2)。この際、生理的変化を予測する対象部位とは異なる部位の生体組織を採取する。次に、各個体から採取した試料を用いて、DNAチップによるハイブリダイゼーションを行う(ステップP4)。ハイブリダイゼーションしたDNAチップをスキャナで撮像し、各プローブ領域ごとの濃度データを遺伝子発現データとして取得する(ステップP5)。上記のようにして得た各個体ごとの遺伝子発現データに基づいて、第1生体群と第2生体群において顕著に発現データの異なる遺伝子を選抜する(ステップP6)。各個体におけるマーカー遺伝子群の遺伝子発現データについて多変量解析を行い、第1生体群と第2生体群を判別する基準を生成する。【選択図】 図1

Description

この発明は、遺伝子の発現データをもとに生体の生理的変化を予測する技術に関するものである。
生体が何らかの生理的変化を起こす際に、それに先んじて単数または複数の遺伝子の発現に何らかの変化が見られることがある。このような遺伝子は、しばしば生体の生理的変化を予測するマーカー遺伝子として用いられる。
生体の生理的変化を予測しようとする場合に用いる試料については、生理的変化を生じる部位から、すなわち生理的変化が疾患の発症であれば、疾患の現れる部位から採取した生体組織またはそれらから調製した生体試料を用いることが一般的である(非特許文献1)。
一方、近年著しく進歩したDNAチップ解析技術やDNAアレイ解析技術により、膨大な数の遺伝子の発現を一度に高い精度で調べることができるようになった。さらには、上記解析方法などから得られた多数の遺伝子をマーカー遺伝子とし、それらの発現の変化について統計解析等の数学的処理(たとえばT検定、分散分析、クラスター分析など)を行うことによって、生体の生理的変化を予測することが可能となった(非特許文献2)。
また、ある生理的変化、たとえば疾患の発症などを誘起する要素を有する生体群の発現量と、かかる要素を有しない生体群の発現量とを比較し、明瞭な差異の認められる遺伝子を選抜して、マーカー遺伝子とすることが知られている(非特許文献3)。
Biochemical and Biophysical Research Communications 315, 1088-1096(2004)
Nature 415, 530-526(2002)
New England Journal of Medicine 347, 1999-2009
上記従来技術においては、生理的変化の生じる部位から試料を採取することが必要であり、部位によってはこれが困難な場合もある。例えば生理的変化が中枢神経系疾患の場合、生理的変化が現れる部位は脳であり、生命を維持している生体から脳組織を採取することは極めて困難である。このように生体組織の採取に伴う生体への負荷や生命維持、あるいは技術上の問題から、当該生理的変化を生じる部位から生体組織や生体試料を得ることができない場合も多い。
また、上記の従来技術では、2群を比較する方法やマーカー遺伝子の選抜基準などが標準化されておらず、より精度の高い予測を可能とするものではなかった。
そこで、この発明は、生体の生理的変化が生じる部位とは異なる部位から採取した試料などを用いて、当該生理的変化を高い精度で予測する技術の提供を目的とする。
また、当該予測方法に適したマーカー遺伝子の選抜技術を提供することを目的とする。
さらにまた、当該予測方法に適した予測基準の作成技術を提供することを目的とする。
(1)この発明に係る生体の生理的変化の予測方法は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて前記発症の有無を判別するための判別基準を生成するステップと、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に前記判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップとを備えている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。
(2)この発明に係る生体の生理的変化の予測方法は、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップとを備え、
前記マーカー遺伝子群は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
前記判定基準は、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。
(3)この発明に係る生体の生理的変化の予測に用いる判別基準を生成する方法は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて、前記対象部位における生理的変化の有無を判別するための判別基準を生成するステップとを備えている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測するための判別基準を得ることができる。
(4)この発明に係るマーカー遺伝子の選抜方法は、生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップとを備えている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、マーカー遺伝子を選抜することができる。
(5)この発明に係る生体の生理的変化の予測方法は、遺伝子発現量の検出は、遺伝子発現検出素子を用いて行うことを特徴としている。
したがって、遺伝子発現量の取得が容易である。
(6)この発明に係る判定基準作成プログラムは、生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、検出した個体ごとの遺伝子発現量を前記生理的変化の有無と関連付けて基礎データとするステップと、前記基礎データに基づいて、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて前記対象部位における生理的変化の有無を判別するための判別基準を生成するステップとをコンピュータに実行させるための判定基準生成プログラムである。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測するための判定基準を作成できる。
(7)この発明に係るマーカー遺伝子選抜プログラムは、生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップとをコンピュータに実行させる。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、マーカー遺伝子を選抜することができる。
(8)この発明に係る予測プログラムは、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップとをコンピュータに実行させるための予測プログラムであって、
前記マーカー遺伝子群は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化の発症部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
前記判定基準は、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。
(9)この発明に係るプログラムは、遺伝子発現量の検出は、遺伝子発現検出素子を用いて行うことを特徴としている。
したがって、遺伝子発現量の取得が容易である。
(10)この発明に係る遺伝子発現検出素子は、基板と、マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブとを備え、
前記マーカー遺伝子群は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであることを特徴としている。
したがって、生理的変化の有無を予測するために必要なマーカー遺伝子に対応するプローブを有する遺伝子発現検出素子を提供することができる。
(11)この発明に係る予測装置は、生体の生理的変化の予測を行うための予測装置であって、
基板と、マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブと、プローブによって捉えられた遺伝子発現量を電気信号に変換する変換部と、各遺伝子発現量に対応する電気信号を受け、判定基準に基づいて生理的変化の有無を予測する予測部とを備え、
前記マーカー遺伝子群は、当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり
前記判定基準は、前記生理的変化を発症する個体と前記生理的変化を発症しない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。
(12)この発明に係るプログラムは、遺伝子発現検出素子は、DNAチップまたはDNAアレイであることを特徴としている。
したがって、一度に大量の遺伝子発現量を取得することができる。
(13)この発明に係る予測装置は、生体組織についての遺伝子の遺伝子発現量は、当該生体組織またはそれから調製した生体試料に基づいて検出することを特徴としている。
(14)この発明に係る予測装置は、生体組織が皮膚組織または粘膜組織であることを特徴としている。
したがって、困難性の低い部位から容易に採取を行うことができる。
(15)この発明に係る予測装置は、生体試料が繊維芽細胞であることを特徴としている。
(16)この発明に係る予測装置は、生体試料が繊維芽細胞由来RNAであることを特徴としている。
(17)この発明に係る予測装置は、発症部位が脳であることを特徴としている。
したがって、生体組織の採取が困難な脳について、生理的変化を予測することができる。
(18)この発明に係る予測装置は、生理的変化が疾患の発症であることを特徴としている。
したがって、疾患発症の有無を予測することができる。
(19)この発明に係る予測装置は、疾患が中枢神経疾患であることを特徴としている。
(20)この発明に係る予測装置は、中枢神経疾患が痴呆症、パーキンソン病、筋萎縮性側索硬化症、またはプリオン病(クロイツフェルトーヤコブ病)であることを特徴としている。
(21)この発明に係る予測装置は、痴呆症がアルツハイマー病または前頭側頭型痴呆であることを特徴としている。
したがって、アルツハイマー病の発症を予測することができる。
(22)この発明に係る予測装置は、生理的変化を誘起する要素がSwedish変異、Arctic変異およびプレセリニン1遺伝子H136Y変異から選ばれる1種以上の要素であることを特徴としている。
(23)この発明に係る予測装置は、多変量解析は、主成分分析および線形判別分析を含む解析方法であることを特徴としている。
(24)この発明に係る予測装置は、発現量の差異が見いだされる遺伝子の選抜は、情報量基準に基づいて行われることを特徴としている。
(25)この発明に係る予測装置は、情報量基準は、アレンのクロスバリデーション基準であることを特徴としている。
(26)この発明に係る予測装置は、遺伝子発現量の検出は、ハイブリダイゼーションによって遺伝子発現検出素子のプローブに結合した標識済みの遺伝子による光学的特性の変化を検出することによって行うことを特徴としている。
(27)この発明に係る予測装置は、遺伝子発現量の検出は、ハイブリダイゼーションによって遺伝子発現検出素子のプローブに結合した遺伝子による電気的特性の変化を検出することによって行うことを特徴としている。
(28)この発明に係る予測装置は、生体の生理的変化の予測を行うために用いる遺伝子発現検出素子であって、
基板と、マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブとを備え、
前記マーカー遺伝子群は、
当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
前記各マーカー遺伝子のためのプローブは、
前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について主成分分析を行い、当該主成分に係る合成変量の係数に応じて、各遺伝子に対応するプローブの検出感度を設定したものであることを特徴としている。
(29)この発明に係る生体の生理的変化の予測システムは、サーバ装置と端末装置を備えており、
前記端末装置は、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を送信する送信手段と、サーバ装置からの予測結果データを受信する受信手段と、受信した予測結果データを出力する出力手段とを備え、
サーバ装置は、前記端末装置からの遺伝子発現量を示す情報を受信する受信手段と、当該遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測する予測手段と、前記予測手段による予測結果データを前記端末装置に送信する送信手段とを備えており、
前記マーカー遺伝子群は、
当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
前記判定基準は、
前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。さらに、端末装置側に予測のための装置がなくとも、サーバ装置に接続できる環境であれば予測結果を得ることができる。
(30)この発明に係るサーバ装置は、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を前記端末装置から受信する受信手段と、当該遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測する予測手段と、前記予測手段による予測結果データを前記端末装置に送信する送信手段とを備えており、
前記マーカー遺伝子群は、
当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
前記判定基準は、
前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。
(31)この発明に係る端末装置は、予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を送信する送信手段と、サーバ装置からの予測結果データを受信する受信手段と、受信した予測結果データを出力する出力手段とを備え、
前記マーカー遺伝子群は、
当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであることを特徴としている。
したがって、生理的変化を生じる部位とは異なる部位から採取した生体組織に基づいて、精度よく、生理的変化の有無を予測することができる。さらに、端末装置側に予測のための装置がなくとも、サーバ装置に接続できる環境であれば予測結果を得ることができる。
(32)この発明に係る予測装置は、マーカー遺伝子に、米国生物工学情報センター(National Center for Biotechnology Information、(NCBI))の遺伝子情報データベース「Genbank」のアクセション番号によって特定される、少なくとも以下の51個の遺伝子が含まれることを特徴としている:
BC006249、NM_000454、NM_001780、BG531983、NM_000177、NM_000801、NM_003197、NM_006389、NM_004446、NM_007178、NM_002414、NM_004092、NM_003651、NM_003022、NM_004528、NM_005614、NM_004730、BC004467、NM_001483、NM_003365、NM_007214、AI927770、NM_001685、NM_005493、NM_001753、NM_002961、NM_001157、NM_004545、NM_003915、AF208850、AW510696、AF312393、BC002977、AF313911、AF000974、L18964、U76833、M55580、U43430、BC005911、AU147399、AL523310、AI144075、AL117593、AA650558、AI123426、NM_005051、NM_014380、NM_015920、NM_017821、AK001105。
したがって、正確にアルツハイマー病の発症を予測することができる。
この発明において「生体の生理的変化」とは、細胞、組織、器官などの生命体の一部あるいは個体全体に生じる、観察可能な変化をいう。たとえば、形、色、大きさ、温度、エネルギー消費、物質産生や運動・行動の変化、疾患の発症などを含む概念である。なお、「生理的変化を発現する要素」は、上述の生体の生理的変化を誘起し得る、物質的、または非物質的なあらゆる事物を含む。具体的には、遺伝子、環境(気温、水温、湿度、浸透圧、音及び振動等)、栄養状態、薬物投与、ストレス、性格、性癖及び嗜好等を挙げることができるが、これらに限定されない。また「生理的変化を誘起する要素」も同義である。
「生理的変化の予測」とは、将来に生じるであろう生理的変化を予測する場合だけでなく、直接的に観測することが困難な部位について現在の生理的変化の有無を予測する場合も含む概念である。
「生体の生理的変化予測マーカー」とは生体の生理的変化を予測するために、直接または間接的に利用されるものをいう。これには生体の生理的変化に関連して、生体内において発現が変動する遺伝子、ヌクレオチド、ポリヌクレオチドまたはタンパク質、ポリペプチド、及びそれらを特異的に認識し、また結合することのできるポリヌクレオチドまたは抗体が包含される。これらのヌクレオチド、ポリヌクレオチド及び抗体は、上述の性質に基づいて、生体内で発現した上述の遺伝子及びタンパク質を検出するためのプローブとして、またヌクレオチド及びポリヌクレオチドは生体内で発現した上述の遺伝子を増幅するためのプライマーとして、さらにタンパク質は結合する物質のスクリーニングに有効に利用することができる。また、「生理的変化予測マーカー」や「予測マーカー」、「マーカー」も同義である。
「遺伝子」には、RNAやDNAなどの塩基配列によって示される遺伝情報をいうものである。ヒト、マウス、ラットなどの生物種間で保存されるオーソログ遺伝子なども含まれる。遺伝子は、タンパク質をコードするものだけでなく、RNAやDNAとして機能するものであってもよい。遺伝子は、その塩基配列にしたがうタンパク質をコードするのが一般的であるが、当該タンパク質と生物学的機能が同等であるタンパク質(たとえば同族体(ホモログやスプライスバリアントなど)や変異体や誘導体)をコードするものであってもよい。たとえば、遺伝情報による塩基配列によって示されるタンパク質とはわずかに塩基配列が異なるタンパク質であって、その塩基配列が遺伝子情報による塩基配列の相補配列とハイブリダイズするようなタンパク質をコードするような遺伝子であってもよい。
「DNA」とは、2本鎖DNAだけでなく、それを構成するセンス鎖およびアンチセンス鎖といった各1本鎖DNAも含む概念である。DNAは、ヒトゲノムDNAを含む2本鎖DNAだけでなく、cDNAを含む1本鎖DNA(正鎖)ならびに当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)およびこれらの断片のいずれをも含む概念である。また、DNAはその全体だけでなく、発現制御領域、コード領域、エキソン、イントロンなどの各機能領域も含む概念である。また、cDNA、ゲノムDNA、合成DNA等を含む概念である。
「RNA」とは、1本鎖RNAだけでなく、これに相補的な配列を有する1本鎖RNAやこれらから構成される2本差RNAを含む概念である。また、totalRNA、mRNA、rRNAを含む概念である。
「遺伝子発現検出素子」とは、遺伝子発現の有無または発現量を検出する素子をいい、光学的に発現量を検出するものだけでなく、電気的に発現量を検出するものを含み、発現の有無や発現量やを物理量に変換するものをいう。ガラス面、プラスチックのウエルやチューブの側面や底面、微少ビーズの表面などにプローブDNAを配置させたものを含み、DNAチップやDNAアレイを含む概念である。
「DNAチップ」「DNAアレイ」とは、プローブDNAを基板上に配した構造を有し、ハイブリダイゼーションにより、複数の遺伝子の発現を測定するものである。光学的に発現量を計測するためのものだけでなく、電気的に発現量を出力するものも含む。「DNAチップ」としては、たとえば、アフィメトリクス社のGeneChip(商標)を用いることができる。「DNAアレイ」としては、アマシャムバイオサイエンス社のCodeLink Expression Bioarray(商標)を用いることができる。なお、DNAアレイには、DNAマイクロアレイだけでなくDNAマクロアレイも含む。
「発現量」とは、遺伝子の発現量を直接的に測定した値だけでなく、所定の計算や統計学的手法によって変換された値も含む概念である。また、「遺伝子発現量」や「発現シグナル」、「遺伝子発現シグナル」、「発現シグナル値」、「遺伝子発現シグナル値」、「遺伝子発現データ」、「発現データ」等も個々の遺伝子の発現を反映する値を指すものとして同義である。
「遺伝子発現」とは遺伝子の発現量により表現される生体の遺伝子発現の態様を指し、1個の遺伝子の発現量により表される場合及び複数の遺伝子の発現量により表される場合のいずれもが含まれる。また、「発現」も生体の遺伝子発現の態様を指すものとして同義である。
「生体組織について遺伝子の発現量を検出する」とは、生体組織そのものを用いて発現量を検出する場合だけでなく、生体組織に基づいて調製した生体試料を用いて発現量を検出する場合を含む概念である。
「生体試料」とは、採取した組織から調製した試料をいい、たとえば、細胞、繊維芽細胞、赤血球、白血球、リンパ球、核酸、繊維芽細胞由来RNAなどである。
「プログラム」とは、とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。
発明を実施するための形態
1.生理的変化の予測方法
図1、図2にこの発明の一実施形態による生体の生理的変化を予測する方法における処理の流れを示す。図1は判別基準の生成を示し、図2は当該判別基準を用いた予測を示している。
図1において、まず、予測対象となる生理的変化について、当該生理的変化を生じる生体群(第1生体群とする)と生じない生体群(第2生体群とする)を特定する(ステップP1)。次に、第1生体群および第2生体群に属する各個体から生体組織を採取する(ステップP2)。この際、生理的変化を予測する対象部位とは異なる部位の生体組織を採取する。たとえば、脳における生理的変化を予測する場合であれば、ヒトの上腕部の皮膚等の組織を採取する。
次に、各個体から採取した生体組織に基づいて試料を調製する(ステップP3)。たとえば、採取した生体組織から繊維芽細胞を調製する。
次に、この試料を用いて、DNAチップによるハイブリダイゼーションを行う(ステップP4)。たとえば、試料からmRNAを取り出し、このmRNAのcDNA(相補性DNA)を複製する。このcDNAを蛍光処理する。さらに蛍光処理されたcDNAを含む水溶液をDNAチップのプローブに滴下し、ハイブリダイゼーション(2重鎖形成反応)を行う。
DNAチップには、縦横に多くのプローブ領域が設けられ、各プローブ領域にはDNAプローブが多数設けられている。各プローブ領域ごとに、DNAプローブの塩基配列は異なるものとなっている。
上記のハイブリダイゼーションにより、蛍光処理されたcDNAは対応する塩基配列を有するDNAプローブと相互作用する。したがって、各プローブ領域の色濃度を測定することによって、mRNAの発現量を検出することができる。
次に、ハイブリダイゼーションしたDNAチップをスキャナで撮像し、mRNAの発現量に応じた色濃度の画像を得る。さらに、画像解析ソフトウエアにより、この画像に基づいて、各プローブ領域ごとの濃度データを遺伝子発現データとして取得する(ステップP5)。
上記のようにして得た各個体ごとの遺伝子発現データに基づいて、第1生体群と第2生体群の遺伝子発現データを比較することによって、第1生体群と第2生体群において顕著に発現データの異なる遺伝子を選抜する(ステップP6)。このようにして選抜した遺伝子群を、マーカー遺伝子群とする。たとえば、クロスバリデーション基準などの情報量基準を用いて、マーカー遺伝子群の選抜を行うことができる。
次に、各個体におけるマーカー遺伝子群の遺伝子発現データについて多変量解析を行い、第1生体群と第2生体群を判別する基準を生成する。たとえば、主成分分析を行い、判別基準を得ることができる。
以上のようにして生理的変化の予測に用いる判別基準を生成することができる。
図2に、生理的変化の予測を示す。まず、ステップP11において、予測対象である個体から生体組織を採取する。この際、生理的変化を予測する対象部位とは異なる部位の生体組織を採取する。
次に、採取した生体組織から生体試料を調整する(ステップP12)。なお、生体試料は、判別基準の作成の際に用いたと同じ部位の生体組織から採取した同じ種類の生体試料であることが好ましい。
この試料を用いて、DNAチップによるハイブリダイゼーションを行う(ステップP13)。たとえば、試料からmRNAを取り出し、このmRNAのcDNA(相補性DNA)を複製する。このcDNAを蛍光処理する。さらに蛍光処理されたcDNAを含む水溶液をDNAチップのプローブに滴下し、ハイブリダイゼーション(2重鎖形成反応)を行う。なお、ここで用いるDNAチップは判別基準の生成の際に用いたものと同様のDNAチップでもよいが、マーカー遺伝子群に対応するプローブだけを設けた専用のDNAチップの方が好ましい。
次に、ハイブリダイゼーションしたDNAチップをスキャナで撮像し、mRNAの発現量に応じた色濃度の画像を得る。さらに、画像解析ソフトウエアにより、この画像に基づいて、各プローブ領域ごとの濃度データを遺伝子発現データとして取得する(ステップP14)。
続いて、取得した遺伝子発現データに判別基準を適用し、生理的変化の有無を予測し(ステップP15)、予測結果を得る(ステップP16)。上記のようにして生体の生理的変化を予測することができる。
なお、上記方法において、マーカー遺伝子の選抜方法、判別基準の作成方法、判別基準に基づく予測方法は、それぞれ独立して実施することができる。たとえば、図1に示す判別基準の作成だけを本発明に従って実施し、その判別基準を他の予測方法に用いたり、予測方法以外に用いることができる。
また、本発明以外の方法によって作成された判別基準を用いて、図2に示す予測方法を実施することが可能である。
さらに、図1のステップP1〜P6によって示されるマーカー遺伝子の選抜方法を実施し、選抜されたマーカー遺伝子に基づき本発明以外の方法によって判別基準を生成したり、選抜されたマーカー遺伝子を判別基準の生成以外に用いることも可能である。
2.装置として構築した例
図1に示す判別基準の生成および図2示す生理的変化の予測は、コンピュータを用いずに実施することができる。しかし、大量のデータ処理を考慮すると、以下に示すように装置として実現することが好ましい。
2.1判別基準生成装置
判別基準生成装置の機能ブロック図を図3に示す。発現量検出手段22により、ハイブリダイゼーション済みのDNAチップD1、D2・・・Dnから、各個体ごと遺伝子ごとの発現量データが得られる。さらに、この発現量データと各個体の生理的変化の有無データとが組み合わされて、基礎データ生成手段24により基礎データが生成される。
マーカー選抜手段26は、第1生体群と第2生体群の発現データを比較して、マーカー遺伝子を選抜する。判別基準生成手段28は、マーカー遺伝子群の発現量データに基づいて多変量解析を行い、第1生体群と第2生体群を判別する基準を演算する。これによって、判別基準30が記録される。
2.1.1コンピュータを用いて構築した例
判別基準生成装置をコンピュータによって実現した場合のハードウエア構成を図4に示す。CPU2には、ディスプレイ4、スキャナ6、メモリ8、CD−ROMドライブ10、ハードディスク12が接続されている。スキャナ6は、ハイブリダーゼーションを行ったDNAチップのプローブ領域を画像として読み取るものである。本実施形態では、スキャナ6はCPU2に接続されており直接的にデータの取り込みが可能となっている。しかし、スキャナ6で読み取った画像データを、可搬性記録媒体(CD−RWなど)に記録し、CD−ROMドライブ10から読み取るようにしてもよい。
メモリ8は、CPU2のワーク領域として用いられる。ハードディスク12には、オペレーティングシステム16および判別基準生成プログラム18が記録されている。これらプログラムは、CD−ROM14に記録されていたものを、CD−ROMドライブ10を介してハードディスク12にインストールされたものである。判別基準生成プログラム18は、オペレーティングシステム16と協働してその機能を発揮する。なお、判別基準生成プログラム18単独で機能するプログラムとしてもよい。
2.1.2判別基準生成プログラム
図5、図6に、判別基準生成プログラムのフローチャートを示す。ここでは、一例を具体的に示すため、予測対象とする生体の生理的変化をアルツハイマー病として説明する。
なお、各個体の皮膚組織から、繊維芽細胞をNeuroscience Letters, 220 9-12(1996)に記載の方法で単離、培養し、1試料あたり300〜1000万個の繊維芽細胞を得て、これを生体試料とした。さらに、この繊維芽細胞からTotalRNAを抽出した。抽出には、Rneasy Mini kit(Qiagen, Valencia, CA)を用いることができる。
TotalRNAからのcDNAの調製、cDNAからのラベル化cRNAの調製、ラベル化cRNAのフラグメント化、フラグメント化cRNAとDNAとのハイブリダイズ、ハイブリダイズしたcRNAの蛍光染色については、特開2003−169867に記載の方法を用いることができる。なお、この実施形態では、DNAチップとして、Affymetrix社製オリゴヌクレオチド型DNAチップGeneChip HG-U133A Arrayを用いた。
まず、ステップS1において、CPU2は、スキャナ6にセットされた、最初の個体の生体試料によってハイブリダイゼーションされたDNAチップの画像を読み取る。この画像は、各遺伝子の発現量に応じた蛍光濃度を有している。次に、CPU2は、当該画像の各プローブ領域の蛍光濃度に基づいて、各遺伝子ごとの発現量データを生成する。これにより発現量データを取得することができる(ステップS2)。これらについても、特開2003−169867に記載の方法を用いることができる。また、発現量データ取得の部分は、アフィメトリクス社の解析ソフトウエアMicroarray Suite version 5.0を用いて実現することができる。
さらに、CPU2は、当該個体についてのアルツハイマー病を発症するか否かのデータを取得する(ステップS3)。なお、アルツハイマー病を発病しているか、あるいは将来発病することが確実な個体を、「アルツハイマー病を発症する」個体として扱った。これは、キーボードなど(図示せず)から入力されたものであってもよいし、予め各個体ごとにハードディスク12に記録されたデータから取得するようにしてもよい。後者の場合には、各個体ごとにIDを付してデータを記録しておき、DNAチップの画像読み取りの際に当該IDを入力することで対応するデータを取得できるようにしておくとよい。
なお、家族性アルツハイマー病病因遺伝子保持者であるSwedish変異保持者、Arctic変異保持者、プレセニリン1遺伝子H163Y変異保持者をアルツハイマーを発症する者とした。また、上記病因遺伝子の非保持者をアルツハイマーを発症しない者とした。したがって、この実施形態では、生理的変化を生じる者の中には現実に生じている者だけでなく、将来生じることが確実視されるものも含む。
上記のようにして、対象とした個体について、アルツハイマー発病の有無と各遺伝子ごとの発現量を基礎データとして得て、ハードディスク12に記録する(ステップS4)。
次に、CPU2は、全ての個体について上記の処理を行ったかどうかを判断する(ステップS5)。未処理の個体があれば、上記ステップS1〜S5の処理を繰り返す。
全ての個体について基礎データを記録すれば、ステップS6以下のマーカー遺伝子の選抜処理に移る。図7に、ハードディスク12に記録された基礎データの一部を示す。図において、最上欄は個体IDである。各個体毎に、発症の有無、遺伝子1の発現データ、遺伝子2の発現データ・・・遺伝子nの発現データが記録される。
なお、この実施形態において用いたDNAチップ(HG-U133A)は、22,283種のプローブを有している。したがって、この実施形態において、ハードディスク12に記録される遺伝子の数nは22、283種である。
次に、CPU2は、ハードディスク12に記録された基礎データに基づいて、マーカー遺伝子を選抜する。まず、CPU2は、発現していない遺伝子および発現量の小さい(シグナルが44未満)遺伝子を検討外とする。次に、最初の遺伝子を対象遺伝子とし(ステップS6)、対象遺伝子について全個体中から最大の発現量と最小の発現量を抽出する(ステップS7)。次式に基づき、最大値と最小値の中間値を算出する。
中間値=(最大値+最小値)/2
次に、この中間値を境として、発現量大のグループと発現量小のグループに分ける(ステップS8)。さらに、各個体のアルツハイマー病発症の有無に基づき、2つのグループに分ける(ステップS9)。このようなグループ分けにより、対象遺伝子の発現量データは、図8に示すように4つのグループに分けられる。領域1,1は「発症あり」かつ「発現大」の領域、領域1,2は「発症あり」かつ「発現小」の領域、領域2,1は「発症なし」かつ「発現大」の領域、領域2,2は「発症なし」かつ「発現小」の領域である。
続いて、CPU2は、この遺伝子の発現量が「発症あり」と「発症なし」に関連を持たない度合い(独立モデル)と、関連を持つ度合い(従属モデル)を算出する。この実施形態では、アレンのクロスバリデーション(CV)基準により、従属モデルの最大対数尤度Ldeと、独立モデルの最大対数尤度Linを、下式に従って算出する(ステップS10)。なお、この算出処理部分については、統計解析ソフトウエア「Visual Mining Studio ver. 3.0」(数理システム社)を用いることができる。
Figure 2006088208
ここで、nは試料の数(全個体数)、n(i,j)は図8の領域i,jに入る試料(個体)の数である。
Figure 2006088208
ここで、n(i)は図8のi列目の領域に入る試料の数である。i=1であれば、領域1,1と領域1,2に入る試料の数である。i=2であれば、領域2,1と領域2,2に入る試料の数である。n(j)は図8のj列目の領域に入る試料の数である。j=1であれば、領域1,1と領域2,1に入る試料の数である。j=2であれば、領域1,2と領域2,2に入る試料の数である。
最大対数尤度Ldeおよび最大対数尤度Linは、発現量と発症が関連する(Lde)/関連しない(Lin)という仮定のもっともらしさを示す値である。そこで、この実施形態では、CPU2は、下式によって対象遺伝子のCV値を算出するようにした(ステップS11)。
CV値=Lde−Lin
したがって、CV値が大きいほど、対象遺伝子の発現量と発症との関連が大きいといえる。CPU2は、算出したCV値を当該遺伝子と対応付けてハードディスク12に記録する。
次に、CPU2は、DNAチップのプローブを構成する全ての遺伝子についてCV値を算出したかどうかを判断する(ステップS12)。未算出の遺伝子があれば、次の遺伝子を対象遺伝子とし(ステップS14)、ステップS7以下を繰り返して実行する。
全ての遺伝子について算出したCV値は、図9に示すようにハードディスク12に記録される。
全ての遺伝子についてCV値を算出すると、CV値の大きい遺伝子から所定個をマーカー遺伝子として選抜する(ステップS13)。この実施形態では、CV値が3以上の遺伝子のうち、上位200個をマーカー遺伝子として選抜した。なお、マーカー遺伝子は本実施形態のようにCV値と個数を組み合わせて選抜してもよいが、CV値のみ、個数のみで選抜するようにしてもよい。
また、CV値に基づいてマーカー遺伝子を選択する場合には、図10に示すように、CPU2は、しきい値とするCV値を変化させたときの、サポートベクターマシン(SVM)によるLOOCV(Leave-One-Out Cross Validation)の正答率が最大となるCV値を選択するようにしてもよい。たとえば、全試料(全個体)から1個(1個体)を取り除き、残った試料(個体)ついて、選抜したマーカー遺伝子の発現量を用いてSVMによる判別分析を行い、判別空間上に発症の有無を有する第1群と第2群との判別面を得る。取り除いた1個の試料についての発現量をもとに判別空間に投影し、正しい判別が行われるかどうかを判断した。この操作を、取り除く試料を変えて全ての試料について行う。これにより、正答率を算出する。
さらに、これらの操作を、しきい値とするCV値を変化させて行う。これにより、図10に示すように、選抜基準であるCV値を変えた場合の正答率を得ることができる。図10の場合であれば、CV値を3または4とすればよいことが判明する。
なお、上記のSVMによるLOOCV交差検証の部分は、統計解析ソフトウエア「R」および「R」用統計解析パッケージ「e1071」(http://www.cran.us.r-project.org/)を用いて実施することができる。
次に、CPU2は、各マーカー遺伝子の発現量ε1、ε2・・・εnを下式に基づいて標準化する(ステップS15)。
Figure 2006088208
ここで、μ1、μ2・・・μnは、各マーカー遺伝子の発現量ε1、ε2・・・εnについての全個体における平均値である。σ1、σ2・・・σnは、各マーカー遺伝子の発現量ε1、ε2・・・εnについての全個体における標準偏差である。本実施形態においては、nは200である。
続いて、CPU2は、上記で算出した各マーカー遺伝子の標準化発現量D1、D2・・・Dnについて、主成分分析を行い、第1主成分X、第2主成分Y、第4主成分Zを算出する(ステップS16)。
Figure 2006088208
ここで、P1iは第1主成分のi番目のマーカー遺伝子についての固有ベクトルである。P2iは第2主成分のi番目のマーカー遺伝子についての固有ベクトルである。P4iは第4主成分のi番目のマーカー遺伝子についての固有ベクトルである。
さらに、CPU2は、アルツハイマーを発症する第1個体群の第1、第2、第4主成分と、アルツハイマーを発症しない第2個体群の第1、第2、第4主成分に基づいて、線形判別分析により、第1群と第2群を判別するための判別式を算出する。具体的には、下式のa、b、c、dを算出する。
Figure 2006088208
したがって、判別式は下式のように表される。
Figure 2006088208
上式の値Aが0より大きければアルツハイマー病を発症すると予測され、0より小さければアルツハイマー病を発症しないと予測することができる。
なお、上記実施形態では、3つの主成分を用いているが、2つ以下、4つ以上の主成分を用いるようにしてもよい。また、上記実施形態では、第1、第2、第4主成分を用いているが、これは、第1、第2、第3主成分を用いた場合よりも、第1、第2、第4主成分を用いた場合の方が予測精度が高かったからである。予測対象である生理的変化によっては、第1、第2、第3主成分を用いた場合の方が予測精度が高い場合も多い。かかる場合には、第1、第2、第3主成分を用いることが好ましい。
2.2予測装置
予測装置の機能ブロック図を図11に示す。この予測装置には、上記の判別式が判別基準として記録されている。
発現量検出手段32により、ハイブリダイゼーション済みのDNAチップDから、予測対象である個体の遺伝子ごとの発現量データが得られる。なお、この実施形態では、マーカー遺伝子に対応するプローブのみを有するDNAチップを用いたが、それ以外の遺伝子プローブも有するものを用いてもよい。
予測手段34は、記録された判別式に基づいて数値Aを算出し、0より大きければアルツハイマー病を発症すると予測する。また、0より小さければアルツハイマー病を発症しないと予測する。出力手段36は、この予測結果をディスプレイ、プリンタなどに出力する。
2.2.1コンピュータを用いて構築した例
予測装置をコンピュータによって実現した場合のハードウエア構成を図12に示す。CPU2には、ディスプレイ4、スキャナ6、メモリ8、CD−ROMドライブ10、ハードディスク12が接続されている。スキャナ6は、ハイブリダイゼーションを行ったDNAチップのプローブ領域を画像として読み取るものである。本実施形態では、スキャナ6はCPU2に接続されており直接的にデータの取り込みが可能となっている。しかし、スキャナ6で読み取った画像データを、可搬性記録媒体(CD−RWなど)に記録し、CD−ROMドライブ10から読み取るようにしてもよい。
メモリ8は、CPU2のワーク領域として用いられる。ハードディスク12には、オペレーティングシステム16、予測プログラム17、判別式19が記録されている。なお、判別式19は予測プログラム17のプログラムの一部として記述されていてもよい。これらプログラムは、CD−ROM14に記録されていたものを、CD−ROMドライブ10を介してハードディスク12にインストールされたものである。予測プログラム17は、オペレーティングシステム16と協働してその機能を発揮する。なお、予測プログラム17単独で機能するプログラムとしてもよい。
2.2.2予測プログラム
図13に、予測プログラムのフローチャートを示す。ここでは、一例を具体的に示すため、予測対象とする生体の生理的変化をアルツハイマー病として説明する。
なお、予測対象である個体の皮膚組織から、フラグメントcRNAを調製する方法やハイブリダイズ、cRNAの蛍光染色については、判別基準生成と同様である。ただし、DNAチップとしては、判別基準生成の際に選抜された200個の遺伝子に対応するプローブのみを有するものを用いた。
まず、ステップS51において、CPU2は、スキャナ6にセットされた、予測対象である個体の生体試料によってハイブリダイゼーションされたDNAチップの画像を読み取る。この画像は、各マーカー遺伝子の発現量に応じた蛍光濃度を有している。次に、CPU2は、当該画像の各プローブ領域の蛍光濃度に基づいて、各マーカー遺伝子ごとの発現量データを生成する。これにより、発現量データを取得することができる(ステップS52)。
さらに、CPU2は、ハードディスク12に記録されている判別式(上記数式6)を読み出し、各マーカー遺伝子の発現量に基づいて、数値Aを算出する(ステップS53)。算出した数値Aが0より小さければ、予測対象個体は、アルツハイマー病を発症しないと予測し、予測結果をハードディスク12に記録する(ステップS55)。算出した数値Aが0以上であれば、予測対象個体は、アルツハイマー病を発症すると予測し、予測結果をハードディスク12に記録する(ステップS56)。
CPU2は、数値Aおよび予測結果をディスプレイ4やプリンタ(図示せず)から出力する(ステップS57)。
3.ネットワークを介しての予測処理
図15に、ネットワークを介して行う予測システムの構成を示す。端末装置(コンピュータ)50は、インターネット52を介して、サーバ装置54(コンピュータ)と通信可能である。
サーバ装置54のハードウエア構成を図16に示す。図12の予測装置とほぼ同様の構成であるが、スキャナ6が設けられていない。また、インターネット52を介して端末装置50と通信するための通信回路7が設けられている。
端末装置50のハードウエア構成を図17に示す。図12の予測装置とほぼ同様の構成であるが、インターネット52を介してサーバ装置54と通信するための通信回路7が設けられている。また、ハードディスク12には、データ取得プログラム15が記録されている。
予測対象である個体の生体試料についてハイブリダイズしたDNAチップDを、端末装置50のスキャナで読み込む。データ取得プログラム15により、CPU2は、図13のステップS51を実行する。画像が取得できると、CPU2は、この画像データを、通信回路7によってサーバ装置54に送信する。
サーバ装置54のCPU2は、予測プログラム17にしたがって、図13のステップS52〜S57を実行する。つまり、この画像データから発現量データを取得し、発症の有無の予測を行う。ステップS57において、CPU2は、数値Aおよび予測結果を、端末装置50に送信する。端末装置50では、これを受けてディスプレイ4に表示する。
この実施形態によれば、端末装置50の側に予測プログラムが無くとも、発症の有無を予測することができる。
なお、上記実施形態では画像データをサーバ装置54に送信するようにしているが、端末装置50において発現量データを得て、これをサーバ装置54に送信するようにしてもよい。
4.DNAチップ型予測装置
図14Aに示すように、DNAチップ内に予測のための処理回路42と判定結果を表示する表示装置44を組み込んだ予測装置40を構築することもできる。プローブ領域46には、マーカー遺伝子に対応するプローブが設けられている。各プローブは、生体試料と結合すると電気信号を発する。この電気信号は、トランジスタなどで増幅され発現量信号として出力する。この発現量信号は、処理回路42に与えられる。電子式DNAチップの詳細は、Analytical andBioanalytical Chemistry, 377(3)521-527, 2003やThe Analyst, 130(5), 687-693, 2005などを参照のこと。
処理回路42は、CPU、メモリを備えており、図13のステップS52からS57を実行するプログラムを有している。処理回路42のCPUには、LCDなどによるディスプレイ44が接続されており、CPUはステップS57において数値Aをディスプレイ44に表示させる。なお、判定結果を表示させるようにしてもよい。このDNAチップ型予測装置を用いれば、簡易に予測を行うことができる。
なお、上記においては処理回路42にCPUを用いたが、図14Bに示すように判別式の演算を実行するハードウエア回路を用いてもよい。各プローブからの発現量信号をA/D変換器(図示せず)によってディジタルデータに変換された発現量データμ1、μ2・・・μnは、マルチプレクサ60を介して減算器62に与えられる。一方、定数データε1、ε2・・・εn(上記数式3における平均値)も、マルチプレクサ64を介して減算器62に与えられる。
マルチプレクサ60、64は、タイミングパルスTP1,TP2・・・TPnによって、発現量データμ1、μ2・・・μnと、定数データε1、ε2・・・εnを切り換えながら減算器62に与える。したがって、減算器62には、順次、発現量データμ1と定数データε1の組み合わせ、発現量データμ2と定数データε2の組み合わせ・・・・発現量データμnと定数データεnの組み合わせが出力される。したがって、減算器62は、順次、定数データε1から発現量データμ1を減算する演算、定数データε2から発現量データμ2を減算する演算・・・定数データεnから発現量データμnを減算する演算を行う。そして、タイミングパルスに従って、減算結果を、乗算器66、68、70に与える。
乗算器66は、タイミングパルスに従って、これにP11/σ1を乗算する演算、P12/σ2を乗算する演算・・・P1n/σnを乗算する演算を順次行う(数式3および数式4参照)。その出力は、タイミングパルスに従って加算器72に与えられる。加算器72は、順次送られてくる演算結果を累積的に加算する。したがって、タイミングパルスがTP1〜TPnまで進むと、加算器72からは第1主成分データXが出力される。同様に、加算器74、加算器76からは、第2主成分データY、第4主成分データZが出力される。
第1主成分データXは乗算器78にて係数a(数式5参照)が乗じられ、第2主成分データYは乗算器80にて係数bが乗じられ、第4主成分データZは乗算器82にて係数cが乗じられた後、それぞれ、加算器84にて加算される。したがって、加算器84より、数値Aを得ることができる。
5.他のDNAチップ構築例
上記のDNAチップ型予測装置では、DNAチップ内に処理回路を内蔵することで、コンピュータやスキャナのない環境でも、予測を行うことができるというメリットがある。しかし、処理回路を内蔵することはチップの構造を複雑にし、DNAチップを高価なものにする可能性がある。
そこで、以下の実施形態では、コンピュータや高価なスキャナが無い環境においても予測を行うことができるだけでなく、比較的安価に製造コストを抑えることのできるDNAチップを示した。
なお、この実施形態では、第1主成分のためのDNAチップ、第2主成分のためのDNAチップ、第4主成分のためのDNAチップというように、必要とする主成分に対応したDNAチップを設けている。
この実施形態では、数式3に代えて、下記数式8に示すような変換式にて標準データD'1、D'2・・・D'nを取得するようにしている。
Figure 2006088208
これにより、標準データD'1、D'2・・・D'nは必ず正の値となる。
この実施形態における第1主成分のためのDNAチップのプローブ領域を図18に示す。図に示すように、プローブ領域は1〜nまで設けられている。
さらに、各プローブ領域におけるRNAプローブの感度は同じではなく、各プローブ領域の遺伝子に対応する係数σi、P1iに対応して、プローブの感度が調整されている。この感度調整によって、P1i/σiを乗じた量に相当する蛍光濃度が検出されるように調製されている。この調製は、各プローブ領域に設けるプローブRNAやプローブDNAの数を調整することによって行うことができる。なお、蛍光濃度とプローブの数との関係を予め測定しておいて、プローブの数を決定することが好ましい。
第2の主成分のためのDNAチップ、第4の主成分のためのDNAチップも同様にして形成される。
このDNAチップによって予測を行う場合には、ハイブリダイズさせたDNAチップのプローブ領域全体を読み取る蛍光センサがあればよい。全体を読み取ることによって、下記数式9におけるシグマ加算が自動的になされることとなる。
Figure 2006088208
このようにして、第1の主成分のためのDNAチップ、第2の主成分のためのDNAチップ、第4の主成分のためのDNAのそれぞれについて、センサによる読み取り値を取得して記録しておき、手作業(電卓などを用いて)によって、これらに下記の数式10を適用すれば、予測判定を行うことができる。
Figure 2006088208
なお、上式では、ΣP1i(μi/σi)をX'から減ずることによって、X'を数式4のXに変換している。Y、Zについても同様である。ここで、ΣP1i(μi/σi)、ΣP2i(μi/σi)、ΣP4i(μi/σi)は、いずれも予め数値として算出しておくことが可能である。したがって、対応するDNAチップに印刷などの方法によって表示しておくことが好ましい。
上記のようにして算出したX、Y、Zを数式5に適用すれば、予測判定を行うことができる。
また、係数a、b、cも考慮して、蛍光濃度を調整するようにすれば、値A算出のための計算処理が容易となる。
この実施形態によれば、コンピュータが無くとも、また、高価なスキャナが無くとも簡易に予測を行うことができる。
なお、センサでの読み取りは全体として行うので、図18に示したように各プローブ領域を分離しておく必要はない。また、一つのDNAチップ上に、第1主成分のためのプローブ群、第2主成分のためのプローブ群、第3主成分のためのプローブ群を設けてもよい。
6.その他の実施形態
上記各実施形態では、アルツハイマー病についての判別を行っているが、その他の前頭側頭型痴呆、痴呆症、パーキンソン病、筋萎縮性側索硬化症、プリオン病などの中枢神経疾患についての判別にも適用できる。さらに、脳以外の部位において発症する疾患についての予測の用いることもできる。
上記実施形態では、皮膚組織を採取しているが、疾患の発症部位以外の組織であれば、粘膜組織、血液など皮膚組織以外の組織であってもよい。
上記実施形態では「比較解析」としてクロスバリデーション基準を用いている。ここで、「比較解析」とは2群の遺伝子発現データを比較して、群間の遺伝子発現の差異を評価する解析手法を指す。
比較解析には、情報量基準に基づいた比較を行う解析方法を用いることが好ましく例えば、t検定、F検定、χ2検定、順位和検定等が挙げられるが、1遺伝子の発現データに適用することで、2群間の遺伝子発現の差異を評価することができる解析手法であればこれらに限定されない。
2群間の遺伝子発現の差異を評価する場合、解析手法によっては、数値パラメータや分類パターンを設定する必要があるが、これらは当業者であれば適宜選択し、調整することが可能である。
また、解析手法はひとつの解析手法により構成されるものだけではなく、複数の解析手法により構成されるものでもよい。複数の解析手法の構成は、例えば、複数の解析手法によって得られたそれぞれの解析結果を総合して、最終的な解析結果とするような並列的な構成であってもよいし、ある解析手法で得られた解析結果を変数として、さらに別の解析手法を適用して得られた解析結果を最終的な解析結果とするような直列的な構成であってもよい。
比較解析により得られる、遺伝子発現と生理的変化を誘起する要素との関連の強さは、例えば、p値や統計量、あるいは発現シグナルの平均値や中央値、分散等の比や差等として表される場合があるが、群間の遺伝子発現の差異を連続量や離散量、級数等により評価することが可能であれば、これらに限定されない。
また生体は通常、ある生理的変化を誘起する要素を有する生体群と、そのような要素を有しない生体群等の2群に分類可能な生体であるが、両群の中間的な要素を保持している生体群が1群あるいは複数群存在する場合は、個々の群間の遺伝子発現の差異を別個に比較解析により評価し、それぞれの群間で、遺伝子発現と該する生理的変化との関連の強さを評価することで、それぞれの群間の生理的変化に対応した生体の生理的変化予測マーカー遺伝子を選抜することが可能である。
生体の生理的変化、例えば疾患の発症等の予測マーカー遺伝子には、上述の遺伝子の発現と生体の生理的変化を誘起する要素との関連の大きさが上位である遺伝子を選抜する。
具体的には、遺伝子発現と生体の生理的変化を誘起する要素との関連の大きさに一定の基準、例えば、p値であれば、0.05未満等を設定し、設定された基準に合致する遺伝子を選抜することができる。生体の生理的変化の発現予測マーカー遺伝子の選抜のための遺伝子発現と生理的変化を誘起する要素との関連の大きさの基準、及び選抜される遺伝子の数は限定されず、当業者が適宜選択し、調整することが可能である。
上記実施形態において「情報量基準」とは、変量と2群を分類する要素と関連の大ききを評価する基準であり、個々の遺伝子の発現と生理的変化を誘起する要素との関連の大きさを評価するために用いられる。
例えば、上記実施形態でマーカー遺伝子を選抜する場合には、情報量基準を用いて個々の遺伝子の発現と生理的変化を誘起する要素との関連の強さを評価することができる。
具体的には、個々の遺伝子毎に、生体を発現量の大きい群と発現量の小さい群の2群に分類し、生理的変化を誘起する要素を有する群と有しない群の分類と併せて、それぞれの分類基準に合致する生体の数を収めた2行×2列の分割表を作成する。
生体を発現量の大きい群と発現量の小さい群の2群に分類する方法には、平均値より大きいか否かにより分類する方法や、最大値と最小値との間を2等分することで分類する方法、χ2検定を用いる方法等が挙げられるが、これらに限定されない。
個々の遺伝子における、生理的変化を誘起する要素を有する群と有しない群との間の発現量の違いは、生体が上述の2つの基準により分類されるパターンが、これら2つの分類基準が何らかの関連を有すると仮定した場合の統計モデル(従属モデル)と、何の関連も有しないと仮定した場合の統計モデル(独立モデル)の何れによりよく適合しているかを比較することにより評価することができ、従属モデルによりよく適合する遺伝子ほど、発現と生理的変化を誘起する要素との関連の大きい遺伝子となる。
具体的には、従属モデルへの適合度を表す情報量基準と、独立モデルへの適合度を表す情報量基準の大小を比較することで、個々の遺伝子の発現と生理的変化を誘起する要素との関連の大きさを評価することができる。
従属モデルへの適合度を表す情報量基準と、独立モデルへの適合度を表す情報量基準の大小の比較は、例えば、比や差をとることにより可能であるが、連続量や離散量、あるいは級数等により評価することが可能であれば、これらに限定されない。
情報量基準として、赤池の情報量基準、ベイズの情報量基準、Minimum Description Length(MDL)基準または、アレンのクロスバリデーション基準等が挙げられる。好ましくは、アレンのアレンのクロスバリデーション基準が挙げられる。
上記実施形態における「多変量解析」とは、複数の変量を同時に解析する統計解析手法の総称であり、複数の遺伝子の発現データを同時に解析する解析手法を指す。
「多変量解析」として、主成分分析、因子分析、自己組織化地図、クラスター分析、判別分析、重回帰分析及び正準相関分析等の解析手法が挙げられるが、複数の遺伝子の発現データに適用することで、2群間の遺伝子発現を判別することができる解析手法であれば、これらに限定されない。
多変量解析を用いて2群間の遺伝子発現を判別する場合、解析手法によっては、数値パラメータや分類パターンを設定する必要があるが、これらは当業者であれば適宜選択し、調整することが可能である。
上述の解析手法はひとつの解析手法により構成されるものだけではなく、複数の解析手法により構成されるものでもよい。複数の解析手法の構成は、例えば、複数の複数の解析手法によって得られたそれぞれの解析結果を総合して、最終的な解析結果とするような並列的な構成であってもよく、ある解析手法で得られた解析結果を変数として、さらに別の解析手法を適用して得られた解析結果を最終的な解析結果とするような直列的な構成であってもよい。
多変量解析により定められる、2群を判別する基準は、一方の群の特徴を表す関係式と他方の群の特徴を表す関係式という形で得られる場合や、一方の群と他方の群との境界を表す点、曲線、直線、曲面、平面及び超平面等として得られる場合等があるが、2群の差異を示すことが可能であり、判別基準が表される空間に、個々の生体を、その遺伝子発現データを用いて投影することが可能であればこれらに限定されるものではない。
また本発明の予測方法をを適用する生体は通常、ある生理的変化を発現する要素を有する生体群と、そのような要素を有しない生体群等の2群に分類可能な生体であるが、両群の中間的な要素を保持している生体群が1群あるいは複数群存在する場合は、個々の群間の遺伝子発現を別個に多変量解析により判別し、それぞれの群間で、該する要素を有する生体群と、そのような要素を有しない生体群等との判別基準を定めることで、それぞれの群間の生理的変化に対応した判別基準を得ることが可能である。
上記実施形態では、多変量解析の具体例として、「主成分分析および判別分析」を用いて説明したが、本発明の多変量解析の手法は前記に限られるものではない。
上記実施形態における「主成分分析」は、複数の変量から合成された新たな変量である主成分を用いて、個々の試料間の関連を特徴づける解析手法であり、ある生理的変化を誘起する要素を有する生体群と、そのような要素を有しない生体群を、より明瞭に判別することのできる変量を得るために用いられる。
主成分分析を用いて生体の生理的変化の発現を予測する場合には、まず、個々の生体について、2群を明瞭に判別できる主成分を得る。解析に用いた遺伝子数と同数の主成分を得ることができるが、通常は比較的上位の主成分を数個から十数個を取得すればよい。次に、これらの主成分から、2群を明瞭に判別可能なものを選択し、2群を判別するための変量とする。選択される主成分の数は限定されない。
主成分分析はPrincipal Component Analysis(1986、Springer-Verlag, Berlin)に記載の方法に従って行うことができ、市販の統計解析ソフトウェア例えば「Spotfire Ver. 7.2」、Spotfire DecisionSite(Spotfire社製)等で実行可能である。
上記実施形態における「線形判別法」とは、複数の変量を用いて2群の試料の間の境界を得る解析方法であり、生体がある生理的変化を将来起こすのか否かを判別する基準とする、該する生理的変化を誘起する要素を有する生体群と、そのような要素を有しない生体群との境界を定めるために用いられる。
線形判別法を用いて生体の生理的変化を予測する場合には、上述の主成分分析により得られ、2群を判別するための変量として選択された主成分に対して線形判別法を適用し、2群を判別する基準となる点、直線、平面または超平面を得ることができる。
上記実施形態では、アレンのクロスバリデーション基準を用いているが、その他の情報量基準を用いてもよい。たとえば、赤池の情報量基準、ベイズの情報量基準、Minimum Description Length(MDL)基準を用いてもよい。ここで、情報量基準とは、変量と2群を分類する要素との関連の大きさを評価する基準をいう。また、従属モデルへの適合度を表す情報量基準と、独立モデルへの適合度を表す情報量基準の大小の比較は、たとえば、比や差をとることにより可能であるが、連続量や離散量、あるいは級数などによって評価してもよい。また、情報量基準以外の比較解析を用いてもよい。たとえば、t検定、F検定、χ2検定、順位和検定など、1遺伝子の発現データに適用することで、2群間の遺伝子発現の差異を評価できる解析手法を用いることができる。
また、解析手法は、複数の解析手法を組み合わせたものであってもよい。
7.実施例
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織繊維芽細胞を用いたアルツハイマー病発症予測マーカー遺伝子の選抜
30人から皮膚組織線維芽細胞の提供を受け、発症予測マーカー遺伝子の選抜を行った。資料提供者の内訳は、家族性アルツハイマー病病因遺伝子保持者として、Swedish変異保持者7人、Arctic変異保持者7人及びプレセニリン1遺伝子H163Y変異保持者5人、家族性アルツハイマー病病因遺伝子非保持者として、上述の病因遺伝子保持者の兄弟あるいは姉妹であって病因遺伝子を非保持の11人であった。
提供された皮膚組織生体試料から、線維芽細胞をNeuroscience Letters, 220 9-12 (1996)に記載の方法で単離、培養し、1試料あたり300〜1000万個の線維芽細胞を得た。
Rneasy Mini Kit(Qiagen, Valencia, CA)を用い、添付の手順に従って線維芽細胞からTotal RNAを抽出した。
線維芽細胞より抽出したTotal RNAを用いて個々の遺伝子の発現量を測定した。遺伝子発現量の測定にはAffymetrix社製オリゴヌクレオチド型DNAチップGeneChip HG-U133A Arrayを使用した。具体的には、Total RNAからのcDNAの調製、該cDNAからラベル化cRNAの調製、ラベル化cRNAのフラグメント化、フラグメント化cRNAとDNAチップとのハイブリダイズ、ハイブリダイズしたcRNAの蛍光染色、DNAチップ上の蛍光の読み取り、及び遺伝子発現量の測定、の順に、特開2003−169687に記載の方法と同様の方法で行った。最終的に、遺伝子発現量はHG-U133A Arrayの蛍光イメージを解析ソフトウェアMicroarray Suite version 5.0より解析することにより得た。
このようにして得られた発現量データを図19a〜図19fに示す。図において、最上欄は個体IDであり、最左欄は遺伝子IDである。図において、遺伝子IDは、アフィリメトリクス社のプローブセット番号にて示している。図19a〜図19cはアルツハイマーを発病する個体(病因遺伝子保持者)の各遺伝子発現量であり、図19d〜図19fはアルツハイマーを発病しない個体(病因遺伝子非保持者)の各遺伝子発現量である。なお、この実施形態では、遺伝子の種類は22,238種あるが、図においてはマーカー遺伝子のデータのみを示し、他の遺伝子については省略した。
HG-U133A Arrayで測定可能な22,238種のヒトRNA量を計測するプローブセットのうち、MAS 5.0による解析で、発現していない(Absent)と判断された9,752個及び発現シグナルの値が44に満たない1,348個を除いた11,138個のプローブセットについて比較解析を行い、個々の遺伝子の発現と家族性アルツハイマー病病因遺伝子の有無との関連の強さを評価した。
評価の基準には、情報量基準のひとつ、アレンのクロスバリデーション基準(CV基準)を用いい、発現量の大きい群と発現量の小さい群との分類は、最大値と最小値との間を2等分することにより行った。
11,138個のプローブセットについて、家族性アルツハイマー病病因遺伝子の有無と発現量の大小に基づいて、図8に示す2×2分割表を作成した。
11,138個のプローブセットついて、分割表の各区画に収められる試料数から、従属モデルのCV基準と独立モデルのCV基準を以下の計算式に基づいて計算した。CV基準は市販の統計解析ソフトウェア「Visual Minng Studio ver. 3.0」(数理システム)を用いて行った。
・従属モデルのCV基準(L)
Figure 2006088208
ここにおいてnは試料の数、n(i,j)はi行目かつj列目の区画に収められた試料数を表す。
・独立モデルのCV基準(L)
Figure 2006088208
ここにおいてnは試料の数、n(i)はi行目に、n(j)はj列目に収められた試料数を表す。
11,138個のプローブセットついての従属モデルのCV基準及び独立モデルのCV基準から「従属モデルのCV基準−独立モデルのCV基準」が3.0より大きいプローブセット200個を選抜し、アルツハイマー病発症予測マーカー遺伝子セットとした。
マーカー遺伝子に対応するプローブセットを図20a、図20bに示す。図中、項目Aはプローブセットの識別番号を表し、対応する遺伝子の情報はアフィメトリクス社(http://www.affymetrix.com/index.affx)より入手可能である。また項目Bは「従属モデルのCV基準−独立モデルのCV基準」の値を表す。
上述の200遺伝子について、サポートベクターマシン(SVM)によるLeave-One-Out交差検証を行った。具体的には、30個の試料から1個を取り除き、残った29個の試料について、200プローブセットの発現シグナルの値を用いてSVMによる判別分析を行い、判別空間上にに家族性アルツハイマー病病因遺伝子を有する群と無有しない群との判別面を得た(図21参照)。取り除いた1個の試料をその発現シグナルの値をもとに判別空間に投影し、家族性アルツハイマー病病因遺伝子の有無が正しく判別されるかどうかを検証した。この検証を30個の試料全てについて行ったところ、30人中29人(96.7%)の試料提供者の家族性アルツハイマー病病因遺伝子の有無が正しく分類された。SVMによるLeave-One-Out交差検証は、統計解析ソフトウェア「R」及び「R」用統計解析パッケージ「e1071」(http://cran.us.r-project.org/)を用いて行った。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞における遺伝子発現解析により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いたアルツハイマー病の発症予測式の設定
実施例1により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いて、将来アルツハイマー病を発症するか否かの判別基準となる発症予測式を設定した。
30人の試料提供者のアルツハイマー病発症予測マーカー遺伝子セットである200プローブセットの発現シグナル値を用いて主成分分析を行い、第一、第二、第四の各主成分の主成分を用いることで、家族性アルツハイマー病病因遺伝子保持者と該遺伝子非保持者を一平面で区分できることを確認した(図21参照)。主成分分析は統計解析ソフトウェア「Spotfire Ver. 7.2」(Spotfie社)を用いて行った。
そこでこれら第一、第二、第四の各主成分の主成分に対して線形判別分析を適用し、以下に示す家族性アルツハイマー病病因遺伝子保持群と該遺伝子非保持群の境界を示す発症予測式を得た。線形判別分析は統計解析ソフウェア「R」(http://cran.us.r-project.org/)を用いて行った。
・発症予測式
Figure 2006088208
ここで、X、Y、およびZは数式3、数式4によって示される。この実施例では、nは200である。
Figure 2006088208
Figure 2006088208
ここでεiは個々のプローブセットの発現シグナルの値を表す。また、P1i、P2i、およびP4iはマーカー遺伝子セットを構成する個々のプローブセットの固有ベクトルの要素、μi及びσiは個々のプローブセットについての30試料の発現値の平均μ及び標準偏差σを表す。具体的には図22a〜図22dに示すような値となった。
ここにおいてεiにアルツハイマー病発症予測の対象とする者の皮膚組織線維芽細胞から抽出したRNA試料をマーカー遺伝子セットの抽出及び発症予測式の設定に用いた30試料と同様の方法でDNAチップGeneChip HG-U133A Arrayとハイブリダイゼーションさせて得られた発現シグナル値のうちの、マーカー遺伝子セットに含まれる200プローブセットそれぞれの発現シグナル値を入力することで、X、Y、およびZの値が得られ、さらにAの値が得られることとなる。
上記Aの値が、A>0であれば、アルツハイマー病を発症すると予測され、A<0であればアルツハイマー病を発症しないと予測される。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞における遺伝子発現解析により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いたアルツハイマー病の発症予測
アルツハイマー病の臨床症状の観察されておらず、家族性アルツハイマー病病因遺伝子を有しない被験者の皮膚組織線維芽細胞のDNAチップ解析データから、アルツハイマー病の発症予測を行う。
実施例1に記載の方法で、被験者より提供された皮膚組織より線維芽細胞を得、さらにRNAを抽出し、GeneChip HG-U133A Arrayによる発現量の測定を行う。
発症予測マーカー遺伝子セットの発現シグナル値及び、図22a〜図22dに示されるマーカー遺伝子セットを構成する個々のプローブセットの固有ベクトルの要素、個々のプローブセットについての試料の発現値の平均及び標準偏差の数値から、発症予測式(数式3、4、7)より、アルツハイマー病を発病しているかどうかを診断できる。
診断は、X、Y、Zの値よりA<0であれば被験者は近い将来アルツハイマー病を発症しないと予測され、A>0であれば発症すると予測される。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞を用いたアルツハイマー病発症予測マーカー遺伝子の選抜。
30人から皮膚組織線維芽細胞の提供を受け、発症予測マーカー遺伝子の選抜を行った。資料提供者の内訳は、家族性アルツハイマー病病因遺伝子保持者として、Swedish変異保持者7人、Arctic変異保持者7人及びプレセニリン1遺伝子H163Y変異保持者5人、家族性アルツハイマー病病因遺伝子非保持者として、上述の病因遺伝子保持者の兄弟あるいは姉妹であって病因遺伝子を非保持の11人であった。
提供された皮膚組織生体試料から、線維芽細胞をNeuroscience Letters, 220 9-12 (1996)に記載の方法で単離、培養し、1試料あたり300〜1000万個の線維芽細胞を得た。
Rneasy Mini Kit(Qiagen, Valencia, CA)を用い、添付の手順に従って線維芽細胞からTotal RNAを抽出した。
線維芽細胞より抽出したTotal RNAを用いて個々の遺伝子の発現量を測定した。遺伝子発現量の測定にはAffymetrix社製オリゴヌクレオチド型DNAチップGeneChip HG-U133A Arrayを使用した。具体的には、Total RNAからのcDNAの調製、該cDNAからラベル化cRNAの調製、ラベル化cRNAのフラグメント化、フラグメント化cRNAとDNAチップとのハイブリダイズ、ハイブリダイズしたcRNAの蛍光染色、DNAチップ上の蛍光の読み取り、及び遺伝子発現量の測定、の順に、特開2003−169687に記載の方法と同様の方法で行った。最終的に、遺伝子発現量はHG-U133A Arrayの蛍光イメージを解析ソフトウェアMicroarray Suite version 5.0より解析することにより得た。
HG-U133A Arrayで測定可能な22,238種のヒトRNA量を計測するプローブセットのうち、まずMAS 5.0による解析で発現していない(Absent)と判断された9,752個を除外し、さらに30人の発現シグナルの平均値が200に満たない9,288個を除外した。
残った3,198個のプローブセットについて比較解析を行った。
まず、家族性アルツハイマー病病因遺伝子保持者19人と病因遺伝子非保持者11人との間でWelchのT検定を行い、p値が0.05より大きい2979個を除外した。
さらに、個々の遺伝子の発現と家族性アルツハイマー病病因遺伝子の有無との関連の強さを評価した。評価の基準には、情報量基準のひとつ、アレンのクロスバリデーション基準(CV基準)を用いい、発現量の大きい群と発現量の小さい群との分類は、最大値と最小値との間を2等分することにより行った。
残った219個のプローブセットについて、家族性アルツハイマー病病因遺伝子の有無と発現量の大小に基づいて、図8に示す2×2分割表を作成した。
219個のプローブセットそれぞれついて、分割表の各区画に収められる試料数から、従属モデルのCV基準と独立モデルのCV基準を以下の計算式に基づいて計算した。CV基準は市販の統計解析ソフトウェア「Visual Minng Studio ver. 3.0」(数理システム)を用いて行った。
CV値の算出は、実施例1と同様とした。
219個のプローブセットついての従属モデルのCV基準及び独立モデルのCV基準から「従属モデルのCV基準−独立モデルのCV基準」が3.0より大きいプローブセット51個を選抜し、アルツハイマー病発症予測マーカー遺伝子セットとした。
このようにして選抜したマーカー遺伝子に対応するプローブを図23に示す。図中、項目Aはプローブセットの識別番号を表し、対応する遺伝子の情報はアフィメトリクス社(http://www.affymetrix.com/index.affx)より入手可能である。また項目Bは「従属モデルのCV基準−独立モデルのCV基準」の値を表す。
このアフィメトリクス社のプローブセットの識別番号は、図24に示すように、米国生物工学情報センター(National Center for Biotechnology Information、(NCBI))の遺伝子情報データベース「Genbank」のアクセション番号に対応している。
上述の51プローブセットについて、サポートベクターマシン(SVM)によるLeave-One-Out交差検証を行った。具体的には、30個の試料から1個を取り除き、残った29個の試料について、51プローブセットの発現シグナルの値を用いてSVMによる判別分析を行い、判別空間上にに家族性アルツハイマー病病因遺伝子を有する群と無有しない群との判別面を得た。取り除いた1個の試料をその発現シグナルの値をもとに判別空間に投影し、家族性アルツハイマー病病因遺伝子の有無が正しく判別されるかどうかを検証した。この検証を30個の試料全てについて行ったところ、30人中26人(86.7%)の試料提供者の家族性アルツハイマー病病因遺伝子の有無が正しく分類された。SVMによるLeave-One-Out交差検証は、統計解析ソフトウェア「R」及び「R」用統計解析パッケージ「e1071」(http://cran.us.r-project.org/)を用いて行った。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞における遺伝子発現解析により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いたアルツハイマー病の発症予測式の設定
実施例4により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いて、将来アルツハイマー病を発症するか否かの判別基準となる発症予測式を設定した。
30人の試料提供者のアルツハイマー病発症予測マーカー遺伝子セットである51プローブセットの発現シグナル値を用いて主成分分析を行い、第一、第二、第三の各主成分の主成分を用いることで、家族性アルツハイマー病病因遺伝子保持者と該遺伝子非保持者を概ね区分できることを確認した(図25参照)
主成分分析は統計解析ソフトウェア「Spotfire Ver. 7.2」(Spotfie社)を用いて行った。
そこでこれら第一、第二、第三の各主成分の主成分に対して線形判別分析を適用し、以下に示す家族性アルツハイマー病病因遺伝子保持群と該遺伝子非保持群の境界を示す発症予測式を得た。線形判別分析は統計解析ソフウェア「R」(http://cran.us.r-project.org/)を用いて行った
発症予測式は、下式にて得られた。
Figure 2006088208
ここで、X、Y、およびZは以下に示す式により得られる。
Figure 2006088208
ここでεは個々のプローブセットの発現シグナルの値を表す。また、P1i、P2i、およびP3iはマーカー遺伝子セットを構成する個々のプローブセットの固有ベクトルの要素、μ及びσは個々のプローブセットについての30試料の発現値の平均及び標準偏差を表す。具体的には図26に示す値となった。
ここにおいてεにアルツハイマー病発症予測の対象とする者の皮膚組織線維芽細胞から抽出したRNA試料をマーカー遺伝子セットの抽出及び発症予測式の設定に用いた30試料と同様の方法でDNAチップGeneChip HG-U133A Arrayとハイブリダイゼーションさせて得られた発現シグナル値のうちの、マーカー遺伝子セットに含まれる51プローブセットそれぞれの発現シグナル値を入力することで、X、Y、およびZの値が得られ、さらにAの値が得られることとなる。
上記Aの値が、A>0であれば、アルツハイマー病を発症すると予測され、A<0であればアルツハイマー病を発症しないと予測される。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞における遺伝子発現解析により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いた家族性アルツハイマー病の病因遺伝子保持者予測
実施例4における組織試料提供者30人とは異なる18人から皮膚組織線維芽細胞の提供を受け、さらに実施例4に記載の方法で、提供された皮膚組織より線維芽細胞を得、RNAを抽出し、GeneChip HG-U133A Arrayによる発現量の測定を行った。
18人提供者の内訳は、家族性アルツハイマー病病因遺伝子保持者として、Swedish変異保持者1人、Arctic変異保持者1人、アミロイド前駆体(APP)遺伝子V717I変異保持者1人、プレセニリン1(PSEN1)遺伝子M146V変異保持者2人、プレセニリン2(PSEN2)遺伝子M239V変異保持者2人及び病因遺伝子不明の家族性アルツハイマー病発症者3人の合計10人、家族性アルツハイマー病病因遺伝子非保持者として、PSEN1遺伝子M146V変異保持者の兄弟または姉妹5人、PSEN2遺伝子M239V変異保持者の兄弟または姉妹2人、PSEN1遺伝子H163Y変異保持者の兄弟または姉妹1人の合計8人であった。
GeneChip HG-U133A Arrayとのハイブリダイゼーションにより得られた発現シグナル値のうちの実施例4に示すマーカー遺伝子セット51プローブセットのそれぞれの発現シグナル値を用いて、発症予測マーカー遺伝子セットの発現シグナル値及び、実施例5の図26に示したマーカー遺伝子セットを構成する個々のプローブセットの固有ベクトルの要素、個々のプローブセットについての実施例4における組織試料提供者30人の発現値の平均及び標準偏差の数値から、発症予測式(数式11、数式12)より、A<0であれば家族性アルツハイマー病の病因遺伝子を保持していないと予測し、A>0であれば家族性アルツハイマー病の病因遺伝子を保持していると予測した。予測結果を図27に示す。
図に示すように、18人中13人について予測が成功した。成功率13/18のp値は0.048となり、5%の有意水準に照らして有意に高い予測成功率であることを確認した。
Swedish変異、Arctic変異及びプレセニリン1遺伝子H163Y変異保持者皮膚組織線維芽細胞における遺伝子発現解析により選抜されたアルツハイマー病発症予測マーカー遺伝子を用いたアルツハイマー病の発症予測
アルツハイマー病の臨床症状の観察されておらず、家族性アルツハイマー病病因遺伝子を有しない被験者の皮膚組織線維芽細胞のDNAチップ解析データから、アルツハイマー病の発症予測を行う。
実施例4に記載の方法で、被験者より提供された皮膚組織より線維芽細胞を得、さらにRNAを抽出し、GeneChip HG-U133A Arrayによる発現量の測定を行う。
GeneChip HG-U133A Arrayとのハイブリダイゼーションにより得られた発現シグナル値のうちの実施例4に示すマーカー遺伝子セット51プローブセットのそれぞれの発現シグナル値を用いて、発症予測マーカー遺伝子セットの発現シグナル値及び、実施例5の図26に示したマーカー遺伝子セットを構成する個々のプローブセットの固有ベクトルの要素、個々のプローブセットについての実施例4における組織試料提供者30人の発現値の平均及び標準偏差の数値から、発症予測式(数式11、数式12)より、A<0であれば家族性アルツハイマー病の病因遺伝子を保持していないと予測し、A>0であれば家族性アルツハイマー病の病因遺伝子を保持していると予測する。
本発明によって、発現部位とは異なる部位から採取した試料を用いてその遺伝子発現データを基に、生体の生理的変化を予測する方法及び、生体の生理的変化の予測に有効に活用される生体の生理的変化予測マーカー遺伝子の選抜方法を提供することができた。
この方法により、解析用の遺伝子を発現部位から採取することが困難な疾患等について、疾患の発症や予後の良否、あるいは薬剤の効果や副作用の程度などを高い精度で予測することができ、より適切な医療行為が可能となった。
この発明の一実施形態による判別基準作成処理の流れを示す図である。 この発明の一実施形態による生理的変化の予測処理の流れを示す図である。 この発明の一実施形態による判別基準作成装置の機能ブロック図である。 図3の装置をCPUを用いて実現した場合のハードウエア構成である。 判断基準生成プログラムのフローチャートである。 判断基準生成プログラムのフローチャートである。 記録された発現データのデータ構造を示すための図である。 分割表を示す図である。 遺伝子毎に記録されたCV値のデータ構造を示す図である。 閾値とするCV値と正答率との関係を示す図である。 予測装置の機能ブロック図である。 図11の装置をCPUを用いて実現した場合のハードウエア構成である。 予測プログラムのフローチャートである。 図14Aは、他の実施形態によるDNAチップの断面図である。図14Bは、処理回路の詳細を示す図である。 予測システムの構成図である。 サーバ装置のハードウエア構成である。 端末装置のハードウエア構成である。 プローブを示す図である。 発現データを示す図である。 発現データを示す図である。 発現データを示す図である。 発現データを示す図である。 発現データを示す図である。 発現データを示す図である。 プローブセットとCV値との関係を示すデータである。 プローブセットとCV値との関係を示すデータである。 判別式による境界面を示す図である。 マーカー遺伝子群の発現値の平均μ、標準偏差σ、固有ベクトルP1、P2、P4などを示す図である。 マーカー遺伝子群の発現値の平均μ、標準偏差σ、固有ベクトルP1、P2、P4などを示す図である。 マーカー遺伝子群の発現値の平均μ、標準偏差σ、固有ベクトルP1、P2、P4などを示す図である。 マーカー遺伝子群の発現値の平均μ、標準偏差σ、固有ベクトルP1、P2、P4などを示す図である。 プローブセットとCV値との関係を示すデータである。 NCBIのGenBankのアクセション番号と、アフィメトリクス社pるローブセットの番号との対応を示す図である。 主成分分析の結果を示した図である。 マーカー遺伝子群の発現値の平均μ、標準偏差σ、固有ベクトルP1、P2、P3などを示す図である。 予測判定結果の正確性を示す図である。
符号の説明
22・・・発現量検出手段
24・・・基礎データ生成手段
26・・・マーカー選択手段
28・・・判別基準生成手段
30・・・判別基準
32・・・発現量検出手段
34・・・予測手段
36・・・出力手段

Claims (32)

  1. 生体の生理的変化の予測方法であって:
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて前記発症の有無を判別するための判別基準を生成するステップと、
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、
    予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に前記判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップと
    を備えた生体の生理的変化の予測方法。
  2. 生体の生理的変化の予測方法であって:
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、
    予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップと
    を備え、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
    前記判定基準は、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であること
    を特徴とする生体の生理的変化の予測方法。
  3. 生体の生理的変化の予測に用いる判別基準を生成する方法であって:
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて、前記対象部位における生理的変化の有無を判別するための判別基準を生成するステップと、
    を備えた生体の生理的変化の予測に用いる判別基準を生成する方法。
  4. 生体の生理的変化の予測に用いるマーカー遺伝子群の選抜方法であって:
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、
    を備えたマーカ遺伝子群の選抜方法。
  5. 請求項1〜3のいずれかの方法において、
    前記遺伝子発現量の検出は、遺伝子発現検出素子を用いて行うことを特徴とするもの。
  6. 生体の生理的変化の予測に用いる判別基準をコンピュータを用いて生成するためのプログラムであって、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、
    検出した個体ごとの遺伝子発現量を前記生理的変化の有無と関連付けて基礎データとするステップと、
    前記基礎データに基づいて、前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて前記対象部位における生理的変化の有無を判別するための判別基準を生成するステップと、
    をコンピュータに実行させるための判定基準生成プログラム。
  7. 生体の生理的変化の予測に用いるマーカー遺伝子群の選抜をコンピュータを用いて行う方法であって:
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出するステップと、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子をマーカー遺伝子群として選抜するステップと、
    をコンピュータに実行させるためのマーカー遺伝子群選抜プログラム。
  8. 生体の生理的変化の予測をコンピュータによって実現するためのプログラムであって、
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について遺伝子発現量を検出するステップと、
    予測対象個体のマーカー遺伝子群を含む遺伝子についての遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測するステップと
    をコンピュータに実行させるための予測プログラムであって、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化の発症部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
    前記判定基準は、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であること
    を特徴とする予測プログラム。
  9. 請求項5〜8のいずれかのプログラムにおいて、
    前記遺伝子発現量の検出は、遺伝子発現検出素子を用いて行うことを特徴とするもの。
  10. 生体の生理的変化の予測を行うために用いる遺伝子発現検出素子であって、
    基板と、
    マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブと、
    を備え、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであること
    を特徴とする遺伝子発現検出素子。
  11. 生体の生理的変化の予測を行うための予測装置であって、
    基板と、
    マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブと、
    プローブによって捉えられた遺伝子発現量を電気信号に変換する変換部と、
    各遺伝子発現量に対応する電気信号を受け、判定基準に基づいて生理的変化の有無を予測する予測部と、
    を備え、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり
    前記判定基準は、
    前記生理的変化を発症する個体と前記生理的変化を発症しない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であること
    を特徴とする予測装置。
  12. 請求項9または10のプログラムまたは素子において、
    前記遺伝子発現検出素子は、DNAチップまたはDNAアレイであることを特徴とするもの。
  13. 請求項5〜12の装置、素子またはプログラムにおいて、
    前記生体組織についての遺伝子の遺伝子発現量は、当該生体組織またはそれから調製した生体試料に基づいて検出することを特徴とするもの。
  14. 請求項5〜13の装置、素子またはプログラムにおいて、
    前記生体組織が皮膚組織または粘膜組織であることを特徴とするもの。
  15. 請求項13の装置、素子またはプログラムにおいて、
    前記生体試料が繊維芽細胞であることを特徴とするもの。
  16. 請求項13の装置、素子またはプログラムにおいて、
    前記生体試料が繊維芽細胞由来RNAであることを特徴とするもの。
  17. 請求項5〜16の装置、素子またはプログラムにおいて、
    前記発症部位が脳であることを特徴とするもの。
  18. 請求項5〜17の装置、素子またはプログラムにおいて、
    前記生理的変化が疾患の発症であることを特徴とするもの。
  19. 請求項18の装置、素子またはプログラムにおいて、
    前記疾患が中枢神経疾患であることを特徴とするもの。
  20. 請求項19の装置、素子またはプログラムにおいて、
    前記中枢神経疾患が痴呆症、パーキンソン病、筋萎縮性側索硬化症、またはプリオン病(クロイツフェルト−ヤコブ病)であることを特徴とするもの。
  21. 請求項20の装置、素子またはプログラムにおいて、
    前記痴呆症がアルツハイマー病または前頭側頭型痴呆であることを特徴とするもの。
  22. 請求項21の装置、素子またはプログラムにおいて、
    前記生理的変化を誘起する要素がSwedish変異、Arctic変異およびプレセリニン1遺伝子H136Y変異から選ばれる1種以上の要素であることを特徴とするもの。
  23. 請求項5〜22の装置、素子またはプログラムにおいて、
    前記多変量解析は、主成分分析および線形判別分析を含む解析方法であることを特徴とするもの。
  24. 請求項5〜23の装置、素子またはプログラムにおいて、
    前記発現量の差異が見いだされる遺伝子の選抜は、情報量基準に基づいて行われることを特徴とするもの。
  25. 請求項24の装置、素子またはプログラムにおいて、
    前記情報量基準は、アレンのクロスバリデーション基準であることを特徴とするもの。
  26. 請求項5〜25の装置、素子またはプログラムにおいて、
    前記遺伝子発現量の検出は、ハイブリダイゼーションによって遺伝子発現検出素子のプローブに結合した標識済みの遺伝子による光学的特性の変化を検出することによって行うことを特徴とするもの。
  27. 請求項5〜25の装置、素子またはプログラムにおいて、
    前記遺伝子発現量の検出は、ハイブリダイゼーションによって遺伝子発現検出素子のプローブに結合した遺伝子による電気的特性の変化を検出することによって行うことを特徴とするもの。
  28. 生体の生理的変化の予測を行うために用いる遺伝子発現検出素子であって、
    基板と、
    マーカー遺伝子群について、それぞれの遺伝子発現量を検出するため、基板に形成されたプローブと、
    を備え、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
    前記各マーカー遺伝子のためのプローブは、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について主成分分析を行い、当該主成分に係る合成変量の係数に応じて、各遺伝子に対応するプローブの検出感度を設定したものであること
    を特徴とする遺伝子発現検出素子。
  29. 端末装置およびサーバ装置を備えた生体の生理的変化の予測システムであって:
    前記端末装置は、
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を送信する送信手段と、
    サーバ装置からの予測結果データを受信する受信手段と、
    受信した予測結果データを出力する出力手段とを備え、
    前記サーバ装置は、
    前記端末装置からの遺伝子発現量を示す情報を受信する受信手段と、
    当該遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測する予測手段と、
    前記予測手段による予測結果データを前記端末装置に送信する送信手段とを備えており、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
    前記判定基準は、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であること
    を特徴とする生体の生理的変化の予測システム。
  30. 端末装置からの問い合わせに応じて生体の生理的変化の予測結果を送信するサーバ装置であって:
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を前記端末装置から受信する受信手段と、
    当該遺伝子発現量に判定基準を適用し、前記対象部位における生理的変化の有無を予測する予測手段と、
    前記予測手段による予測結果データを前記端末装置に送信する送信手段とを備えており、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであり、
    前記判定基準は、
    前記生理的変化を生じる個体と前記生理的変化を生じない個体との間でマーカー遺伝子群の発現量について多変量解析を行い、マーカー遺伝子群の発現量に基づいて作成された判別基準であること
    を特徴とする生体の生理的変化の予測のためのサーバ装置。
  31. 生体の生理的変化の予測を行うサーバ装置に接続される端末装置であって、
    予測対象である個体について、前記生理的変化予測の対象部位とは異なる部位から採取した生体組織について、少なくともマーカー遺伝子群を含む遺伝子について検出した遺伝子発現量を示す情報を送信する送信手段と、
    サーバ装置からの予測結果データを受信する受信手段と、
    受信した予測結果データを出力する出力手段とを備え、
    前記マーカー遺伝子群は、
    当該生理的変化を生じる複数の個体と当該生理的変化を生じない複数の個体を対象として、当該生理的変化予測の対象部位とは異なる部位から採取した生体組織について、複数の遺伝子の遺伝子発現量を検出し、
    前記遺伝子のうち、前記生理的変化を生じる個体と前記生理的変化を生じない個体との間において、統計的に発現量の差異が見いだされる遺伝子を選抜したものであること
    を特徴とする端末装置。
  32. 請求項21または22の装置、素子またはプログラムにおいて、
    前記マーカー遺伝子には、米国生物工学情報センター(National Center for Biotechnology Information、(NCBI))の遺伝子情報データベース「Genbank」のアクセション番号によって特定される、少なくとも以下の51個の遺伝子が含まれることを特徴とするもの:
    BC006249、NM_000454、NM_001780、BG531983、NM_000177、NM_000801、NM_003197、NM_006389、NM_004446、NM_007178、NM_002414、NM_004092、NM_003651、NM_003022、NM_004528、NM_005614、NM_004730、BC004467、NM_001483、NM_003365、NM_007214、AI927770、NM_001685、NM_005493、NM_001753、NM_002961、NM_001157、NM_004545、NM_003915、AF208850、AW510696、AF312393、BC002977、AF313911、AF000974、L18964、U76833、M55580、U43430、BC005911、AU147399、AL523310、AI144075、AL117593、AA650558、AI123426、NM_005051、NM_014380、NM_015920、NM_017821、AK001105。


JP2007503790A 2005-02-21 2006-02-21 生体の生理変化の予測方法および装置 Pending JPWO2006088208A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005044776 2005-02-21
JP2005044776 2005-02-21
PCT/JP2006/303083 WO2006088208A1 (ja) 2005-02-21 2006-02-21 生体の生理的変化の予測方法および装置

Publications (1)

Publication Number Publication Date
JPWO2006088208A1 true JPWO2006088208A1 (ja) 2008-07-10

Family

ID=36916605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007503790A Pending JPWO2006088208A1 (ja) 2005-02-21 2006-02-21 生体の生理変化の予測方法および装置

Country Status (2)

Country Link
JP (1) JPWO2006088208A1 (ja)
WO (1) WO2006088208A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5436446B2 (ja) * 2008-12-01 2014-03-05 国立大学法人山口大学 薬剤の作用・副作用予測システムとそのプログラム
JP2014016663A (ja) * 2012-07-05 2014-01-30 Japan Science & Technology Agency 細胞種解析装置、細胞種解析方法、および、プログラム
US10102333B2 (en) * 2013-01-21 2018-10-16 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
BR112021026653A2 (pt) * 2019-07-30 2022-02-15 Alifax Srl Método e sistema para identificar microrganismos
CN115828093B (zh) * 2022-11-02 2024-04-05 四川帕诺米克生物科技有限公司 组学样本的分析方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994010205A1 (en) * 1992-10-23 1994-05-11 Fujisawa Pharmaceutical Co., Ltd. Protein specific for alzheimer's disease and method of diagnosing alzheimer's disease through detection of the protein
JPH11342000A (ja) * 1998-02-09 1999-12-14 Affymetrix Inc 発現比較のコンピュ―タ支援による視覚化
WO2002072828A1 (fr) * 2001-03-14 2002-09-19 Dna Chip Research Inc. Procede permettant de prevoir un cancer
WO2003072065A2 (en) * 2002-02-28 2003-09-04 Iconix Pharmaceuticals, Inc. Drug signatures
WO2003085548A1 (fr) * 2002-04-04 2003-10-16 Ishihara Sangyo Kaisha, Ltd. Dispositif et procede d'analyse de donnees
JP2004208547A (ja) * 2002-12-27 2004-07-29 Hitachi Ltd うつ病の評価方法
JP2004355174A (ja) * 2003-05-28 2004-12-16 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994010205A1 (en) * 1992-10-23 1994-05-11 Fujisawa Pharmaceutical Co., Ltd. Protein specific for alzheimer's disease and method of diagnosing alzheimer's disease through detection of the protein
JPH11342000A (ja) * 1998-02-09 1999-12-14 Affymetrix Inc 発現比較のコンピュ―タ支援による視覚化
WO2002072828A1 (fr) * 2001-03-14 2002-09-19 Dna Chip Research Inc. Procede permettant de prevoir un cancer
WO2003072065A2 (en) * 2002-02-28 2003-09-04 Iconix Pharmaceuticals, Inc. Drug signatures
WO2003085548A1 (fr) * 2002-04-04 2003-10-16 Ishihara Sangyo Kaisha, Ltd. Dispositif et procede d'analyse de donnees
JP2004208547A (ja) * 2002-12-27 2004-07-29 Hitachi Ltd うつ病の評価方法
JP2004355174A (ja) * 2003-05-28 2004-12-16 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム

Also Published As

Publication number Publication date
WO2006088208A1 (ja) 2006-08-24

Similar Documents

Publication Publication Date Title
Feng et al. Research issues and strategies for genomic and proteomic biomarker discovery and validation: a statistical perspective
CN104903468B (zh) 用于帕金森氏病的新诊断MiRNA标志物
CN104981548B (zh) 用于阿尔茨海默氏病的诊断性miRNA标志物
CA2575921C (en) Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification
KR101828052B1 (ko) 유전자의 복제수 변이(cnv)를 분석하는 방법 및 장치
JP2003021630A (ja) 臨床診断サービスを提供するための方法
CN104968802B (zh) 作为诊断标志物的新miRNA
EP2864918B1 (en) Systems and methods for generating biomarker signatures
CN106460045B (zh) 人类基因组常见拷贝数变异用于癌症易感风险评估
CN101194166A (zh) 有关乳癌分类的材料和方法
JPWO2006088208A1 (ja) 生体の生理変化の予測方法および装置
US20140180599A1 (en) Methods and apparatus for analyzing genetic information
US20150100242A1 (en) Method, kit and array for biomarker validation and clinical use
KR101967248B1 (ko) 개인의 유전 정보를 분석하는 방법 및 장치
CN102089443A (zh) 用于测定受试者中结肠直肠癌的概率的方法和装置
US20030194701A1 (en) Diffuse large cell lymphoma diagnosis and outcome prediction by expression analysis
Buness et al. Classification across gene expression microarray studies
CN113257353B (zh) 基于reads深度进行目的基因外显子水平缺失检测的方法及装置
KR20150039484A (ko) 유전 정보를 이용하여 암을 진단하는 방법 및 장치
JP2022534236A (ja) 多重オミックス分析を利用した鬱病または自殺危険の予測用マーカー発掘方法、鬱病または自殺危険の予測用マーカー、及び多重オミックス分析を利用した鬱病または自殺危険の予測方法
Yahya Sequential Dimension Reduction and Prediction Methods with High-dimensional Microarray Data
KR101887161B1 (ko) 자폐 스펙트럼 장애의 진단용 조성물, 이를 포함하는 마이크로어레이 및 이를 검출하는 방법
KR20070086142A (ko) 유전자 발현량 규격화 방법, 프로그램 및 시스템
WO2022165205A1 (en) Systems and methods for diagnosing neurodegenerative diseases
Geng et al. A hidden Markov model approach for prediction of genomic alterations from gene expression profiling

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120105