JP4059517B2 - ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法 - Google Patents

ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法 Download PDF

Info

Publication number
JP4059517B2
JP4059517B2 JP2006554365A JP2006554365A JP4059517B2 JP 4059517 B2 JP4059517 B2 JP 4059517B2 JP 2006554365 A JP2006554365 A JP 2006554365A JP 2006554365 A JP2006554365 A JP 2006554365A JP 4059517 B2 JP4059517 B2 JP 4059517B2
Authority
JP
Japan
Prior art keywords
region
homoeologous
homozygous
polymorphic marker
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006554365A
Other languages
English (en)
Other versions
JPWO2007007691A1 (ja
Inventor
弘一 萩原
Original Assignee
トミーデジタルバイオロジー株式会社
学校法人 埼玉医科大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トミーデジタルバイオロジー株式会社, 学校法人 埼玉医科大学 filed Critical トミーデジタルバイオロジー株式会社
Application granted granted Critical
Publication of JP4059517B2 publication Critical patent/JP4059517B2/ja
Publication of JPWO2007007691A1 publication Critical patent/JPWO2007007691A1/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、多型マーカーを用いて、劣性遺伝による単一遺伝子疾患又は多遺伝子疾患の疾患感受性遺伝子の位置を効率よく探索する方法に関する。
劣性遺伝の疾患感受性遺伝子の同定は、疾患の治療法の開発に非常に重要であり、従来から多大な研究が行われてきた。その方法として、疾患感受性遺伝子の領域を特定する、連鎖解析や罹患同胞対解析など解析方法が開発されている。
連鎖解析とは,表現型に関連する遺伝子座と染色体上のマーカー遺伝子座との連鎖がどの程度あるのかを手がかりにして,染色体上の原因遺伝子の存在領域を絞り込んでいく方法である。また、罹患同胞対解析とは、同じ疾患を有している兄弟姉妹を比較して、原因遺伝子の存在領域を絞り込んでいく方法である。これらの解析において、多型マーカーが用いられている(非特許文献1参照)。多型とはDNA上の塩基の違いをいい、ある塩基の変化が人口中1%以上の頻度で存在しているものと定義されている。しかし、実際には1%以下の頻度で存在している塩基の変化を多型と呼ぶこともある。本発明においては、塩基に多様性のあるものをすべて多型とする。多型マーカーとは、DNA上の特定の多型を、疾患感受性遺伝子を検索する際にマーカー(標識)として用いたものである。多型マーカーとして、マイクロサテライト多型、VNTR(Variable number of tandem repeat)多型、一塩基多型(Single Nucleotide Polymorphism:SNP)などが解析に用いられており、多型のデータベースが公開されているため、疾患感受性遺伝子の解析に利用されてきている(非特許文献2等参照)。データベースには例えば、NCBIが公開しているdbSNPデータベース(http://www.ncbi.nlm.nih.gov/SNP/index.html)や、科学技術振興事業団と東京大学医科学研究所が共同で公開しているJSNP(日本人のSNP)データベース(http://snp.ims.u−tokyo.ac.jp)などがある。
また、劣性疾患遺伝子の同定法としては、多型を用いたホモ接合体マッピング(Homozygosity mapping)法等が知られており、多型としてSNPの一つである制限酵素切断断片長多型(Restriction Fragment Length Polymorphism、RFLP)を用いたもの(非特許文献3参照)や、マイクロサテライト多型を用いたもの(非特許文献4参照)がある。
さらに疾患感受性遺伝子の領域の特定方法としてよく知られた方法に関連解析がある。関連解析は、コントロール集団と疾患を有している集団で特定の多型マーカーの出現頻度を比較することによって、原因遺伝子の存在領域を絞り込んでいく方法である。この方法には、SNPが用いられている。
上記連鎖解析及び関連解析によって疾患感受性遺伝子の同定が行われたものとしては、ヒト2型糖尿病の原因遺伝子の同定が知られている。(特許文献1参照)
特願2002−339901 中村祐輔著「ゲノム医学からゲノム医療へ」、羊土社、2005年 Sellick,G.S.et al.Diabetes 52:2636,2003 Lander,E.S.et al.Sience 236:1567,1987 Kobayashi,K.et al.Nature Genetics 22:159,1997 クロー著、木村資生訳「遺伝学概説」第8版、培風館、1991年 Mariotta,S.et al.Sarcoidosis Vasc.Diffuse Lung Dis.21:173−81,2004 Castellana G.& Lamorgese V.,Respiration 70:549−55,2003 Tachibana T.et al.Sarcoidosis Vasc.Diffuse Lung Dis.18(suppl 1),58,2001 Huqun.et al.Submitted.
しかし、連鎖解析や罹患同胞対解析は家系解析を基本とするものであり、その遺伝子解析を行う前段階となる検体を得る過程において困難性を有しており、特に浸透率の低い疾患においては、有意な結論を導き出せる検体数の確保が解析の律速段階となることも少なくない。関連解析は、コントロール集団を必要としなければならない点、また偽陽性が多く再検定を行わなければならない点で欠点を有している。さらに、多型マーカーを用いた疾患感受性遺伝子解析において、従来連鎖や連鎖不平衡の考え方から、多型マーカーどうしの横の繋がりに注目されていたため、多くの検体数を要し、膨大な費用と時間がかかるという課題があった。
劣性疾患においては、一人の先祖の単一遺伝子に由来する同祖遺伝子がホモ接合体となることによって疾患を発症する場合がある。本発明者は、この様な疾患感受性遺伝子の存在する領域内の遺伝子異常、SNP、マイクロサテライト多型などのすべての塩基配列がホモ接合となっていることに基づき、ホモ接合である多型マーカーが連続している領域内に疾患感受性遺伝子が存在していることを見出した。すなわち、劣性遺伝においては多型マーカーがホモ接合体として連続している領域は、同祖領域である可能性が高いと言える。本発明は、係る発見に基づき、多型マーカーを用いた少数の検体数で判定することが可能な同祖領域判定方法を提供する。また本発明は、多型マーカーを用いて同祖領域であるかを判定する同素領域判定装置を提供する。さらに、本発明は同祖領域判定方法又は同祖領域判定装置によって判定された領域内から疾患遺伝子探索を行う遺伝子スクリーニング方法を提供する。すなわち本発明は以下のとおりである。
(1)本発明は、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定ステップと、前記ホモ接合判定ステップにて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得ステップと、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に、ホモ接合体領域を同祖領域であると判定する同祖領域判定ステップと、を有する同祖領域判定方法を提供する。
(2)本発明は、二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択する多型マーカー選択ステップと、前記多型マーカー選択ステップにて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定ステップと、前記ホモ接合判定ステップにてホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得ステップと、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に、ホモ接合体領域を同祖領域であると判定する同祖領域判定ステップと、を有する同祖領域判定方法を提供する。
(3)本発明は、多型マーカー選択ステップは、検体DNAの全染色体領域にわたって多型マーカーを選択するステップである同祖領域判定方法を提供する。
(4)本発明は、多型マーカー選択ステップは、候補遺伝子領域とされた領域に含まれる多型マーカーを選択するステップである同祖領域判定方法を提供する。
(5)本発明は、検体DNAが植物由来のDNAである同祖領域判定方法を提供する。
(6)本発明は、検体DNAが動物由来のDNAである同祖領域判定方法を提供する。
(7)本発明は、検体DNAがヒト由来のDNAである同祖領域判定方法を提供する。
(8)本発明は、検体DNAが日本人由来のDNAである同祖領域判定方法を提供する。
(9)本発明は、多型マーカーがSNPである同祖領域判定方法を提供する。
(10)本発明は、多型マーカーがマイクロサテライトである同祖領域判定方法を提供する。
(11)本発明は、多型マーカーがVNTRである同祖領域判定方法を提供する。
(12)本発明は、多型マーカーが、SNP、マイクロサテライト、VNTRのいずれか二以上の組み合わせである同祖領域判定方法を提供する。
(13)本発明は、多型マーカー選択ステップが、前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において1万個以上のSNPを選択するステップである同祖領域判定方法を提供する。
(14)本発明は、多型マーカー選択ステップが、前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において10万個以上のSNPを選択するステップである同祖領域判定方法を提供する。
(15)本発明は、同祖領域判定ステップにおいて所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が1000万分の1から1万分の1の範囲から選択される値よりも小さいことである同祖領域判定方法を提供する。
(16)本発明は、同祖領域判定ステップにおいて所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が500万分の1から5万分の1の範囲から選択される値よりも小さいことである同祖領域判定方法を提供する。
(17)本発明は、同祖領域判定ステップにおいて所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から10万分の1の範囲から選択される値よりも小さいことである同祖領域判定方法を提供する。
(18)本発明は、同祖領域判定ステップにおいて所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から5000分の1の範囲から選択される値よりも小さいことである同祖領域判定方法を提供する。
(19)本発明は、同祖領域情報を複数の検体に対して取得する同祖領域情報取得ステップと、前記同祖領域情報取得ステップにて取得された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を取得する同祖領域重複頻度取得ステップと、をさらに有する同祖領域判定方法を提供する。
(20)本発明は、上記のいずれか一に記載の同祖領域判定方法によって判定された同祖領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法を提供する。
(21)また本発明は、上記のいずれか一に記載の同祖領域判定方法によって判定された同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域であるか否かを判定し、既知である遺伝子が含まれうる領域である場合に、既知である遺伝子と検体DNAの該遺伝子の配列を比較する遺伝子スクリーニング方法を提供する。
(22)本発明は、検体DNAが疾患を有する検体のDNAであり、上記のいずれか一に記載の同祖領域判定方法によって判定された同祖領域が、該疾患に関係すると予想される遺伝子を含む場合に、前記同祖領域中の検体DNAの該遺伝子の配列を同定し、正常遺伝子と比較する、遺伝子スクリーニング方法を提供する。
(23)本発明は、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定部と、前記ホモ接合判定部にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得部と、前記ホモ接合領域情報取得部にて取得されるホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に、ホモ接合領域を同祖領域であると判定する同祖領域判定部と、を有する同祖領域判定装置を提供する。
(24)二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択する多型マーカー選択部と、前記多型マーカー選択部にて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定部と、前記ホモ接合判定部にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得部と、前記ホモ接合領域情報取得部にて取得されるホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に、ホモ接合領域を同祖領域であると判定する同祖領域判定部と、を有する同祖領域判定装置を提供する。
(25)本発明は、多型マーカー選択部が、検体DNAの全染色体領域にわたって多型マーカーを選択する機能を有する同祖領域判定装置を提供する。
(26)本発明は、多型マーカー選択部が、候補遺伝子領域とされた領域に含まれる多型マーカーを選択する機能を有する同祖領域判定装置を提供する。
(27)本発明は、検体DNAが植物由来のDNAである同祖領域判定装置を提供する。
(28)本発明は、検体DNAが動物由来のDNAである同祖領域判定装置を提供する。
(29)本発明は、検体DNAがヒト由来のDNAである同祖領域判定装置を提供する。
(30)本発明は、検体DNAが日本人由来のDNAである同祖領域判定装置を提供する。
(31)本発明は、多型マーカーがSNPである同祖領域判定装置を提供する。
(32)本発明は、多型マーカーがマイクロサテライトである同祖領域判定装置を提供する。
(33)本発明は、多型マーカーがVNTRである同祖領域判定装置を提供する。
(34)本発明は、多型マーカーがSNP、マイクロサテライト、VNTRのいずれか二以上の組み合わせである同祖領域判定装置を提供する。
(35)本発明は、多型マーカー選択部が前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において1万個以上のSNPを選択する機能を有する同祖領域判定装置を提供する。
(36)本発明は、多型マーカー選択部が前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において10万個以上のSNPを選択する機能を有する同祖領域判定装置を提供する。
(37)本発明は、同祖領域判定部において前記所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が1000万分の1から1万分1の範囲から選択される値よりも小さいことである同祖領域判定装置を提供する。
(38)本発明は、同祖領域判定部において所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が500万分の1から5万分の1の範囲から選択される値よりも小さいことである同祖領域判定装置を提供する。
(39)本発明は、同祖領域判定部において所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から10万分の1の範囲から選択される値よりも小さいことである同祖領域判定装置を提供する。
(40)本発明は、同祖領域判定部において所定の同祖判定条件が、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から5000分の1の範囲から選択される値よりも小さいことである同祖領域判定装置を提供する。
(41)本発明は、同祖領域判定部にて所定の同祖判定条件を満たすと判定されたホモ接合領域を示す情報である同祖領域情報を視覚化して出力する同祖領域情報出力部をさらに有する同祖領域判定装置を提供する。
(42)本発明は、同祖領域情報を複数の検体に対応して複数保持する同祖領域情報保持部と、同祖領域情報保持部にて保持された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を示す同祖領域重複頻度情報を取得する同祖領域重複頻度情報取得部と、をさらに有する同祖領域判定装置を提供する。
(43)本発明は、同祖領域重複頻度情報取得部にて取得された同祖領域重複頻度情報を視覚化した情報である同祖領域重複頻度視覚化情報を出力する同祖領域重複頻度視覚化情報出力部をさらに有する同祖領域判定装置を提供する。
(44)本発明は、同祖領域重複頻度取得部にて取得された重複頻度を同祖領域情報に対応付けて蓄積する同祖領域情報蓄積部と、前記同祖領域情報蓄積部に蓄積されている同祖領域情報のうち所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を取得する重要同祖領域情報取得部と、をさらに有する同祖領域判定装置を提供する。
(45)本発明は、重要同祖領域情報取得部にて取得された所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を示す重要同祖領域情報を視覚化して出力する重要同祖領域情報出力部をさらに有する同祖領域判定装置を提供する。
(46)本発明は、上記いずれか一に記載の同祖領域判定装置によって判定された同祖領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法を提供する。
(47)本発明は、上記いずれか一に記載の同祖領域判定装置によって判定された同祖領域情報が、前記同祖領域情報蓄積部に蓄積されている同祖領域情報と重複している場合に、重複領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法を提供する。
(48)本発明は、上記いずれか一に記載の同祖領域判定装置によって判定された同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域であるか否かを判定し、既知である遺伝子が含まれうる領域である場合に、既知である遺伝子と検体DNAの該遺伝子の配列を比較する遺伝子スクリーニング方法を提供する。
(49)本発明は、検体DNAが疾患を有する検体のDNAであり、上記いずれか一に記載の同祖領域判定装置によって判定された同祖領域が、該疾患に関係すると予想される遺伝子を含む場合に、前記検体DNAの同祖領域中の該遺伝子の配列を同定し、正常遺伝子と比較する、遺伝子スクリーニング方法を提供する。
本発明の集団遺伝学に基づいた同祖領域を判定するという新たな判定方法により、ヒトの劣性遺伝に関与する疾患感受性遺伝子の探索において、家系解析及び対照群を必要としなくなるため、検体の確保が容易となり、解析数の大幅な減少が可能となる。また、現在疾患を発症していない場合においても同祖領域は疾患に対し脆弱な部分であると言え、予防医学的にも有用である。さらに、本発明を植物や動物に対し行うことにより、劣性遺伝である疾患に関してはヒトと同様に原因遺伝子の探索が可能となるとともに、ホモ接合体として有用な機能を果たす遺伝子や、有用な表現型を有するような遺伝子の探索が可能であり、品種改良等の分野においても利用することができる。
以下に、各発明を実施するための最良の形態を説明する。本発明は、これらの実施形態に何ら限定されるものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施しうる。
本発明の説明に入る前に、本発明の前提となる集団遺伝学における近交係数の考え方について説明する。近親交配はホモ接合性を増加させ、劣性遺伝疾患の出現頻度を増加させる。近親交配の遺伝的影響は同祖遺伝子を基にして考えられる。「同祖」とは、共通の先祖であり、「同祖遺伝子」とは、一個体の二つの相同遺伝子が両方とも一人の先祖の単一の染色体から由来した遺伝子をいう。「近交係数」とは、全遺伝子数に対する同祖遺伝子の割合をいう(非特許文献5)。同様にして同祖染色体領域も定義され、同祖染色体領域と全染色体領域の比が近交係数となる。本発明においては同祖染色体領域を「同祖領域」という。
図1は同祖領域の概念を説明する図である。子は父親と母親からそれぞれ一本ずつの染色体を受け継ぐため、世代ごとに先祖との共通性が1/2ずつ少なくなり、その領域の長さも短くなっていく。また、減数分裂時におこる交叉によっても多様性を有していく。B及びCは、Aの染色体の1/2を、D及びEはAの染色体の1/4を受け継いでいる。両親(D、E)がいとこ婚の場合には、子(F)の近交係数は1/16となる。この場合、Fのように父親と母親から同一先祖の遺伝子を受け継ぐことがあり得る。このホモ接合となった領域が同祖領域である。同祖領域内に劣性遺伝疾患に関係する遺伝子が存在していた場合には、疾患を発症することになる。通常ならば正常な対立遺伝子に覆い隠されている異常が現れたためであり、このことは近親婚において、疾患を発症しやすい理由である。
しかし、近親婚のない家系においても劣性遺伝子疾患と考えられる疾患が発症する場合がある。この場合は、近親婚が存在しないからといって近交係数の考え方に反しているわけではない。同祖領域は祖父母や曽祖父母のような近い先祖に由来するものだけではなく、もっと遥か昔の先祖によるものである可能性があるからである。同祖領域は世代を経るごとに交叉により短くなっているため、その確率も低くなり疾患として現れにくくなっている。また疾患遺伝子がホモ接合となる原因として突然変異も考えられるが、その確率は一世代、一遺伝子あたり1/10〜1/10と考えられており、本発明においては考慮しない。
以上のような近交係数の考えによれば、同祖領域内でホモ接合となっているものは疾患感受性遺伝子のみではなく、同祖領域内のすべての遺伝子、多型の塩基配列がホモ接合となっているはずである。逆にいえば、ホモ接合となっている多型が連続している領域は、同祖領域である可能性が高く、劣性遺伝の疾患感受性遺伝子も存在している可能性が高い領域である。図4を用いて説明する。図4は多型マーカーがSNPである場合を示しており、太字の塩基がSNPである。図1に示したように通常,父親由来と母親由来の2ルートから染色体を受け継ぐため、領域Bのように多型部分はホモとヘテロが混在しているはずである(図4ではSNPはすべてヘテロ接合となっている)。しかし同祖領域では、領域Aのように、塩基配列のすべてがホモ接合となっている。そのため、多型はマーカーとして用いることができ、ホモ接合の多型マーカーが連続しているホモ接合領域は、同祖領域である可能性が高いといえる。
本発明は以上のような考え方に基づき、多型をマーカーとして用い同祖領域を判定する方法及び装置を提供するものである。本発明の同祖領域判定方法を「ホモ接合指紋法(Homozygosity fingerprinting法)」と呼ぶ。さらに、ホモ接合指紋法を用いた遺伝子スクリーニング方法を提供する。
実施形態1は、主に請求項1、5から12、15から18、23、27から34、37から40に関する。実施形態2は、主に請求項2から4、13、14、24から26、35、36に関する。実施形態3は、主に請求項19及び42に関する。実施形態4は、主に請求項44に関する。実施形態5は、主に請求項41に関する。実施形態6は、主に請求項43、45に関する。実施形態7は、主に請求項20及び46に関する。実施形態8は、主に請求項21及び48に関する。実施形態9は、主に請求項22及び49に関する。実施形態10は、主に請求項47に関する。
<<実施形態1>>
<実施形態1の構成>
実施形態1について説明する。図2に本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(0200)は、「ホモ接合判定部」(0201)と、「ホモ接合領域情報取得部」(0202)と、「同祖領域判定部」(0203)を有する。
「ホモ接合判定部」(0201)は、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定するように構成されている。多型のタイピング方法は、従来技術であるPCR−SSCP、PCR−RFLP、直接シークエンス法、MALDI−TOF/MS法、TaqMan法、インベーダー法などを用いることができる。ホモ接合判定部では、上記方法によってタイピングされた塩基がホモ接合であるかどうかを判定する。
「検体DNA」とは、多型を判定するために用いる試料となるゲノムDNAであり、二倍体以上のDNAを含むものであれば特に限定されない。検体は、ヒト由来であっても、ヒト以外の動物由来であっても、さらには植物由来であってもよい。ヒト由来の場合には日本人由来であることが好ましい。日本人由来のDNAが好ましい理由は、島国であることや鎖国を行っていたことにより、他民族との血の交わりが少なく近交係数の大きな集団であり、同祖領域を有する確率が高いからである。それに対して、民族間の交わりが多く近交係数の小さな集団、例えばアメリカのような集団では、交叉によって同祖領域が短くなっているため同祖となる確率が低いからである。また、偶然にホモ接合が連続しているのか、あるいは同祖であるためにホモ接合が連続しているのかの判断が困難となるからである。検体は、血液、唾液、組織、細胞などのゲノムDNAを採取できるものであればよい。二倍体以上としたのは、本発明においては相同染色体がホモ接合であるかどうかを見るため、一倍体では判定できないためである。よって、性染色体においては女性であればX染色体がホモ接合となり得るため判定することは可能であるが、男性では検出は行えない。またDNAは三倍体以上であってもよい。ゲノムDNAの調製方法は、多型のタイピング方法に合わせた方法で行えば、特に限定されない。例えば、PCRを行う方法を用いるのであれば、PCRの阻害剤となるような物質(EDTA等)を含まないように、ゲノムDNAを調製しなければならない。
「多型マーカー」とは、DNA上の塩基の違いである多型を、疾患感受性遺伝子を検索する際にマーカーとして用いたものである。多型には、マイクロサテライト多型やVNTR多型、SNP等があり、前述したように多型のデータベースが種々公開されている。DNA上には2〜数十塩基の繰り返し配列が存在する。そのほとんどは遺伝情報を持たず、機能不明な部位にあり、生物の個体間で違いが生じやすい部分である。この繰り返し部分の回数が個人間で異なっており、多型となっている。この部分の多型のうち数塩基から数十塩基のものを「VNTR多型」、2から4塩基のものを「マイクロサテライト多型」という。また「SNP」とは、DNA中の一塩基の違いによる多型をいう。SNPには、RFLPも含まれる。SNPは、塩基配列中に高頻度に存在しており、ヒトにおいては300塩基あたりに1個程度存在し、染色体全体では300万から1000万個あるといわれている。近年、このSNPの違いを利用して疾患感受性遺伝子の探索が行われている。本発明において、多型マーカーとしてマイクロサテライト多型又はVNTR多型を用いることができる。多型の箇所の多さから、本発明においては、多型マーカーとしてSNPを用いることが好ましい。さらに、SNP、マイクロサテライト多型、VNTR多型のいずれか二以上の組み合わせでもよい。
「ホモ接合」とは、相同染色体が同一塩基であることをいう。父親由来と母親由来の対立する塩基(対立塩基対)がどちらも同じ塩基であることをいい、ホモ接合である塩基対をホモ接合体という。ホモ接合体は2倍体の染色体である必要はなく、3倍体以上であってもよい。その場合は対となる全ての染色体が同一塩基であれば、ホモ接合であるといえる。
「ホモ接合領域情報取得部」(0202)は、前記ホモ接合判定部(0201)にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するように構成されている。「連続する」とは、前記ホモ接合判定部にてホモ接合と判定された多型マーカーが、ヘテロ接合の多型マーカーを挟むことなく並んでいることをいう。また、「ホモ接合領域」とは、ホモ接合と判定された多型マーカーが連続する検体DNAの領域をいい、「連続する検体DNAの領域」とは、多型マーカーだけでなく遺伝子を含む多型マーカーに挟まれたDNAの領域をいう。図3Aを用いて説明する。図3AはDNA(0301)上に存在する多型マーカーを示している。黒色のバーはホモ接合体の多型マーカー、白色のバーはヘテロ接合体の多型マーカーを示している。0302と示された部分は多型マーカー(b、c、d、e)がすべてホモ接合となっているので、連続する領域である。したがって、図3A中斜線で示したDNAの領域がホモ接合領域となる。「ホモ接合領域情報」とは、連続する検体DNAの領域を示す情報をいう。例えば、図3Aの場合には、ホモ接合領域に含まれる多型マーカー(b、c、d、e)の位置やID、bからeといった連続領域などの情報である。
「同祖領域判定部」(0203)は、前記ホモ接合領域情報取得部(0202)にて取得されるホモ接合領域情報に含まれる多型マーカーの連続確率又は/及び連続距離が所定の同祖判定条件を満たした場合に、ホモ接合領域を同祖領域であると判定するように構成されている。「連続確率」とは、多型マーカーがホモ接合として連続する確率をいう。各多型はホモ接合体として存在する確率(ホモ接合比)が算出されている。その確率は、集団によって異なるため、検体にあった確率を用いた方がよい。例えば、ヒトの場合であっても、日本人の集団と、アメリカ人の集団とでは、多型のホモ接合比が異なっているため、日本人の検体である場合には日本人あるいはアジア人のホモ接合比を用いて、連続確率を計算することが好ましい。検出を行う集団ごとに、対照となる検体を用いて算出してもよい。連続確率は、連続する多型マーカーのホモ接合比を掛け合わせた値であり、偶然にホモ接合が連続する確率である。「連続距離」とは、多型マーカーがホモ接合として連続している距離をいう。距離とは、物理的距離(Physical(map)distance)をいい、単位はbase pair(塩基対)を用いる。すなわち、連続距離とは、ホモ接合領域の両端の多型マーカー間の距離である。「同祖判定条件」とは、ホモ接合の連続が同祖領域であるか否かの判定基準となる連続確率又は及び連続距離の条件をいう。多型マーカーはホモ接合であるか、ヘテロ接合であるかの択一であるため、偶然にホモ接合が連続する場合も存在し得る。この偶然に連続している領域を除くために条件を設定する。例えば、連続確率が1/10以下となるホモ接合領域を同祖領域と設定することができる。この確率は、10個の多型マーカーを用いて判定を行った場合に、偶然にホモ接合が連続し同祖領域と判定されてしまう箇所が1箇所程度であることを示している。また、同祖判定条件を連続距離によって定めることもできる。条件とする連続距離は、検出する多型マーカーのホモ接合比の平均値と多型マーカー間の距離の平均値から決定することもできる。例えば、10万箇所の多型マーカーの検出を行った場合に、そのホモ接合比の平均値が0.74、多型マーカー間の距離の平均値が23.6kbであった場合には、同祖判定条件を900kb以上とすることができる。多型マーカーのホモ接合比が分かっていない場合にはホモ接合領域の連続確率を求めることができないため、ホモ接合比の平均値から求めることのできる連続距離を同祖判定条件として用いることが好ましい。あるいは、連続確率と連続距離の両方を用いてもよい。同祖領域判定部(0203)では、この同祖判定条件を満たしたホモ接合領域を同祖領域であると判定する。
しかし、同祖領域をホモ接合と判定された多型マーカー間の領域とすると、その両端のホモ接合である多型マーカーの隣のヘテロ接合と判定された多型マーカーまでの間に存在する領域は、実際は同祖であるにもかかわらず同祖ではないと判定されてしまう可能性もあり得る。そのため、同祖判定条件を満たしたホモ接合領域の隣のヘテロ接合と判定された多型マーカーまでの間も、同祖領域に含めるようにしてもよい。
ここでホモ接合領域において同祖領域であることが有意となる連続確率による同祖判定条件は、1/10〜1/10以下とすることができる。多型マーカーの数により、1/10以上である場合には同祖領域と判定される領域が多すぎて有意な同祖領域を判定できない。また1/10以下である場合には同祖領域と判定されるために連続しなければならないホモ接合の数が多く、近交係数が低い場合には同祖領域と判定される領域が少なくなりすぎる可能性がある。ヒトのSNPは10個と言われているため、すべてのSNPを検出した場合に、偶然にホモ接合が連続する箇所が1箇所以下であれば、その領域は有意に同祖領域であるといえる。好ましくは、連続確率による同祖判定条件は1/(5×10)〜1/(5×10)以下とすることができる。さらに好ましくは、連続確率による同祖判定条件は1/10〜1/10以下とすることができる。多型マーカーの数が少ない場合には、連続確率による同祖判定条件は1/10〜1/(5×10)以下とすることができる。
同祖領域は世代を経るごとに交叉によって短くなり、多様性を有していく。このことから同祖領域は個人によって異なる指紋のようなものであるといえる。そこで、本発明者は同祖領域判定方法を「ホモ接合指紋法(Homozygosity fingerprinting法)」と名づけた。
ここで、同祖領域であると判定された領域が、実際には同祖でない確率を考える。染色体が無限長であり、1cM(centiMorgan)=1Mb(megabase)とし、交叉が減数分裂時に染色体上でランダムに起こると仮定すると、そのフラグメントの長さは指数分布となる。M(Morgan)とは2つの座位間で起きる交叉の回数の期待値である遺伝的距離を表わす単位である。1Mは、1回の減数分裂において1回の交叉が期待できる距離として定義される。1cM=1/100Mである。ある患者の父親と母親が共通の先祖を持っているとすると、同祖領域は各親から受け継いだ共通先祖の染色体フラグメントの共通部分であり、同祖領域の長さは指数分布となる。その指数分布の確率密度は、以下の式で表わされる。
Figure 0004059517
その平均は1/λとなる。患者の染色体が先祖からm回の減数分裂後の染色体である時、先祖の染色体は、患者の染色体中では平均長100000/m kbのフラグメントとして存在する。同祖領域は先祖の染色体フラグメントの共通部分であるから、mを父親側、nを母親側での先祖から患者までの減数分裂の回数とすると、同祖領域の平均長は100000/(m+n)kbによって計算できる。したがって、フラグメント長の平均は、以下の式で表わされる。
Figure 0004059517
いとこ婚ではm=n=3、はとこ婚ではm=n=4である。したがって、いとこ婚、はとこ婚の親から生まれた子のλ値はそれぞれ0.00006、0.00008となる。ここで、始めに染色体が無限長を持つと仮定しているので、簡単に計算される。しかし、同祖領域の長さは、染色体の長さよりもはるかに短く、この単純化によって大きな誤算は生じない。連続距離による同祖判定条件を900kb以上と設定した場合に、実際には同祖であるにもかかわらずホモ接合領域の長さが900kbよりも短く、同祖領域でないとして除外されてしまう確率は、以下の式によって計算できる。
Figure 0004059517
いとこ婚、はとこ婚の親から生まれた子のP値はそれぞれ0.05、0.07となる。したがって、同祖領域が実際に同祖である確率は、それぞれ0.95、0.93であり、高い確率で同祖領域を判定することができることを示している。20世代前の先祖を共通としている場合であっても、同様に70%程度は同祖領域として検出できることがわかる。実際に同祖である領域を同祖領域でないとして除外される確率をより低くしたい場合には、同祖判定条件をゆるく設定することができる。
上記ホモ接合判定部、ホモ接合情報取得部、同祖領域判定部の計算機による構成の一例は次のようなものである。
まず、ホモ接合判定部は、二倍体以上の検体DNAの塩基配列データを、各染色体ごとに取得する。このデータは、各染色体ごとにその塩基の位置を特定する情報である位置情報と、その位置情報に関連付けて塩基の種類(アデニン、グアニン、シトシン、チミン)を特定する情報である塩基種類情報とから構成されている。このデータを検体DNA基本データと言う。この検体DNA基本データは、例えばシーケンサーの出力データを通信や、記録媒体を介して取得し、ハードディスクドライブや、RAMなどの記憶領域に記憶したものである。
また、別途記憶領域に多型マーカーの位置情報とホモ接合比情報を多型マーカーファイルとして記憶しておく。ここでホモ接合比情報とは、特定の多型マーカーがホモ接合となる確率であり、一般に統計的に取得されている確率情報である。多型マーカーの位置情報を記憶領域から順次読出し、読み出された多型マーカーの位置情報をキーとして前記記憶領域を検索する処理を実行する。その位置情報と関連付けられている塩基種類情報を各染色体の検体DNA基本データから取得して一時記憶領域に保存する。次に一時記憶領域に保存され各染色体の同じ位置情報に関連付けられている塩基種類情報が同一であるかの判定をCPUの比較機能を利用して、各位置情報ごとに実行する。その比較結果が同一である位置情報に関しては、同一である旨を示すマーク付し、また設計によっては同一でない場合には同一でない旨を示すマークを付し、その位置情報と関連付けたファイルとして記憶領域に保存する。このファイルをホモ接合位置情報ファイルと称する。
次にホモ接合情報取得部は、記憶領域に記憶されているホモ接合位置情報ファイルの中からホモ接合が連続する領域を抽出する作業を行なう。これは、ホモ接合となっている位置情報を順次読出し、その位置情報が前記多型マーカーの連続した位置関係にあるか判定する。ホモ接合となっている位置情報が多型マーカーの連続した位置関係にある場合には連続している旨のマークである連続マークをその二つの位置情報と関連付けて記録する。特定の連続マークに関連付けられている位置情報が、他の連続マークと関連付けられている位置情報を共有している場合にはそれらの連続は3以上の多型マーカーがホモ接合として連続していることを示す。この連続マークと位置情報とを関連付けたファイルを連続マークファイルとして記憶領域に格納する。
続いて同祖領域判定部は、連続マークファイルの中から位置情報の共有が連続しているか連続していないかを判定し、その連続の度合いに応じてホモ接合領域が同祖領域であるかどうかを判定する。具体的にはこの判定は、連続する多型マーカーの位置情報に関連付けられて記憶されているホモ接合比情報を順次乗算し、その連続が同祖以外の原因によって起こる確率を算定する。算定された確率を所定の記憶領域に一旦保持し、同祖判定条件として他の記憶領域に記憶されている値を取得し、一旦記憶領域に保持されている算定された確率との比較をCPUの比較機能を利用して実行する。比較の結果、算定された確率が同祖判定条件で定める確率よりも小さい確率であると判断された場合には、これらの領域を示す位置情報を、同祖領域を示す位置情報として記憶領域に格納する。同祖領域を示す位置情報には、同祖領域の両端を示す多型マーカーの位置情報だけでなく、同祖領域に含まれるすべての多型マーカーの位置情報が含まれている。このファイルを同祖領域ファイルと呼ぶ。最終的に同祖領域ファイルに格納されている位置情報を出力すれば同祖領域を特定することが可能となる。
<実施形態1の流れ>
図5は実施形態1の同祖領域判定方法の処理の流れを示したものである。まず、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定する(ホモ接合判定ステップ S0501)。次に、前記ホモ接合判定ステップにて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカー(S0501YES)が連続する検体DNAの領域を示すホモ接合領域情報を取得し(ホモ接合領域情報取得ステップ S0502)、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合(S0503YES)に、ホモ接合体領域を同祖領域であると判定する(同祖領域判定ステップ S0504)。
これらの処理は本同祖領域判定装置によって行うものに限られず、マニュアルで行ってもよい。以下の同祖領域判定装置に関しても同様である。
<実施形態1の効果>
まだ原因遺伝子の同定がされていない疾患を有しているヒトのDNAを検体として用いた場合には、本実施形態の同祖領域判定方法によって判定された同祖領域は疾患遺伝子を有している可能性の高い領域といえる。ヒトの場合と同様に、動物や植物のDNAを検体として用いた場合には、同祖領域であると判定された領域は疾患感受性遺伝子を有している可能性の高い領域といえる。また、本実施形態の同祖領域判定方法によって、現在ある解析方法よりも少ない検体数で、容易に疾患感受性遺伝子の候補領域を特定することができる。さらに、疾患を有していない検体DNAにおいて同祖領域と判定された領域は、劣性遺伝に対して脆弱な部分であるとも判定できる。
<<実施形態2>>
<実施形態2の構成>
実施形態2について説明する。図6に本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(0600)は、「多型マーカー選択部」(0601)と、「ホモ接合判定部」(0602)と、「ホモ接合領域情報取得部」(0603)と、「同祖領域判定部」(0604)を有する。
「多型マーカー選択部」(0601)は、二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択するように構成されている。「ホモ接合判定対象となる多型マーカー」とは、DNA上の多型のうち次ステップのホモ接合判定部において判定を行う多型マーカーをいう。全多型マーカーをホモ接合判定部において判定することは、時間的にも費用的にも効率的でない。多型マーカーは染色体上に等間隔で存在するわけではなく、その間隔は様々である。また、あまりに近接する多型マーカーを用いることは、互いに同祖領域内に入っている可能性が高く、同祖領域判定にあたってあまり意味をなさない。そのため、一定の間隔で多型マーカーを選択した方が検出数を減らすことができ効率的となる。例えば、5〜10kbに1個といったように多型マーカーを選択することができる。またテロメアやセントロメアには、有用な多型マーカーは存在しないと考えられるため、ホモ接合判定の対象から除外することも可能である。多型マーカーはデータベース化されているため、全染色体について同祖領域を判定したい場合には、その中から全染色体に亘って均等に多型マーカーを選択するのがよい。また、すでに関連解析や罹患同胞対解析等によって候補遺伝子領域が特定されているような場合には、その候補領域内に存在する多型マーカーを細かく選択することによって、候補遺伝子領域をさらに狭い範囲に絞り込むことが可能となる。
本発明の同祖判定方法において、ヒトのDNAを検体DNAとし、多型マーカーにSNPを用い全染色体に亘って多型マーカーを選択しようとした場合には、1万個以上のSNPを選択することが好ましい。さらに細かく判定しようとした場合には、10万個以上のSNPを選択することが好ましい。この場合、市販のGeneChip(登録商標)を用いてもよい。
多型マーカー選択部の計算機による構成の一例は次のようなものである。多型マーカーの位置情報及びホモ接合比情報が予め多型マーカーデータベースとして記憶領域に記憶されている。一般に多型マーカーは数千から数万程度、ないしは数十万、数百万、一千万程度存在すると言われている。これは種や、多型マーカー種によって異なる。したがって計算機の資源上十分な資源を活用できる場合は別として、一般的にはこれらの中からホモ接合判定をすべき多型マーカーを選択する。選択は予め選択すべき多型マーカーの数を定め、所定のルールに従って選択した多型マーカーの数がその予め定めた数に達するまで、ないしは予め定めた数以下で所定の条件を満たすまで選択を繰り返す、という手法を採用する。ただし、これに限定されない。所定のルールとは、選択する多型マーカー間の物理的距離が所定の範囲に入るように選択すべしとのルールであったり、あるいは選択されかつ隣接する所定の数の多型マーカーのホモ接合比が所定の値以下になるように選択すべしとのルールであってもよい。また、ハプロタイプブロック情報を利用して一のハプロタイプブロック中からは一の多型マーカーが選択されるべし、とのルールをさらに加えてもよい。さらに、同祖判定の目的に応じて全遺伝子中から同祖判定が必要な領域を選択できる場合には、その必要な領域内で選択を実行するようなルールとしてもよい。いずれにしても、データベースから選択するためのルールが所定の記憶領域に記憶されており、主記憶領域に展開されCPUによって実行される選択プログラムは、前記ルールを選択し、このルールに従って多型マーカーデータベースからの選択を実行する。所定のルールにて選択された多型マーカーは、その位置情報及びホモ接合比情報が選択された多型マーカー記憶領域に記憶される。この記憶領域に記憶されているデータの塊を選択多型マーカーファイルと称する。なお、この選択プロセスは、後続するホモ接合判定ステップなどを実行しようとするたびに実行されなくてもよく、予め選択が行なわれていれば、種や、同祖判定の目的に応じて同じ選択多型マーカーファイルを利用してもよい。
ホモ接合判定部(0602)は、前記多型マーカー選択部(0601)にて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定するように構成されている。判定方法は実施形態1と同様に行う。その他の各部の処理においても実施形態1と同様であるため省略する。また、ホモ接合判定部の計算機による構成も、多型マーカーファイルの代わりに選択多型マーカーファイルを用いること以外は実施形態1と同様である。
ホモ接合領域情報取得部(0603)は、前記ホモ接合判定部(0602)にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するように構成されている。図3Bを用いて説明する。図3BはDNA(0301)上に存在する多型マーカーを示している。黒色のバーはホモ接合体の多型マーカー、白色のバーはヘテロ接合体の多型マーカーを、また多型マーカーの上の下向き三角は選択した多型マーカーを示している。図3B中で0303と示された部分(iからm)には選択していない多型マーカー(j、l)が含まれている。しかし、本発明においては選択した多型マーカーのみ(i,k、m)の連続を見る。したがって0303の部分は、ホモ接合と判定された多型マーカーが連続する領域であると判定される。すなわち、ホモ接合と判定された多型マーカーの間に存在する選択していない多型マーカーがヘテロ接合であるか否かを問わず、ホモ接合領域であると判定する。したがって、図3B中斜線で示したDNAの領域がホモ接合領域と判定される。
<実施形態2の流れ>
図7は実施形態2の同祖領域判定方法の処理の流れを示したものである。まず、二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択し(多型マーカー選択ステップ S0701)、前記多型マーカー選択ステップにて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定する(ホモ接合判定ステップ S0702)。次に、前記ホモ接合判定ステップにてホモ接合と判定された多型マーカー(S0702YES)が連続する検体DNAの領域を示すホモ接合領域情報を取得する(ホモ接合領域情報取得ステップ S0703)。さらに、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合(S0704YES)に、ホモ接合体領域を同祖領域であると判定する(同祖領域判定ステップ S0705)。
<実施形態2の効果>
本実施形態の同祖領域判定方法によって、多型マーカーを選択することにより、必要以上の多型マーカーの検出を省けるため、時間的にも費用的にも効率的に同祖領域を特定することができる。また、すでに関連解析や罹患同胞対解析等によって候補遺伝子領域が特定されているような場合には、その候補遺伝子領域内に存在する多型マーカーを細かく選択することによって、さらに候補遺伝子領域を絞り込むことが可能となる。
<<実施形態3>>
<実施形態3の構成>
実施形態3について説明する。図8に実施形態1を基本とする本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(0800)は、「ホモ接合判定部」(0801)と、「ホモ接合領域情報取得部」(0802)と、「同祖領域判定部」(0803)と、「同祖領域情報保持部」(0804)と、「同祖領域重複頻度情報取得部」(0805)を有する。
「同祖領域情報保持部」(0804)は、前記同祖領域判定部(0803)にて同祖領域であると判定された領域を示す同祖領域情報を複数の検体に対応して複数保持するように構成されている。「同祖領域情報」とは、前記同祖領域判定ステップにて同祖領域であると判定された領域を示す情報であり、例えば、同祖領域の位置、連続確率、連続距離、同祖領域に含まれる多型マーカーの位置、IDなどの情報である。同祖領域情報取得部は、複数の検体の同祖領域情報を保持する。
「同祖領域重複頻度情報取得部」(0805)は、前記同祖領域情報保持部(0804)にて保持された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を示す同祖領域重複頻度情報を取得するように構成されている。「重なる」とは、一の検体の同祖領域と、他の検体の同祖領域の全部又は一部が一致することをいう。「重なる頻度」とは、複数の検体の同祖領域を重ねた場合に、各同祖領域の全検体のうちで重複している検体の個数をいう。以下、重複頻度という。「同祖領域重複頻度情報」とは、特定の同祖領域の複数の検体間の重複頻度を示す情報であり、例えば、重複している同祖領域の位置、重複頻度、同祖領域に含まれる多型マーカーの位置、IDなどの情報である。図9を用いて説明する。図9はAからDの4検体のDNA上の同祖領域(斜線部)を示している。前記同祖領域保持部において、各検体の同祖領域情報が保持されている。例えばAの同祖領域情報は、1から2、3から4の領域が同祖領域であるという情報を含んでいる。4検体の同祖領域情報を重ねた場合には、各同祖領域はaからlの領域に区分され、各領域の重複頻度が計算される。図においてb、f、i、kは4検体中1検体のみが同祖領域と判定されているため重複頻度は1となる。同様に計算を行い、c、d、gは2、hは3、eは4となる。各検体が同一の劣性遺伝疾患を発症している患者の検体の場合には、重複頻度が高いeの領域内に疾患の原因遺伝子が存在する可能性が最も高いといえる。
同祖領域情報保持部と同祖領域重複頻度情報取得部の計算機による構成の一例は次のようなものである。
前述のように、同祖領域ファイルは、算定された確率が同祖判定条件で定める確率よりも小さい確率であると判断された領域を示す位置情報を、同祖領域を示す位置情報として含んでいる。同祖領域情報保持部は、これらの同祖領域ファイルをすべての検体について記録している。
同祖領域重複頻度情報取得部は、同祖領域情報保持部にて保持されている複数の検体の同祖領域ファイルの中から共通する位置情報を取得する。そして、共通する位置情報とその共通する位置情報を有する検体の出現頻度とを関連付けて保持する。つまり、AからB(A及びBは多型マーカーの位置)という位置情報がある特定の検体の同祖領域ファイルに含まれており、別の検体の同祖領域ファイルにもAからBという位置情報が含まれており、全部で100検体の同祖領域ファイルがAからBを共通する位置情報として有している場合には「AからBの領域」と「100」とが関連付けられて保持される。この関連付けて保持するファイルを同祖領域重複頻度ファイルと称する。計算機のプログラムは、まず、各同祖領域ファイルに含まれる多型マーカーを示す位置情報に1を割り当て保持する。次に、各検体を順次検索する。二番目の検体の同じ位置情報に1が割り当てられている場合にはその位置情報に値として1を加算して2を割り当てる。三番目の検体の同じ位置情報に1が割り当てられている場合にはさらに1を割り当てて、3とする。四番目の検体に関して同じ位置情報が同祖領域ファイルに含まれていない場合には1が割り当てられていないので前記位置情報に割り当てられている値3に対して0を加算し、ないしは加算処理を実行しないでそのまま3とする。これを全ての検体に関して繰り返す。そして、全ての検体に対してこの1の値を加算した累積値を得る。各検体の同祖領域ファイルに含まれない位置情報に関してはその検体のその位置情報に関連付ける値として前述のように0を割り当てて、その値0を加算してもよいし、加算処理を実行しなくともよい。
累積値は、位置情報と関連付けて同祖領域重複頻度ファイルに記録していく。また、同祖ファイルを追加した場合には、追加した同祖領域ファイルに含まれる多型マーカーの位置情報に1を割り当てて保持し、記録されている同祖領域重複頻度ファイルに追加することにより、新たな同祖領域重複頻度ファイルとする。このとき以前の同祖領域重複頻度ファイルは、削除するようにする。最終的な同祖領域重複頻度ファイルを出力することにより、同祖領域の重複頻度を決定することが可能となる。
また、重複させた同祖領域ファイルに誤りがあった場合や、ファイル数を減らしたい場合には、同祖領域重複頻度ファイルから抜き出したい同祖領域ファイルの多型マーカーを示す位置情報に割り当てられた1を減算する処理を行う。
<実施形態3の流れ>
図10は実施形態3の処理の流れを示したものである。まず、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定する(ホモ接合判定ステップ S1001)。次に、前記ホモ接合判定ステップにて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得し(ホモ接合領域情報取得ステップ S1002)、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に(S1003YES)、ホモ接合体領域を同祖領域であると判定する(同祖領域判定ステップ S1004)。さらに、前記同祖領域判定ステップにて同祖領域であると判定された領域を示す同祖領域情報を、複数の検体に対して取得し(同祖領域情報取得ステップ S1005)、前記同祖領域情報取得ステップにて取得された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を取得する(同祖領域重複頻度取得ステップ S1006)。
<実施形態3の効果>
本実施形態の同祖領域判定方法によって、まだ原因遺伝子の同定がされていない疾患を有しているヒトのDNAを検体として用いた場合には、疾患の原因遺伝子を有している可能性の高い領域の絞り込みを行うことができる。動物や植物の疾患感受性遺伝子の探索においても同様に用いることができる。また、家畜などの動物や植物の品種改良を行う際に本実施形態の同祖領域判定方法を用いることにより、劣性で有為な機能や形質を発現するような遺伝子の探索が可能となる。
<<実施形態4>>
<実施形態4の構成>
実施形態4について説明する。図11に実施形態1を基本とする本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(1100)は、「ホモ接合判定部」(1101)と、「ホモ接合領域情報取得部」(1102)と、「同祖領域判定部」(1103)と、「同祖領域情報保持部」(1104)と、「同祖領域重複頻度情報取得部」(1105)と、「同祖領域情報蓄積部」(1106)と、「重要同祖領域情報取得部」(1107)を有する。
「同祖領域情報蓄積部」(1106)は、前記同祖領域重複頻度取得部(1105)にて取得された重複頻度を同祖領域情報に対応付けて蓄積するように構成されている。「対応付けて」とは、合わせてという意味である。すなわち、同祖領域情報蓄積部は、同祖領域の位置、連続確率、連続距離、同祖領域に含まれる多型マーカーの位置、IDなどの同祖領域情報と重複頻度の情報とを合わせて蓄積する。
「重要同祖領域情報取得部」(1107)は、前記同祖領域情報蓄積部(1106)に蓄積されている同祖領域情報のうち所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を取得するように構成されている。「所定の重複頻度」とは、設定した重複頻度をいい、例えば10のように設定できる。「重要同祖領域情報」とは、所定の重複頻度以上である同祖領域情報をいう。30検体の同祖領域を判定し、所定の重複頻度を10とした場合には、前記同祖領域情報蓄積部に蓄積されている同祖領域情報のうち30検体中10検体以上で同祖領域と判定されている同祖領域情報のみが取得される。
同祖領域情報蓄積部と重要同祖領域情報取得部の計算機による構成の一例は次のようなものである。
同祖領域情報蓄積部は、前記同祖領域重複頻度取得部にて取得された位置情報に関連付けられた同祖領域重複頻度ファイルを記憶領域に保存する。また、同祖領域重複頻度ファイルは、検体の出生地、生息地、疾患、人種、品種などの情報とともに保存したり、それらの情報ごとに別ファイルとして保存してもよい。
重要同祖領域情報取得部は、前記同祖領域情報蓄積部に保存されている位置情報に関連付けられている同祖領域重複頻度ファイルのうち、所定の重複頻度以上である同祖領域の情報を取得する。この所定の重複頻度以上である同祖領域情報を重要同祖領域ファイルという。つまり、同祖領域重複頻度ファイルにてA:20、B:50、C:100、・・・(間はすべて100)、Y:50、Z:30(A:20とは、Aという位置の多型マーカーが20の同祖領域重複ファイルに含まれていることを示す)とういうが情報が保存されていた場合に、重複頻度が50以上である同祖領域情報を指定した時には、「BからY」という位置情報が重要同祖領域ファイルに記録される。最終的に重要同祖領域ファイルに格納されている位置情報を出力すれば重要同祖領域を特定することが可能となる。
また、遺伝子の情報を位置情報に関連付けて記憶領域に遺伝子情報ファイルとして別途保存しておく。遺伝子の情報とは、遺伝子がコードするたんぱく質の情報であり、疾患との関係が知られている場合には、疾患の名称等の情報とも関連付けておく。この遺伝子情報ファイルは、既存のデータベースの出力データを通信や記録媒体を介して取得し、ハードディスクドライブや、RAMなどの記憶領域に記憶したものでもよい。同祖領域重複頻度ファイルの位置情報が、記憶領域に別途保存されている劣性遺伝子の存在する領域を含んでいる場合には、その遺伝子情報を同祖領域重複頻度ファイルに関連付けて記憶するようにしてもよい。
<実施形態4の流れ>
図12は実施形態4の処理の流れを示したものである。まず、二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定する(ホモ接合判定ステップ S1201)。次に、前記ホモ接合判定ステップにて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得し(ホモ接合領域情報取得ステップ S1202)、前記ホモ接合領域情報に含まれる多型マーカーの連続確率が所定の同祖判定条件を満たした場合に(S1203YES)、ホモ接合体領域を同祖領域であると判定する(同祖領域判定ステップ S1204)。さらに、前記同祖領域判定ステップにて同祖領域であると判定された領域を示す同祖領域情報を、複数の検体に対して取得し(同祖領域情報取得ステップ S1205)、前記同祖領域情報取得ステップにて取得された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を取得する(同祖領域重複頻度取得ステップ S1206)。最後に、前記同祖領域重複頻度取得ステップにて取得された重複頻度を同祖領域情報に対応付けて蓄積し(同祖領域情報蓄積ステップ S1207)、前記同祖領域情報蓄積ステップにて蓄積された同祖領域情報のうち所定の重複頻度以上である重要同祖領域情報を取得する(重要同祖領域情報取得ステップ S1208)。
<実施形態4の効果>
本実施形態の同祖領域判定方法によって、複数の検体で同祖領域と判定された領域のうちで、さらに重複頻度の高い領域の情報のみを取得することができる。疾患感受性遺伝子の探索を行う領域の絞り込む場合に、所定の重複頻度の設定値を変化することによって探索候補領域数の調整を行うことが可能となる。
<<実施形態5>>
<実施形態5の構成>
実施形態5について説明する。図13に実施形態1を基本とする本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(1300)は、「ホモ接合判定部」(1301)と、「ホモ接合領域情報取得部」(1302)と、「同祖領域判定部」(1303)と、「同祖領域情報出力部」(1304)とを有する。
「同祖領域情報出力部」(1304)は、前記同祖領域判定部(1303)にて同祖判定条件を満たすと判定されたホモ接合領域を示す情報である同祖領域情報を視覚化して出力するように構成されている。「視覚化して出力する」とは、形として表すことをいい、例えば表、グラフ、図などとして出力できる。出力方法は、例えばディスプレイヘの表示、印刷、記録媒体への書き込み等により行うことができる。同祖領域情報を視覚化して出力することにより、一検体ごとの同祖領域がいずれの位置にあるかの判断を容易にすることができる。
同祖領域情報出力部の計算機による構成の一例は次のようなものである。同祖領域判定部において取得された同祖領域ファイルは、入出力インターフェイスを介して同祖領域出力部により出力される。同祖領域ファイルに保存されている同祖領域の位置情報を順次読み出し、その位置情報に対応する染色体上の領域を所定のルールに従って視覚化する処理を行う。所定のルールとは、同祖領域の両端の位置情報を染色体の番号順に小さい位置情報のものから並べて表として表すというルールであったり、同祖領域の長さ100kbを幅1mmの領域として染色体地図上に図示するといったルールであってもよい。その一例として染色体地図上に出力したものが、図17(A)、(B)、(C)である。黒く塗られている領域が同祖領域である。図17(A)、(B)、(C)は3人の同祖領域を示しているが、それぞれに同祖領域とされる染色体の位置は異なっており、視覚化することにより同祖領域が個人の指紋のような機能を持つことがわかる。
<実施形態5の流れ>
図20を用いて計算機による実施形態5の処理の流れの一例を説明する。図20では多型マーカーとしてSNPを用い、同祖判定条件を連続確率が1/10以下に設定している。まず、SNPタイピング結果を取得すると、SNPの種類をAAのホモ、BBのホモ、ABのヘテロ、Nocallの4つに分類し、それぞれ1、2、3、4とする(S2001)。A及びBはあらかじめどの塩基を示すものであるかを決定しておく。Nocallは塩基の検出が行えなかったものである。SNPを染色体及び位置により並び替え(S2002)、処理を行っていない最も番号の小さい染色体の一を選択する(S2003)。選択した染色体の位置番号が小さいものから順に多型の種類を検索する(S2004)。まずホモ接合領域のstartとなる1又は2のSNPを検索する(S2005〜S2007)。最初に検出したホモ接合のSNPをstartとする(S2008)。次に隣のSNPを検索し(S2009)、4であればさらに次のSNPを検索する(S2010)。隣のSNPが1又は2であれば(S2011YES)、連続するホモ接合のSNPのホモ接合比を乗算する(S2012)。また隣のSNPが3であれば(S2013)、一つ前のSNPをホモ接合領域のendとする(S2014)。選択した染色体のすべての処理が終了していない場合には(S2015NO)、次にホモ接合領域のstartとなるSNPを検索するステップに戻り(S2006)、選択した染色体のすべてのSNPを検索するまで繰り返す。選択した染色体のすべてのSNPを検索し(S2015YES)、すべての染色体の処理が完了したかを確かめる。すべての染色体の処理が完了していない場合には(S2016NO)、次の染色体の検索を開始する(S2003)。すべての染色体の処理が完了した場合には(S2016YES)、ホモ接合比を乗算した値が設定した同祖判定条件(1/10以下)を満たす領域の情報のみを記録し、出力する(S2017)。
<実施形態5の効果>
同祖領域情報を視覚化することにより、疾患遺伝子位置との比較や、他の検体との比較が容易となる。また、長い同祖領域を有していれば、近い家系内で近親婚があったこと、短い同祖領域ばかりであれば、近い家系内には近親婚がないことを容易に知ることができる。
<<実施形態6>>
<実施形態6の構成>
実施形態6について説明する。図14に実施形態2を基本とする本実施形態の機能ブロックの一例を示した。本実施形態の「同祖領域判定装置」(1400)は、「多型マーカー選択部」(1401)と、「ホモ接合判定部」(1402)と、「ホモ接合領域情報取得部」(1403)と、「同祖領域判定部」(1404)と、「同祖領域情報保持部」(1405)と、「同祖領域重複頻度情報取得部」(1406)と、「同祖領域情報蓄積部」(1407)と、「重要同祖領域情報取得部」(1408)と、「同祖領域重複頻度視覚化情報出力部」(1409)と、「重要同祖領域情報出力部」(1410)を有する。
「同祖領域重複頻度視覚化情報出力部」(1409)は、前記同祖領域重複頻度情報取得部にて取得された同祖領域重複頻度情報を視覚化した情報である同祖領域重複頻度視覚化情報を出力するように構成されている。同祖領域重複頻度情報を視覚化して出力することにより、重複頻度の高い同祖領域がいずれの位置にあるのかの判断を容易にすることができる。
同祖領域重複頻度視覚化情報出力部の計算機による構成の一例は次のようなものである。同祖領域情報重複頻度取得部において取得された重複頻度ファイルは、入出力インターフェイスを介して同祖領域重複頻度視覚化情報出力部により出力される。重複頻度ファイルに記憶されている同祖領域の位置情報を順次読み出し、その位置情報に対応する染色体の領域を所定のルールに従って視覚化する処理を行う。所定のルールとは、横軸を染色体の位置、縦軸を重複頻度とするようなグラフによって出力するというルールであってもよい。出力方法の一例として、重複頻度と色の濃さとを対応させて染色体地図上に出力したものが、図19である。色の濃い領域が重複頻度の高い同祖領域である。矢印で示した領域が重複頻度の高い領域であることが容易に判断することができる。
「重要同祖領域情報出力部」(1410)は、前記重要同祖領域情報取得部にて取得された所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を示す重要同祖領域情報を視覚化して出力するように構成されている。重要同祖領域情報を視覚化して出力することにより、設定した重複頻度以上の同祖領域がいずれの位置にあるのかの判断を容易にすることができる。
重要同祖領域情報出力部の計算機による構成の一例は次のようなものである。重要同祖領域情報取得部において取得された重要同祖領域ファイルは、入出力インターフェイスを介して重要同祖領域情報出力部により出力される。重要同祖領域ファイルに記憶されている同祖領域の位置情報を順次読み出し、その位置情報に対応する染色体の領域を所定のルールに従って視覚化する処理を行う。所定のルールとは、重要同祖領域の位置情報を染色体の番号順に小さい位置情報のものから並べて表として表すというルールであったり、重要同祖領域の長さ100kbを幅1mmの領域として染色体地図上に図示するといったルールであってもよい。出力方法の一例として、図17(A)、(B)の2検体のうち重複頻度が2の重要同祖領域情報を出力したものが図18(D)である。また図17(A)、(B)、(C)の3検体のうち重要頻度が3の重要同祖領域情報を出力したものが図18(E)である。
<実施形態6の効果>
複数の検体の同祖領域情報を、同祖領域重複頻度視覚化情報又は重要同祖領域情報として出力することにより、集団における同祖領域の頻度を明確にすることできる。同祖領域重複頻度視覚化情報出力部を有する同祖領域判定装置は、重複頻度の高い領域を容易に判断することを可能にする。また、重要同祖領域情報出力部を有する同祖領域判定装置は、設定した重複頻度以上の同祖領域のみを出力するため、遺伝子探索を行う領域を限定し、効率的に遺伝子スクリーニングを行うことを可能にする。
<<実施形態7>>
実施形態7について説明する。本実施形態は、特定の機能を有する遺伝子のスクリーニング方法であって、上記いずれか一に記載の同祖領域判定方法又は同祖領域判定装置によって判定された同祖領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法である。
同祖領域と判定された領域内にある遺伝子の配列を決定し、正常遺伝子の配列と比較することによって、検体のDNAの遺伝子配列の異常を調べる遺伝子スクリーニング方法である。原因遺伝子がまったく分かっていない劣性遺伝疾患を有する検体のDNAを用いた場合、同祖領域として判定された領域は疾患感受性遺伝子の存在する候補領域であり、候補領域内のすべての遺伝子配列の検出を行うことによって、疾患感受性遺伝子を特定することが可能である。すなわち、異常遺伝子が同じ疾患を有する検体のDNAに存在していれば、該遺伝子が原因遺伝子であると特定することができる。また、厳しい同祖判定条件によっても同祖領域と判定される領域から遺伝子配列の同定を行うようにすれば、効率よく疾患感受性遺伝子を特定することが可能となる。
また、同祖領域はホモ接合と判定された多型マーカー間の領域であるため、その両端のホモ接合の多型マーカーから次にヘテロ接合と判定された多型マーカーまでの間に存在する遺伝子も実際は同祖である可能性もあり得る。そのため、遺伝子のスクリーニングを行う場合には、次にヘテロと判定された多型マーカーまでの間にある遺伝子も検出するようにするのが好ましい。
<<実施形態8>>
実施形態8について説明する。本実施形態は、特定の機能を有する遺伝子のスクリーニング方法であって、上記いずれか一に記載の同祖領域判定方法又は同祖領域判定装置によって判定された同祖領域情報が、前記同祖領域情報蓄積部に蓄積されている同祖領域情報と重複している場合に、重複領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法である。
疾患を有しているか不明な検体のDNAの同祖領域情報が、同祖領域情報蓄積部に蓄積されている疾患等の情報と結びついた同祖領域情報と重複している場合に、重複領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較することによって疾患を有しているか否かを判定することができる。同祖領域情報蓄積部が、ホモ接合となることによって疾患を発症するような遺伝子や有意な形質を発現するような遺伝子の位置情報と、同素領域情報とを対応させて蓄積することによって、遺伝子診断に用いることが可能である。
<<実施形態9>>
実施形態9について説明する。本実施形態は、特定の機能を有する遺伝子のスクリーニング方法であって、上記いずれか一に記載の同祖領域判定方法又は同祖領域判定装置によって判定された同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域であるか否かを判定し、既知である遺伝子が含まれうる領域である場合に、既知である遺伝子と検体DNAの該遺伝子の配列を比較する遺伝子スクリーニング方法を提供する。
「機能」とは、劣性の性質のみでなく、優性の性質でもよい。例えば、ホモ接合となることによって獲得される寒さや害虫に強いといった性質や糖度が高くなる性質などがあり得る。検体DNAの同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域と重複している場合に、重複領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較することによって、該遺伝子の有無を調べることが可能となる。例えば、既知の劣性遺伝の原因遺伝子領域と比較することにより、劣性遺伝子疾患の簡易な罹患診断とすることができる。検体の同祖領域と疾患遺伝子領域は重複していた場合には、遺伝子の配列を同定し原因遺伝子の特定を行う。
<<実施形態10>>
実施形態10について説明する。本実施形態は、特定の機能を有する遺伝子のスクリーニング方法であって、前記検体DNAが疾患を有する検体のDNAであり、上記いずれか一に記載の同祖領域判定方法又は同祖領域判定装置によって判定された同祖領域が、該疾患に関係すると予想される遺伝子を含む場合に、前記検体DNAの同祖領域中の該遺伝子の配列を同定し、正常遺伝子と比較する、遺伝子スクリーニング方法を提供する。
本実施形態の遺伝子スクリーニング方法により、後述する実施例に記載の肺胞微石症の原因遺伝子を同定した。本スクリーニング方法の詳細は実施例で述べる。
肺胞微石症の原因遺伝子の同定の例を用いて詳細に説明するが、本発明はこれらの実施例に限定されるものではない。
<肺胞微石症について>
肺胞微石症は、肺胞内に層状、年輪状のリン酸カルシウムからなる無数の微結石が形成される原因不明の稀な疾患である(非特許文献6)。本疾患は小児から成人に至るまで見られるが発症における性差はなく、その症状は年齢により異なる。通常、小児期から若年期の症例では胸部X線像に顕著なびまん性肺陰影が見られるにもかかわらず、概して自覚症状に乏しいが、40歳以上の症例では運動時の呼吸困難、咳等自覚症状を訴える。本疾患の長期予後は発見時の年齢により異なるが、必ずしも良好ではない。特に40歳以上の中高年期では症状の進行に伴い咳、呼吸困難等の呼吸器症状を生じる。さらに症状の進行することで呼吸不全に陥り死亡する例も多い。
本疾患は同胞発生の頻度が高いことや兄弟間のような水平伝播の傾向が見られることから常染色体劣性遺伝による遺伝子性肺疾患と考えられている(非特許文献7)。しかしながら、現在までその原因遺伝子は同定されていない。稀な疾患ではあるが、単一民族からなる島国のように同胞性の高い国や、宗教的背景から近親婚率の高い国では潜在的な発症頻度は必ずしも低いとは言えず、無視できる疾患ではない。特に日本は本疾患の症例が世界でも多いことが知られており(非特許文献8)、本疾患の原因究明や治療方法の開発が望まれている。しかし、酸素療法等の対処療法や肺移植以外に本疾患の有効な治療方法は知られていない。
<検体>
図15に示す肺胞微石症を発症した5名を患者のDNAを検体として用いた。斜線は死亡した患者を示している。患者1、2、4は近親婚家系であり、家系内に肺胞微石症の患者を有している。また患者3は近親婚家系ではないが、家系内に肺胞微石症の患者を有している。患者5については近親婚家系かどうか分からない。検体DNAは、生存している患者においては、血液から調整し、死亡している患者においては、パラフィン包理切片標本から調整を行った。ゲノムDNAを抽出する方法は公知の方法を用いることができる。
血液からのフェノール処理の場合を例に挙げて以下で説明する。当該末梢血5mlに溶解バッファー(終濃度:100μg/mlプロテイナーゼK、50mM Tris−HCl(pH7.5)、10mM CaCl、1% SDS)を加えて、50℃で30分インキュベートして細胞を溶解した。続いて、前記細胞溶解液にTEバッファーで飽和させたフェノールを等量加えた後、容器を数回反転して混合した。次に、室温にて3000Xgで10分間遠心処理を行い、水層とフェノール層に分離させた。続いて、上層の水層のみを採取して新たな容器に移した。そして再び当該水層にフェノール・クロロホルム混合液(1:1混合比)を等量加え、容器を数回反転して混合した。次に、室温にて3000Xgで10分間再び遠心処理を行い、水層と中間層(変性タンパク質層)、そしてフェノール・クロロホルム層の3層に分離させた。続いて、中間層を構成する変性タンパク質を混入させないように水層のみを採取した後、中間層が確認できなくなるまで前記フェノール・クロロホルム混合液による処理を数回繰り返し行った。次に、最後に得られた水層サンプルに終濃度50μg/mlになるようRNase Aを加えて50℃で1時間ほどインキュベートしてRNAを分解した。続いて、前述の溶解バッファーを加えて再びプロテイナーゼK処理して水層サンプル中のRNase Aを失活させた。次に、前述のフェノール・クロロホルム混合液を等量加えてふたたびフェノール・クロロホルム処理を行った。処理後の水層の容量に対して3M酢酸ナトリウムを1/10容量、及びイソ・プロパノールを等量加えて静かに撹拌した。最後に、析出してくるゲノムDNAをガラス棒で絡め取るか、室温にて3000Xgで10分間遠心処理を行い、目的のゲノムDNAを得た。
<多型マーカーの選択>
多型マーカーは、染色体の全範囲に亘って満遍なく配置されているAffimetrix社のGeneChip(登録商標)Human Mapping 100k setを用いて行った。GeneChip Human Mapping 100k setは、テロメアとセントロメアを除く領域を幅広くカバーし、約10万個のSNPを一度に検出できる。100kb以内に少なくとも1個のSNPが含まれる領域は全DNAの92%、50kb以内では83%、10kb以内では40%に相当するため、疾患の原因が何であるのかが分かっていない場合の同祖領域の判定において好ましい。図16にそのSNPのカバー領域を示している。
<SNPタイピング>
前記各検体のDNAに対してSNPのタイピングを行った。またその解析は、判定の信頼性を確保するため、Australian Genome Research FacilityとAROS applied biotechnologyの2社に依頼して行った。タイピング結果は非常によく一致していた。SNPタイピングは、Affimetrix社のGeneChip Mapping 100k Assay Mannualに従い、行った。
<ホモ接合領域の判定>
SNPタイピングの結果から、ホモ接合かどうかを判定し、ホモ接合の連続している領域を判定した。
<同祖領域の判定>
10万個のSNPの検出を行ったため同祖判定条件を連続確率が1/10以下として、同祖領域の判定を行った。ホモ接合領域及び同祖領域の判定は、以下の図23から図29に記載のプログラムを計算機に実行させて行った。この図においては、ホモ接合領域をSHS(Stretch of Homozygous SNPs)として表している。
このようにして判定された同祖領域は、図17に示す形で同祖領域出力部によって視覚化して出力することができる。図17(A)、(B)、(C)はそれぞれ患者1、2、3の同祖領域を示している。図17(A)、(B)の患者1、2は両親がいとこ婚であるため長い同祖領域を有している。それに対し、近親婚家系ではない図17(C)の患者3には、長い同祖領域は見られず遠い先祖に由来すると思われる短い同祖領域がみられる。
<重要同祖領域の判定>
患者1と2の共通部分、すなわち重複頻度が2の重要同祖領域を示したものが図18(D)である。どちらの患者も長い同祖領域を持つため、まだ候補領域の絞り込みが行えない。しかし、患者1から3の3検体の同祖領域の共通部分、すなわち重複頻度が3である重要同祖領域を視覚化して出力した図18(E)では、近親婚家系ではない患者3により、重要同祖領域を絞り込むことができた。この重要同祖領域は合わせて11.5Mbの長さとなった。図18(D)、(E)は、図30から図33に記載のプログラムによって重要同祖領域を判定し、重要同祖領域出力部によって視覚化して出力したものである。
<原因遺伝子の特定>
11.5Mbの重要同祖領域内には、35個の遺伝子が含まれていた。しかし、そのうち25個の遺伝子は既知であるか、機能のほぼ知られた遺伝子であった。この中で肺胞微石症の病態に直接関係のありそうな遺伝子は,リン酸共輸送体をコードする遺伝子ただ一つであった。したがって、SLC34A2を候補遺伝子として、5検体に対し各検体のSLC34A2のエクソンの配列を調べたところ、全員の遺伝子がホモ接合の変異を有していた。それに対し、10人の健常人の遺伝子には変異は見られなかった。SLC34A2の塩基配列は、適当な配列をプライマーとして、BigDye Terminator v1.1 cycle sequencing Kit(ABI社)を用いて添付のプロトコルに従って反応を行った。自動DNAシークエンサー(ABI PRISM 310:ABI社)でこの反応産物の塩基配列を直接読み、増幅産物が改変型であることを確認した。また、健常人のゲノムDNAの抽出は上記患者のゲノムDNA抽出方法と同様である。
5人のSLC34A2遺伝子の改変は以下の2とおりであった。さらに、当該2種類の遺伝子の改変に基づく改変型タンパク質は、いずれもIIb型ナトリウム−リン酸共輸送体としての活性を有していないことが判明した。以上の結果から、ヒトSLC34A2遺伝子が肺胞微石症の原因遺伝子であり、IIb型ナトリウム−リン酸共輸送体の機能の失活が肺胞微石症の発症と関連することが明らかとなった(非特許文献9)。
第一の改変は図21Aに示すような置換による改変であった。具体的には野生型の塩基配列(2101)において配列番号1の第13290位のTから第13304位のGまでの15塩基に相当する配列が、改変型(2102)では配列番号3で表される19塩基からなる配列(2103)に置き換わっていた。当該改変によりアミノ酸のフレームシフトが生じるため、野生型CDSの途中に停止コドンが現れる。その結果停止コドンが現れ、図21Bに示すように313アミノ酸からなるアミノ酸改変型ヒトIIb型ナトリウム−リン酸共輸送体タンパク質(2105)が生じる。当該改変型タンパク質は、野生型タンパク質(2104)のアミノ酸配列から予想される8つの膜貫通ドメイン(TM:transmembrane domain)のうちC末側に存在する5つを欠失している。
第二の改変も図22Aに示すような置換による改変であった。具体的には野生型の塩基配列(2201)において第8イントロンのスプライシングドナー部位(二重下線部)として表されるGTが、改変型(2202)ではATに置き換わる点突然変異を生じていた。この改変により、当該遺伝子の転写後、第8イントロンがmRNAスプライシングによって除去されなくなることから、図22Bに示すように、成熟mRNAは改変を有した第8イントロンが残された塩基配列(2203)となる。すなわち、これは配列番号1内で説明する当該遺伝子の野生型CDS(Cording sequence:アミノ酸コード配列)において、第14304位のTと第15670位のG間に配列番号4で表される塩基配列が挿入された状態と同様の配列となる。当該改変によりアミノ酸のフレームシフトが生じるため、塩基配列内に停止コドンが現れ、図22Cで示すように359アミノ酸からなるアミノ酸改変型ヒトIIb型ナトリウム−リン酸共輸送体タンパク質(2204)が生じる。当該改変型タンパク質はアミノ酸配列から予想される8つの膜貫通ドメインのうちC末側に存在する5つを欠失している。
ここで、配列番号1は、野生型ヒトSLC34A2遺伝子のゲノム上の全塩基配列(5’非翻訳領域、及び3’非翻訳領域を含む。)とそのコード領域に対応するアミノ酸配列を表している。前記エクソン及びイントロンの番号等の位置情報は配列表内に記載している。配列番号2は、前記配列番号1のCDSを表している。配列番号3は、前記改変Aにおいて置き換わる19塩基からなる配列を表している。配列番号4は、前記改変Bにおいてスプライシングドナー部位に点突然変異を有する第8イントロンの塩基配列を表している。
<考察>
以上の結果から、従来近親婚家系を用いた劣性疾患遺伝子の同定に用いられていたHomozygosity mapping法が、Homozygosity fingerprinting法として近親婚のない患者にも拡張可能であることことが証明された。低浸透率である肺胞微石症の原因遺伝子の同定において、わずか3例の検体で遺伝子の同定に至ったことから、他の劣性疾患遺伝子の同定においても少数の検体で利用可能であることが示唆される。したがって、本発明の同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法は、劣性遺伝子の同定において非常に有効な解析方法を提供するものであることが判明した。
従来多くの家系あるいは対照群を必要とした劣性遺伝の疾患感受性遺伝子の探索研究において、本発明による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法によって、少数の検体数(肺胞微石症においては3例)で疾患感受性遺伝子の特定を行うことが可能である。本発明は、家系解析を必要とせず少数の検体で原因遺伝子の同定可能であるため、現在症例が少なく原因遺伝子の同定に至っていない低浸透率の劣性遺伝子疾患においても適用可能であり、同定された遺伝子は創薬分野においての利用性が非常に高い。また、複数の検体における重複頻度を観察ことにより複数の重複領域が存在する場合には、複数の疾患感受性遺伝子の候補領域を特定することが可能であり、多遺伝子疾患においても適用可能である。疾患を有していない検体や近親婚家系においても、劣性遺伝子が存在する領域が同祖領域であるかを判定することにより、簡易な劣性遺伝子疾患の診断に用いることも可能である。
さらに本発明は、有用な機能を果たす劣性遺伝子や有用な形質を発現するような劣性遺伝子を同定することも可能であるため、動物や植物の品種改良の分野においても利用可能であり、畜産・農業上の利用性も非常に高い。
同祖領域の概念を説明する図 実施形態1の機能ブロックの一例を表す図 ホモ接合領域の概念を説明する図 同祖領域と多型マーカーの関係を説明する図 実施形態1の処理の流れの一例を説明する図 実施形態2の機能ブロックの一例を表す図 実施形態2の処理の流れの一例を説明する図 実施形態3の機能ブロックの一例を表す図 同祖領域重複頻度の概念を説明する図 実施形態3の処理の流れの一例を説明する図 実施形態4の機能ブロックの一例を表す図 実施形態4の処理の流れの一例を説明する図 実施形態5の機能ブロックの一例を表す図 実施形態6の機能ブロックの一例を表す図 実施例1に用いた患者の家系図 実施例1において選択したSNPの範囲を表す図 肺胞微石症患者の同祖領域を表す図 肺胞微石症患者の重要同祖領域を表す図 同祖領域重複頻度の出力方法の一例を表す図 実施形態5の処理の流れの一例を説明する図 第一の改変を有する肺胞微石症の原因遺伝子を表す図 第二の改変を有する肺胞微石症の原因遺伝子を表す図 ホモ接合領域及び同祖領域の判定プログラム(1) ホモ接合領域及び同祖領域の判定プログラム(2) ホモ接合領域及び同祖領域の判定プログラム(3) ホモ接合領域及び同祖領域の判定プログラム(4) ホモ接合領域及び同祖領域の判定プログラム(5) ホモ接合領域及び同祖領域の判定プログラム(6) ホモ接合領域及び同祖領域の判定プログラム(7) 重要同祖領域の判定プログラム(1) 重要同祖領域の判定プログラム(2) 重要同祖領域の判定プログラム(3) 重要同祖領域の判定プログラム(4)
符号の説明
0200 同祖領域判定装置
0201 ホモ接合判定部
0202 ホモ接合領域情報取得部
0203 同祖領域判定部

Claims (49)

  1. 二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定ステップと、
    前記ホモ接合判定ステップにて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得ステップと、
    前記ホモ接合領域情報に含まれる多型マーカーの連続確率及び/又は連続距離が所定の同祖判定条件を満たした場合に、ホモ接合体領域を同祖領域であると判定する同祖領域判定ステップと、
    を有する同祖領域判定方法。
  2. 二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択する多型マーカー選択ステップと、
    前記多型マーカー選択ステップにて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定ステップと、
    前記ホモ接合判定ステップにてホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得ステップと、
    前記ホモ接合領域情報に含まれる多型マーカーの連続確率及び/又は連続距離が所定の同祖判定条件を満たした場合に、ホモ接合体領域を同祖領域であると判定する同祖領域判定ステップと、
    を有する同祖領域判定方法。
  3. 前記多型マーカー選択ステップは、検体DNAの全染色体領域にわたって多型マーカーを選択するステップである請求項2に記載の同祖領域判定方法。
  4. 前記多型マーカー選択ステップは、候補遺伝子領域とされた領域に含まれる多型マーカーを選択するステップである請求項2に記載の同祖領域判定方法。
  5. 前記検体DNAが植物由来のDNAである請求項1から4のいずれか一に記載の同祖領域判定方法。
  6. 前記検体DNAが動物由来のDNAである請求項1から4のいずれか一に記載の同祖領域判定方法。
  7. 前記検体DNAがヒト由来のDNAである請求項1から4のいずれか一に記載の同祖領域判定方法。
  8. 前記検体DNAが日本人由来のDNAである請求項1から4のいずれか一に記載の同祖領域判定方法
  9. 前記多型マーカーは、SNPである請求項1から8のいずれか一に記載の同祖領域判定方法。
  10. 前記多型マーカーは、マイクロサテライトである請求項1から8のいずれか一に記載の同祖領域判定方法。
  11. 前記多型マーカーは、VNTRである請求項1から8のいずれか一に記載の同祖領域判定方法。
  12. 前記多型マーカーは、SNP、マイクロサテライト、VNTRのいずれか二以上の組み合わせである請求項1から8のいずれか一に記載の同祖領域判定方法。
  13. 前記多型マーカー選択ステップは、
    前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において1万個以上のSNPを選択するステップである請求項9に記載の同祖領域判定方法。
  14. 前記多型マーカー選択ステップは、
    前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中において10万個以上のSNPを選択するステップである請求項9に記載の同祖領域判定方法。
  15. 前記同祖領域判定ステップにおいて、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が1000万分の1から1万分の1の範囲から選択される値よりも小さいことである請求項1から14のいずれか一に記載の同祖領域判定方法。
  16. 前記同祖領域判定ステップにおいて、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が500万分の1から5万分の1の範囲から選択される値よりも小さいことである請求項1から14のいずれか一に記載の同祖領域判定方法。
  17. 前記同祖領域判定ステップにおいて、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から10万分の1の範囲から選択される値よりも小さいことである請求項1から14のいずれか一に記載の同祖領域判定方法。
  18. 前記同祖領域判定ステップにおいて、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から5000分の1の範囲から選択される値よりも小さいことである請求項1から14のいずれか一に記載の同祖領域判定方法。
  19. 前記同祖領域判定ステップにて同祖領域であると判定された領域を示す同祖領域情報を、複数の検体に対して取得する同祖領域情報取得ステップと、
    前記同祖領域情報取得ステップにて取得された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を取得する同祖領域重複頻度取得ステップと、
    をさらに有する請求項1から18のいずれか一に記載の同祖領域判定方法。
  20. 請求項1から19のいずれか一に記載の同祖領域判定方法によって判定された同祖領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法。
  21. 請求項1から19のいずれか一に記載の同祖領域判定方法によって判定された同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域であるか否かを判定し、既知である遺伝子が含まれうる領域である場合に、既知である遺伝子と検体DNAの該遺伝子の配列を比較する遺伝子スクリーニング方法。
  22. 前記検体DNAが疾患を有する検体のDNAであり、請求項1から19のいずれか一に記載の同祖領域判定方法によって判定された同祖領域が、該疾患に関係すると予想される遺伝子を含む場合に、前記同祖領域中の検体DNAの該遺伝子の配列を同定し、正常遺伝子と比較する、遺伝子スクリーニング方法。
  23. 二倍体以上である検体DNAの多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定部と、
    前記ホモ接合判定部にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得部と、
    前記ホモ接合領域情報取得部にて取得されるホモ接合領域情報に含まれる多型マーカーの連続確率及び/又は連続距離が所定の同祖判定条件を満たした場合に、ホモ接合領域を同祖領域であると判定する同祖領域判定部と、
    を有する同祖領域判定装置。
  24. 二倍体以上である検体DNAの多型マーカーからホモ接合判定対象となる多型マーカーを選択する多型マーカー選択部と、
    前記多型マーカー選択部にて選択された多型マーカーを構成している塩基が、ホモ接合であるか判定するホモ接合判定部と、
    前記ホモ接合判定部にて判定の対象となった多型マーカーのうち、ホモ接合と判定された多型マーカーが連続する検体DNAの領域を示すホモ接合領域情報を取得するホモ接合領域情報取得部と、
    前記ホモ接合領域情報取得部にて取得されるホモ接合領域情報に含まれる多型マーカーの連続確率及び/又は連続距離が所定の同祖判定条件を満たした場合に、ホモ接合領域を同祖領域であると判定する同祖領域判定部と、
    を有する同祖領域判定装置。
  25. 前記多型マーカー選択部において、
    検体DNAの全染色体領域にわたって多型マーカーを選択する請求項24に記載の同祖領域判定装置。
  26. 前記多型マーカー選択部において、
    候補遺伝子領域とされた領域に含まれる多型マーカーを選択するステップである請求項24に記載の同祖領域判定装置。
  27. 前記検体DNAが植物由来のDNAである請求項23から26のいずれか一に記載の同祖領域判定装置。
  28. 前記検体DNAが動物由来のDNAである請求項23から26のいずれか一に記載の同祖領域判定装置。
  29. 前記検体DNAがヒト由来のDNAである請求項23から26のいずれか一に記載の同祖領域判定装置。
  30. 前記検体DNAが日本人由来のDNAである請求項23から26のいずれか一に記載の同祖領域判定装置。
  31. 前記多型マーカーは、SNPである請求項23から30のいずれか一に記載の同祖領域判定装置。
  32. 前記多型マーカーは、マイクロサテライトである請求項23から30のいずれか一に記載の同祖領域判定装置。
  33. 前記多型マーカーは、VNTRである請求項23から30のいずれか一に記載の同祖領域判定装置。
  34. 前記多型マーカーは、SNP、マイクロサテライト、VNTRのいずれか二以上の組み合わせである請求項23から30のいずれか一に記載の同祖領域判定装置。
  35. 前記多型マーカー選択部において、
    前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中で1万個以上のSNPを選択する請求項31に記載の同祖領域判定装置。
  36. 前記多型マーカー選択部において、
    前記検体DNAがヒト由来のDNAであり、検体DNAの全染色体領域中で10万個以上のSNPを選択する請求項31に記載の同祖領域判定装置。
  37. 前記同祖領域判定部において、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が1000万分の1から1万分の1の範囲から選択される値よりも小さいことである請求項23から36のいずれか一に記載の同祖領域判定装置。
  38. 前記同祖領域判定部において、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が500万分の1から5万分の1の範囲から選択される値よりも小さいことである請求項23から36のいずれか一に記載の同祖領域判定装置。
  39. 前記同祖領域判定部において、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から10万分の1の範囲から選択される値よりも小さいことである請求項23から36のいずれか一に記載の同祖領域判定装置。
  40. 前記同祖領域判定部において、
    前記所定の同祖判定条件は、ホモ接合領域情報で示される領域の多型マーカーのホモ接合が連続する確率が100万分の1から5000分の1の範囲から選択される値よりも小さいことである請求項23から36のいずれか一に記載の同祖領域判定装置。
  41. 前記同祖領域判定部にて所定の同祖判定条件を満たすと判定されたホモ接合領域を示す情報である同祖領域情報を視覚化して出力する同祖領域情報出力部をさらに有する請求項23から40のいずれか一に記載の同祖領域判定装置。
  42. 前記同祖領域判定部にて同祖領域であると判定された領域を示す同祖領域情報を複数の検体に対応して複数保持する同祖領域情報保持部と、
    前記同祖領域情報保持部にて保持された複数の検体の同祖領域情報に基づいて、特定の同祖領域が複数の検体間で重なる頻度を示す同祖領域重複頻度情報を取得する同祖領域重複頻度情報取得部と、
    をさらに有する請求項23から41のいずれか一に記載の同祖領域判定装置。
  43. 前記同祖領域重複頻度情報取得部にて取得された同祖領域重複頻度情報を視覚化した情報である同祖領域重複頻度視覚化情報を出力する同祖領域重複頻度視覚化情報出力部をさらに有する請求項42に記載の同祖領域判定装置。
  44. 前記同祖領域重複頻度取得部にて取得された重複頻度を同祖領域情報に対応付けて蓄積する同祖領域情報蓄積部と、
    前記同祖領域情報蓄積部に蓄積されている同祖領域情報のうち所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を取得する重要同祖領域情報取得部と、
    をさらに有する請求項42又は43に記載の同祖領域判定装置。
  45. 前記重要同祖領域情報取得部にて取得された所定の重複頻度以上である重複頻度と対応付けられている同祖領域情報を示す重要同祖領域情報を視覚化して出力する重要同祖領域情報出力部をさらに有する請求項44に記載の同祖領域判定装置。
  46. 請求項23から45のいずれか一に記載の同祖領域判定装置によって判定された同祖領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法。
  47. 請求項23から45のいずれか一に記載の同祖領域判定装置によって判定された同祖領域情報が、前記同祖領域情報蓄積部に蓄積されている同祖領域情報と重複している場合に、重複領域に含まれる遺伝子の配列を同定し、正常遺伝子の配列と比較する遺伝子スクリーニング方法。
  48. 請求項23から45のいずれか一に記載の同祖領域判定装置によって判定された同祖領域が、ホモ接合となることにより機能することがすでに既知である遺伝子の含まれうる領域であるか否かを判定し、既知である遺伝子が含まれうる領域である場合に、既知である遺伝子と検体DNAの該遺伝子の配列を比較する遺伝子スクリーニング方法。
  49. 前記検体DNAが疾患を有する検体のDNAであり、請求項23から45のいずれか一に記載の同祖領域判定装置によって判定された同祖領域が、該疾患に関係すると予想される遺伝子を含む場合に、前記検体DNAの同祖領域中の該遺伝子の配列を同定し、正常遺伝子と比較する、遺伝子スクリーニング方法。
JP2006554365A 2005-07-12 2006-07-07 ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法 Expired - Fee Related JP4059517B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005203654 2005-07-12
JP2005203654 2005-07-12
PCT/JP2006/313616 WO2007007691A1 (ja) 2005-07-12 2006-07-07 ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法

Publications (2)

Publication Number Publication Date
JP4059517B2 true JP4059517B2 (ja) 2008-03-12
JPWO2007007691A1 JPWO2007007691A1 (ja) 2009-01-29

Family

ID=37637084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006554365A Expired - Fee Related JP4059517B2 (ja) 2005-07-12 2006-07-07 ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法

Country Status (3)

Country Link
US (1) US20090155782A1 (ja)
JP (1) JP4059517B2 (ja)
WO (1) WO2007007691A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4941964B2 (ja) * 2006-08-07 2012-05-30 トミーデジタルバイオロジー株式会社 ホモ接合ハプロタイプ法
WO2009057757A1 (ja) * 2007-10-31 2009-05-07 National Institute Of Agrobiological Sciences 塩基配列決定プログラム、塩基配列決定装置および塩基配列決定方法
KR101325736B1 (ko) * 2010-10-27 2013-11-08 삼성에스디에스 주식회사 바이오 마커 추출 장치 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040161779A1 (en) * 2002-11-12 2004-08-19 Affymetrix, Inc. Methods, compositions and computer software products for interrogating sequence variations in functional genomic regions

Also Published As

Publication number Publication date
WO2007007691A1 (ja) 2007-01-18
US20090155782A1 (en) 2009-06-18
JPWO2007007691A1 (ja) 2009-01-29

Similar Documents

Publication Publication Date Title
Matthews et al. Improved reference genome of Aedes aegypti informs arbovirus vector control
McGuffin et al. Psychiatric genetics and genomics
Southard-Smith et al. The Sox10Dom mouse: modeling the genetic variation of Waardenburg-Shah (WS4) syndrome
JP5656678B2 (ja) イヌ科動物血統の同定のための方法および材料
Fritz et al. An initiator codon mutation in SDE2 causes recessive embryonic lethality in Holstein cattle
Chamberlain et al. Validation of single nucleotide polymorphisms associated with milk production traits in dairy cattle
Aardema et al. Global evaluation of taxonomic relationships and admixture within the Culex pipiens complex of mosquitoes
Knopp et al. Syndromic ciliopathies: from single gene to multi gene analysis by SNP arrays and next generation sequencing
Steffensen et al. FcγRIIIB polymorphism: evidence that NA1/NA2 and SH are located in two closely linked loci and that the SH allele is linked to the NA1 allele in the Danish population
Morgenthaler et al. A missense variant in the coil1A domain of the keratin 25 gene is associated with the dominant curly hair coat trait (Crd) in horse
Lopez et al. Genomic prediction based on SNP functional annotation using imputed whole-genome sequence data in Korean Hanwoo cattle
Kheirallah et al. Translating lung function genome-wide association study (GWAS) findings: new insights for lung biology
McWhirter et al. Genome-wide homozygosity and multiple sclerosis in Orkney and Shetland Islanders
Geremek et al. Sequence analysis of 21 genes located in the Kartagener syndrome linkage region on chromosome 15q
Skuder et al. A polymorphism in mitochondrial DNA associated with IQ?
Rahimmadar et al. Linkage disequilibrium and effective population size of buffalo populations of Iran, Turkey, Pakistan, and Egypt using a medium density SNP array
JP4059517B2 (ja) ホモ接合指紋法による同祖領域判定方法、同祖領域判定装置、及び遺伝子スクリーニング方法
Tsairidou et al. An analysis of effects of heterozygosity in dairy cattle for bovine tuberculosis resistance
Callaby et al. Genetic diversity of Cameroon cattle and a putative genomic map for resistance to bovine tuberculosis
Verardo et al. Genome-wide analyses reveal the genetic architecture and candidate genes of indicine, taurine, synthetic crossbreds, and locally adapted cattle in Brazil
Jónás et al. A preliminary study to investigate the genetic background of longevity based on whole-genome sequence data of two methuselah dogs
Chang et al. Epistasis among Drosophila persimilis factors conferring hybrid male sterility with D. pseudoobscura bogotana
Yang et al. Population genetics of marmosets in Asian primate research centers and loci associated with epileptic risk revealed by whole-genome sequencing
Tebbe et al. Intronic primers reveal unexpectedly high major histocompatibility complex diversity in Antarctic fur seals
JP4941964B2 (ja) ホモ接合ハプロタイプ法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131228

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070205

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20070205

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees