JP2007327743A - Method and system for analyzing gene copy - Google Patents

Method and system for analyzing gene copy Download PDF

Info

Publication number
JP2007327743A
JP2007327743A JP2004260328A JP2004260328A JP2007327743A JP 2007327743 A JP2007327743 A JP 2007327743A JP 2004260328 A JP2004260328 A JP 2004260328A JP 2004260328 A JP2004260328 A JP 2004260328A JP 2007327743 A JP2007327743 A JP 2007327743A
Authority
JP
Japan
Prior art keywords
correction
value
gene
gene copy
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004260328A
Other languages
Japanese (ja)
Inventor
Hiroyuki Yuya
浩幸 油谷
Kunihiro Nishimura
邦裕 西村
Shunpei Ishikawa
俊平 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Original Assignee
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC filed Critical University of Tokyo NUC
Priority to JP2004260328A priority Critical patent/JP2007327743A/en
Priority to PCT/JP2005/016451 priority patent/WO2006028152A1/en
Publication of JP2007327743A publication Critical patent/JP2007327743A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for correcting the amount of the genome DNA of a chromosome measured, using a probe complementary to genome DNA. <P>SOLUTION: The amount of genome DNA derived from an experiment is corrected, by using the correction tendency value related to a plurality of experimental processes in the measurement of the amount of the genome DNA of the chromosome and the correction factor calculated from the tendency value. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、遺伝子コピーの解析方法及び装置に関し、特に細胞の染色体のゲノムDNA量及びゲノムDNA量比の測定値の補正、染色体の遺伝子コピー数の同定、同補正及び検出方法によるハプロタイプの同定、並びに染色体の遺伝子欠損及び異常増幅に関する測定結果を視覚的に理解し易く表示する技術に係るものである。   The present invention relates to a gene copy analysis method and apparatus, and in particular, correction of measured values of genomic DNA amount and genomic DNA amount ratio of chromosomes of cells, identification of gene copy number of chromosomes, identification of haplotypes by the correction and detection method, In addition, the present invention relates to a technique for displaying the measurement results relating to chromosomal gene defects and abnormal amplification in an easily understandable manner.

近年、DNAマイクロアレイ技術は、主に癌診断を目的として、染色体の任意の部位でのゲノムDNA量を分析するのに広く利用されており、例えば非特許文献1、非特許文献2、非特許文献3、非特許文献4などに記載されている。
ここで、染色体のゲノムDNA量とは、染色体遺伝子のなかの特定部位のゲノムDNA量をいい、遺伝子コピー数に依存するものである。正常細胞では、通常ゲノムDNAは両親由来のアレルが1コピーずつで計2コピーであるが、癌などの疾患においてはゲノムのなかの、遺伝子コピー数の増減が認められる。
In recent years, DNA microarray technology has been widely used to analyze the amount of genomic DNA at an arbitrary site of a chromosome mainly for the purpose of cancer diagnosis. For example, Non-Patent Document 1, Non-Patent Document 2, Non-Patent Document 3, Non-Patent Document 4 and the like.
Here, the amount of genomic DNA of a chromosome refers to the amount of genomic DNA at a specific site in a chromosomal gene and depends on the number of gene copies. In normal cells, the genome DNA usually has two copies of alleles derived from the parents, for a total of 2 copies. In diseases such as cancer, the number of gene copies is increased or decreased in the genome.

正常細胞と疾患細胞における染色体のゲノムDNA量や遺伝子コピー数の検出には、BAC(Bacterial Artificial Chromosome)を利用したCGH(Comparative genome hybridization)マイクロアレイ法を始め、様々なマイクロアレイを用いた方法が開発されている(非特許文献1、非特許文献2、非特許文献3、非特許文献4)。癌などの疾患における染色体遺伝子に対する変異をより詳細に分析するには、染色体のアレルごとのゲノムDNA量の変化を検出しなければならない。
特に、LOH(loss of heterozygosity)の分析では、染色体のいずれのアレル、すなわち母方または父方由来のものであるかを理解することができる(非特許文献5、非特許文献6)。
さらに、染色体のゲノムDNA量の分析では、オリゴヌクレオチドを用いたゲノムタイピングマイクロアレイを利用した方法も報告されている(非特許文献7)。
Various methods using microarrays have been developed to detect the genomic DNA content and gene copy number of normal and diseased cells, including the CGA (Comparative genome hybridization) microarray method using BAC (Bacterial Artificial Chromosome). (Non-patent document 1, Non-patent document 2, Non-patent document 3, Non-patent document 4). In order to analyze mutations to chromosomal genes in diseases such as cancer in more detail, changes in the amount of genomic DNA for each allelic chromosome must be detected.
In particular, in the analysis of LOH (loss of heterozygosity), it is possible to understand which allele of the chromosome, that is, maternal or paternal origin (Non-patent Documents 5 and 6).
Furthermore, in the analysis of the amount of genomic DNA of a chromosome, a method using a genome typing microarray using an oligonucleotide has been reported (Non-patent Document 7).

しかしながら、従来の方法において、全ゲノムの一部をPCRで増幅したものを分析する工程(Representational analysis)は、多くの実験条件や個々の実験状況によって、無視できないノイズデータを含んでしまうという欠点がある。
したがって、染色体のゲノムDNA量や遺伝子コピー数の検出方法においては、より精度の高いデータを得るためにこれらのノイズデータの補正が必要となる。また、これまでの染色体のゲノムDNA量の検出方法において、染色体のアレルごとのゲノムDNA量を分析した報告はなく、アレルごとのゲノムDNA量や遺伝子コピー数を検出することで、より精度の高いデータが得られるとともに、当該データからハプロタイプの検出が可能となる。
However, in the conventional method, the process of analyzing a part of the whole genome amplified by PCR (Representational analysis) has the disadvantage that it contains noise data that cannot be ignored depending on many experimental conditions and individual experimental conditions. is there.
Therefore, in the method for detecting the amount of genomic DNA of a chromosome and the number of gene copies, it is necessary to correct these noise data in order to obtain more accurate data. In addition, there has been no report of analyzing the genomic DNA amount for each allele of the chromosome in the methods for detecting the genomic DNA amount of the chromosome so far, and more accurate by detecting the genomic DNA amount and the gene copy number for each allele. Data is obtained and haplotypes can be detected from the data.

Ishkanian,A.S. et al Nat Genet, 36, 299-303 (2004)Ishkanian, A.S. et al Nat Genet, 36, 299-303 (2004) Pinkel, D. et al. Nature Genetic 20, 207-211(1998)Pinkel, D. et al. Nature Genetic 20, 207-211 (1998) Pollack, J.R. et al Nature Genetic 23 ,41-46(1999)Pollack, J.R. et al Nature Genetic 23, 41-46 (1999) Lucito,R. et al. Genome Research 13, 2291-2305 (2003)Lucito, R. Et al. Genome Research 13, 2291-2305 (2003) Robinson, W.P. Bioessays. 22, 452-9 (2000)Robinson, W.P.Bioessays. 22, 452-9 (2000) Murthy, S.K. Mod Pathol. 15, 1241-50 (2002)Murthy, S.K.Mod Pathol. 15, 1241-50 (2002) Bignell, G.R. et al. Genome Resesrch 14, 287-295(2004)Bignell, G.R. et al. Genome Resesrch 14, 287-295 (2004) Kennedy, G.C. Nature Biotechnology 21, 1233-7(2003)Kennedy, G.C.Nature Biotechnology 21, 1233-7 (2003)

本発明は上記の背景技術に鑑みて創出されたものであり、染色体のゲノムDNA量やゲノムDNA量比に係る測定値を好適な方法により補正し、これらの精度を高めることを目的とし、ひいてはアレル毎のゲノムDNA量や遺伝子コピー数の同定、ハプロタイプの同定等の遺伝子コピー数の解析に寄与する技術を提供する。   The present invention was created in view of the above-mentioned background art, and aims to correct the measurement value related to the genomic DNA amount of the chromosome and the genomic DNA amount ratio by a suitable method, and to improve the accuracy thereof, and thus Provide technologies that contribute to the analysis of gene copy number, such as identification of genomic DNA amount and gene copy number for each allele, and identification of haplotypes.

本発明者は上記の課題を解決すべく鋭意研究を行った結果、マイクロアレイなどを利用した染色体のゲノムDNA量を測定する方法において、測定結果を不安定にする要因として、染色体の遺伝子を増幅する工程、増幅したPCR産物をアレイ上のプローブにハイブリダイゼーションを行う工程、及び蛍光シグナルをスキャニングする工程といった特定実験条件であることを見出した。
これらの実験条件に対する補正を行うことで、染色体のゲノムDNA量を測定する方法における補正方法を完成した。また、染色体のゲノムDNA量を補正することにより、当該測定結果を染色体の遺伝子コピー数に変換できることを見出した。本発明はこの知見を基にして完成されたものである。すなわち本発明は、以下のとおりである。
As a result of diligent research to solve the above problems, the present inventor amplifies a chromosomal gene as a factor that makes the measurement result unstable in a method for measuring the amount of genomic DNA of a chromosome using a microarray or the like. It was found that there were specific experimental conditions such as a step, a step of hybridizing the amplified PCR product to a probe on the array, and a step of scanning a fluorescent signal.
By correcting for these experimental conditions, a correction method for measuring the amount of genomic DNA of a chromosome was completed. Moreover, it discovered that the said measurement result can be converted into the gene copy number of a chromosome by correct | amending the amount of genomic DNA of a chromosome. The present invention has been completed based on this finding. That is, the present invention is as follows.

請求項1に記載の発明は、遺伝子コピーの解析方法において、染色体のゲノムDNA量(以下、ゲノムDNA量と呼ぶ。)、又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比(以下、ゲノムDNA量比と呼ぶ。)、のいずれかの値(以下、測定値と呼ぶ。)を補正する方法を提供する。該方法において、所定のゲノムDNA量、又はゲノムDNA量比を測定する測定値測定工程に続いて、補正傾向値算出手段により、各補正パラメータ値に対するゲノム量若しくはゲノム量比の測定値を座標系にプロットし、そのプロット値をスムージングすることにより、測定値に関する所定のパラメータに係る補正傾向値を算出する補正傾向値算出工程と、補正因子算出手段により、補正傾向値から補正因子を算出する補正因子算出工程と、測定値補正演算手段により、測定値を当該補正因子で補正演算する測定値補正演算工程とを含むことを特徴とする。   The invention according to claim 1 is the gene copy analysis method, wherein the genomic DNA amount of the chromosome (hereinafter referred to as the genomic DNA amount) or the ratio of the genomic DNA amount of the chromosomes of two different or identical cells (hereinafter referred to as the genomic DNA amount). ), And a method for correcting any of the values (hereinafter referred to as measured values). In the method, following the measurement value measurement step of measuring a predetermined genomic DNA amount or genomic DNA amount ratio, a correction tendency value calculation means calculates a measurement value of the genomic amount or genome amount ratio for each correction parameter value in a coordinate system. A correction tendency value calculation step for calculating a correction tendency value related to a predetermined parameter relating to the measured value by smoothing the plot value and a correction factor calculation means for calculating the correction factor from the correction tendency value The method includes a factor calculation step and a measurement value correction calculation step of correcting the measurement value with the correction factor by the measurement value correction calculation means.

請求項2に記載の発明は、前記測定値が、ゲノムDNAに相補的なプローブ(以下、プローブと呼ぶ)を用いて測定されたゲノムDNA量、又はゲノムDNA量比であって、補正因子算出工程において、補正傾向値から各補正基準値における補正因子を算出することを特徴とするものである。補正基準値とは、各補正パラメータ値のうち、任意のプローブに対応する各補正パラメータ値をいい、同補正基準値での補正傾向値から補正因子を算出することができる。補正因子とは、測定されたゲノムDNA量のデータを補正するための値である。   According to the second aspect of the present invention, the measured value is a genomic DNA amount or a genomic DNA amount ratio measured using a probe complementary to genomic DNA (hereinafter referred to as a probe), and a correction factor is calculated. In the process, a correction factor for each correction reference value is calculated from the correction tendency value. The correction reference value means each correction parameter value corresponding to an arbitrary probe among the correction parameter values, and the correction factor can be calculated from the correction tendency value at the correction reference value. The correction factor is a value for correcting the measured genomic DNA amount data.

請求項3に記載の発明は、遺伝子コピーの解析方法における前記補正傾向値算出工程において、染色体の遺伝子を特定の制限酵素で切断した各々の遺伝子断片の長さに対する測定値を座標系に各補正パラメータ値に対してプロットして、そのプロット値をスムージングすることによって、遺伝子断片の長さに係る補正傾向値を算出することを特徴とするものである。   According to the third aspect of the present invention, in the correction tendency value calculating step in the gene copy analysis method, the measurement value for the length of each gene fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme is used for each correction in the coordinate system. The correction tendency value related to the length of the gene fragment is calculated by plotting the parameter value and smoothing the plotted value.

請求項4に記載の発明は、前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、染色体の遺伝子を特定の制限酵素で切断した各々の遺伝子断片に含まれるG及びC塩基の比率に対する測定値を座標系に各補正パラメータ値に対してプロットして、そのプロット値をスムージングすることによって、GC塩基含有率に係る補正傾向値を算出することを特徴とする。   The invention according to claim 4 is a method for measuring the ratio of G and C bases contained in each gene fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme in the correction tendency value calculating step in the gene copy analysis method. The correction tendency value related to the GC base content is calculated by plotting the value with respect to each correction parameter value in the coordinate system and smoothing the plotted value.

請求項5に記載の発明は、前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、染色体の遺伝子を特定の制限酵素で切断した各々の遺伝断片に対して、連続する20塩基乃至220塩基の範囲から選ばれる特定の長さを有する固定枠を前記遺伝子の端から1塩基ごとに移動させながら得られる、当該固定枠に対応する遺伝子断片に含まれるG及びC塩基の比率の最大値に対する測定値を座標系に各補正パラメータ値に対してプロットして、そのプロット値をスムージングすることによって、当該固定枠のGC塩基含有率に係る補正傾向値を算出することを特徴とするものである。   In the invention according to claim 5, in the correction tendency value calculation step in the gene copy analysis method, 20 to 220 bases continuous for each genetic fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme With respect to the maximum value of the ratio of G and C bases contained in the gene fragment corresponding to the fixed frame, obtained by moving a fixed frame having a specific length selected from the range of the gene by one base from the end of the gene. By plotting the measured value against each correction parameter value in the coordinate system and smoothing the plotted value, the correction tendency value related to the GC base content of the fixed frame is calculated. .

請求項6に記載の発明は、前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、プローブの塩基配列の有するハイブリダイゼーション・フリーエネルギーに対する測定値を座標系に各補正パラメータ値に対してプロットして、そのプロット値をスムージングすることによって、ハイブリダイゼーションに係る補正傾向値を算出することを特徴とするものである。   According to the sixth aspect of the present invention, in the correction tendency value calculating step in the gene copy analysis method, the measurement value for the hybridization free energy of the probe base sequence is plotted against each correction parameter value in the coordinate system. Then, the correction tendency value related to hybridization is calculated by smoothing the plot value.

請求項7に記載の発明は、前記遺伝子コピーの解析方法において、前記補正傾向値算出工程において、各々の染色体の特定部位を検出する完全に相補的なゲノムDNAに相補的なプローブセットのシグナル強度の中間値に対する測定値を座標系に各補正パラメータ値に対してプロットして、そのプロット値をスムージングすることによって、対照サンプルのシグナル強度に係る補正傾向値を算出することを特徴とする。   The invention according to claim 7 is characterized in that, in the gene copy analysis method, the signal intensity of a probe set complementary to a completely complementary genomic DNA for detecting a specific site of each chromosome in the correction tendency value calculation step. The correction tendency value related to the signal intensity of the control sample is calculated by plotting the measured value with respect to the intermediate value of each of the correction parameter values in the coordinate system with respect to each correction parameter value and smoothing the plotted value.

請求項8に記載の発明は、前記遺伝子コピーの解析方法において、前記補正傾向値算出工程が、最小二乗平均法を用いて各プロットの平均曲線を求め、当該平均曲線について、多項式を用いて近似することにより、各補正傾向値を算出する工程を含むことを特徴とする。   The invention according to claim 8 is characterized in that, in the gene copy analysis method, the correction tendency value calculating step obtains an average curve of each plot using a least mean square method, and the average curve is approximated using a polynomial. Thus, the method includes a step of calculating each correction tendency value.

請求項9に記載の発明は、前記遺伝子コピーの解析方法における前記補正因子算出工程が、前記各補正傾向値から対応する各プローブにおける補正因子を算出する方法が、下記式に基づいて算出される工程を含むことを特徴とする。
(式)補正因子 = A+ Σ(BkXk+CkXk 2+DkXk 3・・・)
ここで、上記多項式は3次項まで記載しているが、1次項(BkXk)以上の任意の項数が利用でき、たとえば補正因子=A+ΣBkXkでもよい。また、式中
のA〜D・・は平均曲線の係数(補正傾向)値、Xkはk=1〜5がそれぞれ請求項3ないし7に係る補正パラメータ値である。
In the invention according to claim 9, the correction factor calculation step in the gene copy analysis method calculates a correction factor for each probe corresponding to each correction tendency value based on the following equation: Including a process.
(Formula) Correction factor = A + Σ (B k X k + C k X k 2 + D k X k 3 ...)
Here, although the polynomial is described up to the third-order term, any number of terms equal to or higher than the first-order term (B k X k ) can be used. For example, the correction factor = A + ΣB k X k may be used. In the equations, A to D... Are average curve coefficient (correction tendency) values, and X k is a correction parameter value according to claims 3 to 7 where k = 1 to 5, respectively.

請求項10に記載の発明は、遺伝子コピーの解析方法において、染色体の遺伝子コピー数を同定する方法が、請求項1ないし9に係る測定値の補正演算結果値を用い、プロット手段により、物理的な順で並べた染色体の位置に対する補正演算結果値を座標系にプロットした場合に階段状に示されるデータを、抽出手段が抽出する工程、遺伝子コピー数同定手段が、該補正演算結果値が同一階位に属する2以上の連続する染色体の位置における当該補正演算結果値の平均値が最低である領域を遺伝子コピー数0の領域とする工程、遺伝子コピー数同定手段が、前記平均値の次に低い領域を遺伝子コピー数1の領域とする工程を含み、染色体の遺伝子コピー数を同定することを特徴とする遺伝子コピーの解析方法を提供する。   The invention according to claim 10 is characterized in that, in the gene copy analysis method, the method of identifying the gene copy number of the chromosome uses the correction calculation result value of the measurement value according to claims 1 to 9, and the plot means When the correction calculation result values for the chromosome positions arranged in the correct order are plotted on the coordinate system, the step of extracting the data shown in a step shape, the gene copy number identification means has the same correction calculation result value A step of setting a region having the lowest average value of the correction calculation result values at the positions of two or more consecutive chromosomes belonging to the rank as a region having a gene copy number of 0; The present invention provides a method for analyzing gene copies, comprising the step of setting a low region as a region having a gene copy number of 1, and identifying the gene copy number of a chromosome.

請求項11に記載の発明は、前記遺伝子コピーの解析方法における染色体の遺伝子コピー数を同定した結果を表示する方法が、画像処理手段により、第1染色体から第22染色体、X染色体及びY染色体の全部又はその一部について染色体形状様の再現画像を画像表示手段に表示すると共に、該再現画像上に、染色体の遺伝子コピー数が増減している領域を対応づけて視覚的に遺伝子コピー数が当該領域で増減していることを表示することを特徴とする。   The invention according to claim 11 is the method of displaying the result of identifying the gene copy number of the chromosome in the gene copy analysis method, wherein the image processing means uses the chromosome 1 to chromosome 22, X chromosome and Y chromosome. A reproduction image of the chromosome shape is displayed on the image display means for all or a part thereof, and the gene copy number is visually associated with the region where the gene copy number of the chromosome is increased or decreased on the reproduction image. It is characterized by displaying that the area is increasing or decreasing.

請求項12に記載の発明は、前記遺伝子コピーの解析方法において、ハプロタイプを同定する方法が、請求項1ないし9に係る測定値の補正演算結果値を用い、プロット手段により、物理的な順で並べた染色体の位置に対する補正演算結果値を座標系にプロットした場合に階段状に示されるデータを、抽出手段が抽出する工程、ハプロタイプ同定手段が、該補正演算結果値が同一階位に属する2以上の連続する複数の染色体の位置をハプロタイプと同定する工程を含みハプロタイプを同定することを特徴とする。   According to the twelfth aspect of the present invention, in the gene copy analysis method, the haplotype identifying method uses the correction calculation result value of the measurement value according to any one of the first to ninth aspects, and in a physical order by a plotting means. The step of extracting the data shown in a staircase pattern when the correction calculation result values for the positions of the arranged chromosomes are plotted on the coordinate system, the haplotype identification means, the correction calculation result values belong to the same rank 2 The method includes the step of identifying the position of a plurality of consecutive chromosomes as a haplotype, and identifying the haplotype.

請求項13に記載の発明は、前記遺伝子コピーの解析方法におけるハプロタイプを同定した結果を表示する方法が、画像処理手段により、第1染色体から第22染色体、X染色体及びY染色体の全部又はその一部について染色体形状様の再現画像を画像表示手段に表示すると共に、該再現画像上に、特定のハプロタイプが存する領域を対応づけて視覚的に当該特定ハプロタイプが当該領域に存することを表示することを特徴とするものである。   In the invention according to claim 13, the method for displaying the result of identifying the haplotype in the gene copy analysis method is that the image processing means uses the first to the 22nd chromosomes, the X chromosome and the Y chromosome all or one of them. Displaying a chromosome shape-like reproduction image on the image display means, and visually displaying that the specific haplotype exists in the region by associating the region where the specific haplotype exists on the reproduction image. It is a feature.

請求項14に記載の発明は、前記遺伝子コピーの解析方法における測定値測定工程において、プローブがSNPsを識別することができるゲノムタイピングマイクロアレイであり、染色体アレルごとに染色体のゲノムDNA量を測定することを特徴とする。   The invention according to claim 14 is a genome typing microarray in which the probe can identify SNPs in the measurement value measurement step in the gene copy analysis method, and measuring the amount of genomic DNA of a chromosome for each chromosome allele It is characterized by.

請求項15に記載の発明は、前記遺伝子コピーの解析方法において、前記測定値が、遺伝子を増幅することにより測定されたゲノムDNA量であって、補正因子算出工程において、複数のパラメータに係る補正傾向値がある場合にはこれらを合算して補正因子を算出することを特徴とする。   The invention according to claim 15 is the gene copy analysis method, wherein the measurement value is an amount of genomic DNA measured by amplifying the gene, and the correction factor calculation step includes corrections related to a plurality of parameters. If there are trend values, the correction factors are calculated by adding them together.

請求項16に記載の発明は、染色体のゲノムDNA量、又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比のいずれかの値(以下、測定値と呼ぶ。)を測定した結果を入力する入力手段と、該測定値を各補正パラメータ値に対して、座標系にプロットし、そのプロット値をスムージングすることにより、所定のパラメータに係る補正傾向値を算出する補正傾向値算出手段と、補正傾向値から補正因子を算出する補正因子算出手段と、測定値を当該補正因子で補正演算する測定値補正演算手段とを備えることにより、測定値を補正する遺伝子コピーの解析装置を提供する。     In the invention according to claim 16, the result of measuring either the value of the genomic DNA amount of a chromosome or the ratio of the genomic DNA amounts of chromosomes of two different or identical cells (hereinafter referred to as a measured value). An input means for inputting; a correction tendency value calculating means for calculating a correction tendency value relating to a predetermined parameter by plotting the measured value in a coordinate system with respect to each correction parameter value and smoothing the plotted value; The present invention provides a gene copy analyzing apparatus that corrects a measured value by including a correction factor calculating means for calculating a correction factor from the correction tendency value and a measured value correction calculating means for correcting the measured value with the correction factor. .

本発明は遺伝子コピーの解析装置を提供することもできる。すなわち、請求項16に記載の発明は、遺伝子コピーの解析装置であって、染色体のゲノムDNA量、又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比、のいずれかの値(以下、測定値と呼ぶ。)を測定した結果を入力する入力手段と、該測定値を座標系にプロットし、そのプロット値をスムージングすることにより、所定のパラメータに係る補正傾向値を算出する補正傾向値算出手段と、補正傾向値から補正因子を算出する補正因子算出手段と、測定値を当該補正因子で補正演算する測定値補正演算手段とを備えることにより、測定値を補正することを特徴とする。   The present invention can also provide an apparatus for analyzing gene copies. That is, the invention according to claim 16 is a gene copy analyzing apparatus, which is one of the values of the genomic DNA amount of a chromosome or the ratio of the genomic DNA amounts of chromosomes of two different or identical cells (hereinafter referred to as the following). A correction tendency for calculating a correction tendency value according to a predetermined parameter by plotting the measurement value in a coordinate system and smoothing the plot value. A correction factor calculation unit that calculates a correction factor from a correction tendency value, and a measurement value correction calculation unit that corrects the measurement value with the correction factor, thereby correcting the measurement value; To do.

本発明により、遺伝子コピーの解析方法、特にマイクロアレイなどを利用した染色体のゲノムDNA量を測定する方法における測定結果の補正方法、当該補正処理後の測定結果により染色体の遺伝子コピー数を検出方法、及び染色体の遺伝子の欠損または異常増幅を視覚的に理解され易く表示する方法が提供される。
本発明に係る補正方法は、マイクロアレイなどを利用した染色体のゲノムDNA量の測定結果のバイアスを著しく減少させ、測定結果の安定性・信頼性を増すことを示す。
また、当該補正方法による染色体のゲノムDNA量を、遺伝子コピー数に変換することにより、初めて染色体の遺伝子コピー数の絶対値を検出できることが示された。当該補正方法による結果から、ハプロタイプの新しい同定方法をも提供することができる。
さらに、本発明の表示方法を提供することで、それぞれの染色体上における特定の遺伝子の欠損及び異常増幅を、視覚的に理解し易いように伝えることができる。
According to the present invention, a method for correcting a measurement result in a method for analyzing a gene copy, particularly a method for measuring the genomic DNA amount of a chromosome using a microarray, a method for detecting a gene copy number of a chromosome from the measurement result after the correction process, and A method is provided for displaying chromosomal gene defects or abnormal amplification in a visually comprehensible manner.
The correction method according to the present invention shows that the bias of the measurement result of the genomic DNA amount of the chromosome using a microarray or the like is remarkably reduced, and the stability and reliability of the measurement result is increased.
It was also shown that the absolute value of the chromosome gene copy number can be detected for the first time by converting the genomic DNA amount of the chromosome by the correction method into the gene copy number. From the result of the correction method, a new method for identifying a haplotype can also be provided.
Furthermore, by providing the display method of the present invention, it is possible to convey the deficiency and abnormal amplification of a specific gene on each chromosome so that it can be easily understood visually.

以下、本発明を詳細に説明する。図1は本発明による遺伝子コピーの解析方法のうち、染色体のゲノムDNA量又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比を補正する方法についての処理図である。また、図2は本発明に係る遺伝子コピーの解析装置(1)の構成図である。本装置(1)は汎用のパーソナルコンピュータ等によって実現されるものであり、中央演算処理装置(CPU)(2)と連動動作するメモリ(3)、ハードディスク(4)、表示画面を備えた表示装置(5)等から成る。   Hereinafter, the present invention will be described in detail. FIG. 1 is a processing diagram of a method for correcting the genomic DNA amount of a chromosome or the ratio of genomic DNA amounts of chromosomes of two different or identical cells in the gene copy analysis method according to the present invention. FIG. 2 is a block diagram of the gene copy analysis apparatus (1) according to the present invention. The device (1) is realized by a general-purpose personal computer or the like, and includes a memory (3), a hard disk (4), and a display screen that operate in conjunction with a central processing unit (CPU) (2). (5) etc.

1.マイクロアレイを用いた染色体のゲノムDNA量の測定(測定値測定工程)
最初に、本装置(1)に入力するためのゲノムDNA量の測定を行う。マイクロアレイを用いた染色体のゲノムDNA量の測定について説明する。第一に、サンプルの調整方法について説明するが、以下の方法や手順、材料や容量などは特に限定されるものではない。
まず、任意の細胞や組織から染色体遺伝子を抽出する。染色体遺伝子の抽出方法は、細胞抽出液をタンパク質分解酵素で処理して、細胞内のタンパク質や染色体を構成するタンパク質を分解した後に、フェノール・クロロホルム処理をして、タンパク質を分離し、水層にある部分(DNAを含む部分)を取り出すことが挙げられる。次いで、抽出された染色体遺伝子を任意の制限酵素で切断する。制限酵素の処理方法は、特に限定されないが、ここでは、染色体遺伝子を制限酵素XbaIで切断した。
1. Measurement of genomic DNA content of chromosomes using microarray (measurement value measurement process)
First, the amount of genomic DNA to be input to the device (1) is measured. The measurement of the genomic DNA amount of a chromosome using a microarray will be described. First, a sample adjustment method will be described, but the following methods, procedures, materials, capacities, and the like are not particularly limited.
First, a chromosomal gene is extracted from an arbitrary cell or tissue. The chromosomal gene extraction method involves treating the cell extract with a proteolytic enzyme, decomposing the proteins in the cells and the chromosome, and then treating them with phenol / chloroform to separate the proteins into the aqueous layer. Take out a certain part (part containing DNA). Next, the extracted chromosomal gene is cleaved with an arbitrary restriction enzyme. The method for treating the restriction enzyme is not particularly limited, but here, the chromosomal gene was cleaved with the restriction enzyme XbaI.

次いで、制限酵素XbaIで切断された遺伝子フラグメント(断片)のそれぞれに対して、アダプター分子を結合させる。アダプター分子は、制限酵素の切断部位を含み、さらに任意の遺伝子配列を有するオリゴヌクレオチドである。このアダプター分子と遺伝子フラグメントのLigation反応を行い、遺伝子フラグメントにアダプター分子を結合させる。次いで、アダプター分子に対応する特異的なプライマーを使用して、PCR法により遺伝子を増幅させる。PCR反応で増幅した遺伝子断片は、全ゲノムDNAの約2%程度の遺伝子に対応する。前記のPCR法で増幅した遺伝子フラグメントの量は、ゲノムDNAの遺伝子コピー数に応じて変化する。PCR法で増殖するゲノムDNAの遺伝子コピー数が多ければ、それに応じて増幅された遺伝子フラグメントの量も多くなる。   Next, an adapter molecule is bound to each gene fragment (fragment) cleaved with the restriction enzyme XbaI. The adapter molecule is an oligonucleotide containing a restriction enzyme cleavage site and further having an arbitrary gene sequence. Ligation reaction between the adapter molecule and the gene fragment is performed, and the adapter molecule is bound to the gene fragment. The gene is then amplified by PCR using specific primers corresponding to the adapter molecule. Gene fragments amplified by the PCR reaction correspond to about 2% of the total genomic DNA. The amount of gene fragment amplified by the PCR method varies depending on the number of gene copies of genomic DNA. If the number of gene copies of genomic DNA grown by the PCR method is large, the amount of gene fragments amplified accordingly increases.

次いで、PCRで増幅した遺伝子フラグメントに対して、蛍光ラベルを行う。蛍光ラベルに用いる蛍光物質は特に限定されず、また蛍光ラベルの代わりに放射性物質でラベルすることなどが挙げられる。 Next, a fluorescent label is applied to the gene fragment amplified by PCR. The fluorescent substance used for the fluorescent label is not particularly limited, and examples include labeling with a radioactive substance instead of the fluorescent label.

第二に、蛍光ラベルしたPCR産物と、オリゴヌクレオチドのプローブからなるアレイとハイブリダイゼーションを行う。オリゴヌクレオチドマイクロアレイは、特に種類は限定されない。ゲノムタイピングすることができるアレイを利用した場合には、染色体のアレルごとに分けて、染色体遺伝子の欠損や異常増幅を検出することができる。さらに、特定のアレルが父方又は母方由来であるかの情報を考慮することで、染色体遺伝子の欠損等がいずれの由来のものであるかを検出することができる。プローブごとのシグナル強度を定量的に測定することで、特定のプローブに対応する遺伝子領域のゲノムDNA量を検出することができる。   Second, hybridization is performed with an array of fluorescently labeled PCR products and oligonucleotide probes. The type of the oligonucleotide microarray is not particularly limited. When an array capable of genome typing is used, chromosomal gene defects and abnormal amplification can be detected separately for each chromosome allele. Furthermore, by considering information on whether a specific allele is derived from a paternal or maternal, it is possible to detect from which origin a chromosomal gene defect or the like originates. By quantitatively measuring the signal intensity for each probe, the amount of genomic DNA in the gene region corresponding to the specific probe can be detected.

また、特定の遺伝子のみのゲノムDNA量を測定する場合には、アダプター分子の代わりに測定したい遺伝子に対する特異的なプライマー遺伝子を用いて、PCR法などで増幅させてもよく、RT−PCR法やLAMP法など特定遺伝子を増幅し、この遺伝子産物の量を定量的に測定することで、染色体のゲノムDNA量を測定する方法も挙げられる。この場合には、以下で述べるプローブとのハイブリダイゼーションの工程を必要としない。   In addition, when measuring the amount of genomic DNA of only a specific gene, it may be amplified by PCR or the like using a specific primer gene for the gene to be measured instead of the adapter molecule, such as RT-PCR or There is also a method of measuring the amount of genomic DNA of a chromosome by amplifying a specific gene such as LAMP method and quantitatively measuring the amount of this gene product. In this case, the step of hybridization with the probe described below is not required.

測定値としては、ゲノムDNA量でもよいし、2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比(ゲノムDNA量比)でもよい。ゲノムDNA量比もそれぞれのゲノムDNA量は上記と同様の方法により測定を行う。以下、ゲノムDNA量比を中心に説述するが、ゲノムDNA量についても同様に本発明を適用することができる。   The measured value may be the amount of genomic DNA or the ratio of the genomic DNA amounts of two or different cells in the same cell (genomic DNA amount ratio). The genomic DNA content ratio is also measured by the same method as described above. Hereinafter, the description will focus on the genomic DNA amount ratio, but the present invention can be similarly applied to the genomic DNA amount.

2.測定値を補正する方法(補正傾向値の算出工程)
本願発明は、染色体ゲノムDNA量を求める測定工程で生じるバイアスの傾向を数値化した補正因子を利用して、得られた測定値の生データ(一次データ)におけるバイアスを減少させる補正方法を提供する。すなわち、同補正方法は、染色体のゲノムDNA量又はゲノムDNA量比を求める測定工程における各種の測定条件または測定結果を用いる。補正は、各染色体位置に対するプローブごとのデータ値で行う。
2. Method to correct the measured value (correction tendency value calculation process)
The present invention provides a correction method for reducing the bias in the raw data (primary data) of the obtained measurement value by using a correction factor obtained by quantifying the bias tendency generated in the measurement process for determining the amount of chromosomal genomic DNA. . That is, the correction method uses various measurement conditions or measurement results in the measurement process for determining the genomic DNA amount or genomic DNA amount ratio of a chromosome. Correction is performed with the data value for each probe for each chromosome position.

一次データは真に染色体のゲノムDNA量を反映させる成分と、PCR工程など測定条件で影響されるノイズ成分とから成るが、本補正方法では、このノイズ成分を除去することを特徴とする。ノイズ成分の除去は、一次データを「補正基準値」及び「補正傾向値」から計算された「補正因子」で除する、又は一次データから「ノイズ成分」を減じることなどが挙げられる。   The primary data consists of a component that truly reflects the amount of genomic DNA of the chromosome and a noise component that is affected by the measurement conditions such as the PCR process. This correction method is characterized by removing this noise component. The removal of the noise component includes dividing the primary data by the “correction factor” calculated from the “correction reference value” and the “correction tendency value”, or subtracting the “noise component” from the primary data.

また、補正因子やノイズ成分は、以下に説明する5つの補正パラメータに係る「補正基準値」及び「補正傾向値」の全部または一部を用いて算出することが挙げられる。「補正傾向値」については、ゲノムDNA量の測定値に関する所定のパラメータに係る補正傾向値をいい、各補正パラメータにおける測定値を座標系にプロットし、そのプロット値から平均化曲線にスムージングさせ、その平均化曲線の係数から求めることが挙げられる。「補正傾向値」は、なるべく広範囲な染色体の部位を測定できる複数のプローブから求めることが望ましい(図3などを参照)。   In addition, the correction factor and the noise component may be calculated using all or a part of “correction reference value” and “correction tendency value” related to five correction parameters described below. “Correction tendency value” refers to a correction tendency value relating to a predetermined parameter relating to a measurement value of the genomic DNA amount, plots the measurement value in each correction parameter in a coordinate system, and smoothes the average value from the plotted value. Obtaining from the coefficient of the average curve. It is desirable to obtain the “correction tendency value” from a plurality of probes that can measure as many chromosomal sites as possible (see FIG. 3 and the like).

「補正基準値」とは、各補正パラメータ値のうち、任意のプローブに対応する各補正パラメータ値をいい、同補正基準値での補正傾向値から補正因子を算出することができる。「補正因子」とは、測定されたゲノムDNA量のデータを補正するための値であり、補正パラメータの1または1以上から算出することのできる、プローブごとに対応する値である。 The “correction reference value” means each correction parameter value corresponding to an arbitrary probe among the correction parameter values, and the correction factor can be calculated from the correction tendency value at the correction reference value. The “correction factor” is a value for correcting the data of the measured genomic DNA amount, and is a value corresponding to each probe that can be calculated from one or more correction parameters.

ここで補正傾向値は、一次データを最小二乗平均法(least square method)やその他の平均化曲線を求める周知の方法で同曲線にスムージングさせ、その曲線を任意の関数(多項式(polynomial approximation)に当てはめることで求める。平均化曲線へのスムージング時には、一次データの異常値(他の一次データと比して平均化曲線から特に離れているもの)を除外して求めてもよい。   Here, the correction trend value is obtained by smoothing the first-order data into the same curve using a least square method or other known method for obtaining an average curve, and converting the curve into an arbitrary function (polynomial approximation). At the time of smoothing to the average curve, it may be determined by excluding abnormal values of primary data (particularly far from the average curve compared to other primary data).

バイアスを生じさせる「補正パラメータ」とは以下の5つである。ここで、バイアスとは、測定値に「バラツキ」や「ゆらぎ」を生じさせ、測定値を不安定にするものをいう。第1のパラメータはXbaIで切断した遺伝子断片の長さである。本実施工程では、まず細胞の染色体を抽出・精製した後に制限酵素XbaIで染色体を切断するが、その際に切断された遺伝子断片の長さをいう。ここで、代表的な制限酵素としてXbaIを挙げたが、BamI、XhoIなど制限酵素の種類は制限されない。同パラメータは、PCR法で遺伝子を増幅する過程でバイアスを生じさせるものであると予想される。   The “correction parameters” causing the bias are the following five. Here, the bias means that the measurement value becomes unstable by causing “variation” or “fluctuation” in the measurement value. The first parameter is the length of the gene fragment cut with XbaI. In this implementation step, the chromosome of the cell is first extracted and purified, and then the chromosome is cleaved with the restriction enzyme XbaI. The length of the gene fragment cleaved at that time is referred to. Here, although XbaI was mentioned as a typical restriction enzyme, the types of restriction enzymes such as BamI and XhoI are not limited. This parameter is expected to cause a bias in the process of amplifying genes by PCR.

これを示す例として、図3又は図4を示す。これらは、遺伝子断片の長さに対するシグナル強度比を示したグラフである。遺伝子断片は、染色体遺伝子を制限酵素XbaIで切断したそれぞれの遺伝子断片である。図3の縦軸は、シグナル強度比を示し、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量の比である。横軸は、遺伝子断片の長さを示す。図4は、同一のH1437細胞から得たものを用いている。測定値は、同一の細胞を別々に実験したデータを比較した。シグナル強度比は、H1437細胞の遺伝子増幅量/H1437細胞の遺伝子増幅量である。横軸は、制限酵素で切断した遺伝子断片の長さを示し、縦軸は、シグナル強度比を示している。   As an example showing this, FIG. 3 or FIG. 4 is shown. These are graphs showing the ratio of signal intensity to the length of the gene fragment. The gene fragment is a gene fragment obtained by cleaving a chromosomal gene with a restriction enzyme XbaI. The vertical axis in FIG. 3 represents the signal intensity ratio, which is the ratio of the gene amplification amount of the Down syndrome chromosome / the gene amplification amount of the healthy human chromosome. The horizontal axis indicates the length of the gene fragment. FIG. 4 uses those obtained from the same H1437 cells. The measured value compared the data which experimented the same cell separately. The signal intensity ratio is the amount of gene amplification of H1437 cells / the amount of gene amplification of H1437 cells. The horizontal axis indicates the length of the gene fragment cut with the restriction enzyme, and the vertical axis indicates the signal intensity ratio.

図3又は図4の座標系の各プロット値から平均化曲線にスムージングさせ、遺伝子断片の長さに係る平均化曲線の係数から求めることが挙げられる。ここでの「補正基準値」は、横軸の各遺伝子断片の長さをいい、この補正基準値及び補正傾向値から任意の遺伝子断片に係る補正因子データを導出することができる。 For example, smoothing may be performed from each plot value in the coordinate system of FIG. 3 or FIG. 4 to an average curve, and the coefficient obtained from the average curve related to the length of the gene fragment. The “correction reference value” herein refers to the length of each gene fragment on the horizontal axis, and correction factor data relating to an arbitrary gene fragment can be derived from the correction reference value and the correction tendency value.

遺伝子断片の長さによるバイアスは、固定的なバイアス値が見られるものとして、補正因子を固定値としてもよいし、また実験ごとにバイアス値が変動するものとして、個々にバイアス値を測定して決定してもよい。ここで、同バイアスは、遺伝子断片の長さに完全に依存するものでなく、僅かに他の理由に起因するバイアスも含まれると考えられるからである。   The bias due to the length of the gene fragment may be a fixed bias value, the correction factor may be a fixed value, or the bias value may vary from experiment to experiment. You may decide. This is because the bias does not completely depend on the length of the gene fragment, and it is considered that a bias due to other reasons is also included.

第2のパラメータは、前記制限酵素で切断された遺伝子断片に含まれるGC塩基対含有量の比率(%)である。上記第1のパラメータにいう制限酵素で切断した遺伝子断片の塩基数を、当該遺伝子断片に含まれるGCの塩基対ペア数で除して、100を乗じることで算出する。遺伝子断片は2本鎖となっているので、どちらかの遺伝子鎖に注目して、塩基G(グアニン)及び塩基C(シトシン)の数を算出してもよいし、逆に塩基A(アデニン)及び塩基T(チミン)の数を算出から、遺伝子断片全体の塩基数からACの塩基数を減じて求めてもよい。   The second parameter is the ratio (%) of the GC base pair content contained in the gene fragment cleaved with the restriction enzyme. The number of bases of the gene fragment cleaved with the restriction enzyme referred to in the first parameter is divided by the number of GC base pair pairs contained in the gene fragment and multiplied by 100. Since the gene fragment is double-stranded, paying attention to either gene chain, the number of base G (guanine) and base C (cytosine) may be calculated, or conversely, base A (adenine) Alternatively, the number of bases T (thymine) may be calculated, and the number of bases of AC may be subtracted from the number of bases of the entire gene fragment.

これを示す例として、図5及び図6を示す。図5は制限酵素XbaIで切断した遺伝子フラグメントにおけるGC含有量とシグナル強度比の関係を示したグラフである。シグナル強度比は、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。横軸は、遺伝子断片におけるGC塩基含有量を示し、縦軸は、シグナル強度比を示している。また、図6は、同一のH1437細胞の染色体のゲノムDNA量を示すグラフである。測定値は、同一の細胞を別々に実験したデータを比較して得た。シグナル強度比は、H1437細胞の遺伝子増幅量/H1437細胞の遺伝子増幅量である。横軸は、染色体位置に対するプローブの一部を示し、縦軸は、シグナル強度比を示している。   As an example showing this, FIG. 5 and FIG. 6 are shown. FIG. 5 is a graph showing the relationship between the GC content and the signal intensity ratio in a gene fragment cleaved with the restriction enzyme XbaI. The signal intensity ratio is the amount of gene amplification of the chromosome of Down syndrome / the amount of gene amplification of the chromosome of a healthy person. The horizontal axis represents the GC base content in the gene fragment, and the vertical axis represents the signal intensity ratio. FIG. 6 is a graph showing the genomic DNA amount of the chromosome of the same H1437 cell. The measured value was obtained by comparing data obtained by experimenting the same cell separately. The signal intensity ratio is the amount of gene amplification of H1437 cells / the amount of gene amplification of H1437 cells. The horizontal axis represents a part of the probe with respect to the chromosome position, and the vertical axis represents the signal intensity ratio.

図5及び図6の座標系の各プロット値から平均化曲線にスムージングさせ、GC含有量に係る平均化曲線の係数から求めることが挙げられる。ここでの「補正基準値」は、遺伝子断片のGC含有量をいい、この補正基準値及び補正傾向値から任意のGC含有量での補正因子データを導出することができる。 It can be obtained by smoothing an averaged curve from each plot value in the coordinate system of FIGS. 5 and 6 and obtaining the coefficient from the averaged curve related to the GC content. Here, the “correction reference value” refers to the GC content of the gene fragment, and correction factor data with an arbitrary GC content can be derived from the correction reference value and the correction tendency value.

第一及び第二のパラメータは、PCR法で遺伝子を増幅する過程でバイアスを生じさせるものと予想される。遺伝子断片に含まれるGC塩基対含有量の比率によるバイアスは、固定的なバイアス値が見られるものとして、補正因子を固定値としてもよいし、また測定ごとにバイアス値が変動するとして、個々にバイアス値を測定して決定してもよい。同バイアスは、GC塩基対含有量の比率に依存するものでなく、僅かに他の理由のよるバイアスも含まれると考えられるからである。なお、ここでは、全ての遺伝子配列情報は、Human Genome Build 34(from July 2003 UCSC genome build)(非特許文献9に記載)から得ているが、遺伝子配列情報は、その他の遺伝子配列データベースを利用してもよく、また、ゲノムの遺伝子配列を独自で決定してもよい。   The first and second parameters are expected to cause a bias in the process of amplifying genes by PCR. The bias based on the ratio of the GC base pair content contained in the gene fragment is assumed to have a fixed bias value, the correction factor may be a fixed value, and the bias value varies from measurement to measurement. The bias value may be measured and determined. This is because the bias does not depend on the ratio of the GC base pair content, and a bias due to other reasons is considered to be included. Here, all gene sequence information is obtained from Human Genome Build 34 (from July 2003 UCSC genome build) (described in Non-Patent Document 9), but other gene sequence databases are used for gene sequence information. Alternatively, the genomic gene sequence may be determined independently.

HYPERLINK "http://genome.ucsc.edu/" http://genome.ucsc.edu/HYPERLINK "http://genome.ucsc.edu/" http://genome.ucsc.edu/

第3のパラメータは、特定領域におけるGC塩基対含有量の比率(%)である。ここで、特定領域とは、制限酵素で切断した遺伝子断片のなかで、GC塩基対含有量の比率が最も高い100bp(base pair)の連続領域をいう。特定領域におけるGC塩基対含有量の比率(%)とは、100bpの固定枠を任意の制限酵素断片の遺伝子に対して、同遺伝子断片の端から1塩基毎にずらして、その中に含まれるGC含有量をそれぞれ求めて、最もGC塩基対含有量の高い特定領域おける、GC塩基対含有量(%)を算出する。   The third parameter is the ratio (%) of GC base pair content in the specific region. Here, the specific region refers to a continuous region of 100 bp (base pair) having the highest GC base pair content ratio among gene fragments cut with a restriction enzyme. GC base pair content ratio (%) in a specific region means that a 100 bp fixed frame is shifted by one base from the end of the same gene fragment with respect to any restriction enzyme fragment gene, and is included in that Each GC content is obtained, and the GC base pair content (%) in a specific region having the highest GC base pair content is calculated.

算出方法は、第2のパラメータで記載した方法により求める。また、この特定領域は、必ずしも100bpに限定されることなく、20bp乃至220bpの範囲での塩基数としてもよい。同因子は、PCR法で遺伝子を増幅する過程でバイアスを生じさせるものと予想される(図7、図8)。   The calculation method is obtained by the method described in the second parameter. In addition, this specific region is not necessarily limited to 100 bp, and may be the number of bases in the range of 20 bp to 220 bp. This factor is expected to cause a bias in the process of amplifying genes by PCR (FIGS. 7 and 8).

これを示す例として、図7及び図8を示す。図7は、遺伝子断片の特定領域におけるCG含有量に対するシグナル強度比を示したグラフである。縦軸は、シグナル強度比を示し、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。横軸は、同断片に対して、特定領域における100bp内のGC含有量の最大値を百分率で示した。矢印に示す部位よりもGC含有量の高い領域は、ランダムなデータが見られる。このような当該ランダムなシグナル強度比が示される領域は、データ取得の過程で排除してもよい。また、図8は、同一の細胞(H1437細胞)を別々に実験したデータを比較して得た。縦軸は、図7と同様にシグナル強度比を示し、H1437細胞の遺伝子増幅量/H1437細胞の遺伝子増幅量である。横軸は、図7と同様に特定領域のGC含有量を百分率で示した。   As an example showing this, FIG. 7 and FIG. 8 are shown. FIG. 7 is a graph showing a signal intensity ratio with respect to the CG content in a specific region of a gene fragment. The vertical axis represents the signal intensity ratio, which is the amount of gene amplification of chromosomes of Down syndrome / the amount of gene amplification of chromosomes of healthy individuals. The horizontal axis indicates the maximum GC content within 100 bp in a specific region as a percentage for the same fragment. Random data can be seen in the region where the GC content is higher than the region indicated by the arrow. Such a region showing the random signal intensity ratio may be excluded in the data acquisition process. Further, FIG. 8 was obtained by comparing data obtained by separately experimenting with the same cell (H1437 cell). The vertical axis indicates the signal intensity ratio as in FIG. 7, and is the gene amplification amount of H1437 cells / gene amplification amount of H1437 cells. The horizontal axis indicates the GC content in a specific region as a percentage as in FIG.

図7又は8の座標系の各プロット値から平均化曲線にスムージングさせ、特定領域のGC含有量に係る平均化曲線の係数から求めることが挙げられる。ここでの「補正基準値」は、特定領域のGC含有量をいい、この補正基準値及び補正傾向値から任意のGC含有量での補正因子データを導出することができる。 Examples include smoothing an averaged curve from each plot value in the coordinate system of FIG. 7 or 8 and obtaining the coefficient from the averaged curve related to the GC content in a specific region. The “correction reference value” here refers to the GC content in a specific region, and correction factor data with an arbitrary GC content can be derived from the correction reference value and the correction tendency value.

特定領域に含まれるGC塩基対含有量の比率によるバイアスは、固定的なバイアス値として、補正因子を固定値としてもよいし、また実験ごとにバイアス値が変動するとして、個々にバイアス値を測定して決定してもよい。ここで、同バイアスは、GC塩基対含有量の比率に依存するものでなく、僅かに他の理由のよるバイアスも含まれると考えられる。GC塩基対含有量の比率(%)が高い部分(6)は、測定値が近似式の曲線から大幅に離れるので除外してもよい(図7)。   The bias based on the ratio of the GC base pair content contained in a specific region may be a fixed bias value, the correction factor may be a fixed value, or the bias value varies from experiment to experiment, and the bias value is measured individually. May be determined. Here, the bias does not depend on the ratio of the GC base pair content, and it is considered that a bias due to other reasons is also included. The portion (6) having a high GC base pair content ratio (%) may be excluded because the measured value greatly deviates from the approximate equation curve (FIG. 7).

第4のパラメータは、プローブの塩基配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)である。このハイブリダイゼーション・フリーエネルギーの算出方法は、特に限定されないが、ここではOligoScreenTMを用いて算出した。また、GC塩基含有量を指標とした計算方法を用いて、ハイブリダイゼーション・フリーエネルギーを算出してもよい。ハイブリダイゼーション・フリーエネルギーは、プローブと相補的な遺伝子のハイブリダイゼーションやその洗浄の工程にバイアスを生じさせるものと予想されている。 The fourth parameter is the hybridization free energy (Kcal / mol) of the probe base sequence itself. The method for calculating the hybridization free energy is not particularly limited, but here, it was calculated using OligoScreen . Alternatively, hybridization free energy may be calculated using a calculation method using the GC base content as an index. Hybridization free energy is expected to cause a bias in the hybridization and washing process of a gene complementary to the probe.

これを示す例として図9及び図10を挙げる。図9は、プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)に対するに対するシグナル強度比を示すグラフである。シグナル強度比は、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。横軸は、プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)を示し、縦軸は、シグナル強度比を示している。また、図10は、同一の細胞(H1437細胞)を別々に実験したデータを比較して得た。縦軸は、シグナル強度比を示し、H1437細胞の遺伝子増幅量/H1437細胞の遺伝子増幅量である。横軸は、プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)を示す。   As an example showing this, FIG. 9 and FIG. 10 are given. FIG. 9 is a graph showing the ratio of signal intensity to the hybridization free energy (Kcal / mol) of the probe gene sequence itself. The signal intensity ratio is the amount of gene amplification of the chromosome of Down syndrome / the amount of gene amplification of the chromosome of a healthy person. The horizontal axis represents the hybridization free energy (Kcal / mol) of the probe gene sequence itself, and the vertical axis represents the signal intensity ratio. In addition, FIG. 10 was obtained by comparing data obtained by separately experimenting with the same cells (H1437 cells). The vertical axis represents the signal intensity ratio, which is gene amplification amount of H1437 cells / gene amplification amount of H1437 cells. The horizontal axis indicates the hybridization free energy (Kcal / mol) of the probe gene sequence itself.

図9又は10の座標系の各プロット値から平均化曲線にスムージングさせ、ハイブリダイゼーション・フリーエネルギーに係る平均化曲線の係数から求めることが挙げられる。ここでの「補正基準値」は、各ハイブリダイゼーション・フリーエネルギー値をいい、この補正基準値及び補正傾向値から任意のハイブリダイゼーション・フリーエネルギー値での補正因子データを導出することができる。 For example, smoothing is performed from each plot value in the coordinate system of FIG. 9 or 10 to an averaged curve, and the coefficient is obtained from an averaged curve related to hybridization free energy. The “correction reference value” herein refers to each hybridization free energy value, and correction factor data at an arbitrary hybridization free energy value can be derived from the correction reference value and the correction tendency value.

第5のパラメータは、Prefect Match(PM)のプローブセットのシグナル強度の中間値(log scaled)である。対照サンプルのシグナル強度を意味し、特定の染色体部位(特定のSNP部位)を検出する複数のプローブのシグナル強度の中間値をいう。この中間値は、最高値の値及び最低値の値を排除した後に求めても良い。   The fifth parameter is an intermediate value (log scaled) of the signal intensity of the probe set of Prefect Match (PM). It means the signal intensity of the control sample, and means the intermediate value of the signal intensity of a plurality of probes that detect a specific chromosomal site (specific SNP site). The intermediate value may be obtained after eliminating the highest value and the lowest value.

これを示す例として図11を挙げる。図11は、Prefect Match(PM)であるプローブセットのシグナル強度の中間値に対するシグナル強度を示すグラフである。この中間値とは、特定の染色体部位(特定のSNP部位)を検出する複数のプローブのシグナル強度の中間値をいう。縦軸は、シグナル強度比を示し、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。横軸は、Prefect Match(PM)であるプローブセットのシグナル強度の中間値を示す。   An example of this is shown in FIG. FIG. 11 is a graph showing the signal intensity with respect to the intermediate value of the signal intensity of the probe set which is a Perfect Match (PM). This intermediate value refers to an intermediate value of signal intensities of a plurality of probes that detect a specific chromosomal site (specific SNP site). The vertical axis represents the signal intensity ratio, which is the amount of gene amplification of chromosomes of Down syndrome / the amount of gene amplification of chromosomes of healthy individuals. The horizontal axis indicates the intermediate value of the signal intensity of the probe set that is Prefect Match (PM).

図11の座標系の各プロット値から平均化曲線にスムージングさせ、プローブセットのシグナル強度の中間値に係る平均化曲線の係数から求めることが挙げられる。ここでの「補正基準値」は、各プローブセットのシグナル強度の中間値をいい、この補正基準値及び補正傾向値から任意のプローブセットのシグナル強度の中間値での補正因子データを導出することができる。 For example, smoothing is performed from each plot value of the coordinate system of FIG. 11 to an average curve, and the coefficient is obtained from an average curve coefficient related to an intermediate value of the signal intensity of the probe set. The “correction reference value” here refers to the intermediate value of the signal intensity of each probe set, and the correction factor data at the intermediate value of the signal intensity of any probe set is derived from the correction reference value and the correction tendency value. Can do.

3.染色体のゲノムDNA量の測定結果を補正する方法(補正因子の算出工程)
本発明における遺伝子コピー数の解析方法における計測値の補正にあたっては以上の5つの補正パラメータに係る「補正基準値」及び「補正傾向値」の全部又は一部のデータを用いて、プローブごとの「補正因子」を算出する。後述するように、各プローブにおける複数の補正パラメータに係る「補正傾向値」及び「補正基準値」から、プローブにおける「補正因子」を導出することができる。
3. Method to correct the measurement result of the amount of genomic DNA of a chromosome (calculation process of correction factor)
In the measurement value correction in the gene copy number analysis method according to the present invention, all or part of the “correction reference value” and “correction tendency value” related to the above five correction parameters is used. "Correction factor" is calculated. As will be described later, the “correction factor” for the probe can be derived from the “correction tendency value” and the “correction reference value” for the plurality of correction parameters for each probe.

次いで、あるプローブにおける一次データについて、同プローブでの補正因子を用いて補正することにより、一次データについて補正をすることができる。この補正因子を用いて一次データを補正するには、以下で説明するように、一次データを補正因子で除する方法、一次データを補正因子で減じる方法など挙げられる。   Next, the primary data in a probe can be corrected using the correction factor in the probe, whereby the primary data can be corrected. Correction of primary data using this correction factor includes a method of dividing primary data by a correction factor and a method of subtracting primary data by a correction factor, as will be described below.

以下、複数の測定工程における補正傾向値及び補正基準値から総合的な補正因子を求める方法について説明する。複数の測定工程とは、上述の5つの補正パラメータに関する全部又は一部をいう。ここでは例示的に、三次関数の多項式で上記の5つの補正因子を用いて総合的な補正因子(5つの補正要件に係るバイアス予想値・Expected data)示した。ここで、多項式は、一次関数など他の次数の関数で求めても良い。また、補正パラメータもX1からX5の全てを用いることが望ましいが、任意の補正パラメータのみを用いても良い。   Hereinafter, a method for obtaining a comprehensive correction factor from correction tendency values and correction reference values in a plurality of measurement steps will be described. The plurality of measurement steps refers to all or part of the above five correction parameters. Here, by way of example, an overall correction factor (predicted bias value / expected data relating to five correction requirements) is shown using the above five correction factors as a polynomial of a cubic function. Here, the polynomial may be obtained by a function of another order such as a linear function. Further, although it is desirable to use all of the correction parameters X1 to X5, only an arbitrary correction parameter may be used.

(数1) Expected data = A+ Σ(BkXk+CkXk 2+DkXk 3
数1において、Kは、補正要件の1から5でそれぞれ以下の値を取る。また、B、C及びDは、三次関数の係数を示し、Aは同関数の切片を示す。
X1とは、XbaIで切断した遺伝子断片の長さ(bp)、
X2とは、前記制限酵素で切断された遺伝子断片に含まれるGC塩基対含有量の比率(%)、ここで高いGC含有量を示す領域は、データを除外して、曲線にスムージングしてもよい。
X3とは、特定領域におけるGC塩基対含有量の比率(%)
X4とは、プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)。
X5とは、Prefect Match(PM)のプローブセットのシグナル強度の中間値(log scaled)。対照サンプルのシグナル強度を意味し、特定の染色体部位(特定のSNP部位)を検出する複数のプローブのシグナル強度の中間値をいう。この中間値は、最高値の値及び最低値の値を排除した後に求めても良い。
(Number 1) Expected data = A + Σ (B k X k + C k X k 2 + D k X k 3)
In Equation 1, K takes the following values for correction requirements 1 to 5, respectively. B, C, and D represent coefficients of a cubic function, and A represents an intercept of the function.
X1 is the length (bp) of the gene fragment cleaved with XbaI,
X2 is the ratio (%) of the GC base pair content contained in the gene fragment cleaved with the restriction enzyme, and the region showing a high GC content is excluded from the data and smoothed into a curve. Good.
X3 is the ratio of GC base pair content in a specific region (%)
X4 is the hybridization free energy (Kcal / mol) of the probe gene sequence itself.
X5 is an intermediate value (log scaled) of the signal intensity of the probe set of Prefect Match (PM). It means the signal intensity of the control sample, and means the intermediate value of the signal intensity of a plurality of probes that detect a specific chromosomal site (specific SNP site). The intermediate value may be obtained after eliminating the highest value and the lowest value.

なお、使用するマイクロアレイに応じて、X1、X2、X3、X4は固定する値を取るが、X5、A、B、C、Dは測定ごとに変動する値であり、一回の測定ごとに特異的なもので、測定ごとに個別に計算することが望ましい。ただし、X5以外の値については、各プローブに固定的なものとしてもよい。   Depending on the microarray used, X1, X2, X3, and X4 take fixed values, but X5, A, B, C, and D vary from measurement to measurement. It is desirable to calculate each measurement individually. However, values other than X5 may be fixed to each probe.

本発明に係る測定値と補正の結果を示す図を図12及び図13に示す。図12は、ダウン症候群の染色体の健常人の染色体に対する本願の補正前のシグナル強度比を示すグラフである。ここで、シグナル強度比は、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。第21番染色体を中心とした物理的な遺伝子位置ごとの順に、10Kのマッピングを可能とするプローブセットのアレイを使用した。縦軸が、補正前のシグナル強度比を示し、横軸が第21番染色体の周辺における物理的な遺伝子位置を示している。   The figure which shows the measured value and correction result which concern on this invention is shown in FIG.12 and FIG.13. FIG. 12 is a graph showing a signal intensity ratio before correction of the present application with respect to a chromosome of a healthy person having a chromosome of Down syndrome. Here, the signal intensity ratio is the amount of gene amplification of the chromosome of Down syndrome / the amount of gene amplification of the chromosome of a healthy person. An array of probe sets capable of 10K mapping was used in order of each physical gene position centered on chromosome 21. The vertical axis represents the signal intensity ratio before correction, and the horizontal axis represents the physical gene position around chromosome 21.

図13は、図12に示されるグラフを本願の補正方法で処理したグラフである。当該補正処理により、シグナル強度比のデータのバラツキ及びゆらぎ(fluctuations)が著しく減少し、ダウン症候群の患者の第21番染色体領域でシグナル強度比が明確に増大していることが示されている(矢印で示した領域)。シグナル強度比は、ダウン症候群の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。縦軸が、シグナル強度比を示し、横軸が第21番染色体の周辺における物理的な遺伝子位置を示している。   FIG. 13 is a graph obtained by processing the graph shown in FIG. 12 using the correction method of the present application. It has been shown that the signal intensity ratio is clearly increased in the region of chromosome 21 of the patient with Down's syndrome by the correction process, in which the variation and fluctuations in the signal intensity ratio data are significantly reduced (fluctuations) ( Area indicated by an arrow). The signal intensity ratio is the amount of gene amplification of the chromosome of Down syndrome / the amount of gene amplification of the chromosome of a healthy person. The vertical axis shows the signal intensity ratio, and the horizontal axis shows the physical gene position around chromosome 21.

4.染色体の遺伝子コピー数を同定する方法
また、本願発明における補正方法に特定工程を追加することによる、染色体の遺伝子コピー数の絶対値を求める方法を提供する。本発明の補正方法で、ゲノムDNA量の強度比を補正すると、測定値のバイアスが減少して、明瞭な階段状の測定値となることが示される。この階段状の連続した測定値のうち、最小のシグナル強度比の平均値を「0」と定めることで、シグナル強度比と各染色体の領域における遺伝子コピー数の絶対値に変換することができる。
4). A method for identifying the gene copy number of a chromosome, and a method for obtaining an absolute value of the gene copy number of a chromosome by adding a specific step to the correction method of the present invention are provided. It is shown that when the intensity ratio of the amount of genomic DNA is corrected by the correction method of the present invention, the bias of the measurement value is reduced, and the measurement value is clearly stepped. By setting the average value of the minimum signal intensity ratios among the stepwise continuous measurement values as “0”, the signal intensity ratio and the absolute value of the gene copy number in each chromosomal region can be converted.

図14は、アレル別のゲノムDNA量及び遺伝子コピー数分析(Allelic dosage analysis)をした結果のグラフである。図は、各プローブに対する癌患者の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量を示した。いずれかのアレルでの最小のシグナル強度比を、1細胞当たりの遺伝子コピー数を「0」と定義することにより、個々の染色体領域における遺伝子コピー数の絶対数を算出することができる。縦軸(左側)は、シグナル強度比を示し、縦軸(右側)は、本発明で定義した1細胞当たりの遺伝子コピー数の絶対値を表した。遺伝子コピー数の高いアレルは、太線(7)で示し、遺伝子コピー数の低いアレルは、細線(8)で示している。   FIG. 14 is a graph showing the results of genome DNA amount and gene copy number analysis (Allelic dosage analysis) by allele. The figure shows the amount of gene amplification of chromosomes of cancer patients / the amount of gene amplification of chromosomes of healthy individuals for each probe. By defining the minimum signal intensity ratio in any allele as “0” as the number of gene copies per cell, the absolute number of gene copies in each chromosomal region can be calculated. The vertical axis (left side) represents the signal intensity ratio, and the vertical axis (right side) represents the absolute value of the gene copy number per cell defined in the present invention. Alleles with a high gene copy number are indicated by bold lines (7), and alleles with a low gene copy number are indicated by thin lines (8).

図15は、図14と同条件での全ゲノムにおけるアレルごとのゲノムDNA量を分析した結果を示すグラフである。このグラフは、アレルごとのシグナル強度比を示している。いずれかのアレルでの最小のシグナル強度比を、1細胞当たりの遺伝子コピー数を「0」と定義することにより、個々の染色体領域における遺伝子コピー数の絶対数を算出することができる。縦軸(左側)は、シグナル強度比を示し、縦軸(右側)は、本発明で定義した細胞当たりの遺伝子コピー数の絶対値を表した。横軸は、全ゲノムの物理的な遺伝子位置を順に示したものである。遺伝子コピー数の高いアレルは、太線(7)で示し、遺伝子コピー数の低いアレルは、細線(8)で示している。X染色体におけるLOHが片方のアレルで明確に示されている(矢印)。   FIG. 15 is a graph showing the results of analyzing the amount of genomic DNA for each allele in the whole genome under the same conditions as in FIG. This graph shows the signal intensity ratio for each allele. By defining the minimum signal intensity ratio in any allele as “0” as the number of gene copies per cell, the absolute number of gene copies in each chromosomal region can be calculated. The vertical axis (left side) represents the signal intensity ratio, and the vertical axis (right side) represents the absolute value of the gene copy number per cell defined in the present invention. The horizontal axis shows the physical gene position of the whole genome in order. Alleles with a high gene copy number are indicated by bold lines (7), and alleles with a low gene copy number are indicated by thin lines (8). LOH on the X chromosome is clearly shown in one allele (arrow).

この処理をまとめると次の通りである。すなわち、階段状の連続した測定値のうち、最小のシグナル強度比の平均値を「0」とし、この「0」に比較して次に高い連続したシグナル強度の平均値を「1」として、次いで、「2」「3」と求めていく。これにより、シグナル強度比の値から、遺伝子コピー数の絶対値を検出することができる。 This process is summarized as follows. That is, among the stepwise continuous measurement values, the average value of the minimum signal intensity ratio is set to “0”, and the average value of the next highest continuous signal intensity compared to “0” is set to “1”. Next, “2” and “3” are requested. Thereby, the absolute value of the gene copy number can be detected from the value of the signal intensity ratio.

染色体での最小のシグナル強度比を求めるには、比較対照の一方が、健常人であることが望ましい。 ほぼ全領域の染色体でシグナル強度比を求めると、ほとんどの染色体の遺伝子コピー数は、0、1、2または3のいずれかの値となることが示された。
また、染色体の遺伝子コピー数の検出をする場合には、本願発明による補正方法の他に、アレルごとのゲノムDNA量の測定をすることができるゲノムタイピングマイクロアレイを用いることが必要である。
In order to obtain the minimum signal intensity ratio on the chromosome, it is desirable that one of the comparison controls is a healthy person. When the signal intensity ratio was determined for almost all of the chromosomes, it was shown that the gene copy number of most chromosomes was 0, 1, 2, or 3.
In addition, when detecting the gene copy number of a chromosome, it is necessary to use a genome typing microarray that can measure the amount of genomic DNA for each allele in addition to the correction method according to the present invention.

5.染色体上のハプロタイプの同定方法
さらには、本発明により、染色体のハプロタイプの検出する方法にも利用することができる。ここで、ハプロタイプとは、親から遺伝する際に染色体の遺伝子は適当なブロック単位で遺伝するが、その際の連続した遺伝子のブロックのことをハプロタイプと呼んでいる。このハプロタイプには、複数のSNPsが含まれていることが一般的である。
5). The method for identifying a haplotype on a chromosome can also be used for a method for detecting a haplotype on a chromosome according to the present invention. Here, the haplotype, when inherited from the parent, the chromosomal gene is inherited in an appropriate block unit, and a continuous gene block at that time is called a haplotype. This haplotype generally contains a plurality of SNPs.

染色体のゲノムDNA量を測定する際に、マイクロアレイをアレルごとの測定を可能とするゲノムタイピングマイクロアレイとすることで、染色体のハプロタイプの検出ができる。同マイクロアレイでは、アレイ上に通常1つのSNPを有するプローブが配置されており、ハプロタイプの最小の構成成分を有しているからである。また、本発明の補正方法により測定値で処理することにより、信頼性の高い検出ができる。 When measuring the amount of genomic DNA of a chromosome, the haplotype of the chromosome can be detected by making the microarray a genome typing microarray that enables measurement for each allele. This is because in the microarray, a probe having one SNP is usually arranged on the array and has the minimum haplotype component. Moreover, highly reliable detection can be performed by processing with a measured value by the correction method of the present invention.

本発明の補正方法で、染色体のゲノムDNA量のデータを補正することで、上述したように明瞭な階段状の染色体ゲノムDNA量または遺伝子コピー数が求められ、同じシグナル強度比である連続した染色体上のセグメントを見出すことができ、より信頼性の高いハプロタイプの検出ができる。同じシグナル強度比である連続した染色体(アレル)上のセグメント(ブロック)は、単一のハプロタイプであると定義される(図14、図15)。例えば、図14に示されるシグナル強度比が2つのアレルが異なる連続している領域(9)は、遺伝子のハプロタイプを示していると予測される。横軸は、染色体遺伝子の物理的な遺伝子位置を示している。縦軸は、シグナル強度比を示している。 By correcting the genomic DNA amount data of the chromosome with the correction method of the present invention, a clear stepwise chromosomal genomic DNA amount or gene copy number can be obtained as described above, and consecutive chromosomes having the same signal intensity ratio. The upper segment can be found, and the haplotype can be detected more reliably. A segment (block) on consecutive chromosomes (alleles) with the same signal intensity ratio is defined as a single haplotype (FIGS. 14 and 15). For example, a continuous region (9) in which the two alleles have different signal intensity ratios shown in FIG. 14 is predicted to indicate the haplotype of the gene. The horizontal axis indicates the physical gene position of the chromosomal gene. The vertical axis represents the signal intensity ratio.

6.染色体の遺伝子の欠損及び異常増幅を表示する方法
本発明により、染色体の位置ごとの染色体の遺伝子コピー数を求めることができる。その表示方法としては、図14及び図15に示すように、縦軸に染色体のゲノムDNA量(シグナル強度比)または遺伝子コピー数をとり、横軸に染色体の位置(Locus)に対応するプローブを染色体の物理的順序で表すことが一般的であった。
6). Method for Displaying Chromosomal Gene Deletion and Abnormal Amplification According to the present invention, the number of chromosome gene copies for each chromosome position can be determined. As shown in FIG. 14 and FIG. 15, the display method is such that the vertical axis indicates the genomic DNA amount (signal intensity ratio) or gene copy number, and the horizontal axis indicates the probe corresponding to the chromosome position (Locus). It was common to express in the physical order of chromosomes.

本発明では、染色体をその長さなどの染色体形状様に応じて第1染色体から第22染色体、X染色体及びY染色体の全部又はその一部を画面等に表示して、染色体の遺伝子コピー数が欠損している領域を対応づけて欠損させ、また遺伝子コピー数の異常増幅は、当該領域に対応づけて、その遺伝子コピー数に応じて増幅があることを示す表示方法が挙げられる(図16)。また、遺伝子コピー数の数に応じて、染色体の対応する領域の色彩を濃くするなどの変調をつけることも挙げられる。図16に示される長い染色体は、第4番染色体を示し、短い染色体は、第18番染色体を示す。   In the present invention, all or part of chromosomes 1 to 22, chromosomes X and Y are displayed on a screen or the like according to the shape of the chromosome, such as its length, and the number of gene copies of the chromosome is A deficient region is associated and deleted, and an abnormal amplification of the gene copy number is associated with the region, and a display method indicating that there is amplification according to the gene copy number (FIG. 16). . In addition, depending on the number of gene copies, modulation such as increasing the color of the corresponding region of the chromosome may be mentioned. The long chromosome shown in FIG. 16 indicates the 4th chromosome, and the short chromosome indicates the 18th chromosome.

7.染色体上のハプロタイプを表示する方法
上述したように、本発明により染色体上にあるハプロタイプをも検出することができる。このハプロタイプの表示についても、遺伝子コピー数のグラフで示すことが挙げられるが、また、染色体をその長さなどの染色体形状様に応じて第1染色体から第23染色体、X染色体及びY染色体の全部又はその一部を画面等に表示して、染色体のハプロタイプごと領域を対応づけて当該領域ごとに異なる着色をすることにより、空間情報として第三者に伝えるように表示する方法が挙げられる。
7). Method for displaying haplotypes on chromosomes As described above, haplotypes on chromosomes can also be detected according to the present invention. This haplotype display can also be shown by a graph of gene copy number, but the chromosomes are all chromosomes 1 to 23, X and Y depending on the shape of the chromosome such as its length. Alternatively, a method may be used in which a part of the information is displayed on a screen or the like, the regions are associated with each haplotype of the chromosome, and the region is colored differently to display the information as a spatial information to a third party.

実験例1Experimental example 1

以下、本発明を以下の実験例1を用いてさらに具体的に説明するが、本発明の範囲は下記の実験例に限定されることはない。
本実験例では、ダウン症候群の責任遺伝子である第21番染色体を用いて実験した。ダウン症候群の患者の第21番染色体は、健常人の同染色体と比較して遺伝子コピー数が増加していることが知られている。
Hereinafter, the present invention will be described more specifically with reference to the following experimental example 1. However, the scope of the present invention is not limited to the following experimental example.
In this experimental example, an experiment was performed using chromosome 21 which is a gene responsible for Down's syndrome. It is known that chromosome 21 of Down syndrome patients has an increased gene copy number compared to that of healthy individuals.

ダウン症候群の患者の第21番染色体と健常人の同染色体と比較した。図12は、健常人及びダウン症候群の患者のゲノムを上述した方法で、アレイ上にあるプローブごとのシグナル強度をそれぞれ求め、ダウン症候群の患者におけるシグナル強度を健常人におけるシグナル強度で除した比率を算出したものである。図12に示したグラフでは、染色体の特定の部位ごとに、染色体の遺伝子コピー数に依存するシグナル強度比を表しているが、シグナルノイズが多いため、必ずしもシグナル強度比が染色体の遺伝子コピー数に依存しているデータではないことが示される。   We compared chromosome 21 of a patient with Down's syndrome with that of a healthy person. FIG. 12 shows the ratio of the signal intensity for each probe in the Down syndrome patient divided by the signal intensity in the healthy person by obtaining the signal intensity for each probe on the array by the method described above for the genomes of healthy persons and Down syndrome patients. It is calculated. The graph shown in FIG. 12 shows the signal intensity ratio depending on the number of gene copies of the chromosome for each specific part of the chromosome. However, since there is a lot of signal noise, the signal intensity ratio is not necessarily the number of gene copies of the chromosome. It is shown that it is not dependent data.

一次データを本願発明に係る補正方法で処理すると、図13に示すように、一次データの有するデータの「ゆらぎ」や「バラツキ」が著しく減少することが示された。また、補正前の一次データの表す平均値データと、本願補正方法で補正した二次データの表す平均値データには、ほとんど差異がないことが示された(図12と図13)。第21番染色体及びその他の染色体における、一次データのシグナル強度比のメディアン及びSDは、それぞれ1.30±0.39及び1.00±0.28であった。一方、本願補正方法による補正処理後の第21番染色体及びその他の染色体における二次データは、それぞれ1.29±0.18 及び0.99±0.09であった。 When the primary data is processed by the correction method according to the present invention, it is shown that “fluctuation” and “variation” of the data included in the primary data are remarkably reduced as shown in FIG. Further, it was shown that there is almost no difference between the average value data represented by the primary data before correction and the average value data represented by the secondary data corrected by the present correction method (FIGS. 12 and 13). The median and SD of the signal intensity ratio of primary data in chromosome 21 and other chromosomes were 1.30 ± 0.39 and 1.00 ± 0.28, respectively. On the other hand, secondary data on chromosome 21 and other chromosomes after the correction processing by the correction method of the present application were 1.29 ± 0.18 and 0.99 ± 0.09, respectively.

他の実験例では、同一のH1437細胞を用いて、別々に実験したデータから染色体のゲノムDNA量比を測定する実験を行った。補正前の測定データ(図17)と補正後の測定データ(図18)を示した。これらの図の縦軸はシグナル強度比を示し、H1437細胞の遺伝子増幅量/H1437細胞の遺伝子増幅量であり、横軸は、染色体位置に対するプローブの一部を示す。 図17と図18は、中間値及びそのSD値は、1.00±0.08と1.00±0.06となり、シグナル強度の値は変えず、そのデータのバラツキのみを減少させることが示された。 In another experimental example, using the same H1437 cell, an experiment was performed to measure the genomic DNA content ratio of chromosomes from data obtained by experimenting separately. Measurement data before correction (FIG. 17) and measurement data after correction (FIG. 18) are shown. In these figures, the vertical axis represents the signal intensity ratio, which is the gene amplification amount of H1437 cells / the gene amplification amount of H1437 cells, and the horizontal axis represents a part of the probe for the chromosome position. FIG. 17 and FIG. 18 show that the intermediate value and its SD value are 1.00 ± 0.08 and 1.00 ± 0.06, and the signal intensity value is not changed, and only the variation of the data is reduced.

実験例2Experimental example 2

次に、本願での補正方法(GIM; Genome Imbalance Map)による結果と、従来から利用されているBAC(Bacterial artificial chromosome)をスポットしたCGH(Comparative genomic hybridization)アレイ(Genosensor array 300, Vysis)の結果を比較した。実験例2として以下に示す。2つの方法で、高いコピーレンジから低いコピーレンジにかけて良好な相関関係が見られたが、相関関係のない部位も、一部の染色体の部位で見られた(図19)。この理由は、本願補正方法で用いるSNPタイピングアレイと比較して、BACプローブが約200Kbと長いため、この距離のなかで、遺伝子コピー数が異なっていても、遺伝子コピー数が平均化されてしまい、異なる遺伝子コピー数が算出されたと考えられる。   Next, the result of the correction method (GIM; Genome Imbalance Map) in this application and the result of the CGH (Comparative genomic hybridization) array (Genosensor array 300, Vysis) spotted from the BAC (Bacterial artificial chromosome) used in the past Compared. It is shown below as Experimental Example 2. The two methods showed good correlation from high copy range to low copy range, but uncorrelated sites were also found in some chromosomal sites (FIG. 19). This is because the BAC probe is about 200 Kb long compared to the SNP typing array used in the correction method of the present application, and even within this distance, the gene copy number is averaged even if the gene copy number is different. It is considered that a different gene copy number was calculated.

また、男性と女性の染色体の遺伝子コピー数を比較する実験を行ったところ、X染色体における1つの遺伝子コピー数の差異については、本願補正方法(GIM)によるデータがBACをスポットしたCGHアレイと比較してより明確に区別できることが示された。X染色体とそれ以外の常染色体でのシグナル強度比(アジアン±SD)を求めると、GIM法では、0.99±0.09/0.63±0.08であるのに対して、BACアレイでの測定では、1.00±0.09/0.71±0.14になる。X染色体の遺伝子コピー数のアジアンは、0.71で、常染色体のものと、0.29の差のみであり(GIM法の場合には、0.36の差がある)、SD値も0.14と、GIM法の0.08に比して大きい。したがって、本願のGIM法は、X染色体では、BAXでスポットしたCGH法よりも、明確に遺伝子コピー数を区別することができる(図20)。   In addition, we conducted an experiment to compare the gene copy number of the chromosomes of male and female. Regarding the difference in the number of single gene copies in the X chromosome, the data by the present correction method (GIM) was compared with the CGH array that spotted BAC. It was shown that it can be more clearly distinguished. The signal intensity ratio (Asian ± SD) between the X chromosome and the other autosomes is 0.99 ± 0.09 / 0.63 ± 0.08 in the GIM method, while 1.00 ± 0.09 in the BAC array measurement. /0.71±0.14. The Asian gene copy number of the X chromosome is 0.71, which is only 0.29 different from that of the autosome (in the case of the GIM method, there is a difference of 0.36), and the SD value is 0.14, which is 0.08 of the GIM method. Larger than Therefore, the GIM method of the present application can distinguish the gene copy number more clearly in the X chromosome than the CGH method spotted with BAX (FIG. 20).

実験例3Experimental example 3

実験例3として、癌細胞における遺伝子コピー数の検出を挙げる。すなわち、本発明の補正方法を癌細胞のゲノムDNA量及び遺伝子コピー数を求めることを適用した。細胞は、H1395肺がん細胞株と正常細胞から得た染色体を用いて、全染色体遺伝子のゲノムDNA量を測定した。図21は、第8染色体及び第9p染色体における癌細胞と正常細胞の染色体遺伝子のシグナル強度比を示している。シグナル強度比は、癌患者の染色体の遺伝子増幅量/健常人の染色体の遺伝子増幅量である。すなわちゲノムDNA量の比を表している。図中左側の矢印の8q24は、c-myc癌遺伝子の増幅が見とれられる部位を示し、同右側の矢印は未知のゲノム増殖領域を示している。縦軸の右側の目盛りは、遺伝子コピー数を算出した結果を示す。(図15を参照)   Experimental example 3 includes detection of gene copy number in cancer cells. That is, the correction method of the present invention was applied to obtain the amount of genomic DNA and gene copy number of cancer cells. Cells were measured for the amount of genomic DNA of all chromosomal genes using chromosomes obtained from H1395 lung cancer cell line and normal cells. FIG. 21 shows the signal intensity ratio between the chromosomal genes of cancer cells and normal cells on chromosomes 8 and 9p. The signal intensity ratio is the gene amplification amount of chromosomes of cancer patients / gene amplification amount of chromosomes of healthy individuals. That is, it represents the ratio of genomic DNA content. In the figure, the left arrow 8q24 indicates a site where amplification of the c-myc oncogene is observed, and the right arrow indicates an unknown genome growth region. The scale on the right side of the vertical axis shows the result of calculating the gene copy number. (See Figure 15)

正常細胞と特定の癌細胞から得た染色体のゲノムDNA量の比を求め、これを本発明の補正方法で補正することにより、特定の染色体領域で遺伝子が欠損または異常増幅している遺伝子コピー数を示すことができる。これにより、癌やその他の遺伝子疾患の診断方法に応用できるほか、疾患細胞の遺伝子コピー数を特定することにより、疾患関連遺伝子の同定をすることができる。また、アレル別に染色体のゲノムDNA量を求めることにより、染色体の遺伝子コピー数の異常が、父方また母方のいずれかの由来であるかも同定することができる(図3、図7)。   The number of gene copies in which a gene is deleted or abnormally amplified in a specific chromosomal region by determining the ratio of the genomic DNA amount of chromosomes obtained from normal cells and specific cancer cells and correcting this by the correction method of the present invention Can be shown. Thereby, it can be applied to a method for diagnosing cancer and other genetic diseases, and a disease-related gene can be identified by specifying the number of gene copies of disease cells. Further, by determining the amount of genomic DNA of a chromosome for each allele, it is possible to identify whether the abnormal gene copy number of the chromosome is derived from either the paternal or the maternal (FIGS. 3 and 7).

本発明による遺伝子コピーの解析方法における測定値の補正の処理図である。It is a processing figure of correction of the measured value in the analysis method of gene copy by the present invention. 本発明による遺伝子コピーの解析装置の構成図である。It is a block diagram of the gene copy analysis apparatus by this invention. 遺伝子断片の長さに対するシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)を示したグラフである。It is the graph which showed signal intensity ratio with respect to the length of a gene fragment (the amount of chromosome genomic DNA of Down's syndrome / normal amount of chromosome genomic DNA). 遺伝子断片の長さに対するシグナル強度比(同一のH1437細胞の染色体のゲノムDNA量)を示したグラフである。It is the graph which showed the signal intensity ratio (the genomic DNA amount of the chromosome of the same H1437 cell) with respect to the length of a gene fragment. 遺伝子断片に含まれるGC含有量とシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)の関係を示したグラフである。It is the graph which showed the relationship between GC content contained in a gene fragment, and signal intensity ratio (the amount of chromosome genomic DNA of Down's syndrome / normal amount of chromosome genomic DNA). 遺伝子断片に含まれるGC含有量とシグナル強度比(同一のH1437細胞の染色体のゲノムDNA量)の関係を示したグラフである。It is the graph which showed the relationship between GC content contained in a gene fragment, and signal intensity ratio (genomic DNA amount of the chromosome of the same H1437 cell). 遺伝子断片の特定領域におけるCG含有量に対するシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)を示したグラフである。It is the graph which showed signal intensity ratio (the amount of chromosomal genomic DNA of Down's syndrome / normal amount of chromosomal genomic DNA) with respect to CG content in the specific region of a gene fragment. 遺伝子断片の特定領域におけるCG含有量に対するシグナル強度比(同一のH1437細胞の染色体のゲノムDNA量)を示したグラフである。It is the graph which showed signal intensity ratio (genomic DNA amount of the chromosome of the same H1437 cell) with respect to CG content in the specific area | region of a gene fragment. プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)に対するに対するシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)を示すグラフである。It is a graph which shows signal intensity ratio (chromosomal genomic DNA amount of Down syndrome / normal chromosomal genomic DNA amount) with respect to hybridization free energy (Kcal / mol) which the gene sequence of the probe itself has. プローブの遺伝子配列自体の有するハイブリダイゼーション・フリーエネルギー(Kcal/mol)に対するに対するシグナル強度比(同一のH1437細胞の染色体のゲノムDNA量)を示すグラフである。It is a graph which shows the signal intensity ratio (the genomic DNA amount of the chromosome of the same H1437 cell) with respect to the hybridization free energy (Kcal / mol) which the gene sequence itself has. Prefect Match(PM)のプローブセットのシグナル強度の中間値(log scaled)に対するシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)を示すグラフである。It is a graph which shows signal intensity ratio (the amount of chromosomal genomic DNA of Down's syndrome / normal amount of chromosomal genomic DNA) with respect to the intermediate value (log scaled) of the signal intensity of the probe set of Prefect Match (PM). 本願の補正前の染色体位置ごとのシグナル強度比(ダウン症の染色体ゲノムDNA量/正常の染色体ゲノムDNA量)を示すグラフである。It is a graph which shows the signal intensity ratio (the amount of chromosomal genomic DNA of Down's syndrome / the amount of normal chromosomal genomic DNA) for each chromosome position before correction of the present application. 図12に示されるグラフを本願の補正方法で処理したグラフである。It is the graph which processed the graph shown by FIG. 12 with the correction method of this application. 染色体のアレル別のゲノムDNA量及び遺伝子コピー数分析(Allelic dosage analysis)をした結果のグラフである。It is a graph of the result of having analyzed genomic DNA amount and gene copy number analysis (Allelic dosage analysis) according to the allele of a chromosome. 全ゲノムにおけるアレルごとのゲノムDNA量及び遺伝子コピー数を分析した結果を示すグラフである。It is a graph which shows the result of having analyzed the genomic DNA amount and gene copy number for every allele in the whole genome. 本発明の表示方法による染色体遺伝子の欠損及び異常増幅の表示を示す図である。It is a figure which shows the display of the defect | deletion of chromosome gene and abnormal amplification by the display method of this invention. 本願の補正前の染色体位置ごとのシグナル強度比(同一のH1437細胞の染色体のゲノムDNA量)を示すグラフである。It is a graph which shows the signal intensity ratio (the amount of genome DNA of the chromosome of the same H1437 cell) for every chromosome position before correction of this application. 図17に示されるグラフを本願の補正方法で処理したグラフである。It is the graph which processed the graph shown by FIG. 17 with the correction method of this application. 本願補正方法による結果と、BACをスポットしたCGHアレイの結果の比較を示すグラフである。It is a graph which shows the comparison of the result by this application correction method, and the result of the CGH array which spotted BAC. 本願補正方法による結果と、BACをスポットしたCGHアレイの結果の比較を、染色体の位置の順ごとに示すグラフである。It is a graph which shows the comparison with the result by this application correction method, and the result of the CGH array which spotted BAC for every order of the position of a chromosome. 第8染色体及び第9p染色体における癌細胞と正常細胞の染色体遺伝子のシグナル強度比を示すグラフである。It is a graph which shows the signal intensity ratio of the chromosomal gene of the cancer cell and normal cell in the 8th chromosome and the 9th chromosome.

符号の説明Explanation of symbols

1 遺伝子コピーの解析装置
2 中央演算処理装置(CPU)
3 メモリ
4 ハードディスク
5 表示装置
6 GC塩基対含有量の比率の高い部分
7 遺伝子コピー数の高いアレル
8 遺伝子コピー数の低いアレル
9 ハプロタイプを示す領域

1 Gene copy analyzer 2 Central processing unit (CPU)
3 Memory 4 Hard disk 5 Display device 6 High ratio of GC base pair content 7 Allele with high gene copy number 8 Allele with low gene copy number 9 Region indicating haplotype

Claims (16)

遺伝子コピーの解析方法において、
染色体のゲノムDNA量(以下、ゲノムDNA量と呼ぶ。)、又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比(以下、ゲノムDNA量比と呼ぶ。)、のいずれかの値(以下、測定値と呼ぶ。)を補正する方法が、
所定のゲノムDNA量、又はゲノムDNA量比を測定する測定値測定工程に続いて、
補正傾向値算出手段により、各補正パラメータ値に対するゲノム量若しくはゲノム量比の測定値を座標系にプロットし、そのプロット値をスムージングすることにより、測定値に関する所定の補正パラメータに係る補正傾向値を算出する補正傾向値算出工程と、
補正因子算出手段により、補正傾向値から補正因子を算出する補正因子算出工程と、
測定値補正演算手段により、測定値を当該補正因子で補正演算する測定値補正演算工程と
を含むことを特徴とする遺伝子コピーの解析方法。
In the gene copy analysis method,
One of the values of the genomic DNA amount of chromosomes (hereinafter referred to as genomic DNA amount), or the ratio of the genomic DNA amounts of chromosomes of two different or identical cells (hereinafter referred to as genomic DNA amount ratio) ( Hereinafter, the method of correcting the measured value)
Following the measurement value measurement step for measuring a predetermined genomic DNA amount or genomic DNA amount ratio,
The correction tendency value calculation means plots the measurement value of the genome amount or the genome amount ratio with respect to each correction parameter value in the coordinate system, and smoothes the plot value to obtain the correction tendency value related to the predetermined correction parameter related to the measurement value. A correction tendency value calculation step to calculate,
A correction factor calculation step of calculating a correction factor from the correction tendency value by a correction factor calculation means;
And a measurement value correction calculation step of correcting the measurement value with the correction factor by a measurement value correction calculation means.
前記測定値が、ゲノムDNAに相補的な複数のプローブ(以下、プローブと呼ぶ)を用いて測定されたゲノムDNA量、又はゲノムDNA量比であって、
補正因子算出工程において、補正傾向値から各補正基準値における補正因子を算出することを特徴とする請求項1に記載の遺伝子コピーの解析方法。
The measured value is a genomic DNA amount measured using a plurality of probes complementary to genomic DNA (hereinafter referred to as probes), or a genomic DNA amount ratio,
2. The gene copy analysis method according to claim 1, wherein, in the correction factor calculation step, a correction factor at each correction reference value is calculated from the correction tendency value.
前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、
染色体の遺伝子を特定の制限酵素で切断した各々の遺伝子断片の長さに対する測定値を座標系にプロットして、そのプロット値をスムージングすることによって、遺伝子断片の長さに係る補正傾向値を算出する
ことを特徴とする請求項1又は2のいずれかに記載の遺伝子コピーの解析方法。
In the correction tendency value calculation step in the gene copy analysis method,
By plotting the measured values for the length of each gene fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme in the coordinate system and smoothing the plotted value, the correction tendency value related to the length of the gene fragment is calculated. The method for analyzing gene copies according to claim 1 or 2, wherein:
前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、
染色体の遺伝子を特定の制限酵素で切断した各々の遺伝子断片に含まれるG及びC塩基の比率に対する測定値を座標系にプロットして、そのプロット値をスムージングすることによって、GC塩基含有率に係る補正傾向値を算出する
ことを特徴とする請求項1ないし3のいずれかに記載の遺伝子コピーの解析方法。
In the correction tendency value calculation step in the gene copy analysis method,
By plotting the measured values for the ratio of G and C bases contained in each gene fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme in the coordinate system, and smoothing the plotted values, it is related to the GC base content. The method of analyzing gene copies according to any one of claims 1 to 3, wherein a correction tendency value is calculated.
前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、
染色体の遺伝子を特定の制限酵素で切断した各々の遺伝断片に対して、連続する20塩基乃至220塩基の範囲から選ばれる特定の長さを有する固定枠を前記遺伝子の端から1塩基ごとに移動させながら得られる、当該固定枠に対応する遺伝子断片に含まれるG及びC塩基の比率の最大値に対する測定値を座標系にプロットして、そのプロット値をスムージングすることによって、当該固定枠のGC塩基含有率に係る補正傾向値を算出する
ことを特徴とする請求項1ないし4いずれかに記載の遺伝子コピーの解析方法。
In the correction tendency value calculation step in the gene copy analysis method,
For each genetic fragment obtained by cleaving a chromosomal gene with a specific restriction enzyme, a fixed frame having a specific length selected from a continuous range of 20 to 220 bases is moved from the end of the gene one base at a time. The measured value for the maximum value of the ratio of G and C bases contained in the gene fragment corresponding to the fixed frame obtained on the coordinate system is plotted in the coordinate system, and the plotted value is smoothed to obtain the GC of the fixed frame. The method of analyzing gene copies according to any one of claims 1 to 4, wherein a correction tendency value related to the base content is calculated.
前記遺伝子コピーの解析方法における前記補正傾向値算出工程において、
ゲノムDNAに相補的なプローブの塩基配列の有するG及びC塩基の比率もしくはハイブリダイゼーション・フリーエネルギーに対する測定値を座標系にプロットして、そのプロット値をスムージングすることによって、ハイブリダイゼーションに係る補正傾向値を算出することを特徴とする請求項1ないし5のいずれかに記載の遺伝子コピーの解析方法。
In the correction tendency value calculation step in the gene copy analysis method,
Plotting the measured values for the ratio of G and C bases or hybridization free energy in the base sequence of the probe complementary to the genomic DNA in the coordinate system, and smoothing the plotted value, the correction tendency related to hybridization 6. The gene copy analysis method according to claim 1, wherein a value is calculated.
前記遺伝子コピーの解析方法において、
前記補正傾向値算出工程において、
各々の染色体の特定部位を検出するプローブセット中のゲノムDNAに完全に相補的なプローブセットのシグナル強度の中間値に対する測定値を座標系にプロットして、そのプロット値をスムージングすることによって、対照サンプルのシグナル強度に係る補正傾向値を算出することを特徴とする請求項1ないし6のいずれかに記載の遺伝子コピーの解析方法。
In the gene copy analysis method,
In the correction tendency value calculation step,
Control by plotting the measured value against the intermediate value of the signal intensity of the probe set perfectly complementary to the genomic DNA in the probe set that detects a specific site of each chromosome and smoothing the plot value 7. The gene copy analysis method according to claim 1, wherein a correction tendency value related to the signal intensity of the sample is calculated.
前記遺伝子コピーの解析方法において、
前記補正傾向値算出工程が、少なくとも最小二乗平均法を用いて各プロットの平均曲線を求め、当該平均曲線について、多項式を用いて近似することにより、各補正傾向値を算出する工程を含むことを特徴とする請求項1ないし7のいずれかに記載の遺伝子コピーの解析方法。
In the gene copy analysis method,
The correction tendency value calculation step includes a step of calculating each correction tendency value by obtaining an average curve of each plot using at least the least mean square method and approximating the average curve using a polynomial. The gene copy analysis method according to any one of claims 1 to 7,
前記遺伝子コピーの解析方法における前記補正因子算出工程が、
前記各補正傾向値から対応する各プローブにおける補正因子を算出する方法が、下記式、
(式)補正因子 = A+ Σ(BkXk+CkXk 2+DkXk 3・・・)
(上記多項式において1次項以上の任意の項数が利用できる。式中のA〜D・・は平均曲線の係数、Xkはk=1〜5がそれぞれ請求項3ないし7に係る補正パラメータ値)
に基づいて算出される工程を含むことを特徴とする請求項8に記載の遺伝子コピーの解析方法。
The correction factor calculation step in the gene copy analysis method comprises:
A method for calculating a correction factor in each corresponding probe from each correction tendency value,
(Formula) Correction factor = A + Σ (B k X k + C k X k 2 + D k X k 3 ...)
(In the above polynomial, any number of terms equal to or higher than the first order term can be used. A to D in the equation are coefficients of an average curve, and X k is a correction parameter value according to claims 3 to 7 where k = 1 to 5, respectively. )
The gene copy analysis method according to claim 8, further comprising a step of being calculated based on:
前記遺伝子コピーの解析方法における測定値測定工程において、
プローブがSNPsを識別することができるゲノムタイピングマイクロアレイであり、染色体アレルごとに染色体のゲノムDNA量を測定することを特徴とする請求項1ないし9のいずれかに記載の遺伝子コピーの解析方法。
In the measurement value measurement step in the gene copy analysis method,
The gene copy analysis method according to any one of claims 1 to 9, wherein the probe is a genome typing microarray capable of identifying SNPs, and the amount of genomic DNA of a chromosome is measured for each chromosome allele.
遺伝子コピーの解析方法において、
染色体の遺伝子コピー数を同定する方法が、請求項1ないし9に係る測定値の補正演算結果値を用い、
プロット手段により、物理的な順で並べた染色体の位置に対する補正演算結果値を座標系にプロットした場合に階段状に示されるデータを、抽出手段が抽出する工程、
遺伝子コピー数同定手段が、該補正演算結果値が同一階位に属する2以上の連続する染色体の位置における当該補正演算結果値の平均値が最低である領域を遺伝子コピー数0の領域とする工程、
遺伝子コピー数同定手段が、前記平均値の次に低い領域を遺伝子コピー数1の領域とする工程を含み、染色体の遺伝子コピー数を同定することを特徴とする遺伝子コピーの解析方法。
In the gene copy analysis method,
A method for identifying the gene copy number of a chromosome uses a correction calculation result value of a measurement value according to claims 1 to 9,
A step in which the extraction means extracts the data shown in a staircase when the correction calculation result values for the positions of the chromosomes arranged in physical order are plotted in the coordinate system by the plotting means;
A step in which the gene copy number identification means sets the region where the average value of the correction calculation result values at the position of two or more consecutive chromosomes having the correction calculation result values belonging to the same rank as the lowest is the gene copy number 0 region; ,
A method for analyzing gene copies, wherein the gene copy number identification means includes a step of setting a region having the next lowest average value as a region having a gene copy number 1, and identifying the gene copy number of a chromosome.
前記遺伝子コピーの解析方法における染色体の遺伝子コピー数を同定した結果を表示する方法が、
画像処理手段により、第1染色体から第22染色体、X染色体及びY染色体の全部又はその一部について染色体形状様の再現画像を画像表示手段に表示すると共に、
該再現画像上に、染色体の遺伝子コピー数が増減している領域を対応づけて視覚的に遺伝子コピー数が当該領域で増減していることを表示することを特徴とする請求項10に記載の遺伝子コピーの解析方法。
A method of displaying the result of identifying the gene copy number of the chromosome in the gene copy analysis method,
The image processing means displays chromosome-like reproduction images on the image display means for all or part of the first to 22nd chromosomes, the X chromosome and the Y chromosome,
11. The reproduction image is displayed by associating a region where the gene copy number of the chromosome is increasing or decreasing and visually indicating that the gene copy number is increasing or decreasing in the region. Analysis method of gene copy.
前記遺伝子コピーの解析方法において、
ハプロタイプを同定する方法が、請求項1ないし13に係る測定値の補正演算 結果値を用い、
プロット手段により、物理的な順で並べた染色体の位置に対する補正演算結果値を座標系にプロットした場合に階段状に示されるデータを、抽出手段が抽出する工程、
ハプロタイプ同定手段が、該補正演算結果値が同一階位に属する2以上の連続する複数の染色体の位置をハプロタイプと同定する工程を含みハプロタイプを同定する
ことを特徴とする遺伝子コピーの解析方法。
In the gene copy analysis method,
A method for identifying a haplotype uses a result of correction calculation of measured values according to claims 1 to 13,
A step in which the extraction means extracts the data shown in a staircase when the correction calculation result values for the positions of the chromosomes arranged in physical order are plotted in the coordinate system by the plotting means;
A gene copy analysis method comprising: identifying a haplotype, wherein the haplotype identifying means includes a step of identifying a position of a plurality of two or more consecutive chromosomes whose correction calculation result values belong to the same rank as a haplotype.
前記遺伝子コピーの解析方法におけるハプロタイプを同定した結果を表示する方法が、
画像処理手段により、第1染色体から第22染色体、X染色体及びY染色体の全部又はその一部について染色体形状様の再現画像を画像表示手段に表示すると共に、
該再現画像上に、特定のハプロタイプが存する領域を対応づけて視覚的に当該特定ハプロタイプが当該領域に存することを表示することを特徴とする請求項12に記載の遺伝子コピーの解析方法。
A method of displaying a result of identifying a haplotype in the gene copy analysis method,
The image processing means displays chromosome-like reproduction images on the image display means for all or part of the first to 22nd chromosomes, the X chromosome and the Y chromosome,
13. The gene copy analysis method according to claim 12, wherein a region in which the specific haplotype is present is associated with the reproduced image and the fact that the specific haplotype exists in the region is visually displayed.
前記遺伝子コピーの解析方法において、
前記測定値が、遺伝子を増幅することにより測定されたゲノムDNA量であって、
補正因子算出工程において、複数のパラメータに係る補正傾向値がある場合にはこれらを合算して補正因子を算出する請求項1、3、4、5又は8のいずれかに記載の遺伝子コピーの解析方法。
In the gene copy analysis method,
The measured value is the amount of genomic DNA measured by amplifying the gene,
The gene copy analysis according to any one of claims 1, 3, 4, 5 and 8, wherein, in the correction factor calculation step, when there are correction tendency values related to a plurality of parameters, the correction factors are calculated by adding them together. Method.
染色体のゲノムDNA量、又は2つの異なる若しくは同一の細胞の染色体のゲノムDNA量の比のいずれかの値(以下、測定値と呼ぶ。)を測定した結果を入力する入力手段と、
該測定値を座標系にプロットし、そのプロット値をスムージングすることにより、所定のパラメータに係る補正傾向値を算出する補正傾向値算出手段と、
補正傾向値から補正因子を算出する補正因子算出手段と、
測定値を当該補正因子で補正演算する測定値補正演算手段と
を備えることにより、測定値を補正することを特徴とする遺伝子コピーの解析装置。
An input means for inputting the result of measuring either the value of the genomic DNA amount of the chromosome or the ratio of the genomic DNA amount of the chromosomes of two different or identical cells (hereinafter referred to as a measured value);
A correction tendency value calculating means for calculating a correction tendency value according to a predetermined parameter by plotting the measurement value in a coordinate system and smoothing the plot value;
Correction factor calculating means for calculating a correction factor from the correction tendency value;
A gene copy analysis apparatus, comprising: a measurement value correction calculation unit that corrects and calculates a measurement value with the correction factor.
JP2004260328A 2004-09-07 2004-09-07 Method and system for analyzing gene copy Pending JP2007327743A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004260328A JP2007327743A (en) 2004-09-07 2004-09-07 Method and system for analyzing gene copy
PCT/JP2005/016451 WO2006028152A1 (en) 2004-09-07 2005-09-07 Method of analyzing gene copy and apparatus therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004260328A JP2007327743A (en) 2004-09-07 2004-09-07 Method and system for analyzing gene copy

Publications (1)

Publication Number Publication Date
JP2007327743A true JP2007327743A (en) 2007-12-20

Family

ID=36036434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004260328A Pending JP2007327743A (en) 2004-09-07 2004-09-07 Method and system for analyzing gene copy

Country Status (2)

Country Link
JP (1) JP2007327743A (en)
WO (1) WO2006028152A1 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
ES2704701T3 (en) 2010-01-19 2019-03-19 Verinata Health Inc New protocol for preparing sequencing libraries
EP2526415B1 (en) 2010-01-19 2017-05-03 Verinata Health, Inc Partition defined detection methods
CA2832468C (en) 2011-04-12 2023-10-31 Verinata Health, Inc. Resolving genome fractions using polymorphism counts
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19743301A1 (en) * 1997-09-30 1999-04-01 Metasystems Hard & Software Gm Method for comparing the copy number of nucleic acid sequences
EP1474530A4 (en) * 2002-01-18 2007-07-25 Syngenta Participations Ag Probe correction for gene expression level detection

Also Published As

Publication number Publication date
WO2006028152A1 (en) 2006-03-16

Similar Documents

Publication Publication Date Title
JP7197209B2 (en) DNA size-based analysis
Kerkhof et al. Clinical validation of copy number variant detection from targeted next-generation sequencing panels
KR102384620B1 (en) Methods and processes for non-invasive assessment of genetic variations
CN106715711B (en) Method for determining probe sequence and method for detecting genome structure variation
Garg et al. A survey of rare epigenetic variation in 23,116 human genomes identifies disease-relevant epivariations and CGG expansions
WO2006028152A1 (en) Method of analyzing gene copy and apparatus therefor
Bemmo et al. Gene expression and isoform variation analysis using Affymetrix Exon Arrays
Brahmachary et al. Digital genotyping of macrosatellites and multicopy genes reveals novel biological functions associated with copy number variation of large tandem repeats
US20150203907A1 (en) Genome capture and sequencing to determine genome-wide copy number variation
JP2006519977A (en) Method for identifying DNA copy number changes
Mason-Suares et al. Density matters: comparison of array platforms for detection of copy-number variation and copy-neutral abnormalities
McIver et al. Population-scale analysis of human microsatellites reveals novel sources of exonic variation
Ahsan et al. A survey of algorithms for the detection of genomic structural variants from long-read sequencing data
Tsai et al. Identification of a CCG-Enriched expanded allele in patients with myotonic dystrophy type 1 using amplification-free long-read sequencing
Mansur et al. Analyzing the effects of genetic variation in noncoding genomic regions
Zheng et al. Determination of genomic copy number alteration emphasizing a restriction site-based strategy of genome re-sequencing
Huang et al. An integrated analysis tool for analyzing hybridization intensities and genotypes using new-generation population-optimized human arrays
CN107475420A (en) The pathogenic new gene of sperm disease without a head and its application
JP2023526441A (en) Methods and systems for detection and phasing of complex genetic variants
Mayrhofer et al. Sensitive detection of copy number alterations in samples with low circulating tumor DNA fraction.