KR20030014286A - 유전자발현 데이터의 처리방법 및 처리프로그램 - Google Patents

유전자발현 데이터의 처리방법 및 처리프로그램 Download PDF

Info

Publication number
KR20030014286A
KR20030014286A KR1020027017888A KR20027017888A KR20030014286A KR 20030014286 A KR20030014286 A KR 20030014286A KR 1020027017888 A KR1020027017888 A KR 1020027017888A KR 20027017888 A KR20027017888 A KR 20027017888A KR 20030014286 A KR20030014286 A KR 20030014286A
Authority
KR
South Korea
Prior art keywords
value
background
data
values
computer
Prior art date
Application number
KR1020027017888A
Other languages
English (en)
Inventor
코니시토모카즈
Original Assignee
가부시키가이샤 센탄카가쿠기쥬츠 인큐베이션센터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 센탄카가쿠기쥬츠 인큐베이션센터 filed Critical 가부시키가이샤 센탄카가쿠기쥬츠 인큐베이션센터
Publication of KR20030014286A publication Critical patent/KR20030014286A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

해석장치(10)의 백그라운드 산출부(32)는, DNA칩상에 배치된 스폿의 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻어지는 감산값의 누적도수비에 기초하는 정규확율 그래프가, 소정의 직선성을 구비하는 백그라운드값을 산출한다. 신호강도를 나타내는 값에서 상기 백그라운드값이 감해진 값인 보정신호강도값의 대수변환값은, 정규분포로 된다. 따라서, 이것을 표준화 함으로써 동종의 DNA칩 혹은 이종의 DNA칩으로부터 측정된 데이터의 비교를 행하는 것이 가능하게 된다.

Description

유전자발현 데이터의 처리방법 및 처리프로그램{METHOD FOR PROCESSING GENE EXPRESSION DATA, AND PROCESSING PROGRAMS}
DNA칩이란, 슬라이드글라스 등의 기재상에 복수의 유전자를 다른 스폿으로서 고정시키는 것이다. 예를 들면, 마이크로어레이에는 수천에서 수만의 유전자가 타겟으로서 고정되어 있다. 타겟으로서, 일중쇄의 DNA나 mRNA가 이용된다.
DNA칩의 기재로서, 여러 가지의 코팅을 실시한 유리 등으로 이루어지는 판, 나일론이나 니트로셀룰로오스로 이루어지는 막, 중공사, 반도체재료, 금속재료, 유기물질 등 핵산을 유지할 수 있는 여러 가지의 것이 이용될 수 있다. 또, 타겟으로서 cDNA의 전부 혹은 그 일부를 복제한 것, 게놈DNA의 일부를 복제한 것, 합성DNA 및/또는 합성RNA가 이용될 수 있다. 기재에 타겟을 고정하기 위하여, 포토리소그래피법에 의해 유리판 위에 올리고DNA를 합성하는 방법과, 스포터(spotter) 등을 이용하여 기재에 타겟을 부착하는 방법이 알려져 있다.
이와 같은 DNA칩에, 예를 들면 형광표식을 한 DNA나 RNA(해석대상)를 하이브리드형성시킨다. 타겟과 상보적인 해석대상이 이중쇄를 형성한다. 해석대상에는 형광표식이 붙여져 있기 때문에, 보합결합의 후에, 형광스캐너로 DNA칩을 조작한 화상데이터를 취득할 수 있다. 이와 같이 하여 취득된 화상데이터에 기초하여, 어느 한 항에 기재된 스폿에 이중쇄가 형성되어 있는지를 알 수 있게 된다. 보다 구체적으로는, 얻어진 화상은 보합결합의 결과, 각각의 DNA에 유래하는 스폿이 표시된다. 따라서, 스폿의 위치를 포함하는 소정의 영역의 신호강도를 적분함으로써, 각 스폿의 신호강도를 나타내는 값으로 이루어지는 어레이데이터를 얻을 수 있다.
예를 들면, 수천에서 수만의 타겟이 고정되어 있는 마이크로어레이에 의해, 다수의 유전자발현을 나타내는 어레이데이터를 한번의 실험조작으로 얻을 수 있다. 이 결과, 어느 하나의 유전자발현의 데이터 증식을 측정할 때에, 그 대상으로서 다수의 유전자발현을 나타내는 데이터(신호강도를 나타내는 값)의 평균을 산출하고, 이것에 기초하여 데이터를 표준화하는 것이 일반적이다. 보다 구체적으로는, 실험마다의 발현데이터를 비교하기 전에 데이터를 표준화한다. 예를 들면 Johhanes Schuchhardt등에 의한 "Normalization strategies for cDNA microarrays(Nucleic Acids Research(2000) Vol.28 No.10)"에는, 그 표준화의 일례가 개시되어 있다.
취득된 데이터의 확률분포는 비모수(nonparametric)이다. 그러나, 예를 들면 Todd Richmond 등에 의한 "Chasing the dream: plant EST microarrays(Current Opinion in Plant Biology(2000) Vol.3 pp108-166"에 개시되어 있는 바와 같이, 취득된 데이터를 표준화하기 위하여 Z-표준이나 t-표준, 혹은 각 스폿의 신호강도의 적분값을 전체 수치의 산술평균으로 제하는 방법이 이용되고 있다.
이들은 비모수적 방법은 아니기 때문에, 이와 같은 표준화가 데이터의 정밀도를 현저하게 손상하고 있다는 문제가 있었다.
또 형광스캐너에 의해 취득된 화상에 기초한 어레이데이터는, 반드시 백그라운드성분을 포함한다. 이것은 화상데이터 전체에 존재하는 백그라운드의 신호강도 및, 측정범위와 실제의 스폿의 크기나 형상이 반드시 일치하지 않는 것에 기인한다. 따라서, 취득된 화상데이터의 수치로부터 백그라운드성분을 빼고, 진실의 신호값으로 이루어지는 데이터를 취득하는 것이 정확한 해석을 위하여 중요하게 된다. 다른 방법, 예를 들면 전기신호의 검출, 방사선의 검출에 의해 취득된 어레이데이터에서도 마찬가지이다.
종래, 백그라운드성분을, 특정의 스폿이나 스폿되지 않는 부분의 신호강도를 나타내는 수치에 기초하여, 화소당의 평균값이나 중앙값을 구하고, 그 값에 측정영역의 화소수를 곱함으로써 추정되고 있었다.
또는, Michael Eisen이, "ScanAlyze User Manual(http://rana.lbl.gov/ EisenSoftware.htm)"에 있어서 제안되어 있는 바와 같이, 스폿마다 측정범위의 외측근방의 값에서 백그라운드성분을 추정하는 방법도 알려져 있다.
그러나, 상기 종래의 보정법에 있어서는, 백그라운드값 산출을 위하여 이용되는 스폿이나 화상중의 영역의 상위에 의해, 상기 백그라운드의 추정값은 변화한다. 즉, 상기 상위로부터 여러 가지 백그라운드값이 추정될 가능성이 있고, 어느것이 적절한지를 판단할 수 없다는 문제점이 있었다. 특히, DNA를 스폿한 영역과, 그렇지 않은 영역의 사이에서, 백그라운드값의 차가 커지는 일이 있었다.
본 발명은, DNA칩으로부터 취득된 유전자발현 데이터를, 다른 DNA칩으로부터의 데이터와 비교가능하게 하고, 또 적절한 통계적으로 해석하는 것이 가능하게 되는 방법을 제공하는 것을 목적으로 한다.
본 발명은 다수의 유전자를 스폿으로서 고정시킨 DNA칩으로부터 취득된 유전자발현 데이터를 통계적으로 해석하는 방법에 관한 것이다.
도 1은 본 발명의 제1실시형태에 관한 해석장치의 하드웨어 구성도,
도 2는 본 실시형태에 관한 해석장치의 요부를 나타내는 블록다이어그램,
도 3은 본 실시형태에 관한 해석장치의 백그라운드 산출부에서 실행되는 처리를 나타내는 플로우챠트,
도 4는 본 실시형태에 관한 해석장치의 백그라운드 산출부에서 실행되는 처리를 나타내는 플로우챠트,
도 5a는 대수변환을 설명하는 다이어그램,
도 5b는 변환처리부 및 표준화처리부에서 실행되는 처리를 나타내는 플로우챠트,
도 6은 본 실시형태에 관한 방법으로 취득한 데이터의 막대그래프,
도 7은 비교를 위하여 종래의 방법으로 취득한 데이터의 막대그래프,
도 8은 다른 온도환경에 있어서의 실험으로부터 취득한 어레이데이터의 세트에 대하여, 본 실시형태에 관한 처리를 실시하여, 실험마다 얻어진 규준화된 후의 값을 그래프상에 플롯한 도면,
도 9는 비교를 위하여, 도 7에 나타내는 도수분포에 기초하여 규준화를 실행한 결과를 나타내는 그래프,
도 10의 A∼D는 각각 본 실시형태에 관한 보정법에 따라서 보정된 값에 기초하여 작성된 그래프,
도 11의 A∼D는 각각 종래의 보정법에 따라서 보정된 값에 기초하여 작성된 그래프,
도 12a 및 도 12b는 각각 제2 및 제3실시형태에 관한 해석장치의 요부를 나타내는 블록다이어그램,
도 13은 제2실시형태에 관한 치우침보정연산부에서 실행되는 처리를 나타내는 플로루챠트,
도 14는 제3실시형태에 관한 치우침보정연산부에서 실행되는 처리를 나타내는 플로루챠트,
도 15a 및 도 15b는 각각 본 실시형태에 관한 치우침보정을 실시한 데이터 및 치우침보정을 실시하고 있지 않은 데이터를 비교한 산포도이다.
본 발명자는, DNA칩으로부터 얻어지는 데이터(유전자발현에 의한 발광량을 나타내는 데이터)의 대수값이 정규분포하는 것을 발견하였다. 그래서, 각 값의 대수값을 취함으로써, 따라서 각 스폿의 신호강도를 나타내는 값을 대수변환하고, 이것을 표준화(예를 들면 z-표준화)함으로써, 다른 실험의 결과나 동종의 실험결과를 정확하게 비교하는 것이 가능하게 된다. 또, 대수값이나 표준화된 값을 기억하거나, 혹은 비교연산할 때에 이들 값을 이용하기 때문에, 데이터량을 현저하게 작게 하는 것이 가능하게 된다.
보다 상세하게는, 본 발명의 목적은, DNA칩의 보합결합에 의해 DNA칩상에 배치된 각 스폿의 신호강도를 나타내는 값으로 구성되는 어레이데이터를 처리하여, 해석가능한 데이터를 취득하는 데이터처리방법으로서, 상기 어레이데이터를 취득하는 단계와, 그 어레이데이터를 구성하는 각 스폿의 신호강도를 나타내는 값을 대수변환하는 단계와, 대수변환된 값을 상기 DNA칩의 스폿에 대응하도록 배치한 변환데이터를 생성하는 단계를 구비한 것을 특징으로 하는 데이터 처리방법에 의해 달성된다.
본 발명에 의하면, 대수변환된 값의 군은, 정규분포를 띠므로, DNA칩을 사용한 실험결과의 비교, 실험결과의 해석에 적합하다.
바람직한 실시형태에 있어서는, 또한 상기 대수변환된 값을 주사하여, 그 중앙값을 특정하는 단계와, 각 값으로부터 중앙값을 빼는 단계를 구비하고, 상기 중앙값이 감해진 값으로 이루어지는 변환데이터가 생성된다.
이와 같이 하여 얻어진 변환데이터를, 비교대상으로 되는, 동종의 처리가 실시된 데이터와 감산하여, 스폿마다의 비교결과를 비로 나타내는 것이 가능하게 된다.
다른 바람직한 실시형태에 있어서는, 또한 상기 대수변환된 값을 z-표준화하여 표준화된 값을 산출하는 단계를 구비하고, 표준화된 값으로 이루어지는 변환데이터가 생성된다.
이와 같이 하여 얻어진 변환데이터를, 비교대상으로 되는, 동종의 처리를 실시된 데이터로부터 감산하고, 스폿마다의 비교결과를 차분으로 나타내는 것이 가능하게 된다.
또, 본 발명에 있어서는, 상술한 바와 같이 DNA칩으로부터 얻어지는 데이터가 대수정규분포한다는 견지에 기초하여, 본 발명에 있어서는 보다 적절한 백그라운드값을 구할수 있게 되었다. 특히, 종래 값산출을 위하여 이용하는 스폿이나 화상중의 영역의 상위에 의해, 백그라운드값은 변화하여, 어느 값이 적절한 것인지를 판단할 수 없었다. 본 발명자는 DNA칩의 스폿의 신호강도를 나타내는 값이 대수정규분포한다는 견지에 기초하여, 대수정규분포로 되는 보정값이 적절한 것이라는 것을 발견하였다.
본 발명의 보다 바람직한 실시형태에 있어서는, 또한 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻을 수 있는 감산값의 누적도수비에기초한 정규확률 그래프가, 소정의 직선성을 구비하는 백그라운드값을 산출하는 단계를 구비하고, 해당 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻어지는 값을, 대수변환의 대상으로 한다. 또한, 이 백그라운드값은 양음 어느 하나의 값을 취할 수 있다. 또 이 값이 0으로 되는 경우도 생각할 수 있다.
상기 실시형태에 있어서, 상기 백그라운드값을 산출하는 단계는, 신호강도를 나타내는 값의 최소값을 특정하는 단계와, 상기 최소값을 포함하는 소정의 범위를 설정하는 단계와, 상기 소정의 범위 내를 소정의 수만큼 분할하여, 상한값, 하한값 및 분할에 의해 얻어지는 소정수의 중간값을 백그라운드값 후보로 하여 산출하는 단계와, 각 백그라운드값 후보에 대하여 상기 신호강도를 나타내는 값의 각각으로부터 백그라운드 후보값을 빼서 감산값을 산출하고, 해당 산출값에 기초한 정규확률 그래프를 구하는 단계와, 상기 정규확률 그래프 중, 가장 직선성이 우수한 것에 이용된 백그라운드 후보를 특정하는 단계를 갖고, 특정된 백그라운드 후보에 관한 직선성이 충분하게 되기까지, 상기 상한값 및 하한값의 범위를 변경하고, 다시 백그라운드값 후보의 산출, 정규확률 그래프의 산출, 및 백그라운드 후보의 특정을 반복하는 것이 바람직하다. 상기 소정의 직선성을 나타내는 단계는, 카이제곱 검정을 실행함으로써 실현할 수 있다.
또, 다른 바람직한 실시형태에 있어서는, 상기 백그라운드값을 산출하는 단계가, 상기 신호강도를 나타내는 값을 참조하여, 2이상의 소정의 백분위수에 있는 값을 특정하는 단계와, 상기 2이상의 특정된 값에 기초하여 백그라운드값을 추정하는 단계를 갖고 있다. 여기서, 이용하는 신호강도를 나타내는 값의 범위는, 유효한특정범위, 즉 신호-응답의 직선성이 성립되는 범위인 것이 바람직하다.
보다 바람직하게는, 백그라운드값을 산출하는 단계는, 상기 신호강도를 나타내는 값으로부터 제1 사분위(LQ), 제3 사분위(UQ) 및 중앙값(M)을 구하는 단계와,
x=(UQ*LQ-M2)/(UQ+LQ-2M)
단, UQ+DQ-2M=0일 때, x=0
을 구히고, 구해진 x를 백그라운드값으로 하는 단계를 갖고 있다.
또, 본 발명의 다른 실시형태에 있어서는, DNA칩의 화상 색조의 종방향, 횡방향 혹은 방사상의 치우침을 보정하는 것이 가능하다.
이 실시형태는, 상기 DNA칩의 스폿의 배열에 따라서, 상기 스폿을 복수의 그룹으로 분류하는 단계와, 상기 그룹마다 해당 그룹을 구성하는 스폿에 관한 대수변환값으로부터 그 중앙값을 특정하는 단계와, 상기 대수변환값 각각으로부터 상기 중앙값을 감산하는 단계를 구비하고 있다.
또는, 상기 DNA칩의 스폿의 배열에 따라서, 상기 스폿을 복수의 그룹으로 분류하는 단계와, 상기 그룹마다 해당 그룹을 구성하는 스폿에 관한 신호강도를 나타내는 값으로부터 그 중앙값을 특정하는 단계와, 상기 신호강도를 나타내는 값의 각각을 상기 중앙값으로 나누는 단계를 구비하고 있어도 좋다.
상기 실시형태에 있어서, 분류하는 단계는, 상기 DNA칩중의 1 또는 복수의 열, 혹은 1 또는 복수의 행마다에, 해당 열 혹은 행에 포함되는 스폿에 관한 대수값을 취득하는 단계를 갖고 있어도 좋다.
다른 실시형태에 있어서, 상기 데이터 처리방법을 이용하여, 복수의 스폿의 신호강도를 나타내는 값을 비교하는 방법은, 한쪽의 스폿에 관한 변환데이터의 값을 다른쪽의 스폿에 관한 변환데이터의 값으로 나누는 단계를 구비하고 있다.
또 다른 실시형태에 있어서, 상기 데이터 처리방법을 이용하여, 복수의 스폿의 신호강도를 나타내는 값을 비교하는 방법은, 한쪽의 표준화된 값과 다른쪽의 표준화된 값의 차분값을 산출하는 단계를 구비하고 있다. 여기서는, 또한 상기 차분값의 소정수의 누승을 산출하는 단계를 구비하고 있는 것이 보다 바람직하다.
또 본 발명의 목적은, DNA칩의 보합결합에 의해, DNA칩상에 배치된 각 스폿의 신호강도를 나타내는 값으로 구성되는 어레이데이터를 처리하고, 해석가능한 데이터를 취득하는 데이터 처리방법을, 컴퓨터에 실행시키기 위한 데이터 처리프로그램으로서, 상기 어레이데이터를 취득하는 단계와, 그 어레이데이터를 구성하는 각 스폿의 신호강도를 나타내는 값을 대치변환하는 단계와, 대치변환된 값을 상기 DNA칩의 스폿에 대응하도록 배치한 변환데이터를 생성하는 단계를, 상기 컴퓨터에 실행시키는 것을 특징으로 하는 데이터 처리프로그램에 의해서도 달성된다.
상기 DNA칩의 기재에는, 여러 가지의 코팅을 실시한 유리 등으로 만들어진 판, 나일론이나 니트로셀룰로오스 등을 기재로 하는 막, 중공사, 반도체, 금속, 유기물질 등, 표면에 핵산을 유지할 수 있는 임의의 것을 이용할 수 있다. 또, DNA칩상에는 타겟으로서, cDNA의 전부 혹은 일부의 복제, 게놈DNA의 복제, 합성DNA, 합성RNA 등이 배치된다.
또, 칩을 제작하는데는 핵산을 준비하여 두고, 이것을 흡착, 정전기에 의한결합, 공유결합에 의해 기재상에 배치하는 방법이나, 기재상에서 핵산을 합성하는 방법이 있다. 신호강도를 나타내는 신호의 검출에는, 반도체칩을 이용한 전기적인 방법, 형광이나 방사능을 검출하는 방법 등이 포함된다.
본 발명은, 상기 어떤 기재의 위에 어떤 타겟이 형성된 DNA칩으로부터의 어레이데이터에도 적용할 수 있다. 또, 어떤 방법을 사용하여 취득한 어레이데이터에 대해서도 적용할 수 있다.
또한, 본 명세서에 있어서, DNA칩이란, 기재상에 RNA를 형성한 RNA칩, 마이크로어레이(micro-arrary), 도트블롯(dot-blot), 역노잔(reversed nozan)등, 기재의 위에 핵산이 배치된 임의의 것을 포함한다.
이하, 첨부도면을 참조하여, 본 발명의 실시형태에 대하여 설명을 한다. 도1은 본 발명의 제1실시형태에 관한 해석장치의 하드웨어 구성도이다. 도 1에 나타내는 바와 같이, 해석장치(10)는 CPU(12)와, 마우스나 키보드 등의 입력장치(14)와, CRT 등으로 구성되는 표시장치(16)와, RAM(Random Access Memory)(18)과, ROM(Read Only Memory)(20)과, CD-ROM이나 DVD-ROM 등의 휴대기억매체(23)를 억세스하는 휴대기억매체 드라이브(22)와, 하드디스크장치(24)와, 외부와의 데이터 주고받음을 제어하는 인터페이스(I/F)(26)를 구비하고 있다. 도 1에서 이해할 수 있는 바와 같이, 본 실시형태에 관한 해석장치(10)로서, 퍼스널컴퓨터 등을 이용할 수 있다.
I/F(26)는 하이브리드형성된 DNA칩의 스폿의 발광량을 계측하고, 계측된 발광량에 기초한 데이터를 생성하는 판독기 또는 스캐너(도시하지 않음)나 통신회로에 접속되어 있다. 통신회로는 또한 외부네트워크(예를 들면 인터넷)에 접속되어 있다.
본 실시형태에 있어서, 휴대기억매체(23)에는, 판독기 또는 스캐너로부터의 데이터를 받아들이고, 그 데이터에 대하여 후술하는 필요한 데이터변환처리를 실행하는 프로그램, 및 처리가 실시된 데이터를 해석하기 위한 프로그램이 기억되어 있다. 따라서, 휴대기억매체 드라이브(22)가 휴대기억매체(23)로부터 상기 프로그램을 판독하여, 이것을 하드디스크장치(24)에 기억하고, 이것을 기동함으로써 퍼스널컴퓨터가 해석장치(10)로서 작동하는 것이 가능하게 된다. 혹은, 인터넷 등의 외부네트워크를 통하여 상기 프로그램을 다운로드하여도 좋다.
도 2는, 본 실시형태에 관한 해석장치(10)의 요부를 나타내는 블록다이어그램이다. 도 2에 있어서는, 데이터에 대하여 필요한 데이터변환처리를 나타내는 구성부분이 표시되어 있다. 보다 상세하게는, 해석장치(10)는 데이터버퍼(30)와, 데이터버퍼(30)에 일시적으로 기억된 데이터(베이스 데이터)에 기초하여, 그 백그라운드를 산출하는 백그라운드 산출부(32)와, 백그라운드 산출부(32)에서 얻어진 백그라운드값을 사용하여, 데이터를 보정하는 보정연산부(34)와, 보정된 데이터에 대하여 후술하는 변환을 실시하는 데이터변환부(36)와, 데이터변환이 실시된 데이터를 표준화하는 표준화처리부(38)를 갖고 있다.
데이터버퍼(30)는, RAM(18), 경우에 따라서는 하드디스크장치(24)에 의해 그 기능이 실현된다. 데이터버퍼에는 판독기 또는 스캐너로부터 전달된, 각 스폿의 발광량을 나타내는 데이터, 혹은 판독기 또는 스캐너로부터 전달되어 하드디스크장치(24)의 소정 영역에 미리 기억되어 있던, 각 스폿의 발광량을 나타내는 데이터가 일시적으로 기억된다. 또, 데이터버퍼는 표준화처리부(38)에 의해서 표준화된 데이터를 일시적으로 기억하는 것도 가능하다.
판독기 또는 스캐너로부터는, DNA칩을 CCD카메라 등으로 촬영하여 스폿마다의 신호강도를 적분한 것이 어레이데이터로서 출력된다. 혹은, 판독기 또는 스캐너에 있어서, CCD카메라로 촬영한 화상의 화상데이터에 기초하여, 전처리로서 백그라운드값이 산출되고, 각 화소의 신호강도로부터 백그라운드값이 공제되고, 전처리로서의 백그라운드 보정이 이루어진 화상데이터로부터 스폿마다의 신호강도가 적분되어, 어레이데이터로서 출력되는 경우도 있다. 본 실시형태에 있어서는, 미처리의 어레이데이터, 전처리(백그라운드 보정)가 실시된 데이터의 어느쪽도 이용할 수 있다. 또한, 본 명세서에 있어서, 판독기 또는 스캐너로부터 전달되는 상기 스폿마다의 신호를 누산한 데이터를, 어레이데이터 혹은 본 실시형태에 관한 백그라운드 처리를 실시하기 위한 기초로 되는 데이터라는 의미로 베이스데이터라 칭한다.
상기 해석장치(10)의 백그라운드 산출부(32)에서 실행되는 처리에 대하여 도 3 및 도 4를 참조하여 설명을 추가한다.
백그라운드 산출부(32)는, 우선 데이터버퍼에 기억된 어레이데이터에 포함되는, 스폿마다의 신호강도의 적분값(스폿 적분값)을 주사하고, 그 최소값을 취득한다(단계 301). 이어서, 백그라운드 산출부(32)는 취득한 최소값이 제로(0)인지 아닌지를 판단하여(단계 302), 제로인 경우에는(단계 302에서 예스(Yes)), 후보값 "A"를 "-100", 후보값 "B"를 "100"으로 설정한다(단계 303).스폿 적분값이 "0"인 것은 발광량이 없는 것(상으로서는 검게 표시되어 있는 것)을 의미하고 있다. 실제로는, 스폿의 신호강도의 적분값이 "0"인 것은 측정의 불비, 혹은 이미 다른 방법으로 백그라운드값이 빠져 있는 것을 의미한다. 이와 같은 경우에는, 소정의 음의 값을 후보값 "A"로 하고, 소정의 양의 값을 후보값 "B"로 하여, 적절한 백그라운드값을 찾아내기 위한 출발점으로 하고 있다.
이것에 대하여, 단계 302에서 노(No)라 판단된 경우에는, 백그라운드 산출부(32)는 후보값 "A"를 최소값의 절반(1/2·(최소값)), 후보값 "B"를 최소값의 2배(2·(최소값))로 설정한다(단계 304). 또한, 후보값 "A"란 백그라운드값을 특정하기 위하여 처리에서 이용하는 상한값을 의미하고, 후보값 "B"는 하한값을 의미한다.
이어서, 백그라운드 산출부(32)는, 후보값 "A"와 후보값 "B"의 사이를 9등분하고, 또한 8개의 후보값을 취득한다(단계 305). 예를 들면 최소값이 "20"이고, 후보값 "A"가 "10", 후보값 "B"가 "40"이면 이하의 값이 후보값으로 된다.
후보값 "C1"=13.33
후보값 "C2"=16.67
후보값 "C3"=20.00
후보값 "C4"=23.33
후보값 "C5"=26.67
후보값 "C6"=30.00
후보값 "C7"=33.33
후보값 "C8"=36.67
이와 같이 하여 총계 10개의 후보값이 얻어진다.
또한, 베이스데이터(즉 어레이데이터)에 있어서 스폿 적분값에서 각 후보값을 뺀다. 이것에 의해 후보값에 관련된 10세트의 스폿 적분값군을 얻을 수 있다. 이 스폿 적분값군을 각각 보정데이터 후보라 칭한다.
이어서, 백그라운드 산출부(32)는, 각 보정데이터 후보를 구성하는 스폿 적분값의 대수값을 얻고, 그 누적도수비를 취득한다(단게 307). 이 누적도수비를 플롯하여 10개의 정규확률 그래프가 작성된다(단계 308). 백그라운드 산출부(32)는,정규확률 그래프 각각에 대하여, 최소제곱법 등을 사용하여 그래프의 직선성을 검정한다(단계 309). 10개의 정규확률 그래프 중, 가장 직선성이 양호한 것에 대하여 이용된 후보값이 특정된다(단계 401). 이것이 후보값 "A"이면(단계 402에서 예스(Yes)), 백그라운드 산출부(32)는 후보값 "A"의 1/3(1/3·(후보값 "A"))을 새로운 후보값 "A"로 설정하고, 또한 후보값 "B"의 1/3(1/3·(후보값 "B"))를 새로운 후보값 "B"로 설정한다(단계 403). 여기서는 후보값을 찾아내기 위한 범위를 하측으로 (작게)이동하고 있다.
그 한쪽의, 해당 후보값이 후보값"B"인 경우에는(단계 404에서 예스(Yes)), 백그라운드 산출부(32)는 후보값 "A"를 3배로 한 것(3·(후보값 "A"))을 새로운 후보값 "A"로 설정하고, 또한 후보값 "B"를 3배로 한 것(3·(후보값 "B"))를 새로운 후보값 "B"로 설정한다(단계 405). 이것은 후보값을 찾아내기 위한 범위를 상측으로 이동한 것을 의미하고 있다.
그리고, 후보값이 상기 후보값 "A" 혹은 후보값 "B"가 아닌 경우(단계 404에서 노(No), 또한 단계 405에서 노(No))에는, 또한 얻어진 정규확률 그래프가 만족할 만한 직선성을 구비하고 있는지 아닌지를 판단한다(단계 406). 본 실시형태에 있어서, "만족할 만한 직선성"을 판단하기 위하여, 예를 들면 의미있는 수준을 5%로 한 χ2(카이제곱) 검정을 행하고 있다. 그러나 이것에 한정되는 것은 아니고, 다른 방법을 이용하여도 좋으며, 조작자가 자기의 판단으로 직선성이 만족할 만한 것임을 판단하여도 좋다.
단계 406에서 노(No)라 판단된 경우에는, 후보값 "A"가 단계 401에서 특정된 후보값보다 작은 후보값 중, 특정된 후보값에 인접하는 것으로 설정된다(단계 407). 또 후보값 "B"는 단계 401에서 특정된 후보값보다 큰 후보값 중, 특정된 후보값에 인접하는 것으로 설정된다(단계 408).
예를 들면, 위에 열거한 후보값 "C1"∼후보값 "C8"에 있어서, 단계 401에서 후값 "C3"이 특정되었지만, 그 후보값을 스폿 적분값군에서 현재한 값을 이용한 규정확률 그래프에 대하여, 만족할 만한 직선성이 얻어지지 않았다고 생각할 수 있다. 이 경우에는, 후보값 "C2"가 새로운 후보값 "A"로 되고, 후보값 "C5"가 새로운 후보값 "B"로 된다. 즉, 단계 407, 408에서는 보다 적절한 후보값을 찾아내기 위하여 후보값을 찾아내기 위한 범위를 좁히고 있다.
단계 403, 단계 405, 또는 단계 407 및 408에 있어서, 새로운 후보값 "A" 및 후보값 "B"가 얻어지면, 단계 305 이하의 처리가 반복된다. 이것에 대하여, 정규확률 그래프가 만족할 만한 직선성을 구비하고 있는 경우에는(단계 406에서 예스(yes)), 이 정규확률 그래프를 얻기 위하여 이용된 후보값이 백그라운드값으로 결정된다(단계 409).
이어서, 보정연산부(34)가 어레이데이터를 구성하는 각 신호누산값으로부터, 단계 409에서 취득된 백그라운드값을 뺀 것을 산출한다. 단, 본 실시형태에 있어서는, 최종적으로 백그라운드값이 얻어지기 직전에 실행된 단계 306에 있어서, 10세트의 보정데이터 후보 중의 1세트가, 각 신호누산값에서 백그라운드값을 뺀 것이다. 따라서, 이와 같은 보정데이터 후보가 데이터버퍼(30)에 기억되어 있으면, 보정연산부(34)는 새로운 연산을 하지 않고 데이터버퍼(30)로부터 적절한 보정데이터 후보를 판독하면 된다.
백그라운드값이 빠진 신호누산값(보정신호누산값)으로 구성된 보정데이터는, 변환처리부(36)에 전달된다. 변환처리부(36)는 각 보정신호누산값을 대수변환하여, 변환된 신호누산값을 얻는다. 도 5a는 변환처리부(36)에서 실행되는 처리의 개략을 나타내는 도면이다. 도 5a에 나타낸 바와 같이, 백그라운드값이 감산된 보정신호누산값으로 이루어지는 표형식 데이터영역(30-1)으로부터, 차례로 보정신호누산값 "aij"이 취출되고 대수변환되어(부호 500 참조), 변환후의 표형식 데이터영역(30-2)의 대응하는 위치에, 대수변환이 실시된 값(대수변환값) "1naij"가 배치된다.
또한, 도 3의 단계 306 및 단계 307에 있어서, 보정데이터 후보 및 보정데이터 후보를 구성하는 보정신호누산값의 대수변환값이 산출되어 있다. 따라서 선택된 백그라운드값에 관련되는 대수변환값이, 데이터버퍼(30)에 기억되어 있으면, 변환처리부(36)는 보정신호누산값에 대수변환을 실시할 필요는 없고, 데이터버퍼 중의 데이터를 판독시키면 족하다.
이와 같이 하여 대수변화값군이 얻어지면, 변환처리부(36) 및 표준화처리부(38)에 의해 도 5b에 나타내는 처리가 실행된다.
여기서는, 변환처리부(36)는 계급의 수나 클래스의 폭을 설정하여(단계 501), 도수분포표를 생성한다(단계 502). 본 실시형태에 있어서는, 이 도수분포표에 기초한 그래프가 생성되고, 이것이 표시장치(16)의 화면상에 표시된다(단계 503). 이 단계 503 및 후술하는 단계 505는, 본 실시형태에 관한 방법의 정확함을 검증하기 위하여 설치하고 있다.
도 6은, 이와 같이 하여 얻어진 화상의 예이다. 도 6에 있어서 횡축은, 보정신호누산값을 대수변환한 것(대수변환값), 종축은 그 도수를 나타내고 있다. 도 6에 나타내는 예에 있어서는, 벼의 cDNA 라이브러리에서 중복을 피하여 무작위로 선택하고, 핀당 32×10의 매트릭스에 스폿한 마이크로어레이(cDNA칩)를 이용하였다. 이 마이크로어레이에 있어서, 유효한 스폿의 총수는 1157이었다. 보합결합의 타겟제작에는 벼엽초 유래의 poly(A)RNA를 주형으로 사용하여, cy5로 표식한 cDNA를 합성하였다. 또 보합결합의 결과는 ArrayScanner V4.4(Moloecular Dynamics사 제품)를 사용하여 화상으로서 취득하고, 이것을 Array Vision(Moloecular Dynamics사 제품) 프로그램을 사용하여 수치화 하였다.
또, 도 6에 있어서는 산술평균을 포함하는 계급을 검게 칠한 그래프로 나타내고 있다. 도 7은 비교를 위하여, 동일 어레이데이터에 기초한 막대그래프를 나타낸 것이다. 도 6 및 도 7에서, 어레이데이터 자체는 비모수인 것에 대하여, 어레이데이터로부터 얻은 대수변환값이 모수인 것을 이해할 수 있을 것이다.
본 실시형태에 있어서는, 또한 데이터의 비교를 가능하게 하기 위하여, 표준화처리부(38)가 취득한 도수분포에 기초하여, 데이터를 z-표준화(규준화) 한다(단계 504). 이것에 의해 그래프의 횡축 및 종축을, 어레이데이터의 종별 등에 관계없이 공통으로 할 수 있어, 데이터간의 비교가 가능하게 된다.
도 8은 도 6의 막대그래프를 얻기 위하여 이용한 마이크로어레이(cDNA칩)를 이용하여, 다른 온도환경에 있어서의 실험에서 취득한 어레이데이터의 세트에 대하여, 본 실시형태에 관한 처리를 실시하여, 실험마다 얻어진 규준화된 후의 값을 1장의 그래프상에 플롯한 것이다.
도 8에 있어서, 동일한 형상의 점(예를 들면 X표, △표)은, 동일 실험으로 취득된 것을 나타내고 있다. 도 8에 나타낸 바와 같이, 그래프상의 점은 가는 선으로 나타내는 표준분포곡선과 대략 겹치고 있고, 모수적인 방법을 이용하는 것의 타당성이 표시되어 있다. 도 9의 굵은 꺾은 선은 비교를 위하여 도 7에 나타내는 도수분포에 기초하여 규준화를 실행한 결과를 나타내는 그래프이다. 도 9의 가는 선은 표준분포곡선을 나타낸다. 도 9에서, 이와 같은 형상의 막대그래프에서는 모수적인 방법이 적합하지 않은 것을 이해할 수 있을 것이다.
이와 같이 하여, 표준화처리부(38)에 의해 z-표준화가 실시된 데이터(표준화 데이터)는, 데이터버퍼(30)에 기억된다. 이 표준화 데이터를 사용하여 여러 가지 해석, 실험의 검증 등을 하는 것이 가능하게 된다.
이와 같이, 본 실시형태에 의하면, DNA칩 등의 각 스폿의 신호강도를 나타내는 적분값의 대수값이 정규분포한다는 것을 발견하고, 이 발견에 기초하여 백그라운드값을 산출하고 있다. 또 상기 발견으로부터, 적분값(혹은 백그라운드 보정이 이루어진 적분값)을 대수변환하고, 또한 z-표준화를 실시함으로써, 표준화 데이터를 취득하고 있다. 따라서, 이 표준화 데이터를 이용하여 이종 혹은 동종의 실험결과를 용이하게 비교하고, 실험의 검증을 행하는 것이 가능하게 된다.
또, 본 실시형태에 관한 백그라운드 보정에 의하면, 화상데이터에 있어서의 스폿의 잘라내기작업을 현저하게 저감하는 것이 가능하게 된다. 종래, CCD카메라로 촬영된 화상중의 스폿의 영역은, 판독기 또는 스캐너에 짜넣어진 소프트웨어 등에 의해, 어느 정도 특정된다. 그러나, 실제로는 스폿과, 신호강도의 값을 적분하기 위하여 잘라내진 영역이 적절히 중합되어 있지 않는 것이 많다. 따라서, 연구자는 화상을 참조하여 스폿마다에 스폿과 중합되는 원형의 영역을 설정할 필요가 있었다. 이것은 수시간 내지는 하루를 요하는 작업이었다. 본 실시형태에 관한 백그라운드 보정을 이용하면, 어레이를 각 셀의 면적이 같아지고 또한 각 셀에 스폿이 포함되도록, 매트릭스 형상으로 구획지어 해당 셀에 있어서의 신호강도의 적분값을 취득하면 된다. 또는 각각의 면적이 같고, 또한 스폿을 포함하는(즉 스폿보다 큰) 원형영역에서, 스폿 및 그 주변의 각각의 신호강도를 나타내는 값을 적분하면 된다.
이것은 면적이 같으면 백그라운드값은, 각 셀 내지 각 원형영역에서 일정하다고 생각되는 것, 및 보정된 신호적분값의 대수값이 정규분포로 되는 백그라운드값을 산출하고 있는 것에서 실현된다.
또한, 본 실시형태에 관한 백그라운드값을 이용한 보정결과를 이하에 설명한다. 본 출원인은, 스탠포드대학에서 공개되어 있는, 복수의 생물종에 기초한 복수의 발현데이터(http://genome-www4.stanford/edu/MicroArray/SMD에서 공개되고, 또 공개데이터의 개요는 Gavin Sherlock 외의 "The Microarrary Database(Nucleic Acids Research 29, pp152-155(2001년))"에도 게재되어 있다.)로부터, 4개를 무작위로 추출하였다. 여기서는 실험No.5733, 실험No.1300, 실험No.5745 및 실험No.7428을 이용하고 있다. 실험No.7428에 대해서는 채널 2를 이용하고, 다른 실험에 대해서는 채널 1의 데이터를 이용하였다.
실험마다 그 값의 대수값을 z-표준화하고나서 층별화하고, 얻어진 값을 정규확률지에 플롯하고 있다. 도 10의 A∼D부분은, 각각 실험No.5733, 실험No.1300, 실험No.5745 및 실험No.7428(채널 2)에 대하여, 본 실시형태에 관한 보정법(도 3 및 도 4 참조)에 따라서 보정된 값으로부터 얻어진 그래프이다. 이들 도면에서, 그래프가 충분한 직선성을 구비하고 있다. 이것은, 표준화한 결과가 정규분포되어 있는 것을 나타내고 있다.
도 11의 A∼D부분은, 종래의 보정법(상술한 Michael Eisen에 의한 방법)에 기초하여 보정된 것으로부터, 마찬가지로 실험마다 그 값의 대수값을 z-표준화 하고나서 층별화하고, 얻어진 값을 정규확률지에 플롯하여 얻어진 그래프이다. 이들 도면에서 실험No.7438의 채널 2를 제외하면, 그래프의 직선성이 낮고, 충분히 보정되어 있지 않는 것을 나타내고 있다.
다음에, 본 발명의 제2실시형태에 대하여 설명을 한다. 제2실시형태에 있어서는, 마이크로어레이의 기재의 평탄성 문제 등으로부터 보합결합이 불균일하게 되는 것에 기인하는 데이터의 치우침을 보정할 수 있다.
보합결합 후의 마이크로칩에서 얻은 화상에 있어서, 예를 들면 중앙부가 보다 희게 보이고, 주변으로 감에 따라서 검게 보여지는 것이 있다. 혹은, 좌우 혹은 상하방향에서, 전체의 색조가 서서히 변화되는 형상으로 되어 있는 것도 있다. 이것은 예를 들면 어레이베이스부에 이용하고 있는 유리의 변형 등에 의해 발생한다.
그래서, 제2실시형태에 있어서는, 보합결합이 이상적으로 행해졌다면, 어레이중, 각 열 혹은 각 행의 신호적분값의 중앙값이 개략 도일하게 된다는 가정을 하고, 각 열 혹은 각 행에 공통하는 데이터의 보정정수를 구하여, 이것을 이용하여 신호값에 더 보정을 실시하고 있다.
도 12a는 제2실시형태에 관한 해석장치의 요부를 나타내는 블록다이어그램이다. 도 12a에 있어서, 도 2에 나타내는 구성부분과 동일한 것에는 동일한 부호를 붙이고 있다. 도 12a에 나타낸 바와 같이, 제2실시형태에 관한 해석장치는 보정연산부(34)와 변환처리부(36) 사이에 치우침보정연산부(40)가 설치되어 있다.
도 13은 제2실시형태에 관한 치우침보정연산부(40)에서 실행되는 처리를 나타내는 플로우챠트이다. 치우침보정연산부(40)는, 변환처리부(36)에 의해 얻어진 백그라운드가 감해진 신호적분값의 대수값군을 취득한다.
이어서, 치우침보정연산부(40)는, 마이크로어레이의 행 및 열을 나타내는 정보에 기초하여, 해당 대수값군을, 열마다의 그룹으로 분류한다(단계 1302). 각 그룹에 대하여 소정의 보정정수를 구함으로써 치우침보정이 실현된다.
치우침보정연산부(40)는, 제1열(열번호=1(부호 1303 참조))에 속하는 대수값에 기초하여, 그 중앙값을 특정하고(단계 1304), 각 대수값에서 중앙값을 빼서 치우침보정값을 산출한다(단계 1305). 즉, 그 중앙값이 열에 있어서의 치우침보정을 위한 보정정수로 된다. 단계 1304 및 단계 1305에 나타내는 처리는, n개의 열의 모두에 대하여 실행된다(단계 1306, 1307 참조).
이와 같이 하여, 얻어진 치우침보정값군에 대하여 표준화처리부(38)에 있어서 표준화가 실시된다. 본 실시형태에 관한 치우침보정을 실시한 데이터, 및 치우침보정을 실시하고 있지 않은 데이터를 비교한 산포도를, 각각 도 15a 및 도 15b에 나타낸다. 여기서는, 마이크로어레이로서, 벼 cDNA를 스폿하여, 각각이 32열 12행의 그리드를 12개 구비한 매트릭스를, 2세트 붙인 것을 이용하였다. 이 마이크로어레이에 벼 배양세포에 유래하는 cy5로 표식한 cDNA를 하이브리드형성하였다.
도 15b는 제1실시형태에 관한 방법에서, 세트마다에 백그라운드값을 산출하고, 이것을 이용하여 값을 보정하며, 또한 대수변환 및 표준화를 실시한 데이터에 기초한 산포도이다. 도 15a는 제2실시형태에 관한 방법에서, 치우침보정을 행한 데이터에 기초한 산포도이다. 이들 도면에 있어서, 2개의 가는 직선은 각각 x축의 값과 비교하여 y축의 값이 21/2배(루트 2배), 및 (1/2)1/2배(루트 (1/2)배)인 것을 나타내고 있다. 두개의 세트는, 동일한 어레이칩상에 설치된 한쌍의 스폿의 결과에 유래하는, 동일한 보합결합이기 때문에, 원리적으로는 X=Y의 직선상에 각 점이 위치한다. 도 15a 및 도 15b를 참조하면, 치우침보정에 의해 데이터의 흩어짐이 적게 되어 있는 것을 이해할 수 있다.
이와 같이, 본 실시형태에 의하면, 보합결합의 불균일 등에 기인하는 값의 변경을 적절히 보정하는 것이 가능하게 된다.
다음에, 제3실시형태에 대하여 설명을 추가한다. 제3실시형태에 있어서는, 제2실시형태에 관한 치우침보정을 변경한 것이다. 도 12b는 제3실시형태에 관한 해석장치의 요부를 나타내는 블록다이어그램이다. 도 12b에 있어서도, 도 2에 나타내는 구성부분과 동일한 것에는 동일한 부호를 붙이고 있다. 제3실시형태에 있어서는, 데이터버퍼(30)와 백그라운드 산출부(32) 사이에 치우침보정연산부(42)가 재재되고, 백그라운드값의 산출에 앞서서 어레이데이터를 구성하는 신호적분값에 대하여, 치우침보정이 실시된다.
도 14는 제3실시형태에 관한 치우침보정의 처리를 나타내는 플로우챠트이다. 도 14에 나타내는 바와 같이, 치우침보정연산부(42)는, 데이터버퍼로부터 신호적분값의 군을 취득하면(단계 1401), 이것을 마이크로어레이의 초 및 열을 나타내는 정보에 기초하여, 열마다의 그룹으로 분류한다(단계 1402). 이어서, 치우침보정연산부(42)는 제1열(열번호=1(부호 1403 참조))에 속하는 적분값에 기초하여 그 중앙값을 특정하고(단계 1404), 각 적분값을 중앙값으로 나누어서 치우침보정값을 산출한다(단계 1405). 즉, 여기서도 중앙값이 열에 있어서의 치우침보정을 위한 보정정수로 된다.
단계 1404 및 단계 1405에 나타내는 처리는, n개의 열의 모두에 대하여 실행된다(단계 1406, 1407 참조). 이와 같이 하여 얻어진 치우침보정값군에 대하여 백그라운드 산출부(32)에 있어서의 백그라운드값의 산출이 실행된다.
다음에, 본 발명에 관한 데이터의 비교에 대하여 설명을 추가한다. 제1 내지 제3실시형태에 있어서는, 보정된 신호적분값을 대수변환하여 대수값을 취득하고, 또한 해당 대수값을 표준화한 값(표준값)을 산출하고 있다.
이들 표준값을 사용함으로써 이하와 같은 비교가 가능하게 된다.
본 실시형태에 의하면, 상기 표준값을 이용하여 RNA 량의 비, 즉 유전자발현의 비율을 찾아내는 것이 가능하게 된다. 예를 들면, 어느 스폿의 표준값과, 다른 스폿의 표준값의 차를 구하고, 이것에 표준편차를 곱하여, 그 값의 10의 누승을 취함으로써, 상술한 비율을 구하는 것이 가능하다. 스폿에 관한 표준값(z스코어)이 "1"인 것과 "2"인 것 사이의, 유전자발현 비율의 상위를, 예를 들면 상용대수를 사용하면 이하의 식으로 표현되는 바와 같이 정량화할 수 있다.
10^{(2-1)*0.5}≒3.1
(여기서 0.5는 대수값의 표준편차)
즉, (대수의 밑)^{(표준값의 차)*(대수값의 표준편차)}라는 형태로 비율의 상위를 나타내는 것이 가능하게 된다.
이와 같은 비교는, 동일한 DNA칩상의 다른 스폿간, 다른 DNA칩상의 동일한 유전자의 스폿간 등, 임의의 스폿간에서 이루는 것이 가능하다. 스폿간의 비교를 정량화할 수 있음으로써 어느 유전자가 어느정도 많이 발현되어 있는지, 실험동안에 어느 유전자가 어느정도 증가하고 있는지 등을 적절히 파악하는 것이 가능하게 된다.
본 발명은, 이상의 실시형태에 한정되는 것이 아니고, 특허청구의 범위에 기재된 본 발명의 범위 내에서 여러 가지의 변경이 가능하며, 그들도 본 발명의 범위 내에 포함되는 것임은 말할 필요도 없다.
예를 들면, 본 실시형태에 의하면, 스폿의 신호강도의 최소값을 포함하는 소정의 범위를 설정하고, 시행개량법에 의해 백그라운드값을 산출하고 있지(도 3 참조)만, 이것에 한정되는 것은 아니다. 상기 신호강도를 나타내는 값의 제1 사분위(Lower Quartile:LQ)와, 제3 사분위(Upper Quartile:UQ)와, 중앙값(Median:M)을 이용하여, 강한 추정을 행하여도 좋다. 이상적으로 보정된 후에는, 중앙값을 사이에 두고 각 사분위는 대칭의 위치로 되기 때문에, 백그라운드값(x)은 이하의 식으로 주어진다.
1n(UQ-x)-1n(M-x)=1n(M-x)-1n(LQ-x)
이것을 풀면,
x=(UQ*LQ-M2)/(UQ+LQ-2M)
단, UQ+DQ-2M=0일 때, X=0
로 된다. 이 x를 각 스폿의 신호강도를 나타내는 값(신호적분값)에서 빼는 것으로, 보정된 신호적분값을 취득하여도 좋다.
혹은, 마찬가지의 방법으로, 다른 백분위수, 예를 들면 제3 사분위(UQ)와 중앙값(M)을 이용하여 백그라운드값을 추정하여도 좋다. 또한, 보다 많은 백분위수를 사용하여 백그라운드값(x)을 구하고, 그들의 평균값을 취득함으로써 상기 추정값의 정밀도를 높일 수 있다. 정규분포에 있어서, 백분위수와 z(제터)스코어란, 1대1로 대응하기 때문에 z스코어의 차가 같아지게 될 임의의 2개의 백분위수의 조합을 이용하여, 상술한 식과 동일한 방정식을 세워 이것을 풀이함으로써, 백그라운드값(x)을 구할 수 잇다.
또한, 본 실시형태에 있어서 백그라운드값을 산출하기 위하여 이용하는 신호적분값의 범위는, 보합결합 실험 및, 판독기나 스캐너의 특성을 포함한 일련의 측정의 계에 있어서 신호-응답에 직선성이 성립하는 범위로 하여도 좋다.
또, 도 3에 나타내는 처리에 있어서, 신호적분값의 최소값을 포함하는 소정의 범위를 설정하고 있지만, 이것에 한정되는 것은 아니다. 예를 들면,
백그라운드값/(신호적분값의 중앙값)=c(일정)
인 것을 생각할 수 있고,
백그라운드값=c*(중앙값)
의 c를 구하기 위하여 동일한 처리를 실행하여도 좋다.
또, 제2실시형태 및 제3실시형태에 있어서는, 스폿을 마이크로어레이중의 1 또는 복수의 열로 이루어지는 그룹으로 분류하고 있지만, 이것에 한정되는 것은 아니고, 1 또는 복수의 행으로 이루어지는 그룹으로 분류하여도 좋은 것은 말할 필요도 없다. 또, 먼저 설명한 바와 같이, 화상의 색조가 어레이의 외연부로부터 중앙부를 향해서 서서히 변화되는 형상으로 되어 있는 경우도 있다. 이와 같은 경우에는 크기를 차례로 겹쳐 넣는 형상으로 되는 복수의 중공의 사각형으로, 마이크로어레이를 분할하고, 각 사각형에 포함되는 스폿의 신호적분값을 동일한 그룹에 속하도록 하여, 그룹마다의 치우침보정량을 산출하여도 좋다.
또, 상기 실시형태에 있어서는, 표준화로서 z-표준화를 이용하고 있지만, 이것에 한정되는 것은 아니고, 다른 표준화를 적용할수 있는 것도 말할 필요도 없다.
본 발명은, 동종의 DNA칩에 대하여 조건을 변경한 실헝결과의 비교, 이종의DNA칩의 실험결과의 비교 등 다양한 비교에 이용할 수 있다. 예를 들면, 본 출원인은 벼를 저온에서 발아시켰을 때에 작용하는 유전자를, 1만정도의 유전자군 중에서 스크리닝하고 있었다. 여기서 독립된 유전자의 단편을 1만종류 붙인 마이크로어레이를 사용하여, 예를 들면
a) 따뜻한 곳에서 발아된 벼
b) 그것을 저온에 노출시킨 것
이라는 2종류의 조직에서 RNA를 채취하고, 각각 보합결합을 행하였다. 실험은 RNA마다 2회 행하였다. 각각의 실험결과로서, 1만개의 숫자의 나열(상대값)이 얻어진다. 이들 숫자의 나열을 비교하는 적절한 방법이 없는 것이 현상이었다. 본 실시형태에 의하면, 상기 a), b)의 각각의 조건에 의한 실험결과에 기초하여, 표준화된 데이터를 얻고, 대응하는 스폿의 값을 감산함으로써 저온에 노출되었을 때에 축적량이 증가 혹은 감소하는 mRNA를 발견하고, 목적의 유전자를 스크리닝할 수 있었다.
또한, 표준화한 데이터이면, DNA칩의 차이, 생물종의 차이 등을 초월한 비교가 가능하다. 예를 들면, 상기 실험a)에 있어서, "열쇼크 단백질"이라는 1군의 단백질 유전자가 2∼3 standard unit 정도의 양으로 검출되었다. 그런데, 이들 단밸질은 표준적인 육성방법을 한 아기장대라는 식물의 조직으로부터는 항상 0(제로) Standard unit정도의 값으로서 검출된다. 이 차는, 우연이나 종간차로는 설명하기 어려운 크기였다. 이 결과는, a)의 실험계가 "너무 더웠다"는 것을 나타내고 있었다. 따라서, 최초의 실험의 계를 좀더 차게 함으로써, 스크리닝을 보다 정확하게행하는 것을 발견하는 것이 가능하였다.
이와 같이, 본 발명에 의하면, 사용하는 어레이는 동일하지 않은 경우에도 적용가능하다. 또, 비교하기 전의 데이터의 형식이나 자리수 정렬에 의한 제한이 없다. 또한, 예를 들면 사람과 쥐의 비교 등, 종을 초월한 비교가 가능하게 된다.
종을 초월한 비교가 가능한 것은, 본 발명이 약제의 분야에서 응용가능한 것을 나타낸다. 예를 들면, 쥐에서 현저한 약효가 있는 물질이 사람에는 효과가 없었다고 생각할 수 있다. 여기서는, 건강한 쥐에 물자를 투여하였을 때에 어느 장기의 어레이패턴과, 건강한 사람의 동일 장기에 있어서의 유사한 물질에 의한 어레이패턴을 비교함으로써, 유사한 물질군의 일차 스크리닝이 가능하게 된다.

Claims (28)

  1. DNA칩의 보합결합에 의해, DNA칩상에 배치된 각 스폿의 신호강도를 나타내는 값으로 구성되는 어레이데이터를 처리하여 해석가능한 데이터를 취득하는 데이터 처리방법으로서,
    상기 어레이데이터를 취득하는 단계;
    해당 어레이데이터를 구성하는 각 스폿의 신호강도를 나타내는 값을 대수변환하는 단계; 및
    대수변환된 값을 상기 DNA칩의 스폿에 대응하도록 배치한 변환데이터를 생성하는 단계를 구비한 것을 특징으로 하는 데이터 처리방법.
  2. 제1항에 있어서, 상기 대수변환된 값을 주사하여 그 중앙값을 특정하는 단계; 및
    각 값에서 중앙값을 빼는 단계를 더 구비하고, 상기 중앙값이 감해진 값으로 이루어지는 변환데이터가 생성되는 것을 특징으로 하는 데이터 처리방법.
  3. 제1항에 있어서, 상기 대수변환된 값을 z-표준화하여, 표준화된 값을 산출하는 단계를 더 구비하고, 표준화된 값으로 이루어지는 변환데이터가 생성되는 것을 특징으로 하는 데이터 처리방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻어지는 감산값의 누적도수비에 기초한 정규확률 그래프가, 소정의 직선성을 구비하는 백그라운드값을 산출하는 산출하는 단계를 더 구비하고,
    해당 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것에 의해 얻어진 값을, 대수변환의 대상으로 하는 것을 특징으로 하는 데이터 처리방법.
  5. 제4항에 있어서, 상기 백그라운드값을 산출하는 단계가,
    신호강도를 나타내는 값의 최소값을 특정하는 단계;
    상기 최소값을 포함하는 소정의 범위를 설정하는 단계;
    상기 소정의 범위 내를, 소정의 수만큼 분할하여, 상한값, 하한값 및 분할에 의해 얻어지는 소정수의 중간값을 백그라운드값 후보로서 산출하는 단계;
    각 백그라운드값 후보에 대하여, 상기 신호강도를 나타내는 값의 각각으로부터 백그라운드 후보값을 빼서 감산값을 산출하고, 해당 감산값에 기초한 정규확률 그래프를 구하는 단계; 및
    상기 정규확률 그래프 중, 가장 직선성이 우수한 것에 이용된 백그라운드 후보를 특정하는 단계를 갖고,
    특정된 백그라운드 후보에 관한 직선성이 충분하게 될 때까지, 상기 상한값 및 하한값의 범위를 변경하고, 다시 백그라운드값 후보의 산출, 정규확률 그래프의 산출 및 백그라운드 후보의 특정을 반복하는 것을 특징으로 하는 데이터 처리방법.
  6. 제4항 또는 제5항에 있어서, 상기 소정의 직선성을 나타내는 단계가,
    카이제곱 검정을 실행하는 단계를 갖는 것을 특징으로 하는 데이터 처리방법.
  7. 제4항에 있어서, 상기 백그라운드값을 산출하는 단계가,
    상기 신호강도를 나타내는 값을 참조하여, 2이상의 소정의 백분위수에 있는 값을 특정하는 단계; 및
    상기 2이상의 특정된 값에 기초하여, 백그라운드값을 추정하는 단계를 구비한 것을 특징으로 하는 데이터 처리방법.
  8. 제7항에 있어서, 상기 소정의 백분위수에 있는 값을 특정하는 단계가,
    상기 신호강도를 나타내는 값을 참조하여, 제1 사분위(LQ), 제3 사분위(UQ) 및 중앙값(M)을 구하는 단계를 포함하고, 또한,
    상기 백그라운드값을 추정하는 단계가,
    백그라운드값(x)=(UQ*LQ-M2)/(UQ+LQ-2M)
    단, UQ+LQ-2M=0일 때, x=0
    를 구하는 단계를 포함하는 것을 특징으로 하는 데이터 처리방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 DNA칩의 스폿의 배열에 따라서 상기 스폿을 복수의 그룹으로 분류하는 단계;
    상기 그룹마다, 해당 그룹을 구성하는 스폿에 관한 대수변환값으로부터 그 중앙값을 특정하는 단계; 및
    상기 대수변환값의 각각으로부터, 상기 중앙값을 감산하는 단계를 더 구비한 것을 특징으로 하는 데이터 처리방법.
  10. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 DNA칩의 스폿 배열에 따라서 상기 스폿을 복수의 그룹으로 분류하는 단계;
    상기 그룹마다, 해당 그룹을 구성하는 스폿에 관한 신호강도를 나타내는 값으로부터 그 중앙값을 특정하는 단계; 및
    상기 신호강도를 나타내는 값의 각각을, 상기 중앙값으로 나누는 단계를 더 구비한 것을 특징으로 하는 데이터 처리방법.
  11. 제9항 또는 제10항에 있어서,
    상기 분류하는 단계가,
    상기 DNA칩중의 1 또는 복수의 열, 혹은 1 또는 복수의 행마다, 해당 열 혹은 행에 포함되는 스폿에 관한 대수값을 취득하는 단계를 갖는 것을 특징으로 하는 데이터 처리방법.
  12. 제2항에 기재된 데이터 처리방법을 이용하여, 복수의 스폿의 신호강도를 나타내는 값을 비교하는 방법으로서,
    한쪽의 스폿에 관한 변환데이터의 값을, 다른쪽의 스폿에 관한 변환데이터의 값으로 나누는 단계를 구비한 것을 특징으로 하는 방법.
  13. 제3항에 기재된 데이터 처리방법을 이용하여, 복수의 스폿의 신호강도를 나타내는 값을 비교하는 방법으로서,
    한쪽의 표준화된 값과 다른쪽의 표준화된 값의 차분값을 산출하는 단계를 구비한 것을 특징으로 하는 방법.
  14. 제13항에 있어서, 상기 차분값의 소정수의 누승을 산출하는 단계를 더 구비한 것을 특징으로 하는 방법.
  15. DNA칩의 보합결합에 의해 DNA칩상에 배열된 각 스폿의 신호강도를 나타내는 값으로 구성되는 어레이데이터를 처리하고, 해석가능한 데이터를 취득하는 데이터 처리방법을 컴퓨터로 실행시키기 위한 데이터 처리프로그램으로서,
    상기 어레이데이터를 취득하는 단계;
    그 어레이데이터를 구성하는 각 스폿의 신호강도를 나타는 값을 대수변환하는 단계; 및
    대수변환된 값을, 상기 DNA칩의 스폿에 대응하도록 배치한 변환데이터를 생성하는 단계를, 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  16. 제15항에 있어서, 또한, 상기 대수변환된 값을 주사하여, 그 중앙값을 특정하는 단계; 및
    각 값에서 중앙값을 빼는 단계를 상기 컴퓨터로 실행시키고, 이것에 의해 상기 중앙값이 감해진 값으로 이루어지는 변환데이터가 생성되는 것을 특징으로 하는 데이터 처리프로그램.
  17. 제16항에 있어서, 또한, 상기 대수변환된 값을 z-표준화하고, 표준화된 값을 산출하는 단계를 상기 컴퓨터로 실행시키며, 이것에 의해 표준화된 값으로 이루어지는 변환데이터가 생성되는 것을 특징으로 하는 데이터 처리프로그램.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서, 또한, 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻어지는 감산값의 누적도수비에 기초한 정규확률 그래프가, 소정의 직선성을 구비하는 백그라운드값을 산출하는 단계를 상기 컴퓨터로 실행시키고, 그 컴퓨터에 있어서, 상기 신호강도를 나타내는 값의 각각에서 백그라운드값을 빼는 것으로 얻어지는 값을, 대수변환의 대상으로 하도록 동작시키는 것을 특징으로 하는 데이터 처리프로그램.
  19. 제18항에 있어서, 상기 백그라운드값을 산출하는 단계에 있어서,
    신호강도를 나타내는 값의 최소값을 특정하는 단계;
    상기 최소값을 포함하는 소정의 범위를 설정하는 단계;
    상기 소정의 범위 내를 소정의 수만큼 분할하여, 상한값, 하한값 및 분할에 의해 얻어지는 소정수의 중간값을 백그라운드값 후보로서 산출하는 단계;
    각 백그라운드값 후보에 대하여, 상기 신호강도를 나타내는 값의 각각으로부터 백그라운드 후보값을 빼서 감산값을 산출하고, 해당 감산값에 기초한 정규확률 그래프를 구하는 단계; 및
    상기 정규확률 그래프 중, 가장 직선성이 우수한 것에 이용된 백그라운드 후보를 특정하는 단계를 상기 컴퓨터로 실행시키고, 또한,
    특정된 백그라운드 후보에 관한 직선성이 충분하게 되기까지 상기 상한값 및 하한값의 범위를 변경하여, 다시 백그라운드값 후보의 산출, 정규확률 그래프의 산출 및 백그라운드 후보의 특정을, 상기 컴퓨터로 반복시키는 것을 특징으로 하는 데이터 처리프로그램.
  20. 제18항 또는 제19항에 있어서, 상기 소정의 직선성을 나타내는 단계에 있어서,
    카이제곱 검정을 실행하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  21. 제18항에 있어서, 상기 백그라운드값을 산출하는 단계에 있어서,
    상기 신호강도를 나타내는 값을 참조하여 2이상의 소정의 백분위수에 있는 값을 특정하는 단계; 및
    상기 2이상의 특정된 값에 기초하여, 백그라운드값을 추정하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  22. 제21항에 있어서, 상기 백그라운드값을 산출하는 단계에 있어서,
    상기 신호강도를 나타내는 값으로부터 제1 사분위(LQ), 제3 사분위(UQ) 및 중앙값(M)을 구하는 단계; 및
    x=(UQ*LQ-M2)/(UQ+LQ-2M)
    단, UQ+LQ-2M=0일 때, x=0
    를 구하고, 구해진 x를 백그라운드값으로 하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  23. 제14항 내지 제22항 중 어느 한 항에 있어서, 또한, 상기 DNA칩의 스폿 배열에 따라서 상기 스폿을 복수의 그룹으로 분류하는 단계;
    상기 그룹마다, 해당 그룹을 구성하는 스폿에 관한 대수변환값으로부터 그 중앙값을 특정하는 단계; 및
    상기 대수변환값의 각각으로부터 상기 중앙값을 감산하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  24. 제15항 내지 제22항 중 어느 한 항에 있어서, 또한, 상기 DNA칩의 스폿의 배열에 따라서 상기 스폿을 복수의 그룹으로 분류하는 단계;
    상기 그룹마다, 해당그룹을 구성하는 스폿에 관한 신호강도를 나타내는 값으로부터 그 중앙값을 특정하는 단계; 및
    상기 신호강도를 나타내는 값의 각각을 상기 중앙값으로 나누는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  25. 제24항 또는 제25항에 있어서, 상기 분류하는 단계에 있어서, 상기 DNA칩중의 1 또는 복수의 열, 혹은 1 또는 복수의 행마다에, 해당 열 혹은 행에 포함되는 스폿에 관한 대수값을 취득하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 데이터 처리프로그램.
  26. 복수의 스폿의 신호강도를 나타내는 값을 비교하기 위하여 컴퓨터를 동작시키는 프로그램으로서,
    제16항에 기재된 데이터 처리프로그램을 구성하는 단계를 상기 컴퓨터로 실행시키고, 또한,
    한쪽의 스폿에 관한 변환데이터의 값을 다른쪽의 스폿에 관한 변환데이터의 값으로 나누는 단계를 컴퓨터로 실행시키는 것을 특징으로 하는 프로그램.
  27. 복수의 스폿의 신호강도를 나타내는 값을 비교하기 위하여 컴퓨터를 동작시키는 프로그램으로서,
    제17항에 기재된 데이터 처리프로그램을 구성하는 단계를 상기 컴퓨터로 실행시키고, 또한,
    한쪽의 표준화된 값과 다른쪽의 표준화된 값의 차분값을 산출하는 단계를 컴퓨터로 실행시키는 것을 특징으로 하는 프로그램.
  28. 제27항에 있어서, 또한, 상기 차분값의 소정수의 누승을 산출하는 단계를 상기 컴퓨터로 실행시키는 것을 특징으로 하는 프로그램.
KR1020027017888A 2000-06-28 2001-06-04 유전자발현 데이터의 처리방법 및 처리프로그램 KR20030014286A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2000193680 2000-06-28
JPJP-P-2000-00193680 2000-06-28
JPJP-P-2001-00024990 2001-02-01
JP2001024990 2001-02-01

Publications (1)

Publication Number Publication Date
KR20030014286A true KR20030014286A (ko) 2003-02-15

Family

ID=26594816

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027017888A KR20030014286A (ko) 2000-06-28 2001-06-04 유전자발현 데이터의 처리방법 및 처리프로그램

Country Status (6)

Country Link
US (1) US20030182066A1 (ko)
EP (1) EP1313055A4 (ko)
JP (1) JPWO2002001477A1 (ko)
KR (1) KR20030014286A (ko)
AU (1) AU2001260704A1 (ko)
WO (1) WO2002001477A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100601980B1 (ko) * 2005-01-04 2006-07-18 삼성전자주식회사 유전자형 데이터 분석 방법 및 장치

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020183936A1 (en) * 2001-01-24 2002-12-05 Affymetrix, Inc. Method, system, and computer software for providing a genomic web portal
EP1474530A4 (en) * 2002-01-18 2007-07-25 Syngenta Participations Ag CORRECTION OF PROBES FOR THE DETECTION OF GENE EXPRESSION LEVELS
AU2003211240A1 (en) * 2002-02-21 2003-09-09 Ajinomoto Co., Inc. Gene expression data analyzer, and method, program and recording medium for gene expression data analysis
US20050096850A1 (en) * 2003-11-04 2005-05-05 Center For Advanced Science And Technology Incubation, Ltd. Method of processing gene expression data and processing program
US20060194215A1 (en) * 2005-02-28 2006-08-31 Kronick Mel N Methods, reagents and kits for reusing arrays
US20070116376A1 (en) 2005-11-18 2007-05-24 Kolterman James C Image based correction for unwanted light signals in a specific region of interest
WO2008056693A1 (fr) * 2006-11-08 2008-05-15 Akita Prefectural University Procédé de traitement de données de micro-réseau d'adn, dispositif de traitement et programme de traitement
WO2008062855A1 (en) * 2006-11-21 2008-05-29 Akita Prefectural University A method of detecting defects in dna microarray data
US8473217B1 (en) 2007-10-31 2013-06-25 Pathwork Diagnostics, Inc. Method and system for standardization of microarray data
US7747547B1 (en) 2007-10-31 2010-06-29 Pathwork Diagnostics, Inc. Systems and methods for diagnosing a biological specimen using probabilities
WO2009076600A2 (en) * 2007-12-12 2009-06-18 New York University System, method and computer-accessible medium for normalizing databases through mixing
WO2018199293A1 (ja) * 2017-04-27 2018-11-01 節三 田中 植物の特性を増強する方法及び無核果実の生産方法
JP6300215B1 (ja) * 2017-04-27 2018-03-28 節三 田中 植物の特性を増強する方法
JP6716140B6 (ja) * 2017-10-10 2020-07-29 節三 田中 植物の特性を増強する方法
CN112819751B (zh) * 2020-12-31 2024-01-26 珠海碳云智能科技有限公司 多肽芯片检测结果的数据处理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6502039B1 (en) * 2000-05-24 2002-12-31 Aventis Pharmaceuticals Mathematical analysis for the estimation of changes in the level of gene expression

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100601980B1 (ko) * 2005-01-04 2006-07-18 삼성전자주식회사 유전자형 데이터 분석 방법 및 장치

Also Published As

Publication number Publication date
WO2002001477A1 (fr) 2002-01-03
AU2001260704A1 (en) 2002-01-08
US20030182066A1 (en) 2003-09-25
EP1313055A4 (en) 2004-12-01
JPWO2002001477A1 (ja) 2004-03-04
EP1313055A1 (en) 2003-05-21

Similar Documents

Publication Publication Date Title
US6980677B2 (en) Method, system, and computer code for finding spots defined in biological microarrays
KR20030014286A (ko) 유전자발현 데이터의 처리방법 및 처리프로그램
Yang et al. Comparison of methods for image analysis on cDNA microarray data
Jain et al. Fully automatic quantification of microarray image data
US7317820B2 (en) System and method for automatically identifying sub-grids in a microarray
US7412085B2 (en) Method of extracting locations of nucleic acid array features
Balagurunathan et al. Simulation of cDNA microarrays via a parameterized random signal model
Baird et al. Normalization of microarray data using a spatial mixed model analysis which includes splines
US20030087289A1 (en) Image analysis of high-density synthetic DNA microarrays
US7099502B2 (en) System and method for automatically processing microarrays
US20070071300A1 (en) Method and system for automatic vision inspection and classification of microarray slides
Bajcsy An overview of DNA microarray image requirements for automated processing
CN104115190B (zh) 用于在图像中减去背景的方法和系统
KR102048599B1 (ko) 판정 방법, 판정 장치, 판정 시스템 및 프로그램
WO2006030822A1 (ja) 遺伝子発現データの処理方法、および、処理プログラム
EP1788523B1 (en) Image based correction for unwanted light signals in a specific region of interest
JP4266575B2 (ja) 遺伝子発現データの処理方法および処理プログラム
KR100437253B1 (ko) 마이크로어레이 모사 이미지 생성 시스템 및 그 방법
US7363169B2 (en) Simulating microarrays using a parameterized model
US20050096850A1 (en) Method of processing gene expression data and processing program
WO2001027809A2 (en) Visualizing relations in data sets
KR20100111098A (ko) 마이크로어레이의 데이터 스팟의 위치를 검출하는 방법 및 장치
US20230316054A1 (en) Machine learning modeling of probe intensity
EP1583020A2 (en) Program, method and device for analysis of the time-series data obtained by DNA array method
Davies et al. DNA microarray stochastic model

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application