KR101489536B1 - A Gene Expression Data Marker Identification Method for Two Groups - Google Patents

A Gene Expression Data Marker Identification Method for Two Groups Download PDF

Info

Publication number
KR101489536B1
KR101489536B1 KR20100139605A KR20100139605A KR101489536B1 KR 101489536 B1 KR101489536 B1 KR 101489536B1 KR 20100139605 A KR20100139605 A KR 20100139605A KR 20100139605 A KR20100139605 A KR 20100139605A KR 101489536 B1 KR101489536 B1 KR 101489536B1
Authority
KR
South Korea
Prior art keywords
gene
sample
expression data
gene expression
marker
Prior art date
Application number
KR20100139605A
Other languages
Korean (ko)
Other versions
KR20120077593A (en
Inventor
이건명
이찬희
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR20100139605A priority Critical patent/KR101489536B1/en
Publication of KR20120077593A publication Critical patent/KR20120077593A/en
Application granted granted Critical
Publication of KR101489536B1 publication Critical patent/KR101489536B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

본 발명에서는 유전자발현 데이터를 사용하여 두 개의 샘플집단을 구별할 수 있는 유전자 마커와 마커에 대한 정확도 정보를 분석자의 개입 없이 찾아내는 방법 즉, 두 개의 샘플집단에 대한 유전자발현 데이터가 주어질 때, 두 집단을 구분하는 유전자 마커를 식별하는 방법에 있어서, 유전자별로 발현정도의 평균값이 0이 되도록 정규화하는 과정 단계와, 발현정도의 값을 기호로 변화하는 단계를 거쳐, 샘플집단을 분할할 때 복잡도로 최소로 하는 유전자를 매 단계별 마커로 선정하고, 이 마커를 기준으로 샘플집단을 분할하는 과정을 반복하여, 최종적으로 남은 분할되지 않은 샘플집단들을 특징짓는 유전자 패턴으로 마커집합을 구성하고, 정확도를 결정하여 유전자발현 데이터를 식별하는 방법에 관해 개시된다.In the present invention, when gene expression data for two sample groups are given, the method of finding the accuracy information of genetic markers and markers capable of distinguishing two sample groups using gene expression data without analyzer intervention, that is, The method comprising the steps of: normalizing the average value of the degree of expression for each gene to zero, and changing the value of the degree of expression to a symbol, , And the process of dividing the sample group based on the marker is repeated to construct a marker set with a gene pattern characterizing the remaining unsegmented sample groups and determine the accuracy A method for identifying gene expression data is disclosed.

Description

두 개 집단을 구별하는 유전자발현 데이터 마커 식별 방법{A Gene Expression Data Marker Identification Method for Two Groups}A Gene Expression Data Marker Identification Method for Two Groups < RTI ID = 0.0 >

본 발명은 데이터 마커 식별방법에 관한 것으로, 보다 상세하게는 두 샘플집단에 대한 유전자발현 데이터로부터 두 집단을 구별하는 마커를 식별해 내는 방법에 관한 것이다.The present invention relates to a method of identifying a data marker, and more particularly, to a method for identifying a marker that distinguishes two groups from gene expression data for two sample populations.

본 발명은 두 샘플집단에 대한 유전자발현 데이터로부터 두 집단을 구별하는 데 사용될 수 있는 마커를 식별해 내는 방법에 관한 것으로 데이터 분석 기술에 속한다.The present invention pertains to data analysis techniques for identifying markers that can be used to distinguish between two populations from gene expression data for two sample populations.

종래의 상기와 같은 데이터 마커 식별방법은 수치로 표현된 유전자발현 데이터에서 두 샘플집단 간에 발현차이를 보이는 유전자를 확인하여, 의미 있다고 판단되는 유전자를 분석자가 직접 선택하여 마커로 결정하는 것이다. 그러나 이러한 방법은 정확하지 못할 뿐 아니라 비경제적이었다.Conventionally, the above-described data marker identification method identifies a gene showing a difference in expression between two sample groups in gene expression data represented by numerical values, and the analyzer directly selects a gene determined to be significant and determines it as a marker. However, this method was not only inaccurate but also uneconomical.

본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위한 것으로서, 유전자발현 데이터를 사용하여 두 개의 샘플집단을 구별할 수 있는 유전자 마커와 마커에 대한 정확도 정보를, 분석자의 개입이 없이 찾아내는 방법을 제공하는 데 그 목적이 있다.Disclosure of Invention Technical Problem [8] Accordingly, the present invention has been made in view of the above problems, and it is an object of the present invention to provide a method of detecting accuracy of gene markers and markers capable of discriminating two sample groups using gene expression data without involvement of analysts The purpose is to do.

본 발명은 상기와 같은 본 발명의 목적을 달성하기 위하여 두 개의 샘플집단에 대한 유전자발현 데이터가 주어질 때, 두 집단을 구분하는 유전자 마커를 식별하는 방법에 있어서, 유전자별로 발현정도의 평균값이 0이 되도록 정규화하는 과정 단계와, 발현정도의 값을 기호로 변화하는 단계를 거쳐, 샘플집단을 분할할 때 복잡도로 최소로 하는 유전자를 매 단계별 마커로 선정하고, 이 마커를 기준으로 샘플집단을 분할하는 과정을 반복하여, 최종적으로 남은 분할되지 않은 샘플집단들을 특징짓는 유전자 패턴으로 마커집합을 구성하고, 정확도를 결정하여 유전자발현 데이터를 식별하는 방법을 제공한다.In order to achieve the object of the present invention, the present invention provides a method for identifying a genetic marker that distinguishes two groups when gene expression data for two sample groups are given, wherein the average value of the degree of expression is 0 And a step of changing the value of the degree of expression to a symbol to select a gene having a minimum complexity when dividing a sample group into a plurality of step markers and dividing the sample group based on the marker And repeating the process to construct a marker set with a gene pattern characterizing the remaining unsegmented sample groups and determining the accuracy to identify the gene expression data.

본 발명에 의하면 두 개 샘플집단에 대한 유전자발현 데이터들이 주어질 때, 두 집단을 구분할 수 있는 유전자 마커집합을 복잡한 형태도 포함하는 마커더 찾을 수 있어서, 바이오마커를 유전자발현 데이터 수준에서 찾을 때 등에 효과적으로 적용될 수 있다.According to the present invention, when gene expression data for two sample groups are given, it is possible to find a marker including a complicated form of a set of genetic markers capable of distinguishing between two groups, so that when a biomarker is found at the level of gene expression data, Can be applied.

도 1은 본 발명에 따른 입력과 발명의 방법의 결과물 간의 관계를 도시한 도면.
도 2는 본 발명에 따른 유전자발현 데이터로부터 주어진 두 집단을 구별하는 마커를 식별하는 방법을 알고리즘 형태로 도시한 도면.
도 3은 본 발명에 따라 전체 샘플집단이 단계에 따라 선택된 유전자의 기호값에 의해 분할되는 과정을 도시한 도면.
도 4는 본 발명을 설명할 때 사용된 기호를 정리한 도면.
BRIEF DESCRIPTION OF THE DRAWINGS Figure 1 shows the relationship between the input according to the invention and the result of the inventive method;
Figure 2 shows in algorithm form a method for identifying markers that distinguish two given groups from gene expression data according to the present invention.
Fig. 3 is a diagram showing a process in which a whole sample group is divided according to a symbol value of a selected gene according to the present invention. Fig.
4 is a diagram summarizing symbols used when explaining the present invention.

이하에서는 첨부 도면을 참조하여 본 발명을 보다 상세히 설명한다.Hereinafter, the present invention will be described in more detail with reference to the accompanying drawings.

먼저, 도 1은 본 발명에 따른 방법의 구성 요소를 표현하는 것으로, 유전자발현 데이터(10)에 대해서 본 발명에 따른 두 집단을 구별하는 마커 식별 알고리즘을 이용한 방법(20)에 따라 식별된 유전자 마커를 제공하는 부분(30)으로 구성된다.First, FIG. 1 represents the components of a method according to the present invention, in which a genetic marker identified according to a method 20 using a marker identification algorithm that distinguishes two groups according to the invention for gene expression data 10, (30).

도 2는 본 발명에 따른 유전자발현 데이터로부터 두 샘플집단을 구별하는 마커를 식별하는 방법(20)을 구체적인 알고리즘으로 표현한 것이다. 이 방법은 먼저 유전자발현 데이터

Figure 112010087842521-pat00001
를 각 유전자별로 평균값이 0이 되도록 하기의 식 1로 변환하여 정규화된 데이터
Figure 112010087842521-pat00002
을 생성한다(201). 정규화된 데이터
Figure 112010087842521-pat00003
을 하기 식 2를 사용하여 기호로 변환된 유전자발현 데이터
Figure 112010087842521-pat00004
를 생성한다(202). 유전자 집합의 각 유전자
Figure 112010087842521-pat00005
별로 전체 샘플집합
Figure 112010087842521-pat00006
에 대해서, 하기 식 3을 사용하여 분할복잡도
Figure 112010087842521-pat00007
을 계산한다(203). 분할복잡도
Figure 112010087842521-pat00008
을 가장 적게 하는 유전자
Figure 112010087842521-pat00009
를 첫번째 분할 유전자
Figure 112010087842521-pat00010
으로 선택한다(204). 유전자
Figure 112010087842521-pat00011
을 기준으로 샘플집합
Figure 112010087842521-pat00012
를 하기 식 4를 이용하여
Figure 112010087842521-pat00013
로 분할한다(205). 분할된 샘플집합
Figure 112010087842521-pat00014
의 각각에 대해서 하기 식 5를 이용하여 분류복잡도
Figure 112010087842521-pat00015
을 계산한다(206). 분류복잡도가 지정된 임계값
Figure 112010087842521-pat00016
보다 작은 샘플집합
Figure 112010087842521-pat00017
이나, 포함된 샘플의 개수가 미리 지정한 임계값
Figure 112010087842521-pat00018
보다 작은 샘플집합
Figure 112010087842521-pat00019
은 더 이상 분할할 필요가 없는 것으로, 집합
Figure 112010087842521-pat00020
에 원소로서 추가하고, 추가되는
Figure 112010087842521-pat00021
에 대응되는 마커 정보를 하기 식 6과 같이 마커집합
Figure 112010087842521-pat00022
에 추가한다(207). 집합
Figure 112010087842521-pat00023
에 추가되지 않는 샘플집합들은 하기 식 7을 사용하여 샘플집합
Figure 112010087842521-pat00024
를 구성한다(208). 샘플집합
Figure 112010087842521-pat00025
에 대해서 유전자 집합의 각 유전자
Figure 112010087842521-pat00026
별로 하기 식 3을 사용하여 분할복잡도
Figure 112010087842521-pat00027
을 계산한다(209). 분할복잡도
Figure 112010087842521-pat00028
을 가장 적게 하는 유전자
Figure 112010087842521-pat00029
를 두번째 분할 유전자
Figure 112010087842521-pat00030
으로 선택한다(210). 유전자
Figure 112010087842521-pat00031
을 기준으로 집합
Figure 112010087842521-pat00032
에 포함되지 않은 샘플집합
Figure 112010087842521-pat00033
를 하기 식 8과 같이
Figure 112010087842521-pat00034
로 분할한다(211). 분할된 샘플집합들에 대해서 위의 단계 (206)부터의 과정을 더 이상 분할할 샘플집합이 없어지거나, 미리 지정한 마커 유전자 개수에 도달할 때까지 반복한다(212). 최종적인 마커집합
Figure 112010087842521-pat00035
은 두 샘플집단을 구별하는 마커로 사용될 수 있는 유전자와 대응되는 기호값 및, 해당 조건을 만족할 때 분류될 집단이름, 정확도 정보를 포함하게 되고, 마커집합
Figure 112010087842521-pat00036
에 대한 정확도는 하기 식 9로 계산한다(213).Figure 2 is a specific algorithmic representation of a method 20 for identifying markers that distinguish two sample groups from gene expression data according to the present invention. In this method, gene expression data
Figure 112010087842521-pat00001
Is converted into the following expression 1 so that the average value of each gene is 0, and the normalized data
Figure 112010087842521-pat00002
(201). Normalized data
Figure 112010087842521-pat00003
Using the following expression 2: < EMI ID =
Figure 112010087842521-pat00004
(202). Each gene in the gene set
Figure 112010087842521-pat00005
Not a whole sample set
Figure 112010087842521-pat00006
, Using the following Equation 3,
Figure 112010087842521-pat00007
(203). Partition complexity
Figure 112010087842521-pat00008
The least
Figure 112010087842521-pat00009
The first segmented gene
Figure 112010087842521-pat00010
(204). gene
Figure 112010087842521-pat00011
Sample set
Figure 112010087842521-pat00012
Using the following equation 4
Figure 112010087842521-pat00013
(205). Split sample set
Figure 112010087842521-pat00014
≪ / RTI > for each of < RTI ID = 0.0 >
Figure 112010087842521-pat00015
(206). If the classification complexity is a specified threshold
Figure 112010087842521-pat00016
Smaller sample set
Figure 112010087842521-pat00017
Or if the number of included samples exceeds a predetermined threshold
Figure 112010087842521-pat00018
Smaller sample set
Figure 112010087842521-pat00019
Is no longer required to be partitioned,
Figure 112010087842521-pat00020
As an element, and the added
Figure 112010087842521-pat00021
The marker information corresponding to the marker group
Figure 112010087842521-pat00022
(207). set
Figure 112010087842521-pat00023
Are added to the sample set < RTI ID = 0.0 >
Figure 112010087842521-pat00024
(208). Sample set
Figure 112010087842521-pat00025
For each gene in the gene set
Figure 112010087842521-pat00026
Using the following equation 3, the partition complexity
Figure 112010087842521-pat00027
(209). Partition complexity
Figure 112010087842521-pat00028
The least
Figure 112010087842521-pat00029
The second segmented gene
Figure 112010087842521-pat00030
(210). gene
Figure 112010087842521-pat00031
Based on
Figure 112010087842521-pat00032
Sample set not included in
Figure 112010087842521-pat00033
As shown in Equation 8 below
Figure 112010087842521-pat00034
(Step 211). For the divided sample sets, the process from step 206 above is repeated until no more sets of samples are to be divided, or the number of marker genes specified beforehand is reached (212). The final set of markers
Figure 112010087842521-pat00035
Includes a symbol value corresponding to a gene that can be used as a marker for distinguishing two sample groups, a group name and an accuracy information to be classified when the condition is satisfied,
Figure 112010087842521-pat00036
Is calculated by the following equation (213).

도 4는 식 1과 식 9까지에서 사용되는 표기법의 의미를 설명한 것이다.FIG. 4 illustrates the meaning of the notation used in Equations 1 and 9.

식 1은 각 유전자별로 평균값이 0이 되도록 유전자 발현정도값을 변환하는 식이다.Equation 1 is a formula for converting the gene expression level value so that the average value of each gene is zero.

식 2는 발현정도값으로 표현된 데이터를 기호로 변환하기 위해 사용하는 변환 규칙을 나타내는 식이다.Equation 2 is an expression that represents a transformation rule used to transform data represented by an expression level value into a symbol.

식 3은 샘플집합

Figure 112010087842521-pat00037
를 유전자
Figure 112010087842521-pat00038
의 기호값인
Figure 112010087842521-pat00039
에 따라 분할할 때, 각 분할에 샘플집합
Figure 112010087842521-pat00040
Figure 112010087842521-pat00041
에 포함되는 샘플들이 어떤 분포로 섞여있는지 측정하는 복잡도를 계산하는 식이다.Equation 3 is the sample set
Figure 112010087842521-pat00037
Gene
Figure 112010087842521-pat00038
The symbolic value of
Figure 112010087842521-pat00039
, A sample set
Figure 112010087842521-pat00040
Wow
Figure 112010087842521-pat00041
And the complexity of measuring the distribution of the samples included in the distribution.

식 4는 전체 샘플집합

Figure 112010087842521-pat00042
를 유전자
Figure 112010087842521-pat00043
의 기호값인
Figure 112010087842521-pat00044
에 따라 각각
Figure 112010087842521-pat00045
로 분할한 것을 보인 식이다.Equation 4 shows the total sample set
Figure 112010087842521-pat00042
Gene
Figure 112010087842521-pat00043
The symbolic value of
Figure 112010087842521-pat00044
Respectively
Figure 112010087842521-pat00045
As shown in Fig.

식 5는 샘플집합

Figure 112010087842521-pat00046
에 샘플집합
Figure 112010087842521-pat00047
Figure 112010087842521-pat00048
에 포함되는 샘플들이 어떤 분포로 섞여있는지 측정하는 복잡도를 계산하는 식이다.Equation 5 is a set of samples
Figure 112010087842521-pat00046
Sample set in
Figure 112010087842521-pat00047
Wow
Figure 112010087842521-pat00048
And the complexity of measuring the distribution of the samples included in the distribution.

식 6은 집합

Figure 112010087842521-pat00049
에 포함된 각 샘플집합
Figure 112010087842521-pat00050
에 대응하는 마커로서, 첫 번째 선택된 유전자
Figure 112010087842521-pat00051
부터
Figure 112010087842521-pat00052
번째 선택된 유전자
Figure 112010087842521-pat00053
까지의 기호값인
Figure 112010087842521-pat00054
와, 이 조건을 만족할 때 속하는 원래 샘플집단 이름
Figure 112010087842521-pat00055
, 이 마커를 사용하여 판정할 때의 정확도
Figure 112010087842521-pat00056
로 구성된 마커 정보들의 집합
Figure 112010087842521-pat00057
을 나타내는 식이다.Equation 6 is the set
Figure 112010087842521-pat00049
Each sample set contained in
Figure 112010087842521-pat00050
As the marker corresponding to the first selected gene
Figure 112010087842521-pat00051
from
Figure 112010087842521-pat00052
Th selected gene
Figure 112010087842521-pat00053
Which is the symbol value
Figure 112010087842521-pat00054
And the name of the original sample group that belongs when this condition is satisfied
Figure 112010087842521-pat00055
, The accuracy of judgment using this marker
Figure 112010087842521-pat00056
A set of marker information
Figure 112010087842521-pat00057
.

식 7은

Figure 112010087842521-pat00058
번째 단계에서 추가적으로 분할이 필요한 샘플집합들의 원소로 구성된 집합을 나타내는 식이다.Equation 7
Figure 112010087842521-pat00058
The second step is an expression that represents a set of elements of sample sets that need to be further segmented.

식 8은

Figure 112010087842521-pat00059
번째 단계의 분할샘플집합이,
Figure 112010087842521-pat00060
번째 마커유전자
Figure 112010087842521-pat00061
의 값을 기준으로 분할되어,
Figure 112010087842521-pat00062
번째 단계의 샘플집합들로 만들어지는 것을 나타낸다.Equation 8
Figure 112010087842521-pat00059
The split sample set of the < RTI ID = 0.0 >
Figure 112010087842521-pat00060
The second marker gene
Figure 112010087842521-pat00061
And the value of < RTI ID = 0.0 >
Figure 112010087842521-pat00062
Th sample set.

식 9는 마커집합

Figure 112010087842521-pat00063
을 이용하여 어떤 샘플이 속하는 집단을 판정할 때의 정확도를 계산하는 식을 나타낸다.Equation 9 is a set of markers
Figure 112010087842521-pat00063
Is used to calculate the accuracy when determining which group a sample belongs to.

[식 1][Formula 1]

Figure 112010087842521-pat00064
Figure 112010087842521-pat00064

[식 2][Formula 2]

Figure 112010087842521-pat00065
Figure 112010087842521-pat00065

[식 3][Formula 3]

Figure 112010087842521-pat00066
Figure 112010087842521-pat00066

Figure 112010087842521-pat00067
Figure 112010087842521-pat00067

Figure 112010087842521-pat00068
Figure 112010087842521-pat00068

Figure 112010087842521-pat00069
Figure 112010087842521-pat00069

[식 4][Formula 4]

Figure 112010087842521-pat00070
Figure 112010087842521-pat00070

Figure 112010087842521-pat00071
Figure 112010087842521-pat00071

Figure 112010087842521-pat00072
Figure 112010087842521-pat00072

Figure 112010087842521-pat00073
Figure 112010087842521-pat00073

[식 5][Formula 5]

Figure 112010087842521-pat00074
Figure 112010087842521-pat00074

[식 6][Formula 6]

Figure 112010087842521-pat00075
Figure 112010087842521-pat00075

Figure 112010087842521-pat00076
Figure 112010087842521-pat00076

Figure 112010087842521-pat00077
Figure 112010087842521-pat00077

[식 7][Equation 7]

Figure 112010087842521-pat00078
Figure 112010087842521-pat00078

[식 8][Equation 8]

Figure 112010087842521-pat00079
Figure 112010087842521-pat00079

Figure 112010087842521-pat00080
Figure 112010087842521-pat00080

[식 9][Equation 9]

Figure 112010087842521-pat00081
Figure 112010087842521-pat00081

Claims (1)

두 개의 샘플집단에 대한 유전자발현 데이터가 주어질 때, 두 집단을 구분하는 유전자 마커를 식별하는 방법에 있어서,
유전자별로 발현정도의 평균값이 0이 되도록 정규화하는 과정 단계와,
발현정도의 값을 기호로 변화하는 단계를 거쳐,
샘플집단을 분할할 때 복잡도로 최소로 하는 유전자를 매 단계별 마커로 선정하고, 이 마커를 기준으로 샘플집단을 분할하는 과정을 반복하여,
최종적으로 남은 분할되지 않은 샘플집단들을 특징짓는 유전자 패턴으로 마커집합을 구성하고, 정확도를 결정하여 유전자발현 데이터를 식별하는 방법.
Given the gene expression data for two sample populations, a method for identifying genetic markers that distinguish between two populations,
A step of normalizing the average value of the degree of expression to 0 for each gene,
A step of changing the value of the degree of expression to a symbol,
When dividing a sample group, a gene that minimizes the complexity is selected as a step-by-step marker, and a process of dividing a sample group based on the marker is repeated,
A method of identifying a gene expression data by constructing a marker set with a gene pattern characterizing the remaining unsegmented sample groups, and determining the accuracy thereof.
KR20100139605A 2010-12-30 2010-12-30 A Gene Expression Data Marker Identification Method for Two Groups KR101489536B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20100139605A KR101489536B1 (en) 2010-12-30 2010-12-30 A Gene Expression Data Marker Identification Method for Two Groups

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20100139605A KR101489536B1 (en) 2010-12-30 2010-12-30 A Gene Expression Data Marker Identification Method for Two Groups

Publications (2)

Publication Number Publication Date
KR20120077593A KR20120077593A (en) 2012-07-10
KR101489536B1 true KR101489536B1 (en) 2015-02-04

Family

ID=46711052

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20100139605A KR101489536B1 (en) 2010-12-30 2010-12-30 A Gene Expression Data Marker Identification Method for Two Groups

Country Status (1)

Country Link
KR (1) KR101489536B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030093A (en) 2002-06-25 2004-01-29 Hitachi Ltd Method for analyzing gene expression data
JP2004192593A (en) 2002-12-09 2004-07-08 Riichi Adachi Classification method of gene expression data
JP2005025711A (en) 2003-07-03 2005-01-27 Riichi Adachi Classification method of gene expression data
KR20050048728A (en) * 2003-11-19 2005-05-25 (주)워치비젼 System and method for peculiar expression detection of gene expression data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030093A (en) 2002-06-25 2004-01-29 Hitachi Ltd Method for analyzing gene expression data
JP2004192593A (en) 2002-12-09 2004-07-08 Riichi Adachi Classification method of gene expression data
JP2005025711A (en) 2003-07-03 2005-01-27 Riichi Adachi Classification method of gene expression data
KR20050048728A (en) * 2003-11-19 2005-05-25 (주)워치비젼 System and method for peculiar expression detection of gene expression data

Also Published As

Publication number Publication date
KR20120077593A (en) 2012-07-10

Similar Documents

Publication Publication Date Title
US8189892B2 (en) Methods and systems for identification of DNA patterns through spectral analysis
Piro et al. DUDes: a top-down taxonomic profiler for metagenomics
CN105279391A (en) Metagenome 16S rRNA high-throughput sequencing data processing and analysis process control method
CN109002859B (en) Sensor array feature selection and array optimization method based on principal component analysis
KR101595961B1 (en) Associative classification approach for prediction target data in the large data
CN111292807B (en) Method for analyzing double cells in single-cell transcriptome data
CN109545278B (en) Method for identifying interaction between plant lncRNA and gene
CN110969200A (en) Image target detection model training method and device based on consistency negative sample
KR101489536B1 (en) A Gene Expression Data Marker Identification Method for Two Groups
JP6879749B2 (en) Support device and support method
CN102576389B (en) Analytical tool for amplified reaction
CN105907860A (en) QTL-seq method of utilizing/Delta(SNP-index)/for character positioning and application thereof
US9773090B2 (en) Method computer program and system to analyze mass spectra
CN108985065A (en) The Calculate Mahalanobis Distance of application enhancements carries out the method and system of firmware Hole Detection
JP5940018B2 (en) Data name extraction device and program
CN102467741A (en) Method and device for detecting spot area in image
CN104569368A (en) System and method for analyzing biological samples
CN111584006B (en) Circular RNA identification method based on machine learning strategy
JP6356015B2 (en) Gene expression information analyzing apparatus, gene expression information analyzing method, and program
CN110656184B (en) SNP marker combination for distinguishing Chinese Han nationality, Japan, Korea/Korea population
KR101546546B1 (en) An Identification Method for All Contrasting Groups in Gene Expression Data
KR20120095716A (en) Feature selection method and apparatus using topological similar graphs for graph classification
Schumann et al. flowCyBar-Analyze flow cytometric data using gate information
CN101565747B (en) Method for extracting characteristic expression patterns of multiple gene sets
CN110619167B (en) Oil-gas-water three-phase flow phase state critical point identification method based on cluster analysis

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20180103

Year of fee payment: 4