KR102113549B1 - Gene methylation markers for exposure to air pollutants and methods for providing information using the same - Google Patents

Gene methylation markers for exposure to air pollutants and methods for providing information using the same Download PDF

Info

Publication number
KR102113549B1
KR102113549B1 KR1020180161796A KR20180161796A KR102113549B1 KR 102113549 B1 KR102113549 B1 KR 102113549B1 KR 1020180161796 A KR1020180161796 A KR 1020180161796A KR 20180161796 A KR20180161796 A KR 20180161796A KR 102113549 B1 KR102113549 B1 KR 102113549B1
Authority
KR
South Korea
Prior art keywords
methylation
gene
exposure
chromosome
air pollution
Prior art date
Application number
KR1020180161796A
Other languages
Korean (ko)
Inventor
김우진
Original Assignee
강원대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강원대학교산학협력단 filed Critical 강원대학교산학협력단
Priority to KR1020180161796A priority Critical patent/KR102113549B1/en
Application granted granted Critical
Publication of KR102113549B1 publication Critical patent/KR102113549B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to a gene methylation marker for exposure to air pollution and a method for providing information using the same to determine whether a gene is methylated or not by performing an epigenome-wide association study (EWAS) on a sample with regard to exposure to air pollutants, so as to evaluate an effect of air pollutants on the body. With regard to long-term exposure to air pollution, it is possible to identify a differentiated DNA methylation signal from blood and determine correlation between differentiated methylation and differentiated gene expression. Differentiated methylated CpG and region may be used as a potential bio marker for exposure to air pollution, so this result can be used in analysis of a mechanism which associates the exposure to air pollution with harmful health results.

Description

대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법{Gene methylation markers for exposure to air pollutants and methods for providing information using the same}Gene methylation markers for exposure to air pollutants and methods for providing information using the same}

본 발명은 대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법에 관한 것으로, 더욱 상세하게는 시료로부터 대기오염 물질 노출에 대해 후생유전자-광범위 연관분석(EWAS)에 의한 유전자의 메틸화 여부를 판단하고 이에 대한 대기오염 물질에 대한 신체의 영향을 평가할 수 있도록 하는 대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법에 관한 것이다.The present invention relates to a gene methylation marker for exposure to air pollution and a method for providing information using the same, and more specifically, it is determined whether the gene is methylated by an epigenetic-wide range association analysis (EWAS) for air pollutant exposure from a sample. And it relates to a gene methylation marker for air pollution exposure and a method for providing information using the same to enable the evaluation of the effect of the body on air pollutants.

일반적으로 대기오염에 대한 노출은 심혈관 질환과 폐기능을 포함하는 건강에 대한 부정적인 영향이 잘 입증되어 있다. 산화 스트레스와 염증은 근본적인 메커니즘이 제시되고 있지만 이러한 연결을 뒷받침하는 특정 데이터는 부족하다. 대기 오염 노출이 건강에 부정적인 영향을 미친다는 증거가 나오고 있음에도 불구하고 근본적인 메커니즘은 잘 알려져 있지 않다.In general, exposure to air pollution has been well documented for adverse effects on health, including cardiovascular disease and lung function. Oxidative stress and inflammation are the underlying mechanisms, but the specific data supporting these connections are lacking. Although evidence suggests that exposure to air pollution has a negative impact on health, the underlying mechanisms are not well understood.

유전자 발현에 영향을 줄 수 있는 후생적인 변형인 DNA 메틸화(Methylation)는 흡연과 연관되어 있다고 알려져 있다(Joehanes et al. 2016). 데이터가 적지만 대기 오염이 메틸화에 영향을 준다는 근거도 있다(Chi et al., Hou et al., Lichtenfels et al., 2018, Plusquin et al., 2017).DNA methylation, a epigenetic modification that can affect gene expression, is known to be associated with smoking (Joehanes et al. 2016). There is little data, but there is also evidence that air pollution affects methylation (Chi et al., Hou et al., Lichtenfels et al., 2018, Plusquin et al., 2017).

대기오염의 장시간 노출과 메틸화에 대한 대부분의 연구는 백인 성인에서 이루어졌으며, 교차연구를 통해 상이하게 메틸화된 프로브(differentially methylated probes, DMPs)에 대한 근거는 드물다.Most studies of long-term exposure and methylation of air pollution have been conducted in white adults, and evidence for differentially methylated probes (DMPs) in cross-study studies is rare.

Ana JuliadeF.C.Lichtenfels, Diana A.vanderPlaat et al. Long-term Air Pollution Exposure, Genome-wide DNA Methylation and Lung Function in the LifeLines Cohort Study (2018)Ana Juliade F.C.Lichtenfels, Diana A.vanderPlaat et al. Long-term Air Pollution Exposure, Genome-wide DNA Methylation and Lung Function in the LifeLines Cohort Study (2018) Plusquin, M., Guida, F., Polidoro, S. et al. DNA methylation and exposure to ambient air pollution in two prospective cohorts.(2017)Plusquin, M., Guida, F., Polidoro, S. et al. DNA methylation and exposure to ambient air pollution in two prospective cohorts. (2017)

따라서, 본 발명자들은 성인 참여자로부터 분리된 혈액 내 DNA 메틸화가 있는 직경 10μm 이하의 입자상 물질(PM10)과 이산화질소(NO2)에 장기 노출의 관계를 평가하였다. 각각의 C-phosphate-G(CpG) 프로브 레벨과 인접한 여러 CpG프로브들(CpGs)이 관련된 지역 레벨 모두에서 대기 오염 노출과 관련하여 상이하게 메틸화된 신호를 확인하였다.Therefore, the present inventors evaluated the relationship between long-term exposure to nitrogen dioxide (NO 2 ) and particulate matter (PM 10 ) having a diameter of 10 μm or less with DNA methylation in blood isolated from adult participants. Different C-phosphate-G (CpG) probe levels and different methylated signals with respect to air pollution exposure were identified at both regional levels associated with multiple CpG probes (CpGs).

또한 DMPs의 메틸화 레벨이 유전자 발현과 DNA 메틸화가 있는 대규모 독립 데이터 시트에서 연관 전사체의 발현 수준과 관련이 있는지 평가하여 본 발명을 완성하였다.In addition, the present invention was completed by evaluating whether the methylation level of DMPs is related to the expression level of the associated transcript in a large independent data sheet with gene expression and DNA methylation.

따라서, 본 발명의 목적은 대기오염 물질 노출에 대한 DNA 메틸화 마커를 제공하는 것이다.Accordingly, it is an object of the present invention to provide a DNA methylation marker for exposure to air pollutants.

또한, 본 발명의 다른 목적은 대기오염 물질 노출에 대한 유전자 메틸화 정보를 제공하는 방법을 제공하는 것이다.In addition, another object of the present invention is to provide a method for providing gene methylation information for exposure to air pollutants.

전술한 목적을 달성하기 위한 본 발명의 일실시예에 따르면, 대상 개체로부터 채취된 시료로부터 DNA를 분리하고; 상기 DNA로부터 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1종 이상의 유전자의 메틸화를 검출하는 것을 포함하는 대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법을 제공한다.According to an embodiment of the present invention for achieving the above object, to separate the DNA from the sample collected from the subject object; It provides a method for providing gene methylation information for air pollution exposure, comprising detecting methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57, and C20orf123 from the DNA.

또한, 본 발명의 다른 일실시예에 따르면, OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1 종 이상의 유전자의 메틸화를 검출할 수 있는 물질을 포함하는, 대기오염 노출에 대한 유전자 메틸화 분석용 조성물을 제공한다.In addition, according to another embodiment of the present invention, gene methylation analysis for exposure to air pollution, comprising a substance capable of detecting methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123 Provided is a composition.

또한, 본 발명의 다른 일실시예에 따르면 상기 대기오염 노출에 대한 유전자 메틸화 분석용 조성물을 포함하는 대기오염 노출에 대한 유전자 메틸화 분석용 키트를 제공한다.In addition, according to another embodiment of the present invention, there is provided a kit for analyzing gene methylation for exposure to air pollution, comprising a composition for analyzing gene methylation for exposure to air pollution.

전술한 바와 같은 본 발명에 따르면, 대기 오염 장기 노출과 관련하여 혈액에서 상이한 DNA 메틸화 신호를 확인할 수 있으며, 상이한 메틸화와 상이한 유전자 발현의 관련성을 판단할 수 있다. 상이한 메틸화를 보이는 CpG 및 영역은 대기 오염 노출에 대한 잠재적인 바이오 마커로 활용될 수 있다. 이러한 결과는 대기 오염 노출과 유해한 건강 결과를 연결하는 메커니즘 분석에 활용될 수 있다.According to the present invention as described above, it is possible to identify different DNA methylation signals in the blood in relation to long-term exposure to air pollution, and to determine the relationship between different methylation and different gene expression. CpG and regions showing different methylation can serve as potential biomarkers for air pollution exposure. These results can be used to analyze mechanisms linking exposure to air pollution with harmful health outcomes.

이상에서의 본 발명에 따른 효과는 상기에 한정되는 것은 아니며, 기타 본 발명의 효과들은 후술할 실시예 및 청구범위에 기재된 사항을 통하여 본 발명이 속하는 분야의 통상의 지식을 가진 자에 의하여 분명하게 이해될 수 있을 것이다.The effects according to the present invention in the above are not limited to the above, and other effects of the present invention are clearly understood by those skilled in the art to which the present invention pertains through the examples and claims described below. Will be understandable.

도 1은 본 발명의 대기오염 장기 노출에 대한 후생유전자-광범위 연관분석의 워크플로우를 나타낸 것이다.
도 2는 본 발명의 대기오염 장기 노출에 대한 후생유전자-광범위 연관분석의 Manhattan plot 및 quantile-quantile plot을 나타낸 것이다.
(A) PM10 장기 노출에 대한 EWAS를 나타낸 Manhattan plot
(B) PM10 장기 노출에 대한 EWAS를 나타낸 Quantile-quantile plot
(C) NO2 장기 노출에 대한 EWAS를 나타낸 Manhattan plot
(D) NO2 장기 노출에 대한 EWAS를 나타낸 Quantile-quantile plot
도 3은 본 발명의 대기 오염 장기 노출(PM10 및 NO2)과 혈액 DNA 메틸화의 연관성에 대한 영역을 시각화한 것이다.
(A) PM10 노출과 관련하여 TRIM39에서의 상이한 메틸화
(B) PM10 노출과 관련하여 LTA에서의 상이한 메틸화
(C) NO2 노출과 관련하여 LTA에서의 상이한 메틸화
(D) NO2 노출과 관련하여 TRIM39에서의 상이한 메틸화
도 4는 본 발명의 경로 분석 결과를 시각화 한 것이다.
(A) 유전자(행)와 경로(열)의 강화를 보여주는 히트맵
(B) PM10 및 NO2 과 관련하여 6개 경로내 유전자의 면역학 관련 카테고리
도 5는 CpGs에서의 조직 및 세포 유형 특이적 강화 패턴의 PM10 노출과 유의한 상관관계(FDR <0.05)를 나타낸 것이다.
도 6은 CpGs에서의 조직 및 세포 유형 특이적 강화 패턴의 NO2 노출과 유의한 상관관계 (FDR <0.05)를 나타낸 것이다.
Figure 1 shows the workflow of the epigenetic-wide range association analysis for long-term exposure to air pollution of the present invention.
Figure 2 shows the Manhattan plot and quantile-quantile plot of epigenetic-wide range association analysis for long-term exposure to air pollution in the present invention.
(A) Manhattan plot showing EWAS for PM 10 long-term exposure
(B) Quantile-quantile plot showing EWAS for PM 10 long-term exposure
(C) Manhattan plot showing EWAS for NO 2 long-term exposure
(D) Quantile-quantile plot showing EWAS for NO 2 long-term exposure
Figure 3 is a visualization of the area for the association of long-term exposure to air pollution (PM10 and NO 2 ) of the present invention and blood DNA methylation.
(A) Different methylation in TRIM39 with respect to PM 10 exposure
(B) Different methylation in LTA with respect to PM 10 exposure
(C) Different methylation in LTA with respect to NO 2 exposure
(D) Different methylation in TRIM39 with respect to NO 2 exposure
Figure 4 is a visualization of the route analysis results of the present invention.
(A) Heat map showing reinforcement of gene (row) and pathway (column)
(B) Categories related to immunology of genes in 6 pathways in relation to PM 10 and NO 2
Figure 5 shows a significant correlation (FDR <0.05) with PM 10 exposure of tissue and cell type specific enrichment patterns in CpGs.
Figure 6 shows a significant correlation (FDR <0.05) with NO 2 exposure of tissue and cell type specific enrichment patterns in CpGs.

이하, 본 발명에 대하여 보다 상세하게 설명하도록 한다.Hereinafter, the present invention will be described in more detail.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art to which the present invention pertains may easily practice. However, the present invention can be implemented in many different forms and is not limited to the embodiments described herein. In addition, in order to clearly describe the present invention, parts not related to the description are omitted.

본 발명에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.In the present invention, when a part is said to "include" a certain component, it means that the component may be further included other than excluding other components, unless otherwise stated.

본 발명 명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용 오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다.The terms "about", "substantially", and the like used throughout the specification of the present invention are used in terms of or close to those values when manufacturing and material tolerances unique to the stated meanings are presented, and To aid understanding, accurate or absolute figures are used to prevent unconscionable abusers from unduly using the disclosed disclosure.

본 발명 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.The term "~ (step)" or "step of" as used in the present specification does not mean "step for".

본 발명 명세서 전체에서, 마쿠시 형식의 표현에 포함된 "이들의 조합"의 용어는 마쿠시 형식의 표현에 기재된 구성 요소들로 이루어진 군에서 선택되는 하나 이상의 혼합 또는 조합을 의미하는 것으로서, 상기 구성 요소들로 이루어진 군에서 선택되는 하나 이상을 포함하는 것을 의미한다.Throughout the specification of the present invention, the term “combination of these” included in the expression of the marki form means one or more mixtures or combinations selected from the group consisting of the components described in the expression of the marki form, wherein the composition It means to include one or more selected from the group of elements.

본 발명 명세서 전체에서, "샘플" 또는 "시료"는 수행되는 분석의 종류에 따라, 개개인, 체액, 세포주, 조직 배양 등에서 얻어지는 폭넓은 범위의 모든 생물학적 시료를 포함하고, 예를 들어, 혈액, 혈청, 혈장, 소변, 세포, 조직, 생검, 파라핀조직 및 미세침 흡인검체 등을 포함할 수 있으나 이에 제한되지 않는다. 인간을 포함하는 포 유동물로부터 체액 및/또는 조직 생검을 획득하는 방법은 통상적으로 널리 알려져 있다.Throughout the present specification, “sample” or “sample” includes a wide range of biological samples obtained from individuals, body fluids, cell lines, tissue cultures, etc., depending on the type of analysis being performed, eg, blood, serum , Plasma, urine, cells, tissues, biopsies, paraffin tissues, and microneedle aspiration samples, but are not limited thereto. Methods for obtaining bodily fluids and / or tissue biopsies from a mammary fluid containing humans are commonly known.

본 발명 명세서 전체에서, "메틸화"는 DNA를 구성하는 염기에 메틸기가 부착되는 것을 말한다. 바람직하게, 본 발명에서 메틸화 여부는 특정 유전자의 특정 CpG 부위의 시토신(cytosine)에서 일어나는 메틸화 여부를 의미한다. 포유동물 세포의 DNA 에는 아데닌, 시토신, 구아닌 및 티민에 더하여, 시토신 링의 다섯번째 탄소에 메틸 그룹이 부착된 5-메틸시토신(5-methylcytosine, 5-mC)이라는 염기가 존재하는데, 5-메틸시토신의 메틸화는 CpG라고 불리는 CG 디뉴클레오티드(5'-mCG-3')의 C에서만 일어나고, CpG의 메틸화는 alu 또는 트랜스포존과 게놈의 반복서열이 발현되는 것을 억제한다. 또한, 상기 CpG의 5-mC가 자연적으로 탈아미노화하여 티민(T)이 되기 쉽기 때문에, CpG는 포유동물 세포에서 대부분의 후생유전학적 변화가 자주 일어나는 부위이다. 또한, 메틸화가 일어난 경우 그로 인하여 전사인자의 결합이 방해를 받게 되어 특정 유전자의 발현이 억제되며, 반대로, 비메틸화 또는 저메틸화가 일어나는 경우 특정 유전자의 발현이 증가하게 된다.In the present specification, "methylation" refers to a methyl group attached to a base constituting DNA. Preferably, in the present invention, methylation means whether methylation occurs in a cytosine of a specific CpG region of a specific gene. In the DNA of mammalian cells, in addition to adenine, cytosine, guanine and thymine, there is a base called 5-methylcytosine (5-mC) with a methyl group attached to the fifth carbon of the cytosine ring, 5-methyl The methylation of cytosine occurs only in C of CG dinucleotide (5'-mCG-3 ') called CpG, and the methylation of CpG inhibits the expression of alu or transposon and repeat sequences of the genome. In addition, since 5-mC of the CpG is naturally deaminated, it is easy to become thymine (T), so CpG is a site where most epigenetic changes occur frequently in mammalian cells. In addition, when methylation occurs, the binding of transcription factors is interrupted thereby, and expression of a specific gene is suppressed. Conversely, when non-methylation or hypomethylation occurs, expression of a specific gene increases.

본 발명은 대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법에 관한 것이다. 구체적으로 시료로부터 대기오염 물질 노출에 대해 후생유전자-광범위 연관분석(EWAS)에 의한 유전자의 메틸화 여부를 판단하고 이에 대한 대기오염 물질에 대한 신체의 영향을 평가할 수 있도록 하는 대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법에 관한 것이다.The present invention relates to a gene methylation marker for exposure to air pollution and a method for providing information using the same. Specifically, the gene methylation of air pollutant exposure to determine whether the gene is methylated by the epigenetic gene-wide association analysis (EWAS) for air pollutant exposure from the sample and to evaluate the effect of the body on the air pollutant It relates to a marker and information providing method using the same.

이하, 본 발명의 대기오염 노출에 대한 유전자 메틸화 마커 및 이를 이용한 정보제공방법에 대하여 구현예 및 실시예와 도면을 참조하여 구체적으로 설명하도록 한다. 그러나, 본 발명이 이러한 구현예 및 실시예와 도면에 제한되는 것은 아니다.Hereinafter, a gene methylation marker for air pollution exposure of the present invention and an information providing method using the same will be described in detail with reference to embodiments and examples and drawings. However, the present invention is not limited to these embodiments and examples and drawings.

본 발명은 대기 오염의 장기 노출이 DNA 메틸화에 영향을 준다는 근거를 제시한다. 상이한 메틸화 신호는 잠재적인 대기오염 바이오 마커 역할을 할 수 있다. 이러한 결과는 대기오염이 인간의 건강에 미치는 영향을 보다 잘 이해하는데 도움이 될 수 있다.The present invention provides evidence that long-term exposure to air pollution affects DNA methylation. Different methylation signals can serve as potential air pollution biomarkers. These results can help to better understand the impact of air pollution on human health.

본 발명의 일실시예에서 대상 개체로부터 채취된 시료로부터 DNA를 분리하고; 상기 DNA로부터 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1종 이상의 유전자의 메틸화를 검출하는 것을 포함하는,대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법을 제공한다.In one embodiment of the present invention, DNA is separated from a sample collected from a subject; It provides a method for providing gene methylation information for exposure to air pollution, comprising detecting methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57, and C20orf123 from the DNA.

본 발명에서 상기 방법은 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1종, 2종, 3종, 4종, 5종 또는 6종의 유전자의 메틸화를 검출하는 것을 포함하여 대기오염 물질 노출에 대한 신체 영향 평가에 필요한 정보를 제공할 수 있다.In the present invention, the method comprises detecting the methylation of 1, 2, 3, 4, 5 or 6 genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123. It can provide the information needed to assess the physical impact of exposure.

본 발명의 구체예에 따르면 상기 유전자는, OTUB2 유전자의 경우 14 번 염색체의 94491958 번째 염기, TRIM39 유전자의 경우 6 번 염색체의 30297174 내지 30297627 번째 염기 영역, LTA 유전자의 경우 6 번 염색체의 31539539 내지 31540750 번째 염기 영역, CSGALNACT1 유전자의 경우 8 번 염색체의 19459672 내지 19460243 번째 염기 영역, CCDC57 유전자의 경우 17 번 염색체의 80084554 내지 80085082 번째 염기 영역, 그리고 C20orf123 유전자의 경우 20 번 염색체의 45179157 내지 45179413 번째 염기 영역의 메틸화를 검출하는 것 일 수 있으나, 이에 제한되지 않을 수 있다.According to an embodiment of the present invention, the gene is 94491958 th base of chromosome 14 for the OTUB2 gene, 30297174 to 30297627 th base region of the chromosome 6 for the TRIM39 gene, and 31539539 to 31540750 th chromosome 6 for the LTA gene Base region, methylation of 19459672 to 19460243 base region of chromosome 8 for CSGALNACT1 gene, 80084554 to 80085082 base region of chromosome 17 for CCDC57 gene, and 45179157 to 45179413 base region of chromosome 20 for C20orf123 gene It may be to detect, but may not be limited to this.

또한 본 발명의 일 구체예에 따르면, 상기 시료는 인간 대상으로부터 분리되는 조직, 세포, 혈액, 혈장 및 소변으로부터 선택되는 것일 수 있고, 바람직하게는 혈액일 수 있으나, 이에 제한되지 않을 수 있다. 상기 시료들은 본 발명이 속하는 기술분야에서 일반적으로 사용되는 방법에 의해 수득될 수 있다.In addition, according to an embodiment of the present invention, the sample may be selected from tissue, cells, blood, plasma and urine separated from human subjects, and preferably may be blood, but may not be limited thereto. The samples can be obtained by methods commonly used in the art.

본 발명의 일 구체예에서 메틸화의 검출은 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), 메틸화 DNA 특이적 결합 항체 또는 압타머를 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱에서 선택되는 방법에 의해 수행될 수 있으나, 이에 제한되지 않을 수 있다. 이는 본 발명이 속하는 기술 분야에서 일반적으로 사용되는 메틸화 검출 방법에 의해 수행될 수 있다.In one embodiment of the present invention, the detection of methylation is PCR, methylation specific PCR, real time methylation specific PCR, PCR using methylated DNA specific binding antibody or aptamer, quantitative PCR, DNA chips, pyrosequencing and bisulfite sequencing may be performed by a method selected from, but may not be limited to. This can be accomplished by a methylation detection method commonly used in the art.

본 발명의 일 구체예에 따르면, 검출된 유전자의 메틸화 여부 또는 수준을 질병에 관련된 유전자 발현 수준과 비교하는 것을 포함할 수 있다. 이는 후생유전자-광범위 연관연구(EWAS)에서 정상적이고 자연적인 메틸화에 대한 상이한 메틸화를 판단하기 위하여 질병과 관련된 유전자 메틸화를 비교할 수 있다. 이때, 상기 메틸화 수준의 비교는 특정 영역 내의 CpG의 메틸화 비율을 비교하는 것일 수 있다.According to one embodiment of the present invention, it may include comparing the level or the level of gene expression related to the disease with methylation or level of the detected gene. It can compare gene methylation associated with disease to determine different methylation for normal and natural methylation in EWAS. At this time, the comparison of the methylation level may be to compare the methylation ratio of CpG in a specific region.

예를 들어 검사 대상의 시료 내 DNA로부터 검출된 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123 중에 유전자의 메틸화 여부 또는 메틸화 수준이 정상 대조군 또는 양성 대조군의 DNA로부터 검출된 메틸화 여부 또는 메틸화 수준과 상이한 경우, 대상의 대기오염 물질의 노출에 대한 위험 판단 및 대기오염 물질에 대한 인체 영향을 판단할 수 있다.For example, if OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57, and C20orf123 detected from DNA in a sample to be tested are methylated or the methylation level of the gene is different from the methylation level or methylation level detected from the DNA of the normal control or positive control. , It is possible to judge the risk of exposure to the air pollutants of the target and the human influence on the air pollutants.

또는, 대상 개체의 시료 내 DNA로부터 검출된 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123 중에 선택되는 유전자의 메틸화 여부 또는 메틸화 수준은 표준화된 기준과 비교될 수도 있다.Alternatively, the methylation level or methylation level of a gene selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123 detected from DNA in a sample of a subject individual may be compared with a standardized standard.

본 발명의 다른 일실시예에서 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1 종 이상의 유전자의 메틸화를 검출할 수 있는 물질을 포함하는 대기오염 노출에 대한 유전자 메틸화 분석용 조성물을 제공한다.In another embodiment of the present invention provides a composition for gene methylation analysis for exposure to air pollution comprising a substance capable of detecting methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123 .

예를 들어 상기 조성물은 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1 종, 2 종, 3 종, 4 종, 5 종 또는 6 종의 유전자의 메틸화를 검출할 수 있으나, 이에 제한되지 않을 수 있다.For example, the composition can detect methylation of one, two, three, four, five, or six genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57, and C20orf123, but is not limited thereto. It may not.

예를 들어 상기 조성물은 검사 대상으로부터 채취된 시료 내의 DNA로부터 상기한 유전자의 메틸화를 검출할 수 잇는 물질을 포함하며, 상기 시료는 상기 시료는 인간 대상의 조직, 세포, 혈액, 혈장 및 소변으로부터 선택되는 것일 수 있으나, 이에 제한되지 않을 수 있다.For example, the composition includes a substance capable of detecting methylation of the gene from DNA in a sample taken from a test subject, wherein the sample is selected from tissue, cells, blood, plasma and urine of a human subject. It may be, but may not be limited to this.

본 발명의 일 구체예에서, 상기 메틸화를 검출할 수 있는 물질은 메틸화된 염기 또는 메틸화된 염기 영역을 포함하는 단편을 증폭할 수 있는 프라이머쌍, 메틸화된 염기 또는 메틸화된 염기 영역과 혼성화할 수 있는 프로브, 메틸화된 염기 또는 메틸화된 염기 영역과 결합할 수 있는 메틸화 특이적 결합 단백질, 메틸화 특이적 결합 항체 또는 압타머, 메틸화 민감성 제한 엔도뉴클라아제, 시퀀싱 프라이머, 시퀀싱 바이 신세시스 프라이머 및 시퀀싱 바이 라이게이션 프라이머로 구성된 군에서 선택될 수 있으나, 이에 제한되지 않을 수 있다.In one embodiment of the present invention, the substance capable of detecting methylation is capable of hybridizing with a methylated base or a primer pair capable of amplifying a fragment comprising a methylated base region, a methylated base or a methylated base region. Methylation specific binding protein, methylation specific binding antibody or aptamer capable of binding to a probe, methylated base or methylated base region, methylation sensitivity limiting endonuclease, sequencing primer, sequencing by synthesis primer and sequencing by ligation It may be selected from the group consisting of primers, but may not be limited thereto.

본 발명의 구체예에 따르면 상기 메틸화된 염기 또는 메틸화된 염기 영역은 OTUB2 유전자의 경우 14 번 염색체의 94491958 번째 염기, TRIM39 유전자의 경우 6 번 염색체의 30297174 내지 30297627 번째 염기 영역, LTA 유전자의 경우 6 번 염색체의 31539539 내지 31540750 번째 염기 영역, CSGALNACT1 유전자의 경우 8 번 염색체의 19459672 내지 19460243 번째 염기 영역, CCDC57 유전자의 경우 17 번 염색체의 80084554 내지 80085082 번째 염기 영역, 그리고 C20orf123 유전자의 경우 20 번 염색체의 45179157 내지 45179413 번째 염기 영역을 포함할 수 있으나, 이에 제한되지 않을 수 있다.According to an embodiment of the present invention, the methylated base or methylated base region is the 94491958 th base of chromosome 14 for the OTUB2 gene, the 6th base region of 30297174 to 30297627 of the chromosome 6 for the TRIM39 gene, and the 6th for the LTA gene Chromosome 31539539 to 31540750 base region, CSGALNACT1 gene 8 chromosome 19459672 to 19460243 base region, CCDC57 gene 17 chromosome 80084554 to 80085082 base region, and C20orf123 gene 20 chromosome 45179157 to 45179413, but may not be limited thereto.

한편 본 발명의 다른 일실시예에서는 대기오염 물질 노출에 대한 유전자 메틸화 분석용 조성물을 포함하는 대기오염 노출에 대한 유전자 메틸화 분석용 키트를 제공할 수 있다. 예를 들어 상기 키트는 시료나 샘플을 담는 구획된 캐리어 수단, 및 상기 샘플 내 유전자의 메틸화를 검출할 수 있는 물질을 포함할 수 있다.Meanwhile, in another embodiment of the present invention, a kit for gene methylation analysis for air pollution exposure may be provided, which includes a composition for gene methylation analysis for air pollutant exposure. For example, the kit may include a sample or a compartmentalized carrier means for containing a sample, and a substance capable of detecting methylation of a gene in the sample.

예를 들어 상기 키트는 검사 대상에서 분리된 시료를 담는 구획된 캐리어 수단, 비메틸화 시토신을 민감하게 절단하는 제제를 함유하는 첫 번째 용기와, CpG 함유 핵산을 증폭하기 위한 프라이머를 함유하는 두번째 용기 및 절단된 또는 절단되지 않은 핵산의 존재를 검출하는 수단이 함유된 세번째 용기를 포함할 수 있다.For example, the kit includes a compartmentalized carrier means for containing a sample isolated from a test subject, a first container containing an agent that sensitively cleaves unmethylated cytosine, a second container containing a primer for amplifying CpG-containing nucleic acids, and And a third container containing means for detecting the presence of a truncated or uncleaved nucleic acid.

또한, 본 발명의 다른 일실시예에 따르면 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1 종 이상의 유전자의 메틸화 부위를 포함하는 단편에 혼성화할 수 있는 프로브를 포함하는 핵산칩으로 구현될 수 있으며, 예를 들어 상기 시료로부터 분리된 DNA가 상기 핵산칩에 적용될 수 있다. 특정 유전자 단편의 메틸화를 검출할 수 있는 한, 본 발명이 속하는 기술분야에서 알려진 핵산칩이라면 그 구성에 관계 없이 본 발명을 적용할 수 있다.In addition, according to another embodiment of the present invention, a nucleic acid chip comprising a probe capable of hybridizing to a fragment comprising a methylation site of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123 For example, DNA separated from the sample may be applied to the nucleic acid chip. As long as the methylation of a specific gene fragment can be detected, the present invention can be applied to any nucleic acid chip known in the art to which the present invention pertains.

이하, 실시예를 통하여 본 발명을 더욱 상게하게 설명하고자 한다. 하기의 실시예는 단지 설명의 목적을 위한 것으로 본 발명의 범위를 한정하는 것은 아니다.Hereinafter, the present invention will be further described through examples. The following examples are for illustrative purposes only and are not intended to limit the scope of the invention.

<실시예 1> 실험 준비 및 방법<Example 1> Experiment Preparation and Method

1-1 연구 모집단1-1 Research Population

DNA 메틸화 프로파일링을 위해 한국 COPD 집단에서 실험 참여자 100명을 선정하였다. 본 실험에서 방문시 수집된 데이터 및 생물학적 표본을 이용하였다.For DNA methylation profiling, 100 participants were selected from the Korean COPD population. Data and biological samples collected at the visit were used in this experiment.

혈액, 소변 표본 및 설문지는 신체검사를 받은 모든 연구 참여자로부터 수집되었다. 훈련된 간호사는 체성분분석기 IOI 353 (Aarna Systems., Udaipur, India)을 이용하여 신장과 체중을 측정하였다.Blood, urine specimens and questionnaires were collected from all study participants who had undergone a physical examination. The trained nurse measured height and weight using a body composition analyzer IOI 353 (Aarna Systems., Udaipur, India).

체질량 지수(BMI)는 체중(kg)을 신장 제곱(m2)으로 나눈 값으로 계산되었다.Body mass index (BMI) was calculated as weight (kg) divided by height squared (m 2 ).

담배 흡연 상태 및 연간 흡연량에 대한 정보는 설문지를 통해 수집되었다. 하루 흡연한 담배 팩수에 흡연한 년수를 곱하여 현재 흡연자와 과거 흡연자의 연간 흡연량을 계산했다. 현재 비 흡연 상태는 면역 분석법(Immulite 2000 Xpi, Siemens Healthcare Diagnostics, Tarrytown, NY, USA)에 의해 척정된 소변 코티닌 수준(nmol/L)을 확인하였다. 본 실험의 흐름도는 도 1과 같다.Information on cigarette smoking status and annual smoking amount was collected through questionnaires. The number of cigarettes smoked per day was multiplied by the number of years smoked to calculate the annual smoking amount of current and past smokers. Current non-smoking status confirmed urine cotinine levels (nmol / L) measured by immunoassay (Immulite 2000 Xpi, Siemens Healthcare Diagnostics, Tarrytown, NY, USA). The flow chart of this experiment is shown in FIG. 1.

본 실험은 강원대학교 심사위원회의 승인을 받았으며, 모든 참가자들로부터 정보에 대한 동의를 얻었다.This experiment was approved by the Jury of Kangwon National University and consent was obtained from all participants.

1-2 거주 주소지에서의 대기오염 노출1-2 Air pollution exposure at residential address

전국 규모의 노출 예측 모델(Kim and Song 2017)을 사용하여 기준 조사에서 얻은 각 거주지에서 PM10 (μg/m3) 과 NO2 (ppb)의 연간 평균 농도를 측정하였다. 이 예측 모델은 2010년 대기 오염 규제 모니터링 데이터를 사용하여 지리적 예측 변수와 공간적 상관 관계를 기반으로 보편적인 클리깅 플레임 워크에서 오염 물질의 연간 평균 농도를 측정했다. 지리적 예측자는 교통, 인구 통계학적 특성, 토지 이용, 물리적지형, 교통시설, 배출량, 식생 및 고도를 비롯한 오염원을 나타내는 수백개의 지리적 변수에 의해 추정된 것이다. 본 실험에서는 GeoCoder-Xr software(Geoservice, Seoul, South Korea)를 이용하여 방문 참여자의 기준으로 거주 주소가 코딩되었다.National average exposure prediction models (Kim and Song 2017) were used to measure the average annual concentrations of PM 10 (μg / m3) and NO 2 (ppb) in each residence obtained in the baseline survey. This predictive model used the 2010 air pollution regulatory monitoring data to measure the annual average concentration of pollutants in a universal kriging flamework based on geographic predictors and spatial correlations. Geographic predictors are estimated by hundreds of geographic variables representing pollutants, including transportation, demographic characteristics, land use, physical topography, transportation facilities, emissions, vegetation and altitude. In this experiment, the residential address was coded based on the participants of the visit using GeoCoder-Xr software (Geoservice, Seoul, South Korea).

1-3 DNA 메틸화 프로파일링1-3 DNA methylation profiling

방문시 수집된 참여자의 혈액 샘플에서 DNA를 추출하였다. Infinium HumanMethylation450K BeadChip (Illumina, Inc., San Diego, CA, USA)를 이용하여 유전자 전반의 메틸화 프로파일을 얻었다. 신호 추출 및 초기 저품질 프로브 필터링을 위해 Chip Analysis Methylation Pipeline (ChAMP) R package (Morris et al. 2014)을 사용했으며, 샘플 또는 비드에서 p-값 > 0.01 이상인 것과 bead-count < 3 in 5% 인 것은 제외했다. 프로브 설계 편향에 대한 보정은 Beta Mixture Quantile dilation 표준화(Teschendorff et al., 2013)를 사용하여 수행되었다. 배치 효과 보정은 sva R 패키지 (Leek et al. 2012)에서 Combat (Johnson et al. 2007)를 사용하여 보정하였다. 그리고 위양성 결과를 최소화하기 위해 비특이적 또는 인근의 단일 염기 다형성(SNP)과 같은 근처 유전적 변이에 의해 영향을 받을 가능성이 있는 non-CpG 프로브를 추가적으로 제거하였다.DNA was extracted from blood samples of participants collected at the visit. The methylation profile of the whole gene was obtained using Infinium HumanMethylation450K BeadChip (Illumina, Inc., San Diego, CA, USA). For signal extraction and initial low-quality probe filtering, a Chip Analysis Methylation Pipeline (ChAMP) R package (Morris et al. 2014) was used, with p-values> 0.01 and bead-count <3 in 5% in samples or beads. Excluded. Correction for probe design bias was performed using Beta Mixture Quantile dilation standardization (Teschendorff et al., 2013). Batch effect correction was corrected using Combat (Johnson et al. 2007) in the sva R package (Leek et al. 2012). In addition, non-CpG probes likely to be affected by nearby genetic variations, such as non-specific or nearby single base polymorphism (SNP), were additionally removed to minimize false positive results.

X와 Y 염색체에 대한 프로브를 제외하고 남은 402,508 개의 CpG를 연관 분석에 사용했다. 연관 결과에 대한 극단적인 메틸화 이상값의 잠재적인 영향을 줄이기 위해 Tukey’s outer fences(Tukey 1977) 보다 더 극단적인 메틸화 값으로 각 프로브의 메틸화 값의 25번째 및 75번째 백분위의 사분위 범위의 3배 이상으로 정의하여 모든 참가자의 75,549값 (0.19%)을 제거했다.Excluding probes for X and Y chromosomes, the remaining 402,508 CpGs were used for linkage analysis. More than three times the quartile range of the 25th and 75th percentiles of each probe's methylation value with more extreme methylation values than Tukey's outer fences (Tukey 1977) to reduce the potential impact of extreme methylation outliers on the association results. Defined as 75,549 values (0.19%) of all participants were removed.

CD8 + T- 림프구, CD4 + T- 림프구, 자연 살상 세포, B 세포, 단구 및 과립 세포를 포함한 세포 유형 비율을 평가하기 위해 레이니우스 참조 패널(Reinius reference panel)과 하우스먼(Houseman) 알고리즘을 적용하였다.Reinius reference panel and Huseman algorithm applied to evaluate cell type proportions including CD8 + T-lymphocytes, CD4 + T-lymphocytes, natural killer cells, B cells, monocytes and granulocytes Did.

1-4 상이하게 메틸화된 프로브(DMPs)의 식별1-4 Identification of different methylated probes (DMPs)

대기 오염 노출과 DNA 메틸화와의 관련성을 평가하기 위해, 메틸화 값 및 이질성이 결과에 미치는 영향을 줄이기 위해 로버스트 선형 회귀 모델(robust linear regression models)을 이용하였다. 오염 물질 (PM10 또는 NO2)의 연간 평균 농도는 예측기를 이용하였고, 메틸화 베타 값은 반응 변수였다. 메틸화 베타 값은 메틸화된 CpG 프로브 강도 대 전체 프로브 강도의 비율이며 0 (메틸화되지 않은)과 1(메틸화 된) 사이의 범위이다. 공변인(covariate)은 나이, 성별, 담배흡연, 연간 담배 흡연량, 체질량지수(BMI, kg/m2) COPD 상태 (cases, noncases) 및 추정되는 세포-유형 비율을 포함한다. 게놈 전반의 통계적 유의성을 위해, 달리 언급하지 않는 한 오발견율(false discovery rate, FDR)이 보정된 p 값의 임계값을 0.05 미만으로 설정하였다. 또한 본페로니 교정 후 통계적으로 유의미한 연관성을 위해 p-값 <1.2E-07 (= 0.05 / 402,508)을 컷오프로 사용했다. 초기 데이터(.idat 파일)에서 메틸화 베타 값까지의 메틸화 데이터를 사전 처리하기 위해 R 버전 3.0.2와 연관 분석 및 상이한 메틸화 영역의 시각화를 위한 R 버전 3.4.0을 사용하였다.To evaluate the relationship between air pollution exposure and DNA methylation, robust linear regression models were used to reduce the effect of methylation values and heterogeneity on the results. The average annual concentration of contaminants (PM 10 or NO 2 ) was using a predictor, and the methylation beta value was a response variable. The methylated beta value is the ratio of methylated CpG probe strength to total probe strength and ranges between 0 (unmethylated) and 1 (methylated). Covariates include age, gender, cigarette smoking, annual cigarette smoking, body mass index (BMI, kg / m2) COPD status (cases, noncases) and estimated cell-type ratio. For statistical significance throughout the genome, the threshold of the p value corrected for false discovery rate (FDR) was set to less than 0.05 unless otherwise noted. In addition, p-value <1.2E-07 (= 0.05 / 402,508) was used as cutoff for statistically significant association after Bonferroni correction. R version 3.0.2 and R version 3.4.0 for association analysis and visualization of different methylation regions were used to pre-process methylation data from initial data (.idat files) to methylation beta values.

1-5 상이하게 메틸화된 영역(DMRs)의 식별1-5 Identification of different methylated regions (DMRs)

각각의 CpG의 연관 분석 이외에, 대기 오염과 관련하여 영역 레벨로 상이한 DNA 메틸화를 확인하기 위해 두가지 방법, 즉, DMRcate (Peters et al. 2015)와 comb-p (Pedersen et al. 2012)를 이용하였다.In addition to the associated analysis of each CpG, two methods were used to identify different DNA methylation at the region level in relation to air pollution: DMRcate (Peters et al. 2015) and comb-p (Pedersen et al. 2012). .

두가지 방법은 DMR을 식별하기 위해 서로 다른 알고리즘을 구현하기 때문에 가양성(false positives)을 줄이면서 중요한 DMR을 갖는 두가지 방법을 모두 사용하였다. DMRcate는 상이한 메틸화 관련 신호를 갖는 튜너블 커널 스무딩 프로세스를 사용하는 반면, comb-p는 불규칙적으로 간격을 둔 p-값s에서 낮은 p-값의 지역 클러스터링을 검사한다. 후생유전자-광범위 연관연구 결과의 입력 파일 인 DMRcate의 'dmrcate' 함수(회귀 계수, 표준 편차 및 보정되지 않은 p- 값)을 사용하였다. 독립형 소프트웨어인 Comb-p는 보정되지 않은 p-값와, 염색체 위치 정보 (염색체 및 물리적 위치)가 포함된 입력 파일과 함께 사용하였다. 본 실험에서 유의한 DMR을 정의하기 위해 다음의 세가지 기준을 적용했다.Since both methods implement different algorithms to identify DMR, both methods with important DMR are used while reducing false positives. DMRcate uses a tunable kernel smoothing process with different methylation related signals, while comb-p checks for local clustering of low p-values at irregularly spaced p-values. The 'dmrcate' function (regression coefficient, standard deviation, and uncorrected p-value) of DMRcate, an input file of epigenetic-wide range association study results, was used. The standalone software Comb-p was used with an input file containing uncorrected p-values and chromosomal location information (chromosome and physical location). The following three criteria were applied to define significant DMR in this experiment.

첫째, 하나 이상의 CpG가 DMR 내에 있어야 한다.First, at least one CpG must be in the DMR.

둘째, 1,000 개의 염기쌍(bp) 내에서 인접한 CpG를 사용하여 구역별 상이한 메틸화 신호를 계산할 수 있다.Second, different methylation signals for each zone can be calculated using adjacent CpGs within 1,000 base pairs (bp).

셋째, 구역은 두 가지 방법 모두에서 다중검정교정된 P 값 <0.05를 가져야한다.Third, the zone must have a multi-calibrated P value <0.05 in both methods.

DMRcate의 FDR 및 comb-p의 Sidak 모두에서 영역 내의 최소 CpG 수 (N = 2)와 거리의 최소 길이 (N = 1000 뉴클레오티드)가 DMRcate의 기본값이었기 때문에 두 가지 방법의 결과를 조화시키기 위해 comb-p에 대해 동일한 값을 사용하였다.Since both the FDR of DMRcate and the Sidak of comb-p, the minimum number of CpGs in the region (N = 2) and the minimum length of distance (N = 1000 nucleotides) were the defaults for DMRcate, comb-p to harmonize the results of the two methods. The same values were used for.

두 가지 방법은 인접한 프로브의 연관성 결과를 기반으로 DMR을 호출하기 때문에 중요한 DMR이 반드시 해당 지역의 중요한 DMP와 중복되는 것은 아니다. 그리고 상이한 메틸화 영역을 가시화하기 위해 coMET를 사용하였다.Since both methods call DMR based on the results of the association of adjacent probes, important DMR does not necessarily overlap with important DMP in the region. And coMET was used to visualize different methylation regions.

1-6 관련 결과의 생물학적 영향1-6 Biological Effects of Related Results

각 CpG에 대한 유전자 주석은 제조업체(Illumina)의 주석 파일을 사용하여 수행하였고, UCSC RefGene 네임을 얻었다. 각 오염 물질 (PM10 또는 NO2) 관련하여 상이한 메틸화 시그널의 생물학적 영향을 위해, 우리는 보정되지 않은 p-값 <1E-04 (암시 적 결합에 대한 임의의 컷오프) 또는 중요한 DMR을 갖는 DMP에 주석된 유전자의 기능적 경로 분석을 수행하였다.Gene annotation for each CpG was performed using Illumina's annotation file, and the UCSC RefGene name was obtained. For the biological effects of different methylation signals in relation to each contaminant (PM 10 or NO 2 ), we have determined the uncorrected p-value <1E-04 (any cutoff for implicit binding) or DMP with significant DMR. Functional pathway analysis of the annotated gene was performed.

매핑된 유전자 목록은 Ingenuity Pathway Analysis(IPA, Ingenuity Systems, QIAGEN, CA, USA)의 'Core Analysis'에 대한 입력되었다. 조직 또는 세포 유형 특이 신호의 유전자 발현 빈도를 평가하기 위해 우리는 실험적으로 유도된 기능성 요소를 사용하여 DNase 1 과민성 부위 (DHS)와 중첩되는 경우, 각 DMR에서 최소 p 값을 갖는 DMP (FDR <0.05) 및 프로브를 분석하였다(EWAS의 ReGions).The mapped gene list was entered for 'Core Analysis' of Ingenuity Pathway Analysis (IPA, Ingenuity Systems, QIAGEN, CA, USA). To evaluate the frequency of gene expression of tissue or cell type specific signals, we used experimentally derived functional elements to overlap DDNs with a minimum p value in each DMR (FDR <0.05, when overlapping with a DNase 1 hypersensitivity site (DHS). ) And probes were analyzed (EWAS ReGions).

1-7 반복 조사(Replication look-up)1-7 Replication look-up

이전 EWAS의 결과로 DMP를 재현하기 위해 성인에서 PM10 또는 NO2 노출에 관한 두 가지 후생유전자-광범위 연관연구에서 DMP (FDR <0.05)의 근거를 확인하였다(Lichtenfels 외 2018; Plusquin et al. 2017). 또한 두 연구에서 보고된 DMP가 본 연구에서 반복되었는지 여부를 조사했다. 두 연구에서 5,001 개의 DMP가 보고되었으며(FDR <0.05), PM10은 9 개, NO2는 4,992 개이다. 이 중 4,671 개는 프로브 필터링 후 데이터에서 검색 분석에 사용할 수 있었고, PM10은 9 개이고 NO2는 4,662 개이다. 룩업을 위한 통계적 유의성을 위해 보정되지 않은 p-값의 컷오프를 0.05 미만으로 설정했다.To reproduce DMP as a result of previous EWAS, the evidence of DMP (FDR <0.05) was confirmed in two epigene-wide association studies of PM 10 or NO 2 exposure in adults (Lichtenfels et al. 2018; Plusquin et al. 2017 ). We also investigated whether the DMPs reported in both studies were repeated in this study. In both studies, 5,001 DMPs were reported (FDR <0.05), PM10 was 9, and NO 2 was 4,992. Of these, 4,671 were used for search analysis in the data after probe filtering, and PM10 was 9 and NO 2 was 4,662. The cutoff of the uncorrected p-value was set to less than 0.05 for statistical significance for lookup.

1-8 DMPs의 메틸화 수준과 근처 전사체의 유전자 발현 수준과의 연관성 : BIOS 데이터의 발현 양적 형질 전환 메틸화(expression quantitative trait methylation , eQTM)Correlation between methylation levels of 1-8 DMPs and gene expression levels of nearby transcripts: expression quantitative trait methylation (eQTM) of BIOS data

DMPs의 메틸화 수준과 근처 전사체(cis-eQTMs)의 발현 수준 사이의 연관성을 평가하기 위해 메틸화 M 값, 메틸화 대 비메틸화 프로브 강도의 log2 비율, 유전자 발현, 나이, 성별, 림프구 백분율, 단핵구 백분율 및 RNA 흐름 세포 번호를 회귀하였다. 모형의 팽창은 "베이컨"방법을 사용하여 교정하였다. 중요한 DMP (FDR <0.05)를 중심으로 250 킬로베이스 쌍 (kb)의 부분에 eQTM을 매핑하였다. 이 분석을 위해, 메틸화와 유전자 발현 데이터가 모두 네 개의 집단(Leiden Longevity Study, LifeLines Study, Rotterdam Study 및 Netherland Twin Study)에서 이용 가능한 총 3,075 개의 샘플을 사용하였다. 각 집단을 따로 분석 한 다음 METAL 소프트웨어를 사용하는 역분산 가중 고정 효과 모델을 사용하여 결과를 메타 분석하였다.To evaluate the association between the methylation level of DMPs and the expression level of nearby transcripts (cis-eQTMs), the methylated M value, log2 ratio of methylation to unmethylated probe strength, gene expression, age, gender, lymphocyte percentage, monocyte percentage and RNA flow cell numbers were regressed. The expansion of the model was corrected using the "Bacon" method. The eQTM was mapped to a portion of a 250 kilobase pair (kb) centered on an important DMP (FDR <0.05). For this analysis, a total of 3,075 samples with methylation and gene expression data available in all four populations (Leiden Longevity Study, LifeLines Study, Rotterdam Study and Netherland Twin Study) were used. Each group was analyzed separately, and then the results were meta-analyzed using an inverse distributed weighted fixed-effects model using METAL software.

<실시예 2> 결과<Example 2> Results

실험 참여자의 평균 연령은 73세( 표준편차, SD=6)이고, 66%는 남성이었다(표 1). 그리고 39명의 비흡연자, 30명의 과거 흡연자 및 31명의 현재 흡연자이다. 평균 대기오염 농도는 PM10의 경우 45.1 μg/m3이었고 NO2의 경우 13.1 ppb 이었다. 두 대기 오염 물질은 높은 상관관계가 있었다(Spearman 상관 계수 = 0.74, p 값 <2.2E-16).The mean age of the participants was 73 years (standard deviation, SD = 6), and 66% were male (Table 1). And 39 non-smokers, 30 past smokers and 31 current smokers. The average air pollution concentration was 45.1 μg / m 3 for PM10 and 13.1 ppb for NO 2 . The two air pollutants were highly correlated (Spearman correlation coefficient = 0.74, p value <2.2E-16).

Figure 112018125773019-pat00001
Figure 112018125773019-pat00001

Figure 112018125773019-pat00002
Figure 112018125773019-pat00002

두 가지 오염 물질 (FDR <0.05)과 관련하여 다수의 DMPs를 발견하였다. PM10만의 경우 11개, NO2만의 경우 44 개, PM10과 NO2 양쪽 모두는 1 개였다.A number of DMPs were found with two contaminants (FDR <0.05). 11, if only PM10, 44 gae when only NO 2, PM10 and NO 2 are both gaeyeotda 1.

표 2는 PM10 노출과 관련하여 혈액 DNA에서 상이하게 메틸화된 CpGs(FDR <0.05)를 염색체 위치별로 정렬한 것이고, 표 3은 NO2 노출과 관련하여 혈액 DNA에서 상이하게 메틸화된 CpGs(FDR <0.05)를 염색체 위치별로 정렬한 것이다.Table 2 shows the different methylated CpGs (FDR <0.05) in blood DNA in relation to PM 10 exposure by chromosomal location, and Table 3 shows the different methylated CpGs (FDR <in blood DNA in relation to NO 2 exposure). 0.05).

Figure 112018125773019-pat00003
Figure 112018125773019-pat00003

Figure 112018125773019-pat00004
Figure 112018125773019-pat00004

Figure 112018125773019-pat00005
Figure 112018125773019-pat00005

Figure 112018125773019-pat00006
Figure 112018125773019-pat00006

56개의 DMPs 중 일부는 본페로니 다중검정보정 후 PM10 노출과 관련된 cg05454562 (WDR46), cg13999433 (AKNA) 및 cg11691844 (SYTL2)는 같은 유의성을 보였다(표 2).Some of the 56 DMPs showed the same significance for cg05454562 (WDR46), cg13999433 (AKNA) and cg11691844 (SYTL2) associated with PM 10 exposure after Bonferroni multiplex assay (Table 2).

cg05171937 (STK38L), cg26583725 (IRS2와 8,541 bp 떨어져 있음) 및 cg06226567 (C20orf56)은 NO2 노출과 관련이 있었다(표 3).cg05171937 (STK38L), cg26583725 (8,541 bp away from IRS2) and cg06226567 (C20orf56) were associated with NO 2 exposure (Table 3).

DMP cg06992688 (OTUB2)은 PM10과 NO2에 전적으로 상관관계가 있었다.(FDR <0.05)DMP cg06992688 (OTUB2) was completely correlated with PM10 and NO 2 (FDR <0.05).

두 대기오염 물질에 대한 노출은 대부분 전적으로 DNA메틸화와 상관관계가 있었는데, PM10의 경우 92 %, NO2의 경우 71 %였다.Exposure to both air pollutants was mostly entirely correlated with DNA methylation, 92% for PM10 and 71% for NO 2 .

도 2에서와 같이 본 발명에서 후생유전자-광범위 연관 분석(EWAS)의 시각적 표현을 위해 Manhattan 및 quantile-quantile plots으로 나타내었다. 본 실시예의 연관성 결과에서 유전체 인플레이션 계수(genomic inflation factor) 람다(lambda) 값은 PM10 노출의 경우 0.83이었고 NO2 노출의 경우 1.07 이었기 때문에 체계적인 인플레이션(systematic inflation)은 관찰되지 않았다.As shown in FIG. 2, Manhattan and quantile-quantile plots are used for visual representation of epigenetic-wide range association analysis (EWAS) in the present invention. Systematic inflation was not observed because the genomic inflation factor lambda value in this example was 0.83 for PM 10 exposure and 1.07 for NO 2 exposure.

그리고 대기오염과 관련하여 다수의 DMRs를 발견하였다. PM10 만 22 개, NO2 만 52 개, PM10과 NO2 모두 5 개 이다. In addition, a number of DMRs have been discovered in relation to air pollution. There are 22 in the PM 10 , 52 in the NO 2 , and 5 in both the PM10 and NO 2 .

PM10 노출과 관련하여 혈액 DNA에서 상이하게 메틸화된 영역(DMRs)을 표 4에 나타내었다(DMRcate 및 comb-p에서 P<0.05로 조절됨).Different methylated regions (DMRs) in blood DNA with respect to PM 10 exposure are shown in Table 4 (adjusted to P <0.05 in DMRcate and comb-p).

NO2 노출과 관련하여 혈액 DNA에서 상이하게 메틸화된 영역(DMRs)을 표 5에 나타내었다(DMRcate 및 comb-p에서 P<0.05로 조절됨).Different methylated regions (DMRs) in blood DNA with respect to NO 2 exposure are shown in Table 5 (adjusted to P <0.05 in DMRcate and comb-p).

Figure 112018125773019-pat00007
Figure 112018125773019-pat00007

Figure 112018125773019-pat00008
Figure 112018125773019-pat00008

Figure 112018125773019-pat00009
Figure 112018125773019-pat00009

Figure 112018125773019-pat00010
Figure 112018125773019-pat00010

Figure 112018125773019-pat00011
Figure 112018125773019-pat00011

두 오염 물질과 관련된 5 개의 DMR은 chr6 : 30297174-30297627 (TRIM39), chr6 : 31539539-31540750 (LTA), chr8 : 19459672-19460243 (CSGALNACT1), chr17 : 80084554-80085082 (CCDC57) 및 chr20 : 45179157-45179413 (C20orf123)이다.The five DMRs associated with the two contaminants are chr6: 30297174-30297627 (TRIM39), chr6: 31539539-31540750 (LTA), chr8: 19459672-19460243 (CSGALNACT1), chr17: 80084554-80085082 (CCDC57) and chr20: 45179157-45179413 (C20orf123).

DMR에는 반드시 DMP가 포함되어 있지는 않지만 PM10 노출 chr8 : 28961315-28961356 (KIF13B)과 관련된 DMR은 DMP-cg07023317을 포함한다. NO2 노출과 관련된 4 개의 DMR은 chr1 : 153347819-153348305 (S100A12)의 cg02901136, chr6 : 31539539-31540750 (LTA)의 cg11586857, chr14 : 105390602-105391263 (PLD4)의 cg15352829 및 chr15 : 45670068-45671708의 cg04025675를 포함하였다(GATM; LOC145663).DMR does not necessarily include DMP, but DMRs associated with PM 10 exposure chr8: 28961315-28961356 (KIF13B) include DMP-cg07023317. The four DMRs associated with NO 2 exposure are chr1: 153347819-153348305 (S100A12) cg02901136, chr6: 31539539-31540750 (LTA) cg11586857, chr14: 105390602-105391263 (PLD4) cg15352829 and chr15: 45670068-45671708 cg040256 (GATM; LOC145663).

각 DMR 방법에서, 다중검정교정된 p-값(DMRcate에서의 FDR)에 기초한 상위 2 개의 DMR은 조절 유전체 영역의 주석 및 이웃 프로브의 쌍 방향 상관관계를 포함하는 영역의 연관성 결과에 대해 도 3에 시각화하였다.In each DMR method, the top two DMRs based on the multi-calibrated p-value (FDR in DMRcate) are shown in FIG. 3 for the results of the association of the regions including the annotation of the regulatory genomic region and the bidirectional correlation of neighboring probes. Visualized.

DMR 내에서 최소 p 값을 갖는 DMPs (FDR <0.05) 또는 DMRcate 내 FDR <0.05 (Sidak 보정 p 값 <comb-p <0.05)를 갖는 유전자에 기초한 관련 결과에서 강화된 생물학적 네트워크)에 주석을 달았으며, PM10은 138, NO2는 288이다. 강화된 네트워크에는 염증 및 면역 반응 및 심혈관, 호흡기 및 대사성 질환이 포함되었다. 암, 혈액학적 발달, 면역학적 및 염증성 질환 경로는 PM10과 NO2와 관련된 상이한 메틸화 신호 사이에서 중첩되었다(도 4a). PM10과 NO2에 노출에 관련된 유전자들 중 NLRC4, RPTOR, CUX1, S100A12, LTA 및 HLA-DMB(도 4b)와 같은 혈액학적, 면역학적 및 염증성 네트워크에 기여하는 유전자가 있었다(도 4b).Annotated DMPs with minimal p value in DMR (FDR <0.05) or FDR <0.05 in DMRcate (enhanced biological network in relevant results based on genes with Sidak corrected p value <comb-p <0.05)) , PM10 is 138, NO 2 is 288. The enhanced network included inflammatory and immune responses and cardiovascular, respiratory and metabolic diseases. Cancer, hematologic development, immunological and inflammatory disease pathways overlap between different methylation signals associated with PM10 and NO 2 (FIG. 4A). Among the genes involved in exposure to PM10 and NO 2 were genes contributing to hematologic, immunological and inflammatory networks such as NLRC4, RPTOR, CUX1, S100A12, LTA and HLA-DMB (Figure 4b) (Figure 4b).

eFORGE(Breeze 외 2016)를 사용하여 대기 오염 (PM10 또는 NO2) 노출과 관련된 132 개의 프로브 중 조직 또는 세포 유형의 특정 히스톤 자국 (H3K27me3, H3K36me3, H3K4me3, H3K4me3 및 H3K4me1)을 발견하였다. DMP 분석에서 FDR <0.05 또는 DMR의 최소 p 값 : PM10 단독 노출의 경우 11 DMPs, NO2 단독 노출의 경우 44 DMPs, PM10 및 NO2 모두의 노출의 경우 1 DMP, 최소 P 값을 나타내는 19 프로브는 PM10 노출 관련 DMR이고, 최소 p 값을 나타내는 49 개의 프로브는 NO2 노출 관련 DMR, 그리고 최소 p 값을 나타내는 8 개의 프로브는 PM10과 NO2 노출과 관련된 DMR인 것을 보여준다. 혈액에서 H3K4me1의 강화는 PM10 노출과 관련된 상이한 메틸화가 관찰되었다(도 5). NO2 노출과 관련된 상이한 메틸화와 관련하여, 여러 히스톤 마크가 강화되었다; H3K4me1(도 6a), H3K27me3(도 6b), H3K4me3(도 6c) 및 H3K9me3(도 6d). 배아 줄기 (ES) 세포에서 H3K4me1 및 H3K27me3; 폐의 H3K4me1를 확인하였다(도 6).Specific histone marks (H3K27me3, H3K36me3, H3K4me3, H3K4me3 and H3K4me1) of tissue or cell type among 132 probes associated with air pollution (PM10 or NO 2 ) exposure were found using eFORGE (Breeze et al. 2016). In DMP analysis FDR <0.05 or minimum p value of the DMR: PM 10 for 11 DMPs, NO 2 alone exposure when a single exposure to 44 for DMPs, PM 10 and NO 2 both exposure of 1 DMP, 19 represents the minimum P value Probes are PM 10 exposure related DMR, 49 probes showing the minimum p value are NO 2 exposure related DMR, and 8 probes showing the minimum p value are PM10 and NO 2 exposure related DMR. Enhancement of H3K4me1 in blood observed different methylation associated with PM 10 exposure (FIG. 5). With respect to different methylation associated with NO 2 exposure, several histone marks have been enhanced; H3K4me1 (FIG. 6A), H3K27me3 (FIG. 6B), H3K4me3 (FIG. 6C) and H3K9me3 (FIG. 6D). H3K4me1 and H3K27me3 in embryonic stem (ES) cells; Lung H3K4me1 was identified (FIG. 6).

본 발명에서 몇몇 DMPs (FDR <0.05)는 본 발명 이전의 유전자 광범위 DNA 메틸화 연구에서 공기 오염에 노출에 의한 것으로 보고되었다. 본 발명에서 NO2와 관련된 27 개의 DMP (FDR <0.05) 중 11 개가 LifeLines군 (Lichtenfels et al. 2018)에서 동일한 효과의 방향으로 NO2 노출과 관련이 있다고 보고되었다(표 6). Several DMPs (FDR <0.05) in the present invention have been reported to be due to exposure to air pollution in genetic wide DNA methylation studies prior to the present invention. In the present invention, 11 of 27 DMPs associated with NO 2 (FDR <0.05) were reported to be related to NO 2 exposure in the direction of the same effect in the LifeLines group (Lichtenfels et al. 2018) (Table 6).

Figure 112018125773019-pat00012
Figure 112018125773019-pat00012

Figure 112018125773019-pat00013
Figure 112018125773019-pat00013

본 실시예에서 PM10과 관련있는 12 개의 DMPs(FDR < 0.05)는 새로운 것으로 두 개의 이전 연구 (Lichtenfels et al., 2018; Plusquin et al., 2017)에서 이 오염 물질과 관련이 있다고 보고되지 않았다. 특히, 2 개의 연구에서 NO2 노출과 연관되어 있고 본 데이터에서 이용 가능한 것으로 보고된 4,662 개의 프로브 중 26 % (N = 1,231)는 본 실시예에서 최소 명목상의 중요성(보정되지 않은 p- 값 <0.05)과 연관성을 나타낸다.The 12 DMPs associated with PM10 in this example (FDR <0.05) are new and have not been reported to be associated with this contaminant in two previous studies (Lichtenfels et al., 2018; Plusquin et al., 2017). In particular, 26% (N = 1,231) of the 4,662 probes that were associated with NO 2 exposure in 2 studies and reported to be available in this data were of minimal nominal importance (uncorrected p-value <0.05 in this example). ).

BIOS 데이터에서 DNA 메틸화와 유전자 발현을 분석한 결과, DMPs의 메틸화 수준과 근처 전사체(250bp 부위에 걸쳐) 유전자 발현 수준(보정되지 않은 p 값 <0.05)의 상관관계를 확인하였다. 특히, 56 DMPs (FDR <0.05)의 70 % (N = 39)는 근처 전사체의 유전자 발현과 유의한 관련이 있었다.As a result of analyzing the DNA methylation and gene expression in the BIOS data, it was confirmed that the correlation between the methylation level of DMPs and the nearby transcript (over 250 bp region) gene expression level (uncorrected p value <0.05). In particular, 70% of 56 DMPs (FDR <0.05) (N = 39) were significantly associated with gene expression in nearby transcripts.

결과 분석Results analysis

본 실시예에서 혈액에서 대기 오염물질 PM10과 NO2 장기 노출에 관련하여 많은 상이하게 메틸화된 신호(개별 프로브 및 영역)를 확인하였다. 특히, 많은 DMP의 메틸화 수준은 전사체 부근의 유전자 발현 수준과 관련되어 있으며, 대기 오염과 관련된 상이한 메틸화와 유전자 발현 사이의 연관성이 확인되었다.In this example, many different methylated signals (individual probes and regions) were identified in relation to long-term exposure to air pollutants PM10 and NO 2 in the blood. In particular, the level of methylation of many DMPs is related to the level of gene expression in the vicinity of the transcript, and the association between gene expression and different methylation associated with air pollution has been confirmed.

대기 오염과 관련되어 있는 다양한 건강 결과에 대한 유전자-광범위 관련 연구에서 보고된 유전자좌에 주석이 첨부된 일부 DMPs를 확인하였다. 이전 연구에서 rs1799964 (p 값 = 3.3E-07)가 혈중 지질 농도와 관련이 있음을 확인한 LTA에 주석에서 처리된 두 오염 물질 노출과 관련된 cg11586857의 상이한 메틸화가 있다. 두 대기 오염 물질에 대한 노출과 관련된 Cg06992688은 1.0E-04 부근의 p 값을 갖는 폐기능과 관련하여 세 가지 유전자 변이의 가까운 유전자인 OTUB2에 있다. 또한 NO2 노출과 관련된 cg05284742는 ITPK1에 위치하고 있다. 이 유전자는 아시아 인구에서 심근 경색과 관련된 rs2295394 (p 값 = 2.3E-16)를 포함하고 있다.Some DMPs annotated with loci reported in a gene-wide study on various health outcomes related to air pollution were identified. There is a different methylation of cg11586857 associated with the exposure of two pollutants treated in tin to LTA, which in previous studies confirmed that rs1799964 (p value = 3.3E-07) is related to blood lipid concentration. Cg06992688, which is associated with exposure to two air pollutants, is in OTUB2, the closest gene of three genetic variations with respect to pulmonary function with p values around 1.0E-04. In addition, cg05284742 associated with NO 2 exposure is located in ITPK1. This gene contains rs2295394 (p value = 2.3E-16) associated with myocardial infarction in the Asian population.

본 실시예를 통해 염증 및 면역 반응 및 심혈관, 폐 및 대사성 질환과 같은 네트워크가 강화된 결과는 이전의 대기 오염 노출 및 확인된 질병 연관성을 뒷받침한다. 다른 조직 및 세포 유형 (배아 줄기 세포, 혈액 및 폐)의 여러 강화된 히스톤 마크로는 상이한 메틸화 신호의 생물학적 관련성을 의미한다.The results of strengthening networks such as inflammatory and immune responses and cardiovascular, pulmonary and metabolic diseases through this example support prior air pollution exposure and confirmed disease associations. Several enhanced histone macros of different tissues and cell types (embryonic stem cells, blood and lungs) indicate the biological relevance of different methylation signals.

본 실시예에서 상이한 메틸화 신호는 아시아의 대기 오염과 DNA 메틸화 사이의 유사한 관계를 의미한다. 본 실시예에서 두 가지 오염 물질과 관련된 공통적이고 독특한 생물학적 표지나 메커니즘이 있는지 조사할 수 있도록 PM10과 NO2 노출을 모두 포함 시켰다. 또한 유전자 발현과의 관계를 조사하여 DMP를 추적한 결과 대다수는 유전자 발현과 관련이 있다는 사실을 발견했으며, 이는 관련 기능적 중요성을 시사한다. 또한 관찰된 상이한 메틸화 신호의 생물학적 의미를 더 잘 이해하기 위해 조직 및 세포 유형의 특정 히스톤 자국에 대한 경로 분석 및 강화 분석을 수행하였다. 마지막으로 DMP를 식별하는 것 외에도 두 가지 방법을 사용하여 인접한 CpG에서 연결 신호를 결합하여 DMR을 식별하였다.Different methylation signals in this example indicate a similar relationship between air pollution in Asia and DNA methylation. To investigate whether the common and unique biological markers and mechanisms associated with two pollutants in this example included all of the PM10 and NO 2 exposure. In addition, by examining the relationship with gene expression and tracking DMP, the majority of them were found to be related to gene expression, suggesting a related functional significance. In addition, route analysis and enrichment analysis was performed for specific histone marks of tissues and cell types to better understand the biological significance of the different methylation signals observed. Finally, in addition to identifying DMPs, two methods were used to identify DMRs by combining link signals from adjacent CpGs.

본 발명을 통해 장기 대기 오염 노출과 관련하여 혈액에서 상이한 DNA 메틸화 신호를 확인하였으며, 상이한 메틸화와 상이한 유전자 발현이 관련되어 있다. 상이한 메틸화를 보이는 CpG 및 영역은 대기 오염 노출에 대한 잠재적인 바이오 마커로 활용될 수 있다. 이러한 결과는 대기 오염 노출과 유해한 건강 결과를 연결하는 메커니즘 분석에 활용될 수 있다.Through the present invention, different DNA methylation signals have been identified in the blood in relation to long-term air pollution exposure, and different methylation and different gene expression are involved. CpG and regions showing different methylation can serve as potential biomarkers for air pollution exposure. These results can be used to analyze mechanisms linking exposure to air pollution with harmful health outcomes.

이상에서 살펴본 바와 같이, 본 발명의 구체적인 실시예를 상세하게 설명되었으나, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시예를 용이하게 제안할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상술한 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As described above, specific embodiments of the present invention have been described in detail, but those skilled in the art to understand the spirit of the present invention may add other components within the scope of the same spirit, change, delete, etc., and degenerate other inventions However, other embodiments included within the scope of the inventive concept may be easily proposed. Therefore, it should be understood that the above-described embodiments are illustrative in all respects and not restrictive. The scope of the present invention is indicated by the scope of claims to be described later rather than the detailed description described above, and all the changed or modified forms derived from the meaning and scope of the claims and their equivalent concepts are included in the scope of the present invention. It should be interpreted as.

Claims (9)

한국인 대상 개체로부터 채취된 시료로부터 DNA를 분리하고,
상기 DNA로부터 OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1종 이상의 유전자의 메틸화를 검출하는 것을 포함하며,
OTUB2 유전자의 경우 14 번 염색체의 94491958 번째 염기, TRIM39 유전자의 경우 6 번 염색체의 30297174 내지 30297627 번째 염기 영역, LTA 유전자의 경우 6 번 염색체의 31539539 내지 31540750 번째 염기 영역, CSGALNACT1 유전자의 경우 8 번 염색체의 19459672 내지 19460243 번째 염기 영역, CCDC57 유전자의 경우 17 번 염색체의 80084554 내지 80085082 번째 염기 영역, 그리고 C20orf123 유전자의 경우 20 번 염색체의 45179157 내지 45179413 번째 염기 영역의 메틸화를 검출하는 것을 특징으로 하는,
한국인의 대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법.
DNA is isolated from samples collected from Korean subjects,
Detecting the methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123 from the DNA,
For the OTUB2 gene, the 94491958 th base of chromosome 14, for the TRIM39 gene, the 30297174 to 30297627 th base region of the chromosome 6, for the LTA gene, the 31539539 to 31540750 th base region of chromosome 6, for the CSGALNACT1 gene chromosome 8 Characterized by detecting methylation of 19459672 to 19460243 nucleotide region, 80084554 to 80085082 nucleotide region of chromosome 17 for CCDC57 gene, and 45179157 to 45179413 nucleotide region of chromosome 20 for C20orf123 gene,
How to provide gene methylation information for Korean air pollution exposure.
삭제delete 제1항에 있어서,
상기 시료는 인간 대상의 조직, 세포, 혈액, 혈장 및 소변으로부터 선택되는 것인, 한국인의 대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법.
According to claim 1,
The sample is selected from tissues, cells, blood, plasma and urine of human subjects, a method for providing gene methylation information for exposure to air pollution in Koreans.
제1항에 있어서,
메틸화의 검출은 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), 메틸화 DNA 특이적 결합 항체 또는 압타머를 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 구성된 군에서 선택되는 방법에 의해 수행되는 것을 특징으로 하는, 한국인의 대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법.
According to claim 1,
Detection of methylation is PCR, methylation specific PCR, real time methylation specific PCR, PCR using methylated DNA specific binding antibody or aptamer, quantitative PCR, DNA chip, pyrosequencing and A method for providing gene methylation information for exposure to air pollution in Koreans, characterized by being performed by a method selected from the group consisting of bisulfite sequencing.
제1항에 있어서,
검출된 유전자의 메틸화 여부 또는 메틸화 수준을 질병에 관련된 유전자 발현 수준과 비교하는 것을 포함하는 것을 포함하는, 한국인의 대기오염 노출에 대한 유전자 메틸화 정보를 제공하는 방법.
According to claim 1,
A method for providing gene methylation information for exposure to air pollution in Koreans, comprising comparing the methylation level of the detected gene or the methylation level with a gene expression level associated with the disease.
OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 및 C20orf123로부터 선택되는 1 종 이상의 유전자의 메틸화를 검출할 수 있는 물질을 포함하며,
OTUB2 유전자의 경우 14 번 염색체의 94491958 번째 염기, TRIM39 유전자의 경우 6 번 염색체의 30297174 내지 30297627 번째 염기 영역, LTA 유전자의 경우 6 번 염색체의 31539539 내지 31540750 번째 염기 영역, CSGALNACT1 유전자의 경우 8 번 염색체의 19459672 내지 19460243 번째 염기 영역, CCDC57 유전자의 경우 17 번 염색체의 80084554 내지 80085082 번째 염기 영역, 그리고 C20orf123 유전자의 경우 20 번 염색체의 45179157 내지 45179413 번째 염기 영역의 메틸화를 검출하는 것을 특징으로 하는,
한국인의 대기오염 노출에 대한 유전자 메틸화 분석용 조성물.
Contains substances capable of detecting methylation of one or more genes selected from OTUB2, TRIM39, LTA, CSGALNACT1, CCDC57 and C20orf123,
For the OTUB2 gene, the 94491958 th base of chromosome 14, for the TRIM39 gene, the 30297174 to 30297627 th base region of the chromosome 6, for the LTA gene, the 31539539 to 31540750 th base region of chromosome 6, for the CSGALNACT1 gene chromosome 8 Characterized by detecting methylation of 19459672 to 19460243 nucleotide region, 80084554 to 80085082 nucleotide region of chromosome 17 for CCDC57 gene, and 45179157 to 45179413 nucleotide region of chromosome 20 for C20orf123 gene,
Composition for gene methylation analysis of exposure to air pollution in Koreans.
제6항에 있어서,
상기 메틸화를 검출할 수 있는 물질은, 메틸화된 염기 또는 메틸화된 염기 영역을 포함하는 단편을 증폭할 수 있는 프라이머쌍, 메틸화된 염기 또는 메틸화된 염기 영역과 혼성화할 수 있는 프로브, 메틸화된 염기 또는 메틸화된 염기 영역과 결합할 수 있는 메틸화 특이적 결합 단백질, 메틸화 특이적 결합 항체 또는 압타머, 메틸화 민감성 제한 엔도뉴클라아제, 시퀀싱 프라이머, 시퀀싱 바이 신세시스 프라이머 및 시퀀싱 바이 라이게이션 프라이머로 구성된 군에서 선택되는 것인, 한국인의 대기오염 노출에 대한 유전자 메틸화 분석용 조성물.
The method of claim 6,
The substance capable of detecting methylation is a primer pair capable of amplifying a fragment containing a methylated base or a methylated base region, a probe capable of hybridizing with a methylated base or a methylated base region, a methylated base or methylation Selected from the group consisting of methylation specific binding protein, methylation specific binding antibody or aptamer, methylation sensitivity limiting endonuclease, sequencing primer, sequencing by synthesis primer, and sequencing by ligation primer capable of binding to the base region The composition for analysis of gene methylation for exposure to air pollution in Koreans.
삭제delete 제6항 및 제7항 중 어느 한 항의 조성물을 포함하는, 한국인의 대기오염 노출에 대한 유전자 메틸화 분석용 키트.
A kit for analysis of gene methylation for exposure to air pollution in Koreans, comprising the composition of claim 6.
KR1020180161796A 2018-12-14 2018-12-14 Gene methylation markers for exposure to air pollutants and methods for providing information using the same KR102113549B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180161796A KR102113549B1 (en) 2018-12-14 2018-12-14 Gene methylation markers for exposure to air pollutants and methods for providing information using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180161796A KR102113549B1 (en) 2018-12-14 2018-12-14 Gene methylation markers for exposure to air pollutants and methods for providing information using the same

Publications (1)

Publication Number Publication Date
KR102113549B1 true KR102113549B1 (en) 2020-05-21

Family

ID=70910450

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180161796A KR102113549B1 (en) 2018-12-14 2018-12-14 Gene methylation markers for exposure to air pollutants and methods for providing information using the same

Country Status (1)

Country Link
KR (1) KR102113549B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180068723A (en) * 2016-12-14 2018-06-22 한국과학기술연구원 Methylation marker for identifying of exposure to particulate matter 2.5 and the identification method using thereof
KR101920158B1 (en) * 2017-06-27 2018-11-19 강원대학교산학협력단 Methylation marker for diagnosing chronic obstructive pulmonary disease

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180068723A (en) * 2016-12-14 2018-06-22 한국과학기술연구원 Methylation marker for identifying of exposure to particulate matter 2.5 and the identification method using thereof
KR101920158B1 (en) * 2017-06-27 2018-11-19 강원대학교산학협력단 Methylation marker for diagnosing chronic obstructive pulmonary disease

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Ana JuliadeF.C.Lichtenfels, Diana A.vanderPlaat et al. Long-term Air Pollution Exposure, Genome-wide DNA Methylation and Lung Function in the LifeLines Cohort Study (2018)
Clinical Epigenetics (2017) 9:38 *
Clinical Epigenetics (2019) 11:37 *
Environmental Health (2016) 15:119 *
Epigenomics (2017) 9(7):971-984 *
Plusquin, M., Guida, F., Polidoro, S. et al. DNA methylation and exposure to ambient air pollution in two prospective cohorts.(2017)
Respirology (2012) 17:590-600 *

Similar Documents

Publication Publication Date Title
Allen et al. SNP-mediated disruption of CTCF binding at the IFITM3 promoter is associated with risk of severe influenza in humans
Robertson et al. Comprehensive molecular characterization of muscle-invasive bladder cancer
Gerring et al. Genome-wide DNA methylation profiling in whole blood reveals epigenetic signatures associated with migraine
Gasparetto et al. Transcription and DNA methylation patterns of blood-derived CD8+ T cells are associated with age and inflammatory bowel disease but do not predict prognosis
US20210404003A1 (en) Dna methylation and genotype specific biomarker for predicting post-traumatic stress disorder
CN111394456B (en) Early lung adenocarcinoma patient prognosis evaluation system and application thereof
Li et al. Association between DNA hypomethylation at IL 13 gene and allergic rhinitis in house dust mite‐sensitized subjects
AU2006287191A1 (en) Methods and compositions for identifying biomarkers useful in diagnosis and/or treatment of biological states
WO2016097120A1 (en) Method for the prognosis of hepatocellular carcinoma
Siedlinski et al. Association of cigarette smoking and CRP levels with DNA methylation in α-1 antitrypsin deficiency
TW201910773A (en) Gene marker, reagent group and lung cancer detection method for detecting lung cancer
CN109563544A (en) The diagnostic assay of urine monitoring for bladder cancer
AU2014287090B2 (en) A DNA methylation and genotype specific biomarker of suicide attempt and/or suicide ideation
CN116134152A (en) Method for assessing risk of producing a severe response to coronavirus infection
Ammer-Herrmenau et al. Comprehensive wet-bench and bioinformatics workflow for complex microbiota using Oxford Nanopore Technologies
Poblete-Naredo et al. Molecular biomarkers to assess health risks due to environmental contaminants exposure
Flynn et al. Evaluation of nanopore sequencing for epigenetic epidemiology: a comparison with DNA methylation microarrays
Venkateswaran et al. Longitudinal DNA methylation profiling of the rectal mucosa identifies cell-specific signatures of disease status, severity and clinical outcomes in ulcerative colitis cell-specific DNA methylation signatures of UC
EP3740589A1 (en) Phenotypic age and dna methylation based biomarkers for life expectancy and morbidity
Goh et al. Personalizing and targeting therapy for COPD–the role of molecular and clinical biomarkers
Purdue et al. Differences in risk factors for molecular subtypes of clear cell renal cell carcinoma
KR102113549B1 (en) Gene methylation markers for exposure to air pollutants and methods for providing information using the same
Liu et al. Association between GSTM1 polymorphism and DNA adduct concentration in the occupational workers exposed to PAHs: a meta-analysis
Tsantikidi et al. RediScore: Prospective validation of a pipeline for homologous recombination deficiency analysis
Khodasevich et al. Comparison of DNA methylation measurements from EPIC BeadChip and SeqCap targeted bisulphite sequencing in PON1 and nine additional candidate genes

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant