CN113981079A - Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用 - Google Patents

Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用 Download PDF

Info

Publication number
CN113981079A
CN113981079A CN202111106420.4A CN202111106420A CN113981079A CN 113981079 A CN113981079 A CN 113981079A CN 202111106420 A CN202111106420 A CN 202111106420A CN 113981079 A CN113981079 A CN 113981079A
Authority
CN
China
Prior art keywords
gene
lung cancer
csf2rb
data
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111106420.4A
Other languages
English (en)
Inventor
周媛媛
谢军花
刘军权
项伶俐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Longquan People's Hospital Medical Community Of Longquan People's Hospital
Hangzhou Kingmed Center For Clinical Laboratory Co ltd
Original Assignee
Longquan People's Hospital Medical Community Of Longquan People's Hospital
Hangzhou Kingmed Center For Clinical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Longquan People's Hospital Medical Community Of Longquan People's Hospital, Hangzhou Kingmed Center For Clinical Laboratory Co ltd filed Critical Longquan People's Hospital Medical Community Of Longquan People's Hospital
Priority to CN202111106420.4A priority Critical patent/CN113981079A/zh
Publication of CN113981079A publication Critical patent/CN113981079A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/715Assays involving receptors, cell surface antigens or cell surface determinants for cytokines; for lymphokines; for interferons
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hospice & Palliative Care (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Oncology (AREA)
  • Public Health (AREA)
  • Food Science & Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及CSF2RB及编码蛋白在女性非吸烟肺癌保护中的应用,涉及生物医药技术领域。本发明提供给了一种CSF2RB基因及其编码蛋白作为生物标志物或治疗靶点在制备用于女性非吸烟肺癌的诊断、治疗、预后评估试剂或药物中的应用,为精准医疗的开展提供理论依据,同时也为LCNS肿瘤新药物的研发提供新靶点。

Description

CSF2RB及编码蛋白在女性非吸烟肺癌保护中的应用
技术领域
本发明涉及生物医药技术领域,特别是涉及CSF2RB及编码蛋白在女性非吸烟肺癌保护中的应用。
背景技术
肺癌是全世界两性中最常见的癌症(占所有病例的11.6%)和癌症死亡的主要原因(占所有此类死亡的18.4%),它每年造成180多万人死亡。与此疾病相关的高死亡率部分可归因于晚期诊断,在大约80%的病例中有局部或远距离扩散。肺癌晚期治疗效果较差,生存率也相当低(诊断早期5年生存率为57.4%,发生远距离转移时仅为5.2%)。
虽然80-90%的肺癌病例与吸入烟草烟雾致癌物有关,但10-25%的患者在没有显著的个人吸烟史的情况下发展为肺癌,而这一数据在亚洲国家更高,达到30-40%。目前,非吸烟者肺癌(Lung cancer in never smokers,LCNS)正成为一个日益严重的健康问题,且已被公认为全球癌症相关死亡的第七大原因。非吸烟者肺癌在分子和表观遗传水平上与吸烟者肺癌不同。多项研究表明,非吸烟者肺癌与吸烟者肺癌有不同的致癌途径。与吸烟者肺癌患者相比,非吸烟肺癌患者在性别、地理、组织病理、分子和临床方面存在显著差异。LCNS多见于女性,组织学以腺癌为主,其发病率在包括亚洲在内的某些地理区域较高,亚洲非吸烟女性的肺癌发病率是西方国家年龄调整后非吸烟女性人口的3-4倍。
非吸烟者肺癌(尤其是女性非吸烟肺癌)的发病原因尚未清楚,遗传因素被认为在非吸烟者肺癌的发病中有着重要的作用,揭示其内在遗传分子机制是一个亟待解决的问题。
发明内容
针对上述问题,本发明提供一种CSF2RB基因及其编码蛋白作为生物标志物或治疗靶点在制备用于女性非吸烟肺癌的诊断、治疗、预后评估试剂或药物中的应用,为精准医疗的开展提供理论依据,同时也为LCNS肿瘤新药物的研发提供新靶点。
为了达到上述目的,本发明提供一种CSF2RB基因及其编码蛋白作为生物标志物或治疗靶点在制备用于女性非吸烟肺癌的诊断、治疗、预后评估试剂或药物中的应用。
本发明人在研究过程中发现,随着高通量微阵列杂交技术和新一代测序技术的快速发展与应用推广,生物医学领域进入大数据时代,生物信息学技术得到了广泛的应用。目前尚未有研究关于女性非吸烟肺癌(LCNS)相较于女性吸烟者肺癌的差异基因研究,以及相关生存率和预后的关联性分析。因此,利用高通量数据库筛选特定的目标样本数据,了解吸烟者和非吸烟者在肺癌中的这些差异将有助于更好、更有效地诊断和治疗女性非吸烟肺癌(LCNS),差异表达基因与生存率关联性的发现也可用于预测女性非吸烟肺癌(LCNS)的生存期和5年生存率。
CSF2RB(colony stimulating factor 2receptor beta common subunit,集落刺激因子2受体β亚单位,又名共β亚基异源受体)基因,Gene ID:1439,又名CD131,CDw131,IL3RB,IL5RB,SMDP5,betaGMR。人CSF2RB基因位于第22号染色体短臂12区3带,该基因编码的蛋白是IL-3、IL-5和CSF的高亲和力受体的共同β链。
本发明人基于大数据和生物信息学技术筛选出女性非吸烟肺癌(LCNS)相较于女性吸烟者肺癌的关键差异表达基因CSF2RB,通过生存分析发现了CSF2RB基因表达水平与女性非吸烟肺癌生存期和5年生存率之间的关联:所述CSF2RB基因在女性非吸烟肺癌(LCNS)中表达下调;所述CSF2RB基因低表达群体的中位生存期(49个月)显著低于高表达群体的中位生存期(88.7个月);CSF2RB基因高表达群体的5年生存率(86%)显著高于低表达群体的5年生存率(67%)。
在其中一个实施例中,所述诊断包括风险预测和/或辅助诊断,所述预后评估包括生存期预测和/或生存率预测。
在其中一个实施例中,当所述CSF2RB基因或其编码蛋白表达低于阈值,则预测为高患病风险、短生存期或低生存率。
本发明还提供了检测CSF2RB基因及其编码蛋白的试剂在制备女性非吸烟肺癌诊断、治疗、预后评估试剂中的应用。
在其中一个实施例中,所述试剂的检测方式选自:PCR、免疫检测、原位杂交、基因芯片、一代测序技术或高通量测序中的一种。
本发明还提供了一种用于女性非吸烟肺癌检测的试剂盒,其特征在于,包括检测CSF2RB基因表达水平或检测CSF2RB基因编码蛋白的试剂。
本发明还提供了一种CSF2RB基因的激活剂或CSF2RB基因编码蛋白的激活剂在制备用于治疗女性非吸烟肺癌的药物中的应用。
本发明还提供了一种女性非吸烟肺癌标志物的筛选方法,其特征在于,包括以下步骤:
数据筛选:制定纳入标准,将数据库中符合所述纳入标准的基因数据筛选出来,得到筛选后数据;
数据处理:根据是否具有吸烟习惯对所述筛选后数据进行分组,标准化处理,得到标准化数据;
差异表达基因分析:对所述标准化数据进行差异表达基因分析,得到上调基因和下调基因;
基因功能分析:对所述上调基因和所述下调基因进行基因功能分析;
关键基因筛选:对所述上调基因和所述下调基因进行筛选,得到关键基因;
候选基因筛选:对所述关键基因进行生存分析,即得。
在其中一个实施例中,所述数据筛选步骤中,所述纳入标准包括:样本的来源为人组织,所述人包括患肺癌的人,所述样本的信息包括性别、吸烟习惯,所述基因数据为基因表达谱类型的芯片数据;
所述数据处理步骤中,采用R语言Limma包对所述筛选数据进行标准化处理;
所述差异表达基因分析步骤中,采用R语言Limma包对所述标准化数据进行差异表达基因分析;
所述基因功能分析步骤中,采用DAVID在线数据库对所述上调基因和所述下调基因进行基因功能分析;
所述关键基因筛选步骤中,采用蛋白-蛋白相互作用网络分析对所述上调基因和所述下调基因进行筛选,得到关键基因;
所述候选基因筛选步骤中,采用KM法对所述关键基因进行生存分析。
在其中一个实施例中,所述基因功能分析步骤中,所述基因功能分析为GO和KEGG基因富集功能分析;所述关键基因筛选步骤中,所述蛋白-蛋白相互作用网络采用STRING在线工具构建,所述关键基因选自所述蛋白-蛋白相互作用网络中连接度从高到低排序前五十的基因;所述候选基因筛选步骤中,表达水平和生存期,和/或表达水平和生存率的关联性最强的关键基因为所述候选基因。
在其中一个实施例中,所述关键基因选自所述蛋白-蛋白相互作用网络中连接度从高到底排序前二十的基因。
与现有技术相比,本发明具有以下有益效果:
本发明通过大数据和生物信息学技术筛选出女性非吸烟者肺癌(LCNS)相较于女性吸烟者肺癌的关键差异表达基因CSF2RB,通过生存分析发现了CSF2RB基因表达水平与女性非吸烟者肺癌生存期和5年生存率之间的关联:所述CSF2RB基因在女性非吸烟者肺癌(LCNS)中表达下调;所述CSF2RB基因低表达群体的中位生存期(49个月)显著低于高表达群体的中位生存期(88.7个月);CSF2RB基因高表达群体的5年生存率(86%)显著高于低表达群体的5年生存率(67%)。
附图说明
图1为实施例1中利用GEO数据库筛选女性非吸烟者肺癌相较于女性吸烟者肺癌的差异表达基因(DEGs)及生物信息学分析流程图。
图2为实施例1中基因mRNA表达芯片数据标准化处理前的箱线图;其中,1为女性非吸烟样本,2为女性吸烟样本。
图3为实施例1中基因mRNA表达芯片数据标准化处理后的箱线图;其中,3为女性非吸烟样本,4为女性吸烟样本。
图4为实施例1中基因mRNA表达芯片数据标准化处理前的表达密度图;其中,5为女性吸烟样本,6为女性非吸烟样本。
图5为实施例1中基因mRNA表达芯片数据标准化处理后的表达密度图;其中,因均一化后图形重合,女性吸烟肺癌样本和女性非吸烟肺癌样本的表达密度曲线均为7。
图6为实施例1中差异表达基因分析的火山图结果;其中,8为下调基因,9为上调基因。
图7为实施例1中差异表达基因分析的平均差图结果;其中,10为上调基因,11为下调基因。
图8为实施例1中所有差异表达基因分析的热图结果。
图9为实施例1中应用DAVID在线数据库对显著上调的DEGs进行GO terms基因富集功能分析结果;其中,12为生物学过程(BP),13为细胞定位(CC),14为分子功能(MF)。
图10为实施例1中应用DAVID在线数据库对显著上调的DEGs进行KEGG通路基因富集功能分析结果。
图11为实施例1中应用DAVID在线数据库对显著下调的DEGs进行GO terms基因富集功能分析结果;其中,15为生物学过程(BP),16为细胞定位(CC),17为分子功能(MF)。
图12为实施例1中应用DAVID在线数据库对显著下调的DEGs进行KEGG通路基因富集功能分析结果。
图13为实施例1中应用STRING在线工具构建差异表达基因编码蛋白相互作用(PPI)网络结果;其中,18为下调基因,19为上调基因。
图14为实施例1中应用Cytoscape软件cytoHubba插件筛选Top10的关键基因(Hubgenes)结果。
图15为实施例1中女性吸烟者肺癌(N=321)中CSF2RB基因的生存率曲线;其中,20代表CSF2RB基因高表达肺癌患者,21代表CSF2RB基因低表达肺癌患者。
图16为实施例1中女性吸烟者肺癌(N=321)中CSF2RB基因的基因表达蜂群图结果。
图17为实施例1中女性非吸烟者肺癌(N=168)中CSF2RB基因的生存率曲线;其中,22代表CSF2RB基因高表达肺癌患者,23代表CSF2RB基因低表达肺癌患者。
图18为实施例1中女性非吸烟者肺癌(N=168)中CSF2RB基因的基因表达蜂群图结果。
图19为实施例2中样本KM2160634的HE染色结果图在200倍镜下的观察结果。
图20为实施例2中样本KM2160634的HE染色结果图在100倍镜下的观察结果。
图21为实施例2中样本KM2162118的HE染色结果图在200倍镜下的观察结果。
图22为实施例2中样本KM2162118的HE染色结果图在100倍镜下的观察结果。
图23为实施例2中样本KM2164599的HE染色结果图在200倍镜下的观察结果。
图24为实施例2中样本KM2164599的HE染色结果图在100倍镜下的观察结果。
图25为实施例2中样本KM2150150的HE染色结果图在200倍镜下的观察结果。
图26为实施例2中样本KM2150150的HE染色结果图在100倍镜下的观察结果。
图27为实施例2中样本KM2138545的HE染色结果图在200倍镜下的观察结果。
图28为实施例2中样本KM2138545的HE染色结果图在100倍镜下的观察结果。
图29为实施例2中样本KM2131378的HE染色结果图在200倍镜下的观察结果。
图30为实施例2中样本KM2131378的HE染色结果图在100倍镜下的观察结果。
图31为实施例2中样本KM2112771的HE染色结果图在200倍镜下的观察结果。
图32为实施例2中样本KM2112771的HE染色结果图在100倍镜下的观察结果。
图33为实施例2中样本KM2114492的HE染色结果图在200倍镜下的观察结果。
图34为实施例2中样本KM2114492的HE染色结果图在100倍镜下的观察结果。
图35为实施例2中样本KM2116930的HE染色结果图在200倍镜下的观察结果。
图36为实施例2中样本KM2116930的HE染色结果图在100倍镜下的观察结果。
图37为实施例2中样本KM2117801的HE染色结果图在200倍镜下的观察结果。
图38为实施例2中样本KM2117801的HE染色结果图在100倍镜下的观察结果。
图39为实施例2中6个肺癌组织样本各自的CSF2RB基因表达量结果图。
图40为实施例2中女性非吸烟肺癌组织样本的CSF2RB基因表达量平均值、女性吸烟肺癌组织样本的CSF2RB基因表达量平均值。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
定义:
本发明所述的生存期:指患者在患某种疾病后的预计生存时间。
生存率:指指某生物种群内的每一个体经过一定时限以后生存的机率。
关键基因:是hub genes的中文翻译,指在蛋白相互作用网络中有高连接度degree的蛋白编码基因。
候选基因:指一类在疾病中表达情况尚不明确的基因,其蛋白产物也正在探讨中。它们参与生物体的表型表达,连锁分析提示其与基因组某一部位有关联,这些基因可能是结构基因、调节基因或是在生化代谢途径中影响性状表达的基因。
差异表达基因:指一个基因在RNA水平处在不同环境压力、时间、空间等方面下,表达有显著性差异(上调或下调)的基因。
试剂、材料、设备来源:
本实施例所用试剂、材料、设备如无特殊说明,均为市售来源;实验方法如无特殊说明,均为本领域的常规实验方法。
实施例1
筛选关键差异表达基因和生存分析。
通过大数据和生物信息学技术筛选出女性非吸烟肺癌相较于女性吸烟肺癌的关键差异表达基因,然后通过生存分析发现所述基因表达水平与女性非吸烟肺癌生存期和5年生存率之间的关联。利用GEO数据库筛选女性非吸烟者肺癌相较于女性吸烟者肺癌的差异表达基因(DEGs)及生物信息学分析流程图如图1所示。
1、数据的筛选。
本发明的数据来源为美国国立生物信息技术中心(NCBI)的高通量基因表达数据库(GEO,www.ncbi.nlm.nih.gov/geo),所述数据库是目前世界上最大最全面的储存高通量基因表达丰度数据的公共开源数据库。
制定纳入标准:①样本应包含肺癌;②样本为人组织来源;③有明确的性别、吸烟习惯等信息;④芯片数据类型为基因表达谱;⑤尽可能选择常见、统一的芯片平台。根据纳入标准,从GEO数据库中筛选并下载序列研究GSE2109探针矩阵信息、临床表型(分组信息)及对应芯片平台(芯片平台为GPL570,[HG-U133_Plus_2]Affymetrix Human Genome U133Plus 2.0Array)注释信息。筛选样本中女性患肺癌人群的相关基因mRNA表达芯片数据,将符合所述纳入标准的基因数据筛选出来,得到筛选后数据。
2、数据的标准化处理。
将所述筛选后数据根据是否具有吸烟习惯进行分组:GSE2109序列研究中共2158例肿瘤样本数据,其中有女性吸烟肺癌患者43名,女性非吸烟肺癌患者11名,具体信息见下表。
表1样本供者相关资料
Figure BDA0003272470980000051
Figure BDA0003272470980000061
使用R语言Limma包对表达数据使用quantile normalization进行标准化(normalization)处理,消除由于实验技术所导致的表达量(Intensity)的变化,并且使各个样本和平行实验的数据处于相同的水平,从而得到具有生物学意义的基因表达量的变化。基因mRNA表达芯片数据标准化处理前后箱线图(图2和图3)和表达密度图(图4和图5)对比结果。
结果发现,54张芯片数据之间差距不大,标准化处理将所有芯片信号强度标准化到具有类似分布特征的区间内。
3、差异表达基因(DEGs)分析。
使用R语言Limma包对标准化处理后的基因芯片数据进行差异表达基因(DEGs)分析,差异基因的判断标准:①log2|fold change|>1,②adj.P.Val<0.05,并绘制火山图(Volcano Plot)用于可视化差异表达的基因。使用Limma(plotMD)包生成的平均差(MD)图可以显示log2倍数变化与平均log2表达值之间的关系,用于可视化差异表达的基因。类似于火山图,有颜色标记的基因表示显著差异表达(红色=上调,蓝色=下调)。
GSE2109基因芯片中含54675个有效基因,根据差异基因的筛选条件,发现女性非吸烟人群相较于女性吸烟人群患肺癌的差异表达基因379个,去除重复、空白、一个探针对应多个基因等不明确的数据后得到差异表达基因249个,其中上调基因102个,下调基因147个,差异表达基因分布见可视化的火山图(图6)和平均差图(图7)。
热图能更为直观的显示各个样本中不同基因的表达水平,每个小方格代表着一个基因,并通过颜色及亮度表示这个基因表达量差异的大小,红色越亮代表基因表达水平上升水平越高,紫色越亮代表基因表达水平下降越低。每行表示每个基因在不同样本中的表达量,每列表示在一个样本中所有基因的表达量情况。使用R语言pheatmap包绘制热图,所有DEGs的基因聚类热图结果见图8。
结果显示,女性非吸烟者肺癌与吸烟者肺癌组织间的基因表达谱存在差异,且符合差异基因判断条件的基因数目较多。
4、差异表达基因(DEGs)进行基因富集功能(GO与KEGG)分析。
使用DAVID在线分析工具(网址:http://david.abcc.Ncifcrf.gov/)分别对所有显著上调和下调的DEGs进行GO和KEGG基因富集功能分析。GO功能注释主要包括包括分子功能(molecular function,简称MF)、细胞定位(cellular component,简称CC)和生物学过程(biological process,简称BP)三个方面,各自描述了基因产物可能行使的分子功能、所处的细胞环境以及参与的生物学过程;KEGG信号通路富集分析得到的通路通常就是潜在的目标靶点。GO功能注释和KEGG通路基因富集结果见图9-图12。
分析上调基因,GO功能(图9)在BP中主要过程为神经系统发育、细胞内信号转导、轴突引导、MAPK级联、突触组织、软骨发育、肌动蛋白纤维组织,在CC主要存在于细胞连接和生长锥,在MF主要发挥蛋白域特异性结合和微管结合功能;KEGG通路(图10)相关调控的信号主要为Ras信号通路、Rap1信号通路、TRP通道的炎症介质调节、GnRH信号通路、胰高血糖素信号通路、神经胶质瘤、胃酸分泌、粘着斑、雌激素信号通路、ErbB信号通路、昼夜节律夹带、CAMP信号通路、轴突引导、醛固酮合成和分泌。
分析下调基因,GO功能(图11)在BP中主要过程为信号转导、免疫反应、细胞粘附、免疫反应调节和细胞表面受体信号通路,在CC主要存在于膜/细胞膜及其组分、胞外外泌体,在MF主要发挥蛋白结合、受体结合、抗原结合、受体活性和肌动蛋白结合功能;KEGG通路(图12)相关调控的信号主要为肺结核、弓形体病、金黄色葡萄球菌感染、类风湿性关节炎、原发性免疫缺陷、吞噬小体、溶酶体、利什曼病、炎性肠病、HTLV-1感染、单纯疱疹感染、造血细胞系、细胞因子-细胞因子受体相互作用、趋化因子信号通路、细胞粘附分子(CAMs)、抗原处理和呈递。
5、蛋白-蛋白相互作用(PPI)网络分析与关键基因(Hub genes)筛选。
应用STRING在线工具(网址:http://string-db.org)构建249个DEGs编码蛋白相互作用(PPI)网络,应用Cytoscape软件Hubba插件筛选Top10的关键基因(Hub genes)。STRING分析蛋白质之间相互作用关系(PPI)网络结果见图13,分析的相互作用评分(interaction score)阈值为0.05(高于中位置信值)。将PPI结果用Cytoscape软件进行可视化和数据分析,无关联的节点(nodes)移除,剩余PPI网络由218个节点(nodes)和406条边(edges)构成,平均局部聚集系数(average local clustering coefficient)为0.303,PPI富集P值<1.0-16。以cytoHubba模块计算PPI网络节点前10名蛋白网络中有较高连接度的关键基因(Hub genes),结果如图14和下表所示。
表2 Cytoscape软件cytoHubba插件筛选Top10的关键基因(Hub genes)
Rank Name Score
1 CD53 25
2 CD2 22
3 FYB 21
3 CCR7 21
5 IL10RA 20
5 CD48 19
5 LAPTM5 19
8 IKZF1 18
9 CSF2RB 15
10 ITGAL 15
6、通过生存分析筛选候选基因。
Kaplan-Meier Plotter数据库是一个恶性肿瘤预后相关的在线分析数据库,在Kaplan-MeierPlotter数据库中筛选肺癌相关临床数据,按照“女性+吸烟+肺癌”人群(N=321)和“女性+非吸烟+肺癌”人群(N=168)分组,将筛选出的10个关键基因(Hub genes)分别进行生存分析,使用生存分析最常用的方法——KM法,统计检验方法为Log rank检验,得到生存率曲线并分析总生存期(OS)。
Top10关键基因(Hub genes)的生存分析结果见下表。
表3 Top10关键基因(Hub genes)的生存分析结果
Figure BDA0003272470980000081
Figure BDA0003272470980000091
吸烟者肺癌(N=321)中CSF2RB基因的生存率曲线和基因表达蜂群图结果见图15-图16,非吸烟者肺癌(N=168)中CSF2RB基因的生存率曲线和基因表达蜂群图结果见图17-图18。其中,CSF2RB基因的低表达和高表达分组按中位表达(Median)水平分组。在K-M生存曲线中,横轴是生存时间(月),纵轴是生存率(%)。
结果显示:在321名吸烟女性肺癌患者中,CSF2RB基因低表达群体的中位生存期(95个月)和高表达群体的中位生存期(95.5个月)间无显著差异(P=0.501);而在168名非吸烟女性肺癌患者中,CSF2RB基因低表达群体的中位生存期(49个月)显著低于高表达群体的中位生存期(88.7个月),约为高表达群体的55.24%,差异具有统计学意义(P=0.0019)。
在吸烟女性肺癌患者(N=321,图15)中,CSF2RB基因低表达群体的5年生存率(58%)和高表达群体的5年生存率(62%)间无显著差异(P=0.501);而在非吸烟女性肺癌患者(N=168,图17)中,CSF2RB基因高表达群体的5年生存率(86%)显著高于低表达群体的5年生存率(67%),差异具有统计学意义(P=0.0019)。
CSF2RB(colony stimulating factor 2receptor beta common subunit,集落刺激因子2受体β亚单位,又名共β亚基异源受体)基因,Gene ID:1439,又名CD131,CDw131,IL3RB,IL5RB,SMDP5,betaGMR,序列如SEQ ID NO:1所示。人CSF2RB基因位于第22号染色体短臂12区3带,该基因编码的蛋白是IL-3、IL-5和CSF的高亲和力受体的共同β链。
CSF2RB基因的缺陷与蛋白肺泡蛋白沉积症(PAP)相关,PAP是一种常染色体隐性致死性呼吸系统疾病。本发明发现CSF2RB基因为女性非吸烟者肺癌(LCNS)人群中的下调基因,与该基因相关的GO terms注释(图11)分子功能(MF)包括细受体活性/胞因子受体活性和蛋白结合,细胞定位(CC)为膜/细胞膜及组分,生物学过程(BP)包括信号转导和脂多糖应答;其KEGG相关通路(图12)为Jas-STAT信号通路。
实施例2
实时荧光定量PCR(real-time PCR,qPCR)验证CSF2RB基因的差异表达
1、样品收集。
对CSF2RB基因的差异表达进行样本qPCR验证。收集来源于患肺癌的吸烟女性及患肺癌的非吸烟女性的肺癌组织样本各5例,患者情况见下表。患者均知情同意。相应的经福尔马林固定、石蜡包埋的组织病理切片HE染色结果见图19-图38。
表4样本供者相关资料
Figure BDA0003272470980000092
Figure BDA0003272470980000101
2、RNA样品的制备(利用QIAGEN组织RNA提取试剂盒AllPrep DNA/RNAFFPE Kit进行操作)。
2.1制备组织切片。
用专门的石蜡包埋组织切片仪器讲经福尔马林固定、石蜡包埋(FFPE)的组织蜡块切成约5μm厚度的薄片15-20片,表面与空气接触的2-3片丢弃,剩余切片置于1.5-mL无菌离心管中备用。
2.2脱蜡。
1)每管加入1.5mL二甲苯,充分混匀5min,55℃水浴10min溶解石蜡,10,000pm离心5min。
2)小心吸弃上清,保留沉淀(沉淀组织,弃二甲苯)。
3)重复步骤1)和步骤2)三次(尽量去除残存的石蜡)。
4)每管加入1.5mL无水乙醇,涡旋混匀,室温10,000m离心10min。
5)小心吸弃上清,保留沉淀(沉淀组织,弃无水乙醇)。
6)重复步骤4)和步骤5)三次,尽可能除去残存的无水乙醇。
7)室温下干燥样品,使无水乙醇完全挥发。
2.3总RNA提取。
1)每管加180μL buffer PKD充分混匀,10,000pm离心1min。
2)于底层加入40μL-80μL蛋白酶K,无菌吸头温和混匀。
3)封口膜封口置摇床,于55℃水浴过夜,直至组织完全消化。
4)次日95℃水浴15min。
5)取上清液至2mL离心管,冰上孵育3分钟,13,300rpm离心15min。
6)每管加入DNase Booster Buffer 25μL和DNase I stock solution 10μL,充分混匀,短暂离心收集残夜。
7)室温孵育15min,加入500μL Buffer RBC充分混合溶解产物。
8)每管加入1.2mL乙醇(95-100%)至样本中,上下颠倒混匀,迅速进行下一步操作。
9)将RNeasy MinElute spin column放置在2ml收集管中(试剂盒中配套),加入700μL样本(含沉淀),盖上收集管的盖子,10,000rpm离心15s,弃去收集管中的废液。
10)重复上述步骤,直到所有样本处理完毕。
11)移入500μL Buffer RPE至RNAeasy MinElute spin column,并小心盖上收集管盖子,10,000rpm离心15sec,弃去收集管中的废液。
12)重复11)步骤,清洗柱膜。
13)将RNAeasy MinElute spin column层析柱放入一个干净的2mL收集管中,打开盖子,全速(1.45×104rpm)离心5min,使硅胶膜干燥。
14)将RNAeasy MinElute spin column层析柱放入一个干净的1.5mL收集管中(试剂盒中配套),加入20μL RNAase-free water至柱膜中心,全速(1.45×104rpm)离心1min,收集离心后所得洗脱液。
2.4 RNA质量检测。
取2μL石蜡组织样本中已提取的总RNA,用Nanodrop2000紫外分光光度计检测基因组总RNA浓度及纯度。为防止出现误差,测量前先使用DEPC水调零,RNA浓度>100ng/μL,纯度A260/A280在1.60-1.80之间,总RNA质量符合要求。
3、逆转录(利用Takara逆转录试剂盒进行操作)。
冰上配制逆转录反应液(20μL反应体系):5×PrimeScript RT Master Mix 4μL,RNA样本1μL(≤500ng),RNase Free H2O 15μL。
逆转录反应条件如下:37℃15min,85℃5sec,4℃。
反应结束得到cDNA产物。
4、real-time PCR扩增检验。
以beta-Actin基因为内参,对CSF2RB基因在mRNA水平进行荧光定量PCR相对定量分析。实验用引物和Taqman探针序列如下表所示。
表5 RT-PCR扩增检验的引物和Taqman探针序列
Figure BDA0003272470980000111
real-time PCR反应体系(10μL):TaqMan Gene Expression Master Mix 5μL,引物、探针0.5μL,cDNA产物(10ng/μL)4.5μL。
荧光定量PCR反应程序:95℃10min,95℃15sec,60℃60sec(40个循环)。ABI 7500荧光定量PCR反应系统上机检测并分析结果,每个样品做三个复孔取平均值,以内参基因beta-Actin为内对照,ΔCt法对CSF2RB基因进行相对定量,计算公式为:
ΔCt=CSF2RB基因Ct值—β-Actin基因Ct值
5、统计学方法。
同一样品3个复孔检测结果取平均值,结果数据以平均值±标准差的方式来表示,采用SPSS 23.0统计软件来进行统计分析,两者之间的差异采用t检验,P<0.05认为差距具有统计学意义。
6、结果。
结果如图39和图40所示,与对照组(女性吸烟肺癌)相比,CSF2RB基因在实验组(女性非吸烟肺癌)中表达下调,差异具有统计学意义(P<0.05),与实施例1中的生物信息学数据分析结果一致。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 杭州金域医学检验所有限公司
龙泉市人民医院(龙泉市人民医院医共体)
<120> CSF2RB及编码蛋白在女性非吸烟肺癌保护中的应用
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4853
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 1
actctgccta gaggctccag aagaagactg gtctctccca ccacacagag gcctggagga 60
ggcagaggcc aggagggaga ggtcccaaga gcctgtgaaa tgggtctggc ctggctccca 120
gctgggcagg aacacaggac ttcaggacac taaggaccct gtcatgccca tggccagcac 180
ccaccagtgc tggtgcctgc ctgtccagag ctgaccaggg agatggtgct ggcccagggg 240
ctgctctcca tggccctgct ggccctgtgc tgggagcgca gcctggcagg ggcagaagaa 300
accatcccgc tgcagaccct gcgctgctac aacgactaca ccagccacat cacctgcagg 360
tgggcagaca cccaggatgc ccagcggctc gtcaacgtga ccctcattcg ccgggtgaat 420
gaggacctcc tggagccagt gtcctgtgac ctcagtgatg acatgccctg gtcagcctgc 480
ccccatcccc gctgcgtgcc caggagatgt gtcattccct gccagagttt tgtcgtcact 540
gacgttgact acttctcatt ccaaccagac aggcctctgg gcacccggct caccgtcact 600
ctgacccagc atgtccagcc tcctgagccc agggacctgc agatcagcac cgaccaggac 660
cacttcctgc tgacctggag tgtggccctt gggagtcccc agagccactg gttgtcccca 720
ggggatctgg agtttgaggt ggtctacaag cggcttcagg actcttggga ggacgcagcc 780
atcctcctct ccaacacctc ccaggccacc ctggggccag agcacctcat gcccagcagc 840
acctacgtgg cccgagtacg gacccgcctg gccccaggtt ctcggctctc aggacgtccc 900
agcaagtgga gcccagaggt ttgctgggac tcccagccag gggatgaggc ccagccccag 960
aacctggagt gcttctttga cggggccgcc gtgctcagct gctcctggga ggtgaggaag 1020
gaggtggcca gctcggtctc ctttggccta ttctacaagc ccagcccaga tgcaggggag 1080
gaagagtgct ccccagtgct gagggagggg ctcggcagcc tccacaccag gcaccactgc 1140
cagattcccg tgcccgaccc cgcgacccac ggccaataca tcgtctctgt tcagccaagg 1200
agggcagaga aacacataaa gagctcagtg aacatccaga tggcccctcc atccctcaac 1260
gtgaccaagg atggagacag ctacagcctg cgctgggaaa caatgaaaat gcgatacgaa 1320
cacatagacc acacatttga gatccagtac aggaaagaca cggccacgtg gaaggacagc 1380
aagaccgaga ccctccagaa cgcccacagc atggccctgc cagccctgga gccctccacc 1440
aggtactggg ccagggtgag ggtcaggacc tcccgcaccg gctacaacgg gatctggagc 1500
gagtggagtg aggcgcgctc ctgggacacc gagtcggtgc tgcctatgtg ggtgctggcc 1560
ctcatcgtga tcttcctcac catcgctgtg ctcctggccc tccgcttctg tggcatctac 1620
gggtacaggc tgcgcagaaa gtgggaggag aagatcccca accccagcaa gagccacctg 1680
ttccagaacg ggagcgcaga gctttggccc ccaggcagca tgtcggcctt cactagcggg 1740
agtcccccac accaggggcc gtggggcagc cgcttccctg agctggaggg ggtgttccct 1800
gtaggattcg gggacagcga ggtgtcacct ctcaccatag aggaccccaa gcatgtctgt 1860
gatccaccat ctgggcctga cacgactcca gctgcctcag atctacccac agagcagccc 1920
cccagccccc agccaggccc gcctgccgcc tcccacacac ctgagaaaca ggcttccagc 1980
tttgacttca atgggcccta cctggggccg ccccacagcc gctccctacc tgacatcctg 2040
ggccagccgg agcccccaca ggagggtggg agccagaagt ccccacctcc agggtccctg 2100
gagtacctgt gtctgcctgc tggggggcag gtgcaactgg tccctctggc ccaggcgatg 2160
ggaccaggac aggccgtgga agtggagaga aggccgagcc agggggctgc agggagtccc 2220
tccctggagt ccgggggagg ccctgcccct cctgctcttg ggccaagggt gggaggacag 2280
gaccaaaagg acagccctgt ggctataccc atgagctctg gggacactga ggaccctgga 2340
gtggcctctg gttatgtctc ctctgcagac ctggtattca ccccaaactc aggggcctcg 2400
tctgtctccc tagttccctc tctgggcctc ccctcagacc agacccccag cttatgtcct 2460
gggctggcca gtggaccccc tggagcccca ggccctgtga agtcagggtt tgagggctat 2520
gtggagctcc ctccaattga gggccggtcc cccaggtcac caaggaacaa tcctgtcccc 2580
cctgaggcca aaagccctgt cctgaaccca ggggaacgcc cggcagatgt gtccccaaca 2640
tccccacagc ccgagggcct ccttgtcctg cagcaagtgg gcgactattg cttcctcccc 2700
ggcctggggc ccggccctct ctcgctccgg agtaaacctt cttccccggg acccggtcct 2760
gagatcaaga acctagacca ggcttttcaa gtcaagaagc ccccaggcca ggctgtgccc 2820
caggtgcccg tcattcagct cttcaaagcc ctgaagcagc aggactacct gtctctgccc 2880
ccttgggagg tcaacaagcc tggggaggtg tgttgagacc cccaggccta gacaggcaag 2940
gggatggaga gggcttgcct tccctcccgc ctgaccttcc tcagtcattt ctgcaaagcc 3000
aaggggcagc ctcctgtcaa ggtagctaga ggcctgggaa aggagatagc cttgctccgg 3060
cccccttgac cttcagcaaa tcacttctct ccctgcgctc acacagacac acacacacac 3120
acgtacatgc acacattttt cctgtcaggt taacttattt gtaggttctg cattattaga 3180
actttctaga tatactcatt ccatctcccc ctcatttttt taatcaggtt tccttgcttt 3240
tgccattttt cttccttctt ttttcactga tttattatga gagtggggct gaggtctgag 3300
ctgagcctta tcagactgag atgcggctgg ttgtgttgag gacttgtgtg ggctgcctgt 3360
ccccggcagt cgctgatgca catgacatga ttctcatctg ggtgcagagg tgggaggcac 3420
caggtgggca cccgtggggg ttagggcttg gaagagtggc acaggactgg gcacgctcag 3480
tgaggctcag ggaattcaga ctagcctcga ttgtcactcc gagaaatggg catggtattg 3540
ggggtcgggg gggcggtgca agggacgcac atgagagact gtttgggagc ttctggggag 3600
ccctgctagt tgtctcagtg atgtctgtgg gacctccagt cccttgagac cccacgtcat 3660
gtagagaagt taacggccca agtggtgggc aggctggcgg gacctgggga acatcaggag 3720
aggagtccag agcccacgtc tactgcggaa aagtcagggg aaactgccaa acaaaggaaa 3780
atgccccaaa ggcatatatg ctttagggcc tttggtccaa atggcccggg tggccactct 3840
tccagataga ccaggcaact ctccctccca ccggccacag atgaggggct gctgatctat 3900
gcctgggcct gcaccaggga ttatggttct tttaaatctt tgcctttcag atacaggaaa 3960
aataatggca ttaaattgct ttaatttgca ttattttagt tatccagttt gcacatattt 4020
ttataggtat cttaggcatc gattggtatt ttttaactgg gccaagccca ttaaggtctt 4080
tcttctgttg ggtgctatca ttttctgatt aagtcttttt gactattgac atacagtctt 4140
tcacagatgg tggagtgttt ttcccccaaa tctgttgttt gtcttataat gttgtatatg 4200
aggttttatg gtgtatgaat atgaatgctt ctgtaatgtc aaacagatcc ctagtaaact 4260
ccttcttcac ttttactgtc agatttacaa aggtcctccc attgcaaagc agtgtttgtc 4320
ctaatttata tattgttttt ctagttcatt ttgtgtttcc aacttttcat gtaaaatttt 4380
aattattttt gaatgtgtgg atgtgagact gaggtgcctt ttggtactga aattcttttt 4440
ccatgtacct gaagtgttac ttttgtgata taggaaatcc ttgtatatat actttattgg 4500
tccctaggct tcctattttg ttaccttgct ttctctatgg catccaccat tttgattgtt 4560
ctacttttat gatatgtttt cataagtggt taagcaagta ttctcgttac ttttgctctt 4620
aaatccctat tcattacagc aatgttggtg gtcaaagaaa atgataaaca acttgaatgt 4680
tcaatggtcc tgaaatacat aacaacattt tagtacattg taaagtagaa tcctctgttc 4740
ataatgaaca agatgaacca atgtggatta gaaagaagtc cgagatatta attccaaaat 4800
atccagacat tgttaaaggg aaaaaattgc aataaaatat ttgtaacata aaa 4853
<210> 2
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 2
tacaagccca gcccagatg 19
<210> 3
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 3
cctccttggc tgaacagaga 20
<210> 4
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 4
cccagtgctg agggaggggc tcggc 25
<210> 5
<211> 16
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 5
cttcgcgggc gacgat 16
<210> 6
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccacatagga atccttctga cc 22
<210> 7
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 7
caggcaccag ggcgtgatgg 20

Claims (10)

1.CSF2RB基因及其编码蛋白作为生物标志物或治疗靶点在制备用于女性非吸烟肺癌的诊断、治疗、预后评估试剂或药物中的应用。
2.根据权利要求1所述的应用,其特征在于,所述诊断包括风险预测和/或辅助诊断,所述预后评估包括生存期预测和/或生存率预测。
3.根据权利要求1所述的应用,其特征在于,当所述CSF2RB基因或其编码蛋白表达低于阈值,则预测为高患病风险、短生存期或低生存率。
4.检测CSF2RB基因及其编码蛋白的试剂在制备女性非吸烟肺癌诊断、治疗、预后评估试剂中的应用。
5.根据权利要求4所述的应用,其特征在于,所述试剂的检测方式选自:PCR、免疫检测、原位杂交、基因芯片、一代测序技术或高通量测序中的一种。
6.一种用于女性非吸烟肺癌检测的试剂盒,其特征在于,包括检测CSF2RB基因表达水平或检测CSF2RB基因编码蛋白的试剂。
7.一种CSF2RB基因的激活剂或CSF2RB基因编码蛋白的激活剂在制备用于治疗女性非吸烟肺癌的药物中的应用。
8.一种女性非吸烟肺癌标志物的筛选方法,其特征在于,包括以下步骤:
数据筛选:制定纳入标准,将数据库中符合所述纳入标准的基因数据筛选出来,得到筛选后数据;
数据处理:根据是否具有吸烟习惯对所述筛选后数据进行分组,标准化处理,得到标准化数据;
差异表达基因分析:对所述标准化数据进行差异表达基因分析,得到上调基因和下调基因;
基因功能分析:对所述上调基因和所述下调基因进行基因功能分析;
关键基因筛选:对所述上调基因和所述下调基因进行筛选,得到关键基因;
候选基因筛选:对所述关键基因进行生存分析,即得。
9.根据权利要求8所述的筛选方法,其特征在于,所述数据筛选步骤中,所述纳入标准包括:样本的来源为人组织,所述人包括患肺癌的人,所述样本的信息包括性别、吸烟习惯,所述基因数据为基因表达谱类型的芯片数据;
所述数据处理步骤中,采用R语言Limma包对所述筛选数据进行标准化处理;
所述差异表达基因分析步骤中,采用R语言Limma包对所述标准化数据进行差异表达基因分析;
所述基因功能分析步骤中,采用DAVID在线数据库对所述上调基因和所述下调基因进行基因功能分析;
所述关键基因筛选步骤中,采用蛋白-蛋白相互作用网络分析对所述上调基因和所述下调基因进行筛选,得到关键基因;
所述候选基因筛选步骤中,采用KM法对所述关键基因进行生存分析。
10.根据权利要求9所述的筛选方法,其特征在于,所述基因功能分析步骤中,所述基因功能分析为GO和KEGG基因富集功能分析;所述关键基因筛选步骤中,所述蛋白-蛋白相互作用网络采用STRING在线工具构建,所述关键基因选自所述蛋白-蛋白相互作用网络中连接度从高到低排序前五十的基因;所述候选基因筛选步骤中,表达水平和生存期,和/或表达水平和生存率的关联性最强的关键基因为所述候选基因。
CN202111106420.4A 2021-09-22 2021-09-22 Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用 Pending CN113981079A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111106420.4A CN113981079A (zh) 2021-09-22 2021-09-22 Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111106420.4A CN113981079A (zh) 2021-09-22 2021-09-22 Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用

Publications (1)

Publication Number Publication Date
CN113981079A true CN113981079A (zh) 2022-01-28

Family

ID=79736200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111106420.4A Pending CN113981079A (zh) 2021-09-22 2021-09-22 Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用

Country Status (1)

Country Link
CN (1) CN113981079A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115651982A (zh) * 2022-09-13 2023-01-31 上海医创云康生物科技有限公司 肺癌甲基化基因标志物及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060154278A1 (en) * 2003-06-10 2006-07-13 The Trustees Of Boston University Detection methods for disorders of the lung
CN101180408A (zh) * 2005-05-19 2008-05-14 西尼尔根茨生物科学有限公司 用遗传多态性分析评估发生肺癌的风险的方法
CN103966334A (zh) * 2014-05-20 2014-08-06 李群 Csf2rb基因在前列腺癌骨转移中的应用
CN104293919A (zh) * 2014-09-15 2015-01-21 南京医科大学 一种与非吸烟女性肺癌辅助诊断相关的snp标志物及其应用
CN105473743A (zh) * 2013-06-28 2016-04-06 睿智研究实验室私人有限公司 脓毒症生物标志物及其应用
CN112442535A (zh) * 2019-08-27 2021-03-05 上海善准生物科技有限公司 原发性肺腺癌分子分型及生存风险基因群及诊断产品和应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060154278A1 (en) * 2003-06-10 2006-07-13 The Trustees Of Boston University Detection methods for disorders of the lung
CN101180408A (zh) * 2005-05-19 2008-05-14 西尼尔根茨生物科学有限公司 用遗传多态性分析评估发生肺癌的风险的方法
CN105473743A (zh) * 2013-06-28 2016-04-06 睿智研究实验室私人有限公司 脓毒症生物标志物及其应用
CN103966334A (zh) * 2014-05-20 2014-08-06 李群 Csf2rb基因在前列腺癌骨转移中的应用
CN104293919A (zh) * 2014-09-15 2015-01-21 南京医科大学 一种与非吸烟女性肺癌辅助诊断相关的snp标志物及其应用
CN112442535A (zh) * 2019-08-27 2021-03-05 上海善准生物科技有限公司 原发性肺腺癌分子分型及生存风险基因群及诊断产品和应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BOYANG YAO等: "Seven interferon gamma response genes serve as a prognostic risk signature that correlates with immune infiltration in lung adenocarcinoma", AGING, vol. 13, no. 8, pages 11381 - 11410 *
EMILIJA VELJKOVIC等: "Chronic exposure to cigarette smoke condensate in vitro induces epithelial to mesenchymal transition-like changes in human bronchial epithelial cells, BEAS-2B", TOXICOLOGY IN VITRO, vol. 25, 21 November 2010 (2010-11-21), pages 446 - 453 *
NINGNING ZHU等: "CSF2RB Is a Unique Biomarker and Correlated With Immune Infiltrates in Lung Adenocarcinoma", FRONT. ONCOL, vol. 12, 28 April 2022 (2022-04-28), pages 822849 *
游路宽等: "肺鳞癌潜在关键基因的生物信息学分析", 解放军医学院学报, vol. 39, no. 10, pages 903 - 909 *
邢益桓等: "非吸烟女性肺癌潜在相关基因的生物信息学分析及功能预测", Retrieved from the Internet <URL:道客巴巴> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115651982A (zh) * 2022-09-13 2023-01-31 上海医创云康生物科技有限公司 肺癌甲基化基因标志物及其应用

Similar Documents

Publication Publication Date Title
JP6755391B2 (ja) 胃癌の生物学的特性に基づく群区分および予後予測システム
Schuetz et al. Progression-specific genes identified by expression profiling of matched ductal carcinomas in situ and invasive breast tumors, combining laser capture microdissection and oligonucleotide microarray analysis
JP2018196385A (ja) 癌の臨床転帰を予測する方法
CN106795565A (zh) 用于评估肺癌状态的方法
Zuidervaart et al. Gene expression profiling identifies tumour markers potentially playing a role in uveal melanoma development
George et al. Identification of abrogated pathways in fallopian tube epithelium from BRCA1 mutation carriers
CN109715830A (zh) 用于使用基因表达谱诊断肺癌的组合物和方法
CN114164276B (zh) 用于肺癌诊断的试剂盒、装置及方法
Zhong et al. Characterization of hypoxia-related molecular subtypes in clear cell renal cell carcinoma to aid immunotherapy and targeted therapy via multi-omics analysis
Jiang et al. Assessment of significant pathway signaling and prognostic value of GNG11 in ovarian serous cystadenocarcinoma
CN111187840A (zh) 一种用于早期乳腺癌诊断的生物标志物
CN113981079A (zh) Csf2rb及编码蛋白在女性非吸烟肺癌保护中的应用
CN115482935B (zh) 预测小细胞转化的肺腺癌患者预后模型及其建立方法
JP2008538284A (ja) 乳房の腫瘍のレーザーマイクロダイセクションおよびマイクロアレイ解析が、エストロゲン受容体に関係する遺伝子および経路を明らかにする
Xie A biomarker and molecular mechanism investigation for thyroid cancer
Koper et al. Whole transcriptome analysis of pre-invasive and invasive early squamous lung carcinoma in archival laser microdissected samples
US20060234235A1 (en) Methods and compositions for the diagnosis of neuroendocrine lung cancer
Wang et al. Comprehensive bioinformatics analysis confirms RBMS3 as the central candidate biological target for ovarian cancer
EP2596131A2 (en) Gene expression profiling for the identification of lung cancer
UPADHYAY et al. Identification of Potent Novel Biomarkers of Uterine Leiomyoma Through DEGs Screening and Networking.
Chen et al. Prognostic value and gene regulatory network of CMSS1 in hepatocellular carcinoma
Ahn et al. Predicting survival outcomes in ovarian cancer using gene expression data
Kyrgiafini et al. The Role of Long Noncoding RNAs on Male Infertility: A Systematic Review and In Silico Analysis. Biology 2022, 11, 1510
Bhumika et al. Bioinformatics Tools to Discover and Validate Cancer Biomarkers
CN115472294A (zh) 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination