JP2014531202A - 喫煙状態を判定するための方法および組成物 - Google Patents

喫煙状態を判定するための方法および組成物 Download PDF

Info

Publication number
JP2014531202A
JP2014531202A JP2014528478A JP2014528478A JP2014531202A JP 2014531202 A JP2014531202 A JP 2014531202A JP 2014528478 A JP2014528478 A JP 2014528478A JP 2014528478 A JP2014528478 A JP 2014528478A JP 2014531202 A JP2014531202 A JP 2014531202A
Authority
JP
Japan
Prior art keywords
marker
subject
data
data set
smoking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014528478A
Other languages
English (en)
Inventor
スティーヴン ローゼンバーグ
スティーヴン ローゼンバーグ
マイケル リード エラスホフ
マイケル リード エラスホフ
フィリップ ビイネケ
フィリップ ビイネケ
ジェイムズ エイ. ウィングローブ
ジェイムズ エイ. ウィングローブ
Original Assignee
カーディオ ディーエクス インコーポレイティッド
カーディオ ディーエクス インコーポレイティッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カーディオ ディーエクス インコーポレイティッド, カーディオ ディーエクス インコーポレイティッド filed Critical カーディオ ディーエクス インコーポレイティッド
Publication of JP2014531202A publication Critical patent/JP2014531202A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

発現レベルが喫煙状態と相関する末梢血マーカーを提供する。高度に情報価値のあるマーカーを用いて開発された予測モデルを、対象の喫煙状態の生化学的代替物を提供するためにこのマーカーを用いるためのシステム、キット、および方法と共に開示する。いくつかの態様において、喫煙関連疾患は慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である。

Description

関連出願の相互参照
本出願は、2011年8月29日に出願された米国仮特許出願第61/528,616号の恩典を主張し、その全開示はあらゆる目的のために全体として参照により本明細書に組み入れられる。
分野
本発明は、マーカー発現測定値に基づいて喫煙状態を判定するための予測モデル、それらの使用方法、ならびにそれらの具現化のためのコンピュータシステムおよびソフトウェアに関する。
関連技術の説明
喫煙は世界中の予防可能な死亡原因の第1位であり、世界中で毎年500万件を超える死亡をもたらし、この死亡のうちの約500,000件が米国で起こる(1、2)。喫煙は、ヒトの健康にとって有害であり、多くの形態のがん(肺、膵臓)および循環器疾患/肺疾患(アテローム性動脈硬化症、慢性閉塞性肺疾患)を含む複数の疾患のリスクを高めることが示されている(3、4、5)。タバコの煙は4,000を超える化合物を含み、その多くが発がん性または毒性であることが示されている;これらの化合物は肺胞を通じて循環系に入ることができ、身体の様々な器官に広まり、損傷を引き起こす(6)。この過程において、免疫系の循環細胞はこれらの化合物に曝露され、これにより、確立された技術を用いて評価することができる遺伝子発現の変化が起こる可能性がある。
満たされていない臨床的および科学的必要性
コチニンはニコチンの代謝産物であり、喫煙者の血中および尿中に出現する。したがって、血中または尿中のコチニンの生化学的測定値は喫煙状態のマーカーを提供するが、特殊なアッセイ法が必要である。定量的RNA測定または核酸配列決定反応などの、容易に利用可能でありかつ一般的な分子生物学ツールを用いた一般的アッセイ法は、喫煙状態を判定するための独立した方法を提供し、患者試料から得られた核酸に基づく平行系または多重系の測定の一部として実施することができる。
概要
本明細書において、以下の段階を含む、対象から得られた試料をスコア付けするコンピュータ具現化法であって、該スコアが該対象の喫煙状態を示す、方法、を記載する:試料と関連するデータセットを得る段階であって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、段階;ならびにコンピュータプロセッサにより、解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定する段階。
いくつかの態様において、データセットはマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1はCLDND1であり、マーカー2はLRRN3であり、マーカー3はMUC1であり、マーカー4はGOPCであり、かつマーカー5はLEF1である。いくつかの態様において、データセットは、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む。いくつかの態様において、データセットは、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む。いくつかの態様において、データセットは、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む。いくつかの態様において、データセットは、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む。
いくつかの態様において、本方法は、コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む。いくつかの態様において、喫煙関連疾患は慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である。
いくつかの態様において、データセットは、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む。
いくつかの態様において、データセットは、スコアを算出するために用いられる臨床因子をさらに含む。いくつかの態様において、臨床因子は、性別および高血圧からなる群より選択される。いくつかの態様において、臨床因子は性別である。
いくつかの態様において、解釈関数は予測モデルに基づく。いくつかの態様において、予測モデルは、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデル(tree-based recursive partitioning model)からなる群より選択される。いくつかの態様において、解釈関数は、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である。いくつかの態様において、解釈関数は、表7に提示されるものからなる解釈関数の群より選択される解釈関数である。
いくつかの態様において、試料と関連するデータセットを得る段階は、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む。いくつかの態様において、試料と関連するデータセットを得る段階は、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む。
いくつかの態様において、データセットは、記憶装置に記憶された状態で得られる。いくつかの態様において、量的発現データはハイブリダイゼーションデータからのものである。いくつかの態様において、量的発現データはポリメラーゼ連鎖反応データからのものである。いくつかの態様において、量的発現データは配列データからのものである。
また本明細書において、以下の段階を含む、対象から得られた試料をスコア付けするコンピュータ具現化法を記載する:スコアを算出するために用いられる臨床因子、ならびにCLDND1、IL7R、LRRN3、CCR7、MUC1、FOXP3、GOPC、MCM3、LEF1、およびCCR7からなる群より選択される少なくとも1つのマーカーの量的発現レベル値を含む、試料と関連するデータセットを得る段階;ならびにコンピュータプロセッサにより、解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定する段階。いくつかの態様において、データセットは、CLDND1、LRRN3、MUC1、GOPC、およびLEF1の量的発現データを含む。いくつかの態様において、データセットは2つまたはそれより多いマーカーの量的発現データを含む。いくつかの態様において、データセットは3つまたはそれより多いマーカーの量的発現データを含む。いくつかの態様において、データセットは4つまたはそれより多いマーカーの量的発現データを含む。いくつかの態様において、データセットは5つまたはそれより多いマーカーの量的発現データを含む。
また本明細書において、以下のものを含む、対象から得られた試料をスコア付けするためのシステムであって、該スコアが該対象の喫煙状態を示す、システム、を記載する:試料と関連するデータセットを記憶するための記憶装置であって、該データセットが、マーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、記憶装置;ならびに解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定するための、該記憶装置に通信的に連結されたプロセッサ。
また本明細書において、コンピュータ実行可能なプログラムコードを記憶するコンピュータ可読記憶媒体であって、該プログラムコードが以下のものを含む、コンピュータ可読記憶媒体、を記載する:試料と関連するデータセットを記憶するためのプログラムコードであって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、プログラムコード;ならびに解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定するためのプログラムコード。
また本明細書において、以下の段階を含む、対象から得られた試料をスコア付けする方法であって、該スコアが該対象の喫煙状態を示す、方法、を記載する:複数の分析物を含む試料を対象から得る段階;該試料を試薬と接触させる段階;該試薬と該複数の分析物との間で複数の複合体を生成する段階;該試料と関連するデータセットを得るために該複数の複合体を検出する段階であって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、段階;ならびに解釈関数を用いて該データセットから該対象の喫煙状態を示すスコアを決定する段階。
また本明細書において、以下のものを含む、対象から得られた試料をスコア付けするためのキットであって、該スコアが該対象の喫煙状態を示す、キット、を記載する:対象から得られた試料から、マーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを決定するための複数の試薬を含む試薬のセットであって、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、試薬のセット;ならびに該複数の試薬を用いて、該試料からデータセット中の量的発現データを決定するための指示書であって、コンピュータプロセッサにより、解釈関数を用いて該データセットから該対象の喫煙状態を示すスコアを決定するための指示を含む、指示書。
ある態様において、本発明は、表1に収載される1つまたは複数のマーカーの量的発現データを含むデータセットを用いて、対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析し、それによって該対象の喫煙状態を判定することにより、対象の喫煙状態を判定する方法を提供する。ある態様においては、このような対象の喫煙状態を用いて、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、または喘息などの喫煙関連疾患を発症するリスクを評価することができる。ある態様において、解析段階は、該マーカーの発現レベルを閾値と比較することによって行われる。他の態様において、データセットは、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む。マーカーは喫煙状態と正または負に相関してよく、マーカーの発現レベルは非喫煙者と比較して喫煙者において上昇または低下し得る。他の局面において、本発明の方法は1つまたは複数のコンピュータ上で具現化される。いくつかの態様において、データセットは、試料をアッセイして発現値を実験的に決定することにより得られる。他の態様において、データセットは、試料を処理してデータを実験的に決定した第三者から直接または間接的に得られる。データセット中のデータは、qRT-PCRアッセイ法、ハイブリダイゼーションアッセイ法、または配列決定反応アッセイ法などのヌクレオチドに基づくアッセイ法を用いて得られた測定値を反映し得る。いくつかの態様において、本発明の方法は、コンピュータプロセッサを用いて具現化される。本発明はまた、対象の喫煙状態を判定するためのシステムを包含する。このシステムは、データセットを記憶するための記憶装置、および該データセットを解析してマーカーの発現レベルを決定するための、該記憶装置に通信的に連結されたプロセッサを含む。他の態様において、本発明は、表1より選択されるマーカーの量的発現データを含む、対象から得られた試料と関連するデータセットを記憶するためのコンピュータ実行可能なプログラムコード、および該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析するためのプログラムコードを記憶するコンピュータ可読記憶媒体を含む。さらなる他の態様において、本発明のシステムは、表1より選択されるマーカーの閾値を含むデータセットを記憶するための記憶装置を含む。閾値は、非喫煙対象または非喫煙対象集団から得られた発現データと関連し得る。本発明のさらなる他の態様は、以下のものを含む、対象の喫煙状態を判定する上で使用するためのキットを含む:対象から得られた試料から、表1より選択されるマーカーの量的発現データを決定するための試薬のセット、ならびに該試料から量的発現データを決定するために該試薬を用いるための、および該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するためにデータセットを解析するための指示書。指示書は、解析で使用するための閾値、および/また喫煙状態を示すスコアを作成するための解釈関数をさらに含み得る。キットは、例えば、少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーといった、表1より選択される2つ以上のマーカーに関する試薬を含み得る。本発明の態様はまた、対象の喫煙状態を示すスコアを作成するための、量的発現データ上で動く予測モデルおよび関連した解釈関数を組み入れる。予測モデルは、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルであってよい。特定の態様において、マーカーは、CDND1、LRRN3、MUC1、GOPC、もしくはLEF1、または発現がCDND1、LRRN3、MUC1、GOPC、およびLEF1と相関する、表1より選択されるマーカーを含む。いくつかの態様において、解釈関数は、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である。他の態様において、解釈関数は、表7に提示される解釈関数である。
本発明のこれらおよび他の特徴、局面、および利点は、以下の説明および添付図面を参照してより良く理解されるであろう。
試料の予測モデルの適用による喫煙者および非喫煙者カテゴリーへの分類と、同じ試料の平均コチニンレベルとの間の関係を示すプロットである。
詳細な説明
概して、特許請求の範囲および明細書において用いられる用語は、当業者によって理解される平易な意味を有すると解釈されるように意図したものである。さらなる明確さを提供するために特定の用語を以下に定義する。平易な意味と提供される定義との間に矛盾がある場合には、提供される定義が用いられるものとする。
「Ct」という用語はサイクル閾値を指し、蛍光値が設定閾値を超えるPCRサイクル数と定義される。したがって、低いCt値は高レベルの発現に対応し、高いCt値は低レベルの発現に対応する。
「Cp」という用語は交差点を指し、例えばLightCyclerなどのリアルタイムPCR機器における標準物質の増幅曲線の対数線形部分の最良適合とノイズバンド(バックグラウンド蛍光測定値に従って設定)との交点と定義される。
「FDR」という用語は偽発見率を意味する。FDRは、ランダムに置換されたデータセットを解析し、所与のp値閾値における平均遺伝子数を集計することによって推定することができる。
「GL」、「GM」、および「GU」という用語はそれぞれ、アルゴリズム開発データセット中のその遺伝子のCpの第1パーセンタイル、中央値、および第99パーセンタイルを指す。
「マーカー(marker)」または「マーカー(markers)」という用語は、非限定的に、脂質、リポタンパク質、タンパク質、サイトカイン、ケモカイン、増殖因子、ペプチド、核酸、遺伝子、およびオリゴヌクレオチド、ならびにそれらの関連する複合体、代謝産物、変異、変種、多型、修飾物、断片、サブユニット、分解産物、要素、およびその他の分析物または試料由来の尺度を包含する。マーカーはまた、変異タンパク質、変異核酸、コピー数の変化、および/または転写物変種を、そのような変異、コピー数の変化、および/または転写物変種が、予測モデルを作成するのに有用であるか、または関連マーカー(例えば、タンパク質または核酸の非変異型、オルタナティブ転写物等)を用いて開発される予測モデルにおいて有用である状況において含み得る。
「高度に相関した遺伝子発現」または「高度に相関したマーカー発現」という用語は、冠動脈疾患の予測モデルにおける互換的な使用を可能にするのに十分な相関度を有する遺伝子またはマーカー発現値を指す。例えば、発現値Xを有する遺伝子xを用いて予測モデルを構築する場合、当業者および本開示の恩典にとって容易に明らかである簡単な方法で、発現値Yを有する高度に相関した遺伝子yを予測モデルに代入することができる。遺伝子xとyの発現値の間にY=a+bXのようなほぼ直線関係があると仮定すると、Xを(Y−a)/bとして予測モデルに代入することができる。非線形相関の場合には、遺伝子yの発現値を遺伝子xの対応する発現値に効果的に変換する同様の数学的変換を用いることができる。「高度に相関したマーカー」または「高度に相関した代替マーカー」という用語は、例えば上記基準に基づいて予測モデルに代入および/または加算することができるマーカーを指す。高度に相関したマーカーは、少なくとも2つの方法:(1) 元のマーカーに対して高度に相関したマーカーを置換し、喫煙状態を予測するための新たなモデルを作成する方法;または(2) 喫煙状態を予測するための既存のモデルにおいて元のマーカーに対して高度に相関したマーカーを置換する方法で用いることができる。
「哺乳動物」という用語は、ヒトおよび非ヒトの両方を包含し、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、およびブタを含むが、これらに限定されない。
「メタ遺伝子」という用語は、予測モデルにおいて成分として使用することができる単一の値を作成するためにその発現値が組み合わされる遺伝子のセットを指す。(Brunet, J.P., et al. Proc. Natl. Acad. Sciences 2004;101(12):4164-9)。
「試料」という用語は、静脈穿刺、排泄、射精、マッサージ、生検、針吸引、洗浄試料、擦過、外科的切開、もしくは介入、または当技術分野で公知の他の手段を含む手段によって対象から採取された単一の細胞または複数の細胞または細胞の断片または一定分量の体液を含み得る。
「対象」という用語は、細胞、組織、または生物、ヒトまたは非ヒトを、インビボ、エクスビボ、またはインビトロ、雄または雌にかかわらず包含する。
「試料と関連するデータセットを得る」という用語は、少なくとも1つの試料から決定されたデータのセットを得ることを包含する。データセットを得ることは、試料を得ること、およびその試料を処理してデータを実験的に決定することを包含する。この語句はまた、例えば試料を処理してデータセットを実験的に決定した第三者からデータのセットを受け取ることを包含する。さらには、この語句は、少なくとも1つのデータベースまたは少なくとも1つの出版物またはデータベースと出版物との組み合わせからデータを取り出すことを包含する。データセットは、記憶装置に記憶された状態を含む種々の公知の方法によって当業者が得ることができる。
本明細書および添付の特許請求の範囲において用いられる場合、「1つの(a)」、「1つの(an)」、および「その(the)」という単数形は、文脈がそうではないことを明確に示さない限り、複数の参照対象をも含むということに留意されたい。
方法
マーカーおよび臨床因子
本発明の1つまたは複数のマーカーの量は、値として示すことができる。値は、ある条件下における試料の評価から得られる1つまたは複数の数値であってよい。値は、例えば、実験室で行われるアッセイによって試料から測定値を実験的に得ることにより、または代替的に、研究所などのサービス提供者から、またはデータセットが例えば記憶装置上に記憶されているデータベースもしくはサーバーからデータセットを得ることにより、得ることができる。
ある態様において、1つまたは複数のマーカーの量は、ある条件下での試料の評価から得られる、表1に提示される遺伝子の発現レベルと関連する1つまたは複数の数値であってよい。表1の列表示は以下を示す:「プローブ名」とは、Agilentヒト全ゲノムアレイ(Agilent Technologies、Santa Clara, CA)において見出されるプローブの名称を指す;「遺伝子名」とは、ヒトゲノム解析機構(Human Genome Organization;HUGO) 遺伝子命名委員会(Gene Nomenclature Committee;HGNC)によって提供される指針に従ったヒト遺伝子の名称を指す。アクセッション番号および別名などの各ヒト遺伝子に関するさらなる情報は、HGNC genenames.orgウェブサイトの検索ページに遺伝子名を入力することによって見出すことができる。例えば、2011年8月10日にHGNCウェブサイトの簡単検索(Simple Search)フィールドに「LRRN3」という用語を入力すると、LRRN3の承認遺伝子名(ロイシンリッチリピートニューロン3)、LRRN3の配列アクセッションID(GenBank AB060967;RefSeq: NM 001099658)、およびLRRN3の以前の記号または同義語(FIGLER5、FLJ11129、NLRR3)が返される。さらなるヒト遺伝子名が以下の実施例セクションにおいて提供される。当業者は、表1に提供される遺伝子名情報が、本発明においてバイオマーカーとして用いられる遺伝子を明確に特定することを認識し、表1の遺伝子名情報を用いて、この名称の遺伝子に関するタンパク質および核酸配列情報を、過度の実験を行うことなく得ることができる。このような情報によって、当業者は、本明細書に記載されるいくつかの方法のいずれか1つを用いて、これらのマーカーの量的発現レベルデータを得ることが容易に可能となる。「喫煙対数オッズ」とは、バイオマーカーと喫煙状態との関連性の標準的な統計的尺度を指す。表1中の正の値は、そのマーカーが喫煙状態と正に関連することを示し、負の値は、そのマーカーが喫煙状態と負に関連すること(すなわち、そのマーカーが陰性(非喫煙)喫煙状態と関連すること)を示す。したがって、表1において、喫煙の増加と共に発現が減少する場合には、そのマーカーは負の値を有し、喫煙の増加と共に発現が増加する場合には、そのマーカーは正の値を有する。「喫煙p」とは、マーカーの喫煙状態との関連性(正または負)の統計的有意性を指す。
ある態様において、マーカーの関連する値は、対象から得られた試料に関連するデータセット中に含まれ得る。データセットは、表1に提示される2個またはそれより多い、3個またはそれより多い、4個またはそれより多い、5個またはそれより多い、6個またはそれより多い、7個またはそれより多い、8個またはそれより多い、9個またはそれより多い、10個またはそれより多い、11個またはそれより多い、12個またはそれより多い、13個またはそれより多い、14個またはそれより多い、15個またはそれより多い、16個またはそれより多い、17個またはそれより多い、18個またはそれより多い、19個またはそれより多い、20個またはそれより多い、21個またはそれより多い、22個またはそれより多い、23個またはそれより多い、24個またはそれより多い、25個またはそれより多い、26個またはそれより多い、27個またはそれより多い、28個またはそれより多い、29個またはそれより多い、あるいは30個またはそれより多いマーカーのマーカー発現値を含み得る。データセットは、表1に提示されるマーカーのサブセットまたは完全なセットを、喫煙状態と正または負に関連することが現在知られているか、または後に決定される他のマーカーと共に含み得る。例えば、データセットは、SASH1、P2RY6、MUC1、LRRN3、MGAT3、およびCLDND1の発現値を含み得る。別の態様において、データセットは、CLDND1、LRRN3、MUC1、GOPC、およびLEF1の発現値を含み得る。他の組み合わせが、以下の実施例セクションにおいてより詳細に記載される。データセットはまた、マーカーの発現値と臨床因子、例えば性別を組み合わせてもよい。データセットはまた、マーカーの発現値と対象の性別の指標(すなわち、対象が雄であるかまたは雌であるかの表示)を組み合わせてもよい。データセットはまた、マーカーの発現値と対象の高血圧状態の指標を組み合わせてもよい。
別の態様において、本発明は、1つまたは複数のマーカーを含む、対象と関連する試料を得ることを含む。試料は、対象によって得ることもできるし、または第三者、例えば医療専門家によって得ることもできる。医療専門家の例には、内科医、救急医療技術者、看護師、第一応答者、心理学者、医学物理士、ナースプラクティショナー、外科医、歯科医、および当業者に公知であるような任意の他の明白な医療専門家が含まれる。試料は、末梢血細胞、単離された白血球、または末梢血細胞もしくは単離された白血球から抽出されたRNAを含み得る。試料は、任意の体液、例えば、羊水、房水、胆汁、リンパ液、母乳、間質液、血液、血漿、耳垢(cerumen)(耳垢(earwax))、カウパー氏腺液(射精前液)、乳糜、粥状液、膣液、月経分泌物、粘液、唾液、尿、嘔吐物、涙液、膣潤滑液、汗、血清、精液、皮脂、膿、胸水、脳脊髄液、滑液、細胞内液、および硝子体液から得ることができる。一例では、試料は、医療専門家が例えば注射器により対象から血液を抜き取る採血によって得られる。次にこの体液を試験して、アッセイ法を用いて1つまたは複数のマーカーの値を決定することができる。次に、1つまたは複数のマーカーの値は、アッセイを行ったのと同じ当事者が本発明の方法を用いて評価することもできるし、または本発明の方法を用いた評価のために第三者に送ることもできる。
喫煙状態は、特定の喫煙関連疾患リスクと相関することが周知である。これらには、慢性閉塞性肺疾患(COPD)、慢性気管支炎、肺気腫、肺がん、喘息が含まれる(11、12)。したがって、本発明の方法を用いて独立したリスク因子を提供して、1つまたは複数の喫煙関連疾患を発症する個体のリスクを評価することができる。本発明の方法による結果は、喫煙状態を用いて喫煙関連疾患リスクを評価するいくつかの診断過程のいずれか1つに送り込むことができる。これらの結果は、例えば、患者の病歴データを内科医に、保険会社に、または1つもしくは複数の喫煙関連疾患を発症する個体のリスクを評価することに関心のある任意の他の実態に提供した上で、個体の自己申告による喫煙状態の代わりに、またはそれに加えて用いることができる。
解釈関数
ある態様において、解釈関数は、予測モデルによって生成された関数であってよい。解釈関数はまた、複数の予測モデルによって生成され得る。ある態様において、解釈関数は、log(Pr(喫煙者)/(1-Pr(喫煙者))=15.7306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.7166 * LEF1、式中、男性である場合には性別=1、女性である場合には性別=0、Pr=確率の形態をとってよい。他の解釈関数は表7に提示される。
ある態様において、予測モデルには、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルが含まれ得る。ある態様において、予測モデルにはまた、サポートベクターマシン、二次判別分析、またはLASSO回帰モデルが含まれ得る。Elements of Statistical Learning, Springer 2003, Hastie, Tibshirani, Friedmanを参照されたい;これはあらゆる目的のために全体として参照により本明細書に組み入れられる。予測モデル性能は、曲線下面積(AUC)によって特徴づけることができる。ある態様において、予測モデル性能は、0.68〜0.70の範囲のAUCを特徴とする。ある態様において、予測モデル性能は、0.70〜0.79の範囲のAUCを特徴とする。ある態様において、予測モデル性能は、0.80〜0.89の範囲のAUCを特徴とする。ある態様において、予測モデル性能は、0.90〜0.99の範囲のAUCを特徴とする。解釈関数は、以下の実施例に示されるように情報価値のあるマーカーの組み合わせを用いて、または発現が喫煙状態と高度に関連する単一の遺伝子を用いて開発することができる。特定の態様において、単一遺伝子に基づいて分類する方法は、ロジスティック回帰または線形判別分析(LDA)を用いて開発される。
アッセイ法
1つまたは複数のマーカーのアッセイ法の例には、DNAアッセイ法、マイクロアレイ、配列決定された分子の数をカウントし、そのカウントを用いて発現レベルを決定する配列決定に基づくアッセイ法が含まれる。配列決定される分子は、mRNA転写物に対応するcDNAであってよい。他のアッセイ法には、ポリメラーゼ連鎖反応法(PCR)、RT-qPCR、配列決定アッセイ法、サザンブロット、ノーザンブロット、抗体結合アッセイ法、酵素結合免疫吸着アッセイ法(ELISA)、フローサイトメトリー、タンパク質アッセイ法、ウェスタンブロット、ネフェロメトリー、比濁法、クロマトグラフィー、質量分析法、例として非限定的にRIA、免疫蛍光、免疫化学発光、免疫電気化学発光、または競合免疫アッセイ法、免疫沈降を含む免疫アッセイ法、および以下の実施例セクションに記載されるアッセイ法が含まれる。アッセイからの情報は定量的であってよく、本発明のコンピュータシステムに送ることができる。情報はまた、パターンまたは蛍光を観察することのように定性的であってもよく、これを使用者によって、または読み取り装置もしくはコンピュータシステムにより自動的に、定量的尺度に変換することができる。ある態様において、対象はまた、臨床因子(例えば、性別)などの、アッセイ情報以外の情報をコンピュータシステムに提供することもできる。
発現レベルを評価するためにRT-qPCRを使用することに加えて、マイクロアレイまたはRNA配列決定などの他の様式を用いることもできる。例えば、RT-qPCRデータに基づく予測モデルのマイクロアレイデータへのクロスウォークのためには、アレイデータを最初に標準的な正規化に供す。次に回帰直線を当てはめて、モデル遺伝子のそれぞれのPCR値をそのアレイ値から予測する。次に、各回帰の当てはめ値を予測因子として喫煙モデルに挿入する。予測モデルのRNA配列決定へのクロスウォークのためには、次世代配列決定プラットフォームを用いて、モデル遺伝子の標的化再配列決定を達成する。未加工の配列読み取りをそれぞれの標的化遺伝子と整列させ、被覆の大きさを算出することにより未加工の発現レベルを評価する。未加工の値を、試料当たりの未加工配列の総数および標的遺伝子の長さによって正規化する。次に回帰直線を当てはめて、モデル遺伝子のそれぞれのPCR値をその正規化された配列値から予測する。次に、各回帰の当てはめ値を予測因子として喫煙モデルに挿入する。
情報価値のあるマーカー群
名称、アクセッション番号、または配列により本出願において特定される特定の例示的マーカーに加えて、本発明の範囲内には、例証される配列と少なくとも90%、もしくは少なくとも95%、もしくは少なくとも97%、もしくはそれより高い同一性を有するか、または例証される遺伝子もしくは配列によってコードされるタンパク質と少なくとも90%、もしくは少なくとも95%、もしくは少なくとも97%、もしくはそれより高い同一性を有する配列を有するタンパク質をコードする変種配列の発現値を用いて試料をスコア付けし、任意で分類するためのすべての実施可能な喫煙状態の予測モデルおよびそれらの使用方法が含まれる。配列同一性の割合は、例えば、Stephen F. Altschul et al., J. Mol. Biol. 215:403-410 (1990)に記載され、国立衛生研究所(National Institutes of Health)によって維持される国立バイオテクノロジー情報センター(National Center for Biotechnology Information)ウェブサイトにおいて利用可能なBLASTnおよびBLASTpを含む、当業者に周知のアルゴリズムを用いて決定することができる。本発明の態様に従って、例示的マーカー発現値に加えて、またはその代わりに、例示的マーカー発現値の発現と高度に相関することが現在知られているか、または後に見出されるマーカー発現測定値を使用する、試料をスコア付けし、任意で分類する際のすべての実施可能な予測モデルおよびそれらの使用方法は以下に記載される通りである。本発明の目的に関して、このような高度に相関した遺伝子は、主張される本発明の文字通りの範囲内であるか、または代替的に、例示的マーカーの等価物として包含されるかのいずれかと考えられる。例示的マーカーの発現値と高度に相関した発現値を有するマーカーの同定、および予測モデルの成分としてのそれらの使用は、十分に当技術分野における通常技術のレベルの範囲内である。以下の実施例セクションは、高度に相関したマーカーを同定し、喫煙状態の予測モデルにおいてアルゴリズムマーカーに対してそれらを置換する方法、および試料をスコア付けし、任意で分類するためのそれらの使用方法の数多くの例を提供する。
コンピュータ具現化
1つの態様において、コンピュータは、チップセットに連結された少なくとも1つのプロセッサを含む。またチップセットには、メモリ、記憶装置、キーボード、グラフィックスアダプター、ポインティング装置、およびネットワークアダプターが連結されている。ディスプレイはグラフィックスアダプターに連結されている。1つの態様において、チップセットの機能性は、メモリコントローラーハブおよびI/Oコントローラーハブによって提供される。別の態様において、メモリは、チップセットの代わりにプロセッサに直結されている。
記憶装置は、ハードドライブ、コンパクトディスク読み取り専用メモリ(CD-ROM)、DVD、またはソリッドステート記憶装置のような、データを保持することができる任意の装置である。メモリは、プロセッサによって用いられる命令およびデータを保持する。ポインティング装置は、マウス、トラックボール、または他のタイプのポインティング装置であってよく、データをコンピュータシステムに入力するためにキーボードと組み合わせて用いられる。グラフィックスアダプターは、画像および他の情報をディスプレイ上に表示する。ネットワークアダプターは、コンピュータシステムをローカルまたは広域ネットワークに連結する。
当技術分野において公知のように、コンピュータは、前述の構成要素とは異なるおよび/または前述の構成要素以外の構成要素を有し得る。加えて、コンピュータは、特定の構成要素を欠くこともできる。さらに、記憶装置はローカルであってよく、および/またはコンピュータから遠隔的であってもよい(記憶域ネットワーク(SAN)内に具現化されるなど)。
当技術分野において公知のように、コンピュータは、本明細書に記載される機能性を提供するためのコンピュータプログラムモジュールを実行するように適合化される。本明細書で用いられる場合、「モジュール」という用語は、指定された機能性を提供するために利用されるコンピュータプログラム論理を指す。したがって、モジュールは、ハードウェア、ファームウェア、および/またはソフトウェアにより具現化され得る。1つの態様において、プログラムモジュールは記憶装置上に記憶され、メモリにロードされ、プロセッサによって実行される。
2つまたはそれより多い核酸配列またはポリペプチド配列に関連する場合のパーセント「同一性」という用語は、2つまたはそれより多い配列またはサブ配列が、最大限一致するように比較し整列させた場合に、以下に記載される配列比較アルゴリズム(例えば、BLASTPおよびBLASTNまたは当業者に利用可能な他のアルゴリズム)の1つを用いて、または目視により測定して、同じであるヌクレオチドまたはアミノ酸残基の指定された割合を有することを指す。用途に応じて、パーセント「同一性」は、比較される配列のある領域にわたって、例えば機能ドメインにわたって存在してもよいし、または代替的に、比較される2つの配列の全長にわたって存在してもよい。
配列比較では、典型的には1つの配列が、試験配列を比較する参照配列となる。配列比較アルゴリズムを使用する場合、試験配列および参照配列をコンピュータに入力し、必要に応じてサブ配列座標を指定し、配列アルゴリズムプログラムパラメータを指定する。次いで配列比較アルゴリズムが、指定されたプログラムパラメータに基づいて、参照配列に対する試験配列のパーセント配列同一性を算出する。
比較のための配列の最適なアライメントは、例えば、Smith & Waterman, Adv. Appl. Math. 2:482 (1981)の局所相同性アルゴリズムによって、Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)の相同性アライメントアルゴリズムによって、Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988)の類似性検索法によって、これらのアルゴリズムのコンピュータ具現化(Wisconsin Genetics Software Package、Genetics Computer Group、575 Science Dr., Madison, Wis.におけるGAP、BESTFIT、FASTA、およびTFASTA)によって、または目視(一般的には下記のAusubel et al.を参照)によって行うことができる。
パーセント配列同一性および配列類似性を決定するのに適したアルゴリズムの一例は、Altschul et al., J. Mol. Biol. 215:403-410 (1990)に記載されているBLASTアルゴリズムである。BLAST解析を行うためのソフトウェアは、国立バイオテクノロジー情報センターを通じて公的に利用可能である。
本明細書に記載される実体の態様は、本明細書に記載されるモジュール以外の、および/またはそれとは異なるモジュールを含み得る。加えて、モジュールに帰属する機能性は、他の態様において、他のまたは異なるモジュールによって実行され得る。さらに、本説明は、明確さおよび便宜のために「モジュール」という用語を省略することもある。
キット
本発明は、表1より選択される1つまたは複数のマーカーの量的発現データを決定するためのキット、および対象の喫煙状態を判定するために該データを使用するための指示書を提供する。任意で、キットは包装材料を含み得る。キットは、表1より選択される1つまたは複数のマーカーの発現レベルを決定するための、qRT-PCRアッセイ、ハイブリダイゼーションアッセイ、または配列決定アッセイなどのヌクレオチドに基づくアッセイを実施するための試薬を含み得る。キットは、本明細書に記載される他のタイプのアッセイのいずれかを実施するための試薬を含み得る。試薬は、表4に提示されるプローブおよびプライマーなどのプローブおよびプライマー、または他の類似の試薬であってよい。試薬は、表1または表2中に確認されるプローブなどのプローブであってよい。指示書は、量的発現データ上で動くように用いられる解釈関数を含み得る。解釈関数は、予測モデルから作成され得る。指示書は、喫煙対象もしくは喫煙対象集団から、または非喫煙対象もしくは非喫煙対象集団から決定され得る閾値を含み得る。指示書は、喫煙状態を判定するために、量的発現データを閾値と比較する方法を含み得る。
本発明を実施するための具体的な態様の例は以下の通りである。これらの例は、例示を目的として提供されるにすぎず、本発明の範囲を限定することを決して意図するものではない。使用した数字(例えば、量、温度等)に関しては正確性を期すよう努力したが、いくらかの実験誤差および偏差は当然ながら考慮されるべきである。
別段の指示がない限り、本発明の実施は、当技術分野の技術の範囲内であるタンパク質化学、生化学、組み換えDNA技法、および薬理学の従来法を使用する。このような技法は文献において十分に説明されている。例えば、T. E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993);A. L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition);Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989);Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.);Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990);Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B(1992)を参照されたい。
材料および方法
統計的方法
すべての統計的方法は、Rソフトウェアパッケージを用いて行った。使用した統計的方法は、以下にさらに詳細に記載され、言及される。
遺伝子選択
RT-PCRのための遺伝子は、有意性、倍率変化、経路解析、および文献の裏付けに基づいて選択した。遺伝子:遺伝子相関に基づく階層的クラスタリングにより、RT-PCR遺伝子が複数のクラスターを表すことが保証された。正規化遺伝子は、分散が低いこと、発現が中程度〜高度であること、および症例:対照状態、性別、年齢、または細胞数との有意な関連性の欠如に基づいて選択した。
PCR統計解析
単変量および多変量ロジスティック回帰を用いて、臨床/人口統計学的因子を喫煙状態関連性について評価した。喫煙状態および他の臨床/人口統計学的因子との遺伝子発現関連性は、ロバストロジスティック回帰によって評価した(非調節および性別/年齢調節)。7
全ゲノムマイクロアレイ解析
第I相−PREDICT発見
本発明者らは、冠動脈疾患と相関する遺伝子発現シグニチャーを同定するために設計された前向き臨床試験(PREDICT)に登録された210名のカテーテル室患者から単離されたRNAについて全ゲノムマイクロアレイ解析を行った。
カテーテル挿入時に、血液をPAXgenチューブ中に採取した。Agencourt RNAdvanceシステムを用いて自動化法によってRNAを単離し、Ribogreen(Invitrogen(現Life Technologies)、Carlsbad, CA)を用いて定量した。製造業者(Agilent、Santa Clara, CA)によって推奨される方法を用いてRNAをCy3で標識し、全ゲノムアレイ(Agilentヒト全ゲノムアレイ)にハイブリダイズさせた。
アレイ正規化
アレイ正規化のためのAgilent処理シグナル値をトリム平均100になるよう拡大縮小した後、log2変換した。標準的なアレイQC測定基準(存在率、対相関、およびシグナル強度)を品質評価に使用した結果、210のPREDICT試料のうち12が除外された。
アレイ解析
PREDICTアレイに関して、対の設計を考慮して、条件付きロジスティック回帰を使用した。偽発見率を用いて多重比較を説明づけた。GOEASTを用いて、遺伝子オントロジー(GO)用語の過剰提示を決定した。
Agilent特徴抽出ソフトウェアを用いてアレイ特徴データを抽出し、分位数正規化を用いて正規化した。
アルゴリズムの計算および変換
データの再処理およびQC段階
1) 各アルゴリズム遺伝子/試料の三つ組ウェルの中央値を計算した
a. 1つのウェルにコールがない場合、残り2つのウェルの中央値を用いた
b. 2つまたは3つのウェルにコールがない場合、このアルゴリズム遺伝子にはその試料に関してコールなしが付与された
2) アルゴリズム遺伝子SDの中央値を計算した。この値が0.15よりも大きい場合、この試料は複製物SDが高いために(High Replicate SDのために)失格とした。
3) 各アルゴリズム遺伝子iに関して、GLi未満の値をGLiで置換することにより、下限Cp値を作成した。この値は、アルゴリズム開発セットにおけるその遺伝子のCpの第1パーセンタイルを表す。
4) 各アルゴリズム遺伝子iに関して、GUiを超える値をGUiで置換することにより、上限Cp値を作成した。この値は、アルゴリズム開発セットにおけるその遺伝子のCpの第99パーセンタイルを表す。
5) 各アルゴリズム遺伝子iに関して、そのCp値とGMiとの差の絶対値を計算したが、GMiとは、アルゴリズム開発セットにおけるその遺伝子のCp中央値を表す。アルゴリズム遺伝子すべてにわたって、この値を合計した。合計が27.17よりも大きい場合、この試料は、発現プロファイルが範囲外(Expresson Profile Out of Range)であるために失格とした。27.17とは、アルゴリズム開発セット内のこの測定基準の最大値を表す。
ある場合には、対象に関してアルゴリズムスコアが算出されなかった。この理由には、PAXgene(登録商標)チューブ血液量が少ないこと、研究室QC失格等が含まれた。このような失格の発生頻度は集計されたが、これらの対象は解析セットには含めなかった。
発現レベルが喫煙と相関する遺伝子を同定するために、喫煙状態を従属変数として使用し、年齢、性別、および遺伝子発現を独立変数として使用して、ロバスト線形モデル(8)を用いた。表1は、喫煙状態と有意な相関(p<0.05)を示した4988個のプローブ(4214個の遺伝子に相当する)を含む。1933個のプローブは喫煙者において下方制御され(負の喫煙対数オッズによって示される)、3055個のプローブは喫煙者において上方制御された(正の喫煙対数オッズによって示される)(表1)。
(表1)
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
少数の遺伝子(36個)は、1つまたは複数のプローブが上方制御を示し、1つまたは複数のプローブが下方制御を示す、2個以上の関連プローブを有した。
PREDICT試験に登録された150名のカテーテル室女性患者から単離されたRNAに関するその後のマイクロアレイ解析において、RT-qPCRによるさらなる評価のために、自己申告による喫煙状態との関連性により6個の遺伝子が選択された:SASH1;P2RY6;MUC1;LRRN3;MGAT3;およびCLDND1。
生物学的に注釈が付けられ、かつ発現がゼロではないマイクロアレイプローブの中で、これらは喫煙状態と最も強力な絶対相関を示した(r>0.425)という理由で選択された。いずれも、喫煙状態でより高い発現を有した。これら6つのRT-qPCRプローブ設計のうち5つが成功した;MGAT3の設計は成功せず、よってこの遺伝子は含めなかった。これらの遺伝子5個をセット1と命名した。セット1マーカー(およびMGAT3)の対応するAgilent全ゲノムアレイプローブおよび遺伝子名を表2に提供する。
(表2)
Figure 2014531202
第II相‐RT-qPCR解析
1039名のPREDICT患者から単離されたRNAのRT-qPCR解析において、セット1遺伝子を含む261個の遺伝子を喫煙状態との関連性について評価した(表3)。付加的な255個の遺伝子は、冠疾患、関連特性(例えば、脂質レベル)との関連性について、または細胞マーカーとして選択された。261個の遺伝子の発現値をACLYおよびTFCP2の平均値に対して正規化した;遺伝子の発現値が0.01分位および0.99分位を超えた場合には、値を切り捨てた。これらの遺伝子のうち135個が、年齢調節および性別調節ロジスティック回帰モデルにおいて喫煙状態との有意な関連性を示した;80個の有意なアレイ遺伝子のうち59個が、qRT-PCRによっても依然として有意であった。このセットのうち3つ(HIST1H2AC、NONO、PAPD4)を除くすべてが、遺伝子発現の方向性においてアレイデータと一致した。LRRN3は、喫煙状態と最も有意に関連する遺伝子のままであり、これにCLDND1、SASH1、およびP2RY6が続いた(p<0.001)。以下の表3において、遺伝子GNASおよびFTH1について、遺伝子記号中の「x」という接尾語は、所与の遺伝子に関するアッセイ法がエキソン配列に対して設計されたことを意味し;遺伝子記号中の「n」という接尾語は、所与の遺伝子に関するアッセイ法がイントロン配列に対して設計されたことを意味することに留意されたい。
(表3)遺伝子261個のセット
Figure 2014531202
Figure 2014531202
個々のマーカーの識別閾値の決定
特定の態様において、喫煙状態は、単一のマーカーまたはマーカー群の発現レベルを解析して、非喫煙対象または非喫煙対象集団における同じ1つまたは複数のマーカーの発現レベルの解析によって確立された閾値レベルと、この発現レベルが有意に異なるかどうかを判定することにより判定される。1つまたは複数のマーカーに関する対象の値と閾値との間の有意差は、喫煙状態を示す。逆に、喫煙対象または非喫煙対象集団を用いて閾値を設定するように、方法を開発することができる。この態様において、有意差は、試験試料を提供した対象の非喫煙状態を示す。
実施例1‐予測モデリング
喫煙状態を従属変数とし、年齢、性別、および遺伝子発現を独立変数とした段階的順方向ロジスティック回帰(9)を用いて、喫煙状態の予測モデルを構築した。患者は、患者の自己申告による喫煙状態が現在喫煙者であるかまたは最近やめた喫煙者(この2カ月以内)であった場合に、喫煙者と定義された。遺伝子5個がこのモデルによって選択され、セット2と命名した。セット1の遺伝子のうち3個がこのモデルによって選択された(CLDND1、LRRN3、MUC1)。残りの遺伝子2個(GOPC、LEF1)は、それぞれCAD関連性のために、およびCD8+ナイーブ細胞マーカーとして、遺伝子259個の解析中に含めたものである。セット2の遺伝子の発現レベルを評価するために用いられるプローブ配列およびプライマー配列を表4に示す。
(表4)
Figure 2014531202
結果として得られたモデル式は以下の通りである:
log(Pr(喫煙者)/(1-Pr(喫煙者))=15.7306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.7166 * LEF1、
式中、男性である場合には性別=1、女性である場合には性別=0;Pr=確率。
自己申告による状態の予測に関して、このモデルは10分割交差検証において平均AUC 0.932を有する。カットオフ確率0.5において、このモデルの当てはめ感度は0.784であり、特異度は0.953であった。モデル性能のさらなる詳細を表5に提供する。180名の独立したPREDICT対象を用いてモデル性能を検証したところ、AUCは0.82(95% CI 0.65〜0.94)であり、感度は0.63であり、および特異度は0.94であった。
(表5)
Figure 2014531202
実施例2‐交差検証されたサブモデルの開発
実施例1に記載されたアプローチ(すなわち、喫煙状態を従属変数とし、年齢、性別、および遺伝子発現を独立変数とした段階的順方向ロジスティック回帰(9))を用いて、セット2の遺伝子の全サブセットについて、10分割交差検証されたサブモデルを開発した。これらのサブモデルの性能を表6に提示する。
(表6)
Figure 2014531202
これらのサブモデルに対応する等式を以下の表7に提示する。これらは実施例1に提示される等式と同様の様式で適用され、log(Pr(喫煙者)/(1-Pr(喫煙者))を解くために用いられる。例えば、サブモデル1と関連する式は以下の通りである:log(Pr(喫煙者)/(1-Pr(喫煙者))=3.411334+0.5660 * 性別−6.4940 * CLDND1、
式中、男性である場合には性別=1、女性である場合には性別=0;Pr=確率。
(表7)
Figure 2014531202
実施例3‐高度に相関した代替マーカーを用いた交差検証されたモデル
実施例1に記載されたモデルに基づいて、マーカーの1つが高度に相関したマーカーと置換されたモデルを開発した;高度に相関したマーカーを選択する基準は、元の遺伝子に対する最大(ピアソン)相関Rであった。表8は、喫煙モデルにおける各遺伝子が、喫煙モデル中にまだ含まれていなかった253個の試験遺伝子から選択された遺伝子に置き換えられた、10分割交差検証されたモデルにおける平均AUCを示す。相関性(R値によって表示)もまた表8に含める。
(表8)
Figure 2014531202
実施例4‐情報価値のあるマーカーの閾値の決定
情報価値のあるマーカー259個のセットの、喫煙集団および非喫煙集団において報告された平均Ctおよび標準偏差を表9に示す。これらの値は、「第II相‐RT-qPCR解析」セクションにおいて上記された通りに正規化し、切り捨ててある。
(表9)
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
Figure 2014531202
実施例5‐予測モデルの生化学的検証
自己申告による喫煙状態の正確さを確認するために、生化学的方法を使用した。ニコチンの比較的安定した代謝産物であるコチニンのレベルは、自己申告による喫煙状態と相関することが示されており、酵素結合免疫アッセイ法(ELISA)によって容易に測定され得る(10)。合計20件の試料をアッセイした:自己申告非喫煙者からの試料10件は、遺伝子発現による喫煙の当てはめ確率は0.3%未満であり、自己申告喫煙者からの試料10件は、遺伝子発現による喫煙の当てはめ確率は99%超であった。コチニンレベルが低い自己申告喫煙者1名を除いて、自己申告による状態とコチニンレベルとの間には強い一致が認められた(図1)。
閾値10 ng/mlを用いた場合、コチニンレベルはAUC 0.89(95% CI 0.81〜0.97)、感度0.81、および特異度0.97をもたらした。遺伝子発現モデルとコチニンとの間には中程度の一致が認められた(91%一致、95% CI 85.97〜94.83、κ=0.53);両方法が正の喫煙状態を報告した場合、85%の対象(11名)が自己申告喫煙者であり、1名が最近やめ、1名が元喫煙者であった。
参照による組み入れの提示
科学出版物、公開済み特許出願、および交付済み特許を含む、本明細書において引用される参考文献はすべて、あらゆる目的のために全体として本明細書に組み入れられる。
参考文献
Figure 2014531202

Claims (225)

  1. 以下の段階を含む、対象から得られた試料をスコア付けするコンピュータ具現化法であって、該スコアが該対象の喫煙状態を示す、方法:
    試料と関連するデータセットを得る段階であって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、段階;ならびに
    コンピュータプロセッサにより、解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定する段階。
  2. データセットがマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1がCLDND1であり、マーカー2がLRRN3であり、マーカー3がMUC1であり、マーカー4がGOPCであり、かつマーカー5がLEF1である、請求項1記載の方法。
  3. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む、請求項1記載の方法。
  4. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む、請求項1記載の方法。
  5. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む、請求項1記載の方法。
  6. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む、請求項1記載の方法。
  7. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項1〜6のいずれか一項記載の方法。
  8. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項7記載の方法。
  9. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項1〜8のいずれか一項記載の方法。
  10. データセットが、スコアを算出するために用いられる臨床因子をさらに含む、請求項1〜9のいずれか一項記載の方法。
  11. 臨床因子が、性別および高血圧からなる群より選択される、請求項10記載の方法。
  12. 臨床因子が性別である、請求項11記載の方法。
  13. 解釈関数が予測モデルに基づく、請求項1〜12のいずれか一項記載の方法。
  14. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデル(tree-based recursive partitioning model)からなる群より選択される、請求項13記載の方法。
  15. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項1〜14のいずれか一項記載の方法。
  16. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項1〜15のいずれか一項記載の方法。
  17. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項1〜16のいずれか一項記載の方法。
  18. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項1〜17のいずれか一項記載の方法。
  19. データセットが、記憶装置に記憶された状態で得られる、請求項1〜18のいずれか一項記載の方法。
  20. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項1〜19のいずれか一項記載の方法。
  21. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項1〜20のいずれか一項記載の方法。
  22. 量的発現データが配列データ由来のものである、請求項1〜21のいずれか一項記載の方法。
  23. 以下の段階を含む、対象から得られた試料をスコア付けするコンピュータ具現化法:
    スコアを算出するために用いられる臨床因子、ならびにCLDND1、IL7R、LRRN3、CCR7、MUC1、FOXP3、GOPC、MCM3、LEF1、およびCCR7からなる群より選択される少なくとも1つのマーカーの量的発現レベル値を含む、試料と関連するデータセットを得る段階;ならびに
    コンピュータプロセッサにより、解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定する段階。
  24. データセットが、CLDND1、LRRN3、MUC1、GOPC、およびLEF1の量的発現データを含む、請求項23記載の方法。
  25. データセットが2つまたはそれより多いマーカーの量的発現データを含む、請求項23記載の方法。
  26. データセットが3つまたはそれより多いマーカーの量的発現データを含む、請求項23記載の方法。
  27. データセットが4つまたはそれより多いマーカーの量的発現データを含む、請求項23記載の方法。
  28. データセットが5つまたはそれより多いマーカーの量的発現データを含む、請求項23記載の方法。
  29. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項23〜28のいずれか一項記載の方法。
  30. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項29記載の方法。
  31. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項23〜30のいずれか一項記載の方法。
  32. 臨床因子が、性別および高血圧からなる群より選択される、請求項23〜31のいずれか一項記載の方法。
  33. 臨床因子が性別である、請求項32記載の方法。
  34. 解釈関数が予測モデルに基づく、請求項23〜33のいずれか一項記載の方法。
  35. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項34記載の方法。
  36. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項23〜35のいずれか一項記載の方法。
  37. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項23〜36のいずれか一項記載の方法。
  38. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項23〜37のいずれか一項記載の方法。
  39. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項23〜38のいずれか一項記載の方法。
  40. データセットが、記憶装置に記憶された状態で得られる、請求項23〜39のいずれか一項記載の方法。
  41. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項23〜40のいずれか一項記載の方法。
  42. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項23〜41のいずれか一項記載の方法。
  43. 量的発現データが配列データ由来のものである、請求項23〜42のいずれか一項記載の方法。
  44. 以下のものを含む、対象から得られた試料をスコア付けするためのシステムであって、該スコアが該対象の喫煙状態を示す、システム:
    試料と関連するデータセットを記憶するための記憶装置であって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、記憶装置;ならびに
    解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定するための、該記憶装置に通信的に連結されたプロセッサ。
  45. データセットがマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1がCLDND1であり、マーカー2がLRRN3であり、マーカー3がMUC1であり、マーカー4がGOPCであり、かつマーカー5がLEF1である、請求項44記載のシステム。
  46. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む、請求項44記載のシステム。
  47. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む、請求項44記載のシステム。
  48. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む、請求項44記載のシステム。
  49. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む、請求項44記載のシステム。
  50. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項44〜49のいずれか一項記載のシステム。
  51. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項50記載のシステム。
  52. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項44〜51のいずれか一項記載のシステム。
  53. データセットが、スコアを算出するために用いられる臨床因子をさらに含む、請求項44〜52のいずれか一項記載のシステム。
  54. 臨床因子が、性別および高血圧からなる群より選択される、請求項53記載のシステム。
  55. 臨床因子が性別である、請求項54記載のシステム。
  56. 解釈関数が予測モデルに基づく、請求項44〜55のいずれか一項記載のシステム。
  57. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項56記載のシステム。
  58. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項44〜57のいずれか一項記載のシステム。
  59. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項44〜58のいずれか一項記載のシステム。
  60. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項44〜59のいずれか一項記載のシステム。
  61. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項44〜60のいずれか一項記載のシステム。
  62. データセットが、記憶装置に記憶された状態で得られる、請求項44〜61のいずれか一項記載のシステム。
  63. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項44〜62のいずれか一項記載のシステム。
  64. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項44〜63のいずれか一項記載のシステム。
  65. 量的発現データが配列データ由来のものである、請求項44〜64のいずれか一項記載のシステム。
  66. コンピュータ実行可能なプログラムコードを記憶するコンピュータ可読記憶媒体であって、該プログラムコードが以下のものを含む、コンピュータ可読記憶媒体:
    試料と関連するデータセットを記憶するためのプログラムコードであって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、プログラムコード;ならびに
    解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定するためのプログラムコード。
  67. データセットがマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1がCLDND1であり、マーカー2がLRRN3であり、マーカー3がMUC1であり、マーカー4がGOPCであり、かつマーカー5がLEF1である、請求項66記載の媒体。
  68. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む、請求項66記載の媒体。
  69. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む、請求項66記載の媒体。
  70. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む、請求項66記載の媒体。
  71. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む、請求項66記載の媒体。
  72. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項66〜71のいずれか一項記載の媒体。
  73. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項72記載の媒体。
  74. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項66〜73のいずれか一項記載の媒体。
  75. データセットが、スコアを算出するために用いられる臨床因子をさらに含む、請求項66〜74のいずれか一項記載の媒体。
  76. 臨床因子が、性別および高血圧からなる群より選択される、請求項75記載の媒体。
  77. 臨床因子が性別である、請求項76記載の媒体。
  78. 解釈関数が予測モデルに基づく、請求項66〜77のいずれか一項記載の媒体。
  79. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項78記載の媒体。
  80. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項66〜79のいずれか一項記載の媒体。
  81. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項66〜80のいずれか一項記載の媒体。
  82. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項66〜81のいずれか一項記載の媒体。
  83. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項66〜82のいずれか一項記載の媒体。
  84. データセットが、記憶装置に記憶された状態で得られる、請求項66〜83のいずれか一項記載の媒体。
  85. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項66〜84のいずれか一項記載の媒体。
  86. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項66〜85のいずれか一項記載の媒体。
  87. 量的発現データが配列データ由来のものである、請求項66〜86のいずれか一項記載の媒体。
  88. 以下の段階を含む、対象から得られた試料をスコア付けする方法であって、該スコアが該対象の喫煙状態を示す、方法:
    複数の分析物を含む試料を対象から得る段階;
    該試料を試薬と接触させる段階;
    該試薬と該複数の分析物との間で複数の複合体を生成する段階;
    該試料と関連するデータセットを得るために該複数の複合体を検出する段階であって、該データセットがマーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを含み、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、段階;ならびに
    解釈関数を用いて該データセットから該対象の喫煙状態を示すスコアを決定する段階。
  89. データセットがマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1がCLDND1であり、マーカー2がLRRN3であり、マーカー3がMUC1であり、マーカー4がGOPCであり、かつマーカー5がLEF1である、請求項88記載の方法。
  90. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む、請求項88記載の方法。
  91. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む、請求項88記載の方法。
  92. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む、請求項88記載の方法。
  93. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む、請求項88記載の方法。
  94. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項88〜93のいずれか一項記載の方法。
  95. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項94記載の方法。
  96. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項88〜95のいずれか一項記載の方法。
  97. データセットが、スコアを算出するために用いられる臨床因子をさらに含む、請求項88〜96のいずれか一項記載の方法。
  98. 臨床因子が、性別および高血圧からなる群より選択される、請求項97記載の方法。
  99. 臨床因子が性別である、請求項98記載の方法。
  100. 解釈関数が予測モデルに基づく、請求項88〜99のいずれか一項記載の方法。
  101. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項100記載の方法。
  102. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項88〜101のいずれか一項記載の方法。
  103. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項88〜102のいずれか一項記載の方法。
  104. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項88〜103のいずれか一項記載の方法。
  105. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項88〜104のいずれか一項記載の方法。
  106. 量的発現データが配列データ由来のものである、請求項88〜105のいずれか一項記載の方法。
  107. 以下のものを含む、対象から得られた試料をスコア付けするためのキットであって、該スコアが該対象の喫煙状態を示す、キット:
    対象から得られた試料から、マーカー1、マーカー2、マーカー3、マーカー4、および/またはマーカー5のうちの1つまたは複数の量的発現データを決定するための複数の試薬を含む試薬のセットであって、マーカー1がCLDND1またはIL7Rであり、マーカー2がLRRN3またはCCR7であり、マーカー3がMUC1またはFOXP3であり、マーカー4がGOPCまたはMCM3であり、かつマーカー5がLEF1またはCCR7である、試薬のセット;ならびに
    該複数の試薬を用いて、該試料からデータセット中の量的発現データを決定するための指示書であって、コンピュータプロセッサにより、解釈関数を用いて該データセットから該対象の喫煙状態を示すスコアを決定するための指示を含む、指示書。
  108. データセットがマーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含み、マーカー1がCLDND1であり、マーカー2がLRRN3であり、マーカー3がMUC1であり、マーカー4がGOPCであり、かつマーカー5がLEF1である、請求項107記載のキット。
  109. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの2つまたはそれより多い量的発現データを含む、請求項107記載のキット。
  110. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの3つまたはそれより多い量的発現データを含む、請求項107記載のキット。
  111. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5のうちの4つまたはそれより多い量的発現データを含む、請求項107記載のキット。
  112. データセットが、マーカー1、マーカー2、マーカー3、マーカー4、およびマーカー5の量的発現データを含む、請求項107記載のキット。
  113. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定するための指示をさらに含む、請求項107〜112のいずれか一項記載のキット。
  114. 喫煙関連疾患が慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および/または喘息である、請求項113記載のキット。
  115. データセットが、表1より選択される少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多い付加的なマーカーの量的発現データを含む、請求項107〜114のいずれか一項記載のキット。
  116. データセットが、スコアを算出するために用いられる臨床因子をさらに含む、請求項107〜115のいずれか一項記載のキット。
  117. 臨床因子が、性別および高血圧からなる群より選択される、請求項116記載のキット。
  118. 臨床因子が性別である、請求項117記載のキット。
  119. 解釈関数が予測モデルに基づく、請求項107〜118のいずれか一項記載のキット。
  120. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項119記載のキット。
  121. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項1〜120のいずれか一項記載のキット。
  122. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項107〜121のいずれか一項記載のキット。
  123. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項107〜122のいずれか一項記載のキット。
  124. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項107〜123のいずれか一項記載のキット。
  125. 量的発現データが配列データ由来のものである、請求項107〜124のいずれか一項記載のキット。
  126. 以下の段階を含む、対象の喫煙状態を判定する方法:
    表1より選択されるマーカーの量的発現データを含む、対象から得られた試料と関連するデータセットを得る段階;および
    該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析する段階であって、それによって該対象の喫煙状態を判定する、段階。
  127. 対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価する段階をさらに含む、請求項126記載の方法。
  128. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項127記載の方法。
  129. 解析する段階が、マーカーの前記決定された発現レベルを閾値と比較する段階をさらに含み、該決定された発現レベルと該閾値の差が正の喫煙状態を示す、請求項126記載の方法。
  130. 閾値が、非喫煙対象または非喫煙対象集団から得られた発現データと関連している、請求項129記載の方法。
  131. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項126記載の方法。
  132. 対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価する段階をさらに含む、請求項131記載の方法。
  133. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項132記載の方法。
  134. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項131記載の方法。
  135. データセットが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む、請求項126記載の方法。
  136. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項135記載の方法。
  137. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項136記載の方法。
  138. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項136記載の方法。
  139. マーカーの発現レベルが対象の喫煙状態と正に相関する、請求項126記載の方法。
  140. マーカーの発現レベルが閾値よりも有意に高い、請求項129記載の方法。
  141. マーカーの発現レベルが対象の喫煙状態と負に相関する、請求項126記載の方法。
  142. マーカーの発現レベルが閾値よりも有意に低い、請求項129記載の方法。
  143. 1つまたは複数のコンピュータ上で具現化される、請求項126記載の方法。
  144. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項126記載の方法。
  145. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項126記載の方法。
  146. 量的発現データがヌクレオチドに基づくアッセイから得られる、請求項126記載の方法。
  147. 量的発現データが、qRT-PCRアッセイ、ハイブリダイゼーションアッセイから、または配列決定反応により得られる、請求項146記載の方法。
  148. 以下の段階を含む、対象の喫煙状態を判定する方法:
    表1より選択されるマーカーを含む試料を対象から得る段階;
    該試料を試薬と接触させる段階;
    該試薬と該マーカーとの間で複合体を生成する段階;
    該マーカーの量的発現データを含む、該試料と関連するデータセットを得るために、該複合体を検出する段階;および
    該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析する段階であって、それによって該対象の喫煙状態を判定する、段階。
  149. 対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価する段階をさらに含む、請求項148記載の方法。
  150. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項149記載の方法。
  151. 解析する段階が、マーカーの前記決定された発現レベルを閾値と比較する段階をさらに含み、該決定された発現レベルと該閾値の差が正の喫煙状態を示す、請求項148記載の方法。
  152. 閾値が、非喫煙対象または非喫煙対象集団から得られた発現データと関連している、請求項151記載の方法。
  153. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項148記載の方法。
  154. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項153記載の方法。
  155. データセットが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む、請求項148記載の方法。
  156. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項155記載の方法。
  157. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項156記載の方法。
  158. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項156記載の方法。
  159. マーカーの発現レベルが対象の喫煙状態と正に相関する、請求項148記載の方法。
  160. マーカーの発現レベルが閾値よりも有意に高い、請求項151記載の方法。
  161. マーカーの発現レベルが対象の喫煙状態と負に相関する、請求項148記載の方法。
  162. マーカーの発現レベルが閾値よりも有意に低い、請求項151記載の方法。
  163. 以下の段階を含む、対象の喫煙状態を判定するためのコンピュータ具現化法:
    表1より選択されるマーカーの量的発現データを含む、対象から得られた試料と関連するデータセットを記憶装置に記憶させる段階;および
    該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するためにコンピュータプロセッサにより該データセットを解析する段階であって、それによって該対象の喫煙状態を判定する、段階。
  164. 対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価する段階をさらに含む、請求項163記載の方法。
  165. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項164記載の方法。
  166. 解析する段階が、マーカーの発現レベルを閾値と比較する段階をさらに含み、該発現レベルと該閾値の差が正の喫煙状態を示す、請求項163記載の方法。
  167. 閾値が、非喫煙対象または非喫煙対象集団から得られた発現データと関連している、請求項166記載の方法。
  168. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項163記載の方法。
  169. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項168記載の方法。
  170. データセットが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む、請求項163記載の方法。
  171. 解析する段階が、対象の喫煙状態を示すスコアを作成するために、解釈関数をマーカーの前記決定されたレベルに適用する段階をさらに含む、請求項170記載の方法。
  172. 解釈関数が、表7に提示される解釈関数からなる群より選択される解釈関数である、請求項171記載の方法。
  173. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項171記載の方法。
  174. マーカーの発現レベルが対象の喫煙状態と正に相関する、請求項163記載の方法。
  175. マーカーの発現レベルが閾値よりも有意に高い、請求項166記載の方法。
  176. マーカーの発現レベルが対象の喫煙状態と負に相関する、請求項163記載の方法。
  177. マーカーの発現レベルが閾値よりも有意に低い、請求項166記載の方法。
  178. 以下のものを含む、対象の喫煙状態を判定するためのシステム:
    表1より選択されるマーカーの量的発現データを含む、対象から得られた試料と関連するデータセットを記憶するための記憶装置;および
    該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析し、それによって該対象の喫煙状態を判定するための、該記憶装置に通信的に連結されたプロセッサ。
  179. プロセッサが、対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価するようにプログラムされる、請求項178記載のシステム。
  180. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項179記載のシステム。
  181. 表1より選択されるマーカーの閾値を含むデータセットを記憶するための記憶装置をさらに含む、請求項178記載のシステム。
  182. 閾値が、非喫煙対象または非喫煙対象集団から得られた発現データと関連している、請求項181記載のシステム。
  183. 試料と関連するデータセットが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む、請求項178記載のシステム。
  184. プロセッサが、解釈関数をマーカーの前記決定されたレベルに適用し、対象の喫煙状態を示すスコアを作成するようにプログラムされる、請求項178記載のシステム。
  185. 解釈関数が、表7に提示される解釈関数の群より選択される解釈関数である、請求項184記載のシステム。
  186. プロセッサが、解釈関数を前記決定された発現レベルに適用し、対象の喫煙状態を示すスコアを作成するようにプログラムされる、請求項183記載のシステム。
  187. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項186記載のシステム。
  188. コンピュータ実行可能なプログラムコードを記憶するコンピュータ可読記憶媒体であって、該プログラムコードが以下のものを含む、コンピュータ可読記憶媒体:
    表1より選択されるマーカーの量的発現データを含む、対象から得られた試料と関連するデータセットを記憶するためのプログラムコード;および
    該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するために該データセットを解析し、それによって該対象の喫煙状態を判定するためのプログラムコード。
  189. 前記判定された喫煙状態に基づいて、喫煙関連疾患を発症する対象のリスクを評価するためのプログラムコードをさらに含む、請求項188記載のコンピュータ可読記憶媒体。
  190. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項189記載のコンピュータ可読記憶媒体。
  191. 解釈関数を前記決定された発現レベルに適用して、対象の喫煙状態を示すスコアを作成するためのプログラムコードをさらに含む、請求項188記載のコンピュータ可読記憶媒体。
  192. 解釈関数が、表7に提示される解釈関数の群より選択される解釈関数である、請求項191記載のコンピュータ可読記憶媒体。
  193. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項191記載のコンピュータ可読記憶媒体。
  194. 以下のものを含む、対象の喫煙状態を判定する上で使用するためのキット:
    対象から得られた試料から、表1より選択されるマーカーの量的発現データを決定するための試薬のセット;ならびに
    該試料から量的発現データを決定するために該試薬のセットを用いるための、および該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するためにデータセットを解析し、それによって該対象の喫煙状態を判定するための指示書。
  195. 指示書が、対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価するための指示をさらに含む、請求項194記載のキット。
  196. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項195記載のキット。
  197. 指示書が、ヌクレオチドに基づくアッセイを実施するための指示をさらに含む、請求項194記載の方法。
  198. 量的発現データが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーのデータを含む、請求項194記載のキット。
  199. 以下のものを含む、対象の喫煙状態を判定する上で使用するためのキット:
    対象から得られた試料から、表1より選択されるマーカーの量的発現データを決定するための、本質的に複数の試薬からなる試薬のセット;ならびに
    該試料から量的発現データを決定するために該複数の試薬を用いるための、および該対象の喫煙状態と正または負に相関する該マーカーの発現レベルを決定するためにデータセットを解析し、それによって該対象の喫煙状態を判定するための指示書。
  200. 指示書が、対象の前記判定された喫煙状態を用いて、喫煙関連疾患を発症する該対象のリスクを評価するための指示をさらに含む、請求項199記載のキット。
  201. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項200記載のキット。
  202. 指示書が、ヌクレオチドに基づくアッセイを実施するための指示をさらに含む、請求項36記載の方法。
  203. 量的発現データが、表1より選択される少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーのデータを含む、請求項36記載のキット。
  204. 以下の段階を含む、対象から得られた試料をスコア付けするコンピュータ具現化法であって、該スコアが該対象の喫煙状態を示す、方法:
    表1より選択される複数のマーカーの量的発現データを含む、試料と関連するデータセットを得る段階;および
    コンピュータプロセッサにより、解釈関数を用いて該データセットから対象の喫煙状態を示すスコアを決定する段階。
  205. コンピュータプロセッサにより、前記スコアに基づいて、喫煙関連疾患を発症する対象のリスクを判定する段階をさらに含む、請求項204記載の方法。
  206. 喫煙関連疾患が、慢性閉塞性肺疾患、慢性気管支炎、肺気腫、肺がん、および喘息からなる群より選択される、請求項204記載の方法。
  207. データセットが、表1より選択される少なくとも3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多いマーカーの量的発現データを含む、請求項204記載の方法。
  208. 解釈関数が予測モデルに基づく、請求項204記載の方法。
  209. 予測モデルが、部分的最小二乗モデル、ロジスティック回帰モデル、線形回帰モデル、線形判別分析モデル、リッジ回帰モデル、および樹形再帰分割モデルからなる群より選択される、請求項208記載の方法。
  210. 試料と関連するデータセットを得る段階が、試料を得る段階と、データセットを実験的に決定するために該試料を処理する段階とを含む、請求項204記載の方法。
  211. 試料と関連するデータセットを得る段階が、試料を処理してデータセットを実験的に決定した第三者から直接または間接的に該データセットを受け取る段階を含む、請求項204記載の方法。
  212. 量的発現データがハイブリダイゼーションデータ由来のものである、請求項204記載の方法。
  213. 量的発現データがポリメラーゼ連鎖反応データ由来のものである、請求項204記載の方法。
  214. 量的発現データが配列データ由来のものである、請求項204記載の方法。
  215. データセットが、表1より選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、または少なくとも5個のマーカーからのデータを含む、請求項204記載の方法。
  216. マーカーが、CDND1、LRRN3、MUC1、GOPC、もしくはLEF1、または発現がCDND1、LRRN3、MUC1、GOPC、およびLEF1と相関する、表1より選択されるマーカーを含む、請求項215記載の方法。
  217. 発現がCLDND1と相関するマーカーがIL7Rである、請求項216記載の方法。
  218. 発現がLRRN3と相関するマーカーがCCR7である、請求項216記載の方法。
  219. 発現がMUC1と相関するマーカーがFOXP3である、請求項216記載の方法。
  220. 発現がGOPCと相関するマーカーがMCM3である、請求項216記載の方法。
  221. 発現がLEF1と相関するマーカーがCCR7である、請求項216記載の方法。
  222. データセットが、表1より選択される少なくとも5個のマーカーを含む、請求項215記載の方法。
  223. 少なくとも5個のマーカーが、CDND1、LRRN3、MUC1、GOPC、およびLEF1、またはその発現がCDND1、LRRN3、MUC1、GOPC、およびLEF1と相関するマーカーである、請求項222記載の方法。
  224. 解釈関数が、log(pr(喫煙者)/(1-Pr(喫煙者))=15.78306+0.3876 * 性別−3.3368 * CLDND1−3.4034 * LRRN3−1.4847 * MUC1+5.9209 * GOPC+2.27166 * LEF1であり、式中、男性である場合には性別=1であり、女性である場合には性別=0であり、Prは確率である、請求項222記載の方法。
  225. 解釈関数が、表7に提示されるものからなる解釈関数の群より選択される解釈関数である、請求項215記載の方法。
JP2014528478A 2011-08-29 2012-08-24 喫煙状態を判定するための方法および組成物 Pending JP2014531202A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161528616P 2011-08-29 2011-08-29
US61/528,616 2011-08-29
PCT/US2012/052303 WO2013032917A2 (en) 2011-08-29 2012-08-24 Methods and compositions for determining smoking status

Publications (1)

Publication Number Publication Date
JP2014531202A true JP2014531202A (ja) 2014-11-27

Family

ID=47757128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014528478A Pending JP2014531202A (ja) 2011-08-29 2012-08-24 喫煙状態を判定するための方法および組成物

Country Status (12)

Country Link
US (2) US20150178462A1 (ja)
EP (1) EP2751290A4 (ja)
JP (1) JP2014531202A (ja)
KR (1) KR20140051461A (ja)
CN (1) CN103890193A (ja)
AU (1) AU2012300375A1 (ja)
BR (1) BR112014004768A2 (ja)
CA (1) CA2846837A1 (ja)
EA (1) EA201490533A1 (ja)
IL (1) IL231131A0 (ja)
SG (1) SG11201400243PA (ja)
WO (1) WO2013032917A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018506301A (ja) * 2015-01-26 2018-03-08 ザ ユニバーシティー オブ シカゴ IL13Rα2結合剤及び癌治療におけるその使用
JP2019532410A (ja) * 2016-09-14 2019-11-07 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103389376B (zh) * 2013-08-21 2015-08-19 中南大学湘雅医院 评估肝细胞癌临床分期和预后的试剂盒及ecscr的应用
PL3084664T3 (pl) * 2013-12-16 2020-10-05 Philip Morris Products S.A. Układy i sposoby do przewidywania statusu palenia u osobnika
CN105214077B (zh) * 2014-06-03 2019-02-05 浙江阿思科力生物科技有限公司 Usp33在肿瘤中的应用
CA2954169A1 (en) * 2014-07-14 2016-01-21 Allegro Diagnostics Corp. Methods for evaluating lung cancer status
CN104651354B (zh) * 2015-01-21 2017-12-15 田小利 Scml4基因序列及表达改变检测及其在冠心病预测中的应用
CN105296658A (zh) * 2015-11-30 2016-02-03 北京泱深生物信息技术有限公司 Alkbh2基因在缺血性脑卒中诊断中的应用
EP3475911A1 (en) * 2016-06-22 2019-05-01 Swiss Reinsurance Company Ltd. Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
CN106801095A (zh) * 2017-02-14 2017-06-06 徐州市中心医院 Prrt1基因在制备冠心病诊断产品中的应用
CN107937521B (zh) * 2017-11-19 2019-01-04 武汉迈特维尔生物科技有限公司 用于检测肾上腺皮质癌的试剂盒
CN108611413B (zh) * 2018-03-30 2021-10-01 青岛泱深生物医药有限公司 一种帕金森相关生物标志物及其应用
CN108303547A (zh) * 2018-02-07 2018-07-20 北京泱深生物信息技术有限公司 一种用于诊断慢性阻塞性肺疾病的分子标志物
CN108070649A (zh) * 2018-02-07 2018-05-25 北京泱深生物信息技术有限公司 Kcne1基因在诊断慢性阻塞性肺疾病中的应用
RU2690393C1 (ru) * 2018-05-29 2019-06-04 Федеральное государственное бюджетное научное учреждение "Научно-исследовательский институт комплексных проблем гигиены и профессиональных заболеваний" Способ прогнозирования вероятности развития атеросклероза у шахтеров с хроническим пылевым бронхитом
CN109055522A (zh) * 2018-07-03 2018-12-21 吉林大学 C4orf38在制备用于检测或治疗神经性疼痛的产品中的应用
CN111500733B (zh) * 2020-05-27 2022-03-08 中国人民解放军军事科学院军事医学研究院 外周血单核细胞中用于非小细胞肺癌早期诊断的分子标记物
CN111856031B (zh) * 2020-07-21 2023-04-28 国家烟草质量监督检验中心 通过测定外周血中性粒细胞中蛋白的表达来鉴定烟碱暴露的潜在生物标志物的方法
CN114231529B (zh) * 2021-11-17 2023-08-01 中国科学院昆明动物研究所 一种人pkmyt1ar基因及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7102429B2 (en) * 2002-06-28 2006-09-05 Motorola, Inc. RF amplifier with enhanced efficiency
JP2007516693A (ja) * 2003-06-09 2007-06-28 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・ミシガン 癌の治療および診断のための組成物および方法
CN1852974A (zh) * 2003-06-09 2006-10-25 密歇根大学董事会 用于治疗和诊断癌症的组合物和方法
DE102004003612B4 (de) * 2004-01-25 2015-01-08 grapho metronic Meß- und Regeltechnik GmbH Verfahren und Auswertung eines Bildes von einem vorbestimmten Ausschnitt eines Druckerzeugnisses
AU2007223788B2 (en) * 2006-03-09 2012-11-29 The Trustees Of Boston University Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
WO2008063521A2 (en) * 2006-11-13 2008-05-29 The General Hospital Corporation Gene-based clinical scoring system
US20100119474A1 (en) * 2007-03-06 2010-05-13 Cornell University Chronic obstructive pulmonary disease susceptibility and related compositions and methods
WO2010120914A1 (en) * 2009-04-14 2010-10-21 Cardiodx, Inc. Predictive models and method for assessing age

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018506301A (ja) * 2015-01-26 2018-03-08 ザ ユニバーシティー オブ シカゴ IL13Rα2結合剤及び癌治療におけるその使用
JP2019532410A (ja) * 2016-09-14 2019-11-07 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ
JP7022119B2 (ja) 2016-09-14 2022-02-17 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ
JP2022062189A (ja) * 2016-09-14 2022-04-19 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ
JP7275334B2 (ja) 2016-09-14 2023-05-17 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ

Also Published As

Publication number Publication date
EA201490533A1 (ru) 2014-08-29
US20150178462A1 (en) 2015-06-25
CA2846837A1 (en) 2013-03-07
WO2013032917A3 (en) 2013-06-13
EP2751290A2 (en) 2014-07-09
KR20140051461A (ko) 2014-04-30
US20190311808A1 (en) 2019-10-10
SG11201400243PA (en) 2014-03-28
WO2013032917A2 (en) 2013-03-07
CN103890193A (zh) 2014-06-25
IL231131A0 (en) 2014-03-31
EP2751290A4 (en) 2015-07-15
BR112014004768A2 (pt) 2019-09-24
AU2012300375A1 (en) 2014-03-20

Similar Documents

Publication Publication Date Title
JP2014531202A (ja) 喫煙状態を判定するための方法および組成物
Corchete et al. Systematic comparison and assessment of RNA-seq procedures for gene expression quantitative analysis
JP6603208B2 (ja) 複数の細胞内シグナル伝達経路活性を用いた治療反応の医学的予後及び予測
EP3013986B1 (en) Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression
CN106795565B (zh) 用于评估肺癌状态的方法
EP2417545B1 (en) Method for in vitro diagnosing acute myeloid leukemia
US9122777B2 (en) Method for determining coronary artery disease risk
JP2021164484A (ja) 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法
JP2022521791A (ja) 病原体検出のための配列決定データを使用するためのシステムおよび方法
EP3304093B1 (en) Validating biomarker measurement
EP2812693B1 (en) A multi-biomarker-based outcome risk stratification model for pediatric septic shock
WO2019023517A2 (en) GENOMIC SEQUENCING CLASSIFIER
US20220251647A1 (en) Gene expression signatures useful to predict or diagnose sepsis and methods of using the same
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
WO2013049152A2 (en) Methods for evaluating lung cancer status
US20230348980A1 (en) Systems and methods of detecting a risk of alzheimer's disease using a circulating-free mrna profiling assay
JP2023511658A (ja) 敗血症を患う個体における重症疾患の予測及び対処
CN113528643A (zh) 抑郁症相关的生物标志物及其诊断产品和应用
US20210262040A1 (en) Algorithms for Disease Diagnostics
CN111540410B (zh) 用于预测个体的吸烟状况的系统和方法
JP2021517892A (ja) 疼痛のための精密医療:診断バイオマーカー、薬理ゲノミクス、およびリパーパス薬
US20240035090A1 (en) mRNA BIOMARKERS FOR DIAGNOSIS OF LIVER DISEASE
WO2024077282A2 (en) Biomarkers for the diagnosis of amyotrophic lateral sclerosis
CN116246775A (zh) 冠状动脉扩张症的诊断系统、装置