JP2021164484A - 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法 - Google Patents

機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法 Download PDF

Info

Publication number
JP2021164484A
JP2021164484A JP2021117469A JP2021117469A JP2021164484A JP 2021164484 A JP2021164484 A JP 2021164484A JP 2021117469 A JP2021117469 A JP 2021117469A JP 2021117469 A JP2021117469 A JP 2021117469A JP 2021164484 A JP2021164484 A JP 2021164484A
Authority
JP
Japan
Prior art keywords
seq
uip
classifier
sample
transcripts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021117469A
Other languages
English (en)
Other versions
JP2021164484A5 (ja
Inventor
シー. ケネディ,ジュリア
C Kennedy Giulia
ディガンズ,ジェームズ
Diggans James
ファン,ジン
Jing Huang
チョイ,ユンナ
Yoonha Choi
ヨン キム,ス
Su Yeon Kim
パンクラッツ,ダニエル
Pankratz Daniel
パガン,モライマ
Pagan Moraima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Veracyte Inc
Original Assignee
Veracyte Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Veracyte Inc filed Critical Veracyte Inc
Publication of JP2021164484A publication Critical patent/JP2021164484A/ja
Publication of JP2021164484A5 publication Critical patent/JP2021164484A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Pulmonology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

【課題】本発明は、サンプル間で通常型間質性肺炎(UIP)または非UIPを識別するための、システム、方法および分類器を提供する。
【解決手段】機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法に関する。
【選択図】なし

Description

関連出願の相互参照
[0001] この出願は、2014年11月5日に出願された米国特許仮出願第62/075,328号、および2015年3月10日に出願された米国特許仮出願第62/130,800号に対する優先権を主張し、その全体を参照により本明細書に組み込む。この出願は、2014年3月14日に出願されたPCT/US2014/029029号の全ての主題のその全体も参照により本明細書に組み込む。
電子的に提出されたテキストファイルの説明
[0002] これと共に電子的に提出されるテキストファイルの内容は、その全体を参照により本明細書に組み込む:配列表のコンピュータ読み込み可能な形式のコピー(ファイル名:VRCT_003_01WO_SeqList_ST25.txt、記録日:2015年11月05日、ファイルサイズ64キロバイト。)
[0003] 間質性肺疾患(ILD)は、類似の臨床症状を持つが、重症度ならびに予後の範囲が広い急性および慢性両側性の実質性肺障害の不均質な群である1、2。これらの中で、特発性肺線維症(IPF)は、最も一般的で、重篤なILDの1つであり、進行性線維症、肺機能の悪化、死亡によって特徴付けられる3〜6。IPFと診断された患者のほとんどは、初期診断の5年以内に死亡する7、8。しかしながら、2つの新薬の最近の有効性および開発中の他の治療法は、この事態を変化させる可能性があり9〜11、適当な治療的介入には正確な診断が極めて重大である5、12
[0004] IPFは、診断が難しい場合がある。IPFに対する診断手法は、他の間質性肺炎、ならびに結合組織疾患および環境および職業的な曝露を除外する必要がある3〜6。IPFの疑いがある患者は、高分解能コンピュータ断層撮影(HRCT)を通常受け、通常型間質性肺炎(UIP)のパターンがはっきりと明らかな場合だけ、疾患を高い特異度で確認する5、13。にもかかわらず、多くの患者の場合、診断は、間質性肺炎および/またはUIPパターンの組織病理学的特性を明らかにするために侵襲的な外科的肺生検(SLB)を必要とし5、14、症状の出現からIPFを診断するまでの典型的な時間が1〜2年になる場合がある15。病理学者間で不一致が起こり、正しい診断が個々の経験によって決まる場合がある16。組織病理学的評価をしても、確定診断が確認しにくいままの場合もある。呼吸器科医、放射線科医および病理学者の多くの専門家のチーム(MDT)が協議する場合、診断精度が高まることが示されているが17;残念ながら、全ての患者および医師が、経験あるMDTによるこのレベルの専門家審査を受ける機会を有するわけではない。そのような審査には時間がかかり、患者は、認定された専門知識がある地域施設で診察される必要がある。
[0005] したがって、IPFを診断するより有効な方法が必要である。加えて、UIPを非UIPと識別する方法が必要である。
[0006] 本明細書において、その精度が、専門家の病理学診断を使用して真のラベルとして確認された分類器を使用して、サンプル間で通常型間質性肺炎(UIP)か非UIPかを識別するために使用される方法およびシステムが記述される。科学文献では遺伝子発現プロファイリング研究が、IPFと他のILDサブタイプとの差異的発現を報告しているが18、19、いずれも、臨床医の差異的診断の一部として頻繁に存在する他のサブタイプを含有するデータセットにおいてUIPを分類しようとしてこなかった。
[0007] いくつかの実施形態において、本発明は、肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法および/またはシステムを提供する。いくつかの実施形態において、方法は:対象の試験サンプル中の第1群の転写産物および第2群の転写産物それぞれの発現レベルをアッセイするために提供され、第1群の転写産物は、UIPにおいて過剰発現され、かつ、表5、7、9、10、11および12のいずれかに挙げた遺伝子のいずれか1つまたは複数を含み、第2群の転写産物は、UIPにおいて過小発現され、かつ、表5、8、9、10、11または12のいずれかに挙げた遺伝子のいずれか1つまたは複数を含む。いくつかの実施形態において、本方法は、第1群の転写産物および第2群の転写産物それぞれの発現レベルを、対応する転写産物の参照発現レベルと比較する工程であって、(1)参照発現レベルと比較して(a)第1群に対応する発現レベルにおける増加もしくは(b)第2群に対応する発現レベルにおける低下がある場合に前記肺組織を通常型間質性肺炎(UIP)と分類する、または(2)参照発現レベルと比較して(c)第2群に対応する発現レベルにおける増加もしくは(d)第1群に対応する発現レベルにおける低下がある場合に肺組織を非通常型間質性肺炎(非UIP)と分類する工程をさらに提供する。いくつかの実施形態において、本方法は、表5、8、9、11および/または12に挙げた1つまたは複数の遺伝子のいずれかの配列バリアントを決定および/または比較する工程をさらに提供する。
[0008] いくつかの実施形態において、本発明は、肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法および/またはシステムを提供する。いくつかの実施形態において、本方法および/またはシステムを使用して、対象の肺組織由来試験サンプルにおける第1群の転写産物および第2群の転写産物それぞれの発現レベルを配列決定、アレイハイブリダイゼーションまたは核酸増幅によりアッセイし、第1群の転写産物は、UIPにおいて過剰発現され、かつ、表5、7、9、10、11または12に挙げた遺伝子のいずれか1つまたは複数を含み、第2群の転写産物は、UIPにおいて過小発現され、かつ、表5、8、9、10、11または12に挙げた遺伝子のいずれか1つまたは複数を含む。特定の実施形態において、本方法および/またはシステムは、第1群の転写産物および第2群の転写産物それぞれの発現レベルを、対応する転写産物の参照発現レベルとさらに比較する工程であって、(1)参照発現レベルと比較して(a)第1群に対応する発現レベルにおける増加もしくは(b)第2群に対応する発現レベルにおける低下がある場合に前記肺組織を通常型間質性肺炎(UIP)と分類する、または(2)参照発現レベルと比較して(c)第2群に対応する発現レベルにおける増加もしくは(d)第1群に対応する発現レベルにおける低下がある場合に肺組織を非通常型間質性肺炎(非UIP)と分類する。
[0009] いくつかの実施形態において、本発明は、
発現している2つ以上の転写産物の発現レベルを測定する工程、および/またはサンプル中で発現している1つもしくは複数の転写産物の配列バリアントを決定する工程;
コンピュータ生成分類器を使用してUIPと非UIPとを区別する工程
により試験サンプルがUIPまたは非UIPに陽性か検出するための方法および/またはシステムを提供し;分類器は、HP、NSIP、サルコイドーシス、RB、細気管支炎および器質化肺炎(OP)を含む非UIP病理学サブタイプの範囲を使用して築かれる。
[0010] いくつかの実施形態において、試験サンプルは、生検サンプルまたは気管支肺胞洗浄サンプルである。いくつかの実施形態において、試験サンプルは、新鮮凍結または固定される。
[0011] いくつかの実施形態において、転写産物発現レベルは、RT−PCR、DNAマイクロアレイハイブリダイゼーション、RNASeqまたはそれらの組み合わせにより決定される。いくつかの実施形態において、転写産物の1つまたは複数が標識される。
[0012] いくつかの実施形態において、本方法は、試験サンプルにおいて発現しているRNAから作製されるcDNAを検出する工程を含み、任意選択により、cDNAは、検出工程に先立って複数のcDNA転写産物から増幅される。
[0013] いくつかの実施形態において、本発明の方法は、試験サンプル中の少なくとも1つの対照核酸の発現レベルを測定する工程をさらに含む。
[0014] いくつかの実施形態において、本発明の方法は、肺組織を間質性肺疾患(ILD)、ILDの特定の型、非ILD、または非診断のいずれか1つに分類する。特定の実施形態において、本発明の方法は、肺組織を特発性肺線維症(IPF)または非特異性間質性肺炎(NSIP)のいずれかに分類する。
[0015] いくつかの実施形態において、本発明の方法および/またはシステムは、配列番号1〜22のいずれか1つの1つまたは複数の転写産物の発現レベルについて試験サンプルをアッセイする工程を含む。いくつかの実施形態において、本方法は、1〜20個の他の遺伝子の発現レベルについて試験サンプルをアッセイする工程をさらに含む。いくつかの実施形態において、他の遺伝子は、HMCN2、ADAMTSL1、CD79B、KEL、KLHL14、MPP2、NMNAT2、PLXDC1、CAPN9、TALDO1、PLK4、IGHV3−72、IGKV1−9およびCNTN4のうち1つもしくは複数または任意選択により全てを含む。
[0016] いくつかの実施形態において、本発明の方法および/またはシステムは、本明細書に開示するUIP対非UIP分類器のトレーニングにおける共変量として喫煙状態を使用する工程をさらに含み、任意選択により、喫煙状態は、対象の喫煙者状態の指標となる発現プロファイルを検出することにより決定される。いくつかの実施形態において、そのような分類器を使用して、試験サンプルがUIPかまたは非UIPか決定する。
[0017] いくつかの実施形態において、本発明の方法および/またはシステムは、UIP対非UIP分類器をトレーニングする工程を含み、分類器トレーニングの間に、喫煙者状態のバイアスの影響を受けやすい遺伝子は除外する、または喫煙者状態のバイアスの影響を受けにくい遺伝子とは異なって重み付けされる。
[0018] いくつかの実施形態において、本発明は、本明細書に記載のとおり、肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法および/またはシステムを提供し、本方法は、喫煙者と非喫煙者を区別する遺伝子シグネチャーを認識するためにトレーニングした第1の分類器を使用して試験サンプルを喫煙者または非喫煙者とする第1の分類を含み;本方法は、試験サンプルをUIPまたは非UIPとする第2の分類をさらに含み、第2の分類工程は、第2または第3の分類器を使用し、第2および第3の分類器は、喫煙者(喫煙者特異的分類器)および非喫煙者(非喫煙者特異的分類器)それぞれにおけるUIP対非UIPを区別するためにトレーニングされ、第2の分類は、(i)第1の分類において試験サンプルが喫煙者に分類された場合に喫煙者特異的分類器、または(ii)第1の分類において試験サンプルが非喫煙者に分類された場合に非喫煙者特異的分類器のいずれかを使用する。
[0019] いくつかの実施形態において、本発明は、肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法および/またはシステムを提供し、本方法は、遺伝子発現、バリアント、突然変異、融合、ヘテロ接合性の喪失(LOH)および生物学的経路効果から選択される1つまたは複数の特性を使用してトレーニングされる分類器を実装する工程を含む。いくつかの実施形態において、分類器は、遺伝子発現、遺伝子配列バリアント、遺伝子突然変異、遺伝子融合、遺伝子ヘテロ接合性の喪失(LOH)および遺伝子の生物学的経路効果を含む特性を使用してトレーニングされる。
[0020] いくつかの実施形態において、本発明は、第1群において2つ以上の異なる転写産物、または3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、もしくは20個超の異なる転写産物および/または第2群において2つ以上の異なる転写産物、または3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、または20個超の異なる転写産物をアッセイする工程を提供する。
[0021] いくつかの実施形態において、本方法は、配列番号1〜22のいずれか1つの2つ以上の異なる転写産物、または配列番号1〜22のいずれか1つの3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、もしくは20個超の異なる転写産物を検出する工程を提供する。特定の実施形態において、この方法は、配列番号1〜22の転写産物全ての発現レベルについて試験サンプルをアッセイする工程を提供する。いくつかの実施形態において、本方法は、1〜20個の他の遺伝子の発現レベルについて試験サンプルをアッセイする工程をさらに含む。いくつかの実施形態において、本方法は、HMCN2、ADAMTSL1、CD79B、KEL、KLHL14、MPP2、NMNAT2、PLXDC1、CAPN9、TALDO1、PLK4、IGHV3−72、IGKV1−9およびCNTN4のうち1つまたは複数をアッセイする工程を提供する。
[0022]IPFと診断された3名の患者(患者P1、P2およびP3)から得られた外植片サンプルに対するペアワイズ相関を示す図である。位置(上または下、中心もしくは周辺)を、各サンプルについて表示する。IPFサンプルを正常な肺サンプルから分離する上位200個の差異的に発現している遺伝子を使用してペアワイズピアソン相関係数を計算し、より高い相関がマゼンタ色で表され、より低い相関が緑色で表されるヒートマップとしてプロットした。正常な肺サンプル同士およびそれとの相関は、0.7の範囲である(不掲載)。 [0023]図2A〜2Dは、マイクロアレイデータを使用して築いた分類器の能力を示す図である。図2A:ROC曲線を使用して、リーブワンペイシェントアウト(leave-one-patient-out)(LOPO)交差検定を使用するトレーニングセットの能力を特徴付けた。 個々のサンプルに対するスコアは、トレーニングセットにおける患者全体で示される。患者レベル病理学診断が、x軸に示される。UIP病理学ラベルを持つサンプルが黒丸で表示され、病理学によって非UIPのサンプルが白三角形で示される。水平の点線は、92%特異性および64%感度に対応する閾値を示すために描画される。 ROC曲線を使用して、固定モデルでサンプルをスコアリングすることにより独立したテストセットの能力を特徴付けた。 個々のサンプルに対するスコアは、独立したテストセットにおける患者全体で示される。患者レベル病理学診断が、x軸に示される。UIP病理学ラベルを持つサンプルが黒丸で表示され、病理学によって非UIPのサンプルが白三角形で示される。水平の点線は、92%特異性および82%感度に対応する閾値を示すために描画される。 [0024]RNASeqを使用して築いた分類器の能力を示す図である。リーブワンペイシェントアウト(LOPO)交差検定を遂行し、受信者動作特性(ROC)曲線をRNASeq分類器について作製した。 RNASeqを使用して築いた分類器の能力を示す図である。トレーニングセットにおける個々のサンプルのスコアが、RNASeq分類について示される。患者レベル病理学診断が、x軸に示される。UIP病理学ラベルを持つサンプルが黒丸で表示され、病理学によって非UIPのサンプルが白三角形で示される。95%特異性に対応するスコア閾値を、水平線として表示する。 対応させた組に対するマイクロアレイを使用して築いた分類器の能力を示す図である。リーブワンペイシェントアウト(LOPO)交差検定を遂行し、受信者動作特性(ROC)曲線をマイクロアレイ分類器について作製した。 対応させた組に対するマイクロアレイを使用して築いた分類器の能力を示す図である。トレーニングセットにおける個々のサンプルのスコアが、マイクロアレイ分類について示される。患者レベル病理学診断が、x軸に示される。UIP病理学ラベルを持つサンプルが黒丸で表示され、病理学によって非UIPのサンプルが白三角形で示される。95%特異性に対応するスコア閾値を、水平線として表示する。 [0025]分類能力に対する誤ラベルの影響を算定するシミュレーション研究を示す図である。アレイトレーニングセット(n=77)を、本研究に使用した。データセット(x軸)における所与の割合のラベル交換で、個々のサンプルの分類ラベルは、3名の専門家の病理学診断の意見の相違レベルを説明する重み付けとともに別のクラスラベルに交換された。各箱ひげ図は、100回の反復シミュレーションのLOPO CV能力(AUC)を使用して描画された。AUC=0.5における水平のより細かい点線は、ランダムな能力を表し、すなわち、分類がない、より粗い点線は、図2Aに示される分類器能力に対応する。 [0026]2つのサンプル(サンプルAおよびサンプルB)による仮定的患者に対する中央病理診断プロセスを示す図である。3名の専門の病理学者が、審査プロセスに参加する。サンプルレベル診断の場合、各サンプルのスライドガラスは、各病理学者(病理学者を、Path.と略記する)によって審査される。患者レベル診断の場合、全てのサンプル(この演習においては2つ)のスライドガラスが集められ、各病理学者により一緒に審査される。サンプルレベルおよび患者レベル診断の両方で、同じ審査プロセスを行う。付与後にさえ専門の病理学者の意見が一致しなければ、最終診断として多数決が使用され、その場合、診断における信頼の不足のためサンプルは削除される。全ての保存組織(n=128)の中で、そのような例は1つだけ観察された。 [0027]3名の正常臓器ドナー(上)およびIPFと診断された3名の患者(下)からの肺サンプリングの位置を示す図である。ドナーN1〜N3およびP3は、女性であった。ドナーP1およびP2は、男性であった。 [0028]本明細書に開示する態様を実装するのに使用可能なコンピュータシステムの図解である。 [0029]図7Aのコンピュータシステムの処理装置の詳細な図解である。 [0100]本発明の非限定的な1つの方法の詳細な図解であって、公知のUIPおよび非UIPサンプルに対する遺伝子産物発現データを使用して分類器をトレーニングし(例えば分類器トレーニングモジュールを使用する)、それによりUIP対非UIPを識別し、任意選択により分類器は、喫煙者状態を共変と見なし、未知のサンプル由来の遺伝子産物発現データをトレーニングされた分類器に入力して、未知のサンプルをUIPまたは非UIPのいずれかに同定し、分類器による分類の結果を定義し、報告によって出力する。 [0030]喫煙者と非喫煙者の間のUIPおよび非UIPサンプルにおける差異的遺伝子発現を示す図である。UIPと非UIPサンプルの間で差異的に発現される遺伝子の数は、喫煙者と非喫煙者の間で大きく異なる。 [0031]UIPと非UIPサンプルの間の差異的遺伝子発現が、喫煙者状態のバイアスの影響を受けやすいことを示す図である。差異的遺伝子発現の方向(すなわち、過剰対過小発現)および大きさ(円のサイズ)は、喫煙状態により複雑になる。 [0032]図10A〜図10Dは、UIP対非UIPにおいて差異的に発現している遺伝子の例および発現レベルに対する喫煙状態の効果を示す図である。図10Aは、UIP対非UIP喫煙者対非喫煙者におけるIGHV3−72の差異的発現を示す。 UIP対非UIP喫煙者対非喫煙者におけるCPXM1の差異的発現を示す。 UIP対非UIP喫煙者対非喫煙者におけるBPIFA1の差異的発現を示す。 UIP対非UIP喫煙者対非喫煙者におけるHLA−Uの差異的発現を示す。
定義
[0033] 本明細書では「間質性肺疾患」または「ILD」(別名びまん性実質性肺疾患[DPLD])とは、間質(肺の肺胞周りの組織および空間)を侵す1群の肺疾患のことを指す。ILDは、疑いがある原因もしくは公知の原因により分類することができ、または特発性であることができる。例えば、ILDは、吸入物質(無機または有機)、薬物誘導性(例えば、抗生物質、化学療法薬、抗不整脈剤、スタチン)、結合組織疾患(例えば、全身性硬化症、多発性筋炎、皮膚筋炎、紅斑性全身的狼瘡、関節リウマチ)に付随して、肺感染症(例えば、異型肺炎、ニューモシスチス肺炎[PCP]、結核、トラコーマクラミジア、呼吸器合胞体ウイルス)に付随して、悪性度(例えば、癌性リンパ管症)に付随して起こると分類することができ、または特発性(例えば、サルコイドーシス、特発性肺線維症、ハマン−リッチ症候群、抗合成酵素症候群)であり得る。
[0034] 本明細書では「ILD炎症」とは、根底にある炎症により特徴付けられる炎症性ILDサブタイプの分析群のことを指す。これらのサブタイプは、IPFおよび/または他の任意の非炎症性肺疾患サブタイプに対する比較器として集合的に使用することができる。「ILD炎症」は、HP、NSIP、サルコイドーシスおよび/または器質化肺炎を含むことができる。
[0035] 「特発性間質性肺炎」または「IIP」(非感染性肺炎とも称される)とは、例えば、剥離性間質性肺炎、非特異性間質性肺炎、リンパ性間質性肺炎、原因不明の器質化肺炎および特発性肺線維症を含むILDのクラスのことを指す。
[0036] 本明細書では「特発性肺線維症」または「IPF」とは、肺の支持骨格(間質)の線維形成により特徴付けられる慢性、進行型肺疾患のことを指す。定義により、肺線維症の原因が不明(「特発性」)な場合に、本用語が使用される。顕微鏡的には、IPF患者由来の肺組織は、通常型間質性肺炎(UIP)として公知の組織学的/病理学的特性の特徴の組を示し、その特徴はIPFの病理学的対応物である。
[0037] 「非特異性間質性肺炎」または「NSIP」は、安定したもしくは巣状のコラーゲン沈着がある慢性炎症細胞によって定義される細胞類型、およびびまん性巣状線維化によって定義される繊維化類型によって一般に特徴付けられる特発性間質性肺炎の形態である。UIPとは対照的に、通常型間質性肺炎を特徴付ける蜂巣状所見も線維芽細胞病巣もない。
[0038] 「過敏性肺炎」または「HP」とは、外因性アレルギー性肺胞炎(EAA)とも呼ばれ、吸入された抗原(例えば、有機性粉末)による過大な免疫応答および過敏性が原因の肺内の肺胞の炎症のことを指す。
[0039] 「肺サルコイドーシス」または「PS」とは、結節を形成し得る慢性炎症細胞(肉芽腫)の異常な集積を含む症候群のことを指す。HPの炎症プロセスは、肺胞、小気管支および微小血管を一般に含む。HPの急性および亜急性症例において、理学的検査は、通常乾性ラ音を示す。
[0040] 用語「マイクロアレイ」とは、基板上にあるハイブリダイズ可能なアレイ要素、好ましくはポリヌクレオチドプローブの秩序ある配置のことを指す。
[0041] 用語「ポリヌクレオチド」とは、単数もしくは複数で使用される場合、任意のポリリボヌクレオチドもしくはポリデオキシリボヌクレオチドのことを一般に指し、無修飾RNAもしくはDNAまたは修飾RNAもしくはDNAであることができる。したがって、例えば、本明細書に定義されるポリヌクレオチドには、一本鎖および二本鎖DNA、一本鎖と二本鎖領域を含むDNA、一本鎖および二本鎖RNA、ならびに一本鎖と二本鎖領域を含むRNA、一本鎖、より一般的には、二本鎖、または一本鎖および二本鎖領域を含み得るDNAとRNAを含むハイブリッド分子があるがこれに限定されない。加えて、本明細書では、用語「ポリヌクレオチド」とは、RNAもしくはDNAまたはRNAとDNAの両方を含む三本鎖領域のことを指す。そのような領域における鎖は、同一分子または異なる分子由来であることができる。この領域は、1つまたは複数の分子の全てを含み得るが、より一般的にはいくつかの分子の一領域のみを含む。三重らせん領域の分子の1つは、しばしばオリゴヌクレオチドである。用語「ポリヌクレオチド」は、(例えば、フルオロフォアなど検出可能なシグナルを得るための)1つまたは複数の修飾塩基を含有するDNA(例えば、cDNA)およびRNAを含むこともできる。したがって、安定性もしくは他の理由のために修飾された骨格を持つDNAまたはRNAは、本明細書においてその用語が目的とするような「ポリヌクレオチド」である。さらに、イノシンなど通常でない塩基またはトリチウム化塩基などの修飾塩基を含むDNAもしくはRNAは、本明細書に定義される用語「ポリヌクレオチド」に含まれる。一般に、用語「ポリヌクレオチド」は、化学的、酵素的および/または代謝的に修飾された全ての形態の無修飾ポリヌクレオチド、ならびに単一および複雑型細胞を含めたウイルスおよび細胞の特徴を示すDNAおよびRNAの化学的形態を包含する。
[0042] 用語「オリゴヌクレオチド」とは、それだけには限らないが、一本鎖デオキシリボヌクレオチド、一本鎖または二本鎖リボヌクレオチド、RNA:DNAハイブリッドおよび二本鎖DNAを含む比較的短いポリヌクレオチド(例えば、100、50、20個またはより少ないヌクレオチド)のことを指す。一本鎖DNAプローブオリゴヌクレオチドなどのオリゴヌクレオチドは、例えば市販の自動化オリゴヌクレオチド合成装置を使用する化学的方法によりしばしば合成される。しかしながら、オリゴヌクレオチドは、in vitro組換えDNA媒介技術ならびに細胞および生物におけるDNAの発現を含めた他の様々な方法により作ることができる。
[0043] 用語「遺伝子産物」または「発現産物」は、mRNAを含めた遺伝子のRNA転写産物(RNA転写産物)、およびそのようなRNA転写産物のポリペプチド翻訳産物のことを指すために本明細書において互換的に使用される。遺伝子産物は、例えば、ポリヌクレオチド遺伝子発現産物(例えば、スプライスされていないRNA、mRNA、スプライスバリアントmRNA、マイクロRNA、断片化RNA、および同種のもの)またはタンパク質発現産物(例えば、成熟ポリペプチド、翻訳後修飾されたポリペプチド、スプライスバリアントポリペプチド、および同種のもの)であることができる。いくつかの実施形態において、遺伝子発現産物は、突然変異、融合、ヘテロ接合性の喪失(LOH)、および/または生物学的経路効果を含む配列バリアントであることができる。
[0044] 遺伝子発現産物に適用されるとき用語「標準化した発現レベル」とは、1つまたは複数の参照(または対照)遺伝子発現産物と比較して標準化された遺伝子産物のレベルのことを指す。
[0045] 遺伝子発現産物に適用されるとき「参照発現レベル」とは、1つまたは複数の参照(または対照)遺伝子発現産物の発現レベルのことを指す。遺伝子発現産物に適用されるとき「参照標準化発現レベル」とは、1つまたは複数の参照(または対照)遺伝子発現産物について標準化した発現レベル値(すなわち標準化した参照発現レベル)のことを指す。いくつかの実施形態において、参照発現レベルは、本明細書に記載のとおり、正常サンプルにおける1つまたは複数の遺伝子産物の発現レベルである。いくつかの実施形態において、参照発現レベルは、実験的に決定される。いくつかの実施形態において、参照発現レベルは、歴史的な発現レベル、例えば、正常サンプルにおける参照発現レベルのデータベース値であり、そのサンプルは、例えば、(i)単一サンプルの参照発現レベルの反復分析からの2つ以上、好ましくは3つ以上の参照発現レベルの平均;(ii)異なる複数のサンプル(例えば、正常サンプル)の参照発現レベルの分析からの2つ以上、好ましくは3つ以上の参照発現レベルの平均;ならびに(iii)上記の工程(i)および(ii)の組み合わせ(すなわち、複数のサンプルから分析した参照発現レベルの平均であり、参照発現レベルの少なくとも1つが、反復して分析される)など単一の参照発現レベルまたは複数の参照発現レベルの集計を示す。いくつかの実施形態において、「参照発現レベル」は、例えば、他の手段によりUIPまたは非UIPであることが最終的に決定された(すなわち確認された病理診断)サンプル中の配列バリアントの発現レベルである。
[0046] 遺伝子発現産物に適用されるとき「参照発現レベル値」とは、1つまたは複数の参照(または対照)遺伝子発現産物の発現レベル値のことを指す。遺伝子発現産物に適用されるとき「参照標準化発現レベル値」とは、1つまたは複数の参照(または対照)遺伝子発現産物について標準化した発現レベル値のことを指す。
[0047] ハイブリダイゼーション反応の「ストリンジェンシー」は、当業者によって容易に決定可能であり、一般にプローブ長、洗浄温度および塩濃度に応じた経験的な算出である。一般に、より長いプローブは、適当なアニーリングに、より高い温度を必要とし、より短いプローブはより低い温度を必要とする。ハイブリダイゼーションは、相補鎖が融解温度以下の環境に存在するときに、変性DNAが再アニールする能力によって一般に決まる。プローブとハイブリダイズ可能な配列の間の所望の相同性の程度が高い程、使用できる相対温度はより高くなる。その結果、より高い相対温度により、反応条件がよりストリンジェントになる傾向があるが、より低い温度により、よりストリンジェントでないことになる。ハイブリダイゼーション反応のストリンジェンシーについてのさらなる詳細および説明については、Ausubelら、Current Protocols in Molecular Biology(Wiley Interscience、 1995)を参照のこと。
[0048] 本明細書に定義される「ストリンジェントな条件」または「高いストリンジェンシー条件」は、一般に:(1)洗浄に低イオン強度溶液および高温度、例えば0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウム、50℃を利用し;(2)ハイブリダイゼーションの間に、ホルムアミド、例えば0.1%ウシ血清アルブミン/0.1%フィコール/0.1%ポリビニルピロリドン/750mM塩化ナトリウム、75mMクエン酸ナトリウムを含む50mMリン酸ナトリウム緩衝液pH6.5を含む50%(v/v)ホルムアミドなどの変性剤を42℃で利用し;または(3)50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、超音波処理したサケ精子DNA(50μg/mL)、0.1%SDS、および10%硫酸デキストランを42℃で利用し、0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)中で42℃ならびに55℃で50%ホルムアミドによる洗浄、その後EDTAを含有する0.1×SSCで55℃、からなる高いストリンジェンシーの洗浄を行う。
[0049] 「中程度にストリンジェントな条件」は、Sambrookら、Molecular Cloning:A Laboratory Manual(Cold Spring Harbor Press、1989)に記述されているように同定することができ、上述したそれより低いストリンジェンシーの洗浄溶液およびハイブリダイゼーション条件(例えば、温度、イオン強度および%SDS)の使用を含む。中程度にストリンジェントな条件の例は:20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%硫酸デキストラン、および20mg/mL変性剪断サケ精子DNAを含む溶液中で、37℃で終夜インキュベーションし、その後1×SSC中で、約37〜50℃でフィルタを洗浄する。当業者は、必要に応じて温度、イオン強度等を調整して、プローブ長などの因子および同種のものに適合させる方法を認識することができる。
[0050] 本明細書では「感度」とは、標的とする障害が実際にある、試験した総数のうちの真の陽性の割合(すなわち、陽性試験結果を有する、標的とする障害がある患者の割合)のことを指す。本明細書では「特異性」とは、標的とする障害が実際にはない、試験した全患者のうち真の陰性の割合(すなわち、陰性試験結果を有する、標的とする障害がない患者の割合)のことを指す。
[0051] 本発明の文脈において、任意の特定の遺伝子セットにおいて挙げた遺伝子のうち「少なくとも1つ」、「少なくとも2つ」、「少なくとも5つ」等への参照は、挙げた遺伝子のいずれか1つまたはいずれかおよび全ての組み合わせを意味する。
[0052] 用語「スプライシング」および「RNAスプライシング」は、互換的に使用され、イントロンを除去し、エキソンを接続して、真核細胞の細胞質に移動する連続したコード配列を持つ成熟mRNAを作製するRNAプロセシングのことを指す。
[0053] 用語「エキソン」とは、成熟RNA産物中に表される分断遺伝子の任意の区域のことを指す(B. Lewin, Genes 7V[Cell Press, 1990])。理論的には、用語「イントロン」とは、転写されるが、そのいずれかの側にあるエキソンと一緒にスプライシングにより転写産物の中から除去されるDNAの任意の区域のことを指す。操作上、エキソン配列は、参照配列番号に定義される遺伝子のmRNA配列中に存在する。操作上、イントロン配列は、エキソン配列により囲われ、通常5’および3’境界でGTならびにAGスプライス共通配列を有する遺伝子のゲノムDNA内の介在配列である。
[0054] 「コンピュータによるシステム」とは、情報を分析するために使用されるハードウェア、ソフトウェアおよびデータ記憶媒体のシステムのことを指す。患者コンピュータによるシステムのハードウェアは、中央演算処理装置(CPU)、ならびにデータ入力、データ出力(例えば、表示)およびデータ記憶のためのハードウェアを含むことができる。データ記憶媒体は、上述した本情報の記録、またはそのような製品にアクセスすることができるメモリアクセスデバイスを含む任意の製品を含むことができる。
[0055] 本明細書では、用語「モジュール」とは、作動的に接続されている電気成分の任意の組立物および/または一式のことを指し、例えば、メモリ、処理装置、電気トレース、光コネクタ、ソフトウェア(ハードウェアで実行する)、および/または同種のものを含むことができる。例えば、処理装置中で実行されるモジュールは、ハードウェアに基づくモジュール(例えばフィールドプログラマブルゲートアレイ[FPGA]、特定用途向け集積回路[ASIC]、デジタル信号プロセッサ[DSP])および/またはモジュールと関連する1つもしくは複数の特定の機能を遂行することができるソフトウェアに基づくモジュール(例えば、メモリに保存されているおよび/または処理装置で実行されるコンピュータコードのモジュール)の任意の組み合わせであることができる。
[0056] コンピュータ読み込み可能な媒体にデータ、プログラミングまたは他の情報を「記録する」とは、当業者に公知の任意のそのような方法を使用して情報を保存するプロセスのことを指す。保存されている情報にアクセスするために使用される手段に基づいて、任意の簡便なデータ記憶構造を選ぶことができる。様々なデータ処理装置プログラムおよび形式を使用して、例えば文書処理テキストファイル、データベース形式等を記憶させることができる。
[0057] 「処理装置」または「コンピューティング手段」は、必要となる機能を遂行することになる任意のハードウェアおよび/またはソフトウェアの組み合わせに参照を付す。例えば、適当な処理装置は、電子制御装置、メインフレーム、サーバまたはパーソナルコンピュータ(卓上または携帯用)などの形態で利用可能なプログラム可能なデジタルマイクロプロセッサであることができる。処理装置がプログラム可能な場合、適当なプログラミングは、遠隔地から処理装置、または以前に保存したコンピュータプログラム製品(磁気、光学または固体素子デバイスを使用するにせよ、携帯型もしくは固定のコンピュータ読み込み可能な記憶媒体など)へと通信することができる。例えば、磁気媒体または光ディスクは、プログラミングを保有することができ、それに対応するステーションで各処理装置と通信する適当な読取機により読み取ることができる。
[0058] 「試験サンプル」は、1つまたは複数の細胞のサンプル、好ましくは対象から得られた組織サンプル(例えば経気管支生検[TBB]サンプルなど、肺組織サンプル)である。いくつかの実施形態において、試験サンプルは、当業者に公知の任意の手段により得られる生検サンプルである。特定の実施形態において、試験サンプルは、ビデオ支援胸腔鏡下手術(VATS);気管支肺胞洗浄(BAL);経気管支生検(TBB);または凍結経気管支生検により得られるサンプルである。いくつかの実施形態において、試験サンプルは、患者が示す臨床徴候および症状(例えば、息切れ[一般に、労作により悪化する]、乾性咳)、ならびに、任意選択により1つまたは複数の画像試験の結果(例えば胸部X線、コンピュータ断層撮影[CT])、肺機能試験(例えば、肺活量測定、酸素測定、運動負荷試験)、肺組織分析(例えば、気管支鏡検査、気管支肺胞洗浄、外科生検により得られるサンプルの組織学的および/または細胞学的分析)に基づいて、肺疾患、例えばILDの疑いがある患者から得られる。
[0059] 「遺伝子シグネチャー」は、遺伝子発現パターン(すなわち、1つまたは複数の遺伝子またはその断片の発現レベル)であり、いくつかの特徴または表現型の指標となる。いくつかの実施形態において、遺伝子シグネチャーとは、遺伝子、複数の遺伝子、遺伝子の断片または1つもしくは複数の遺伝子の複数の断片の発現(および/または発現の欠如)のことを指し、発現および/または発現の欠如は、UIP、非UIP、喫煙者状態もしくは非喫煙者状態の指標となる。
[0060] 本明細書では、「喫煙者である」は、煙草を現在吸う対象もしくは過去に煙草を吸っていた人または煙草を現在吸うもしくは過去に煙草を吸っていた人の遺伝子シグネチャーを有する人のことを指すことを意味する。
[0061] 本明細書では「バリアント」とは、本発明の分類器のトレーニングの間に使用される特性を記述するために使用される場合、選択的スプライスバリアントのことを指す。
[0062] 本明細書では、「突然変異」とは、本発明の分類器のトレーニングの間に使用される特性を記述するために使用される場合、公知の正常な参照配列からの配列の逸脱のことを指す。いくつかの実施形態において、逸脱は、UniGeneデータベース(The NCBIハンドブック、Bethesda(MD):米国バイオテクノロジー情報センター;2003年にある、Pontius JU, Wagner L, Schuler GD. UniGene:a unified view of the transcriptome. 、本明細書に組み込む)、RefSeq(The NCBIハンドブック[インターネット]、Bethesda (MD): 国立医学図書館(US)、米国バイオテクノロジー情報センター;2002年10月、第18章、参照配列(RefSeq)プロジェクト、ワールドワイドウェブアドレス:ncbi.nlm.nih.gov/refseq/で利用可能)、Ensembl(EMBL、ワールドワイドウェブアドレス:ensembl.org/index.htmlで利用可能)、および同種のものなど公的に利用可能なデータベースによる、受理された天然の遺伝子配列からの逸脱である。いくつかの実施形態において、突然変異は、参照配列に存在する配列残基への付加、欠失または置換を含む。
[0063] 省略形には、以下がある:HRCT、高分解能コンピュータ断層撮影;VATS、ビデオ支援胸腔鏡下手術;SLB、外科的肺生検;TBB、経気管支生検;RB、呼吸細気管支炎;OP、器質化肺炎、DAD、びまん性肺胞損傷、CIF/NOC、分類されていない慢性間質性線維症;MDT、多くの専門家のチーム;CV、交差検定;LOPO、リーブワンペイシェントアウト;ROC、受信者動作特性;AUC、曲線下面積;RNASeq、次世代配列決定技術によるRNA配列決定;NGS、次世代配列決定技術;H&E、ヘマトキシリンエオジン;FDR、偽発見率;IRB、施設内倫理委員会;ATS、米国胸部学会;COPD、慢性閉塞性肺疾患;KEGG、Kyoto Encyclopedia of Genes and Genomes;CI、信頼区間
[0064] 値の範囲が提供される場合、その範囲の上限下限間の間にある各値は、文脈に別段の明確な記載がない限り下限の単位の10分の1まで本発明に包含され、他の任意の記載されている値またはその記載されている範囲の間にある値も、本発明に包含されるものと理解される。これらのより狭い範囲の上限下限は、そのより狭い範囲にそれぞれ独立に含まれてもよく、また本発明に包含され、記載されている範囲内で特に除外された任意の境界に制約される。記載されている範囲が境界の一方または両方を含む場合、その含まれている境界のいずれか一方または両方を除外した範囲も、本発明に含まれる。本明細書では、「約」は、指示した値の±10%を意味する。
[0065] UIPを他のILDサブタイプと識別する分子シグネチャーを使用する方法および/またはシステムを本明細書に開示する。専門家の病理学が得られないサンプルからのUIPの正確な診断は、診断を加速し、したがって治療の決定を容易にし、患者に対する手術危険度および医療制度の費用を減少させることにより、ILD患者に恩恵をもたらすことになる。
[0066] また、対象の喫煙者もしくは非喫煙者状態を使用して、分子シグネチャーを使用して他のILDサブタイプからのUIPの識別を改善する方法および/またはシステムを本明細書に開示する。
[0067] したがって、本明細書に開示する方法および/またはシステムは、臨床的もしくは人口統計学的情報の予備知識なしに高次元転写データに基づいてUIPを非UIPパターンと識別することができる分類器を提供する。
[0068] いくつかの実施形態において、本発明は、表5、7、8、9、10、11もしくは12のいずれかに示される1つもしくは複数の配列もしくはその断片、もしくは表5、7、8、9、10、11および12のそれぞれからの少なくとも1つの配列もしくはその断片を含むかまたはそれらからなる分類器を使用してUIPを非UIPと識別する方法を提供する。いくつかの実施形態において、本発明は、表5、7、8、9、10、11および12のいずれか1つもしくは複数もしくは全てに提供される配列のうち少なくとも1、2、3、4、5、6、7、8、9、10個以上を含むかまたはそれらからなる分類器を使用するそのような方法を提供する。例えば、いくつかの実施形態において、本発明は、表5、7、8、9、10、11および12のいずれか1つもしくは複数もしくは全てに提供される配列を少なくとも11、12、13、14、15、20、30、50、100、150、200、250、300個以上を含むかまたはそれらからなる分類器を使用するそのような方法を提供し、その分類器は、その間にある全ての整数(例えば、16、17、18、19、21、22、23、24、25個の配列等)および範囲(例えば、表5、7、8、9、10、11および12のいずれか1つもしくは複数もしくは全ての約1〜10個の配列、約10〜15個の配列、10〜20個の配列、5〜30個の配列、5〜50個の配列、10〜100個の配列、50〜200個の配列等)を含む。
[0069] いくつかの特定の実施形態において、本発明は、以下の配列もしくはその断片の1つもしくは複数を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0070] いくつかの実施形態において、本発明は、以下の配列のうち2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;または21個を任意の組み合わせで含むかまたはそれらからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の任意の組み合わせ。特定の態様において、そのような分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0071] いくつかの実施形態において、本発明は、以下の配列の全てを含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0072] いくつかの特定の実施形態において、本発明は、以下の配列もしくはその断片の1つもしくは複数を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)HMCN2、3)ADAMTSL1、4)CD79B、5)KEL、6)KLHL14、7)MPP2、8)NMNAT2、9)PLXDC1、10)CAPN9、11)TALDO1、12)PLK4、13)IGHV3−72、14)IGKV1−9および15)CNTN4。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0073] いくつかの実施形態において、本発明は、以下の配列のうち2;3;4;5;6;7;8;9;10;11;12;13;もしくは14個を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)HMCN2、3)ADAMTSL1、4)CD79B、5)KEL、6)KLHL14、7)MPP2、8)NMNAT2、9)PLXDC1、10)CAPN9、11)TALDO1、12)PLK4、13)IGHV3−72、14)IGKV1−9および15)CNTN4。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0074] いくつかの実施形態において、本発明は、以下の配列を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)HMCN2、3)ADAMTSL1、4)CD79B、5)KEL、6)KLHL14、7)MPP2、8)NMNAT2、9)PLXDC1、10)CAPN9、11)TALDO1、12)PLK4、13)IGHV3−72、14)IGKV1−9および15)CNTN4。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0075] いくつかの特定の実施形態において、本発明は、HLA−F(配列番号1)もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、1)HLA−F(配列番号:1)と、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0076] いくつかの特定の実施形態において、本発明は、HMCN2もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、HMCN2および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0077] いくつかの特定の実施形態において、本発明は、ADAMTSL1もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、ADAMTSL1および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0078] いくつかの特定の実施形態において、本発明は、CD79Bもしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、CD79Bおよび1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0079] いくつかの特定の実施形態において、本発明は、KELもしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、KELおよび1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0080] いくつかの特定の実施形態において、本発明は、KLHL14もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、KLHL14および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0081] いくつかの特定の実施形態において、本発明は、MPP2もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、MPP2および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0082] いくつかの特定の実施形態において、本発明は、NMNAT2もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、NMNAT2および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0083] いくつかの特定の実施形態において、本発明は、PLXDC1もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、PLXDC1および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0084] いくつかの特定の実施形態において、本発明は、CAPN9もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、CAPN9および
1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0085] いくつかの特定の実施形態において、本発明は、TALDO1もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、TALDO1および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0086] いくつかの特定の実施形態において、本発明は、PLK4もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、PLK4および
1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0087] いくつかの特定の実施形態において、本発明は、IGHV3−72もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、IGHV3−72および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0088] いくつかの特定の実施形態において、本発明は、IGKV1−9もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、IGKV1−9および1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0089] いくつかの特定の実施形態において、本発明は、CNTN4もしくはその断片を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:そのような実施形態において、本方法は、CNTN4および
1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)の少なくとも1つを含む分類器を使用する。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有する。
[0090] いくつかの実施形態において、本発明は、以下の配列のうち2;3;4;5;6;7;8;9;10;11;12;13;14;15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、もしくは35個を含むもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)、22)DES(配列番号:22)、23)HMCN2、24)ADAMTSL1、25)CD79B、26)KEL、27)KLHL14、28)MPP2、29)NMNAT2、30)PLXDC1、31)CAPN9、32)TALDO1、33)PLK4、34)IGHV3−72、35)IGKV1−9及び36)CNTN4。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。
[0091] いくつかの実施形態において、本発明は、以下の配列の全てを含むかもしくはそれからなる分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供する:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)、22)DES(配列番号:22)、23)HMCN2、24)ADAMTSL1、25)CD79B、26)KEL、27)KLHL14、28)MPP2、29)NMNAT2、30)PLXDC1、31)CAPN9、32)TALDO1、33)PLK4、34)IGHV3−72、35)IGKV1−9及び36)CNTN4。特定の態様において、分類器は、1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子を含有することができる。他の態様において、分類器は、これらの遺伝子のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含むことができる。いくつかの実施形態において、本発明は、本明細書に記載される分類器を使用してUIPを非UIPと識別する方法および/またはシステムを提供し、その方法は、対象を喫煙者または非喫煙者に分類する分類器を実装する工程をさらに含む。そのような喫煙者状態の分類を、任意選択によりUIP対非UIP分類器を実装するのに先立って実装することができ、または喫煙者状態の分類工程を、本発明のUIP対非UIP分類器のトレーニング(例えば分類器トレーニングモジュールを使用する)において使用される共変量として組み込むことができる。
[0092] いくつかの実施形態において、代わりに、またはさらに、本明細書に記載される分類器を使用してUIPを非UIPと識別する方法および/またはシステムは、UIP対非UIP分類器のトレーニング(例えば分類器トレーニングモジュールを使用する)または実装の間に喫煙者状態のバイアスの影響を受けやすい特定の遺伝子またはそのバリアントに対する差異的重み付けを除外するまたは割り当てる工程をさらに含む。本明細書では、「喫煙者状態の偏り」とは、非喫煙者患者において、UIP対非UIP患者において差異的に発現されるが、喫煙者である(または、喫煙者であった)UIP対非UIP患者において検出可能に差異的に発現されない遺伝子またはそのバリアントのことを指す。
[0093] いくつかの実施形態において、本発明の方法および/またはシステムは、少なくとも第1および第2の分類器を含む段階的分類器を含み、第1の分類器は、喫煙者を非喫煙者と区別する遺伝子シグネチャーを認識するためにトレーニングされ(例えば分類器トレーニングモジュールを使用する)、第2の分類器は、喫煙者または非喫煙者それぞれにおいてUIP対非UIPを区別するためにトレーニングされる(例えば分類器トレーニングモジュールを使用する)。
[0094] いくつかの実施形態において、本発明の方法および/またはシステムは:
試験サンプル(例えば肺組織)から核酸(例えば、RNA、例えばトータルRNAなど)を抽出する工程と;
核酸を増幅して、発現している核酸ライブラリを作製する(例えば、cDNA[任意選択により標識cDNA]のポリメラーゼ連鎖反応媒介増幅による、そのcDNAは、逆転写[RT−PCR]により1つまたは複数のRNAサンプルから作製することができる)工程と;
アレイ(例えば、マイクロアレイ)または直接配列決定(例えば、RNAseq)によって核酸ライブラリに存在する1つまたは複数の核酸の発現を検出する(例えば、RT−PCRによって作製されたcDNA種を測定することによりRNA発現プロファイルを検出する)工程と;
本明細書に記載されるトレーニングした分類器を使用して試験サンプルがUIPかまたは非UIPか決定する工程と
を含む。
[0095] いくつかの実施形態において、本発明の方法および/またはシステムは、喫煙者状態をトレーニング演習に組み込むことをさらに含む。特定の実施形態において、喫煙者状態は、任意選択により以下の方法の1つによって組み込まれる:
(i)喫煙状態を、トレーニング(例えば分類器トレーニングモジュールを使用する)の間UIPまたは非UIP分類器における共変量として使用することによる。
(ii)UIPもしくは非UIP分類器トレーニング(例えば分類器トレーニングモジュールを使用する)の間に、喫煙者状態のバイアスの影響を受けやすい複数の遺伝子を同定し、そのような遺伝子を除外する、または任意選択により、そのようなバイアスの影響を受けにくい遺伝子と異なる重み付けをすることによる。
(iii)喫煙者を非喫煙者と区別する遺伝子シグネチャーを認識するためにトレーニングされる(例えば分類器トレーニングモジュールを使用する)初期分類器を使用して、試験サンプルの遺伝子シグネチャーに基づいて試験サンプルを「喫煙者」または「非喫煙者」に前分類し;次いで、前分類の後に、喫煙者もしくは非喫煙者いずれかにおいてUIP対非UIPを区別するためにトレーニングされた(例えば分類器トレーニングモジュールを使用する)固有の分類器が実装される段階的分類を構築することによる。例えば、前分類器が、試験サンプルが喫煙者由来であると決定する場合、UIP対非UIP分類は、喫煙者由来のUIPおよび非UIPサンプルでトレーニングされた(例えば分類器トレーニングモジュールを使用する)分類器を使用して遂行される。反対に、前分類器が、試験サンプルが非喫煙者由来であると決定する場合、UIP対非UIP分類は、非喫煙者由来のUIPおよび非UIPサンプルでトレーニングされた(例えば分類器トレーニングモジュールを使用する)分類器を使用して遂行される。いくつかの実施形態において、少なくとも部分的には、分類器トレーニングにおいて喫煙者状態のバイアスの影響を受けやすい遺伝子の包含に起因するバックグラウンドノイズの減少により、そのような喫煙者または非喫煙者特異的分類器は、診断能力の改善をもたらす。
[0096] したがって、本発明は、本明細書に開示するように、UIPを非UIPと識別する方法に使用する適当な分類器も提供する。様々な実施形態において、本発明は、UIPを非UIPと識別するのに適当な分類器を提供し、分類器は、専門の病理学者によって決定された1つもしくは複数の組織病理学ラベルに対応するサンプルからのマイクロアレイまたは配列決定データを使用してトレーニングされる(例えば分類器トレーニングモジュールを使用する)。いくつかの実施形態において、サンプルはラベルされたUIPまたは非UIPである。
[0097] いくつかの実施形態において、本発明は、表5、7、8、9、10、11もしくは12のいずれかに示される1つもしくは複数の配列もしくはその断片、もしくは表5、7、8、9、10、11もしくは12のそれぞれからの少なくとも1つの配列もしくはその断片を含むかまたはそれらからなる分類器を示す。いくつかの実施形態において、本発明は、表5、7、8、9、10、11および12のいずれか1つもしくは複数もしくは全てに提供される配列のうち少なくとも1、2、3、4、5、6、7、8、9、10個以上を含むかまたはそれらからなる分類器を提供する。例えば、いくつかの実施形態において、本発明は、表5、7、8、9、10、11もしくは12のいずれか1つもしくは複数もしくは全てに提供される配列を少なくとも11、12、13、14、15、20、30、50、100、150、200、250、300個以上を含むかまたはそれらからなる分類器を提供し、その分類器は、その間にある全ての整数(例えば、16、17、18、19、21、22、23、24、25個の配列等)および範囲(例えば、表5、7、8、9、10、11、もしくは12のいずれか1つもしくは複数もしくは全てからの約1〜10個の配列、約10〜15個の配列、10〜20個の配列、5〜30個の配列、5〜50個の配列、10〜100個の配列、50〜200個の配列等)を含む。一実施形態において、本発明は、表5に提供される全ての配列、表7に提供される全ての配列、表8に提供される全ての配列、表9に提供される全ての配列、表10に提供される全ての配列、表11に提供される全ての配列もしくは表12に提供される全ての配列を含むかまたはそれらからなる分類器を提供する。一実施形態において、本発明は、表5、7、8、9、10、11もしくは12のそれぞれに提供される全ての配列を含むかまたはそれらからなる分類器を提供する。
[0098] いくつかの特定の実施形態において、本発明は、UIPを非UIPと識別するための分類器を提供し、分類器は、以下の配列もしくはその断片の1つもしくは複数を含むかまたはそれらからなる:1)HLA−F(配列番号:1)、2)CDKL2(配列番号:2)、3)GPR98(配列番号:3)、4)PRKCQ(配列番号:4)、5)HLA−G(配列番号:5)、6)PFKFB3(配列番号:6)、7)CEACAM1(配列番号:7)、8)RABGAP1L(配列番号:8)、9)CD274(配列番号:9)、10)PRUNE2(配列番号:10)、11)ARAP2(配列番号:11)、12)DZIP1(配列番号:12)、13)MXRA7(配列番号:13)、14)PTCHD4(配列番号:14)、15)PDLIM3(配列番号:15)、16)CNN1(配列番号:16)、17)NIPSNAP3B(配列番号:17)、18)PAQR7(配列番号:18)、19)ACTG2(配列番号:19)、20)NA(配列番号:20)、21)TIMP2(配列番号:21)および22)DES(配列番号:22)。一実施形態において、分類器は、上記の配列の全22個を含むかまたはそれらからなる。いくつかの実施形態において、本発明はUIPを非UIPと識別するための分類器を提供し、分類器は、上記の22個の配列のうち2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;もしくは21個を含むかまたはそれらからなる。特定の態様において、分類器は1、2、3、4、5、6、7、8個またはより多くの追加の遺伝子もしくはその断片を含有する。他の態様において、分類器は、上記の22個の配列のうち1、2、3、4、5、6、7、8個またはより多くを削除し、任意選択により他の遺伝子を含む。他の態様において、22個の遺伝子のそれぞれは、他の遺伝子のいずれか1つまたは複数、20個までと組み合わせて使用することができる。
組織サンプル
[0099] 対象となる分析または診断方法に使用する肺組織サンプルは、生検サンプル(例えば、ビデオ支援胸腔鏡下手術;VATSにより得られる生検サンプル);気管支肺胞洗浄(BAL)サンプル;経気管支生検;凍結経気管支生検;および同種のものであることができる。分析用の肺組織サンプルは、適当な保存液に入れて提供することができる。
[00100] 組織サンプルは、患者が示す臨床徴候および症状(例えば、息切れ[一般に、労作により悪化する]、乾性咳)、ならびに、任意選択により1つまたは複数の画像試験の結果(例えば胸部X線、コンピュータ断層撮影[CT])、肺機能試験(例えば、肺活量測定、酸素測定、運動負荷試験)、肺組織分析(例えば、気管支鏡検査、気管支肺胞洗浄、外科生検により得られるサンプルの組織学的および/または細胞学的分析)に基づいて、肺疾患、例えばILDの疑いがある患者から得ることができる。
[00101] 肺組織サンプルは、様々な方法のいずれかで処理することができる。例えば、肺組織サンプルは、細胞溶解に供することができる。肺組織サンプルは、RNA保護溶液(RNA分解を阻害する溶液、例えば、RNAのヌクレアーゼ消化を阻害する)中に保存することができ、その後細胞溶解に供することができる。核酸および/またはタンパク質などの構成成分は、肺組織サンプルから濃縮もしくは単離することができ、濃縮もしくは単離された構成成分は、対象となる方法に使用することができる。核酸およびタンパク質などの構成成分を濃縮ならびに単離する方法は当業者に公知であり;任意の公知の方法を使用することができる。発現分析用のRNAを単離する方法は、当業者に記述されている。
発現産物レベルを決定するin vitro方法
[00102] UIP対非UIP分類において観察されるゲノムシグナルをさらに実証するパネルの発現を算定するためのさらなる手法は、多様な生化学アッセイおよび検出方法にわたって強力である。特に、コホートのサブセットについてRNASeqデータを生成し、CV下で能力を評価した。対応させたアレイデータとの能力比較により、RNASeqデータを使用する分類が、マイクロアレイプラットフォームから生成されるデータと類似の能力を実現することが実証された。
[00103] 遺伝子発現産物レベルを決定する一般的な方法は、当業者に公知であり、それだけには限らないが:追加の細胞学的アッセイ、特定のタンパク質もしくは酵素活性のアッセイ、タンパク質もしくはRNAもしくは特定のRNAスプライスバリアントを含めた特定の発現産物のアッセイ、in situハイブリダイゼーション、全もしくは部分的ゲノム発現分析、マイクロアレイハイブリダイゼーションアッセイ、遺伝子発現連鎖分析(SAGE)、酵素結合免疫吸光度アッセイ、質量分析、免疫組織化学、ブロッティング、配列決定、RNA配列決定、DNA配列決定(例えば、RNAから得られるcDNAの配列決定);次世代配列決定、ナノ細孔配列決定、パイロシークエンス、またはナノストリング配列決定の1つもしくは複数を含むことができる。例えば、遺伝子発現産物レベルは、Kim、らに記述される方法によって決定することができる(Lancet Respir Med. 2015 Jun;3(6):473-82、全ての補足を含め、その全体を本明細書に組み込む)。本明細書では、用語「アッセイする」もしくは「検出する」もしくは「決定する」は、遺伝子発現産物レベルの決定に関して互換的に使用され、いずれの場合にも、遺伝子発現産物レベルを決定する上記の方法は、遺伝子発現産物レベルを検出またはアッセイするのに適当であると考えられる。遺伝子発現産物レベルは、トータルmRNAまたはグリセルアルデヒド3リン酸デヒドロゲナーゼもしくはチューブリンを含むがこれに限定されない特定の遺伝子の発現レベルなどの内部標準に対して標準化することができる。
[00104] 様々な実施形態において、サンプルは、組織サンプル(例えば、TBBサンプルなど肺組織サンプル)から採取される細胞を含む。細胞は、当業者に公知のまたは本明細書に開示される標準的な技術を使用してサンプルから採取することができる。例えば、一実施形態において、細胞は、細胞サンプルを遠心分離し、ペレットになった細胞を再懸濁することによって採取される。細胞は、リン酸緩衝食塩水(PBS)などの緩衝液に再懸濁することができる。細胞懸濁液を遠心分離して細胞ペレットを得た後、細胞を溶解して、核酸、例えば、メッセンジャーRNAを抽出することができる。対象から得られるサンプルは全て、どんな種類のさらなる処理を受けるものも含めて、対象から得られると考えられる。
[00105] 一実施形態において、サンプルは、本明細書に記載のとおり遺伝子発現産物の検出を遂行される前にさらに処理される。例えば、細胞または組織サンプル中のmRNAは、サンプルの他の構成成分から分離することができる。mRNAは天然の環境にないので、サンプルを濃縮および/または精製して、非天然の状態にmRNAを単離することができる。例えば、研究は、in vivoにおけるmRNAの高次構造が、同じ配列のin vitro構造と異なることを示した(例えば、Rouskin et al. [2014]Nature 505, pp. 701-705を参照のこと、全ての目的のためにその全体を本明細書に組み込む)。
[00106] 一実施形態においてサンプル由来のmRNAは、合成DNAプローブとハイブリダイズされ、いくつかの実施形態において合成DNAプローブは検出部分(例えば、検出可能な標識、捕捉配列、バーコードレポート配列)を含む。したがって、これらの実施形態において、非天然のmRNA−cDNA複合体を最終的に製作し、使用して、遺伝子発現産物を検出する。別の実施形態において、サンプル由来のmRNAは、検出可能な標識、例えば、フルオロフォアで直接標識される。さらなる実施形態において、非天然の標識mRNA分子は、cDNAプローブにハイブリダイズされ、複合体が検出される。
[00107] 一実施形態において、mRNAが、サンプルから一度得られたら、ハイブリダイゼーション反応において相補的DNA(cDNA)に変換されるかまたは1つもしくは複数のcDNAプローブと共にハイブリダイゼーション反応に使用される。cDNAは、in vivoで存在せず、したがって非天然の分子である。さらにまた、cDNA−mRNAハイブリッドは合成であり、in vivoで存在しない。cDNAは、in vivoで存在しないことに加えて、デオキシリボ核酸を含むがリボ核酸を含まないので、cDNAは必然的にmRNAと異なる。cDNAは、例えば、ポリメラーゼ連鎖反応(PCR)または当分野の技術者に公知の他の増幅方法により次いで増幅される。例えば、利用可能な他の増幅方法には、リガーゼ連鎖反応(LCR)(Wu and Wallace, Genomics, 4:560[1989]、Landegren et al., Science, 241:1077(1988)、全ての目的のためにその全体を参照により組み込む)、転写増幅(Kwoh et al., Proc. Natl. Acad. Sci. USA, 86:1173[1989]、全ての目的のためにその全体を参照により組み込む)、全ての目的のためにその全体を参照により組み込む自家持続配列複製法(Guatelli et al., Proc. Nat. Acad. Sci. USA, 87:1874[1990]、全ての目的のためにその全体を参照により組み込む)、および核酸配列ベース増幅(NASBA)がある。PCR増幅用のプライマーを選択するためのガイドラインは、当分野の技術者に公知である。例えば、全ての目的のためにその全体を参照により組み込むMcPhersonら、PCR Basics:From Background to Bench、Springer−Verlag、2000年を参照のこと。この増幅反応の産物、すなわち、増幅cDNAも、必然的に非天然の産物である。第1に、上述のとおり、cDNAは非天然の分子である。第2に、PCRの場合、増幅プロセスは、出発材料のあらゆる個々のcDNA分子に対し何億個ものcDNAコピーを作るのに役立つ。生成されるコピー数は、in vivoで存在するmRNAのコピー数とは全く異なる。
[00108] 一実施形態において、cDNAは、(例えば、アダプタ特異的プライマーを使用して)断片に追加のDNA配列(例えば、アダプタ、レポータ、捕捉配列または部分、バーコード)を導入するプライマーによって増幅される、またはmRNAもしくはcDNA遺伝子発現産物配列は、追加の配列(例えば、アダプタ、レポータ、捕捉配列または部分、バーコード)を含むcDNAプローブに直接ハイブリダイズされる。追加の配列を導入し、非天然のハイブリッドを形成させることにより、増幅および/またはcDNAプローブへのmRNAのハイブリダイゼーションは、したがって非天然の一本鎖cDNA、もしくはmRNAから非天然の二本鎖分子を作るのに役立つ。さらに、当分野の技術者に公知であるように、増幅手順には、それに付随する誤差率がある。したがって、増幅はcDNA分子にさらなる修飾を導入する。一実施形態において、アダプタ特異的プライマーによる増幅の間、検出可能な標識、例えば、フルオロフォアが、一本鎖cDNA分子に付加される。したがって増幅は、少なくとも(i)cDNAはin vivoで存在せず、(i)アダプタ配列がcDNA分子の末端に付加されて、in vivoで存在しないDNA配列が作られ、(ii)増幅に付随する誤差率のために、in vivoで存在しないDNA配列をさらに作られ、(iii)天然に存在するそれと比較してcDNA分子の構造が異なり、(iv)cDNA分子への検出可能な標識の化学的付加のため、天然に存在しないDNA複合体を作るのにも役立つ。
[00109] いくつかの実施形態において、対象の遺伝子発現産物の発現は、非天然のcDNA分子の検出によって核酸レベルで検出される。
[00110] 本明細書に記載される遺伝子発現産物は、対象とする核酸配列のいずれかの全長もしくは部分的配列、または逆転写反応においてin vitroで合成的に得られるそれらの非天然のcDNA産物を含めたRNAを含む。用語「断片」とは、少なくとも10、15、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1200もしくは、1500個の隣接するヌクレオチド、または本明細書に開示する完全長遺伝子発現産物ポリヌクレオチドに存在するヌクレオチド数までを一般に含むポリヌクレオチドの一部のことを指すものとする。遺伝子発現産物ポリヌクレオチドの断片は、少なくとも15、25、30、50、100、150、200もしくは250個の隣接するアミノ酸、または本発明の完全長遺伝子発現産物タンパク質に存在するアミノ酸の総数までを一般にコードすることになる。
[00111] 特定の実施形態において、遺伝子発現プロファイルは、全トランスクリプトームのショットガン配列決定により得ることができ(「WTSS」または「RNAseq」;例えば、Ryan et al BioTechniques 45: 81- 94を参照のこと)、これは、サンプルのRNA含有量についての情報を得るためにハイスループット配列決定技術を使用してcDNAを配列決定する。一般論として、cDNAがRNAから作られ、cDNAが増幅され、増幅産物が配列決定される。
[00112] 増幅後に、cDNAは、任意の簡便な方法を使用して配列決定することができる。例えば、断片は、Illuminaの可逆的ターミネーター法、Rocheのパイロシークエンス法(454)、Life Technologiesのライゲーションによる配列決定(SOLiDプラットフォーム)またはLife TechnologiesのIon Torrentプラットフォームを使用して配列決定することができる。そのような方法の例は、以下の参照:Margulies et al(Nature 2005 437: 376-80);Ronaghi et al(Analytical Biochemistry 1996 242: 84-9);Shendure(Science 2005 309: 1728);Imelfort et al(Brief Bioinform. 2009 10:609-18);Fox et al(Methods Mol Biol. 2009;553:79-108);Appleby et al(Methods Mol Biol. 2009;513: 19-39)、およびMorozova(Genomics. 2008 92:255-64)に記述されており、それらを、方法の一般的な説明ならびに工程のそれぞれに関する全ての出発産物、試薬および最終産物を含めた方法の特定の工程について参照により組み込む。明らかなように、選択した次世代配列決定プラットフォームに適合するフォワードおよびリバース配列決定プライマー部位を、増幅工程の間に断片の末端に付加することができる。
[00113] 他の実施形態において、産物はナノ細孔配列決定を使用して配列決定することができる(例えば、Soni et al Clin Chem 53: 1996-2001 2007に記述される、またはOxford Nanopore Technologiesに記述される)。ナノ細孔配列決定は、単一分子配列決定技術であり、DNAの単一分子は、ナノ細孔を通過する際に直接配列決定される。ナノ細孔は、ほぼ直径1nm程度の小さい穴である。導電性流動体へのナノ細孔の浸漬およびそれを跨ぐ電位(電圧)の適用により、ナノ細孔を通るイオンの伝導のため、微弱電流を得られる。流れる電流の量は、ナノ細孔のサイズおよび形状の影響を受ける。DNA分子がナノ細孔を通過するときに、DNA分子上の各ヌクレオチドは異なる程度でナノ細孔をふさぎ、異なる程度でナノ細孔を通る電流の大きさを変化させる。したがって、DNA分子がナノ細孔を通過するときのこの電流の変化が、DNA配列のリードを表す。ナノ細孔配列決定技術については、米国特許第5,795,782号、第6,015,714号、第6,627,067号、第7,238,485号および第7,258,838号ならびに米国特許出願公開第2006003171号および第20090029477号に開示されている。
[00114] いくつかの実施形態において、対象とする方法の遺伝子発現産物はタンパク質であり、特定の生体サンプル中のタンパク質の量は、サンプルのコホートから得られるタンパク質データから得られる分類器を使用して分析される。タンパク質の量は:酵素結合免疫吸着アッセイ(ELISA)、質量分析、ブロッティングまたは免疫組織化学のうち1つもしくは複数によって決定することができる。
[00115] いくつかの実施形態において、遺伝子発現産物マーカーおよび選択的スプライシングマーカーは、例えば、Affymetrixアレイ、cDNAマイクロアレイ、オリゴヌクレオチドマイクロアレイ、スポットしたマイクロアレイ、またはBiorad、Agilent、もしくはEppendorf製の他のマイクロアレイ製品を使用するマイクロアレイ分析によって決定することができる。マイクロアレイは、1回の実験でアッセイできる多数の遺伝子または選択的スプライスバリアントを含有できるので、特別な利点を提供する。いくつかの場合において、マイクロアレイデバイスは、全ヒトゲノムもしくはトランスクリプトームまたはその大量の画分を含有することができるので、遺伝子発現パターン、ゲノム配列もしくは選択的スプライシングの包括的な評価が可能になる。マーカーは、Sambrook Molecular Cloning a Laboratory Manual 2001年ならびにBaldi,P.およびHatfield,W.G.、DNA Microarrays and Gene Expression 2002年に記載の標準的な分子生物学およびマイクロアレイ分析技術を使用して見出すことができる。
[00116] マイクロアレイ分析は、当業者に公知の方法を使用して生体サンプル(例えば生検または細針吸引液)から核酸を抽出し、精製することにより一般に始まる。発現ならびに選択的スプライシング分析の場合、DNAからRNAを抽出および/または精製することが有利になり得る。tRNAならびにrRNAなど他の型のRNAからmRNAを抽出および/または精製することがさらに有利になり得る。
[00117] 精製した核酸は、例えば逆転写、ポリメラーゼ連鎖反応(PCR)、ライゲーション、化学反応もしくは他の技術により、蛍光標識、放射性核種、またはビオチン、ジゴキシゲニン、もしくはジゴキシンなどの化学的標識でさらに標識することができる。標識は、直接または結合段階をさらに必要とする場合がある間接的であることもできる。結合段階は、例えばアミノアリル−UTPならびにNHSアミノ反応性色素(シアニン色素など)を使用してハイブリダイゼーションに先立って、または例えば、ビオチンおよび標識ストレプトアビジンを使用して後に、起こすことができる。一例として、修飾ヌクレオチド(例えば1 aaUTP:4 TTP比)が、正常ヌクレオチドと比較してより低い率で酵素的に付加され、一般に60塩基毎に1つ得られる(分光光度計で測定される)。aaDNAは、例えばカラムまたは透析濾過デバイスにより次いで精製することができる。アミノアリル基は、核酸塩基に結合している長いリンカー上のアミン基であり、それは反応性標識(例えば蛍光色素)と反応する。
[00118] 標識サンプルは、ドデシル硫酸ナトリウム(SDS)、SSC、硫酸デキストラン、ブロッキング薬剤(COT1 DNA、サケ精子DNA、仔ウシ胸腺DNA、PolyAまたはPolyTなど)、デンハルト液、フォルマミン(formamine)、またはそれらの組み合わせを含有することができるハイブリダイゼーション溶液と次いで混合できる。
[00119] ハイブリダイゼーションプローブは、可変長のDNAもしくはRNAの断片であり、それを使用してDNAまたはRNAサンプル中にあるプローブ内の配列と相補的なヌクレオチド配列(DNA標的)の存在を検出する。その塩基配列が、プローブと標的の間の相補性のためプローブ−標的塩基対合を可能にするプローブは、それにより一本鎖核酸(DNAまたはRNA)にハイブリダイズする。標識プローブは、単一DNA鎖に先ず変性され(加熱またはアルカリ条件による)、次いで標的DNAにハイブリダイズされる。
[00120] 標的配列へのプローブのハイブリダイゼーションを検出するために、プローブは、分子マーカーでタグ付けされ(または、標識され);一般に使用されるマーカーは、32Pまたはジゴキシゲニンであり、ジゴキシゲニンは非放射性抗体に基づくマーカーである。プローブに対して中程度〜高い配列相補性(例えば少なくとも70%、80%、90%、95%、96%、97%、98%、99%またはより高い相補性)を有するDNA配列またはRNA転写産物は、オートラジオグラフィーもしくは他の画像化技術でハイブリダイズしたプローブを可視化することにより、次いで検出される。中程度または高い相補性を持つ配列の検出は、どれくらいストリンジェントなハイブリダイゼーション条件が適用されるかによって決まり;高いハイブリダイゼーション温度およびハイブリダイゼーション緩衝液の低い塩などの強いストリンジェンシーは、極めて類似している核酸配列同士のハイブリダイゼーションだけを可能にし、一方でより低い温度ならびに高い塩などの弱いストリンジェンシーは、配列の類似性が低い場合でもハイブリダイゼーションを可能にする。DNAマイクロアレイに使用されるハイブリダイゼーションプローブとは、コーティングされたスライドガラスなどの不活性表面に共有結合されたDNAまたは遺伝子チップのことを指し、そこに移動性のcDNA標的がハイブリダイズされる。
[00121] アレイ上のプローブにハイブリダイズすることになる標的核酸を含む混合物を、加熱または化学的手段により変性させ、マイクロアレイの開口部に添加することができる。穴を次いで密封し、マイクロアレイを、例えば、マイクロアレイが回転によりまたは混合器内で混合されるハイブリダイゼーションオーブン内でハイブリダイズさせることができる。終夜ハイブリダイゼーションさせた後、非特異的結合を(例えばSDSおよびSSCで)洗い流すことができる。マイクロアレイを、次いで乾燥させ、色素を励起するレーザーおよび色素による放射を測定する検出器を備える機械でスキャンすることができる。画像に鋳型グリッドを重層することができ、特性(例えばいくつかのピクセルを含む特性)の強度を定量化することができる。
[00122] 様々なキットを使用して対象とする方法の核酸を増幅し、プローブを生成することができる。本発明に使用することができるキットの例には、それだけには限らないが、Nugen WT−Ovation FFPEキット、Nugen Exon ModuleおよびFrag/Labelモジュールを含むcDNA増幅キットがある。NuGEN WT−Ovation(商標)FFPEシステムV2は、FFPEサンプルから得られる小さく分解したRNAの膨大なアーカイブに対して広範な遺伝子発現分析を行うことを可能にする全トランスクリプトーム増幅システムである。システムは、わずか50ngのトータルFFPE RNAの増幅に必要な試薬および手順から構成される。手順は、qPCR、サンプルのアーカイブ化、断片化および標識に使用することができる。増幅したcDNAは、NuGENのFL−Ovation(商標)cDNA Biotin Module V2を使用してGeneChip(商標)3’発現アレイ分析用として2時間未満で断片化し、標識することができる。Affymetrix GeneChip(商標)Exon and Gene STアレイを使用する分析の場合、増幅したcDNAを、WT−Ovation Exon Moduleで使用し、次いでFL−Ovation(商標)cDNA Biotin Module V2を使用して断片化し、標識することができる。Agilentアレイでの分析の場合、増幅したcDNAは、NuGENのFL−Ovation(商標)cDNA Fluorescent Moduleを使用して断片化し、標識することができる。
[00123] いくつかの実施形態において、Ambion WT−発現キットを使用することができる。Ambion WT−発現キットは、独立したリボソームRNA(rRNA)除去工程なしにトータルRNAの直接増幅を可能にする。Ambion(商標)WT Expressionキットにより、トータルRNA 50ng程度のサンプルを、Affymetrix(商標)GeneChip(商標)ヒト、マウス、およびラットExon and Gene 1.0 STアレイで分析することができる。より少ない投入RNAの必要量およびAffymetrix(商標)方法とTaqMan(商標)リアルタイムPCRデータとの高い一致に加えて、Ambion(商標)WT Expressionキットは、感度の有意な増加をもたらす。例えば、Ambion(商標)WT Expressionキットによるシグナル対ノイズ比の増加の結果として、バックグラウンドより高く検出されるより多数のプローブセットをエキソンレベルで得ることができる。Ambion(商標)−発現キットは、さらなるAffymetrix標識キットと組み合わせて使用することができる。いくつかの実施形態において、AmpTec Trinucleotide Nano mRNA Amplification kit(6299-A15)を対象とする方法に使用することができる。ExpressArt(商標)TRinucleotide mRNA amplification Nano kitは、投入トータルRNA 1ng〜700ngの広い範囲に適している。投入トータルRNAの量およびaRNAの必要な収量によって、>10μgの範囲のaRNA収量に、1回転(投入>トータルRNA 300ng)または2回転(最小投入量、トータルRNA 1ng)を使用することができる。AmpTecの登録商標のTRinucleotideプライミング技術により、rRNAに対する選択と組み合わせてmRNAの優先的な増幅(普遍的な真核生物3'-poly(A)配列の影響を受けない)を得られる。AmpTec Trinucleotide Nano mRNA Amplification kitについてのより多くの情報は、www.amptec.com/products.htmで得ることができる。このキットは、cDNA変換キットおよびAffymetrix標識キットと組み合わせて使用することができる。
[00124] 生データは、例えば、バックグラウンド強度を差し引き、その後各チャネルで等しい特性の合計強度または参照遺伝子の強度のいずれかをもたらす強度で割ることにより次いで標準化することができ、次いで、全ての強度についてt値を算出することができる。より高度な方法には、Affymetrixチップ用などのz−比、loessおよびlowess回帰ならびにRMA(robust multichip分析)がある。
[00125] いくつかの実施形態において、上記の方法を使用して転写産物発現レベルを決定し、それにより対象が喫煙者か非喫煙者か識別するための分類器をトレーニングする(例えば分類器トレーニングモジュールを使用する)ことができる。いくつかの実施形態において、上記の方法を使用して転写産物発現レベルを決定し、それにより対象がUIPか非UIPか識別するための分類器をトレーニングする(例えば分類器トレーニングモジュールを使用する)ことができる。
データ分析
(i)正常に対するサンプルの比較
[00126] いくつかの実施形態において、対象由来のサンプル(「試験サンプル」)に対して遂行した分子プロファイリングの結果を、正常であることが公知のまたはその疑いがある生体サンプル(「正常サンプル」)と比較することができる。いくつかの実施形態において、正常サンプルは、評価段階でILD、もしくは症状を含まないもしくは含まないと思われる、または評価段階で1つもしくは複数のILDに対する分子プロファイリングアッセイにおいて陰性を試験することになったサンプルである。いくつかの実施形態において、正常サンプルは、どんなILDも含まない、もしくは含まないと思われるものであり、または分子プロファイリングアッセイにおいてどんなILDについても陰性を試験することになったサンプルである。正常サンプルは、試験した対象と異なる対象または同じ対象由来であることができる。いくつかの場合において、正常サンプルは、例えば試験した対象などの対象から得られる肺組織サンプルである。正常サンプルは、試験サンプルと同時にまたは異なるときにアッセイすることができる。いくつかの実施形態において、正常サンプルは、非喫煙者由来であることが公知であるまたはその疑いがあるサンプルである。特定の実施形態において、正常サンプルは、非UIPであることが少なくとも2名の専門の病理学者により確認されたサンプルである。特定の実施形態において、正常サンプルは、非IPFであることが少なくとも2名の専門の病理学者により確認されたサンプルである。
[00127] 試験サンプルに対するアッセイの結果は、公知の病状(例えば、正常、選択されたILD[例えば、IPF、NSIP等]に罹患している、喫煙者、非喫煙者)を有するサンプルに対する同じアッセイの結果と比較することができる。いくつかの場合において、正常サンプルに対するアッセイの結果は、データベースまたは参照のものである。いくつかの場合において、正常サンプルに対するアッセイの結果は、当業技術者に公知のまたは一般に受け入れられる値もしくはその範囲の値である。いくつかの場合において、比較は定性的である。他の場合において、比較は定量的である。いくつかの場合において、定性的または定量的比較は、それだけには限らないが:蛍光値、スポット強度、吸光度値、化学発光シグナル、ヒストグラム、臨界閾値、統計的有意性値、遺伝子産物発現レベル、遺伝子産物発現レベル変化、選択的エキソン使用、選択的エキソン使用の変化、タンパク質レベル、DNA多型、コピー数変動、1つもしくは複数のDNAマーカーもしくは領域の有無の指標、もしくは核酸配列の比較のうち1つもしくは複数を含むことができる。
(ii)結果の評価
[00128] いくつかの実施形態において、分子プロファイリングの結果は、遺伝子産物発現レベルまたは選択的エキソン使用を特定のILDなど特定の表現型もしくは正常状態(normalcy)(例えば疾患または症状がない)と相関させるための当業者に公知の方法を使用して評価される。いくつかの場合において、指定の統計的信頼レベルを決定して、診断信頼レベルを得ることができる。例えば、90%を超える信頼レベルが、ILDの存在または喫煙者もしくは非喫煙者状態の有用な予測手段になり得ると決定することができる。他の実施形態において、程度の差はあるが厳しい信頼レベルを選ぶことができる。例えば、約または少なくとも約50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、または99.9%の信頼レベルを、有用な表現型予測手段として選ぶことができる。得られた信頼レベルは、いくつかの場合において、サンプルの品質、データの品質、分析の品質、使用した具体的な方法、および/または分析した遺伝子発現産物の数と関連する。診断を可能にするための指定の信頼レベルは、偽陽性もしくは偽陰性の期待数および/または費用に基づいて選ぶことができる。指定の信頼レベルを実現するまたは診断力があるマーカーを同定するためのパラメータを選ぶ方法には、それだけには限らないが、受診者動作特性(ROC)曲線分析、二項ROC(binormal ROC)、主成分分析、部分最小二乗法分析、特異値分解、リーストアブソリュートシュリンケージアンドセレクションオペレータ(least absolute shrinkage and selection operator)分析、最少角回帰法、および閾値勾配正則化法(threshold gradient directed regularization method)がある。
(iii)データ分析
[00129] 生の遺伝子発現レベルならびに選択的スプライシングデータは、データの標準化および/または信頼度を改善するように設計された方法および/またはプロセスの適用によって、いくつかの場合において改善され得る。本開示のいくつかの実施形態において、処理される個々のデータ点が多数のため、データ分析は、本明細書に記載される様々な方法および/または処理の適用のためにコンピュータもしくは他のデバイス、機械もしくは装置を必要とする。「機械学習分類器」とは、コンピュータ使用予測データ構造または方法のことを指し、遺伝子発現プロファイルを特徴付けるために利用される。例えば、マイクロアレイ利用ハイブリダイゼーションアッセイにより得られる特定の発現レベルに対応するシグナルは、発現プロファイルを分類するために分類器に一般に供される。教師あり学習(supervised learning)は、分類器を「トレーニング」して、クラス間の差異を認識し、次いで独立したテストセットに対する分類器の精度を「試験する」ことを一般に含む。新たな、不明なサンプルの場合、分類器を使用して、サンプルが属するクラスを予測することができる。様々な実施形態において、そのようなトレーニングは、例えば、分類器トレーニングモジュールを使用して実現される。
[00130] いくつかの場合において、ロバストマルチアレイ平均法(robust multi-array average)(RMA)を使用して生データを標準化することができる。RMA方法は、いくつかのマイクロアレイに関してそれぞれ対応させた細胞についてバックグラウンド修正強度を計算することにより始められる。バックグラウンド修正値は、Irizarryら、Biostatistics 2003年4月4日(2):249〜64頁に記載のとおり正の数に限定される。バックグラウンド修正の後、バックグラウンド修正した対応させた細胞の各強度の底2の対数を、次いで得る。各入力アレイおよび各プローブ発現値に対してアレイパーセンタイルプローブ値が、全てのアレイパーセンタイル点の平均と置き換えられるクォンタイル標準化法を使用して、各マイクロアレイに対してバックグラウンド修正し、対数変換し、対応させた強度を次いで標準化する。この方法については、Bolstadら、Bioinformatics 2003年により完全に記述されている。次いで、クォンタイル標準化後に、標準化したデータを線形モデルに当てはめて、各マイクロアレイについて各プローブの発現計測を得ることができる。次いで、チューキーのメジアンポリッシュアルゴリズムmedian polish algorithm)(Tukey, J. W.,Exploratory Data Analysis. 1977)を使用して、標準化したプローブセットデータについて対数目盛発現レベルを決定することができる。
[00131] 他の様々なソフトウェアおよび/またはハードウェアモジュールもしくはプロセスを実装することができる。特定の方法において、特性選択およびモデル推定は、glmnetを使用してlassoペナルティを用いるロジスティック回帰により遂行することができる(Friedman J, Hastie T, Tibshirani R. Regularization Paths for Generalized Linear Models via Coordinate Descent. Journal of statistical software 2010; 33(1): 1-22)。生のリードは、TopHatを使用してアラインすることができる(Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics 2009; 25(9): 1105-11.)。遺伝子数は、HTSeq(Anders S, Pyl PT, Huber W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics 2014.)を使用して得ることができ、DESeq(Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-Seq data with DESeq2; 2014)を使用して標準化できる。方法において、上位の特性(Nは、10〜200の範囲にある)を使用して、e1071ライブラリ(Meyer D. Support vector machines: the interface to libsvm in package e1071. 2014.)を使用する線形サポートベクターマシン(SVM)(Suykens JAK, Vandewalle J. Least Squares Support Vector Machine Classifiers. Neural Processing Letters 1999; 9(3): 293-300)をトレーニングした。信頼区間は、pROCパッケージを使用して計算することができる(Robin X, Turck N, Hainard A, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. BMC bioinformatics 2011; 12: 77)
[00132] 加えて、データをフィルタリングして、疑わしいと考え得るデータを除去することができる。いくつかの実施形態において、約4、5、6、7または8個未満のグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブから得られるデータは、異常ハイブリダイゼーション性向もしくは二次構造問題のため、信頼できないと考え得る。同様に、約12、13、14、15、16、17、18、19、20、21、または22個より多くのグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブから得られるデータは、異常ハイブリダイゼーション性向もしくは二次構造問題のため信頼できないと考え得る。
[00133] いくつかの場合において、一連の参照データセットに対してプローブセットの信頼度を順位付けすることにより信頼できないプローブセットを選択して、データ分析から除外することができる。例えば、RefSeqまたはEnsembl(EMBL)は、非常に高品質の参照データセットと考えられる。RefSeqまたはEnsembl配列に合うプローブセットのデータは、いくつかの場合、高い信頼度が期待されるためマイクロアレイ分析実験に特に含めることができる。同様に、あまり信頼性が高くない参照データセットに合うプローブセットのデータは、さらなる分析から除外する、または包含について個別的な基準で検討することができる。いくつかの場合において、Ensembl高スループットcDNA(HTC)および/またはmRNA参照データセットを使用して、別々にまたは一緒にプローブセットの信頼度を決定することができる。他の場合において、プローブセットの信頼度を順位付けすることができる。例えば、全ての参照データセット、例えばRefSeq、HTC、HTSeq、ならびにmRNAなどに完全に合うプローブおよび/またはプローブセットは、最も信頼性が高いと順位付けすることができる(1)。さらにまた、3つの参照データセット中で2つに合うプローブおよび/またはプローブセットは、次に最も信頼性が高いと順位付けすることができ(2)、3つの参照データセット中で1つに合うプローブおよび/またはプローブセットは、次に順位付けすることができ(3)ならびに参照データセットに合わないプローブおよび/またはプローブセットは、最後に順位付けすることができる(4)。次いでプローブおよび/またはプローブセットを、その順位付けに基づいて分析に含めるかまたは除外することができる。例えば、さらなる分析のために区分1、2、3および4プローブセット;区分1、2および3プローブセット;区分1ならびに2プローブセット;または区分1プローブセットからのデータを含むように選ぶことができる。別の例において、プローブセットは、参照データセット登録情報に対する塩基対ミスマッチの数により順位付けすることができる。分子プロファイリング用の所与のプローブおよび/またはプローブセットの信頼度を算定するための多数の方法が当業者に理解されており、本開示の方法は、これらの方法およびそれらの組み合わせのいずれも包含するものと理解される。
[00134] 本発明のいくつかの実施形態において、プローブセットからのデータが、発現されないまたは検出不能なレベル(バックグラウンド以下)で発現される場合、それらを分析から除外することができる。いずれかの群について:
標準正規分布のT0〜∞の積分値<有意性(0.01)
[式中、T0=Sqr(群サイズ)(T-P)/Sqr(Pvar);群サイズ=群内のCELのファイル数、T=プローブセット中のプローブスコアの平均、P=GC含量のバックグラウンドプローブ平均の平均、およびPvar=バックグラウンドプローブ分散の合計/(プローブセット内のプローブ数)2]
である場合、プローブセットは、バックグラウンドより高く発現していると判断される。
[00135] これにより、プローブセットに対するバックグラウンドの中点であるプローブセットプローブとして、郡内のプローブセットの平均が類似のGC含量のバックグラウンドプローブの平均発現より大きいプローブセットを含めることが可能になり、バックグラウンドプローブセット分散からプローブセット分散度を導くことが可能になる。
[00136] 本開示のいくつかの実施形態において、分散を呈さないまたは低く呈するプローブセットを、さらなる分析から除外することができる。低分散のプローブセットは、カイ二乗検定によって分析から除外される。プローブセットは、その変換された分散が自由度(N-1)でのカイ二乗分布の99%信頼区間の左側にある場合、低分散であると見なされる。(N-1)*プローブセット分散/(遺伝子プローブセット分散)。Chi−Sq(N-1)について、式中、Nは、入力CELファイルの数であり、(N-1)は、カイ二乗分布の自由度であり、「遺伝子のプローブセット分散」は、遺伝子全部のプローブセット分散の平均である。本発明のいくつかの実施形態において、所与の遺伝子または転写産物クラスターに対するプローブセットに含まれる、GC含量、信頼度、分散および同種のものに関して以前に記載されているフィルタ工程を通過するプローブの数が最小数より少ない場合、それをさらなる分析から除外することができる。例えばいくつかの実施形態において、所与の遺伝子または転写産物クラスターに対するプローブセットが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個未満、もしくは約20個未満のプローブを含有する場合、それをさらなる分析から除外することができる。
[00137] 遺伝子発現レベルまたは選択的スプライシングのデータ分析の方法は、本明細書に提供される特性選択の方法および/またはプロセスの使用をさらに含むことができる。本発明のいくつかの実施形態において、特性選択は、LIMMAソフトウェアパッケージの使用により得られる(Smyth, G. K. (2005). Limma: linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor, R. Gentleman, V. Carey, S. Dudoit, R. Irizarry, W. Huber (eds.), Springer, New York, pages 397-420)。
[00138] 遺伝子発現レベルおよび/または選択的スプライシングのデータ分析の方法は、前分類器方法および/またはプロセス(例えば、前分類器分析モジュールにより実装する)の使用をさらに含むことができる。例えば、方法および/またはプロセスは、細胞特異的分子指紋を使用して、その組成物によりサンプルを前分類し、次いで修正/標準化因子を適用することができる。このデータ/情報を、最終診断の補助にその情報を組み込むことができる最終的な分類法および/またはプロセスへ次いで送ることができる。
[00139] 特定の実施形態において、本発明の方法は、本発明のUIP/非UIP分類器を適用する前にサンプルを喫煙者もしくは非喫煙者に前分類する分子指紋を使用する前分類器方法および/またはプロセス(例えば、前分類器分析モジュールにより実装する)の使用を含む。
[00140] 遺伝子発現レベルおよび/または選択的スプライシングのデータ分析の方法は、本明細書に提供される分類器方法および/またはプロセス(例えば、分類器分析モジュールにより実装する)の使用をさらに含むことができる。本発明のいくつかの実施形態において、対角線形判別分析、k−最近傍分類器、サポートベクターマシン(SVM)分類器、線形サポートベクターマシン、ランダムフォレスト分類器、もしくは確率モデル利用法またはそれらの組み合わせが、マイクロアレイデータの分類に提供される。いくつかの実施形態において、サンプル(例えば第2のILDからの第1のILD、正常対ILD)を区別するまたはサブタイプ(例えばIPF対NSIP)を区別する同定されたマーカーを、対象のクラス間の発現レベルにおける差異の統計的有意性に基づいて選択する。いくつかの場合において、統計的有意性は、ベンジャミンホッホバーグまたは偽発見率(FDR)のための別の修正を適用することにより調整される。
[00141] いくつかの場合において、分類器は、FishelおよびKaufmanら、2007年 Bioinformatics 23(13):1599〜606頁に記述されるそれなどのメタ分析手法で補足することができる。いくつかの場合において、分類器は、再現性分析などのメタ分析手法で補足することができる。いくつかの場合において、再現性分析は、少なくとも1つの予測発現産物マーカーセットに現れるマーカーを選択する。
[00142] マイクロアレイデータの分析に対する事後確率を導き、適用する方法は当業者に公知であり、例えばSmyth,G.K.2004年 Stat.Appi.Genet.Mol.Biol.3:第3項目に記述されている。いくつかの場合において、事後確率を使用して、分類器により提供されるマーカーを順位付けすることができる。いくつかの場合において、マーカーを事後確率にしたがって順位付けすることができ、選んだ閾値を通過するものを、その差異的発現が例えばIPFもしくはNSIPであるサンプルの指標または診断になるマーカーとして選ぶことができる。例示的な閾値には、0.7、0.75、0.8、0.85、0.9、0.925、0.95、0.975、0.98、0.985、0.99、0.995またはより高い事前確率がある。
[00143] 分子プロファイリングの結果の統計的評価は:診断精度の尤度;ILDの尤度;特定のILDの尤度;特定の治療的介入の成功の尤度、対象が喫煙者である尤度、および対象が非喫煙者である尤度のうち1つまたは複数の指標となる定量値(単数または複数)を提供することができるが、提供することに限定されない。したがって、遺伝学または分子生物学においてトレーニングされる可能性が低い医師は、生データを理解する必要はない。むしろ、データは、患者治療を指導するのに最も有用な形態で医師に直接示される。分子プロファイリングの結果は:スチューデントt検定、両側t検定、ピアソン順位和分析、隠れマルコフモデル分析、q−qプロットの分析、主成分分析、一元配置分散分析、二元配置分散分析、LIMMAおよび同種のものを含むがそれだけには限らない当業者に公知のいくつかの方法を使用して統計学的に評価することができる。[00182]本発明のいくつかの実施形態において、分子プロファイリング単独もしくは細胞学的分析と組み合わせての使用は、約85%〜約99%もしくは約100%正確な分類、同定または診断を提供することができる。いくつかの場合において、分子プロファイリングプロセスおよび/または細胞診断学は、約もしくは少なくとも約85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%、もしくは99.9%正確なILDの分類、同定、診断を提供する。いくつかの実施形態において、分子プロファイリングプロセスおよび/または細胞診断学は、約もしくは少なくとも約85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%、もしく99.9%正確な特定のILD型(例えばIPF;NSIP;HP)の存在の分類、同定または診断を提供する。
[00144] いくつかの場合において、精度は、経時的に対象を追跡して、元の診断の正確さを決定することにより決定することができる。他の場合において、精度は、決定論的な方式または統計的方法を使用して確立することができる。例えば、受信者動作特性(ROC)分析を使用して、最適なアッセイパラメータを決定し、それにより特定のレベルの精度、特異性、陽性予測値、陰性予測値および/または偽発見率を実現することができる。
[00145] 本開示のいくつかの実施形態において、第1のILDと第2のILDの間(例えば、IPFとNSIPの間)、ILDと正常の間、および/または喫煙者と非喫煙者の間で発現レベルに最大の差異もしくは選択的スプライシングに最大の差異を呈することが決定される産物をコードしているヌクレオチドの遺伝子発現産物および組成物を、本開示の分子プロファイリング試薬としての使用に選ぶことができる。そのような遺伝子発現産物は、当業者に公知のもしくは使用されている他の方法より広いダイナミックレンジ、より大きなシグナル対ノイズ、改善された診断力、偽陽性もしくは偽陰性のより低い尤度、またはより高い統計的信頼レベルを提供することにより、特に有用になり得る。
[00146] 本発明の他の実施形態において、当業者に公知の標準的な細胞学的技術の使用と比較した場合、分子プロファイリング単独または細胞学的分析と組み合わせての使用は、診断できないとスコアリングされるサンプル数を約もしくは少なくとも約100%、99%、95%、90%、80%、75%、70%、65%、もしくは約60%まで減少させ得る。いくつかの場合において、本発明の方法は、当業者に使用される標準的な細胞学的方法と比較した場合、中間または疑わしいとスコアリングされるサンプル数を約もしくは少なくとも約100%、99%、98%、97%、95%、90%、85%、80%、75%、70%、65%、もしくは約60%まで減少させ得る。
[00147] いくつかの場合において、分子プロファイリングアッセイの結果は、分子プロファイリング事業者、個人、医療提供者、または保険提供者の代表者もしくは代理人による利用のためにデータベースに登録される。いくつかの場合において、アッセイ結果は、医療専門家などの代表者、代理人、または事業コンサルタントによるサンプル分類、同定、もしくは診断を含む。他の場合において、データのコンピュータ分析が、自動で得られる。いくつかの場合において、分子プロファイリング事業は、遂行した分子プロファイリングアッセイ、コンサルティングサービス、データ分析、結果の報告、もしくはデータベース利用のうち1つもしくは複数について個人、保険提供者、医療提供者、研究者、または政府機関に請求することができる。
[00148] 本発明のいくつかの実施形態において、分子プロファイリングの結果は、コンピュータ画面上の報告または紙記録として示される。いくつかの場合において、報告は、差異的に発現している遺伝子の数、元サンプルの適合性、差異的選択的スプライシングを示す遺伝子の数、診断、診断の統計的信頼、対象が喫煙者である尤度、ILDの尤度、および指示された療法の1つまたは複数などの情報を含み得るが、これに限定されない。
(iv)分子プロファイリング結果に基づくサンプルの類別化
[00149] 分子プロファイリングの結果は、喫煙者、非喫煙者、ILD、特定の型のILD、非ILD、または診断できない(ILDの有無について十分な情報が得られない)のうちの1つに分類することができる。いくつかの場合において、分子プロファイリングの結果は、IPF対NSIP区分に分類することができる。特定の場合において、結果はUIPまたは非UIPに分類することができる。
[00150] 本発明のいくつかの実施形態において、結果は、トレーニングされた分類器を使用して分類される。本発明のトレーニングされた分類器は、1つもしくは複数の組織病理があるサンプルを含むがこれに限定されない、公知のILDおよび正常サンプル、公知の喫煙者および非喫煙者サンプル、または喫煙者および/または非喫煙者由来の公知のILDおよび正常サンプルの組み合わせの参照セットを使用して開発された方法および/またはプロセスを実装する。いくつかの実施形態において、トレーニング(例えば分類器トレーニングモジュールを使用する)は、第1のILD由来の第1の組のバイオマーカーにおける遺伝子発現産物レベルと第2のILD由来のバイオマーカーの第2の組における遺伝子発現産物レベルとの比較を含み、バイオマーカーの第1の組は、第2の組にないバイオマーカーを少なくとも1つ含む。いくつかの実施形態において、トレーニング(例えば分類器トレーニングモジュールを使用する)は、非UIPである第1のILD由来の第1の組のバイオマーカーにおける遺伝子発現産物レベルとUIPである第2のILD由来のバイオマーカーの第2の組における遺伝子発現産物レベルとの比較を含み、バイオマーカーの第1の組は、第2の組にないバイオマーカーを少なくとも1つ含む。いくつかの実施形態において、トレーニング(例えば分類器トレーニングモジュールを使用する)は、喫煙者である第1の対象由来の第1の組のバイオマーカーにおける遺伝子発現産物レベルと非喫煙者である第2の対象由来のバイオマーカーの第2の組における遺伝子発現産物レベルとの比較をさらに含み、バイオマーカーの第1の組は、第2の組にないバイオマーカーを少なくとも1つ含む。いくつかの実施形態において、分類器全体または分類器の部分のいずれかを、分類器に使用される他の全てのバイオマーカーパネル(または、他の全てのバイオマーカーシグネチャー)に対する分類パネル内のバイオマーカーパネルの発現レベルの比較を使用してトレーニングする(例えば分類器トレーニングモジュールを使用する)ことができる。
[00151] サンプルの類別化に適した分類器には、それだけには限らないがk−最近傍分類器、サポートベクターマシン、線形判別分析、対角線形判別分析、updown分析、単純ベイズ分類器、ニューラルネットワーク分類器、隠れマルコフモデル分類器、遺伝子分類器、またはその任意の組み合わせがある。
[00152] いくつかの場合において、本発明のトレーニングされた分類器は、それだけには限らないが、DNA多型データ、配列決定データ、本発明の細胞学者もしくは病理学者によるスコアリングもしくは診断、本開示の前分類器方法および/またはプロセスにより得られる情報、または本開示の対象の病歴についての情報など遺伝子発現もしくは選択的スプライシングデータ以外のデータを組み込むことができる。
[00153] ILDの診断のために生体サンプルを分類する場合、2成分分類器から起こり得る結末が一般に2つある。同様に、喫煙者の診断のために生体サンプルを分類する場合、2成分分類器から起こり得る結末が一般に2つある。2成分分類器を実際の真の値(例えば、生体サンプルからの値)と比較した場合、起こり得る結末が一般に4つある。予測からの結末がpであり(「p」は、特定のILDなど陽性の分類器出力である)、実測値もpである場合、それは真の陽性(TP)と呼ばれ;しかしながら、実測値がnである場合、それは偽陽性(FP)と言われる。反対に、予測結末および実測値の両方が、nである(「n」は、ILDでない、または本明細書に記載の特定の疾患組織がないなど陰性分類器出力である)場合、真の陰性が起こり、実測値がpだが予測結末がnである場合、偽陰性である。一実施形態において、人が特定の疾患を有するかどうか決定しようとする診断試験を考慮する。人が陽性反応を示すが、実際には疾患がない場合、この場合偽陽性が起こる。人が陰性反応を示し、健康であることが示唆される場合に、実際に疾患がある場合、一方で偽陰性が起こる。いくつかの実施形態において、サブタイプの現実の有病率と仮定される受信者動作特性(ROC)曲線は、該当する割合で利用可能なサンプルにおいて実現された誤りを再サンプリングすることにより生成され得る。
[00154] 陽性の予測値(PPV)、または精度率、もしくは疾患の試験後確率は、正しく診断される陽性試験結果の患者の割合である。その割合は、陽性試験が試験される基礎となる症状を反映する確率を反映するので、診断方法で最も重要な計測である。しかしながら、その値は疾患の有病率によって決まり、変化し得る。一例において、FP(偽陽性);TN(真の陰性);TP(真の陽性);FN(偽陰性)。偽陽性率(α)=FP/(FP+TN)−特異性;偽陰性率(β)=FN/(TP+FN)−感度;力=感度=1−β;尤度比陽性=感度/(1-特異性);尤度比陰性=(1-感度)/特異性。
[00155] 陰性予測値は、正しく診断される陰性試験結果の患者の割合である。PPVおよびNPV測定は、適当な疾患サブタイプ有病率推定値を使用して得ることができる。プールした疾患有病率の推定値は、手術によりB対Mにおおまかに分類する予測不能なもののプールから算出することができる。いくつかの実施形態において、サブタイプ特異的推定値の場合、利用可能なサンプルが全くないので、時には疾患有病率が算出できない場合がある。これらの場合において、サブタイプ疾患有病率は、プールした疾患有病率推定値により置換することができる。
[00156] いくつかの実施形態において、発現産物のレベルまたは選択的エキソンの使用は、IPF、NSIPもしくはHPのうち1つの指標となる。
[00157] いくつかの実施形態において、発現産物のレベルまたは選択的エキソンの使用は、対象が喫煙者もしくは非喫煙者である指標となる。
[00158] いくつかの実施形態において、対象とする方法の発現分析の結果は、所与の診断が正しいという統計的信頼レベルを提供する。いくつかの実施形態において、そのような統計的信頼レベルは、少なくとも約85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、もしくそれ以上、またはより高い。
報告
[00159] 対象とする方法および/またはシステムは、サンプル(肺組織サンプル)がILDサンプルであるという指標を提供する報告を生成する(例えば報告モジュールを使用する)工程を含み得る。対象とする診断方法は、試験される個体がILDかどうかに関する指標を提供する報告を生成する工程を含み得る。対象とする診断方法は、試験される個体が喫煙者かそうでないかに関する指標を提供する報告を生成する工程を含み得る。対象とする方法(または、報告モジュール)は、試験される個体がIPFかどうか(およびIPFでない、例えば、IPF以外のILD;例えば、報告は、個体がIPFでありNSIPでないことを示し得る)に関する指標を提供する報告を生成する工程を含み得る。
[00160] いくつかの実施形態において、ILDを診断する対象とする方法は、報告を生成する(例えば報告モジュールを使用する)工程を含む。そのような報告は、患者がILDであるという尤度;患者が喫煙者であるという尤度;さらなる評価に関する勧告;治療薬および/またはデバイス介入に関する勧告;ならびに同種のものなどの情報を含むことができる。
[00161] 例えば、本明細書に開示する方法は、対象とする診断方法の結果を提供する報告を生成するまたは出力する工程をさらに含むことができ、その報告は、電子媒体の形態(例えば、コンピュータモニタ上の電子表示)で、または有形媒体の形態(例えば、紙または他の有形の媒体に印刷された報告)で提供することができる。対象とする診断方法の結果に関する判定(例えば、個体がILDであるという尤度;個体がIPFであるという尤度;個体が喫煙者であるという尤度)は、「報告」または単純に「スコア」と称することができる。人または報告を作成する実体(「報告書作成プログラム」)は、サンプル収集、サンプル処理などの工程も遂行することができる。あるいは、報告書作成プログラム以外の実体が、サンプル収集、サンプル処理および同種のものなどの工程を遂行することもできる。診断判定報告を、利用者に提供することができる。「利用者」は、医療専門家(例えば、臨床医、実験室技術者、医師[例えば、心臓病専門医]、等)であることができる。
[00162] 対象とする報告は:1)業務提供者情報;2)患者データ;3)所与の遺伝子産物もしくは遺伝子産物の組の発現レベル、スコアまたは分類器決定に関するデータ;4)追跡評価勧告;5)治療的介入または勧告;および6)他の特性のうち1つまたは複数をさらに含むことができる。
さらなる評価
[00163] 所与の遺伝子産物もしくは遺伝子産物の組の発現レベルに基づいて、および/または報告(上述のとおり)に基づいて、医師もしくは他の資格のある医療関係者は、被験者(患者)のさらなる評価が必要かどうか決定することができる。さらなる評価には、例えば、肺活量測定があり得る。
治療的介入
[00164] 所与の遺伝子産物もしくは遺伝子産物の組の発現レベルに基づいて、および/または報告(上述のとおり)に基づいて、医師もしくは他の資格のある医療関係者は、適当な治療的介入が助言されるかどうか決定することができる。
[00165] 治療的介入には、薬物を使用する治療的介入、デバイスを使用する治療的介入および外科的介入がある。報告が、個体がIPFであるという尤度を示す場合、薬物を使用する治療的介入には、例えば、個体への有効量のピルフェニドン、プレドニゾン、アザチオプリン、またはN−アセチルシステインの投与がある。外科的介入には、例えば、動脈バイパス手術がある。
コンピュータで実装される方法、システムおよびデバイス
治療的介入
[00166] 本開示の方法は、方法工程(例えば、アッセイ、比較、算出、および同種のもの)が全てまたは部分的に自動化されるように、コンピュータで実装することができる。
[00167] したがって、本開示は、差異的診断を含めた間質性肺疾患の診断(例えば、IPF、NSIP、HP等の診断)を容易にするコンピュータで実装される方法に関連する方法、コンピュータシステム、デバイスおよび同種のものを提供する。
[00168] 本開示は、喫煙者状態(例えば、喫煙者対非喫煙者)の決定を容易にするコンピュータで実装される方法に関連する方法、コンピュータシステム、デバイスおよび同種のものをさらに提供する。
[00169] 本開示は、差異的診断を含めた間質性肺疾患の診断(例えば、IPF、NSIP、HP等の診断)を容易にするコンピュータで実装される方法に関連する方法、コンピュータシステム、デバイスおよび同種のものをさらに提供し、本方法は、対象の喫煙者状態(喫煙者対非喫煙者)を決定する工程と、喫煙者状態を対象の間質性肺疾患診断の決定に組み込む工程とをさらに含む。いくつかの実施形態において、(i)トレーニング(例えば分類器トレーニングモジュールを使用する)中に使用されるモデルにおいて、喫煙者状態が、共変量として間質性肺疾患診断に組み込まれる。この手法は、特に喫煙者から得られたデータ(ノイズがより高い)においてシグナル対ノイズ比を向上させ、喫煙者および非喫煙者から得られるデータを組み合わせ、同時に使用可能にする。いくつかの実施形態において、(ii)間質性肺疾患の診断分類器トレーニングの間に喫煙者状態のバイアスの影響を受けやすい1つもしくは複数の遺伝子を同定し、そのような遺伝子を除外するまたは喫煙者状態の影響を受けにくい他の遺伝子と異なる重み付けをすることにより、喫煙者状態が間質性肺疾患診断に組み込まれる。いくつかの実施形態において、(iii)初期分類器が喫煙者を非喫煙者と区別する遺伝子シグネチャーを認識するためにトレーニングされる(例えば分類器トレーニングモジュールを使用する)段階的分類を構築することにより、喫煙者状態が、間質性肺疾患診断に組み込まれる。一旦患者サンプルが「喫煙者」または「非喫煙者」に前分類されたら(例えば前分類器分析モジュールを使用する)、喫煙者もしくは非喫煙者それぞれにおいてUIP対非UIPを区別するためにそれぞれトレーニングされた固有の分類器を実装して、間質性肺疾患を診断することができる。なおさらなる実施形態において、喫煙者状態を対象の間質性肺疾患診断の決定に組み込む工程を含む方法は、上記のような組み込み手段の1つまたは複数の組み合わせを含む(すなわち、直上の段落における実施形態(i)〜(iii)の2つ以上の組み合わせ)。
[0100] 例えば、バイオマーカーレベルの値を得る工程と、標準化したバイオマーカー(遺伝子)発現レベルを対照レベルと比較する工程と、ILDの尤度を算出する(および任意選択により対象が喫煙者であるという尤度)工程と、報告を生成する工程と、同種の工程を含めた方法工程は、コンピュータプログラム製品により完全にまたは部分的に遂行することができる。得られた値は、例えばデータベースに電子的に保存することができ、プログラムされたコンピュータにより実行される分類器に供する(例えば分類器分析モジュールを使用する)ことができる。
[0101] 例えば、本開示の方法および/またはシステムは、バイオマーカーレベル(例えば、遺伝子産物の標準化した発現レベル)を分類器分析モジュールに入力して、方法および/またはプロセスを実行し、それにより本明細書に記載される比較および算出工程を遂行し、例えば、コンピュータに対して局所または遠隔位置にある出力デバイスへ報告を表示または印刷することにより本明細書に記載の報告を生成する(例えば報告モジュールを使用する)工程を含むことができる。報告への出力は、スコア(例えば、数値的スコア[数値の表記])または非数値的スコア(例えば、数値または数値範囲の非数値的出力表記[例えば、「IPF」、「IPFの証拠がない」])であることができる。他の態様において、出力は「UIP」対「非UIP」を示すことができる。他の態様において、出力は「喫煙者」対「非喫煙者」を示すことができる。
[0102] したがって、本開示は、保存されているソフトウェアおよび/またはハードウェアモジュールを有するコンピュータ読み込み可能な記憶媒体を含むコンピュータプログラム製品を提供する。ソフトウェアおよび/またはハードウェアモジュールは、処理装置により実行される場合、個体からの1つまたは複数の生体サンプル(例えば、肺組織サンプル)の分析から得られる値に基づいて関連する算出を実行することができる。コンピュータプログラム製品は、算出を遂行するためのコンピュータプログラムの中に保存した。
[0103] 本開示は、上述したプログラムを実行するためのシステムを提供し、そのシステムは以下を一般に含む:a)ソフトウェアおよび/またはハードウェアモジュールを実行する中央コンピューティング環境または処理装置;b)患者データを受信するためにコンピューティング環境に作動的に接続されており、患者データが、例えば上述のとおり、患者由来の生体サンプルを使用するアッセイから得られるバイオマーカーレベルまたは他の値を含むことができる入力デバイス;c)利用者(例えば、医療関係者)に情報を提供するためにコンピューティング環境に接続されている出力デバイス;ならびにd)中央コンピューティング環境(例えば、処理装置)によって実行される方法および/またはプロセスであり、その方法および/またはプロセスが入力デバイスによって受信したデータに基づいて実行され、その方法および/またはプロセスが値を算出し、本明細書に記載のとおり、その値が、対象がILDであるという尤度の指標となる、方法および/またはプロセス。
[0104] 本開示は、上述したプログラムを実行するためのシステムも提供し、そのシステムは以下を一般に含む:a)ソフトウェアおよび/またはハードウェアモジュールを実行する中央コンピューティング環境または処理装置;b)患者データを受信するためにコンピューティング環境に作動的に接続されており、患者データが、例えば上述のとおり、患者由来の生体サンプルを使用するアッセイから得られるバイオマーカーレベルまたは他の値を含むことができる入力デバイス;c)利用者(例えば、医療関係者)に情報を提供するためにコンピューティング環境に接続されている出力デバイス;ならびにd)中央コンピューティング環境(例えば、処理装置)によって実行される方法および/またはプロセスであり、その方法および/またはプロセスが入力デバイスによって受信したデータに基づいて実行され、その方法および/またはプロセスが値を算出し、本明細書に記載のとおり、その値が、対象がILDであるという尤度の指標となり、トレーニング中に使用されたモデルにおいて、その方法および/またはプロセスが、共変量として喫煙状態(喫煙者対非喫煙者)を使用する方法および/またはプロセス。いくつかの実施形態において、本方法および/またはプロセスは分類器トレーニングは、喫煙者状態のあバイアスの影響を受けやすい1つまたは複数の遺伝子を除外するかまたは異なる重み付けをして、トレーニングに使用される特性空間を、喫煙状態により混乱または影響を受けない遺伝子について濃縮する。
[0105] なおさらなる実施形態において、 本開示は、上述したプログラムを実行するためのシステムを提供し、そのシステムは以下を一般に含む:a)ソフトウェアおよび/またはハードウェアモジュールを実行する中央コンピューティング環境または処理装置;b)患者データを受信するためにコンピューティング環境に作動的に接続されており、患者データが、例えば上述のとおり、患者由来の生体サンプルを使用するアッセイから得られるバイオマーカーレベルまたは他の値を含むことができる入力デバイス;c)利用者(例えば、医療関係者)に情報を提供するためにコンピューティング環境に接続されている出力デバイス;ならびにd)中央コンピューティング環境(例えば、処理装置)によって実行される第1の方法および/またはプロセスであり、第1の方法および/またはプロセスが、入力デバイスによって受信したデータに基づいて実行され、第1の方法および/またはプロセスが値を算出し、本明細書に記載のとおり、その値が、対象が喫煙者または非喫煙者であるという尤度の指標となり、喫煙者または非喫煙者である対象の状態が第1の方法および/またはプロセスに喫煙者または非喫煙者それぞれにおいてUIP対非UIPを区別するために特にトレーニングされている(例えば分類器トレーニングモジュールを使用する)第2の方法および/またはプロセスを適用させる、第1の方法および/またはプロセス、e)中央コンピューティング環境(例えば、処理装置)によって実行される第2の方法および/またはプロセスであり、第2の方法および/またはプロセスが入力デバイスによって受信したデータに基づいて実行され、第2の方法および/またはプロセスが値を算出し、本明細書に記載のとおり、その値が、対象がILDであるという尤度の指標となる方法および/またはプロセス。
コンピュータシステム
[0106] 図7Aは、バスもしくはバス群110によって接続されている少なくとも1つの処理装置102、または処理ユニットもしくは複数の処理装置、メモリ104、少なくとも1つの入力デバイス106および少なくとも1つの出力デバイス108を含む処理システム100を例示する。処理システムは、例えば、ホストデバイス、パーソナルコンピュータ、携帯もしくはラップトップデバイス、パーソナル携帯情報機器、マルチプロセッサシステム、マイクロプロセッサ型システム、プログラム可能な家電デバイス、ミニコンピュータ、サーバコンピュータ、ウェブサーバコンピュータ、メインフレームコンピュータなどの任意の適当なデバイス、および/または上記のシステムもしくはデバイスいずれかを含む分散型コンピューティング環境上で実装することができる。
[0107] 特定の実施形態において、入力デバイス106および出力デバイス108は、同じデバイスであることができる。インターフェイス112はまた、1つまたは複数の周辺デバイスへ処理システム100を接続するために提供でき、例えば、インターフェイス112は、PCIカードまたはPCカードであることができる。少なくとも1つのデータベース116を収容する少なくとも1つの記憶デバイス114を提供することもできる。
[0108] メモリ104は、任意の形態のメモリデバイス、例えば、揮発性または不揮発性メモリ、固体記憶デバイス、磁気デバイス等であることができる。例えば、いくつかの実施形態において、メモリ104は、ランダムアクセスメモリ(RAM)、メモリバッファ、ハードディスク、読出し専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROM)、データベース、および/または同種のものであることができる。
[0109] 処理装置102は、例えば処理システム100内で異なる機能を扱うために2つ以上の固有の処理デバイスを含むことができる。処理装置100は、汎用処理装置(GPP)、中央処理ユニット(CPU)、アクセラレーテッドプロセッシングユニット(APU)、グラフィックスプロセッサユニット(GPU)、特定用途向け集積回路(ASIC)、および/または同種のものなど1組の命令もしくはコード(例えば、メモリに保存されている)を走らせるもしくは実行するように構成されている任意の適当な処理デバイスであることができる。そのような処理装置100は、パーソナルコンピュータアプリケーション、モバイルアプリケーション、インターネットウェブブラウザ、携帯および/または無線通信(ネットワークによる)および/または同種のものの使用と関連付けてメモリに保存されている1組の命令もしくはコードを走らせるもしくは実行することができる。より具体的には、処理装置は、本明細書に記載のとおり、データの分析および分類と関連付けてメモリ104に保存されている1組の命令またはコードを実行することができる。
[0110] 入力デバイス106は、入力データ118を受信し、例えば、キーボード、ペン様デバイスもしくはマウスなどのポインタデバイス、マイクロホンなど音声制御起動用のオーディオ受信デバイス、モデムもしくは無線データアダプタなどのデータ受信装置もしくはアンテナ、データ収集カード等を含むことができる。入力データ118は、異なる供給源、例えばネットワークを介して受信したデータと組み合わせたキーボード命令によってもたらされ得る。
[0111] 出力デバイス108は、出力データ120を作製または生成し、例えば、表示デバイスもしくはモニタ、その場合出力データ120は視覚的であり、プリンタ、その場合出力データ120は印刷され、ポート、例えばUSBポート、周辺成分アダプタ、モデムもしくは無線ネットワークアダプタなどのデータ送信機もしくはアンテナ等を含むことができる。出力データ120は固有であり、異なる出力デバイスから得られ、例えばネットワークに送信されたデータと組み合わされたモニタ上の視覚的表示であることができる。利用者は、例えば、モニタ上でもしくはプリンタを使用することによりデータ出力、またはデータ出力の解釈を見ることができる。
[0112] いくつかの実施形態において、入力デバイス106および/または出力デバイス108は、ネットワークを介してデータを送信および/または受信するように構成されている通信インターフェイスであることができる。より具体的には、そのような実施形態において、処理システム100は、1つまたは複数のクライアントデバイスに対するホストデバイスとして機能することができる(図7Aには示さない)。したがって、処理システム100は、クライアントデバイスへデータを送信し(例えば、出力データ120)、そこからデータを受信する(例えば、入力データ118)ことができる。そのような通信インターフェイスは、1つもしくは複数のネットワークインターフェイスカードまたは同種のものなど、処理システム100をクライアントデバイスと通信させることができる任意の適当なモジュールおよび/またはデバイスであることができる。そのようなネットワークインターフェイスカードには、例えば、ネットワークを介してクライアントデバイス150をホストデバイス110と通信させることができるイーサネットポート、WiFi(登録商標)無線、ブルートゥース(登録商標)無線、近距離無線通信(NFC)、および/または携帯無線、または同種のものがあり得る。
[0113] 記憶デバイス114は、データまたは情報記憶手段の任意の形態、例えば、揮発性もしくは不揮発性のメモリ、固体記憶デバイス、磁気デバイス等であることができる。例えば、いくつかの実施形態において、記憶デバイス114は、ランダムアクセスメモリ(RAM)、メモリバッファ、ハードドライブ、読出し専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROM)、データベース、および/または同種のものであることができる。
[0114] 使用にあたっては、処理システム100は、有線もしくは無線通信手段を介してデータもしくは情報を少なくとも1つのデータベース116に保存するおよび/またはそこから取り出すことができるように構成される。インターフェイス112は、処理ユニット102と専門用途に使用できる周辺成分との間の有線および/または無線通信を可能にできる。一般に、処理装置102は、入力デバイス106を介して入力データ118として命令を受信することができ、出力デバイス108を利用することにより処理結果または他の出力を利用者に表示することができる。2つ以上の入力デバイス106および/または出力デバイス108を備えることができる。処理システム100は、端末、サーバ、専用ハードウェア、または同種のものの任意の適当な形態であることができる。処理システム100は、ネットワーク化された通信システムの一部であることができる。
[0115] 処理システム100は、ネットワーク、例えば、ローカルエリアネットワーク(LAN)、バーチャルローカルエリアネットワーク(VLAN)などの仮想ネットワーク、ワイドエリアネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセスネットワーク(WiMAX)、携帯型ネットワーク、インターネット、および/または有線および/または無線ネットワークとして実装される他の任意の適当なネットワークに接続することができる。例えば、LANネットワーク環境において使用される場合、コンピューティングシステム環境100は、ネットワークインターフェイスまたはアダプタを介してLANに接続される。WANネットワーク環境において使用される場合、コンピューティングシステム環境は、モデム、またはインターネットなどWANを介して通信を確立するための他の手段を一般に含む。内部または外部的であり得るモデムは、利用者入力インターフェイスもしくは別の適当な機序を介してシステムバスに接続することができる。ネットワーク化環境において、コンピューティングシステム環境100、またはその部分と関連して表わされるプログラムモジュールは、遠隔メモリ記憶デバイスに保存できる。図7の例示されたネットワーク接続は例であり、複数のコンピュータ間の通信リンクを確立する他の手段を使用できることが認められる。
[0116] 入力データ118および出力データ120は、ネットワークを介して他のデバイスと通信することができる。ネットワークを介する情報および/またはデータの転送は、有線通信手段もしくは無線通信手段を使用して実現することができる。サーバは、ネットワークと1つまたは複数のデータベースの間のデータ転送を容易にすることができる。サーバおよび1つまたは複数のデータベースは、情報源の一例を提供する。
[0117] したがって、図7Aに例示される処理コンピューティングシステム環境100は、1つまたは複数の遠隔コンピュータへの論理的接続を使用するネットワーク化環境において操作することができる。遠隔コンピュータは、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイスもしくは他の一般的なネットワークノードであることができ、上述した要素の多くまたは全てを一般に含む。
[0118] 図7Bは、より詳細に図7Aの処理装置102を例示する。処理装置102は、特定のモジュールを実行するように構成することができる。モジュールは、例えば、ハードウェアモジュール、メモリ104に保存されているおよび/または処理装置102において実行されるソフトウェアモジュール、および/またはその任意の組み合わせであることができる。例えば、図7Bに示すように、処理装置102は、前分類器分析モジュール130、分類器トレーニングモジュール132、分類器分析モジュール134および報告モジュール136を含むおよび/または実行する。図7Bに示すように、前分類器分析モジュール130、分類器トレーニングモジュール132、分類器分析モジュール134および報告モジュール136を接続し、および/または電気的に結合させることができる。このように、信号を、前分類器分析モジュール130、分類器トレーニングモジュール132、分類器分析モジュール134および報告モジュール136の間で送信することができる。
[0119] 分類器トレーニングモジュール132は、データのコーパス(例えば遺伝子発現データ、配列決定データ)を受信し、分類器をトレーニングするように構成することができる。例えば、UIPおよび非UIPとして以前に同定された(例えば、専門家による)サンプルからの臨床注釈データを、入力デバイス106によって受信し、分類器トレーニングモジュール132で使用してUIPならびに非UIPとして以前に同定されたサンプル間の相関を同定することができる。例えば、専門家のTBB組織病理ラベル(すなわち、UIPまたは非UIP)、専門家のHRCTラベル、および/または専門家の患者レベルの臨床結末ラベルを得て、単独もしくは組み合わせて使用して、マイクロアレイおよび/または配列決定データを使用して分類器をトレーニングすることができる。使用した特性空間は、遺伝子発現、バリアント、突然変異、融合、ヘテロ接合性の喪失(LOH)、生物学的経路効果および/または機械学習アルゴリズムをトレーニングするための特性として抽出することができる他の任意の次元のデータを含むことができる。いくつかの実施形態において、UIP対非UIP分類器、喫煙者対非喫煙者分類器、またはUIP対非UIPおよび喫煙者対非喫煙者分類器をトレーニングするために使用した特性空間は、遺伝子発現、バリアント、突然変異、融合、ヘテロ接合性の喪失(LOH)ならびに生物学的経路効果を含む。いくつかの実施形態において、UIP対非UIP分類器、喫煙者対非喫煙者分類器、またはUIP対非UIPおよび喫煙者対非喫煙者分類器をトレーニングするために使用した特性空間は、遺伝子発現ならびにバリアント次元を含む。
[0120] いくつかの実施形態において、分類器トレーニングモジュール132は、受信したサンプルが喫煙者または非喫煙者と関連するかどうかと関連付けられた指標に基づいて喫煙者分類器および非喫煙者分類器をトレーニングすることができる。他の実施形態において、喫煙者/非喫煙者を、特質(モデル共変量)として使用して、単一の分類器をトレーニングすることができる。分類器がトレーニングされた後、それを使用して、本明細書に記載の新しく受信した不明なサンプルを同定および/または分類することができる。
[0121] 前分類器分析モジュール130は、サンプルが喫煙者または非喫煙者と関連するかどうか同定することができる。具体的には、前分類器分析モジュール130は、任意の適切な方法を使用して、喫煙する(または、大量喫煙歴がある)個体対喫煙しない(または、喫煙歴がない)個体に由来するサンプルを同定および/または分類することができる。分類は、利用者からの指標の受信、喫煙者状態のバイアスの影響を受けやすい遺伝子の同定、機械学習分類器の使用など任意の適当な方式、および/または本明細書に記載される他の任意の適当な方法で行うことができる。
[0122] 分類器分析モジュール134は、サンプルを分類器へ入力して、UIPおよび非UIPと関連付けるように受信したサンプルを同定および/または分類することができる。具体的には、分類器分析モジュール134は、トレーニングされた分類器を使用して、サンプルがUIPまたは非UIPを示すかどうか同定することができる。いくつかの実施形態において、分類器分析モジュール134は、UIPまたは非UIPと関連付けられるサンプルのパーセンテージもしくは信頼スコアを示すことができる。いくつかの実施形態において、分類器分析モジュール134は、2つの別々の分類器:一方は喫煙者サンプル用、他方は非喫煙者サンプル用(前分類器分析モジュール130で決定される)を実行することができる。他の実施形態において、単一の分類器が、喫煙者状態の入力とともに喫煙者および非喫煙者サンプルの両方に対して実行される。
[0123] 報告モジュール136は、本明細書でさらに詳細に記載される分類器分析モジュール134の結末に基づいて任意の適当な報告を生成するように構成することができる。いくつかの場合において、報告は、差異的に発現している遺伝子の数、元サンプルの適合性、差異的選択的スプライシングを示す遺伝子の数、診断、診断の統計的信頼、対象が喫煙者である尤度、ILDの尤度、および指示した療法の1つまたは複数などの情報を含み得るが、これに限定されない。
[0124] 図7Cは、本発明の1つの非限定的な実施形態のフローチャートを例示し、公知のUIPおよび非UIPサンプルに対する遺伝子産物発現データを使用して分類器をトレーニングし(例えば分類器トレーニングモジュールを使用する)、それによりUIP対非UIPを識別し、任意選択により分類器は喫煙者状態を共変と見なし、未知のサンプル由来の遺伝子産物発現データをトレーニングされた分類器に入力して、未知のサンプルをUIPまたは非UIPのいずれかに同定し、分類器による分類の結果を定義し、報告によって出力する。
[0125] 特定の実施形態は、図7Aのコンピューティングシステム環境100など1つまたは複数のコンピューティングデバイスにより遂行される操作の行為および象徴的表現を参照して記述され得る。このように、コンピュータで実行されると時々称されるそのような行為および操作が、構造形態でデータを表す電気信号の、コンピュータの処理装置による扱いを含むことは理解されよう。この扱いは、データを変換するまたはデータをコンピュータのメモリシステム内の場所に維持し、当業技術者に理解される方式でコンピュータの操作を再構成する、さもなければ改変する。データが維持されるデータ構造は、データの形式によって定義される特定の特性を有するメモリの物理的な位置である。しかしながら、実施形態が前の文脈に記述されているが、当業者が、以下に記述される行為および操作もハードウェアにおいて実装できることを認めることになると限定するものではない。
[0126] 実施形態は、他の多くの汎用または特殊用途のコンピューティングデバイスおよびコンピューティングシステム環境もしくは構成で実装され得る。実施形態での使用に適し得る他のコンピューティングシステム、環境および構成の例には、パーソナルコンピュータ、携帯もしくはラップトップデバイス、パーソナル携帯情報機器、マルチプロセッサシステム、マイクロプロセッサ型システム、プログラム可能な家電、ネットワーク、ミニコンピュータ、サーバコンピュータ、ウェブサーバコンピュータ、メインフレームコンピュータ、および上記システムまたはデバイスのいずれかを含む分散型コンピューティング環境があるが、これに限定されない。
[0127] 実施形態は、ハードウェアおよび/またはソフトウェアモジュールなど、コンピュータ実行可能な命令の一般的な文脈で記述できる。実施形態は、作業が通信ネットワークを介して連結されている遠隔処理デバイスによって遂行される分散型コンピューティング環境において実施することもできる。分散型コンピューティング環境において、プログラムモジュールは、メモリ記憶デバイスを含めた局所および遠隔コンピュータ記憶媒体の両方に位置することができる。
コンピュータプログラム製品
[0128] 本開示は、図7を参照して上述されるそれなどプログラム可能なコンピュータにおいて実行される場合に本開示の方法を実施することができるコンピュータプログラム製品を提供する。前述のとおり、本明細書に記載される主題は、所望の構成に応じてシステム、装置、方法、および/または物品で具現され得る。これらの様々な実装は、特殊もしくは汎用であることができ、記憶システムからデータおよび命令を受信し、そこへデータおよび命令を伝達するために接続されている少なくとも1つのプログラム可能な処理装置、少なくとも1つの入力デバイス(例えばビデオカメラ、マイクロホン、ジョイスティック、キーボード、および/またはマウス)、および少なくとも1つの出力デバイス(例えば表示モニタ、プリンタ等)を含むプログラム可能なシステム上で実行および/または解釈可能な1つもしくは複数のコンピュータプログラムにおける実装を含むことができる。
[0129] コンピュータプログラム(別名プログラム、ソフトウェア、ソフトウェアアプリケーション、アプリケーション、コンポーネント、またはコード)は、プログラム可能な処理装置のための命令を含み、高レベルの手順および/またはオブジェクト指向のプログラミング言語、および/またはアセンブリ/機械言語で実装され得る。本明細書では、用語「機械読み込み可能な媒体」とは、機械読み込み可能な信号として機械命令を受信する機械読み込み可能な媒体を含め、プログラム可能な処理装置に機械命令および/またはデータを提供するために使用される任意のコンピュータプログラム製品、装置および/またはデバイス(例えば、磁気ディスク、光ディスク、メモリ等)のことを指す。
[0130] 本開示の態様が、ソフトウェア、ハードウェア、ファームウェア、またはその任意の組み合わせにおいて少なくとも一部具現され得ることはこの説明から明らかになる。したがって、本明細書に記載される技術は、ハードウェア回路および/またはソフトウェアのどんな特定の組み合わせにも、またはコンピュータもしくは他のデータ処理システムにより実行される命令に対するどんな特定の供給源にも限定されない。むしろ、これらの技術は、任意の型のROM、RAM、キャッシュメモリ、ネットワークメモリ、フロッピーディスク、ハードドライブディスク(HDD)、固体デバイス(SSD)、光ディスク、CD−ROM、および磁気−光ディスク、EPROM、EEPROM、フラッシュメモリ、または電子形式で命令を保存するのに適当な他の任意の型の媒体を含めたメモリもしくは他のコンピュータ読み込み可能な媒体に保存されている命令のシーケンスを実行するマイクロプロセッサなど、1つもしくは複数の処理装置に応答してコンピュータシステムもしくは他のデータ処理システムにおいて実施され得る。
[0131] 加えて、処理装置は、1つもしくは複数のプログラム可能な汎用もしくは特殊用途マイクロプロセッサ、デジタル信号プロセッサ(DSP)、プログラム可能コントローラー、特定用途向け集積回路(ASIC)、プログラム可能論理デバイス(PLD)、トラステッドプラットフォームモジュール(TPM)、もしくは同種のもの、もしくはそのようなデバイスの組み合わせであることができる、またはそれらを含むことができる。別の実施形態において、論理回路または他のハードウェアに組み込まれた回路などの特殊用途ハードウェアを、ソフトウェア命令と組み合わせて使用して、本明細書に記載される技術を実装することができる。
アレイおよびキット
[0132] 本開示は、対象評価方法または対照診断方法を実施するのに使用するアレイおよびキットを提供する。
アレイ
[0133] 対象アレイは、複数の核酸を含むことができ、それのそれぞれは、ILDについて試験された個体から得られる組織サンプルに存在する細胞において差異的に発現される遺伝子にハイブリダイズする。
[0134] 対象アレイは、複数の核酸を含むことができ、それのそれぞれは、喫煙者状態について試験された個体から得られる組織サンプルに存在する細胞において差異的に発現される遺伝子にハイブリダイズする。
[0135] 対象アレイは、複数の核酸を含むことができ、それのそれぞれは、喫煙者状態およびILD両方について試験された個体から得られる組織サンプルに存在する細胞において差異的に発現される遺伝子にハイブリダイズする。
[0136] 対象アレイは、複数のメンバーの核酸を含むことができ、そのメンバー核酸のそれぞれが、異なる遺伝子産物にハイブリダイズする。いくつかの場合において、2つ以上のメンバー核酸が、同じ遺伝子産物にハイブリダイズする;例えば、いくつかの例において2、3、4、5、6、7、8、9、10個、またはより多くのメンバー核酸が、同じ遺伝子産物にハイブリダイズする。メンバー核酸は、約5ヌクレオチド(nt)〜約100nt、例えば、5、6、7、8、9、10、11、12、13、14、15、16、17 18、19、20、20〜25、25〜30、30〜40、40〜50、50〜60、60〜70、70〜80、80〜90、または90〜100ntの長さを有することができる。核酸は、1つまたは複数のリン酸骨格修飾を有することができる。
[0137] 対象アレイは、約10〜約10個の固有のメンバー核酸、または10個より多くの固有のメンバー核酸を含むことができる。例えば、対象アレイは、約10〜約10、約10〜約10、約10〜約10、約10〜約10、または10個より多くの固有のメンバー核酸を含むことができる。
省略形
Figure 2021164484
Figure 2021164484
[0138] 「ENSEMBL ID」とは、Ensembl Genome Browserデータベースの遺伝子識別子番号のことを指す(ワールドワイドウェブアドレス:ensembl.org/index.htmlを参照のこと、本明細書に組み込む)。各識別子は、「Ensembl Gene」を意味するために、文字ENSGで始まる。各ENSEMBL ID番号(すなわち、Ensemblデータベース中の各「遺伝子」)とは、特定のヒト染色体上の特定の開始および停止位置により定義される遺伝子のことを指し、したがってヒトゲノムの特定の座を定義する。平均的な当業者が十分に認めるように、本明細書に開示される遺伝子記号の全ては、遺伝子配列のことを指し、一般公開されているデータベース、例えば、UniGeneデータベース(The NCBIハンドブック、Bethesda(MD):米国バイオテクノロジー情報センター;2003年中にある、Pontius JU, Wagner L, Schuler GD. UniGene:a unified view of the transcriptome. 、ワールドワイドウェブアドレスncbi.nlm.nih.gov/unigeneで利用可能、本明細書に組み込む)、RefSeq(The NCBIハンドブック[インターネット]、Bethesda (MD): 国立医学図書館(US)、米国バイオテクノロジー情報センター;2002年10月、第18章、参照配列(RefSeq)プロジェクトワールドワイドウェブアドレス:ncbi.nlm.nih.gov/refseq/で利用可能、本明細書に組み込む)、Ensembl(EMBL、ワールドワイドウェブアドレス:ensembl.org/index.htmlで利用可能、本明細書に組み込む)、および同種のものですぐに利用できる。遺伝子記号、Ensembl IDおよびEntrez IDによって本明細書に開示される遺伝子の配列は、その全体を本明細書に組み込む。
[0139] 本明細書に引用される参照、特許および特許出願の全ては、全ての目的のためにその全体を組み込む。
実施例1
サンプル採集、病理学診断およびラベル
[0140] ビデオ支援胸腔鏡下手術(VATS)標本を、Veracyte社(South San Francisco、CA)の後援のもとに、施設内倫理委員会(IRB)に承認された進行中の多施設共同臨床手順、新規のゲノム試験(BRAVE)用の気管支サンプル採集の一部としてあらかじめ採取した。さらなるVATSおよび外科的肺生検標本を、保存供給源から得た。
[0141] 手術後に、組織検査スライドを採取し、非特定化し、専門家の病理学審査に提出した。選択したスライドをスキャンして、顕微鏡画像の永久デジタルファイルを構築した(Aperio、Vista、CA)。スライドを、図5に記述される中央病理診断プロセスにしたがって評価し、サンプルレベルおよび患者レベル両方の病理学診断を得た。病理学区分を、表3に要約する。患者は、2つ以上のサンプルレベル診断(すなわち患者当たりVATSサンプル当たり1つ、ほとんどの場合右肺の下葉および上葉のそれぞれから1つ)を有し得るが、1つの患者レベル診断しか有し得ない。
Figure 2021164484
[0143] 大部分の診断用語は、米国胸部学会(ATS)2011年または2013年ガイドライン5、6に従うが、葉レベルで特性をよりよく特徴付けるために専門の病理学者委員会によりいくつかの変更を行った。特に、「典型的なUIP」および「困難なUIP」を、ATS 2011年ガイドラインに記載の「明確なUIP」ならびに「可能性のあるUIP」の代わりに含めた。分類されていない慢性間質性線維症(CIF/NOC)は、分類不能な線維性ILDに対応する。CIF/NOCの3つのサブカテゴリ、「有利なUIP」、「有利なNSIP」および「有利なHP」を定義して、専門家の病理学委員会の判断においてUIP、非特異的間質性肺炎(NSIP)、または過敏性肺炎(HP)を示唆する特性を呈する分類不能な線維形成の症例を指定した。喫煙関連間質性線維症(SRIF)の診断も含める20
[0144] 分類のために、サンプルレベル病理学診断を、2成分クラスラベル(UIPおよび非UIP)に変換した。病理学診断区分(表3)の中で、「UIP」クラスは、(1)UIP、(2)典型的なUIP、(3)困難なUIP、および(4)CIF/NOC、有利なUIPを含む。診断不能(ND)以外の他の全ての病理学診断を、「非UIP」クラスに割り当てた。
実施例2
サンプル処理
[0145] 凍結組織サンプルを、Tissue−Tek O.C.T.媒体(Sakura Finetek U.S.A.)を使用して切片作製のために封入し、CM1800クリオスタット(Leica Biosystems、Buffalo Grove、Illinois)を使用して2×20μm切片を生成した。組織カールを、RNAprotect(QIAGEN、Valencia、California)に直ちに浸漬し、4℃で終夜インキュベートし、抽出まで−80℃で保存した。可能な場合はいつでも、隣接する5μm組織カールをスライドガラスへ封入し、標準的な手順にしたがってヘマトキシリンエオジン(H&E)染色用に処理した。
[0146] 核酸を、製造業者のガイドラインにしたがってAllPrep Microキット(QIAGEN)を使用して抽出した。トータルRNAの収量および品質を、Quant−it(Invitrogen)ならびにPico BioAnalyzerキット(Agilent)を使用して決定した。トータルRNA 15ngを、製造業者の手順にしたがってOvation FFPE WTA System(NuGEN、San Carlos、California)を使用して増幅し、GeneChip Gene ST 1.0(Affymetrix、Santa Clara、California)マイクロアレイにハイブリダイズさせ、処理し、スキャンした。発現データを、ロバストマルチアレイ平均法(RMA)により標準化した。
実施例3
次世代RNA配列決定
[0147] 全トランスクリプトームRNA配列決定を、サンプル当たり80000000個のペアエンドリードの目標最小リード深度で、選択したサンプルに対して遂行した。簡潔には、製造業者の命令にしたがってトータルRNA 10ngを、Ovation RNASeq System v2(NuGEN、San Carlos、California)を使用して増幅し、TruSeq(Illumina、San Diego、California)配列決定ライブラリを調製し、Illumina HiSeqで配列決定した。生のリードを、TopHat2を使用してhg19ゲノムアセンブリにアラインした。遺伝子カウントを、HTSeqを使用して得て、DESeq2パッケージ内のvarianceStabilizingTransformation機能を使用してBioconductorで標準化した。生カウントおよび標準化した発現レベルを、55097個の転写産物について得た。
実施例4
コホート選択および分類器トレーニング
[0148] 研究コホートは、保存された(n=128)およびあらかじめ採集したBRAVE(n=38)組織の両方を最初に含んだ。H&E染色に対して細胞性が乏しい(1名の患者からn=4)または正常肺組織所見(n=1)を持つ保存サンプルは、「分類不能な線維性ILD」、すなわちCIF/NOCと診断されたサンプル(n=3)もしくは少なくとも2名の病理学者により病理学的合意がなかったサンプル(n=29)なので、除外された。BRAVEサンプルの場合、CIF/NOCサンプルを除外しなかった。中央病理診断を逃したため、1つだけ、BRAVEコホートサンプルを削除した。残留ゲノムDNA汚染がある処理したRNAサンプル(n=2)または低品質RNA(RNAインテグリティナンバー[RIN]<4)(n=1)も、除外した。全てを除外した後、86名の患者からの125個のサンプルが、分類用として残った。含まれる患者の年齢、性別、喫煙歴および病理学診断を、表1に要約する。
Figure 2021164484
[0150] 125個のサンプル(86名の患者)が、マイクロアレイ分類に利用可能であった。患者レベル病理学サブタイプの偏りを制御しながら、86名の患者をトレーニングおよびテストセットにランダム化した(表1)。マイクロアレイトレーニングセットは、54名の患者由来の77個のサンプル(UIP 39個および非UIP 38個)からなる。マイクロアレイテストセットは、32名の患者由来の48個のサンプル(UIP 22個対非UIP 26個)からなる。
[0151] RNASeqデータを、29名の患者(表1)由来の36個のサンプルのサブセット(UIP 17個および非UIP 19個)について生成し、ILDサブタイプの範囲を表した。36個のサンプルの中で、22個がマイクロアレイトレーニングセットと重なり、14個がマイクロアレイテストセットと重なる。このデータセットのサンプルサイズが小さいため、分類能力を、交差検定(CV)だけで評価した。
実施例5
トレーニングモデル、分類、特性選択
[0152] 全ての統計分析を、R 3.0.121版を使用して実施した。マイクロアレイ分類器の場合、UIPと非UIPクラスの間で差異的に発現している遺伝子を、limmaにより順位付けし、次いで最も低い偽発見率(FDR)(<0.0003)を持つ上位200個の遺伝子を、モデル構築の候補遺伝子として先に進めた。いくつかのモデルを、異なる方法を使用して構築し、誤りが最も低いものを選んだ。特性選択およびモデル推定は、glmnetを使用してlassoペナルティを用いるロジスティック回帰により遂行した。RNASeq分類器の場合、遺伝子を、生カウントデータに対してDESeq2パッケージで実装されるワルドスタイル検定から得られるFDRにより順位付けした。上位の特性(Nは、10〜200の範囲にある)を使用して、標準化した発現データに対してe1071ライブラリを使用する線形サポートベクターマシン(SVM)をトレーニングした。
[0153] 分類器能力をCVにより評価し、利用可能な場合、独立したテストセットによって評価した。過剰当てはめを最小化するために、トレーニング/テストセットおよびCVパーティションを定義する際に、単一の患者を最小単位として維持した;すなわち、同じ患者のものであるサンプル全てを、トレーニング/テストセットまたはCVパーティションにおいて1群としてまとめた。使用したCV方法は、リーブワンペイシェントアウト(LOPO)および10倍の患者レベルCVを含む。
[0154] 能力を、所与のスコア閾値での曲線下面積(AUC)、ならびに特異性(1.0−偽陽性率)および感度(1.0−偽陰性率)として報告した。少なくとも>90%の特異性を必要とするようにスコア閾値を設定した。各能力測定について、95%信頼区間を、2000層化ブートストラップ再標本化およびpROCパッケージを使用して計算し、[上下CI]として報告した。
実施例6
外植された肺からのサンプリングにおける空間的不均質性
[0155] 3名の正常肺ドナー(n=7)およびIPFと診断された患者由来の3つの肺(n=53)からの合計60個のサンプリングを、ゲノム規模でのマイクロアレイデータを使用して分析した。移植手順の間に得られた完全に正常なおよび疾患のある肺を、Inova Fairfax、Falls Church、Verginiaの施設内倫理委員会(IRB)により承認された手順にしたがって採取した。3名の正常ドナーならびにIPFと診断された3名の患者由来の外植された肺の上下葉を、中央および周辺でサンプル採取した。外植体サンプルの位置および数を、図6に例示する。外科病理学および最終的な臨床診断は、発信機関により提供された。3名の専門の病理学者による病理学オーバーリードは、3つ全てのIPF患者外植肺におけるUIPを全員一致で確認した。
[0156] 遺伝子発現を、7つの正常および53個のIPFの外植肺サンプルで評価した。正常とIPF患者外植サンプルの間で差異的に発現している遺伝子を同定し、R limmaパッケージ(Smyth, G. K.[2005])を使用して偽発見率(FDR)により順位付けした。マイクロアレイトレーニングセットにおいてUIPと非UIPクラスの間で差異的に発現している上位200個の遺伝子を表12に示す。最低のFDR調整済P値(<1.45e-07)を持つ上位200個の遺伝子を使用して、53個のUIPサンプル全ての対についてピアソン相関係数を算出した。
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
[0158] サンプリングの数および位置(上対下および中央対周辺)を図6に、IPF患者の臨床的特徴を表4に示す。空間的不均質性を測定するのに有用な遺伝子を同定するために、正常対IPFサンプルにおいて差異的発現を探した。この比較は、約5000個のFDR<0.05で有意に差異的に発現しているRNA転写産物を作製した(データ不掲載)。上位200個の差異的に発現している遺伝子を選択し、ペアワイズ相関を測定した。IPFと診断された3名の患者の結果を、図1に示す。全てのIPFサンプル全体にわたって相関が高いにもかかわらず、3つの固有のパターンが、IPFサンプルの間の相関構造において明らかになる。ある患者(P1)は、上葉対下葉の遺伝子発現において大きな差異、すなわち遺伝子信号における低い相関を示す。ある患者(P3)は、上葉と下葉サンプリングの間でより高い相関を示す。第3の患者(P2)は、これら2つの症例間で中間の結果を示し、上葉および下葉からのサンプリングの間に時にはより高く、時にはより低い相関がある。少数の患者に関してであるとはいえ、これらの結果は、葉特異的病理学を持つサンプルが、分類器開発のトレーニング段階においてより正確であり得ることを示唆する。この情報に基づいて、葉由来病理学を使用して、サンプルレベルで割り当てた真のラベルを持つSLB組織を使用して分類器を調製した。実施例7に提示する結果は、高い期待精度でUIPおよび非UIPサンプルを分類するSLB組織における分子シグネチャーの存在を実証する。
Figure 2021164484
実施例7
外科的肺生検に対するマイクロアレイ分類器の能力
[0160] VATS中に得られた生検に対するサンプル特異的病理学ラベルを使用して、マイクロアレイ分類器を、UIPおよび非UIPサンプルを分離している上位200個の遺伝子に対するロジスティック回帰によりトレーニングした(表12を参照のこと)。最終的なモデルを、22個の遺伝子で構築した(表5)。
[0161] 発現データを、ロバストマルチアレイ平均法(RMA)により標準化した。特性選択およびモデル推定は、glmnet3を使用してlassoペナルティを用いるロジスティック回帰により遂行した。生のリードは、TopHatを使用してアラインした。遺伝子数は、HTSeqを使用して得て、DESeqを使用して標準化した。上位の特性(Nは、10〜200の範囲にある)を使用して、e1071ライブラリを使用する線形サポートベクターマシン(SVM)をトレーニングした。信頼区間は、pROCパッケージを使用して計算した。
[0162] LOPO CV能力を、受信者動作特性(ROC)曲線として要約する(図2A)。AUCは0.9[CI 0.82〜0.96]であり、特異性92%[CI 84%〜100%]および感度64%[CI 49%〜79%]である。個々のLOPO CV分類スコアを、全ての患者について示す(図2B)。3つの誤分類された非UIPサンプルの中で、2つは閾値に非常に近いスコア(0.86および1.30)を有し、1つは高いスコア(4.21)を有する。高いスコアを持つ後者のサンプルは、サンプルレベルおよび患者レベル両方で「分類不能な線維性ILD」と診断された。UIPサンプルの中で、15個(36%)が閾値以下のスコアである(偽陰性)が、それらサンプルのいずれも大きな陰性スコアではない。特定の場合においてLOPO CVは、能力を過大評価する潜在性を有するので、非常によく似た能力(5回反復した10倍CVのAUC中央値が、0.88である)を与える10倍の患者レベルCV(すなわち、患者の10%が、各ループにおいて除外される)も評価した。
Figure 2021164484
[0164] 省略形:TCID=転写産物クラスター識別;記号=遺伝子記号;logFC=ログ倍率変化;MedExpr.UIP=UIPサンプルの全体にわたる発現レベルの中央値;MedExpr.Non UIP=UIPサンプルの全体にわたる発現レベルの中央値;FDR=偽発見率;
[0165] 独立したテストセット能力を図2Cに示し、AUC 0.94[CI 0.86〜0.99]の、特異性92%[CI 81%〜100%]および感度82%[CI 64%〜95%]を示す。個々の分類スコア分布は、UIPと非UIPクラスの間の良好な分離を示す(図2D)。誤分類された2つの非UIPサンプルは、診断において不確定度を示す「分類不能な線維性ILD」の専門家の診断を、患者レベルおよびサンプルレベルの両方で有する。恐らく一連のサブ分類器を各CVループ内に適用することに固有である一層大きな変動のため、単一モデルを適用することにより得られるスコアと比較して、テストセットにおいて観察されるスコア範囲(図2D)は、LOPO CVスコアにおいて見られる範囲(図2B)より狭い。95%信頼区間を含む分類能力を、表6に要約する。
Figure 2021164484
[0167] 我々の手法は、有意な利点を提供する。初期の遺伝子発現プロファイリング研究は、IPF対HPもしくはNSIPなどいくつかの非IPF ILDサブタイプ、またはILDではない対象に対する比較に重点を置いた18,19,23,25。ここで報告される非UIPコホートは、HP、NSIP、サルコイドーシス、RB、細気管支炎、器質化肺炎(OP)、その他を含む広い範囲の病理学サブタイプを表し、したがって診療において直面するILDの多様性に近い。加えて、分類器を、保存したおよびあらかじめ採集したSLBの組み合わせを使用してトレーニングならびに試験して、サンプルの取り扱いおよび採集における潜在的差異に対する頑健性を確実にした。最終的に、初期の多くの研究は、分類エンジンを構築することなく、差異的遺伝子発現分析だけに重点を置いた。それに対し、本手法は、適切にトレーニングされ、検証された場合、独立したデータセットに対してよく一般化された分子試験を開発する厳密な方法である。
実施例8
外科的肺生検に対するRNASeq分類器の能力
[0168] RNASeqデータによる36個のサンプルのサブセットを使用して、線形SVM分類器およびLOPO CVにより評価される能力をトレーニングした。AUCは、10〜200個に及ぶ遺伝子数に対して一貫して0.80を上回る(データ不掲載)。さらなる検査のために100個の遺伝子を使用するモデルを選んだ。AUCは、0.9[CI 0.77〜1.00](特異性=95% [CI 84%〜100%]、感度=59% [CI 35%〜82%])である(図3A)。1つだけ非UIPサンプルが誤分類される(図3B)。このサンプルに対するサンプルレベル病理学は、呼吸細気管支炎(RB)であり、患者での病理学は、びまん性肺胞損傷(DAD)であり、数が少ないため2つのサブタイプはモデル化が困難であった。同じ組のサンプルに対して対応させたアレイデータを使用して類似の分析を実施した;アレイ利用分類器は、160個の遺伝子を使用して類似の能力を実現する(AUC=0.86 [CI 0.73〜0.96])。特異性は、95%[CI 84%〜100%]であり、感度は、47%[CI 24%〜71%]である(図3C)。興味深いことに、RNASeq分類器によりUIPとして誤分類された同じ非UIPサンプルは、マイクロアレイ分類器によっても誤分類される(図3D)。全体として、RNASeqに基づく分類は、アレイプラットフォームと同程度の能力を実現する。
実施例9
分類器によって使用される遺伝子と関連する生物学的経路
[0169] 機械学習プロセスにより選択された遺伝子全体にわたり共通の生物学的基礎があるかどうか決定するために、過剰リプリゼンテーション(over-representation)分析(ORA)を使用して、選択された経路における遺伝子の統計的に有意な関与を同定した。ORAテストセットとしてマイクロアレイテストセット(n=77)においてGeneTrailソフトウェア(genetrail.bioinf.uni-sb.de/)およびlimmaによりUIPと非UIPサンプルの間で差異的に発現している上位1000個の遺伝子(FDR < 0.013)を使用して、過剰/過少リプリゼンテーション分析(Over/under-representation analyses)(ORA)を遂行した。ORA参照セットは、ヒト全遺伝子(n=44829)およびKEGG経路の注釈ならびに遺伝子オントロジー(GO)データベースを含んだ。有意性は、修正FDR閾値p<0.05でフィッシャーの正確確率検定によって評価された。
[0170] UIP対非UIP比較において見出した上位1000個の遺伝子を調査するにあたって、固有の発見が明らかになった(表2)。
Figure 2021164484
Figure 2021164484
[0172] 省略形:FDR=偽発見率;GO=遺伝子オントロジー;KEGG=Kyoto Encyclopedia of Genes and Genomes;ORA=過剰リプリゼンテーション分析。
[0173] UIPにおいて、細胞接着、筋肉疾患、細胞移動および運動性に関係する遺伝子は、優勢である。これらの結果は、IPFにおいて差異的に調節される経路の以前の報告と一致する18,19,22,23。それに対し、他の非UIPサブタイプは、適応と先天性両方のシステムを含めた免疫プロセスに関係する遺伝子を過剰発現する。この強化は、非UIPコホートに存在するRBおよびHPサブタイプにより;免疫成分を呈することが公知の疾患であり得た24。KEGG経路および遺伝子オントロジー群において過剰に表れる遺伝子を表7および8に要約した。
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
実施例10
誤ラベルシミュレーション研究
[0176] 2成分分類ラベル(UIPまたは非UIP)交換シミュレーション研究を、マイクロアレイトレーニングセットに対して遂行した。サンプルを、シミュレーションセット当たり合計割合1%〜40%の範囲で、ラベル入れ替えするためにランダムに選択した。3名の専門家の病理学診断の盲検審査における合意のレベルは、3/3(n=44)、2/2(n=8)、2/3(n=24)、および1/3(n=1)である。サンプルラベルを、3名の専門の病理学者の盲検審査における意見の相違レベル:3/3または2/2の合意に対して5%、2/3の合意に対して50%、および1/3の合意に対して90%の割合を占める確率に比例する重みにより他のクラスに変えた。シミュレーションを、各割合で100回繰り返した。
[0177] LOPO CV能力(AUC)を、交換したラベルの一連の割合全体におよぶ100回の反復シミュレーションにより評価した(図4)。ラベル交換がない場合、能力の中央値は図2Aに示されるアレイ分類器能力に非常に近い(AUC=0.9)。(サンプルおよびラベルの同じセットを使用して、モデル推定にはわずかな変動があり得る)。交換率が増加するにつれて、能力は単調に減少する。ラベルの40%が交換される場合、能力の中央値は0.5に近づき、分類が偶然と変わらないことを示す。
実施例11
UIP/非UIP差異的遺伝子発現の大きさおよび方向は、喫煙者対非喫煙者試験対照において異なる。
[0178] 間質性肺疾患は、喫煙したことがない人より、喫煙する人または止める前に喫煙歴が長かった人においてより優勢である。喫煙者および非喫煙者UIPまたは非UIP対象から得られるサンプルの差異的遺伝子発現プロファイルを比較して、喫煙状態がUIP診断分類器の能力に影響を及ぼすかどうか決定した。
[0179] 経気管支生検サンプルを調製した[実施例1および2に記述される方法にしたがって、ならびにRNA配列決定分析を、実施例3に記述される方法にしたがって遂行した]。RNASeqデータを、24個のサンプル(9個のUIPおよび15個の非UIP)のサブセットについて生成し、差異的遺伝子発現を3つの2成分比較により分析した:(i)UIP対非UIP、それぞれn=9および15サンプル;(ii)非喫煙者UIP対非喫煙者非UIP、それぞれn=3および5サンプル;ならびに(iii)喫煙者UIP対喫煙者非UIP、それぞれn=12および4サンプル。
[0180] 群(i)〜(iii)に対する発現分析の結果をそれぞれ表9〜11に示し、図8〜10に要約する。UIPと非UIPサンプルの間で差異的に発現される遺伝子の数は、喫煙者と非喫煙者の間で大きく異なる。(喫煙者由来サンプルにおいて64個が差異的に発現し、非喫煙者由来サンプルにおいて671個が差異的に発現した)(図8)。さらに、非喫煙者において差異的に上方制御された特定の遺伝子は、喫煙者において下方制御された、または差異的に発現されなかった(図9および10)。これらのデータは、非喫煙者由来サンプルのUIP分類に有用な特定の遺伝子が、有益でない、または喫煙者における同じ疾患の診断と矛盾する場合があることを実証する。遺伝子発現における喫煙者状態の差異は、従来の2クラスの機械学習法を使用して生成される遺伝子発現分類器予測の能力を減少させ得る。任意選択により組み合わせられるまたはUIP対非UIP分類器と個々に組み合わせて使用される3つの異なる技術および本明細書に開示される診断方法によるUIP対非UIP診断の方法を使用してこの問題を解決する。
[0181] 最初の手法において、喫煙状態(喫煙者対非喫煙者)が、トレーニングの間にモデルにおいて共変量として使用される。この単純な手法は、特に喫煙者から得られたデータ(ノイズがより高い)においてシグナル対ノイズ比を向上させ、喫煙者および非喫煙者から得られるデータを組み合わせ、同時に使用可能にする。
[0182] 第2の手法において、分類器トレーニングの間に、喫煙者状態のバイアスの影響を受けやすい遺伝子を同定し、除外し、または任意選択により、そのようなバイアスの影響を受けにくい遺伝子と異なる重み付けをする。この方法は、トレーニングに使用される特性空間を、喫煙状態により混乱または影響を受けない遺伝子について濃縮する。
[0183] 第3の手法において、初期分類器が喫煙者を非喫煙者と区別する遺伝子シグネチャーを認識するためにトレーニングされる段階的分類の取り組みが、利用される。一旦患者サンプルが「喫煙者」または「非喫煙者」に前分類されたら、喫煙者もしくは非喫煙者それぞれにおいてUIP対非UIPを区別するためにそれぞれトレーニングされた固有の分類器を実装する。そのような喫煙者または非喫煙者特異的分類器は、診断能力の改善をもたらす。
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
Figure 2021164484
[0187] 上述した様々な実施形態を組み合わせて、さらなる実施形態を提供することができる。この明細書において参照されおよび/または出願データシートに挙げられる米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願および非特許刊行物の全ては、参照によりその全体を本明細書に組み込む。実施形態の態様は、様々な特許、出願および刊行物の概念を利用してなおさらなる実施形態を提供するために必要であれば、修飾することができる。
[0188] これらのおよび他の変更を、上の詳細な記述に照らして実施形態に作ることができる。一般に、以下の特許請求の範囲において、使用される用語は、特許請求の範囲を明細書および特許請求の範囲に開示される特定の実施形態に限定するものと解釈されるべきでなく、そのような特許請求の範囲が権利を有する等価物の全範囲とともに考え得る全ての実施形態を含むと解釈されるべきである。したがって、特許請求の範囲は開示により限定されない。
[0189] 本明細書に記載されるいくつかの実施形態は、コンピュータで実装される様々な操作を遂行するための命令またはコンピュータコードを有する非一時的なコンピュータ読み込み可能な媒体(非一時的な処理装置読み込み可能な媒体と呼ぶこともできる)を持つコンピュータ記憶製品に関する。コンピュータ読み込み可能な媒体(または処理装置読み込み可能な媒体)は、それ自体が一時的伝播信号(例えば、空間またはケーブルなど伝播媒体に情報を保有している伝播電磁波)を含まないという意味で非一時的である。媒体およびコンピュータコード(コードと呼ぶこともできる)は、特定の目的(単数または複数)のために設計および構築されたものであることができる。非一時的なコンピュータ読み込み可能な媒体の例には、ハードディスク、フロッピーディスクおよび磁気テープなど磁気記憶媒体;コンパクトディスク/デジタルビデオディスク(CD/DVD)など光記憶媒体、コンパクトディスク−読み取り専用メモリ(CD-ROM)、およびホログラフィックデバイス;光ディスクなど光磁気記憶媒体;搬送波信号プロセッシングモジュール;ならびに特定用途向け集積回路(ASIC)、プログラム可能な論理デバイス(PLD)、読み取り専用メモリ(ROM)およびランダムアクセスメモリ(RAM)デバイスなど、プログラムコードを保存し、実行するように特別に構成されるハードウェアデバイスがあるが、これに限定されない。本明細書に記載される他の実施形態は、コンピュータプログラム製品に関し、その製品は、例えば、本明細書に検討される命令および/またはコンピュータコードを含むことができる。
[0190] いくつかの実施形態および/または本明細書に記載される方法は、ソフトウェア(ハードウェア上で実行される)、ハードウェア、またはそれらの組み合わせにより遂行することができる。ハードウェアモジュールは、例えば、汎用処理装置、フィールドプログラマブルゲートアレイ(FPGA)、および/または特定用途向け集積回路(ASIC)を含むことができる。ソフトウェアモジュール(ハードウェア上で実行される)は、C、C++、Java(商標)、Ruby、Visual Basic(商標)、R、および/または他のオブジェクト指向、手順的、統計的を含めた様々なソフトウェア言語(例えば、コンピュータコード)、または他のプログラミング言語および開発ツールで表すことができる。コンピュータコードの例には、マイクロコードまたはマイクロ命令、コンパイラにより作製されるなどの機械命令、ウェブサービスを作製するのに使用されるコード、およびインタープリターを使用してコンピュータにより実行されるより高レベルの命令を含有するファイルがあるが、これに限定されない。例えば、実施形態は、命令型プログラミング言語(例えば、C、フォートラン等)、関数型プログラミング言語(例えば、Haskell、Erlang等)、論理プログラミング言語(例えば、Prolog)、オブジェクト指向プログラミング言語(例えば、Java、C++等)、統計的プログラミング言語および/または環境(例えば、R等)または他の適当なプログラミング言語および/または開発ツールを使用して実装することができる。コンピュータコードのさらなる例には、制御信号、暗号化されたコードおよび圧縮コードがあるが、これに限定されない。
参考文献
以下の参考文献の全ては、その全体を本明細書に組み込む。
1. du Bois RM. Strategies for treating idiopathic pulmonary fibrosis. Nature reviews Drug discovery 2010; 9(2): 129-40.
2. Hodnett PA, Naidich DP. Fibrosing Interstitial Lung Disease: A Practical HRCT Based Approach to Diagnosis and Management and Review of the Literature. American Journal of Respiratory Critical Care Medicine 2013.
3. American Thoracic Society. Idiopathic pulmonary fibrosis: diagnosis and treatment. International consensus statement. American Thoracic Society (ATS), and the European Respiratory Society (ERS). American journal of respiratory and critical care medicine 2000; 161(2 Pt 1): 646-64.
4. King TE, Jr., Pardo A, Selman M. Idiopathic pulmonary fibrosis. Lancet 2011; 378(9807): 1949-61.
5. Raghu G, Collard HR, Egan JJ, et al. An official ATS/ERS/JRS/ALAT statement: idiopathic pulmonary fibrosis: evidence-based guidelines for diagnosis and management. American journal of respiratory and critical care medicine 2011; 183(6): 788-824.
6. Wells AU. The revised ATS/ERS/JRS/ALAT diagnostic criteria for idiopathic pulmonary fibrosis (IPF)--practical implications. Respiratory research 2013; 14 Suppl 1: S2.
7. Fernandez Perez ER, Daniels CE, Schroeder DR, et al. Incidence, prevalence, and clinical course of idiopathic pulmonary fibrosis: a population-based study. Chest 2010; 137(1): 129-37.
8. du Bois RM, Weycker D, Albera C, et al. Ascertainment of individual risk of mortality for patients with idiopathic pulmonary fibrosis. American journal of respiratory and critical care medicine 2011; 184(4): 459-66.
9. King TE, Jr., Bradford WZ, Castro-Bernardini S, et al. A phase 3 trial of pirfenidone in patients with idiopathic pulmonary fibrosis. N Engl J Med 2014; 370(22): 2083-92.
10. Richeldi L, du Bois RM, Raghu G, et al. Efficacy and safety of nintedanib in idiopathic pulmonary fibrosis. N Engl J Med 2014; 370(22): 2071-82.
11. Woodcock HV, Maher TM. The treatment of idiopathic pulmonary fibrosis. F1000prime reports 2014; 6: 16.
12. Cottin V, Richeldi L. Neglected evidence in idiopathic pulmonary fibrosis and the importance of early diagnosis and treatment. European respiratory review : an official journal of the European Respiratory Society 2014; 23(131): 106-10.
13. Sumikawa H, Johkoh T, Colby TV, et al. Computed tomography findings in pathological usual interstitial pneumonia: relationship to survival. American journal of respiratory and critical care medicine 2008; 177(4): 433-9.
14. Wells AU. Managing diagnostic procedures in idiopathic pulmonary fibrosis. European respiratory review : an official journal of the European Respiratory Society 2013; 22(128): 158-62.
15. Collard HR, King TE, Jr., Bartelson BB, Vourlekis JS, Schwarz MI, Brown KK. Changes in clinical and physiologic variables predict survival in idiopathic pulmonary fibrosis. American journal of respiratory and critical care medicine 2003; 168(5): 538-42.
16. Nicholson AG, Addis BJ, Bharucha H, et al. Inter-observer variation between pathologists in diffuse parenchymal lung disease. Thorax 2004; 59(6): 500-5.
17. Flaherty KR, King TE, Jr., Raghu G, et al. Idiopathic interstitial pneumonia: what is the effect of a multidisciplinary approach to diagnosis? American journal of respiratory and critical care medicine 2004; 170(8): 904-10.
18. Selman M, Pardo A, Barrera L, et al. Gene expression profiles distinguish idiopathic pulmonary fibrosis from hypersensitivity pneumonitis. American journal of respiratory and critical care medicine 2006; 173(2): 188-98.
19. Lockstone HE, Sanderson S, Kulakova N, et al. Gene set analysis of lung samples provides insight into pathogenesis of progressive, fibrotic pulmonary sarcoidosis. American journal of respiratory and critical care medicine 2010; 181(12): 1367-75.
20. Katzenstein AL. Smoking-related interstitial fibrosis (SRIF), pathogenesis and treatment of usual interstitial pneumonia (UIP), and transbronchial biopsy in UIP. Modern pathology : an official journal of the United States and Canadian Academy of Pathology, Inc 2012; 25 Suppl 1: S68-78.
21. Team RC. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria http://wwwR-projectorg/ 2014.
22. Pardo A, Gibson K, Cisneros J, et al. Up-regulation and profibrotic role of osteopontin in human idiopathic pulmonary fibrosis. PLoS medicine 2005; 2(9): e251.
23. DePianto DJ, Chandriani S, Abbas AR, et al. Heterogeneous gene expression signatures correspond to distinct lung pathologies and biomarkers of disease severity in idiopathic pulmonary fibrosis. Thorax 2014.
24. Selman M, Pardo A, King TE, Jr. Hypersensitivity pneumonitis: insights in diagnosis and pathobiology. American journal of respiratory and critical care medicine 2012; 186(4): 314-24.
25. Yang IV, Coldren CD, Leach SM, et al. Expression of cilium-associated genes defines novel molecular subtypes of idiopathic pulmonary fibrosis. Thorax 2013.
26. Garcia-Alvarez J, Ramirez R, Checa M, et al. Tissue inhibitor of metalloproteinase-3 is up-regulated by transforming growth factor-beta1 in vitro and expressed in fibroblastic foci in vivo in idiopathic pulmonary fibrosis. Experimental lung research 2006; 32(5): 201-14.
27. Piotrowski WJ, Gorski P, Pietras T, Fendler W, Szemraj J. The selected genetic polymorphisms of metalloproteinases MMP2, 7, 9 and MMP inhibitor TIMP2 in sarcoidosis. Medical science monitor : international medical journal of experimental and clinical research 2011; 17(10): CR598-607.
28. Chaudhuri R, McSharry C, Brady J, et al. Low sputum MMP-9/TIMP ratio is associated with airway narrowing in smokers with asthma. The European respiratory journal : official journal of the European Society for Clinical Respiratory Physiology 2014; 44(4): 895-904.
29. Hviid TV, Milman N, Hylenius S, Jakobsen K, Jensen MS, Larsen LG. HLA-G polymorphisms and HLA-G expression in sarcoidosis. Sarcoidosis, vasculitis, and diffuse lung diseases : official journal of WASOG / World Association of Sarcoidosis and Other Granulomatous Disorders 2006; 23(1): 30-7.
30. Li GY, Kim M, Kim JH, Lee MO, Chung JH, Lee BH. Gene expression profiling in human lung fibroblast following cadmium exposure. Food and chemical toxicology : an international journal published for the British Industrial Biological Research Association 2008; 46(3): 1131-7.
31. Ozsolak F, Milos PM. RNA sequencing: advances, challenges and opportunities. Nature reviews Genetics 2011; 12(2): 87-98.
32. Mutz KO, Heilkenbrinker A, Lonne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Current opinion in biotechnology 2013; 24(1): 22-

Claims (30)

  1. 肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法であって:
    対象の試験サンプル中の第1群の転写産物および第2群の転写産物それぞれの発現レベルをアッセイする工程であって、前記第1群の転写産物が、UIPにおいて過剰発現され、かつ、表5、7、9、10、11および12のいずれかに挙げた遺伝子のいずれか1つに対応する1つまたは複数の配列を含み、前記第2群の転写産物が、UIPにおいて過小発現され、かつ、表5、8、9、10、11または12のいずれかに挙げた遺伝子のいずれか1つに対応する1つまたは複数の配列を含む工程と;
    前記第1群の転写産物および前記第2群の転写産物それぞれの発現レベルを、対応する転写産物の参照発現レベルと比較する工程であって、(1)前記参照発現レベルと比較して(a)前記第1群に対応する発現レベルにおける増加および/または(b)前記第2群に対応する発現レベルにおける低下がある場合に前記肺組織を通常型間質性肺炎(UIP)と分類する、あるいは(2)前記参照発現レベルと比較して(c)前記第2群に対応する発現レベルにおける増加および/または(d)前記第1群に対応する発現レベルにおける低下がある場合に肺組織を非通常型間質性肺炎(非UIP)と分類する、工程と
    を含む方法。
  2. 肺組織サンプルが通常型間質性肺炎(UIP)または非通常型間質性肺炎(非UIP)に陽性か検出する方法であって:
    対象の肺組織由来試験サンプル中の第1群の転写産物および第2群の転写産物それぞれの発現レベルを配列決定、アレイハイブリダイゼーションまたは核酸増幅によりアッセイする工程であって、前記第1群の転写産物が、UIPにおいて過剰発現され、かつ、表5、7、9、10、11および12のいずれかに挙げた遺伝子のいずれか1つに対応する1つまたは複数の配列を含み、前記第2群の転写産物が、UIPにおいて過小発現され、かつ、表5、8、9、10、11または12のいずれかに挙げた遺伝子のいずれか1つに対応する1つまたは複数の配列を含む工程と;
    前記第1群の転写産物および前記第2群の転写産物それぞれの発現レベルを、対応する転写産物の参照発現レベルと比較する工程であって、(1)前記参照発現レベルと比較して(a)前記第1群に対応する発現レベルにおける増加および/または(b)前記第2群に対応する発現レベルにおける低下がある場合に前記肺組織を通常型間質性肺炎(UIP)と分類する、あるいは(2)前記参照発現レベルと比較して(c)前記第2群に対応する発現レベルにおける増加および/または(d)前記第1群に対応する発現レベルにおける低下がある場合に肺組織を非通常型間質性肺炎(非UIP)と分類する、工程と
    を含む方法。
  3. 肺組織サンプルが、UIPまたは非UIPに陽性かを検出する方法であり:
    前記サンプル中で発現している2つ以上の転写産物の発現レベルを測定する工程と;
    コンピュータ生成分類器を使用する工程であって、前記サンプルをUIPおよび非UIPに分類する、工程と
    を含み;
    前記分類器が、HP、NSIP、サルコイドーシス、RB、細気管支炎、および器質化肺炎(OP)を含む非UIP病理学サブタイプの不均質なスペクトラムを使用してトレーニングされる方法。
  4. 前記試験サンプルが、生検サンプルまたは気管支肺胞洗浄サンプルである、請求項1〜3のいずれか一項に記載の方法。
  5. 前記試験サンプルが、新鮮凍結または固定される、請求項1〜3のいずれか一項に記載の方法。
  6. 前記発現レベルが、RT−PCR、DNAマイクロアレイハイブリダイゼーション、RNASeqまたはそれらの組み合わせにより決定される、請求項の1〜3いずれか一項に記載の方法。
  7. 前記方法が、試験サンプルにおいて発現しているRNAから作製されるcDNAを検出する工程を含む、請求項1〜3のいずれか一項に記載の方法。
  8. 前記cDNAが、検出工程に先立って複数のcDNA転写産物から増幅される、請求項7に記載の方法。
  9. 前記転写産物の1つまたは複数が標識される、請求項1〜3のいずれか一項に記載の方法。
  10. 前記試験サンプル中の少なくとも1つの対照核酸の発現レベルを測定する工程をさらに含む、請求項1〜3のいずれか一項に記載の方法。
  11. 前記肺組織が、間質性肺疾患(ILD)、ILDの特定の型、非ILD、または非診断のいずれか1つに分類される、請求項1〜3のいずれか一項に記載の方法。
  12. 前記肺組織が、特発性肺線維症(IPF)または非特異性間質性肺炎(NSIP)のいずれかに分類される、請求項1〜3のいずれか一項に記載の方法。
  13. 前記方法が、配列番号1〜22のいずれか1つの1つまたは複数の転写産物の発現レベルについて前記試験サンプルをアッセイする工程を含む、請求項1または2に記載の方法。
  14. 1〜20個の他の遺伝子の発現レベルについて前記試験サンプルをアッセイする工程をさらに含む、請求項13に記載の方法。
  15. 前記方法が、配列番号1〜22のいずれか1つの1つまたは複数の転写産物の発現レベルについて前記試験サンプルをアッセイする工程を含む、請求項3に記載の方法。
  16. (1)または(2)の分類工程に対する共変量として喫煙状態を使用する工程をさらに含む、請求項1〜2のいずれか一項に記載の方法。
  17. 喫煙状態が、前記対象の喫煙者状態の指標となる発現プロファイルを検出することにより決定される、請求項16に記載の方法。
  18. 前記サンプルの分類が、喫煙者状態のバイアスの影響を受けやすい1つまたは複数の転写産物の発現レベルの検出を含み、喫煙者状態のバイアスの影響を受けやすい前記転写産物に、喫煙者のバイアスの影響を受けにくい転写産物と異なる重み付けをする、請求項1〜17のいずれか一項に記載の方法。
  19. 前記サンプルの分類が、喫煙者状態のバイアスの影響を受けやすい1つまたは複数の転写産物の発現レベルの検出を含み、喫煙者状態のバイアスの影響を受けやすい前記転写産物を分類工程から除外する、請求項1〜18のいずれか一項に記載の方法。
  20. 前記第1群が、2つ以上の異なる転写産物、または3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、または20個超の異なる転写産物を含む、請求項1〜2のいずれか一項に記載の方法。
  21. 前記第2群が、2つ以上の異なる転写産物、または3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、または20個超の異なる転写産物を含む、請求項1〜2のいずれか一項に記載の方法。
  22. 配列番号1〜22のいずれか1つの、2つ以上の異なる転写産物、または配列番号1〜22のいずれか1つの3つ以上、4つ以上、5つ以上、10個以上、15個以上、20個以上、または20個超の異なる転写産物を検出する工程を含む、請求項13または15に記載の方法。
  23. 配列番号1〜22の転写産物全ての発現レベルについて前記試験サンプルをアッセイする工程を含む、請求項13または15に記載の方法。
  24. 1〜20個の他の遺伝子の発現レベルについて前記試験サンプルをアッセイする工程をさらに含む、請求項15、22または23に記載の方法。
  25. 前記他の遺伝子が、HMCN2、ADAMTSL1、CD79B、KEL、KLHL14、MPP2、NMNAT2、PLXDC1、CAPN9、TALDO1、PLK4、IGHV3−72、IGKV1−9およびCNTN4を含むかまたはそれらからなる、請求項24に記載の方法。
  26. 前記分類工程に対する共変量として喫煙状態を使用することをさらに含む、請求項3に記載の方法。
  27. 前記方法が、前記分類工程に先立って共変量として喫煙状態を使用する、請求項16または27に記載の方法。
  28. 遺伝子発現、バリアント、突然変異、融合、ヘテロ接合性の喪失(LOH)および生物学的経路効果から選択される1つまたは複数の特性を使用してトレーニングされる分類器を実装する工程を含む、請求項1〜27のいずれか一項に記載の方法。
  29. 前記分類器が、遺伝子発現、配列バリアント、突然変異、融合、ヘテロ接合性の喪失(LOH)および生物学的経路効果を含む特性を使用してトレーニングされる、請求項29に記載の方法。
  30. 前記分類工程が、前記試験サンプル中の配列バリアントを検出する工程と、前記サンプルをUIPまたは非UIPとして分類するために、前記配列バリアントを参照サンプル中のそれぞれの配列と比較する工程とをさらに含む、請求項1〜29のいずれか一項に記載の方法。
JP2021117469A 2014-11-05 2021-07-15 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法 Pending JP2021164484A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462075328P 2014-11-05 2014-11-05
US62/075,328 2014-11-05
US201562130800P 2015-03-10 2015-03-10
US62/130,800 2015-03-10
JP2017543316A JP7356788B2 (ja) 2014-11-05 2015-11-05 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017543316A Division JP7356788B2 (ja) 2014-11-05 2015-11-05 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Publications (2)

Publication Number Publication Date
JP2021164484A true JP2021164484A (ja) 2021-10-14
JP2021164484A5 JP2021164484A5 (ja) 2022-02-28

Family

ID=55909824

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017543316A Active JP7356788B2 (ja) 2014-11-05 2015-11-05 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法
JP2021117469A Pending JP2021164484A (ja) 2014-11-05 2021-07-15 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017543316A Active JP7356788B2 (ja) 2014-11-05 2015-11-05 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Country Status (5)

Country Link
US (4) US20170335396A1 (ja)
EP (2) EP3770274A1 (ja)
JP (2) JP7356788B2 (ja)
CN (2) CN114606309A (ja)
WO (1) WO2016073768A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10526655B2 (en) 2013-03-14 2020-01-07 Veracyte, Inc. Methods for evaluating COPD status
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
CN114606309A (zh) 2014-11-05 2022-06-10 威拉赛特公司 使用机器学习和高维转录数据的诊断系统和方法
CA3033241A1 (en) * 2016-09-07 2018-03-15 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
CA3036597C (en) * 2016-09-14 2023-03-28 Philip Morris Products S.A. Systems, methods, and gene signatures for predicting a biological status of an individual
BR112019014841A2 (pt) 2017-01-23 2020-04-28 Regeneron Pharma rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13
SG11201909453RA (en) 2017-04-11 2019-11-28 Regeneron Pharma Assays for screening activity of modulators of members of the hydroxysteroid (17-beta) dehydrogenase (hsd17b) family
CN110958853B (zh) * 2017-06-02 2023-08-25 威拉赛特公司 用于鉴定或监测肺病的方法和系统
WO2019075181A1 (en) 2017-10-11 2019-04-18 Regeneron Pharmaceuticals, Inc. INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION
WO2019202767A1 (ja) * 2018-04-17 2019-10-24 国立大学法人大阪大学 抗線維化剤及び線維症のバイオマーカー
CN110819700A (zh) * 2018-08-10 2020-02-21 杭州米天基因科技有限公司 一种构建肺部小结节计算机辅助检测模型的方法
CN110838363B (zh) * 2018-08-16 2023-02-21 宏达国际电子股份有限公司 控制方法以及医学系统
US20200075129A1 (en) * 2018-08-30 2020-03-05 Life Technologies Corporation Machine learning system for genotyping pcr assays
CN111401214B (zh) * 2020-03-12 2023-04-18 四川大学华西医院 一种基于深度学习的多分辨率集成her2判读方法
WO2022060842A1 (en) * 2020-09-15 2022-03-24 The Trustees Of Columbia University In The City Of New York Systems and methods for predicting graft dysfunction with exosome proteins
CN113607941A (zh) * 2020-10-22 2021-11-05 广州中医药大学顺德医院(佛山市顺德区中医院) 一种新型冠状病毒肺炎重症区分与疗效评价系统
EP4351723A2 (en) * 2021-06-11 2024-04-17 Acceleron Pharma Inc. Actrii proteins and uses thereof
WO2023059743A1 (en) * 2021-10-05 2023-04-13 Neumora Therapeutics, Inc. Machine learning systems for training encoder and decoder neural networks

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014144564A2 (en) * 2013-03-15 2014-09-18 Veracyte, Inc. Biomarkers for diagnosis of lung diseases and methods of use thereof
JP2018504138A (ja) * 2014-11-05 2018-02-15 ベラサイト インコーポレイテッド 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Family Cites Families (327)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3640268A (en) 1965-10-23 1972-02-08 Hugh J Davis Method and device for biopsy specimen collecting and handling
AT277936B (de) 1968-02-27 1970-01-12 Guenter Dipl Ing Knapp Verfahren zur quantitativen Bestimmung von Jod und von Schilddrüsenhormonen sowie Vorrichtung zur Durchführung des Verfahrens
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4641662A (en) 1984-09-28 1987-02-10 Jaicks John R Endocervical curette system
US4800896A (en) 1985-11-08 1989-01-31 Jalowayski Alfredo A Cell sample collector probe
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US6013431A (en) 1990-02-16 2000-01-11 Molecular Tool, Inc. Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5798257A (en) 1990-07-09 1998-08-25 Research Corporation Technologies, Inc. Nucleic acid encoding human MTS-1 protein
ATE199054T1 (de) 1990-12-06 2001-02-15 Affymetrix Inc A Delaware Corp Verbindungen und ihre verwendung in einer binären synthesestrategie
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5994069A (en) 1996-01-24 1999-11-30 Third Wave Technologies, Inc. Detection of nucleic acids by multiple sequential invasive cleavages
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
US5726060A (en) 1991-09-17 1998-03-10 Bridges; Michael Anthony Method for culturing mammalian respiratory epithelial cells
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
EP1588761A3 (en) 1991-11-22 2005-11-23 Affymetrix, Inc. Method of forming arrays of polymers
US6204370B1 (en) 1992-03-11 2001-03-20 Institute Of Virology, Slovak Academy Of Sciences MN gene and protein
US6027887A (en) 1992-03-11 2000-02-22 Institute Of Virology, Solvak Academy Of Sciences MN gene and protein
US5541061A (en) 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries
US5288514A (en) 1992-09-14 1994-02-22 The Regents Of The University Of California Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support
US5422273A (en) 1993-03-23 1995-06-06 Baal Medical Products, Inc. Cell collection apparatus
US5876978A (en) 1993-04-06 1999-03-02 Medical College Of Ohio Method for quantitative measurement of gene expression using multiplex competitive reverse transcriptase-polymerase chain reaction
US5477863A (en) 1993-04-14 1995-12-26 Grant; Michael A. Collection kit with a sample collector
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
US5529925A (en) 1993-12-03 1996-06-25 St. Jude Children's Research Hospital Nucleic acid sequences and fusion proteins present in human t(2;5) lymphoma
US5440942A (en) 1994-02-02 1995-08-15 Hubbard; Stephen H. Biological sample collecting and holding device
US5989815A (en) 1994-03-18 1999-11-23 University Of Utah Research Foundation Methods for detecting predisposition to cancer at the MTS gene
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
US7625697B2 (en) 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby
US5830753A (en) 1994-09-30 1998-11-03 Ludwig Institute For Cancer Research Isolated nucleic acid molecules coding for tumor rejection antigen precursor dage and uses thereof.
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US5705365A (en) 1995-06-07 1998-01-06 Gen-Probe Incorporated Kits for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5710029A (en) 1995-06-07 1998-01-20 Gen-Probe Incorporated Methods for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
WO1997007828A1 (en) 1995-08-30 1997-03-06 The Regents Of The University Of California Therapy for cellular accumulation in chronic inflammatory diseases
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
KR100262838B1 (ko) 1996-04-16 2003-03-15 기시모토 다다미쓰 고형암세포및조직이형성의검출방법,및골수이식및말초혈간세포이식용조직의검사방법
US6136182A (en) 1996-06-07 2000-10-24 Immunivest Corporation Magnetic devices and sample chambers for examination and manipulation of cells
GB9711040D0 (en) 1997-05-29 1997-07-23 Duff Gordon W Prediction of inflammatory disease
WO1998057145A1 (en) 1997-06-10 1998-12-17 Quadrivium, L.L.C. System and method for detection of a biological condition
US20020076735A1 (en) 1998-09-25 2002-06-20 Williams Lewis T. Diagnostic and therapeutic methods using molecules differentially expressed in cancer cells
US6085907A (en) 1998-05-08 2000-07-11 Institute Of Legal Medicine, University Of Bern Foldable cardboard box for contact-free drying and long-term storage of biological evidence recovered on cotton swabs and forensic evidence collection kit including same
WO1999060160A1 (en) 1998-05-21 1999-11-25 Diadexus Llc A novel method of diagnosing, monitoring, and staging lung cancer
CA2329776C (en) 1998-06-08 2009-02-10 Fuso Pharmaceutical Industries, Ltd. Antibody against lar phosphatase subunit
US6204375B1 (en) 1998-07-31 2001-03-20 Ambion, Inc. Methods and reagents for preserving RNA in cell and tissue samples
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
ATE374833T1 (de) 1998-11-09 2007-10-15 Eiken Chemical Verfahren zur synthese von nukleinsäuren
US20040241728A1 (en) 1999-01-06 2004-12-02 Chondrogene Limited Method for the detection of lung disease related gene transcripts in blood
US6436642B1 (en) 1999-04-20 2002-08-20 Curagen Corporation Method of classifying a thyroid carcinoma using differential gene expression
WO2000079257A1 (en) 1999-06-22 2000-12-28 President And Fellows Of Harvard College Molecular and atomic scale evaluation of biopolymers
US7258838B2 (en) 1999-06-22 2007-08-21 President And Fellows Of Harvard College Solid state molecular probe device
US6746846B1 (en) 1999-06-30 2004-06-08 Corixa Corporation Methods for diagnosing lung cancer
US6667154B1 (en) 1999-06-30 2003-12-23 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
NZ517121A (en) 1999-09-13 2004-05-28 Nugen Technologies Inc Methods and compositions for linear isothermal amplification of polynucleotide sequences
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
CA2386987A1 (en) 1999-10-18 2001-04-26 Dennis Marshall-Fraser Sample taking device
WO2001052789A2 (en) 2000-01-20 2001-07-26 The Brigham And Women's Hospital, Inc. PAX8-PPARη NUCLEIC ACID MOLECULES AND POLYPEPTIDES AND USES THEREOF
US7361488B2 (en) 2000-02-07 2008-04-22 Illumina, Inc. Nucleic acid detection methods using universal priming
US6383804B1 (en) 2000-07-13 2002-05-07 International Bioproducts, Inc. Sampling device with snap-off head and method of use
AU2001281136A1 (en) 2000-08-04 2002-02-18 Board Of Regents, The University Of Texas System Detection and diagnosis of smoking related cancers
EP1346043A2 (en) 2000-11-20 2003-09-24 Diadexus, Inc. Compositions and methods relating to lung specific genes and proteins
AU2002236507A1 (en) 2000-11-29 2002-06-11 Cangen International Dap-kinase and hoxa9, two human genes associated with genesis, progression, and aggressiveness of non-small cell lung cancer
US6988040B2 (en) 2001-01-11 2006-01-17 Affymetrix, Inc. System, method, and computer software for genotyping analysis and identification of allelic imbalance
US6972181B2 (en) 2001-01-12 2005-12-06 Mount Sinai School Of Medicine Of New York University Differential diagnosis of cancer and other conditions based on expression of p63
WO2003040325A2 (en) 2001-02-01 2003-05-15 Curagen Corporation Novel proteins and nucleic acids encoding same
WO2002064781A2 (en) 2001-02-09 2002-08-22 Active Pass Pharmaceuticals, Inc. Regulation of amyloid precursor protein expression by modification of abc transporter expression or activity
US7026163B1 (en) 2001-02-23 2006-04-11 Mayo Foundation For Medical Education And Research Sulfotransferase sequence variants
US20030190602A1 (en) 2001-03-12 2003-10-09 Monogen, Inc. Cell-based detection and differentiation of disease states
KR20030094281A (ko) 2001-03-12 2003-12-11 모노젠, 인크. 세포에 기초한 질병상태의 검출 및 질병상태의 구별
US20040197785A1 (en) 2001-03-14 2004-10-07 Willey James C. Method for quantitative measurement of gene expression for indentifying individuals at risk for bronchogenic carcinoma
JP2005527180A (ja) 2001-04-18 2005-09-15 プロテイン デザイン ラブス, インコーポレイテッド 肺がんの診断方法、肺がんの修飾因子の組成及びスクリーニングの方法
US6494845B2 (en) 2001-05-04 2002-12-17 Oralscan Laboratories, Inc. Retractable brush for use with endoscope for brush biopsy
AU2002355963A1 (en) 2001-08-16 2003-03-03 Genzyme Corporation Molecular characteristics of non-small cell lung cancer
EP1440311B1 (en) 2001-08-31 2009-01-07 Gen-Probe Incorporated Affinity-shifted probes for quantifying analyte polynucleotides
US6824520B2 (en) 2001-09-21 2004-11-30 Pulmonary Data Services, Inc. Method and apparatus for tracking usage of a respiratory measurement device
EP1444361A4 (en) 2001-09-28 2006-12-27 Whitehead Biomedical Inst CLASSIFICATION OF LUNG CARCINOMAS BY GENE EXPRESSION ANALYSIS
CN1620309A (zh) * 2001-12-18 2005-05-25 蒙多生物技术实验室 用于结合分子诊断法改进间质性肺疾病的治疗的干扰素γ或甲苯吡啶酮的新型药物组合物
US7141372B2 (en) 2002-01-18 2006-11-28 Health Research Incorporated Universal RT-coupled PCR method for the specific amplification of mRNA
US20040005294A1 (en) 2002-02-25 2004-01-08 Ho-Young Lee IGFBP-3 in the diagnosis and treatment of cancer
JP2006506945A (ja) 2002-03-28 2006-03-02 メディカル・カレッジ・オブ・オハイオ 遺伝子発現プロフィールを使用する非小細胞肺癌の診断および処置のための方法および組成物
US20030194734A1 (en) 2002-03-29 2003-10-16 Tim Jatkoe Selection of markers
US20030186248A1 (en) 2002-03-29 2003-10-02 Erlander Mark G. Interpreting cytological specimens via molecular histological signatures
US20050143933A1 (en) 2002-04-23 2005-06-30 James Minor Analyzing and correcting biological assay data using a signal allocation model
DE10219117C1 (de) 2002-04-29 2003-10-30 Adnagen Ag Verfahren zur Stabilisierung von RNS und Verwendungen von Stabilisierungspuffern
AU2003234623A1 (en) 2002-05-16 2003-12-02 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening
WO2004005891A2 (en) 2002-07-10 2004-01-15 The Regents Of The University Of Michigan Expression profile of lung cancer
WO2004011625A2 (en) 2002-07-31 2004-02-05 University Of Southern California Polymorphisms for predicting disease and treatment outcome
DE60324810D1 (de) 2002-09-20 2009-01-02 New England Biolabs Inc HELICASE-ABHuNGIGE AMPLIFIKATION VON NUKLEINSUREN
EP1403638A1 (en) 2002-09-25 2004-03-31 Mondobiotech SA Molecular methods for diagnosing interstitial lung diseases
SI1549652T1 (sl) 2002-09-30 2009-04-30 Bayer Healthcare Ag Kondenzirani azolpirimidinski derivati
US7300788B2 (en) 2002-10-08 2007-11-27 Affymetrix, Inc. Method for genotyping polymorphisms in humans
US20050266443A1 (en) 2002-10-11 2005-12-01 Thomas Jefferson University Novel tumor suppressor gene and compositions and methods for making and using the same
WO2004042057A1 (ja) 2002-11-07 2004-05-21 Daiichi Pure Chemicals Co., Ltd. 遺伝子変異検出法
AU2004254552B2 (en) 2003-01-29 2008-04-24 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2004070062A2 (en) 2003-02-04 2004-08-19 Wyeth Compositions and methods for diagnosing and treating cancers
PT1597391E (pt) 2003-02-20 2008-12-19 Genomic Health Inc Utilização de arn intrónico para medir a expressão genética
WO2004081564A1 (en) 2003-03-14 2004-09-23 Peter Maccallum Cancer Institute Expression profiling of tumours
US20040241725A1 (en) 2003-03-25 2004-12-02 Wenming Xiao Lung cancer detection
WO2004091383A2 (en) 2003-04-01 2004-10-28 Genzyme Corporation Breast endothelial cell expression patterns
WO2004091511A2 (en) 2003-04-10 2004-10-28 Genzyme Corporation Compositions and methods to diagnose and treat lung cancer
US7378233B2 (en) 2003-04-12 2008-05-27 The Johns Hopkins University BRAF mutation T1796A in thyroid cancers
WO2005001132A2 (en) 2003-05-30 2005-01-06 The Board Of Trustees Of The University Of Illinois Gene expression profiles that identify genetically elite ungulate mammals
EP1639090A4 (en) 2003-06-09 2008-04-16 Univ Michigan COMPOSITIONS AND METHODS FOR TREATING AND DIAGNOSING CANCER
WO2004111197A2 (en) 2003-06-10 2004-12-23 Trustees Of Boston University Gene expression signatures, methods and compositions for diagnosing disorders of the lung
CA3084542A1 (en) 2003-06-10 2005-01-06 The Trustees Of Boston University Gene expression analysis of airway epithelial cells for diagnosing lung cancer
ES2905579T3 (es) 2003-07-10 2022-04-11 Genomic Health Inc Algoritmo del perfil de expresión y prueba para el pronóstico de la recaída del cáncer de mama
WO2005007830A2 (en) 2003-07-14 2005-01-27 Mayo Foundation For Medical Education And Research Methods and compositions for diagnosis, staging and prognosis of prostate cancer
US20070038386A1 (en) 2003-08-05 2007-02-15 Schadt Eric E Computer systems and methods for inferring casuality from cellular constituent abundance data
US7678061B2 (en) 2003-09-18 2010-03-16 Cardiac Pacemakers, Inc. System and method for characterizing patient respiration
US20070148650A1 (en) 2003-11-12 2007-06-28 Trustees Of Boston University Isolation of nucleic acid from mouth epithelial cells
US20050130177A1 (en) 2003-12-12 2005-06-16 3M Innovative Properties Company Variable valve apparatus and methods
EP1694866A4 (en) 2003-12-12 2007-12-26 Bayer Pharmaceuticals Corp GENE EXPRESSION PROFILES AND METHODS OF USE
JP2005168432A (ja) 2003-12-12 2005-06-30 Nara Institute Of Science & Technology 甲状腺濾胞癌と甲状腺濾胞腺腫を判別するためのデータを収集するための方法及び該方法のためのキット
US20050250125A1 (en) 2003-12-19 2005-11-10 Novakoff James L Method for conducting pharmacogenomics-based studies
US20090020433A1 (en) 2003-12-31 2009-01-22 Microfabrica Inc. Electrochemical Fabrication Methods for Producing Multilayer Structures Including the use of Diamond Machining in the Planarization of Deposits of Material
US7407755B2 (en) 2004-01-15 2008-08-05 Lubinski Jan Determining a predisposition to cancer
EP2295604B1 (en) 2004-02-09 2015-04-08 Thomas Jefferson University Diagnosis and treatment of cancers with microRNA located in or near cancer-associated chromosomal features
WO2005085471A2 (de) 2004-03-03 2005-09-15 Universität Leipzig Verfahren und mittel zur differentiellen diagnose von schilddrüsentumoren
EP1753873A4 (en) 2004-03-05 2008-11-05 Ohio Med College METHODS AND COMPOSITIONS FOR THE EVALUATION OF NUCLEIC ACIDS AND ALLELES
US8426126B2 (en) 2004-03-18 2013-04-23 Applied Biosystems, Llc Modified surfaces as solid supports for nucleic acid purification
US7238485B2 (en) 2004-03-23 2007-07-03 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
JP2005304497A (ja) 2004-03-25 2005-11-04 Joji Inasawa 特定の癌関連遺伝子を用いる癌の検出方法及び癌の抑制方法
WO2005095654A1 (en) 2004-03-25 2005-10-13 Biohelix Corporation Helicase-dependent amplification of circular nucleic acids
US7319011B2 (en) 2004-04-08 2008-01-15 Duke University Method for distinguishing follicular thyroid adenoma (FTA) from follicular thyroid carcinoma (FTC)
DE602005025211D1 (de) 2004-04-09 2011-01-20 Us Gov Health & Human Serv Diagnosegerät zur diagnose gutartiger gegenüber bösartigen schilddrüsenläsionen
US20050240357A1 (en) 2004-04-26 2005-10-27 Minor James M Methods and systems for differential clustering
US20060019272A1 (en) 2004-05-03 2006-01-26 The Regents Of The University Of Colorado Diagnosis of disease and monitoring of therapy using gene expression analysis of peripheral blood cells
EP2471924A1 (en) 2004-05-28 2012-07-04 Asuragen, INC. Methods and compositions involving microRNA
MXPA06014046A (es) 2004-06-04 2007-08-14 Aviaradx Inc La importancia del gen hoxb13 para cancer.
US20070020655A1 (en) 2005-06-03 2007-01-25 Aviaradx, Inc. Identification of Tumors and Tissues
JP4533015B2 (ja) 2004-06-15 2010-08-25 キヤノン株式会社 化合物及びそれを用いた有機エレクトロルミネッセンス素子
US20060019615A1 (en) 2004-07-24 2006-01-26 Ditmer Larry R Wireless keying for a continuous wave (CW) amateur radio transmitter
GB0417740D0 (en) 2004-08-10 2004-09-08 Uc3 Methods and kit for the prognosis of breast cancer
KR20070044048A (ko) 2004-08-11 2007-04-26 더 클리브랜드 클리닉 파운데이션 갑상선암의 검출방법
AU2005272823B2 (en) 2004-08-13 2012-04-12 President And Fellows Of Harvard College An ultra high-throughput opti-nanopore DNA readout platform
HUE039237T2 (hu) 2004-10-06 2018-12-28 Mayo Found Medical Education & Res B7-H1 és PD-1 vesesejt karcinoma kezelésében
US7629325B2 (en) 2004-10-11 2009-12-08 Technion Research & Development Foundation Ltd. Human Sef isoforms and methods of using same for cancer diagnosis and gene therapy
US7485468B2 (en) 2004-10-15 2009-02-03 Galapagos Bv Molecular targets and compounds, and methods to identify the same, useful in the treatment of joint degenerative and inflammatory diseases
US20060141497A1 (en) 2004-10-22 2006-06-29 Finkelstein Sydney D Molecular analysis of cellular fluid and liquid cytology specimens for clinical diagnosis, characterization, and integration with microscopic pathology evaluation
WO2006050573A1 (en) 2004-11-11 2006-05-18 Garvan Institute Of Medical Research Method of diagnosing cancer and reagents therefor
BRPI0518734A2 (pt) 2004-11-30 2008-12-02 Veridex Llc prognàstico de cÂncer de pulmço
EP1828249B1 (en) 2004-12-03 2010-12-29 Schering Corporation Biomarkers for pre-selection of patients for anti-igf1r therapy
JP5629894B2 (ja) 2004-12-07 2014-11-26 国立大学法人大阪大学 甲状腺乳頭癌を診断するための新規のマーカー
US7862995B2 (en) 2004-12-10 2011-01-04 Targeted Molecular Diagnostics Methods and materials for predicting responsiveness to treatment with dual tyrosine kinase inhibitor
WO2006079034A2 (en) 2005-01-21 2006-07-27 Gene Express, Inc. Business methods for assessing nucleic acids
US20120122718A1 (en) 2005-03-01 2012-05-17 Reisman David N BRM Expression and Related Diagnostics
WO2006105252A2 (en) 2005-03-28 2006-10-05 The Regents Of The University Of Colorado Diagnosis of chronic pulmonary obstructive disease and monitoring of therapy using gene expression analysis of peripheral blood cells
WO2006110593A2 (en) 2005-04-07 2006-10-19 Macrogenics, Inc. Biological targets for the diagnosis, treatment and prevention of cancer
EP3211093A1 (en) 2005-04-14 2017-08-30 The Trustees of Boston University Diagnostic for lung disorders using class prediction
US20200248274A1 (en) 2005-04-14 2020-08-06 Trustees Of Boston University Diagnostic for lung disorders using class prediction
US20070037186A1 (en) 2005-05-20 2007-02-15 Yuqiu Jiang Thyroid fine needle aspiration molecular assay
US20070020657A1 (en) 2005-05-20 2007-01-25 Grebe Stefan K Methods for detecting circulating tumor cells
WO2006138275A2 (en) 2005-06-13 2006-12-28 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
US20070099209A1 (en) 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
IL177006A0 (en) 2005-08-02 2006-12-10 Veridex Llc Predicting bone relapse of breast cancer
CA2619577A1 (en) 2005-08-15 2007-02-22 Genentech, Inc. Gene disruptions, compositions and methods relating thereto
WO2007028162A2 (en) 2005-09-02 2007-03-08 The University Of Toledo Methods and compositions for identifying biomarkers useful in diagnosis and/or treatment of biological states
CA2623403A1 (en) 2005-09-22 2007-04-05 China Synthetic Rubber Corporation Gene expression profiling for identification of prognostic subclasses in nasopharyngeal carcinomas
US20070172844A1 (en) 2005-09-28 2007-07-26 University Of South Florida Individualized cancer treatments
US7962291B2 (en) 2005-09-30 2011-06-14 Affymetrix, Inc. Methods and computer software for detecting splice variants
US20080254470A1 (en) 2005-10-03 2008-10-16 Epigenomics Ag Methods and Nucleic Acids For the Analysis of Gene Expression Associated With the Prognosis of Cell Proliferative Disorders
US7598052B2 (en) 2005-10-11 2009-10-06 The Regents Of The University Of Michigan Expression profile of thyroid cancer
US20070220621A1 (en) 2005-10-31 2007-09-20 Clarke Michael F Genetic characterization and prognostic significance of cancer stem cells in cancer
US9347945B2 (en) 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
FR2896881B1 (fr) 2006-01-31 2008-04-18 Biomerieux Sa Procede de dosage du prongf pour le diagnostic in vitro du cancer du sein et utilisation du prongf en therapie
US7670775B2 (en) 2006-02-15 2010-03-02 The Ohio State University Research Foundation Method for differentiating malignant from benign thyroid tissue
JP2009529329A (ja) 2006-03-09 2009-08-20 トラスティーズ オブ ボストン ユニバーシティ 鼻腔上皮細胞の遺伝子発現プロファイルを用いた、肺疾患のための診断および予後診断の方法
JP4867018B2 (ja) 2006-03-22 2012-02-01 富士フイルム株式会社 癌の検出方法および抑制方法
WO2007126882A2 (en) 2006-03-27 2007-11-08 Jivan Biologics, Inc. Analysis of splice variant expression data
US20100113299A1 (en) 2008-10-14 2010-05-06 Von Hoff Daniel D Gene and gene expressed protein targets depicting biomarker patterns and signature sets by tumor type
US20080028302A1 (en) 2006-07-31 2008-01-31 Steffen Meschkat Method and apparatus for incrementally updating a web page
KR20080020083A (ko) 2006-08-30 2008-03-05 유영도 암 진단 마커로서의 Romo1의 용도
KR101443214B1 (ko) 2007-01-09 2014-09-24 삼성전자주식회사 폐암 환자 또는 폐암 치료를 받은 폐암 환자의 폐암 재발 위험을 진단하기 위한 조성물, 키트 및 마이크로어레이
SI2472264T1 (sl) 2007-02-27 2016-06-30 SentoClone International AB Karolinska Institute Science Park Multipleksna detekcija tumorskih celic z uporabo plošč vezavnih sredstev na zunajcelične markerje
WO2008109773A2 (en) 2007-03-06 2008-09-12 Cornell Research Foundation, Inc. Chronic obstructive pulmonary disease susceptibility and related compositions and methods
US20100273172A1 (en) 2007-03-27 2010-10-28 Rosetta Genomics Ltd. Micrornas expression signature for determination of tumors origin
US8802599B2 (en) 2007-03-27 2014-08-12 Rosetta Genomics, Ltd. Gene expression signature for classification of tissue of origin of tumor samples
US9096906B2 (en) 2007-03-27 2015-08-04 Rosetta Genomics Ltd. Gene expression signature for classification of tissue of origin of tumor samples
WO2008117278A2 (en) 2007-03-27 2008-10-02 Rosetta Genomics Ltd. Gene expression signature for classification of cancers
WO2010073248A2 (en) 2008-12-24 2010-07-01 Rosetta Genomics Ltd. Gene expression signature for classification of tissue of origin of tumor samples
EP1975245A1 (de) 2007-03-28 2008-10-01 Greenpeace e.V. Gen-Profiling zur Auswahl von politischen Kandidaten, kommerzielle Nutzung von Politikern
EP1975252A1 (en) 2007-03-29 2008-10-01 INSERM (Institut National de la Santé et de la Recherche Medicale) Methods for the prognosis or for the diagnosis of a thyroid disease
WO2008130887A1 (en) 2007-04-14 2008-10-30 The Regents Of The University Of Colorado Biomarkers for follicular thyroid carcinoma and methods of of use
WO2008140774A2 (en) 2007-05-08 2008-11-20 Picobella Llc Methods for diagnosing and treating prostate and lung cancer
US7901888B2 (en) 2007-05-09 2011-03-08 The Regents Of The University Of California Multigene diagnostic assay for malignant thyroid neoplasm
JP5719591B2 (ja) 2007-06-08 2015-05-20 バイオジェン アイデック エムエー インコーポレイティドBiogen Idec Inc. 抗tnf応答性または非応答性を予測するためのバイオマーカー
ES2570359T3 (es) 2007-08-03 2016-05-18 Univ Ohio State Res Found Regiones ultraconservadas que codifican ARNnc
US9234244B2 (en) 2007-08-27 2016-01-12 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Diagnostic tool for diagnosing benign versus malignant thyroid lesions
AT505726A2 (de) 2007-08-30 2009-03-15 Arc Austrian Res Centers Gmbh Set von tumor-markern
WO2009037633A2 (en) 2007-09-17 2009-03-26 Koninklijke Philips Electronics N.V. Method for the analysis of ovarian cancer disorders
CN101990577A (zh) 2007-09-19 2011-03-23 波士顿大学理事会 鉴定肺病药物开发的新途径
WO2009037337A1 (en) 2007-09-20 2009-03-26 Novartis Ag Robust and tissue independent gender-specific transcript markers for molecular gender determination
US20100285468A1 (en) 2007-09-24 2010-11-11 Allelogic Biosciences Corporation Detection and/or quantification of nucleic acids
WO2009068591A2 (en) 2007-11-28 2009-06-04 Novartis Forschungsstiftung, Zweigniederlassung, Friedrich Miescher Institute For Biomedical Research Biomarkers for the onset of neurodegenerative diseases
EP2227691B1 (en) 2007-12-05 2012-10-31 The Wistar Institute Of Anatomy And Biology Method for diagnosing lung cancers using gene expression profiles in peripheral blood mononuclear cells
US20090155805A1 (en) 2007-12-14 2009-06-18 Veridex, Llc Copy number alterations that predict metastatic capability of human breast cancer
US20090191535A1 (en) 2007-12-22 2009-07-30 Mark Carle Connelly Method of assessing metastatic carcinomas from circulating endothelial cells and disseminated tumor cells
JP2011508598A (ja) 2008-01-04 2011-03-17 サントル ナショナル ドゥ ラ ルシェルシュ シアンティフィク 乳癌のインビトロ分子診断
CA2712773A1 (en) 2008-01-22 2009-07-30 Veridex, Llc Molecular staging of stage ii and iii colon cancer and prognosis
EP2247775B1 (en) 2008-01-28 2012-12-19 National University of Singapore Method of generating a classification model
US20090246779A1 (en) 2008-02-15 2009-10-01 University Of Washington Increasing genomic instability during premalignant neoplastic progression revealed through high resolution array-cgh
WO2009111881A1 (en) 2008-03-13 2009-09-17 British Columbia Cancer Agency Branch Biomarkers for diagnosis of differentiated thyroid cancer
US8293880B2 (en) 2008-03-25 2012-10-23 University Of Southern California Prognostic panel for urinary bladder cancer
US20100055689A1 (en) 2008-03-28 2010-03-04 Avrum Spira Multifactorial methods for detecting lung disorders
US20110159498A1 (en) 2008-04-11 2011-06-30 China Synthetic Rubber Corporation Methods, agents and kits for the detection of cancer
CA2724312A1 (en) 2008-05-14 2009-11-19 Dnar, Inc. Biomarkers for the identification, monitoring, and treatment of head and neck cancer
AU2009253675A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
JP5717178B2 (ja) * 2008-06-05 2015-05-13 国立大学法人佐賀大学 特発性間質性肺炎の検出方法
CA2726531A1 (en) 2008-06-05 2009-12-10 University Health Network Compositions and methods for classifying lung cancer and prognosing lung cancer survival
US20110077168A1 (en) 2008-06-17 2011-03-31 Nitzan Rosenfeld Methods for distinguishing between specific types of lung cancers
GB0811413D0 (en) 2008-06-20 2008-07-30 Kanton Basel Stadt Gene expression signatures for lung cancers
ES2338843B1 (es) 2008-07-02 2011-01-24 Centro De Investigaciones Energeticas, Medioambientales Y Tecnologicas Huella genomica de cancer de mama.
WO2010004589A2 (en) 2008-07-07 2010-01-14 Decode Genetics Ehf Genetic variants predictive of cancer risk in humans
WO2010008543A2 (en) 2008-07-15 2010-01-21 Trustees Of Dartmouth College Molecular signatures for diagnosing scleroderma
US20110230366A1 (en) 2008-08-12 2011-09-22 Decode Genetics Ehf. Genetic Variants Useful for Risk Assessment of Thyroid Cancer
US20110212855A1 (en) 2008-08-15 2011-09-01 Decode Genetics Ehf. Genetic Variants Predictive of Cancer Risk
CN102203295A (zh) 2008-09-03 2011-09-28 约翰霍普金斯大学 胰腺肿瘤发生的通路及遗传性胰腺癌基因
WO2010028274A1 (en) * 2008-09-05 2010-03-11 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Marker panels for idiopathic pulmonary fibrosis diagnosis and evaluation
US20110251091A1 (en) 2008-09-12 2011-10-13 Cornell University Thyroid tumors identified
US9068974B2 (en) 2008-11-08 2015-06-30 The Wistar Institute Of Anatomy And Biology Biomarkers in peripheral blood mononuclear cells for diagnosing or detecting lung cancers
WO2010056931A1 (en) 2008-11-14 2010-05-20 Intelligent Oncotherapeutics, Inc. Methods for identification of tumor phenotype and treatment
WO2010056351A2 (en) 2008-11-14 2010-05-20 Stc.Unm Gene expression classifiers for relapse free survival and minimal residual disease improve risk classification and out come prediction in pedeatric b-precursor acute lymphoblastic leukemia
JP6257125B2 (ja) 2008-11-17 2018-01-10 ベラサイト インコーポレイテッド 疾患診断のための分子プロファイリングの方法および組成物
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
NZ602569A (en) 2008-11-21 2014-03-28 Anthrogenesis Corp Treatment of diseases, disorders or conditions of the lung using placental cells
CA2777638A1 (en) 2008-11-26 2010-06-03 Decode Genetics Ehf. Genetic variants useful for risk assessment of thyroid cancer
US9090943B2 (en) 2008-11-30 2015-07-28 Rosetta Genomics Ltd. Methods for detecting an increased susceptibility to cancer
BRPI1004572A2 (pt) 2009-01-09 2016-04-05 Univ Michigan "fusões genéticas recorrentes em câncer
US20100204058A1 (en) 2009-01-28 2010-08-12 Howard Yuan-Hao Chang Profiling for Determination of Response to Treatment for Inflammatory Disease
WO2010091049A2 (en) 2009-02-03 2010-08-12 Children's Medical Center Corporation Diagnosis and treatment of cancer
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
US8697275B2 (en) 2009-03-04 2014-04-15 Samsung Sdi Co., Ltd. Rechargeable battery having an extendable case region
WO2010123625A1 (en) 2009-04-24 2010-10-28 University Of Southern California Cd133 polymorphisms predict clinical outcome in patients with cancer
CA2753916C (en) 2009-04-29 2020-08-25 Genomedx Biosciences Inc. Systems and methods for expression-based classification of thyroid tissue
SG10201401722XA (en) 2009-05-01 2014-08-28 Genomic Health Inc Gene expression profile algorithm and test for likelihood of recurrence of colorectal cancer andresponse to chemotherapy
US8669057B2 (en) 2009-05-07 2014-03-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
EP2427574A2 (en) 2009-05-08 2012-03-14 The Ohio State University Research Foundation Microrna expression profiling and targeting in chronic obstructive pulmonary disease (copd) lung tissue and methods of use thereof
EP2775300A3 (en) 2009-08-28 2015-04-01 Asuragen, INC. miRNA Biomarkers of Lung Disease
US8828656B2 (en) 2009-08-31 2014-09-09 University Of Bremen Microrna-based methods and compositions for the diagnosis, prognosis and treatment of tumor involving chromosomal rearrangements
US9110065B2 (en) 2009-09-21 2015-08-18 Paul Walfish Methods and compositions for the diagnosis and treatment of thyroid cancer
CA2776228A1 (en) 2009-10-01 2011-04-07 Chipdx Llc System and method for classification of patients
US20120329666A1 (en) 2009-10-05 2012-12-27 Duke University Peripheral Blood Biomarkers for Idiopathic Interstitial Pneumonia and Methods of Use
CN102858991A (zh) 2009-10-15 2013-01-02 克雷桑多生物科技公司 生物标志物及炎性疾病活动性的测量和监测方法
US8975019B2 (en) 2009-10-19 2015-03-10 University Of Massachusetts Deducing exon connectivity by RNA-templated DNA ligation/sequencing
US20120282276A1 (en) 2009-11-05 2012-11-08 The Regents Of The University Of Michigan Biomarkers predictive of progression of fibrosis
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
WO2011079846A2 (en) 2009-12-30 2011-07-07 Rigshospitalet Mrna classification of thyroid follicular neoplasia
GB201000688D0 (en) 2010-01-15 2010-03-03 Diagenic Asa Product and method
CA2787994C (en) 2010-01-26 2021-01-12 National Jewish Health Diagnosis and prognosis of idiopathic interstitial pneumonia by rs35705950 snp in muc5b gene promoter
EP2366800A1 (en) 2010-03-01 2011-09-21 Centrum Onkologii-Instytut im M. Sklodowskiej-Curie Oddzial w Gliwicach Kit, method and use for the diagnosis of papillary thyroid cancer using a gene expression profile
WO2011116380A2 (en) 2010-03-19 2011-09-22 H. Lee Moffitt Cancer Center And Research Institute, Inc. Hybrid model for the classification of carcinoma subtypes
US20130029873A1 (en) * 2010-04-12 2013-01-31 University Health Network Methods and compositions for diagnosing pulmonary fibrosis subtypes and assessing the risk of primary graft dysfunction after lung transplantation
US9157123B2 (en) 2010-04-20 2015-10-13 The Johns Hopkins University Genetic amplification of IQGAP1 in cancer
US20110269142A1 (en) 2010-04-30 2011-11-03 President And Fellows Of Harvard College Clinical Method for Individualized Epithelial Cancer Screening Involving ERCC5 and IGF2R Genetic Testing and Gene-Environment Interactions
CN106498076A (zh) 2010-05-11 2017-03-15 威拉赛特公司 用于诊断病状的方法和组合物
US20190100809A1 (en) 2010-05-11 2019-04-04 Veracyte, Inc. Algorithms for disease diagnostics
CN104777313B (zh) 2010-07-09 2017-09-26 私募蛋白质体公司 肺癌生物标记及其用途
US20130295571A1 (en) 2010-10-29 2013-11-07 Institut National De La Santee Et De La Recherche Medicale ( Inserm) Marker of breast tumors from the luminal-b subtype
AU2011329772B2 (en) 2010-11-17 2017-05-04 Interpace Diagnostics, Llc miRNAs as biomarkers for distinguishing benign from malignant thyroid neoplasms
WO2012085948A1 (en) 2010-12-21 2012-06-28 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
KR20140024270A (ko) * 2010-12-30 2014-02-28 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
WO2012094744A1 (en) 2011-01-11 2012-07-19 University Health Network Prognostic signature for oral squamous cell carcinoma
WO2012123972A1 (en) 2011-03-17 2012-09-20 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
CA2830069C (en) 2011-03-20 2019-11-12 The University Of British Columbia Therapeutic agent for emphysema and copd
US8945829B2 (en) 2011-03-22 2015-02-03 Cornell University Distinguishing benign and malignant indeterminate thyroid lesions
EP2505664B1 (en) 2011-03-30 2014-12-03 Universität Leipzig Method and means for distinguishing malignant from benign tumor samples, in particular in routine air dried fine needle aspiration biopsy (FNAB)
AU2012249288C1 (en) * 2011-04-29 2017-12-21 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
US20120288860A1 (en) 2011-05-12 2012-11-15 George Mason University Differential gene expression for detecting and/or differentiating lung disease
US20140302042A1 (en) 2011-07-01 2014-10-09 Dana-Farber Cancer Institute, Inc. Methods of predicting prognosis in cancer
KR20130017525A (ko) 2011-08-11 2013-02-20 주식회사 젠닥스 대장암, 유방암, 신장암 또는 갑상선암의 조기 진단을 위한 바이오 마커 및 이의 용도
EP2751292A4 (en) 2011-09-01 2015-05-20 Allegro Diagnostics Corp METHOD AND COMPOSITIONS FOR DETECTING CANCER BASED ON MIRNA EXPRESSION PROFILES
WO2013049152A2 (en) 2011-09-26 2013-04-04 Allegro Diagnostics Corp. Methods for evaluating lung cancer status
WO2013066678A1 (en) 2011-10-26 2013-05-10 Georgetown University Microrna expression profiling of thyroid cancer
US20130142728A1 (en) 2011-10-27 2013-06-06 Asuragen, Inc. Mirnas as diagnostic biomarkers to distinguish benign from malignant thyroid tumors
WO2013074938A2 (en) 2011-11-18 2013-05-23 The University Of Chicago Biomarkers for assessing idopathic pulmonary fibrosis
GB2511221B (en) 2011-12-09 2020-09-23 Veracyte Inc Methods and compositions for classification of samples
WO2013086524A1 (en) 2011-12-09 2013-06-13 The Johns Hopkins University Compositions and methods for characterizing thyroid neoplasia
EP2788771A1 (en) 2011-12-09 2014-10-15 Pronota NV Ltbp2 as a biomarker for lung injury
GB2513732B (en) 2011-12-10 2020-12-02 Veracyte Inc Methods and compositions for sample identification
WO2013088457A1 (en) 2011-12-13 2013-06-20 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
CA2799163A1 (en) 2011-12-18 2013-06-18 20/20 Genesystems, Inc. Methods and algorithms for aiding in the detection of cancer
US20130184999A1 (en) 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
AU2013229762A1 (en) 2012-03-09 2014-09-25 Caris Life Sciences Switzerland Holdings Gmbh Biomarker compositions and methods
WO2013138726A1 (en) 2012-03-15 2013-09-19 Sabiosciences Corp. Thyroid cancer biomarker
WO2013148232A1 (en) 2012-03-27 2013-10-03 Genentech, Inc. Methods of prognosing, diagnosing and treating idiopathic pulmonary fibrosis
JP2013212052A (ja) 2012-03-30 2013-10-17 Yale Univ Krasバリアントおよび腫瘍生物学
US20140010861A1 (en) * 2012-04-02 2014-01-09 modeRNA Therapeutics Modified polynucleotides for the production of proteins associated with human disease
EP2841603A4 (en) 2012-04-26 2016-05-25 Allegro Diagnostics Corp METHODS OF ASSESSING THE STATUS OF LUNG CANCER
WO2013169858A1 (en) 2012-05-08 2013-11-14 The Broad Institute, Inc. Diagnostic and treatment methods in patients having or at risk of developing resistance to cancer therapy
US9677138B2 (en) 2012-05-20 2017-06-13 Trustees Of Boston University Methods and systems for monitoring, diagnosing, and treating chronic obstructive pulmonary disease
WO2013182951A1 (en) 2012-06-08 2013-12-12 Koninklijke Philips N.V. Method and system for monitoring the lung function of a patient
WO2013190092A1 (en) 2012-06-21 2013-12-27 Philip Morris Products S.A. Gene signatures for copd diagnosis
US10047401B2 (en) 2012-08-20 2018-08-14 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Expression protein-coding and noncoding genes as prognostic classifiers in early stage lung cancer
US9994907B2 (en) 2012-09-20 2018-06-12 Genomedx Biosciences, Inc. Thyroid cancer diagnostics
EP2906712A1 (en) 2012-10-10 2015-08-19 Stichting Het Nederlands Kanker Instituut- Antoni van Leeuwenhoek Ziekenhuis Methods and means for predicting resistance to anti-cancer treatment
BR102013027577A2 (pt) 2012-10-25 2016-03-29 Memorialsloan Kettering Cancer Ct método de detecção de um nível aumentado de axl ou gas6 e método de identificação de um paciente com câncer resistente a inibidor de egfr
US20140143188A1 (en) 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
AU2013352339B2 (en) 2012-11-27 2019-07-04 Pontificia Universidad Catolica De Chile Compositions and methods for diagnosing thyroid tumors
AU2013355260B2 (en) 2012-12-04 2019-07-25 Caris Mpi, Inc. Molecular profiling for cancer
EP3542850A1 (en) 2012-12-14 2019-09-25 Mindera Corporation Methods and devices for detection and acquisition of biomarkers
US20140220006A1 (en) 2013-02-01 2014-08-07 Meso Scale Technologies, Llc Lung cancer biomarkers
CA2902871A1 (en) 2013-03-12 2014-10-09 Cepheid Methods of detecting cancer
US10526655B2 (en) 2013-03-14 2020-01-07 Veracyte, Inc. Methods for evaluating COPD status
KR20150130408A (ko) * 2013-03-15 2015-11-23 인터뮨, 인크. 프로테오믹 ipf 마커
CA2905620A1 (en) 2013-03-15 2014-10-02 Biotheranostics, Inc. Neuroendocrine tumors
JP6577873B2 (ja) 2013-03-15 2019-09-18 フンダシオ、インスティトゥト、デ、レセルカ、ビオメディカ(イエレベ、バルセロナ)Fundacio Institut De Recerca Biomedica (Irb Barcelona) がんの転移の予後診断および処置のための方法
BR112015022490A2 (pt) 2013-03-15 2017-07-18 Veracyte Inc métodos e composições para classificação de amostras
CN105378110B (zh) 2013-04-17 2024-06-25 生命技术公司 与癌症相关的基因融合体和基因变异体
EP2993980B1 (en) 2013-05-10 2023-11-01 Memorial Sloan Kettering Cancer Center Lipid scavenging in ras cancers
US11031105B2 (en) 2013-11-07 2021-06-08 Medial Research Ltd. Methods and systems of evaluating a risk of lung cancer
PL406033A1 (pl) 2013-11-14 2015-05-25 Warszawski Uniwersytet Medyczny Sposób diagnozowania raka brodawkowatego tarczycy, zastosowanie markera mikroRNA do diagnozowania nowotworu tarczycy, oceny stopnia zaawansowania choroby oraz oceny podatności pacjenta i/lub choroby na zaproponowane leczenie oraz zawierający takie markery zestaw diagnostyczny
US9708667B2 (en) 2014-05-13 2017-07-18 Rosetta Genomics, Ltd. MiRNA expression signature in the classification of thyroid tumors
US20160130656A1 (en) 2014-07-14 2016-05-12 Allegro Diagnostics Corp. Methods for evaluating lung cancer status
WO2016094330A2 (en) 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
EP3265588A4 (en) 2015-03-04 2018-10-10 Veracyte, Inc. Methods for assessing the risk of disease occurrence or recurrence using expression level and sequence variant information
US20170127976A1 (en) 2015-06-11 2017-05-11 Michael Phillips Method and apparatus for identification of biomarkers in breath and methods of usng same for prediction of lung cancer
WO2017065959A2 (en) 2015-09-25 2017-04-20 Veracyte, Inc. Methods and compositions that utilize transcriptome sequencing data in machine learning-based classification
EP4180531A3 (en) 2016-05-12 2023-08-23 Trustees of Boston University Nasal epithelium gene expression signature and classifier for the prediction of lung cancer
US10927417B2 (en) 2016-07-08 2021-02-23 Trustees Of Boston University Gene expression-based biomarker for the detection and monitoring of bronchial premalignant lesions
CA3033241A1 (en) 2016-09-07 2018-03-15 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
CN110958853B (zh) 2017-06-02 2023-08-25 威拉赛特公司 用于鉴定或监测肺病的方法和系统
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity
GB2581584A (en) 2017-07-27 2020-08-26 Veracyte Inc Genomic sequencing classifier

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014144564A2 (en) * 2013-03-15 2014-09-18 Veracyte, Inc. Biomarkers for diagnosis of lung diseases and methods of use thereof
JP2018504138A (ja) * 2014-11-05 2018-02-15 ベラサイト インコーポレイテッド 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AM J RESOIR CRIT CARE MED, vol. 175, JPN6019049924, 2007, pages 45 - 54, ISSN: 0004819851 *

Also Published As

Publication number Publication date
US20210324464A1 (en) 2021-10-21
CN114606309A (zh) 2022-06-10
EP3215170A1 (en) 2017-09-13
EP3770274A1 (en) 2021-01-27
US20210079471A1 (en) 2021-03-18
EP3215170A4 (en) 2018-04-25
JP2018504138A (ja) 2018-02-15
US11639527B2 (en) 2023-05-02
US20240110242A1 (en) 2024-04-04
US20170335396A1 (en) 2017-11-23
JP7356788B2 (ja) 2023-10-05
WO2016073768A1 (en) 2016-05-12
CN107206043A (zh) 2017-09-26

Similar Documents

Publication Publication Date Title
JP2021164484A (ja) 機械学習および高次元転写データを使用して経気管支生検における特発性肺線維症を診断するシステムおよび方法
JP7394169B2 (ja) 通常型間質性肺炎を検出するための方法及びシステム
US20210332431A1 (en) Methods for nucleic acid sequencing
US20200263257A1 (en) Method of predicting breast cancer prognosis
CN106795565B (zh) 用于评估肺癌状态的方法
JP5405110B2 (ja) 原発不明がんの原発巣を同定するための方法および材料
JP2017113008A (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
KR20140051461A (ko) 흡연 상태를 결정하기 위한 방법 및 조성물
US20220251647A1 (en) Gene expression signatures useful to predict or diagnose sepsis and methods of using the same
US11976329B2 (en) Methods and systems for detecting usual interstitial pneumonia
WO2014130444A1 (en) Method of predicting breast cancer prognosis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220706

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230302