JP2014535050A - 生体試料におけるゲノム再編成を特定又は検出する方法 - Google Patents

生体試料におけるゲノム再編成を特定又は検出する方法 Download PDF

Info

Publication number
JP2014535050A
JP2014535050A JP2014537743A JP2014537743A JP2014535050A JP 2014535050 A JP2014535050 A JP 2014535050A JP 2014537743 A JP2014537743 A JP 2014537743A JP 2014537743 A JP2014537743 A JP 2014537743A JP 2014535050 A JP2014535050 A JP 2014535050A
Authority
JP
Japan
Prior art keywords
probe
short
sequence
genomic
probes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014537743A
Other languages
English (en)
Other versions
JP2014535050A5 (ja
Inventor
旬 小松
旬 小松
ワルラフェン ピエール
ワルラフェン ピエール
セッピ マウリジオ
セッピ マウリジオ
コンセイレル エマヌエル
コンセイレル エマヌエル
Original Assignee
ゲノミク ビジョン
ゲノミク ビジョン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゲノミク ビジョン, ゲノミク ビジョン filed Critical ゲノミク ビジョン
Publication of JP2014535050A publication Critical patent/JP2014535050A/ja
Publication of JP2014535050A5 publication Critical patent/JP2014535050A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/102Multiple non-interacting labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

分解能を高め、かつ視覚化及び検出を単純化する、特別に設計された長プローブ及び短プローブのセットを使用する、対象ポリヌクレオチド配列の検出、視覚化、及び/又は比較のための方法。有用なプローブ及びプローブの組み合わせを特定するための、この方法及び手順を実施するのに有用なプローブ組成物。これらの方法は、ゲノム再編成、特に、癌を含めた様々な疾患、障害、及び状態と関連するゲノム再編成の検出のために、又はゲノム再編成と関連する治療法の評価のために有用である。該プローブ組成物は、遺伝子再編成の検出のためのキットにおいて、又はコンパニオン診断用製品又はキット(結腸直腸癌などの癌に対する素因の診断又は評価のためのキットなど)において使用することができる。【選択図】 なし

Description

(発明の背景)
(発明の分野)
本発明は、ポリヌクレオチドプローブの特別に設計された組み合わせを使用する、インビトロでゲノム再編成を検出するための高分解能の厳密な方法に関する。本発明は、ゲノムDNAの再編成と関連する状態、障害、及び疾患の検出及び診断の正確な方法に関する。
(従来技術の説明)
(ヒト疾患の複遺伝子パラダイム)
ヒト疾患の遺伝子解析の進歩により、疾患の開始及び進行に寄与する分子機構が、より明らかになりつつある。特定の疾患と、体細胞遺伝子配列における、又はゲノムDNAにおける特定の一塩基多型(「SNP」)を伴う、一塩基変異に対する相関及び/又は連鎖不平衡とが、以前から関連付けられている。より大きな遺伝子変化及び再編成が、遺伝的原因又は根拠を有する疾患、障害、又は状態の主な原因と関連する、又はこれらの原因を構成する可能性があるという証拠が、最新の技術によって示されている。疾患相関性は現在では、単一遺伝子パラダイムから、疾患の原因及び進行が2以上の単一の遺伝子変異又は起源と関連するという複遺伝子パラダイムへと移りつつある。これらの新しい洞察によって、疾患検出及び治療のためのより優れた手段が提供される一方、より大きなゲノム再編成との疾患相関性を評価することによる、単一の変異事象又はSNPの検出を超えるコンビナトリアル遺伝子解析の必要性も強調される。こうしたコンビナトリアル遺伝子解析は、特定の状態、障害、疾患、又は病態の、より優れた、より厳密な、かつより正確な診断を提供するであろうことに加えて、より適切な医療調査、より正確な治療決定及び介入を確立することを助け、また、こうした治療法及び介入の有効性を評価することを助けるであろう。
(遺伝性疾患の複遺伝子的原因)
同一又は同様の臨床徴候及び結果が顕在化する遺伝性障害は、様々な遺伝子の、単一かつ唯一の変異、又は変異の組み合わせに起因する可能性がある。こうした変異は、一塩基変化及び/又は大きな遺伝子再編成の類の範囲内であり得る。こうした遺伝性障害のいくつかの例は、脆弱X症候群(FMR1遺伝子の変異及び伸長(expansion))、毛細血管拡張性運動失調症(ATM遺伝子のイントロン又はエキソン配列内の一塩基対変異並びに欠失及び転座)、ゼッケル症候群(SCKL1、SCKL2、SCKL3、PCTN、及びATRの変異並びに大きな再編成)、自閉症(GLO1、MTF1、及びSLC11A3の変異並びに大きな再編成)、脊髄性筋萎縮症(変異、欠失、トランス転換(transconversion)、並びにシス-重複(SMN1及びSMN2遺伝子が含まれる))、及び筋緊張性ジストロフィー(DM1及びDM2のトリヌクレオチド/テトラヌクレオチド伸長)である。
(癌素因の複遺伝子的原因)
癌素因については、その一塩基変化及び/又は大きな再編成を特定することができるいくつかの原因遺伝子を挙げることができる、家族性癌の素因徴候のいくつかの例が存在する。
乳癌及び卵巣癌。原因遺伝子:BRCA1、BRCA2、ATM...変異タイプ:現在までに特定されている、より高い割合の点変異。
遺伝性非ポリポーシス大腸癌(リンチ症候群)。原因遺伝子:MSH2、MLH1、MSH6、EPCAM...。変異タイプ:相当する割合の点変異も特定されている。
(癌進行の複遺伝子的原因)
癌進行はまさに、単一遺伝子原因仮説が、ここ数年ではっきりと排除された、ヒト疾患領域である。第1に、疾患の開始は、癌遺伝子又は腫瘍抑制遺伝子に分類される少なくとも2つの独立した遺伝子の遺伝子変化による2つの分子事象(不死化及び形質転換)に確実に依存する。第2に、疾患の進行は、原因遺伝子とは独立した更なる遺伝子変化と関連する。この更なる変化は、癌進行における役割を果たすだけでなく、治療中の治療法に対する耐性出現の根拠であることも実証された。特に、癌関連遺伝子のリストの中では、極めて稀な例が、別々の一塩基変異(例えばKRas又はBRaf)のみを受けるとしても、大多数は、大きな再編成(例えば、HER2、ALK...)のみ、又は一塩基変異と大きな再編成(p53、c-myc、c-Met、EGFR...)の両方を受ける。
分子診断の既存の方法の不正確性が、ある程度原因で、癌、循環器疾患、糖尿病、及び他の遺伝性の遺伝的状態を含めた複遺伝子性の状態、障害、及び疾患の特定及び特徴付けは、困難であった。分子コーミング(Molecular Combing)は、おそらく、すべてのタイプの(複合の及び異種の集団(腫瘍など)においても)大きな遺伝子再編成(欠失、増幅、伸長、逆位、転座...)の検出を可能にする唯一の手法である。
患者の多重分析を可能にする高分解能バーコードは、例えば患者の層別化/分類及び/又は予後についてなどの、様々なレベルでの診断を助けることができるであろう。
(治療介入のための重要な要素としての正確な遺伝子変化を特定するための多重高分解能バーコード)
(筋緊張性ジストロフィーの例)
筋緊張性ジストロフィー(DM1)及び筋緊張性ジストロフィー2(DM2)は、2つの異なる遺伝子のトリヌクレオチド/テトラヌクレオチド伸長を特徴とする、2種の筋ジストロフィーである。重症型のDM1が、DM2と臨床的に区別可能である場合、より軽症型のDM1は、DM2と非常に類似した臨床徴候を示す。現在、筋緊張性ジストロフィーのための治癒法又は特異的な治療は存在しない。しかし、DM1患者は、DM2では現れない該疾患の合併症(心臓障害、白内障...)を呈し、これは、治療可能であるが、治癒しない可能性がある。したがって、高分解能バーコードの多重分析の使用によるDM1とDM2との区別は、二次的影響の予防及び治療を助けることができるであろう。
(遺伝性の乳癌及び卵巣癌の例)
ある特定の国々(米国)では、BRCA1/2の構成変化を検出することが、治療介入(外科/再構成)を推進する。したがって、潜在的に関与するすべての遺伝子を含む正確な診断の、明らかな必要性が存在する。こうした試験は、この症候群;BRCA1、BRCA2、ATM、ATR...に関与することが公知である遺伝子の周囲の大きな染色体領域を含む高分解能バーコードの多重分析に基づいて行うことができるであろう。
(DNA損傷及び応答阻害剤例)
合成致死は、特定のプロトコル/レジメンにおける、癌患者を含める治療決定に対する強力な現実となっている。第1の例の1つは、BRCA欠損を有する乳癌患者が、PARP阻害剤(すなわちDNA損傷及び応答経路に作用する新しいカテゴリーの薬物)に対するより高い感受性を呈するという実証と共に示された。より最近、これは、ATM阻害剤などのこのカテゴリー内の他のタイプの阻害剤に、また、すべてのタイプのDNAポリメラーゼ及び複製阻害剤を含めた、より伝統的な抗癌薬に拡大された。
この概念は、他の阻害剤に拡大されるだけでなく、肺及び転移性黒色腫などの他のタイプの癌に拡大ことができるであろうことも実証されている。
ここでは、多重高分解能バーコードは、このクラスの阻害剤に対する感受性を予測するのを助けることができるであろうDNA損傷及び応答に関与する遺伝子における遺伝子変化の検出を可能にすることとなる。こうした遺伝子のリストには、BRCA1、BRCA2、ATM、ATR、MSH2、MLH1、MSH6、EPCAM...を含めることができるであろう。
(肺癌の例)
肺癌に関与する多数の変化は、以下のものなどの、より優れた患者分類のために多重化することができるであろう:
・LOH/欠失(P53、STK11、LKB1、BRG1、KLF6);
・増幅(FGFR1、MET、EGFR、HER2...);
・転座:(ALK);
これらのすべての遺伝子変化は、治療的処置と関連している:
・P53:ヌトリン(Nutlin)(低用量アクチノマイシンDは、同様の効果をもたらす)
・FGFR1:マシチニブ、PD173074、SU5402 TK1258 AZD4547...
・MET:GSK1363089、ARQ197、SGX523、XL184...
・EGFR:タルセバ、アービタックス、ベクチビックス...
・HER2:ハーセプチン、ラパチニブ...
・ALK:クリゾチニブ
NSCLCの少なくとも30%が、これらの変異のうちの少なくとも1つに依存することが実証されたので、腫瘍の遺伝子プロファイルを明らかにすることによって、治療の選択を進めるのを助けることができるであろう。これは、この主要な遺伝子座を網羅する高分解能バーコードを組み合わせた多重分析を設計することによって、可能にすることができるであろう。
(対象となる(遺伝子)配列の位置推定)
遺伝子配列は、機能性タンパク質を合成するための、最も基本的な情報である。遺伝子配列の変化は、時として、機能性タンパク質合成を損なう結果となる。遺伝子配列の変化に加えて、遺伝子配列の喪失又は獲得(コピー数変化、CNV)も、細胞活性の恒常性にとって問題であり得る。例えば、(機能性)抗腫瘍タンパク質(p53)の喪失、又は癌原遺伝子(c-myc)の獲得は、癌になりやすい細胞をもたらす。こうした変異が、生殖細胞に起こる(又は存在する)場合、この変異は、遺伝性疾患の保因者又は患者である又は癌の素因を有する個人の全細胞に広がる。生殖細胞系列変異は、遺伝性であり得る。最近、CNVは、遺伝学の分野の理解にとって、ますます重要になっている(参照文献1)。しかし、コピー数の計数だけでは必ずしも十分ではなく、多くの場合、配列要素の実際の部位を確認することが重要である。これは、例えば均衡型転座の場合に際立っている。アレイベースの比較ゲノムハイブリダイゼーション(aCGH)及び定量PCRなどのDNA配列決定及びCNV検出方法は一般に、これらの平衡変異を検出することができない。これらの方法は、配列及びコピー数か正確であるかないかを評価するからである。FISH、及びファイバーFISH又は分子コーミングなどのその拡張形態は、方法に応じた異なる分解能及び精度を用いて、これらの平衡変異に対処することができる。
(分解能及び精度)
大きな(数kbから数十kb)ゲノム再編成を検出するための、標的領域に対するBAC/PAC/コスミドプローブの使用が、成功裏に実施された(参照文献2)。これらの手法では、検出可能な事象の最少サイズ(例えば欠失した又は増幅された配列のサイズ)(以下では、こうした分析の「分解能」と呼ぶ)は、数十キロベースの測定プローブ又はギャップに伴われる大きな標準偏差が原因で、制限される。実際、こうした分析では、測定の標準偏差は、測定される要素の長さと共に増大する。例えば、40kbプローブは、〜5kbの標準偏差で測定される。したがって、あるスライド上で所与のプローブの16測定が行われる場合、測定の平均値として得られるプローブのサイズに対する精度は、2.5kbの1桁程度である(分布はガウス分布であり、かつ、精度は信頼区間の半分の幅、すなわち2sd./√n(ここではsd=標準偏差、かつn=測定数)と考える)。10kbプローブについては、標準偏差が〜2kbである場合、精度は、〜1kbとなるであろう。このことは、プローブが短いほど、より優れた(より低い)分解能が得られるという事実を示す。
さらに、こうした事象の部位(事象の末端の位置)は、その事象が起こる範囲内のプローブ又はギャップのサイズによって制限される精度(以下では「部位精度」)で明らかにすることができる:例えば、40kbプローブが、試料内で39kbと推定される場合、それ以上の精度はなくそのプローブ内のどこかで-したがって40kbゲノム領域内のどこかで、1kbの欠失が存在していたと結論付けることができる。10kbプローブ内に同様の1kb欠失が存在している場合、範囲が10kbゲノム領域に狭められるので、その欠失の部位は、より優れた精度を有することが分かるであろう。したがって、プローブ及びギャップが小さいほど、部位精度が良くなる。
小さなプローブには限界がある:(i)小さなプローブは、あるサイズ未満では検出が難しくなる;(ii)小さなプローブは、(比較的多いプローブが存在するので)より複雑な配色計画を必要とする;(iii)所与の領域をカバーするために、より特徴的なプローブが存在するので、実験に、より費用と時間がかかる;(iv)最も重要なことだが、プローブの迅速かつ信頼度の高い特定は、ヒト作業者によるものであれ1本のソフトウェアによるものであれ、より長プローブの方が、背景からより迅速に識別されるので、簡単である。実際、背景は主に、ほぼ円形の蛍光スポットからなる。十分に大きい場合、これらのスポットの形状は、プローブと容易に識別することができる。しかし、サイズが小さ過ぎる場合、小さなプローブと識別することは困難に思われる。
本発明による操作条件では、〜3kbよりも短プローブは、低下した効率で検出される。3〜10kbの範囲内では、測定の標準偏差はほとんど変わらず、したがって、この範囲内のより短いプローブでは、分解能における利益はほとんど存在しない。したがって、この範囲が通常、プローブサイズについての良い妥協案であると考えられる。しかし、プローブが、密接し過ぎる場合(10kbギャップ未満)、ほんの一部のシグナルのみが検出されることとなり、それによって、対応する配列の存在を確実に立証することができるので、より小さいプローブ(500〜3000bpの範囲内)が、やはり有用である。12kbよりも長い(好ましくは14kbよりも長い)単独のプローブの検出が、ヒト作業者についても自動検出ソフトウェアについても、より信頼性が高いことも判明した。
(反復の排除)
真核生物のゲノムDNAは、様々な反復配列、すなわち、通常の一倍体ゲノム中に2回以上(及びその長さ及び塩基含量に基づいて統計的に予測されるのよりも多く)出現する配列を含有している。これらのうち、あるものは、非常に高頻度(数万から数百万のコピー)で出現する。ヒトゲノムDNAでは、これらのうち最も豊富なのは、Aluファミリーであり、これは、ゲノムの〜10%を成す〜1,000,000コピーを有する。ヒトゲノムDNAを使用するあらゆるハイブリダイゼーション手順では、こうした反復をもつプローブが、多数の標的に対してハイブリッド形成し、ゲノム全体にわたる領域からの非特異的なシグナルをもたらすであろうことが予想される。他のタイプの反復配列も、より低頻度で、しばしばより特異的な局在性を伴って存在する。相同の程度だけでなく、コピー数及び反復配列長も、広く変動し得る。例えば、βサテライト配列は、限られた数の遺伝子座に特に局在している、通常、同一の50〜100bp長の配列の数百コピーを含むタンデムリピート配列として、多数の(数百から数千)コピーで存在する。
非特異的なシグナルを排除するための戦略は、手順及びプローブの種類に依存する。概略的には、プローブが、aCGH手順でそうであるように、DNA(オリゴヌクレオチド、一般的に100bp未満)の非常に短い配列である場合、オリゴヌクレオチドの配列は、データベース中にある反復配列との比較によって、反復配列を含まないように選択される。この戦略は、反復配列を含まない短い配列が比較的豊富であることから、非常に短いプローブに関してのみ実用的であるが、反復成分を完全に含まない長いストレッチ(stretch)が稀であることから、より長いプローブに関しては非実用的である(しかし、これは、多数の不利益を受ける手法において、より長いFISHプローブに適合されている。以下を参照のこと)。さらに、短プローブについても、この戦略は、プローブの設計を非常に制約し、反復配列が豊富な、あるゲノム領域は、この制約が原因で、被覆密度が、より低い(したがって、事象の分解能が、より低い)。
サザンブロット又はFISH手順において、プローブが、より長い場合(一般的に、PCR産物又はクローン化DNAインサート-1から150kb)、Alu反復などの反復成分を富化した非標識競合DNA(通常Cot-1 DNA)が、標識されたプローブと共に、大過剰量で加えられる。反復配列上での非標識プローブの競合によって、標識されたプローブのハイブリダイゼーションが最小限になる。この戦略は、費用がかかる。また、競合DNAが、純粋に反復配列から作製されるわけではないので、競合は、プローブがそれに対して設計されたユニーク配列に対しても起こり、そのため、使用可能な競合DNAの量が制限される。したがって、この手法の効率は、制限される。
より長いプローブのための代替手法が、Knoll及び共同研究者ら(米国特許第7,014,997号)によって提案されている。これは、通常、オリゴヌクレオチドに採用される戦略と類似しており、プローブは、反復成分を含まない配列区間内で選択される。この戦略は、対象領域のバイオインフォマティクス分析、及び配列データベースとの比較による公知の反復配列の排除に基づく。しかし、この手法には、いくつかの制限がある:反復配列の事前情報が必要とされ、例えば、こうした情報が利用できない種では、これは問題であり得る。より重要なことには、反復配列を含まない2kb以上の区間は、平均して20〜30kbに1回しか出現せず、かつ、不均一に分布しているので(分布はガウス分布であり、かつ、精度は信頼区間の半分の幅、すなわち2sd./√n(ここではsd=標準偏差、かつn=観察数)と考える)、プローブの設計は、非常に制約され、高分解能コードを設計できる可能性は弱められるであろう。これによって、反復が豊富な領域、及び/又は偽遺伝子が対象相同遺伝子の隣に位置する領域では、Knoll及び共同研究者ら(参照文献3)の戦略を用いてこうした低コピー反復配列を排除することも特に難しいことが証明されるであろう。再編成試験において、例えば診断目的のために標的にされる領域は、これらの特徴を示すことが多いので、この手法は、高分解能バーコードの設計には適しておらず、こうしたコードが診断目的で使用されることとなる場合には特に適していない。この手法と本発明との相違を、以下に、より詳細に開示する。
(発明の概要)
本発明は、インビトロ診断及び遺伝子再編成の検出の分野に関し、また、既に公知の又は新規の、試験されることとなる生体試料における遺伝子再編成を特定又は検出するための、及び、例えば癌又は代謝性若しくは胎児の遺伝性疾患としての疾患のマーカーを提供するための方法に関する。本発明は、長さが10kb未満の短い配列として選択されるヌクレオチド配列を有する精製又は合成された核酸分子(ポリヌクレオチド)を含有する組成物、及び先のヌクレオチドとオーバーラップしない12kb以上のサイズを有するヌクレオチド配列を有する、前記方法における他の異なる核酸分子(ポリヌクレオチド)と関連する組成物を使用することが特徴である。プローブとして使用される選択されたヌクレオチド配列(ポリヌクレオチド)は、その天然の頻繁に反復される配列が部分的に欠失されている。本発明はまた、分子コーミングなどのファイバーFISHのような技術と同様の、ハイブリダイゼーションによる遺伝子再編成の検出のためのプローブ配列のセットの設計のためにもたらされる改良に関する。本明細書に記載する改良は、時間及び費用効率の良い分析における再編成の高精度/高分解能の検出を可能にする。本発明はまた、診断用途及びコンパニオン診断のためのプローブ配列の使用に、また、配列の変化の有無の検出の方法に、また、先述の使用のためのキットに関する。これを、その変異がヒト結腸直腸癌発生のリスクを上昇させる、少なくとも2つの遺伝子:MSH2及びMLH1の一部に又はMSH2及びMLH1の領域に対応するヌクレオチド配列のセットと共に、下に例示する。
本発明は、前記遺伝子に特異的である、標識された又はされていないポリヌクレオチドのセット又はプローブに関する。現在、現行の技術を使用する遺伝子再編成の検出は、しばしば、診断用途にとっては信頼性が不十分である。いくつかのタイプの再編成に対する強い本質的制限を受ける、遺伝子変化を検出するために使用される大抵の技術とは異なり、FISH又はファイバーFISHなどの直接的技術は、いかなるタイプの再編成も本質的に検出することができる。これらの使用は、主に、その分解能によって制限される。それに対して、分子コーミングは、十分な分解能に到達することが可能であるが、現在使用されるプローブ設計は、再編成の費用及び時間効率の良い高分解能分析を可能にすることができない。
これらの改良は、再編成の高感度の検出及び厳密な測定を最適化するために設計された-一般的に、より短い-プローブと、結果を分析する時に対象シグナルの迅速かつ信頼度の高い検出を可能にするための-一般的に、より長い-プローブとの、同じセットのプローブ内での組み合わせを含む。より長いプローブが、同等の機能及び効果を有するより短いプローブの組み合わせと置き換えられる、代替設計も開示する。
対象となる1以上のゲノム領域(1又は複数)の検出ための、分解能のための小さなプローブと、検出の容易さのための長プローブとを組み合わせるという概念に基づく本発明の特定の態様を、以下に、より詳細に開示する。
したがって、本発明は、変異した又は再編成されたゲノムポリヌクレオチド(標的)配列を検出するための方法であって、
(a1)変異又は再編成が探索される、対象となる1以上のゲノム領域を含む標的ゲノムポリヌクレオチドと、対象となる各領域と結合する短プローブセットとを、短プローブセットが結合する標的配列の部分の間の長いギャップ無しにハイブリッド形成させること(ここでは、各ゲノム領域上で、短プローブのサブセットは、共に使用された時に、対象領域の内側又は外側に長い連続的なストレッチを形成するように選択され、かつ、該プローブは、高頻度の反復配列を任意に除去することができ、したがって、より一般には、こうした反復配列を任意に含まない);或いは
(a2)変異又は再編成が探索される、対象となる1以上のゲノム領域を含む標的ゲノムポリヌクレオチドを、対象となる各領域と結合する短プローブセットと、短プローブセットが結合する標的配列の部分の間の長いギャップ無しに、及び対象となる各領域(1又は複数)の外側の近接配列と結合する1以上の長(ドッキング)プローブと、ハイブリッド形成させることと(ここでは、長プローブ(1又は複数)の配列(1又は複数)は、短プローブの配列とオーバーラップせず、かつ、該短プローブ及び/又は長プローブは、高頻度の反復配列を任意に除去することができ、したがって、より一般には、こうした反復配列を任意に含まない);
(b)対象ゲノム領域(1又は複数)に対してハイブリッド形成したプローブの部位を検出することと;任意に、
(c)標的ゲノムポリヌクレオチド配列に対してハイブリッド形成したプローブの部位と、1以上のモチーフとを、前記プローブと基準の、対照の、正常な、非変異の、又は非再編成のゲノムポリヌクレオチド配列とのハイブリダイゼーションに基づいて比較すること;及び任意に、
(d)変異した又は再編成されたゲノムポリヌクレオチドの存在を、特定の表現型、疾患、障害、又は状態と関連付けること
を含む前記方法に関する。
変異した又は再編成されたゲノムポリヌクレオチド配列は、癌に罹患している又は癌に罹患している疑いがある対象から、例えば、結腸直腸癌に罹患している又は結腸直腸癌に罹患している疑いがある対象から得ることができる。こうした場合では、短及び長プローブによって、結腸直腸癌と関連する変異又はゲノム再編成が特定され、かつ、対照又は基準試料は、これらの変異又は再編成を含有しないであろう。結腸直腸癌の存在又は結腸直腸癌を発症するリスクは、標的ゲノムポリヌクレオチド配列を基準と比較し、結腸直腸癌と関連する変異又は再編成が存在するかどうかを判定することによって評価される。この方法は、プローブセット1、2、3、及び4に対応する又は該プローブセットから得られる特異的なプローブを用いて実施することができる。結腸直腸癌については、対象ゲノム領域は、この疾患と関連する遺伝子、例えばMSH2、MLH1、MSH6、PMS2、又はEPCAMなどから選択することができる。
同様に、該方法は、乳癌、卵巣癌、又は肺癌などの他の種類の癌を罹患している、又は発症するリスクがある対象から得られる試料に適用することができる。該方法はまた、循環器疾患、糖尿病、神経筋障害;例えば筋緊張性ジストロフィー又は脊髄性筋萎縮症などを含めた他の種類の疾患、障害、又は状態を罹患している、又は発症するリスクがある対象から得られる試料、或いは、既知又は未知の胎児の遺伝子変化を含めた遺伝子又は遺伝性疾患、障害、又は状態に罹患している、罹患している疑いがある、又は保因者である疑いがある対象から得られる試料に適用することができる。該試料は、複遺伝子性の遺伝子又は遺伝性疾患、障害、又は状態、或いはゲノムDNAの再編成と関連する遺伝子又は遺伝性疾患、障害、又は状態を罹患している対象から得ることができる。
本発明のいくつかの態様では、試料は、ゲノム又は体細胞の遺伝子再編成と関連する疾患、障害、又は状態の治療を受けている対象から得られることとなり、得られた結果は、治療前、治療中、又は治療の停止後の、他の時点で得られた結果と比較される。対象遺伝子又は遺伝子の領域の変異した又は再編成されたヌクレオチド配列に対する治療薬の効率を評価するためのコンパニオン試験は、本発明による短及び長プローブを使用して実施することができる。
先に記載した方法では、好ましくは、ステップa)における短プローブ及び長プローブとのハイブリッド形成は、同時に実施されることとなる。
好ましくは、短プローブの長さは、0.5kbから10kbの範囲内であり、短プローブが標的に結合する場合、短プローブ間のギャップの最大サイズは、15kb、好ましくは12kb、より好ましくは10kbである。
先に記載した方法で用いられる短プローブの数は、1、2、3から10、15、又はそれ以上の範囲内であり得る。
長プローブの最大サイズは、150kbであり、これらのプローブの長さは、12kbから40kbの範囲であることが好ましい。好ましくは、「対象領域の外側の近接配列と結合する長プローブ(1又は複数)」を有するために、長プローブと対象領域との距離は、対象領域から、最長で150kb、より好ましくは最長で75kb、さらに好ましくは最長で25kbである。試験される又は標的化されることとなるゲノム領域の最少サイズは、50kbである。対象領域の最少数は、シングルプレックス(singleplex)試験については1、多重(multiplex)試験については2以上である。短プローブ及び/又は長プローブの組み合わせの例としては、少なくとも1つの短配列(10kb未満)と少なくとも1つのオーバーラップしていない長配列(15kb超)、又は少なくとも2つの短配列(それぞれ10kb未満)の少なくとも1つの群(群全体の長さは、14kb超かつ150kb未満である)が挙げられ、これらは、変異した又は再編成されたポリヌクレオチド配列に対して連続的にハイブリッド形成する。短プローブは、少なくとも15kbである対象領域の内側又は外側のゲノムポリヌクレオチド配列のストレッチにまたがる連続的なプローブのセットを含むことができる。
長プローブは、反復DNA配列を排除することができる。排除されることとなるこれらの反復配列は通常、2回以上、その長さ及び塩基含量に基づいて統計的に予測されるよりもしばしば多く、出現するであろう。例えば、50から400bpの反復配列を排除することができるが、該方法の感受性又は特異性を低下させる、より短い又はより長い反復配列も、特定及び排除することができる。こうした配列の例は、反復AluファミリーDNA配列である。
本発明の一実施態様によれば、プローブ、すなわち短プローブ又は長プローブについて、反復配列を排除させるためには、これらのプローブは、こうした反復配列を含まないゲノムの領域においてハイブリッド形成するように設計される。すなわち、プローブは、排除されることとなる10%未満、好ましくは2%未満の選択されたタイプ(1又は複数)の反復配列を有する。
先に記載した方法では、短及び長プローブは、蛍光的にタグを付けることが好ましく、プローブセットの異なる成分を、異なる色を有する標識などの異なる標識でタグを付けることができる。タグ付けによって、変異した又は再編成された配列のモチーフ又はサブモチーフ特性を明らかにするための1つの手段が提供される。
本明細書に記載する通りの短プローブのセット又は短プローブと長プローブの組み合わせと、任意に、前記プローブをポリヌクレオチドに結合させるための、及び/又は分子コーミングを実施するための、及び/又はハイブリダイゼーションが起こったかどうかを検出するための1以上の成分とを含む組成物又はキットも企図される。例えば、先に記載した短プローブ及び長プローブ(1又は複数)(ここでは、前記プローブ配列のうちの少なくとも2つは、分子コーミングを使用することによって、遺伝子再編成を検出する)を含有する組成物は、少なくとも1つの短配列(<12kb)及び少なくとも1つのオーバーラップしていない長配列(>14kb)、又は少なくとも2つの短配列(それぞれ10kb未満)の少なくとも1つの群(全長は、14kb超かつ150kb未満である)を含み、遺伝子標的に対して連続的にハイブリッド形成する。こうした組成物における短プローブ(1又は複数)は、好ましくは0.5kbから12kbの範囲、長プローブ(1又は複数)は、14kbから40kbの範囲であり得る。先に記載した高頻度の反復配列は、プローブから除去することができる。プローブ配列の例は、MSH2遺伝子に対して若しくはMSH2遺伝子の領域内で、又はMLH1遺伝子に対して若しくはMLH1遺伝子の領域内で特異的にハイブリッド形成するものである。反復配列が除去されている具体的な種類の短プローブ配列(1又は複数)には、表1に列挙するプライマー対を使用する、ヒトゲノムDNAに対するPCR増幅によって得られる配列からなる群から選択される、又は該配列を含むものが挙げられ:
MSH2-v1
P3(プライマー対P3a_MSH2-v1からP3c_MSH2-v1、配列番号:21〜26)
P4(プライマー対P4a_MSH2-v1からP4b_MSH2-v1、配列番号:27〜30)
P5(プライマー対P5a_MSH2-v1からP5c_MSH2-v1、配列番号:31〜36)
P6(プライマー対P6a_MSH2-v1からP6b_MSH2-v1、配列番号:37-40)
P7(プライマー対P7a_MSH2-v1からP7c_MSH2-v1、配列番号:41〜46)
P8(プライマー対P8a_MSH2-v1からP8b_MSH2-v1、配列番号:47〜50)
P9(プライマー対P9a_MSH2-v1からP9c_MSH2-v1、配列番号:51〜56)
P10(プライマー対P10a_MSH2-v1からP10b_MSH2-v1、配列番号:57〜60)
MLH1-v1
P3(プライマー対P3a_MLH1-v1からP3d_MLH1-v1、配列番号:95〜102)
P4(プライマー対P4a_MLH1-v1からP4b_MLH1-v1、配列番号:103〜106)
P5(プライマー対P5a_MLH1-v1からP5b_MLH1-v1、配列番号:107〜110)
P6(プライマー対P6a_MLH1-v1、配列番号:111〜112)
P7(プライマー対P7a_MLH1-v1、配列番号:113〜114
P8(プライマー対P8a_MLH1-v1からP8d_MLH1-v1、配列番号:115〜122)
短プローブは、表1に列挙するプライマー対を使用する、ヒトゲノムDNAに対するPCR増幅によって得られる配列からなる群から選択される、又は該配列を含む長プローブ配列(1又は複数)と組み合わせて使用することができる
MSH2-v1
P11(プライマー対P11a_MSH2-v1からP11c_MSH2-v1、配列番号:61〜66)
P12(プライマー対P12a_MSH2-v1からP12e_MSH2-v1、配列番号:67〜76)
MLH1-v1
P9(プライマー対P9a_MLH1-v1からP9c_MLH1-v1、配列番号:123〜128)
P10(プライマー対P10a_MLH1-v1からP10e_MLH1-v1、配列番号:129〜138)。
長いストレッチを形成する具体的な種類の連続的な短プローブ配列(1又は複数)には、表1に列挙するプライマー対を使用する、ヒトゲノムDNAに対するPCR増幅によって得られる配列からなる群から選択される、又は該配列を含むものが挙げられる:
MSH2-v2
PE1-2(プライマー対PE1_MSH2-v2からPE2_MSH2-v2、配列番号:163〜166)と
PE3-6(プライマー対PE3_MSH2-v2からPE5-6_MSH2-v2、配列番号:167〜172)(共に1つのストレッチを形成する);
PE9(プライマー対E9_MSH2-v2及びI9-10_MSH2-v2、配列番号:185〜188)、
PE10(プライマー対E10_MSH2-v2、配列番号:189-190)、
PE11(プライマー対E11_MSH2-v2及びI11-12_MSH2-v2、配列番号:191〜194)、
PE12-14(プライマー対E12_MSH2-v2及びE13-14_MSH2-v2、配列番号:195-198)と
PE15-16(プライマー対E15_MSH2-v2及びE16_MSH2-v2、配列番号:199〜202)(共に1つのストレッチを形成する);
MLH1-v2
PE1-2(プライマー対E1_MLH1-v2及びE2_MLH1-v2、配列番号:227〜230)、
PE3-4(プライマー対I23_MLH1-v2、E3_MLH1-v2及びE4_MLH1-v2、配列番号:231〜236)、
PE5-6(プライマー対E5_MLH1-v2及びE6_MLH1-v2、配列番号:237〜240)、
PE7-9(プライマー対E7-8_MLH1-v2及びE9_MLH1-v2、配列番号:241〜244)と
PE10-11(プライマー対E10_MLH1-v2及びE11_MLH1-v2、配列番号:245〜248)(共に1つのストレッチを形成する)。
本発明の短プローブを調製する目的で設計されるプライマーは、20から40ヌクレオチドの配列を有し、かつ、その3'末端において、標的と塩基対形成する少なくとも20の連続的ヌクレオチドの配列を含むことができる。したがって、プライマー配列は、その5'末端において、標的とは塩基対形成しない追加のヌクレオチドも含むことができる。塩基対形成しないヌクレオチドは、プライマーの構築のために、又はプライマーから出発する重合から得られる増幅された配列のクローニングのために有用であり得る。特定の実施態様では、標的とハイブリッド形成するプライマーの配列は、20ヌクレオチドよりも長い。
分子コーミングは、特別に処理したガラス表面に均一かつ不可逆的に付着した単一のDNA分子の直接的視覚化のための強力なFISHベースの技術である(Herrick及びBensimon、2009);(Schurra及びBensimon、2009)。この技術は、ゲノム全体にわたるDNAの構造及び機能分析をかなり改良し、単一分析において高分解能でゲノム全体を(kb範囲で)視覚化することが可能である。
本発明の別の実施態様は、先に記載した通りの短プローブセット又は短プローブ及び長プローブのセットを設計するための方法であって、
対象ゲノム領域を含有するポリヌクレオチドを特定することと、
対象ゲノム領域の外側であるが、対象領域内の最も近いプローブの100kb以内、好ましくは、対象領域内の最も近いプローブの30kb以内である長プローブ配列を選択し、前記長プローブ配列から、高頻度で反復している配列を任意に除去することと、
短プローブ間に20kb超のギャップ、好ましくは12kb超のギャップが生じないように、対象ゲノム領域内から短プローブ配列を選択すること;又は対象ゲノム領域をカバーする長い連続的ストレッチを共に形成する一連の短プローブを選択することと;
該プローブを、対象ゲノム領域を含むゲノムポリヌクレオチドとハイブリッド形成させることと、
ハイブリッド形成したプローブを検出することと、
対象ゲノム配列を基準のゲノム配列から特異的に区別するモチーフを、どのプローブセットが形成するかを判定することと
を含む前記方法である。
標的ゲノムポリヌクレオチド配列に対してハイブリッド形成したプローブの部位と、1以上のモチーフとの、前記プローブと基準の、対照の、正常な、非変異の、又は非再編成のゲノムポリヌクレオチド配列とのハイブリダイゼーションに基づく比較は、データバンクに開示されている、又は、試料に対して実験的に得られる。
本明細書に開示する技術は、疾患の診断に、また、ある疾患、障害、又は状態と関連する遺伝子再編成の特定のために適用することができる。これらの技術は、特定の再編成を有する対象又は対象群の、治療法に対する応答、環境要因に対する応答、又は生活様式の選択の影響を研究するためのコンパニオン診断として使用することもできる。特に、本発明の診断用生成物及び方法は、結腸直腸癌を罹患している、又は発症するリスクがある対象についての診断及び評価のために有用である。高分解能バーコードは、患者の層別化/分類及び予後の段階での拡張又は拡大された診断についての患者の多重分析を可能にする。したがって、本明細書に開示する技術は、疾患、障害、又は状態の進行及び確実性の高い予後、並びに進行、安定、又は回復の可能性を予測するために使用することもできる。多重高分解能バーコードはまた、ある特定の種類の治療法から恩恵を受けるであろう対象における鍵となる遺伝子変化の特定、並びにある特定の種類の治療法又は治療介入に対する対象の反応を評価するための方式を可能にする。
本発明の具体的実施態様としては、以下が挙げられる。この実施態様は、特に、インビトロで実施される。
変異した又は再編成されたゲノムポリヌクレオチド配列を検出するための方法であって、(a1)変異又は再編成が探索される、対象となる1以上のゲノム領域(1又は複数)を含む標的ゲノムポリヌクレオチドと、対象となる各領域と結合する短プローブセットとを、短プローブセットが結合する標的配列の部分の間の長いギャップ無しにハイブリッド形成させること(前記短プローブセットは、各ゲノム領域上で、短プローブのいくつかが共に使用された時に、対象領域の内側又は外側に長い連続的なストレッチを形成するように選択された短プローブ(サブ)セットを任意に含む又は該短プローブと任意に組み合わせられ、かつ、該短プローブは、高頻度の反復配列を任意に除去することができる);或いは(a2)変異又は再編成が探索される、対象となる1以上のゲノム領域を含む標的ゲノムポリヌクレオチドを、対象となる各領域と結合する短プローブセットと、短プローブセットが結合する標的配列の部分の間の長いギャップ無しに、及び対象領域(1又は複数)の外側の近接配列と結合する1以上の長(ドッキング)プローブと、ハイブリッド形成させることと(ここでは、長プローブ(1又は複数)の配列(1又は複数)は、短プローブの配列とオーバーラップせず、かつ、該短プローブ及び/又は長プローブは、高頻度の反復配列の一部又は全部を任意に除去することができる);(b)対象ゲノム領域(1又は複数)に対してハイブリッド形成したプローブの部位を検出することと;任意に、(c)標的ゲノムポリヌクレオチド配列に対してハイブリッド形成したプローブの部位と、1以上のモチーフとを、前記プローブと基準の、対照の、正常な、非変異の、又は非再編成のゲノムポリヌクレオチド配列とのハイブリダイゼーションに基づいて比較すること;及び/又は、(d)変異した又は再編成されたゲノムポリヌクレオチドの存在を、特定の表現型、疾患、障害、又は状態と関連付けることを含む前記方法に関する。
本発明は特に、変異した又は再編成されたゲノムポリヌクレオチド配列が、癌に罹患している、又は癌に罹患している疑いがある、又は癌に対する遺伝的素因を有する可能性がある対象から得られる、本明細書に記載する方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、結腸直腸癌に罹患している、又は結腸直腸癌に罹患している疑いがある、又は結腸直腸癌に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。ここでは、前記短及び長プローブによって、結腸直腸癌と関連する変異又はゲノム再編成が特定され、かつ、前記の対照の、非変異の、又は正常なゲノム配列は、結腸直腸癌のリスクがない対象から得られ、かつ、ゲノム再編成の検出;及び前記ゲノム再編成が検出される場合、結腸直腸癌の存在又は結腸直腸癌を発症するリスクを評価すること。この方法では、プローブは、MSH2遺伝子に対して若しくはMSH2遺伝子の領域内で、又はMLH1遺伝子に対して若しくはMLH1遺伝子の領域内で特異的にハイブリッド形成することができる。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、乳癌に罹患している、又は乳癌に罹患している疑いがある、又は乳癌に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、卵巣癌に罹患している、又は卵巣癌に罹患している疑いがある、又は卵巣癌に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、肺癌に罹患している、又は肺癌に罹患している疑いがある、又は肺癌に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、循環器疾患、障害、若しくは状態に罹患している、又は循環器疾患、障害、若しくは状態に罹患している疑いがある、又は循環器疾患、障害、若しくは状態に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、糖尿病に罹患している、又は糖尿病に罹患している疑いがある、又は糖尿病に対する遺伝的素因を有する可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、神経筋障害に罹患している、又は神経筋障害に罹患している疑いがある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、遺伝子又は遺伝性疾患、障害、又は状態に罹患している、又は罹患している疑いがある、又は保因者である可能性がある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、短及び長プローブ配列が、癌、結腸直腸癌、又は既知若しくは未知の胎児の遺伝子変化と関連するヒト遺伝子に対して又はヒトゲノム領域に対して、前記領域又は遺伝子が変異した又は遺伝子再編成された場合に特異的である方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、複遺伝子性の遺伝子又は遺伝性疾患、障害、又は状態、或いはゲノムDNAの再編成と関連する遺伝子又は遺伝性疾患、障害、又は状態に罹患している、又は罹患している疑いがある、又は保因者である疑いがある対象から得られる方法に関する。
本発明はまた、特定の実施態様では、変異した又は再編成されたゲノムポリヌクレオチド配列が、遺伝性の又は後天性のゲノム再編成と関連する疾患、障害、又は状態の治療を受けている対象から得られ、かつ、得られた結果が、治療前、治療中、又は治療の停止後の、他の時点で得られた結果と比較される方法に関する。
本発明は、個々に又は任意の組み合わせで採用される以下の特徴によって特徴付けられる、本明細書に記載する実施態様のいずれかの方法に関する:(a2)における短プローブ及び長プローブとのハイブリッド形成は、同時に実施される;短プローブは、10kb以下である;及び/又は、短プローブ(1又は複数)は、変異した又は再編成されたポリヌクレオチド配列に対して連続的にハイブリッド形成する、少なくとも1つの短配列(10kb未満)と少なくとも1つのオーバーラップしていない長配列(12kb超)、又は少なくとも2つの短配列(それぞれ5、6、7、8、9、又は10kb未満)の少なくとも1つの群(群全体の長さは、12kb超かつ150kb未満である)を含む。これらの方法では、短プローブは、少なくとも14kbである対象領域の内側又は外側のゲノムポリヌクレオチド配列のストレッチにまたがる連続的なプローブのセットを含むことができる;及び/又は、長プローブ(1又は複数)は、14kb超かつ40kb未満の1以上のドッキングプローブを含むことができる。長プローブ(1又は複数)は、少なくとも14kbの長さを有し、かつ、対象領域の外側のポリヌクレオチド配列と結合することができる。
長プローブと短プローブはどちらも、高頻度で出現する反復DNA配列を排除するように設計することができる。長プローブ及び短プローブから排除することができるこれらの反復DNA配列は一般に、2回以上、またその長さ及び塩基含量に基づいて統計的に予測されるよりもしばしば多く、出現するものである。例えば、2回以上、またその長さ及び塩基含量に基づいて統計的に予測されるよりもしばしば多く出現する、50から400の連続的なヌクレオチドの長さの反復DNA配列を、短プローブ及び/又は長プローブ(1又は複数)から排除することができる。短プローブ及び長プローブから排除することができる反復配列の一例は、反復AluファミリーDNA配列のメンバーである。
本発明のいくつかの実施態様では、第1の実施態様の(b)におけるプローブは、蛍光定量的に検出することができるように、蛍光的にタグ付けされる。b)における他の実施態様では、各プローブは、2つ以上の蛍光タグのうちの1つでタグ付けされる。
先述の方法の他の実施態様によれば、あらゆるプローブ配列の代わりに、モチーフ又は容易に識別可能なプローブのサブセットが、検出及び比較される。
先に記載した方法は、少なくとも3、4、5、6、7、8、9、10、11、12個、又はそれ以上の短プローブを用いることができる。これらの短プローブは、それぞれ、最小500、600、700、800、900又はそれ以上の塩基対(bp)の長さを有することができる。先述の方法のいくつかの実施態様では、プローブは、対象ゲノム領域内の短プローブ間のギャップが、それぞれ多くとも12kbであるように選択されることとなる。さらなる実施態様では、短プローブは、対象となる単一の連続的なゲノム領域と結合することとなる、又は、短プローブは、対象となる2以上の非連続的なゲノム領域と結合するように選択することができる。先述の方法において使用される長プローブは、多くとも20、30、又は40kbであるように選択することができる。先に記載した方法における対象ゲノム領域(1又は複数)は、又は該ゲノム領域はそれぞれ、50kb超であるように選択することができる。
本発明の別の実施態様は、短プローブセット、又は短プローブセットと長プローブセット(1又は複数);及び任意に、前記プローブをポリヌクレオチドに結合させるための、及び/又は分子コーミングを実施するための、及び/又はハイブリダイゼーションが起こったかどうかを検出するための1以上の成分;を含むキットである。(i)ここでは、短プローブは、対象ゲノム領域の長い連続的ストレッチに共に結合するプローブのセットを含む;又は(ii)ここでは、長プローブは、対象ゲノム領域の外側の配列と結合し、短プローブ配列とオーバーラップしない;また、任意に、反復配列は、長プローブ及び/又は短プローブから除去されている。本発明のキットは、本明細書に開示する本発明の方法における使用に適している、及び/又は該使用に特異的である。特定の実施態様では、このキットの短プローブ及び/又は長プローブは、該方法に関して、本明細書に記載する特徴によって特徴付けられる。こうしたキットは、結腸直腸癌又は結腸直腸癌に対する遺伝的素因と関連するゲノム再編成の検出のために;乳癌又は乳癌に対する遺伝的素因と関連するゲノム再編成の検出のために;卵巣癌又は卵巣癌に対する遺伝的素因と関連するゲノム再編成の検出のために;肺癌又は肺癌に対する遺伝的素因と関連するゲノム再編成の検出のために用いることができる、又は、これらの検出のための説明書を含有することができる。
本発明の別の実施態様は、先述の第1の実施態様に記載した短プローブ、又は短及び長プローブ(1又は複数)を含有する組成物である。ここでは、前記プローブ配列のうちの少なくとも2つは、分子コーミングを使用することによって、遺伝子再編成を検出し、前記組成物は、(a)少なくとも1つの短配列(10kb未満)及び少なくとも1つのオーバーラップしていない長配列(14kb超)、又は(b)少なくとも2つの短配列(それぞれ10kb未満)の少なくとも1つの群(全長は、14kb超かつ150kb未満である)を含み、遺伝子標的に対して連続的にハイブリッド形成する。この組成物においては、短プローブ(1又は複数)は、0.5kbから9kbの範囲であり得、長プローブ(1又は複数)は、14kbから40kbの範囲であり得る。短プローブのサイズは、0.5から9kbの範囲であり得、少なくとも90%の高頻度の反復配列は、短プローブ配列から除去することができる。この組成物は、MSH2遺伝子に対して若しくはMSH2遺伝子の領域内で、又はMLH1遺伝子に対して若しくはMLH1遺伝子の領域内で特異的にハイブリッド形成するプローブ配列を含有することができる。
さらに別の実施態様では、本発明は、(a)対象ゲノム領域を含有するポリヌクレオチドを特定することと、(b)対象ゲノム領域の外側であるが、対象領域内の最も近いプローブの100kb以内である長プローブ配列を選択し、該長プローブ配列から、高頻度で反復している配列を任意に除去することと、(c)短プローブ間に15kb超のギャップが生じないように、対象ゲノム領域内から短プローブ配列を選択すること;又は対象ゲノム領域をカバーする長い連続的ストレッチを共に形成する一連の短プローブを選択することと;(d)該プローブを、対象ゲノム領域を含むゲノムポリヌクレオチドとハイブリッド形成させることと、(e)ハイブリッド形成したプローブを検出することと、(f)対象ゲノム配列を基準のゲノム配列から特異的に区別するモチーフを、どのプローブセットが形成するかを判定することとを含む方法に関して本明細書に記載する短及び長プローブを設計するための方法を含む。
(A)RP11-1084A21 BACクローンに対するMSH2遺伝子配列のドットプロット。(B)RP11-1084A21に対するプローブコードv1(反復成分を含まない)。(C)RP11-1084A21に対するプローブコード-v2。対角線は、2つの配列間の完全に一致するDNA領域である。点は、反復成分の代表である。より高い密度の点(又はグレーバンド)は、より高い密度の反復成分である。 MLH1領域のドットプロット分析。(A)RP11-426N19 BACクローンに対するMLH1遺伝子配列のドットプロット。(B)RP11-426N19に対するプローブコードv1(反復成分を含まない)。(C)RP11-426N19に対するプローブコード-v2。 反復成分の排除によるMSH2用の設計されたプローブセット。A)理論的プローブセット(顕微鏡観察実験における赤色及び緑色での標識は、ここでは、それぞれグレー及び黒で表される)、及びエキソンの位置(番号付きの小さな点)。(B)MSH2-v1プローブセットに相当する実際のハイブリダイゼーション画像。本来の顕微鏡観察画像は、各チャネルが、所与のフルオロフォアからのシグナルである、3チャネル画像からなる-これらは、顕微鏡観察手順において別々に得られる。これらのチャネルは、ここでは、グレースケールでの異なる濃淡として表される:緑色プローブは黒で、赤色プローブはグレーで示されるのに対し、背景(シグナルが存在しない)は、白色である。縦横比は維持されず、プローブの視認性を向上させるために、シグナルは、「広げられて」(すなわち、DNA繊維の方向に対して垂直に引き伸ばされて)いる。 反復成分の排除によるMLH1用の設計されたプローブセット。A)理論的プローブセット(赤色及び緑色)、及びエキソンの位置(紫色の点)。(B)MLH1-v1プローブセットに相当する実際のハイブリダイゼーション画像。図表及び顕微鏡観察画像については、図3のパネルA及びBと同じ色表現が使用される。 ドッキングプローブ(v2)を含む、MSH2用の設計されたプローブセット。(A)理論的プローブセット。B)MSH2-v2プローブセットに相当する実際のハイブリダイゼーション画像。この画像及び他の3色の顕微鏡観察画像(及び相当する図表)における色表現は、以下の通りである:青色プローブは黒、緑色プローブはダークグレー、赤色プローブはライトグレーで表され、背景は白色である。 ドッキングプローブ(v2)を含む、MLH1用の設計されたプローブセット。(A)理論的プローブセット。(B)MLH1-v1プローブセットに相当する実際のハイブリダイゼーション画像。図表及び顕微鏡観察画像については、図5と同じ色表現が使用される。 LoVo細胞株におけるMSH2における、v2プローブセットを用いるゲノム再編成の確認。理論的プローブセット(上)と、分子コーミングによって確認された再編成(中央)の概略図。写真(下)は、MSH2の(例えば中央に見られるような)エキソン3からエキソン8の欠失に相当する、反復性の異常なシグナルセットである。図表及び顕微鏡観察画像については、図5と同じ色表現が使用される。 SK-OV-3細胞株におけるMLH1における、v2プローブセットを用いるゲノム再編成の確認。理論的プローブセット(上)と、分子コーミングによって確認された再編成(中央)の概略図。写真(下)は、MLH1プローブセットの上流(理論的プローブセットの左側)に相当する、代表的な(ただし少数例の)シグナルセットである。MSH2プローブシグナル(正常)とMLH1(左側の一部)との観察数の違いによって、MLH1におけるエキソン4から19の欠失がホモであることが明確に実証される(参照文献7と一致する)。また、分子コーミング試験によって、欠失の切断点が、以前に報告されていたよりも大きい(エキソン19からの下流プローブがすべて欠失している)ことが明らかになった。図表及び顕微鏡観察画像については、図5と同じ色表現が使用される。
表1は、本発明のプローブを設計するための、ハイブリダイゼーションフラグメント合成のために使用される、ヒトゲノムDNAに対するプライマー配列及び同等物を記載している。記載した配列の末端にヌクレオチドを添加し、40ヌクレオチドにすることによって得られるこれらのプライマー又は変形形態は、本発明の一部である。
表2.プローブセットの配列及びそのカバー領域の分析。具体的に開示されたこれらの配列及びプローブセットは、本発明の一部である。
それぞれのプローブセットの配列又は領域を、RepeatMasker試験にかけ、代表的な値のいくつかを、表に示す。合計長:各セットにおけるすべてのプローブの配列の合計。MLH1及びMSH2領域については、これは、各領域の全長である。反復長:ヒトゲノムにおける反復の部類と認識される配列の合計。これには、SINE以外の配列が含まれる。総反復:合計長における反復長の割合(%)。SINE:合計長においてSINEと分類される配列の割合(%)。ALUs:合計長においてAluファミリー配列と分類される配列の割合(%)。
(発明の詳細な説明)
先に記載した戦略は、言及した理由により、分子コーミングなどの技術を使用する診断用途のための高分解能コードを設計するのには適さない。
本発明では、プローブは、以下の通りに定義される:短プローブは、あるゲノム配列と相補的な核酸配列であり、このプローブは、いったんそのゲノム配列に対してハイブリッド形成した後、所与のマーカー(蛍光色素など)を用いて検出することができる。1本のプローブは、(i)全配列をカバーする単一のフラグメント、又は(ii)いくつかの厳密には連続的なフラグメント、及び/又は(iii)わずかにオーバーラップするフラグメント(250bp未満のオーバーラップ)、及び/又は(iv)非常に短いギャップ(1000bp未満)によって分離されるフラグメントから作製することができる。こうした短いオーバーラップ又はギャップを伴い、現行の設定で分子コーミングを使用すると、フラグメントは、ほぼ連続的に見える。距離は、具体的な技術及び実験条件に応じて調節することができる。例えば、より低い分解能の条件では、より長いギャップ(2kb未満)又はオーバーラップが許容可能であり、こうしたギャップによって分離される、提供されるフラグメントは、それでも連続的に見える。より高い分解能の条件下では、フラグメントが連続的に見えるように、ギャップは、より短いもの(200bp未満)であるべきである。短プローブのサイズは、500bpから10kbの範囲である。
長プローブは、あるゲノム配列と相補的な核酸配列であり、このプローブは、いったんそのゲノム配列に対してハイブリッド形成した後、所与のマーカー(蛍光色素など)を用いて検出することができる。1本のプローブは、(i)全配列をカバーする単一のフラグメント、又は(ii)いくつかの厳密には連続的なフラグメント、及び/又は(iii)わずかにオーバーラップするフラグメント(250bp未満のオーバーラップ)、及び/又は(iv)70%超の標的配列ストレッチが、プローブによってカバーされるという条件で(すなわち、ギャップが、30%未満の標的配列に対応するという条件で)ギャップ(3.5kb未満)によって分離されるフラグメントから作製することができる。こうしたオーバーラップ又はギャップを伴い、現行の設定で分子コーミングを使用すると、フラグメントは、効率的に検出される。距離は、具体的な技術及び実験条件に応じて調節することができる。例えば、より低い分解能の条件では、より長いギャップ(それぞれ5kb未満、全体では配列の50%未満に対応)又はオーバーラップが許容可能であり、こうしたギャップによって分離される、提供されるフラグメントは、それでも効率的に検出される。また、こうした条件下では、効率的な検出を可能にするために、より長いプローブ(20kb超)が使用されるべきである。より高い分解能の条件下では、フラグメントが効率的に検出されるように、ギャップは、より短いもの(2kb未満)であるべきであり、プローブは、より短いサイズ(10kb超)を用いて、さらに効率的に検出することができる。長プローブのサイズは、12kbから150kbの範囲である。
本発明では、プローブのサイズは、ゲノム配列の長さを反映する。ここでは、プローブは、DNA分子中の鎖の数とは無関係にハイブリッド形成する。したがって、プローブは、1kb(1キロベース=1000塩基)、又はそれと区別なく1000bp(塩基対)と記述することができ:どちらの場合でも、プローブは、標的DNA分子の鎖のうちの1つの1000塩基にわたって(また、プローブが二本鎖である場合、標的分子の他の鎖の相補的な1000塩基に対しても)ハイブリッド形成する。
本発明では、「バーコード」は、異なるマーカーで標識されたプローブのセットによって形成された、特異的なモチーフを指す。ここでは、モチーフ特性は、そのセットにおけるプローブの長さ、連続的プローブを分離するギャップの長さ、及びプローブが検出される色(又は、より一般には、プローブを標識するマーカー)である。
高被覆バーコードは、高分解能、プローブ、及びおおよそ0.5kbから10kbの範囲である必要がある間隔の長さに合わせて設計されるべきである(上記参照)。これによって、再編成を完全に排除し、さらには、高い部位精度を可能にするコードにとって十分に間隔が狭いプローブを設計することは非実用的になる。一方、プローブのいくつかの非特異的ハイブリダイゼーション(すなわち、そのプローブの設計された標的ではないゲノム領域に対するプローブ[の一部]のハイブリダイゼーション)は、シグナルの読み取りに対するコード戦略を使用する場合に、許容し得るものである。実際、単一プローブのハイブリダイゼーションが評価されるサザンブロット、又はあらゆるプローブのハイブリダイゼーションが別々に考慮されるaCGHなどの適用例では、たとえ非常に限られた数の領域に対するプローブの非特異的なハイブリダイゼーションでさえ、使用不可能な結果をもたらす可能性がある。程度はより低いが、これは、FISHなどの複数プローブ適用例の場合もそうである。FISHの分解能が、数十メガベースほどに距離が離れたゲノム領域を識別するのに不十分であるからである。単回の非特異的なハイブリダイゼーションは、標的領域に対して十分に近くに位置している場合に、使用不可能な結果をもたらすであろう。
コード戦略を使用する分子コーミング及び他の同様の適用例では、非特異的にハイブリッド形成したプローブの量自体は、主な問題ではない。プローブ(又はプローブのフラグメント)が、対象領域の外側に、さらに複数回ハイブリッド形成する場合、混乱させることとなるコードに対して、十分に類似しているモチーフを再び形成するとは考えにくい。また、短配列(<<1kb)に対する非特異的なハイブリダイゼーションは、非特異的なハイブリダイゼーションの長い(>1kb)ストレッチを産生するのに十分にクラスター化されていない限り、対象領域内であっても、検出されない可能性が高いであろう。
先の理由で、本発明者らは、主な問題点が、(いくつかの)所与のゲノム領域(1又は複数)における(いくつかの)高分解能コード(1又は複数)の設計である場合の、プローブの設計のための代替手法を開発した。この手法の主要なステップは、領域(1又は複数)それ自体の配列の知識に頼るのみである。こうしたコードを設計する場合、主な問題は、対象(1又は複数)となる領域内の大幅な非特異的ハイブリダイゼーションを避けることである。非特異的ハイブリダイゼーションは、いくつかのプローブが、対象領域の外側の隣接する配列に対して非特異的ハイブリダイゼーションを示す場合にのみ問題となる。後者の場合、プローブのパターンが、本来のコード又はそれの再編成型に類似し、これが誤った結論をもたらす可能性があるというリスクが存在する。本明細書に記載する発明は、こうした存在を排除できないが、本明細書に記載する方法が、いったん、他の非特異的ハイブリダイゼーションを排除するために使用されれば、これは、比較的容易に行われる(以下を参照のこと)。
この手法の基本は、対象領域(1又は複数)内で反復している配列の検出及び排除である。そのためには、対応する配列(1又は複数)(標的配列(1又は複数))のみを知る必要がある。こうした反復を検出するための、ある簡単な方式は、標的配列(1又は複数)内の局在的配列アライメントを探すことであり、これは、例えば各標的配列の、それ自体との、及び他の標的配列とのドットプロット比較を用いて行うことができる。ドットプロットは、2軸を成して比較される2つの(セットの)配列を伴うグラフであり、座標が局在的相同性に相当するあらゆる位置に、点が付けられる。例えば、配列Aからのヌクレオチドx(横軸)が、配列Bからのヌクレオチドy(縦軸)と一致する場合、点は、(x;y)座標を伴う位置に表示されることとなる。グラフでは、局在的アライメントは、対角線として現れる。ドットプロットから生じた、より精巧ないくつかの手段が利用可能である。これは、単一ヌクレオチドではなく短配列(「コドン(word)」、一般的に数ヌクレオチド/数十ヌクレオチド長)を比較し、相同の程度に応じて様々なグレーの濃淡で点を表示し、それによって、ゆるやかな相同性の直接的視覚的読み取りが可能になる(非特異的なハイブリダイゼーションは、不完全な相同性を伴って良好に表示され得る)。比較はまた、配列のうちの1つの両方の鎖に対して直接的に行うことができ、それによって、センス方向と逆相補方向の両方についての相同性が明らかになる。こうした手段の例は、「Dotter」である(参照文献4)。
これらの手段を用いると、ヒトゲノム中のAlu配列などの非常に高頻度の反復配列は、かなりはっきりと現れる。これらは、標的領域内の多数の他の配列との局在的相同性を有するからである。したがって、高頻度のこれらの配列を有するストレッチは、グレーのバンドとして現れる(ストレッチが、縦軸上に位置するか横軸上に位置するかに応じて、水平又は垂直)。ドットプロット表示手段を用いるこれらのストレッチの厳密な外観は、設定、及び、もしかするとコドンサイズに依存することとなる。設定は、80%を超える相同性を有する200bpよりも長い配列ストレッチが、はっきりと現れ、かつ、おおよそ10bpの精度で位置し得るように選択される。
対象領域内の、10を超えるかなりの相同配列を含有する200bp又はそれ以上の配列(1、2、3、4、5、10、15、又は20%未満のヌクレオチドミスマッチ又は挿入/欠失)は、かなりの非特異的なハイブリダイゼーションを引き起こしやすい、高頻度の反復配列である。一般に、これらの高頻度の反復配列を欠くようにプローブを設計することが可能であり、したがって、公開されている以前の方法と比較すると、本発明の技術の特異性及び高分解能が増している。
(「ドッキング」プローブ)
先に示した通り、より短いプローブは、切断点の、より厳密な位置推定、及び欠失した又は増幅された配列の測定に役立つが、一般的に言えば、ファイバーFISH技術及び分子コーミングを用いて検出するのは、より困難である。より短いプローブは、シグナルの、より短いストレッチとして現れる、すなわち、これは、より小さく、かつ、ノイズ(プローブ又はプローブのハイブリダイゼーションとは無関係の蛍光スポット)と区別しにくいからである。これは、シグナルの自動的(コンピュータによる)検出を考える場合に特に当てはまる。
したがって、コード内に、より長いプローブ(例えば、特に、MSH2又はMLH1遺伝子の領域内の遺伝子再編成の検出のための、12kb超かつ150kb未満、好ましくは14kb超かつ40kb未満)を含むことが望ましい。これらのプローブは、ノイズと迅速に区別可能であり、かつ、そのサイズのおかげで容易に検出可能である、(スポットではなく)実線として現れるであろう。いったん対象シグナルが検出されれば、同じDNA繊維上に位置する他のプローブの検出が、容易になる。
これは、分子コーミングなどの技術を使用して、繊維の直線性が、第1のプローブのアライメント内に位置する他のプローブ(もし存在すれば)を意味する場合に、特に当てはまる。したがって、本発明は、プローブセットに、より長い(>12kb、好ましくは>14kb)プローブを含めることが、対象シグナルの、より容易な検出のためのステップであることを提供する。セット内のすべてのプローブがその長さである必要があるわけではなく:迅速かつ「粗い」検出ステップでは、対象シグナルの位置推定を可能にする長プローブが探索される。このプローブは、対象領域への「着地」を効率的に可能にすることから、「ドッキングプローブ」と呼ばれる。第2のステップでは、ドッキングプローブの近くで(より具体的には、このプローブのアライメントにおける、分子コーミング又は関連技術の場合)、より短いプローブが探索される。ヒト作業者によって実施される場合、これらのステップは、形式上連続的に実行することはほとんどできないが、作業者が、より長いプローブに限定して探索を行うことができるならば、画像をより迅速に閲覧することができ、それによって、この作業者は、これらのプローブを検出するだけで済み、他の、より短いプローブを探すために、より多くの時間を、ドッキングプローブが見られる画像に費やすであろう。より長いドッキングプローブは、部位精度及びコードの分解能を局所的に減じる可能性があるので、再編成が探索される領域には位置されないことが好ましい。これは、プローブが、対象領域内ではないがその近くに、例えば、この領域のどちらかの端に位置する場合に可能である。
所与の領域の分析において、完全なシグナル(すなわち、連続的な領域全体をカバーするシグナル)を考慮することのみが望ましい場合、これらの、より長いプローブを、領域の完全性を評価するために使用することもできる:各端に位置するプローブが存在する、また、両方のプローブが存在する場合、DNA調製又は伸長ステップ中に、繊維の切断は起こらない。単一の試験において、いくつかの非連続的な領域が分析される場合、正確に検出するために、明らかにそれぞれの領域が、その「ドッキング」プローブを有しなければならない。
(短プローブの連続的ストレッチ)
先述の「ドッキングプローブ」手法に代わるものは、より短いプローブの少なくとも一部の群が、シグナルの連続的ストレッチを形成するように、プローブのセットを設計することである。これは、プローブ配列が隣接している場合に可能である。この場合、いくつかのプローブが、十分な分解能を提供するために必要なだけ短い(10kb未満)とはいえ、上手く組み合わされて、迅速かつ信頼度の高い検出のための十分に長い(14kb超)シグナルを形成することができる。実際、作業者が、カラーチャネルを画像と組み合わせることができるならば、このストレッチは、スポットではなく長い線として現れ、背景ノイズとの区別が可能になるであろう。これは、蛍光顕微鏡観察におけるトリカラーフィルターなどの通常の光学装置を使用することによって、又は、通常の画像表示ソフトウェアを使用することによって可能である。自動検出の場合、複合的な色情報を使用し、したがって、背景スポット様のノイズに対して多色線の非常に特徴的な外観を使用することも可能である。
(測定)
先に記載したプローブ設計は、ある試験において測定されることとなる多数のプローブをもたらす可能性がある。プローブ測定のための通常の手法は、シグナルを成すプローブならびにこれを分離するギャップのすべてを測定することである。多数のプローブを用いる試験では、結果を分析するために必要とされる作業の量は増える。これを埋め合わせるために、本発明は、シグナル測定のための、より効率的な手法の設計に関する。この手法は、容易に認識できるモチーフを成すプローブのサブグループの測定にある。サブグループは、2つ又は数個の連続するプローブ及びその間のギャップ、及びもしかすると、全長をかなり厳密な測定範囲内(10〜30kb)に維持するために選択されるどちらかの端のギャップである。
蛍光のセグメントのデジタル化画像の測定では、系統的バイアスが存在する可能性がある。実際、こうしたフラグメントの末端では、シグナルの強度は、中心から遠ざかると、徐々に低下し、背景のレベルに到達する。作業者/ソフトウェアが、実際の末端の決定のための閾値をどこに設定したかに応じて、長さの一貫した過大又は過小評価が存在し得る。このバイアスは、測定されるモチーフが、一端にプローブを、別の端にギャップを有する場合に相殺される。したがって、このようにモチーフを設計することが好ましい。
あるモチーフが、所与の試料において、(予測される理論的長さとは異なる)異常な長さを有することが判明している場合、再編成の部位をさらに厳密に決める(precise)ために、このモチーフの範囲内のプローブ及びギャップを測定する可能性が残る。この手法では、小さなプローブによって可能にされる部位精度を維持したまま、最初のスクリーニングに対するすべてのシグナルを迅速かつ効率的に測定することが可能である。プローブと比較するとより大きいサイズのサブグループが原因である、測定に対するいくらか低い精度は、同じ作業時間内で測定することが可能な非常に多くのシグナルによって、本質的に相殺される。
(HNPCC-根本的理由に対する適用)
結腸直腸癌は、ヒトにおける4番目に頻度の高い型の癌であり、この癌のおよそ5%は、遺伝性の型と考えられる。最も頻度の高い型の遺伝性の結腸直腸癌は、リンチ症候群、又はHNPCC(遺伝性非ポリポーシス大腸癌)として知られる。HNPCCは、癌発症の生涯リスクを80%まで増大させる(米国の正常集団では、生涯リスクはおよそ7%である)。HNPCCはまた、他の癌(子宮内膜癌、卵巣癌、胃癌)も増大させる。
HNPCCの遺伝面は、MSH2、MLH1、MSH6、PMS2などのミスマッチ修復(MMR)遺伝子のうちのいくつかの変異の結果として公知である。MSH2及びMLH1の変異は、HNPCCにおけるMMR遺伝子のすべての変異のうちの80%超を占める。これらの遺伝子の変異においては、点変異と大きな再編成との両方が報告されており、遺伝子配列における高レベルの小さな反復成分が原因で、MSH2における特に高い割合の大きな変異が認められている。今日では、癌の家族歴の調査、不安定性試験におけるマイクロサテライトによる腫瘍の特徴付け後に、分子診断が行われる。
通常、MMR遺伝子のうちの1つの変異1アレルは、HNPCCの分子診断にとって十分である。すべてのHNPCCの個人は、野生型遺伝子と変異遺伝子の両方を有する。標的MMR遺伝子の点変異は、遺伝子の配列決定によって検出することができ、現行の配列決定試験は、エキソンの配列のみを調べている。欠失及び増幅(それぞれ、遺伝因子の喪失又は獲得)などの大きな再編成の場合、これらは、配列決定によって検出されない。何故なら、変化した配列が存在せず、また、しばしば、配列決定のためのプライマー結合領域が欠失しているからである。結果として、配列情報は、野生型アレルのみに由来し、偽陰性が発生する。実際、MSH2及びMLH1遺伝子は、その遺伝子配列内のSINEの反復成分の割合が、より高い。この大きな再編成に対処するためには、試験によって、MMR遺伝子内の欠失又は増幅の存在が検出されるべきである。1つの手法は、ハイブリダイゼーションの設計されたプローブを用いるMMR遺伝子の地図作製(cartography)である。原因となる大きな再編成は、kb未満から全遺伝子の喪失(最大100kb)までの広い範囲にわたる。所与の地図作製は、この動的な広い範囲の変異に対して高感度でなければならない。これに対処するために、MSH2及びMLH1遺伝子座に対する特異的なプローブ設計を行った。
本発明はまた、既知又は未知のゲノム再編成の検出に関する。本発明はまた、既知又は未知のゲノム再編成、及び関連する病態、又は例えば癌若しくは循環器疾患などの病態に対する関連する素因の検出のための、本発明によるプローブを含有するキットに関する。
(HNPCCに対する適用-材料及び方法)
(プローブ設計v1)
各プローブ(プローブは連続的ハイブリダイゼーションシグナルを意味する)は、複数のクローン化DNAフラグメントから構成され得る。例えば、MSH2-v2のプローブ1は、15kbストレッチをカバーし、3kbの5本のクローン化DNAフラグメントからなる。これらの5本のフラグメントの各ジャンクションのギャップ又はオーバーラップは、分解能よりも小さい(<50bp)ので、これらは、3〜6kbの長さを有する遺伝子配列それ自体の領域に対する15kbの連続的な単一のプローブと考えられ、確かにそのようである。プローブ又はギャップサイズよりも大きな再編成の場合、設計されたプローブのカラーパターンの明らかな変化が認められることとなる。プローブ領域内での大きな再編成だけでなく、ギャップ領域内でのこうした再編成も検出可能であり、これは、標的遺伝子内のあらゆる位置での1kbよりも大きいいかなる再編成も検出可能であることを意味する。これは、高分解能プローブハイブリダイゼーションを用いる地図作製法の独自性である。他の技術(MLPA、aCGH)は、プローブ配列を含むこうした再編成しか検出することができない。MSH2及びMLH1などの、高頻度の大きな再編成を伴う遺伝子については、これらの遺伝子配列内の反復成分の存在が、他の技術のためのプローブ設計の自由を制限する。これらのプローブ設計において反復成分配列を含めることによって、誤った検出がかなり増大し、これらのプローブ設計は、原則として、反復成分を含むべきではない。
プローブ配列は、ドットプロット分析によって選択した。各遺伝子のBACクローン配列(MSH2についてはRP11-1084A21(Ch2:47,574,044-47,785,729)、MLH1についてはRP11-426N19(Ch3:36,992,516-37,161,490)は、自動プロットし、すべてのグレーバンド領域を、PCRプライマー設計の標的領域から排除した。PCRプライマーセットを、標的領域内で、Primer3plus PCRプライマー設計ツールによって設計した(参照文献6)。プライマーの配列のリストを、表1A及びBに示す。Alu反復の排除は、ドットプロット分析とRepeatMasker(http://www._repeatmasker.org)との両方によって検証した。図1B及び図2Bは、BACクローンに対するプローブフラグメント配列のドットプロットに関する、BACクローンに対する(Alu反復を含有する)遺伝子のドットプロットよりもかなり減少したグレーバンドを示す。これは、設計されたプローブの配列が、この標的領域内の反復性の反復配列を含まないことを示す。RepeatMasker分析(ウェブサーバーの初期設定を用いる)はまた、設計されたプローブ配列内のAlu配列の割合の劇的な低下を明確に示す(表2)。
(プローブ設計v2)
ハイブリダイゼーション画像上のバーコードの「認識」を容易にするために、「ドッキング」プローブセクションで言及した通りに、(v2と呼ばれる)プローブセットの代替設計を行った。設計プロセスは、ドットプロットに基づいて反復成分を排除しないことを除いて、v1と同じである。v2プローブ設計については、各プローブが、(「線」と認識される限界に近い)3kbを超える長さを有するように設計し、また、すべてのエキソン配列は、プローブストレッチによってカバーされる(ギャップ内に収まるエキソンがない)。ドッキングプローブを、15〜20kbの長さを有する各遺伝子の両端に対して設計した。MSH2-v2コードについては、EPCAM遺伝子をカバーする特異的なプローブ(原理部分を参照のこと)は、2つのドッキングプローブの間に含まれていた。設計されたコードv2のDNA配列を、ドットプロット分析にかけて、設計された領域の内部に分断された反復が存在しないことを確かめた(図1C及び2C)。
(プローブフラグメントのクローニング及びハイブリダイゼーションプローブの標識)
プローブの各フラグメントを、PCRによって増幅し、次いで、このフラグメントをプラスミドベクター(pNEB193、pCR2.1-TOPO、pCRXL-TOPO)に連結した。連結産物を、E.coliコンピテント細胞に形質転換し、クローン化されたフラグメントの末端配列を確認した。各遺伝子の精製されたプラスミドDNAセットを、理論的バーコードに対応する色に従って、2(v1)又は3(v2)グループに分けた(v1については図3A及び図4A、v2プローブセットについては図5及び図6)。各グループのプラスミドDNAを、ランダムプライミング法によって標識した。ランダムプライミングのための鋳型として、プローブフラグメントの配列又はPCR増幅されたプローブフラグメントを含有する完全なプラスミドを使用した。3色検出に使用される3つのハプテン、すなわち、ビオチン(Biot)、ジゴキシゲニン(Dig)、及びAlexa Fluor 488(A488)が存在する。Biot-標識は、製造者の説明書を伴うBioPrime DNA標識システム(Invitrogen社)によって行った。Dig及びA488標識については、キット内のdNTP混合物を、自分でブレンドしたdNTP混合物(最終の標識反応溶液中、Dig標識のための0.1mMジゴキシゲニン-11-dUTP(Roche applied science社)又はA488標識のための0.1mM ChromaTide(登録商標)Alexa Fluor(登録商標)488-7-OBEA-dCTP(Invitrogen社)、0.1mMの改変されていない同等物(dTTP又はdCTP)、及びそれぞれ0.2mMの他の3種のデオキシヌクレオチド)と置き換えた。
(試料DNA調製)
MSH2又はMLH1における大きな再編成の検出の確認のために、3種の細胞のヒト細胞株を使用した。細胞株GM17939は、非変異の試料として使用した。細胞株LoVoは、MSH2内のエキソン3〜エキソン8の欠失についてホモであるMSH2再編成の確認のために使用した。別の細胞株SK-OV-3は、MLH1内のエキソン4〜エキソン19のホモ欠失として報告されるMLH1の再編成確認のために使用した。各細胞株について、細胞バンクの説明に従って、細胞培養物を調製した。培養した細胞を(LoVo及びSK-OV-3について、集密度50〜70%の時に)採取、又は(GM17939について、培地1mlあたり300,000〜400,000細胞の時に)遠心分離によって収集した。細胞ペレットを、1×PBS/トリプシン混合物に、45μl中に1,000,000細胞を含むように再懸濁し、この細胞懸濁液を、同じ体積の(あらかじめ50℃で融解及び平衡化した)1.2%(w/v)NuSieve GTGアガロース溶液(1×PBS中)と混合した。細胞/アガロース混合物を、ゲルプラグモールドのウェルに注ぎ、続いて、4℃で30分間、ゲル化を行った。ゲル化したアガロースプラグを、2mg/mlのプロテイナーゼKと1%(w/v)のサルコシルの混合物(0.5M EDTA中)(pH8.0、各プラグにつき250μl)に浸した。このアガロースプラグを、50℃で一晩インキュベートした。
翌日、インキュベートしたプラグを、1×TE(10mM Tris-HCl、1mM EDTA、pH8.0)中で3回、それぞれ1時間洗浄した。このDNAプラグは、0.5mEDTA中で4℃で保管することができる。洗浄したプラグを、100μlの33μM YOYO-1(Invitrogen社)(TE40.2(40mM Tris-HCl、2mM EDTA pH8.0)中)中で、暗所で1時間、染色した。染色したプラグを、1mlのコーミング緩衝液(0.5M MES pH5.5)中で、68℃で20分間加熱し、次いで、42℃で10分、冷却し、その後、1.5単位のβアガラーゼI(NEB)を添加した。βアガラーゼ処理は、暗所で一晩、42℃で実施した。
翌日、処理したDNA溶液を、コーミング槽に注ぎ、槽内の溶液の高さを、追加のコーミング緩衝液を用いて調整した。
(分子コーミング)
DNA溶液を、Molecular Combing Machine(MCS、Genomic Vision社)にセットした。シラン処理したカバーガラス(Combicoverslips、Genomic Vision社)上で分子コーミングを実施した。コーミングしたカバーガラスを、68℃で4時間、固定し、次いでハイブリダイゼーションのために使用した(又は使用まで-20℃で保管した)。
(プローブのハイブリダイゼーション及び検出)
あるハイブリダイゼーションのために、5μlのそれぞれの(MSH2とMLH1の両方の)標識されたプローブ溶液を合わせ、10μgの超音波処理したニシン又はサケ精子DNA及び10μgのヒトCot1-DNA(V2プローブセットについてのみ)と組み合わせ、次いで、標準のエタノール沈殿によって精製した。沈殿を、20μlのハイブリダイゼーション緩衝液(50%ホルムアミド、2×SSC、1% SDS、及びBlockAidブロッキング溶液(Invitrogen社))で再懸濁した。再懸濁したプローブ溶液を、清潔なスライドガラスにセットし、DNAコーミングしたカバーガラスでカバーした。このスライドを、両方のプローブを共に変性させるために、90℃で5分間加熱し、次いで、コーミングしたDNAを、標識されたプローブとコーミングしたDNAとのハイブリダイゼーションのための湿度で、37℃で一晩、インキュベートした。
ハイブリッド形成したカバーガラスを、50%ホルムアミド/2×SSC溶液中で3回、それぞれ5分間、続いて、2×SSCでさらに3回、それぞれ5分間洗浄した。次いで、洗浄したカバーガラスを、2又は3層の蛍光標識された抗体又はストレプトアビジンを用いて顕出させた。各層については、すべてのハプテンに対する抗体を、BlockAidブロッキング溶液(最終体積中に20μl)で25倍希釈し、37℃で20分間インキュベートした。Biotについては、第1層及び第3層にStreptavidin Alexa Fluor 594(Invitrogen社)を使用し、第2層に、ビオチン結合-ヤギ抗ストレプトアビジン抗体を使用した。Digについては、第1層にマウス抗ジゴキシンAMCA結合型(Jackson immunoresearch社)、第2層にラット抗マウスAMCA結合型(Jackson immunoresearch社)、第3層に、ヤギ抗ラットAlexa Fluore 350結合型(Invitrogen社)を使用した。A488については、第1層にウサギ抗Alexa Fluor 488(Invitrogen社)、第2層にヤギ抗ウサギAlexa Fluor 488結合型を使用した(A488については第3の抗体は存在しない)。抗体の各層の20分のインキュベート後、カバーガラスを、2×SSC/1% Tween 20洗浄溶液中で、室温で3回、それぞれ5分間洗浄した。第3層の洗浄後、カバーガラスを1×PBS、続いて連続的な70、90、及び100%エタノール浴中で、それぞれ1分間すすいだ。カバーガラスを室温で乾燥させ、その後顕微鏡観察を行った。
(シグナルの獲得及び測定)
カバーガラス上で顕出させた抗体の蛍光シグナルを、分子コーミングシグナルのためのカスタムスキャニング構成を備えた標準の落射蛍光顕微鏡システム又は自動蛍光顕微鏡システム(Image Xpress Micro、Molecular Devices社)によって得た。直線上に並んだ蛍光シグナル及びギャップのあらゆるセットを、ImageJによって測定した。測定したそれぞれのシグナルのセット(色情報を有する)を、パターンマッチングにかけ、理論的プローブセットとの比較によって、位置(そのセットが、プローブセットのうちの1つの一部である場合)及び方向を決定した。すべての未分類のセット(理論的プローブセットのいかなる位置及び方向とも一致しない)を、これらのセット間の類似性チェックにかけ、反復性の異常なパターンが現れるかどうかを検出した。
(HNPCCに対する適用-結果)
図3B及び4Bは、ハイブリッド形成したDNAからのシグナルの代表的な画像である。いくつかのプローブは、その長さから予測される通りの「線」ではなく「点」のように見える。ハイブリダイゼーションの画像上には、いくつかの「ランダムな」スポットが存在するが、これらのスポットは、設計されたコードの認識を邪魔しない。いくつかの小さなプローブのシグナル(例えば、図3Bにおける矢印部分)は、サイズ評価のためのプローブシグナルの「長さ」を測定するためにははっきりしていないが、プローブシグナル間の「距離」の測定は可能であり、これは、正常なプローブセットハイブリダイゼーションにおけるプローブの長さ及びギャップの測定と等しい。
図5B及び6Bは、バーコード-v2のハイブリダイゼーションシグナルの代表的な画像である。蛍光シグナルは、バーコード-v1のシグナルよりも連続的であり、ドッキングプローブを発見する、また、各プローブの長さ及びギャップを測定するのが、より容易である。これらのバーコード-v2を使用して、特徴付けられた癌細胞株、すなわちLoVo及びSK-OV-3(参照文献5)の大きなゲノム再編成を視覚化した。
図7は、LoVo細胞株由来のコーミングしたDNAに対するバーコードv2のハイブリダイゼーションの結果である;LoVo細胞株は、MSH2における欠失(エキソン3から8)についてホモである。ハイブリダイゼーションスライドは、MLH1遺伝子の多くの正常な(理論的コードと同一の)シグナルを有していたが、いずれの正常なMSH2シグナルも有していなかった。実際、切断された形の正常なMSH2シグナルの反復性のシグナルが存在していた(図7B)。切断されたシグナルからの推測によると、この切断は、MSH2遺伝子のエキソン3から8に対応するプローブ及びギャップの喪失に起因する。
図8は、MLH1内の欠失(エキソン4から19)についてホモであるSK-OV-3細胞株DNAに対するバーコード-v2の結果である。多くの正常なMSH2シグナルのうち、MLH1の一部の数シグナル(プローブ1からプローブ3)のみが認められた。これは、MLH1の以下の配列の欠如を意味し、これは参照文献と一致している。さらに、右の(MLH1の下流の)ドッキングプローブの欠如は、この欠失が、MLH1のエキソン19を越えて影響を与えていることを示す。
MSH2ゲノム領域又はMLH1ゲノム領域内の再編成と関連する結腸直腸癌に対する素因を検出するために選択される配列は、以下のヌクレオチド配列及びその対応する相補的配列の中から選択されることが好ましい。これらの配列は、以下のものとして記載される:
MSH2遺伝子領域をカバーし、かつ連続的なストレッチを構成する短プローブ(表1内の見出しMSH2-v2の下の、PE1〜2及びPE3〜6(配列番号:354〜358);PE9からPE15〜16(配列番号:365〜373))、及びMSH2遺伝子領域をカバーする他の短プローブ(表1内の見出しMSH2-v2の下の、PE7及びPE8、配列番号:359〜364);MSH2遺伝子に隣接する長プローブ(表1内の見出しMSH2-v2の下のtPP1、EPCAM5’、EPCAM3’(配列番号:342〜353)、及びcPP1(配列番号:374〜378));MLH1遺伝子領域をカバーし、かつ連続的なストレッチを構成する短プローブ(表1内の見出しMLH1-v2の下の、PE1〜2からPE10〜11、配列番号:386-396)、及びMLH1遺伝子領域をカバーする他の短プローブ(表1内の見出しMLH1-v2の下の、PE12〜13、PE14〜15、及びPE16〜19、配列番号:397〜401);MLH1遺伝子に隣接する長プローブ(表1内の見出しMLH1-v2の下の、tPP1(配列番号:379〜385)及びcPP1(配列番号:402〜408))。例えば、これらのプローブは、表1内の見出しMSH2-v2(配列番号:139〜212)及びMLH1-v2(配列番号:213〜272)の下に列挙するプライマーを使用するフラグメントの増幅によって得ることができる。
(参照文献の組み込み)
本開示によって引用された、又は本開示において言及したそれぞれの文書、特許、特許出願又は特許公報の全体を、特に、本文中の参照文献の引用を取り巻く具体的な対象物に関して、参照により組み込む。しかし、あらゆるこうした参照文献が、背景技術を構成し、かつ、引用された文書の正確性及び妥当性に異議を申し立てる権利が留保されることは容認されない。
表1
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
Figure 2014535050
表2
Figure 2014535050
参考文献
Figure 2014535050

Claims (48)

  1. 変異した又は再編成されたゲノムポリヌクレオチド(標的)配列をインビトロ検出するための方法であって、
    (a1)変異又は再編成が探索される、対象となる1以上のゲノム領域を含む標的ゲノムポリヌクレオチドを、対象となる各領域と結合する短プローブセットと、短プローブセットが結合する標的配列の部分の間の長いギャップ無しにハイブリッド形成させること(前記短プローブセットは、各ゲノム領域上で、短プローブのいくつかが共に使用された時に、対象領域の内側又は外側に長い連続的なストレッチを形成するように選択された短プローブ(サブ)セットを任意に含む又は該短プローブ(サブ)セットと任意に組み合わせられ、かつ、該短プローブは、高頻度の反復配列を任意に除去することができる);或いは
    (a2)変異又は再編成が探索される、対象となる1以上のゲノム領域を含む標的ゲノムポリヌクレオチドを、対象となる各領域と結合する短プローブセットと、短プローブセットが結合する標的配列の部分の間の長いギャップ無しに、及び対象領域(1又は複数)の外側の近接配列と結合する1以上の長(ドッキング)プローブと、ハイブリッド形成させることと(ここでは、長プローブ(1又は複数)の配列(1又は複数)は、短プローブの配列とオーバーラップせず、かつ、該短プローブ及び/又は長プローブは、高頻度の反復配列を任意に除去することができる);
    (b)対象ゲノム領域(1又は複数)に対してハイブリッド形成したプローブの部位を検出することと;任意に、
    (c)標的ゲノムポリヌクレオチド配列に対してハイブリッド形成したプローブの部位と、1以上のモチーフとを、前記プローブと基準の、対照の、正常な、非変異の、又は非再編成のゲノムポリヌクレオチド配列とのハイブリダイゼーションに基づいて比較すること;及び任意に、
    (d)変異した又は再編成されたゲノムポリヌクレオチドの存在を、特定の表現型、疾患、障害、又は状態と関連付けることを含む、前記方法。
  2. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、癌に罹患している、又は癌に罹患している疑いがある、又は癌に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  3. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、結腸直腸癌に罹患している、又は結腸直腸癌に罹患している疑いがある、又は結腸直腸癌に対する遺伝的素因を有する可能性がある対象から得られ、かつ、前記短及び長プローブによって、結腸直腸癌と関連する変異又はゲノム再編成が特定され、かつ、前記の対照の、非変異の、又は正常なゲノム配列は、結腸直腸癌のリスクがない対象から得られ、かつ、ゲノム再編成の検出;及び前記ゲノム再編成が検出される場合、結腸直腸癌の存在又は結腸直腸癌を発症するリスクを評価する、請求項1記載の方法。
  4. 前記プローブが、MSH2遺伝子に対して若しくはMSH2遺伝子の領域内で、又はMLH1遺伝子に対して若しくはMLH1遺伝子の領域内で特異的にハイブリッド形成する、請求項3記載の方法。
  5. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、乳癌に罹患している、又は乳癌に罹患している疑いがある、又は乳癌に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  6. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、卵巣癌に罹患している、又は卵巣癌に罹患している疑いがある、又は卵巣癌に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  7. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、肺癌に罹患している、又は肺癌に罹患している疑いがある、又は肺癌に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  8. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、循環器疾患、障害、若しくは状態に罹患している、又は循環器疾患、障害、若しくは状態に罹患している疑いがある、又は循環器疾患、障害、若しくは状態に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  9. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、糖尿病に罹患している、又は糖尿病に罹患している疑いがある、又は糖尿病に対する遺伝的素因を有する可能性がある対象から得られる、請求項1記載の方法。
  10. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、神経筋障害に罹患している、又は神経筋障害に罹患している疑いがある対象から得られる、請求項1記載の方法。
  11. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、遺伝子又は遺伝性疾患、障害、又は状態に罹患している、又は罹患している疑いがある、又は保因者である可能性がある対象から得られる、請求項1記載の方法。
  12. 前記短及び長プローブ配列が、癌、結腸直腸癌、又は既知若しくは未知の胎児の遺伝子変化と関連するヒト遺伝子に対して又はヒトゲノム領域に対して、前記領域又は遺伝子が変異した又は遺伝子再編成された場合に特異的である、請求項1から4のいずれか1項記載の方法。
  13. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、複遺伝子性の遺伝子又は遺伝性疾患、障害、又は状態、或いはゲノムDNAの再編成と関連する遺伝子又は遺伝性疾患、障害、又は状態に罹患している、又は罹患している疑いがある、又は保因者である疑いがある対象から得られる、請求項1記載の方法。
  14. 前記変異した又は再編成されたゲノムポリヌクレオチド配列が、遺伝性の又は後天性のゲノム再編成と関連する疾患、障害、又は状態の治療を受けている対象から得られ、かつ、得られた結果が、治療前、治療中、又は治療の停止後の、他の時点で得られた結果と比較される、請求項1記載の方法。
  15. (a2)における短プローブ及び長プローブとのハイブリッド形成が、同時に実施される、請求項1から14のいずれか1項記載の方法。
  16. 前記短プローブが10kb以下である、請求項1から14又は15のいずれか1項記載の方法。
  17. 前記短プローブ(1又は複数)が、
    変異した又は再編成されたポリヌクレオチド配列に対して連続的にハイブリッド形成する、
    少なくとも1つの短配列(10kb未満)と少なくとも1つのオーバーラップしていない長配列(12kb超)、又は
    少なくとも2つの短配列(それぞれ10kb未満)の少なくとも1つの群(群全体の長さは、12kb超かつ150kb未満である)
    を含む、請求項1から14又は15のいずれか1項記載の方法。
  18. 前記短プローブが、少なくとも14kbである対象領域の内側又は外側のゲノムポリヌクレオチド配列のストレッチにまたがる連続的なプローブのセットを含む、請求項1〜14又は15から17のいずれか1項記載の方法。
  19. 前記長プローブ(1又は複数)が、14kb超かつ40kb未満の1以上のドッキングプローブを含む、請求項1から14又は15から18のいずれか1項記載の方法。
  20. 前記長プローブ(1又は複数)が、少なくとも14kbであり、かつ、対象領域の外側のポリヌクレオチド配列と結合する、請求項1から14又は15から19のいずれか1項記載の方法。
  21. 高頻度で出現する反復DNA配列が、短プローブ及び/又は長プローブから排除されている、請求項1から14又は15から20のいずれか1項記載の方法。
  22. 2回以上、またその長さ及び塩基含量に基づいて統計的に予測されるよりも多く出現する反復DNA配列が、短プローブ及び/又は長プローブから排除されている、請求項1から14又は15から21のいずれか1項記載の方法。
  23. 2回以上、またその長さ及び塩基含量に基づいて統計的に予測されるよりも多く出現する、50から400の連続的なヌクレオチドの長さの反復DNA配列が、短プローブ及び/又は長プローブ(1又は複数)から排除されている、請求項1から14又は15から20のいずれか1項記載の方法。
  24. 反復AluファミリーDNA配列のほとんどが、短プローブ及び/又は長プローブから排除されている、請求項1から14又は15から23のいずれか1項記載の方法。
  25. b)における前記プローブが、蛍光的にタグ付けされ、蛍光定量的に検出される、請求項1から14又は15から24のいずれか1項記載の方法。
  26. b)における各プローブが、2つ以上の蛍光タグのうちの1つでタグ付けされる、請求項1から14又は15から24のいずれか1項記載の方法。
  27. あらゆるプローブ配列の代わりに、モチーフ又は容易に識別可能なプローブのサブセットが、検出及び比較される、請求項1から14又は15から26のいずれか1項記載の方法。
  28. 少なくとも3個の短プローブが用いられる、請求項1から14又は15から27のいずれか1項記載の方法。
  29. 少なくとも10個の短プローブが用いられる、請求項1から14又は15から27のいずれか1項記載の方法。
  30. 前記短プローブが、それぞれ少なくとも500bpである、請求項1から14又は15から29のいずれか1項記載の方法。
  31. 前記対象ゲノム領域内の短プローブ間のギャップが、それぞれ多くとも12kbである、請求項1から14又は15から30のいずれか1項記載の方法。
  32. 前記長プローブが、それぞれ多くとも40kbである、請求項1から14又は15から31のいずれか1項記載の方法。
  33. 前記対象ゲノム領域(1又は複数)がそれぞれ、50kb超である、請求項1から14又は15から32のいずれか1項記載の方法。
  34. 前記短プローブが、対象となる単一の連続的なゲノム領域と結合する、請求項1から14又は15から33のいずれか1項記載の方法。
  35. 前記短プローブが、対象となる2以上の非連続的なゲノム領域と結合する、請求項1から14又は15から33のいずれか1項記載の方法。
  36. 短プローブセット、又は短プローブ(1又は複数)セットと長プローブ(1又は複数)セット;及び任意に、前記プローブをポリヌクレオチドに結合させるための、分子コーミングを実施するための、及び/又はハイブリダイゼーションが起こったかどうかを検出するための1以上の成分;を含むキットであって、
    (i)短プローブが、対象ゲノム領域の長い連続的ストレッチに共に結合するプローブのセットを含む;又は
    (ii)長プローブが、対象ゲノム領域の外側の配列と結合し、短プローブ配列とオーバーラップしない;
    また、任意に、反復配列が、長プローブ及び/又は短プローブから除去されている、前記キット。
  37. 結腸直腸癌又は結腸直腸癌に対する遺伝的素因と関連するゲノム再編成の検出のための、請求項36記載のキット。
  38. 乳癌又は乳癌に対する遺伝的素因と関連するゲノム再編成の検出のための、請求項36記載のキット。
  39. 卵巣癌又は卵巣癌に対する遺伝的素因と関連するゲノム再編成の検出のための、請求項36記載のキット。
  40. 肺癌又は肺癌に対する遺伝的素因と関連するゲノム再編成の検出のための、請求項36記載のキット。
  41. 請求項1に記載した短プローブ(1又は複数)、又は短及び長プローブ(1又は複数)を含有する組成物であって、前記プローブ配列のうちの少なくとも2つが、分子コーミングを使用することによって、遺伝子再編成を検出し、かつ該組成物が、
    少なくとも1つの短配列(10kb未満)及び少なくとも1つのオーバーラップしていない長配列(14kb超)、又は
    少なくとも2つの短配列(それぞれ10kb未満)の少なくとも1つの群(全長は、14kb超かつ150kb未満である)
    を含み、遺伝子標的に対して連続的にハイブリッド形成する、前記組成物。
  42. 前記短プローブ(1又は複数)が、0.5kbから9kbの範囲である、請求項41記載の組成物。
  43. 前記長プローブ(1又は複数)が、14kbから40kbの範囲である、請求項41又は42記載の組成物。
  44. 前記短プローブのサイズが、0.5から9kbの範囲であり、かつ、少なくとも90%の高頻度の反復配列が、短配列から除去されている、請求項41記載の組成物。
  45. 前記プローブ配列が、MSH2遺伝子に対して若しくはMSH2遺伝子の領域内で、又はMLH1遺伝子に対して若しくはMLH1遺伝子の領域内で特異的にハイブリッド形成する、請求項41から43のいずれか1項記載の組成物。
  46. 前記短プローブ配列(1又は複数)が、配列番号:21〜60、配列番号:95〜122;配列番号:163〜172;配列番号:185〜202、及び配列番号:227〜248として開示されるプライマー対を使用する増幅によって得られる短プローブの群からなる群から選択される、又は、前記長プローブ配列(1又は複数)が、配列番号:61〜76及び配列番号:123-138として開示されるプライマー対を使用する増幅によって得られる長プローブの群からなる群から選択される、請求項41記載の組成物。
  47. 請求項1に記載した短及び長プローブを設計するための方法であって、
    対象ゲノム領域を含有するポリヌクレオチドを特定することと、
    該対象ゲノム領域の外側であるが、該対象領域内の最も近いプローブの100kb以内である長プローブ配列を選択し、該長プローブ配列から、高頻度で反復している配列を任意に除去することと、
    短プローブ間に15kb超のギャップが生じないように、該対象ゲノム領域内から短プローブ配列を選択すること;又は該対象ゲノム領域をカバーする長い連続的ストレッチを共に形成する一連の短プローブを選択することと;
    該プローブを、該対象ゲノム領域を含むゲノムポリヌクレオチドとハイブリッド形成させることと、
    該ハイブリッド形成したプローブを検出することと、
    対象ゲノム配列を基準のゲノム配列から区別するモチーフを、どのプローブセットが形成するかを判定することと
    を含む、前記方法。
  48. 前記短プローブ(1又は複数)及び/又は長プローブ(1又は複数)が、それぞれ、請求項16から24又は41から46のいずれかにおいて定義された通りである、請求項47記載の方法。
JP2014537743A 2011-10-31 2012-10-30 生体試料におけるゲノム再編成を特定又は検出する方法 Pending JP2014535050A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161553889P 2011-10-31 2011-10-31
US61/553,889 2011-10-31
PCT/IB2012/002423 WO2013064896A1 (en) 2011-10-31 2012-10-30 Method for identifying or detecting genomic rearrangements in a biological sample

Publications (2)

Publication Number Publication Date
JP2014535050A true JP2014535050A (ja) 2014-12-25
JP2014535050A5 JP2014535050A5 (ja) 2016-08-18

Family

ID=47559567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014537743A Pending JP2014535050A (ja) 2011-10-31 2012-10-30 生体試料におけるゲノム再編成を特定又は検出する方法

Country Status (4)

Country Link
US (3) US9133514B2 (ja)
EP (1) EP2773770A1 (ja)
JP (1) JP2014535050A (ja)
WO (1) WO2013064896A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014532403A (ja) * 2011-10-31 2014-12-08 ゲノミク ビジョン ゲノムモールスコードを分子コーミングと併用する乳癌及び卵巣癌遺伝子並びに遺伝子座brca1及びbrca2におけるゲノム再編成の検出、可視化、及び高解像度物理マッピングの方法
WO2016077750A1 (en) * 2014-11-14 2016-05-19 Athena Diagnostics, Inc. Methods to detect a silent carrier genotype
EP3548637A1 (en) * 2016-11-29 2019-10-09 Genomic Vision Method for designing a set of polynucleotide sequences for analysis of specific events in a genetic region of interest
WO2020109866A1 (en) 2018-11-30 2020-06-04 Genomic Vision Association between integration of viral as hpv or hiv genomes and the severity and/or clinical outcome of disorders as hpv associated cervical lesions or aids pathology

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001507929A (ja) * 1996-10-30 2001-06-19 アンスティテュ、パストゥール 分子コーミングによる遺伝病の診断法および診断用キット
JP2010502206A (ja) * 2006-09-07 2010-01-28 アンスティテュ・パストゥール 遺伝子モールスコード
WO2011132078A2 (en) * 2010-04-23 2011-10-27 Genomic Vision Diagnosis of viral infections by detection of genomic and infectious viral dna by molecular combing

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6828097B1 (en) 2000-05-16 2004-12-07 The Childrens Mercy Hospital Single copy genomic hybridization probes and method of generating same
US20030017159A1 (en) * 2001-05-02 2003-01-23 Jerome Ritz Immunogenic tumor antigens: nucleic acids and polypeptides encoding the same and methods of use thereof
US20100112551A1 (en) * 2004-06-14 2010-05-06 Charles Dunlop Approaches to identifying mutations associated with hereditary nonpolyposis colorectal cancer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001507929A (ja) * 1996-10-30 2001-06-19 アンスティテュ、パストゥール 分子コーミングによる遺伝病の診断法および診断用キット
JP2010502206A (ja) * 2006-09-07 2010-01-28 アンスティテュ・パストゥール 遺伝子モールスコード
WO2011132078A2 (en) * 2010-04-23 2011-10-27 Genomic Vision Diagnosis of viral infections by detection of genomic and infectious viral dna by molecular combing

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Cancer Research", 2005, VOL.65, NO.4, PP.1174-1179, JPN6016012551, ISSN: 0003633038 *
S GAD: "Bar code screening on combed DNA for large rearrangements of the BRCA1 and BRCA2 genes in French bre", J. MED. GENET., vol. 39, JPN6016035387, 2002, pages 817 - 821, XP055054670, ISSN: 0003633036, DOI: 10.1136/jmg.39.11.817 *
SOPHIE GAD: "Color Bar Coding the BRCA1 Gene on Combed DNA: A Useful Strategy for Detecting Large Gene Rearrangem", GENES, CHROMOSOMES & CANCER, vol. 31, JPN6016035389, 2001, pages 75 - 84, XP071949262, ISSN: 0003633037, DOI: 10.1002/gcc.1120 *

Also Published As

Publication number Publication date
US20140011194A1 (en) 2014-01-09
US9133514B2 (en) 2015-09-15
EP2773770A1 (en) 2014-09-10
WO2013064896A1 (en) 2013-05-10
US20180100202A1 (en) 2018-04-12
US20160032405A1 (en) 2016-02-04

Similar Documents

Publication Publication Date Title
Ferrari et al. A whole-genome sequence and transcriptome perspective on HER2-positive breast cancers
Supplee et al. Sensitivity of next-generation sequencing assays detecting oncogenic fusions in plasma cell-free DNA
Nones et al. Genomic catastrophes frequently arise in esophageal adenocarcinoma and drive tumorigenesis
US20180230550A1 (en) Personalized Tumor Biomarkers
Higa et al. A tailored next‐generation sequencing panel identified distinct subtypes of wildtype IDH and TERT promoter glioblastomas
Garg et al. A survey of rare epigenetic variation in 23,116 human genomes identifies disease-relevant epivariations and CGG expansions
CN114058704A (zh) 用于检测癌症中的微卫星不稳定性和dna碱基切除修复途径抑制的合成致死性的新标记
JP2000511433A (ja) 前立腺癌に関連する遺伝子の変化
EP2663652A1 (en) High resolution melting analysis as a prescreening tool
US20180100202A1 (en) Method for identifying or detecting genomic rearrangements in a biological sample
CN104894256B (zh) 检测乙醛脱氢酶2基因rs671多态性位点的引物、试剂盒及其PCR方法
US20180340235A1 (en) Methods for the detection, visualization and high resolution physical mapping of genomic rearrangements in breast and ovarian cancer genes and loci brca1 and brca2 using genomic morse code in conjunction with molecular combing
JP2023523002A (ja) 染色体近接実験における構造的変異検出
CN104862401B (zh) 检测kras基因热点突变位点的引物、试剂盒及其pcr方法
Tokunaga et al. Frequency of microsatellite instability inBreast cancer determined by high-resolution fluorescent microsatellite analysis
CN104830991B (zh) 检测pdgfra基因d842v多态性位点的引物、试剂盒及其pcr方法
Loftus et al. A custom capture sequence approach for oculocutaneous albinism identifies structural variant alleles at the OCA2 locus
CN104818340B (zh) 检测jak2基因v617f位点多态性的引物、试剂盒及其pcr方法
CN104846108B (zh) 检测c-kit基因d816v突变位点的引物、试剂盒及其pcr方法
Morowitz et al. Detection of single-copy chromosome 17q gain in human neuroblastomas using real-time quantitative polymerase chain reaction
JP2006508691A (ja) サブテロメアdnaプローブおよびその製造方法
Moreno et al. Single nCounter assay for prediction of MYCN amplification and molecular classification of medulloblastomas: a multicentric study
Rangel-López et al. Low density DNA microarray for detection of most frequent TP53 missense point mutations
McClinton et al. Targeted nanopore sequencing enables complete characterisation of structural deletions initially identified using exon‐based short‐read sequencing strategies
AU2021291586B2 (en) Multimodal analysis of circulating tumor nucleic acid molecules

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151029

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20161208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180703