发明内容
本发明的目的是提供检测DNA甲基化的试剂及其在甲状腺结节良恶性筛查中的用途。
本发明第一方面提供一种分离的来自哺乳动物的核酸分子,所述核酸分子具有选自以下(1)和(2)的核酸的序列或与其具有至少70%相同性的变体:(1)选自以下的一个或多个基因的核酸的片段:GAS6、SOX17、ZMIZ1、TSHR、CDH1、MCRIP2、LINC01977、EGR3,所述片段长为50-1000bp,其中,GAS6基因的片段包含GAS6基因的位点:114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的片段包含SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620中的一个或多个或全部,ZMIZ1基因的片段包含ZMIZ1基因的位点:81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253中的一个或多个或全部,TSHR基因的片段包含TSHR基因的位点:81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,CDH1基因的片段包含CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部,MCRIP2基因的片段包含MCRIP2基因的位点:698072、698142、698153、698168、698208、698218、698222、698230中的一个或多个或全部,LINC01977基因的片段包含MCRIP2基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640中的一个或多个或全部,EGR3基因的片段包含EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部,,(2)(1)所述基因的上下游10Kb以内的核酸区域,其中,所述变体中的上述位点未突变。
在一个或多个实施方案中,GAS6基因的片段包含GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的片段包含SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的片段包含ZMIZ1基因的位点81002041、81002052、81002054、81002056、81002062、81002083中的一个或多个或全部,TSHR基因的片段包含TSHR基因的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,CDH1基因的片段包含CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部,MCRIP2基因的片段包含MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的片段包含LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的片段包含EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,GAS6基因的片段包含GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的片段包含SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的片段包含ZMIZ1基因的位点:81002052、81002054、81002056、81002062中的一个或多个或全部,TSHR基因的片段包含TSHR基因的位点:81422010、81422032、81422035、81422084中的一个或多个或全部,CDH1基因的片段包含CDH1基因的位点:68771035、68771045、68771051、68771059、68771073中的一个或多个或全部,MCRIP2基因的片段包含MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的片段包含LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的片段包含EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,所述核酸分子包含选自以下的一个或多个片段:由SEQID NO:4和5作为引物扩增的GAS6基因的片段,由SEQ ID NO:6和7作为引物扩增的SOX17基因的片段,由SEQ ID NO:8和9作为引物扩增的ZMIZ1基因的片段,由SEQ ID NO:10和11作为引物扩增的TSHR基因的片段,由SEQ ID NO:12和13作为引物扩增的CDH1基因的片段,由SEQID NO:14和15作为引物扩增的MCRIP2基因的片段,由SEQ ID NO:16和17作为引物扩增的LINC01977基因的片段,由SEQ ID NO:18和19作为引物扩增的EGR3基因的片段。。
本发明第二方面提供检测DNA甲基化的试剂,所述试剂包含检测选自以下(1)和(2)所述区域的DNA甲基化水平的试剂:(1)选自以下的一个或多个基因的片段:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1,所述片段长为50-1000bp,(2)(1)所述基因的上下游5Kb或10Kb以内的核酸区域。
在一个或多个实施方案中,检测DNA甲基化水平的试剂检测下述(a)-(e)中一组或多组基因的片段的甲基化水平:(a)选自以下的一种或多种基因:GAS6、SOX17、ZMIZ1、TSHR、CDH1、MCRIP2、LINC01977、EGR3,(b)GAS6、SOX17,(c)GAS6、SOX17和选自ZMIZ1、TSHR和CDH1的一种或两种,(d)GAS6、SOX17和选自MCRIP2、LINC01977和EGR3中的一种或两种,(e)(a)-(d)中任一组所述基因的上下游5Kb或10Kb以内的核酸区域。
在一个或多个实施方案中,各基因的片段包含对应的选自以下位点的一个或多个位点或其上下游500bp以内的核酸区域:
ZMIZ1:10号染色体的81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253,
C15orf52:15号染色体的40626309、40626312、40626386,
SLC16A3:17号染色体的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841,
ZNF512B:20号染色体的62588634、62588638、62588672,
SLC17A5:6号染色体的74290205、74290207、74290220、74290225、74290228,
LIMK1:7号染色体的73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160,
PLEC:8号染色体的145013661、145013673,
TOR4A:9号染色体的140172787、140172790、140172812,
TMEM131L:4号染色体的154409945、154409963、154409972、154409978、154409997、154410003、154410006,
DNM2:19号染色体的10870373、10870377、10870427、10870429、10870441、10870448,
IL17C:16号染色体的88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451,
PRDM16:1号染色体的3229914、3229921、3229950、3229968、3229973、3310213、3310229、3310235、3310238、3310240、3310268、3310287、3310312、3310314、3310317、3310329,
TSHR:14号染色体的81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084,
KIF1A:2号染色体的241759696、241759701、241759714、241759716,
DAPK:9号染色体的90112842、90112853、90112861、90112866,
CDH1:16号染色体的68771035、68771037、68771045、68771051、68771059、68771064、68771073,
TPO:2号染色体的1481013、1481015、1481022、1481039,
RARG:12号染色体的53613176、53613182、53613190、53613202、53613210、53613218,
MT1JP:16号染色体的56669271、56669292、56669295、56669300、56669318、56669322、56669324、56669327、56669344、56669351、56669353、56669402、56669414、56669423、56669430、56669433、56669437、56669451、56669453、56669455、56669463、56669474、56669480、56669482、56669485、56669487、56669490、56669519、56669533、56669553、56669564、56669573、56669578、56669588、56669590、56669606、56669610,
TBX3:12号染色体的115174750、115174773、115174780,
BIN1:2号染色体的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644,
TIMP2:17号染色体的76921845、76921853、76921860,
CFAP65:2号染色体的219866132、219866139、219866148、219866158、219866165、219866168、219866199、219866218,
PRR15:7号染色体的29605992、29606026、29606040、29606047、29606056、29606062、29606073、29606179、29606191、29606201、29606204、29606220、29606222、29606227、29606231、29606255、29606257、29606262、29606271、29606277、29606289、29606320,
DPYS:8号染色体的105478870、105478873、105478878、105478905、105478908、105478916、105478918、105478945、105478956、105478965、105478974、105478983、105478986、105478989,
MCC:5号染色体的112538999、112539011、112539018、112539022、112539061、112539084、112539104、112539128,
TBX15:1号染色体的119535725、119535730、119535740、119535742、119535750、119535759、119535766、119535812、119535817、119535821、119535823、119535876、119535879、119535884、119535891,
COL23A1:5号染色体的178003785、178003798、178003803、178003814、178003823、178003825、178003834、178003841、178003844,
ILDR2:1号染色体的166890429、166890436、166890440、166890442、166890448、166890452、166890456、166890461、166890468、166890473、166890475、166890480、166890492、166890500、166890503、166890509、166890516、166890528、166890535、166890543、166890555、166890559、166890568、166890573、166890584、166890586,
DHRS3:1号染色体的12656091、12656114、12656132、12656152、12656170、12656175、12656182、12656187、12656197、12656200、12656211、12656315、12656323、12656340、12656355、12656367,
GDNF:5号染色体的37834763、37834770、37834772、37834774、37834777、37834780、37834784、37834792、37834799、37834802、37834806、37834811,TBX18:6号染色体的85477032、85477035、85477070、85477083、85477106、85477124、85477151、85477153、85477166,
SIM2:21号染色体的38069563、38069579、38069619、38069625、38069638、38069650、38069662、38069664、38069676、38069681,
HOXA9:7号染色体的27204848、27204854、27204858、27204861、27204863、27204879、27204884、27204894、27204897、27204918、27204929、27204938、27204945、27204948、27204951、27204958、27204981、27204984,
EHBP1L1:11号染色体的65352612、65352621、65352635、65352639、65352642、65352651、65352654、65352665、65352670,
GJC2:1号染色体的228345954、228345957、228345965、228345978、228345980、228345989,
RCOR2:11号染色体的63687223、63687238、63687247、63687250、63687259、63687282、63687288、63687299、63687318、63687325,
PRDM1:6号染色体的106429711、106429722、106429731、106429747、106429750、106429761、106429769、106429771,
UNCX:7号染色体的1263643、1263655、1263659、1263664、1263676、1263694、1263716、1263723,
RPS7P5:1号染色体的240161502、240161507、240161511、240161516、240161523、240161527、240161530、240161535、240161546、240161558、240161560,
FOXI2:10号染色体的129534843、129534853、129534866、129534879、129534891、129534910、129534912、129534924,
ACRBP:12号染色体的6756182、6756187、6756191、6756195、6756211、6756225、6756230、6756270,
GAS6:13号染色体的114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158,
MCRIP2:16号染色体的698072、698142、698153、698168、698208、698218、698222、698230,
LINC01977:17号染色体的77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640,
EGR3:8号染色体的22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299,
SOX17:8号染色体的55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620,
PAX5:9号染色体的36986087、36986093、36986098、36986101、36986103、36986117、36986131、36986138、36986141、36986143、36986147、36986149、36986156,
NEURL1:10号染色体的105344464、105344482、105344493、105344495、105344497、105344503、105344506、105344513、105344516、105344519、105344526,
IRX4:5号染色体的1876386、1876395、1876397、1876403、1876420、1876424、1876432、1876436、1876449、1876456、1876459、1876463,
RUSC1:1号染色体的155295135、155295171、155295181、155295192、155295196、155295212、155295229、155295236。
优选地,ZMIZ1基因的片段包含ZMIZ1基因的位点81002041、81002052、81002054、81002056、81002062、81002083中的一个或多个,
C15orf52基因的片段包含C15orf52基因的位点40626309、40626312中的一个或多个,
SLC16A3基因的片段包含SLC16A3基因的位点80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757中的一个或多个,
ZNF512B基因的片段包含ZNF512B基因的位点62588634、62588638、62588672中的一个或多个,
SLC17A5基因的片段包含SLC17A5基因的位点74290205、74290207、74290220、74290225、74290228中的一个或多个,
LIMK1基因的片段包含LIMK1基因的位点73509112、73509133、73509138、73509148、73509160中的一个或多个,
PLEC基因的片段包含PLEC基因的位点145013661、145013673中的一个或多个,
TOR4A基因的片段包含TOR4A基因的位点140172787、140172790、140172812中的一个或多个,
TMEM131L基因的片段包含TMEM131L基因的位点154409945、154409963、154409972、154409978、154409997中的一个或多个,
DNM2基因的片段包含DNM2基因的位点10870427、10870429、10870441、10870448中的一个或多个,
IL17C基因的片段包含IL17C基因的位点88701004、88701021、88701029、88701036、88701043、88701051、88701060中的一个或多个,
PRDM16基因的片段包含PRDM16基因的位点3229950、3229968、3229973中的一个或多个,
MT1JP基因的片段包含MT1JP基因的位点56669271、56669292、56669295、56669300、56669318、56669322、56669324、56669327、56669344中的一个或多个,
TBX3基因的片段包含TBX3基因的位点115174750、115174773、115174780中的一个或多个,
BIN1基因的片段包含BIN1基因的位点127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616中的一个或多个,
TIMP2基因的片段包含TIMP2基因的位点76921845、76921853、76921860中的一个或多个,
CFAP65基因的片段包含CFAP65基因的位点219866199、219866218中的一个或多个,
TSHR基因的片段包含TSHR基因的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个,
KIF1A基因的片段包含KIF1A基因的位点241759696、241759701、241759714、241759716中的一个或多个,
DAPK基因的片段包含DAPK基因的位点90112842、90112853、90112861、90112866中的一个或多个,
CDH1基因的片段包含CDH1基因的位点68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,
TPO基因的片段包含TPO基因的位点1481013、1481015、1481022、1481039中的一个或多个,
RARG基因的片段包含RARG基因的位点53613176、53613182、53613190、53613202、53613210、53613218中的一个或多个,
PRR15基因的片段包含PRR15基因的位点29606026、29606040、29606047、29606056、29606062、29606073、29606220、29606222、29606227、29606231、29606255、29606257、29606262、29606271、29606277、29606289中的一个或多个,
DPYS基因的片段包含DPYS基因的位点105478905、105478908、105478916、105478918、105478945、105478956、105478965、105478974、105478983中的一个或多个,
MCC基因的片段包含MCC基因的位点112538999、112539011、112539018、112539022、112539061中的一个或多个,
TBX15基因的片段包含TBX15基因的位点119535740、119535742、119535750、119535759、119535766中的一个或多个,
COL23A1基因的片段包含COL23A1基因的位点178003798、178003803、178003814、178003823、178003825、178003834、178003841、178003844中的一个或多个,
ILDR2基因的片段包含ILDR2基因的位点166890516、166890528、166890535、166890543、166890555、166890559、166890568、166890573、166890584、166890586中的一个或多个,
DHRS3基因的片段包含DHRS3基因的位点:12656340、12656355、12656367中的一个或多个,
GDNF基因的片段包含GDNF基因的位点:37834770、37834772、37834774、37834777、37834780、37834784、37834792、37834799、37834802、37834806、37834811中的一个或多个,
TBX18基因的片段包含TBX18基因的位点:85477035、85477070、85477083、85477106中的一个或多个,
SIM2基因的片段包含SIM2基因的位点:38069638、38069650、38069662、38069664、38069676、38069681中的一个或多个,
HOXA9基因的片段包含HOXA9基因的位点:27204854、27204858、27204861、27204863、27204879中的一个或多个,
EHBP1L1基因的片段包含EHBP1L1基因的位点:65352621、65352635、65352639、65352642、65352651、65352654、65352665、65352670中的一个或多个,
GJC2基因的片段包含GJC2基因的位点:228345965、228345978、228345980、228345989中的一个或多个,
RCOR2基因的片段包含RCOR2基因的位点:63687223、63687238、63687247、63687250、63687259中的一个或多个,
PRDM1基因的片段包含PRDM1基因的位点:106429722、106429731、106429747、106429750、106429761、106429769、106429771中的一个或多个,
UNCX基因的片段包含UNCX基因的位点:1263643、1263655、1263659、1263664、1263676中的一个或多个,
RPS7P5基因的片段包含RPS7P5基因的位点:240161511、240161516、240161523、240161527、240161530中的一个或多个,
FOXI2基因的片段包含FOXI2基因的位点:129534910、129534912、129534924中的一个或多个,
ACRBP基因的片段包含ACRBP基因的位点:6756182、6756187、6756191、6756195、6756211中的一个或多个,
GAS6基因的片段包含GAS6基因的位点:114524062、114524068、114524084、114524095、114524131、114524138中的一个或多个,
MCRIP2基因的片段包含MCRIP2基因的位点:698072、698142、698153、698168、698208中的一个或多个,
LINC01977基因的片段包含LINC01977基因的位点:77789596、77789601、77789612、77789620中的一个或多个,
EGR3基因的片段包含EGR3基因的位点:22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个,
SOX17基因的片段包含SOX17基因的位点:55379602、55379608、55379617、55379620中的一个或多个,
PAX5基因的片段包含PAX5基因的位点:36986087、36986093、36986098、36986101、36986103中的一个或多个,
NEURL1基因的片段包含NEURL1基因的位点:105344493、105344495、105344497中的一个或多个,
IRX4基因的片段包含IRX4基因的位点:1876386、1876395、1876397、1876403中的一个或多个,
RUSC1基因的片段包含RUSC1基因的位点:155295192、155295196、155295212中的一个或多个。
在本发明的任意实施方案中,针对各基因的位点的编号对应于该基因所处染色体的碱基编号。
在第二方面的优选实施方案中,检测DNA甲基化水平的试剂检测选自以下的1、2、3、4、5、6、7、8、9、10、11、12、13、14个基因的片段的DNA甲基化水平:SLC16A3、CDH1、TSHR、RARG、PRR15、MCC、TBX15、DPYS、COL23A1、ILDR2、NEURL1、BIN1、DNM2、IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下两种基因的片段的DNA甲基化水平:SLC16A3和CDH1、SLC16A3和TSHR、SLC16A3和RARG、SLC16A3和PRR15、SLC16A3和MCC、SLC16A3和TBX15、SLC16A3和DPYS、SLC16A3和COL23A1、SLC16A3和ILDR2、SLC16A3和NEURL1、SLC16A3和BIN1、SLC16A3和DNM2、SLC16A3和IL17C,CDH1和TSHR、CDH1和RARG、CDH1和PRR15、CDH1和MCC、CDH1和TBX15、CDH1和DPYS、CDH1和COL23A1、CDH1和ILDR2、CDH1和NEURL1、CDH1和BIN1、CDH1和DNM2、CDH1和IL17C,TSHR和RARG、TSHR和PRR15、TSHR和MCC、TSHR和TBX15、TSHR和DPYS、TSHR和COL23A1、TSHR和ILDR2、TSHR和NEURL1、TSHR和BIN1、TSHR和DNM2、TSHR和IL17C,RARG和PRR15、RARG和MCC、RARG和TBX15、RARG和DPYS、RARG和COL23A1、RARG和ILDR2、RARG和NEURL1、RARG和BIN1、RARG和DNM2、RARG和IL17C,PRR15和MCC、PRR15和TBX15、PRR15和DPYS、PRR15和COL23A1、PRR15和ILDR2、PRR15和NEURL1、PRR15和BIN1、PRR15和DNM2、PRR15和IL17C,MCC和TBX15、MCC和DPYS、MCC和COL23A1、MCC和ILDR2、MCC和NEURL1、MCC和BIN1、MCC和DNM2、MCC和IL17C,TBX15和DPYS、TBX15和COL23A1、TBX15和ILDR2、TBX15和NEURL1、TBX15和BIN1、TBX15和DNM2、TBX15和IL17C,DPYS和COL23A1、DPYS和ILDR2、DPYS和NEURL1、DPYS和BIN1、DPYS和DNM2、DPYS和IL17C,COL23A1和ILDR2、COL23A1和NEURL1、COL23A1和BIN1、COL23A1和DNM2、COL23A1和IL17C,ILDR2和NEURL1、ILDR2和BIN1、ILDR2和DNM2、ILDR2和IL17C,NEURL1和BIN1、NEURL1和DNM2、NEURL1和IL17C,BIN1和DNM2、BIN1和IL17C,或DNM2和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下三种基因的片段的DNA甲基化水平:SLC16A3和CDH1和TSHR、CDH1和TSHR和RARG、TSHR和RARG和PRR15、RARG和PRR15和MCC、PRR15和MCC和TBX15、MCC和TBX15和DPYS、TBX15和DPYS和COL23A1、DPYS和COL23A1和ILDR2、COL23A1和ILDR2和NEURL1、ILDR2和NEURL1和BIN1、NEURL1和BIN1和DNM2、或BIN1和DNM2和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下四种基因的片段的DNA甲基化水平:SLC16A3和CDH1和TSHR和RARG、SLC16A3和CDH1和TSHR和PRR15、SLC16A3和CDH1和TSHR和MCC、SLC16A3和CDH1和TSHR和TBX15、SLC16A3和CDH1和TSHR和DPYS、SLC16A3和CDH1和TSHR和COL23A1、SLC16A3和CDH1和TSHR和ILDR2、SLC16A3和CDH1和TSHR和NEURL1、SLC16A3和CDH1和TSHR和BIN1、SLC16A3和CDH1和TSHR和DNM2、或SLC16A3和CDH1和TSHR和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下五种基因的片段的DNA甲基化水平:SLC16A3和CDH1和TSHR和RARG和PRR15、SLC16A3和CDH1和TSHR和PRR15和MCC、SLC16A3和CDH1和TSHR和MCC和TBX15、SLC16A3和CDH1和TSHR和TBX15和DPYS、SLC16A3和CDH1和TSHR和DPYS和COL23A1、SLC16A3和CDH1和TSHR和COL23A1和ILDR2、SLC16A3和CDH1和TSHR和ILDR2和NEURL1、SLC16A3和CDH1和TSHR和NEURL1和BIN1、SLC16A3和CDH1和TSHR和BIN1和DNM2、或SLC16A3和CDH1和TSHR和DNM2和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下六种基因的片段的DNA甲基化水平:SLC16A3和CDH1和TSHR和RARG和PRR15和MCC、SLC16A3和CDH1和TSHR和PRR15和MCC和TBX15、SLC16A3和CDH1和TSHR和MCC和TBX15和DPYS、SLC16A3和CDH1和TSHR和TBX15和DPYS和COL23A1、SLC16A3和CDH1和TSHR和DPYS和COL23A1和ILDR2、SLC16A3和CDH1和TSHR和COL23A1和ILDR2和NEURL1、SLC16A3和CDH1和TSHR和ILDR2和NEURL1和BIN1、SLC16A3和CDH1和TSHR和NEURL1和BIN1和DNM2、或SLC16A3和CDH1和TSHR和BIN1和DNM2和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测以下七种基因的片段的DNA甲基化水平:SLC16A3和CDH1和TSHR和RARG和PRR15和MCC和TBX15、CDH1和TSHR和RARG和PRR15和MCC和TBX15和DPYS、TSHR和RARG和PRR15和MCC和TBX15和DPYS和COL23A1、RARG和PRR15和MCC和TBX15和DPYS和COL23A1和ILDR2、PRR15和MCC和TBX15和DPYS和COL23A1和ILDR2和NEURL1、MCC和TBX15和DPYS和COL23A1和ILDR2和NEURL1和BIN1、TBX15和DPYS和COL23A1和ILDR2和NEURL1和BIN1和DNM2、DPYS和COL23A1和ILDR2和NEURL1和BIN1和DNM2和IL17C。在一个或多个实施方案中,检测DNA甲基化水平的试剂检测选自以下基因中的8种、9种、10种、11种、12种、13种、14种或所有15种基因的片段的DNA甲基化水平:SLC16A3、CDH1、TSHR、RARG、PRR15、MCC、TBX15、DPYS、COL23A1、ILDR2、NEURL1、BIN1、DNM2和IL17C。
在一个或多个实施方案中,所述试剂:(1)检测以下(a1)-(a8)中一组或多组的位点的DNA甲基化水平:(a1)GAS6基因的位点:114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158中的一个或多个或全部,(a2)SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620中的一个或多个或全部,(a3)ZMIZ1基因的位点:81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253中的一个或多个或全部,(a4)TSHR基因的位点:81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,(a5)CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部,(a6)MCRIP2基因的位点:698072、698142、698153、698168、698208、698218、698222、698230中的一个或多个或全部,(a7)MCRIP2基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640中的一个或多个或全部,(a8)EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部,或(2)检测选自以下的一个或多个基因的核酸片段的DNA甲基化水平,所述片段长为50-1000bp:GAS6、SOX17、ZMIZ1、TSHR、CDH1、MCRIP2、LINC01977、EGR3,其中,GAS6基因的片段包含GAS6基因的位点:114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的片段包含SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620中的一个或多个或全部,ZMIZ1基因的片段包含ZMIZ1基因的位点:81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253中的一个或多个或全部,TSHR基因的片段包含TSHR基因的位点:81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,CDH1基因的片段包含CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部,MCRIP2基因的片段包含MCRIP2基因的位点:698072、698142、698153、698168、698208、698218、698222、698230中的一个或多个或全部,LINC01977基因的片段包含MCRIP2基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640中的一个或多个或全部,EGR3基因的片段包含EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部,或(3)检测(2)中所述基因的上下游10Kb以内的核酸区域的DNA甲基化水平。所述位点参考人类参考基因组hg19版本。
在一个或多个实施方案中,(a1)-(a8)为:GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的位点81002041、81002052、81002054、81002056、81002062、81002083中的一个或多个或全部,TSHR基因的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,(a1)-(a8)为:GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的位点:81002052、81002054、81002056、81002062中的一个或多个或全部,TSHR基因的位点:81422010、81422032、81422035、81422084中的一个或多个或全部,CDH1基因的位点:68771035、68771045、68771051、68771059、68771073中的一个或多个或全部,MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,所述检测DNA甲基化水平的试剂检测以下位点的DNA甲基化水平:(a1)-(a2)中的一组或多组,和任选的(a3)-(a8)中的一组或多组;优选地,所述位点包含:(a1)-(a2)和任选的(a3)-(a5)中的一组或多组,或,(a1)-(a2)和任选的(a6)-(a8)中的一组或多组;更优选地,所述位点包含:(a1)-(a2)和任选的(a3)-(a5)或任选的(a6)-(a8)。在一个或多个实施方案中,所述检测DNA甲基化水平的试剂检测以下位点的DNA甲基化水平:(a1)-(a5),或,(a1)-(a2)和(a6)-(a8)。
在一个或多个实施方案中,所述试剂是引物,所述引物能扩增出选自以下的一个或多个片段:(b1)由SEQ ID NO:4和5作为引物扩增的GAS6基因的片段,(b2)由SEQ ID NO:6和7作为引物扩增的SOX17基因的片段,(b3)由SEQ ID NO:8和9作为引物扩增的ZMIZ1基因的片段,(b4)由SEQ ID NO:10和11作为引物扩增的TSHR基因的片段,(b5)由SEQ ID NO:12和13作为引物扩增的CDH1基因的片段,(b6)由SEQ ID NO:14和15作为引物扩增的MCRIP2基因的片段,(b7)由SEQ ID NO:16和17作为引物扩增的LINC01977基因的片段,和(b8)由SEQID NO:18和19作为引物扩增的EGR3基因的片段。优选地,所述引物能扩增出:(b1)-(b2)中的一组或多组,和任选的(b3)-(b8)中的一组或多组;更优选地,所述引物能扩增出:(b1)-(b2)和任选的(b3)-(b5)中的一组或多组,或,(b1)-(b2)和任选的(b6)-(b8)中的一组或多组;更优选地,所述引物能扩增出:(b1)-(b2)和任选的(b3)-(b5)或任选的(b6)-(b8)。在一个或多个实施方案中,所述引物是SEQ ID NO:4-19中任一或与其具有90%相同性的序列。优选地,所述引物选自(1)SEQ ID NO:4-7中一个或多个或全部,(2)SEQ ID NO:4-13中一个或多个或全部,(3)SEQ ID NO:4-7、14-19中一个或多个或全部,或(4)与(1)-(3)中任意具有90%相同性的序列。
在一个或多个实施方案中,所述试剂是探针,所述探针能与选自以下的一个或多个片段杂交:(b1)由SEQ ID NO:4和5作为引物扩增的GAS6基因的片段,(b2)由SEQ ID NO:6和7作为引物扩增的SOX17基因的片段,(b3)由SEQ ID NO:8和9作为引物扩增的ZMIZ1基因的片段,(b4)由SEQ ID NO:10和11作为引物扩增的TSHR基因的片段,(b5)由SEQ ID NO:12和13作为引物扩增的CDH1基因的片段,(b6)由SEQ ID NO:14和15作为引物扩增的MCRIP2基因的片段,(b7)由SEQ ID NO:16和17作为引物扩增的LINC01977基因的片段,和(b8)由SEQID NO:18和19作为引物扩增的EGR3基因的片段。优选地,所述引物能与以下片段杂交:优选地,所述探针能与以下片段杂交:(b1)-(b2)中的一组或多组,和任选的(b3)-(b8)中的一组或多组;更优选地,所述探针能与以下片段杂交:(b1)-(b2)和任选的(b3)-(b5)中的一组或多组,或,(b1)-(b2)和任选的(b6)-(b8)中的一组或多组。更优选地,所述探针能与以下片段杂交:(b1)-(b2)和任选的(b3)-(b5)或任选的(b6)-(b8)。在一个或多个实施方案中,所述探针是SEQ ID NO:20-27中任一或与其具有90%相同性的序列。优选地,所述探针选自(1)SEQ ID NO:20-21中一个或多个或全部,(2)SEQ ID NO:20-24中一个或多个或全部,(3)SEQ ID NO:20-21、25-27中一个或多个或全部,或(4)与(1)-(3)中任意具有90%相同性的序列。
在一个或多个实施方案中,片段的长度为30-2000bp,30-1500bp,50-1000bp,50-800bp,50-500bp,50-400bp,50-350bp,50-300bp,50-250bp,50-200bp,60-180bp,60-170bp,60-160bp,60-150bp,60-140bp,60-130bp,60-120bp,70-110bp,或80-100bp,优选50-350bp或60-180bp。
在上述各方面的一个或多个实施方案中,所述哺乳动物是人。
在上述各方面的一个或多个实施方案中,所述基因或位点包括DNA正义链或反义链。
在上述各方面的一个或多个实施方案中,所述位点参考人类参考基因组hg19版本。
在上述各方面的一个或多个实施方案中,检测DNA甲基化的试剂是选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。优选地,所述试剂选自以下一种或多种:重亚硫酸盐及其衍生物、PCR缓冲液、聚合酶、dNTP、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。
优选地,所述试剂包括引物。所述引物序列为甲基化特异的或非特异的。优选地,所述引物的序列包括非甲基化特异的封闭序列(Blocker)。优选地,引物是SEQ ID NO:4-19中任一或与其具有90%相同性的序列。
优选地,所述试剂包括探针。所述探针的序列的5’端标记荧光报告基团,3’端标记淬灭基团。优选地,所述探针的序列包含MGB(Minor groove binder)或者LNA(Lockednucleic acid)。优选地,探针是SEQ ID NO:20-27中任一或与其具有90%相同性的序列。
本发明另一方面还提供鉴定甲状腺结节性质的试剂盒,包含本发明第二所述的试剂和任选的本发明第一方面所述的核酸分子。在一个或多个实施方案中,检测DNA甲基化的试剂是选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。优选地,所述试剂选自以下一种或多种:重亚硫酸盐及其衍生物、PCR缓冲液、聚合酶、dNTP、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。在一个或多个实施方案中,所述试剂盒还包含检测基因突变的试剂。在一个或多个实施方案中,检测基因突变的试剂是选自以下方法的一个或多个中所用的试剂:PCR-单链构象多态性法、异源双链分析法、突变富集PCR法、突变梯度凝胶电泳法、化学切割错配法、等位基因特异性寡核苷酸分析法、连接酶链反应、等位基因特异性扩增法、RNA酶A切割法、染色体原位杂交、荧光原位杂交技术、DNA序列分析、酶促切割错配法、切割片段长度多态性、双脱氧指纹图谱法、错配接合蛋白质截短测试法、引物延伸法、寡核苷酸链接检测法、毛细管电泳法、基于芯片的方法等。优选地,检测基因突变的试剂包括:引物、探针、缓冲液、聚合酶、dNTP、限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。
在一个或多个实施方案中,所述试剂盒还包括检测BRAF基因的V600E位点的突变水平的试剂和/或TERT基因的C228T/C250T位点的突变水平的试剂。
本发明另一方面还提供本文所述的核酸分子和/或本文所述的试剂在制备用于鉴定样品中甲状腺结节性质的试剂盒中的用途。所述试剂包括本文任一实施方案所述的检测DNA甲基化的试剂和任选的检测基因突变的试剂。所述基因突变选自:BRAF基因的V600E位点的突变和TERT基因的C228T/C250T位点的突变。所述检测DNA甲基化的试剂如本文第二-第四方面所述。
本发明另一方面还提供检测DNA甲基化的试剂和任选的本文所述的核酸分子在制备用于鉴定甲状腺结节性质的试剂盒中的用途,所述试剂检测样品中选自以下(1)和(2)所述区域的DNA甲基化水平:(1)选自以下的一个或多个基因的片段:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1,(2)(1)所述基因的上下游5Kb或10Kb以内的核酸区域。优选地,所述试剂检测选自以下的一个或多个基因的甲基化水平:GAS6、SOX17、ZMIZ1、TSHR、CDH1、MCRIP2、LINC01977、EGR3。
在一个或多个实施方案中,所述试剂检测样品中下述(1)-(4)中一组或多组基因的片段的甲基化水平:(1)GAS6、SOX17,(2)GAS6、SOX17和选自ZMIZ1、TSHR和CDH1的一种或两种,(3)GAS6、SOX17和选自MCRIP2、LINC01977和EGR3中的一种或两种,(4)(1)-(3)中任一组所述基因的上下游5Kb或10Kb以内的核酸区域。
在一个或多个实施方案中,各基因的检测位点选自以下位点的一个或多个或其上下游500bp以内的核酸区域:
GAS6:13号染色体的114524043、114524062、114524068、114524084、114524142、114524150、114524158
SOX17:8号染色体的55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617
ZMIZ1:10号染色体的81002052、81002054、81002056、81002062
TSHR:14号染色体的81422010、81422032、81422035、81422084
CDH1:16号染色体的68771035、68771045、68771051、68771059、68771073
MCRIP2:16号染色体的698142、698153、698168、698218、698222、698230
LINC01977:17号染色体的77789596、77789601、77789612、77789620、77789628、77789632、77789635
EGR3:8号染色体的22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299。
在一个或多个实施方案中,检测DNA甲基化的试剂检测以下(a1)-(a8)中一组或多组位点的甲基化水平:(a1)GAS6基因的位点:114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158中的一个或多个或全部,(a2)SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620中的一个或多个或全部,(a3)ZMIZ1基因的位点:81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253中的一个或多个或全部,(a4)TSHR基因的位点:81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,(a5)CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部,(a6)MCRIP2基因的位点:698072、698142、698153、698168、698208、698218、698222、698230中的一个或多个或全部,(a7)MCRIP2基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640中的一个或多个或全部,(a8)EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。所述检测DNA甲基化的试剂如本文其他实施方案所述。
在一个或多个实施方案中,(a1)-(a8)为:GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的位点81002041、81002052、81002054、81002056、81002062、81002083中的一个或多个或全部,TSHR基因的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个或全部,CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个或全部MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,(a1)-(a8)为:GAS6基因的位点:114524043、114524062、114524068、114524084、114524142、114524150、114524158中的一个或多个或全部,SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617中的一个或多个或全部,ZMIZ1基因的位点:81002052、81002054、81002056、81002062中的一个或多个或全部,TSHR基因的位点:81422010、81422032、81422035、81422084中的一个或多个或全部,CDH1基因的位点:68771035、68771045、68771051、68771059、68771073中的一个或多个或全部,MCRIP2基因的位点:698142、698153、698168、698218、698222、698230中的一个或多个或全部,LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635中的一个或多个或全部,EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个或全部。
在一个或多个实施方案中,检测DNA甲基化水平的试剂检测以下位点的DNA甲基化水平:(a1)-(a2)中的一组或多组,和任选的(a3)-(a8)中的一组或多组;优选地,所述位点包含:(a1)-(a2)和任选的(a3)-(a5)中的一组或多组,或,(a1)-(a2)和任选的(a6)-(a8)中的一组或多组;更优选地,所述位点包含:(a1)-(a2)和任选的(a3)-(a5)或任选的(a6)-(a8)。
在一个或多个实施方案中,所述试剂盒还包含检测BRAF基因的V600E位点的突变水平的试剂。
在一个或多个实施方案中,所述试剂盒还包含检测TERT基因的C228T/C250T位点的突变水平的试剂。
在用途的一个或多个实施方案中,所述基因或位点包括DNA正义链或反义链。
在用途的一个或多个实施方案中,所述位点参考人类参考基因组hg19版本。
在用途的一个或多个实施方案中,试剂盒还包括检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平的试剂。
在用途的一个或多个实施方案中,鉴定甲状腺结节性质包括:与对照样品比较,或者根据甲基化水平和/或突变水平获得评分,根据比较结果或评分鉴定甲状腺结节性质。
在用途的一个或多个实施方案中,样品来自人,优选来自组织、细胞或者体液,例如甲状腺组织或血液。在用途的一个或多个实施方案中,样品含有基因组DNA或cfDNA。
在用途的一个或多个实施方案中,检测DNA甲基化的试剂如本发明第二方面所述。
在用途的一个或多个实施方案中,检测DNA甲基化的试剂是选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。优选地,所述试剂选自以下一种或多种:重亚硫酸盐及其衍生物、PCR缓冲液、聚合酶、dNTP、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。
优选地,所述引物序列为甲基化特异的或非特异的。优选地,所述引物的序列包括非甲基化特异的封闭序列(Blocker)。优选地,引物是SEQ ID NO:4-19中任一或与其具有90%相同性的序列。
优选地,所述探针的序列的5’端标记荧光报告基团,3’端标记淬灭基团。优选地,所述探针的序列包含MGB(Minor groove binder)或者LNA(Locked nucleic acid)。优选地,探针是SEQ ID NO:20-27中任一或与其具有90%相同性的序列。
本发明还提供一种引物,其检测选自以下(1)和(2)所述区域的DNA甲基化水平:(1)选自以下的一个或多个基因的片段:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1,(2)(1)所述基因的上下游5Kb或10Kb以内的核酸区域。优选地,所述引物检测本文所述位点的甲基化水平。
本发明还提供一种探针,其检测选自以下(1)和(2)所述区域的DNA甲基化水平:(1)选自以下的一个或多个基因的片段:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1,(2)(1)所述基因的上下游5Kb或10Kb以内的核酸区域。优选地,所述探针检测本文所述位点的甲基化水平。
本发明还提供一种用于甲状腺结节良恶性筛查的方法,包括:(1)检测对象的样品中本文所述基因、位点或核酸区域的甲基化水平;任选的(2)检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平;(3)与对照样品比较,或者根据所述甲基化水平和/或突变水平获得评分,例如通过计算获得评分;(4)根据步骤(3)的比较结果或评分鉴定甲状腺结节性质。
本发明还提供一种用于甲状腺结节良恶性筛查的方法,包括:(1)检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平;任选的(2)检测对象的样品中本文所述基因、位点或核酸区域的甲基化水平;(3)与对照样品比较,或者根据所述突变水平和/或甲基化水平获得评分,例如通过计算获得评分;(4)根据步骤(3)的比较结果或评分鉴定甲状腺结节性质。
在一个或多个实施方案中,所述方法在步骤(1)之前还包括:样品DNA的抽提、质检、和/或将DNA上未甲基化的胞嘧啶转化为不与鸟嘌呤结合的碱基。
在一个或多个实施方案中,所述转化使用酶促方法进行,优选脱氨酶处理,或所述转化使用非酶促方法进行,优选用亚硫酸氢盐或重硫酸盐处理,更优选使用亚硫酸氢钙、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢铵、重硫酸钠、重硫酸钾和重硫酸铵处理。
在一个或多个实施方案中,所述检测包括但不限于:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。
在一个或多个实施方案中,步骤(4)包括:与对照样品比较,对象样品的甲基化水平和/或突变水平变化,当甲基化水平和/或突变水平满足阈值时,则鉴定甲状腺结节为良性或恶性结节。
在一个或多个实施方案中,步骤(4)包括:当评分满足阈值时,则鉴定甲状腺结节为良性或恶性结节。
在一个或多个实施方案中,所述样品来自人,优选来自组织、细胞或者体液,例如甲状腺组织或血液。在一个或多个实施方案中,所述样品是甲状腺结节活检物,优选是细针穿刺活检物。在一个或多个实施方案中,所述样品是血浆。
在一个或多个实施方案中,所述样品来自具有甲状腺良性或恶性结节的对象。在一个或多个实施方案中,所述样品来自甲状腺肿大的患者。
在一个或多个实施方案中,所述样品包括基因组DNA或cfDNA。
本发明还提供鉴定甲状腺结节性质的试剂盒,包含检测本文所述基因、位点、核酸区域的甲基化水平的引物和/或探针。
具体实施方式
发明人发现特定的染色体、基因或甲基化位点与恶性甲状腺结节相关。
提及甲状腺结节时,本文所述“良性”和“恶性”表示甲状腺结节的性质。通常,良性表现为结节生长缓慢、质地均匀、活动度好、表面光滑、呈囊性改变、无淋巴结肿大、无钙化等。恶性表现为不可控的恶性细胞生长、扩散和组织浸润。提示甲状腺结节为恶性的超声征象包括:结节的高度大于宽度、缺乏声晕、微小钙化、边界不规则、回声减低、实性结节、结节内部血流丰富等。在一些实施方式中,恶性甲状腺结节包括甲状腺癌。
发明人发现,甲状腺结节的性质与选自以下的一个或多个基因的片段的甲基化水平相关:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1。优选地,所述基因选自下组:(1)LIMK1和SLC17A5,(2)BIN1和DNM2,(3)BIN1和SLC16A3,(4)SLC16A3、DNM2和IL17C,(5)SLC16A3、DNM2、IL17C、CDH1和TSHR,(6)GAS6、SOX17,(3)GAS6、SOX17、ZMIZ1、TSHR、CDH1,(7)GAS6、SOX17、MCRIP2、LINC01977、EGR3。
发明人还发现,甲状腺结节的性质与选自以下的一个或多个位点的甲基化水平相关,这些位点的编号参考人类参考基因组hg19:
ZMIZ1:10号染色体的81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253,
C15orf52:15号染色体的40626309、40626312、40626386,SLC16A3:17号染色体的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841,
ZNF512B:20号染色体的62588634、62588638、62588672,
SLC17A5:6号染色体的74290205、74290207、74290220、74290225、74290228,
LIMK1:7号染色体的73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160,
PLEC:8号染色体的145013661、145013673,
TOR4A:9号染色体的140172787、140172790、140172812,
TMEM131L:4号染色体的154409945、154409963、154409972、154409978、154409997、154410003、154410006,
DNM2:19号染色体的10870373、10870377、10870427、10870429、10870441、10870448,
IL17C:16号染色体的88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451,
PRDM16:1号染色体的3229914、3229921、3229950、3229968、3229973、3310213、3310229、3310235、3310238、3310240、3310268、3310287、3310312、3310314、3310317、3310329,
TSHR:14号染色体的81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084,
KIF1A:2号染色体的241759696、241759701、241759714、241759716,
DAPK:9号染色体的90112842、90112853、90112861、90112866,
CDH1:16号染色体的68771035、68771037、68771045、68771051、68771059、68771064、68771073,
TPO:2号染色体的1481013、1481015、1481022、1481039,
RARG:12号染色体的53613176、53613182、53613190、53613202、53613210、53613218,
MT1JP:16号染色体的56669271、56669292、56669295、56669300、56669318、56669322、56669324、56669327、56669344、56669351、56669353、56669402、56669414、56669423、56669430、56669433、56669437、56669451、56669453、56669455、56669463、56669474、56669480、56669482、56669485、56669487、56669490、56669519、56669533、56669553、56669564、56669573、56669578、56669588、56669590、56669606、56669610,
TBX3:12号染色体的115174750、115174773、115174780,
BIN1:2号染色体的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644,
TIMP2:17号染色体的76921845、76921853、76921860,
CFAP65:2号染色体的219866132、219866139、219866148、219866158、219866165、219866168、219866199、219866218,
PRR15:7号染色体的29605992、29606026、29606040、29606047、29606056、29606062、29606073、29606179、29606191、29606201、29606204、29606220、29606222、29606227、29606231、29606255、29606257、29606262、29606271、29606277、29606289、29606320,
DPYS:8号染色体的105478870、105478873、105478878、105478905、105478908、105478916、105478918、105478945、105478956、105478965、105478974、105478983、105478986、105478989,
MCC:5号染色体的112538999、112539011、112539018、112539022、112539061、112539084、112539104、112539128,
TBX15:1号染色体的119535725、119535730、119535740、119535742、119535750、119535759、119535766、119535812、119535817、119535821、119535823、119535876、119535879、119535884、119535891,
COL23A1:5号染色体的178003785、178003798、178003803、178003814、178003823、178003825、178003834、178003841、178003844,
ILDR2:1号染色体的166890429、166890436、166890440、166890442、166890448、166890452、166890456、166890461、166890468、166890473、166890475、166890480、166890492、166890500、166890503、166890509、166890516、166890528、166890535、166890543、166890555、166890559、166890568、166890573、166890584、166890586,
DHRS3:1号染色体的12656091、12656114、12656132、12656152、12656170、12656175、12656182、12656187、12656197、12656200、12656211、12656315、12656323、12656340、12656355、12656367,
GDNF:5号染色体的37834763、37834770、37834772、37834774、37834777、37834780、37834784、37834792、37834799、37834802、37834806、37834811,
TBX18:6号染色体的85477032、85477035、85477070、85477083、85477106、85477124、85477151、85477153、85477166,
SIM2:21号染色体的38069563、38069579、38069619、38069625、38069638、38069650、38069662、38069664、38069676、38069681,
HOXA9:7号染色体的27204848、27204854、27204858、27204861、27204863、27204879、27204884、27204894、27204897、27204918、27204929、27204938、27204945、27204948、27204951、27204958、27204981、27204984,
EHBP1L1:11号染色体的65352612、65352621、65352635、65352639、65352642、65352651、65352654、65352665、65352670,
GJC2:1号染色体的228345954、228345957、228345965、228345978、228345980、228345989,
RCOR2:11号染色体的63687223、63687238、63687247、63687250、63687259、63687282、63687288、63687299、63687318、63687325,
PRDM1:6号染色体的106429711、106429722、106429731、106429747、106429750、106429761、106429769、106429771,
UNCX:7号染色体的1263643、1263655、1263659、1263664、1263676、1263694、1263716、1263723,
RPS7P5:1号染色体的240161502、240161507、240161511、240161516、240161523、240161527、240161530、240161535、240161546、240161558、240161560,
FOXI2:10号染色体的129534843、129534853、129534866、129534879、129534891、129534910、129534912、129534924,
ACRBP:12号染色体的6756182、6756187、6756191、6756195、6756211、6756225、6756230、6756270,
GAS6:13号染色体的114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158,
MCRIP2:16号染色体的698072、698142、698153、698168、698208、698218、698222、698230,
LINC01977:17号染色体的77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640,
EGR3:8号染色体的22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299,
SOX17:8号染色体的55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620,
PAX5:9号染色体的36986087、36986093、36986098、36986101、36986103、36986117、36986131、36986138、36986141、36986143、36986147、36986149、36986156,
NEURL1:10号染色体的105344464、105344482、105344493、105344495、105344497、105344503、105344506、105344513、105344516、105344519、105344526,
IRX4:5号染色体的1876386、1876395、1876397、1876403、1876420、1876424、1876432、1876436、1876449、1876456、1876459、1876463,
RUSC1:1号染色体的155295135、155295171、155295181、155295192、155295196、155295212、155295229、155295236。
发明人还发现,甲状腺结节的性质还与BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平相关。
本文中,检测DNA甲基化的方法本领域周知,例如基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR(Methylation-specific PCR,MSP))、DNA测序(如亚硫酸氢盐测序(Bisulfite sequencing,BS)、全基因组甲基化测序(Whole-genome bisulfitesequencing,WGBS)、简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS))、甲基化敏感的限制性内切酶分析法(Methylation-Sensitive DependentRestriction Enzymes)、荧光定量法、甲基化敏感性高分辨率熔解曲线法(Methylation-sensitivity High-resolution Melting,MS-HRM)、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。在一个或多个实施方案中,检测包括检测基因或位点处的任一条链。检测上述位点的甲基化水平包括检测所述位点的上下游500bp以内的核酸区域的甲基化水平相关。
因此,本发明涉及检测DNA甲基化的试剂。本领域周知上述检测DNA甲基化的方法中所用的试剂。示例性地,检测DNA甲基化的试剂可为选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。
检测DNA甲基化的试剂可包含以下的一种或多种:重亚硫酸盐及其衍生物、PCR缓冲液、聚合酶、dNTP、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。在涉及DNA扩增的检测方法中,检测DNA甲基化的试剂包括引物。所述引物序列为甲基化特异的或非特异的。优选地,所述引物的序列包括非甲基化特异的封闭序列(Blocker)。封闭序列可以提高甲基化检测的特异性。检测DNA甲基化的试剂还可包括探针。通常,探针的序列的5’端标记荧光报告基团,3’端标记淬灭基团。优选地,所述探针的序列包含MGB或者LNA。
本文中,检测基因突变的方法及其试剂本领域周知。示例性地,检测基因突变的方法包括PCR-单链构象多态性法、异源双链分析法、突变富集PCR法、突变梯度凝胶电泳法、化学切割错配法、等位基因特异性寡核苷酸分析法、连接酶链反应、等位基因特异性扩增法、RNA酶A切割法、染色体原位杂交、荧光原位杂交技术、DNA序列分析、酶促切割错配法、切割片段长度多态性、双脱氧指纹图谱法、错配接合蛋白质截短测试法、引物延伸法、寡核苷酸链接检测法、毛细管电泳法、基于芯片的方法等。在一个或多个实施方案中,检测包括检测基因或位点处的任一条链。
因此,本发明涉及检测基因突变的试剂。本领域周知上述检测基因突变的方法中所用的试剂。示例性的检测基因突变的试剂包括:引物、探针、缓冲液、聚合酶、dNTP、限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。
本发明还涉及鉴定甲状腺结节性质的试剂盒,包含本文所述的试剂,特别是本文第二和/或三方面所述的试剂。所述试剂盒还可包含本文所述的核酸分子,特别是第一方面所述的核酸分子作为内标或阳性对照。所述试剂盒可包含检测基因突变的试剂。本文所述“引物”是指在核苷酸聚合作用起始时,引导合成的一种具有特定核苷酸序列的核酸分子。引物通常是人工合成的两段寡核苷酸序列,一个引物与靶区域一端的一条DNA模板链互补,另一个引物与靶区域另一端的另一条DNA模板链互补,其功能是作为核苷酸聚合作用的起始点。体外人工设计的引物被广泛用于聚合酶链反应(PCR)、qPCR、测序和探针合成等。通常,引物被设计为扩增的产物长度为50~150bp、60-140、70-130、80-120bp。优选地,产物长度为80-100bp。
在一个或多个实施方案中,检测DNA甲基化的试剂包括探针。所述探针的序列的5’端标记荧光报告基团,3’端标记淬灭基团。优选地,所述探针的序列包含MGB(Minor groovebinder)或者LNA(Locked nucleic acid)。MGB和LNA用于提高Tm(melting temperature)值,增加分析的特异性,提高探针设计的灵活性。
本文术语“变体”或“突变体”是指与参照序列相比,通过一个或多个核苷酸的插入、缺失或取代使核酸序列发生变化同时保留其与其他核酸杂交能力的多核苷酸。本文任一实施方案所述的突变体包括与参照序列具有至少70%,优选至少80%,优选至少85%,优选至少90%,优选至少95%,优选至少97%的序列相同性并保留参照序列的生物学活性的核苷酸序列。可采用例如NCBI的BLASTn计算两条比对的序列之间的序列相同性。突变体还包括在参照序列的和核苷酸序列中具有一个或多个突变(插入、缺失或取代)、同时仍保留参照序列生物学活性的核苷酸序列。所述多个突变通常指1-10个以内,例如1-8个、1-5个或1-3个。取代可以是嘌呤核苷酸与嘧啶核苷酸之间的取代,也可以是嘌呤核苷酸之间或嘧啶核苷酸之间的取代。取代优选是保守性取代。例如,在本领域中,用性能相近或相似的核苷酸进行保守性取代时,通常不会改变多核苷酸的稳定性和功能。保守性取代例如嘌呤核苷酸之间的(A与G)的互换,嘧啶核苷酸之间的(T或U与C)的互换。因此,在本发明多核苷酸中用来自同一残基替换一个或几个位点,将不会在实质上影响其活性。具体地,本发明中的变体中所含有的本文所述的位点未发生突变。即本发明方法检测的是相应序列中的所述位点的甲基化情况,对于这些位点之外的碱基可以发生突变。
本发明还提供一种用于甲状腺结节良恶性筛查的方法,包括:(1)检测对象的样品中本文所述基因、位点或核酸区域的甲基化水平;任选的(2)检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平;(3)与对照样品比较,或者通过计算得出评分,来衡量甲基化水平;(4)当满足判读标准时,则鉴定对象为良性或恶性结节。通常,所述方法在步骤(1)之前还包括:样品DNA的抽提、质检、和/或将DNA上未甲基化的胞嘧啶转化为不与鸟嘌呤结合的碱基。
本文所述“DNA”或“DNA分子”即脱氧核糖核酸。DNA基本组成单位是脱氧核糖核苷酸,经磷酸二酯键缩合而成长链状分子。每个脱氧核糖核苷酸由磷酸、脱氧核糖和碱基组成。DNA的碱基(bp)主要有腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。在双链DNA的双螺旋结构中,A与T经氢键配对,G与C经氢键配对。DNA形式包括cDNA、基因组DNA、片段化DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以为任意长度,例如50-500bp,100-400bp,150-300bp或200-250bp。
本文所述“尿嘧啶”或“U”是RNA的组成部分。“RNA”或“RNA分子”即核糖核酸。RNA由核糖核苷酸经磷酸二酯键缩合而成长链状分子。每个核糖核苷酸分子由磷酸、核糖和碱基构成。RNA的碱基主要有4种,即腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、尿嘧啶(U)。在RNA的碱基配对中,U取代了DNA中的T的位置,即A与U经氢键配对,G与C经氢键配对。
DNA或RNA的碱基之间可发生转化。本文所述“转化”、“胞嘧啶转化”或“CT转化”是利用非酶促或酶促方法处理DNA,将未修饰的胞嘧啶碱基(cytosine,C)转化为不与鸟嘌呤结合的碱基(例如尿嘧啶碱基(uracil,U))的过程。本领域周知进行胞嘧啶转化的非酶促或酶促方法。示例性地,非酶促方法包括亚硫酸氢盐或重硫酸盐处理,例如亚硫酸氢钙、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢铵、重硫酸钠、重硫酸钾和重硫酸铵等。示例性地,酶促方法包括脱氨酶处理。经转化的DNA任选经纯化。适用于本文的DNA纯化方法本领域周知。
提及胞嘧啶时,“修饰”表示胞嘧啶碱基上的化学基团的引入或除去。在胞嘧啶转化过程中,经修饰的胞嘧啶碱基比未修饰的胞嘧啶碱基稳定,不易受或不受转化过程的影响而变为U。在一个或多个实施方案中,修饰是指甲基化。本文所述“甲基化”或“DNA甲基化”是指在基因组DNA的CpG二核苷酸的胞嘧啶5'碳位共价结合一个甲基基团,成为5-甲基胞嘧啶(5mC)。
任选地,本文所述胞嘧啶转化前可通过非酶促或酶促方法对经修饰的胞嘧啶进行保护,从而使其免受下游的转化作用或脱氨基作用。适用于保护经修饰的胞嘧啶的非酶促或酶促方法本领域周知。例如,TET2(ten-eleven translocation 2)和/或氧化增强剂可保护经修饰的胞嘧啶。TET2可通过级联反应将5mC和5hmC氧化成5caC。氧化增强剂可通过糖基化将5hmC转化成5ghmC。适用于进行所述糖基化的氧化增强剂本领域周知。
在一个或多个实施方案中,所述判读标准为:与对照样品比较时,对象样品的甲基化水平和/或突变水平升高或降低。当甲基化水平和/或突变水平满足某一阈值时,则鉴定为恶性结节。对所测基因的甲基化水平进行数学分析,得到得分的拟合方程。对于检测的样品而言,当得分大于阈值,则判定结果为阳性,即为恶性结节,否则为阴性,即良性结节。本领域知晓常规数学分析的方法以及确定阈值的过程,示例性的方法是二元Logistic回归分析。通常,该阈值为0。
例如,当通过BIN1和SLC16A3基因的甲基化水平鉴定结节性质时,对BIN1基因以及SLC16A3基因的甲基化水平进行二元Logistic回归分析,拟合方程为:
得分=3.45–0.08×BIN1的甲基化水平+0.01×SLC16A3的甲基化水平。
所以,若样品的BIN1和SLC16A3基因的得分大于0,则判定结果为阳性,即为恶性结节。
本文中,样品来自哺乳动物,优选人。样品可来自任何器官(例如甲状腺)、组织(例如上皮组织、结缔组织、肌肉组织和神经组织)、细胞(例如甲状腺结节活检物)或者体液(例如血液、血浆、血清、组织液、尿液)。通常,只要所述样品包含基因组DNA或cfDNA(Circulating free DNA or Cell free DNA)即可。cfDNA称为循环游离DNA或者细胞游离DNA,是释放到血浆中的降解的DNA片段。示例性地,所述样品是甲状腺结节活检物,优选是细针穿刺活检物。或者,所述样品是血浆。
示例性实施方案:
1、一种分离的来自哺乳动物的核酸分子,选自以下各组中的一组或多组或与其具有至少70%相同性的变体:(a)7号染色体的片段和6号染色体的片段,(b)2号染色体的片段和19号染色体的片段,(c)2号染色体的片段和17号染色体的片段,(d)17号染色体的片段、19号染色体的片段和16号染色体的片段,所述片段长为50-5000bp,优选50-1000bp,其中
7号染色体的片段包含7号染色体上的位点73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160中的一个或多个,
6号染色体的片段包含6号染色体上的位点74290205、74290207、74290220、74290225、74290228中的一个或多个;
2号染色体的片段包含2号染色体上的位点127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,
19号染色体的片段包含19号染色体上的位点10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个;
17号染色体的片段包含17号染色体上的位点80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个,
16号染色体的片段包含16号染色体上的位点88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451中的一个或多个,
所述变体中的上述位点未突变。
2、如实施方案1所述的核酸分子,其中所述核酸分子还包含14号染色体的片段或与其具有至少70%相同性的变体,所述14号染色体的片段包含14号染色体上的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个,所述片段长为50-5000bp,优选50-1000bp,并且,16号染色体的片段还包含16号染色体上的位点68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,
所述变体中的上述位点未突变。
3、检测DNA的试剂,所述检测DNA的试剂包括检测选自以下(1)和(2)所述区域的DNA甲基化水平的试剂:
(1)选自以下的一个或多个基因的片段:ZMIZ1、C15orf52、SLC16A3、ZNF512B、SLC17A5、LIMK1、PLEC、TOR4A、TMEM131L、DNM2、IL17C、PRDM16、MT1JP、TBX3、BIN1、TIMP2、CFAP65、TSHR、KIF1A、DAPK、CDH1、TPO、RARG、PRR15、DPYS、MCC、TBX15、COL23A1、ILDR2、DHRS3、GDNF、TBX18、SIM2、HOXA9、EHBP1L1、GJC2、RCOR2、PRDM1、UNCX、RPS7P5、FOXI2、ACRBP、GAS6、MCRIP2、LINC01977、EGR3、SOX17、PAX5、NEURL1、IRX4、RUSC1,所述片段长为50-1000bp,
(2)(1)所述基因的上下游10Kb以内的核酸区域,
其中,ZMIZ1基因的片段包含ZMIZ1基因的位点:81001968、81001996、81002041、81002052、81002054、81002056、81002062、81002083、81002110、81002116、81002123、81002129、81002133、81002137、81002139、81002164、81002168、81002223、81002241、81002253中的一个或多个,
C15orf52基因的片段包含C15orf52基因的位点:40626309、40626312、40626386中的一个或多个,
SLC16A3基因的片段包含SLC16A3基因的位点:80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个,
ZNF512B基因的片段包含ZNF512B基因的位点:62588634、62588638、62588672中的一个或多个,
SLC17A5基因的片段包含SLC17A5基因的位点:74290205、74290207、74290220、74290225、74290228中的一个或多个,
LIMK1基因的片段包含LIMK1基因的位点:73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160中的一个或多个,
PLEC基因的片段包含PLEC基因的位点:145013661、145013673中的一个或多个,
TOR4A基因的片段包含TOR4A基因的位点:140172787、140172790、140172812中的一个或多个,
TMEM131L基因的片段包含TMEM131L基因的位点:154409945、154409963、154409972、154409978、154409997、154410003、154410006中的一个或多个,
DNM2基因的片段包含DNM2基因的位点:10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个,
IL17C基因的片段包含IL17C基因的位点:88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451中的一个或多个,
PRDM16基因的片段包含PRDM16基因的位点:3229914、3229921、3229950、3229968、3229973、3310213、3310229、3310235、3310238、3310240、3310268、3310287、3310312、3310314、3310317、3310329中的一个或多个,
TSHR基因的片段包含TSHR基因的位点:81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个,
KIF1A基因的片段包含KIF1A基因的位点:241759696、241759701、241759714、241759716中的一个或多个,
DAPK基因的片段包含DAPK基因的位点:90112842、90112853、90112861、90112866中的一个或多个,
CDH1基因的片段包含CDH1基因的位点:68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,
TPO基因的片段包含TPO基因的位点:1481013、1481015、1481022、1481039中的一个或多个,
RARG基因的片段包含RARG基因的位点:53613176、53613182、53613190、53613202、53613210、53613218中的一个或多个,
MT1JP基因的片段包含MT1JP基因的位点:56669271、56669292、56669295、56669300、56669318、56669322、56669324、56669327、56669344、56669351、56669353、56669402、56669414、56669423、56669430、56669433、56669437、56669451、56669453、56669455、56669463、56669474、56669480、56669482、56669485、56669487、56669490、56669519、56669533、56669553、56669564、56669573、56669578、56669588、56669590、56669606、56669610中的一个或多个,
TBX3基因的片段包含TBX3基因的位点:115174750、115174773、115174780中的一个或多个,
BIN1基因的片段包含BIN1基因的位点:127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,
TIMP2基因的片段包含TIMP2基因的位点:76921845、76921853、76921860中的一个或多个,
CFAP65基因的片段包含CFAP65基因的位点:219866132、219866139、219866148、219866158、219866165、219866168、219866199、219866218中的一个或多个,
PRR15基因的片段包含PRR15基因的位点:29605992、29606026、29606040、29606047、29606056、29606062、29606073、29606179、29606191、29606201、29606204、29606220、29606222、29606227、29606231、29606255、29606257、29606262、29606271、29606277、29606289、29606320中的一个或多个,
DPYS基因的片段包含DPYS基因的位点:105478870、105478873、105478878、105478905、105478908、105478916、105478918、105478945、105478956、105478965、105478974、105478983、105478986、105478989中的一个或多个,
MCC基因的片段包含MCC基因的位点:112538999、112539011、112539018、112539022、112539061、112539084、112539104、112539128中的一个或多个,
TBX15基因的片段包含TBX15基因的位点:119535725、119535730、119535740、119535742、119535750、119535759、119535766、119535812、119535817、119535821、119535823、119535876、119535879、119535884、119535891中的一个或多个,
COL23A1基因的片段包含COL23A1基因的位点:178003785、178003798、178003803、178003814、178003823、178003825、178003834、178003841、178003844中的一个或多个,
ILDR2基因的片段包含ILDR2基因的位点:166890429、166890436、166890440、166890442、166890448、166890452、166890456、166890461、166890468、166890473、166890475、166890480、166890492、166890500、166890503、166890509、166890516、166890528、166890535、166890543、166890555、166890559、166890568、166890573、166890584、166890586中的一个或多个,
DHRS3基因的片段包含DHRS3基因的位点:12656091、12656114、12656132、12656152、12656170、12656175、12656182、12656187、12656197、12656200、12656211、12656315、12656323、12656340、12656355、12656367中的一个或多个,
GDNF基因的片段包含GDNF基因的位点:37834763、37834770、37834772、37834774、37834777、37834780、37834784、37834792、37834799、37834802、37834806、37834811中的一个或多个,
TBX18基因的片段包含TBX18基因的位点:85477032、85477035、85477070、85477083、85477106、85477124、85477151、85477153、85477166中的一个或多个,
SIM2基因的片段包含SIM2基因的位点:38069563、38069579、38069619、38069625、38069638、38069650、38069662、38069664、38069676、38069681中的一个或多个,
HOXA9基因的片段包含HOXA9基因的位点:27204848、27204854、27204858、27204861、27204863、27204879、27204884、27204894、27204897、27204918、27204929、27204938、27204945、27204948、27204951、27204958、27204981、27204984中的一个或多个,
EHBP1L1基因的片段包含EHBP1L1基因的位点:65352612、65352621、65352635、65352639、65352642、65352651、65352654、65352665、65352670中的一个或多个,
GJC2基因的片段包含GJC2基因的位点:228345954、228345957、228345965、228345978、228345980、228345989中的一个或多个,
RCOR2基因的片段包含RCOR2基因的位点:63687223、63687238、63687247、63687250、63687259、63687282、63687288、63687299、63687318、63687325中的一个或多个,
PRDM1基因的片段包含PRDM1基因的位点:106429711、106429722、106429731、106429747、106429750、106429761、106429769、106429771中的一个或多个,
UNCX基因的片段包含UNCX基因的位点:1263643、1263655、1263659、1263664、1263676、1263694、1263716、1263723中的一个或多个,
RPS7P5基因的片段包含RPS7P5基因的位点:240161502、240161507、240161511、240161516、240161523、240161527、240161530、240161535、240161546、240161558、240161560中的一个或多个,
FOXI2基因的片段包含FOXI2基因的位点:129534843、129534853、129534866、129534879、129534891、129534910、129534912、129534924中的一个或多个,
ACRBP基因的片段包含ACRBP基因的位点:6756182、6756187、6756191、6756195、6756211、6756225、6756230、6756270中的一个或多个,
GAS6基因的片段包含GAS6基因的位点:114524043、114524062、114524068、114524084、114524095、114524131、114524138、114524142、114524150、114524158中的一个或多个,
MCRIP2基因的片段包含MCRIP2基因的位点:698072、698142、698153、698168、698208、698218、698222、698230中的一个或多个,
LINC01977基因的片段包含LINC01977基因的位点:77789596、77789601、77789612、77789620、77789628、77789632、77789635、77789640中的一个或多个,
EGR3基因的片段包含EGR3基因的位点:22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个,
SOX17基因的片段包含SOX17基因的位点:55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620中的一个或多个,
PAX5基因的片段包含PAX5基因的位点:36986087、36986093、36986098、36986101、36986103、36986117、36986131、36986138、36986141、36986143、36986147、36986149、36986156中的一个或多个,
NEURL1基因的片段包含NEURL1基因的位点:105344464、105344482、105344493、105344495、105344497、105344503、105344506、105344513、105344516、105344519、105344526中的一个或多个,
IRX4基因的片段包含IRX4基因的位点:1876386、1876395、1876397、1876403、1876420、1876424、1876432、1876436、1876449、1876456、1876459、1876463中的一个或多个,
RUSC1基因的片段包含RUSC1基因的位点:155295135、155295171、155295181、155295192、155295196、155295212、155295229、155295236中的一个或多个。
4、如实施方案3所述的检测DNA的试剂,其特征在于,
ZMIZ1基因的片段包含ZMIZ1基因的位点81002041、81002052、81002054、81002056、81002062、81002083中的一个或多个,
C15orf52基因的片段包含C15orf52基因的位点40626309、40626312中的一个或多个,
SLC16A3基因的片段包含SLC16A3基因的位点80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757中的一个或多个,
ZNF512B基因的片段包含ZNF512B基因的位点62588634、62588638、62588672中的一个或多个,
SLC17A5基因的片段包含SLC17A5基因的位点74290205、74290207、74290220、74290225、74290228中的一个或多个,
LIMK1基因的片段包含LIMK1基因的位点73509112、73509133、73509138、73509148、73509160中的一个或多个,
PLEC基因的片段包含PLEC基因的位点145013661、145013673中的一个或多个,
TOR4A基因的片段包含TOR4A基因的位点140172787、140172790、140172812中的一个或多个,
TMEM131L基因的片段包含TMEM131L基因的位点154409945、154409963、154409972、154409978、154409997中的一个或多个,
DNM2基因的片段包含DNM2基因的位点10870427、10870429、10870441、10870448中的一个或多个,
IL17C基因的片段包含IL17C基因的位点88701004、88701021、88701029、88701036、88701043、88701051、88701060中的一个或多个,
PRDM16基因的片段包含PRDM16基因的位点3229950、3229968、3229973中的一个或多个,
MT1JP基因的片段包含MT1JP基因的位点56669271、56669292、56669295、56669300、56669318、56669322、56669324、56669327、56669344中的一个或多个,
TBX3基因的片段包含TBX3基因的位点115174750、115174773、115174780中的一个或多个,
BIN1基因的片段包含BIN1基因的位点127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616中的一个或多个,
TIMP2基因的片段包含TIMP2基因的位点76921845、76921853、76921860中的一个或多个,
CFAP65基因的片段包含CFAP65基因的位点219866199、219866218中的一个或多个,
TSHR基因的片段包含TSHR基因的位点81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个,
KIF1A基因的片段包含KIF1A基因的位点241759696、241759701、241759714、241759716中的一个或多个,
DAPK基因的片段包含DAPK基因的位点90112842、90112853、90112861、90112866中的一个或多个,
CDH1基因的片段包含CDH1基因的位点68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,
TPO基因的片段包含TPO基因的位点1481013、1481015、1481022、1481039中的一个或多个,
RARG基因的片段包含RARG基因的位点53613176、53613182、53613190、53613202、53613210、53613218中的一个或多个,
PRR15基因的片段包含PRR15基因的位点29606026、29606040、29606047、29606056、29606062、29606073、29606220、29606222、29606227、29606231、29606255、29606257、29606262、29606271、29606277、29606289中的一个或多个,
DPYS基因的片段包含DPYS基因的位点105478905、105478908、105478916、105478918、105478945、105478956、105478965、105478974、105478983中的一个或多个,
MCC基因的片段包含MCC基因的位点112538999、112539011、112539018、112539022、112539061中的一个或多个,
TBX15基因的片段包含TBX15基因的位点119535740、119535742、119535750、119535759、119535766中的一个或多个,
COL23A1基因的片段包含COL23A1基因的位点178003798、178003803、178003814、178003823、178003825、178003834、178003841、178003844中的一个或多个,
ILDR2基因的片段包含ILDR2基因的位点166890516、166890528、166890535、166890543、166890555、166890559、166890568、166890573、166890584、166890586中的一个或多个,
DHRS3基因的片段包含DHRS3基因的位点:12656340、12656355、12656367中的一个或多个,
GDNF基因的片段包含GDNF基因的位点:37834770、37834772、37834774、37834777、37834780、37834784、37834792、37834799、37834802、37834806、37834811中的一个或多个,
TBX18基因的片段包含TBX18基因的位点:85477035、85477070、85477083、85477106中的一个或多个,
SIM2基因的片段包含SIM2基因的位点:38069638、38069650、38069662、38069664、38069676、38069681中的一个或多个,
HOXA9基因的片段包含HOXA9基因的位点:27204854、27204858、27204861、27204863、27204879中的一个或多个,
EHBP1L1基因的片段包含EHBP1L1基因的位点:65352621、65352635、65352639、65352642、65352651、65352654、65352665、65352670中的一个或多个,
GJC2基因的片段包含GJC2基因的位点:228345965、228345978、228345980、228345989中的一个或多个,
RCOR2基因的片段包含RCOR2基因的位点:63687223、63687238、63687247、63687250、63687259中的一个或多个,
PRDM1基因的片段包含PRDM1基因的位点:106429722、106429731、106429747、106429750、106429761、106429769、106429771中的一个或多个,
UNCX基因的片段包含UNCX基因的位点:1263643、1263655、1263659、1263664、1263676中的一个或多个,
RPS7P5基因的片段包含RPS7P5基因的位点:240161511、240161516、240161523、240161527、240161530中的一个或多个,
FOXI2基因的片段包含FOXI2基因的位点:129534910、129534912、129534924中的一个或多个,
ACRBP基因的片段包含ACRBP基因的位点:6756182、6756187、6756191、6756195、6756211中的一个或多个,
GAS6基因的片段包含GAS6基因的位点:114524062、114524068、114524084、114524095、114524131、114524138中的一个或多个,
MCRIP2基因的片段包含MCRIP2基因的位点:698072、698142、698153、698168、698208中的一个或多个,
LINC01977基因的片段包含LINC01977基因的位点:77789596、77789601、77789612、77789620中的一个或多个,
EGR3基因的片段包含EGR3基因的位点:22548269、22548279、22548283、22548287、22548296、22548299中的一个或多个,
SOX17基因的片段包含SOX17基因的位点:55379602、55379608、55379617、55379620中的一个或多个,
PAX5基因的片段包含PAX5基因的位点:36986087、36986093、36986098、36986101、36986103中的一个或多个,
NEURL1基因的片段包含NEURL1基因的位点:105344493、105344495、105344497中的一个或多个,
IRX4基因的片段包含IRX4基因的位点:1876386、1876395、1876397、1876403中的一个或多个,
RUSC1基因的片段包含RUSC1基因的位点:155295192、155295196、155295212中的一个或多个。
5.如实施方案3所述的检测DNA的试剂,其特征在于,所述检测DNA的试剂还包括检测BRAF基因的V600E位点的突变水平的试剂。
6.如实施方案3所述的检测DNA的试剂,其特征在于,所述检测DNA的试剂还包括检测TERT基因的C228T/C250T位点的突变水平的试剂。
7、检测DNA甲基化的试剂,所述试剂检测以下(a)-(d)中一组或多组位点的甲基化水平:
a.(1)7号染色体上的73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160中的一个或多个,和
(2)6号染色体上的74290205、74290207、74290220、74290225、74290228中的一个或多个;
b.(1)2号染色体上的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,和
(2)19号染色体上的10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个;
c.(1)2号染色体上的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,和
(2)17号染色体上的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个;
d.(1)17号染色体上的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个,
(2)19号染色体上的10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个,和
(3)16号染色体上的88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451中的一个或多个。
8、如实施方案7所述的试剂,其特征在于,所述试剂还检测以下位点的甲基化水平:
e.(1)16号染色体上的68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,和(2)14号染色体上的81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个。
9、如实施方案2-8中任一项所述的试剂,其特征在于,还具有选自以下的一个或多个特征:
所述片段包括DNA正义链或反义链,
检测DNA甲基化的试剂是选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR、DNA测序、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱,
优选地,检测DNA甲基化的试剂选自以下一种或多种:重亚硫酸盐及其衍生物、PCR缓冲液、聚合酶、dNTP、引物、探针、甲基化敏感或不敏感的限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物,
优选地,所述引物为甲基化特异的或非特异的引物,优选地,所述引物的序列包括非甲基化特异的封闭序列(Blocker),优选地,所述引物是SEQ ID NO:1、2、4、5、7、8或与其具有90%相同性的序列,
优选地,所述探针具有报告序列,优选地,所述探针是SEQ ID NO:3、6、9或与其具有90%相同性的序列,
检测基因突变的试剂是选自以下方法的一个或多个中所用的试剂:PCR-单链构象多态性法、异源双链分析法、突变富集PCR法、突变梯度凝胶电泳法、化学切割错配法、等位基因特异性寡核苷酸分析法、连接酶链反应、等位基因特异性扩增法、RNA酶A切割法、染色体原位杂交、荧光原位杂交技术、DNA序列分析、酶促切割错配法、切割片段长度多态性、双脱氧指纹图谱法、错配接合蛋白质截短测试法、引物延伸法、寡核苷酸链接检测法、毛细管电泳法、基于芯片的方法,
优选地,检测基因突变的试剂包括:引物、探针、缓冲液、聚合酶、dNTP、限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物。
10、一种鉴定甲状腺结节性质的试剂盒,包含实施方案2-9中任一项所述的试剂和任选的实施方案1所述的核酸分子。
11、检测DNA的试剂和任选的实施方案1所述的核酸分子在制备用于鉴定样品中甲状腺结节性质的试剂盒中的用途,所述试剂检测以下(a)-(d)中一组或多组位点的甲基化水平:
a.(1)7号染色体上的73508994、73509017、73509055、73509062、73509073、73509075、73509112、73509133、73509138、73509148、73509160中的一个或多个,和
(2)6号染色体上的74290205、74290207、74290220、74290225、74290228中的一个或多个;
b.(1)2号染色体上的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,和
(2)19号染色体上的10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个;
c.(1)2号染色体上的127822478、127822492、127822495、127822514、127822551、127822568、127822582、127822593、127822616、127822644中的一个或多个,和
(2)17号染色体上的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个;
d.(1)17号染色体上的80189165、80189174、80189177、80189197、80189225、80189230、80189239、80189645、80189671、80189674、80189684、80189687、80189698、80189709、80189719、80189726、80189728、80189739、80189757、80189787、80189792、80189811、80189817、80189832、80189841中的一个或多个,
(2)19号染色体上的10870373、10870377、10870427、10870429、10870441、10870448中的一个或多个,和
(3)16号染色体上的88700818、88700826、88700844、88700849、88700857、88700869、88700875、88700891、88700897、88700916、88700920、88700937、88700943、88700948、88700967、88700970、88700993、88701004、88701021、88701029、88701036、88701043、88701051、88701060、88701074、88701081、88701090、88701099、88701111、88701115、88701133、88701140、88701148、88701159、88701161、88701176、88701178、88701180、88701183、88701190、88701201、88701204、88701210、88701212、88701236、88701240、88701266、88701278、88701281、88701285、88701305、88701421、88701442、88701451中的一个或多个,
任选的e.(1)16号染色体上的68771035、68771037、68771045、68771051、68771059、68771064、68771073中的一个或多个,和(2)14号染色体上的81421983、81421989、81422010、81422017、81422032、81422035、81422063、81422084中的一个或多个,
优选地,所述试剂如实施方案8-9中任一项所述,。
12、如实施方案11所述的用途,其特征在于,所述用途具有选自以下的一个或多个特征:
所述试剂盒还包括检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平的试剂,
所述鉴定甲状腺结节性质包括:与对照样品比较,或者根据所述甲基化水平和/或突变水平获得评分,根据比较结果或评分鉴定甲状腺结节性质,
所述样品来自人,优选来自组织、细胞或者体液,例如甲状腺组织或血液,
所述样品含有基因组DNA或cfDNA。
13、一种鉴定甲状腺结节性质的方法,包括:
(1)检测对象的样品中基因、位点或核酸区域的甲基化水平,所述基因、位点或核酸区域如实施方案2-9中所述;
任选的(2)检测BRAF基因的V600E位点的突变水平和/或TERT基因的C228T/C250T位点的突变水平;
(3)与对照样品比较,或者根据所述甲基化水平和/或突变水平获得评分;
(4)根据步骤(3)的比较结果或评分鉴定甲状腺结节性质,
优选地,步骤(4)包括:
与对照样品比较,对象样品的甲基化水平和/或突变水平变化,当甲基化水平和/或突变水平满足阈值时,则鉴定甲状腺结节为良性或恶性结节,或
当评分满足阈值时,则鉴定甲状腺结节为良性或恶性结节。
实施例
下面结合附图和具体实施例对本发明作进一步详细的说明。下列实施例中,未注明具体条件的实验方法,通常按常规条件中所述的方法进行。
实施例1:简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS)筛选甲状腺结节良恶性差异的甲基化位点
1)样本准备
使用QIAamp DNA Mini Kit(QIAGEN,货号:51304)对37例甲状腺癌和37例甲状腺良性结节的组织进行DNA抽提;使用QubitTM dsDNA HS Assay Kit(Thermo,货号:Q32854)检测DNA的浓度;使用1%琼脂糖凝胶电泳进行质检。
2)MspI酶切
配制反应体系如下:
组分 |
体积(μl) |
10×Buffer Tango |
2.0 |
MspI(10U/μl) |
1.0 |
无核酸酶水+DNA |
17.0 |
总计 |
20.0 |
反应程序为:37℃2小时,4℃保存。
3)末端修复和加A
配制反应体系如下:
组分 |
体积(μl) |
酶切DNA产物 |
20.0 |
End Repair&A-Tailing Buffer |
4.0 |
End Repair&A-Tailing Enzyme Mix |
2.0 |
无核酸酶水 |
14.0 |
总计 |
40.0 |
反应程序为:20℃30分钟,65℃30分钟,4℃保存。
4)接头连接
配制反应体系如下:
组分 |
体积(μl) |
末端修复和加A产物 |
40.0 |
Indexed methylated adapter |
2.0 |
T4 DNA Ligase Buffer(10×) |
5.0 |
T4 DNA Ligase |
1.0 |
无核酸酶水 |
2.0 |
总计 |
50.0 |
反应程序为:16℃过夜,65℃10分钟,4℃保存。
5)连接后纯化
i.连接后溶液转移至50μl AMPure beads中,涡旋混匀,室温温育5分钟,低速短暂离心。将离心管放置到磁力架上直至溶液澄清;
ii.用80%乙醇溶液清洗两遍;
iii.室温下晾干磁珠;
iv.加入32μl ddH2O,室温下温育2分钟,将离心管放置到磁力架上直至溶液澄清,吸取30μl上清溶液转移到新的离心管中。
6)重亚硫酸盐转化
使用MethylCodeTM Bisulfite Conversion Kit(Thermo,货号:MECOV50)对步骤5得到的DNA进行重亚硫酸盐转化,未甲基化的胞嘧啶(cytosine,C)经过转化变为尿嘧啶(uracil,U);甲基化的胞嘧啶转化后不发生改变。
转化试剂配制如下:
组分 |
体积(μl) |
无核酸酶水 |
800.0 |
Dilution Buffer |
300.0 |
Resuspension Buffer |
50.0 |
添加120μl配制好的转化试剂到步骤5得到的30μl连接纯化产物中,混匀。反应程序为:98℃10分钟,64℃2.5小时,4℃保存。
按照说明书回收处理后的DNA,最后用43μl洗脱液洗脱DNA,转移41.6μl进行下一步反应。
7)文库扩增
配制反应体系如下:
组分 |
体积(μl) |
10×PfuTurbo Cx reaction buffer |
5.0 |
dNTPs(25mM each dNTP) |
0.4 |
Primer mix |
2.0 |
PfuTurbo Cx hotstart DNA polymerase(2.5U/μl) |
1.0 |
重亚硫酸盐转化DNA |
41.6 |
总计 |
50.0 |
反应程序为:95℃2分钟;95℃30秒,65℃30秒,72℃1分钟,15个循环;72℃5分钟,4℃保存。
8)文库纯化
i.文库扩增产物加入50μl AMPure beads中,涡旋混匀,室温温育5分钟,低速短暂离心。将离心管放置到磁力架上直至溶液澄清;
ii.用80%乙醇溶液清洗两遍;
iii.室温下晾干磁珠;
iv.加入40μl ddH2O,室温下温育2分钟,将离心管放置到磁力架上直至溶液澄清,吸取38μl上清溶液转移到新的离心管中。
9)文库质控
Qubit测定文库浓度,LabChip(PerkinElmer)检测文库片段分布,如图1所示。
10)测序
使用Illumina平台HiSeq X Ten采用PE150进行测序。
11)数据分析
经过生物信息学分析,获得如表1在甲状腺结节良恶性之间具有甲基化差异的CpG位点,包括CpG所在染色体、CpG起始位点、对应的基因、统计学比较P值以及甲状腺恶性结节与良性结节甲基化CpG位点间的比值。
表1,566个甲状腺结节良恶性甲基化差异的CpG位点以及对应的51个基因
实施例2,甲基化特异的PCR法(Methylation-specific PCR,MSP)和定量甲基化特异的PCR法(Quantitative MSP,Q-MSP)验证差异的甲基化位点
1)样本准备
使用QIAamp DNA Mini Kit(QIAGEN,货号:51304)对10例甲状腺癌和10例甲状腺良性结节的组织或血浆进行DNA抽提;使用QubitTM dsDNA HS Assay Kit(Thermo,货号:Q32854)检测DNA的浓度;使用1%琼脂糖凝胶电泳进行质检。
2)DNA转化
使用MethylCodeTM Bisulfite Conversion Kit(Thermo,货号:MECOV50)对步骤1得到的DNA进行重亚硫酸盐转化,未甲基化的胞嘧啶(cytosine,C)经过转化变为尿嘧啶(uracil,U);甲基化的胞嘧啶转化后不发生改变。
3)PCR混合物准备
包括PCR反应液、引物混合物、探针混合物,进行单个样本的配制如下:
MSP反应体系组成
组分 |
体积(μl) |
Platinum<sup>TM</sup>II Hot-Start PCR Master Mix(2×) |
10.00 |
水 |
7.44 |
目标基因正向引物F,100μM |
0.12 |
目标基因反向引物R,100μM |
0.12 |
内参基因正向引物F,100μM |
0.12 |
内参基因反向引物R,100μM |
0.12 |
目标基因探针P,100μM(FAM/BHQ1) |
0.04 |
内参基因探针P,100μM(HEX/BHQ1) |
0.04 |
样本DNA(10.0ng)/阳性对照/阴性对照 |
2.00 |
总共 |
20.00 |
Q-MSP反应体系组成
组分 |
体积(μl) |
Platinum<sup>TM</sup>II Hot-Start PCR Master Mix(2×) |
10.00 |
水 |
7.44 |
目标基因正向引物F,100μM |
0.12 |
目标基因反向引物R,100μM |
0.12 |
内参基因正向引物F,100μM |
0.12 |
内参基因反向引物R,100μM |
0.12 |
目标基因探针P,100μM(FAM/BHQ1) |
0.04 |
内参基因探针P,100μM(HEX/BHQ1) |
0.04 |
样本DNA(10.0ng)/梯度稀释的标准品/阳性对照/阴性对照 |
2.00 |
总共 |
20.00 |
注:梯度稀释的标准品为重亚硫酸盐转化的30ng的4倍梯度稀释的6个梯度的完全甲基化阳性标准品。
4)PCR反应
设置PCR程序为94℃预变性2min;94℃变性30s,60℃退火延伸1min,45个循环。60℃退火延伸阶段收集荧光信号。
5)检测结果分析
对各个基因的甲基化水平分别进行ROC曲线分析如图2A-C所示,各个基因的AUC均大于0.6。
实施例3,多重预扩增甲基化特异的PCR法(preAMP-MSP)进行甲状腺结节良恶性判别
1)样本准备
使用QIAamp Circulating Nucleic Acid Kit(QIAGEN,货号:55114)对20例甲状腺癌和20例甲状腺良性结节的血浆进行cfDNA抽提;使用QubitTM dsDNA HS Assay Kit(Thermo,货号:Q32854)检测cfDNA的浓度;使用LabChip 3K Assay进行质检。
2)DNA转化
使用MethylCodeTM Bisulfite Conversion Kit(Thermo,货号:MECOV50)对步骤1得到的cfDNA进行重亚硫酸盐转化,未甲基化的胞嘧啶(cytosine,C)经过转化变为尿嘧啶(uracil,U);甲基化的胞嘧啶转化后不发生改变。
3)预扩增PCR反应
预扩增PCR混合物包括PCR反应液、引物混合物。引物混合物包含GAS6(SEQ ID NO:4和5)、SOX17(SEQ ID NO:6和7)、MCRIP2(SEQ ID NO:14和15)、LINC01977(SEQ ID NO:16和17)、EGR3(SEQ ID NO:18和19)和内参基因(SEQ ID NO:1和2)的各一对引物。
预扩增PCR反应体系组成
组分 |
体积(μl) |
Platinum<sup>TM</sup>II Hot-Start PCR Master Mix(2×) |
12.50 |
水 |
4.10 |
多重引物混合物,100μM |
3.40 |
样本cfDNA/阳性对照/阴性对照 |
5.00 |
总共 |
25.00 |
设置PCR程序为94℃预变性2min;94℃变性15s,60℃退火45s,68℃延伸1min,15个循环;72℃延伸1min,4℃保存。
4)MSP反应
按照厂商试剂盒说明配制反应体系,包含PlatinumTMII Hot-Start PCR MasterMix(2×)、水、引物混合物(同上)、探针混合物(探针序列如SEQ ID NO:20(GAS6)、SEQ IDNO:21(SOX17)、SEQ ID NO:25(MCRIP2)、SEQ ID NO:26(LINC01977)、SEQ ID NO:27(EGR3)和SEQ ID NO:3(内参)所示)、1:100稀释的预扩增PCR产物。其中,GAS6基因位点包括114524043、114524062、114524068、114524084、114524142、114524150、114524158,MCRIP2基因位点包括698142、698153、698168、698218、698222、698230,LINC01977基因位点包括77789596、77789601、77789612、77789620、77789628、77789632、77789635,EGR3基因位点包括22548250、22548260、22548269、22548279、22548283、22548287、22548296、22548299,SOX17基因位点包括55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617、55379620。设置PCR程序为94℃预变性2min;94℃变性30s,60℃退火延伸1min,45个循环。60℃退火延伸阶段收集荧光信号。
5)检测结果分析
甲基化水平(methylation level)=2–ΔCt待检样品/2–ΔCt阳性标准品×100。其中,ΔCt=Ct目的基因–Ct内参基因。
对GAS6基因、MCRIP2基因、LINC01977基因、EGR3基因以及SOX17基因的甲基化水平进行二元Logistic回归分析,拟合方程为得分(Score)=-1.99–2.31×GAS6甲基化水平+0.68×MCRIP2甲基化水平+1.92×LINC01977甲基化水平+2.14×EGR3甲基化水平–1.49×SOX17甲基化水平,判读方法为所检测GAS6、MCRIP2、LINC01977、EGR3和SOX17基因的得分大于0,则判定结果为阳性,即为恶性结节。
得分如表2,ROC分析如图3。根据判读标准,20例甲状腺良性结节有4例阳性,20例甲状腺癌有13例阳性,特异性达到80.0%,灵敏度为75.0%。
表2
组别 |
得分 |
组别 |
得分 |
良性结节 |
-0.75 |
恶性结节 |
1.36 |
良性结节 |
-0.23 |
恶性结节 |
-1.08 |
良性结节 |
-1.39 |
恶性结节 |
2.21 |
良性结节 |
-1.59 |
恶性结节 |
0.25 |
良性结节 |
-0.24 |
恶性结节 |
-1.03 |
良性结节 |
-0.85 |
恶性结节 |
-0.10 |
良性结节 |
-1.51 |
恶性结节 |
4.49 |
良性结节 |
1.14 |
恶性结节 |
0.31 |
良性结节 |
-1.07 |
恶性结节 |
0.76 |
良性结节 |
0.23 |
恶性结节 |
6.25 |
良性结节 |
-1.33 |
恶性结节 |
-0.68 |
良性结节 |
0.08 |
恶性结节 |
1.92 |
良性结节 |
-2.36 |
恶性结节 |
2.82 |
良性结节 |
1.79 |
恶性结节 |
0.78 |
良性结节 |
-1.66 |
恶性结节 |
-0.11 |
良性结节 |
-0.65 |
恶性结节 |
-0.79 |
良性结节 |
-0.42 |
恶性结节 |
6.46 |
良性结节 |
-1.26 |
恶性结节 |
1.79 |
良性结节 |
-1.03 |
恶性结节 |
-0.79 |
良性结节 |
-0.39 |
恶性结节 |
0.53 |
实施例4,多重预扩增甲基化特异的PCR法(preAMP-MSP)进行甲状腺结节良恶性判别
步骤1)-4)同实施例3,不同的是,步骤3)中,引物混合物包含GAS6(SEQ ID NO:4和5)、SOX17(SEQ ID NO:6和7)、ZMIZ1(SEQ ID NO:8和9)、TSHR(SEQ ID NO:10和11)、CDH1(SEQ ID NO:12和13)和内参基因(SEQ ID NO:1和2)的各一对引物。各基因的探针如SEQ IDNO:20(GAS6)、SEQ ID NO:21(SOX17)、SEQ ID NO:22(ZMIZ1)、SEQ ID NO:23(TSHR)、SEQ IDNO:24(CDH1)和SEQ ID NO:3(内参)所示。步骤4)中,ZMIZ1基因位点包括81002052、81002054、81002056、81002062,TSHR基因位点包括81422010、81422032、81422035、81422084,CDH1基因位点包括68771035、68771045、68771051、68771059、68771073,GAS6基因位点包括114524043、114524062、114524068、114524084、114524142、114524150、114524158,SOX17基因位点包括55379566、55379568、55379573、55379579、55379583、55379591、55379599、55379602、55379608、55379617。
5)检测结果分析
甲基化水平(methylation level)=2–ΔCt待检样品/2–ΔCt阳性标准品×100。其中,ΔCt=Ct目的基因–Ct内参基因。
对ZMIZ1基因、TSHR基因、CHD1基因、MCC基因以及DPYS基因的甲基化水平进行二元Logistic回归分析,拟合方程为得分(Score)=-2.91-0.52×ZMIZ1甲基化水平+10.63×TSHR甲基化水平–2.78×CDH1甲基化水平+5.16×GAS6甲基化水平+6.28×SOX17甲基化水平,判读方法为所检测ZMIZ1、TSHR、CHD1、GAS6和SOX17基因的得分大于0,则判定结果为阳性,即为恶性结节。
得分如表3,ROC分析如图4。根据判读标准,20例甲状腺良性结节有6例阳性,20例甲状腺癌有15例阳性,特异性达到90.0%,灵敏度为60.0%。
表3
组别 |
得分 |
组别 |
得分 |
良性结节 |
-1.03 |
恶性结节 |
0.51 |
良性结节 |
0.11 |
恶性结节 |
-1.37 |
良性结节 |
1.31 |
恶性结节 |
-0.70 |
良性结节 |
-0.23 |
恶性结节 |
1.85 |
良性结节 |
-1.95 |
恶性结节 |
-0.60 |
良性结节 |
-0.86 |
恶性结节 |
0.93 |
良性结节 |
0.77 |
恶性结节 |
-0.14 |
良性结节 |
0.65 |
恶性结节 |
0.67 |
良性结节 |
-1.45 |
恶性结节 |
1.72 |
良性结节 |
2.15 |
恶性结节 |
0.92 |
良性结节 |
-1.79 |
恶性结节 |
1.17 |
良性结节 |
-0.70 |
恶性结节 |
1.41 |
良性结节 |
-4.81 |
恶性结节 |
0.75 |
良性结节 |
0.16 |
恶性结节 |
1.02 |
良性结节 |
-3.03 |
恶性结节 |
1.59 |
良性结节 |
-2.61 |
恶性结节 |
2.58 |
良性结节 |
-2.68 |
恶性结节 |
1.61 |
良性结节 |
-2.79 |
恶性结节 |
2.32 |
良性结节 |
-1.46 |
恶性结节 |
-0.19 |
良性结节 |
-7.20 |
恶性结节 |
3.30 |
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 上海鹍远生物技术有限公司
<120> 检测DNA甲基化的试剂及用途
<130> 20A603
<150> 202010038550.8
<151> 2020-01-14
<160> 27
<170> SIPOSequenceListing 1.0
<210> 1
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 1
cccttaaaaa ttacaaaaac cacaacc 27
<210> 2
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 2
aggaggttta gtaagttttt tggattg 27
<210> 3
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 3
accaccaccc aacacacaat aacaaacaca 30
<210> 4
<211> 16
<212> DNA
<213> Artificial Sequence
<400> 4
atgtaactga ccccgc 16
<210> 5
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 5
cgggtttgcg gttaaac 17
<210> 6
<211> 16
<212> DNA
<213> Artificial Sequence
<400> 6
gaggtttcgc ggttcg 16
<210> 7
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 7
cgtaaccaac gctaccg 17
<210> 8
<211> 26
<212> DNA
<213> Artificial Sequence
<400> 8
aattcctata accaaaaact aacgac 26
<210> 9
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 9
taggatgtaa tgttaggaag gtagt 25
<210> 10
<211> 26
<212> DNA
<213> Artificial Sequence
<400> 10
tgtagagttg agaatgaggt gatttc 26
<210> 11
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 11
gcccaaatcc ctaaacaaat cg 22
<210> 12
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 12
gtaattttag gttagagggt tatyg 25
<210> 13
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 13
ccctccccaa aacraaac 18
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 14
gtgtttattg atttagacga gtgg 24
<210> 15
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 15
cgacaaatcg accgtataac a 21
<210> 16
<211> 28
<212> DNA
<213> Artificial Sequence
<400> 16
taataaygac tctaaaataa cacaaact 28
<210> 17
<211> 18
<212> DNA
<213> Artificial Sequence
<400> 17
gttcggcggt cgttaaag 18
<210> 18
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 18
ttcgtgtgga tgcgtag 17
<210> 19
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 19
ccraaaacta craccrccg 19
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 20
cgacaacgct tataaccaac cccg 24
<210> 21
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 21
cgttcgtagt gtcgttggat cgg 23
<210> 22
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 22
aaaacgacta cgcgcgaccc taccc 25
<210> 23
<211> 28
<212> DNA
<213> Artificial Sequence
<400> 23
acaacaccaa ctacaacaaa tccgccga 28
<210> 24
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 24
cgcccacccg acctcgcat 19
<210> 25
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 25
tgggcgtagt agtttttggc gag 23
<210> 26
<211> 26
<212> DNA
<213> Artificial Sequence
<400> 26
cgtctcgacc cctatacgaa tctacg 26
<210> 27
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 27
cgggttagtt cgttcgaacg gttg 24