KR20190113860A

KR20190113860A - 신규한 루시퍼라제 및 이를 이용하는 방법

Info

Publication number: KR20190113860A
Application number: KR1020197025169A
Authority: KR
Inventors: 일리야 빅토로비치 얌폴스키
Original assignee: 오브체스트보 에스 오그라니체노이 오트벳스트벤노스티유 ＂플랜타＂
Priority date: 2017-01-30
Filing date: 2017-12-06
Publication date: 2019-10-08
Also published as: EP3575395A4; JP2020505028A; CN110234758A; MX2019009045A; RU2674894C2; US20210079363A1; US11913033B2; WO2018139956A1; BR112019015682A8; RU2017102986A; JP7298907B2; BR112019015682A2; EP3575395A1; KR102594240B1; CA3051667A1; AU2017395644A1; RU2017102986A3

Abstract

본 발명은 신규한 루시퍼라제, 이의 기능성 단편, 상동체(homologous) 및 돌연변이를 암호화하는 핵산 분자, 및 상기 핵산에 의해 암호화되는 단백질에 관한 것이다. 관심 있는 핵산 분자는 균류(fungi)로부터 분리되거나 또는 유전공학적 방법에 의해 수득된다. 또한, 상기 핵산 분자를 포함하는 숙주세포, 안정한 세포주(stable cell line) 및 형질전환 유기체가 제공된다. 이에 더하여, 본 발명의 단백질에 특이적인 항체가 제공된다. 상기 단백질 및 핵산은 많은 적용분야 및 방법에 이용되고 있으며, 특히, 유기체, 세포, 세포 소기관, 또는 단백질의 표지에 이용되고 있다. 또한, 상기 단백질 및 뉴클레오티드 조성물은 다양한 조건하에서 단백질-단백질 상호작용을 검출하는 방법, 프로모터 활성을 테스트하는 방법에 이용된다. 마지막으로, 다양한 방법 및 적용분야에서 본 발명의 단백질 및 핵산을 이용하기 위한 키트가 제공된다.

Description

신규한 루시퍼라제 및 이를 이용하는 방법

본 발명은 일반적으로 생물학 및 화학 분야에 관한 것이며, 특히, 루시퍼라제에 관한 것이다.

생물 발광(Bioluminescence)은 빛을 생성 및 방출하는 생물학적 유기체(biological organism) 또는 생체분자의 능력을 의미한다. 생물 발광을 생성하는 능력은 루시퍼라제(luciferase) 또는 광단백질(photoprotein)과 같은 특정한 단백질의 존재에 의해 결정된다. 루시퍼라제는 저분자 화합물(low molecular weight compound), 즉, 루시페린(luciferin)의 산화를 촉매하고(catalyzing), 이들을 옥시루시페린(oxyluciferin)으로 전환시키는 효소이다. 산화는 빛의 방출 및 옥시루시페린의 방출을 동반한다.

또한, 광단백질은 루시페린의 산화를 촉매하나, 이 경우에, 루시페린은 보결분자단(prosthetic group)으로 작용해서 안정한 광단백질 복합체를 형성한다. 광단백질에 의해 생성된 빛의 양은 이의 농도에 거의 비례하는 반면, 루시퍼라제의 경우에는 효소의 농도와 루시페린의 농도 모두에 좌우된다. 많은 경우에서, 광단백질에 의해 촉매되는 생물발광 반응은 매질 중 금속 이온의 방출에 응하여 활성화된다. 예를 들어, 에쿼린 광단백질(aequorin photoprotein)은 빛의 짧은 섬광(short flash)의 방출을 야기하는 칼슘 이온의 방출에 응하여, 루시페린[코엘렌테라진(coelenterazine)]의 산화를 촉매한다.

루시퍼라제는 생물의약품 및 생명공학의 많은 적용분야에서 리포터 유전자로 이용된다. 특히, 이들은 진단법, 매질 중 미생물 및 독성 제제(toxic agent)를 검출하는 방법에 이용되고, 또한, 이들은 다양한 물질 농도의 검출, 신호전달 연쇄반응(signalling cascade)의 활성의 검출 등에 이용된다 [Scott et al., Annu Rev Anal Chem, 2011, 4: 297-319; Badr and Tannous, Trends Biotechnol. 2011, 29: 624-33; Andreu et al., FEMS Microbiol Rev. 2011, 35: 360-94]. 루시퍼라제를 응용하는 많은 방법들이 검토되어 왔다 [Kaskova et al., Chem Soc Rev., 2016, 45: 6048-6077; Scott et al., Annu Rev Anal Chem, 2011, 4: 297-319; Widder and Falls, IEEE Journal of Selected Topics in Quantum Electronics, 2014, 20: 232-241].

현재, 몇몇 유형의 생물 발광 시스템이 공지되어 있다. 다양한 유기체가 40회가 넘는 진화의 과정에서 이들을 독립적으로 발달시켰다는 것이 밝혀졌다 [Herring, Journal of Bioluminescence and Chemiluminescence, 1987, 1: 147-63; Haddock et al., Annual Review of Marine Science, 2010; 2: 443-93].

D-루시페린의 산화를 촉매하는, 포티누스 피랄리스 ( Photinus pyralis ) (북미 반딧불이)로부터의 루시퍼라제가 기술되어 있다 [de Wet et al., Proc. Natl. Acad. Sci. USA, 1985, 82: 7870-3; de Wet et al., Proc. Natl. Acad. Sci. USA, 1987, 7: 725-37]. D-루시페린의 산화는 560 nm에서 방출 최대(emission maximum)를 갖는 연두색 빛의 방출을 동반한다. 동일한 D-루시페린이 다른 곤충 루시퍼라제에 의해 산화되는데, 오늘부로, 딱정벌레과(Phengodidae), 방아벌레과(Elateridae) 및 반딧불이과(Lampyridae)의 다양한 곤충 종으로부터의 30종이 넘는 효소들 - 536 내지 630 nm 범위에서 방출 최대를 갖는 빛을 방출하는 - 이 클로닝되었다. 또한, 곤충 루시퍼라제의 돌연변이형이 기술되었고, 합성 D-루시페린 유사체가 생산되었는데, 이는 상이한 특성을 지닌 루시페린-루시퍼라제 페어(pair)의 수득을 가능하게 한다 [Thorne et al., Chem Biol., 2010, 17: 646-57]. 매우 다양한 유사체에도 불구하고, 반응의 높은 양자 효율 (0.88+-0.25 [Seliger and McElroy, Arch Biochem Biophys, 1960, 88: 136-141])로 인해, 여전히 D-루시페린이 시험관내 생물발광에 대한 가장 통상적인 기질이다. 이 시스템의 이용에 있어서, 중대한 어려움은 포티누스 피랄리스로부터의 루시퍼라제의 상대적으로 큰 분자량(61 kDa)이다. 이 사실은 이의 증가된 게놈의 낮은 안정성으로 인해, 이 시스템을 몇몇 키메라 단백질(예를 들어, 바이러스의 연구를 위한)의 고안에 부적합하도록 만든다 [Tran et al., J Virol, 2013, 87: 13321-13329; Tran et al., Viruses, 2015, 7: 5319-5327]. 다른 어려움은 광학적으로 순수한 (enantiomerically pure) 형태의 D-루시페린의 수득의 필요성인데, 그 이유는 이의 이성질체인 L-루시페린이 반응의 강력한 경쟁적 저해제이기 때문이다 [Lembert, Biochem J, 1996, 317: 273-277]. 포티누스 피랄리스로부터의 루시퍼라제가 분비되지 않는다는 사실도 생체 내 생물 발광 신호의 정량화에 대한 추가의 한계점에 처하게 한다.

또한, 코엘렌테라진의 산화를 촉매하는 큰 그룹의 루시퍼라제 및 광단백질이 기술되어 있다. 예를 들어, 레닐라 ( Renilla ), 가우시아 ( Gaussia ) 및 메트리디아 롱가(Metridia longa )에서의 코엘렌테라진-의존성 생물 발광 시스템이 기술되어 있고 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006, 470 p.], 광범위하게 사용되고 있다. 코엘렌테라진-의존성 루시퍼라제 및 광단백질의 돌연변이형 및 코엘렌테라진의 합성 유사체가 또한 수득되었다 [Kaskova et al., Chem Soc Rev., 2016, 45: 6048-6077]. 코엘렌테라진 시스템의 복수의 이점 - 즉, 분비될 수 있는 능력, 작은 크기 및 이용할 수 있는 루시퍼라제가 매우 다양함 - 에도 불구하고, 이의 적용에 대한 주요 한계점은 청색 영역(blue region)에서의 생물 발광 방출 최대의 위치에 주로 관련되어 있는데, 결과적으로, 청색광은 관심 있는 조직에 의해 생체 내에서 대부분 흡수된다. 게다가, 생물 발광 기질 자체가 비-효소적 산화 동안에 주변의 산소에 의해 빛을 방출할 수 있는데 [조직에서, 초과산화물 음이온(superoxide anion) 및 퍼옥시니트리트 이온(peroxynitrite ion)의 존재는 이 과정을 강화시킴], 이는 측정된 생물 발광 신호에서 노이즈를 야기한다.

해양 세균(marine bacteria)에 관한 생물 발광 시스템의 다른 예시가 기술되어 있다. 이 시스템은 다른 생물 발광 시스템과 현저히 상이하다. 세균 루시페린 [미리스틱 알데히드(myristic aldehyde)]은 반응 동안에 산화되나, 생물 발광 방출체(emitter)는 아니다 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006? 470 p.]. 루시페린 외에, 발광 반응(luminescent reaction)의 주요 구성요소는 니코틴아미드 아데닌 디뉴클레오티드(nicotinamide adenine dinucleotide, NADH)와 플라빈 모노뉴클레오티드(flavin mononucleotide, FMN-H₂)이며, 이들의 산화된 유사체가 진정한 광원(true light source)으로 작용한다. 해양 세균의 생물 발광 시스템은 원핵생물 발현 시스템에만 적용되기 때문에, 이들은 사용이 한정되어 있다.

고 반응성(highly reactive) 루시페린과 매우 안정한 루시퍼라제를 특징으로 하는, 패충류(ostracod) 사이프리디나(Cypridina)의 생물 발광 시스템이 공지되어 있다 [Shimomura et al., Science, 1969, 164: 1299-300]. 이 생물 발광 시스템의 주요 불리한 점 중 하나는 공기 중에서, 특히 불순물이 존재하는 경우에, 사이프리디나 루시페린의 극도로 낮은 안정성이다. 루시페린의 생물 발광 최대는 448-463 nm의 범위 내에 있다(용액의 이온 강도에 따라). 이 사실은 이 시스템이 심부 조직(deep tissue)에서 변형된 형태의 생체 내 적용에 부적합하도록 만든다.

와편모충류(dinoflagellate) 및 난바다곤쟁이류(euphausiids)의 생물 발광 시스템이 또한 공지되어 있다. 오늘부로, 이 그룹의 세 종의 루시퍼라제를 코딩하는(coding) 유전자가 클로닝되어 있다 [O. Shimomura, Bioluminescence: Chemical Principles and Methods, World Scientific Publishing Co. Pte. Ltd, Singapore, 2006]. 이들 시스템의 중대한 불리한 점은 이들에 대한 지식이 부족한 것인데, 전체 루시퍼라제 서열이 아직 확인되지 않았고, 이 시스템의 적용의 범위가 결정되지 않았다. 오늘부로, 와편모충류 및 난바다곤쟁이류의 생물 발광 메커니즘과 관련된 지식은 단편적이다.

오늘날 이용되고 있는 복수의 생물 발광 시스템에도 불구하고, 새로운 특성을 지니는, 더 많은 루시페린-루시퍼라제 페어에 대한 필요성이 여전히 존재한다. 특히, 수-가용성 세포-투과성 루시페린을 산화시키는 것이 가능한 ATP- 및 NAD(P)H-비의존성 루시퍼라제는 이로울 수 있다.

이 점에 있어서, 균류 루시퍼라제(fungal luciferase)는 대단한 관심사이다. 균류 생물 발광은 공지되어 있다. 더욱이, 아리스토텔레스의 논문(Aristotle's tractates)에서도 언급되었다. 그러나, 균류 생물 발광 시스템은 여전히 잘 알려져 있지 않다. 1959년에, Airth와 McElroy는 균류 생물 발광 시스템이 적어도 하나의 열-민감성 구성요소, 즉, 루시퍼라제와 열-비민감성 (heat-insensitive) 구성요소, 즉, 루시페린과 NAD(P)H를 포함한다는 것을 제시했다 [Airth and McElroy, Journal of Bacteriology, 1959, 77: 249-50]. 2015년에, Purtov 등은 균류 루시페린을 검출했는데, 이는 막-투과성 분자인, 3-히드록시히스피딘 (3-hydroxyhispidin)이었다 [Purtov et al., Angewandte Chemie, 2015, 54: 8124-28]. 그러나, 클로닝된 균류 루시퍼라제는 없었다.

본 발명은 신규한 루시퍼라제와 이의 기능성 돌연변이를 암호화하는 분리된 핵산 분자를 제공한다. 상기 루시퍼라제는 3-히드록시히스피딘(3-hydroxyhispidin)을 산화시켜서 빛의 방출을 야기한다. 상기 루시퍼라제는 ATP와 NAD(P)H에 대해 비의존성이다. 바람직한 양태에서, 상기 핵산은 균류로부터 분리되거나 또는 유전공학적 방법을 이용하여 수득된다.

일부 양태에서, 본 발명의 핵산은 서열번호 02, 04, 06, 08, 10, 12, 14, 16 또는 18로 이루어진 군으로부터 선택된 루시퍼라제를 암호화한다. 뉴클레오티드 서열의 예시는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17에 나타난다.

일부 양태에서, 본 발명의 핵산은 서열번호 35에 나타낸 특정한 일치 아미노산 서열을 포함하는 루시퍼라제를 암호화한다.

일부 양태에서, 본 발명의 핵산은 자연적인 루시퍼라제에 비해서 C-말단 및/또는 N-말단이 짧은 루시퍼라제의 기능성 단편을 암호화한다.

일부 양태에서, 본 발명의 핵산은 루시퍼라제를 암호화하며, 이의 아미노산 서열은 서열번호 02, 04, 06, 08, 10, 12, 14, 16 또는 18로 이루어진 군으로부터 선택된 루시퍼라제와 실질적으로 동일하다. 일부 양태에서, 본 발명의 핵산은 루시퍼라제의 기능성 단편을 암호화하며, 이의 아미노산 서열은 서열번호: 20, 22, 24, 26, 28, 30, 32 또는 34로 이루어진 군으로부터 선택된 기능성 단편과 실질적으로 동일하다.

또한, 유전적 암호의 축퇴(degeneracy) 또는 이들과의 혼성화로 인해, 제공된 뉴클레오티드 서열과 상이한 핵산 분자는 본 발명의 범위 내에 있다.

다른 양태에서 본 발명의 핵산을 포함하는 벡터가 또한 제공된다. 이에 더하여, 본 발명은 본 발명의 핵산과 선택된 숙주세포에서의 핵산의 발현에 필요한 조절 인자를 포함하는 발현 카세트를 제공한다. 이에 더하여, 본 발명의 핵산, 벡터 또는 발현 카세트를 포함하는 세포, 안정한 세포주, 형질전환 유기체 (예를 들어, 식물, 동물, 균류, 미생물)가 제공된다.

다른 양태에서, 상기 언급된 핵산에 의해 암호화되는 본 발명의 기능성 루시퍼라제가 제공된다.

또한, 본 발명의 핵산을 포함하는 핵산 또는 벡터 또는 발현 카세트를 포함하는 키트가 제공된다.

또한, 본 발명의 단백질에 특이적으로 결합하는 항체 또는 이의 단편이 제공된다.

또한, 본 발명의 핵산 및 단백질을 이용하여, 세포, 세포 구조체, 및 생체분자를 표지하는 방법이 제공된다.

기술적 결과는 생물발광 시스템을 이용하는 분야에서의 기술적인 수단의 확장을 수반한다. 이는 빛의 방출을 동반하는 3-히드록시히스피딘 산화를 촉매할 수 있는 새로운 그룹의 효소의 아미노산과 뉴클레오티드 서열을 확인함으로써 달성된다.

도 1은 네오노토파누스 남비(Neonothopanus nambi)로부터의 루시퍼라제가 (1) 자연적 시스템 및 (2) 이종 시스템에서 발현되는 경우에, 이의 생물 발광 스펙트럼을 나타낸다.
도 2 및 도 3은 비-형질전환 대조 세포(9);와 네오노토파누스 남비 (1), 뽕나무 버섯 (2) 미세나 시트리컬러 (3), 잣뽕나무 버섯 (4), 받침애주름 버섯 (5), 천마 버섯 (6), 부채 버섯 (7), 옴팔로투스 올레아리우스 (8)로부터의 루시퍼라제를 발현하는, HeLa Kyoto 세포 (도 2) 및 HEK293T 세포 (도 3);에 의한 시간에 따른 생물 발광 강도의 변화를 나타낸다.
도 4는 his-태그(his-tag)를 표적으로 하는 항체와 겨자무 과산화효소(horseradish peroxidase)와 컨쥬게이팅된(conjugating) 항체를 이용한 웨스턴 블랏의 사진을 나타낸다. 1번 레인: 네오노토파누스 남비로부터의 비-his-태그된(non-his-tagged) 루시퍼라제를 발현하는 세포의 후-핵 상청액(post-nuclear supernatant). 2번 레인: 네오노토파누스 남비로부터의 his-태그된 루시퍼라제를 발현하는 세포의 후-핵 상청액. 3번 레인: 140000 g에서의 원심분리에 의해 수득된 상청액. 4번 레인: 140000 g에서의 원심분리에 의해 수득된 펠렛.
도 5는 본 발명의 루시퍼라제의 아미노산 서열의 다중 정렬을 나타낸다. N-말단 막 관통 도메인(N-terminal transmembrane domain)에 밑줄이 표기되어 있다. 공통 서열은 맨 위에 나타냈다.
도 6은 코마시 블루-염색된 농도 구배 폴리아크릴아미드 겔(gradient polyacrylamide gel) (10-25%)의 사진을 나타낸다. IPTG 유도(induction)전의 대장균 용해물 (1번 레인); 실온에서 밤새 발현시킨 후의 대장균 용해물 (2번 레인); 세포 용해 및 35000 g에서의 원심분리 후의 상청액 (3번 레인); 대장균 봉입체(E. coli inclusion body)로부터의 추출물 (4번 레인).
도 7은 pH에 대한 네오노토파누스 남비로부터의 재조합 루시퍼라제의 생물 발광 강도의 의존성을 나타낸다.
도 8은 적색 투과 채널 (상단, mKate2) 및 녹색 투과 채널(하단, 루시퍼라제)에서 촬영된, 현미경 사진에 중첩된 (superimposed) 투과현미경 사진을 나타낸다.
도 9는 네오노토파누스 남비로부터의 루시퍼라제 (마우스의 등의 좌측 반부에 이식됨) 및 포티누스 피랄리스 루시퍼라제(우측 반부에 이식됨)를 이용한 살아있는 마우스에서의 종양 세포의 표지를 나타낸다. 마우스 사진과 이식된 종양으로부터 비롯된, 기록된 광신호(light signal)의 중첩(superimposition)이 나타난다.
도 10은 네오노토파누스 남비로부터의 루시퍼라제의 도움으로, 신경관 형성(neurulation)중인 (16-17 단계) 아프리카 발톱 개구리( Xenopus laevis ) 배아의 신경계의 표지를 나타낸다. 루시퍼라제 생물 발광이 나타난다.

본 발명은 신규한 루시퍼라제, 이의 기능성 단편, 상동체 및 돌연변이를 암호화하는 핵산 분자, 및 상기 핵산에 의해 암호화되는 단백질에 관한 것이다. 관심 있는 핵산 분자는 균류로부터 분리되거나 또는 유전적으로 조작된다. 또한, 이들 핵산 분자를 포함하는 숙주세포, 안정한 세포주 및 형질전환 유기체(transgenic organism)가 제공된다. 이에 더하여, 본 발명의 단백질에 특이적인 항체가 제공된다.

상기 단백질 및 뉴클레오티드 조성물은 많은 적용분야 및 방법에 이용되며, 특히, 유기체, 세포, 세포 소기관 또는 단백질의 표지에 이용된다. 또한, 상기 단백질 및 뉴클레오티드 조성물은 다양한 조건하에서 단백질-단백질 상호작용의 검출방법 및 프로모터 활성의 테스트에 이용된다. 마지막으로, 이러한 방법 및 적용을 위한 키트가 제공된다.

정의

본 발명의 대상에 대한 다양한 용어들이 상기에서, 및 상세한 설명과 청구범위에서 이용된다.

본 명세서에서 이용된, 용어 "루시퍼라제(luciferase)"는 루시페린을 산화시킬 수 있는 단백질을 의미하며, 여기서 산화반응은 빛의 방출 (발광)을 동반하며, 산화된 루시페린이 방출된다.

본원에 이용된, 용어 "인간화- "는 포유동물 세포에서의 단백질의 발현에 대해 코돈을 최적화시키기 위해, 핵산 서열에 만들어진 변화를 의미한다 (Yang et al., 1996, Nucleic Acids Research 24:4592-4593).

본원에 이용된, 용어 "분리된- "은 분자 또는 세포가 자연적인 조건하에 존재하는 환경과 상이한, 환경에 처한 분자 또는 세포를 의미한다.

본원에 이용된, 용어 "돌연변이" 또는 "유도체"는 하나 이상의 아미노산이 본 발명의 단백질의 N-말단에서 및/또는 C-말단에서 및/또는 자연적인 아미노산 서열 내에서 첨가되고/되거나 치환되고/되거나 결실되고/되거나 삽입되는, 본 발명의 단백질을 의미한다. 본원에서 이용된, 용어 "돌연변이"는 돌연변이 단백질을 암호화하는 핵산 분자를 의미한다. 또한, 본원에서, 용어 "돌연변이"는 단백질 또는 핵산보다 더 짧거나 더 긴, 임의의 변이체를 의미한다.

용어 "상동성"은 뉴클레오티드 또는 아미노산 서열과, 다른 뉴클레오티드 또는 아미노산 서열의 상호연결(interconnection)을 기술하는 데 이용되는데, 이 상호연결은 이러한 비교된 서열 사이의 일치도(degree of identity) 및/또는 유사도(degree of similarity)에 의해 결정된다.

본원에 이용된, 아미노산 또는 뉴클레오티드 서열이 비교 대상으로 선택된 영역 내의 명시된 서열에 대해서 적어도 40% 동일하다면, 아미노산 또는 뉴클레오티드 서열은 참조 서열에 대해서 "실질적으로 유사"하거나 또는 "실질적으로 동일"하다. 따라서, 실질적으로 유사한 서열은, 예를 들어, 적어도 45% 동일한, 또는 적어도 50% 동일한, 또는 적어도 55% 동일한, 또는 적어도 60% 동일한, 또는 적어도 62% 동일한, 또는 적어도 65% 동일한, 또는 적어도 70% 동일한, 또는 적어도 75% 동일한, 예를 들어, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한 (예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 98% 또는 99% 동일한) 서열이다. 서로 동일한 두 서열은 또한 실질적으로 유사하다. 본 발명의 목적으로, 비교되는 루시퍼라제 서열의 길이는 단백질 또는 기능성 단편의 아미노산 서열의 적어도 100개의 아미노산, 바람직하게는 적어도 200개의 아미노산, 예를 들어, 200-230개의 아미노산 또는 전체 길이이다. 핵산에 대해서는, 비교되는 서열의 길이가 통상적으로 적어도 300개의 뉴클레오티드, 바람직하게는 적어도 600개의 뉴클레오티드이다.

서열의 일치성은 참조 서열에 기초하여 결정된다. 서열 분석용 알고리즘이 당해 분야에 공지되어 있으며, 예를 들어, BLAST가 Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990)에 기술되어 있다. 본 발명의 목적으로, 표준 파라미터와 함께 갭 정렬(gapped alignment)을 이용한, 국립 생물공학 정보센터 (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/blast)가 제공하는 BLAST 소프트웨어 패키지에 의한 뉴클레오티드 및 아미노산 서열의 비교는 뉴클레오티드 서열과 아미노산 서열 사이의 일치도와 유사도의 결정에 이용될 수 있다.

본원에 이용된, 용어 "기능성- "은 뉴클레오티드 또는 아미노산 서열이 명시된 테스트 또는 과업에 대해서 기능할 수 있다는 것을 의미한다. 루시퍼라제에 대해서 이용된 용어 "기능성- "은 단백질이 발광을 동반하는, 루시페린 산화 반응을 촉매할 수 있다는 것을 의미한다.

본원에 이용된, "생물화학적 특성"은 단백질 폴딩(folding)과 성숙(maturation) 속도, 반감기, 촉매작용 속도, pH 및 온도 안정성, 및 다른 유사한 특성을 의미한다.

본원에 이용된, "스펙트럼 특성"은 스펙트럼, 양자 효율(quantum efficiency) 및 발광 강도, 및 다른 유사한 특성들을 의미한다.

키메라 단백질(chimeric protein)에 대해서 이용된, 용어 "작동 가능하게 연결된- " 또는 유사한 용어는 서로 물리적으로 및 기능적으로 연결된 폴리펩티드 서열을 의미한다. 가장 바람직한 양태에서, 키메라 분자의 폴리펩티드 구성요소의 기능은 분리된 폴리펩티드 구성요소의 기능적 특성에 비해서 변화하지 않는다. 예를 들어, 본 발명의 루시퍼라제는 관심 있는 융합 파트너(fusion partner)에 융합될 수 있다. 이 경우에, 키메라 단백질은 루시퍼라제 특성을 유지하고, 관심 있는 폴리펩티드는 이의 본래의 생물학적 특성을 유지한다. 일부 양태에서, 루시퍼라제 및 융합 파트너 모두의 활성이 분리된 단백질의 활성에 비해서 감소될 수 있다. 또한, 이러한 키메라 단백질은 본 발명의 범위 내에서 적용된다. 핵산에 대해서 이용된, 용어 "작동 가능하게 연결된- " 또는 유사한 용어는 핵산이 이의 접합(junction)이 리딩 프레임과 종결 코돈의 "고장"을 포함하지 않는 방식으로 공유결합되는 것을 의미한다. 통상의 기술자는 "작동 가능하게 연결된" 구성요소 (단백질, 폴리펩티드, 연결 서열, 단백질 도메인 등)를 포함하는, 키메라 단백질을 암호화하는 뉴클레오티드 서열이 상기 구성요소를 암호화하는 단편 - 이 단편은 뉴클레오티드 서열의 전사 및 번역 동안에, 전체 길이의 키메라 단백질이 생성되는 방식으로 공유결합된다 - 으로 이루어졌다는 것을 인식할 것이다.

본원에 이용된, 용어 "특이적으로 혼성화하다"는 두 개의 단일-가닥 핵산 분자 또는 충분히 상보적인 서열 사이의 회합(association)을 의미하는데, 당해 분야에서 통상적으로 이용되는 미리 결정된 조건하에서, 이러한 혼성화를 허용한다 (용어 "실질적으로 상보적인- "이 때때로 이용된다).

폴리펩티드를 "암호화하는" 뉴클레오티드 서열에 대한 참조는 이러한 폴리펩티드가 mRNA 전사 및 번역 동안에 뉴클레오티드 서열로부터 생성된다는 것을 의미한다. 이를 위해, mRNA와 동일하고 서열 리스트에 통상적으로 이용되는 코딩 가닥(coding strand)과 전사 동안에 주형으로 이용되는 상보적 가닥 모두가 명시될 수 있다. 통상의 기술자는 이 용어가 일정한(uniform) 아미노산 서열을 암호화하는 임의의 축퇴 뉴클레오티드 서열(degenerate nucleotide sequence)을 또한 포함한다는 것을 인식할 것이다. 폴리펩티드를 암호화하는 뉴클레오티드 서열은 인트론을 포함하는 서열을 포함한다.

핵산 분자

본 발명은 루시퍼라제 및 이의 기능성 단편(예를 들어, 절단되거나 또는 연장된 루시퍼라제의 변이체)을 암호화하는 핵산 분자를 제공한다. 바람직한 양태에서, 본 발명의 핵산은 루시퍼라제를 암호화하고, 이의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 및 18로 이루어진 군으로부터 선택된다. 또한, 상기 언급된 루시퍼라제와 실질적으로 유사한 상기 루시퍼라제의 상동체 및 돌연변이를 암호화하는 핵산 분자는 본 발명의 범위 내에 있다. 이러한 특정한 유형의 관심 있는 핵산 분자 각각은 아래의 실험 부분에서 더욱 상세히 개시된다.

본원에 이용된, 핵산 분자는 게놈 DNA 또는 cDNA를 비롯한 DNA 분자, 또는 mRNA 분자를 비롯한 RNA 분자이다. 일부 양태에서, 본 발명의 핵산 분자는 본 발명의 루시퍼라제를 암호화하고, 적합한 조건하에서 [예를 들어, 생리적 세포 내 조건(physiological intracellular condition)하에서], 이종 발현 시스템(heterologous expression system)에서, 루시퍼라제로 발현되는 것이 가능한 오픈 리딩 프레임을 갖는 DNA 분자 (또는 cDNA)이다.

일부 양태에서, 루시퍼라제를 암호화하는 본 발명의 핵산 분자는 균류로부터 분리된다. 관심 있는 특정한 핵산 분자는 네오노토파누스 남비 (서열번호: 2), 천 마버섯 ( Armillaria gallica ) (서열번호: 4), 뽕나무 버섯 ( Armillaria mellea ) (서열번호: 6), 잣뽕나무 버섯 ( Armillaria ostoyae ) (서열번호: 8), 받침애주름 버섯 ( Mycena chlorophos ) (서열번호: 10), 미세나 시트리컬러 ( Mycena citricolor) (서열번호: 12), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) (서열번호: 14), 및 부채 버섯 ( Panellus stipticus ) (서열번호: 16 및 18)으로부터의 루시퍼라제를 암호화하는 핵산을 포함한다. 이러한 핵산의 뉴클레오티드 서열은 서열번호 1, 3, 5, 7, 9, 11, 13, 15 및 17에 나타냈다.

일부 양태에서, 본 발명의 핵산 분자는 유전적으로 조작된다. 핵산을 수득하는 방법이 당해 분야에 공지되어 있다. 예를 들어, 아미노산 서열 정보(예를 들어, 서열번호 2-18) 또는 뉴클레오티드 서열 정보 (예를 들어, 서열번호: 3, 5, 7, 9, 11, 13, 15 또는 17)의 가용성(availability)은 올리고뉴클레오티드 합성에 의한, 본 발명의 분리된 핵산 분자의 제조를 가능하게 한다. 아미노산 서열에 대한 정보가 입수 가능하다면, 유전적 코드의 축퇴(degeneracy)로 인해 서로 상이한 몇몇 핵산들이 합성될 수 있다. 목적하는 숙주에 대한 코돈 변이체를 선별하는 방법은 당해 분야에 공지되어 있다.

합성 올리고뉴클레오티드는 포스포라미디트법 (phosphoramidite method)을 이용하여 제조될 수 있다. 수득된 제작물을 고성능 액체 크로마토그래피 (high-performance liquid chromatography, HPLC) 또는 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2^nd Ed., (1989) Cold Spring Harbor Press, Cold Spring Harbor, NY에 기술된 다른 방법을 비롯한, 당해 분야에 공지된 방법에 의해, 예를 들어, 미국 보건복지부 (HHS), 재조합 DNA 연구에 대한 국립보건원 (National Institute of Health, NIH) 가이드라인에 기술된 지시에 따라서 정제할 수 있다. 본 발명의 긴 이중-가닥 DNA 분자는 다음과 같이 합성될 수 있다: 인접한 단편과 부착(cohesion)이 가능한 적합한 말단을 포함하는, 필요한 상보성(necessary complementarity)을 갖는 몇몇 더 작은 단편들이 합성될 수 있다. 인접한 단편은 재조합에 기초한 방법에서 DNA 리가아제에 의해, 또는 PCR 동안에 결합될 수 있다.

또한, 본 발명의 루시퍼라제를 암호화하는 핵산 분자는 바시디오마이코다 문(Basidiomycota division), 바람직하게는 담자균 강(Basidiomycetes class), 특히, 주름버섯 목(Agaricales order)에 속하는 균류로부터의 생물학적 공급원(biological source)으로부터 클로닝될 수 있다.

본 발명은 또한 본 발명의 단백질을 암호화하는 핵산과 상동성인, 실질적으로 유사한, 동일한 또는, 이로부터 유래된 핵산을 포함할 수 있다.

본 발명의 핵산은 자연적인 조건하에서 이들이 존재하는 환경과 상이한 환경에 처하는데, 예를 들어, 이들은 분리되거나, 이들의 수가 증가되거나, 이들이 시험관내 시스템, 또는 자연적인 조건하에서 이들이 존재하는 세포 또는 유기체 이외의 세포 또는 유기체에 존재하거나 또는 이에서 발현된다.

매우 유사한 뉴클레오티드 서열 간의 뉴클레오티드 서열의 변경 또는 차이는 보통의 복제(replication) 또는 중복(duplication) 동안에 발생하는 뉴클레오티드 서열 치환을 나타낼 수 있다. 다른 치환은 구체적으로 추산될 수 있고, 특정 아미노산의 코돈 또는 조절 영역(regulatory region)의 뉴클레오티드 서열을 변경시키는 것과 같은, 특정한 목적으로 서열로 삽입될 수 있다. 이러한 특정한 치환이 다양한 돌연변이유발 기술을 이용해서 시험관내에서 만들어질 수 있거나, 또는 이러한 변화를 유도하거나 또는 선별하는 특정한 번식 조건하에서, 숙주 유기체에서 수득될 수 있다. 서열의 이러한 특정하게 제조된 변이체를 본래의 서열의 "돌연변이" 또는 "유도체"라고 할 수 있다.

본 발명은 루시퍼라제 - 이의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18에 나타냄 - 와 실질적으로 유사한 루시퍼라제를 암호화하는 핵산을 또한 제공한다. 이러한 폴리펩티드 또는 이의 단편을 암호화하는 핵산은 복수의 공지된 방법 중 임의의 방법에 의해 수득될 수 있다. 본 발명의 cDNA 단편은 매우 엄격한 조건하에서 표적 유기체로부터의 cDNA 라이브러리에 대한 혼성화 탐침으로 이용될 수 있다. 탐침은 큰 단편 또는 더 짧은 축퇴 프라이머(degenerate primer)일 수 있다. 유사한 서열을 갖는 핵산은 매우 엄격한 조건하에서, 예를 들어, 50°C 이상의 온도 (예를 들어, 60°C 또는 65°C)에서, 50% 포름아미드, 0.1 Х SSC (15 mM 소듐 클로라이드 /1.5 mM 소듐 시트레이트), 0.1% SDS의 조건하에서, 혼성화에 의해 검출될 수 있다. 참조 서열과 실질적으로 동일한 영역, 예를 들어, 대립유전자 변이체(allelic variant), 유전적으로 변형된 핵산 변이체 등을 갖는 핵산은 매우 엄격한 혼성화 조건하에서 참조 서열에 결합한다. 이러한 뉴클레오티드 서열은 탐침, 특히, 참조 DNA 서열에 상보적인 표지된 탐침을 이용하여 분리될 수 있다.

이러한 폴리펩티드 또는 이의 단편을 암호화하는 핵산은 게놈 시퀀싱 또는 전사체 시퀀싱(transcriptomic sequencing) 동안에 또한 검출될 수 있다. 특히, 실질적으로 유사한 루시퍼라제는 유기체 시퀀싱 동안에, 예를 들어, 다양한 종, 대부분 바시디오마이코다 문, 예를 들어, 담자균 강, 특히 주름버섯 목의 균류의 시퀀싱 동안에 획득된 데이터에 기초하여 예측된 가설 단백질(hypothetical protein)의 서열 중에서 식별될 수 있다.

본 발명은 서열번호 35에 나타낸 서열과 실질적으로 유사한 특정한 일치 아미노산 서열을 갖는 루시퍼라제를 암호화하는 핵산을 또한 제공한다. 여기서, 용어 "공통 서열"은 본 발명의 상이한 루시퍼라제에 규칙적으로 존재하는 평균적인 아미노산 서열(개개의 아미노산에 소규모 변이가 있는)을 의미한다.

돌연변이 또는 유도된 핵산은 상기-기술된 핵산으로부터 선택된, 주형 핵산의 서열에 하나 이상의 뉴클레오티드를 변형, 결실, 또는 첨가함으로써, 또는 이의 조합에 의해, 이 주형 핵산으로부터 수득하여 주형 핵산의 변이체를 생성할 수 있다. 변형, 첨가 또는 결실은 당해 분야에 공지된 임의의 방법을 이용하여 수행될 수 있는데 (예를 들어, Gustin et al., Biotechniques (1993) 14: 22; Barany, Gene (1985) 37: 111-123; and Colicelli et al., Mol. Gen. Genet. (1985) 199:537-539, Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108을 참고), 에러-유발 PCR(error-prone PCR), 셔플링(shuffling), 올리고뉴클레오티드-지정 돌연변이 유발(oligonucleotide-directed mutagenesis), 어셈블리 PCR (assembly PCR), 유성 PCR 돌연변이 유발(sexual PCR mutagenesis), 생체 내 돌연변이 유발(in vivo mutagenesis), 카세트 돌연변이 유발(cassette mutagenesis), 반복 앙상블 돌연변이 유발(recursive ensemble mutagenesis), 대수적 앙상블 돌연변이 유발(exponential ensemble mutagenesis), 부위-특이적 돌연변이 유발(site-specific mutagenesis), 무작위 돌연변이 유발(random mutagenesis), 유전자 어셈블리(gene reassembly), 유전자 부위 포화 돌연변이 유발(gene site saturation mutagenesis, GSSM), 합성 라이게이션 재-어셈블리(synthetic ligation reassembly, SLR), 또는 이들의 조합을 포함한다. 변형, 첨가 및 결실은 재조합, 반복 서열 재조합, 포스포티오에이트-변형 DNA 돌연변이 유발(phosphothioate-modified DNA mutagenesis), 우라실-함유 주형 돌연변이 유발(uracil-containing template mutagenesis), 갭 듀플렉스 돌연변이 유발(gapped duplex mutagenesis), 점 미스매치 수선 돌연변이 유발(point mismatch repair mutagenesis), 수선-결핍 숙주 균주 돌연변이 유발(repair-deficient host strain mutagenesis), 화학적 돌연변이 유발, 방사성 돌연변이 유발, 결실 돌연변이 유발, 제한-선별 돌연변이 유발(restriction-selection mutagenesis), 제한-정제 돌연변이 유발(restriction-purification mutagenesis), 인공 유전자 합성(artificial gene synthesis), 앙상블 돌연변이 유발(ensemble mutagenesis), 키메라 핵산 멀티머 생성(chimeric nucleic acid multimer creation), 또는 이들의 조합을 포함하는, 방법에 의해 또한 도입될 수 있다. 일부 양태에서, 돌연변이 또는 유도된 핵산에 의해 암호화된 루시퍼라제는 야생형 루시퍼라제와 동일한 스펙트럼 또는 생화학적 특성을 갖는다. 다른 양태에서, 돌연변이 또는 유도된 핵산은 변형된 특성을 갖는 루시퍼라제를 암호화한다.

또한, 본 발명의 단백질을 암호화하는 핵산의 축퇴 변이체가 제공된다. 축퇴 핵산 변이체는 동일한 아미노산을 암호화하는 다른 코돈과의 핵산 코돈의 치환을 포함한다. 특히, 핵산의 축퇴 변이체는 생성되어 숙주세포에서의 발현을 증가시킨다. 이 양태에서, 숙주세포 유전자에서 바람직하지 않거나 또는 덜 바람직한 핵산 코돈은 상기 치환된 코돈이 동일한 아미노산을 암호화하는, 숙주세포 내 유전자의 코딩 서열에 풍부하게(abundantly) 존재하는 코돈으로 치환된다. 관심 있는 축퇴 변이체의 예시는 아래의 실험 부분에 더 상세히 기술된다.

이러한 루시퍼라제의 절단 및 연장된 변이체를 암호화하는 핵산은 또한 본 발명의 범위 내에 있다. 본원에서 이용된, 이러한 단백질 변이체는 폴리펩티드 사슬의 변경된 C-말단, N-말단, 또는 두 말단을 갖는 아미노산 서열을 포함한다.

절단된 변이체에서, 하나 이상의 (보통 최고 39개, 대개 37개 이하) 아미노산이 서열로부터 제거될 수 있거나, 또는 임의의 다른 아미노산으로 치환될 수 있다. 특히, 막 관통 도메인을 암호화하는 서열 및 루시퍼라제의 N-말단으로부터의 이전의 아미노산 서열은 완전히 또는 부분적으로 제거될 수 있다. 막 관통 도메인은 당해 분야에 공지된 방법, 예를 들어, [Krogh et al., Journal of Molecular Biology2001, 305(3):567-580] 및 [Sonnhammer et al., Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, pages 175-182, Menlo Park, CA, 1998. AAAI Press]에 기술된 알고리즘을 이용하여 식별될 수 있다. 분석을 위해, 상기 알고리즘에 기초하고, [http://www.cbs.dtu.dk/services/TMHMM/]에 기술된 소프트웨어가 이용될 수 있다. 연장된 변이체에서, 단백질의 C-말단 또는 N-말단은 추가의 아미노산을 포함할 수 있다. 기능성 단편의 아미노산 서열 및 대응하는 암호화 뉴클레오티드 서열의 예시는 서열번호 19-34에 나타냈다. 기능성 단편의 발현을 위해, 이들을 암호화하는 핵산이 적어도 조절 서열 및 전사 개시 부위를 포함하는 핵산에 작동 가능하게 연결된다. 또한, 이들 핵산은 6-his-태그-암호화 서열, 신호 펩티드 (signal peptide) 또는 기능성 단백질 도메인을 포함할 수 있다.

상기 언급된 변형들은 루시퍼라제의 스펙트럼 특성을 실질적으로 변화시키지 않으나, 세포 내 국소화(intracellular localization)를 변화시킬 수 있거나, 숙주세포에서 단백질 폴딩을 촉진시킬 수 있거나, 응집을 감소시킬 수 있거나, 또는 다른 생화학적 단백질 특성, 예를 들어, 반감기를 조절할 수 있다. 일부 양태에서, 이러한 변형은 생화학적 단백질 특성들을 변화시키지 않는다. 상기 모든 유형의 변형들 및 돌연변이들은 원칙적으로는 핵산 수준에서 수행된다.

본 발명의 핵산 분자는 전체 대상 단백질 또는 이의 부분을 암호화할 수 있다. 이중-가닥 단편 및 단일-가닥 단편은 표준 방법, 효소 제한(enzymatic restriction), PCR 증폭 등에 따라서 올리고뉴클레오티드의 화학적 합성에 의해 DNA 서열로부터 수득될 수 있다. 일반적으로, DNA 단편의 크기는 적어도 약 15개의 뉴클레오티드, 보통 적어도 약 18개의 뉴클레오티드 또는 약 25개의 뉴클레오티드일 것이고, 적어도 약 50개의 뉴클레오티드일 수 있다. 일부 양태에서, 대상 핵산 분자는 약 100, 약 200, 약 300, 약 400, 약 500, 약 600 이상의 크기를 가질 수 있다. 대상 핵산은 대상 단백질의 단편 또는 완전한 단백질을 암호화할 수 있는데, 예를 들어, 대상 핵산은 단백질의 약 25개의 아미노산, 약 50개의 아미노산, 약 75개의 아미노산, 약 100개의 아미노산, 약 125개의 아미노산, 약 150개의 아미노산, 약 200개의 아미노산, 최대, 완전한 길이의 폴리펩티드를 암호화할 수 있다.

대상 핵산은 실질적으로 순수한 형태로 분리 및 수득될 수 있다. 실질적으로 순수한 형태는 핵산이 적어도 약 50% 순수한 것, 보통은 적어도 약 90% 순수한 것, 보통은 "재조합"된 것, 즉, 이의 자연적인 숙주에서, 자연적으로 존재하는 염색체의 서열에 통상적으로 결합하지 않는, 하나 이상의 뉴클레오티드가 플랭킹(flanking)된 것을 의미한다.

아래에서 상술되는 본 발명의 단백질 또는 이의 단편을 포함하는, 융합된 단백질을 암호화하는 핵산이 또한 제공된다.

대상 핵산을 포함하는 벡터 및 다른 핵산 제작물이 또한 제공된다. 적합한 벡터는 바이러스 벡터 및 비-바이러스 벡터, 플라스미드, 코스미드, 파지 등을 포함하고, 바람직하게는 플라스미드를 포함하며, 본 발명의 핵산 서열을 적합한 숙주로 클로닝하는 것, 증폭시키는 것, 발현시키는 것, 이동시키는 것(transferring) 등에 이용된다. 적합한 벡터를 선택하는 것은 통상의 기술자에게 용이한 것이다. 제작물을 제조하기 위해, 통상적으로 부분적 또는 전체-길이의 핵산은 벡터 내 절단된 제한 효소 부위로의 DNA 리가아제 부착에 의해 벡터로 삽입된다. 대안적으로는, 목적하는 뉴클레오티드 서열이 생체 내 상동 재조합(in vivo homologous recombination)에 의해, 통상적으로는 목적하는 뉴클레오티드 서열의 플랭크(flank)위에서 벡터에 상동성 영역을 붙임으로써 삽입될 수 있다. 상동성 영역은, 예를 들어, 올리고뉴클레오티드의 라이게이션에 의해, 또는 상동성 영역 및 목적하는 뉴클레오티드서열의 부분 모두를 포함하는 프라이머를 이용하는 중합효소 연쇄반응에 의해 추가된다. 원칙적으로는, 벡터는 숙주에서 이의 복제 - 외부 염색체 인자로서 세포로 도입된 것의 결과 - 를 보장하는 복제 기점을 갖는다. 벡터는 숙주에서 핵산의 발현 및 재조합 기능성 루시퍼라제의 생성을 제공하는 조절 인자를 또한 포함할 수 있다. 발현 벡터에서, 상기 핵산은 프로모터, 인핸서(enhancer), 종결자(terminator), 작동자(operator), 억제자(repressor), 사일런서(silencer), 인슐레이터(insulator) 및 유도자(inducer)를 포함할 수 있는 조절 서열에 기능적으로 연결된다.

이용되는, 그 중에서도, 대상 루시퍼라제 또는 이에 기초한 키메라 단백질의 수득, 또는 대상 핵산 분자의 복제에 이용되는 발현 카세트 또는 시스템이 또한 제공된다. 발현 카세트는 외부 염색체 인자로 존재할 수 있거나, 또는 세포로의 상기 발현 카세트의 도입 결과로서, 세포의 게놈으로 통합될 수 있다. 발현을 위해, 본 발명의 핵산에 의해 암호화된 유전자 산물은, 예를 들어, 박테리아, 효모, 식물, 곤충, 양서류(amphibian) 또는 포유동물을 포함하는 임의의 편리한 발현 시스템에서 발현된다. 발현 카세트에서, 표적 핵산은 프로모터, 인핸서, 종결 서열, 작동자, 억제자 및 유도자를 포함할 수 있는 조절 서열에 작동 가능하게 연결된다. 목적하는 생성물을 발현시킬 수 있는 발현 카세트 또는 시스템을 제조하는 방법은 통상의 기술자에게 공지되어 있다.

본 발명의 단백질을 지속 가능하게(sustainably) 발현시키는 세포주는 당해 분야에 공지된 방법에 의해 선택될 수 있다 (예, dhfr, gpt, 네오마이신 또는 히그로마이신(hygromycin)을 비롯한 선별 마커와의 공동-형질주입은 게놈으로 통합된 유전자를 포함하는, 형질주입된 세포의 식별 및 분리를 허용한다).

상기 발현 시스템은 원핵생물 숙주 또는 진핵생물 숙주에서 이용될 수 있다. 대장균, 고초균(B. subtilis ), S. 세리비시아 (S. cerevisiae ), 곤충 세포, 또는 인간 배아세포가 아닌 고등 유기체(higher organism) 세포 - 효모, 식물 [예를 들어, 애기장대(Arabidopsis thaliana ), 니코티아나 벤타미아나 ( Nicotiana benthamiana ), 피스코미트렐라 파텐스 ( Physcomitrella patens)], 척추동물 [예를 들어, COS 7 세포, HEK 293, CHO, 제노푸스 난모세포 ( Xenopus oocyte)] 등을 비롯함 - 와 같은 숙주세포가 단백질의 생산에 이용될 수 있다.

상기 참조된 숙주세포, 또는 다른 적절한 숙주세포 또는 유기체 중 임의의 것이 본 발명의 핵산의 복제 및/또는 발현에 이용되는 경우에, 생성되는 복제된 핵산, 발현된 단백질 또는 폴리펩티드는 숙주세포 또는 유기체의 생성물로서, 본 발명의 범위 내에 있다. 생성물은 당해 분야에 공지된 적절한 수단에 의해 회수될 수 있다.

PCR, 롤링 서클 증폭(rolling circle amplification), 혼성화 스크리닝 탐침(hybridization screening probe) 등을 위한 프라이머로 유용한, 대상 핵산의 작은 DNA 단편이 또한 제공된다. 이전에 기술된 대로, 더 큰 DNA 단편은 암호화된 폴리펩티드의 생산에 유용하다. 그러나, PCR을 비롯한 기하적 증폭 반응(geometric amplification reaction)에 이용하기 위해, 작은 DNA 단편의 쌍, 즉, 프라이머가 이용된다. 프라이머 서열의 정확한 조성이 발명에 중대한 것은 아니나, 대부분의 적용에서, 당해 분야에 알려진 대로, 프라이머는 엄격한 조건하에서 대상 서열에 혼성화할 것이다. 적어도 약 50개의 뉴클레오티드, 바람직하게는 적어도 약 100개의 뉴클레오티드의 증폭 산물을 생성하고, 전체 핵산 서열까지 연장할, 프라이머의 쌍을 선택하는 것이 바람직하다. 프라이머 서열의 선택을 위한 알고리즘은 일반적으로 공지되어 있고, 상업적인 소프트웨어 패키지에서 입수 가능하다. 증폭 프라이머는 DNA의 상보적 가닥에 혼성화하고, 서로를 향해 프라이밍(priming)할 것이다.

본 발명의 핵산 분자는 생물학적 샘플에서 유전자의 발현을 확인하는 데 또한 이용될 수 있다. 게놈 DNA 또는 RNA를 비롯한 특정 뉴클레오티드 서열의 존재에 대해, 세포를 탐침하는 방식이 문헌에 잘 규명되어 있다. 간단히 말해서, DNA 또는 mRNA는 세포 샘플로부터 분리된다. mRNA는 역전사 효소(reverse transcriptase)를 이용해서 상보적 DNA 가닥을 형성한 후에, 대상 DNA 서열에 특이적인 프라이머를 이용한 중합효소 연쇄반응 증폭을 수행하는, RT-PCR에 의해 증폭될 수 있다. 대안적으로, mRNA 샘플은 겔 전기영동에 의해 분리되고, 적합한 지지체, 예, 니트로셀룰로스(nitrocellulose), 나일론(nylon) 등으로 옮긴(transferring) 다음에, 탐침으로서 대상 DNA의 단편에 탐침한다. 올리고뉴클레오티드 라이게이션 검정(oligonucleotide ligation assay), 인 시츄 혼성화(in situ hybridization), 및 솔리드 칩(solid chip) 상에 정렬된 DNA 탐침으로의 혼성화를 비롯한 다른 기법도 또한 이용될 수 있다. 대상 서열에 혼성화하는 mRNA의 검출은 샘플에서의 유전자 발현을 나타낸다.

단백질

본 발명은 루시퍼라제, 및 이의 전체-길이 단백질 및 부분 또는 단편을 포함하는 이의 상동체, 유도체 및 돌연변이를 또한 제공한다.

대상 단백질은 산소가 존재하는 경우에 루시페린의 산화를 촉매할 수 있는 루시퍼라제이다. 산화 반응은 매질 중 ATP, NAD(P)H 및 다른 대사 산물의 존재에 대해서 비의존성이다. 대상 단백질이 하기 화학식 1의 구조를 갖는 3-히드록시히스피딘 (3-hydroxyhispidin)을 산화시키기 때문에, 대상 단백질은 공지된 루시퍼라제와는 상이하다:

[화학식 1]

대상 루시퍼라제는 다른 화합물의 산화를 촉매할 수 있다. 이러한 화합물을 검출하기 위해, 분리된 루시퍼라제 및 상기 화합물은 적합한 조건하에서 결합되고, 산화 반응 동안에 방출된 빛이 검출된다. 대상 루시퍼라제에 대한 루시페린으로서 작용할 수 있는 화합물의 예시는, 예를 들어, 다음과 같다:

[화학식 2]

다음의 구조를 갖는, (E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원

;

[화학식 3]

다음의 구조를 갖는, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원

;

[화학식 4]

다음의 구조를 갖는, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원

;

[화학식 5]

다음의 구조를 갖는, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원

; 및

[화학식 6]

다음의 구조를 갖는, (E)-3,4-디히드록시-6-(2-(6-히드록시나프?렌-2-일)비닐)-2H-피란-2-원

.

본 발명의 루시퍼라제에 의한 루시페린의 산화는 검출 가능한 빛의 방출을 동반한다.

본 발명의 일부 양태에서, 반응 동안에 방출된 빛은 통상적인 방법[예를 들어, 육안 검사(visual inspection), 야간 투시(night vision), 분광 광도법(spectrophotometry), 분광 형광법(spectrofluorimetry), 영상 사진 기록(image photographic recording), 및 예를 들어, IVIS 스펙트럼 인 비보 이미징 시스템(IVIS Spectrum In Vivo Imaging System) (PerkinElmer)을 비롯한 특정한 발광 및 형광 검출 장비(special luminescence and fluorescence detection equipment) 등]을 이용하여 검출될 수 있다. 기록된 빛은 한 광자(photon)의 강도 범위(intensity range) 내에서, 예를 들어, 1 cd의 강도를 갖는 용이하게 가시적인 빛(easily visible light), 및 예를 들어, 100 cd 이상의 강도를 갖는 밝은 빛(bright light)으로 방출될 수 있다.

3-히드록시히스피딘의 산화 동안에 방출된 빛은 400 내지 700 nm의 범위 내에 속하고, 대개 450 내지 650 nm의 범위 내에 속하며, 520-590 nm에서 방출 최대를 갖는다.

대상 단백질은 50°C 이하의 온도, 대개 최고 45°C의 온도에서 활성을 유지한다. 즉, 이들은 30-42°C의 온도 범위 이내에서 활성을 유지하고, 시험관내 및 생체내 이종 발현 시스템에서 이용될 수 있다.

대상 단백질은 4 내지 10의 범위 이내에서, 대개 6.5 내지 9.5의 범위 이내에서 pH 안정성을 갖는다. 대상 단백질의 최적 pH 안정성은 7.0 내지 8.0의 범위 이내에서, 예를 들어, 7.3 내지 7.5에 속한다.

관심 있는 특정한 단백질은 네오노토파누스 남비 (서열번호: 2), 천마버섯 (Armillaria gallica ) (서열번호: 4), 뽕나무 버섯 ( Armillaria mellea ) (서열번호: 6), 잣뽕나무 버섯 ( Armillaria ostoyae ) (서열번호: 8), 받침애주름 버섯 ( Mycena chlorophos ) (서열번호: 10), 미세나 시트리컬러 ( Mycena citricolor ) (서열번호: 12), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) (서열번호: 14), 및 부채 버섯 ( Panellus stipticus ) (서열번호: 16 및 18)으로부터의 자연적인 루시퍼라제 및, 예를 들어, 서열번호 20, 22, 24, 26, 28, 30, 32, 34에 나타낸 아미노산 서열을 포함하는 이들의 재조합 및 절단 변이체를 포함하며, 이는 아래의 실험 섹션에서 더 상세히 기술된다.

상기 루시퍼라제 및 이의 기능성 단편과 실질적으로 유사한 루시퍼라제가 또한 제공된다. 많은 양태에서, 관심 있는 아미노산 서열은 서열에서 실질적으로 동일하며, 예를 들어, 적어도 40% 동일, 예를 들어, 적어도 45% 동일하거나, 또는 적어도 50% 동일하거나, 또는 적어도 55% 동일하거나, 또는 적어도 60% 동일하거나, 또는 적어도 65% 동일하거나, 또는 적어도 70% 동일하거나, 또는 적어도 75% 동일하거나, 예를 들어, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일(예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 98% 또는 99% 동일)하다. 특히, 이는 단백질 기능성 영역을 제공하는 아미노산 서열, 즉, 본 발명의 자연적인 루시퍼라제의 일부인 막 관통 도메인의 서열 후에 위치하는 단백질 서열을 의미한다.

본 발명은 또한 본 발명의 자연적인 루시퍼라제에 내재하는 특정한 공통 서열을 포함하는 루시퍼라제를 제공하며, 이 공통 서열을 서열번호 35에 나타냈다. 공통 서열은 복수의 관련된 서열에 있는 위치에서 가장 통상적으로 접하는 아미노산의 식별을 통한 본 발명의 루시퍼라제의 다중 비교(multiple comparison)에 기초하여 수득된다.

본 발명은 상기 언급된 단백질의 돌연변이를 또한 제공한다. 돌연변이는 단백질 - 이로부터, 돌연변이가 수득됨 - 의 생물학적 특성을 유지할 수 있거나, 또는 야생형 단백질의 생물학적 특성과는 상이한 생물학적 특성을 가질 수 있다. 본 발명에 따른, 용어 단백질의 "생물학적 특성"은 다양한 루시페린을 산화시키는 능력; 생체내 및/또는 시험관내 안정성 (예를 들어, 반감기)와 같은 생화학적 특성; 성숙 속도 (maturation rate); 응집 또는 올리고머화(oligomerization) 경향 및 다른 유사한 특성들을 의미하나, 이에 한정되는 것은 아니다. 돌연변이는 하나 이상의 아미노산에 대한 변경, 하나 이상의 아미노산의 결실 또는 삽입, N-말단 절단 또는 연장, C-말단 절단 또는 연장 등을 포함한다.

돌연변이는 상기 "핵산 분자" 섹션에 상술되어 있는 기법과 같은, 통상적인 분자 생물학적 기법을 이용하여 수득될 수 있다.

본 발명의 단백질은 분리된 형태이다. 즉, 주어진 단백질은 실질적으로 다른 단백질 또는 올리고당(oligosaccharide), 핵산 및 이의 단편 등을 비롯한, 다른 자연적인 생물학적 분자로부터 유리되어 있다. 이런 맥락에서, 용어 "실질적으로 유리 -"는 분리된 단백질을 함유하는 상기 조성물의 70% 미만, 보통 60% 미만, 및 대개 50% 미만이 다른 자연적인 생물학적 분자로 구성되어 있다는 것을 의미한다. 일부 양태에서, 상기 단백질은 실질적으로 순수한 형태이다. 이런 맥락에서, 용어 "실질적으로 순수한 형태"는 상기 단백질이 적어도 95% 순수하고, 보통 적어도 97% 순수하며, 대개 적어도 99% 순수하다는 것을 의미한다.

바람직한 양태에서, 합성법을 이용하여, 예를 들어, 관심 있는 단백질을 암호화하는 서열을 암호화하는 재조합 핵산을 적합한 숙주에서 발현시킴으로써 표적 단백질이 수득되는데, 이는 상기 기술된 바와 같다. 임의의 편리한 단백질 정제 절차를 이용할 수 있으며, 적합한 단백질 정제 기법이 적절한 참조 가이드에 기술되어 있다 (Guide to Protein Purification, (Deuthser ed.) (Academic Press, 1990)). 예를 들어, 용해물은 본래의 공급원으로부터 제조되어, HPLC, 배제 크로마토그래피, 겔 전기영동, 친화도 크로마토그래피 등을 이용하여 정제될 수 있다.

본 발명은, 예를 들어, 세포 내 국소화 서열(subcellular localization sequence)[예를 들어, 핵 국소화 신호(nuclear localization signal), 퍼옥시좀 국소화 신호(peroxisome localization signal), 미토콘드리아, 골지체 등], 신호 펩티드 또는 관심 있는 임의의 단백질 또는 폴리펩티드에 융합된, 본 발명의 단백질 또는 이의 기능성 단편을 포함하는 융합 단백질을 또한 수반한다. 융합 단백질은, 예를 들어, 본 발명의 루시퍼라제, 및 루시퍼라제의 N-말단 및/또는 C-말단에 인-프레임 방식으로 작동 가능하게 융합된 제2 폴리펩티드 ["융합 파트너 (Fusion partner)])를 포함할 수 있다. 융합 파트너는 이 융합 파트너(예를 들어, 에피토프 태그)에 특이적인 항체에 결합할 수 있는 폴리펩티드, 이의 항체 또는 결합 단편, 촉매 기능을 제공하거나 또는 세포 반응을 유도하는 폴리펩티드, 이의 리간드 또는 수용체 또는 모방체(mimetics) 등을 포함하나, 이에 한정되는 것은 아니다.

본 발명은 본 발명의 루시퍼라제에 특이적으로 결합하는 항체를 또한 제공한다. 적합한 항체는 당해 분야에 공지된 기법을 이용하여 수득될 수 있다. 예를 들어, 다중클론 항체는 (Harlow and Lane Antibodies: A Laboratory Manual, (1988) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York)에 기술된 기법을 이용하여 수득될 수 있다. 단일클론 항체는 (Goding Monoclonal Antibodies: Principles and Practice: Production and Application of Monoclonal Antibodies in Cell Biology, Biochemistry and Immunology; 3rd edition, (1996) Academic Press)에 기술된 대로 수득될 수 있다. 인간화된 항체를 포함하는 키메라 항체, 및 Fv, F (ab')2 및 FAb를 비롯한 단일-쇄 항체 및 항체 단편이 또한 관심 대상이다.

형질전환체 ( transformant )

본 발명의 핵산은 세포주에서의 형질전환 유기체 또는 부위-특이적 유전자 변형을 포함하는 형질전환체(transformant)의 생성에 이용될 수 있다. 본 발명의 형질전환 세포는 전이 유전자(transgene)로 존재하는 본 발명의 하나 이상의 핵산을 포함한다. 본 발명의 목적으로, 원핵생물 숙주[예를 들어, 대장균, 스트렙토미세스 속( Streptomyces sp .), 바실러스 서브틸리스 (Bacillus subtilis ), 락토바실러 스 아시도필루스 (Lactobacillus acidophilus) 등] 또는 인간 배아세포를 제외한 진핵생물 숙주를 포함하는 임의의 적합한 숙주를 이용할 수 있다. 본 발명의 형질전환 유기체는 박테리아, 시아노박테리아, 균류, 식물 및 동물을 포함하는 원핵생물 또는 진핵생물 유기체일 수 있고, 본 발명의 이종 핵산을 포함하는 이 유기체의 하나 이상의 세포가 당해 분야에 주지된 형질전환 기법을 비롯한 인간의 개입(human intervention)에 의해 도입된다.

본 발명의 분리된 핵산은 당해 분야에 공지된 방법, 예를 들어, 감염, 형질주입, 형질전환, 유전자-건 전달(gene-gun delivery) 또는 트랜스컨쥬게이션(transconjugation)에 의해 숙주로 도입될 수 있다. 핵산 분자(즉, DNA)를 이러한 유기체로 이동시키는 기법은 널리 공지되어 있으며, Sambrook 등의 (Molecular Cloning: A Laboratory Manual, 3nd Ed., (2001) Cold Spring Harbor Press, Cold Spring Harbor, NY)와 같은 참고문헌에 제공된다.

한 양태에서, 형질전환 유기체는 원핵생물 유기체일 수 있다. 원핵생물 숙주의 형질전환 방법은 당해 분야에 주지되어 있다 (예를 들어, Sambrook 등의 (Molecular Cloning: A Laboratory Manual, 2nd Ed., (1989) Cold Spring Harbor Laboratory Press) 및 Ausubel 등의 (Current Protocols in Molecular Biology (1995) John Wiley & Sons, Inc)를 참고한다).

다른 양태에서, 상기 형질전환 유기체는 균류, 예를 들어, 효모일 수 있다. 효모는 이종 유전자 발현용 비히클로서 널리 이용된다(예를 들어, Goodey 등의 Yeast biotechnology, D R Berry et al., eds, (1987) Allen and Unwin, London, pp. 401-429, 및 Kong 등의 Molecular and Cell Biology of Yeasts, E. F. Walton and G. T. Yarronton, eds, Blackie, Glasgow (1989) pp. 107-133을 참고한다). 몇몇 유형의 효모 벡터가 이용 가능하며, 통합 벡터(integrative vector) - 이의 유지를 위해서 숙주 게놈과의 재조합을 필요로 한다 - 및 자율 복제 플라스미드 벡터(autonomously replicating plasmid vector)를 포함한다.

다른 숙주 유기체는 동물이다. 당해 분야에 주지되고, 참고문헌(Pinkert, Transgenic Animal Technology: A Laboratory Handbook, 2nd edition (2003) San Diego: Academic Press; Gersenstein and Vinterstein, Manipulating the Mouse Embryo: A Laboratory Manual, 3rd ed, (2002) Nagy A. (Ed), Cold Spring Harbor Laboratory; Blau et al., Laboratory Animal Medicine, 2nd Ed., (2002) Fox J.G., Anderson L.C., Loew F.M., Quimby F.W. (Eds), American Medical Association, American Psychological Association; Gene Targeting: A Practical Approach by Alexandra L. Joyner (Ed.) Oxford University Press; 2nd edition (2000)을 비롯함)에 제공된 형질전환 기법에 의해 형질전환 동물이 획득될 수 있다. 예를 들어, 형질전환 동물은 내인성 유전자 자리(endogenous locus)가 변경되는, 이종 재조합을 통해 획득될 수 있다. 대안적으로는, 핵산 제작물이 게놈에 무작위로 통합된다. 안정한 통합을 위한 벡터는 플라스미드, 레트로바이러스 및 다른 동물 바이러스, YAC 등을 포함한다.

미세주입(microinjection), 또는 재조합 바이러스 또는 재조합 바이러스 벡터를 이용한 감염 등을 비롯한, 의도적인 유전적 조작(deliberate genetic manipulation)에 의한 세포의 전구체로의 도입을 통해서, 핵산은 직접적이거나 또는 간접적으로 세포로 도입될 수 있다. 용어 "유전적 조작"은 전통적인 교배육종(cross-breeding) 또는 시험관내 수정을 포함하지 않고, 그 보다는 재조합 핵산 분자의 도입을 의미한다. 이 핵산 분자는 염색체 내에 통합될 수 있거나, 또는 이는 외부 염색체 인자로 복제하는 DNA(extrachromosomally replicating DNA)일 수 있다.

상동 재조합용 DNA 제작물은 본 발명의 핵산의 적어도 일부를 포함하며, 상기 유전자는 목적하는 하나 이상의 유전적 변형을 갖고, 표적 유전자 자리에 상동성 영역을 포함한다. 무작위 통합용 DNA 제작물은 재조합을 매개하기 위해, 상동성 영역을 포함할 필요가 없다. 양성 선택 및 음성 선택용 마커가 또한 포함될 수 있다. 상동 재조합을 통한 표적된 유전자 변형을 갖는 세포를 생성하는 방법이 당해 분야에 공지되어 있다. 포유동물 세포를 형질주입하는 다양한 기법이, 예를 들어, (Keown et al., Meth. Enzymol. (1990) 185:527-537)에 기술되어 있다.

배아 줄기 (embryonic stem, ES) 세포의 경우, ES 세포주가 이용될 수 있거나, 또는 배아세포가 마우스, 랫트, 기니피그 등을 비롯한 숙주로부터 새롭게 수득될 수 있다. 이러한 세포는 적절한 섬유아세포-피더 층(fibroblast-feeder layer) 상에서 성장되거나, 또는 백혈병 억제 인자(leukemia inhibiting factor, LIF)가 존재하는 경우 성장한다. 당해 분야에 공지된 적절한 기법을 이용하여, 형질전환된 ES 또는 배아세포는 형질전환 동물의 생성에 이용될 수 있다.

형질전환 동물은 인간이 아닌 포유동물 (예, 마우스, 랫트), 조류 또는 양서류 등을 포함하는, 임의의 인간이 아닌 동물일 수 있고, 기능 연구(functional study), 약물 스크리닝 등에 이용될 수 있다.

형질전환 식물이 또한 획득될 수 있다. 형질전환 식물세포 및 식물을 제조하는 방법이 특허 제5,767,367호, 제5,750,870호, 제5,739,409호, 제5,689,049호, 제5,690,045호, 제5,674,731호, 제5,656,666호, 제5,633,155호, 제5,629,470호, 제5,595,896호, 제5,576,198호, 제5,538,879호 및 제5,484,956호에 기술되어 있고, 이들의 개시는 본원에 참고로 포함된다. 형질전환 식물을 생성하는 방법이 Plant Biochemistry and Molecular Biology (eds. Lea and Leegood, John Wiley & Sons (1993) pp. 275-295) 및 Plant Biotechnology and Transgenic Plants (eds. Oksman-Caldentey and Barz) (2002) 719 p에서 또한 검토된다.

예를 들어, 체세포를 포함하는 배형성 외식편(embryogenic explant)은 형질전환 숙주의 제조에 이용될 수 있다. 세포 또는 조직의 수확 후에, 관심 있는 외인성 DNA를 식물세포로 도입시키는데, 다양한, 상이한 기법이 이러한 도입에 이용 가능하다. 분리된 원형질체(protoplast)를 이용하면, DNA-매개 유전자 전달 프로토콜 - 다가 양이온 (polyvalent cation) (예를 들어, PEG 또는 PLO)의 존재하에, 관심 있는 외인성 코딩 서열을 포함하는 플라스미드와 같은 네이키드 DNA (naked DNA)와 원형질체의 배양; 또는 관심 있는 외인성 서열을 포함하는 네이키드 DNA의 존재하에, 원형질체의 전기천공(electroporation);을 포함함 - 을 통해 도입시킬 기회가 생긴다. 그런 다음에, 외인성 DNA를 성공적으로 함입한 원형질체가 선별되고, 적절한 양 및 비율의 자극 인자 - 옥신(auxin) 및 시토키닌(cytokinin)과 같은 - 와의 접촉을 통해서 캘러스(callus)로 성장하여, 궁극적으로는 형질전환 식물로 성장한다.

통상적인 기술자가 이용할 수 있는 "유전자-건" 접근법 또는 아그로박테리움-매개 형질전환(Agrobacterium-mediated transformation)과 같은, 식물을 생산하는 다른 적합한 방법들이 이용될 수 있다.

이용방법

본 발명의 폴리펩티드 및 핵산은 다양한, 상이한 적용분야에서 이용된다. 예를 들어, 이들은 진단학, 품질관리, 환경시험(environmental test) 및 생물공학 및 의학분야에서의 다른 유사한 검정을 위한 시약으로 이용된다. 또한, 이들은 가정에서, 오락-지향 적용분야(entertainment-oriented application), 예를 들어, 광원으로 이용될 수 있는 생물 발광 형질전환 식물 및 동물의 생성에 이용된다.

예를 들어, 조성물의 핵산은 매질에서 다양한 외부 신호의 검출, 예를 들어, 포유동물의 장(intestine)에서 신호의 검출에 이용된다. 이 양태에 대해서, 신호전달 연쇄반응(signalling cascade)을 암호화하는 발현 카세트가 숙주의 게놈으로 도입되는데, 분석된 주변 신호는 트리거(trigger)로 작용하고, 루시퍼라제 유전자 발현은 리포터(reporter)로 작용한다. 루시퍼라제 유전자 발현은 신호전달 연쇄반응 전달에 의해, 또는 예를 들어, [Kotula et al., Proc. Natl. Acad. Sci. USA, 2014, 111: 4838-4843]에 기술된 기법을 이용하여 세포 게놈의 유전적 변경을 유도하는 것을 통해 직접적으로 야기될 수 있다. 예를 들어, 주변 매질 중 테트라사이클린의 존재를 검출하는 대장균 균주의 고안에 대해서, tetA 유전자 프로모터의 제어하에 있는 루시퍼라제 코딩 서열, 및 항시성 프로모터(constitutive promoter)의 제어하에서 트랜스포존(transposon) Tn10의 테트라사이클린 억제자 (tetracycline repressor, TetR)를 암호화하는 서열이 대장균 게놈으로 도입된다. 대장균의 게놈 편집(editing)은, 예를 들어, [Sabri et al., Microbial Cell Factories, 2013, 12:60]에 기술된 당해 분야에 주지된 기법을 통해 수행된다. 샘플 매질에서 배양된 후에 유전적으로 변형된 대장균 세포 및 이러한 배양을 하지 않은 대조 세포에 3-히드록시히스피딘을 추가한 후에, 매질 중 테트라사이클린의 존재가 생물 발광 강도의 비교에 의해 검출된다. 이와 유사하게, 신호전달 연쇄반응의 대응하는 인자를 목적하는 신호에 특이적으로 감수성인 인자로 치환시킴으로써, 다른 주변 매질 신호에 감수성인 다른 미생물 균주가 고안될 수 있다. 대상 루시퍼라제에 의한 빛 방출이 ATP, NAD(P)H 및 다른 대사산물의 세포 내 가용성(intracellular availability)으로부터 독립적인 것은 세포의 다양한 생리학적 상태에서 리포터 신호의 안정성을 보장한다.

또한, 본 발명의 핵산은 수(water) 중 독성 물질, 예를 들어, 헥사클로로사이클로핵산(hexachlorocyclohexane) 유도체 등의 존재를 결정하는 방법에 이용된다. 신속한 단백질 분해의 신호에 작동 가능하게 융합된 루시퍼라제의 항시적인 생성을 제공하는 발현 카세트가 숙주 (예를 들어, 대장균)로 도입된다. 독성을 측정하기 위해, 동결건조된 박테리아를 90분 동안 생물 발광 검출 큐벳에서 동일한 액체와 배양시키고; 동시에, 박테리아의 다른 분획물을 대조 액체(control liquid)와 배양시킨다. 독성 효과에 대한 기준은 독성 물질을 함유하지 않는 용액을 갖는 샘플의 생물 발광 강도의 변화와 비교된, 분석된 탐침에서의 생물 발광 강도의 변화이다. 따라서, 발광 강도의 하락에 기초해 독성 효과를 측정할 수 있다.

또한, 본 발명의 분자는 샘플 용액 중 3-히드록시히스피딘의 농도의 측정에 이용될 수 있다. 이를 위해, 알려진 농도의 정제된 루시퍼라제를 함유하는 시약을 큐벳에 넣고, 백그라운드 생물 발광 신호를 발광측정기(luminometer)를 이용해서 기록한다. 그런 다음, 대조군 보정 측정 (Control calibration measurement)을 다음과 같이 수행한다: 생물 발광 강도를 기록하는 동안에 알려진 농도의 3-히드록시히스피딘 용액을 큐벳에 추가한다. 3-히드록시히스피딘이 존재하는 경우 또는 존재하지 않는 경우의 생물 발광 강도 신호의 등급(magnitude)의 차이는 3-히드록시히스피딘의 농도에 비례하는 값이다. 수행될 측정에 관계된 3-히드록시히스피딘 용액의 농도에 대해서 작업을 반복한다. 획득된 데이터에 기초하여, 3-히드록시히스피딘 농도에 대한 생물 발광 강도의 의존성에 대한 보정 곡선(calibration curve)을 플로팅한다. 알려지지 않은 농도의 3-히드록시히스피딘 용액을 시약에 추가한 후에, 상기 보정 곡선을 이용하여, 알려지지 않은 샘플 중 3-히드록시히스피딘 농도를 생물 발광 강도에 기초하여 결정한다. 대상 단백질 및 핵산은 다른 화합물을 포함하는 복합 혼합물(complex mixture) 중 3-히드록시히스피딘의 농도를 특이적으로 측정할 수 있는 유일하게 존재하는 시약이다.

조성물의 핵산은 빛-방출 형질전환 식물 또는 동물의 생산에 더 이용될 수 있다. 예를 들어, 형질전환 이끼 [피스코미트렐라 파텐스 ( Physcomitrella patens )]를 생산하기 위해, 항시성 프로모터(constitutive promoter), 예를 들어, 벼의 AktI 유전자의 프로모터, 또는 유도성 프로모터(inducible promoter), 예를 들어, 대두의 Gmhsp17.3B 유전자의 열-민감성 프로모터의 제어하에서, 숙주세포에서의 발현에 최적화된 서열을 암호화하는 루시퍼라제를 이의 게놈으로 통합시키는 것이 필요하다. 화농성연쇄상구균 (Streptococcus pyogenes )으로부터의 Cas9 핵산가수분해효소와 게놈 유전자 자리에 상보적인 가이드 RNA (guide RNA)를 이용하여, 당해 분야에 공지된 임의의 방법이 이러한 통합, 예를 들어, 이끼의 게놈 DNA에서의 이중-가닥 갭(double-stranded gap)의 형성에 의해 유도되는 상동 재조합에 이용될 수 있다. 이 경우에, 통합된 유전적 제작물은 길이가 약 250개인 뉴클레오티드를 갖는 이중-가닥 갭의 영역 내 게놈의 영역에 상동인 영역이 플랭킹(flanking)되어야 한다. 임의의 공지된 기법이 DNA의 이끼 세포로의 전달, 예를 들어, 폴리에틸렌 글리콜을 이용한 이끼 원형질체와 네이키드 DNA의 형질전환에 또한 이용될 수 있다. 형질전환 후에, 이끼 원형질체는 세포벽 재생을 위한 성장 배지에서 성장되어야 하고, 그런 다음에 이들은 배우체(gametophyte)의 재생을 위한 고체 배지에 플레이팅(plating)되어야 한다. 유전적으로 변형된 식물은 3-히드록시히스피딘 또는 방출된 분자가 배지 또는 토양에 추가되는 경우에 광원으로 작용할 수 있거나, 또는 숙주세포에서 3-히드록시히스피딘 생합성이 발생하는 경우에 자체적으로 생물발광할 수 있다. 대상 루시퍼라제는 대부분 초록색 빛을 방출하므로, 가시 스펙트럼(visible spectrum)의 초록색 영역에서 광합성 식물 조직의 감소된 흡수로 인해, 이러한 조직을 통한 빛의 방출에 최적으로 적합하다.

조성물의 핵산은 세포 단백질, 소기관, 개별적인 세포 또는 조직의 가시화에 또한 이용될 수 있다. 예를 들어, 유기체에서 암세포의 이동을 가시화하기 위해, 루시퍼라제의 핵산 서열은 발현 카세트 또는 발현 벡터의 일부로서 암세포에 도입된다. 당해 분야에 공지된 임의의 방법은 이러한 도입에 이용될 수 있다. 예를 들어, 루시퍼라제를 암호화하는 핵산은 숙주로 이식되기 전에 암세포의 게놈에 통합될 수 있다. 다른 양태에서, 핵산은 모든 유기체 세포로 통합되나, 암세포에서만 활성인 프로모터의 제어하에 있다. 3-히드록시히스피딘이 세포막을 통해 침투하는 것이 가능하기 때문에, 대상 루시퍼라제는 조직 고정(tissue fixation) 및 투과화(permeabilization) 없이, 살아있는 유기체에서 생체내 가시화될 수 있다. 암 종양 및 전이의 발달을 가시화하기 위해, 루시페린 용액은 샘플 유기체로 도입되어야 하고, 조직은 생물 발광의 검출에 적합한 장비를 이용하여 가시화되어야 한다.

키트

본 발명은 본 발명의 핵산 및 단백질의 하나 이상의 적용을 실시하는 키트를 또한 제공한다.

상기 키트는 통상적으로는 본 발명에 따른 단백질 또는 이러한 단백질을 암호화하는 핵산을 포함하고, 바람직하게는 인자를 함께 포함하여 숙주에서의 표적 단백질의 발현을 제공하는데, 그 예로는 표적 단백질을 암호화하는 핵산을 포함하는 발현 벡터 또는 발현 카세트가 있다. 또한, 상기 키트는 본 발명의 루시퍼라제에 의해 매개된 발광 반응을 수행하는 루시페린을 포함한다.

일부 양태에서, 루시페린은 3-히드록시히스피딘, (E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원, 및 (E)-3,4-디히드록시-6-(2-(6-히드록시나프탈렌-2-일)비닐)-2H-비란-2-원으로 이루어진 군으로부터 선택된다.

상기 키트 구성요소는 완충 용액과 같은 적합한 보관 매질(storage medium)에, 보통은 적합한 용기에 존재한다. 상기 구성요소는 동결건조된 형태로 키트에 존재할 수 있다.

또한, 키트는 대상 단백질에 특이적인 항체를 포함할 수 있다. 일부 양태에서, 상기 키트는 복수의 상이한 벡터 - 이들 각각은 표적 단백질을 암호화한다 - 를 포함하고, 상기 벡터는 상이한 매질 및/또는 다양한 조건하에서의 발현, 예를 들어, 항시적인 발현(constitutive expression)과 같은 발현을 위해 설계되었으며, 상기 벡터는 포유동물 세포에서의 발현을 위한 강력한 프로모터, 또는 통상적인 프로모터 통합 및 장기적인 발현 등을 위한 다중 클로닝 부위 (multiple cloning site)를 갖는 비-프로모터 벡터를 포함한다.

상기 구성요소 외에, 표적 키트는 대상 방법을 실시하기 위한 설명서를 또한 포함한다. 설명서는 표적 키트에 상이한 형태로 존재할 수 있고, 하나 이상의 이러한 형태가 각 키트에 존재할 수 있다.

아래 실시예는 한정하는 것이 아닌, 예시로서 제공된다.

[ 실시예 ]

[ 실시예 1. 네오노토파누스 남비 로부터의 루시퍼라제의 코딩 서열의 분리]

네오노토파누스 남비의 균사체(mycelium)로부터의 전체 RNA를 [Chomczynski and Sacchi, Anal. Biochem., 1987, 162, 156-159]에 기술된 방법을 이용하여 분리하였다. cDNA를 SMART PCR cDNA 합성 키트 (미국 소재, Clontech)를 이용하여 제조사의 프로토콜에 따라 증폭시켰다. PCR 산물을 pGAPZ 벡터 (미국 소재, Invitrogen)로 클로닝했고, XL1 블루 균주 (XL1 Blue strain)의 컴피턴트 대장균 세포(competent E. coli cell)로 형질전환시켰다. 이 박테리아를 제오신 항생제(zeocin antibiotic)가 존재하는 페트리 접시(Petri dish)에서 성장시켰다. 16시간 후에, 콜로니를 접시로부터 세척했고, 강하게 혼합하였으며, 플라스미드 DNA 추출 키트 (러시아 소재, Evrogen)를 이용해서, 이로부터 플라스미드 DNA를 추출했다. 분리된 플라스미드 DNA를 AvrII 제한 부위에 의해 선형화시켜서 피히아 파스토리스 GS115 (Pichia pastoris GS115) 세포의 형질전환에 이용했다. 전기천공법(Electroporation)을 [Wu and Letchworth, Biotechniques, 2004, 36:152-4]에 기재된, 리튬 아세테이트 및 디티오트레이톨을 이용한 방법에 따라 수행했다. 전기천공된 세포를 1 M 솔비톨, 2% (w/v) 포도당, 1.34% (w/v) 효모 질소 염기 (yeast nitrogen base, YNB), 0.005% (w/v) 아미노산 혼합물, 0.00004% (w/v) 비오틴 및 2% (w/v) 한천을 함하는, RDB 배지를 함유하는 페트리 접시에 도말했다(spreading). 효모에서 네오 노토파누스 남비의 생성되는 cDNA 라이브러리의 다양성은 약 100만 개의 클론에 달했다. 수득된 콜로니들을 3-히드록시히스피딘의 용액과 함께 분무했고(spraying), 세포에서 루시퍼라제의 존재를 빛 방출에 의해 검출했다. IVIS 스펙트럼 CT (미국 소재, PerkinElmer)를 콜로니가 방출한 빛의 검출에 이용했다. 3-히드록시히스피딘을 추가한 후에 발광이 검출된 콜로니들을 선별해서 PCR용 표준 플라스미드 프라이머와 함께 주형으로 이용했다. PCR 산물을 생거법(Sanger method)에 의해 시퀀싱했다. 수득된 핵산 서열은 서열번호 01에 나타냈다. 수득된 핵산 서열로 암호화되는 아미노산 서열은 서열번호 02에 나타냈다.

발현된 루시퍼라제의 생물 발광을 분석하기 위해, 발광이 관찰된 피히아 파스토리스 콜로니들을 분리해서, 250 ml의 YPD 배지가 채워져 있는 750 ml 플라스크에서, 72시간 동안, 30°C에서 성장시켰고, 200 rpm에서 스터링했다(stirring). 그런 다음에, 루시퍼라제-발현 세포를 5000 g에서 15분 동안, 4°C에서 원심분리시켜서 펠렛으로 만들었다. 수득된 펠렛을 0.1% DDM을 포함하는 pH 7.4의 0.1 M 포스페이트 완충액에 2시간 동안 4°C에서 재현탁시켰다(resuspending). 현탁액을 21000 g에서 30분 동안 4°C에서 원심분리시켰다. 750 μl의 수득된 현탁액을 1% DDM 중 3-히드록시히스피딘 (25 μM)의 용액 250 μl에 추가하여 생물 발광 반응을 활성화시켰다. Varian Cary Eclipse 분광 형광 측정기(spectrofluorimeter)를 이용해서 생물 발광을 검출하였다. 수득된 스펙트럼은 네오노토파누스 남비 균사체 생물 발광의 스펙트럼과 실질적으로 동일했다 (도 1).

[ 실시예 2. 다양한 균종(Fungal Species)으로부터의 루시퍼라제의 코딩 서열의 분리]

게놈 DNA를 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯( Mycena chlorophos), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) 및 부채 버섯 (Panellus stipticus )으로부터 분리했고, Illumina HiSeq 기술 (미국 소재, Illumina)를 이용해서 제조사의 권고에 따라, 전체 게놈 시퀀싱(full genomic sequencing)을 수행했다. 시퀀싱 결과를 가설 단백질의 아미노산 서열의 예측 및 실시예 1에 기술된 대로 검출된 네오노토파누스 남비로부터의 루시퍼라제의 상동체의 탐색에 이용했다. Altschul 등의 J. Mol. Biol., 215, pp. 403-10 (1990)에 기술된 서열 분석용 알고리즘 및 국립 생물공학 정보센터에 의해 제공된 소프트웨어를 이용해서 상동체를 탐색했다. 아미노산 서열을 NCBI Genbank 데이터베이스의 균류 게놈 시퀀싱 데이터에서 탐색했다. BLASTP의 검색 프로그램의 표준 파라미터를 탐색에 이용했다. 결과적으로, 가설 단백질의 서열, 즉, 천마버섯 ( Armillaria gallica), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 옴팔로투스 올레아리우스 (Omphalotus olearius ), 부채 버섯 (Panellus stipticus ) 및 미세나 시트리컬러 (Mycena citricolor )에서 네오노토파누스 남비로부터의 루시퍼라제의 상동체가 검출되었다. 검출된 루시퍼라제 모두가 서로 실질적으로 동일하다. 아미노산 서열의 일치도는 표 1에 나타냈다.

[표 1. 루시퍼라제의 아미노산 서열의 일치도]

뉴클레오티드 서열의 보존 영역(conserved region)의 다중 정렬에 기초하여, 축퇴 프라이머를 제작했다. 프라이머의 구조를 서열번호 36-43에 나타냈다. 전체 RNA를 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 미세나 시 트리컬러 (Mycena citricolor ), 옴팔로투스 올레아리우스 ( Omphalotus olearius ), 및 부채 버섯 ( Panellus stipticus )의 자실체(fruiting body) 및 균사체로부터 분리했고, 실시예 1에 기술된 대로 cDNA를 제조했다. 수득된 cDNA를 상기 프라이머와 함께 PCR에 이용했다. 1μl의 20배 증폭된 cDNA, Encyclo 중합효소 믹스 (Evrogen), 제조사에 의해 제공된 1배 완충액, 200 μM dNTPs 및 프라이머 1711-1714 중 하나인, 0.5 μM의 프라이머, 및 프라이머 1715 -1718 중 하나인, 0.5 μM의 프라이머를 포함하는, 50 μl의 반응 혼합물에서 PCR을 수행했다. PTC-200 MJ Research Thermal Cycler에서, "Block" 온도 제어법 (각 사이클은 다음의 조건하에서 수행된다: 95°C에서 10초, 55°C에서 10초, 및 72°C에서 1분)을 이용하여 30회의 PCR 사이클을 수행했다. PCR 산물을 pTAdv 벡터 (Clontech)로 클로닝했고, 플라스미드 DNA를 분리해서 생거법으로 M13 공통 프라이머(universal primer)를 이용하여 시퀀싱했다. 모든 경우에서, 샘플 균류의 cDNA는 루시퍼라제 서열을 보였다.

부채 버섯 ( Panellus stipticus ) cDNA의 증폭은 146번 위치에서(서열번호: 15-18), 발린을 이소류신으로 단일 아미노산 치환하는 것을 특징으로 하는, 루시퍼라제 서열의 두 변이체를 야기했다.

[ 실시예 3. 포유동물 세포에서 루시퍼라제의 발현]

실시예 1과 실시예 2에서 나타낸 대로 수득한 루시퍼라제의 코딩 서열을 포유동물 세포에서의 발현에 최적화 (인간화)시켰다. 인간화된 핵산을 올리고뉴클레오티드 합성에 의해 표준 기법을 이용해서 수득했다. 인간화된 핵산의 뉴클레오티드 프로파일(nucleotide profile)을 서열번호 44-51에 나타냈고, 대응하는 단백질의 아미노산 프로파일은 서열번호 2, 4, 6, 8, 10, 12, 14, 16에 나타낸 야생형 단백질과 동일하다. 수득된 핵산을 mKate2-케라틴 융합 단백질을 암호화하는 서열 대신, Nhel 및 Notl 제한 부위를 이용하는 pmKate2-케라틴 벡터 (러시아 소재, Evrogen)로 클로닝했다. 플라스미드 DNA를 정제해서, FuGENE HD 형질주입 시약 (미국 소재, Promega)을 이용하여, 제조사의 프로토콜에 따라 HEK293NT 및 HeLa 세포로 형질주입했다. 형질주입 절차 24시간 후에, 농도가 660 μg/ml인 3-히드록시히스피딘을 배지에 추가하였고, IVIS 스펙트럼 CT (PerkinElmer)를 이용해서 세포 발광을 검출했다. 모든 샘플의 빛 방출의 강도는 비-형질주입 대조 세포로부터 비롯된 신호보다 한 크기 정도(an order of magnitude) 크다 (도 2).

벡터에 포함된 뉴클레오티드 서열 서열번호 51에 146번 위치에서 발린을 이소류신으로 대체하는, 부위-지정 돌연변이를 유발시켰다. 수득된 서열을 포함하는 벡터를 HEK293NT 세포로 형질주입했다. 형질주입 절차 24시간 후에, 농도가 660 μg/ml인 3-히드록시히스피딘을 배지에 추가했고, IVIS 스펙트럼 CT (PerkinElmer)를 이용해서 세포 발광을 검출했다. 이 변이체가 또한 생물 발광 반응에서 3-히드록시히스피딘의 산화를 가능하게 한다는 것이 밝혀졌다.

[ 실시예 4. 피히아 파스토리스 세포에서 네오노토파누스 남비 로부터의 루 시퍼라제의 발현]

네오노토파누스 남비로부터의 루시퍼라제를 암호화하는 DNA를 실시예 1에 나타낸 대로 수득했다. 유전자-특이적 말단 프라이머(terminal primer)를 이용하여 루시퍼라제 유전자를 증폭시켜서, C-말단 his-태그를 암호화하는 서열과 인-프레임으로, BstBI와 SalI 제한 핵산 내부 가수분해효소 부위를 이용하는 GAP-pPicZA 발현 벡터 (Invitrogen)로 클로닝시켰다. 전기천공법에 의해, 수득된 유전자 제작물을 낮은 단백질 가수분해 효소 활성을 특징으로하는 피히아 핑크( Pichia pink) 균주로 형질전환시켰다. 전기천공법 절차를 [Wu and Letchworth, Biotechniques, 2004, 36:152-4]에 기술된 리튬 아세테이트 및 디티오트레이톨(dithiothreitol)을 이용한 방법에 따라 수행했다. 전기천공된 세포를 YPD 배지 (2% (w/v) 펩톤, 1% (w/v) 효모 추출물, 2% (w/v) 포도당, 2 % (w/v) 한천) 및 농도가 100 μg/ml인 제오신 항생제를 함유하는 페트리 접시에 도말했다.

루시퍼라제를 생성하는 피히아 핑크 클론을 3-히드록시히스피딘의 용액과 함께 콜로니의 분무 및 IVIS 스펙트럼 CT (PerkinElmer)를 이용한 생물 발광 (방출하는 빛)의 가시화를 통해 검출했다. 가장 높은 발광 강도를 특징으로 하는 클론들을 선별했다. 클론들을 분리했고, 250 ml의 YPD 배지로 채워져 있는 750 ml 플라스크에서, 72시간 동안, 30°C에서 성장시켰으며, 200 rpm에서 교반시켰다. 5000 g에서, 15분 동안, 4°C에서의 원심분리에 의해, 루시퍼라제-발현 세포를 펠렛으로 만들었다. 수득된 펠렛을 100 ml의 용해 완충액 (0.1 M 소듐 포스페이트, 0.1 M KCl, 4 mM EDTA, 2 mM TCEP, 1 mM PMSF, pH 7.4) 중에 재현탁시켰고, APV2000 고압 균질기 (SPX)을 이용하여, 600 bar에서 20회 처리했다. 용해물을 8000 g에서 15분 동안 4°C에서 원심분리시켰다. 수득된 후-핵 상청액(post-nuclear supernatant)을 140000 g에서 2시간 동안 4°C에서 원심분리시켰다. 수득된 잔류물 (마이크로솜 분획)을 10 ml의 수중에 재현탁시켰다. 램리법(Laemmli method)에 따라서 (쿠마시 블루로 염색된 10-25% 폴리아크릴마이드 겔), 폴리아크릴아미드 겔 전기영동을 변성시킴으로써 샘플을 용해했고, 화학발광 신호 검출(chemiluminescence signal detection)과 함께, his-태그를 표적화하는 항체 컨쥬게이트 및 겨자무 과산화효소를 이용하는 웨스턴 블랏에 사용했다 (도 4). 웨스턴 블랏은 네오노토파누스 남비로부터의 루시퍼라제의 예상 분자량에 대략적으로 대응하는, 28 kDa의 단백질의 영역 내 겔에서 이동하는 루시퍼라제의 특이적인 염색을 보였다. 또한, 웨스턴 블랏은 재조합 루시퍼라제와 140000 g에서의 원심분리에 의해 수득된 잔류물의 공침(coprecipitation)을 나타냈다.

[ 실시예 5. 루시퍼라제의 기능성 단편의 수득]

네오노토파누스 남비로부터의 루시퍼라제의 절단된 단편을 암호화하는 오픈 리딩 프레임을 올리고뉴클레오티드 합성을 이용하여 수득했다. N-말단에서 6, 9, 12, 15, 21, 25, 31, 33, 35, 37 및 40번 아미노산 잔기에서의 절단(cut)을 갖는 루시퍼라제 단편을 암호화하는 핵산을 전사 개시 부위 및 his-태그를 암호화하는 핵산에 작동 가능하게 융합시킨 다음에, BamHI과 HindIII 제한 핵산 내부 가수분해효소를 이용하여 pET-23 벡터로 클로닝했다. 벡터를 이용해서 BL21-CodonPlus 균주 (Stratagene BL21-Gold 고-수율 균주의 유도체)의 대장균 세포로 형질전환시켰다. 이 세포를 다음의 배지를 함유하는 페트리 접시에 플레이팅했고(plating): 1% NaCl, 1% 트립톤, 0.5% 효모 추출물, 1.5% 한천, 100 μg/ml의 암피실린, 100 μg/ml의 클로람페니콜 및 물), 37°C에서 밤새 배양시켰다. 그런 다음에, 대장균 세포 콜로니를 루시페린의 용액과 함께 분무했고, IVIS 스펙트럼 CT (미국 소재, PerkinElmer)에서 가시화하여 발현된 루시퍼라제 단편의 기능성을 측정했다. N-말단의 6, 9, 12, 15, 21, 25, 31, 33, 35, 37번 아미노산 잔기에서 절단이 있는 루시퍼라제 단편이 루시페린의 용액과 함께 분무되는 경우에 빛을 방출한다는 것이 밝혀졌다.

루시퍼라제 단편이 작동 가능하게 융합된 N-말단의 뉴클레오티드 및 아미노산 서열을 서열번호 52와 53에 각각 나타냈다.

[http://www.cbs.dtu.dk/services/TMHMM/]에 기술된 소프트웨어를 이용하여, 네오노토파누스 남비로부터의 루시퍼라제의 아미노산 서열의 분석을 수행했고, 처음 39개의 아미노산이 막 관통 도메인을 포함한다는 것을 보였다 (도 5). 획득된 데이터에 기초하여, 막 관통 도메인을 포함하는 서열의 제거는 빛 방출을 동반하는, 3-히드록시히스피딘의 산화를 촉매하는 균류 루시퍼라제의 능력에 영향을 끼치지 않는다는 결론을 내렸다.

[http://www.cbs.dtu.dk/services/TMHMM/]에 제공되는 소프트웨어를 이용하여, 실시예 2에서 기술된 대로 클로닝된, 천마버섯 ( Armillaria gallica ), 뽕나무 버섯 ( Armillaria mellea ), 잣뽕나무 버섯 ( Armillaria ostoyae ), 받침애주름 버섯 ( Mycena chlorophos ), 미세나 시 트리컬러 ( Mycena citricolor ), 옴팔로투스 올레아리우스 ( Omphalotus olearius ) 및 부채 버섯 ( Panellus stipticus )으로부터의 루시퍼라제를 분석했다. 각 경우에서, 막 관통 도메인을 포함하는 N-말단 단편을 아미노산 서열에서 검출했다 (도 5). 막 관통 도메인을 포함하는 N-말단 서열의 제거 후에 수득된, 루시퍼라제 단편의 뉴클레오티드 및 아미노산 서열을 서열번호 19-34에 나타냈다.

루시퍼라제의 다중 정렬을 도 5에 나타냈다. 단백질이 C-말단에서 길이가 8-11개인 아미노산의 비-보존적 단편을 포함하는 것을 볼 수 있다. 단편은 또한 루시퍼라제 기능성의 손실 없이 제거될 수 있거나 또는 다른 C-말단으로 치환될 수 있다. 루시퍼라제가 서열번호 35에 나타낸 공통 서열을 포함하는 고-상동성 중심 영역(high-homologous central region)을 포함하는 것을 또한 볼 수 있다.

[ 실시예 6. 다른 루시페린과 루시퍼라제의 이용]

포유동물 세포에서의 발현에 필요한 균류 루시퍼라제의 코딩 서열을 포함하는 플라스미드를 실시예 3에 기술된 대로 수득해서, HEK293N 세포의 형질주입에 이용했다. 형질주입 절차 24시간 후, 트립신-베르센 용액(trypsin-Versen solution) (0,025% 트립신)을 이용하여 세포를 접시로부터 떼어냈고, 배지를 pH 8.0의 포스페이트 살린 버퍼(Phosphate-buffered saline)로 교체했으며, 원심분리에 의해 세포를 재현탁시켰고, 초음파를 이용하여 용해했다; 농도가 660 μg/ml인 3-히드록시히스피딘 또는 이의 유도체 ((E)-6-(4-디에틸아미노)스티릴)-3,4-디히드록시-2H-피란-2-원, (E)-3,4-디히드록시-6-(4-히드록시스티릴)-2H-피란-2-원, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원, (E)-6-(2-(1,2,3,5,6,7-헥사히드로피리도[3,2,1-ij]퀴놀린-9-일)비닐)-3,4-디히드록시-2H-피란-2-원 및 (E)-3,4-디히드록시-6-(2-(6-히드록시나프텔렌-2-일)비닐)-2H-피란-2-원) 중 하나를 배지에 추가했다.

Varian Cary Eclipse 분광 형광 측정기를 생물 발광 스펙트럼의 검출에 이용했다. 모든 검토된 루시페린으로, 모든 샘플들이 빛을 방출했다. 이용된 루시페린에 따라, 발광 최적 변위(luminescence optimum displacement)가 다음과 같이 관찰되었다 : (E)-3,4-디히드록시-6-(2-(6-히드록시나프탈렌-2-일)비닐)-2H-피란-2-원의 산화 동안에, 580 nm가 넘는 파장을 갖는, 양자의 현저한 방출을 동반한 장-파장 영역으로의 이동이 관찰되고, (E)-6-(2-1H-인돌-3-일)비닐)-3,4-디히드록시-2H-피란-2-원의 산화 동안에, 단-파장 영역으로의 이동이 관찰된다.

[ 실시예 7. 재조합 루시퍼라제의 수득]

서열번호 52의 서열을 루시퍼라제의 기능성 단편을 암호화하는 핵산(서열번호 19, 21, 23, 25, 27, 29, 31, 33)의 5'말단에 작동 가능하게 연결했고, 수득된 제작물을 pET-23 벡터로 BamHI 및 HindIII 제한 핵산 내부가수분해 효소를 이용해서 클로닝했다. 벡터를 이용해서 BL21-CodonPlus 균주 (Stratagene BL21-Gold 고-수율 균주의 유도체)의 대장균 세포로 형질전환했다. 세포를 1.5% 한천, 100 μg/ml의 암피실린 및 100 μg/ml의 클로람페니콜을 포함하는 LB 배지를 포함하는 페트리 접시에 플레이팅했고, 37°C에서 밤새 배양시켰다. 그런 다음에, 대장균 콜로니를 암피실린과 클로람페니콜이 보충된 4 ml의 액체 LB 배지로 옮겨서, 37°C에서, 요동(rocking)과 함께 밤새 배양시켰다. 1 ml의 밤새 배양물(overnight culture)을 미리 추가된 암피실린과 클로람페니콜을 함유하는, 100 ml의 Overnight Express Autoinduction 배지 (Novagen)로 옮겼다. 600 nm에서 0.6 OD의 광학 밀도에 도달할 때까지, 배양물을 37°C에서 2.5시간 동안 성장시킨 다음에, 이를 16시간 동안 실온에서 성장시켰다. 그런 다음에, Eppendorf 5810R 원심분리기에서, 4500 rpm에서 20분 동안의 원심분리에 의해 세포를 펠렛으로 만들었고, 35 ml의 완충액 (50 mM Tris HCl, pH 8.0, 150 mM NaCl) 중에 재현탁해서 음파 파쇄(sonication) 시켰다. 세포 용해물을 7500 rpm에서 15분 동안 원심분리했고, 잔류물을 추출했으며, 상청액을 35000 rpm에서 1시간 동안 더 원심분리해서 마이크로솜 분획을 가용성 분획으로부터 분리했다. 잔류물을 요소를 함유하는 10 ml의 완충액 (8M 요소, 50 mM Tris, pH 8.0)에, 실온에서 밤새 용해시켰다.

예상 재조합 생성물의 존재는 전기천공법에 의해 확인했다. 네오노토파누스 남비로부터의 루시퍼라제의 단편에 대한 이러한 분석의 예시는 도 6에 나타냈다. 네오노토파누스 남비로부터의 루시퍼라제의 예상 분자량에 대략적으로 대응하는 28 kDa 영역 내 밴드가 관찰될 수 있었다. 분리된 재조합 단백질의 분획물을 전기영동용 폴리아크릴아미드 겔에 적용했다. 또한, 이들을 재조합 단백질의 기능성과 안정성의 확인에 이용했다. 3-히드록시히스피딘을 추가한 경우에, 분리된 재조합 단백질은 빛을 방출했고, 520-535 nm의 범위 내에서 방출 최대를 가지며, 네오노토파누스 남비로부터의 루시퍼라제의 기능성 단편은 가장 높은 강도의 방출된 빛을 가졌고, 옴팔로투스 올레아리우스 ( Omphalotus olearius )로부터의 루시퍼라제의 기능성 단편은 가장 낮은 강도를 가졌다. 재조합 단백질은 pH 7-9의 완충 용액에서 활성이었고, pH 7.3-8에서 최대 강도의 생물 발광을 보였다. 용액의 pH에 대한 생물 발광 강도의 의존성에 대한 다이어그램의 예시를 도 7에 나타냈다.

온도 안정성을 분석하기 위해, 루시퍼라제를 상이한 온도에서, 10분 동안, pH 7.4에서 배양시켰다. 배양의 말에, 3-히드록시히스피딘을 단백질에 추가했고, 생물 발광 강도를 상기 기술된 대로 분석했다. 50°C 이하의 온도에서 배양시킨 후에, 루시퍼라제는 활성을 최대 활성의 10% 넘게, 40°C 이하의 온도에서는 최대 활성의 30% 넘게, 38°C 이하의 온도에서는 70% 넘게, 및 34°C 이하의 온도부터는 활성을 100% 유지했다.

[ 실시예 8. 세포 표지를 위한 네오노토파누스 남비 로부터의 루시퍼라제의 이용]

실시예 3에 기술된 대로 수득된, 거대세포 바이러스 프로모터(cytomegaloviral promoter)의 제어하에 있는 네오노토파누스 남비로부터의 루시퍼라제를 포함하는 벡터를 붉은색 형광 단백질을 암호화하는 pTurboFP635-N 벡터 (러시아 소재, Evrogen)와 함께 HEK293NT 세포주의 세포로 공동-형질주입했다. FuGENE HD 형질주입 시약 (Promega)을 이용해서, 제조사가 권고한 프로토콜에 따라서 형질주입을 수행했다. 형질주입 절차 24시간 후에, 3-히드록시히스피딘을 배지에 660 μg/ml의 최종농도로 추가했고, 20x 대물렌즈와 Leica DM6000 현미경을 이용해서 세포 발광을 분석했다. 세포를 투과광(transmitted light)에서, 형광을 검출하는 초록색 채널과 붉은색 채널에서 가시화했다 (도 6). 인간 세포에서 네오노 토파누스 남비로부터의 루시퍼라제의 발현은 스펙트럼의 초록색 영역에서 분명한 광신호를 야기한다. 세포에 대한 루시퍼라제 발현의 독성에 대한 신호는 나타나지 않았다.

[ 실시예 9. 네오노토파누스 남비로 부터의 루시퍼라제를 이용한 단백질의 표지]

실시예 3에 기술된 대로 수득된, 네오노토파누스 남비로부터의 루시퍼라제를 암호화하는 인간화된 핵산을 세포질 베타-액틴(cytoplasmic beta-actin) 및 인간 피브릴라린(fibrillarin)을 암호화하는 핵산에 작동 가능하게 융합했다 (인-프레임 방식으로 클로닝함). 실시예 3에 기술된 대로, 수득된 제작물을 pmKate2-케라틴 벡터로 클로닝했다. 형질주입 절차 24시간 후에, 3-히드록시히스피딘을 배양 배지에 최종 농도 660 μg/ml까지 추가했고, 기록된 생물 발광은 대응하는 세포 단백질의 전형적인 세포내 국소화 패턴에 일치했다.

[ 실시예 10. 네오노토파누스 남비로 부터의 루시퍼라제를 이용한 세포 소기관의 표지]

실시예 3에 기술된 대로 인간 세포에서의 발현에 최적화되고 수득된, 네오노토파누스 남비로부터의 루시퍼라제의 서열의 변이체를 다음의 세포내 국소화 신호에 인-프레임 방식으로 작동 가능하게 융합했다: 인간 사이토크롬 산화효소(cytochrome oxidase)의 서브 유닛 7로부터의 미토콘드리아 표적 신호(mitochondrial targeting signal, MTS); 인간 베타 1-4 갈락토실 전이효소의 N-말단의 81 아미노산에 의해 암호화되는 신호 [Watzele and Berger, Nucleic Acids. Res., 1990, 18:7174]; 퍼옥시좀 표적 신호(peroxisomal targeting signal) [Gould et al. J. Biol. Chem., 1989, 108: 1657-1664; Gould et al. EMBO J., 1990, 9: 85-90; Monosov et al., J. Histo. Cytochem., 1996, 44: 581-589]; SV40 T 항원의 핵 국소화 신호(nuclear localization signal, NLS)의 세 카피 (copy) [Kalderon et al., Cell, 1984, 39: 499-509; Lanford et al., Cell, 1986, 46: 575-582]. 네오노토파누스 남비로부터의 루시퍼라제와의 키메라 제작물을 발현하는, 플라스미드와 HeLa Kyoto 세포의 형질주입은 대응하는 세포내 소기관으로의 키메라 단백질의 효율적인 전달을 야기했다. 매질에 3-히드록시히스피딘을 최종 농도 660 μg/ml로 추가하는 것을 수반하는 형질주입 24시간 후에, 생물 발광이 검출되었다.

[ 실시예 11. 전체 유기체 내에 있는 세포의 표지]

거대세포 바이러스 프로모터의 제어하에 있는 네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 포함하는 벡터를 실시예 3에 기술된 대로 수득했다. 또한, 포티누스 피랄리스 ( Photinus pyralis ) 반딧불이로부터의 루시퍼라제를 암호화하는 인간화된 뉴클레오티드 서열을 합성해서 동일한 벡터로 클로닝했다.

수득된 제작물을 CT26 세포 [생쥐( Mus musculus ) 암종 세포)]의 형질주입에 이용했다. 네오노토파누스 남비로부터의 루시퍼라제를 발현하는 세포를 마우스의 등의 좌측 반부에 피하로 주사한 반면, 포티누스 피랄리스의 루시퍼라제를 발현하는 세포를 동일한 방식으로 마우스의 등의 우측 반부에 주사했다. 주사 10분 후에, 균류 루시페린 (0.5 mg)과 포티누스 피랄리스 반딧불이 루시페린 (0.5 mg)의 혼합물을 복강내로 주사했다. 그런 다음에, 마우스의 생물 발광을 IVIS 스펙트럼 CT (PerkinElmer)를 이용하여 가시화했다. 네오노토파누스 남비로부터의 루시퍼라제를 발현하는 종양은 20000000 cu의 빛 방출의 강도를 보이며, 포티누스 피랄리스로부터의 루시퍼라제를 발현하는 종양은 21000000 cu의 빛 방출의 강도를 보였다 (도 9).

SP6 mMessage mMachine 키트 (미국 소재, Ambion)로부터의 SP6 중합효소를 이용하여, 루시퍼라제 유전자를 포함하는 Acc65I 선형화된 pCS2+ 벡터의 시험관내 전사를 통해 네오노토파누스 남비로부터의 루시퍼라제의 mRNA를 수득했다. mRNA를 CleanRNA Standard 키트 (Evrogen)에 의해 더 정제했고, 2-세포기(two-cell) 아프리카 발톱 개구리 배아의 두 할구 모두에, 할구 당 500 pg의 mRNA를 주사했다. 가시화를 위해, 초기 낭배기(gastrula stage) (단계 10.5)에서 660 μg/ml의 루시페린 용액을 배아의 할구에 주사했다. 신경관형성 (단계 16-17) 동안에, Leica DM6000 현미경을 이용해서, 현미경의 초록색 형광 검출 및 붉은색 형광 검출 채널에서, 5x 대물렌즈로, 로다민(rhodamine) 염색 후의 배아 발광을 검출했다 (도 10). 생물 발광 신호를 배아의 신경 조직에서 검출했다.

[ 실시예 12. 다중클론 항체의 제조]

서열번호 19에 나타낸 막 관통 도메인의 결실이 있는, 네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 이중-가닥 DNA로서 합성적으로 수득해서, 생성되는 재조합 단백질의 N-말단이 his-태그를 포함하는 방식으로, pQE-30 발현 벡터 (독일 소재, Qiagen)에 클로닝했다. 대장균에서의 발현 후에, 재조합 단백질을 변성 조건하에서 금속-친화도 TALON 수지 (Clontech)로 정제했다. 프로인드 보강제(Freund's adjuvant) 중에 유화된, 정제된 단백질 제제를 4번의 토끼의 면역화(immunization)에 매월 이용했다. 면역화 후 10일째 또는 11일째에서 토끼의 혈액을 채혈했다. 수득된 다중클론 항혈청의 활성을 ELISA와 웨스턴 면역 블로팅법(Western immunoblotting method)을 이용하여 재조합 단백질에 의해 입증했다.

[ 실시예 13. 형질전환 식물의 획득]

네오노토파누스 남비로부터의 루시퍼라제의 코딩 서열을 피스코미트렐라 파 텐스(Physcomitrella patens) 이끼 세포 (서열번호 54)에서의 발현을 위해 최적화했다. 그런 다음에, 벼의 aktI 유전자의 프로모터, 인간 거대세포 바이러스의 5'-비번역 영역, 루시퍼라제의 코딩 서열, 종결 코돈, 및 아그로박테리움 투메파키엔스 (Agrobacterium tumefaciens ) osc 유전자로부터의 종결 서열을 포함하는 전사 유닛(transcriptional unit)을 인 실리코(in silico)로 고안했다. 수득된 서열을 합성적으로 생성해서, 깁슨 어셈블리법 [Gibson et al., Nat Methods, 2009, 6: 343-5]을 이용하여 pLand#1 발현 벡터로, 피스코미트렐라 파텐스 이끼의 게놈 DNA의 유전자 자리와 부합하는 DNA 단편 사이 - 고도로 발현되는 이끼 유전자 Pp3c16_6440V3.1과 Pp3c16_6460V3.1의 서열 사이에 있는 - 에 클로닝했다. pLand#1 벡터는 동일한 DNA 유전자 자리 영역에 상보적인, Cas9 핵산 가수분해 효소에 대한 가이드 RNA의 서열(sgRNA)을 또한 포함했다.

[Cove et al., Cold Spring Harb Protoc., 2009, 2]에 기술된 폴리에틸렌 글리콜 형질전환 프로토콜에 따라서, 플라스미드 DNA 제제를 Cas9 핵산 가수분해 효소 서열을 포함하는 발현 벡터와 피스코미트렐라 파텐스 원형질체로 공동 형질전환했다. 그런 다음에, 형질전환체를 50 rpm에서 교반하면서, BCD 배지에서 2일 동안 어둠 속에서 배양시켜 세포벽을 재생시켰다. 그런 다음에, 원형질체를 한천과 BCD 매질을 포함하는 페트리 접시로 옮겨서, 일주일 동안 16시간의 조명(illumination)하에서 성장시켰다. 형질전환된 이끼 콜로니를 외부 게놈 프라이머(external genomic primer)로부터 PCR에 의해 스크리닝해서 게놈으로의 유전적 제작물의 통합을 평가했고, 새로운 페트리 접시로 옮겨서 30일 동안 동일한 조명 조건하에서 성장시켰다.

수득된 이끼 배우체를 농도가 660 μg/ml인 3-히드록시히스피딘을 포함하는 BCD 배치에 침지했고(soaking), IVIS 스펙트럼 인 비보 영상화 시스템 (PerkinElmer)으로 분석했다. 모든 샘플 형질전환 식물은 3-히드록시히스피딘을 포함하는 동일한 용액에서 배양된 야생형 대조 식물의 신호 강도보다 적어도 두 크기 정도(two orders of magnitude)가 큰 강도를 갖는 생물 발광을 보였다.

[ 실시예 14. 형질전환 동물의 획득]

[Hisano et al., Sci Rep., 2015, 5:8841]에 기술된 방법에 따라서, 네오노 토파누스 남비로부터의 루시퍼라제의 유전자를 포함하는, 형질전환 어류 [ 다니오 레리오(Danio rerio )]를 고안했다. 형질전환 동물을 고안하기 위해, T7 박테리오파지 중합효소 프로모터의 제어하에 있는, 가이드 RNA와 Cas9 핵산 가수분해 효소의 mRNA의 서열을 포함하는 DNA 단편을 합성했다. MAXIscript T7 키트 (미국 소재, Life Technologies)로부터의 시약을 이용해서, 수득된 단편을 시험관내 전사에 이용했고, 합성된 RNA를 RNA 분리 키트 (러시아 소재, Evrogen)를 이용해서 정제했다. 네오노토파누스 남비로부터의 루시퍼라제의 유전자를 포함하는 공여 벡터 (donor vector) 서열 - 다니오 레리오 유전자인, krtt1c19e로부터의 50개의 뉴클레오티드 서열이 플랭킹(flanking)된 - 또한 합성적으로 수득했다. 공여 벡터, Cas9 핵산 가수분해 효소의 mRNA 및 가이드 RNA를 주사 완충액 (40 mM HEPES, pH 7.4, 240 mM KCl, 0.5% 페놀 레드를 추가함)에 용해시켜서, 약 1-2 nl의 부피로 1-2-세포기 다니오 레리오 배아에 주사했다. 70개의 배아 중 약 50개의 배아가 주사 후에 생존했고, 수정 후 4일째에 정상적인 발달을 보였다.

생물 발광 신호를 기록하기 위해, [Cosentino et al., J Vis Exp. 2010; (42): 2079]에 기술된 절차에 따라서 3-히드록시히스피딘의 용액을 다니오 레리오 유생(larvae)에 정맥으로 주사했다. IVIS 스펙트럼 인 비보 영상화 시스템 (PerkinElmer)을 이용해 생물 발광을 기록했다. 측정 후에, 게놈 DNA를 유생으로부터 분리해서 게놈으로의 루시퍼라제 유전자의 통합을 확인했다. 네오노토파누스 남비로부터의 루시퍼라제의 유전자의 게놈 통합이 올바르게 된 모든 유생은 3-히드록시히스피딘 용액의 주사 후의 야생형 어류로부터의 신호의 강도보다 적어도 한 크기 정도(an order of magnitude)가 큰 강도를 갖는 생물 발광을 보였다.

각각의 개별적인 간행물 또는 특허 출원이 구체적이고 개별적으로 본원에 참고로 포함된다는 것을 나타내는 경우와 마찬가지로, 모든 간행물 및 특허 출원이 본원에 참고로 포함된다. 각 간행물의 인용이 예시로서 제공되고, 본 발명의 이해에 있어서 유용할 수 있다. 명확하게 또는 내재적으로 참고된 임의의 간행물이 선행 기술이라는 것을 인정하는 것은 아니다.

SEQUENCE LISTING <110> OBSCHESTVO S OGRANICHENNOY OTVETSTVENNOSTYU "PLANTA" <120> NOVEL LUCIFERASES AND METHODS FOR USING SAME <130> 000002747 <150> RU 2017102986 <151> 2017-01-30 <160> 54 <170> PatentIn version 3.5 <210> 1 <211> 801 <212> DNA <213> Neonothopanus nambi <400> 1 atgcgcatta acattagcct ctcgtctctc ttcgaacgtc tctccaaact tagcagtcgc 60 agcatagcga ttacatgtgg agttgttctc gcctccgcaa tcgcctttcc catcatccgc 120 agagactacc agactttcct agaagtggga ccctcgtacg ctccgcagaa ctttagagga 180 tacatcatcg tctgtgtcct ctcgctattc cgccaagagc agaaagggct cgccatctat 240 gatcgtcttc ccgagaaacg caggtggttg gccgaccttc cctttcgtga aggaaccaga 300 cccagcatta ccagccatat cattcagcga cagcgcactc aactggtcga tcaggagttt 360 gccaccaggg agctcataga caaggtcatc cctcgcgtgc aagcacgaca caccgacaaa 420 acgttcctca gcacatcaaa gttcgagttt catgcgaagg ccatatttct cttgccttct 480 atcccaatca acgaccctct gaatatccct agccacgaca ctgtccgccg aacgaagcgc 540 gagattgcac atatgcatga ttatcatgat tgcacacttc atcttgctct cgctgcgcag 600 gatggaaagg aggtgctgaa gaaaggttgg ggacaacgac atcctttggc tggtcctgga 660 gttcctggtc caccaacgga atggactttt ctttatgcgc ctcgcaacga agaagaggct 720 cgagtagtgg agatgatcgt tgaggcttcc atagggtata tgacgaacga tcctgcagga 780 aagattgtag aaaacgccaa g 801 <210> 2 <211> 267 <212> PRT <213> Neonothopanus nambi <400> 2 Met Arg Ile Asn Ile Ser Leu Ser Ser Leu Phe Glu Arg Leu Ser Lys 1 5 10 15 Leu Ser Ser Arg Ser Ile Ala Ile Thr Cys Gly Val Val Leu Ala Ser 20 25 30 Ala Ile Ala Phe Pro Ile Ile Arg Arg Asp Tyr Gln Thr Phe Leu Glu 35 40 45 Val Gly Pro Ser Tyr Ala Pro Gln Asn Phe Arg Gly Tyr Ile Ile Val 50 55 60 Cys Val Leu Ser Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr 65 70 75 80 Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Ala Asp Leu Pro Phe Arg 85 90 95 Glu Gly Thr Arg Pro Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg 100 105 110 Thr Gln Leu Val Asp Gln Glu Phe Ala Thr Arg Glu Leu Ile Asp Lys 115 120 125 Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Lys Thr Phe Leu Ser 130 135 140 Thr Ser Lys Phe Glu Phe His Ala Lys Ala Ile Phe Leu Leu Pro Ser 145 150 155 160 Ile Pro Ile Asn Asp Pro Leu Asn Ile Pro Ser His Asp Thr Val Arg 165 170 175 Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Cys Thr 180 185 190 Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Leu Lys Lys 195 200 205 Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro 210 215 220 Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Glu Glu Ala 225 230 235 240 Arg Val Val Glu Met Ile Val Glu Ala Ser Ile Gly Tyr Met Thr Asn 245 250 255 Asp Pro Ala Gly Lys Ile Val Glu Asn Ala Lys 260 265 <210> 3 <211> 798 <212> DNA <213> Armillaria gallica <400> 3 atgtccttca tcgacagcat gaaacttgac ctcgtcggac acctctttgg catcaggaat 60 cgcggcttag ccgccgcttg ttgtgctcta gcagtcgcct ctactatcgc cttcccttac 120 attcgtaggg actaccagac atttttatct ggcggtccct cttacgctcc ccagaatatc 180 agaggatatt tcatcgtctg cgttctggcc ttgttccgtc aggagcaaaa gggccttgcg 240 atatatgatc gccttcccga gaagcgcagg tggctgcctg acttgcctcc tcgcaatggc 300 ccgcggccga tcacgaccag ccatataatc caaagacagc gcaaccaggc gccggacccc 360 aagttcgccc tcgaggaact caaggccacg gttattccac gggtgcaggc tcgccatact 420 gacctcaccc atctcagcct atccaaattc gagttccatg ctgaagcaat tttcctgctc 480 ccctctgtac ccatcgatga tccaaaaaat gttccaagtc acgacacggt gcgcaggacg 540 aaaagggaga tcgcgcatat gcacgactac catgacttca cgctgcatct tgcactggcc 600 gcccaagacg ggaaggaagt cgtgtcgaag ggatgggggc agcgacaccc cctagcaggc 660 cctggcgttc ctggtccacc tacggagtgg acatttattt atgcgccacg taacgaagag 720 gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780 gctggagtag ttatcgca 798 <210> 4 <211> 266 <212> PRT <213> Armillaria gallica <400> 4 Met Ser Phe Ile Asp Ser Met Lys Leu Asp Leu Val Gly His Leu Phe 1 5 10 15 Gly Ile Arg Asn Arg Gly Leu Ala Ala Ala Cys Cys Ala Leu Ala Val 20 25 30 Ala Ser Thr Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe 35 40 45 Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Phe 50 55 60 Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala 65 70 75 80 Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro 85 90 95 Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg 100 105 110 Gln Arg Asn Gln Ala Pro Asp Pro Lys Phe Ala Leu Glu Glu Leu Lys 115 120 125 Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His 130 135 140 Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu 145 150 155 160 Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr 165 170 175 Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp 180 185 190 Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val 195 200 205 Ser Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro 210 215 220 Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu 225 230 235 240 Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met 245 250 255 Thr Asn Asp Pro Ala Gly Val Val Ile Ala 260 265 <210> 5 <211> 801 <212> DNA <213> Armillaria mellea <400> 5 atgtccttct tcgacagcgt gaaacttgac ctcgtcggac gcctctttgg catcaggaat 60 cgcggcttag ctgttacttg ttgtgctgtg gcagtcgcct ctatcatcgc gttcccttac 120 attcgtaggg actaccagac atttttatct gggggtccct cctacgctcc ccagaacatc 180 agaggatacc tcattgtctg cgtcctggcc ttgttccgtc aggagcaaaa aggccttgcg 240 atatacgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcgatggc 300 ccacggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccggacctc 360 aagttcgccc tcgaggaact caaggccacg gtcattccac gggtgcaggc tcgccacact 420 gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480 ccctctgtac ccatcgatga tccaaagaat gtgccaagtc acgacacggt gcgcaggacg 540 aagagggaaa ttgcgcatat gcacgactac catgactaca cgctgcatct tgcgttggcc 600 gcccaagacg ggaaggaagt cgtatcaaag ggatgggggc agcgacaccc gctggcaggc 660 cctggcgttc ctggtccacc gacggagtgg acgtttattt atgcgccacg taacgaagag 720 gagctggcag tggtggaaat gattatcgag gcatcgatag gctatatgac caatgaccct 780 gcaggaaaaa ctatcgcata g 801 <210> 6 <211> 266 <212> PRT <213> Armillaria mellea <400> 6 Met Ser Phe Phe Asp Ser Val Lys Leu Asp Leu Val Gly Arg Leu Phe 1 5 10 15 Gly Ile Arg Asn Arg Gly Leu Ala Val Thr Cys Cys Ala Val Ala Val 20 25 30 Ala Ser Ile Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe 35 40 45 Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Leu 50 55 60 Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala 65 70 75 80 Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro 85 90 95 Pro Arg Asp Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg 100 105 110 Gln Arg Asn Gln Ala Pro Asp Leu Lys Phe Ala Leu Glu Glu Leu Lys 115 120 125 Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His 130 135 140 Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu 145 150 155 160 Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr 165 170 175 Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp 180 185 190 Tyr Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val 195 200 205 Ser Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro 210 215 220 Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu 225 230 235 240 Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met 245 250 255 Thr Asn Asp Pro Ala Gly Lys Thr Ile Ala 260 265 <210> 7 <211> 801 <212> DNA <213> Armillaria ostoyae <400> 7 atgtccttca tcgacagcat gaaacttgac ttcgtcggac acctctttgg catcaggaat 60 cgcggcttag ccaccgcttg ttgtgctgtg gcagtcgctt ctgccatcgc cttcccttac 120 attcgtaggg actaccagac attcttatct ggcggtccct cttacgctcc ccagaacatc 180 aaaggatatc tcatcgtctg cgtcctggcc ttgttccgtc aggagcaaaa gggccttgcg 240 atatatgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcaatggc 300 ccgcggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccagactcc 360 aagttcgccc tcgaggaact caaggctacg gtcattccac gggtgcaggc tcgccacact 420 gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480 ccctctgtac ccatcgatga tccaaaaaat gttccaagtc atgacacggt gcgcaggacg 540 aagagggaga tcgcgcatat gcacgactac catgacttta cgttgcatct tgcactggcc 600 gcccaagacg ggaaggaagt cgtggcgaag ggatgggggc agcgacaccc gctggcaggc 660 cctggcgttc ctggtccacc tacggagtgg acgtttattt atgcgccacg taacgaagag 720 gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780 gctggaacag ttatcgtata g 801 <210> 8 <211> 266 <212> PRT <213> Armillaria ostoyae <400> 8 Met Ser Phe Ile Asp Ser Met Lys Leu Asp Phe Val Gly His Leu Phe 1 5 10 15 Gly Ile Arg Asn Arg Gly Leu Ala Thr Ala Cys Cys Ala Val Ala Val 20 25 30 Ala Ser Ala Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe 35 40 45 Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Lys Gly Tyr Leu 50 55 60 Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala 65 70 75 80 Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro 85 90 95 Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg 100 105 110 Gln Arg Asn Gln Ala Pro Asp Ser Lys Phe Ala Leu Glu Glu Leu Lys 115 120 125 Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His 130 135 140 Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu 145 150 155 160 Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr 165 170 175 Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp 180 185 190 Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val 195 200 205 Ala Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro 210 215 220 Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu 225 230 235 240 Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met 245 250 255 Thr Asn Asp Pro Ala Gly Thr Val Ile Val 260 265 <210> 9 <211> 753 <212> DNA <213> Mycena chlorophos <400> 9 atggtccaac tcacccgaac ctccggattc atcgccgctg cggccattgt tgctgccatc 60 gccttcccgt tcattcgtcg agactaccag acgttccttc gtggtgggcc gtcctatgcc 120 ccacagaaca tccgcggcta tatcatcgtc ctggttctgt ccctcttccg cggcgaggag 180 aagggtcttg caatctacga gccccttcct gagaagcgca catggctgcc ggagcttccg 240 cggcgcgcgg gagaccggcc caagacgacg agccacatca tccaacggca gctcgaccag 300 taccccgacc cggactttgt cctcaaagcc ctgaaagcga cggtcatccc gcgtgtccaa 360 gcccggcaca cagacaagac tcacctcgcg ctgtccaagt tcgagttcca tgctgaggcc 420 atcttcgtgc gcccggaaat cgccatcgac gacccgaagc atatccccag ccacgacacg 480 gtgcgacgga cgaagcgcga gattgcgcac atgcacgact atcacgactg cacgctgcat 540 ttggcgctag cggcgcagga cgcgaagcag gtgctgcaga agggctgggg ccagcgccat 600 ccgctggcag ggcctgggat gcccgggccg cccacggagt ggacgttctt gtatgccccg 660 aggaccgagg aggaagtgaa ggttgtggag accattgtcg aggcctctat cgcgtacatg 720 acgaacgcgg agaagccggt cgagctggtg cag 753 <210> 10 <211> 251 <212> PRT <213> Mycena chlorophos <400> 10 Met Val Gln Leu Thr Arg Thr Ser Gly Phe Ile Ala Ala Ala Ala Ile 1 5 10 15 Val Ala Ala Ile Ala Phe Pro Phe Ile Arg Arg Asp Tyr Gln Thr Phe 20 25 30 Leu Arg Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Arg Gly Tyr Ile 35 40 45 Ile Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Lys Gly Leu Ala 50 55 60 Ile Tyr Glu Pro Leu Pro Glu Lys Arg Thr Trp Leu Pro Glu Leu Pro 65 70 75 80 Arg Arg Ala Gly Asp Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg 85 90 95 Gln Leu Asp Gln Tyr Pro Asp Pro Asp Phe Val Leu Lys Ala Leu Lys 100 105 110 Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Lys Thr His 115 120 125 Leu Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Val Arg 130 135 140 Pro Glu Ile Ala Ile Asp Asp Pro Lys His Ile Pro Ser His Asp Thr 145 150 155 160 Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp 165 170 175 Cys Thr Leu His Leu Ala Leu Ala Ala Gln Asp Ala Lys Gln Val Leu 180 185 190 Gln Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro 195 200 205 Gly Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Thr Glu Glu 210 215 220 Glu Val Lys Val Val Glu Thr Ile Val Glu Ala Ser Ile Ala Tyr Met 225 230 235 240 Thr Asn Ala Glu Lys Pro Val Glu Leu Val Gln 245 250 <210> 11 <211> 738 <212> DNA <213> Mycena citricolor <400> 11 atggcttatc agctcacttg gattcagact ctcgtgctgg gtgcccttgt ggcaatggca 60 gtagcgttcc ccttcatcaa gaaagactac gagacgttcc tgaagggcgg cccctcctat 120 gcgccccaaa acgttcgcgg atacatcatc gtgctcgtgc tcgcgctctt ccgccaagag 180 cagctcgggc tggagatcta cgaccgcatg cccgagaaac gtcgctggct cgcgaatctc 240 cctcagcgcg agggcccccg ccccaagacc acaagtcaca tcatccagcg gcagctcagc 300 cagcacacgg accccgcatt cggcgccgcg tacctcaaag acaccgtcat tccgcgcgtc 360 caggcgcggc acgcagccaa cacgcacatc gcgcgctcga cgttcgagtt ccacgccgcc 420 gcgatcttcc tgaacgcgga cgtgccgctg cccgagggcc tgcccgcaag cgagacggtg 480 cggcggacca agggcgagat cgcgcacatg cacgactacc acgacttcac gctgcacctc 540 gcgctcgcag cagcggatgg gaaggaggtg gtcggcaagg gctgggggca gcgccatccg 600 ctggcgggac ccggcgtgcc gggtccgccg aacgagtgga cctttgtgta tgcgccgagg 660 aatgaagagg agatgggcgt ggtcgagcag atcgtagagg cggcgattgg gtacatgtcg 720 aacgtgcctg cgctggaa 738 <210> 12 <211> 246 <212> PRT <213> Mycena citricolor <400> 12 Met Ala Tyr Gln Leu Thr Trp Ile Gln Thr Leu Val Leu Gly Ala Leu 1 5 10 15 Val Ala Met Ala Val Ala Phe Pro Phe Ile Lys Lys Asp Tyr Glu Thr 20 25 30 Phe Leu Lys Gly Gly Pro Ser Tyr Ala Pro Gln Asn Val Arg Gly Tyr 35 40 45 Ile Ile Val Leu Val Leu Ala Leu Phe Arg Gln Glu Gln Leu Gly Leu 50 55 60 Glu Ile Tyr Asp Arg Met Pro Glu Lys Arg Arg Trp Leu Ala Asn Leu 65 70 75 80 Pro Gln Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln 85 90 95 Arg Gln Leu Ser Gln His Thr Asp Pro Ala Phe Gly Ala Ala Tyr Leu 100 105 110 Lys Asp Thr Val Ile Pro Arg Val Gln Ala Arg His Ala Ala Asn Thr 115 120 125 His Ile Ala Arg Ser Thr Phe Glu Phe His Ala Ala Ala Ile Phe Leu 130 135 140 Asn Ala Asp Val Pro Leu Pro Glu Gly Leu Pro Ala Ser Glu Thr Val 145 150 155 160 Arg Arg Thr Lys Gly Glu Ile Ala His Met His Asp Tyr His Asp Phe 165 170 175 Thr Leu His Leu Ala Leu Ala Ala Ala Asp Gly Lys Glu Val Val Gly 180 185 190 Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro Gly 195 200 205 Pro Pro Asn Glu Trp Thr Phe Val Tyr Ala Pro Arg Asn Glu Glu Glu 210 215 220 Met Gly Val Val Glu Gln Ile Val Glu Ala Ala Ile Gly Tyr Met Ser 225 230 235 240 Asn Val Pro Ala Leu Glu 245 <210> 13 <211> 786 <212> DNA <213> Omphalotus olearius <400> 13 atgctcccag ctttcatcta caaaccaagg ctagtgatca cttgtgtatt cgttctggcc 60 tccgcactcg catttccctt catacgcaaa gattaccaga ctttcctgga ggtgggaccc 120 tcgtacgccc cgcagaacct ccaaggatac atcatcgtct gtgtactctc tctgttccgg 180 caagaacaga aagacgtagc gatttatgat cgccttcctg agaaaaggag gtggttagga 240 gacctcccgt ttcgcgaggg gccaagaccg agtatcacta gccatatcat ccagcgacag 300 cgcacccaat tggctgacgc cgagttcgct accaaagagc tgataggcaa aatcatccct 360 cgcgtccaag cccgacacac caacacaaca ttcctcagca catctaaatt cgaattccac 420 gcccaggcca tcttcctttt gccctctatc ccaatcaacg accctcaaaa cattccaagc 480 cacgataccg ttcgtcgcac gaaacgcgag atcgcgcata tgcatgatta tcacgactgt 540 acgttgcatc tcgcacttgc tgctcaagat gggaaggagg ttttagagaa aggatggggt 600 cagcgacatc ctcttgctgg acctggtgtt cctggcccgc cgacggagtg gacgtttctt 660 tatgcaccgc gcagcgaaga ggaggttcgg gttgtggaga tgattgttga ggcatcagtt 720 gtgtatatga cgaatgatcc tgcggataaa atcgtagaag ctactgtgca gggtactgaa 780 gaatag 786 <210> 14 <211> 261 <212> PRT <213> Omphalotus olearius <400> 14 Met Leu Pro Ala Phe Ile Tyr Lys Pro Arg Leu Val Ile Thr Cys Val 1 5 10 15 Phe Val Leu Ala Ser Ala Leu Ala Phe Pro Phe Ile Arg Lys Asp Tyr 20 25 30 Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln 35 40 45 Gly Tyr Ile Ile Val Cys Val Leu Ser Leu Phe Arg Gln Glu Gln Lys 50 55 60 Asp Val Ala Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Gly 65 70 75 80 Asp Leu Pro Phe Arg Glu Gly Pro Arg Pro Ser Ile Thr Ser His Ile 85 90 95 Ile Gln Arg Gln Arg Thr Gln Leu Ala Asp Ala Glu Phe Ala Thr Lys 100 105 110 Glu Leu Ile Gly Lys Ile Ile Pro Arg Val Gln Ala Arg His Thr Asn 115 120 125 Thr Thr Phe Leu Ser Thr Ser Lys Phe Glu Phe His Ala Gln Ala Ile 130 135 140 Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp Pro Gln Asn Ile Pro Ser 145 150 155 160 His Asp Thr Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp 165 170 175 Tyr His Asp Cys Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys 180 185 190 Glu Val Leu Glu Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro 195 200 205 Gly Val Pro Gly Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg 210 215 220 Ser Glu Glu Glu Val Arg Val Val Glu Met Ile Val Glu Ala Ser Val 225 230 235 240 Val Tyr Met Thr Asn Asp Pro Ala Asp Lys Ile Val Glu Ala Thr Val 245 250 255 Gln Gly Thr Glu Glu 260 <210> 15 <211> 747 <212> DNA <213> Panellus stipticus <400> 15 atgaacatca acctgaaagc tctgatcgga gtctgtgccg tgctcatcac cgctgcagtg 60 ttccccttcg ttcgtaaaga ctatcacacc tttcttgaag gtggaccatc ctacgcgccg 120 cagaatttgc aaggctatat catcgtgttg gtgctctcac tctttcgagg ggaggagacg 180 ggattggaaa tatacgaccg cttgcccgaa aaacgccgct ggctcgagga gctgcctgtt 240 cgcgaaggcc cgcgcccaaa gacaaccagc cacatcattc agagacagtt gaatcagcac 300 gttgacccgg acttcggaat gaactctttg aaaggctccg tcatccggcg ccttcaatcc 360 cgccaccagg acataactca actcgcactc tcgaaattcg aattccacgc cgaggccata 420 tttctgcgcc ccgatgtcgc gatcaacgat cccaaacacg tcccgagcca cgacacggtg 480 cgccgcacaa agcgcgagat agctcacatg cacgactacc atgattacac gtgtcatttg 540 gcgctcgcag cgcaggatgg gaagcaagtg attgcaaaag ggtggggcca gagacatccg 600 ctcgccggac cgggcatgcc ggggccgccg acggagtgga catttttgta tgcgccgagg 660 aatgaggcgg aggttcaagt gttggagacg attatcgaag cgtcaatcgg gtacatgtcg 720 aacgcaccag ccttgggtgg gagcgag 747 <210> 16 <211> 249 <212> PRT <213> Panellus stipticus <400> 16 Met Asn Ile Asn Leu Lys Ala Leu Ile Gly Val Cys Ala Val Leu Ile 1 5 10 15 Thr Ala Ala Val Phe Pro Phe Val Arg Lys Asp Tyr His Thr Phe Leu 20 25 30 Glu Gly Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile 35 40 45 Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile 50 55 60 Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Glu Glu Leu Pro Val 65 70 75 80 Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg Gln 85 90 95 Leu Asn Gln His Val Asp Pro Asp Phe Gly Met Asn Ser Leu Lys Gly 100 105 110 Ser Val Ile Arg Arg Leu Gln Ser Arg His Gln Asp Ile Thr Gln Leu 115 120 125 Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Arg Pro 130 135 140 Asp Val Ala Ile Asn Asp Pro Lys His Val Pro Ser His Asp Thr Val 145 150 155 160 Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Tyr 165 170 175 Thr Cys His Leu Ala Leu Ala Ala Gln Asp Gly Lys Gln Val Ile Ala 180 185 190 Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro Gly 195 200 205 Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu 210 215 220 Val Gln Val Leu Glu Thr Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser 225 230 235 240 Asn Ala Pro Ala Leu Gly Gly Ser Glu 245 <210> 17 <211> 747 <212> DNA <213> Panellus stipticus <400> 17 atgaacatca acctgaaagc tctgatcgga gtctgtgccg tgctcatcac cgctgcagtg 60 ttccccttcg ttcgtaaaga ctatcacacc tttcttgaag gtggaccatc ctacgcgccg 120 cagaatttgc aaggctatat catcgtgttg gtgctctcac tctttcgagg ggaggagacg 180 ggattggaaa tatacgaccg cttgcccgaa aaacgccgct ggctcgagga gctgcctgtt 240 cgcgaaggcc cgcgcccaaa gacaaccagc cacatcattc agagacagtt gaatcagcac 300 gttgacccgg acttcggaat gaactctttg aaaggctccg tcatccggcg ccttcaatcc 360 cgccaccagg acataactca actcgcactc tcgaaattcg aattccacgc cgaggccata 420 tttctgcgcc ccgatatcgc gatcaacgat cccaaacacg tcccgagcca cgacacggtg 480 cgccgcacaa agcgcgagat agctcacatg cacgactacc atgattacac gtgtcatttg 540 gcgctcgcag cgcaggatgg gaagcaagtg attgcaaaag ggtggggcca gagacatccg 600 ctcgccggac cgggcatgcc ggggccgccg acggagtgga catttttgta tgcgccgagg 660 aatgaggcgg aggttcaagt gttggagacg attatcgaag cgtcaatcgg gtacatgtcg 720 aacgcaccag ccttgggtgg gagcgag 747 <210> 18 <211> 249 <212> PRT <213> Panellus stipticus <400> 18 Met Asn Ile Asn Leu Lys Ala Leu Ile Gly Val Cys Ala Val Leu Ile 1 5 10 15 Thr Ala Ala Val Phe Pro Phe Val Arg Lys Asp Tyr His Thr Phe Leu 20 25 30 Glu Gly Gly Pro Ser Tyr Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile 35 40 45 Val Leu Val Leu Ser Leu Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile 50 55 60 Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Glu Glu Leu Pro Val 65 70 75 80 Arg Glu Gly Pro Arg Pro Lys Thr Thr Ser His Ile Ile Gln Arg Gln 85 90 95 Leu Asn Gln His Val Asp Pro Asp Phe Gly Met Asn Ser Leu Lys Gly 100 105 110 Ser Val Ile Arg Arg Leu Gln Ser Arg His Gln Asp Ile Thr Gln Leu 115 120 125 Ala Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Arg Pro 130 135 140 Asp Ile Ala Ile Asn Asp Pro Lys His Val Pro Ser His Asp Thr Val 145 150 155 160 Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp Tyr 165 170 175 Thr Cys His Leu Ala Leu Ala Ala Gln Asp Gly Lys Gln Val Ile Ala 180 185 190 Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Met Pro Gly 195 200 205 Pro Pro Thr Glu Trp Thr Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu 210 215 220 Val Gln Val Leu Glu Thr Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser 225 230 235 240 Asn Ala Pro Ala Leu Gly Gly Ser Glu 245 <210> 19 <211> 690 <212> DNA <213> artificial sequence <220> <223> Nucleic acid coding the functional fragment of luciferase from Neonothopanus nambi <400> 19 atcatccgca gagactacca gactttccta gaagtgggac cctcgtacgc tccgcagaac 60 tttagaggat acatcatcgt ctgtgtcctc tcgctattcc gccaagagca gaaagggctc 120 gccatctatg atcgtcttcc cgagaaacgc aggtggttgg ccgaccttcc ctttcgtgaa 180 ggaaccagac ccagcattac cagccatatc attcagcgac agcgcactca actggtcgat 240 caggagtttg ccaccaggga gctcatagac aaggtcatcc ctcgcgtgca agcacgacac 300 accgacaaaa cgttcctcag cacatcaaag ttcgagtttc atgcgaaggc catatttctc 360 ttgccttcta tcccaatcaa cgaccctctg aatatcccta gccacgacac tgtccgccga 420 acgaagcgcg agattgcaca tatgcatgat tatcatgatt gcacacttca tcttgctctc 480 gctgcgcagg atggaaagga ggtgctgaag aaaggttggg gacaacgaca tcctttggct 540 ggtcctggag ttcctggtcc accaacggaa tggacttttc tttatgcgcc tcgcaacgaa 600 gaagaggctc gagtagtgga gatgatcgtt gaggcttcca tagggtatat gacgaacgat 660 cctgcaggaa agattgtaga aaacgccaag 690 <210> 20 <211> 230 <212> PRT <213> artificial sequence <220> <223> Amino acid sequence of the functional fragment of luciferase from Neonothopanus nambi <400> 20 Ile Ile Arg Arg Asp Tyr Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Phe Arg Gly Tyr Ile Ile Val Cys Val Leu Ser Leu 20 25 30 Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu 35 40 45 Lys Arg Arg Trp Leu Ala Asp Leu Pro Phe Arg Glu Gly Thr Arg Pro 50 55 60 Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg Thr Gln Leu Val Asp 65 70 75 80 Gln Glu Phe Ala Thr Arg Glu Leu Ile Asp Lys Val Ile Pro Arg Val 85 90 95 Gln Ala Arg His Thr Asp Lys Thr Phe Leu Ser Thr Ser Lys Phe Glu 100 105 110 Phe His Ala Lys Ala Ile Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp 115 120 125 Pro Leu Asn Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Gly Lys Glu Val Leu Lys Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Leu Tyr Ala Pro Arg Asn Glu Glu Glu Ala Arg Val Val Glu Met 195 200 205 Ile Val Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Lys 210 215 220 Ile Val Glu Asn Ala Lys 225 230 <210> 21 <211> 681 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Armillaria gallica <400> 21 tacattcgta gggactacca gacattttta tctggcggtc cctcttacgc tccccagaat 60 atcagaggat atttcatcgt ctgcgttctg gccttgttcc gtcaggagca aaagggcctt 120 gcgatatatg atcgccttcc cgagaagcgc aggtggctgc ctgacttgcc tcctcgcaat 180 ggcccgcggc cgatcacgac cagccatata atccaaagac agcgcaacca ggcgccggac 240 cccaagttcg ccctcgagga actcaaggcc acggttattc cacgggtgca ggctcgccat 300 actgacctca cccatctcag cctatccaaa ttcgagttcc atgctgaagc aattttcctg 360 ctcccctctg tacccatcga tgatccaaaa aatgttccaa gtcacgacac ggtgcgcagg 420 acgaaaaggg agatcgcgca tatgcacgac taccatgact tcacgctgca tcttgcactg 480 gccgcccaag acgggaagga agtcgtgtcg aagggatggg ggcagcgaca ccccctagca 540 ggccctggcg ttcctggtcc acctacggag tggacattta tttatgcgcc acgtaacgaa 600 gaggaactgg cagtggtgga aatgattatc gaggcatcaa taggctatat gaccaatgac 660 cctgctggag tagttatcgc a 681 <210> 22 <211> 227 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Armillaria gallica <400> 22 Tyr Ile Arg Arg Asp Tyr Gln Thr Phe Leu Ser Gly Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Ile Arg Gly Tyr Phe Ile Val Cys Val Leu Ala Leu 20 25 30 Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu 35 40 45 Lys Arg Arg Trp Leu Pro Asp Leu Pro Pro Arg Asn Gly Pro Arg Pro 50 55 60 Ile Thr Thr Ser His Ile Ile Gln Arg Gln Arg Asn Gln Ala Pro Asp 65 70 75 80 Pro Lys Phe Ala Leu Glu Glu Leu Lys Ala Thr Val Ile Pro Arg Val 85 90 95 Gln Ala Arg His Thr Asp Leu Thr His Leu Ser Leu Ser Lys Phe Glu 100 105 110 Phe His Ala Glu Ala Ile Phe Leu Leu Pro Ser Val Pro Ile Asp Asp 115 120 125 Pro Lys Asn Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Phe Thr Leu His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Gly Lys Glu Val Val Ser Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Ile Tyr Ala Pro Arg Asn Glu Glu Glu Leu Ala Val Val Glu Met 195 200 205 Ile Ile Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Val 210 215 220 Val Ile Ala 225 <210> 23 <211> 681 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Armillaria mellea <400> 23 tacattcgta gggactacca gacattttta tctgggggtc cctcctacgc tccccagaac 60 atcagaggat acctcattgt ctgcgtcctg gccttgttcc gtcaggagca aaaaggcctt 120 gcgatatacg accgccttcc cgagaagcgc aggtggctac ctgacttgcc tcctcgcgat 180 ggcccacggc ccatcacgac cagccatata atccaaagac agcgcaacca ggcgccggac 240 ctcaagttcg ccctcgagga actcaaggcc acggtcattc cacgggtgca ggctcgccac 300 actgacctca cccatctcag cctatccaag ttcgagttcc atgctgaagc aatcttcctg 360 ctcccctctg tacccatcga tgatccaaag aatgtgccaa gtcacgacac ggtgcgcagg 420 acgaagaggg aaattgcgca tatgcacgac taccatgact acacgctgca tcttgcgttg 480 gccgcccaag acgggaagga agtcgtatca aagggatggg ggcagcgaca cccgctggca 540 ggccctggcg ttcctggtcc accgacggag tggacgttta tttatgcgcc acgtaacgaa 600 gaggagctgg cagtggtgga aatgattatc gaggcatcga taggctatat gaccaatgac 660 cctgcaggaa aaactatcgc a 681 <210> 24 <211> 227 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Armillaria mellea <400> 24 Tyr Ile Arg Arg Asp Tyr Gln Thr Phe Leu Ser Gly Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Ile Arg Gly Tyr Leu Ile Val Cys Val Leu Ala Leu 20 25 30 Phe Arg Gln Glu Gln Lys Gly Leu Ala Ile Tyr Asp Arg Leu Pro Glu 35 40 45 Lys Arg Arg Trp Leu Pro Asp Leu Pro Pro Arg Asp Gly Pro Arg Pro 50 55 60 Ile Thr Thr Ser His Ile Ile Gln Arg Gln Arg Asn Gln Ala Pro Asp 65 70 75 80 Leu Lys Phe Ala Leu Glu Glu Leu Lys Ala Thr Val Ile Pro Arg Val 85 90 95 Gln Ala Arg His Thr Asp Leu Thr His Leu Ser Leu Ser Lys Phe Glu 100 105 110 Phe His Ala Glu Ala Ile Phe Leu Leu Pro Ser Val Pro Ile Asp Asp 115 120 125 Pro Lys Asn Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Tyr Thr Leu His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Gly Lys Glu Val Val Ser Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Ile Tyr Ala Pro Arg Asn Glu Glu Glu Leu Ala Val Val Glu Met 195 200 205 Ile Ile Glu Ala Ser Ile Gly Tyr Met Thr Asn Asp Pro Ala Gly Lys 210 215 220 Thr Ile Ala 225 <210> 25 <211> 798 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Armillaria ostoyae <400> 25 atgtccttca tcgacagcat gaaacttgac ttcgtcggac acctctttgg catcaggaat 60 cgcggcttag ccaccgcttg ttgtgctgtg gcagtcgctt ctgccatcgc cttcccttac 120 attcgtaggg actaccagac attcttatct ggcggtccct cttacgctcc ccagaacatc 180 aaaggatatc tcatcgtctg cgtcctggcc ttgttccgtc aggagcaaaa gggccttgcg 240 atatatgacc gccttcccga gaagcgcagg tggctacctg acttgcctcc tcgcaatggc 300 ccgcggccca tcacgaccag ccatataatc caaagacagc gcaaccaggc gccagactcc 360 aagttcgccc tcgaggaact caaggctacg gtcattccac gggtgcaggc tcgccacact 420 gacctcaccc atctcagcct atccaagttc gagttccatg ctgaagcaat cttcctgctc 480 ccctctgtac ccatcgatga tccaaaaaat gttccaagtc atgacacggt gcgcaggacg 540 aagagggaga tcgcgcatat gcacgactac catgacttta cgttgcatct tgcactggcc 600 gcccaagacg ggaaggaagt cgtggcgaag ggatgggggc agcgacaccc gctggcaggc 660 cctggcgttc ctggtccacc tacggagtgg acgtttattt atgcgccacg taacgaagag 720 gaactggcag tggtggaaat gattatcgag gcatcaatag gctatatgac caatgaccct 780 gctggaacag ttatcgta 798 <210> 26 <211> 266 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Armillaria ostoyae <400> 26 Met Ser Phe Ile Asp Ser Met Lys Leu Asp Phe Val Gly His Leu Phe 1 5 10 15 Gly Ile Arg Asn Arg Gly Leu Ala Thr Ala Cys Cys Ala Val Ala Val 20 25 30 Ala Ser Ala Ile Ala Phe Pro Tyr Ile Arg Arg Asp Tyr Gln Thr Phe 35 40 45 Leu Ser Gly Gly Pro Ser Tyr Ala Pro Gln Asn Ile Lys Gly Tyr Leu 50 55 60 Ile Val Cys Val Leu Ala Leu Phe Arg Gln Glu Gln Lys Gly Leu Ala 65 70 75 80 Ile Tyr Asp Arg Leu Pro Glu Lys Arg Arg Trp Leu Pro Asp Leu Pro 85 90 95 Pro Arg Asn Gly Pro Arg Pro Ile Thr Thr Ser His Ile Ile Gln Arg 100 105 110 Gln Arg Asn Gln Ala Pro Asp Ser Lys Phe Ala Leu Glu Glu Leu Lys 115 120 125 Ala Thr Val Ile Pro Arg Val Gln Ala Arg His Thr Asp Leu Thr His 130 135 140 Leu Ser Leu Ser Lys Phe Glu Phe His Ala Glu Ala Ile Phe Leu Leu 145 150 155 160 Pro Ser Val Pro Ile Asp Asp Pro Lys Asn Val Pro Ser His Asp Thr 165 170 175 Val Arg Arg Thr Lys Arg Glu Ile Ala His Met His Asp Tyr His Asp 180 185 190 Phe Thr Leu His Leu Ala Leu Ala Ala Gln Asp Gly Lys Glu Val Val 195 200 205 Ala Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Val Pro 210 215 220 Gly Pro Pro Thr Glu Trp Thr Phe Ile Tyr Ala Pro Arg Asn Glu Glu 225 230 235 240 Glu Leu Ala Val Val Glu Met Ile Ile Glu Ala Ser Ile Gly Tyr Met 245 250 255 Thr Asn Asp Pro Ala Gly Thr Val Ile Val 260 265 <210> 27 <211> 684 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Mycena chlorophos <400> 27 ttcattcgtc gagactacca gacgttcctt cgtggtgggc cgtcctatgc cccacagaac 60 atccgcggct atatcatcgt cctggttctg tccctcttcc gcggcgagga gaagggtctt 120 gcaatctacg agccccttcc tgagaagcgc acatggctgc cggagcttcc gcggcgcgcg 180 ggagaccggc ccaagacgac gagccacatc atccaacggc agctcgacca gtaccccgac 240 ccggactttg tcctcaaagc cctgaaagcg acggtcatcc cgcgtgtcca agcccggcac 300 acagacaaga ctcacctcgc gctgtccaag ttcgagttcc atgctgaggc catcttcgtg 360 cgcccggaaa tcgccatcga cgacccgaag catatcccca gccacgacac ggtgcgacgg 420 acgaagcgcg agattgcgca catgcacgac tatcacgact gcacgctgca tttggcgcta 480 gcggcgcagg acgcgaagca ggtgctgcag aagggctggg gccagcgcca tccgctggca 540 gggcctggga tgcccgggcc gcccacggag tggacgttct tgtatgcccc gaggaccgag 600 gaggaagtga aggttgtgga gaccattgtc gaggcctcta tcgcgtacat gacgaacgcg 660 gagaagccgg tcgagctggt gcag 684 <210> 28 <211> 228 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Mycena chlorophos <400> 28 Phe Ile Arg Arg Asp Tyr Gln Thr Phe Leu Arg Gly Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Ile Arg Gly Tyr Ile Ile Val Leu Val Leu Ser Leu 20 25 30 Phe Arg Gly Glu Glu Lys Gly Leu Ala Ile Tyr Glu Pro Leu Pro Glu 35 40 45 Lys Arg Thr Trp Leu Pro Glu Leu Pro Arg Arg Ala Gly Asp Arg Pro 50 55 60 Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Asp Gln Tyr Pro Asp 65 70 75 80 Pro Asp Phe Val Leu Lys Ala Leu Lys Ala Thr Val Ile Pro Arg Val 85 90 95 Gln Ala Arg His Thr Asp Lys Thr His Leu Ala Leu Ser Lys Phe Glu 100 105 110 Phe His Ala Glu Ala Ile Phe Val Arg Pro Glu Ile Ala Ile Asp Asp 115 120 125 Pro Lys His Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Ala Lys Gln Val Leu Gln Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Met Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Leu Tyr Ala Pro Arg Thr Glu Glu Glu Val Lys Val Val Glu Thr 195 200 205 Ile Val Glu Ala Ser Ile Ala Tyr Met Thr Asn Ala Glu Lys Pro Val 210 215 220 Glu Leu Val Gln 225 <210> 29 <211> 666 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Mycena citricolor <400> 29 ttcatcaaga aagactacga gacgttcctg aagggcggcc cctcctatgc gccccaaaac 60 gttcgcggat acatcatcgt gctcgtgctc gcgctcttcc gccaagagca gctcgggctg 120 gagatctacg accgcatgcc cgagaaacgt cgctggctcg cgaatctccc tcagcgcgag 180 ggcccccgcc ccaagaccac aagtcacatc atccagcggc agctcagcca gcacacggac 240 cccgcattcg gcgccgcgta cctcaaagac accgtcattc cgcgcgtcca ggcgcggcac 300 gcagccaaca cgcacatcgc gcgctcgacg ttcgagttcc acgccgccgc gatcttcctg 360 aacgcggacg tgccgctgcc cgagggcctg cccgcaagcg agacggtgcg gcggaccaag 420 ggcgagatcg cgcacatgca cgactaccac gacttcacgc tgcacctcgc gctcgcagca 480 gcggatggga aggaggtggt cggcaagggc tgggggcagc gccatccgct ggcgggaccc 540 ggcgtgccgg gtccgccgaa cgagtggacc tttgtgtatg cgccgaggaa tgaagaggag 600 atgggcgtgg tcgagcagat cgtagaggcg gcgattgggt acatgtcgaa cgtgcctgcg 660 ctggaa 666 <210> 30 <211> 222 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Mycena citricolor <400> 30 Phe Ile Lys Lys Asp Tyr Glu Thr Phe Leu Lys Gly Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Val Arg Gly Tyr Ile Ile Val Leu Val Leu Ala Leu 20 25 30 Phe Arg Gln Glu Gln Leu Gly Leu Glu Ile Tyr Asp Arg Met Pro Glu 35 40 45 Lys Arg Arg Trp Leu Ala Asn Leu Pro Gln Arg Glu Gly Pro Arg Pro 50 55 60 Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Ser Gln His Thr Asp 65 70 75 80 Pro Ala Phe Gly Ala Ala Tyr Leu Lys Asp Thr Val Ile Pro Arg Val 85 90 95 Gln Ala Arg His Ala Ala Asn Thr His Ile Ala Arg Ser Thr Phe Glu 100 105 110 Phe His Ala Ala Ala Ile Phe Leu Asn Ala Asp Val Pro Leu Pro Glu 115 120 125 Gly Leu Pro Ala Ser Glu Thr Val Arg Arg Thr Lys Gly Glu Ile Ala 130 135 140 His Met His Asp Tyr His Asp Phe Thr Leu His Leu Ala Leu Ala Ala 145 150 155 160 Ala Asp Gly Lys Glu Val Val Gly Lys Gly Trp Gly Gln Arg His Pro 165 170 175 Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Asn Glu Trp Thr Phe Val 180 185 190 Tyr Ala Pro Arg Asn Glu Glu Glu Met Gly Val Val Glu Gln Ile Val 195 200 205 Glu Ala Ala Ile Gly Tyr Met Ser Asn Val Pro Ala Leu Glu 210 215 220 <210> 31 <211> 705 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Omphalotus olearius <400> 31 ttcatacgca aagattacca gactttcctg gaggtgggac cctcgtacgc cccgcagaac 60 ctccaaggat acatcatcgt ctgtgtactc tctctgttcc ggcaagaaca gaaagacgta 120 gcgatttatg atcgccttcc tgagaaaagg aggtggttag gagacctccc gtttcgcgag 180 gggccaagac cgagtatcac tagccatatc atccagcgac agcgcaccca attggctgac 240 gccgagttcg ctaccaaaga gctgataggc aaaatcatcc ctcgcgtcca agcccgacac 300 accaacacaa cattcctcag cacatctaaa ttcgaattcc acgcccaggc catcttcctt 360 ttgccctcta tcccaatcaa cgaccctcaa aacattccaa gccacgatac cgttcgtcgc 420 acgaaacgcg agatcgcgca tatgcatgat tatcacgact gtacgttgca tctcgcactt 480 gctgctcaag atgggaagga ggttttagag aaaggatggg gtcagcgaca tcctcttgct 540 ggacctggtg ttcctggccc gccgacggag tggacgtttc tttatgcacc gcgcagcgaa 600 gaggaggttc gggttgtgga gatgattgtt gaggcatcag ttgtgtatat gacgaatgat 660 cctgcggata aaatcgtaga agctactgtg cagggtactg aagaa 705 <210> 32 <211> 235 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Omphalotus olearius <400> 32 Phe Ile Arg Lys Asp Tyr Gln Thr Phe Leu Glu Val Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile Val Cys Val Leu Ser Leu 20 25 30 Phe Arg Gln Glu Gln Lys Asp Val Ala Ile Tyr Asp Arg Leu Pro Glu 35 40 45 Lys Arg Arg Trp Leu Gly Asp Leu Pro Phe Arg Glu Gly Pro Arg Pro 50 55 60 Ser Ile Thr Ser His Ile Ile Gln Arg Gln Arg Thr Gln Leu Ala Asp 65 70 75 80 Ala Glu Phe Ala Thr Lys Glu Leu Ile Gly Lys Ile Ile Pro Arg Val 85 90 95 Gln Ala Arg His Thr Asn Thr Thr Phe Leu Ser Thr Ser Lys Phe Glu 100 105 110 Phe His Ala Gln Ala Ile Phe Leu Leu Pro Ser Ile Pro Ile Asn Asp 115 120 125 Pro Gln Asn Ile Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Cys Thr Leu His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Gly Lys Glu Val Leu Glu Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Val Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Leu Tyr Ala Pro Arg Ser Glu Glu Glu Val Arg Val Val Glu Met 195 200 205 Ile Val Glu Ala Ser Val Val Tyr Met Thr Asn Asp Pro Ala Asp Lys 210 215 220 Ile Val Glu Ala Thr Val Gln Gly Thr Glu Glu 225 230 235 <210> 33 <211> 681 <212> DNA <213> artificial <220> <223> Nucleic acid coding the functional fragment of luciferase from Panellus stipticus <400> 33 ttcgttcgta aagactatca cacctttctt gaaggtggac catcctacgc gccgcagaat 60 ttgcaaggct atatcatcgt gttggtgctc tcactctttc gaggggagga gacgggattg 120 gaaatatacg accgcttgcc cgaaaaacgc cgctggctcg aggagctgcc tgttcgcgaa 180 ggcccgcgcc caaagacaac cagccacatc attcagagac agttgaatca gcacgttgac 240 ccggacttcg gaatgaactc tttgaaaggc tccgtcatcc ggcgccttca atcccgccac 300 caggacataa ctcaactcgc actctcgaaa ttcgaattcc acgccgaggc catatttctg 360 cgccccgatg tcgcgatcaa cgatcccaaa cacgtcccga gccacgacac ggtgcgccgc 420 acaaagcgcg agatagctca catgcacgac taccatgatt acacgtgtca tttggcgctc 480 gcagcgcagg atgggaagca agtgattgca aaagggtggg gccagagaca tccgctcgcc 540 ggaccgggca tgccggggcc gccgacggag tggacatttt tgtatgcgcc gaggaatgag 600 gcggaggttc aagtgttgga gacgattatc gaagcgtcaa tcgggtacat gtcgaacgca 660 ccagccttgg gtgggagcga g 681 <210> 34 <211> 227 <212> PRT <213> artificial <220> <223> Amino acid sequence of the functional fragment of luciferase from Panellus stipticus <400> 34 Phe Val Arg Lys Asp Tyr His Thr Phe Leu Glu Gly Gly Pro Ser Tyr 1 5 10 15 Ala Pro Gln Asn Leu Gln Gly Tyr Ile Ile Val Leu Val Leu Ser Leu 20 25 30 Phe Arg Gly Glu Glu Thr Gly Leu Glu Ile Tyr Asp Arg Leu Pro Glu 35 40 45 Lys Arg Arg Trp Leu Glu Glu Leu Pro Val Arg Glu Gly Pro Arg Pro 50 55 60 Lys Thr Thr Ser His Ile Ile Gln Arg Gln Leu Asn Gln His Val Asp 65 70 75 80 Pro Asp Phe Gly Met Asn Ser Leu Lys Gly Ser Val Ile Arg Arg Leu 85 90 95 Gln Ser Arg His Gln Asp Ile Thr Gln Leu Ala Leu Ser Lys Phe Glu 100 105 110 Phe His Ala Glu Ala Ile Phe Leu Arg Pro Asp Val Ala Ile Asn Asp 115 120 125 Pro Lys His Val Pro Ser His Asp Thr Val Arg Arg Thr Lys Arg Glu 130 135 140 Ile Ala His Met His Asp Tyr His Asp Tyr Thr Cys His Leu Ala Leu 145 150 155 160 Ala Ala Gln Asp Gly Lys Gln Val Ile Ala Lys Gly Trp Gly Gln Arg 165 170 175 His Pro Leu Ala Gly Pro Gly Met Pro Gly Pro Pro Thr Glu Trp Thr 180 185 190 Phe Leu Tyr Ala Pro Arg Asn Glu Ala Glu Val Gln Val Leu Glu Thr 195 200 205 Ile Ile Glu Ala Ser Ile Gly Tyr Met Ser Asn Ala Pro Ala Leu Gly 210 215 220 Gly Ser Glu 225 <210> 35 <211> 211 <212> PRT <213> artificial <220> <223> Consensus sequence <220> <221> MISC_FEATURE <222> (3)..(214) <223> ??any amino acid <400> 35 Asp Tyr Xaa Thr Phe Leu Xaa Xaa Gly Pro Ser Tyr Ala Pro Gln Asn 1 5 10 15 Xaa Xaa Gly Tyr Xaa Ile Val Xaa Val Leu Xaa Leu Phe Arg Xaa Glu 20 25 30 Xaa Xaa Xaa Xaa Ile Tyr Xaa Xaa Xaa Pro Glu Lys Arg Xaa Trp Leu 35 40 45 Xaa Xaa Leu Pro Xaa Arg Xaa Gly Xaa Arg Pro Xaa Xaa Thr Ser His 50 55 60 Ile Ile Gln Arg Gln Xaa Xaa Gln Xaa Xaa Asp Xaa Xaa Phe Xaa Xaa 65 70 75 80 Xaa Xaa Leu Xaa Xaa Xaa Xaa Ile Xaa Arg Xaa Gln Xaa Arg His Xaa 85 90 95 Xaa Xaa Thr Xaa Xaa Xaa Ser Xaa Phe Glu Phe His Ala Xaa Ala Ile 100 105 110 Phe Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa Pro Xaa Xaa 115 120 125 Xaa Thr Val Arg Arg Thr Lys Xaa Glu Ile Ala His Met His Asp Tyr 130 135 140 His Asp Xaa Thr Xaa His Leu Ala Leu Ala Ala Xaa Asp Xaa Lys Val 145 150 155 160 Xaa Xaa Lys Gly Trp Gly Gln Arg His Pro Leu Ala Gly Pro Gly Xaa 165 170 175 Pro Gly Pro Pro Xaa Glu Trp Thr Phe Xaa Tyr Ala Pro Arg Xaa Glu 180 185 190 Xaa Glu Xaa Xaa Val Xaa Glu Xaa Ile Xaa Glu Ala Xaa Xaa Xaa Tyr 195 200 205 Met Xaa Asn 210 <210> 36 <211> 38 <212> DNA <213> artificial <220> <223> Primer 1711 <220> <221> misc_feature <222> (6)..(36) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 36 atcgcnttyc cntwcathcc narrgaytac saracntt 38 <210> 37 <211> 35 <212> DNA <213> artificial <220> <223> Primer 1712 <220> <221> misc_feature <222> (6)..(3) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <220> <221> misc_feature <222> (6)..(6) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (12)..(12) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, t or u <400> 37 atcgcnttyc cntwcathcc narrgaytac sarac 35 <210> 38 <211> 32 <212> DNA <213> artificial <220> <223> Primer 1713 <220> <221> misc_feature <222> (6)..(31) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 38 atcgcnttyc cntwcathcc narrgaytac sa 32 <210> 39 <211> 29 <212> DNA <213> artificial <220> <223> Primer 1714 <220> <221> misc_feature <222> (6)..(27) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 39 atcgcnttyc cntwcathcc narrgayta 29 <210> 40 <211> 42 <212> DNA <213> artificial <220> <223> Primer 1715 <220> <221> misc_feature <222> (1)..(40) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 40 ngcagggncn ttsgtcatat asccnatnga ngcytcnayn at 42 <210> 41 <211> 36 <212> DNA <213> artificial <220> <223> Primer 1716 <220> <221> misc_feature <222> (1)..(34) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 41 ngcagggncn ttsgtcatat asccnatnga ngcytc 36 <210> 42 <211> 32 <212> DNA <213> artificial <220> <223> Primer 1717 <220> <221> misc_feature <222> (7)..(30) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 42 gcagggncnt tsgtcatata sccnatngan gc 32 <210> 43 <211> 30 <212> DNA <213> artificial <220> <223> Primer 1718 <220> <221> misc_feature <222> (1)..(28) <223> R - A or G, Y - C or T, S - G or C, W - A or T, H - A or T, N ?any base <400> 43 ngcagggncn ttsgtcatat asccnatnga 30 <210> 44 <211> 801 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Neonothopanus nambi <400> 44 atgcgcatta acatctccct ttcatctctt ttcgagcgat tgagcaaact gagttccagg 60 agtattgcaa tcacttgtgg ggttgtcctc gcgagcgcca tcgcattccc catcatccgg 120 agagattatc agacgtttct tgaggtgggc cctagctatg caccacagaa cttccgagga 180 tatatcatcg tgtgtgtact gtcactgttt aggcaagaac aaaagggatt ggctatctat 240 gataggttgc ctgagaaacg gcggtggctc gctgatctcc catttagaga ggggacacga 300 ccgagcatca cttcacacat catacaaaga cagcgaacgc agctcgttga ccaagagttc 360 gcaactaggg aactgattga taaggtgata cccagagtac aggcgcgaca caccgataaa 420 acttttcttt ccacctctaa attcgagttc catgccaaag ctattttctt gttgccttcc 480 ataccgatta atgatcctct gaatattcca tcccacgaca cagttcgacg gacgaaacgc 540 gaaattgcgc acatgcacga ctatcacgat tgcactttgc acctggcact ggctgctcaa 600 gacggaaaag aagttctgaa aaagggttgg gggcaaagac atccgctggc gggacccggt 660 gtacctgggc cgcctacgga atggacattt ttgtacgcac cgaggaacga agaggaggcc 720 agggtcgttg agatgattgt tgaggctagt attgggtaca tgacgaatga tccggctggt 780 aaaattgttg aaaatgcaaa g 801 <210> 45 <211> 798 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Armillaria gallica <400> 45 atgagcttta tagactcaat gaaacttgat cttgtaggac acctcttcgg catacgcaac 60 agaggactcg cagcagcctg ttgcgccctt gcagtagctt ccacgatagc tttcccttat 120 atccgccggg attaccaaac gttccttagc ggtggccctt cttacgcgcc acagaacata 180 cgaggctatt ttatcgtgtg tgtgctcgct ctgtttcgcc aagaacagaa agggctggcg 240 atttatgacc gacttcctga gaaacgaagg tggcttcctg accttcctcc ccggaatggc 300 cctcgcccga ttacgacctc tcatattata caaagacaga ggaaccaagc gccagatccg 360 aaatttgccc tggaggagct caaggccact gtgattccac gagtccaagc ccgccatacg 420 gatcttacac atctcagtct tagcaaattt gagtttcatg ccgaggcaat ttttcttttg 480 ccgtccgttc cgatagacga ccccaaaaat gtaccctcac acgatacggt caggcgcaca 540 aagagggaga tcgcccatat gcatgactat cacgacttta ccctgcatct cgctctggcg 600 gcacaagacg gcaaggaggt agtcagcaaa ggctggggcc aaaggcatcc gctcgcgggc 660 ccaggggttc cggggccacc tacagagtgg actttcatct atgcgccgcg aaacgaggaa 720 gaactcgcag tagttgagat gatcatagag gcatcaattg gctacatgac gaacgatcct 780 gccggagtcg ttatagcc 798 <210> 46 <211> 798 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Armillaria mellea <400> 46 atgagttttt ttgactctgt caaacttgat ctggtgggac ggctcttcgg catccgaaac 60 aggggacttg cggttacttg ctgcgcggta gcggtcgcct ctattatcgc cttcccatac 120 attcgccgcg actatcagac cttcctgtca ggcggacctt cttatgcacc gcagaatata 180 aggggctatc ttattgtttg tgtactggct ctctttcggc aagaacaaaa aggtctggct 240 atctacgata gacttcctga gaaacgacgc tggctgccag atcttccccc ccgcgacggc 300 ccaaggccca taacaacaag tcatattata cagagacaac ggaaccaggc cccagacctc 360 aagtttgccc tcgaggagct gaaagcgact gttataccta gagtacaggc gagacataca 420 gacttgaccc atttgagcct gagcaagttt gaattccatg ccgaagcaat ctttcttctg 480 ccttccgtac ccattgacga tccaaaaaac gtcccctcac atgatactgt aagacgcacg 540 aagcgagaga tcgcacacat gcacgactac catgactaca ctctgcacct tgccttggca 600 gctcaggatg gcaaggaagt tgtatccaag gggtggggcc aaagacaccc cttggctggc 660 ccgggagtgc ctggaccccc gaccgaatgg acgtttattt acgcaccaag gaacgaggaa 720 gaattggccg tcgttgaaat gattattgaa gcgtccatag gatatatgac caacgatccg 780 gccggaaaga caatcgcg 798 <210> 47 <211> 798 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Armillaria ostoyae <400> 47 atgtctttta ttgacagtat gaagcttgat ttcgtaggtc acttgtttgg tatacgaaac 60 cgaggtctcg ctactgcgtg ctgcgcggtg gcagtagcga gtgctatagc attcccgtat 120 atccgccgag attaccagac atttcttagc ggtggaccta gctatgcacc ccagaatatt 180 aaagggtatt tgatcgtttg tgtgcttgca ctgtttcgcc aggagcagaa gggtcttgct 240 atttacgacc gactgcctga gaaaaggcga tggttgcctg accttccacc cagaaacggt 300 cccaggccca tcacgacctc acacataatc caacggcaga ggaaccaggc tccagattca 360 aagtttgcgc ttgaggaact caaggctact gtaataccta gagtccaggc cagacatacg 420 gatctcaccc atctcagcct cagtaagttt gagtttcatg cggaagctat tttcctgctc 480 ccgagcgtac ccattgatga ccccaagaat gtcccctcac atgatacggt acgacgcacg 540 aagcgggaga tagctcacat gcacgactac catgatttca ctctgcatct cgccttggca 600 gcgcaggatg gcaaggaggt agtagcgaaa ggatgggggc agagacaccc gctggcaggc 660 cctggggttc ccggccctcc gaccgaatgg acatttatct atgcgccccg caacgaagag 720 gagctcgcag ttgttgagat gatcattgaa gcatccattg ggtacatgac aaatgaccca 780 gccggtacag tcattgtt 798 <210> 48 <211> 753 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Mycena chlorophos <400> 48 atggtacagc tcacgcgaac ctcagggttt attgcagcgg ctgcgattgt tgccgccatc 60 gcgttcccgt ttattcgacg ggactatcag acttttctgc gagggggccc ctcatatgcc 120 ccacagaata ttcgcggcta tatcattgtc ctggtcttgt ccctcttcag aggagaagaa 180 aagggtctgg ctatctatga gccgcttcca gagaaacgga cgtggttgcc agagttgcct 240 agacgggcgg gcgatagacc caaaactacc agccatataa tacaacgaca actcgaccaa 300 tatcccgacc cggacttcgt acttaaagca ttgaaagcaa ctgtaatacc gagagttcag 360 gcaaggcaca ctgataaaac ccatcttgca ctttccaagt ttgaattcca cgccgaggca 420 atcttcgtcc gaccagagat agccatagac gatccgaaac atatcccaag tcatgacaca 480 gtcagacgaa cgaaacggga gatagcccat atgcatgatt atcatgactg caccctgcac 540 cttgcgcttg cggcacagga cgcaaaacag gtcttgcaaa aaggatgggg acagagacac 600 ccccttgccg gacctggcat gccgggtccg cctactgaat ggacattcct ctacgccccg 660 agaactgagg aggaggtgaa agtggttgaa accatagtgg aggcgagtat agcttacatg 720 accaatgcag aaaaaccagt agaactcgta caa 753 <210> 49 <211> 738 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Mycena citricolor <400> 49 atggcttatc agttgacatg gattcagact cttgtattgg gtgctctcgt ggctatggct 60 gttgcatttc cattcatcaa aaaagattat gagaccttcc tcaagggcgg cccttcatac 120 gccccccaga atgtccgcgg ttatattatc gtactcgtcc tcgcgctgtt cagacaagaa 180 caattggggc ttgagatata tgaccgcatg cccgaaaaac gcaggtggct cgctaacctc 240 cctcaacggg aaggtccgcg accgaaaacc actagccata tcattcagcg ccagctctct 300 cagcataccg accccgcctt tggagcggct tatctgaaag acaccgtaat cccgcgagtg 360 caggcgcggc atgcagcgaa cactcacata gcgcgaagta cgttcgaatt tcacgcagcg 420 gctatctttc tcaacgcaga cgtgccgttg cccgaaggac tgccagctag cgaaacagtg 480 agacgaacca aaggagaaat cgcgcacatg cacgattacc acgattttac gctgcacctg 540 gcacttgcgg cagcggacgg gaaagaggtg gtcggcaaag gatggggaca gagacatcca 600 ctcgctggcc ctggggtgcc tggccctccg aatgagtgga cattcgtgta cgctcccagg 660 aacgaggaag agatgggcgt agtagagcag attgtagagg ctgcaatcgg ttacatgtca 720 aatgtccctg ctctcgag 738 <210> 50 <211> 783 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Omphalotus olearius <400> 50 atgctcccgg ctttcatata taaaccgaga ttggtcatta cgtgcgtttt tgttctcgct 60 agtgcattgg cttttccctt cataagaaag gactatcaga ctttcctcga agtcgggccg 120 tcttatgctc ctcaaaacct tcaagggtat atcatagtct gcgtattgtc actcttcaga 180 caagagcaaa aagatgtagc catatacgat agactccccg agaaaagaag gtggcttggt 240 gacctgccgt tcagagaagg gccgcgcccg tctattacct cccacattat ccaacgccaa 300 agaacgcaac ttgctgatgc agagttcgca acaaaggagt tgattgggaa gatcattccg 360 agggtgcagg caaggcatac aaataccact ttcttgtcaa cgagtaaatt tgagtttcac 420 gcccaggcaa tctttctgct tccttcaatt cccataaacg atccacaaaa tatcccaagt 480 cacgatacgg tacggcgcac gaagcgcgag atcgcccaca tgcatgatta tcatgattgc 540 acgcttcact tggctctcgc cgcgcaggac gggaaagagg tgcttgagaa ggggtggggt 600 cagcggcatc cactcgccgg gccaggtgtt cccggtcccc caaccgaatg gacatttctc 660 tatgcgcccc gctctgaaga agaggtacgg gtcgtggaaa tgatagtcga ggctagcgtg 720 gtttatatga cgaatgatcc tgcggacaag attgtagagg ccaccgtcca gggcaccgaa 780 gag 783 <210> 51 <211> 747 <212> DNA <213> artificial <220> <223> Humanized nucleic acid coding luciferase from Panellus stipticus <400> 51 atgaatataa atctgaaagc acttattggt gtctgtgcgg tactcatcac cgctgctgtc 60 tttccttttg tacggaaaga ctatcacacc tttttggagg gcggcccttc ctatgctcca 120 cagaacttgc agggctacat aatagtcctc gtcttgtcac tcttcagggg agaggagact 180 ggtttggaaa tttatgatcg cttgccagaa aagcggcgat ggctggaaga actgccagtg 240 cgggagggac cgcggcctaa gactacgagt cacatcatcc aacgccagct caaccagcac 300 gttgaccccg acttcggcat gaatagcttg aaaggctctg tgatacggag gcttcaatcc 360 cgccaccaag atataacgca gcttgctctt tccaagtttg agtttcacgc cgaagcaatt 420 tttctccggc ctgacgtcgc aatcaatgac cccaaacacg tgccatctca tgacactgtc 480 cgacgcacaa agagggagat cgctcacatg cacgactacc acgattacac ttgccatttg 540 gcccttgccg cccaagatgg caaacaagtg atagcgaagg gctggggtca aagacatccg 600 cttgctgggc ccggtatgcc tggacctcct accgagtgga ccttccttta tgccccacgc 660 aacgaagcag aggtgcaagt gctggaaact attattgagg caagtatagg atatatgagt 720 aacgcacctg ccctgggagg ttccgaa 747 <210> 52 <211> 60 <212> DNA <213> artificial <220> <223> Nucleic acid coding site of transcription initiation and His-tag <400> 52 atggctagca tgactggtgg acagcaaatg ggtcgcggat cccaccacca ccaccaccac 60 <210> 53 <211> 20 <212> PRT <213> artificial <220> <223> N-terminal amino acid sequence comprising His-tag <400> 53 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser His His 1 5 10 15 His His His His 20 <210> 54 <211> 801 <212> DNA <213> artificial <220> <223> Nucleic acid coding the luciferase from Neonothopanus nambi, optimised fro expression in Physcomitrella patens <400> 54 atgaggataa atatctcttt gtctagtctc tttgagagac tgagcaaatt gtcatcccga 60 tccatcgcaa ttacctgcgg cgtagtcttg gcaagtgcaa tagcattccc aattatccga 120 agagactatc aaacgttcct tgaagtcggt ccgagctatg ccccacagaa cttccgaggc 180 tatatcatcg tttgtgtctt gtcacttttt aggcaagagc agaaagggtt ggcaatctat 240 gacaggcttc cagaaaagag gcgttggctt gccgacttgc cgtttcgtga agggacgagg 300 ccatccataa cctcccacat tatacagcgt cagcgtactc agctggtaga tcaagagttt 360 gcaaccagag aacttatcga taaggtgatc ccacgtgtgc aagcaagaca cacagacaaa 420 acttttctca gtacgtcaaa atttgagttt catgcaaagg ccatcttcct tctcccctct 480 atccctatta atgatcctct taacattccc tcacacgata cggtaagaag aaccaagcgt 540 gagatcgctc acatgcatga ttaccatgat tgcactctgc acttggctct tgctgctcag 600 gatggtaagg aagttttgaa gaaggggtgg ggccagcgtc acccactggc cggaccagga 660 gtcccaggcc ctcctactga gtggaccttc ctttacgcac caaggaacga agaggaggcc 720 agagttgtcg agatgatagt cgaagctagt attggctaca tgactaacga tcctgctggt 780 aagattgtcg aaaatgccaa g 801

Claims

루시퍼라제(luciferase) 또는 이의 기능성 단편을 암호화하는 분리된 핵산으로서, 상기 핵산은 하기로 이루어진 군으로부터 선택되는 것인, 분리된 핵산:
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 아미노산 서열과 실질적으로 동일한 아미노산 서열을 특징으로 하는 단백질을 암호화하는 핵산;
(b) 상기 (a)의 아미노산 서열과 적어도 60% 동일한 서열을 갖는 단백질을 암호화하는 핵산; 및
(c) 서열번호 35의 공통 서열(consensus sequence)을 포함하는 단백질을 암호화하는 핵산.
제1항에 기재된 핵산 분자를 포함하는 발현 카세트(expression cassette)로서, 숙주세포에서의 핵산 발현에 필요한 조절 인자(regulatory element)의 제어하에 있고, 숙주세포 게놈에 통합되거나 또는 외부 염색체 인자(extrachromosomal element)의 형태로 숙주세포에 도입되며, 제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제의 발현을 제공할 수 있는 것인, 발현 카세트.
제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제를 생산하는 세포로서, 상기 세포는 제2항에 기재된 발현 카세트를 외부 염색체 인자 또는 세포 게놈에 통합된 인자의 형태로 포함하는 것인, 세포.
하기로 이루어진 군으로부터 선택된, 분리된 루시퍼라제 또는 이의 기능성 단편:
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34에 주어진 아미노산 서열과 실질적으로 동일한 아미노산 서열을 특징으로 하는 단백질;
(b) 상기 (a)의 아미노산 서열과 적어도 60% 동일한 아미노산 서열을 갖는 단백질; 및
(c) 서열번호 35의 공통 서열을 포함하는 아미노산 서열을 갖는 단백질.
(1) 제1항에 기재된 핵산, 또는 제2항에 기재된 발현 카세트, 또는 제4항에 기재된 단백질; 및 (2) 제1항에 기재된 루시퍼라제에 의해 산화될 수 있는 루시페린(luciferin);을 포함하는, 키트.
제1항에 기재된 핵산을 포함하는, 형질전환 유기체(transgenic organism).
제4항에 기재된 단백질에 특이적으로 연결되는, 항체.
세포내 국소화 신호 (intracellular localisation signal)에 작동 가능하게(operably) 융합된, 제1항에 기재된 핵산 분자를 포함하는 발현 카세트로서, 숙주세포에서의 핵산의 발현에 필요한 조절 인자의 제어하에 있고, 숙주세포 게놈에 통합되거나 또는 외부 염색체 인자의 형태로 세포에 도입되며, 세포내 국소화 신호에 연결된 제1항에 기재된 핵산에 의해 암호화되는 루시퍼라제의 발현을 제공할 수 있는 것인, 발현 카세트.
제2항 또는 제8항에 기재된 발현 카세트를 세포에 도입하는 단계를 포함하는, 세포 및 세포 구조체(cellular structure)를 표지하는 방법.