KR20220111294A

KR20220111294A - 키메라 옵신 gpcr 단백질

Info

Publication number: KR20220111294A
Application number: KR1020227021853A
Authority: KR
Inventors: 존야 클라인로겔; 미힐 반 뷔크
Original assignee: 유니버시태트 베른
Priority date: 2019-11-29
Filing date: 2020-11-30
Publication date: 2022-08-09
Also published as: ECSP22050231A; IL293076A; AU2020392702B2; PE20230093A1; JP2023504136A; MX2022006496A; WO2021105509A1; CR20220283A; BR112022010095A2; US20240174743A1; AU2020392702A1; AU2023241362A1; CA3162568A1; CL2022001376A1; JOP20220128A1; CN115038458A; EP4065153A1; CO2022008784A2; AU2020392702A9

Abstract

강하게 발현하고 표적 세포의 정확한 세포 이하 구획 내로 표적화되는, 감광성 상류 옵신 부분 및 키메라 CT를 포함하는 표적 GPCR 부분을 포함하는 키메라 옵신 GPCR 단백질이 제공된다. 키메라 옵신 GPCR 단백질은 표적 GPCR 경로에 특이적인 천연 G 단백질을 효율적으로 활성화시켜 천연 표적 GPCR과 비슷한 생리학적 반응을 유도한다. 키메라 옵신 GPCR 단백질을 암호화하는 핵산 분자뿐만 아니라, 캡시드, 벡터, 키메라 옵신 GPCR 단백질을 포함하거나 발현하는 세포 및 운반체가 또한 제공된다. 또한, 키메라 옵신 GPCR 단백질을 유전자 조작하는 방법 및 키메라 옵신 GPCR 단백질의 의학적 적용이 제공된다.

Description

키메라 옵신 GPCR 단백질

본 발명은 광유전학(optogenetics) 분야에 있으며, 추가의 감광성 키메라 옵신 GPCR 단백질을 도입한다. 특히, 본 발명은 감광성 옵신 및 추가의 GPCR 단백질을 포함하는 키메라 GPCR 단백질 및 이를 암호화하는 핵산 분자, 뿐만 아니라 이러한 핵산 분자를 조작하는 방법에 관한 것이다. 본 발명은 추가로 캡시드, 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자를 포함하는 벡터 및 입자, 뿐만 아니라 키메라 옵신 GPCR 단백질의 의도적으로 선택된 신호전달 캐스케이드로의 광 활성화 및 결합(coupling)을 기반으로 하는 치료적 적용, 예를 들어, 의약 및 유전자 치료 방법에 관한 것이다. 본 발명은 특히 옵신-mGluR6 키메라 단백질 및 광수용체 변성으로 인한 시력 상실로 고통 받는 인간 또는 동물 환자의 유전자 치료 처치를 위한 이의 용도에 관한 것이다.

대략 3000명 중 1명은 광수용체 변성과 실명을 초래하는 유전적 돌연변이로 고통 받는다. 광수용체 손실에도 불구하고, 하류 망막 뉴런은 대체로 손상되지 않은 상태로 남아 있다. 최근 연구에 따르면 광수용체 손실 후 광 활성화 단백질을 살아 있는 망막 조직에 직접 도입하자 광 감도와 기능적 시력이 회복될 수 있었다(Lagali P.S. et al., 2008; van Wyk M et al., 2015; Cehajic-Kapetanovic J. et al. 2015).

WO 2012/174674는 mGluR6의 세포내 도메인을 포함하는 키메라 감광성 G 단백질 결합 수용체(G-protein coupled receptor, GPCR) 단백질을 개시한다. 이러한 키메라 GPCR 단백질 중 하나는 감광성 GPCR 멜라놉신 및 mGluR6의 IL2, IL3 및 CT를 포함하며, Opto-mGluR6이라고도 한다(van Wyk M et al., 2015). 유리하게는, Opto-mGluR6 단백질은 내인성 mGluR6 수용체의 광 활성화 버전이므로, 오로지 표적화된 ON 두극세포(bipolar cell)에 상재하는 천연 mGluR6 단백질인 G알파(o) G 단백질을 활성화시킴으로써, mGluR6 특이적 세포내 신호전달 캐스케이드에 광 활성화를 결합시킬 수 있다.

GPCR은 제약 산업의 주요 표적이다(Sriram P. et al, 2018). 선행 기술은 Opto-GPCR에 대한 Optogenetic 사용자 가이드(Kleinlogel S., 2016)에서 검토된 바와 같이, 또는 예를 들어, 오피오이드 신호전달 및 행동의 시공간적 제어(Siuda et al. 2015)를 위한 옵토(opto) MOR이라는 키메라 로돕신 MOPR 오피오이드 수용체 단백질과 함께 적용된 바와 같이, 표적-GPCR 특이적 G 단백질 신호전달 캐스케이드의 광학 활성화를 가능하게 하는 다른 접근법을 포함한다.

따라서, 기능적 활성 키메라 옵신 GPCR 단백질은 다음과 같은 이중 기능을 제공한다: 첫째, 이들은 광 활성화할 수 있다. 즉, 이들은 감광성 옵신 부분으로 인해 감광성이다. 둘째, 이들은 표적 GPCR 단백질의 GPCR 신호전달 경로에 광 활성화를 결합시킨다.

GPCR 단백질(G 단백질 결합 수용체 단백질, 줄여서 GPCR)은 인간 게놈에서 가장 큰 슈퍼패밀리의 수용체를 나타내며, 서열 상동성과 기능적 유사성을 기반으로 한 계통발생학적 분류의 GRAFS 체계에 따라 5개의 패밀리(또는 클래스)로 나뉜다(Schiφth, H.B. and Fredriksson R, 2005).

클래스 A는 가장 크고 가장 잘 이해된 GPCR 단백질 패밀리이다. 이는 또한 이의 "프로토타입"의 명칭을 따서 로돕신 패밀리로 명명되었다.

모든 패밀리의 GPCR은 고도로 보존된 3차 구조 및 유사한 활성화 모드를 공유한다: 모든 GPCR은 다양한 길이의 3개의 세포외 및 3개의 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7) 및 세포외 N 말단 도메인(NT) 및 세포내 C 말단 도메인(CT)을 포함한다.

또한, 대부분의 클래스 A GPCR 및 다른 GPCR 클래스 및 특히 클래스 C GPCR의 다수의 또는 심지어 대부분의 GPCR 단백질은 또한 7개의 막관통 나선(TM1 내지 TM7)에 추가하여 TM7의 하류에 8개의 나선(H8)을 포함한다(Bruno et al, 2012). H8은 막관통 나선이 아니라 GPCR의 CT의 근위 영역에 있는 CT의 서브도메인이다. 오히려, H8은 세포막의 세포질 표면에 평행하고 인접하게 놓여 있으며, 따라서 때때로 양쪽성 나선으로 지칭된다.

GPCR 수용체 단백질은 3개의 기능적 서브유닛, 즉 G-알파, G-베타 및 G-감마 서브유닛으로 구성된 이종삼량체 G 단백질과 생리학적으로 상호작용한다. G 단백질은 알파 서브유닛의 구조적 유사성과 이들이 유도하는 조절 반응의 유형에 기반하여 네 개의 서브패밀리, 즉, Gs, Gi/o, Gq/11 및 G12/13으로 분류되었다. 각 GPCR은 G 단백질의 한 서브패밀리에 우선적으로 결합하여, 우선적으로 하나의 신호전달 캐스케이드를 자극한다. GPCR 수용체와 G 단백질 사이의 구조적 상호작용은 예를 들어, Moreira I(2014)가 요약한 바와 같이 많은 연구의 주제였다. G 단백질의 네 가지 주요 클래스는 자체적으로 하위 클래스로 나뉜다. 예를 들어, 활성화된 단계의 mGluR6은 G알파(i/o)의 하위 클래스인 G알파(o)에 결합한다.

예시적인 모 옵신(parent optin)의 생리학적 세포 환경에 존재하는 예시적인 내인성 G 단백질은 멜라놉신의 경우 G(알파)q, 원추형 옵신의 경우 G(알파)t 및 해파리 옵신의 경우 G(알파)s이다.

놀랍게도, 유사한 3차원 구조에도 불구하고, 임의의 GPCR 패밀리의 구성원은 기능, 신호전달 및 3D 형태 안정성에 중요한 3개의 주요 GPCR 클래스 A, B 및 C의 구조적 정렬에 의해 확인된 몇 개의 보존된 아미노산과 짧은 모티프(Schwartz et al. 2006, Nygaard et al. 2013)를 제외하고는 다른 패밀리의 구성원과 실질적으로 서열 유사성을 나타내지 않는다(Kleinlogel, 2016).

지난 10년 동안, 도메인은 기능적 활성 키메라 GPCR 단백질의 몇 가지 예를 제공하는 두 개의 GPCR 사이, 특히 광 활성화 옵신-GPCR과 리간드 활성화 비옵신 GPCR 단백질 사이에서 교환되었다. 이러한 키메라 GPCR은 리간드 또는 특히 빛에 의해 활성화되는데, 이는 제1 GPCR 단백질의 특징이며, 이는 제2 GPCR 단백질의 특징인 G알파 단백질에 결합하여 이 신호 활성화를 제2 GPCR 단백질에 결합시킨다(Kleinlogel, 2016; Morri et al., 2018; Siuda et al., 2015). 이러한 도메인 교환은 서열 유사성이 없음에도 불구하고 GPCR 단백질의 서열 정렬 및 후술되는 보존된 모티프를 랜드마크로 사용하는 도메인 식별에 의해 가능하게 된다.

위에서 언급한 고도로 보존된 아미노산과 짧은 모티프 중 일부는 세포내 도메인과 막관통 도메인 사이의 접합부에 위치하며, 특히,

- TM3과 IL2 사이의 접합부 (c)의 고도로 보존된 E(D)RY(서열번호 80) 모티프,

- IL3과 TM6 사이의 접합부 (f)의 글루타메이트 잔기(E),

(이들은 GPCR의 비활성 상태를 안정화시키는 TM3과 TM6 사이에서 함께 "이온 잠금"을 형성함);

- TM7과 CT의 근위 말단 사이, 특히 TM7과 나선 8(H8)의 근위 말단 사이의 접합부 (g)의 NPxxY 모티프(서열번호 81)가 그러하다.

TM3과 IL2의 접합부의 E(D)RY 부위와 IL3과 TM6의 접합부의 글루타메이트 잔기에 의해 형성된 TM3과 TM6 사이의 이온 잠금 및 TM7의 말단의 NPxxY 모티프는 신호에 반응하여, 예를 들어, 광 활성화 또는 리간드 결합에 의한 레티날의 광이성질화 시 재배열하여 GPCR 단백질의 활성화된 형태를 형성하는 중요한 구조적 제약을 제공한다(Fritze et al. 2003).

NR(K)Q(예를 들어, HPK 또는 HEP) 서열(서열번호 82)은 대부분의 GPCR, 특히 클래스 A 및 클래스 C GPCR의 CT의 근위 영역에서 H8의 근위 말단의 더 고도로 보존된 모티프이다. 종종 H8을 포함하는 CT의 NR(K)Q 모티프 및 근위 영역은 활성화(즉, 리간드 결합에 의해 또는 옵신의 경우 광 흡수에 의해 유발됨) 시, GPCR 단백질의 형태적 전환과 관련이 있는 것으로 보인다. 또한, CT의 NR(K)Q 모티프와 근위 영역은 GPCR 활성을 제어하기 위한 어레스틴 결합에 중요한 것으로 간주된다(예를 들어, Sato T, 2019).

키메라 옵신 GPCR 단백질은 7개의 막관통 도메인을 포함하고 특히 TM3의 원위 말단의 E(D)RY 모티프 및 TM7의 원위 말단의 NPxxY 모티프와 같은 고도로 보존된 모티프를 포함하는 GPCR 수용체 단백질의 고도로 보존된 3차 구조를 나타낸다.

추가로 부분적으로 보존된 구조적 요소와 모티프는 다음을 포함한다:

- 원위 방향으로 H8의 뒤를 직접 잇고, 소 로돕신의 C322 및 C323에 상응하는 하나 또는 두 개의 팔미토일화 부위(Ovchinnikov Yu A, 1988). 팔미트산에 연결된 아미노산 잔기의 공유 변형은 H8의 원위 말단이 막에 고정되게 한다. 대부분의 옵신에서 H8의 원위 말단의 시스테인 잔기는 팔미토일화되어 있다. H8의 원위 말단의 아미노산 잔기의 팔미토일화는 주로 GPCR 막 국소화, 지질 뗏목 모집 및 단백질 안정화에 관여하는 것으로 간주된다. 일부 예외적인 옵신, 예를 들어, 원추형 옵신 OPN1MW 및 OPN1LW는 H8의 원위 말단에 팔미토일화된 아미노산을 포함하지 않는다.

- 일반적으로 원위 방향으로 팔미토일화 부위를 지나서 위치하는 C 말단의 인산화 부위. 인산화 부위는 일반적으로 인산화된 세린 또는 트레오닌 또는 때때로 티로신 잔기를 나타낸다. 인산화 부위는 GPCR 수용체의 턴오버(turn-over)를 위한 탈감작 및 내재화에 관여한다. 이들은 또한 특히 G 단백질 신호전달의 동역학에 영향을 미치는 G 단백질 결합 수용체 키나제(GRK) 및 어레스틴과 같은 활성 조절자의 결합 선호도를 결정한다. 예를 들어, 멜라놉신은 다중 인산화 부위가 있는 특히 긴 C 말단을 가지고 있으며, 특히 일부 원위 인산화 부위는 일시계를 바꾸는 이 옵신의 시간적 통합 생리적 기능을 위해 신호 중단을 느리게 만드는 것으로 나타났다(Mure L. et al, 2016 참조).

옵신은 추가로 보존된 모티프를 포함한다. 특히, 발색단을 공유 결합시키기 위해 발색단 포켓에 두 개의 보존된 모티프가 존재한다. 모든 동물 옵신의 발색단은 11-시스-레티날이다. 발색단 포켓에는 고도로 보존된 두 개의 모티프가 있다:

- Schiff 염기를 통해 발색단 11-시스-레티날에 공유 연결된 TM7의 보존된 리신(K),

- 11-시스-레티날의 Schiff 염기 결합을 안정화시키는 TM3의 음성 반대이온(E).

즉, 발색단 포켓은 발색단과 공유 결합하는 TM7의 리신 잔기인 Schiff 염기를 포함하고, TM3의 음성 반대이온을 추가로 포함한다.

생리적 기능의 회복 및 조절 또는 GPCR 수용체 활성의 조절과 같은 의료 요법에서의 사용에 특히 유리한 특성을 나타내도록 유전적으로 조작된 추가의 감광성 키메라 GPCR 단백질이 여전히 필요하다. 특히 유리한 특성은 예를 들어, 형태적 안정성, 생리학적으로 적합한 동역학 특성, 상당한 규모의 반응 및 표적 GPCR의 생리학적 국소화를 위한 효율적인 세포내 트래피킹(trafficking)을 포함한다.

또한, 추가 의료 적용을 위해 추가 표적 GPCR을 포함하는 감광성 옵신 GPCR 키메라에 대한 필요성이 여전히 존재한다. 추가 의료 적용에서 광 활성화 가능한 GPCR 수용체 단백질에 대한 원하는 치료 표적의 비제한적 예는 예를 들어, 통증, 심부전, 불안 또는 색각의 치료를 포함한다.

또한, 유전 공학에 의해 얻을 수 있는 기능적 활성 키메라 감광성 옵신 GPCR 단백질의 설계에 대한 추가 지침이 여전히 필요하다. 감광성 옵신 GPCR 단백질을 생성하는 간단하고 효율적인 유전 공학 방법은 유전자 요법에 의한 변성된 광수용체의 생리학적 회복뿐만 아니라, 추가 적용에 적합할 수 있는 다른 표적 GPCR 단백질의 활성 조작을 위해 여전히 요망된다.

따라서, 본 발명의 일반적인 목적은 위에서 언급된 바와 같은 이러한 요구를 충족시키고 옵신과 표적 GPCR 단백질이라고 하는 추가 GPCR 단백질 사이에 키메라 GPCR 단백질을 제공하는 것이다.

본 발명의 특정 목적은 예를 들어, 천연 광수용체에 의해 제공되는 감광성 신호전달 활성이 부족하거나 불충분하여, 부분 또는 완전 시력 상실 환자를 위한 유전자 요법에서의 사용에 대해 하나 이상의 특히 유리한 특성을 나타내는 추가 키메라 옵신 mGluR6 단백질을 제공하는 것이다.

본 발명의 특정 목적은 표적 세포에서의 효율적인 발현, 예컨대, 예를 들어, ON 두극세포에서 옵신-mGluR6 키메라의 효율적인 발현; 표적 세포에서 효율적이고 특이적인 세포내 분류, 예컨대, 예를 들어, ON 두극세포에서 mGluR6 시그널로솜(signalosome)으로 옵신-mGluR6 키메라의 수지상 트래피킹; 표적 세포의 천연 GPCR G 단백질 신호전달 경로로의 효율적인 결합, 예컨대, 예를 들어, 두극세포에서 Gαo에 결합; 형태적 안정성, 생리학적 동역학 및 낮은 탈감작으로 생리적 산출물을 생성하는 능력을 나타냄을 포함하는 하나 이상의 특정 바람직한 특성이 있는 키메라 옵신 GPCR 단백질을 조작하는 것이다.

본 발명의 추가 목적은 표적-GPCR 특이적 G 단백질 신호전달 캐스케이드의 광 활성화를 가능하게 하기 위해 임의의 표적 GPCR에 적용 가능한 키메라 옵신-GPCR 설계의 간단한 원리를 제공하는 것이다. 이 목적은 특히 세포의 생리학적 조작이나 유전자 치료 또는 기타 의학적 및 약리학적 적용에 사용하기 위해 키메라 옵신 GPCR 단백질을 설계하고 유전적으로 조작하기 위한 간단한 방법의 필요성을 해결한다.

본 발명의 추가 목적은 현재 약제로는 달성되지 않는 비할 데 없는 특이성을 갖는 치료적 GPCR 신호전달 경로를 재확립하거나 개선할 수 있도록 하는 특히 광유전학적 치료제에 사용하기 위한 키메라 옵신 GPCR에 의해 선택된 세포 반응을 조절하는 것이다.

본 발명의 이러한 목적의 비제한적인 예는 추가 키메라 옵신 GPCR, 예컨대, 예를 들어, 의약으로 사용하기 위한 키메라 옵신 오피오이드 수용체 GPCR, 키메라 옵신 하이드록시트립타민 수용체(HT) GPCR, 키메라 GABA(B) 수용체 및 키메라 옵신 베타 아드레날린 수용체 GPCR 단백질을 제공하는 것을 포함한다.

따라서, 본 발명의 목적은 설계된 키메라 옵신 GPCR 단백질을 암호화하는 유전적으로 조작된 핵산 분자, 키메라 옵신 GPCR 단백질을 암호화하는 융합 유전자를 포함하는 핵산 분자를 유전적으로 조작하고 발현시키는 방법, 뿐만 아니라 각각 키메라 옵신 GPCR 단백질 또는 이를 암호화하는 핵산 분자를 기반으로 하는 의학 제품, 특히, 유전자 치료제 및 방법을 제공하는 것을 추가로 포함한다.

설명이 진행됨에 따라 보다 쉽게 명백해질 본 발명의 이러한 목적 및 또 다른 목적을 구현하기 위해, 키메라 옵신 GPCR 단백질 및 이와 관련된 본 발명의 양태를 후술되는 특징에 의해 나타낸다.

본 발명의 제1 양태에서 키메라 옵신 GPCR 단백질이 제공된다:

키메라 옵신 GPCR 단백질은 다양한 길이의 세포외 및 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7)을 포함한다.

키메라 옵신 GPCR 단백질은 상류 옵신의 감광성 옵신 부분 및 표적 GPCR 단백질로 지칭되는 제2 GPCR 단백질의 표적 GPCR 부분으로 지칭되는 제2 GPCR 부분을 포함한다.

표적 GPCR 부분은 표적 GPCR(표적 GPCR CT, 또는 더 짧은 표적 CT)의 C 말단 도메인을 포함한다.

상류 옵신 부분은 발색단에 공유 결합하는 발색단 포켓을 포함한다.

상류 옵신 부분은 절단된 C 말단 도메인을 추가로 포함한다. 상류 옵신의 이러한 절단된 CT는 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단 또는 그 하류에 위치하는 절단 부위를 갖는다.

이 O-CT-근위 영역은 NR(K)Q 모티프 및 원위 방향으로 그 다음의 7~13개의 아미노산을 포함하며,

상기 키메라 옵신 GPCR 단백질은 키메라 C 말단 도메인(키메라 CT)을 포함한다.

표적-GPCR-CT는 절단된 옵신 CT의 하류에 위치한다.

아래에서 더 자세히 설명하는 바와 같이, 대부분의 옵신의 CT의 근위 영역은 NR(K)Q 모티프로 시작하여 이의 하류에서 대략 7 내지 13개 아미노산의 아미노산 위치에서 끝나는 나선 8(H8)로 지칭되는 서브도메인을 포함한다. 최근에, G 단백질 결합 및 활성 조절에서 H8의 잠재적으로 중요한 역할은 구조적 데이터에 의해 표시되었다(Ahn et al., 2010, Sato, 2019, Tsai, et al., 2018). 다른 한편으로, G 단백질 결합 특이성은 본 발명자들이 발견한 바와 같이 CT의 더 원위 영역에 의해 조절된다. H8은 종종 하나 이상의 팔미토일화 부위에 의해 원위 말단에서 세포질막으로 고정된다. O-CT-근위 영역의 원위 말단은 NR(K)Q 모티프의 원위 말단 하류에 있는 대략 10개의 임의의 아미노산 위치, 즉 7 내지 13개 또는 8 내지 12개 또는 9 내지 11개의 아미노산 사이에 위치할 수 있다. 문헌에서, H8은 때때로 TM7과 CT 도메인 사이에 위치하는 추가 GPCR 도메인으로 간주되고 때로는 CT의 서브도메인으로 간주된다. 이 문서에서 H8은 CT의 서브도메인으로 지칭된다.

따라서, 일부 실시형태에서, O-CT 근위 영역의 원위 말단은 다음을 포함하는 군으로부터 선택되는 위치에 위치한다:

- 나선 8(H8)의 원위 말단

- 팔미토일화 부위 또는

- 소 로돕신의 팔미토일화 부위에 상응하는 위치.

제2 GPCR 단백질은 표적 GPCR로 지칭되는데, 이는 광 활성화 키메라 옵신 GPCR이 활성화를 더 이상 천연 옵신 신호전달 경로에 결합시키지 않고, 대신 유전자 조작에 의해 키메라 옵신의 설계 및 구축에 사용되는 의도적으로 선택된 표적 GPCR의 신호전달 경로에 결합시키기 때문이다.

본 발명자들은 표적 GPCR의 CT(표적-CT)와 함께 상류 옵신 CT의 근위 영역(O-CT-근위 영역)을 포함하는 C 말단 도메인이 키메라 옵신 GPCR 단백질을 표적 GPCR의 신호전달 캐스케이드로 효율적으로 결합시키기에 충분하다는 점을 예기치 않게 발견하였다. 이는 특히 표적 GPCR 단백질의 상응하는 특성을 모방하는 키메라 옵신 GPCR의 세포 이하(subcellular) 트래피킹, 반응 동역학, G 단백질 결합 특이성 및 세포내 결합 파트너와의 상호작용과 관련이 있다.

이는 O-CT-근위 영역의 원위 말단에 있는 팔미토일화 부위에서 절단되고 표적 CT와 함께 스플라이싱된 상류 옵신을 포함하는 키메라 옵신 GPCR에서 처음 관찰되었다.

절단된 상류 CT 및 표적 CT를 포함하는 키메라 옵신 GPCR 단백질, 즉 키메라 CT를 포함하는 키메라 옵신 GPCR 단백질이 표적 GPCR 단백질의 임의의 세포내 루프가 없는 경우에도 천연 표적 GPCR 단백질의 생리학적 반응에 상응하거나 이를 능가하는 반응으로 표적 GPCR의 신호전달 경로에 결합시킨다는 것은 대단히 놀라운 점이다. O-CT-근위 영역이 내장된 절단된 옵신 CT는 표적 CT에 의한 G 단백질 활성화 효율을 유의하게 증가시킨다.

본 발명의 옵신 GPCR 단백질은 광 활성화된 G 단백질 활성화를 증진시키기 위해 O-CT-근위 영역을 포함하도록 설계된다. 반면, 이들은 상류 옵신의 전체 CT를 포함하지 않도록 설계된다. 대신, O-CT-근위 영역에 대해 원위에 위치하고 세포 이하 트래피킹, 동역학 조절 및 - 본 발명에 제시된 바와 같이 - G 단백질 특이성에 관여하는 상류 옵신 CT 영역은 키메라 옵신 GPCR에서 제외된다. 즉, 키메라 옵신 GPCR의 표적 GPCR 부분만이 이러한 생리학적 활성을 유도하는 C 말단 영역을 포함한다. 이를 통해 상류 옵신 CT에서 파생된 분자 정보와 표적 GPCR CT의 간섭을 피할 수 있어 표적 GPCR에 관한 G 단백질 특이성, 세포 이하 국소화 특이성 및 동역학 조절이 증진된다. 따라서, 키메라 옵신 GPCR 단백질은 광 활성화 시 표적 GPCR의 반응을 모방하고 광 활성화는 표적 GPCR의 신호전달 캐스케이드에 효율적으로 결합된다.

표적 GPCR 단백질의 세포내 루프는 선택적으로 본 발명의 키메라 옵신 GPCR에 추가될 수 있지만, 이들이 필요한 것은 아니다. 따라서, 본 발명은 - 원하는 경우 - 표적 CT의 근위 말단과 함께 스플라이싱된 상류 옵신 CT의 절단 부위에서 단 하나의 단일 유전자 융합 부위를 사용하여 광 활성화 가능한 키메라 옵신 GPCR 단백질의 유전자 조작을 가능하게 한다.

따라서, 본 발명은 표적 세포의 정확한 세포 이하 구획에서 강력하게 발현시키고 표적 GPCR의 생리학적 반응을 모방하는 반응을 이끌어내는 표적 세포의 천연 G 단백질 경로를 효율적으로 활성화하는, 최소한의 유전자 조작만을 필요로 하는 추가 옵신 GPCR 키메라를 제공한다.

놀랍게도, 본원에 기술된 키메라 옵신 GPCR 단백질은 모든 세포내 루프가 없는 경우에도 예를 들어, opto-mGluR6(van Wyk et al. 2015)과 같은 선행 기술에서 이용 가능한 키메라 감광성 GPCR과 비교하여 표적 GPCR에 특이적인 생리학적 반응을 모방한다.

일부 실시형태에서, 표적 GPCR 단백질은 대사성 글루타메이트 수용체 6(mGluR6)이다. mGluR6은 건강한 생리학적 시각 신호전달 캐스케이드에서 글루타메이트에 의해 활성화되고 G알파(o) 단백질에 결합하여 시각 신호 캐스케이드에 활성화를 결합시키는 망막 ON 두극세포의 내인성 GPCR 단백질이다. ON 두극세포는 시각적 신호 캐스케이드에서 생리학적 광수용기 세포의 바로 하류에 있는 망막 뉴런이다.

본 발명의 제1 양태는 추가로 O-CT-근위 영역 및 표적 GPCR CT 또는 이의 기능적 변이체를 포함하는 키메라 C 말단 펩티드에 관한 것이다. 키메라 C 말단 펩티드의 일부 실시형태에서, 표적 GPCR CT의 이러한 기능적 변이체는 H8의 원위 말단 또는 팔미토일화 부위에 근위 말단을 갖는 표적 GPCR의 원위 C 말단 단편이다. 키메라 C 말단 펩티드의 일부 실시형태에서, C 말단 단편은 표적 GPCR CT의 H8을 추가로 포함한다.

본 발명의 제2 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 및 키메라 C 말단 펩티드를 암호화하는 핵산 분자에 관한 것이다.

본 발명의 제3 양태는 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 제2 양태에 따른 핵산 분자를 표적 세포로 전달하기 위한 의학적 용도를 위한 AAV 캡시드에 관한 것이다. 제3 양태는 추가로 캡시드를 암호화하는 핵산 분자에 관한 것이다.

독립적인 발명은 표적 세포 및 캡시드를 암호화하는 핵산 분자로의 이식유전자의 패키징 및 수송을 위한 합리적으로 설계된 신규한 아데노 관련 바이러스(AAV) 캡시드에 관한 것이다. 독립적인 발명은 특히 키메라 옵신 GPCR을 암호화하는 핵산 분자를 표적 세포로 전달하는 것에 관한 것이다.

본 발명의 제4 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 포함하는 벡터에 관한 것이다.

본 발명의 제5 양태는 제2 양태에 따른 핵산 분자를 포함하거나 발현하는 입자, 특히 나노 입자, 소포, 세포(특히 생식 세포는 제외) 및 동물, 또는 제3 양태에 따른 벡터 또는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR을 포함하는 벡터에 관한 것이다.

본 발명의 제6 양태는 본 발명의 제1 양태의 키메라 옵신 GPCR 단백질을 암호화하는 제2 양태의 핵산 분자를 유전적으로 조작하는 방법에 관한 것이다.

본 발명의 제7 양태는 의학적 용도를 위한 본 발명에 따른 키메라 옵신 GPCR 단백질과 관련된 제품에 관한 것이다. 특히, 제7 양태는 제1 양태에 따른 키메라 옵신 GPCR 단백질, 또는 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자, 또는 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 제4 양태에 따른 벡터, 또는 의료 요법에 사용하기 위한 입자, 소포 또는 세포에 관한 것이다. 제7 양태는 또한 본 발명에 따른 키메라 GPCR 단백질에 기반한 의약 및 위에서 언급된 제품을 사용하는 치료 방법에 관한 것이다.

본 발명의 위에서 언급된 양태의 일부 실시형태는 특히 2개의 옵신을 포함하는 키메라 옵신 mGluR6 단백질 또는 키메라 옵신 GPCR, 및 특히 광수용체 변성으로 인한 시력의 부분 또는 완전 상실로 고통 받는 환자의 유전자 요법을 위한 이의 용도에 관한 것이다.

다음의 상세한 설명을 고려할 때 본 발명은 더 잘 이해될 것이고 위에 기재된 것 이외의 목적이 명백해질 것이다. 이러한 설명은 첨부된 도면을 참조한다:
도 1: 옵신의 일반적인 구조.
도 2: 예시적인 키메라 옵신 GPCR의 도식.
도 3: 키메라 옵신 mGluR6의 예시적인 실시형태.
도 4: 키메라 옵신 GPCR의 예시적인 실시형태는 세포막을 표적으로 한다.
도 5: 키메라 C 말단을 갖는 키메라 옵신 mGluR6의 예시적인 실시형태는 모 옵신과 비교하여 옵신-mGluR6에 의해 매개되는 광 활성화 전류를 증가시켰다.
도 6: HEK-GIRK 세포를 사용한 키메라 옵신 GPCR의 시험관 내 기능적 스크리닝의 예.
도 7: 키메라 옵신 GPCR의 예시적인 실시형태의 G 단백질 재표적화 및 경로 선택성을 조사하는 플레이트 판독기 실험.
도 8: 키메라 옵신-mGluR6 변이체의 예시적인 실시형태의 ON-두극세포 수상돌기 및 mGluR6 시그널로솜으로의 올바른 생체 내 트래피킹.
도 9: 키메라 옵신-mGluR6 GPCR의 예시적인 실시형태는 단리된 ON-두극세포를 직접적으로 감광성으로 만든다.
도 10: 키메라 옵신 mGluR6 변이체의 예시적인 실시형태를 이용한 AAV 유전자 요법에 의해 치료된 시각장애 마우스의 생체 내 시력 측정.
도 11: 키메라 옵신-mGluR6의 예시적인 실시형태로 처리된 시각장애 rd1 망막의 망막 신경절 세포로부터 기록된 생체 외 광 반응.
도 12: 키메라 옵신-mGluR6의 예시적인 실시형태를 발현하는 AAV의 예시적인 실시형태를 사용한 유리체내 유전자 요법 후의 2개의 시각장애 rd1 망막으로부터의 망막을 통한 수직 동결절편의 현미경 사진.
도 13: HEK293-GIRK 세포에서 발현된 예시적인 JSR1(S186F)palm-beta2AR 키메라의 전체 세포 패치-클램프 방법으로 측정된 광 유도 전류.

달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그 외에는, 본원에서 사용되는 특정 용어는 아래 설명에 기재된 의미를 갖는다.

본 명세서 및 청구범위에서 사용되는 단수 형태는 문맥에서 달리 명시하지 않는 한, 복수 형태를 포함한다.

달리 표시되지 않는 한, 일련의 요소 앞에 오는 "적어도"라는 용어는 계열의 모든 요소를 지칭하는 것으로 이해되어야 한다.

이 문서에서, "포함한다" 또는 "포함하는"이라는 용어는 명시된 요소 또는 단계 또는 요소 또는 단계의 집합을 포함하는 것으로 정의된다. 이 문서에서, "포함한다" 또는 "포함하는"이라는 용어는 일반적으로 임의의 다른 요소 또는 단계 또는 요소 또는 단계의 집합을 배제하지 않는다. 또한, 이 문서에서 "포함한다" 또는 "포함하는"이라는 용어는 또한 요소 또는 단계 또는 요소 또는 단계의 집합에 대한 정확한 서술과 관련이 있다. "포함한다" 또는 "포함하는"이라는 용어의 의미의 이 후자의 경우에만, 청구범위에 명시되지 않은 임의의 요소, 단계 또는 성분을 일반적으로 배제하는 용어 "구성되는"과 사실상 일치한다.

본 발명의 제1 양태는 키메라 옵신 GPCR 단백질에 관한 것이다. 제2 GPCR 단백질의 감광성 상류 옵신 부분 및 제2 GPCR 부분(표적-GPCR 부분)을 포함하는 "키메라 옵신 GPCR 단백질"이라는 어구는 전술한 바와 같이 GPCR 단백질 중 특징적인 보존된 구조인 3차 구조를 포함하는 감광성 유전자 조작 GPCR 단백질을 지칭한다. 키메라 옵신 GPCR 단백질 - 대안적으로 (키메라) 옵신 GPCR 수용체 또는 (키메라) 옵신 GPCR 또는 키메라 GPCR로 지칭됨 - 및 이를 암호화하는 키메라 핵산 분자 또는 키메라 (융합) 유전자는 특히 예를 들어, 모 유전자 절삭 및 선택된 모 유전자 부분의 결찰 또는 예를 들어, 키메라 옵신 GPCR 단백질 또는 이의 단편을 암호화하는 핵산 분자의 합성을 포함하는 당업계에 공지된 유전자 조작 기술에 의해 수득 가능하다. 상류 옵신 부분은 빛에 노출되면 키메라 GPCR 수용체에 광 감도와 활성화를 부여한다. 제2 GPCR 부분은 위에서 설명된 바와 같이 표적 GPCR의 생리학적 신호 경로에 특이적인 G 단백질에 대해 키메라 옵신 GPCR 단백질의 광 활성화를 결합시키기 때문에 표적 GPCR 부분으로 지칭된다. 예시적인 표적 GPCR은 예를 들어, β-아드레날린성 수용체, GABA(B) 수용체, MOR, 뮤 오피오이드 수용체, 5-HT7과 같은 세로토닌 수용체, OPN1과 같은 제2 옵신 및 mGluR6 또는 mGluR5와 같은 대사성 글루타메이트 수용체(mGluR)를 포함한다.

이 문서에서, 키메라 옵신 GPCR이 유래되는 옵신 및 표적 GPCR은 모 GPCR이라 지칭된다. 따라서, 예를 들어, 키메라 멜라놉신 mGluR6 단백질은 모 GPCR 멜라놉신 및 모 mGluR6의 부분을 사용하여 설계되고 조작된다. 문맥에서 알 수 있듯이, 모 GPCR이라는 용어는 모 GPRC 단백질 또는 모 GPCR 유전자 또는 둘 다를 지칭한다.

이 문서에서, GPCR 단백질이라는 용어는 G 단백질 결합 수용체 단백질을 지칭한다.

이 문서에서, "옵신"이라는 용어는 클래스 A GPCR 단백질의 감광성 구성원을 지칭하며, 특히 생리학적, 천연 옵신을 지칭한다. 일부 실시형태에서, 용어 "옵신"은 또한 기능적 활성, 즉, 아래에 추가로 기술되는 보존된 GPCR 3D 구조 및 보존된 모티프를 일반적으로 포함하는 천연 옵신의 변이체인 감광성 옵신을 포함할 수 있다. 이러한 유전적 옵신 변이체는 예를 들어, 돌연변이된 옵신 유전자 또는 유전적으로 조작된 유전자, 예를 들어 기능적인 감광성 옵신을 암호화하는 키메라 옵신 유전자로부터 유래된 핵산 분자에 의해 암호화된다.

유사하게, 용어 표적 GPCR은 일반적으로 생리학적, 자연 발생 표적 GPCR을 지칭하고, 일부 실시형태에서는 일반적으로 위에서 언급된 보존된 GPCR 3D 구조 및 보존된 모티프를 나타내고 기능적, 즉 표적 GPCR의 신호전달 경로에 활성화를 효율적으로 결합시킬 수 있는, mGluR6의 변이체와 같은 천연 표적 GPCR의 변이체를 지칭한다. 표적 GPCR의 이러한 변이체는 예를 들어, 돌연변이된 표적 GPCR 유전자 또는 유전적으로 조작된 유전자, 예를 들어 기능적 활성 표적 GPCR 단백질을 암호화하는 키메라 표적 GPCR 유전자로부터 유래된 핵산 분자에 의해 암호화된다.

따라서, 이 문서에서, 일부 실시형태에서 용어 도메인 또는 서브도메인은 GPCR 단백질의 생리학적 천연 도메인 외에 도메인 또는 서브도메인의 유전적 변이체, 예컨대, 예를 들어, 천연 GPCR 도메인 또는 서브도메인을 기능적으로 모방하는, 돌연변이된 또는 유전자 조작된, 예를 들어, 키메라 또는 합성 도메인 또는 서브도메인을 포함할 수 있다.

상류 옵신 부분의 각 도메인은 상류 옵신(상류 옵신 유전자) 또는 이의 유전적 변이체를 암호화하는 유전자로부터 유래된 유전자 단편에 의해 암호화된다. 표적 GPCR 부분의 각 도메인은 표적 GPCR 유전자 또는 이의 유전적 변이체로부터 유래된 유전자 단편에 의해 암호화된다. 함께 상류 옵신 유전자 단편에 의해 암호화되는 키메라 옵신 GPCR의 모든 도메인은 상류 옵신 부분으로 지칭되고 유사하게 함께 표적 GPCR 유전자 단편에 의해 암호화되는 모든 도메인 또는 서브도메인은 표적 GPCR 부분으로 지칭된다. 일부 실시형태에서, 상류 옵신 부분 및 또는 표적 GPCR 부분은 하나 이상, 특히 2 또는 3개의 모 유전자로부터 유래될 수 있다.

표적 GPCR은 임의의 GPCR 클래스, 특히 클래스 A, B 또는 C, 더욱 특별하게는 클래스 A 또는 C로부터 선택될 수 있다. 클래스 A의 예시적인 표적 GPCR은 예를 들어, 원추형 옵신, 세로토닌 수용체(예를 들어, 5-HT7), 뮤 오피오이드 또는 β-아드레날린성 수용체를 포함한다. 클래스 B의 예시적인 표적 GPCR은 예를 들어 글루카곤 수용체(GCGR) 및 기타 호르몬 수용체를 포함한다. 클래스 C의 예시적인 표적 GPCR은 예를 들어, 대사성 글루타메이트 수용체(mGluR, 예를 들어 mGluR6, mGluR5) 또는 GABA_B 수용체)를 포함한다.

GPCR 단백질의 막관통 도메인과 세포내 도메인 사이 및 이에 따라 이를 암호화하는 유전자 단편 사이에는 도 1에 제시된 바와 같이 TM1과 IL1 사이의 접합부 (a), IL1과 TM2 사이의 접합부 (b), TM3과 IL2 사이의 접합부 (c) 등등 TM7과 CT 사이의 접합부 (g)까지로 지칭되는 전이부를 형성하는 6개의 접합부가 있다.

유사하게, GPCR 단백질의 막관통 도메인과 세포외 도메인 사이 및 이들을 암호화하는 유전자 단편의 사이에는 또한 도 2에 제시된 바와 같이 NT와 TM1 사이의 접합부 (A'), TM2와 EL1 사이의 접합부 (B'), EL1과 TM3 사이의 접합부 (C') 등등 EL3과 TM7 사이의 접합부 (G')까지로 지칭되는 전이부를 형성하는 6개의 접합부가 있다.

이 문서에서, 당업계에서 일반적으로 사용되는 "보존된 모티프"라는 용어는 정확히 동일한, 예를 들어, 특정 보존된 모티프를 지칭할 때 일반적으로 인용되는 3~5개의 아미노산으로 구성된 모티프로 제한되지 않는다. 오히려, 이러한 보존된 각 모티프는 예를 들어, 아래 표 1에 포함된 것과 같은 몇몇 대안을 나타내는 특히 빈번한 프로토타입 서열의 이름을 따서 명명된다.

또한, 기능적 변이체는 보존된 모티프에서 유래될 수 있다. 예를 들어, E(D)RY 모티프(ERY 및 DRY)의 기능적 변이체에는 DRIY(서열번호 83), NRIY(서열번호 84) 또는 NRY가 포함되며, 이들 모두는 감광성 옵신-mGluR6 키메라 GPCR을 생성한다(WO 2012/174674 참조). 보존된 모티프의 예시적인 기능적 변이체도 아래 표 2에 제시되어 있다.

분명히, 몇몇 보존된 모티프는 TM 도메인과 세포내 도메인 사이의 접합부 또는 그 주변에서, 즉, 막관통 나선(TM1 내지 TM7)과 세포내 루프(IL1 내지 IL3) 및 C 말단(CT) 사이의 접합부 또는 그 주변에서 발생한다. 그러나 모든 접합부가 고도로 보존된 모티프를 반드시 포함하는 것은 아니다.

이 문서에서, NPxxY 모티프라는 용어는 특히 모 상류 옵신 또는 모 표적 GPCR 또는 키메라 옵신 GPCR의, GPCR 단백질의 TM7의 원위 말단에 있는, 즉 TM7/CT 접합부 주변에 있는 보존된 모티프를 지칭하며, 다음의 기준 중 하나 이상을 충족함으로써 정의된다:

A) 이는 아미노산에 대한 한 문자 부호에 따른 서열 NPxxY의 5개의 연속적인 아미노산의 서열임(여기서 x는 임의의 아미노산 잔기에 상응함);

B) 이는 아래 표 I에 열거된 특정 GPCR의 NPxxY 모티프에 상응하는 서열임;

C) 이는 소 로돕신의 아미노산 서열과 모 GPCR, 특히 모 상류 옵신의 아미노산 서열의 정렬에서 소 로돕신의 N(302)PxxY(136)의 서열에 상응하는 5개 아미노산의 서열임.

NPxxY 모티프는 비록 상당한 서열 변이를 나타내지만(예를 들어, 문헌[Sato, 2019]의 표 2 참조) 모든 클래스 A GPCR과 대부분의 기타 GPCR에서 존재하고 식별 가능하다.

이 문서에서, NR(K)Q 모티프라는 용어는 GPCR 단백질, 특히 모 상류 옵신 또는 모 표적 GPCR 또는 키메라 옵신 GPCR 및 H8의 근위 말단 주변의 옵신 CT의 NPxxY 모티프에서 몇몇 아미노산 하류에 있는 CT의 근위 영역에 있는 보존된 모티프를 지칭하며, 다음의 기준 중 하나 또는 둘 다를 충족함으로써 정의된다:

A) 이는 특정 GPCR, 특히 표 1 또는 문헌[Davies et al. 2010]에 열거된 모 상류 옵신에 대한 NR(K)Q 모티프에 상응하는 서열임;

B) 이는 소 로돕신의 아미노산 서열과 모 GPCR, 특히 모 상류 옵신의 아미노산 서열의 정렬에서 소 로돕신의 N(310)KQ(312)의 서열에 상응하는 3 또는 4개의 연속적인 아미노산의 서열임.

NR(K)Q 모티프는 모든 클래스 A GPCR과 대부분의 기타 GPCR에서 존재하고 식별 가능하다. 특히, NR(K)Q 모티프는 상당한 서열 변이를 나타내지만, 소 로돕신과의 서열 정렬에 의해 식별 가능한 3 또는 4개의 연속적인 아미노산의 서열에 상응한다. NR(K)Q 모티프에는 HPK 또는 HPE 또는 HKQ 또는 HPR 또는 IRK 또는 DYK 등과 같은 서열이 포함된다(Davies W. et al., 2010).

이 문서에서, 용어 "팔미토일화 부위" 및 "팔미토일화 부위에 상응하는 아미노산 위치"(후자는 줄여서 팔미토일화 부위라고도 함)는 다음의 기준 A, B, C 및 D 중 하나 이상을 충족함으로써 정의된다. 특히, 팔미토일화 부위라는 용어는 하나의 기준, 예를 들어, A를 충족하거나, 또는 두 가지 기준 B 및 C 또는 B 및 D 또는 C 및 D 또는 세 가지 기준 B, C 및 D를 충족한다. 기준 A에서 D는 다음과 같다:

A) 이는 모 GPCR, 특히 모 옵신의 CT에 있는 팔미토일화 아미노산 잔기임;

B) 이는 모 GPCR, 특히 모 옵신의 CT에 있는 팔미토일화 가능한 아미노산 잔기로서, 아미노산 시스테인(C), 세린(S), 트레오닌(T), 티로신(Y) 또는 트립토판(W)으로부터 선택된 옵신의 NR(K)Q 모티프의 원위 말단의 하류에서 적어도 7개 아미노산, 특히 적어도 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치함;

C) 이는 모 GPCR, 특히 모 옵신의 CT에 있는 아미노산 잔기로서, NR(K)Q 모티프의 원위 말단의 하류에서 7 내지 13개 아미노산 잔기 사이, 특히 8 내지 12개 사이, 또는 9 내지 11개 사이 또는 10개 아미노산 잔기에 위치함;

D) 이는 소 로돕신과 모 GPCR, 특히 모 옵신의 아미노산 서열의 정렬에서 소 로돕신의 C322 또는 C323에 상응하는 아미노산 잔기임.

특히, 이 마지막 기준 D는 실제로 팔미토일화되지 않았지만 아미노산 서열 정렬에서 로돕신의 팔미토일화된 C322 및 C323에 상응하는 H8의 말단에 위치한 아미노산 잔기를 지칭한다. 예를 들어, 인간 원추형 옵신 hOPN1MW 및 hOPN1LW에서, 이러한 아미노산 위치는 아미노산 잔기 G338 및 K339에 상응한다.

H8의 원위 말단의 팔미토일화된 아미노산 잔기는 - 존재하는 경우 - H8의 막 결합을 유리하게 증진시킨다. 따라서, H8의 원위 말단에 하나 이상의 팔미토일화 부위를 갖는 상류 옵신을 포함하는 키메라 옵신 GPCR에서, 적어도 하나의 팔미토일화 부위는 가장 바람직하게는 절단된 상류 옵신 CT에 유지된다. 따라서, 이 문서에서 위의 기준 A 또는 B를 충족시키는 팔미토일화 부위의 절단 부위에 대한 언급은 달리 표시되지 않는 한 팔미토일화 부위에 말단으로 인접하게 위치한다.

이 문서에서, 단백질 및 핵산 분자의 맥락에서, 용어 하류 및 원위는 단백질의 C 말단 방향 또는 영역 및 핵산 분자의 3' 방향 또는 영역을 나타내는 반면, 용어 상류 및 근위는 단백질의 N 말단 방향 또는 영역 및 핵산 분자의 5' 방향 또는 영역을 나타낸다. ~의 하류 및 ~의 원위라는 용어와 이에 따른 ~의 상류 및 ~의 근위라는 용어도 상호 교환적으로 사용된다.

이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 상류(또는 근위)라는 용어는 근위쪽으로 인접한 위치를 포함하는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위 말단의 상류(또는 근위)의 위치를 지칭한다.

이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 하류(또는 원위)라는 용어는 원위쪽으로 인접한 위치를 포함하는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 원위 말단의 하류(또는 원위)의 위치를 지칭한다.

이 문서에서, 특정 도메인, 서브도메인, 영역, 모티프 또는 부위"에 있는"라는 어구는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내의 위치를 지칭한다. 이 문서에서, 특정 모티프 또는 부위"에 있는 또는 이의 원위의"라는 어구는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내의 위치 또는 이의 원위 위치를 지칭한다. "~에 있는 또는 이의 하류의", "~에 있는 또는 이의 근위의" 및 "~에 있는 또는 이의 상류의"라는 어구에 준용할 수 있다.

이 문서에서, 두 개의 특정 모티프 또는 부위 사이라는 어구, 예컨대, 예를 들어, NR(K)Q 모티프와 팔미토일화 부위 사이는 문맥에서 명시적으로 언급되거나 명백하지 않는 한, 원래 또는 기능적으로 동등한 버전으로 유지되거나 재구성되는 한 이러한 모티프 또는 부위 내의 아미노산 위치를 포함한다. 실제로, 2개의 보존된 모티프 또는 부위 사이 또는 보존된 모티프와 또 다른 아미노산 위치 사이의 스플라이싱 부위를 포함하는 일부 바람직한 실시형태에서, 바람직한 스플라이싱 부위는 보존된 모티프 내에 위치할 수 있으며, 스플라이싱 조작 완료 후에 보존된 모티프 또는 부위 또는 이의 기능적 등가물이 유지되거나 재구성된다.

이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위 말단에 있는 또는 상류 말단에 있는 이라는 어구는 근위(또는 상류) 말단에 있는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내에 여전히 완전히 또는 부분적으로 존재하거나 또는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위(또는 상류 말단)에 근위쪽으로 인접한 근위(또는 상류) 말단에서의 위치를 포함한다.

이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 원위 말단에 있는 또는 하류 말단에 있는 이라는 어구는 유사하게 원위(또는 하류 말단)에 있는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내에 여전히 완전히 또는 부분적으로 존재하거나 또는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위에 원위쪽으로 인접한 원위(또는 하류) 말단에서의 위치를 포함한다.

이 문서에서, 신호전달 경로의 맥락에서 상류 및 하류는 각각 이전 및 이후 단계에 관련된 경로 또는 세포 또는 구성요소의 이전 및 이후 단계를 지칭한다.

이 문서에서, (유전자) 스플라이싱 부위 및 (유전자) 융합 부위, 절단 부위 또는 절삭 및 결찰 부위와 같은 대안적 또는 유사한 용어는 상이한 기원의 유전자 단편, 특히 상이한 모 GPCR로부터 유래된 유전자 단편이 연결되는 부위를 지칭한다.

다르게 언급되지 않는 한, 유전자 조작의 종료 시 보존된 모티프 또는 부위에 위치한 유전자 스플라이싱 부위(융합 부위, 절삭 및 결찰 부위, 절단 부위)는 전술한 바와 같이 동일하거나 기능적으로 동등한 모티프 또는 설계를 유지하거나 재구성한다. 스플라이싱 부위가 특정 모티프, 부위 또는 아미노산 위치의 상류/근위 또는 하류/원위에 위치하는 것으로 정의되더라도, 상기 유전자 스플라이싱 부위는 완료된 유전자 조작(예를 들어, 절삭, 결찰, 절단 융합, 스플라이싱)의 결과로서 보존된 모티프 또는 아미노산이 복원되거나 예를 들어, 일부 실시형태에서, 보존적 아미노산 치환을 포함하는 전술한 바와 같은 이의 기능적 유도체에 의해 대체되는 경우 이러한 특정 모티프, 부위 또는 아미노산에 또는 그 내부에 위치할 수 있다.

이 문서에서, 당업계에서 일반적인 바와 같이 일반적으로 G알파(i/o)의 경우 G(i/o) 또는 G알파(o)의 경우 Ga(o) 또는 G알파(q)의 경우 Ga(q)의 패턴을 따르는 G 단백질 및 이들의 상응하는 G알파 서브유닛의 축약형이 사용될 수 있다.

이 문서에서, 변이체라는 용어는 참조 폴리펩티드와 상이하지만 본질적 특성을 유지하는 폴리펩티드 또는 이를 암호화하는 유전자를 지칭한다. 폴리펩티드의 전형적 변이체는 참조로 사용된 또 다른 폴리펩티드와 그 일차 아미노산 서열이 상이하다. 일반적으로, 차이는 참조 폴리펩티드 및 변이체의 서열이 전반적으로 밀접하게 유사하고, 여러 영역에서, 동일하도록 제한된다. 변이체 및 참조 폴리펩티드는 하나 이상의 변형(예를 들어, 치환, 부가, 및/또는 결실)에 의해 아미노산 서열이 상이할 수 있다. 폴리펩티드 변이체는 자연 발생, 예컨대 대립유전자 변이체일 수 있거나, 자연 발생하는 것으로 알려져 있지 않은 변이체일 수 있다. 즉, 변이체는 인위적으로 구축될 수 있다.

이 문서에서 아미노산 서열의 맥락에서 "서열 동일성 백분율", "~와 동일한 백분율", "유사성 백분율"이라는 어구는 아미노산 서열의 총 길이의 아미노산 잔기의 수와 비교하여 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산 서열의 일치 수를 나타낸다. 따라서, 당업계에 공지된 서열 비교 알고리즘을 사용하여 측정 시 서열을 최대 상응성을 위해 비교하고 정렬하는 경우, 또는 특히 짧은 서열 모티프의 경우, 수동으로 정렬하고 시각적으로 검사하는 경우, 정렬을 사용하여, 2개 이상의 서열에 대해, 동일한 아미노산 잔기의 백분율(예를 들어, 아미노산 서열의 전장에 걸쳐 90%, 또는 95% 또는 100%의 동일성)을 결정할 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하기 위한 적합한 프로그램은 당업계에 공지되어 있다.

비교를 위한 서열의 정렬은, 예를 들어, 문헌[Smith and Waterman, Adv. Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘, 문헌[Needleman 25 and Wunsch, J. Mol. Biol. 48:443 (1970)]의 전체 정렬 알고리즘, 문헌[Pearson and Lipman, Proc. Nat. Acad. Sci. 85:2444 (1988)]의 유사도 방법 검색 또는, CLUSTAL, 예를 들어, CLUSTALW, Clustal Omega, GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함하지만, 이에 제한되지 않는 이러한 알고리즘의 컴퓨터 구현에 의해 수행될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 예를 들어, 미국 국립 생명공학 정보 센터(National Center for Biotechnology - Information)를 통해 공개적으로 이용 가능하다(NCBI BLAST 알고리즘(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402, http://blast.ncbi.nlm.nih.gov/). 핵산 서열 비교를 위한 한 가지 예는 기본 설정을 사용하는 BLASTN 알고리즘이다: 예상 역치: 10; 워드 크기: 28; 쿼리 범위에서의 최대 일치: 0; 일치/불일치 점수: 1.-2; 갭 코스트: 선형. 달리 언급되지 않는 한, 본원에 제공된 서열 동일성 값은 각각 단백질 및 핵산 비교에 대해 위에서 확인된 35개의 기본 매개변수를 사용하여 BLAST 프로그램 제품군(문헌[Altschul et al., J. Mol. Biol. 215:403-410 (1990)])을 사용하여 얻은 값을 지칭한다.

이 문서에서 용어 보존적 아미노산 치환은 상응하는 참조와 예를 들어, 유사한 크기, 형상, 전하, 화학적 특성(예를 들어 공유 또는 수소 결합을 형성하는 능력 포함) 등 물리적, 생물학적, 화학적 또는 기능적으로 유사한 변형을 지칭한다.

예를 들어, 보존적 아미노산 치환은 아미노산 잔기가 동일한 측쇄 패밀리의 다른 아미노산 잔기로 대체되는 것을 포함하며, 예를 들어 세린이 트레오닌으로 치환될 수 있다. 아미노산 잔기는 일반적으로 다음과 같은 공통적이고 유사한 측쇄 특성에 따라 패밀리로 나뉜다:

1. 비극성 측쇄(예를 들어, 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌),

2. 하전되지 않은 극성 측쇄(예를 들어, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 프롤린, 시스테인, 트립토판),

3. 염기성 측쇄(예를 들어, 리신, 아르기닌, 히스티딘, 프롤린),

4. 산성 측쇄(예를 들어, 아스파르트산, 글루탐산),

5. 베타-분지 측쇄(예를 들어, 트레오닌, 발린, 이소류신), 및

6. 방향족 측쇄(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘).

보존적 치환은 또한 비천연 아미노산의 사용을 포함할 수 있다.

이 문서에서 용어 "유사한 단백질 서열"은 정렬될 때 비교될 서열의 상응하는 위치에서 유사한 아미노산 잔기 및 가장 흔히 동일한 아미노산 잔기를 공유하는 것들이다. 유사한 아미노산 잔기는 측쇄의 화학적 특성에 따라 패밀리로 그룹화된다. 상기 패밀리는 "보존적 아미노산 치환"에 대해 전술되어 있다. 서열 간의 "유사성 백분율"은 비교될 서열의 상응하는 서열 위치에서 동일하거나 유사한 잔기를 함유하는 위치의 수를 비교되는 총 위치 수로 나누고 100%를 곱한 것이다. 예를 들어, 10개의 서열 위치 중 6개의 위치에 동일한 아미노산 잔기가 있고 10개의 위치 중 2개의 위치에 유사한 잔기가 포함되어 있으면, 서열은 80% 유사성을 갖는다. 두 서열 간의 유사성은 예를 들어 EMBOSS Needle을 사용하여 결정할 수 있다.

이 문서에서, 옵신 CT의 근위 영역은 O-CT-근위 영역이라고 하며, NR(K)Q 모티프와 종종 나선 8(H8)을 포함하는 원위 방향으로 다음의 대략 10개의 아미노산, 특히 7 내지 13개, 더욱 특별하게는 8 내지 12개 또는 가장 특별하게는 9 내지 11개의 아미노산을 포함하는 것으로 정의된다. 옵신 CT의 근위 영역은 선택적으로 H8의 원위 말단에 있는 팔미토일화 부위 (C)를 포함한다.

이 문서에서, 절단된 옵신 CT라는 용어는 절단된 옵신 CT에서 원위 방향으로 모 상류 옵신 CT의 아미노산이 제외되는 절단 부위에서 절단된 상류 옵신의 절단된 CT를 지칭한다. 절단된 CT의 절단 부위는 O-CT-근위 영역의 원위 말단 또는 이의 원위, 특히 위에 정의된 바와 같은 O-CT-근위 영역에 대한 원위 연장부의 원위 말단의 아미노산 위치에 위치한다.

키메라 옵신 GPCR 단백질의 바람직한 실시형태에서, 절단된 옵신 CT의 절단 부위는 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단에 위치한다.

그러나 키메라 옵신 GPCR의 일부 실시형태는 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 있는 상류 옵신 CT의 절단 부위를 포함한다. O-CT-근위 영역에 대한 원위 연장부는 O-CT-근위 영역의 원위 말단의 하류 또는 특히 팔미토일화 부위의 하류에서 최대 5개 또는 최대 10개 또는 최대 16개 또는 최대 22개 또는 최대 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산에 있는 원위 말단을 포함한다.

일부 실시형태에서, 옵신 CT의 절단 부위는 NR(K)Q 모티프의 하류에서 최대 41개 또는 최대 43개 또는 최대 45개 또는 최대 47개 아미노산의 위치에서 선택된다.

O-CT-근위 영역에 대한 원위 연장부를 포함하는 일부 바람직한 실시형태에서, 상류 옵신은 멜라놉신의 군으로부터 선택된다.

O-CT-근위 영역에 대한 원위 연장부를 포함하는 일부 실시형태에서, 상류 옵신은 긴 CT 도메인을 포함한다. 예를 들어, 이는 적어도 50, 65, 80, 100, 150 또는 200개의 아미노산을 갖는 CT를 포함한다.

O-CT-근위 영역에 대한 원위 연장부를 갖는 이러한 실시형태 및 다른 실시형태 중 일부에서, 원위 연장부의 원위 말단은 상류 옵신에 특이적인 세포내 트래피킹 및 동역학 특성에 영향을 미치는 상류 옵신 CT의 서브도메인이 제외되도록 선택된다.

멜라놉신의 비정상적으로 긴 C 말단 세포질 영역(뮤린 OPN4의 AA364~521)은 다른 GPCR과 제한된 상동성을 나타낸다. 따라서, 이는 멜라놉신의 특징적인 반응 특성에 기여할 수 있으며, 이는 일시계를 바꾸는 환경적 광 검출기인 시간 경과에 따른 입력을 합산한다. 다양한 종의 멜라놉신 사이에 고도로 보존되어 있는 마우스 Opn4의 AA381~397은 광활성화된 멜라놉신의 반응을 형성하는 데 중요한 역할을 한다고 제안되었다(Mure et al. 2016). 따라서, 상류 옵신으로서 멜라놉신을 갖는 키메라 옵신 GPCR의 일부 실시형태는 마우스 멜라놉신의 397번 아미노산 위치에 있는 또는 이의 원위의 절단된 멜라놉신을 포함하여 이의 반응 동역학을 가속화한다. 아미노산 위치 397은 마우스 멜라놉신에서 아미노산 위치 364에 위치한 팜(palm) 부위의 하류의 33개 아미노산에 상응한다.

따라서, 옵신이 멜라놉신인 키메라 옵신 GPCR 단백질의 일부 실시형태에서, 절단된 옵신 CT는 팔미토일화 부위의 하류의 최대 약 33개 아미노산에 상응하는 NR(K)Q 모티프의 원위 말단의 하류의 최대 약 44개 아미노산을 포함한다.

키메라 옵신 GPCR의 일부 실시형태에서 상류 옵신 부분은 절단 부위까지 전체 상류 옵신을 포함하거나, 또는 상류 옵신 부분은 E(DRY) 모티프에서 절단 부위까지의 상류 옵신의 연속 영역을 포함하거나, 또는 상류 옵신 부분은 TM3, TM4, TM5, TM6 및 TM7 및 선택적으로 절단 부위까지 절단된 상류 옵신 CT를 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 막관통 도메인 TM3 및 TM7을 포함하고, 특히 막관통 도메인 TM3 내지 TM7, TM2 내지 TM7을 포함하거나 TM1 내지 TM7을 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 EL1, EL2, EL3 및 NT로부터 선택된 세포외 도메인 중 하나 이상을 추가로 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 2개 이상의 모 옵신, 특히 2개의 모 옵신으로부터 유래된다.

일부 실시형태에서, 상류 옵신 부분은 비인간 옵신인 모 옵신으로부터 유래된 막관통 도메인을 포함하고 인간 옵신인 모 옵신으로부터 유래된 1개 이상, 특히 2개 또는 3개, 또는 모든 세포외 도메인을 추가로 포함한다. 유리하게는, 이들 실시형태에서 인간 면역계는 인간 옵신으로부터 유래된 세포외 도메인을 외래 에피토프로 인식하지 않는다. 따라서, 옵신 GPCR 단백질의 일부 바람직한 실시형태에서, 모든 세포외 도메인은 인간 옵신으로부터 유래된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, TM7 및 절단된 옵신 CT는 동일한 모 옵신으로부터 유래된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 모든 세포외 도메인, 모든 막관통 도메인 및 모든 세포내 루프를 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 CT의 절단 부위까지 전체 모 상류 옵신을 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 단일안정성(mono-stable) 또는 이안정성(bi-stable) 옵신 또는 삼안정성(tri-stable) 옵신, 특히 이안정성 옵신으로부터 유래된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 다음을 포함하는 옵신의 군으로부터 선택된 모 옵신으로부터 유래된다:

- 멜라놉신(OPN4)

- 로돕신(RHO)

- 원추형 옵신(OPN1SW, OPN1LW 및 OPN1MW)

- 해파리 옵신(cubop, JellyOP)

- 깡충거미(jumping spider) 로돕신(JSR1)

- 파라피놉신(PPO)

- 뉴롭신(OPN5)

- 엔세팔롭신(OPN3)

키메라 옵신-GPCR 단백질의 일부 실시형태에서, 결실 또는 부가, 특히 최대 5개 또는 최대 10개 또는 최대 15개 또는 최대 20개 또는 최대 30개 아미노산의 결실 또는 부가가 생리학적 모 옵신과 비교하여 키메라 옵신 GPCR의 상류 옵신 부분에 존재한다. 이러한 실시형태 및 다른 실시형태 중 일부에서 아미노산의 치환, 특히 보존적 아미노산의 치환 및/또는 특히 최대 5개 또는 최대 10개 또는 최대 15개 또는 20개의 치환된 아미노산이 생리학적 모 옵신과 비교하여 키메라 옵신 GPCR의 상류 옵신 부분에 존재한다.

키메라 옵신-GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분의 아미노산 서열은 생리학적인 하나 이상의 모 옵신의 상응하는 부분과 적어도 80%, 85%, 90%, 92%, 93%, 94%, 95%, 95%, 96%, 97%, 98%, 99%, 특히 완전히 동일하거나 유사하다.

이 문서에서, 표적 GPCR CT 또는 줄여서 표적 CT라는 용어는 표적 GPCR의 본질적으로 완전한 CT 또는 이의 기능적 활성 변이체를 지칭한다. 표적 CT의 기능적 활성 변이체는 키메라 옵신 GPCR 또는 모 표적 GPCR의 활성화를 유사한 효율로 모 GPCR의 특정 신호전달 경로에 결합시킬 수 있다.

이전 청구항 중 하나에 따른 키메라 옵신 GPCR로서, 표적 GPCR을 포함하고, 특히 하나 이상의 아미노산의 결실, 특히 NPxxY 모티프와 팔미토일화 부위까지 또는 팔미토일화 부위에 근위쪽으로 인접한 아미노산 위치까지의 임의의 아미노산 위치 사이의 N 말단 결실을 포함하는 키메라 옵신 GPCR.

일부 실시형태에서 표적 GPCR CT는 본질적으로 완전하다. 특히 본질적으로 완전한 표적 GPRC는 NPxxY와 NR(K)Q 부위에 있거나 그 사이에 있는 근위 말단을 포함한다. 일부 실시형태에서 표적 GPCR CT는 NR(K)Q 부위의 하류에서 1개의 아미노산 또는 최대 2개 또는 최대 3개 또는 최대 4개 또는 최대 5개 아미노산의 근위 말단을 갖는다. 일부 실시형태에서 표적 CT는 NR(K)Q 부위의 원위에 있는 약 7 내지 13 또는 8 내지 12 또는 9 내지 11개 또는 대략 10개 아미노산에 있거나 또는 특히 팔미토일화 부위에 있거나 위에서 정의된 바와 같은 팔미토일화 부위에 상응하는 아미노산 위치에 있는 표적 CT의 근위 영역의 원위 말단과 NR(K)Q 부위 사이에 있는 근위 말단을 갖는다.

모 표적 GPCR의 CT의 기능적 변이가 있는 일부 실시형태에서, 표적 GPCR의 TM7의 원위 말단에 있는 NPxxY 모티프와 표적 GPCR CT의 H8의 근위 말단에 있는 NR(K)Q 모티프 사이에 위치한 하나 이상의 아미노산은 결실되거나 치환된다.

모 표적 GPCR의 기능적 변이체를 갖는 일부 추가 실시형태에서 표적 GPCR의 근위 영역은 H8의 원위 말단에 있는 팔미토일화 부위까지 결실된다. 따라서, 이들 실시형태 또는 H8을 포함하지 않는 표적 CT를 갖는 일부 추가 실시형태에서, 표적 GPCR의 NR(K)Q 모티프 및 후속 7 내지 13개 또는 8 내지 12개 또는 9 내지 11개 아미노산이 결실된다. 특정 실시형태에서, 위에서 정의된 바와 같은 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 부위의 근위의 아미노산이 결실된다.

이들 실시형태 중 일부에서 이러한 기능적 표적 GPCR CT 및 절단된 옵신 CT는 팔미토일화 부위에서 함께 스플라이싱된다.

치환 및/또는 결실을 포함하는 CT의 기능적 변이체의 일부 실시형태에서 보존된 NR(K)Q 모티프는 온전하게 유지된다.

모 표적 GPCR의 CT의 기능적 변이체를 갖는 일부 실시형태에서, 키메라 옵신 GPCR 단백질의 표적 GPCR 부분의 표적 GPCR CT의 아미노산 서열은 생리학적 모 표적 GPCR CT와 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일하거나 유사하다.

키메라 옵신 GPCR의 일부 실시형태에서, 표적 GPCR 부분은 비옵신 GPCR로부터 유래된다. 키메라 옵신 GPCR의 일부 다른 실시형태에서, 표적 GPCR 부분은 옵신으로부터 유래된다.

따라서, 일부 실시형태는 2개의 옵신, 즉 상류 옵신 및 표적 옵신으로 지칭되는 하류 옵신을 포함한다.

상류 옵신 부분은 광 활성화 가능하며 표적 GPCR CT에 광 활성화를 결합시킨다. 표적 옵신은 생리학적으로 표적 옵신과 관련된 G알파 단백질에 결합하여 표적 옵신의 신호전달 캐스케이드로 광 활성화를 결합시킨다.

절단된 상류 옵신 CT에는 O-CT-근위 영역이 내장된다. 상류 옵신 및 표적 옵신을 포함하는 일부 실시형태는 2개의 O-CT-근위 영역을 포함하는데, 하나는 상류 옵신에서 유래하고 다른 하나는 표적 GPCR에서 유래한다. 이들 실시형태는 또한 2개의 옵신 CT H8 서브도메인인 상류 옵신 H8 및 표적 GPCR H8을 포함할 수 있다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 CT 부분은 다음을 포함하는 GPCR 단백질의 군으로부터 선택된 모 표적 GPCR로부터 유래된다:

특히 다음을 포함하는 군으로부터 선택된 클래스 A GPCR:

- 원추형 옵신, 특히 OPN1SW, OPN1MW 또는 OPN1LW,

- 세로토닌 수용체, 특히 5-HT7,

- 뮤 오피오이드 수용체,

- β-아드레날린 수용체, 특히 베타1-아드레날린 수용체, 베타2-아드레날린 수용체 및 베타3-아드레날린 수용체;

특히 다음을 포함하는 군으로부터 선택된 클래스 B GPCR:

- 호르몬 수용체, 특히 글루카곤 수용체(GCGR)

특히 다음을 포함하는 군으로부터 선택된 클래스 C GPCR:

- GABA_B 수용체, 특히 GABA_B1 및 GABA_B2

- 대사성 글루타메이트 수용체, 특히 mGluR6 및 mGluR5 수용체.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 클래스 A GPCR 또는 클래스 B GPCR, 또는 클래스 C GPCR을 제외한 또 다른 클래스의 GPCR이다. 이들 실시형태 중 일부에서, 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서 표적 GPCR은 클래스 C GPCR, 특히 mGluR6이다. 이들 실시형태 중 일부에서, 표적 클래스 C GPCR 부분, 특히 mGluR6 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하되, 다음의 기준 중 하나가 충족된다:

A: 키메라 GPCR에서 상류 옵신 부분에 포함된 자연 크기의 IL3 및 고유 위치에 상응하는 위치에서 클래스 C GPCR의 자연 크기의 IL2의 병존은 키메라 GPCR에서 이들 두 IL 사이의 입체 장애를 피하기 위해 배제된다;

B: 상류 옵신 부분은 세포내 루프 IL1 내지 IL3 모두를 포함한다;

C: 상류 옵신 부분은 IL1을 포함하고 표적 GPCR 부분은 상응하는 위치에서 상류 옵신 IL2 및 IL3을 대체하는 IL2 및 IL3을 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 다음의 요소의 군으로부터 선택된 서열 요소를 추가로 포함한다:

- 골지 방출 신호(golgi export signal)

- 막 트래피킹 서열

- 형광 단백질을 암호화하는 서열 요소

하나 이상의 선택된 요소는 키메라 옵신 GPCR의 CT의 C 말단 끝에 임의의 순서로 독립적으로 배열된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 방출 신호, 특히 소포체 또는 골지 방출 신호, 특히 아미노산 서열 KSRITSEGEYIPLDQIDINV(서열번호 85)를 갖는 칼륨 채널 Kir2.1로부터의 골지 방출 신호 또는 아미노산 서열 FCYENEV(서열번호 86)를 갖는 Kir2.1로부터의 ER 방출 신호를 선택된 서열 요소로서 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 특히 옵신으로부터의 막 트래피킹 서열, 더욱 특별하게는 줄여서 1D4 에피토프 태그 또는 1D4 태그라고도 하는 아미노산 서열 ETSQVAPA(서열번호 53)를 선택된 서열 요소로서 포함한다(문헌[Gross et al. 2009]; 문헌[Lodowski et al. 2013] 참조).

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 특히 mKate2, TurboFP635 또는 mScarlet으로부터 선택된 형광 단백질을 암호화하는 서열 요소를 포함한다. 이들 실시형태 중 일부에서 형광 단백질은 키메라 옵신 GPCR의 CT에 직접 융합되고, 이들 실시형태 중 다른 일부에서 형광 단백질은 IRES 또는 T2A 서열을 통해 연결된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR 부분은 IL1을 추가로 포함하고 표적 GPCR의 IL1은 상류 옵신의 IL1을 대체한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신의 IL3은 표적 GPCR의 IL3으로 대체된다. 일부 다른 실시형태에서, 상류 옵신 IL3 내의 가변 영역은 표적 GPCR의 IL3으로 대체된다. 이에 의해 옵신 IL3이 형성된 가변 영역을 대체하는 위치에서 표적 GPCR의 전체 IL3을 포함하는 키메라 IL3이 얻어진다. 상류 옵신 IL3의 가변 영역에 근위 및 원위쪽으로 인접한 상류 옵신 IL3의 부분은 키메라 IL3에 유지된다.

특히 표적 GPCR로서 mGluR6을 갖는 키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 CT의 근위 말단은 NR(K)Q 모티프에 또는 이의 상류에 또는 팔미토일화 부위에 위치한다.

mGluR C 말단 및 결합 파트너와의 이들의 상호작용은 잘 특성화되어 있다(예를 들어, 문헌[Enz R, 2012] 참조). mGluR6에서 아미노산 HPE는 NR(K)Q 모티프를 구성한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 mGluR6이고 mGluR6의 IL3은 옵신 IL3의 가변 영역을 부분적으로 대체하여 키메라 옵신-mGluR6 IL3을 형성한다. 따라서, 이들 실시형태는 키메라 CT 이외에도 키메라 IL3을 포함한다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 mGluR6이고 상류 옵신 부분은 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상을 추가로 포함하되, 상류 옵신 부분에 포함된 자연 크기의 IL3 및 옵신-mGluR6 키메라 단백질의 mGluR6 부분에 포함된 자연 크기의 IL2의 병존은 배제된다.

키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 멜라놉신으로부터 유래되고 NT, EL1 내지 EL3, TM1 내지 TM7, IL1 및 절단된 옵신 CT를 포함하고, 표적 GPCR 부분은 mGluR6 또는 hOPN1mw로부터 유래되고 IL2, IL3 및 CT를 포함한다.

옵신-GPCR 단백질의 일부 실시형태는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다. 이들 서열 중 일부는 골지 방출 신호 및/또는 1D4 태그로부터 선택된 C 말단 추가 서열을 포함한다. 골지 방출 신호와 1D4 태그는 선택적이다. 따라서, 골지 방출 신호 및/또는 1D4 태그를 포함하는 상기 언급된 서열번호 중 임의의 것에 따른 서열은 선택적인 C 말단에 부가된 서열 중 하나 또는 둘 모두가 부재하는 변이체를 포함하도록 정의된다.

키메라 옵신-GPCR 단백질의 일부 특히 바람직한 실시형태는 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다.

옵신-GPCR 단백질의 일부 실시형태는 다음으로부터 선택된 하나 이상의 변이를 포함하는 상기 언급된 서열번호를 갖는 서열 중 임의의 하나의 변이체인 아미노산 서열을 포함한다:

- 보존적 아미노산 치환,

- 1 내지 최대 3개 또는 최대 5개, 최대 8개 또는 최대 15개 아미노산 범위의 결실,

- 1 내지 최대 3개 또는 최대 5개, 최대 8개 또는 최대 15개 아미노산 범위의 삽입,

여기서 키메라 옵신-GPCR 단백질은 표적 GPCR에 특이적인 G알파 단백질의 광 활성화 의존적 결합을 나타낸다. 이들 실시형태 중 일부에서 표적 GPCR은 mGluR6이고 광 활성화 시 키메라 옵신 mGluR6은 G알파(o)와 결합한다.

상기 언급된 서열번호를 갖는 서열 중 어느 하나의 변이체인 아미노산 서열을 포함하는 옵신-GPCR 단백질의 일부 실시형태에서, 상기 서열은 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 갖는다.

키메라 옵신 GPCR의 일부 바람직한 실시형태에서, 표적 GPCR 부분은 NPxxy와 NR(K)Q 부위 사이에 근위 말단을 갖는 본질적으로 완전한 CT를 포함하거나 이로 구성된다. 특히 바람직한 실시형태에서, 표적 GPCR 부분은 mGluR6 또는 제2 옵신(표적 옵신), 특히 원추형 옵신 또는 로돕신으로부터 유래된다.

이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신 CT의 절단 부위는 팔미토일화 부위 또는 상기 정의된 바와 같은 팔미토일화 부위에 상응하는 아미노산 위치에 위치한다. 일부 바람직한 실시형태에서 상류 옵신 CT의 절단 부위는 팔미토일화 부위의 원위에, 예를 들어 팔미토일화 부위의 최대 5개 또는 최대 10개 또는 최대 33개 아미노산의 원위에 위치된다.

키메라 옵신 GPCR의 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신 부분은 CT의 절단 부위까지 전체 모 상류 옵신을 포함한다.

이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 특히 비인간 기원의 상류 옵신을 포함하는 경우, 선택적으로 하나 이상 또는 모든 세포외 도메인이 인간 옵신의 세포외 도메인과 교환된다. 선택적으로, 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서 추가로 또는 대안적으로 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상이 표적 GPCR로부터 유래된 IL, 특히 IL1 또는 IL3 또는 전술한 바와 같은 IL3의 부분과 교환된다.

키메라 옵신 GPCR의 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신은 멜라놉신, 원추형 옵신, 특히 중파 원추형 옵신, 상자 해파리 옵신 또는 파라피놉신, 또는 깡충거미 로돕신(JSR1 또는 hJSR(S186F))을 포함하는 군으로부터 선택된다.

상류 옵신으로서 멜라놉신 및 표적 옵신으로서 mGluR6을 포함하는 이들 실시형태 및 다른 바람직한 실시형태 중 일부는 줄여서 mela-mGluR6으로 지칭된다. mela(palm)-mGluR6으로 명명되는 특히 바람직한 mela-mGluR6 실시형태에서, 멜라놉신은 H8의 원위 말단에서 이의 팔미토일화 부위에서 절단되고 mGluR6의 본질적으로 완전한 CT에 융합된다. mela(palm)-mGluR6 키메라의 일부 가장 바람직한 실시형태는 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28 또는 이의 변이체를 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다.

전술한 바와 같이, 본 발명의 키메라 옵신 GPCR 단백질은 GPCR 단백질의 공통적인 3D 구조를 나타낸다. 키메라 옵신 GPCR은 E(D)RY 모티프, NPxxY 모티프, NR(K)Q 모티프가 있는 이온 잠금과 같은 모든 GPCR 단백질의 특징인 보존된 모티프를 추가로 포함한다. 본 발명에 따른 키메라 GPCR 단백질은 상류 옵신 부분 및 표적 GPCR 부분을 포함한다.

표적 GPCR이 비옵신 GPCR인 실시형태에서 상류 옵신 부분은 줄여서 옵신 부분이라고도 한다. 상류 옵신 부분은 발색단 포켓을 포함하고 선택적으로 원위 연장부를 갖는 O-CT-근위 영역을 포함하는 절단된 옵신 CT를 포함한다.

O-CT-근위 영역은 NR(K)Q 모티프 및 선택적으로 원위 말단에 하나 이상의 팔미토일화 부위가 있는, 많은 실시형태에서 H8을 형성하는 원위 방향의 다음의 대략 10개의 아미노산을 포함한다. 일부 실시형태에서 O-CT-근위 영역은 NPxxY 부위까지의 근위 연장부 및/또는 NR(K)Q 모티프의 하류에서 대략 최대 44개 아미노산에 상응하는 팔미토일화 부위의 하류에서 대략 최대 33개의 아미노산의 원위 연장부를 포함한다.

표적 GPCR 부분은 본질적으로 표적 GPCR의 전체 CT 또는 이의 기능적 변이체, 특히 기능적 단편을 포함한다. 일부 실시형태에서 표적 GPCR은 추가 옵신이다.

일부 실시형태에서, 키메라 옵신 GPCR 단백질은 2개의 나선 H8을 포함한다: 하나는 절단된 옵신 CT에 있고 다른 하나는 표적 GPCR CT에 있다.

모 상류 옵신의 O-CT-근위 영역은 키메라 옵신 GPCR에서 상류 옵신 부분의 형태 안정성 및 광 활성화 기능을 유리하게 증진시키는 것으로 밝혀졌다.

표적 GPCR 또는 이의 기능적 변이체, 특히 기능적 단편은 세포막으로의 트래피킹을 포함하는 정확한 세포 이하 단백질 트래피킹을 유리하게 매개한다. 나아가, 키메라 옵신 GPCR 단백질의 세포막으로의 정확한 트래피킹은 광 활성화에 대한 반응뿐만 아니라 모 옵신의 G알파 단백질에서 표적 GPCR의 G알파 단백질로의 G 단백질 결합 선택성의 이동도 증진시키는 것으로 여겨진다.

따라서, O-CT-근위 영역 및 표적 CT를 포함하는 키메라 CT가 놀라운 기술적 효과를 가져온다: 이는 단독으로 상류 옵신을 변형시켜 표적 GPCR의 G알파 단백질에 대한 결합에 의해 치료 표적 세포의 내인성 시그널로솜으로 키메라 옵신 GPCR의 광 활성화를 결합시키기에 충분하다.

일부 실시형태에서, 키메라 GPCR 단백질은 상류 옵신 부분 및 mGluR6 부분을 포함한다. 옵신 부분은 발색단 포켓 및 NR(K)Q 모티프 및 H8을 포함하는 절단된 옵신-CT, 및 선택적으로 하나 이상의 팔미토일화 부위 및/또는 선택적으로 팔미토일화 부위의 하류에서 최대 약 33개 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 약 44개 아미노산을 포함한다. mGluR6 부분은 본질적으로 전체 mGluR6-CT 또는 이의 기능적 변이체, 특히 기능적 단편을 포함한다. 이들 실시형태에 따른 옵신-mGluR6 키메라 GPCR 단백질은 mGluR6-CT의 상류에 절단된 옵신-CT를 갖는 키메라 CT를 갖는다. 일부 실시형태에서, 이는 2개의 나선 H8을 포함한다: 하나는 절단된 옵신 CT에 있고 다른 하나는 표적 GPCR CT에 있다.

키메라 CT는 예시적인 키메라 옵신-mGluR6 단백질을 ON 두극세포의 시그널로솜으로 표적화하기에 충분하며, 여기서 광 활성화 시, 모 멜라놉신의 생리학적 세포 환경에서 내인성인 시그널로솜의 상이한 G 단백질 대신 G알파(o) 단백질에 결합한다.

옵신 mGluR6 키메라의 일부 실시형태에서, 옵신은 멜라놉신이다.

유리하게는, 절단된 멜라놉신 CT 및 천연 표적 GPCR CT를 포함하는 키메라 CT를 포함하는 키메라 멜라놉신 GPCR의 예시적인 실시형태는 모 멜라놉신보다 훨씬 더 빠른 광 반응을 나타낸다. 이것은 멜라놉신의 반응 동역학이 시각에 필요한 반응 동역학보다 빛의 변화에 대한 더 느린 반응 동역학을 요구하는 과정인 24시간 주기 리듬의 조절에서 생리학적 역할에 적응한다는 점을 고려하면 참으로 바람직하다.

생리학적 모 옵신이 건강한 광수용기 세포에서 신호전달 캐스케이드에 광 활성화를 결합시키므로 키메라 옵신 GluR6 단백질은 유사한 효율로 mGluR6 신호전달 캐스케이드에 광 활성화를 결합시키는 것으로 관찰되었다.

따라서, 옵신-GluR6 키메라 GPCR을 암호화하는 핵산 분자를 사용하여 생리학적으로 빛에 둔감한 뉴런, 특히 ON 두극세포를 유전적으로 변형시키면 시각 신호전달 경로에서 광수용기 세포를 우회하고 ON-두극세포를 신경 망막을 활성화시킬 수 있는 "대체 광수용체"로 전환시킴으로써 광수용기 세포가 변성된 망막의 시력을 회복시킬 수 있다.

선행 기술, 예를 들어, 위에서 언급한 키메라 옵신 mGluR6 단백질은 이전에 이 치료 개념을 입증했다. 본 발명의 현저한 놀라운 점은 생리학적 옵신에 O-CT-근위 영역, 특히 절단된 옵신-CT에 내장된 O-CT-근위 영역 및 표적 GPCR의 본질적으로 전체 CT를 포함하는 유전자 조작 키메라 CT를 간단히 장착하는 것으로 충분하다는 점이다. 또한, 이 유전자 설계는 테스트한 모든 옵신 GPCR 키메라에 적용할 수 있다.

대조적으로, 선행 기술은 CT 외에도 세포내 루프, 특히 IL3 및 IL2가 G 단백질 선택성에 특히 중요하거나 심지어 필요한 것으로 나타났음을 교시한다(WO2012/174674, Kleinlogel, 2016; Tsai et al, 2018).

따라서, 놀랍게도, 본 발명의 키메라 옵신-mGluR6 단백질에 의한 mGluR6 시그널로솜의 특이적 G 알파(o) 결합은 mGluR6의 세포내 루프의 완전한 부재 하에 달성된다.

실제로, 키메라 CT만을 포함하고 mGluR6의 추가 세포내 도메인을 포함하지 않는 예시적인 키메라 옵신 mGluR6 GPCR 단백질은 유리한 특성, 예컨대, 예를 들어, 광 활성화에 대한 반응의 빠른 동역학 및 반응의 진폭, 또는 예컨대, 모 표적 GPCR을 포함하는 세포의 생리학적 구획에 상응하는 세포 이하 구획으로의 정확한 세포내 트래피킹에서 세포내 루프의 추가 교체를 포함하는 선행 기술의 키메라 옵신 GPCR을 모방하거나 능가한다. 예를 들어, 본 발명의 키메라 옵신 mGluR6 GPCR은 ON 두극세포의 수상돌기를 보다 효율적으로 표적화하고 선행 기술에서 이용 가능한 키메라 옵토-mGluR6에 비해 광 유도 망막 반응을 증진시킨다(van Wyk et al, 2015).

본 발명에 따른 키메라 CT 또는 표적 옵신 CT를 사용한 키메라 옵신 GPCR 단백질의 특별한 이점은 오로지 단일한 필수 스플라이싱 부위의 선택을 기반으로 하는 최소의 인실리코 모델링 및 유전자 조작을 필요로 하는 설계의 큰 단순성이다. 그런데도, 키메라 옵신 GPCR 단백질, 예컨대, 예를 들어 키메라 옵신 mGluR6 또는 키메라 옵신 5-하이드록시트립타민 수용체 7(5-HT7)의 광 활성화에 대한 기능적 반응은 심지어 크기와 속도 면에서 모 표적 GPCR의 생리학적 반응에 상응한다.

본 발명의 제1 양태는 추가로 모 옵신 CT 및 모 표적 GPCR CT로부터 유래된 키메라 C 말단 도메인(키메라 CT), 특히 전술한 키메라 옵신 GPCR 단백질의 키메라 C 말단 도메인(키메라 CT)을 포함하는 펩티드에 관한 것이다. 키메라 C 말단 펩티드는 CT의 근위 영역(O-CT-근위 영역)을 포함하는 상류 옵신의 절단된 C 말단 도메인(절단된 옵신-CT)을 포함한다. O-CT-근위 영역은 특히 나선 8(H8) 및 소 로돕신의 C322 또는 C323에 각각 상응하는 팔미토일화 부위를 포함한다. 일부 실시형태에서 O-CT-근위 영역은 옵신의 팔미토일화 부위의 하류에서 예를 들어, 최대 약 33, 34 또는 35개 아미노산의 원위 연장부를 포함한다. 펩티드는 표적 GPCR의 C 말단 도메인(표적 GPCR CT) 또는 이의 기능적 변이체, 특히 기능적 단편을 추가로 포함한다. 표적 GPCR CT는 절단된 옵신 CT의 하류에 위치한다.

본 발명의 제2 양태는 키메라 옵신 GPCR 단백질을 암호화하고 절단된 옵신 CT 및 표적 GPCR CT 또는 이의 기능적 변이체를 포함하는 키메라 C 말단 펩티드를 암호화하는 핵산 분자에 관한 것이다. 상기 핵산 분자는 키메라 옵신 GPCR 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성된다.

키메라 옵신 GPCR 단백질 및 키메라 C 말단 펩티드 및 이들을 암호화하는 핵산 서열은 유전자 스플라이싱 생성물이라고도 하는 유전자 융합 생성물이며, 이는 전술한 바와 같이 모 상류 옵신을 암호화하는 모 유전자의 단편 및 모 표적 GPCR을 암호화하는 모 유전자의 단편을 포함한다.

이 문서에서, 키메라 옵신 GPCR 또는 키메라 C 말단 펩티드를 암호화하는 핵산 서열은 키메라 옵신 GPCR 유전자 또는 키메라 옵신 GPCR 이식유전자로도 지칭된다.

이 문서에서, 용어 이식유전자는 유기체 또는 세포의 게놈으로 전달된 유전자 또는 핵산 분자에 관한 것이다. 특히, 용어 이식유전자는 본 발명의 키메라 옵신 GPRC 또는 키메라 C 말단 펩티드를 암호화하는 유전자 또는 핵산 분자를 지칭한다.

이 문서에서, 키메라 옵신 GPCR 단백질 및 상기 옵신 키메라 GPCR 단백질을 암호화하는 핵산 분자라는 용어는 자연적으로는 그와 같이 존재하지 않는 단백질 및 핵산 분자를 지칭한다. 오히려 이들은 예를 들어, 유전자 클로닝, 유전자 발현, 재조합 핵산 기술, 화학적 합성, 예컨대, 재조합 핵산 분자의 고체상 화학 합성과 같은 분자 기술로 얻을 수 있는 인공 분자이다. 이들은 또한 당업계에 공지된 다른 방식으로 처리, 제조 및 조작될 수 있다. 분자, 유전 및 생화학적 방법과 화학적 방법에 사용되는 표준 기술은 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.] 및 [Ausubel et al., Short Protocols in Molecular Biology (1999) 4th Ed, John Wiley & Sons, Inc.]을 참조한다.

따라서, 본 발명의 제2 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성된 핵산 분자에 관한 것이다.

핵산 분자의 일부 실시형태에서, 이는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 아미노산 서열로부터 선택되는 서열과 적어도 90% 동일한, 예컨대, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로부터 선택된 아미노산 서열과 적어도 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%,99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 핵산 서열을 포함한다.

서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로부터 선택된 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 이러한 핵산 서열의 예는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로부터 선택된 핵산 서열과 동일한 핵산 서열을 포함하나, 이에 한정되지 않는다.

일부 실시형태에서 키메라 옵신 GPCR을 암호화하는 핵산 분자는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 70% 동일한, 예컨대, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 핵산 서열을 포함하거나 이로 구성된다.

제38항에 따른 핵산 분자의 일부 특히 바람직한 실시형태에서, 바람직한 mela(palm mGluR6 키메라 옵신 GPCR을 암호화하며, 여기서 상기 핵산 분자는 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된다.

본 발명의 제3 양태는 본 발명의 제2 양태에 따른 핵산 분자를 표적 세포로 전달하기 위한 의학적 용도를 위한 아데노 관련 바이러스 캡시드(AAV 캡시드) 폴리펩티드에 관한 것이다. 따라서, 제3 양태는 제1 양태에 따른 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자의 표적 세포 내로의 전달을 위한 AAV 캡시드를 제공한다. 제3 양태는 또한 상기 의학적 용도를 위한 AAV 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자에 관한 것이다.

양태 A에서 본원에 기재된 주요 발명과 독립적인 제2 발명은 신규한 AAV 캡시드 폴리펩티드 그 자체에 관한 것이고 양태 B에서는 상기 신규한 AAV 캡시드를 암호화하는 서열을 포함하는 핵산 분자에 관한 것이다.

독립적인 제2 발명의 양태 C는 표적 세포에 이식유전자를 전달하기 위한 의학적 용도를 위한 신규한 AAV 캡시드 폴리펩티드 - 및 이를 암호화하는 핵산 분자 -에 관한 것이다. 독립적인 제2 발명의 양태 C는 또한 제1의 주요 발명의 각각 제2 및 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 핵산 분자를 표적 세포에 전달하기 위한 의학적 용도를 위한 신규한 AAV 캡시드 폴리펩티드 - 및 이를 암호화하는 핵산 분자 - 를 포함한다.

독립적인 제2 발명의 양태 D는 독립적인 제2 발명의 양태 A에 따른 신규한 캡시드를 암호화하는 양태 B에 따른 핵산 분자를 포함하는 재조합 AAV 벡터에 관한 것이다.

아래의 설명 및 청구범위에서 AAV 캡시드 또는 캡시드라는 용어는 문맥상 다르게 명백하지 않는 한, 주요 발명에 따른 의학적 용도를 위한 캡시드 및 독립적인 제2 발명에 따른 캡시드 그 자체를 모두 지칭한다.

따라서, 본 발명의 제3 양태에서, 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드 및 AAV 캡시드 폴리펩티드를 암호화하는 핵산 분자는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 표적 세포에 전달하기 위한 의료 요법에 사용하기 위해 제공된다.

일부 실시형태에서 캡시드는 AAV2, AAV2(7m8)(Dalkara D et al, 2013) 또는 AAV8(BP2)(Cronin et al, 2014)의 캡시드 단백질 또는 이의 유래된 변이체이다.

야생형 AAV에서, 게놈은 함께 상호작용하여 정20면체 대칭의 캡시드를 형성하는 캡시드 단백질 VP1, VP2 및 VP3, 및 세포질로부터 세포 핵 내로의 새로 생성된 VP 단백질의 수송 및 안정화를 위해 요구되는 어셈블리-활성화 단백질(AAP)을 암호화하는 Cap 유전자를 포함한다. 3개의 VP 모두가 하나의 mRNA로부터 번역되고 상이하게 스플라이싱된다. 가장 큰 90 kDa의 VP1은 스플라이싱되지 않은 전사체이며, 72 kDa의 VP2는 비-통상적 ACG 시작 코돈으로부터 번역되는 반면, 가장 작은 60 kDa의 VP3은 AUG 코돈으로부터 번역된다. 3개의 VP 모두는 중첩되는 C 말단을 갖는다.

본 문서의 맥락에서 AAV 캡시드의 아미노산 위치에 대한 언급은 GenBank 등록번호 J01901.1(아데노 관련 바이러스 2, 완전한 게놈)에서 이용할 수 있는 AAV2의 참조 서열에 따른 AAV2의 캡시드 단백질 VP1의 아미노산 서열에 관한 것이다.

일부 실시형태에서, AAV 캡시드는 펩티드 삽입물을 포함한다. 일부 실시형태에서, 펩티드는 특히 피크 또는 스파이크성 돌출부에 삽입된다.

펩티드는 AAV2 캡시드의 위치 587에 삽입된다. 스파이크성 돌출부(피크)는 캡시드의 가장 노출된 영역을 나타낸다. 최고 피크는 AAV2 캡시드 상에서 아미노산 위치 453에 위치하고, 두 번째 최고 피크는 위치 587에 위치한다. 이들 피크는 캡시드 어셈블리를 손상시키지 않는 펩티드 삽입을 수용하며 비-허용성 세포를 표적화할 기회를 제공한다. 마찬가지로, 돌출부는 AAV 숙주 상호작용, 수용체 결합 및 면역원성의 중추적 부위를 나타낸다.

야생형 캡시드 AAV2 서열(서열번호 59)은 굵은 활자체와 밑줄로 표시된 N587과 R588 사이의 위에서 언급한 펩티드의 삽입 지점과 함께 아래에 제시되어 있다.

일부 실시형태에서, AAV 캡시드 단백질은 AAV2 캡시드 단백질이고 아미노산 587과 588 사이에 아미노산 삽입물을 포함하고, 여기서 펩티드 삽입물은 다음을 포함하는 펩티드의 군으로부터 선택된다:

- SASEAST (서열번호 60)

- TPPSITA (서열번호 61)

- PRTPHTA (서열번호 62)

- NHAPNHC (서열번호 63)

N587과 R588 사이의 펩티드 삽입물은 선행 기술에 기재되어 있다(David A., 2018; EP 출원 번호 19206603.3, 미공개). 이들 실시형태에서, AAV 캡시드 폴리펩티드는 줄여서 7량체 펩티드 삽입물로도 불리는 7개의 아미노산으로 구성된 펩티드 삽입물을 포함한다.

일부 추가 실시형태에서 AAV 캡시드 폴리펩티드는 7 내지 13량체인 펩티드 삽입물을 포함한다. 특히, 이들 실시형태는 전술한 7량체 펩티드 삽입물과 같은 7량체를 포함하고, 0~6개 아미노산의 1개 또는 2개의 플랭킹(flanking) 링커를 추가로 포함하며, 여기서 6은 N 및 C 말단에 부가된 플랭킹 아미노산의 총 수의 최대 수이다.

일부 예시적인 실시형태는 링커 서열을 포함하지 않는 펩티드 삽입물로 구성되고, 다른 실시형태는 한쪽 또는 양쪽에 링커를 포함한다. 일부 실시형태에서 링커는 알라닌(A), 아스파라긴(N), 리신(L), 아르기닌(R), 트레오닌(T) 또는 글리신(G) 또는 이의 혼합물을 포함하는 아미노산의 군으로부터 선택되지만 이에 한정되지 않는다.

일부 바람직한 실시형태에서 1개 또는 2개의 플랭킹 링커는 다음으로부터 선택된 아미노산을 포함하거나 바람직하게는 이로 구성된다:

i. 아미노산 G 및 A 또는

ii. 아미노산 A, N, L, T, R, G, A, N, L 및 R, 특히 A, L, N, R.

일부 바람직한 실시형태에서, 플랭킹 링커 중 하나 또는 둘 모두는 N 및 R로부터 선택된 적어도 하나의 아미노산을 포함한다. 일부 특히 바람직한 실시형태에서, 링커는 양쪽에 2 또는 3개의 아미노산을 포함한다. 이들 실시형태 및 기타 실시형태 중 일부에서 링커는 아미노산 A, L, N, R로부터 선택된 하나 이상의 아미노산으로 구성된다. 예시적인 바람직한 실시형태에서 링커 및 펩티드 삽입물은 NLA-펩티드-AR의 배열이다.

일부 바람직한 실시형태에서 캡시드는 AAV2 캡시드 단백질 또는 다음으로부터 선택되는, N587과 R588 사이에 펩티드 삽입물을 포함하는 이의 돌연변이 변이체이다:

- AAASASEASTAA (서열번호 64),

- AAATPPSITAAA (서열번호 65),

- AAAPRTPHTAAA (서열번호 66),

- NLANHAPNHCAR (서열번호 67),

- NLAPRTPHTAAR (서열번호 68).

이 문서에서 삽입물을 포함하는 AAV2 캡시드의 실시형태는 괄호 안에 변형이 뒤따르는 야생형 AAV 혈청형을 열거하는 축약식 명명법으로도 지칭된다. 전술한 바와 같은 펩티드 삽입물을 포함하는 예시적인 캡시드에 대한 이러한 축약식 명명법은 예를 들어 괄호 안에 열거된 펩티드 삽입물 내의 7개 아미노산을 포함하고 선택적으로 1개 또는 2개의 플랭킹 링커를 추가로 포함하는 AAV2 캡시드를 지칭하는 AAV2(NHAPNHC) 또는 예를 들어, 열거된 7개 아미노산 PRTPHTA를 갖는 펩티드 삽입물을 포함하고 선택적으로 1개 또는 2개의 플랭킹 링커를 포함하는 AAV2(PRTPHTA) 캡시드이다.

플랭킹 링커를 포함하는 펩티드 삽입물의 위에서 언급된 예시적인 실시형태는 AAV2 캡시드의 약간 확장된 서열 맥락에서 플랭킹 링커와 함께 아래에 열거되어 있다. 링커의 예시적인 실시형태는 밑줄이 그어져 있다. 처음 3개의 링커는 알라닌을 포함하고 -AAA-...-AA-의 형태이고 마지막 2개의 링커는 대안적인 아미노산, 즉 알라닌(A) 외에 아르기닌(R), 아스파라긴(N) 및 리신(L)을 포함하고 아래에 제시된 바와 같이 -NLA-...-AR-의 형태이다.

서열번호 69:

580 - VSTNLQRGN-AAA- SASEAST-AA-RQAATADVNTQGVLPG

서열번호 70:

580 - VSTNLQRGN-AAA- TPPSITA-AA-RQAATADVNTQGVLPG

서열번호 71:

580 - VSTNLQRGN-AAA- PRTPHTA-AA-RQAATADVNTQGVLPG

서열번호 72:

580 - VSTNLQRGN-NLA-NHAPNHC-AR- RQAATADVNTQGVLPG

서열번호 73:

580 - VSTNLQRGN-NLA-PRTPHTA-AR- RQAATADVNTQGVLPG

서열번호 67, NLANHAPNHCAR 또는 서열번호 68, NLAPRTPHTAAR에 따른 펩티드 삽입물을 포함하는 캡시드는 그 자체로 신규하고 독립적인 발명을 구성한다. 따라서, 이들 신규한 캡시드는 본원에 기재된 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자를 패키징하기 위한 rAAV2 벡터의 맥락으로 한정되지 않는다. 특히, 이들 신규한 캡시드는 본 발명의 제1 및 제2 양태에 따른 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자와 함께 의학적 용도로 한정되지 않는다.

따라서, 독립적인 발명에서, AAV 혈청형 2 캡시드의 587 내지 592 사이, 바람직하게는 N587 내지 R588 사이의 위치 또는 또 다른 혈청형의 AAV에서 이에 상동성인 위치에 펩티드 삽입물을 포함하는 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드가 제공되며, 여기서 펩티드 삽입물은 다음을 포함하는 서열의 군으로부터 선택된다:

- NLANHAPNHCAR (서열번호 67),

- NLAPRTPHTAAR (서열번호 68)

일부 실시형태에서, 캡시드 단백질은 AAV2 캡시드이고 적어도 하나의 돌연변이를 포함하며, 여기서 이러한 적어도 하나의 돌연변이는 다음으로부터 선택된다:

a. 아미노산 위치 252, 272, 444, 500, 700, 704 및/또는 730에서 티로신(Y)에서 페닐알라닌(F)으로의 돌연변이; 및/또는

b. 아미노산 위치 491에서 트레오닌(T)에서 발린(V)으로의 돌연변이.

신규한 캡시드의 특히 바람직한 실시형태는 아래에 제시된 바와 같이 서열번호 74에 따른 NLAPRTPHTAAR 삽입을 갖는 AAV2 캡시드 단백질의 아미노산 서열을 포함한다:

VP1과 중첩되는 VP3(회색 서열), 티로신에서 페닐알라닌(Y-F)으로의 돌연변이는 진회색으로 강조 표시되고 밑줄이 그어져 있으며, 아미노산 넘버링은 전체 VP1 서열을 나타낸다. 모티프가 삽입된 G453의 최고 피크와 N587의 두 번째 최고 피크는 밑줄이 그어져 있고, 흰색 언더레이로 표시되어 있다. 삽입은 이탤릭체 및 상자로 표시되어 있다.

제3 양태 및 독립적인 발명은 또한 전술한 바와 같은 AAV 캡시드를 암호화하는 핵산 분자에 관한 것이다.

일부 실시형태에서, 핵산 분자는 AAV2, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2(PRTPHTA)로부터 선택된 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성된다.

일부 실시형태에서, 제49항에 있어서, 핵산 분자는 다음으로부터 선택되는, AAV2 게놈의 N587 내지 R588 사이의 펩티드 삽입물이 있는 아미노산 서열을 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 것인 핵산 분자:

- AAASASEASTAA (서열번호 64),

- AAATPPSITAAA (서열번호 65),

- AAAPRTPHTAAA (서열번호 66),

- NLANHAPNHCAR (서열번호 67),

- NLAPRTPHTAAR (서열번호 68).

일부 실시형태에서, 핵산 분자는 특히 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함한다. 일부 바람직한 이들 실시형태에서, 이식유전자는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된다.

일부 특히 바람직한 실시형태에서, 핵산 분자는 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된 mela(palm)-mGluR6 키메라 GPCR을 암호화하는 이식유전자를 포함한다.

캡시드 및 이식유전자를 암호화하는 핵산 분자의 일부 실시형태에서, 이식유전자는 세포 특이적 프로모터에 작동 가능하게 연결된다. 이들 실시형태 중 일부에서 세포 특이적 프로모터는 특히 ON 두극세포 특이적 프로모터, 더욱 특별하게는 200En-mGluR500P 프로모터, 서열번호 75에 따른 770En_454P(hGRM6) 프로모터 또는 서열번호 76에 따른 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 군으로부터 선택된 프로모터이다.

Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6이라는 용어는 각각 팔미토일화 부위에서 절단되었거나 또는 팔미토일화 부위의 하류의 33개 아미노산에서 절단된, 절단 멜라놉신 CT를 포함하는 멜라놉신 mGluR6 키메라 옵신 GPCR의 바람직한 실시형태를 지칭한다.

따라서, 캡시드를 암호화하는 핵산 분자의 일부 특히 바람직한 실시형태에서, 캡시드는 AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPHC) 또는 AAV2(PRPTPHTA) 캡시드로부터 선택된다. 추가로, 상기 핵산 분자는 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6과 같은 키메라 옵신 GPCR의 바람직한 실시형태를 암호화하는 이식유전자를 추가로 포함하고, 나아가 이식유전자는 770En-445P(hGRM6) 프로모터 또는 444En_454P(hGRM6) 프로모터의 제어 하에 있다.

신규한 rAAV 캡시드에 관한 독립적인 본 발명의 일부 실시형태에서, 전술한 바와 같은 신규한 펩티드 삽입물을 갖는 신규한 rAVV 캡시드를 포함하는 벡터가 제공된다.

본 발명의 제5 양태에 따른 캡시드의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.

본 발명의 제4 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 포함하는 벡터에 관한 것이다. 따라서, 제4 양태는 표적 세포로의 유전자 전달 및 특히 키메라 옵신 GPCR을 그 안에서 발현시키기 위한 벡터에 관한 것이다. 다시 말해서, 본 발명의 제4 양태에 따른 벡터는 본 발명의 제1 양태에 따른 키메라 옵신 GPRC 또는 키메라 C 말단 펩티드를 암호화하는 이식유전자를 포함한다.

따라서, 각각 본 발명의 제1 및 제2 양태에 기재된 바와 같은 핵산 분자에 의해 암호화되는 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 핵산을 포함하는 벡터, 특히 핵산 발현 벡터가 제공된다. 핵산 발현 벡터는 키메라 옵신 GPCR을 암호화하는 핵산 분자에 의해 암호화되는 이식유전자에 작동 가능하게 연결된 프로모터를 포함한다.

일부 실시형태에서, 이식유전자는 최적화된 KOZAK 서열이 선행된다. KOZAK 서열은 컨센서스 (gcc)gccAccAUGG(서열번호 77) 또는 (gcc)gccGccAUGG(서열번호 78)를 가지며, 번역 개시를 증진시킨다.

일부 실시형태에서, 핵산 발현 벡터는 또한 WPRE(우드척(Woodchuck) 간염 바이러스 전사후 조절 요소) 조절 서열을 포함한다(문헌[Hulliger et al. 2010]의 서열번호 20 참조). WPRE는 전사될 때 발현을 향상시키는 3차 구조를 생성하는 DNA 서열이다.

일부 실시형태에서, 핵산 발현 벡터는 또한 이식유전자의 하류에 삽입되는 폴리A 꼬리를 포함한다. 폴리A 꼬리는 이식유전자의 번역을 촉진한다.

일부 실시형태에서, 벡터는 아데노 관련 바이러스(AAV)로부터 유래된다. 상기 벡터는 전술한 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 핵산 분자를 포함하므로 재조합(rAAV) 벡터이다.

일부 실시형태에서, rAAV 벡터는 단일 가닥 벡터(ssAAV) 또는 자가-상보적 벡터(scAAV)이다.

일부 실시형태에서, 벡터는 특히 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 AAV12를 포함하는 AAV 혈청형의 군으로부터 선택된 재조합 AAV 벡터이다. 일부 바람직한 실시형태에서, 벡터는 rAAV2 또는 rAAV8 벡터이다.

이들 실시형태 및 기타 실시형태 중 일부에서 벡터는 다음을 포함하는 서열의 군으로부터 선택된 핵산 서열을 추가로 포함한다:

- AAV 캡시드 단백질을 암호화하는 서열 및/또는

- 프로모터, 특히 세포 특이적 프로모터, 더욱 특별하게는 두극세포 특이적 프로모터.

프로모터, 특히 세포 특이적 프로모터를 포함하는 일부 실시형태에서, 벡터는 인핸서 서열 및 선택적으로 스페이서를 추가로 포함한다. 5'-말단에서 3'-말단까지, 벡터는 먼저 인핸서, 그 다음 선택적 스페이서, 그 다음 프로모터를 포함한다. 이식유전자는 프로모터에 의해 구동되는 이식유전자의 발현을 위해 프로모터의 3'-방향에 위치한다. 즉, 이식유전자는 프로모터에 작동 가능하게 연결된다.

일부 실시형태에서, 특히 mGluR6 표적 GPCR CT를 포함하는 키메라 옵신 GPCR을 암호화하는 핵산 분자를 발현하는 벡터의 경우, 벡터는 ON-두극세포 특이적 프로모터를 포함한다. 이들 실시형태 중 일부에서 ON-두극세포 특이적 프로모터는 GRM6-sv40 프로모터(Kim et al., 2008) 또는 4xGRM6-sv40 프로모터(Cronin et al., 2014) 또는 200En-mGluR500P 프로모터(Lu et al., 2016) 또는 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터(문헌[Hulliger et al., 2020] 및 EP19200082.6(미공개) 참조)를 포함하는 군으로부터 선택된다.

770En_454P(hGRM6) 프로모터는 서열번호 75를 포함하거나 이로 구성된다. 770En_454P(hGRM6) 프로모터는 뮤린과 인간 게놈(-13873 내지 -13467 rel. TLSS GRM6) 사이에 300 bp의 보존된 서열을 함유하고, 또한 3' ChIP-seq 피크 및 Dnase 과민성 클러스터(-13990 내지 -13816 rel. TLSS GRM6)를 함유하는 인핸서 770En(hGRM6)(-14236 내지 -13467 rel. TLSS GRM6)을 포함한다.

444En_454P(hGRM6) 프로모터는 서열번호 76을 포함하거나 이로 구성된다. 444En_454P(hGRM6) 프로모터는 인핸서 444En(hGRM6)(-14033 내지 -13590 rel. TLSS GRM6)을 포함하며, 3' 및 5' ChiP-seq 피크만 포함하는 770En(hGRM6)의 3' 및 5' 절단된 버전이다.

세포 특이적 프로모터를 포함하는 벡터의 일부 실시형태에서, 세포 특이적 프로모터는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터이다.

전술한 바와 같은 ON-두극세포 특이적 프로모터를 포함하는 벡터의 일부 바람직한 실시형태는 키메라 멜라놉신-mGluR6을 암호화하는 핵산 분자를 발현한다. 이들 실시형태 중 일부에서, 키메라 멜라놉신 mGluR6 단백질은 줄여서 Mela(palm)-mGluR6이라고도 하는, 팔미토일화 부위에서 절단된 옵신 CT, 또는 줄여서 Mela(palm+33)-mGluR6이라고도 하는 팔미토일화 부위의 하류에서 절단된 33개 아미노산을 포함한다. 추가의 바람직한 실시형태에서 벡터는 키메라 OPN1mw-mGluR6 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR을 포함한다.

벡터의 일부 특히 바람직한 실시형태는 특히, 200En-mGluR500P, 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터로부터 선택된 ON-두극세포 특이적 프로모터의 제어 하에, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 중 하나에 따른 Mela(palm)-mGluR6, 특히 서열번호 15에 따른 Mela(palm)-mGluR6 또는 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른, 세포내 루프를 추가로 포함하는 Mela-mGluR6을 발현한다.

벡터의 일부 실시형태는 본 발명의 제3 양태에 따른 AAV 캡시드를 암호화하는 핵산 서열을 포함한다. 일부 바람직한 실시형태에서, 벡터는 전술한 바와 같이 N587 내지 R588 사이에 펩티드 삽입물을 갖는 AAV 캡시드를 암호화한다.

일부 바람직한 실시형태에서, 벡터는 키메라 옵신 GPCR을 암호화하는 이식유전자에 작동 가능하게 연결된 770En-445P(hGRM6) 프로모터를 포함하고, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2 (PRPHTA)를 발현하는 핵산 분자를 추가로 포함한다. 이들 실시형태 및 기타 실시형태 중 일부에서 키메라 옵신 GPCR은 바람직하게는 다음으로부터 선택된다:

- 상류 옵신으로서 멜라놉신 또는 hOPN1mw를 포함하고 표적 옵신으로서 mGluR6을 포함하는 키메라 옵신 GPCR 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR,

- Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6으로부터 선택된 키메라 옵신 GPCR

- 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 서열번호 29 또는 서열번호 31을 포함하는 군으로부터 선택된 핵산 서열에 따른 키메라 옵신 GPCR.

벡터의 특히 바람직한 실시형태는 서열번호 79에 따른 서열을 포함하거나 이로 구성된다. 벡터의 이 실시형태에서, 이는 770En-445P(hGRM6) 프로모터의 제어 하에 서열번호 19에 따른 예시적인 hmela(palm) - mGluR6 이식유전자를 포함하고 AAV8(BP2) 캡시드를 암호화하는 핵산 서열을 추가로 포함한다.

본 발명의 제4 양태에 따른 벡터의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.

본 발명의 제5 양태는 제2 양태에 따른 핵산 분자를 포함하거나 발현하는 운반체, 예컨대, 입자, 특히 나노 입자, 소포, 세포주 - 특히 생식 세포주는 제외- 및 동물, 또는 제3 양태에 따른 벡터 또는 제1 양태에 따른 키메라 옵신 GPCR을 포함하는 벡터에 관한 것이다.

본 발명의 제5 양태의 일부 실시형태에서, 트랜스제닉 동물, 특히 트랜스제닉 마우스 또는 트랜스제닉 세포주가 제공된다. 트랜스제닉 동물 또는 트랜스제닉 세포주는 본 발명의 제2 양태의 핵산 분자 또는 제4 양태의 벡터를 포함하고/하거나 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 발현한다.

트랜스제닉 세포의 일부 실시형태는 트랜스제닉 생식 세포주를 선택적으로 배제하는 줄기 세포주 또는 기관형 세포주와 같은 키메라 옵신 GPCR 단백질을 발현하기 위한 적합한 세포주로부터 유래된다. 특히, 적합한 세포주는 다음을 포함하는 세포주의 군으로부터 선택된다:

- HEK293-GIRK 세포,

- 내부 망막 뉴런, 특히 ON 두극세포,

- 신장 세포 및

- Gs, Gq 또는 G_12/13으로부터 선택된 G 단백질을 발현하는 세포.

트랜스제닉 동물 또는 트랜스제닉 세포의 일부 실시형태는 CRISPR/cas 변형된 게놈을 포함한다. CRISPR/Cas 게놈 편집은 당업자에게 알려져 있다(예를 들어, 문헌[Vandemoortele et al. (2017)], 예를 들어, 문헌[Long et al. (2018)], 예를 들어, 문헌[Hsu et al (2014), Cell 157(6):1262-1278] 및 그 안의 참고문헌 참조).

제5 양태의 일부 실시형태에서, 본 발명은 표적 세포로 본 발명의 이전 양태 중 하나에 따른 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자 또는 벡터를 전달하기 위한 운반체, 특히 입자 또는 나노입자 또는 소포를 제공한다.

일부 실시형태에서, 운반체는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 제2 양태에 따른 핵산 분자 또는 제4 양태에 따른 벡터를 포함하거나, 또는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 포함한다. 일부 실시형태에서, 운반체는 유전자 총과 함께 사용하기에 특히 적합한 나노- 또는 마이크로-입자이다. 이들 실시형태 및 다른 실시형태 중 일부에서 운반체는 금 입자이다.

이 문서에서, 키메라 옵신 GPCR 단백질 또는 핵산 분자 또는 벡터의 전달을 위한 운반체는 더 짧게 "전달용 운반체"로도 지칭된다. 전달용 운반체는 인간 또는 비인간 동물의 표적 세포 또는 표적 유기체의 수용자 게놈으로의 전달에 적합한 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 키메라 옵신-GPCR 단백질 또는 핵산 분자 또는 벡터를 부착하거나 패키징할 수 있는 임의의 적합한 화학적 또는 물리적 구조를 지칭한다.

전달용 운반체의 예시적인 실시형태는 소포 및 입자, 특히 마이크로- 또는 나노-입자이다. 예시적인 소포는 예를 들어 생물학적 또는 합성 기원의 막 소포를 포함한다. 예시적인 입자는 특히 유전자 총과 함께 사용하기에 적합한 마이크로- 및 나노-입자이며, 예를 들어, 특히 흡착 또는 공유 결합 리간드로서 키메라 옵신 GPCR 단백질 또는 이를 암호화하는 키메라 핵산으로 코팅된 금 입자를 포함한다(O'Brian and Lummis, 2011). 운반체의 일부 실시형태에서, 이는 이식유전자 및 CRISPR/cas 카세트, 즉, 예를 들어, Cas9와 같은 Cas 효소 및 하나 이상의 가이드 RNA(들)(gRNA), 특히 단일 가이드 RNA(들)(sgRNA)를 암호화하는 플라스미드, 또는 하나 이상의 gRNA, 특히 sgRNA의 개별 형질감염과 조합되는 Cas 효소, 특히 Cas9를 암호화하는 플라스미드를 포함한다.

본 발명의 이들 실시형태 및 기타 실시형태 중 일부에서, 운반체는 본 발명의 제2 양태에 따른 핵산 서열 또는 이식유전자 및 CRISPR/cas 카세트를 포함하는 본 발명의 제4 양태에 따른 벡터를 포함한다.

일부 바람직한 실시형태에서, 전술한 트랜스제닉 동물 또는 트랜스제닉 세포 또는 전달용 운반체는 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함한다.

일부 추가의 바람직한 실시형태에서, 전술한 트랜스제닉 동물 또는 트랜스제닉 세포 또는 전달용 운반체, 이식유전자는 다음을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화한다:

- Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는

- Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는

- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6.

본 발명의 제5 양태에 따른 운반체, 세포 또는 동물의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.

본 발명의 제6 양태는 본 발명의 제1 양태의 키메라 옵신 GPCR 단백질을 암호화하는 제2 양태의 핵산 분자를 유전적으로 조작하는 방법에 관한 것이다.

또한, 본 발명의 제6 양태는 특히 본 발명의 제1 양태에 따른 상류 옵신 CT의 근위 영역 및 표적 GPCR CT를 포함하는 키메라 C 말단 펩티드를 암호화하는 핵산 분자를 조작하는 방법에 관한 것이다.

모든 GPCR 단백질 및 특히 또한 GPCR의 편재적으로 보존된 모티프에 공통적인 보존된 3D 구조, 예컨대, 접합부 TM3/IL2 주변의 E(D)RY, TM6과 IL3의 접합부 주변의 E, TM7의 원위 말단 주변의 NPxxY 및 나선 8의 근위 말단 주변의 NR(K)Q 또는 부분적으로 보존된 요소, 예컨대, H8의 원위 말단에 있는 팔미토일화 부위 및 GPCR 사이의 추가의 보존된 요소는 프로토타입 GPCR 소 로돕신과의 서열 정렬에 의해 쉽게 확인된다.

예시적인 적합한 스플라이싱 부위는 또한 막관통 도메인/세포내 도메인 접합부 GPCR의 선택적인 구조적 정렬에 의해 및 특히 보존된 서열 모티프에 대한 막관통 및 세포내 도메인 사이의 접합부 주변의 서열을 스캐닝함으로써 쉽게 확인된다.

이들 사이의 키메라 접합부에서 하나 이상의 선택된 모 GPCR(모 옵신/모 표적 GPCR)의 보존된 모티프 또는 이의 기능적 변이체의 보존 또는 재구성은 높은 확률로 기능적 활성 키메라 GPCR을 초래한다.

따라서, 본 발명의 제6 양태에서, 옵신의 광 민감성, 정확한 세포내 트래피킹, 표적 GPCR의 효율적인 G 단백질 결합 및 G 단백질 특이성과 같은 원하는 기능을 갖는 키메라 GPCR을 유전적으로 조작하고 설계하는 효율적이고 간단한 방법이 제공된다. 방법은 상류 옵신과 표적 CT 사이에 단일 필수 융합 부위만 요구한다. 상류 옵신의 원하는 절단 부위는 a) H8 또는 하나 이상의 팔미토일화 부위의 위치 - 또는 전술한 바와 같이 소 로돕신의 팔미토일화 부위 중 하나에 상응하는 "추정" 팔미토일화 부위(들)에 대한 지식 또는 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개 또는 약 10개의 아미노산을 계산함으로써 및 b) 표적 GPCR의 C 말단의 위치에 대한 지식을 기반으로 쉽게 확인된다.

상이한 클래스의 GPCR 사이의 최소한의 서열 상동성에도 불구하고 보존된 3D 구조는 GPCR 단백질의 기능적 도메인에서 아미노산 서열 변이의 대단한 허용범위를 보여준다. 나아가, 기능적 키메라 옵신 GPCR을 조작하는 것은 예를 들어, 보존적 아미노산 치환에 의해 얻은 보존된 서열 또는 이의 기능적 유사체를 보존하면서 보존된 구조적 요소 또는 모티프 또는 그 주변에서 스플라이싱함으로써 단순화된다. 일부 실시형태에서 스플라이싱 부위는 모 GPCR의 보존된 모티프 내의 상응하는 위치에 의도적으로 위치되고 동일하거나 기능적으로 동등한 버전으로 재구성된다. 이 원리는 특히 NR(K)Q 모티프에서의 스플라이싱 또는 O-CT-근위 영역의 근위 및 원위 말단 주변에 위치한 팔미토일화 부위에서의 스플라이싱에 각각 적용된다.

본 발명의 제2 양태에 따른 핵산 분자를 조작하는 방법의 일부 실시형태는 상류 옵신 CT에서 절단 부위 및/또는 표적 GPCR CT에서 절삭 부위를 선택하기 전에, 다음 단계를 포함함으로써 모 GPCR 중 하나 또는 둘 다의 보존된 모티프 및 이들을 암호화하는 유전자를 확인한다:

- 서열 정렬 도구를 사용하여 상류 옵신(또는 이의 단편)의 아미노산 서열을 표적 GPCR(또는 이의 단편)의 아미노산 서열과 정렬하는 단계,

- 특히 E(D)RY, IL3과 TM6의 접합부 주변의 E, TM7/CT 접합부 주변의 NPxxY, NR(K)Q 및 CT의 팔미토일화된 C 및 - 표적 GPCR이 옵신인 경우 TM7의 발색단의 결합을 위한 K를 포함하는 보존된 모티프의 군으로부터 선택된 보존된 모티프를 구성하는 아미노산 위치를 결정하는 단계.

이들 실시형태 중 일부에서, 옵신의 아미노산 서열은 보존된 모티프를 구성하는 아미노산 위치의 확인을 위해 선택적으로 소 로돕신의 아미노산 서열과 정렬된다. 적합한 정렬 도구에는 예를 들어, 전술한 바와 같은 Clustal Omega(EMBL-EBI) 및 기타 정렬 도구가 포함된다.

키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 조작하는 방법의 이들 실시형태 및 기타 실시형태 중 일부에서, 상류 옵신 CT의 절단 부위 및/또는 표적 GPCR CT의 절삭 부위를 선택하기 전에, 1차 아미노산 서열을 2차/3차 단백질 구조의 예측을 위한 프로그램에 입력하는 단계를 포함하는, 모 옵신 및 모 표적 GPCR 중 하나 또는 둘 모두에서 보존된 3D GPCR 도메인 또는 서브도메인, 특히 서브도메인 나선 8의 확인을 포함한다. 예를 들어 YASPIN(Lin et al., 2005)과 같은 적합한 프로그램 또는 예를 들어, 다음의 목록 https://molbiol-tools.ca/Protein_tertiary_structure.htm 또는 문헌[Kuhlmann et al., 2019] 또는 슈뢰딩거 소프트웨어 패키지(https://www.schrodinger.com/prime)로부터 선택된 또 다른 프로그램을 당업계에서 이용할 수 있다. 특히 재조합 핵산 기술, 인실리카(in silica)에서의 재조합 클로닝 설계 및 화학적 핵산 합성을 포함하는 전술한 바와 같은 당업계에서 이용 가능한 방법은 당업자에게 공지되어 있다.

따라서, 본 발명의 제6 양태에서, 특히 전술한 바와 같이, O-CT-근위 영역을 포함하는 절단된 옵신 CT를 포함하는 키메라 C 말단 도메인(키메라 CT)을 포함하고 본질적으로 완전한 표적 GPCR CT 또는 이의 기능적 유도체를 추가로 포함하는 키메라 옵신 GPCR 단백질 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법이 제공된다. 키메라 CT는 모 상류 옵신 CT 및 모 표적 GPCR CT로부터 유래된다. 유전자 조작 방법은 다음의 단계를 포함한다:

A-1 O-CT-근위 영역의 원위 말단의 아미노산 위치 또는 O-CT-근위 영역 근위 영역에 대한 원위 연장부 내의 아미노산 위치에서 모 상류 옵신의 CT의 절단 부위 (x)를 선택하는 단계,

A-2 선택된 절단 부위에서 절단된 절단 CT를 갖는 상류 옵신 부분 또는 펩티드를 암호화하는 핵산 분자를 수득하는 단계;

B-1 표적 GPCR CT의 근위 영역 내, 특히 NR(K)Q 모티프 또는 이의 상류에서 또는 NPxxY와 NR(K)Q 모티프 사이에서 절삭 부위 (y)를 선택하는 단계,

B-2 표적 GPCR CT 또는 이의 기능적 변이체, 특히 기능적 단편을 암호화하는 핵산 분자를 수득하는 단계; 및

C-1 단계 A-2에서 수득된 절단된 옵신-CT를 암호화하는 핵산 분자를 단계 B-2에서 수득된 표적 CT 또는 이의 기능적 변이체를 암호화하는 핵산 분자와 융합시키는 단계.

단계 A-1에서 키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태에서 절단 부위 (x)는 다음의 기준 중 하나를 충족한다:

- 절단 부위 (x)는 NR(K)Q 모티프의 하류에서 또는 적어도 7 또는 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치한 뉴클레오티드에 위치하고,

- 절단 부위 (x)는 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산의 하류 및 특히 이의 원위쪽으로 인접하여 위치한다.

- 절단 부위는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다.

키메라 옵신 GPCR의 일부 실시형태에서, 특히 멜라놉신과 같은 비정상적으로 많은 수의 아미노산을 갖는 광범위한 C 말단을 포함하는 상류 옵신을 갖는 실시형태에서, 절단 부위 (x)는 O-CT-근위 영역의 원위 말단의 하류의 아미노산 위치, 특히 위의 설명에 따른 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 위치한다. O-CT-근위 영역에 대한 원위 연장부의 원위 말단은 특히 각각 O-CT-근위 영역의 원위 말단의 하류에서 최대 30 또는 31 또는 32 또는 33 또는 34 또는 35개의 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 45 또는 47 또는 49개의 뉴클레오티드까지 위치한다.

멜라놉신과 같은 광범위 CT를 갖는 상류 옵신을 포함하는 일부 실시형태에서, 절단 부위 (x)는 광활성화의 반응 종결에 기여하는 보존된 인산화 부위 클러스터의 하류에 위치한다. 이러한 보존된 인산화 부위는 특히 문헌[Mure et al. 2016]에 기재된 바와 같이 마우스 멜라놉신의 위치 381 및 397에 상응하는 아미노산 위치 사이에 위치한다. 다시 말해서, 이러한 실시형태에서, O-CT-근위 영역에 대한 원위 연장부의 원위 말단은 바람직하게는 보존된 인산화 부위의 클러스터의 원위 말단의 하류 또는 특히 이의 원위쪽으로 인접하여 선택된다.

키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태에서, 단계 A-1에서 선택된 상류 옵신의 절단 부위 x 및 단계 B-1에서 선택된 표적 GPCR의 절삭 부위 y는 둘 다 각각의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치에 위치하거나, 또는 둘 다 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개, 또는 10개의 아미노산에 위치한다.

키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태는 하나 이상의 세포내 루프를 교환하거나 부분적으로 교환하는 하나 이상의 추가 단계, 예를 들어, 상응하는 위치에서 상류 옵신의 하나 이상의 세포내 루프 또는 부분 세포내 루프를 표적 GPCR의 세포내 루프 또는 부분 세포내 루프로 대체하는 하나 이상의 추가 단계를 포함한다.

여기서 특히 하나 이상의 스플라이싱 부위는 다음에 위치하는 스플라이싱 부위의 군으로부터 선택된다:

- IL1 교환을 위한 접합부 a 및 접합부 b,

- IL2 교환을 위한 접합부 c 및 접합부 d,

- IL3 교환을 위한 접합부 e 및 접합부 f,

- 표적 GPCR의 IL3과의 교환에서 상류 옵신 IL3의 고도로 가변적인 영역을 제거하는 IL3 내의 2개의 스플라이싱 부위.

본 발명의 제7 양태는 키메라 옵신 GPCR과 관련된 전술한 제품을 사용하는 의학적 적용에 관한 것이다. 의학적 적용은 특히 이를 필요로 하는 인간 또는 비인간 개체의 치료를 위한 의약 및 방법을 포함한다. 본 발명의 이전에 설명된 모든 양태 및 실시형태에 따른 제품은 제7 양태, 즉 의학적 적용에 적용 가능하다.

의료용, 특히 유전자 치료용으로 적용 가능한 본 발명의 전술한 양태에 따른 제품은 다음을 포함하는 제품의 군으로부터 선택된다:

- 본 발명의 제1 양태에 따른 키메라 옵신-GPCR 단백질

- 본 발명의 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자

- 본 발명의 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자

- 본 발명의 제4 양태에 따른 벡터

- 본 발명의 제6 양태에 따른 운반체 또는 세포.

일부 실시형태에서, 본 발명의 제7 양태는 시력의 부분 또는 완전 상실로 고통 받는 환자의 의학적 처치, 특히 유전자 요법 형태의 의학적 처치에 관한 것이다. 이들 실시형태 중 일부에서 제품은 옵신 및 mGluR6을 포함하거나 2개의 옵신을 포함하는 키메라 옵신 GPCR을 포함하거나 이를 암호화한다.

이 문서에서, 2개의 옵신을 포함하는 실시형태, 즉 상류 옵신 및 표적 옵신을 포함하는 실시형태는 줄여서 키메라 옵신-옵신 (GPCR)로도 지칭된다. 상류 옵신 및 mGluR6을 포함하는 실시형태는 줄여서 옵신-mGluR6으로도 지칭된다.

의학적 처치를 위한 키메라 옵신-mGluR6의 일부 바람직한 실시형태는 표적 GPCR로서 mGluR6에 융합된 상류로서 멜라놉신 또는 임의의 기타 옵신 - 예를 들어, 상자 해파리 옵신, 파라피놉신 또는 깡충거미 로돕신 또는 이의 인간화 변이체 또는 원추형 옵신 - 을 포함한다. 의학적 처치를 위한 키메라 옵신 GPCR의 일부 다른 바람직한 실시형태는 2개의 옵신을 포함하고 특히 원추형 옵신 또는 로돕신으로부터 유래된 표적 GPCR에 융합된 임의의 옵신을 포함한다.

의학적 처치를 위한 키메라 옵신-mGluR6의 이들 바람직한 실시형태 중 일부에서 및 추가의 실시형태에서, 상류 옵신은 O-CT-근위 영역의 원위 말단, 특히 예를 들어, 본원에 기재된 바와 같은 예시적인 Mela(palm)-mGluR6에서와 같이, 전술한 바와 같인 팔미토일화 부위에서 절단된다; 이들 바람직한 실시형태 및 추가의 실시형태 중 다른 것에서 상류 옵신은 O-CT-근위 영역에 대한 원위 연장부의 원위 말단, 특히 예를 들어, 본원에 기재된 예시적인 Mela(palm +33AA)-mGluR6에서와 같이, 전술한 바와 같은 팔미토일화 부위의 하류에서 약 33개 아미노산에서 절단된다.

본 발명의 제7 양태에 따른 의학적 용도, 특히 유전자 요법의 일부 바람직한 실시형태에서, 본 발명의 제7 양태에 따른 시력 개선, 시력의 부분 또는 완전 상실을 치료하기 위하여, 이식유전자는 ON-두극세포 특이적 프로모터, 특히 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터에 작동 가능하게 연결된다.

시력의 부분 또는 완전 상실을 치료하기 위한 본 발명의 제7 양태에 따른 의학적 용도의 일부 바람직한 실시형태에서, 유전자 요법을 위한 벡터, 특히 rAAV 벡터가 적용된다. 이들 실시형태 및 기타 실시형태 중 일부에서 AAV 캡시드, 특히 AAV2(7m8), AAV2(BP2) 또는 전술한 바와 같은 펩티드 삽입물을 갖는 AAV2가 적용된다.

본 발명의 제7 양태의 일부 실시형태에서, 키메라 옵신 GPCR은 시력의 부분 또는 완전 상실로 고통 받는 환자의 의학적 처치에 사용하기 위한 것이고, 처치를 위한 의학적 적응증은 특히 색소성 망막염(RP), 연령 관련 황반 변성 및 임의의 기타 형태의 광수용체 변성을 포함하는 군으로부터 선택된다.

본 발명의 제7 양태는 또한 본 발명에 따른 제품을 포함하는 제약 조성물에 관한 것이다. 특히 제약 조성물은 눈으로의 투여에 적합한 제약 제형으로 제공된다.

예시적인 실시형태에서, 전술한 바와 같은 AAV 벡터는 눈으로의 망막 하 또는 유리체 내 주사를 위해 완충 식염수 용액에 용해된다. 일부 예시적인 실시형태에서, AAV는 유전자 치료 제형으로서 0.04%의 Tween-20이 있는 완충 식염수(PBS)에 용해된다.

또한, 본 발명의 제7 양태는 본 발명에 따른 제품의 군으로부터 선택된 제품의 투여를 포함하는, 이를 필요로 하는 인간 개체 또는 비인간 개체, 특히 동물을 치료하는 방법에 관한 것이다. 방법의 일부 실시형태에서, 키메라 옵신 GPCR은 유리체 내 투여에 의해, 특히 유리체 내 주사에 의해, 또는 망막 하 투여에 의해 투여된다.

이 문서에서, 유리체 내 투여라는 용어는 약제가 눈의 유리체 내로 전달되는, 예를 들어 핵산 분자, 벡터 또는 전달용 운반체와 같은 약제의 투여 경로에 관한 것이다. 유리체 내 투여는 유리체액 젤이라는 젤리 같은 액체로 채워진, 유리체강이라고 하는 눈 뒤쪽의 공간에 약제를 직접 주입하는 절차이다.

이 문서에서, 용어 망막 하 투여는 약제, 특히 본 명세서의 맥락에서의 바이러스를 망막 색소 상피 세포와 광수용체 사이의 공간으로 투여하는 경로에 관한 것이다.

본 발명의 제7 양태는 또한 시력을 개선하기 위한 의료 요법, 또는 부분 또는 완전 실명의 치료, 또는 색소성 망막염(RP)의 치료, 또는 황반 변성의 치료 또는 다른 형태의 광수용체 변성의 치료를 위한 약제의 제조에서 본 발명에 따른 제품의 용도에 관한 것이다.

본 발명의 제7 양태는 또한 전술한 바와 같은 의학적 적용에 관한 것으로, 이는 다음을 포함하는 제품의 군으로부터 선택된 제품을 포함하고,

- 본 발명의 제1 양태에 따른 키메라 옵신-GPCR 단백질

- 본 발명의 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자

- 본 발명의 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자

- 본 발명의 제4 양태에 따른 벡터

- 본 발명의 제6 양태에 따른 운반체 또는 세포,

여기서 제품은 키메라 옵신 GPCR 단백질을 포함하거나 상기 키메라 옵신 GPCR 단백질을 암호화하는 핵산 분자 서열을 포함하는 핵산 분자를 포함하고,

키메라 옵신 GPCR 단백질은 다음을 포함하는 군으로부터 선택된다:

- Mela(palm)-mGluR6, 특히 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 서열에 따른 Mela(palm)-mGluR6 또는

- Mela(palm+33)-mGluR6, 특히 서열번호 16에 따른 Mela(palm+33)-mGluR6 또는

- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 30 또는 서열번호 32로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6.

본 발명의 제7 양태에 따른 의학적 적용의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.

아래에 본 발명의 일부 실시형태에 관한 비제한적인, 추가의 예시적인 세부사항이 예를 들어, 실시예, 표, 서열 목록, 종속항, 도면 범례 및 도면에 제시되어 있다. 이러한 예시적인 실시형태는 예시적이며 본 발명의 범위를 제한하려는 것이 아니다.

단일 분리 가능한 특징에 대한 대안이 "실시형태"로서 기재되는 곳마다, 이러한 대안은 자유롭게 조합될 수 있고 여전히 본원에 기재된 본 발명의 범위 내에 있음을 이해해야 한다.

절단된 CT를 갖는 상류 옵신으로서 멜라놉신을 갖는 키메라 옵신 GPCR 단백질의 일부 예시적인 실시형태와 관련하여, 예시적인 절단 부위는 아래에 제시된 인간 및 뮤린 멜라놉신 아미노산 서열에서 확인된다. 이 절단 부위는 팔미토일화 부위(팔미토일화 시스테인)의 하류에 있는 33개 아미노산에 위치한다. 이 예시적인 절단 부위는 "palm+33AA" 부위로 지칭되고 이는 O-CT-근위 영역에 대한 원위 연장부의 원위 말단을 형성한다.

아래에 제시된 인간 및 뮤린 멜라놉신 유전자(OPN4)의 서열 섹션에서, C 말단 멜라놉신 단편의 아미노산 서열은 O-CT-근위 영역의 근위 말단, 즉 NR(K)Q 모티프(hOPN4 및 mOPN4에서 HPK임)에서 시작한다. palm + 33AA 절단 부위는 아미노산 위치 397에서 아래쪽 화살표로 표시된다. 다음의 아미노산 잔기는 테두리가 표시되어 있다:

- 보존된 HPK, 즉 NR(K)Q 모티프

- 팔미토일화 시스테인

- 절단 부위의 상류의 보존된 인산화된 세린 및 트레오닌 잔기.

hOPN4 - 서열번호 57

_-*

mOPN4 - 서열번호 58

키메라 옵신 GPCR, 특히 키메라 멜라놉신 GPCR의 다른 예시적인 실시형태에서, 절단된 CT의 절단 부위는 "palm+33AA" 부위의 상류에서 임의의 아미노산 위치 또는 추가의 하류, 예를 들어, 팔미토일화 부위의 하류에서 최대 예를 들어, 34 또는 35개 아미노산에 위치할 수 있다.

키메라 옵신-GPCR에서 기능적 유도체로서 유리하게 보존되거나 재구성되는 모 옵신 및 모 표적 GPCR의 예시적인 관련 보존된 부위가 아래의 표 I에 제공된다.

기능적 키메라 옵신 GPRC 단백질을 생성하는 예시적인 테스트한 스플라이싱 부위는 아래의 표 II에 제시되어 있다.

일부 실시형태에서 스플라이싱 부위는 두 모 GPCR에서 보존된 모티프 또는 부위에 배치된다.

일부 실시형태에서 보존된 모티프 또는 부위는 적합한 스플라이싱 부위의 확인을 위한 기준점 역할을 한다. 이러한 스플라이싱 부위는 전술한 예시적인 palm+33 부위와 같은 두 모 GPCR에서의 특정 보존된 모티프 또는 부위에 대해 동일한 거리에 위치할 것이다.

일반적으로, 모 옵신의 서열은 (예를 들어, 절삭 및 후속 결찰에 의해 또는 인실리코 설계된 키메라 옵신 GPCR의 핵산 합성에 의해) 2개의 모 GPCR의 도메인 또는 서브도메인을 연결하기 위한 적합한 스플라이싱 부위의 확인을 위해 보존된 부위를 기반으로 정렬된다.

일부 실시형태에서, 모 옵신에 알려진 팔미토일화 부위가 결여되어 있는 경우, 소 로돕신의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 부위 모두가 스플라이싱에 적합한 부위 또는 기준점으로서 확인되도록 정렬되었다.

참고:

NA = 본 발명에 따른 비옵신 GPCR의 경우 해당 없음

$ 팔미토일화되지 않음, 소 로돕신의 C322/C323에 상응하는 아미노산

[표 2]

스플라이싱 부위의 약어 관련 비고:

Palm = 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치

Palm + 33 = Palm의 하류에서 33개 아미노산의 아미노산 위치

Jct. = 막관통 도메인과 세포내 도메인 사이의 전이부의 접합부

가변 영역 = 표적 GPCR의 IL로 대체된 옵신의 IL의 고도로 가변적인 영역을 절제하는 2개의 스플라이스 부위

2개의 옵신을 갖는 실시형태에 대한 예시적인 스플라이스 부위 x-3

실시예

도 5 내지 12는 현미경적 시각화 외에 키메라 옵신 GPCR 단백질의 기능을 증명하기 위해 적용된 세 가지의 상이한 실험 접근법의 결과를 보여준다:

시험관 내:

1. HEK-GIRK 패치-클램프 Gβγ 활성 분석: 기능적 옵신을 GIRK(Kir3.1/3.2) 칼륨 채널을 안정적으로 발현하는 HEK293 세포주에서 발현시켰다. 빛 자극은 내인성 세포내 Gi/o-단백질을 활성화하는 옵신을 활성화한다. 활성화된 Gβγ 단백질은 차례로 GIRK 이온 채널을 열어 빛 자극에 대해 시간 고정되고 기록될 수 있는 전기적 반응을 유발한다. 방법에 대한 자세한 설명은 문헌[van Wyk et al., PLoS Biol 2015]를 참조한다.

2. Gα-특이성 생물발광 플레이트 판독기 분석: 각 옵신을 HEK293 세포주에서 리포터 발현 플라스미드와 공동 발현시켰다. GIRK 분석과 유사하게, 활성화된 옵신은 차례로 cAMP(Gs 및 Gi) 또는 Ca2+(Gq)를 생성하는 효소를 억제하거나 활성화하는 G 단백질을 활성화한다. 이들 생성물(cAMP 및 Ca2+)의 축적은 각각 cAMP 또는 Ca2+에 의해 활성화된 생물발광 단백질의 발광으로 측정할 수 있다. Gs 및 Gi 활성의 변화를 시각화하기 위해 pcDNA5/FRT/TO Glo22F를 리포터 플라스미드로 사용하고 Gq 신호전달의 변화를 위해 pcDNA5/FRT/TO mtAeq를 리포터 플라스미드로 사용했다. 각각 루시퍼라제 또는 코엘렌테라진을 기질로 첨가하고 발광 변화로 표시되는 cAMP(Gs 및 Gi) 또는 Ca2+(Gq) 수준의 변화를 Infinite F200Pro Tecan 플레이트 판독기(Mδnnedorf, 스위스)로 측정하였다. 광 유도 형광 변화를 옵신 형질감염 수준으로 정규화하기 위해, 형광의 절대 변화를 측정된 플레이트의 각 웰의 전체 mCitrine 리포터 형광으로 나누었다.

생체 외:

이러한 옵신 단백질이 AAV 유전자 요법에 의해 살아 있는 망막에 도입된, 광수용기 세포가 없는 망막(rd1 색소성 망막염 마우스, C3H/HeOuJ 마우스 계통)의 마우스 망막 뉴런으로부터의 광 반응을 기록하였다(문헌[van Wyk et al. (2015)] 및 아래 도 11의 범례 참조).

생체 내:

이러한 옵신 단백질이 AAV 유전자 요법에 의해 살아 있는 망막에 도입된, 광수용체 변성이 있는 마우스 모델에서 행동 안구운동 반사를 기록했다(아래 도 10의 범례 참조).

도면의 상세한 설명

다음의 상세한 설명을 고려할 때 본 발명은 더 잘 이해될 것이고 위에 기재된 것 이외의 목적이 명백해질 것이다. 이러한 설명은 첨부된 도면을 참조한다.

도 1: 옵신의 일반적인 구조.

도 1은 7개의 막관통 도메인 TM1 내지 TM7, 세포외 도메인, N 말단 NT 및 세포외 루프 EL1, EL2 및 EL3, 뿐만 아니라 세포내 도메인 C 말단 CT 및 세포내 루프 IL1, IL2 및 IL3을 갖는 모 옵신의 일반적인 구조의 개략도를 보여준다. 막과 세포질 사이의 경계에 있는 TM 도메인과 세포내 도메인 사이의 접합부는 접합부 (a) 내지 (g)로 표시되어 있다. 옵신-GCPR 키메라 단백질에 대한 선택적 스플라이싱 부위는 예를 들어 세포내 루프의 교환을 위한 이들 접합부에 위치할 수 있다. 또한, CT의 보존된 서브도메인인, CT의 근위 영역에 있는 나선 8(H8)이 표시되어 있고, 옵신에 존재하는 여러 보존된 서열 모티프, 특히 다음의 서열 모티프가 표시되어 있다:

- IL3과 TM6 사이의 접합부 (f)의 글루타메이트 잔기(E)에 연결된 TM3의 세포질 경계에 있는 E(D)RY 부위 사이의 이온 잠금,

- Schiff 염기를 통해 발색단 11-시스-레티날에 결합된 TM7의 리신 잔기(K) 및 Schiff 염기를 안정화시키는 TM3의 음성 반대이온, 일반적으로 글루타메이트를 갖는 발색단 결합 포켓,

- TM7의 C 말단 끝의 NPxxY 모티프,

- H8의 원위 말단에 있는 하나 이상의 팔미토일화 부위(들)(C),

- CT의 세포질 영역의 C 말단 인산화 부위(P),

또한, 도 1은 CT에서의 3개의 예시적인 절단 부위 (x-1), (x-2) 및 (x-3)을 예로서 나타낸다.

도시된 절단 부위 (x-1)은 H8의 원위 말단에 위치하고 소 로돕신의 팔미토일화 부위(C322 또는 C323)에 상응하는 팔미토일화 시스테인 잔기에 원위쪽으로 인접해 있다. 도시된 절단 부위 (x-2)는 팔미토일화 부위의 하류, 멜라놉신의 경우 팔미토일화 부위의 하류에서 33개 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 40, 41, 42, 43, 44 또는 45개 아미노산에 위치한다. 도시된 절단 부위 (x-3)은 NR(K)Q 모티프 내에 또는 이에 대해 직접 원위에 있다. 도시되지 않은 다른 절단 부위는 특히 (x-1)과 (x-2) 사이 또는 (x-3)과 (x-1) 사이의 아미노산 위치에 위치한다.

도 2: 예시적인 키메라 옵신 GPCR의 도식.

도 2는 예시적인 모 상류 옵신의 절단된 C 말단이 팔미토일화 부위에 원위쪽으로 인접하여 절삭되고 예시적인 표적 GPCR의 CT와 융합되는, 단일 스플라이싱 부위 (x-1)만을 갖는, 최소한의 유전자 조작만을 요구하는 키메라 옵신 GPCR의 예시적인 실시형태를 보여준다; (x-2) 및 (x-3)과 같은 대안적인 예시적인 스플라이스 부위가 도 1에 표시되고 설명되어 있다.

도 2에 도시된 예시적인 실시형태는 C 말단의 가장 원위 말단에 선택적으로 부가될 수 있는 추가 서열을 추가로 포함한다. 이러한 선택적 추가 서열은 마커 단백질(예를 들어, 형광 단백질) 또는 트래피킹 서열(예를 들어, 골지 및 ER 방출 신호 또는 막 트래피킹 서열)을 암호화할 수 있다. 본원에 제시되지 않은 추가의 예시적인 실시형태에서, 비인간 옵신이 사용되는 경우 잠재적 인간 요법에서 단백질의 항원성을 감소시키기 위하여 인간 옵신 도메인과의 세포외 도메인 교환을 위해 TM 도메인(TM1 내지 TM7) 및 세포외 도메인(NT, EL1 내지 EL3) 사이의 접합부 (A’)~(G’) 주변에 선택적인 추가 스플라이싱 부위가 도입될 수 있다.

도 3: 키메라 옵신 mGluR6의 예시적인 실시형태.

(a): 도 3은 키메라 C 말단을 갖는 멜라놉신-mGluR6 키메라 GPCR의 예시적인 실시형태를 도시하며, 이는 팔미토일화 부위(C)까지 절단된 멜라놉신 C 말단을 포함하고, 이어서 먼저 전체 크기의 mGluR6 CT, 다음으로 mKate2 형광 마커, 마지막으로 추가의 골지 방출 신호 및 표적 CT의 맨 원위 말단에 위치한 로돕신 막 트래피킹 서열이 원위 방향으로 팔미토일화 부위에 원위쪽으로 인접하여 이어진다. 또한, 멜라놉신의 IL1은 접합부 a와 b에 위치한 절삭 스플라이싱 부위에서 mGluR6의 것으로 완전히 대체된 반면, mGluR6의 전체 IL3은 멜라놉신의 더 긴 IL3의 고도로 가변적인 영역 내에 위치한 스플라이싱 부위에 도입되었다.

이 예시적인 실시형태에서, 가변 영역이 기능적 차이, 즉, 여기서는 잠재적으로 G 단백질 특이성을 결정한다는 근거 하에 mGluR6의 짧은 IL3이 멜라놉신의 더 긴 IL3의 최소 보존된 영역으로 도입된다. 실제로 키메라 옵신 mGluR6 IL3을 사용한 이 실시형태는 도 6b에서 입증된 바와 같이 옵신 IL3에 도입된 mela(palm)mGluR6과 비교하여 기능성을 증진시킨다.

(b)-상단: TM5와 TM6 사이의 IL3의 초가변 영역을 나타내는 다른 종으로부터의 멜라놉신 유전자(OPN4)의 정렬(출처: DOI: 10.1371/journal.pone.0025111).

(b)-하단: mGluR6의 IL3 삽입 위치. 아래를 가리키는 화살표는 본원에서 사용된 마우스 멜라놉신(M. OPN4)의 절삭 부위를 나타내고, 위를 가리키는 화살표는 a에 표시된 접합부 e 및 f를 나타낸다.

도 4: 키메라 옵신 GPCR의 예시적인 실시형태는 세포막을 표적으로 한다.

원형질막으로의 적절한 세포내 트래피킹을 확인하기 위해, 형광 리포터 단백질(mKate2)을 사용하여 단백질 국소화를 연구하는 옵신-mGluR6-mKate2 융합 단백질을 생성하였다. 융합 단백질은 HEK293 세포에서 발현되었다. 미분 간섭 대조 현미경 이미지(A,C)와 형광 이미지(B,D)를 비교하여 옵신-mGluR6 단백질이 세포막에 위치하는 것을 확인하였다. 이는 두 개의 상이한 키메라 옵신 GPCR 단백질, 즉 (A,B)의 멜라놉신-mGluR6-mKate2 키메라 GPCR과 (C,D)의 해파리 옵신-mGluR6-mKate2 키메라 GPCR로 표시된다. 두 키메라 GPCR 모두에서 절단 부위는 멜라놉신 CT의 팔미토일화 부위에 원위쪽으로 인접하여 위치한다.

도 5: 모 옵신과 비교하여 옵신-mGluR6에 의해 매개되는 증가된 광 활성화 전류를 나타내는 키메라 C 말단을 갖는 키메라 옵신 mGluR6의 예시적인 실시형태.

다양한 예시적인 키메라 옵신-mGluR6 구축물(추가 트래피킹 서열이 결여됨)을 GIRK1/2 채널(Gi/o 패밀리의 활성화된 G 단백질에 의해 직접 개방되는 칼륨 채널)을 안정적으로 발현하는 HEK293 세포주로 일시적으로 형질감염시켰다. 세포가 전압-클램프 모드(-75 mV 유지 전위)에서 패치-클램핑되면 5초 동안 제시된 470 nm의 빛 자극(1 x 10¹⁴개 광자 cm^-2 sec^-1)이 히스토그램의 변이체에 대해 도시된 내향 GIRK 전류를 활성화한다. 상이한 구축물에 의해 활성화된 GIRK 전류의 상대적 크기(pF 단위의 패치된 세포의 크기로 정규화됨)가 표시되어 있다. 별표는 Student t-검정에 의해 결정된 유의 수준을 나타낸다(* p≤0.05, ** p≤0.01).

(A) 중파 원추형 옵신(OPN1MW) 유도 GIRK 전류는 키메라 OPN1MW(palm)-mGluR6CT에 의해 유도된 전류보다 유의하게 작다.

(B) 멜라놉신 변이체에 의한 비교 광 활성화 GIRK 전류, 1 = 변형되지 않은 멜라놉신, 2 = CT mGluR6이 부가된 팔미토일화 부위에서 절삭된 멜라놉신, 3 = 또한, 멜라놉신의 전체 IL1이 mGluR6의 것으로 대체되었다, 4 = 또한, 전체 mGluR6 IL3이 멜라놉신의 긴 IL3의 가변 위치에 배치되었다. mGluR6 C 말단의 C 말단 부가는 광 유도 GIRK 전류를 유의하게 증가시킨다.

도 6: HEK-GIRK 세포를 사용한 키메라 옵신 GPCR의 시험관 내 기능적 스크리닝의 예.

옵신-표적 GPCR 키메라가 있는 형질감염된 HEK-GIRK 세포를 문헌[Van Wyk et al. (2015)]에 기술된 바와 같이 Gi/o G 단백질 신호전달을 활성화하는 능력에 대해 평가하였다. 표적 GPCR CT에 더하여 mKate 형광 단백질 및 추가 골지 및 막 트래피킹 서열을 운반하는 다양한 옵신-GPCR 변이체로 형질감염된 HEK-GIRK 세포에서 기록된 패치-클램프 흔적의 예시적인 광 반응이 제시되어 있다(빛 자극은 검은색 수평선으로 표시됨; 470 nm; 1 x 10¹⁴ 개 광자/sec/cm²). (A) 프로토타입 Opto-mGluR6(WO 2012/174674 A1 및 van Wyk et al. (2015)), (B) Mela(palm+33AA)-mGluR6, (C) Mela(palm)+IL1-mGluR6, (D) Mela(palm)+IL3-mGluR6, (E) Mela(palm)-mGluR6, (F) JellyOP(palm)-mGluR6, (G) OPN1MW(palm)-mGluR6, (H) Mela(palm)-OPN1MW(IL1, IL2, IL3, CT).

도 7: 키메라 옵신 GPCR의 예시적인 실시형태의 G 단백질 재표적화 및 경로 선택성을 조사하는 플레이트 판독기 실험.

옵신-GPCR 키메라 리포터 발현 플라스미드로 HEK293 세포를 공동 형질감염시키고 생물발광 플레이트 판독기 분석에서 이들의 Gα 특이성을 평가하였다. GIRK 분석과 유사하게, 활성화된 옵신은 차례로 cAMP(Gs)를 생성하고, cAMP(Gi/o)를 감소시키거나 세포내 Ca2+(Gq)를 증가시키는 효소를 억제 또는 활성화하는 G 단백질을 활성화한다. 이들 생성물(cAMP 및 Ca2+)의 축적은 각각 cAMP 또는 Ca2+에 의해 활성화된 생물발광 단백질의 발광으로 측정할 수 있다. 빛 적용(480 nm, 10초)은 검은색 화살표로 표시되어 있다. 광 유도 형광 변화를 옵신 형질감염 수준으로 정규화하기 위해, 형광의 절대 변화를 측정된 플레이트의 각 웰의 전체 mCitrine 리포터 형광으로 나누었다. 검은색 화살표는 빛 자극을 나타낸다. (A,B) Mela(palm)-mGluR6(검은색 흔적) 및 변형되지 않은 멜라놉신(회색 흔적)의 Gi/o(A) 및 Gq(B) 결합에 대한 선호도. (A)에서, 세포 내 cAMP를 먼저 포스콜린(forskolin)(아데닐레이트 시클라제를 자극함)을 첨가하여 증진시켜 광 활성화 키메라 단백질에 의한 cAMP 감소를 측정할 수 있음을 주목한다. 그래프는 팔미토일화 부위에서 mGluR6의 C 말단에 의한 멜라놉신의 C 말단 교환이 G 단백질 선호도를 Gq(멜라놉신)에서 Gi/o(mGluR6)로 이동시킴을 보여준다. 멜라놉신의 팔미토일화 부위에 mGluR6의 C 말단을 삽입하면 G-알파 서브유닛 선호도가 Gq에서 Gi/o로 이동한다. (C) JellyOP(palm)-mGluR6(검은색 흔적)과 비교한, 변형되지 않은 JellyOP(회색 흔적)의 Gi/o 대 Gs 결합 선호도. PTX는 Gi/o의 억제제로서, JellyOP가 Gs에만 결합함을 나타내는 반면(PTX 무첨가(●) 및 PTX 첨가 후(■) 신호의 변화 없음), JellyOP(palm)-mGluR6은 Gi/o에 명백히 결합하여, PTX 첨가 전(●)과 PTX 첨가 후(■) 명확하게 증가한 차등 휘도값()만큼 가시적이다. 해파리 옵신의 팔미토일화 부위에 mGluR6의 C 말단을 삽입하면 G-알파 서브유닛 선호도가 Gs에서 Gi/o로 이동한다. (D) JellyOP(palm)-5HT7은 광 활성화 cAMP 증가에 의해 표시되는 Gs를 효율적으로 활성화한다. 대조군: 광 활성화 키메라 단백질 없이 HEK293 세포를 발현하는 mCitrine 단독. (E) 전방 대상 피질의 피라미드 세포에서 발현되는 JellyOP(palm)-5HT7은 HCN 채널의 활성을 감소시켜 막 전위를 탈분극시킨다. 이 효과는 약리학적 5-HT7 자극의 효과와 동일하다(Santello et al. (2015)). 뮤린 전방 대상 피질의 예리한 박편에서 피라미드 세포의 체세포 패치-클램프 기록(상단에 제시)의 데이터(하단). JellyOP(palm)-5HT7은 정위 주사에 의한 AAVdj 유전자 요법에 의해 도입되었다.

도 8: 키메라 옵신-mGluR6 변이체의 예시적인 실시형태의 ON-두극세포 수상돌기 및 mGluR6 시그널로솜으로의 올바른 생체 내 트래피킹.

마우스를 ssAAV2(7m8)를 사용한 유전자 요법(Dalkara et al. (2013)) 및 770En_454P(hGRM6) 프로모터의 제어 하의 멜라놉신-mGluR6 유전자 설정(EP19200082.6, 본 출원에 첨부됨)을 이용하여 치료하였다. (A) 천연 mGluR6도 상재하는 ON-두극세포의 수상돌기에서 키메라 옵신 mGluR6 단백질의 정확한 세포 이하 국소화를 나타내는 스케치. (B) 항멜라놉신 항체(흰색)로 시각화된 Mela(palm+33AA)-mGluR6-IRES-TurboFP635는 ON-두극세포의 수상돌기에서 명확하게 발현된다. 신경절 세포층(GCL)에서 기원하는 축색 돌기는 자연적으로 멜라놉신을 발현하는 ipRGC(본질적 감광성 망막 신경절 세포)에서 유래한다. 항-RFP 항체로 시각화된 (C) Mela(palm)-mGluR6-mKate2 및 (D) JellyOP(palm)-mGluR6-mKate2는 단백질의 수지상 국소화를 다시 명확하게 나타낸다. 옵신(palm) 버전은 표적 세포에서 키메라 단백질을 올바르게 국소화하기에 충분하다.

도 9: 키메라 옵신-mGluR6 GPCR의 예시적인 실시형태는 단리된 ON-두극세포를 직접적으로 감광성으로 만든다.

마우스를 Mela(palm+33AA)-mGluR6 및 JellyOP(palm)-mGluR6으로 유전자 치료하고, 안구 적출 후 망막을 파파인으로 소화시켰다. 단리된 세포를 유리 커버 슬립에 플레이팅하고, 천공 패치 기술을 사용하여 패치-클램핑하였다. (A) 두극세포는 DIC 광학 하에 쉽게 식별되었다. (B) 형질감염된 두극세포는 형광 리포터 유전자의 공동 발현에 의해 식별되었으며, 여기서 TurboFP635는 형광 현미경으로 시각화되었다. (C, D) 수직 파선으로 표시된, 2초의 청색광(470 nm; 1 x 10^14개 광자/cm^2/sec)에 반응하여 변환된 ON-두극세포로부터의 예시적인 패치-클램프 기록. (C) Mela(palm+33AA)-mGluR6을 발현하는 ON-두극세포로부터의 회색과 검은색의 겹쳐진 두 개의 예시 흔적. 빛에 반응하여, 세포는 분명히 과분극화되어 TRPM1 비선택적 양이온 채널을 음성으로 게이팅하는 mGluR6 캐스케이드의 직접 활성화를 나타낸다. (D) JellyOP(palm)-mGluR6을 발현하는 ON-두극세포(검은색 흔적) 및 망막 박편에서 기록된 광수용체에 의해 직접 활성화된 간상 두극세포(회색 흔적)로부터의 비교 패치-클램프 흔적. JellyOP(palm)-mGluR6 발현 두극세포는 670 ms의 반응 오프셋(Tau(off))으로 매우 빠른 동역학을 보여주었다. 이는 광수용체 활성화 하의 두극세포의 반응 오프셋(이 예에서 Tau(off)=570 ms)과 거의 동일하다. 또한, JellyOP(palm)-mGluR6의 반응 온셋(Tau(on)=90 ms)은 광수용체에 의해 활성화된 두극세포의 반응 온셋(70 ms)과 거의 동일하다. 내인성의 신속한 동역학은 mGluR6 시그널로솜에서 JellyOP(palm)-mGluR6의 정확한 국소화와 두극세포 내에서의 적절한 신호 전달에 대한 명확한 표시이다. 동역학 매개변수(Tau 값)의 적합도는 적색선과 녹색선으로 표시되어 있다.

도 10: 키메라 옵신 mGluR6 변이체의 예시적인 실시형태를 이용한 AAV 유전자 요법에 의해 치료된 시각장애 마우스의 생체 내 시력 측정.

히스토그램은 x축에 표시된 상이한 키메라 옵신-mGluR6 구축물을 이용한 AAV 유전자 요법으로 치료한 시각장애 색소성 망막염 rd1(망막 변성 C3H/HeOuJ 계통) 마우스의 평균 시력(± s.e.m.)을 나타내고, 여기서 (palm)은 멜라놉신, 해파리 옵신 및 중파 원추형 옵신의 CT의 팔미톨화 부위에 원위쪽으로 인접하여 위치한 절단 부위를 나타내고, Mela(palm+33AA)는 멜라놉신 CT의 팔미톨화 부위의 하류에서 아미노산 위치 33에 원위쪽으로 인접하여 위치한 절단 부위를 나타내고, + IL1 또는 + IL3은 mGluR6의 CT에 추가하여 mGluR6의 이러한 서브유닛의 존재를 나타내고, 마지막으로 JellyOP 및 OPN1MW는 각각 해파리 옵신 및 인간 중파 원추형 옵신을 나타낸다. C57BL/6은 주사되지 않은, 시력이 있는 야생형 마우스를 지칭하며, 양성 대조군으로 사용된다. 이 테스트에서, 마우스는 공간 주파수 변화의 흑백 막대를 나타내는 가상 현실(Striatatech, 눈운동 검사통)로 둘러싸인 높은 플랫폼에 제약 없이 배치된다(자세한 내용은 문헌[Prusky et al. (2004)] 참조). 마우스가 여전히 인식하는 가장 높은 공간 시력(cyc/deg)을 정량화하기 위하여 마우스의 추적 머리 움직임(시운동 반사)을 적외선 카메라로 자동으로 모니터링하고 분석한다. Mela(palm)-mGluR6 주사된 마우스는 시각장애 한배 새끼(rd1)보다 유의하게 더 낫게 수행한다. 모든 멜라놉신-mGluR6 변이체 처리된 마우스와 JellyOP(palm)-mGluR6 및 OPN1MW(palm)-mGluR6 주사된 마우스도 동등하게 잘 수행하였다. 유의 수준은 일원 분산분석 테스트에 의해 결정되었으며 그래프에서 유의 수준은 다음과 같이 표시된다: * p≤0.05, *** p≤0.001 및 n.s. 유의하게 다르지 않음. 요약하면, 모든 구축물은 시각장애 rd1 마우스에서 공간 시력을 유의하게 회복시키는 데 있어서 동등하게 잘 수행하였다. 유전자 요법은 770En_454P(hGRM6) 프로모터의 제어 하에 키메라 옵신 mGluR6 단백질 유전자를 설정하는 ssAAV2(7m8)(Dalkara et al(2013)) 벡터를 사용하여 수행되었다.

도 11: 신규한 옵신-mGluR6 구축물로 처리된 시각장애 rd1 망막의 망막 신경절 세포로부터 기록된 생체 외 광 반응.

세포 부착 패치-클램프 기록은 전조직 표본 망막에서 생체 외에서 수행되었다. (A) 세포 유형 식별을 위한 패치-클램프 기록 후 세포내 표지된 망막 신경절 세포. (B) Mela(palm+33AA)-mGluR6 키메라로 처리된 rd1 망막의 망막 신경절 세포의 스파이크 반응을 보여주는 예시적인 래스터 플롯. 반응은 mGluR6 수용체 효능제인 L-AP4(25 μM)에 의해 차단되지 않아, 광수용체에서 ON-두극세포로의 입력을 차단한다. 이는 빛 반응이 Mela(palm+33AA)-mGluR6에 의해 유발됨을 확인시켜준다. 빛은 점선 사이의 2초 동안 적용되었다. 막대의 각 수평선(번호 1~8)은 하나의 기록을 나타낸다. 각 수직선은 신경절 세포의 기록된 활동 전위에 해당한다. 명백히, 이 세포는 빛이 매우 안정적으로 적용될 때 활동 전위 발화를 증가시킨다. (C) 다른 시각장애 뮤린 rd1 망막의 Mela(palm)-mGluR6 발현에 의해 회복된 일시적인 OFF, ON 및 ON-OFF 신경절 세포의 예시적인 스파이크-시간-히스토그램. 빛에 대한 신경절 세포 반응의 자연적 다양성- 즉, OFF-세포라고 하는 빛 오프셋에서 스파이크 주파수의 증가(왼쪽), ON-세포라고 하는 빛 온셋에서 스파이크 주파수의 증가(중간) 또는 ON-OFF 세포라고 하는 빛 온셋 및 오프셋에서 발화의 증가(오른쪽) -의 회복은 내인성 내부 망막 기능의 회복을 확인시켜준다. (D) 상이한 키메라 옵신 mGluR6 단백질 변이체로 형질도입된 마우스의 rd1 망막 평면 표본 고정에서의 다중 전극 어레이(MEA) 기록. 반복된 빛 자극(흔적 위의 수평 막대로 표시되는 빛 자극의 지속시간)의 선택된 전극(번호 1~5)으로부터의 예시적인 래스터 플롯(B와 유사)이 제시되어 있다. rd1은 빛 자극 시 기저 발화율의 변화가 없는, 처리되지 않은 한배 새끼이다. 반대로, 키메라 옵신 mGluR6 단백질의 모든 망막은 현저한 빛 잠금 반응을 나타낸다.

도 12: AAV2 캡시드를 암호화하는 바이러스 VP1 유전자의 N587 내지 R588 사이에 펩티드 삽입물 (a) NLAPRTPHTAAR 및 (b) NLANHAPNHCAR을 포함하는 AAV2를 이용한 유리체 내 유전자 요법 후 ON-두극세포를 발현하는 hMela(palm)-mGluR6-IRES2-TurboFP635를 보여주는 2마리의 치료된 변성 마우스(rd1 망막 변성 마우스 계통 C3H/HeOuJ)의 망막을 통한 수직 동결절편의 현미경 사진. hMela(palm)-mGluR6-IRES2-TurboFP635의 발현은 두 경우 모두 770En_454P(hGRM6) ON-두극세포 특이적 프로모터에 의해 유도된다.

도 13: 예시적인 JSR1(S186F)palm-beta2AR 키메라 옵신 GPCR을 HEK293-GIRK 세포에서 발현시켰고, 광 유도 전류를 전체 세포 패치-클램프 방법으로 측정하였다. 385 nm의 빛은 GIRK 전류를 유도한 반면, 550 nm의 빛은 이안정성 JSR1(S186F) 돌연변이체의 이색성 특성으로 인해 활성을 종료시켰다. 예시적인 hJSR(S186F)palm-GABAB2 키메라 옵신 GPCR로 수행한, 동일한 빛을 사용한 유사한 패치 클램프 실험은 유사한 GIRK 전류를 유도했다(데이터 미제시).

아래 표 3의 개요에 제시된 바와 같은 키메라 옵신 GPCR의 예시적인 실시형태의 선택을 위한 cDNA 및 아미노산 서열.

[표 3]

모 GPCR 및 C 말단 스플라이싱 부위 및 서열번호의 표시가 있는 예시적인 실시형태의 개요

¹⁾ 홀수: 핵산 서열; 짝수: 아미노산 서열.

²⁾ 기원: m = 뮤린; h = 인간; jf = 해파리; js = 깡충거미; h-js = 인간화 깡충거미

³⁾ 명칭은 ⁴⁾에서와 같이 보존된 모티프 또는 부위를 지칭함으로써 모 GPCR 및 상류 옵신의 CT의 절단 부위를 나타내고, 표적 GPCR과 관련하여, CT 단독이 아닌 경우 도메인이 열거된다.

⁴⁾ 보존된 모티프 또는 부위이거나 이에 대한 것임; palm = 팔미토일화 부위; palm+33AA = 팔미토일화 부위의 원위의 33개 아미노산

아래에 열거된 아미노산 서열에서 테두리 표시된 아미노산은 보존된 모티프를 나타내고, 회색 강조표시는 팔미토일화된 Cy를 나타낸다.

실시형태 (A): Mela(palm+33AA)-mGluR6 (뮤린 서열 기반)

구축: 멜라놉신은 AA397 이후에 절단되었고, mGluR6 C 말단은 NR(K)Q/HPE 모티프에서 시작하여 부가되었다.

cDNA -- 서열번호 1

펩티드 서열 -- 서열번호 2

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (B): Mela(palm)-mGluR6 (뮤린 서열 기반)

구축: 멜라놉신은 멜라놉신의 팔미토일화 Cys(AA364) 이후에 절단되었고, mGluR6 C 말단은 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)에 비해 더 나은 서열 정렬의 결과로 2개의 추가 근위 아미노산을 포함하여 부가되었다.

cDNA -- 서열번호 3

펩티드 서열 -- 서열번호 4

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (C): Mela(palm+33AA)+IL1-mGluR6 (뮤린 서열 기반)

구축: 실시형태 A와 동일하나, 멜라놉신 IL1과 mGluR6의 IL1의 추가적인 완전한 교환을 수반함. 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)에서와 동일한 절삭 부위.

cDNA -- 서열번호 5

펩티드 서열 -- 서열번호 6

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (D): Mela(palm)+IL1-mGluR6 (뮤린 서열 기반)

구축: 멜라놉신은 멜라놉신의 팔미토일화 Cys(AA364) 이후에 절단되었고, mGluR6 C 말단은 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)과 비교하여 2개의 추가 근위 AA를 포함하여 부가되었다.

cDNA -- 서열번호 7

펩티드 서열 -- 서열번호 8

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (E): Mela(palm+33AA)+IL3-mGluR6 (뮤린 서열 기반)

구축: (1)과 동일하나, mGluR6의 짧은 IL3을 멜라놉신의 긴 IL3의 가변 부분에 추가로 삽입함.

cDNA -- 서열번호 9

펩티드 서열 -- 서열번호 10

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (F): Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) (뮤린 서열 기반)

구축:

mela의 모든 세포내 도메인이 교환되었고 CT 스플라이스 부위 X-1이 있는 OPN1MW의 상응하는 세포내 도메인에 의한 키메라(도 3 옵션 1)

cDNA -- 서열번호 11

펩티드 서열 -- 서열번호 12

범례:

밑줄 = OPN1MW

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (G): OPN1MW(palm)-mGluR6 (뮤린 서열 기반)

구축: HPE 모티프를 포함하는 mGluR6 C 말단이 추정 팔미토일화 부위에, 즉 소 로돕신의 팔미토일화 부위 C322 바로 앞의 잔기(F, 회색으로 강조 표시) 뒤에 부가되었다.

cDNA -- 서열번호 13

펩티드 서열 -- 서열번호 14

범례:

밑줄 = mGluR6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (H): Mela(palm+33AA)-mGluR6 (인간 서열 기반)

구축: 뮤린 구축물을 이용하여 위와 같이 구축.

cDNA -- 서열번호 15

펩티드 서열 -- 서열번호 16

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (I): Mela(palm)-mGluR6 (인간 서열 기반)

구축: 뮤린 구축물을 이용하여 위와 같이 구축.

대립 유전자 변이체: "L 변이체"

cDNA -- 서열번호 17

펩티드 서열 -- 서열번호 18

대립 유전자 변이체: P-변이체

cDNA 서열번호 19(인간 멜라놉신 이소형 1 포함)

펩티드 서열 -- 서열번호 20

인간 멜라놉신의 이소형 1을 포함하는 멜라놉신-mGluR6("p 변이체")의 AA 서열

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

테두리 표시됨 = 대립 유전자 변이체 및 보존된 모티프

설명: HEK293 세포에서의 비교 실험에서 L 및 P 변이체는 동등하게 수행하였다. P-변이체는 가장 일반적인 mGluR6 대립 유전자 변이체이며, 대부분의 실험에서 사용되었다.

실시형태 (J): Mela(palm+33A)+IL1-mGluR6 (인간 서열 기반)

구축: 뮤린 구축물을 이용하여 위와 같이 구축.

cDNA -- 서열번호 29

펩티드 서열 -- 서열번호 30

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (K): Mela(palm+33A)+IL3-mGluR6 (인간 서열 기반)

구축: mGluR6(GRM6) IL3 및 mGluR6(GRM6) CT를 포함하는 인간 멜라놉신 키메라

cDNA -- 서열번호 31

펩티드 서열 -- 서열번호 32

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (L): JellyOP(palm)-mGluR6

구축: JellyOP의 팔미토일화 부위(회색 Cys) 뒤에 뮤린 GRM6의 C 말단이 부가된 상자 해파리 옵신 키메라

cDNA -- 서열번호 33

펩티드 서열 -- 서열번호 34

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (M): JellyOP(palm)-5HT7

구축: JellyOP의 팔미토일화 부위(회색 Cys) 뒤에 뮤린 5-하이드록시트립타민 수용체 7(이소형 1)의 C-말단이 부가된 상자 해파리 옵신 키메라. 팔미토일화 부위 뒤에서 시작하는 5-HT7 수용체의 C 말단 서열이 여기에 부가되었다.

cDNA -- 서열번호 35

펩티드 서열 -- 서열번호 36

범례:

밑줄 = 5HT7

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (N):PPO(palm)-mGluR6 (뮤린 mGluR6)

구축: 칠성장어(Lethenteron camtschaticum) 파라피놉신(PPO)

HPE 부위의 상류에서 2개의 아미노산에서 mGluR6의 CT와 융합된 PPO의 팔미토일화 부위의 스플라이싱 부위 x.

DNA 서열 -- 서열번호 37

펩티드 서열 -- 서열번호 38

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

실시형태 (O): JSR1(palm)-mGluR6 (뮤린 mGluR6)

깡충거미 로돕신, 초승달 깡충거미(Hasarious adansoni)의 Kumpopsin 1

구축: HPE 부위의 상류에서 2개의 아미노산에서 mGluR6의 CT와 융합된 JSR1의 팔미토일화 부위의 스플라이싱 부위 x.

cDNA 서열 -- 서열번호 39

펩티드 서열 -- 서열번호 40

범례:

밑줄 = GRM6

밑줄 및 굵은 활자체 = 선택적 골지 방출 신호

굵은 활자체 = 선택적 1D4 에피토프

참고문헌

■ Ablonczy Z., Kono M., Knapp D. Crouch R., “Palmytolation of cone opsins” Vision Research 46 (2006) 4493-4501. doi: 10.1016/j.visres.2006.08.003

■ Ahn KH, Nishiyama A, Mierke DF, Kendall DA, “Hydrophobic residues in helix 8 of cannabinoid receptor 1 are critical for structural and functional properties.” Biochemistry (2010) 49: 502-11

■ Bailes, H. and R. Lucas, “Human melanopsin forms a pigment maximally sensitive to blue light (λmax

479 nm) supporting activation of G(q/11) and G(i/o) signalling cascades. Proc Biol Sci, 2013. 280: p. 20122987. doi: 10.1098/rspb.2012.2987

■ Bruno A, Costantino G, De Fabritiis G, Pastor M, Selent J, “Membrane-Sensitive Conformational States of Helix 8 in Metabotropic Glu2 Receptor, a Class C GPCR”. PLoS ONE, vol. 7, Issue 8, August 2012. (https://doi.org/10.1371/journal.pone.0042023)

■ Cronin T., Vandenberghe L., Hantz P., Juttner J., Reimann A., Kacsσ

., Huckfeldt R., Busskamp V., Kohler H., Lagali P., Botond R.& Bennett J. “Efficient transduction and optogenetic stimulation of retinal bipolar cells by a synthetic adeno-assoc iated virus capsid and promoter” EMBO Mol Med, 2014, 6(9): p. 1175-1190;

■ Cehajic-Kapetanovic J., Eleftheriou C., Allen A.E., Milosavljevic N., Pienaar A., Bedford R., Davis K.E., Bishop P.N., Lucas R.J., “Restoration of Vision with Ectopic Expression of Human Rod Opsin”. Curr Biol. 2015 Aug 17;25(16):2111-22. doi: 10.1016/j.cub.2015.07.029. Epub 2015 Jul 30.

■ Dalkara D, Byrne LC, Klimczak RR, Visel M, Yin L, Merigan WH, Flannery JG, Schaffer DV, “In vivo-directed evolution of a new adeno-associated virus for therapeutic outer retinal gene delivery from the vitreous” Sci Transl Med. 2013 Jun 12;5(189):189ra76. doi: 10.1126/scitranslmed.3005708

■ David A., “Evolution of recombinant adeno-associated viral vectors for application in ocular gene therapy” Dissertation Universitδt Bern, 2018.

■ Davies W, Hankinsa M, Foster R;, “Vertebrate ancient opsin and melanopsin: divergent irradiance detectors”. 2010, Photochem. Photobiol. Sci., 2010, 9, 1444-1457.

■ Fritze O, Slawomir F, Kuksa V, Palczewski K, Hofmann K, Ernst O,, “Role of the conserved NPxxY(x)_5,6F motif in the rhodopsin ground state and during activation”. PNAS, March 4, 2003, vol.100, No.5. (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC151333/)

■ Gross A. K. et al., Defective Membrane Trafficking of Autosomal Dominant Retinitis Pigmentosa Mutant Ter349Glu Rhodopsin IS Rescued by C-Terminal Addition of 1D4 Epitope, iovs, April 2009, Vol. 50, Issue 13

■ https://molbiol-tools.ca/Protein_tertiary_structure.htm, accessed on 27 November 2020, 10:40am

■ https://www.schrodinger.com/prime, accessed on 27 November 2020, 10:45am

■ Hulliger Carlos Elmar et al., Empowering Retianl Gene Therapy with a Specific Promoter of Human Rod and Cone ON-Bipolar Cells, Molecular Therapy: Methods & Clinical Development, Vol. 17, June 2020. pp. 505-519

■ Hulliger Carlos Elmar et al., Empowering Retianl Gene Therapy with a Specific Promoter of Human Rod and Cone ON-Bipolar Cells, Molecular Therapy: Methods & Clinical Development, Vol. 17, June 2020. pp. 505-519 - Supplemental Information

■ Hsu P., Lander E.S., Zhang F., “Development and Applications of CRISPR-Cas9 for Genome Engineering”, Cell 157(6):1262-1278 (2014)

■ Kim D, Matsuda T and Cepko C. “A Core Paired-Type and POU Homeodomain-Containing Transcription Factor Program Drives Retinal Bipolar Cell Gene Expression”, J Neurosci 2008, 28: p. 7748-7764;

■ Kleinlogel S, “Optogenetic user’s guide to Opto-GPCRs”. Frontiers in Bioscience, Landmark, 21, 794-805, January 1, 2016.

■ Kuhlman, B., Bradley, P., “Advances in protein structure prediction and design”. Nat Rev Mol Cell Biol 20, 681-697 (2019)

■ Lagali P.S., Balya D., Awatramani G.B., M

nch T.A., Kim D.S., Busskamp V., Cepko C.L., Roska B, “Light-activated channels targeted to ON bipolar cells restore visual function in retinal degeneration”. Nat Neurosci. 2008 Jun;11(6):667-75. doi: 10.1038/nn.2117. Epub 2008 Apr 27.

■ Lin K., Simossis V.A., Taylor W.R., Heringa J., “A simple and fast secondary structure prediction method using hidden neural networks”, Bioinformatics 21(2):152-159 (2005)

■ Lodowski et al., Signals Governing the Trafficking and Mistrafficking of a Ciliary GPCR, Rhodopsin, The Journal of Neuroscience, August 21, 2013, - 33(34):13621-13638.13621

■ Long C., Li H., Tiburcy M., Rodriguez-Caycedo C., Kyrychenko V., Zhou H., Zhang Y., Min Y., Shelton J.M., Mammen P.A., Liaw N.Y., Zimmermann W.H., Bassel-Duby R., Schneider J.W. and Olson E.N., “Correction of diverse muscular dystrophy mutations in human engineered heart muscle by single-site genome editing”, Science Advances 4(1) (2018) eaap9004, DOI: 10.1126/sciadv.aap9004

■ Lu Q, Ganjawala T, Ivanova E, Cheng J, Troilo D and Pan Z, “AAV-mediated transduction and targeting of retinal bipolar cells with improved mGluR6 promoters in rodents and primates”, Gene Ther, 2016, 23: p. 680-9.

■ Moreira I S, “Structural features of the G-protein/GPCR interactions”. Biochimica et Bioohysica Acta Vol. 1840_1, p. 16-33, January 2014 (https://doi.org/10.1016/j.bbagen.2013.08.027)

■ Morri M, Sanchez-Romero I, Tichy AM, Kainrath S, Gerrard EJ, Hirschfeld PP, Schwarz J, Janovjak H “Optical functionalization of human Class A orphan G-protein-coupled receptors.” Nat Commun 9: 1950 (2018),

doi:10.1038/s41467-018-04342-1 (2018).

■ Mure L, Hatori M, Zhu Q, Demas J, Kim I, Nayak S, Panda S, “Melanopsin-Encoded Response Properties of Intrinsically Photosensitive Retinal Ganglion Cells”. 2016, Neuron 90, 1016-1027, June 1, 2016; https://doi.org/10.1016/j.neuron.2016.04.016)

■ Nygaard R et al. “The Dynamic Process of β-Adrenergic Receptor activation”. Cell 152, 532-542, Jan 31, 2013. (https://doi.org/10.1016/j.bbagen.2013.08.027)

■ O'Brien, J.A., Lummis, S.C., “Nano-biolistics: a method of biolistic transfection of cells and tissues using a gene gun with novel nanometer-sized projectiles”, BMC Biotechnol 11, 66 (2011). https://doi.org/10.1186/1472-6750-11-66

■ Ovchinnikov Yu A, Abdulaev NG, Bogachuk AS, “Two adjacent cysteine residues in the C-terminal cytoplasmic fragment of bovine rhodopsinhttps”, //doi.org/10.1016/j.bbagen.2013.08.027 are palmitilated. Federation of European Biochemical Societies Letters 1988; 230:1-5. [PubMed: 3350146]

■ Prusky G.T., Alam N.M., Beekman, S., Douglas R.M., “Rapid Quantification of Adult and Developing Mouse Spatial Vision Using a Virtual Optomotor System”, 45:4611-4616, Dec. 2004

■ Santello M., Nevian T., “Dysfunction of Cortical Dendritic Integration in Neuropathic Pain Reversed by Serotoninergic Neuromodulation”, Neuron 86(1):233-246, March 26, 2015

■ Sato T., “Conserved 2nd Residue of Helix 8 of GPCR May Confer the Subclass-Characteristic and Distinct Roles through a Rapid Initial Interaction with Specific G Proteins”, Int. J. Mol. Sci. 2019, 20, 1752; doi:10.3390/ijms20071752.

■ Schiφth, H.B, Fredriksson R, “The GRAFS classification system of G-protein coupled receptors in comparative perspective”. General and Comparative Endocrinology 142, Feb. 15, 2005, 94-101. Doi: 10.1016/j.ygcen.2004.12.018.

■ Schwartz T, Frimurer T, Holst B, Rosenkilde M and Elling C, “Molecular mechanism of 7TM receptor activation - a global toggle switch model”. Annu Rev Pharmacol Toxicol 46, 481-519 (2006- DOI: 10.1146/annurev.pharmtox.46.120604.141218.

■ Siuda E, Copits B, Schmidt M, Baird M, Al-Hasani R, Planer W, Funderburk S, McCall J, Gereau IV R, Bruchas M, “Spatiotemporal control of opioid signaling and behavior”. Neuron. 2015 May 20; 86(4): 923-935. doi:10.1016/j.neuron.2015.03.066

■ Somasundaram P, Wyrick GR, Fernandez DC, Ghahari A, Pinhal CM, Richardson MS, Rupp AC, Cui L, Wu Z, Brown RL, Badea TC, Hattar S, and Robinson PR., “C-terminal phosphorylation regulates the kinetics of a subset of melanopsin-mediated behaviors in mice”. Proc Natl Acad Sci U S A. 2017 Mar 7; 114(10): 2741-2746.

■ Sriram K and Insel P A, “G Protein-Coupled Receptors as Targets for Approved Drugs: How Many Targets and How Many Drugs?”. Mol Pharmacol 93:251-258, April 2018. https://doi.org/10.1124/mol.117.111062

■ Tsai C-J, Pamula F, Nehmι R, M

hle J, Weinert T, Flock T, Nogly P, Edwards P, Carpenter B, Gruhl T, Ma P, Deupi X, Standfuss J,Tate C and Schertler G, “Crystal structure of rhodopsin in complex with a mini-Go sheds light on the principles of G protein selectivity”, Sci. Adv. 2018; 4 : eaat 7052 19 September 2018

■ Tsai CJ, Marino J, Adaixo R, Pamula F, Muehle J, Maeda S, Flock T, Taylor NM, Mohammed I, Matile H, Dawson RJ, Deupi X, Stahlberg H, Schertler G, “Cryo-EM structure of the rhodopsin-Gαi-βγ complex reveals binding of the rhodopsin C-terminal tail to the Gβ subunit”. Elife 2019 Jun 28;8: e46041. Doi: 10.7554/eLife.46041

■ Vandemoortele, G., De Sutter, D. and Eyckerman, S., “Robust Generation of Knock-in Cell Lines Using CRISPR-Cas9 and rAAV-assisted Repair Template Delivery”. Bio-protocol 7(7): e2211 (2017). DOI: 10.21769/BioProtoc.2211.

■ van Wyk M., Pielecka-Fortuna J., Lφwel S., Kleinlogel S., “Restoring the ON Switch in Blind Retinas: Chimeric opsin mGluR6 proteins, a Next-Generation, Cell-Tailored Optogenetic Tool”. PLoS Biol. 2015 May 7;13(5):e1002143. doi: 10.1371/journal.pbio.1002143. eCollection 2015 May.

■ Zhu X, Brown B, Li A, Mears AJ, Swaroop A, Craft CM, “GRK1-dependent phosphorylation of S and M opsins and their binding to cone arrestin during cone phototransduction in the mouse retina.” J Neurosci. 2003 Jul 9, 23(14):6152-60.

현재 본 발명의 바람직한 실시형태가 위에 도시되고 설명되었지만, 본 발명이 이에 한정되지 않으나, 다르게는 다음의 청구범위의 범위 내에서 다양하게 구현되고 실시될 수 있음이 명백히 이해되어야 한다.

SEQUENCE LISTING <110> University of Bern <120> Chimeric Opsin GPCR Proteins <130> P180999CH00 <160> 86 <170> BiSSAP 1.3.6 <210> 1 <211> 1377 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6 cDNA <400> 1 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300 cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360 actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420 ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480 acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540 ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600 agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660 tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720 tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780 atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840 cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900 ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960 tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020 atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080 cacctgcctt gccttggggt gcttctcggt gtatcaggcc agcgcagcca cccctccctc 1140 agctaccgct ctacccaccg ctccacattg agcagccagt cctcagacct ccatccagag 1200 cagaacgtgc agaagcggaa gcgcagcctc aagaagacct ccacgatggc ggccccgccc 1260 aagagcgaga actcagagga cgccaagaag agcaggatca ccagcgaggg cgagtacatc 1320 cccctggacc agatcgacat caacgtgaca gagaccagcc aagtggcgcc tgcctaa 1377 <210> 2 <211> 458 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6 protein <220> <221> LIPID <222> 364 <223> PALMITATE <400> 2 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg 85 90 95 Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala 100 105 110 Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala 115 120 125 Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe 130 135 140 Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu 145 150 155 160 Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala 165 170 175 Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly 180 185 190 Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp 195 200 205 Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr 210 215 220 Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys 225 230 235 240 Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe 245 250 255 Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys Glu Gly Cys Gly 260 265 270 Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser Glu 275 280 285 Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu 290 295 300 Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly Tyr 305 310 315 320 Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile Ala 325 330 335 Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His Pro 340 345 350 Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly Val Leu 355 360 365 Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr Arg Ser 370 375 380 Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His Pro Glu 385 390 395 400 Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met 405 410 415 Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser Arg 420 425 430 Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn 435 440 445 Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 <210> 3 <211> 1284 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 cDNA <400> 3 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300 cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360 actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420 ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480 acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540 ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600 agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660 tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720 tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780 atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840 cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900 ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960 tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020 atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080 cacctgcctt gcctgttcca tccagagcag aacgtgcaga agcggaagcg cagcctcaag 1140 aagacctcca cgatggcggc cccgcccaag agcgagaact cagaggacgc caagaagagc 1200 aggatcacca gcgagggcga gtacatcccc ctggaccaga tcgacatcaa cgtgacagag 1260 accagccaag tggcgcctgc ctaa 1284 <210> 4 <211> 427 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 protein <220> <221> LIPID <222> 364 <223> PALMITATE <400> 4 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg 85 90 95 Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala 100 105 110 Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala 115 120 125 Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe 130 135 140 Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu 145 150 155 160 Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala 165 170 175 Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly 180 185 190 Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp 195 200 205 Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr 210 215 220 Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys 225 230 235 240 Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe 245 250 255 Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys Glu Gly Cys Gly 260 265 270 Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser Glu 275 280 285 Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu 290 295 300 Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly Tyr 305 310 315 320 Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile Ala 325 330 335 Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His Pro 340 345 350 Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Phe His Pro 355 360 365 Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr 370 375 380 Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser 385 390 395 400 Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile 405 410 415 Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 420 425 <210> 5 <211> 1389 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33AA) -mGluR6(IL1, CT) cDNA <400> 5 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacacct tcatgcgaca caacgacact 300 cccatagtcc gcgcctctgg ccgtgagctt ttcatcatca acctcgcagt cagcgacttc 360 ctcatgtcag tcactcaggc cccggtcttc tttgccagca gcctctacaa gaagtggctc 420 tttggggaga caggttgcga gttctatgcc ttctgcgggg ctgtctttgg catcacttcc 480 atgatcaccc tgacagccat agccatggac cgctatctgg tgatcacacg tccactggcc 540 accatcggca ggggatccaa aagacgaacg gcactcgtcc tgctaggcgt ctggctttat 600 gccctggcct ggagtctgcc acctttcttt ggttggagtg cctacgtgcc cgaggggctg 660 ctgacatcct gctcctggga ctacatgacc ttcacacccc aggtgcgtgc ctacaccatg 720 ctgctcttct gctttgtctt cttcctcccc ctgctcatca tcatcttctg ctacatcttc 780 atcttcaggg ccatccgaga gacaggccgg gcctgtgagg gctgcggtga gtcccctctg 840 cggcagaggc ggcagtggca gcggctgcag agtgagtgga agatggccaa ggtcgcactg 900 attgtcattc ttctcttcgt gctgtcctgg gctccctact ccactgtggc tctggtggcc 960 tttgctggat actcgcacat cctgacgccc tacatgagct cggtgccagc cgtcatcgcc 1020 aaggcttctg ccatccacaa tcccattatc tacgccatca ctcaccccaa gtacagggtg 1080 gccattgccc agcacctgcc ttgccttggg gtgcttctcg gtgtatcagg ccagcgcagc 1140 cacccctccc tcagctaccg ctctacccac cgctccacat tgagcagcca gtcctcagac 1200 ctccatccag agcagaacgt gcagaagcgg aagcgcagcc tcaagaagac ctccacgatg 1260 gcggccccgc ccaagagcga gaactcagag gacgccaaga agagcaggat caccagcgag 1320 ggcgagtaca tccccctgga ccagatcgac atcaacgtga cagagaccag ccaagtggcg 1380 cctgcctaa 1389 <210> 6 <211> 462 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33AA) -mGluR6(IL1, CT) protein <220> <221> LIPID <222> 368 <223> PALMITATE <400> 6 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg 85 90 95 His Asn Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile 100 105 110 Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro 115 120 125 Val Phe Phe Ala Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr 130 135 140 Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser 145 150 155 160 Met Ile Thr Leu Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr 165 170 175 Arg Pro Leu Ala Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu 180 185 190 Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro 195 200 205 Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys 210 215 220 Ser Trp Asp Tyr Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met 225 230 235 240 Leu Leu Phe Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe 245 250 255 Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys 260 265 270 Glu Gly Cys Gly Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg 275 280 285 Leu Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu 290 295 300 Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala 305 310 315 320 Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro 325 330 335 Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala 340 345 350 Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys 355 360 365 Leu Gly Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu 370 375 380 Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp 385 390 395 400 Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys 405 410 415 Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala 420 425 430 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 435 440 445 Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 460 <210> 7 <211> 1284 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6(IL1, CT) cDNA <400> 7 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300 cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360 actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420 ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480 acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540 ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600 agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660 tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720 tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780 atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840 cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900 ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960 tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020 atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080 cacctgcctt gcctgttcca tccagagcag aacgtgcaga agcggaagcg cagcctcaag 1140 aagacctcca cgatggcggc cccgcccaag agcgagaact cagaggacgc caagaagagc 1200 aggatcacca gcgagggcga gtacatcccc ctggaccaga tcgacatcaa cgtgacagag 1260 accagccaag tggcgcctgc ctaa 1284 <210> 8 <211> 431 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6(IL1, CT) protein <220> <221> LIPID <222> 368 <223> PALMITATE <400> 8 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg 85 90 95 His Asn Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile 100 105 110 Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro 115 120 125 Val Phe Phe Ala Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr 130 135 140 Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser 145 150 155 160 Met Ile Thr Leu Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr 165 170 175 Arg Pro Leu Ala Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu 180 185 190 Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro 195 200 205 Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys 210 215 220 Ser Trp Asp Tyr Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met 225 230 235 240 Leu Leu Phe Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe 245 250 255 Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys 260 265 270 Glu Gly Cys Gly Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg 275 280 285 Leu Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu 290 295 300 Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala 305 310 315 320 Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro 325 330 335 Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala 340 345 350 Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys 355 360 365 Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys 370 375 380 Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp 385 390 395 400 Ala Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp 405 410 415 Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 420 425 430 <210> 9 <211> 1380 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6(IL3, CT) cDNA <400> 9 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300 cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360 actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420 ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480 acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540 ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600 agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660 tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720 tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780 atccgagaga caggccgggg tgtgccagag accttcaatg aagcccctct gcggcagagg 840 cggcagtggc agcggctgca gagtgagtgg aagatggcca aggtcgcact gattgtcatt 900 cttctcttcg tgctgtcctg ggctccctac tccactgtgg ctctggtggc ctttgctgga 960 tactcgcaca tcctgacgcc ctacatgagc tcggtgccag ccgtcatcgc caaggcttct 1020 gccatccaca atcccattat ctacgccatc actcacccca agtacagggt ggccattgcc 1080 cagcacctgc cttgccttgg ggtgcttctc ggtgtatcag gccagcgcag ccacccctcc 1140 ctcagctacc gctctaccca ccgctccaca ttgagcagcc agtcctcaga cctccatcca 1200 gagcagaacg tgcagaagcg gaagcgcagc ctcaagaaga cctccacgat ggcggccccg 1260 cccaagagcg agaactcaga ggacgccaag aagagcagga tcaccagcga gggcgagtac 1320 atccccctgg accagatcga catcaacgtg acagagacca gccaagtggc gcctgcctaa 1380 <210> 10 <211> 459 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6(IL3, CT) protein <220> <221> LIPID <222> 365 <223> PALMITATE <400> 10 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg 85 90 95 Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala 100 105 110 Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala 115 120 125 Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe 130 135 140 Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu 145 150 155 160 Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala 165 170 175 Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly 180 185 190 Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp 195 200 205 Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr 210 215 220 Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys 225 230 235 240 Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe 245 250 255 Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu Thr Phe 260 265 270 Asn Glu Ala Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser 275 280 285 Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val 290 295 300 Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly 305 310 315 320 Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile 325 330 335 Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His 340 345 350 Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly Val 355 360 365 Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr Arg 370 375 380 Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His Pro 385 390 395 400 Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr 405 410 415 Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser 420 425 430 Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile 435 440 445 Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 <210> 11 <211> 1164 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) cDNA <400> 11 atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60 accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120 cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180 acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240 ctcacaggga tgctgggcaa tctgacggtc atctacgcca ccatgagatt caagaagctg 300 cgccatccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360 actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420 ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480 acagccatag ccatggaccg ctatctggtg atctgcaagc cctttggcaa tgtgagattt 540 gatgctaagc tgacggcact cgtcctgcta ggcgtctggc tttatgccct ggcctggagt 600 ctgccacctt tctttggttg gagtgcctac gtgcccgagg ggctgctgac atcctgctcc 660 tgggactaca tgaccttcac accccaggtg cgtgcctaca ccatgctgct cttctgcttt 720 gtcttcttcc tccccctgct catcatcatc ttctgctaca tccaagtgtg gctggccatc 780 cgagcagtgg caaagcaaca gaaagaatct gagtccactc agaaggccga gaaggaggtg 840 acaaaggtcg cactgattgt cattcttctc ttcgtgctgt cctgggctcc ctactccact 900 gtggctctgg tggcctttgc tggatactcg cacatcctga cgccctacat gagctcggtg 960 ccagccgtca tcgccaaggc ttctgccatc cacaatccca ttatctacgc catcactcac 1020 cccaagtaca gggtggccat tgcccagcac ctgccttgca actgcatctt acatctcttt 1080 ggaaagaagg ttgatgatag ctctgaactt tccagcacct ccaagacaga agtctcatct 1140 gtctcttcag tgtcacctgc ataa 1164 <210> 12 <211> 387 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) protein <220> <221> LIPID <222> 353 <223> PALMITATE <400> 12 Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp 1 5 10 15 Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr 20 25 30 Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr 35 40 45 Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val 50 55 60 Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly 65 70 75 80 Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Ala Thr Met Arg 85 90 95 Phe Lys Lys Leu Arg His Pro Ala Asn Met Phe Ile Ile Asn Leu Ala 100 105 110 Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala 115 120 125 Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe 130 135 140 Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu 145 150 155 160 Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Cys Lys Pro Phe Gly 165 170 175 Asn Val Arg Phe Asp Ala Lys Leu Thr Ala Leu Val Leu Leu Gly Val 180 185 190 Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp Ser 195 200 205 Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr Met 210 215 220 Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys Phe 225 230 235 240 Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Gln Val 245 250 255 Trp Leu Ala Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser Glu Ser 260 265 270 Thr Gln Lys Ala Glu Lys Glu Val Thr Lys Val Ala Leu Ile Val Ile 275 280 285 Leu Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val 290 295 300 Ala Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val 305 310 315 320 Pro Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr 325 330 335 Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro 340 345 350 Cys Asn Cys Ile Leu His Leu Phe Gly Lys Lys Val Asp Asp Ser Ser 355 360 365 Glu Leu Ser Ser Thr Ser Lys Thr Glu Val Ser Ser Val Ser Ser Val 370 375 380 Ser Pro Ala 385 <210> 13 <211> 1092 <212> DNA <213> Artificial Sequence <220> <223> OPN1MW(palm)-mGluR6 cDNA <400> 13 atggcccaaa ggcttacagg tgaacagaca ctggaccact atgaggatag cacccatgca 60 agcatcttca cctataccaa cagcaacagc accaaaggtc cctttgaagg ccccaattat 120 cacattgctc ccaggtgggt gtaccacctc accagcacct ggatgattct tgtggtcgtt 180 gcatctgtct tcactaatgg acttgtgctg gcagccacca tgagattcaa gaagctgcgc 240 catccactga actggattct ggtgaacttg gcagttgctg acctagcaga gaccattatt 300 gccagcacta tcagtgttgt gaaccaaatc tatggctact tcgttctggg acaccctctg 360 tgtgtcattg aaggctacat tgtctcattg tgtggaatca caggcctctg gtccctggcc 420 atcatttcct gggagagatg gctggtggtc tgcaagccct ttggcaatgt gagatttgat 480 gctaagctgg ccactgtggg aatcgtcttc tcctgggtct gggctgctat atggacggcc 540 ccaccaatct ttggttggag caggtactgg ccttatggcc tgaagacatc ctgtggccca 600 gacgtgttca gcggtacctc gtaccccggg gttcagtctt atatgatggt cctcatggtc 660 acgtgctgca tcttcccact cagcatcatc gtgctctgct acctccaagt gtggctggcc 720 atccgagcag tggcaaagca acagaaagaa tctgagtcca ctcagaaggc cgagaaggag 780 gtgacacgca tggtggtggt gatggtcttc gcatactgcc tctgctgggg accctatact 840 ttctttgcat gctttgctac tgcccaccct ggctatgcct tccaccctct tgtggcctcc 900 ctaccatcct actttgccaa aagtgccact atctacaacc ccattatcta tgtctttatg 960 aaccggcagt ttcgaaactg catcttacat ctctttcatc cagagcagaa cgtgcagaag 1020 cggaagcgca gcctcaagaa gacctccacg atggcggccc cgcccaagag cgagaactca 1080 gaggacgcca ag 1092 <210> 14 <211> 393 <212> PRT <213> Artificial Sequence <220> <223> OPN1MW(palm)-mGluR6 protein <400> 14 Met Ala Gln Arg Leu Thr Gly Glu Gln Thr Leu Asp His Tyr Glu Asp 1 5 10 15 Ser Thr His Ala Ser Ile Phe Thr Tyr Thr Asn Ser Asn Ser Thr Lys 20 25 30 Gly Pro Phe Glu Gly Pro Asn Tyr His Ile Ala Pro Arg Trp Val Tyr 35 40 45 His Leu Thr Ser Thr Trp Met Ile Leu Val Val Val Ala Ser Val Phe 50 55 60 Thr Asn Gly Leu Val Leu Ala Ala Thr Met Arg Phe Lys Lys Leu Arg 65 70 75 80 His Pro Leu Asn Trp Ile Leu Val Asn Leu Ala Val Ala Asp Leu Ala 85 90 95 Glu Thr Ile Ile Ala Ser Thr Ile Ser Val Val Asn Gln Ile Tyr Gly 100 105 110 Tyr Phe Val Leu Gly His Pro Leu Cys Val Ile Glu Gly Tyr Ile Val 115 120 125 Ser Leu Cys Gly Ile Thr Gly Leu Trp Ser Leu Ala Ile Ile Ser Trp 130 135 140 Glu Arg Trp Leu Val Val Cys Lys Pro Phe Gly Asn Val Arg Phe Asp 145 150 155 160 Ala Lys Leu Ala Thr Val Gly Ile Val Phe Ser Trp Val Trp Ala Ala 165 170 175 Ile Trp Thr Ala Pro Pro Ile Phe Gly Trp Ser Arg Tyr Trp Pro Tyr 180 185 190 Gly Leu Lys Thr Ser Cys Gly Pro Asp Val Phe Ser Gly Thr Ser Tyr 195 200 205 Pro Gly Val Gln Ser Tyr Met Met Val Leu Met Val Thr Cys Cys Ile 210 215 220 Phe Pro Leu Ser Ile Ile Val Leu Cys Tyr Leu Gln Val Trp Leu Ala 225 230 235 240 Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser Glu Ser Thr Gln Lys 245 250 255 Ala Glu Lys Glu Val Thr Arg Met Val Val Val Met Val Phe Ala Tyr 260 265 270 Cys Leu Cys Trp Gly Pro Tyr Thr Phe Phe Ala Cys Phe Ala Thr Ala 275 280 285 His Pro Gly Tyr Ala Phe His Pro Leu Val Ala Ser Leu Pro Ser Tyr 290 295 300 Phe Ala Lys Ser Ala Thr Ile Tyr Asn Pro Ile Ile Tyr Val Phe Met 305 310 315 320 Asn Arg Gln Phe Arg Asn Cys Ile Leu His Leu Phe His Pro Glu Gln 325 330 335 Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala 340 345 350 Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser Arg Ile 355 360 365 Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val 370 375 380 Thr Glu Thr Ser Gln Val Ala Pro Ala 385 390 <210> 15 <211> 1386 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6 cDNA <400> 15 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgggggtg ctgctgggtg tatcacgccg gcacagtcgc 1140 ccctacccca gctaccgctc cacccaccgc tccacgctga ccagccacac ctccaacctc 1200 catccagagc agaatgtgca gaagcgaaag cggagcctca aggccacctc cacggtggca 1260 gccccaccca agggcgagga tgcagaggcc cacaagaaga gcaggatcac cagcgagggc 1320 gagtacatcc ccctggacca gatcgacatc aacgtgacag agaccagcca agtggcgcct 1380 gcctaa 1386 <210> 16 <211> 461 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33AA)-mGluR6 protein <220> <221> LIPID <222> 367 <223> PALMITATE <400> 16 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro Ser 370 375 380 Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn Leu 385 390 395 400 His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala Thr 405 410 415 Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His Lys 420 425 430 Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile 435 440 445 Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 460 <210> 17 <211> 1293 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi export signal and a 1D4 tag cDNA <400> 17 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260 gtgacagaga ccagccaagt ggcgcctgcc taa 1293 <210> 18 <211> 430 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi export signal and a 1D4 tag protein <220> <221> LIPID <222> 367 <223> PALMITATE <400> 18 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 405 410 415 Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 420 425 430 <210> 19 <211> 1293 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 P isoform of h melanopsin comprising a Golgi export signal and a 1D4 tag cDNA <400> 19 atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260 gtgacagaga ccagccaagt ggcgcctgcc taa 1293 <210> 20 <211> 430 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 P isoform of h melanopsin comprising a Golgi export signal and a 1D4 tag cDNAprotein <220> <221> LIPID <222> 367 <223> PALMITATE <400> 20 Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 405 410 415 Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 420 425 430 <210> 21 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi export signal cDNA <400> 21 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260 gtgtaa 1266 <210> 22 <211> 421 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi export signal protein <400> 22 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 405 410 415 Ile Asp Ile Asn Val 420 <210> 23 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGlur6 P isoform of h melanopsin comprising a Golgi export signal cDNA <400> 23 atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260 gtgtaa 1266 <210> 24 <211> 421 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGlur6 P isoform of h melanopsin comprising a Golgi export signal protein <400> 24 Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 405 410 415 Ile Asp Ile Asn Val 420 <210> 25 <211> 1206 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin without optional C-terminally added sequences cDNA <400> 25 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagtaa 1206 <210> 26 <211> 401 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 L isoform of h melanopsin without optional C-terminally added sequences protein <400> 26 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys <210> 27 <211> 1206 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 P isoform of h melanopsin without optional C-terminally added sequences cDNA <400> 27 atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840 tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900 gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960 gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020 gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080 attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140 agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200 aagtaa 1206 <210> 28 <211> 401 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm)-mGluR6 P isoform of h melanopsin without optional C-terminally added sequences protein <400> 28 Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe 260 265 270 Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu 275 280 285 Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu 290 295 300 Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe 305 310 315 320 Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala 325 330 335 Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile 340 345 350 Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu 355 360 365 Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 370 375 380 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 385 390 395 400 Lys <210> 29 <211> 1395 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33A)+mGluR6 (IL1, CT) cDNA <400> 29 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttccggta caacaacacg 300 cccatcgtcc gggcctcggg ccgagagctc ttcattatca acctcgcggt cagcgacttc 360 ctcatgtcct tcacccaggc ccctgtcttc ttcaccagta gcctctataa gcagtggctc 420 tttggggaga caggctgcga gttctatgcc ttctgtggag ctctctttgg catttcctcc 480 atgatcaccc tgacggccat cgccctggac cgctacctgg taatcacacg cccgctggcc 540 acctttggtg tggcgtccaa gaggcgtgcg gcatttgtcc tgctgggcgt ttggctctat 600 gccctggcct ggagtctgcc acccttcttc ggctggagcg cctacgtgcc cgaggggttg 660 ctgacatcct gctcctggga ctacatgagc ttcacgccgg ccgtgcgtgc ctacaccatg 720 cttctctgct gcttcgtgtt cttcctccct ctgcttatca tcatctactg ctacatcttc 780 atcttcaggg ccatccggga gacaggacgg gctctccaga ccttcggggc ctgcaagggc 840 aatggcgagt ccctgtggca gcggcagcgg ctgcagagcg agtgcaagat ggccaagatc 900 atgctgctgg tcatcctcct cttcgtgctc tcctgggctc cctattccgc tgtggccctg 960 gtggcctttg ctgggtacgc acacgtcctg acaccctaca tgagctcggt gccagccgtc 1020 atcgccaagg cctctgcaat ccacaacccc atcatttacg ccatcaccca ccccaagtac 1080 agggtggcca ttgcccagca cctgccctgc ctgggggtgc tgctgggtgt atcacgccgg 1140 cacagtcgcc cctaccccag ctaccgctcc acccaccgct ccacgctgac cagccacacc 1200 tccaacctcc atccagagca gaatgtgcag aagcgaaagc ggagcctcaa ggccacctcc 1260 acggtggcag ccccacccaa gggcgaggat gcagaggccc acaagaagag caggatcacc 1320 agcgagggcg agtacatccc cctggaccag atcgacatca acgtgacaga gaccagccaa 1380 gtggcgcctg cctaa 1395 <210> 30 <211> 464 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33A)+mGluR6 (IL1, CT) protein <220> <221> LIPID <222> 370 <223> PALMITATE <400> 30 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Arg 85 90 95 Tyr Asn Asn Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile 100 105 110 Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro 115 120 125 Val Phe Phe Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr 130 135 140 Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser 145 150 155 160 Met Ile Thr Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr 165 170 175 Arg Pro Leu Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe 180 185 190 Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro 195 200 205 Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys 210 215 220 Ser Trp Asp Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met 225 230 235 240 Leu Leu Cys Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr 245 250 255 Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu 260 265 270 Gln Thr Phe Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg 275 280 285 Gln Arg Leu Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val 290 295 300 Ile Leu Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu 305 310 315 320 Val Ala Phe Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser 325 330 335 Val Pro Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile 340 345 350 Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu 355 360 365 Pro Cys Leu Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro 370 375 380 Tyr Pro Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr 385 390 395 400 Ser Asn Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu 405 410 415 Lys Ala Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu 420 425 430 Ala His Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu 435 440 445 Asp Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 460 <210> 31 <211> 1389 <212> DNA <213> Artificial Sequence <220> <223> Mela(palm+33A)+mGluR6 (IL3, CT) cDNA <400> 31 atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60 gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120 cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180 cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240 ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300 ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360 ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420 acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480 ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540 gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600 tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660 tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720 tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780 gccatccggg agacaggacg gggcgtgccc gagaccttca acgaggccaa gggcaatggc 840 gagtccctgt ggcagcggca gcggctgcag agcgagtgca agatggccaa gatcatgctg 900 ctggtcatcc tcctcttcgt gctctcctgg gctccctatt ccgctgtggc cctggtggcc 960 tttgctgggt acgcacacgt cctgacaccc tacatgagct cggtgccagc cgtcatcgcc 1020 aaggcctctg caatccacaa ccccatcatt tacgccatca cccaccccaa gtacagggtg 1080 gccattgccc agcacctgcc ctgcctgggg gtgctgctgg gtgtatcacg ccggcacagt 1140 cgcccctacc ccagctaccg ctccacccac cgctccacgc tgaccagcca cacctccaac 1200 ctccatccag agcagaatgt gcagaagcga aagcggagcc tcaaggccac ctccacggtg 1260 gcagccccac ccaagggcga ggatgcagag gcccacaaga agagcaggat caccagcgag 1320 ggcgagtaca tccccctgga ccagatcgac atcaacgtga cagagaccag ccaagtggcg 1380 cctgcctaa 1389 <210> 32 <211> 462 <212> PRT <213> Artificial Sequence <220> <223> Mela(palm+33A)+mGluR6 (IL3, CT) protein <220> <221> LIPID <222> 368 <223> PALMITATE <400> 32 Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu 1 5 10 15 Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser 20 25 30 Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr 35 40 45 Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp 50 55 60 Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val 65 70 75 80 Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys 85 90 95 Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu 100 105 110 Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe 115 120 125 Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu 130 135 140 Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr 145 150 155 160 Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu 165 170 175 Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu 180 185 190 Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly 195 200 205 Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp 210 215 220 Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys 225 230 235 240 Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile 245 250 255 Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu Thr 260 265 270 Phe Asn Glu Ala Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg 275 280 285 Leu Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu 290 295 300 Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala 305 310 315 320 Phe Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro 325 330 335 Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala 340 345 350 Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys 355 360 365 Leu Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro 370 375 380 Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn 385 390 395 400 Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala 405 410 415 Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His 420 425 430 Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln 435 440 445 Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 460 <210> 33 <211> 1095 <212> DNA <213> Artificial Sequence <220> <223> JellyOP(palm)-mGluR6 cDNA <400> 33 atgggagcga atataacaga aatattgtca ggctttttag cttgtgtagt atttctctct 60 ataagcttga atatgatagt tctaattaca ttttaccgct tacgacataa attggctttt 120 aaagatgctc tcatggctag tatggcgttc agtgatgttg tacaagctat cgtaggatat 180 cctttagagg tattcactgt agtagacgga aaatggacat tcggaatgga attatgtcaa 240 gttgcaggat ttttcattac tgcccttggt caagtttcca tcgctcatct cactgctctc 300 gccttagatc gatacttcac agtgtgcaga cctttcgtgg caactgcgat tcacggatca 360 atgagaaatg caggtatggt catatttgtt tgctggttct acgcgtcctt ctgggcagtc 420 ctacccttag ttggatggtc aaattatgac gtggagggtg acggtatgcg atgctccatc 480 aactgggcag acgacagtcc taaaagctac tcatacaggg tttgtttatt cgtattcatc 540 tacctgattc ctgttctttt gatggtggct acttacgtgt tggttcaagg agagatgaag 600 aatatgcgag gtcgtgcagc acagttgttt ggttcagaat ccgaggctgc actaaagaat 660 atcaaggccg aaaagcgaca cacaaggctg gttttcgtca tgatcctttc tttcatcgta 720 gcttggaccc catatacctt cgtcgccatg tgggtttcct ttttcacgaa acaacttggg 780 ccaatacctt tatacgttga tactttggca gctatgcttg caaagtcgtc ggctatgttc 840 aaccccatca tttactgctt cctccacaag caattcagaa gagctgtatt acgtggtgtt 900 tgtctgttcc atccagagca gaacgtgcag aagcggaagc gcagcctcaa gaagacctcc 960 acgatggcgg ccccgcccaa gagcgagaac tcagaggacg ccaagacaga gaccagccaa 1020 gtggcgcctg ccaagagcag gatcaccagc gagggcgagt acatccccct ggaccagatc 1080 gacatcaacg tgtaa 1095 <210> 34 <211> 364 <212> PRT <213> Artificial Sequence <220> <223> JellyOP(palm)-mGluR6 protein <220> <221> LIPID <222> 301 <223> PALMITATE <400> 34 Met Gly Ala Asn Ile Thr Glu Ile Leu Ser Gly Phe Leu Ala Cys Val 1 5 10 15 Val Phe Leu Ser Ile Ser Leu Asn Met Ile Val Leu Ile Thr Phe Tyr 20 25 30 Arg Leu Arg His Lys Leu Ala Phe Lys Asp Ala Leu Met Ala Ser Met 35 40 45 Ala Phe Ser Asp Val Val Gln Ala Ile Val Gly Tyr Pro Leu Glu Val 50 55 60 Phe Thr Val Val Asp Gly Lys Trp Thr Phe Gly Met Glu Leu Cys Gln 65 70 75 80 Val Ala Gly Phe Phe Ile Thr Ala Leu Gly Gln Val Ser Ile Ala His 85 90 95 Leu Thr Ala Leu Ala Leu Asp Arg Tyr Phe Thr Val Cys Arg Pro Phe 100 105 110 Val Ala Thr Ala Ile His Gly Ser Met Arg Asn Ala Gly Met Val Ile 115 120 125 Phe Val Cys Trp Phe Tyr Ala Ser Phe Trp Ala Val Leu Pro Leu Val 130 135 140 Gly Trp Ser Asn Tyr Asp Val Glu Gly Asp Gly Met Arg Cys Ser Ile 145 150 155 160 Asn Trp Ala Asp Asp Ser Pro Lys Ser Tyr Ser Tyr Arg Val Cys Leu 165 170 175 Phe Val Phe Ile Tyr Leu Ile Pro Val Leu Leu Met Val Ala Thr Tyr 180 185 190 Val Leu Val Gln Gly Glu Met Lys Asn Met Arg Gly Arg Ala Ala Gln 195 200 205 Leu Phe Gly Ser Glu Ser Glu Ala Ala Leu Lys Asn Ile Lys Ala Glu 210 215 220 Lys Arg His Thr Arg Leu Val Phe Val Met Ile Leu Ser Phe Ile Val 225 230 235 240 Ala Trp Thr Pro Tyr Thr Phe Val Ala Met Trp Val Ser Phe Phe Thr 245 250 255 Lys Gln Leu Gly Pro Ile Pro Leu Tyr Val Asp Thr Leu Ala Ala Met 260 265 270 Leu Ala Lys Ser Ser Ala Met Phe Asn Pro Ile Ile Tyr Cys Phe Leu 275 280 285 His Lys Gln Phe Arg Arg Ala Val Leu Arg Gly Val Cys Leu Phe His 290 295 300 Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser 305 310 315 320 Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys 325 330 335 Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp 340 345 350 Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 355 360 <210> 35 <211> 1128 <212> DNA <213> Artificial Sequence <220> <223> JellyOP(palm)-5HT7 cDNA <400> 35 atgggagcga atataacaga aatattgtca ggctttttag cttgtgtagt atttctctct 60 ataagcttga atatgatagt tctaattaca ttttaccgct tacgacataa attggctttt 120 aaagatgctc tcatggctag tatggcgttc agtgatgttg tacaagctat cgtaggatat 180 cctttagagg tattcactgt agtagacgga aaatggacat tcggaatgga attatgtcaa 240 gttgcaggat ttttcattac tgcccttggt caagtttcca tcgctcatct cactgctctc 300 gccttagatc gatacttcac agtgtgcaga cctttcgtgg caactgcgat tcacggatca 360 atgagaaatg caggtatggt catatttgtt tgctggttct acgcgtcctt ctgggcagtc 420 ctacccttag ttggatggtc aaattatgac gtggagggtg acggtatgcg atgctccatc 480 aactgggcag acgacagtcc taaaagctac tcatacaggg tttgtttatt cgtattcatc 540 tacctgattc ctgttctttt gatggtggct acttacgtgt tggttcaagg agagatgaag 600 aatatgcgag gtcgtgcagc acagttgttt ggttcagaat ccgaggctgc actaaagaat 660 atcaaggccg aaaagcgaca cacaaggctg gttttcgtca tgatcctttc tttcatcgta 720 gcttggaccc catatacctt cgtcgccatg tgggtttcct ttttcacgaa acaacttggg 780 ccaatacctt tatacgttga tactttggca gctatgcttg caaagtcgtc ggctatgttc 840 aaccccatca tttactgctt cctccacaag caattcagaa gagctgtatt acgtggtgtt 900 tgtcagtacc ggaatatcaa ccggaagctc tctgctgcag gcatgcacga agccctgaaa 960 cttgctgaga ggcctgagag aagcgagttt gtgctacaaa actgtgacca ctgtgggaaa 1020 aaaggtcatg atacatgaaa gagcaggatc accagcgagg gcgagtacat ccccctggac 1080 cagatcgaca tcaacgtgac agagaccagc caagtggcgc ctgcctaa 1128 <210> 36 <211> 374 <212> PRT <213> Artificial Sequence <220> <223> JellyOP(palm)-5HT7 protein <220> <221> LIPID <222> 301 <223> PALMITATE <400> 36 Met Gly Ala Asn Ile Thr Glu Ile Leu Ser Gly Phe Leu Ala Cys Val 1 5 10 15 Val Phe Leu Ser Ile Ser Leu Asn Met Ile Val Leu Ile Thr Phe Tyr 20 25 30 Arg Leu Arg His Lys Leu Ala Phe Lys Asp Ala Leu Met Ala Ser Met 35 40 45 Ala Phe Ser Asp Val Val Gln Ala Ile Val Gly Tyr Pro Leu Glu Val 50 55 60 Phe Thr Val Val Asp Gly Lys Trp Thr Phe Gly Met Glu Leu Cys Gln 65 70 75 80 Val Ala Gly Phe Phe Ile Thr Ala Leu Gly Gln Val Ser Ile Ala His 85 90 95 Leu Thr Ala Leu Ala Leu Asp Arg Tyr Phe Thr Val Cys Arg Pro Phe 100 105 110 Val Ala Thr Ala Ile His Gly Ser Met Arg Asn Ala Gly Met Val Ile 115 120 125 Phe Val Cys Trp Phe Tyr Ala Ser Phe Trp Ala Val Leu Pro Leu Val 130 135 140 Gly Trp Ser Asn Tyr Asp Val Glu Gly Asp Gly Met Arg Cys Ser Ile 145 150 155 160 Asn Trp Ala Asp Asp Ser Pro Lys Ser Tyr Ser Tyr Arg Val Cys Leu 165 170 175 Phe Val Phe Ile Tyr Leu Ile Pro Val Leu Leu Met Val Ala Thr Tyr 180 185 190 Val Leu Val Gln Gly Glu Met Lys Asn Met Arg Gly Arg Ala Ala Gln 195 200 205 Leu Phe Gly Ser Glu Ser Glu Ala Ala Leu Lys Asn Ile Lys Ala Glu 210 215 220 Lys Arg His Thr Arg Leu Val Phe Val Met Ile Leu Ser Phe Ile Val 225 230 235 240 Ala Trp Thr Pro Tyr Thr Phe Val Ala Met Trp Val Ser Phe Phe Thr 245 250 255 Lys Gln Leu Gly Pro Ile Pro Leu Tyr Val Asp Thr Leu Ala Ala Met 260 265 270 Leu Ala Lys Ser Ser Ala Met Phe Asn Pro Ile Ile Tyr Cys Phe Leu 275 280 285 His Lys Gln Phe Arg Arg Ala Val Leu Arg Gly Val Cys Gln Tyr Arg 290 295 300 Asn Ile Asn Arg Lys Leu Ser Ala Ala Gly Met His Glu Ala Leu Lys 305 310 315 320 Leu Ala Glu Arg Pro Glu Arg Ser Glu Phe Val Leu Gln Asn Cys Asp 325 330 335 His Cys Gly Lys Lys Gly His Asp Thr Lys Ser Arg Ile Thr Ser Glu 340 345 350 Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val Thr Glu Thr 355 360 365 Ser Gln Val Ala Pro Ala 370 <210> 37 <211> 1118 <212> DNA <213> Artificial Sequence <220> <223> PPO(palm)-mGluR6 cDNA <400> 37 ccatggagaa cttgacctcg ctcgacctcc tgcccaacgg cgaggtcccg ttgatgcccc 60 gctacggctt caccatcctc gccgtgatca tggccgtgtt caccatcgcc tcgctcgtgc 120 tcaacagcac cgtcgtcatc gtcaccctgc gccaccgcca gctacgccac ccgctcaact 180 tctcgctcgt caacctcgcc gtggcggacc tgggcgtcac ggtgttcggc gccagcctcg 240 tcgtggagac caacgccgtc gggtacttca acctcggccg cgtcggctgc gtcatcgaag 300 ggttcgccgt cgctttcttc ggcatcgccg ctctgtgcac gatcgccgtg atcgccgtcg 360 atcgcttcgt ggtggtgtgc aagccgctgg gcacgctgat gttcacgcgg cgccacgcgc 420 tgctgggcat cgcctgggcc tggctctggt cgttcgtgtg gaacacgccg ccgctcttcg 480 gctggggcag ctacgagctg gagggcgtgc ggacgtcgtg cgcgcccgac tggtacagcc 540 gcgaccccgc caacgtgtcg tacattacga gctacttcgc cttctgcttc gccatcccct 600 tcctcgtcat cgtggtggcg tacggccgcc tcatgtggac cctccaccag gtggccaagc 660 tggggatggg cgagagcggc agcaccgcca aggcggaggc gcaggtgtcg cgcatggtgg 720 tggtcatggt ggtggccttc ctcgtctgct ggctgcccta cgcgctcttc gccatgatcg 780 tggtgaccaa gcccgacgtg tacatcgacc cggtcatcgc cacactgccc atgtacctga 840 ccaagacgag cacggtctac aaccccatca tctacatctt catgaaccgc cagttccggg 900 actgcgccgt gcccttcctg ctctgcctgt tccatccaga gcagaacgtg cagaagcgga 960 agcgcagcct caagaagacc tccacgatgg cggccccgcc caagagcgag aactcagagg 1020 acgccaagac agagaccagc caagtggcgc ctgccaagag caggatcacc agcgagggcg 1080 agtacatccc cctggaccag atcgacatca acgtgtaa 1118 <210> 38 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> PPO(palm)-mGluR6 protein <220> <221> LIPID <222> 308 <223> PALMITATE <400> 38 Met Glu Asn Leu Thr Ser Leu Asp Leu Leu Pro Asn Gly Glu Val Pro 1 5 10 15 Leu Met Pro Arg Tyr Gly Phe Thr Ile Leu Ala Val Ile Met Ala Val 20 25 30 Phe Thr Ile Ala Ser Leu Val Leu Asn Ser Thr Val Val Ile Val Thr 35 40 45 Leu Arg His Arg Gln Leu Arg His Pro Leu Asn Phe Ser Leu Val Asn 50 55 60 Leu Ala Val Ala Asp Leu Gly Val Thr Val Phe Gly Ala Ser Leu Val 65 70 75 80 Val Glu Thr Asn Ala Val Gly Tyr Phe Asn Leu Gly Arg Val Gly Cys 85 90 95 Val Ile Glu Gly Phe Ala Val Ala Phe Phe Gly Ile Ala Ala Leu Cys 100 105 110 Thr Ile Ala Val Ile Ala Val Asp Arg Phe Val Val Val Cys Lys Pro 115 120 125 Leu Gly Thr Leu Met Phe Thr Arg Arg His Ala Leu Leu Gly Ile Ala 130 135 140 Trp Ala Trp Leu Trp Ser Phe Val Trp Asn Thr Pro Pro Leu Phe Gly 145 150 155 160 Trp Gly Ser Tyr Glu Leu Glu Gly Val Arg Thr Ser Cys Ala Pro Asp 165 170 175 Trp Tyr Ser Arg Asp Pro Ala Asn Val Ser Tyr Ile Thr Ser Tyr Phe 180 185 190 Ala Phe Cys Phe Ala Ile Pro Phe Leu Val Ile Val Val Ala Tyr Gly 195 200 205 Arg Leu Met Trp Thr Leu His Gln Val Ala Lys Leu Gly Met Gly Glu 210 215 220 Ser Gly Ser Thr Ala Lys Ala Glu Ala Gln Val Ser Arg Met Val Val 225 230 235 240 Val Met Val Val Ala Phe Leu Val Cys Trp Leu Pro Tyr Ala Leu Phe 245 250 255 Ala Met Ile Val Val Thr Lys Pro Asp Val Tyr Ile Asp Pro Val Ile 260 265 270 Ala Thr Leu Pro Met Tyr Leu Thr Lys Thr Ser Thr Val Tyr Asn Pro 275 280 285 Ile Ile Tyr Ile Phe Met Asn Arg Gln Phe Arg Asp Cys Ala Val Pro 290 295 300 Phe Leu Leu Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys 305 310 315 320 Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu 325 330 335 Asn Ser Glu Asp Ala Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr 340 345 350 Ile Pro Leu Asp Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val 355 360 365 Ala Pro Ala 370 <210> 39 <211> 1238 <212> DNA <213> Artificial Sequence <220> <223> JSR1(palm)-mGluR6 cDNA <400> 39 atgttaccac atgcagcaaa aatggcggcc agggtggctg gcgatcacga tggaagaaac 60 atttcaattg ttgatcttct gccagaagac atgctaccga tgattcacga acattggtat 120 aagttccccc cgatggaaac ttccatgcat tatatcctcg gaatgcttat tatagttata 180 ggaatcatca gtgtatcagg taatggagtt gtcatgtact taatgatgac agtgaagaac 240 ctccgaactc ccggtaattt tctggtattg aatcttgccc tatctgattt tggtatgctg 300 ttttttatga tgccgacgat gtccataaat tgcttcgccg aaacgtgggt tataggacct 360 ttcatgtgtg agctctatgg aatgatcggc tcattatttg gaagtgcatc tatctggagt 420 ctggtaatga taacactcga ccgatacaat gtcatcgtga aaggaatggc tggaaaacct 480 ctaacgaaag ttggagcact gttaagaatg cttttcgtct ggatttggtc attaggctgg 540 accattgcac cgatgtacgg atggagcagg tatgttcctg aaggctcgat gacatcatgc 600 actattgact acatagatac agctattaat ccaatgtctt accttatcgc ctacgctatt 660 tttgtatact tcgtaccact ctttatcatt atttactgct acgctttcat cgtaatgcaa 720 gtagcagccc acgagaaatc cctacgagaa caagctaaaa agatgaacat caaatccctc 780 agatcaaatg aagataacaa gaaagcaagt gcagaattca gactggctaa ggtggctttt 840 atgaccatct gctgctggtt catggcgtgg actccttatc taaccctgtc cttccttgga 900 atcttctccg acaggacctg gctaacacct atgacatccg tttggggagc catatttgca 960 aaagctagtg cctgctacaa tcctattgtt tatggaataa gtcatcctaa gtatcgtgcc 1020 gctttacatg ataagttccc atgcctctgt tccatccaga gcagaacgtg cagaagcgga 1080 agcgcagcct caagaagacc tccacgatgg cggccccgcc caagagcgag aactcagagg 1140 acgccaagac agagaccagc caagtggcgc ctgccaagag caggatcacc agcgagggcg 1200 agtacatccc cctggaccag atcgacatca acgtgtaa 1238 <210> 40 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> JSR1(palm)-mGluR6 protein <220> <221> LIPID <222> 348 <223> PALMITATE <400> 40 Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His 1 5 10 15 Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu 20 25 30 Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser 35 40 45 Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser 50 55 60 Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn 65 70 75 80 Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp 85 90 95 Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe 100 105 110 Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met 115 120 125 Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile 130 135 140 Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro 145 150 155 160 Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp 165 170 175 Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val 180 185 190 Pro Glu Gly Ser Met Thr Ser Cys Thr Ile Asp Tyr Ile Asp Thr Ala 195 200 205 Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe 210 215 220 Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln 225 230 235 240 Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn 245 250 255 Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu 260 265 270 Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met 275 280 285 Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp 290 295 300 Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala 305 310 315 320 Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro 325 330 335 Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Leu Phe His Pro 340 345 350 Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr 355 360 365 Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser 370 375 380 Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile 385 390 395 400 Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 405 410 <210> 41 <211> 1722 <212> DNA <213> Artificial Sequence <220> <223> hJSR(S186F)palm-GABAB2-TS-1D4 cDNA <400> 41 atgctgcctc acgccgctaa aatggccgca agagtggccg gagatcacga cggcagaaac 60 atctctatcg tggacctgct gcctgaagat atgcttccaa tgattcacga gcactggtac 120 aagtttcccc ccatggaaac cagcatgcac tacatcctgg gcatgctgat catcgtgatc 180 ggaatcattt ctgtgtccgg caatggcgtg gtgatgtacc tgatgatgac cgttaagaac 240 ctgcggacac ctggaaattt cctggtgctg aacctggctc tgagcgactt cggcatgctg 300 ttcttcatga tgcccaccat gagcatcaac tgtttcgccg agacatgggt catcggtcct 360 ttcatgtgcg agctgtacgg catgatcggc tctctgtttg gcagcgccag catctggtct 420 cttgtgatga tcaccctgga ccggtataat gtcatcgtta agggaatggc cggaaagcct 480 ctgaccaagg tgggcgctct gctgagaatg ctcttcgtgt ggatctggtc cctgggctgg 540 accattgccc ctatgtacgg ctggagcaga tatgtgccag agggctctat gaccttctgc 600 accatcgatt acatcgacac cgccattaac cccatgagct acctgatcgc ctacgccatc 660 ttcgtgtact tcgtgcccct gttcatcatc atctactgct acgcctttat cgtgatgcag 720 gtggctgccc atgagaagag cctgcgggaa caggccaaga aaatgaacat caagagcctg 780 cgctccaacg aggacaacaa gaaggcctct gccgagttca gactggccaa agtggccttc 840 atgaccatct gctgttggtt catggcttgg accccttacc tgacactgag cttcctgggc 900 atcttcagcg acagaacatg gctgacccct atgacaagcg tgtggggcgc catctttgcc 960 aaggccagcg cctgttacaa ccctatcgtg tacggcatca gccaccccaa gtacagagcc 1020 gccctgcacg ataagtttcc ttgcactctg aggacaaacc ctgacgcagc cactcagaac 1080 aggcgattcc agttcacaca gaaccagaag aaagaagatt cgaagacctc cacctcagtc 1140 accagcgtga accaggcgag cacgtcacgc ctggagggac tgcagtcaga aaaccaccgc 1200 ctacgaatga agatcacaga gctggacaaa gacttggaag aagtcaccat gcagctacaa 1260 gacacaccag agaagaccac atacatcaaa cagaatcact accaagagct caacgacatc 1320 ctcagcttgg gcaacttcac agagagcaca gatggaggaa aggccattct aaaaaatcac 1380 ctcgatcaaa accctcagct ccagtggaac acgaccgagc cctcaagaac atgcaaagac 1440 cccatagagg acatcaactc cccagagcac atccagcgcc ggctgtccct ccagctcccc 1500 atcctccacc acgcctacct cccgtccatt ggaggcgtgg acgccagctg cgtcagcccc 1560 tgtgtcagcc ctacagccag ccctcgccac agacacgtac caccctcctt ccgagtcatg 1620 gtctcgggcc tgaagagcag gatcaccagc gagggcgagt acatccccct ggaccagatc 1680 gacatcaacg tgacagagac cagccaagtg gcgcctgcct aa 1722 <210> 42 <211> 573 <212> PRT <213> Artificial Sequence <220> <223> hJSR(S186F)palm-GABAB2-TS-1D4 protein <400> 42 Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His 1 5 10 15 Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu 20 25 30 Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser 35 40 45 Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser 50 55 60 Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn 65 70 75 80 Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp 85 90 95 Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe 100 105 110 Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met 115 120 125 Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile 130 135 140 Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro 145 150 155 160 Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp 165 170 175 Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val 180 185 190 Pro Glu Gly Ser Met Thr Phe Cys Thr Ile Asp Tyr Ile Asp Thr Ala 195 200 205 Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe 210 215 220 Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln 225 230 235 240 Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn 245 250 255 Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu 260 265 270 Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met 275 280 285 Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp 290 295 300 Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala 305 310 315 320 Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro 325 330 335 Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Thr Leu Arg Thr 340 345 350 Asn Pro Asp Ala Ala Thr Gln Asn Arg Arg Phe Gln Phe Thr Gln Asn 355 360 365 Gln Lys Lys Glu Asp Ser Lys Thr Ser Thr Ser Val Thr Ser Val Asn 370 375 380 Gln Ala Ser Thr Ser Arg Leu Glu Gly Leu Gln Ser Glu Asn His Arg 385 390 395 400 Leu Arg Met Lys Ile Thr Glu Leu Asp Lys Asp Leu Glu Glu Val Thr 405 410 415 Met Gln Leu Gln Asp Thr Pro Glu Lys Thr Thr Tyr Ile Lys Gln Asn 420 425 430 His Tyr Gln Glu Leu Asn Asp Ile Leu Ser Leu Gly Asn Phe Thr Glu 435 440 445 Ser Thr Asp Gly Gly Lys Ala Ile Leu Lys Asn His Leu Asp Gln Asn 450 455 460 Pro Gln Leu Gln Trp Asn Thr Thr Glu Pro Ser Arg Thr Cys Lys Asp 465 470 475 480 Pro Ile Glu Asp Ile Asn Ser Pro Glu His Ile Gln Arg Arg Leu Ser 485 490 495 Leu Gln Leu Pro Ile Leu His His Ala Tyr Leu Pro Ser Ile Gly Gly 500 505 510 Val Asp Ala Ser Cys Val Ser Pro Cys Val Ser Pro Thr Ala Ser Pro 515 520 525 Arg His Arg His Val Pro Pro Ser Phe Arg Val Met Val Ser Gly Leu 530 535 540 Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile 545 550 555 560 Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala 565 570 <210> 43 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> JSR(S186F)palm-beta2AR cDNA <400> 43 atgctgcctc acgccgctaa aatggccgca agagtggccg gagatcacga cggcagaaac 60 atctctatcg tggacctgct gcctgaagat atgcttccaa tgattcacga gcactggtac 120 aagtttcccc ccatggaaac cagcatgcac tacatcctgg gcatgctgat catcgtgatc 180 ggaatcattt ctgtgtccgg caatggcgtg gtgatgtacc tgatgatgac cgttaagaac 240 ctgcggacac ctggaaattt cctggtgctg aacctggctc tgagcgactt cggcatgctg 300 ttcttcatga tgcccaccat gagcatcaac tgtttcgccg agacatgggt catcggtcct 360 ttcatgtgcg agctgtacgg catgatcggc tctctgtttg gcagcgccag catctggtct 420 cttgtgatga tcaccctgga ccggtataat gtcatcgtta agggaatggc cggaaagcct 480 ctgaccaagg tgggcgctct gctgagaatg ctcttcgtgt ggatctggtc cctgggctgg 540 accattgccc ctatgtacgg ctggagcaga tatgtgccag agggctctat gaccttctgc 600 accatcgatt acatcgacac cgccattaac cccatgagct acctgatcgc ctacgccatc 660 ttcgtgtact tcgtgcccct gttcatcatc atctactgct acgcctttat cgtgatgcag 720 gtggctgccc atgagaagag cctgcgggaa caggccaaga aaatgaacat caagagcctg 780 cgctccaacg aggacaacaa gaaggcctct gccgagttca gactggccaa agtggccttc 840 atgaccatct gctgttggtt catggcttgg accccttacc tgacactgag cttcctgggc 900 atcttcagcg acagaacatg gctgacccct atgacaagcg tgtggggcgc catctttgcc 960 aaggccagcg cctgttacaa ccctatcgtg tacggcatca gccaccccaa gtacagagcc 1020 gccctgcacg ataagtttcc ttgcattgcc ttccaggagc ttctgtgcct gcgcaggtct 1080 tctttgaagg cctatgggaa tggctactcc agcaacggca acacagggga gcagagtgga 1140 tatcacgtgg aacaggagaa agaaaataaa ctgctgtgtg aagacctccc aggcacggaa 1200 gactttgtgg gccatcaagg tactgtgcct agcgataaca ttgattcaca agggaggaat 1260 tgtagtacaa atgactcact gctgaagagc aggatcacca gcgagggcga gtacatcccc 1320 ctggaccaga tcgacatcaa cgtgacagag accagccaag tggcgcctgc ctaa 1374 <210> 44 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> JSR(S186F)palm-beta2AR protein <400> 44 Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His 1 5 10 15 Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu 20 25 30 Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser 35 40 45 Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser 50 55 60 Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn 65 70 75 80 Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp 85 90 95 Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe 100 105 110 Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met 115 120 125 Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile 130 135 140 Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro 145 150 155 160 Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp 165 170 175 Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val 180 185 190 Pro Glu Gly Ser Met Thr Phe Cys Thr Ile Asp Tyr Ile Asp Thr Ala 195 200 205 Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe 210 215 220 Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln 225 230 235 240 Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn 245 250 255 Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu 260 265 270 Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met 275 280 285 Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp 290 295 300 Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala 305 310 315 320 Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro 325 330 335 Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Ile Ala Phe Gln 340 345 350 Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys Ala Tyr Gly Asn Gly 355 360 365 Tyr Ser Ser Asn Gly Asn Thr Gly Glu Gln Ser Gly Tyr His Val Glu 370 375 380 Gln Glu Lys Glu Asn Lys Leu Leu Cys Glu Asp Leu Pro Gly Thr Glu 385 390 395 400 Asp Phe Val Gly His Gln Gly Thr Val Pro Ser Asp Asn Ile Asp Ser 405 410 415 Gln Gly Arg Asn Cys Ser Thr Asn Asp Ser Leu Leu Lys Ser Arg Ile 420 425 430 Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val 435 440 445 Thr Glu Thr Ser Gln Val Ala Pro Ala 450 455 <210> 45 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm Mela hOPN4 trunc CT mGlur6 CT <400> 45 Asn Pro Ile Ile Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile 1 5 10 15 Ala Gln His Leu Pro Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys 20 25 30 Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys 35 40 45 Ser Glu Asn Ser Glu Asp Ala Lys 50 55 <210> 46 <211> 79 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm+33 Mela hOPN4 trunc CT mGlur6 CT <400> 46 His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly 1 5 10 15 Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr 20 25 30 Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His 35 40 45 Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser 50 55 60 Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys 65 70 75 <210> 47 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site Jct a Jct b Mela hOPN4 TM1 TM2 mGlur6 IL1 <400> 47 Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg His Asn 1 5 10 15 Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile Ile Asn 20 25 30 Leu Ala Val Ser Asp Phe Leu Met 35 40 <210> 48 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site variable region Mela hOPN4 proxim IL3 region distal IL3 region mGlur6 IL3 <400> 48 Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu 1 5 10 15 Thr Phe Asn Glu Ala Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu 20 25 30 Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu 35 40 45 <210> 49 <211> 66 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm Jellyopsin Cubop trunc CT m5HT7 CT <400> 49 Phe Asn Pro Ile Ile Tyr Cys Phe Leu His Lys Gln Phe Arg Arg Ala 1 5 10 15 Val Leu Arg Gly Val Cys Gln Tyr Arg Asn Ile Asn Arg Lys Leu Ser 20 25 30 Ala Ala Gly Met His Glu Ala Leu Lys Leu Ala Glu Arg Pro Glu Arg 35 40 45 Ser Glu Phe Val Leu Gln Asn Cys Asp His Cys Gly Lys Lys Gly His 50 55 60 Asp Thr 65 <210> 50 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm JellyOP cubop trunc CT mGlur6 CT <400> 50 Phe Asn Pro Ile Ile Tyr Cys Phe Leu His Lys Gln Phe Arg Arg Ala 1 5 10 15 Val Leu Arg Gly Val Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys 20 25 30 Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys 35 40 45 Ser Glu Asn Ser Glu Asp Ala Lys 50 55 <210> 51 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm Cone opsin hOPN1MW trunc CT mGlur6 CT <400> 51 Tyr Asn Pro Ile Ile Tyr Val Phe Met Asn Arg Gln Phe Arg Asn Cys 1 5 10 15 Ile Leu His Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg 20 25 30 Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn 35 40 45 Ser Glu Asp Ala Lys 50 <210> 52 <211> 49 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site palm Mela hOPN4 trunc CT Cone opsin OPN1MW CT <400> 52 Asn Pro Ile Ile Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile 1 5 10 15 Ala Gln His Leu Pro Cys Gly Lys Lys Val Asp Asp Ser Ser Glu Leu 20 25 30 Ser Ser Thr Ser Lys Thr Glu Val Ser Ser Val Ser Ser Val Ser Pro 35 40 45 Ala <210> 53 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> 1D4 tag <400> 53 Glu Thr Ser Gln Val Ala Pro Ala 1 5 <210> 54 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site Jct a Jct b Mela hOPN4 TM1 TM2 Cone opsin OPN1MW IL1 <400> 54 Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Ala Thr Met Lys Phe 1 5 10 15 Lys Lys Leu Arg His Pro Ala Asn Met Phe Ile Ile Asn Leu Ala Val 20 25 30 Ser Asp Phe Leu 35 <210> 55 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site Jct c Jct d Mela hOPN4 TM3 TM4 Cone opsin OPN1MW IL2 <400> 55 Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Cys Lys Pro Phe Gly 1 5 10 15 Asn Val Arg Phe Asp Ala Lys Leu Thr Ala Leu Val Leu Leu Gly Val 20 25 30 Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe 35 40 <210> 56 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> Amino Acid Sequence at Splicing Site Jct e Jct f Mela hOPN4 TM5 TM6 Cone opsin OPN1MW IL3 <400> 56 Leu Ile Ile Ile Phe Cys Tyr Ile Gln Val Trp Leu Ala Ile Arg Ala 1 5 10 15 Val Ala Lys Gln Gln Lys Glu Ser Glu Ser Thr Gln Lys Ala Glu Lys 20 25 30 Glu Val Thr Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu 35 40 45 <210> 57 <211> 125 <212> PRT <213> Artificial Sequence <220> <223> Sequence section human melanopsin gene (OPN4) C-terminal melanopsin fragment <400> 57 His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly 1 5 10 15 Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro Ser Tyr 20 25 30 Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn Leu Ser 35 40 45 Trp Ile Ser Ile Arg Arg Arg Gln Glu Ser Leu Gly Ser Glu Ser Glu 50 55 60 Val Gly Trp Thr His Met Glu Ala Ala Ala Val Trp Gly Ala Ala Gln 65 70 75 80 Gln Ala Asn Gly Arg Ser Leu Tyr Gly Gln Gly Leu Glu Asp Leu Glu 85 90 95 Ala Lys Ala Pro Pro Arg Pro Gln Gly His Glu Ala Glu Thr Pro Gly 100 105 110 Lys Thr Lys Gly Leu Ile Pro Ser Gln Asp Pro Arg Met 115 120 125 <210> 58 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Sequence section murine melanopsin gene (OPN4) C-terminal melanopsin fragment <400> 58 His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly 1 5 10 15 Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr 20 25 30 Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu Ser 35 40 45 Trp Ile Ser Gly Arg Lys Arg Gln Glu Ser Leu Gly Ser Glu Ser Glu 50 55 60 Val Gly Trp Thr Asp Thr Glu Thr Thr Ala Ala Trp Gly Ala Ala Gln 65 70 75 80 Gln Ala Ser Gly Gln Ser Phe Cys Ser Gln Asn Leu Glu Asp Gly Glu 85 90 95 Leu Lys Ala Ser Ser Ser Pro Gln Thr Lys Gly His Leu Pro Ser Leu 100 105 110 Asp Leu Gly Met 115 <210> 59 <211> 735 <212> PRT <213> Artificial Sequence <220> <223> wild type capsid AAV2 sequence <400> 59 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Phe Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 60 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> peptide insert SASEAST <400> 60 Ser Ala Ser Glu Ala Ser Thr 1 5 <210> 61 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> peptide insert TPPSITA <400> 61 Thr Pro Pro Ser Ile Thr Ala 1 5 <210> 62 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> peptide insert PRTPHTA <400> 62 Pro Arg Thr Pro His Thr Ala 1 5 <210> 63 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> peptide insert NHAPNHC <400> 63 Asn His Ala Pro Asn His Cys 1 5 <210> 64 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide insert AAASASEASTAA <400> 64 Ala Ala Ala Ser Ala Ser Glu Ala Ser Thr Ala Ala 1 5 10 <210> 65 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide insert AAATPPSITAAA <400> 65 Ala Ala Ala Thr Pro Pro Ser Ile Thr Ala Ala Ala 1 5 10 <210> 66 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide insert AAAPRTPHTAAA <400> 66 Ala Ala Ala Pro Arg Thr Pro His Thr Ala Ala Ala 1 5 10 <210> 67 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide insert NLANHAPNHCAR <400> 67 Asn Leu Ala Asn His Ala Pro Asn His Cys Ala Arg 1 5 10 <210> 68 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide insert NLAPRTPHTAAR <400> 68 Asn Leu Ala Pro Arg Thr Pro His Thr Ala Ala Arg 1 5 10 <210> 69 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> peptide insert SASEAST with linker <400> 69 Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Ser Ala Ser Glu 1 5 10 15 Ala Ser Thr Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 20 25 30 Gly Val Leu Pro Gly 35 <210> 70 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> peptide insert TPPSITA with linker <400> 70 Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Thr Pro Pro Ser 1 5 10 15 Ile Thr Ala Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 20 25 30 Gly Val Leu Pro Gly 35 <210> 71 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> peptide insert PRTPHTA with linker <400> 71 Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Pro Arg Thr Pro 1 5 10 15 His Thr Ala Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 20 25 30 Gly Val Leu Pro Gly 35 <210> 72 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> peptide insert NHAPNHC with linker <400> 72 Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Asn His Ala Pro 1 5 10 15 Asn His Cys Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 20 25 30 Gly Val Leu Pro Gly 35 <210> 73 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> peptide insert PRTPHTA-AR with linker <400> 73 Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Pro Arg Thr Pro 1 5 10 15 His Thr Ala Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 20 25 30 Gly Val Leu Pro Gly 35 <210> 74 <211> 747 <212> PRT <213> Artificial Sequence <220> <223> AAV capsid with NLAPRTPHTAAR insertion <400> 74 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Phe Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Phe 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Phe Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Pro Arg 580 585 590 Thr Pro His Thr Ala Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn 595 600 605 Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr 610 615 620 Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe 625 630 635 640 His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro 645 650 655 Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr 660 665 670 Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly 675 680 685 Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys 690 695 700 Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Tyr Asn Lys Ser Val 705 710 715 720 Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg 725 730 735 Pro Ile Gly Thr Arg Phe Leu Thr Arg Asn Leu 740 745 <210> 75 <211> 1354 <212> DNA <213> Artificial Sequence <220> <223> ON-Bipolar cell specific promoter 770En_566P(hGRM6) <400> 75 gggtctccaa cttgccaact gtagatcttg gaacctttca tccttcataa ctgcataagc 60 caattccttc taataaatct gtataatata tctgtctata taataaatat gtacttacat 120 aactctgtat gttacatcta tctattctat ctatctatct atctatctat ctatctatct 180 atctatcatc tatctatcta tttatctatt ctctgtgtct ttggagaacc ctgacatagt 240 aagcaatcat atcacctgca aatgatgaaa gctgtgtatt ttccaaatca gtcgttttat 300 gtcttttttt cttgcactga ctagtgcccc ctagagggaa tgataattgg aattattgtc 360 ttgctctgat tttaaaggaa gtagatactt caaataattc atcatggagt gcaatatttt 420 ctgtaggctt ttagtagata acttcatcag tttaaagaag atccttagat tatgaaacat 480 ttacaattat gaatgaatat tagatgttat caaatgcttt ttctgcatcc atttagataa 540 tcatgttttt cctttaatct gttaatgcgg tgaattacat taatagattt cctaagtcat 600 taatctgcta aagtgcattt ctgggacaaa ccagacttgg ttatgacatt gtatgtattt 660 cagtttgcaa atattggact aggatttttg tatctatatt ccttagtttg acctgtaaat 720 tttatttctt gtactaagta ttagcctcac gaaaggcatt gtcaaatgtt caattgatat 780 aatgctagcc aagaagagga cagaggcaga aagccaggga cagagactga gaaacagaga 840 cctagaggca gaagaagact gagatagaga tggacagaga ttgtgtcaga cacagcccca 900 gagacagcca gacagtctga gtcagacgca aaccaaagac aagaaaacag gaaaacagac 960 ccagagattg ggagagggag gggaaggaga tgcggggaga gccagcaccg ccacccccca 1020 cactcaggag gggtctccac cctcggagcg gtctctcatc cctccctaga atccttaaat 1080 cctctctcgc tcagggcctc ggccgcatct gtcacagact tgtcctgaac cgacagcggc 1140 tggcgcaggt gactggcttg gggcgggagc ctgggtgtgc gctggggatg gaccccgagg 1200 aagaggggcc aagctgtcgg gaagcggcag ggctggaggg gtggaggcag tggtcgggcg 1260 ggaccccggg cgacagggtt cggcgcttgt aagagcgaga cggaggcccg ggcaggccgg 1320 ctgagctaac tccccagagc cgaagtggaa ggcg 1354 <210> 76 <211> 917 <212> DNA <213> Artificial Sequence <220> <223> ON-Bipolar cell specific promoter 444En_454P(hGRM6) <400> 76 atctattctc tgtgtctttg gagaaccctg acatagtaag caatcatatc acctgcaaat 60 gatgaaagct gtgtattttc caaatcagtc gttttatgtc tttttttctt gcactgacta 120 gtgcccccta gagggaatga taattggaat tattgtcttg ctctgatttt aaaggaagta 180 gatacttcaa ataattcatc atggagtgca atattttctg taggctttta gtagataact 240 tcatcagttt aaagaagatc cttagattat gaaacattta caattatgaa tgaatattag 300 atgttatcaa atgctttttc tgcatccatt tagataatca tgtttttcct ttaatctgtt 360 aatgcggtga attacattaa tagatttcct aagtcattaa tctgctaaag tgcatttctg 420 ggacaaacca gacttggtta tgaccaattg atataatgct agcggagggg tctccaccct 480 cggagcggtc tctcatccct ccctagaatc cttaaatcct ctctcgctca gggcctcggc 540 cgcatctgtc acagacttgt cctgaaccga cagcggctgg cgcaggtgac tggcttgggg 600 cgggagcctg ggtgtgcgct ggggatggac cccgaggaag aggggccaag ctgtcgggaa 660 gcggcagggc tggaggggtg gaggcagtgg tcgggcggga ccccgggcga cagggttcgg 720 cgcttgtaag agcgagacgg aggcccgggc aggccggctg agctaactcc ccagagccga 780 agtggaaggc gcgccccgag cgccttctcc ccaggacccc ggtgtccctc cccgcgcccc 840 gagcccgcgc tctccttccc ccgccctcag agcgctcccc gcccctctgt ctccccgcag 900 cccgctagac gagccga 917 <210> 77 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> KOZAK consensus sequence 1 <400> 77 gccgccacca ugg 13 <210> 78 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> KOZAK consensus sequence 2 <400> 78 gccgccgcca ugg 13 <210> 79 <211> 6020 <212> DNA <213> Artificial Sequence <220> <223> rAAV vector OPN4-mGluR6-TS-1D4 <400> 79 ccttaattag gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180 agccatgctc taggaagatc ggaattcgcc cttaagtcta gagggtctcc aacttgccaa 240 ctgtagatct tggaaccttt catccttcat aactgcataa gccaattcct tctaataaat 300 ctgtataata tatctgtcta tataataaat atgtacttac ataactctgt atgttacatc 360 tatctattct atctatctat ctatctatct atctatctat ctatctatca tctatctatc 420 tatttatcta ttctctgtgt ctttggagaa ccctgacata gtaagcaatc atatcacctg 480 caaatgatga aagctgtgta ttttccaaat cagtcgtttt atgtcttttt ttcttgcact 540 gactagtgcc ccctagaggg aatgataatt ggaattattg tcttgctctg attttaaagg 600 aagtagatac ttcaaataat tcatcatgga gtgcaatatt ttctgtaggc ttttagtaga 660 taacttcatc agtttaaaga agatccttag attatgaaac atttacaatt atgaatgaat 720 attagatgtt atcaaatgct ttttctgcat ccatttagat aatcatgttt ttcctttaat 780 ctgttaatgc ggtgaattac attaatagat ttcctaagtc attaatctgc taaagtgcat 840 ttctgggaca aaccagactt ggttatgaca ttgtatgtat ttcagtttgc aaatattgga 900 ctaggatttt tgtatctata ttccttagtt tgacctgtaa attttatttc ttgtactaag 960 tattagcctc acgaaaggca ttgtcaaatg ttcaattgat ataatgctag cggaggggtc 1020 tccaccctcg gagcggtctc tcatccctcc ctagaatcct taaatcctct ctcgctcagg 1080 gcctcggccg catctgtcac agacttgtcc tgaaccgaca gcggctggcg caggtgactg 1140 gcttggggcg ggagcctggg tgtgcgctgg ggatggaccc cgaggaagag gggccaagct 1200 gtcgggaagc ggcagggctg gaggggtgga ggcagtggtc gggcgggacc ccgggcgaca 1260 gggttcggcg cttgtaagag cgagacggag gcccgggcag gccggctgag ctaactcccc 1320 agagccgaag tggaaggcgc gccccgagcg ccttctcccc aggaccccgg tgtccctccc 1380 cgcgccccga gcccgcgctc tccttccccc gccctcagag cgctccccgc ccctctgtct 1440 ccccgcagcc cgctagacga gccgagcggc cgcgccacca tgaaccctcc ttcggggcca 1500 agagtcccgc ccagcccaac ccaagagccc agctgcatgg ccaccccagc accacccagc 1560 tggtgggaca gctcccagag cagcatctcc agcctgggcc ggcttccatc catcagtccc 1620 acagcacctg ggacttgggc tgctgcctgg gtccccctcc ccacggttga tgttccagac 1680 catgcccact ataccctggg cacagtgatc ttgctggtgg gactcacggg gatgctgggc 1740 aacctgacgg tcatctatac cttctgcagg agcagaagcc tccggacacc tgccaacatg 1800 ttcattatca acctcgcggt cagcgacttc ctcatgtcct tcacccaggc ccctgtcttc 1860 ttcaccagta gcctctataa gcagtggctc tttggggaga caggctgcga gttctatgcc 1920 ttctgtggag ctctctttgg catttcctcc atgatcaccc tgacggccat cgccctggac 1980 cgctacctgg taatcacacg cccgctggcc acctttggtg tggcgtccaa gaggcgtgcg 2040 gcatttgtcc tgctgggcgt ttggctctat gccctggcct ggagtctgcc acccttcttc 2100 ggctggagcg cctacgtgcc cgaggggttg ctgacatcct gctcctggga ctacatgagc 2160 ttcacgccgg ccgtgcgtgc ctacaccatg cttctctgct gcttcgtgtt cttcctccct 2220 ctgcttatca tcatctactg ctacatcttc atcttcaggg ccatccggga gacaggacgg 2280 gctctccaga ccttcggggc ctgcaagggc aatggcgagt ccctgtggca gcggcagcgg 2340 ctgcagagcg agtgcaagat ggccaagatc atgctgctgg tcatcctcct cttcgtgctc 2400 tcctgggctc cctattccgc tgtggccctg gtggcctttg ctgggtacgc acacgtcctg 2460 acaccctaca tgagctcggt gccagccgtc atcgccaagg cctctgcaat ccacaacccc 2520 atcatttacg ccatcaccca ccccaagtac agggtggcca ttgcccagca cctgccctgc 2580 ctgttccatc cagagcagaa tgtgcagaag cgaaagcgga gcctcaaggc cacctccacg 2640 gtggcagccc cacccaaggg cgaggatgca gaggcccaca agaagagcag gatcaccagc 2700 gagggcgagt acatccccct ggaccagatc gacatcaacg tgacagagac cagccaagtg 2760 gcgcctgcct aaggatctgc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 2820 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 2880 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 2940 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggactcgagt 3000 taagggcgaa ttcccgataa ggatcttcct agagcatggc tacgtagata agtagcatgg 3060 cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg 3120 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 3180 ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac tggccgtcgt 3240 tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca 3300 tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 3360 gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa gcgcggcggg 3420 tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 3480 cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 3540 ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 3600 ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 3660 gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 3720 tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 3780 aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 3840 ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 3900 cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 3960 aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 4020 ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 4080 cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 4140 agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 4200 gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 4260 cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 4320 gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 4380 ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 4440 gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 4500 gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 4560 cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 4620 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 4680 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 4740 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 4800 gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 4860 ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 4920 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4980 gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 5040 caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5100 ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg 5160 tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5220 ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5280 tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5340 cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5400 gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5460 ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5520 gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5580 agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5640 tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5700 tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5760 gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 5820 taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 5880 aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 5940 atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 6000 tacgccagat ttaattaagg 6020 <210> 80 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> E(D)RY motif <220> <221> UNSURE <222> 2 <400> 80 Glu Xaa Arg Tyr 1 <210> 81 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> NPxxY motif <220> <221> UNSURE <222> 3 <220> <221> UNSURE <222> 4 <400> 81 Asn Pro Xaa Xaa Tyr 1 5 <210> 82 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> NR(K)Q motif <220> <221> UNSURE <222> 3 <400> 82 Asn Arg Xaa Gln 1 <210> 83 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> DRIY variant of E(D)RY motif <400> 83 Asp Arg Ile Tyr 1 <210> 84 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> NRIY variant of E(D)RY motif <400> 84 Asn Arg Ile Tyr 1 <210> 85 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Golgi export signal from the potassium channel Kir2.1 <400> 85 Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile 1 5 10 15 Asp Ile Asn Val 20 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> ER export signal from Kir2.1 <400> 86 Phe Cys Tyr Glu Asn Glu Val 1 5

Claims

세포외 및 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7)을 포함하는 키메라 옵신 GPCR 단백질로서,
상기 키메라 옵신 GPCR 단백질은 상류 옵신의 감광성 옵신 부분을 포함하고,
상기 상류 옵신 부분은 발색단에 공유 결합하는 발색단 포켓을 포함하고,
상기 키메라 옵신 GPCR 단백질은 제2 GPCR 단백질(표적 GPCR 단백질)의 제2 GPCR 부분(표적 GPCR 부분)을 포함하고,
상기 표적 GPCR 부분은 C 말단 도메인(표적-GPCR-CT)을 포함하고;
여기서,
상기 상류 옵신 부분은 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단 또는 그 하류에 위치하는 절단 부위를 갖는 절단된 C 말단 도메인(절단된 옵신 CT)을 추가로 포함하고,
상기 O-CT-근위 영역은 NR(K)Q 모티프 및 원위 방향으로 그 다음의 7~13개의 아미노산을 포함하며,
상기 키메라 옵신 GPCR 단백질은 키메라 C 말단 도메인(키메라 CT)을 포함하고;
상기 표적-GPCR-CT는 상기 절단된 옵신 CT의 하류에 위치하는 것;을 특징으로 하는 키메라 옵신 GPCR 단백질.
제1항에 있어서, O-CT 근위 영역의 원위 말단은 다음을 포함하는 군으로부터 선택되는 위치에 위치하는 것인 키메라 옵신 GPCR:
- 나선 8(H8)의 원위 말단
- 팔미토일화 부위 또는
- 소 로돕신의 팔미토일화 부위에 상응하는 위치.
제1항 또는 제2항에 있어서,
O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 있는 상류 옵신 CT의 절단 부위를 포함하고,
O-CT-근위 영역의 원위 연장부는 O-CT-근위 영역의 원위 말단의 하류 또는 특히 팔미토일화 부위의 하류에서 최대 5개 또는 최대 10개 또는 최대 16개 또는 최대 22개 또는 최대 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산을 포함하는 것인 키메라 옵신 GPCR.
제3항에 있어서, 상류 옵신은 멜라놉신의 군으로부터 선택되는 것인 키메라 옵신 GPCR.
제3항에 있어서, 상류 옵신은 적어도 50, 65, 80, 100, 150 또는 200개 아미노산 길이의 CT를 포함하는 옵신의 군으로부터 선택되는 것인 키메라 옵신 GPCR.
제1항 내지 제5항 중 한 항에 있어서,
상류 옵신 부분은 절단 부위까지 전체 상류 옵신을 포함하거나, 또는
상류 옵신 부분은 E(DRY) 모티프에서 절단 부위까지 상류 옵신의 연속 영역을 포함하거나, 또는
상류 옵신 부분은 TM3, TM4, TM5, TM6 및 TM7 및 선택적으로 절단된 옵신 CT를 절단 부위까지 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제6항 중 어느 한 항에 있어서,
상류 옵신 부분은 막관통 도메인 TM3 및 TM7을 포함하고, 특히 막관통 도메인 TM3 내지 TM7, TM2 내지 TM7 또는 TM1 내지 TM7을 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제7항 중 한 항에 있어서, 상류 옵신 부분은 EL1, EL2, EL3 및 NT로부터 선택된 세포외 도메인 중 하나 이상을 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제8항 중 어느 한 항에 있어서, 상류 옵신 부분은 2개 이상의 모 옵신, 특히 2개의 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
제1항 내지 제9항 중 한 항에 있어서,
상류 옵신 부분은 비인간 옵신인 모 옵신으로부터 유래된 막관통 도메인을 포함하고
상류 옵신 부분은 인간 옵신인 모 옵신으로부터 유래된 1개 또는 2개 또는 3개, 또는 모든 세포외 도메인을 추가로 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제10항 중 어느 한 항에 있어서, TM7 및 절단된 옵신 CT는 동일한 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
제1항 내지 제11항 중 한 항에 있어서, 상류 옵신 부분은 모든 세포외 도메인, 모든 막관통 도메인 및 모든 세포내 루프를 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제12항 중 어느 한 항에 있어서, 상류 옵신 부분은 상류 옵신 CT의 절단 부위까지 전체 모 상류 옵신을 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제13항 중 어느 한 항에 있어서, 상류 옵신 부분은 단일안정성 또는 이안정성 옵신 또는 삼안정성 옵신, 특히 이안정성 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
제1항 내지 제14항 중 어느 한 항에 있어서, 상류 옵신 부분은 다음을 포함하는 옵신의 군으로부터 선택된 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR:
- 멜라놉신(OPN4)
- 로돕신(RHO)
- 원추형 옵신(OPN1SW, OPN1LW 및 OPN1MW)
- 해파리 옵신(cubop, JellyOP)
- 깡충거미(jumping spider) 로돕신(JSR1)
- 파라피놉신(PPO)
- 뉴롭신(OPN5)
- 엔세팔롭신(OPN3)
제1항 내지 제15항 중 한 항에 있어서, 모 표적 GPCR의 CT의 기능적 변이체인 표적 CT를 포함하고, 특히 하나 이상의 아미노산의 결실, 특히 NPxxY 모티프와 팔미토일화 부위까지 또는 팔미토일화 부위에 근위쪽으로 인접한 아미노산 위치까지의 임의의 아미노산 위치 사이의 N 말단 결실을 포함하는 키메라 옵신 GPCR.
제1항에 있어서,
표적 GPCR 부분은 비옵신 GPCR로부터 유래되거나 또는 표적 옵신이라는 제2 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
제1항 내지 제17항 중 어느 한 항에 있어서, 표적 CT 부분은 다음을 포함하는 GPCR 단백질의 군으로부터 선택된 모 표적 GPCR로부터 유래되는 것인 키메라 옵신 GPCR:
특히 다음을 포함하는 군으로부터 선택된 클래스 A GPCR:
- 원추형 옵신, 특히 OPN1SW, OPN1MW 또는 OPN1LW,
- 세로토닌 수용체, 특히 5-HT7,
- 뮤 오피오이드 수용체,
- β-아드레날린 수용체, 특히 베타1-아드레날린 수용체, 베타2-아드레날린 수용체 및 베타3-아드레날린 수용체;
특히 다음을 포함하는 군으로부터 선택된 클래스 B GPCR:
- 호르몬 수용체, 특히 글루카곤 수용체(GCGR)
특히 다음을 포함하는 군으로부터 선택된 클래스 C GPCR:
- GABA_B 수용체, 특히 GABA_B1 및 GABA_B2
- 대사성 글루타메이트 수용체, 특히 mGluR6 및 mGluR5 수용체
제1항 내지 제18항 중 한 항에 있어서, 표적 GPCR은 클래스 A GPCR 또는 클래스 B GPCR, 또는 클래스 C GPCR을 제외한 또 다른 클래스 GPCR의 GPCR이고, 선택적으로 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하는 것인 키메라 옵신 GPCR 단백질.
제1항 내지 제19항 중 한 항에 있어서, 표적 GPCR 단백질은 클래스 C GPCR, 특히 mGluR6이고, 클래스 C 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하되, 다음의 기준 중 하나가 충족되는 것인 키메라 옵신 GPCR:
A: 키메라 GPCR에서 상류 옵신 부분에 포함된 자연 크기의 IL3 및 고유 위치에 상응하는 위치에서 클래스 C GPCR의 자연 크기의 IL2의 병존은 배제된다;
B: 상류 옵신 부분은 세포내 루프 IL1 내지 IL3 모두를 포함한다;
C: 상류 옵신 부분은 IL1을 포함하고 표적 GPCR 부분은 상응하는 위치에서 상류 옵신 IL2 및 IL3을 대체하는 IL2 및 IL3을 포함한다.
제1항 내지 제20항 중 어느 한 항에 있어서, 키메라 옵신 GPCR의 CT는 다음의 요소의 군으로부터 선택된 하나 이상의 서열 요소를 추가로 포함하고:
- 골지 방출 신호
- 막 트래피킹 서열
- 형광 단백질을 암호화하는 서열 요소,
하나 이상의 선택된 요소는 키메라 옵신 GPCR CT의 C 말단 끝에 임의의 순서로 독립적으로 배열되는 것인 키메라 옵신 GPCR.
제1항 내지 제21항 중 어느 한 항에 있어서, 키메라 옵신 GPCR의 CT는 선택된 방출 신호로서 특히 소포체 방출 신호, 더욱 특별하게는 서열번호 86에 따른 아미노산 서열을 포함하거나 이로 구성된 Kir2.1로부터의 소포체 방출 신호, 또는 특히 골지 방출 신호, 더욱 특별하게는 서열번호 85에 따른 아미노산 서열을 포함하거나 이로 구성된 칼륨 채널 Kir2.1로부터의 골지 방출 신호를 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제22항 중 어느 한 항에 있어서,
키메라 옵신 GPCR의 CT는 특히 옵신으로부터의, 더욱 특별하게는 로돕신으로부터의, 가장 특별하게는 서열번호 87에 따른 아미노산 서열을 포함하거나 이로 구성된, 막 트래피킹 서열을 선택된 서열 요소로서 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제23항 중 어느 한 항에 있어서,
키메라 옵신 GPCR의 CT는 형광 단백질, 특히 mKate2, TurboFP635 또는 mScarlet을 암호화하는 선택된 서열 요소를 포함하고,
형광 단백질은 키메라 옵신 GPCR의 CT에 직접 융합되거나 IRES 또는 T2A 서열을 통해 연결되는 것인 키메라 옵신 GPCR.
제1항 내지 제24항 중 어느 한 항에 있어서,
표적 GPCR 부분은 IL1을 추가로 포함하고 표적 GPCR의 IL1은 상류 옵신의 IL1을 대체하는 것인 키메라 옵신 GPCR.
제1항 내지 제25항 중 어느 한 항에 있어서,
상류 옵신의 IL3은 표적 GPCR의 IL3으로 대체되거나;
또는 상류 옵신의 IL3은 키메라 IL3으로 대체되고, 표적 GPCR의 IL3은 옵신 IL3 내의 가변 영역을 대체하는 것인 키메라 옵신 GPCR.
제1항 내지 제26항 중 한 항에 있어서, 특히 표적 GPCR은 mGluR이고, 표적 CT는 NR(K)Q 모티프 또는 이의 상류의 근위 말단을 포함하는 것인 키메라 옵신 GPCR.
제1항 내지 제27항 중 한 항에 있어서, 표적 GPCR은 mGluR6이고 mGluR6의 IL3은 옵신 IL3의 가변 영역을 부분적으로 대체하여 키메라 IL3을 형성하는 것인 키메라 옵신 GPCR.
제1항 내지 제28항 중 한 항에 있어서,
표적 GPCR은 mGluR6이고 상류 옵신 부분은 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상을 추가로 포함하되, 상류 옵신 부분에 포함된 자연 크기의 IL3 및 상류 옵신-mGluR6 키메라 단백질의 mGluR6 부분에 포함된 자연 크기의 IL2의 병존은 배제되는 것인 키메라 옵신 GPCR.
제1항 내지 제29항 중 어느 한 항에 있어서, 상류 옵신 부분은 멜라놉신으로부터 유래되고 NT, EL1 내지 EL3, TM1 내지 TM7, IL1 및 절단된 옵신 CT를 포함하고, 표적 GPCR 부분은 mGluR6으로부터 유래되고 IL2, IL3 및 CT를 포함하거나, 또는 표적 GPCR 부분은 hOPN1mw로부터 유래되고 IL2, IL3 및 CT를 포함하는 것인 키메라 옵신 GPCR.
제1항에 있어서, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열을 포함하는 키메라 옵신 GPCR.
제31항에 있어서, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성되는 키메라 옵신 GPCR.
제35항에 있어서, 아미노산 서열은 다음으로부터 선택되는 하나 이상의 변이를 포함하는 상기 서열 중 임의의 하나의 변이체이고:
- 보존적 아미노산 치환,
- 1 내지 최대 3개, 5개, 8개 또는 15개 아미노산 범위의 결실,
- 1 내지 최대 3개, 5개, 8개 또는 15개 아미노산 범위의 삽입,
여기서 키메라 옵신-GPCR 단백질은 표적 GPCR에 특이적인 G알파 단백질의 광 활성화 의존적 결합을 나타내는 것인 키메라 옵신 GPCR.
제35항 또는 제36항에 있어서, 아미노산 서열은 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 갖는 이들 서열 중 임의의 하나의 변이체인 키메라 옵신 GPCR.
모 옵신 CT 및 모 표적 GPCR CT로부터 유래된 키메라 C 말단 도메인(키메라 CT), 특히 제1항 내지 제34항 중 어느 한 항에 따른 키메라 옵신 GPCR 단백질의 키메라 C 말단 도메인(키메라 CT)을 포함하는 펩티드로서,
상기 펩티드는 (CT의 근위 영역을 포함하고, 특히 나선 8(H8) 및 소 로돕신의 C322 또는 C323에 각각 상응하는 팔미토일화 부위를 포함하고, 선택적으로 옵신의 팔미토일화 부위의 하류에서 최대 33, 34 또는 35개 아미노산을 추가로 포함하는) 옵신의 절단된 C 말단 도메인(절단된 옵신-CT)을 포함하고,
상기 펩티드는 표적 GPCR의 C 말단 도메인(표적 GPCR CT) 또는 이의 기능적 변이체, 특히 기능적 단편을 추가로 포함하고, 표적 GPCR CT는 절단된 옵신 CT의 하류에 위치하는 것인 펩티드.
제1항 내지 제34항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는 제35항에 따른 펩티드를 암호화하는 핵산 분자.
제36항에 있어서, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열과 적어도 90% 또는 적어도 95% 또는 적어도 98% 동일한 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 핵산 서열을 포함하는 핵산 분자.
제36항에 있어서, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 70% 또는 80% 또는 90% 동일한 핵산 서열을 포함하는 핵산 분자.
제36항에 있어서, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성되는 핵산 분자.
제35항 내지 제39항 중 한 항에 따른 핵산 분자를 표적 세포에 전달하기 위한 의료 요법에 사용하기 위한 AAV 캡시드 폴리펩티드.
제40항에 있어서, 캡시드 단백질은 AAV2, AAV2(7m8) 또는 AAV8(BP2)의 캡시드 단백질인, 상기 사용을 위한 AAV 캡시드 폴리펩티드.
제41항에 있어서,
캡시드 폴리펩티드는 AAV2 캡시드 폴리펩티드이고 야생형 AAV2의 아미노산 587과 588 사이에 아미노산 삽입물을 포함하고,
펩티드 삽입물은
- SASEAST (서열번호 60)
- TPPSITA (서열번호 61)
- PRTPHTA (서열번호 62)
- NHAPNHC (서열번호 63)
를 포함하는 펩티드 서열의 군으로부터 선택된 서열을 포함하거나 이로 구성되는 것인, 상기 사용을 위한 AAV 캡시드 폴리펩티드.
제41항 또는 제42항에 있어서,
AAV2 캡시드는 7 내지 13개 아미노산의 폴리펩티드를 포함하고,
특히 펩티드 삽입물은 제42항에 따른 펩티드 삽입물을 포함하고, 1 또는 2개의 플랭킹 링커를 추가로 포함하고,
링커는 양쪽에 최대 1, 2, 3, 4 또는 5개의 아미노산을 포함하되, 링커의 아미노산의 총 수는 6개 아미노산을 초과하지 않으며,
특히 링커는 양쪽에 2 또는 3개의 아미노산을 포함하고,
링커는
i. 아미노산 G 및 A 또는
ii. 아미노산 A, N, L, T, R, G, A, N, L 및 R, 특히 A, L, N, R로부터 선택되는 아미노산을 포함하거나 이로 구성되고, 더욱 특별하게는 아미노산 중 적어도 하나는 N 및 R로부터 선택되는 것인, 상기 사용을 위한 AAV 캡시드 폴리펩티드.
제43항에 있어서, 다음으로부터 선택되는, 야생형 AAV2의 N587과 R588 사이에 펩티드 삽입물을 포함하는, 상기 사용을 위한 AAV 캡시드 폴리펩티드:
- AAASASEASTAA (서열번호 64),
- AAATPPSITAAA (서열번호 65),
- AAAPRTPHTAAA (서열번호 66),
- NLANHAPNHCAR (서열번호 67),
- NLAPRTPHTAAR (서열번호 68).
야생형 AAV 혈청형 2(AAV2)의 587 내지 592 사이, 특히 AAV 혈청형 2의 N587 내지 R588 사이의 위치 또는 또 다른 혈청형의 AAV에서 이에 상동성인 위치에 펩티드 삽입물을 포함하는 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드로서, 펩티드 삽입물은
- NLANHAPNHCAR (서열번호 67)
- NLAPRTPHTAAR (서열번호 68)
을 포함하는 서열의 군으로부터 선택되는 것인 AAV 캡시드 폴리펩티드.
제40항 내지 제45항 중 한 항에 있어서,
캡시드는
a. 아미노산 위치 252, 272, 444, 500, 700, 704 및/또는 730에서 티로신(Y)에서 페닐알라닌(F)으로의 돌연변이; 및/또는
b. 아미노산 위치 491에서 트레오닌(T)에서 발린(V)으로의 돌연변이
로부터 선택되는 돌연변이 중 하나 이상을 포함하는 것인, 제40항 내지 제44항에 따른 사용을 위한 AAV 캡시드 폴리펩티드 또는 제45항에 따른 AAV 캡시드.
제42항에 따른 사용을 위한 AAV 캡시드 폴리펩티드 또는 제45항에 따른 또는 제45항 및 제46항에 따른 AAV 캡시드로서,
특히 서열번호 74에 따른 아미노산 서열을 포함하거나 이로 구성된, AAV 캡시드 폴리펩티드 또는 AAV 캡시드.
제40항 내지 제47항 중 한 항에 따른 AAV 캡시드를 암호화하는 핵산 분자.
제48항에 있어서, AAV2, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2(PRTPHTA)로부터 선택된 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 핵산 분자.
제48항 또는 제49항에 있어서, 다음으로부터 선택되는, AAV2 게놈의 N587 내지 R588 사이의 펩티드 삽입물이 있는 아미노산 서열을 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 핵산 분자:
- AAASASEASTAA (서열번호 64),
- AAATPPSITAAA (서열번호 65),
- AAAPRTPHTAAA (서열번호 66),
- NLANHAPNHCAR (서열번호 67),
- NLAPRTPHTAAR (서열번호 68).
제48항 내지 제50항 중 한 항에 있어서, 핵산 분자는 이식유전자를 포함하고,
특히, 이식유전자는 키메라 옵신 GPCR을 암호화하고, 특히 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성되는 것인, 핵산 분자.
제48항 내지 제51항 중 한 항에 있어서, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된 mela(palm)-mGluR6 키메라 GPCR을 암호화하는 이식유전자를 포함하는 핵산 분자.
제51항 또는 제52항에 있어서, 세포 특이적 프로모터를 포함하고,
세포 특이적 프로모터는 이식유전자에 작동 가능하게 연결되고,
세포 특이적 프로모터는 특히 ON 두극세포 특이적 프로모터, 더욱 특별하게는 200En-mGluR500P 프로모터, 서열번호 75에 따른 770En_454P(hGRM6) 프로모터 또는 서열번호 76에 따른 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 군으로부터 선택된 ON 두극세포 특이적 프로모터인 핵산 분자.
제45항에 따른 또는 제45항 및 제46항에 따른 또는 제45항 및 제47항에 따른 AAV 캡시드를 암호화하는 서열을 포함하는 재조합 AAV 벡터(rAAV).
제36항 내지 제39항 중 한 항에 따른 핵산 분자를 포함하는 벡터로서, 특히 프로모터에 작동 가능하게 연결된 제36항 내지 제39항 중 한 항에 따른 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자를 포함하는 핵 발현 벡터.
제54항 또는 제55항에 있어서, 재조합 아데노 관련 바이러스(rAAV)인 벡터.
제54항 내지 제56항 중 한 항에 있어서, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12, 특히 AAV2 또는 AAV8을 포함하는 AAV 혈청형의 군으로부터 선택된 벡터.
제54항 내지 제57항 중 한 항에 있어서,
- AAV 캡시드 단백질을 암호화하는 서열 및/또는
- 프로모터, 특히 세포 특이적 프로모터, 더욱 특별하게는 두극세포 특이적 프로모터
를 포함하는 서열의 군으로부터 선택된 핵산 서열을 추가로 포함하는 벡터.
제54항 내지 제58항 중 한 항에 있어서, 특히,
- GRM6-sv40 프로모터,
- 4xGRM6-sv40 프로모터,
- 200En-mGluR500P 프로모터,
- 770En_454P(hGRM6) 프로모터 서열번호 75,
- 444En_454P(hGRM6) 프로모터 서열번호 76 및
- 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 프로모터의 군으로부터 선택된, ON-두극세포 특이적 프로모터에 의해 유도된 제35항 내지 제39항 중 한 항에 따른 키메라 옵신 GPCR을 암호화하는 핵산 분자를 포함하는 벡터.
제54항 내지 제59항 중 한 항에 있어서, 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 벡터.
제54항 내지 제60항에 있어서, 이식유전자를 포함하고, 이식유전자는
- Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화하는 것인 벡터.
제54항 내지 제61항 중 한 항에 있어서,
벡터는 제40항 내지 제47항 중 한 항에 따른, 특히 제43항 내지 제47항 중 한 항에 따른 AAV 캡시드를 암호화하는 핵산 서열을 추가로 포함하는 벡터.
제54항 내지 제62항의 조합에 있어서,
키메라 옵신 GPCR을 암호화하는 이식유전자에 작동 가능하게 연결된 770En-445P(hGRM6) 프로모터를 포함하고,
AAV2(7m8), AAV8(BP2), AAV2(NHAPNHC) 및 AAV2(PRTPHTA)를 포함하는 군으로부터 선택된 캡시드를 암호화하는 핵산 서열을 추가로 포함하고,
특히 이식유전자는
- 상류 옵신으로서 멜라놉신 또는 hOPN1mw를 포함하고 표적 옵신으로서 mGluR6을 포함하는 키메라 옵신 GPCR 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR,
- Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6으로부터 선택된 키메라 옵신 GPCR
- 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 서열번호 29 또는 서열번호 31을 포함하는 군으로부터 선택된 핵산 서열에 의해 암호화된 키메라 옵신 GPCR
을 포함하는 군으로부터 선택된 키메라 옵신 GPCR을 암호화하는 것인 벡터.
제54항 또는 제55항에 있어서, 서열번호 79에 따른 서열이 있는 핵산 분자를 포함하거나 이로 구성된 벡터.
트랜스제닉 동물, 특히 트랜스제닉 마우스, 또는 트랜스제닉 세포로서, 제36항 내지 제39항 중 한 항에 따른 핵산 분자를 포함하거나 제54항 내지 제64항 중 한 항에 따른 벡터를 포함하고/하거나, 제1항 내지 제35항 중 한 항에 따른 옵신-GPCR 단백질을 포함하는 트랜스제닉 동물, 특히 트랜스제닉 마우스, 또는 트랜스제닉 세포.
제60항에 있어서, 줄기 세포주 - 특히, 생식 세포주는 제외 -로부터 유래되거나, 또는 세포는 기관형 세포주, 특히
- HEK293-GIRK 세포
- 내부 망막 뉴런, 특히 ON 두극세포,
- 신장 세포 및
- Gs, Gq 또는 G_12/13으로부터 선택된 G 단백질을 발현하는 세포
를 포함하는 세포주의 군으로부터 선택된 기관형 세포주로부터 선택되는 트랜스제닉 세포.
제65항 또는 제66항에 있어서, CRISPR/cas 변형된 게놈을 포함하는 트랜스제닉 동물 또는 트랜스제닉 세포.
운반체로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는
제36항 내지 제39항 중 한 항에 따른 핵산 분자 또는 제54항 내지 제64항 중 한 항에 따른 벡터
를 포함하고,
핵산 분자 또는 벡터는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하고,
운반체는 표적 세포 또는 인간 또는 비인간 동물로의 상기 키메라 옵신 GPCR의 전달에 적합하고,
선택적으로 소포, 입자, 마이크로입자, 나노 입자 및 금 입자를 포함하는 군으로부터 선택되는 운반체.
제68항에 있어서, 이식유전자 및 CRISPR/cas 카세트를 포함하는 운반체.
제65항 내지 제69항 중 한 항에 있어서, 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는, 제65항 내지 제67항 중 한 항에 따른 트랜스제닉 동물 또는 트랜스제닉 세포 또는 제68항 또는 제69항에 따른 전달용 운반체.
제65항 내지 제69항 중 한 항에 있어서,
이식유전자는
- Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화하는 것인, 제65항 내지 제67항 중 한 항에 따른 트랜스제닉 동물 또는 트랜스제닉 세포 또는 제68항 또는 제69항에 따른 전달용 운반체.
키메라 옵신 GPCR 단백질 또는 키메라 펩티드, 특히 제1항 내지 제35항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는 키메라 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법으로서,
상기 키메라 옵신 GPCR 단백질 또는 상기 키메라 펩티드는 절단된 상류 옵신 CT를 포함하는 키메라 C 말단 도메인(키메라 CT)을 포함하고,
상기 키메라 CT는 모 상류 옵신 CT 및 모 표적 GPCR CT로부터 유래되고,
단계:
A-1 O-CT-근위 영역의 원위 말단의 아미노산 위치 또는 O-CT-근위 영역에 대한 원위 연장부 내의 아미노산 위치에서 모 상류 옵신의 CT의 절단 부위 (x)를 선택하는 단계,
A-2 선택된 절단 부위에서 절단된 절단 CT를 갖는 상류 옵신 부분 또는 펩티드를 암호화하는 핵산 분자를 수득하는 단계;
B-1 모 표적 GPCR CT의 근위 영역 내, 특히 NR(K)Q 모티프 또는 이의 상류에서 또는 NPxxY와 NR(K)Q 모티프 사이에서 절삭 부위 (y)를 선택하는 단계,
B-2 표적 GPCR CT 또는 이의 기능적 변이체, 특히 이의 기능적 단편을 암호화하는 핵산 분자를 수득하는 단계; 및
C-1 단계 A-2에서 수득된 절단된 옵신-CT를 암호화하는 핵산 분자를 단계 B-2에서 수득된 표적 CT 또는 이의 기능적 변이체를 암호화하는 핵산 분자와 융합시키는 단계;
를 포함하는 방법.
제72항에 있어서, 단계 A-1에서 절단 부위 (x)는 다음을 포함하는 기준의 군으로부터 선택된 기준 중 하나 이상을 충족하는 것인 방법:
- 절단 부위 (x)는 NR(K)Q 모티프의 하류에서 또는 적어도 7 또는 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치한 뉴클레오티드에 위치한다,
- 절단 부위 (x)는 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산의 하류 및 특히 이의 원위쪽으로 인접하여 위치한다,
- 절단 부위는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다.
제72항에 있어서, 특히 상류 옵신은 멜라놉신이고, 단계 A-1에서 절단 부위 (x)는 다음을 포함하는 기준의 군으로부터 선택된 기준 중 하나 이상을 충족하는 것인 방법:
- 절단 부위 (x)는 O-CT-근위 영역의 하류에서 최대 30개 또는 31개 또는 32개 또는 33개 또는 34개 또는 35개 아미노산, 특히 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 위치한다,
- 절단 부위 (x)는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다,
- 절단 부위는 인산화 부위의 보존된 클러스터의 하류의 아미노산 위치, 특히 상기 보존된 인산화 부위의 클러스터의 원위 말단에 원위쪽으로 인접하여 위치한다.
제72항에 있어서, 단계 A-1에서 선택된 상류 옵신의 절단 부위 x 및 단계 B-1에서 선택된 표적 GPCR의 절삭 부위 y는 둘 다 각각의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치에 위치하거나, 또는둘 다 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개, 또는 약 10개의 아미노산에 위치하는 것인 유전자 조작 방법.
제72항 내지 제75항 중 한 항에 있어서, 하나 이상의 세포내 루프를 교체하거나 부분적으로 교체하는 하나 이상의 추가 단계, 특히 상응하는 위치에서 상류 옵신의 하나 이상의 세포내 루프 또는 부분 세포내 루프를 표적 GPCR의 세포내 루프로 교환하는 하나 이상의 추가 단계를 포함하고,
특히 하나 이상의 스플라이싱 부위는
- IL1 교환을 위한 접합부 a 및 접합부 b
- IL2 교환을 위한 접합부 c 및 접합부 d
- IL3 교환을 위한 접합부 e 및 접합부 f
- 표적 GPCR의 IL3과의 교환에서 상류 옵신 IL3의 고도로 가변적인 영역을 제거하는 IL3 내의 2개의 스플라이싱 부위
를 포함하는 군으로부터 선택되는 것인 유전자 조작 방법.
제72항 내지 제76항 중 한 항에 있어서, 단계 A 및 또는 단계 B 전에 모 GPCR을 암호화하는 핵산 서열 중 하나 또는 둘 모두의 보존된 모티프의 확인을 추가로 포함하고, 이는
- 선택적으로 서열 정렬 도구를 사용하여 옵신 또는 이의 단편의 아미노산 서열을 표적 GPCR 또는 이의 단편의 아미노산 서열과 정렬하는 단계,
- 특히,
- E(D)RY/NRI,
- IL3과 TM6의 접합부 주변의 E,
- NPxxY,
- NR(K)Q,
- 팔미토일화된 C 및
- 표적 GPCR이 또한 옵신인 경우 TM7의 발색단의 결합을 위한 K
를 포함하는 보존된 모티프의 군으로부터 선택된 보존된 모티프를 구성하는 아미노산 위치를 결정하는 단계를 포함하고,
선택적으로 옵신의 아미노산 서열은 보존된 모티프를 구성하는 아미노산 위치의 확인을 위해 소 로돕신의 아미노산 서열과 정렬되는 것인 유전자 조작 방법.
제72항 내지 제77항 중 한 항에 있어서, 단계 A 및/또는 단계 B 전에 1차 아미노산 서열을 2차/3차 단백질 구조의 예측을 위한 프로그램에 입력하는 단계를 포함하는, 모 옵신 및 모 표적 GPCR 중 하나 또는 둘 모두에서 보존된 3D GPCR 도메인 또는 서브도메인, 특히 서브도메인 나선 8의 확인을 추가로 포함하는 유전자 조작 방법.
의학적 사용, 특히 유전자 요법을 위한, 제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포.
제79항에 따른 사용을 위한, 키메라 옵신 GPCR 단백질,
또는 상기 옵신 GPCR을 암호화하는 핵산 분자,
또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자,
또는 벡터 또는 운반체 또는 세포로서,
사용의 목적은 시력 개선, 부분 또는 완전 실명의 치료, 색소성 망막염(RP)의 치료, 황반 변성의 치료 및 다른 형태의 광수용체 변성의 치료를 포함하는 군으로부터 선택되는 것인 키메라 옵신 GPCR 단백질, 또는 상기 옵신 GPCR을 암호화하는 핵산 분자, 또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 벡터 또는 운반체 또는 세포.
제79항 또는 제80항에 따른 사용을 위한, 키메라 옵신 GPCR 단백질,
또는 상기 옵신 GPCR을 암호화하는 핵산 분자,
또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자,
또는 벡터 또는 운반체 또는 세포로서,
키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고, 특히 표적 옵신은 원추형 옵신 또는 로돕신인, 키메라 옵신 GPCR 단백질, 또는 상기 옵신 GPCR을 암호화하는 핵산 분자, 또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 벡터 또는 운반체 또는 세포.
제품을 포함하는 제약 조성물로서, 제품은
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
를 포함하고,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 제약 조성물.
치료를 필요로 하는 인간 또는 비인간 동물을 치료하는 방법으로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
의 투여를 포함하고,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 방법.
시력 개선, 또는 부분 또는 완전 실명의 치료, 또는 색소성 망막염(RP)의 치료, 또는 황반 변성의 치료 또는 다른 형태의 광수용체 변성의 치료를 위한 의료 요법용 약제의 제조에 있어서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포의 용도로서,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 용도.
제79항 내지 제84항 중 한 항에 따른 의학적 적용으로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
를 포함하는 제품의 군으로부터 선택된 제품을 포함하고,
제품은 키메라 옵신 GPCR 단백질을 포함하거나 상기 키메라 옵신 GPCR 단백질을 암호화하는 핵산 서열을 포함하는 핵산 분자를 포함하고,
키메라 옵신 GPCR은
- Mela(palm)-mGluR6, 특히 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 서열에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 16에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 30 또는 서열번호 32로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택되는 것인 의학적 적용.