KR20230087436A

KR20230087436A - 당뇨병을 치료하기 위한 변형된 인슐린 및 글루코키나제 핵산

Info

Publication number: KR20230087436A
Application number: KR1020237003717A
Authority: KR
Inventors: 나치 굽타; 웨이란 션; 미켈 가르시아 마르티네즈; 베로니카 히메네즈 센자노; 마리아 파티마 보쉬 투베르트
Original assignee: 크리야 테라퓨틱스, 인크.; 우니버시타트 아우토노마 데 바르셀로나
Priority date: 2020-07-03
Filing date: 2021-07-02
Publication date: 2023-06-16
Also published as: MX2023000099A; JP2023542241A; CA3174156A1; WO2022006551A2; WO2022006551A3; EP4176060A2; CN116234904A; IL299545A; AU2021300450A1

Abstract

본 개시내용은 인슐린 및 글루코키나제를 코딩하는 변형된 핵산 서열, 이를 포함하는 발현 카세트 및 전달 벡터, 및 당뇨병을 치료하기 위한 이의 전달 방법에 관한 것이다.

Description

당뇨병을 치료하기 위한 변형된 인슐린 및 글루코키나제 핵산

관련 출원에 대한 상호 참조

본 출원은 2020년 7월 3일에 출원된 미국 가출원 번호 63/047,965; 2020년 7월 20일에 출원된 미국 가출원 번호 63/054,162; 2020년 8월 18일에 출원된 미국 가출원 번호 63/067,264; 2021년 1월 26일에 출원된 미국 가출원 번호 63/141,918; 및 2021년 5월 14일에 출원된 미국 가출원 번호 63/188,788의 우선권을 주장하며, 이들의 각각은 그 전문이 본원에 참조로 포함된다.

전자적으로 제출된 서열 목록에 대한 참조

본 출원과 함께 출원된 ASCII 텍스트 파일 (4525_016PC05_Seqlisting_ST25; 크기: 240,360 바이트; 및 생성일: 2021년 6월 30일)로의 전자적으로 제출된 서열 목록의 내용은 그 전문이 본원에 참조로 포함된다.

진성 당뇨병의 2가지 주요한 형태는 제1형 (T1DM) 및 제2형 (T2DM)이다 (Diabetes care, 1997, 20-1183-1197).

T1DM은 췌장 β-세포의 특이적 파괴로 인한 인슐린 생산의 극심한 결여를 특징으로 한다. T1DM에서의 β-세포 소실은 췌도염으로 지칭되는 만성 염증이 β-세포 파괴를 유발하는 자가면역 매개 과정의 결과이다 (문헌 [Eizirik D. L. et al., 2001, Diabetologia, 44:2115-2133] 및 [Mathis D et al., 2001, Nature, 414: 792-798]). T1DM은 아동기의 가장 통상적인 내분비 및 대사 상태 중 하나이며; 발생은 특히 어린 아동 사이에 급속하게 증가하고 있다. T1DM은 자가면역-매개 β-세포 파괴가 거의 완전하여 환자가 생존하기 위해 인슐린-대체 요법을 필요로 하도록 할 경우 진단된다. 성인에서의 T1DM은 T2DM과 유사하게 나타날 수 있으며, 이는 대사 제어에 있어서의 느린 악화, 및 인슐린 의존성으로의 후속 진행을 갖는다. 이 형태는 성인에서 잠재성 자가면역 진성 당뇨병 (LADA)으로 지칭된다 (Diabetes Atlas 4th edition, 2009, International Diabetes Federation).

T2DM은 진성 당뇨병의 가장 통상적인 형태이며, 유전적, 환경적, 및 행동적 위험 인자 사이의 상호작용에 기인하였다. T2DM은 인슐린 무감응, 감소하는 인슐린 생산, 및 궁극적인 췌장 베타-세포 부전을 특징으로 한다 (Olokoba, A. et al., 2012, Oman Med. J. 27(4):269-273).

일생의 인슐린 치료는 종종 T1DM 및 T2DM 둘 다를 위한 선택의 요법이다. 외인성 인슐린으로의 일생의 치료는 당뇨병을 관리하는데 있어서 매우 성공적이었지만, 엄격한 혈당 제어를 유지하는 것으로의 곤란함으로 인해 당뇨병성 합병증이 여전히 발생할 수 있다. 연장된 고혈당증의 상태는 가장 통상적으로 망막병증, 신경병증, 신장병증, 뇌혈관 사고, 또는 심근 경색으로서 나타나는 중증 미세혈관 또는 거대혈관 합병증을 초래할 수 있다. 이들 파괴적인 합병증은 혈당 제어의 개선으로 예방될 수 있다. 중요하게는, 특히 불안정한 형태인 불안정형 당뇨병은 심지어 일생의 외인성 인슐린으로도 관리하기가 매우 곤란할 수 있다.

추가로, 많은 저개발국에서는, 자기-치료 도구에 대한 및 인슐린에 대한 접근이 제한될 수 있으며, 이는 당뇨병 아동에서 극심한 장애 및 조기 사망을 초래할 수 있다 (문헌 [Diabetes Atlas 4th edition, 2009, International Diabetes Federation, Beran D. et al 2006, Lancet, 368: 1689-1695], 및 [Gale E. A., et al, 2006, Lancet, 368: 1626-1628]). 범세계적 관점에서, 당뇨병을 갖는 아동에서 사망의 가장 통상적인 원인은 인슐린에 대한 접근의 결여이다. 따라서, 일회성 유전자 요법의 이용가능성은 인슐린에 대한 접근이 제한된 상황에서 현저한 효과를 가질 수 있다 (Greenwood H. L. et al., 2006, PLoS Med 3.e381).

고혈당증의 감소 및 정상혈당의 유지는 T1DM 및 T2DM에 대한 임의의 치료 접근법의 목표이다. 대부분의 당뇨병 환자에 대한 현재의 요법은 단기-작용 및 장기-작용 인슐린 제제 둘 다의 규칙적인 피하 주사에 기반한다.

개시내용의 분야

본 개시내용은 당뇨병의 치료에 사용하기 위한 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산을 포함하는 유전자 요법 조성물을 포함하는 의학 분야에 관한 것이다.

간단한 요약

본 개시내용의 특정 측면은 (i) 신호 펩티드를 코딩하는 뉴클레오티드 서열로서, 임의로 여기서 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아닌 것인 뉴클레오티드 서열, 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산 위치에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는, 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하고, 임의로 절단 부위를 추가로 포함하는 폴리뉴클레오티드에 관한 것이다. 일부 측면에서, 신호 펩티드는 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열이다. 일부 측면에서, 절단 부위는 푸린 절단 부위이다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 (i) 신호 펩티드를 코딩하는 뉴클레오티드 서열 및 (ii) 서열식별번호(SEQ ID NO): 43-57, 110-116, 150-151, 154-155 또는 157-159 중 어느 것의 핵산 73-330, 서열식별번호: 117-122, 152 또는 156 중 어느 것의 핵산 88-345, 또는 서열식별번호: 153의 핵산 79-336과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하는 것인 폴리뉴클레오티드에 관한 것이다.

일부 측면에서, 코딩된 인간 Ins 단백질은 (i) 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열) 및 (ii) 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110을 포함한다. 일부 측면에서, 코딩된 인간 인슐린 단백질은 절단 부위 (예를 들어, 푸린 절단 부위)를 추가로 포함한다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 서열식별번호: 43-57, 110-122, 또는 150-159 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하는 것인 폴리뉴클레오티드에 관한 것이다. 일부 측면에서, 폴리뉴클레오티드는 인간 Ins 단백질을 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 43-57, 110-122, 또는 150-159 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 적어도 2개의 ORF 뉴클레오티드 서열을 포함하고, 여기서 2개의 ORF 뉴클레오티드 서열은 동일하거나 상이할 수 있다. 일부 측면에서, 폴리뉴클레오티드는 IRES 서열을 추가로 포함한다. 일부 측면에서, 적어도 2개의 ORF 뉴클레오티드 서열은 IRES 서열에 의해 분리된다.

일부 측면에서, 코딩된 인간 Ins 단백질은 신호 서열 및 프로인슐린 폴리펩티드를 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110 중 어느 것의 아미노산 서열을 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 프리프로인슐린이다. 일부 측면에서, 코딩된 인간 Ins 단백질은 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145의 아미노산 서열을 포함한다.

일부 측면에서, 폴리뉴클레오티드 또는 핵산 서열은 5' UTR 및/또는 3' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산은 서열식별번호: 1-16, 84-88, 123-141, 또는 160-161 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함한다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 (i) 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 코딩하는 뉴클레오티드 서열 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형 (또는 야생형 프리프로인슐린에서의 상응하는 아미노산에 비해 아미노산 H34, P52, K53, R55, L86, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형)을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드에 관한 것이다.

일부 측면에서, 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아니다 (예를 들어, 야생형 프리프로인슐린 서열은 IL-6 신호 서열 또는 피브로넥틴 신호 서열로 대체됨). 일부 측면에서, 프로인슐린 폴리펩티드는 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110 중 어느 것의 아미노산 서열을 포함한다.

일부 측면에서, 폴리뉴클레오티드는 절단 부위 (예를 들어, 푸린 절단 부위)를 추가로 포함한다.

일부 측면에서, 코딩된 인간 Ins 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)은 (i) H34D, H34I, 또는 H34V (또는 프로인슐린 B-쇄의 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D), 이소류신 (I) 또는 발린 (V)으로), 및/또는 (ii) 야생형 프리프로인슐린 서열에 비해 P52, K53, R55, 및/또는 L86 (또는 프로인슐린 B-쇄의 위치 B28 및/또는 B29 또는 프로인슐린 C-쇄의 위치 C1 및/또는 C32)에서의 하나 이상의 아미노산 변형으로부터 선택되는 아미노산 변형을 포함한다. 일부 측면에서, P52, K53, R55, 및/또는 L86에서의 하나 이상의 아미노산 변형은 P52D, K53R, R55K, L86R, 또는 이들의 임의의 조합을 포함한다 (또는 프로인슐린 B-쇄 또는 C-쇄에서의 하나 이상의 변형은 프로인슐린 B-쇄의 위치 B28에서의 프롤린 (P)에서 아스파르트산 (D)으로, 프로인슐린 B-쇄의 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 프로인슐린 C-쇄의 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 프로인슐린 C-쇄의 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로, 또는 이들의 임의의 조합을 포함함).

본 개시내용의 특정 측면은 인간 글루코키나제 (Gck) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 서열식별번호: 61-80 또는 162 중 어느 것의 핵산 1-1398; 또는 서열식별번호: 61-80 및 162 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 ORF를 포함하는 것인 폴리뉴클레오티드에 관한 것이다. 일부 측면에서, 코딩된 인간 Gck 단백질은 서열식별번호: 82의 아미노산 서열을 포함한다.

일부 측면에서, Gck 단백질을 코딩하는 폴리뉴클레오티드 또는 핵산 서열은 5' UTR 및/또는 3' UTR을 추가로 포함한다. 일부 측면에서, 핵산은 서열식별번호: 42, 서열식별번호: 42의 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 핵산은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산은 서열식별번호: 20-39 및 89-96, 및 163-164 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함한다.

일부 측면에서, 핵산은 프로모터 (예를 들어, 진핵 프로모터)에 작동가능하게 연결된다. 본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드 및 핵산 서열에 작동가능하게 연결된 이종 발현 제어 서열을 포함하는 발현 카세트에 관한 것이다. 일부 측면에서, 핵산은 폴리아데닐화 (폴리A) 요소에 작동가능하게 연결된다.

본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 (예를 들어, 바이러스 벡터, 비-바이러스 벡터, 플라스미드, 지질, 또는 리소좀)에 관한 것이다. 일부 측면에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터 또는 렌티바이러스 벡터이다. 본 개시내용의 특정 측면은 AAV 캡시드 및 본 개시내용의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 게놈을 포함하는 재조합 AAV (rAAV) 입자에 관한 것이다. 일부 측면에서, AAV 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVRH8, AAVrh9, AAV9, AAVrh10, AAV10, AAVRH10, AAV11, 및 AAV12로 이루어진 군으로부터 선택된다. 본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 포함하는 숙주 세포 (예를 들어, 포유동물 세포)에 관한 것이다.

본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 대상체에게 투여하고, 그에 의해 대상체에서 인간 Ins 단백질 및/또는 인간 Gck를 생산하는 것을 포함하는, 대상체에서 인간 Ins 단백질 및/또는 인간 Gck 단백질을 생산하는 방법에 관한 것이다. 본 개시내용의 특정 측면은 당뇨병과 연관된 증상의 치료 또는 개선을 필요로 하는 대상체에서 당뇨병과 연관된 증상을 치료하거나 개선시키는 방법에 관한 것이며, 이는 본 개시내용의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자의 치료 유효량을 대상체에게 전달하고, 그에 의해 대상체에서 당뇨병을 치료하는 것을 포함한다. 일부 측면에서, 당뇨병은 제1형 진성 당뇨병 (T1DM) 또는 제2형 진성 당뇨병 (T2DM)이다.

일부 측면에서, 본원에 개시된 방법은 인간 인슐린을 코딩하는 제1 폴리뉴클레오티드 및 인간 Gck를 코딩하는 제2 폴리뉴클레오티드를 포함하는 복수의 폴리뉴클레오티드; 인간 인슐린을 코딩하는 폴리뉴클레오티드를 포함하는 제1 발현 카세트 및 인간 Gck를 코딩하는 폴리뉴클레오티드를 포함하는 제2 발현 카세트를 포함하는 복수의 발현 카세트; 인간 인슐린을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함하는 제1 벡터 및 인간 Gck를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함하는 제2 벡터를 포함하는 복수의 벡터; 또는 인간 인슐린을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함하는 제1 rAAV 입자 및 인간 Gck를 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함하는 제2 rAAV 입자를 포함하는 복수의 rAAV 입자를 대상체에게 투여하는 것을 포함한다. 일부 측면에서, 복수의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자는 동시에 또는 순차적으로 투여된다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자의 전달 및/또는 투여는 근육내이다. 일부 측면에서, 본 개시내용의 방법은 (i) 대상체에서의 당화 혈액 헤모글로빈 (HbA1c) 수준의 감소 및/또는 조절; (ii) 대상체에서의 순환 케톤의 감소, (iii) 대상체에서의 트리글리세리드의 감소, 또는 (iv) 이들의 임의의 조합을 제공한다.

도 1A는 인간 인슐린 (hIns) 비변형된 핵산 서열 (서열식별번호: 1, 서열식별번호: 127, 및 서열식별번호: 160) 및 변형된 hIns 핵산 서열 (서열식별번호: 2-16, 84-88, 123-126, 및 128-141)을 포함하는 핵산 서열 구축물의 목록을 제시한다. 서열은 3' UTR, ORF, 및 5' UTR 핵산 서열을 포함한다. 특정 서열은 또한 IRES 서열을 포함한다. HEK 세포 내로 형질감염된 예시적인 pAAV-Ins 플라스미드는 우측 칼럼에 제시된다.
도 1B 및 1C는 0.5ug/웰 (도 1B) 또는 0.1ug/웰 (도 1C) pAAV-인슐린 플라스미드 중 어느 하나로 형질감염된 HEK 세포로부터의 인슐린 분비를 제시하는 그래프이다. 각각의 플라스미드의 인슐린 발현 수준을 대조군 플라스미드 (AAV1-CMV-hInsB10D_2)와 비교하였다.
도 2A는 인간 글루코키나제 (hGcK) 야생형 핵산 서열 (서열식별번호: 19 및 서열식별번호: 163) 및 변형된 hGcK 핵산 서열 (서열식별번호: 20-39 및 89-96)을 포함하는 핵산 서열 구축물의 목록을 제시한다. 서열은 3' UTR, ORF, 및 5' UTR 핵산 서열을 포함한다. HEK 세포 내로 형질감염된 예시적인 pAAV-Gck 플라스미드는 우측 칼럼에 제시된다.
도 2B는 2.5ug/웰 pAAV-Gck 플라스미드로 형질감염된 HEK 세포에서의 글루코키나제 발현을 제시하는 그래프이다. 각각의 플라스미드의 GcK 발현 수준을 대조군 플라스미드 (AAV1-CMV-hGcKWT_2)와 비교하였다.
도 3A-3C는 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 및 3회의 독립적인 연구에서 벡터 AAV1-CMV-hInsB10D-9 (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88)로 감염된 2v6.11 세포의 세포 추출물에서의 세포내 AAV1-h인슐린 벡터 게놈 (vg) 양을 제시하는 그래프이다. 도 3A는 검정 1이고, 도 3B는 검정 2이고, 도 3C는 검정 3이다.
도 4A-4C는 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 및 3회의 독립적인 연구에서 벡터 AAV1-CMV-hInsB10D (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88)로 감염된 2v6.11 세포에서의 인간 인슐린 mRNA 발현 수준을 제시하는 그래프이다. 도 4A는 검정 1이고, 도 4B는 검정 2이고, 도 4C는 검정 3이다.
도 5A-5C는 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 AAV1-CMV-hInsB10D (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88)로의 2v6.11 세포의 3회의 독립적인 감염 연구 후에 측정된 분비된 인간 인슐린 (mU/L) 수준을 제시하는 그래프이다. 도 5A는 검정 1이고, 도 5B는 검정 2이고, 도 5C는 검정 3이다.
도 6A-6C는 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 A AAV1-CMV-hInsB10D (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88)로의 2v6.11 세포의 3회의 독립적인 감염 연구 후에 측정된 분비된 인간 인슐린의 기능성을 제시하는 그래프이다. 활성은 표준 참조물로서 재조합 인간 인슐린 (라이프 테크놀로지스(Life Technologies))을 사용하여 ng/ml로서 표현된다. 도 6A는 검정 1이고, 도 6B는 검정 2이고, 도 6C는 검정 3이다.
도 7A-7C는 3회의 독립적인 검정에서 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 AAV1-CMV-hGckWT (야생형) (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)로 감염된 2v6.11 세포의 세포 추출물에서의 세포내 AAV1-h글루코키나제 벡터 게놈 (vg) 양을 제시하는 그래프이다. 도 7A는 검정 1이고, 도 7B는 검정 2이고, 도 7C는 검정 3이다.
도 8A-8C는 3회의 독립적인 검정에서 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 AAV1-CMV-hGckWT (야생형) (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)로 감염된 2v6.11 세포에서의 인간 글루코키나제 mRNA 발현 수준을 제시하는 그래프이다. 도 8A는 검정 1이고, 도 8B는 검정 2이고, 도 8C는 검정 3이다.
도 9A-9C는 3회의 독립적인 검정에서 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 AAV1-CMV-hGckWT (야생형) (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)로의 2v6.11 세포의 3회의 독립적인 감염 연구 후에 측정된 세포내 글루코키나제 수준 (ng/mg)을 제시하는 그래프이다. 도 9A는 검정 1이고, 도 9B는 검정 2이고, 도 9C는 검정 3이다.
도 10A-10C는 3회의 독립적인 검정에서 3개의 상이한 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))로 벡터 AAV1-CMV-hGckWT (야생형) (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)로의 2v6.11 세포의 3회의 독립적인 감염 연구 후에 세포 추출물에서 측정된 글루코키나제 효소 활성 (mU/mg)을 제시하는 그래프이다. 도 10A는 검정 1이고, 도 10B는 검정 2이고, 도 10C는 검정 3이다.
도 11A-11C는 주사 후 3주 (도 11A), 4주 (도 11B), 및 5주 (도 11C)에 인간 인슐린 유전자를 함유하는 AAV1 (서열식별번호: 1) 및 래트 글루코키나제 유전자를 함유하는 AAV1로 감염된 개별적인 C57Blk6 마우스에 대한 급식된 또는 절식된 상태 하에서의 글루코스 수준을 제시하는 그래프이다. 도 11B에서의 사 (4) 주 시점은 절식된 상태 하에서 수집되었다.
도 12는 주사 후 5-주 기간에 걸쳐 시험된 인간 인슐린 유전자를 함유하는 AAV1 (서열식별번호: 1) 및 래트 글루코키나제 유전자를 함유하는 AAV1로 주사된 C57Blk6 마우스에서의 급식된 또는 절식된 상태 하에서의 평균 글루코스 수준을 제시하는 그래프이다. 시점은 절식된 상태 하에서 수집된 사 (4) 주 시점에 대해서를 제외하고 급식된 상태 하에서 수집되었다.
도 13A-13B는 변형된 인슐린 핵산 서열을 포함하는 AAV 플라스미드 (pAAV)로 형질감염된 HEK293 세포에 대한 세포내 인슐린 함량 및 분비된 인슐린 수준을 제시하는 그래프이다.
도 14A-14D는 변형된 인슐린 핵산 서열을 포함하는 pAAV로 형질감염된 HEK293 세포에서의 인슐린의 발현 수준을 제시하는 그래프이다.
도 15는 변형된 인슐린 핵산 서열을 포함하는 pAAV로 형질감염된 HEK293 세포에 대한 분비된 인슐린 수준을 제시하는 그래프이다.
도 16A-16F는 변형된 인슐린 핵산 서열을 포함하는 AAV 벡터로 처리된 CD1 마우스의 경구 글루코스 내성 시험 후의 혈액 글루코스 수준을 제시하는 그래프이다.
도 17은 변형된 인슐린 핵산 서열을 포함하는 AAV 벡터로 처리된 건강한 마우스의 절식 글루코스 수준을 제시하는 그래프이다. 측정은 AAV 투여 후 삼 (3) 주에 취해졌다.
도 18A-18C는 인간 TLR9를 과발현하도록 변형되고, 이어서 AAV-ratGck 또는 AAV-hInsB10_2 (도 18A); AAV1-hGckWT, AAV1-hGck8, 또는 AAV1-hGck12 (도 18B); 및 AAV1-CMV-hInsB10D, AAV1-hIns5, 또는 AAV1-hIns7 (도 18C)로 형질도입된 HEK 세포에서의 TLR9 자극을 제시하는 그래프이다.
도 19는 제1형 당뇨병의 STZ-유도된 마우스 모델에서의 시간 경과에 따른 평균 혈액 글루코스 수준을 제시하는 그래프이다. 채워진 원은 비-STZ+PBS 비히클 대조군을; 비어 있는 원은 STZ+PBS 대조군을; 비어 있는 삼각형은 AAV1_926 + AAV1_927 (높은 용량)을; 파선을 갖는 채워진 삼각형은 B10H AAV1-Gck (높은 용량)를; 채워진 마름모는 Ins-B10H+IL6 AAV1-Gck (낮은 용량)를; 실선을 갖는 채워진 삼각형은 B10H AAV1-Gck (중간 용량)를; 비어 있는 마름모는 B10H+IL6AAV1-Gck (높은 용량)를 나타낸다.
도 20A 및 20B는 AAV1_926 + AAV1_927 (높은 용량), B10D AAV1-Gck2 (낮은 용량), B10H-IL6 AAV1-Gck (낮은 용량), B10H-IL6 AAV1-Gck (높은 용량), 또는 PBS 대조군의 i.m. 투여 후 4주에 절식된 대조군 또는 STZ-처리된 마우스에서의 순환 인간 인슐린 (ng/mL)의 수준을 제시하는 그래프이다. 순환 인슐린 수준은 불량한 건강/저혈당증으로 인해 죽었거나 안락사된 동물에서는 결정되지 않았다. 도 20B에서의 파선은 절식된 상태 하에서의 비-당뇨병 C57BL/6 마우스에서의 순환 인슐린 수준을 나타낸다.
도 21은 B10H AAV1-Gck (높은 용량), Ins-B10H-IL6 AAV1-Gck (낮은 용량), 또는 비히클 대조군의 투여 후 8주에 수행된 대조군 또는 STZ-처리된 마우스에서의 경구 글루코스 내성 시험의 결과를 제시하는 그래프이다.
도 22는 B10H AAV1-Gck (높은 용량), B10H+IL6 AAV1-Gck (낮은 용량), 또는 비히클 대조군의 투여 후 8주에 수행된 대조군 또는 STZ 처리된 마우스에서의 글루코스 챌린지 후 0 내지 120분에 계산된 혈액 글루코스 수준의 곡선하 면적 (AUC)을 제시하는 그래프이다.
도 23A 및 23B는 B10H AAV1-Gck (높은 용량), Ins-B10D AAV-Gck (낮은 용량), Ins-B10D AAV-Gck (중간 용량), Ins-B10H+IL6 AAV1-Gck (낮은 용량), Ins-B10H+IL6 AAV1-Gck (높은 용량) 또는 비히클 대조군 (도 23A) 또는 B10H-AAV1-Gck (높은 용량), Ins-B10H+IL6 AAV1-Gck (낮은 용량), 또는 비히클 대조군 (도 23B)의 투여 후 8주에 대조군 및 STZ-처리된 마우스에서의 HbA1c 수준을 제시하는 그래프이다. HbA1C 수준은 불량한 건강/저혈당증으로 인해 죽었거나 안락사된 동물에서는 결정되지 않았다.
도 24A-24B는 B10H AAV1-Gck (낮은 용량), B10H AAV1-Gck (높은 용량), Ins-B10D AAV1-Gck (낮은 용량), Ins-B10D AAV1-Gck (중간 용량), Ins-B10H+IL6 AAV1-Gck (낮은 용량), Ins-B10H+IL6 AAV1-Gck (높은 용량), 또는 비히클 대조군의 투여 후의 대조군 또는 STZ-처리된 마우스에서의 혈청 트리글리세리드 (도 24A) 또는 케톤 (도 24B) 수준을 제시하는 그래프이다.
도 25는 AAV1mTWhIns+AAV1rGck (KT1+AAV926; 높은 용량), AAV1mWTINS + AAV1rGck (INS-17 + AAV926; 낮은 용량), 또는 AAV1mWThINS + AAV1rGck (INS-17 + AAV926; 높은 용량)의 투여 후의 STZ 처리된 마우스의 간에서의 hINS 발현을 제시하는 그래프이다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시내용이 속하는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 상충하는 경우, 정의를 포함하는 본 개시내용이 지배할 것이다. 맥락에 의해 달리 요구되지 않는 한, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다.

본 개시내용 전반에 걸쳐, 단수 용어 실체는 그 실체의 하나 이상을 지칭하며; 예를 들어, "폴리뉴클레오티드"는 하나 이상의 폴리뉴클레오티드를 나타내는 것으로 이해된다. 따라서, 용어 "하나", "하나 이상", 및 "적어도 하나"는 본원에서 상호교환가능하게 사용될 수 있다.

더욱이, 본원에 사용되는 경우 "및/또는"은 다른 것과 함께 또는 없이 2개의 특정된 특색 또는 성분의 각각의 구체적인 개시내용으로서 취해져야 한다. 따라서, 본원에서 "A 및/또는 B"와 같은 어구에 사용된 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" (단독), 및 "B" (단독)를 포함하는 것으로 의도된다. 마찬가지로, "A, B, 및/또는 C"와 같은 어구에 사용된 용어 "및/또는"은 하기 측면의 각각을 포괄하는 것으로 의도된다: A, B, 및 C; A, B, 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A (단독); B (단독); 및 C (단독).

용어 "약"은 대략, 대략적으로, 주위의, 또는 그의 영역에서를 의미하기 위해 본원에서 사용된다. 용어 "약"이 수치 범위와 함께 사용되는 경우, 이는 경계를 제시된 수치 범위 위 및 아래로 연장시킴으로써 그 범위를 수식한다. 일반적으로, 용어 "약"은 달리 지시되지 않는 한, 수치 값을 위 또는 아래 (초과 또는 미만)로 10 퍼센트의 분산에 의해 언급된 값 위 및 아래로 수식하기 위해 본원에서 사용된다.

수 또는 일련의 수 앞의 용어 "적어도"는 맥락으로부터 명백한 바와 같이, 용어 "적어도"에 인접한 수, 및 논리적으로 포함될 수 있는 모든 후속 수 또는 정수를 포함하는 것으로 이해된다. 예를 들어, 핵산 분자에서 뉴클레오티드의 수는 정수여야 한다. 예를 들어, "21-뉴클레오티드 핵산 분자의 적어도 18개의 뉴클레오티드"는 18, 19, 20, 또는 21개의 뉴클레오티드가 지시된 특성을 가짐을 의미한다. 적어도가 일련의 수 또는 범위 앞에 존재하는 경우, "적어도"는 일련 또는 범위에서 수의 각각을 수식할 수 있는 것으로 이해된다. "적어도"는 또한 정수에 제한되지 않는다 (예를 들어, "적어도 5%"는 유효 숫자의 수를 고려하지 않고 5.0%, 5.1%, 5.18%를 포함함).

뉴클레오티드 서열은 구체적으로 달리 지시되지 않는 한, 본원에서 단지 단일 가닥에 의해 5'에서 3' 방향으로 좌측에서 우측으로 제시된다. 뉴클레오티드 및 아미노산은 본원에서 IUPAC-IUB 생화학 명명법 위원회에 의해 권고된 방식으로, 또는 (아미노산에 대해) 1-문자 부호, 또는 3 문자 부호 (둘 다 37 CFR §1.822 및 확립된 용법에 따라) 중 어느 하나에 의해 나타내어진다.

본원에 사용된 "폴리뉴클레오티드" 또는 "핵산"은 포스포디에스테르 연결에 의해 연결된 뉴클레오티드의 서열을 의미한다. 폴리뉴클레오티드는 본원에서 5'에서 3' 방향의 방향으로 제시된다. 본 개시내용의 폴리뉴클레오티드는 데옥시리보핵산 (DNA) 분자 또는 리보핵산 (RNA) 분자일 수 있다. 뉴클레오티드 염기는 본원에서 단일 문자 부호에 의해 지시된다: 아데닌 (A), 구아닌 (G), 티민 (T), 시토신 (C), 이노신 (I) 및 우라실 (U).

본원에 사용된 용어 "폴리펩티드"는 달리 지시되지 않는 한, 펩티드 및 단백질 둘 다를 포괄한다.

용어 "코딩 서열" 또는 "코딩하는 서열"은 특정한 단백질, 예를 들어, 예컨대 인슐린 또는 글루코키나제를 "코딩하는" DNA 또는 RNA 영역 (전사된 영역)을 의미하기 위해 본원에서 사용된다. 코딩 서열은 적절한 조절 영역, 예컨대 프로모터의 제어 하에 놓이는 경우, 시험관내에서 또는 생체내에서 전사되고 (DNA), 폴리펩티드로 번역된다 (RNA). 코딩 서열의 경계는 5' (아미노) 말단에서 시작 코돈 및 3' (카르복시) 말단에서 번역 정지 코돈에 의해 결정된다. 코딩 서열은 원핵생물 또는 진핵생물로부터의 cDNA, 원핵생물 또는 진핵생물로부터의 게놈 DNA, 및 합성 DNA 서열을 포함할 수 있으나 이에 제한되지는 않는다. 전사 종결 서열은 코딩 서열에 대해 3'에 위치할 수 있다.

유전자는 몇몇 작동가능하게 연결된 단편, 예컨대 예를 들어, 폴리아데닐화 부위 또는 신호 서열을 포함하는 프로모터, 5' 리더 서열, 인트론, 코딩 서열 및 3'-비번역된 서열을 포함할 수 있다. 본원에 사용된 "유전자의 발현"은 유전자가 RNA로 전사되고/거나 활성 단백질로 번역되는 과정을 지칭한다.

본원에 사용된 오픈 리딩 프레임 (ORF)은 번역되는 능력을 갖는 리딩 프레임의 부분이다. ORF는 시작 코돈으로 시작하고 정지 코돈에서 종료하는 코돈의 연속적 스트레치이다. 일부 측면에서, ORF 서열은 시작 코돈 서열 및/또는 정지 코돈 서열과 함께 또는 없이 제시되거나 언급될 수 있다.

코작(Kozak) 컨센서스 서열, 코작 컨센서스 또는 코작 서열은 진핵 mRNA 상에서 발생하고 컨센서스 (gcc)gccRccAUGG를 갖는 서열로 공지되어 있으며, 여기서 R은 또 다른 "G"에 의해 이어진 시작 코돈 (AUG)의 3개의 염기 상류의 퓨린 (아데닌 또는 구아닌)이다. 일부 측면에서, 폴리뉴클레오티드는 코작 컨센서스 서열과 적어도 95%, 적어도 99% 서열 동일성, 또는 그 초과를 갖는 핵산 서열을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 코작 컨센서스 서열을 포함한다.

용어 "서열 동일성"은 서열을 비교함으로써 결정된 바와 같은, 2개 이상의 아미노산 (폴리펩티드 또는 단백질) 서열 또는 2개 이상의 핵산 (폴리뉴클레오티드) 서열 사이의 관계를 의미하기 위해 본원에서 사용된다. 특정 측면에서, 서열 동일성은 2개의 주어진 서열식별번호의 전장에 또는 그의 부분에 기반하여 계산된다. 그의 부분은 둘 다의 서열식별번호의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%, 또는 임의의 다른 특정된 백분율을 의미할 수 있다. 용어 "동일성"은 또한 경우에 따라, 이러한 서열의 스트링 사이의 매치에 의해 결정된 바와 같은, 아미노산 또는 핵산 서열 사이의 서열 관련성의 정도를 의미할 수 있다.

특정 측면에서, 동일성을 결정하는 방법은 시험된 서열 사이에 가장 큰 매치를 제공하도록 디자인된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 입수가능한 컴퓨터 프로그램에서 성문화된다.

"실질적 상동성" 또는 "실질적 유사성"은 핵산 또는 그의 단편을 언급하는 경우, 또 다른 핵산 (또는 그의 상보적 가닥)과 적절한 뉴클레오티드 삽입 또는 결실로 최적으로 정렬되는 경우, 서열의 적어도 약 95 내지 99%에서 뉴클레오티드 서열 동일성이 있음을 지시하는 것을 의미한다.

본원에 사용된, 및 달리 지시되지 않는 한, 제1 핵산 서열을 제2 핵산 서열과 관련하여 기재하는데 사용되는 경우 용어 "상보적"은 통상의 기술자에 의해 이해될 것인 바와 같이, 제2 핵산 서열을 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드와 특정 조건 하에서 혼성화하고 두가닥 구조를 형성하는 제1 핵산 서열을 포함하는 올리고뉴클레오티드 또는 폴리뉴클레오티드의 능력을 지칭한다. 이러한 조건은 예를 들어, 엄격한 조건일 수 있으며, 여기서 엄격한 조건은 400 mM NaCl, 40 mM PIPES pH 6.4, 1 mM EDTA, 50 ℃, 또는 70 ℃, 12-16시간 동안, 이어서 세척을 포함할 수 있다 (예를 들어, 문헌 ["Molecular Cloning: A Laboratory Manual, Sambrook, et al. (1989) Cold Spring Harbor Laboratory Press] 참조). 다른 조건, 예컨대 유기체 내부에서 직면할 수 있는 바와 같은 생리학적으로 관련된 조건이 사용될 수 있다. 통상의 기술자는 혼성화된 뉴클레오티드의 궁극적인 적용에 따라 2개의 서열의 상보성의 시험을 위해 가장 적절한 조건의 세트를 결정할 수 있을 것이다.

용어 "프로모터"는 유전자의 전사 개시 부위의 전사의 방향에 관하여 상류에 위치한, 하나 이상의 유전자 (또는 코딩 서열)의 전사를 제어하도록 기능하고, 프로모터로부터의 전사의 양을 직접적으로 또는 간접적으로 조절하도록 작용하는 관련 기술분야의 통상의 기술자에게 공지된 전사 인자 결합 부위, 억제제 및 활성화제 단백질 결합 부위, 및 뉴클레오티드의 임의의 다른 서열을 포함하나 이에 제한되지는 않는 DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 임의의 다른 DNA 서열의 존재에 의해 구조적으로 확인되는 핵산 서열 또는 단편을 의미하기 위해 본원에서 사용된다. "구성적" 프로모터는 대부분의 생리학적 및 발달적 조건 하에서 활성인 프로모터이다. "유도성" 프로모터는 생리학적 또는 발달적 조건에 따라 조절되는 프로모터이다. "조직 특이적" 프로모터는 분화된 세포/조직의 특이적 유형에서 우선적으로 활성이다.

본원에 사용된 용어 "인핸서"는 인접한 유전자의 전사를 자극하거나 억제하는 시스-작용 요소이다. 전사를 억제하는 인핸서는 또한 "사일런서"로 지칭된다. 인핸서는 코딩 서열로부터 및 전사된 영역의 하류의 위치로부터 최대 몇몇 킬로베이스 쌍 (kb)의 거리에 걸쳐 양쪽 배향에서 기능할 수 있다 (예를 들어, 코딩 서열과 연관될 수 있음).

용어 "작동적으로 연결된", "작동적으로 삽입된", "작동적으로 위치된", "제어 하에서" 또는 "전사 제어 하에서"는 프로모터가 RNA 폴리머라제 개시 및 유전자의 발현을 제어하기 위한 핵산에 관하여 정확한 위치 및 배향에 있음을 의미한다. 용어 "작동가능하게 연결된"은 DNA 서열 및 조절 서열(들)이 적절한 분자 (예를 들어, 전사 활성화제 단백질)가 조절 서열(들)에 결합되는 경우 유전자 발현을 허용하도록 하는 방식으로 연결됨을 의미한다. 용어 "작동가능하게 삽입된"은 세포 내로 도입된 관심의 DNA가 도입된 DNA의 전사 및 번역을 지정하는 (즉, 관심의 DNA에 의해 코딩되는 폴리펩티드의 생산을 용이하게 하는) DNA 서열에 인접하게 위치됨을 의미한다.

용어 "트랜스진"은 세포 내로 도입된 유전자 또는 핵산 분자를 의미하기 위해 본원에서 사용된다. 트랜스진의 예는 치료 폴리펩티드를 코딩하는 핵산 (예를 들어, 인슐린을 코딩하는 유전자 및/또는 글루코키나제를 코딩하는 유전자)이다. 일부 실시양태에서, 유전자는 세포에 존재할 수 있지만, 일부 경우에 통상적으로 세포에서 발현되지 않거나 불충분한 수준으로 발현된다. 이 맥락에서, "불충분한"은 상기 유전자, 예를 들어, 인슐린 및/또는 글루코키나제가 통상적으로 세포에서 발현되지만, 본원에 개시된 바와 같은 상태 및/또는 질환 (예를 들어, 당뇨병)이 여전히 발달될 수 있음을 의미한다. 특정 측면에서, 트랜스진은 유전자, 예를 들어, 인슐린 및/또는 글루코키나제의 증가된 발현 또는 과발현을 허용한다. 트랜스진은 세포에 대해 천연인 서열을 포함할 수 있거나, 세포에서 자연적으로 발생하지 않는 서열을 포함하거나, 또는 이는 둘 다의 조합을 포함할 수 있다. 특정 측면에서, 트랜스진은 세포에서 인슐린, 글루코키나제, 또는 인슐린 및 글루코키나제 둘 다를 코딩하는 서열의 발현을 위해 적절한 조절 서열에 작동가능하게 연결될 수 있는 인슐린, 글루코키나제, 인슐린 및 글루코키나제 둘 다, 및/또는 추가의 단백질(들)을 코딩하는 변형된 서열을 포함할 수 있다. 일부 측면에서, 트랜스진은 숙주 세포의 게놈 내로 통합되지 않는다.

용어 "변형된 유전자", "변형된 핵산" 등은 유전자 또는 핵산 서열의 천연 서열에서에 비해 하나 이상의 변형 또는 변화의 도입을 의미하기 위해 본원에서 상호교환가능하게 사용된다. 이러한 변형은 코딩된 단백질 서열에 대한 돌연변이를 발생시킬 수 있거나 그렇지 않을 수 있다. 일부 실시양태에서, 변형된 핵산은 야생형 또는 돌연변이체 단백질 서열 또는 그의 단편을 코딩한다.

본원에 사용된 용어 "로부터 유래된"은 특정된 분자 또는 유기체, 또는 특정된 분자 또는 유기체로부터의 정보 (예를 들어, 아미노산 또는 핵산 서열)로부터 단리되거나 이를 사용하여 제조된 성분을 지칭한다. 예를 들어, 제2 핵산 서열 (예를 들어, 야생형 인간 인슐린 유전자)로부터 유래된 핵산 서열 (예를 들어, 변형된 인간 인슐린 유전자)은 제2 핵산 서열의 뉴클레오티드 서열과 동일하거나 실질적으로 유사한 뉴클레오티드 서열 또는 그의 부분을 포함할 수 있다. 일부 측면에서, 돌연변이체, 유사체 또는 유도체는 야생형 서열로부터 유래될 수 있다.

폴리뉴클레오티드의 경우에, 유래된 종은 예를 들어, 천연 발생 돌연변이유발, 인공 지정 돌연변이유발 또는 인공 무작위 돌연변이유발에 의해 수득될 수 있다. 폴리뉴클레오티드를 유도하는데 사용된 돌연변이유발은 의도적으로 지정되거나 의도적으로 무작위이거나, 또는 각각의 혼합물일 수 있다.

본원에 사용된 용어 "전달 벡터" 또는 "벡터"는 적절한 제어 요소와 회합되는 경우 복제가 가능하고, 세포 사이에 유전자 또는 핵산 서열을 전달할 수 있는 임의의 유전 요소, 예컨대 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 인공 염색체, 바이러스, 비리온 등을 포함한다. 따라서, 상기 용어는 클로닝 및 발현 비히클, 뿐만 아니라 바이러스 벡터를 포함한다. 일부 측면에서, 유용한 벡터는 전사되는 핵산 절편이 프로모터의 전사적 제어 하에 위치되는 벡터인 것으로 고려된다. 일부 측면에서, 전달 벡터는 바이러스 벡터, 플라스미드, 지질, 및 리소좀으로 이루어진 군으로부터 선택된다.

일부 측면에서, 생물학적 벡터는 바이러스, 특히 약독화된 및/또는 복제-결핍성 바이러스를 포함한다. 일부 실시양태에서, 화학적 벡터는 지질 복합체 및 네이키드 DNA 구축물을 포함한다.

본원에 사용된 용어 "네이키드 DNA" 또는 "네이키드 핵산" 등은 표적 세포의 세포질 내로의 핵산의 전달을 용이하게 하는 바이러스 입자, 박테리아 세포, 또는 다른 캡슐화 수단 내에 함유되지 않는 핵산 분자를 지칭한다. 네이키드 핵산은 표적 세포의 부위에의 (예를 들어, 소화관을 통한 핵산의 표적 세포 내로의 활주를 용이하게 하고/거나, 핵산을 위산으로부터 보호하고/거나, 장 점액을 침투하는 역할을 하는) 및/또는 표적 상피 세포의 표면에의 핵산의 전달을 용이하게 하기 위한 수단과 회합될 수 있다.

"바이러스 게놈" 또는 "벡터 게놈" 또는 "바이러스 벡터"는 관심의 분자, 예를 들어, 단백질, 펩티드, 및 폴리뉴클레오티드 또는 그의 복수개를 코딩하거나 포함하는 하나 이상의 폴리뉴클레오티드 영역을 포함하는 서열을 지칭한다. 바이러스 벡터는 세포 내로 유전 물질을 전달하는데 사용된다. 바이러스 벡터는 특이적 적용을 위해 변형될 수 있다. 일부 측면에서, 전달 벡터는 아데노-연관 바이러스 (AAV) 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 또는 레트로바이러스 벡터로 이루어진 군으로부터 선택되는 바이러스 벡터를 포함한다.

본원에 사용된 용어 "아데노-연관 바이러스 벡터" 또는 "AAV 벡터"는 아데노-연관 벡터의 성분을 포함하거나 그로부터 유래되고, 포유동물 세포, 바람직하게는 인간 세포를 감염시키는데 적합한 임의의 벡터를 지칭한다. 용어 AAV 벡터는 전형적으로 탑재물을 포함하는 AAV-유형 바이러스 입자 또는 비리온을 지정한다. AAV 벡터는 혈청형의 조합 (즉, "위형화된" AAV)을 포함하는 다양한 혈청형으로부터 또는 다양한 게놈 (예를 들어, 단일 가닥 또는 자기-상보적)으로부터 유래될 수 있다. 또한, AAV 벡터는 복제 결함성이고/거나 표적화될 수 있다. 본원에 사용된 용어 "아데노-연관 바이러스" (AAV)는 AAV 유형 1, AAV 유형 2, AAV 유형 3 (유형 3A 및 3B를 포함함), AAV 유형 4, AAV 유형 5, AAV 유형 6, AAV 유형 7, AAV 유형 8, AAV 유형 9, AAV 유형 10, AAV 유형 11, AAV 유형 12, AAV 유형 13, AAVrh8, AAVrh10, AAVrh.74, 뱀 AAV, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 양 AAV, 염소 AAV, 새우 AAV, 문헌 [Gao et al. (J. Virol. 78:6381 (2004))] 및 [Moris et al. (Virol. 33:375 (2004))]에 의해 개시된 그러한 AAV 혈청형 및 분기군, 및 임의의 다른 AAV를 포함하나 이에 제한되지는 않는다. 예를 들어, 문헌 [FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers)]을 참조한다. 일부 측면에서, "AAV 벡터"는 공지된 AAV 벡터의 유도체를 포함한다. 일부 측면에서, "AAV 벡터"는 변형된 또는 인공 AAV 벡터를 포함한다. 용어 "AAV 게놈" 및 "AAV 벡터"는 상호교환가능하게 사용될 수 있다.

본원에 사용된 "AAV 입자"는 적어도 하나의 탑재물 영역 (예를 들어, 인슐린 및/또는 Gck를 코딩하는 폴리뉴클레오티드) 및 적어도 하나의 역위 말단 반복부 (ITR) 영역을 갖는 AAV 벡터를 포함하는 AAV 바이러스이다. 일부 측면에서, 용어 "본 개시내용의 AAV 벡터" 또는 "본원에 개시된 AAV 벡터"는 예를 들어, AAV 입자에 캡슐화된 인슐린, GcK, 또는 이들의 조합을 코딩하는 본원에 개시된 폴리뉴클레오티드 또는 핵산을 포함하는 AAV 벡터를 지칭한다.

바이러스에 의한 세포의 "형질도입"은 바이러스 입자로부터 세포로의 핵산의 전달이 있음을 의미한다. 일부 측면에서, 형질도입은 바이러스 벡터에 의한 수용자 숙주 세포 내로의 인슐린 및/또는 글루코키나제를 코딩하는 핵산 또는 핵산들의 전달을 지칭한다. 예를 들어, 본 개시내용의 rAAV 벡터에 의한 표적 세포의 형질도입은 형질도입된 세포 내로의 그 벡터에 함유된 rAAV 게놈 (예를 들어, 본 개시내용의 폴리뉴클레오티드를 포함함)의 전달을 초래한다.

세포의 "형질감염"은 세포를 유전적으로 변형시킬 목적으로 유전 물질이 세포 내로 도입되는 것을 의미한다. 형질감염은 관련 기술분야에 공지된 다양한 수단, 예를 들어, 형질도입 또는 전기천공에 의해 달성될 수 있다.

본원에 사용된 "벡터"는 시험관내에서 또는 생체내에서, 숙주 세포 내로 전달되는 폴리뉴클레오티드를 포함하는 재조합 플라스미드 또는 바이러스를 의미한다.

용어 "숙주 세포" 또는 "표적 세포"는 폴리뉴클레오티드 전달이 시험관내에서 또는 생체내에서 일어나는 세포를 의미하기 위해 본원에서 사용된다. AAV 벡터는 분열 및 비-분열 세포 둘 다를 형질도입할 수 있다.

"재조합"은 자연에서 일반적으로 발견되는 것과는 별개임을 의미한다.

벡터 또는 바이러스 캡시드에 관하여 "혈청형"은 캡시드 단백질 서열 및 캡시드 구조에 기반한 별개의 면역학적 프로파일에 의해 정의된다.

"AAV Cap"는 AAV Cap 단백질, VP1, VP2 및 VP3 및 그의 유사체를 의미한다.

"AAV Rep"는 AAV Rep 단백질 및 그의 유사체를 의미한다.

다른 요소에 의해 플랭킹된 서열에 관하여 "플랭킹된"은 상류 및/또는 하류의, 즉, 서열에 비해 5' 및/또는 3'의 하나 이상의 플랭킹 요소의 존재를 지시한다. 용어 "플랭킹된"은 서열이 반드시 인접함을 지시하는 것으로 의도되지 않는다. 예를 들어, 트랜스진을 코딩하는 핵산 및 플랭킹 요소 사이에 개재 서열이 있을 수 있다. 2개의 다른 요소 (예를 들어, ITR)에 의해 "플랭킹된" 서열 (예를 들어, 트랜스진)은 하나의 요소가 서열에 대해 5'에 위치하고, 다른 것은 서열에 대해 3'에 위치하지만; 그 사이에 개재 서열이 있을 수 있음을 지시한다.

본원에 사용된 용어 예를 들어, 본원에 개시된 폴리뉴클레오티드를 포함하는 유전자 요법 조성물의 "유효량", "치료 유효량", 및 "충분한 양"은 인간을 포함하는 대상체에게 투여되는 경우, 임상적 결과를 포함하는 유익하거나 목적하는 결과를 실행하는데 충분한 양을 지칭하며, 따라서, "유효량" 또는 그에 대한 동의어는 그것이 적용되고 있는 맥락에 의존한다.

주어진 치료제 또는 조성물의 양은 다양한 인자, 예컨대 주어진 작용제, 제약 제제, 투여의 경로, 질환 또는 장애의 유형, 대상체의 신원 (예를 들어, 연령, 성별, 및/또는 중량) 또는 치료되는 숙주 등에 따라 다양할 것인 이러한 양에 상응할 것이다.

본원에 사용된 용어 "유전자 요법"은 질환 또는 상태를 치료하기 위한 개체의 세포 및/또는 조직 내로의 핵산 서열 (예를 들어, 본원에서 정의된 바와 같은 치료 분자를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 프로모터를 포함하는 핵산)의 삽입이다. 유전자 요법은 또한 자연에서 억제성인, 즉, 내인성 유전자 또는 단백질, 예컨대 비바람직한 또는 비정상인 (예를 들어, 병원성) 유전자 또는 단백질의 발현, 활성 또는 기능을 억제하거나, 감소시키거나 감소시키는 트랜스진의 삽입을 포함한다. 이러한 트랜스진은 외인성일 수 있다. 외인성 분자 또는 서열은 치료되는 세포, 조직 및/또는 개체에서 통상적으로 발생하지 않는 분자 또는 서열인 것으로 이해된다. 후천성 및 선천성 질환 둘 다는 유전자 요법으로 처리될 수 있다.

일부 측면에서, 본 개시내용은 야생형 또는 돌연변이체 인슐린 및/또는 야생형 글루코키나제 또는 그의 기능적 단편을 코딩하는 변형된 핵산을 제공한다. 본 개시내용은 또한 야생형 또는 돌연변이체 인슐린 및/또는 야생형 글루코키나제 또는 그의 기능적 단편을 코딩하는 변형된 핵산(들)을 그들의 서열의 일부로서 포함하는 핵산 구축물을 제공한다. 예를 들어, 본 개시내용은 다른 요소, 예컨대 조절 요소와 함께 변형된 핵산 서열(들)을 포함하는 발현 카세트, 플라스미드 및/또는 다른 벡터를 포함한다. 일부 측면에서, 본 개시내용은 야생형 또는 돌연변이체 인슐린 및/또는 야생형 글루코키나제 또는 그의 기능적 단편을 코딩하는 변형된 핵산 서열(들)을 포함하는 패키징된 유전자 전달 비히클, 예컨대 바이러스 캡시드를 제공한다. 본 개시내용은 또한 세포에서 발현을 촉진시키는데 요구되는 요소와 함께 세포 내로 변형된 핵산 서열(들)을 전달함으로써 야생형 또는 돌연변이체 인슐린 및/또는 야생형 글루코키나제 또는 그의 기능적 단편을 발현시키는 방법을 포함한다. 본 개시내용은 또한 야생형 또는 돌연변이체 인슐린 및/또는 야생형 글루코키나제 또는 그의 기능적 단편을 코딩하는 변형된 핵산 서열(들)이 예를 들어, 하나 이상의 벡터의 성분으로서 대상체에게 투여되고/거나 하나 이상의 바이러스 유전자 전달 비히클의 성분으로서 패키징되는 유전자 요법 방법을 제공한다. 치료는 예를 들어, 당뇨병의 증상의 치료 또는 감소를 필요로 하는 대상체에서 당뇨병의 증상을 치료하거나 감소시키기 위해 실행될 수 있다. 본 개시내용의 이들 측면의 각각은 본원에서 추가로 상세하게 논의된다.

변형된 핵산

일부 측면에서, 본 개시내용은 인슐린, 글루코키나제, 또는 이들의 조합을 코딩하는 변형된 (예를 들어, 코돈-최적화된 및/또는 감소된 CpG 함량) 핵산을 포함하는 폴리뉴클레오티드를 제공한다. 일부 측면에서, 변형된 핵산은 인간 인슐린 (예를 들어, 프리프로인슐린 또는 프로인슐린, 그의 돌연변이체, 유사체, 또는 변이체)을 코딩한다. 일부 측면에서, 변형된 핵산은 인간 글루코키나제 (예를 들어, Gck, 그의 돌연변이체, 유사체, 또는 변이체)를 코딩한다. 일부 측면에서, 코딩 서열에 대한 변형은 인슐린 및/또는 글루코키나제에 대한 야생형 또는 돌연변이체 아미노산 서열을 보존한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 신호 서열 및 프로인슐린 폴리펩티드를 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110 중 어느 것의 아미노산 서열을 포함한다. 일부 측면에서, 변형된 핵산 서열은 인간 프리프로인슐린 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145)을 코딩한다. 일부 측면에서, 변형된 핵산 서열은 인간 Gck (예를 들어, 서열식별번호: 82)를 코딩한다.

일부 측면에서, 변형된 핵산은 코돈 최적화된다. 일부 측면에서, 코돈 최적화는 인슐린 또는 글루코키나제를 코딩하는 핵산의 오픈 리딩 프레임에서 코돈을 변형시키는 것을 포함한다. 일부 측면에서, 변형된 핵산은 상응하는 야생형 서열 및/또는 비변형된 서열에 비해 감소된 CpG 함량을 포함한다.

일부 측면에서, 변형된 핵산은 상응하는 야생형 서열 및/또는 비변형된 서열에 비해 감소된 선천성 면역원성을 갖는다. 일부 측면에서, 변형된 핵산은 상응하는 야생형 서열 및/또는 비변형된 서열에 비해 증가된 발현을 갖는다. 일부 측면에서, 변형된 핵산은 상응하는 야생형 서열 및/또는 비변형된 서열에 비해 감소된 발현을 갖는다. 일부 측면에서, 변형된 서열은 가상 환경 방법, 이어서 수동 서열 검사를 통해 개발된다. 본 개시내용의 핵산은 분자 생물학 기술을 사용하여 생산될 수 있으며, 예를 들어, 인슐린 또는 글루코키나제를 코딩하는 변형된 cDNA는 PCR 증폭 또는 cDNA 클로닝 기술에 의해 수득될 수 있다.

일부 측면에서, 핵산 서열은 CpG 함량을 감소시키도록, 예를 들어, TLR9 이량체화 및 관련된 경로를 통해 염증 반응을 최소화하도록 변형된다. 일부 측면에서, 특정 CpG 모티프는 그들의 염증 효과에 대해 억제성 또는 중화성이다. 일부 실시양태에서, 이들 모티프 중 하나 이상은 보존될 수 있다. 일부 측면에서, 이러한 CpG 모티프는 TLR9 이량체화의 하류 효과의 억제를 위해 핵산 서열 내로 도입될 수 있다.

일부 측면에서, 코돈 변형은 상응하는 야생형 폴리뉴클레오티드 및/또는 비변형된 폴리뉴클레오티드에 비해 인슐린 및/또는 글루코키나제 코딩 폴리뉴클레오티드의 면역원성을 감소시킬 수 있다. 일부 측면에서, 코돈 변형은 상응하는 야생형 및/또는 비변형된 폴리뉴클레오티드에 비해 인슐린 또는 글루코키나제 코딩 폴리뉴클레오티드의 발현을 개선시킨다. 일부 측면에서, 코돈 변형은 상응하는 야생형 Gck 폴리뉴클레오티드 및/또는 비변형된 Gck 폴리뉴클레오티드에 비해 글루코키나제 코딩 폴리뉴클레오티드의 면역원성을 감소시킬 수 있다.

본 개시내용의 변형된 핵산은 전체 세포에, 세포 용해물에, 또는 부분적으로 정제된 또는 실질적으로 순수한 형태에 존재할 수 있다. 변형된 핵산은 단리될 수 있다. 핵산은 알칼리성/SDS 처리, CsCl 밴딩, 칼럼 크로마토그래피, 아가로스 겔 전기영동 및 관련 기술분야에 널리 공지된 다른 것들을 포함하는 표준 기술에 의해, 다른 세포 성분 또는 다른 오염물, 예를 들어, 다른 세포 핵산 또는 단백질로부터 정제되는 경우, "단리되거나" "실질적으로 순수하게 되며", 예를 들어 문헌 [F. Ausubel, et al., ed. (1987) Current Protocols in Molecular Biology, Greene Publishing and Wiley Interscience, New York]을 참조한다. 일부 측면에서, 본 개시내용의 변형된 핵산은 예를 들어, DNA 또는 RNA일 수 있고, 인트론 서열을 함유할 수 있거나 그렇지 않을 수 있다. 일부 측면에서, 핵산은 cDNA 분자일 수 있다.

변형된 인슐린 핵산

일부 측면에서, 본원에 개시된 폴리뉴클레오티드 또는 핵산 서열은 야생형 (서열식별번호: 147) 및/또는 비변형된 인간 인슐린 (Ins) 또는 인간 Ins 돌연변이체 또는 유사체 (예를 들어, 서열식별번호: 110 또는 서열식별번호: 111)에 비해 변형된다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산은 예를 들어, 서열식별번호: 1 또는 서열식별번호: 127에 상응하는 5' UTR, ORF, 및/또는 3' UTR을 포함하는 서열에 비해 변형된다. 일부 측면에서, 변형된 핵산은 야생형 인간 인슐린 (서열식별번호: 41), 그의 변이체 또는 돌연변이체 (예를 들어, 서열식별번호: 144 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다.

인슐린은 디술피드 결합에 의해 함께 연결된 2개의 폴리펩티드 쇄, 즉, A- 및 B- 쇄를 포함한다. 이는 먼저 프리프로인슐린으로 지칭되는 단일 폴리펩티드로서 합성된다. "프리프로인슐린"은 인슐린 유전자의 1차 번역 생성물이다. 이는 110개의 아미노산의 길이인 펩티드이다. 프리프로인슐린은 그의 N-말단에 부착된 신호 펩티드를 갖는 프로인슐린 분자를 포함한다. 프리프로인슐린의 신호 펩티드를 포함하는 N-말단의 부분은 절단되어, 잔류 아미노산을 "프로인슐린"으로서 남긴다. 생성된 절단된 서열의 아미노산 1-30은 "B 쇄"이고, 여기서 "B10"은 프리프로인슐린의 위치 34에 상응한다. 따라서, 예를 들어, "B10" 프로인슐린 돌연변이는 프리프로인슐린에서 H34 돌연변이에 상응한다. 특정 측면에서, 본원에 언급된 "B10H"는 B10 위치에서의 야생형 히스티딘 아미노산 (또한 야생형 프리프로인슐린 서열에서 H34로 언급됨)을 지칭한다. 프리프로인슐린 및 프로인슐린은 또한 A- 및 B- 쇄 사이에 C-펩티드를 포함한다. 성숙한 인슐린 단백질에서, C-펩티드는 단백질분해적으로 절단되고, A- 및 B- 쇄는 디술피드 결합에 의해 연결된다.

일부 측면에서, 본원에 개시된 변형된 코딩 서열은 야생형 프리프로인슐린 (서열식별번호: 41)에서의 상응하는 위치에 비해 위치(들) H34, P52, K53, R55, 및/또는 L86에 하나 이상의 돌연변이를 포함하는 프리프로인슐린 돌연변이체를 코딩한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41에서의 상응하는 위치에 비해 하기 돌연변이 H34D, H34I, H34V, P52D, K53R, R55K, 및/또는 L86R 중 하나 이상을 포함하는 프리프로인슐린 돌연변이체를 코딩한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41에서의 상응하는 위치에 비해 돌연변이 H34D, H34I, H34V, P52D, K53R, R55K, 및/또는 L86R을 포함하는 프리프로인슐린 돌연변이체를 코딩한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41에서의 상응하는 위치에 비해 돌연변이 P52D, K53R, R55K, 및/또는 L86R을 포함하는 프리프로인슐린 돌연변이체를 코딩한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145로부터 선택되는 아미노산 서열과 적어도 90%, 95%, 99% 또는 100% 유사한 아미노산 서열을 코딩한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145로부터 선택되는 아미노산 서열과 적어도 90%, 95%, 99% 또는 100% 유사한 아미노산 서열을 코딩하고, 여기서 아미노산 서열은 서열식별번호: 41에서의 상응하는 위치에 비해 하기 돌연변이 H34D, H34I, H34V, P52D, K53R, R55K, 및/또는 L86R 중 하나 이상을 포함한다. 일부 측면에서, 변형된 코딩 서열은 서열식별번호: 41에서의 상응하는 위치에 비해 H34 돌연변이를 포함하지 않는 아미노산 서열을 코딩한다.

일부 측면에서, 변형된 핵산 서열은 절단 부위, 예를 들어, 푸린 엔도프로테아제 절단 부위를 포함한다.

일부 측면에서, 변형된 핵산 서열은 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 코딩하는 핵산을 포함한다. 일부 측면에서, 프리프로인슐린은 야생형 인슐린 신호 서열 (예를 들어, MALWMRLLPLLALLALWGPDPAAA (서열식별번호: 165) 또는 서열식별번호: 41의 아미노산 1-24)을 포함한다. 일부 측면에서, 야생형 프리프로인슐린의 신호 서열은 비-인슐린 분비 펩티드, 예를 들어, IL-6 신호 서열 (예를 들어, MNSFSTSAFGPVAFSLGLLLVLPAAFPAP (서열식별번호: 166)) 또는 피브로넥틴 신호 서열 (예를 들어, MLRGPGPGLLLLAVQCLGTAVPSTGA (서열식별번호: 167))로 대체된다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 H34D, H34I, 또는 H34V로부터 선택되는 아미노산 변형 (또는 프로인슐린 B-쇄의 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D), 이소류신 (I) 또는 발린 (V)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34D (또는 프로인슐린 B-쇄의 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D)으로)를 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 H34D, H34I, 또는 H34V로부터 선택되는 아미노산 변형 (또는 프로인슐린 B-쇄의 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D), 이소류신 (I) 또는 발린 (V)으로)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34D, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34D, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34I, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 이소류신 (I)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34I, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 이소류신 (I)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34V, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 발린 (V)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 H34V, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B10에서의 히스티딘 (H)에서 발린 (V)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 야생형 프리프로인슐린 아미노산 위치에 상응하는 아미노산 변형 P49D, K53R, R55K, 및 L86R (또는 프로인슐린에 상응하는 변형 위치 B28에서의 프롤린 (P)에서 아스파르트산 (D)으로, 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 및 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로)을 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 변형된 핵산은 아미노산 변형 P49D, K53R, R55K, 및 L86R (야생형 프리프로인슐린 아미노산 위치에 상응함)을 포함하는 인간 인슐린을 코딩하고, 여기서 인간 인슐린은 임의로 절단 부위, 예를 들어, 푸린 절단 부위, 및 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 포함한다.

일부 측면에서, 변형된 핵산은 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하고, 여기서 핵산은 (i) 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 코딩하는 뉴클레오티드 서열 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형 (또는 야생형 프리프로인슐린에서의 상응하는 아미노산에 비해 아미노산 H34, P52, K53, R55, L86, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형)을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 측면에서, 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아니며, 예를 들어, 야생형 프리프로인슐린 서열은 IL-6 신호 서열 또는 피브로넥틴 신호 서열로 대체된다). 일부 측면에서, 폴리뉴클레오티드는 절단 부위 (예를 들어, 푸린 절단 부위)를 추가로 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)은 (i) H34D, H34I, 또는 H34V (또는 프로인슐린 B-쇄의 위치 B10에서의 히스티딘 (H)에서 아스파르트산 (D), 이소류신 (I) 또는 발린 (V)으로), 및/또는 (ii) 야생형 프리프로인슐린 서열에 비해 P52, K53, R55, 및/또는 L86 (또는 프로인슐린 B-쇄의 위치 B28 및/또는 B29 또는 프로인슐린 C-쇄의 위치 C1 및/또는 C32)에서의 하나 이상의 아미노산 변형으로부터 선택되는 아미노산 변형을 포함한다. 일부 측면에서, P52, K53, R55, 및/또는 L86에서의 하나 이상의 아미노산 변형은 P52D, K53R, R55K, L86R, 또는 이들의 임의의 조합을 포함한다 (또는 프로인슐린 B-쇄 또는 C-쇄에서의 하나 이상의 변형은 프로인슐린 B-쇄의 위치 B28에서의 프롤린 (P)에서 아스파르트산 (D)으로, 프로인슐린 B-쇄의 위치 B29에서의 리신 (K)에서 아르기닌 (R)으로, 프로인슐린 C-쇄의 위치 C1에서의 아르기닌 (R)에서 리신 (K)으로, 프로인슐린 C-쇄의 위치 C32에서의 류신 (L)에서 아르기닌 (R)으로, 또는 이들의 임의의 조합을 포함함).

일부 측면에서, 변형된 핵산은 변이체 또는 돌연변이체 인간 인슐린 단백질 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 인간 인슐린 단백질은 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다. 일부 측면에서, 인간 인슐린 단백질은 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 아미노산 서열을 포함한다. 일부 측면에서, 인간 인슐린 단백질은 야생형 인간 인슐린에 비해 삽입, 결실, 치환, 또는 이들의 조합을 포함한다. 일부 측면에서, 인간 인슐린 단백질은 적어도 하나의 치환을 포함한다. 일부 측면에서, 적어도 하나의 치환은 보존적 치환이다. 일부 측면에서, 적어도 하나의 치환은 비-보존적 치환이다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 43-57, 110-116, 150-151, 154-155, 및 157-159 중 어느 것의 핵산 73-330, 서열식별번호: 117-122, 152, 및 156 중 어느 것의 핵산 88-345, 또는 서열식별번호: 153의 핵산 79-336과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 갖는 핵산 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함한다. 일부 측면에서, ORF는 신호 펩티드를 코딩하는 핵산 서열을 추가로 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하고, 여기서 변형된 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 122와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159의 서열을 갖는 핵산을 포함하는 오픈 리딩 프레임을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 122의 서열을 갖는 핵산을 포함하는 오픈 리딩 프레임을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1, 표 13, 및/또는 도 1A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 서열식별번호: 159, 및 이들의 임의의 조합과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열로 이루어진 군으로부터 선택되는 2개 이상의 ORF를 포함한다. 일부 측면에서, 2개 이상의 ORF 중 하나는 서열식별번호: 122와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는다. 일부 측면에서, 2개 이상의 ORF는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 서열식별번호: 159, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 측면에서, 2개 이상의 ORF 중 하나는 서열식별번호: 122의 핵산 서열을 갖는다.

일부 측면에서, 2개 이상의 ORF는 작동가능하게 연결된다. 일부 측면에서, ORF는 IRES에 의해 작동가능하게 연결된다. 일부 측면에서, IRES는 서열식별번호: 142 또는 서열식별번호: 143과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 측면에서, IRES는 서열식별번호: 142 또는 서열식별번호: 143의 핵산 서열을 포함한다.

일부 측면에서, IRES에 의해 연결된 2개 이상의 ORF는 서열식별번호: 110 및 서열식별번호: 53, 서열식별번호: 47 및 서열식별번호: 54, 서열식별번호: 49 및 서열식별번호: 56, 서열식별번호: 111 및 서열식별번호: 114, 서열식별번호: 112 및 서열식별번호: 115, 서열식별번호: 113 및 서열식별번호: 116, 서열식별번호: 120 및 서열식별번호: 114, 서열식별번호: 121 및 서열식별번호: 115, 또는 서열식별번호: 122 및 서열식별번호: 116을 포함하는 서열과 적어도 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 측면에서, IRES를 통해 연결된 2개 이상의 ORF는 서열식별번호: 110 및 서열식별번호: 53, 서열식별번호: 47 및 서열식별번호: 54, 서열식별번호: 49 및 서열식별번호: 56, 서열식별번호: 111 및 서열식별번호: 114, 서열식별번호: 112 및 서열식별번호: 115, 서열식별번호: 113 및 서열식별번호: 116, 서열식별번호: 120 및 서열식별번호: 114, 서열식별번호: 121 및 서열식별번호: 115, 또는 서열식별번호: 122 및 서열식별번호: 116을 포함하는 핵산 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 변형된 5' UTR 핵산 서열을 추가로 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 또는 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드는 코작 컨센서스 서열 (코작 컨센서스 또는 코작 서열)을 추가로 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR 핵산 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 변형된 3' UTR 핵산 서열을 추가로 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 3' UTR 핵산 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하고, 여기서 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 138과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161의 서열을 갖 는 핵산을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 138의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16의 핵산 5-957을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 제시된 5' UTR, ORF, 및 3' UTR을 포함하는 변형된 핵산을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 야생형 프리프로인슐린 분비 신호 펩티드를 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 야생형 프리프로인슐린 분비 신호 펩티드를 코딩하지 않는다. 일부 측면에서, 야생형 프리프로인슐린은 비-인슐린 분비 신호에 의해 대체된다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 인터류킨 6 (IL-6) 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 피브로넥틴 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩한다.

변형된 글루코키나제 핵산

일부 측면에서, 본원에 개시된 폴리뉴클레오티드 또는 핵산 서열은 예를 들어, 서열식별번호: 19에 상응하는, 예를 들어, 5' UTR, ORF, 및/또는 3' UTR 핵산 서열을 포함하는 야생형 및/또는 비변형된 인간 글루코키나제 (Gck)에 비해 변형된다. 일부 측면에서, 변형된 핵산은 야생형 인간 글루코키나제 (서열식별번호: 82) 또는 그의 기능적 단편을 코딩한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 ORF를 포함하고, 여기서 핵산 서열은 인간 글루코키나제 단백질 (서열식별번호: 82) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162의 서열을 갖는 핵산을 포함하는 오픈 리딩 프레임을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 변형된 5' UTR 핵산 서열을 추가로 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드는 코작 컨센서스 서열 (코작 컨센서스 또는 코작 서열)을 추가로 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 변형된 3' UTR 핵산 서열을 추가로 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 3' UTR 서열을 포함한다.

일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하고, 여기서 핵산 서열은 인간 글루코키나제 단백질 (예를 들어, 서열식별번호: 82) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39로부터 선택되는 서열의 핵산 5-2025와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39의 핵산 5-2025를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 변형된 핵산이다.

발현 구축물

일부 측면에서, 본 개시내용은 또한 본원에 개시된 인슐린, 글루코키나제, 이들의 조합, 또는 그의 기능적 단편을 코딩하는 핵산 서열, 예를 들어 변형된 핵산 서열 및 핵산 서열에 작동가능하게 연결된 이종 제어 서열을 포함하는 발현 카세트를 제공한다. 일부 측면에서, 이종 제어 서열은 프로모터이다.

관심의 DNA에 작동가능하게 연결된 진핵 프로모터를 갖는 핵산 구축물은 본 개시내용에 사용될 수 있다. 본 개시내용에 따라 사용될 수 있는 DNA 서열 (또는 상응하는 RNA 서열)을 함유하는 구축물은 관심의 DNA 또는 RNA 서열을 함유하는 임의의 진핵 발현 구축물일 수 있다. 예를 들어, 플라스미드 또는 바이러스 구축물 (예를 들어, AAV 벡터)은 라이게이션가능한 말단을 갖는 선형 DNA를 제공하도록 절단될 수 있다. 이들 말단은 무손상 레플리콘 및 목적하는 표현형적 특성을 갖는 생물학적으로 기능적인 재조합 DNA 분자를 제공하도록 상보적인 유사한 라이게이션가능한 말단을 갖는 외인성 DNA에 결합된다. 일부 측면에서, 구축물은 진핵 및 원핵 숙주 둘 다에서 복제가 가능하다.

일부 측면에서, 본 개시내용에 사용된 외인성 DNA는 적합한 세포, 및 관련 기술분야에 공지된 기술을 사용하여 제조된 구축물로부터 수득된다. 마찬가지로, 유전적으로 변경된 숙주 세포에서 외인성 DNA 또는 RNA 서열의 발현을 수득하기 위한 기술은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Kormal et al., Proc. Natl. Acad. Sci. USA, 84:2150-2154 (1987)]; [Sambrook et al. Molecular Cloning: a Laboratory Manual, 2nd Ed., 1989, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]을 참조하며; 이들의 각각은 관심의 DNA의 진핵 발현을 위한 방법 및 조성물에 관하여 본원에 참조로 포함됨).

일부 측면에서, DNA 구축물은 분비 세포 내에서 관심의 DNA (예를 들어, 인슐린, 글루코키나제, 이들의 조합, 또는 그의 단편을 코딩하는 변형된 핵산)의 발현을 용이하게 하는 프로모터를 함유한다. 일부 측면에서, 프로모터는 강한 진핵 프로모터, 예컨대 시토메갈로바이러스 (CMV), 마우스 유방 종양 바이러스 (MMTV), 라우스 육종 바이러스 (RSV), 또는 아데노바이러스로부터의 프로모터이다. 예시적인 프로모터는 인간 CMV의 극초기 유전자로부터의 프로모터 (Boshart et al., Cell 41:521-530 (1985) 및 RSV의 긴 말단 반복부 (LTR)로부터의 프로모터 (Gorman et al., Proc. Natl. Acad. Sci. USA 79:6777-6781 (1982))를 포함하나 이에 제한되지는 않는다. 대안적으로, 사용되는 프로모터는 조직-특이적 프로모터일 수 있다.

본 개시내용의 구축물은 또한 구축물을 함유하고/거나 발현하는 세포의 선택을 보조하는 다른 성분, 예컨대 마커 (예를 들어, 항생제 저항성 유전자 (예컨대 암피실린 저항성 유전자) 또는 β-갈락토시다제), 박테리아 세포에서 구축물의 안정한 복제를 위한 복제 원점 (바람직하게는, 높은 카피 수 복제 원점), 핵 국재화 신호, 또는 DNA 구축물, 그에 의해 코딩되는 단백질, 또는 둘 다의 생산을 용이하게 하는 다른 요소를 포함할 수 있다.

진핵 발현을 위해, 구축물은 최소로 관심의 DNA (예를 들어, 인슐린, 글루코키나제, 이들의 조합, 또는 그의 단편을 코딩하는 변형된 핵산)에 작동가능하게 연결된 진핵 프로모터를 함유할 수 있으며, 이는 다시 폴리아데닐화 서열에 작동가능하게 연결된다. 폴리아데닐화 신호 서열은 관련 기술분야에 공지된 다양한 폴리아데닐화 신호 서열 중 임의의 것으로부터 선택될 수 있다. 일부 측면에서, 폴리아데닐화 신호 서열은 SV40 초기 폴리아데닐화 신호 서열이다. 구축물은 또한 관심의 DNA의 발현의 수준을 증가시킬 수 있는 하나 이상의 인트론을 포함할 수 있으며, 특히 여기서 관심의 DNA는 cDNA (예를 들어, 천연-발생 서열의 인트론을 함유하지 않음)이다. 관련 기술분야에 공지된 다양한 인트론 중 임의의 것이 사용될 수 있다 (예를 들어, 관심의 DNA에 대해 위치 5'에서 구축물에 삽입된 인간 β-글로빈 인트론).

관심의 DNA (예를 들어, 인슐린, 글루코키나제, 이들의 조합, 또는 그의 단편을 코딩하는 변형된 핵산)는 구축물 내로 삽입될 수 있으며, 그에 따라 치료 분자 (예를 들어, 단백질)는 융합 단백질 (예를 들어, N-말단에 β-갈락토시다제 또는 그의 부분 및 C-말단 부분에 치료 단백질을 갖는 융합 단백질)로서 발현된다. 융합 단백질의 생산은 단백질을 발현하는 형질전환된 세포의 확인을 용이하게 할 수 있다 (예를 들어, 융합 단백질에 결합하는 항체를 사용한 효소-연결 면역흡착 검정 (ELISA)에 의해).

관심의 DNA (예를 들어, 인슐린, 글루코키나제, 이들의 조합, 또는 그의 단편을 코딩하는 변형된 핵산)의 전달을 위한 벡터는 바이러스성 또는 비-바이러스성 중 어느 하나일 수 있거나, 아주반트, 예컨대 바이러스 입자 (예를 들어, AAV 입자) 또는 양이온성 지질 또는 리포솜과 혼합된 네이키드 DNA로 구성될 수 있다. "아주반트"는 혼자만으로는 목적하는 효과를 생성하지 않지만, 활성 화합물의 작용을 증진시키거나 다르게는 개선시키도록 작용하는 물질이다. 사용되는 정확한 벡터 및 벡터 제제는 몇몇 인자, 예컨대 유전자 전달을 위해 표적화되는 세포 및/또는 기관에 의존할 것이다.

적합한 프로모터의 예는 시토메갈로바이러스 (CMV) 극초기 프로모터, 바이러스 긴 말단 반복부 프로모터 (LTR), 예컨대 뮤린 몰로니 백혈병 바이러스 (MMLV) 라우스 육종 바이러스, 또는 HTLV-1로부터의 것들, 원숭이 바이러스 40 (SV 40) 초기 프로모터, RSV 프로모터, 및 단순 포진 바이러스 티미딘 키나제 프로모터를 포함한다. 일부 측면에서, 프로모터는 세포-특이적 및/또는 조직-특이적 프로모터이다. 일부 측면에서, 프로모터는 인트론성 서열과 함께 사용된다. 일부 측면에서, 프로모터는 조직 특이적이다. 일부 측면에서, 프로모터는 CMV 프로모터이다. 일부 측면에서, CMV 프로모터는 미니 CMV 프로모터이다.

일부 측면에서, 발현 카세트는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF를 포함하는 변형된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하고, 여기서 변형된 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 발현 카세트는 서열식별번호: 122와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF를 포함하는 변형된 핵산 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159의 서열을 갖는 핵산을 포함하는 오픈 리딩 프레임을 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 서열식별번호: 122의 서열을 갖는 핵산을 포함하는 오픈 리딩 프레임을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1, 표 13, 및/또는 도 1A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 발현 카세트는 야생형 프리프로인슐린 분비 신호 펩티드를 포함하는 인간 인슐린을 코딩하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 본 개시내용의 폴리뉴클레오티드는 야생형 프리프로인슐린 분비 신호 펩티드를 코딩하지 않는다. 일부 측면에서, 야생형 프리프로인슐린은 비-인슐린 분비 신호에 의해 대체된다. 일부 측면에서, 발현 카세트는 인터류킨 6 (IL-6) 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 발현 카세트는 피브로넥틴 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩하는 폴리뉴클레오티드를 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 또는 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함하는 변형된 핵산을 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR 서열을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함하는 변형된 핵산을 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 3' UTR 서열을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하고, 여기서 변형된 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 발현 카세트는 서열식별번호: 138과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161의 서열을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 138의 서열을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하는 변형된 핵산을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF를 포함하는 변형된 핵산 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162의 서열을 갖는 변형된 핵산에 작동가능하게 연결된 프로모터를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함하는 변형된 핵산을 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR 서열을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함하는 변형된 핵산을 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 3' UTR 서열을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하고, 여기서 핵산 서열은 인간 글루코키나제 단백질 (예를 들어, 서열식별번호: 82) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 발현 카세트는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39로부터 선택되는 서열의 핵산 5-2025와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164의 서열을 갖는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39의 핵산 5-2025를 포함하는 변형된 핵산을 포함한다. 일부 측면에서, 발현 카세트는 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하는 변형된 핵산을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제1 ORF를 포함하는 제1 변형된 핵산 및 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%, 또는 100% 서열 동일성을 갖는 제2 ORF를 포함하는 제2 변형된 핵산 서열을 포함한다.

일부 측면에서, 발현 카세트는 변형된 핵산에 작동가능하게 연결된 프로모터를 포함하고, 여기서 각각의 제1 및 제2 변형된 핵산은 각각 제1 및 제2 프로모터에 연결된다. 일부 측면에서, 제1 ORF를 포함하는 제1 변형된 핵산 서열은 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 및 서열식별번호: 159로 이루어진 군으로부터 선택되고, 제2 ORF를 포함하는 제2 변형된 핵산 서열은 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 및 서열식별번호: 162로 이루어진 군으로부터 선택된다.

일부 측면에서, 제1 변형된 핵산 서열은 야생형 프리프로인슐린 분비 신호 펩티드를 포함하는 인간 인슐린을 코딩한다. 일부 측면에서, 제1 변형된 핵산 서열은 야생형 프리프로인슐린 분비 신호 펩티드를 코딩하지 않는다. 일부 측면에서, 야생형 프리프로인슐린은 비-인슐린 분비 신호에 의해 대체된다. 일부 측면에서, 제1 변형된 핵산 서열은 인터류킨 6 (IL-6) 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩한다. 일부 측면에서, 제1 변형된 핵산 서열은 피브로넥틴 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩한다.

일부 측면에서, 제1 및 제2 변형된 핵산 서열은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다.

일부 측면에서, 제1 및 제2 변형된 핵산 서열은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호 99, 서열식별번호: 100, 서열식별번호: 101, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호 99, 서열식별번호: 100, 서열식별번호: 101, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다.

일부 측면에서, 발현 카세트는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제1 변형된 핵산 및 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제2 변형된 핵산 서열을 포함하고, 여기서 각각의 제1 및 제2 변형된 핵산은 각각 제1 및 제2 프로모터에 연결된다. 일부 측면에서, 제1 변형된 핵산 서열은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖고, 제2 변형된 핵산은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39로부터 선택되는 서열의 핵산 5-2025와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는다. 일부 측면에서, 제1 변형된 핵산 서열은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161로 이루어진 군으로부터 선택되고, 제2 핵산 서열은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164로 이루어진 군으로부터 선택된다. 일부 측면에서, 제1 변형된 핵산은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16의 핵산 5-957을 포함하고, 제2 변형된 핵산은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39의 핵산 5-2025를 포함한다. 일부 측면에서, 제1 변형된 핵산 서열은 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하고, 제2 변형된 핵산 서열은 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함한다.

본 개시내용의 특정 측면은 발현 구축물, 예를 들어, 벡터에 관한 것이다. 일부 측면에서, 발현 구축물은 발현 카세트를 포함한다. 일부 측면에서, 발현 구축물은 세포에서 안정화될 수 있고 에피솜적으로 잔류하는 게놈을 추가로 포함한다. 본 개시내용의 맥락 내에서, 일부 측면에서, 세포 또는 숙주 세포는 구축물을 제조하는데 사용되는 세포 또는 구축물이 투여되는 세포를 포괄할 수 있다. 일부 측면에서, 구축물은 예를 들어 상동 재조합 또는 다른 것을 통해 세포의 게놈 내로 통합될 수 있다. 일부 측면에서, 발현 구축물은 본원에 개시된 바와 같은 인슐린 및/또는 글루코키나제를 코딩하는 뉴클레오티드 서열이 본원에서 제공된 바와 같은 프로모터에 작동가능하게 연결된 것이고, 여기서 프로모터는 세포에서 뉴클레오티드 서열(들) (즉, 코딩 서열(들))의 발현을 지정할 수 있다. 일부 측면에서, 본원에 사용된 발현 카세트는 인슐린을 코딩하는 뉴클레오티드 서열 및/또는 글루코키나제를 코딩하는 뉴클레오티드 서열을 포함하거나 이로 이루어지고, 각각의 경우에, 뉴클레오티드 서열은 프로모터에 작동가능하게 연결되고, 여기서 프로모터는 상기 뉴클레오티드 서열의 발현을 지정할 수 있다. 일부 측면에서, 바이러스 발현 구축물은 유전자 요법에 사용되도록 의도되는 발현 구축물이다. 이는 본원에 개시된 바와 같은 바이러스 게놈의 부분을 포함하도록 디자인될 수 있다.

일부 측면에서, 발현 구축물은 ITR 서열 (예를 들어, AAV2 ITR), 폴리A 서열 (예를 들어, SV40 폴리아데닐화 신호, bGH 폴리아데닐화 신호), 및 인핸서 서열 (예를 들어, SV40 인핸서 서열) 중 하나 이상을 추가로 포함한다.

일부 측면에서, 본원에 개시된 발현 구축물은 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 서열이 예컨대 문헌 [Ausubel et al., "Current Protocols in Molecular Biology", Greene Publishing and Wiley-Interscience, New York (1987)] 및 [Sambrook and Russell (2001, 상기 문헌)] (이들 둘 다는 그 전문이 본원에 참조로 포함됨)에 기재된 바와 같이 적합한 세포, 예를 들어 배양된 세포 또는 다세포 유기체의 세포에서 발현되는 재조합 기술을 사용하여 제조된다. 또한, 문헌 [Kunkel (1985) Proc. Natl. Acad. Sci. 82:488 (부위 지정 돌연변이유발을 기재함) 및 [Roberts et al. (1987) Nature 328:731-734] 또는 [Wells, J. A., et al. (1985) Gene 34: 315] (카세트 돌연변이유발을 기재함)을 참조한다.

전달 벡터

본 개시내용은 또한 본원에 기재된 변형된 핵산, 폴리뉴클레오티드, 또는 발현 카세트 중 임의의 것을 포함하는 벡터를 제공한다. 일부 측면에서, 전달 벡터는 바이러스 벡터, 비-바이러스 벡터, 플라스미드, 지질, 또는 리소좀이다. 일부 측면에서, 전달 벡터는 바이러스 벡터이다. 일부 측면에서, 바이러스 벡터는 아데노-연관 바이러스 (AAV) 발현 벡터이다.

일부 측면에서, 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 또는 뉴클레오티드 서열은 발현 구축물 또는 발현 벡터에 사용된다. 어구 "발현 벡터"는 일반적으로 이러한 서열과 혼화성인 숙주에서 유전자의 발현을 실행할 수 있는 뉴클레오티드 서열을 지칭한다. 이들 발현 벡터는 적어도 적합한 프로모터 서열 및 임의로, 전사 종결 신호를 포함할 수 있다. 발현을 실행하는데 필요하거나 도움이 되는 추가의 인자는 또한 본원에 개시된 바와 같이 사용될 수 있다. 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 또는 DNA 또는 코돈-최적화된 뉴클레오티드 서열은 시험관내 세포 배양물 내로의 도입 및 그에서의 발현이 가능한 발현 벡터 내로 혼입될 수 있다. 일부 측면에서, 발현 벡터는 원핵 숙주, 예컨대 박테리아, 예를 들어, 이. 콜라이(E. coli)에서의 복제에 적합하거나, 배양된 포유동물, 식물, 곤충 (예를 들어, Sf9), 효모, 진균 또는 다른 진핵 세포주 내로 도입될 수 있다. 일부 측면에서, 발현 구축물은 생체내에서의 발현에 적합하다.

일부 측면에서, 전달 벡터는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF를 포함하는 변형된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함하고, 여기서 변형된 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 전달 벡터는 서열식별번호: 122와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF를 포함하는 변형된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함한다. 일부 측면에서, 변형된 핵산은 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159의 서열을 갖는 ORF를 포함한다. 일부 측면에서, 변형된 핵산은 서열식별번호: 122의 서열을 갖는 ORF를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1, 표 13, 및/또는 도 1A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 전달 벡터는 야생형 프리프로인슐린 분비 신호 펩티드를 포함하는 인간 인슐린을 코딩하는 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 야생형 프리프로인슐린 분비 신호 펩티드를 코딩하지 않는 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 야생형 프리프로인슐린은 비-인슐린 분비 신호에 의해 대체된다. 일부 측면에서, 전달 벡터는 인터류킨 6 (IL-6) 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩하는 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 피브로넥틴 분비 신호 펩티드를 포함하는 인간 프리프로인슐린을 코딩하는 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%, 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR 서열을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 1 및/또는 도 1A에 존재하거나 언급된 3' UTR 서열을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함하고, 여기서 변형된 핵산 서열은 인간 인슐린 단백질 (예를 들어, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 전달 벡터는 서열식별번호: 138과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161의 서열을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 138의 서열을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16의 핵산 5-957을 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 ORF 서열을 포함하는 변형된 핵산에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162의 서열을 갖는 변형된 핵산에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 ORF 서열을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR 서열을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 표 2 및/또는 도 2A에 존재하거나 언급된 3' UTR 서열을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164로부터 선택되는 서열과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함하고, 여기서 핵산 서열은 인간 글루코키나제 단백질 (예를 들어, 서열식별번호: 82) 또는 그의 기능적 단편을 코딩한다. 일부 측면에서, 전달 벡터는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39로부터 선택되는 서열의 핵산 5-2025와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164의 서열을 갖는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39의 핵산 5-2025를 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하는 변형된 핵산을 포함하는 발현 카세트를 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 또는 서열식별번호: 159와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제1 ORF를 포함하는 제1 변형된 핵산, 및 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제2 ORF를 포함하는 제2 변형된 핵산 서열을 포함하는 발현 카세트를 포함한다. 일부 측면에서, 전달 벡터는 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 서열식별번호: 80, 또는 서열식별번호: 162의 서열을 갖는 변형된 핵산에 작동가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함하고, 여기서 각각의 제1 및 제2 변형된 핵산은 각각 제1 및 제2 프로모터에 연결된다. 일부 측면에서, 제1 ORF를 포함하는 제1 변형된 핵산 서열은 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45, 서열식별번호: 46, 서열식별번호: 47, 서열식별번호: 48, 서열식별번호: 49, 서열식별번호: 50, 서열식별번호: 51, 서열식별번호: 52, 서열식별번호: 53, 서열식별번호: 54, 서열식별번호: 55, 서열식별번호: 56, 서열식별번호: 57, 서열식별번호: 110, 서열식별번호: 111, 서열식별번호: 112, 서열식별번호: 113, 서열식별번호: 114, 서열식별번호: 115, 서열식별번호: 116, 서열식별번호: 117, 서열식별번호: 118, 서열식별번호: 119, 서열식별번호: 120, 서열식별번호: 121, 서열식별번호: 122, 서열식별번호: 150, 서열식별번호: 151, 서열식별번호: 152, 서열식별번호: 153, 서열식별번호: 154, 서열식별번호: 155, 서열식별번호: 156, 서열식별번호: 157, 서열식별번호: 158, 및 서열식별번호: 159로 이루어진 군으로부터 선택되고, 제2 ORF를 포함하는 제2 변형된 핵산 서열은 서열식별번호: 61, 서열식별번호: 62, 서열식별번호: 63, 서열식별번호: 64, 서열식별번호: 65, 서열식별번호: 66, 서열식별번호: 67, 서열식별번호: 68, 서열식별번호: 69, 서열식별번호: 70, 서열식별번호: 71, 서열식별번호: 72, 서열식별번호: 73, 서열식별번호: 74, 서열식별번호: 75, 서열식별번호: 76, 서열식별번호: 77, 서열식별번호: 78, 서열식별번호: 79, 및 서열식별번호: 80으로 이루어진 군으로부터 선택된다.

일부 측면에서, 제1 및 제2 변형된 핵산 서열은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%, 100% 서열 동일성을 갖는 핵산 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 5' UTR은 서열식별번호: 42, 서열식별번호: 42의 핵산 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148의 서열을 갖는 핵산을 포함한다.

일부 측면에서, 제1 및 제2 변형된 핵산 서열은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 3' UTR은 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택되는 제한 부위를 포함한다. 일부 측면에서, 3' UTR은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149의 서열을 갖는 핵산을 포함한다.

일부 측면에서, 전달 벡터는 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, least 99%, 또는 100% 서열 동일성을 갖는 제1 변형된 핵산 및 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 제2 변형된 핵산 서열을 포함하는 발현 카세트를 포함하고, 여기서 각각의 제1 및 제2 변형된 핵산은 각각 제1 및 제2 프로모터에 연결된다. 일부 측면에서, 제1 변형된 핵산은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16으로부터 선택되는 서열의 핵산 5-957과 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖고, 제2 변형된 핵산 서열은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39로부터 선택되는 서열의 핵산 5-2025와 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는다. 일부 측면에서, 제1 변형된 핵산 서열은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 서열식별번호: 16, 서열식별번호: 84, 서열식별번호: 85, 서열식별번호: 86, 서열식별번호: 87, 서열식별번호: 88, 서열식별번호: 123, 서열식별번호: 124, 서열식별번호: 125, 서열식별번호: 126, 서열식별번호: 127, 서열식별번호: 128, 서열식별번호: 129, 서열식별번호: 130, 서열식별번호: 131, 서열식별번호: 132, 서열식별번호: 133, 서열식별번호: 134, 서열식별번호: 135, 서열식별번호: 136, 서열식별번호 137, 서열식별번호: 138, 서열식별번호: 139, 서열식별번호: 140, 서열식별번호: 141, 서열식별번호: 160, 또는 서열식별번호: 161로 이루어진 군으로부터 선택되고, 제2 핵산 서열은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 89, 서열식별번호: 90, 서열식별번호: 91, 서열식별번호: 92, 서열식별번호: 93, 서열식별번호: 94, 서열식별번호: 95, 서열식별번호: 96, 서열식별번호: 163, 또는 서열식별번호: 164로 이루어진 군으로부터 선택된다. 일부 측면에서, 제1 변형된 핵산 서열은 서열식별번호: 1, 서열식별번호: 2, 서열식별번호: 3, 서열식별번호: 4, 서열식별번호: 5, 서열식별번호: 6, 서열식별번호: 7, 서열식별번호: 8, 서열식별번호: 9, 서열식별번호: 10, 서열식별번호: 11, 서열식별번호: 12, 서열식별번호: 13, 서열식별번호: 14, 서열식별번호: 15, 또는 서열식별번호: 16의 핵산 5-957을 포함하고, 제2 변형된 핵산 서열은 서열식별번호: 20, 서열식별번호: 21, 서열식별번호: 22, 서열식별번호: 23, 서열식별번호: 24, 서열식별번호: 25, 서열식별번호: 26, 서열식별번호: 27, 서열식별번호: 28, 서열식별번호: 29, 서열식별번호: 30, 서열식별번호: 31, 서열식별번호: 32, 서열식별번호: 34, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38, 또는 서열식별번호: 39의 핵산 5-2025를 포함한다. 일부 측면에서, 제1 변형된 핵산 서열은 표 1 및/또는 도 1A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함하고, 제2 변형된 핵산 서열은 표 2 및/또는 도 2A에 존재하거나 언급된 5' UTR, ORF, 및 3' UTR을 포함한다.

일부 측면에서, 전달 벡터는 제어 또는 조절 서열, 선택가능한 마커, 임의의 융합 상대, 및/또는 추가의 요소와 작동가능하게 연결된 단백질 (예를 들어, 인슐린 및/또는 Gck)을 코딩하는 서열을 포함할 수 있다. 특정 측면에서, 변형된 핵산은 또 다른 핵산 서열과 기능적 관계에 놓인다. 용어 "조절 서열"은 단백질의 전사 또는 번역을 제어하는 프로모터, 인핸서 및 다른 발현 제어 요소 (예를 들어, 폴리아데닐화 신호)를 포함한다. 이러한 조절 서열은 예를 들어, 문헌 [Goeddel (Gene Expression Technology, Methods in Enzymology 185, Academic Press, San Diego, CA (1990))]에 기재되어 있다. 일부 측면에서, 발현 벡터는 단백질을 코딩하는 핵산에 작동가능하게 연결된 전사 및 번역 조절 핵산을 포함하고, 전형적으로 단백질을 발현하는데 사용되는 숙주 세포에 대해 적절하다. 일반적으로, 전사 및 번역 조절 서열은 프로모터 서열, 리보솜 결합 부위, 전사 시작 및 정지 서열, 번역 시작 및 정지 서열, 및 인핸서 또는 활성화인자 서열을 포함할 수 있다. 또한 관련 기술분야에 공지된 바와 같이, 발현 벡터는 발현 벡터를 함유하는 형질전환된 숙주 세포의 선택을 허용하는 선택 유전자 또는 마커를 함유할 수 있다. 선택 유전자는 관련 기술분야에 공지되어 있으며, 사용되는 숙주 세포에 따라 다양할 것이다. 예를 들어, 전형적으로 선택가능한 마커 유전자는 벡터가 도입된 숙주 세포 상의 약물, 예컨대 G418, 히그로마이신 또는 메토트렉세이트에 대한 저항성을 부여한다. 일부 측면에서, 선택가능한 마커 유전자는 디히드로폴레이트 리덕타제 (DHFR) 유전자 (메토트렉세이트 선택/증폭을 갖는 dhfr- 숙주 세포에서 사용하기 위해) 및 neo 유전자 (G418 선택을 위해)를 포함한다.

일부 측면에서, 전달 벡터는 바이러스 발현 구축물을 포함하는 바이러스 벡터 또는 유전자 요법 벡터이다. 특정 측면에서, 바이러스 벡터 또는 유전자 요법 벡터는 유전자 요법에 적합한 벡터이다.

일부 측면에서, 유전자 요법 벡터는 아데노바이러스 및 아데노-연관 바이러스 (AAV) 벡터를 포함한다. 이들 벡터는 윤활막 세포 및 간 세포를 포함하는 폭넓은 수의 분열 및 비-분열 세포 유형을 감염시킨다. 세포 진입 후의 아데노바이러스 및 AAV 벡터의 에피솜적 성질은 상기 지시된 바와 같이 이들 벡터를 치료 적용에 적합하게 만든다 (Russell, 2000, J. Gen. Virol. 81: 2573-2604; Goncalves, 2005, Virol J. 2(1):43). AAV 벡터는 트랜스진 발현의 매우 안정한 장기 발현을 발생시킬 수 있다 (개에서 최대 9년 (Niemeyer et al., Blood. 2009 Jan. 22; 113(4):797-806) 및 인간에서 최대 2년 (Nathwani et al., N Engl J Med. 2011 Dec. 22; 365(25):2357-65, Simonelli et al., Mol Ther. 2010 March; 18(3):643-50. Epub 2009 Dec. 1.)). 일부 측면에서, 아데노바이러스 벡터는 러셀(Russell) (2000, 상기 문헌)에 의해 검토된 바와 같이 숙주 반응을 감소시키도록 변형된다. AAV 벡터를 사용한 유전자 요법을 위한 방법은 문헌 [Wang et al., 2005, J Gene Med. March 9 (Epub ahead of print)], [Mandel et al., 2004, Curr Opin Mol Ther. 6(5):482-90], 및 [Martin et al., 2004, Eye 18(11):1049-55], [Nathwani et al., N Engl J Med. 2011 Dec. 22; 365(25):2357-65], [Apparailly et al., Hum Gene Ther. 2005 April; 16(4):426-34]에 의해 기재되어 있다.

일부 측면에서, 유전자 요법 벡터는 레트로바이러스 벡터를 포함한다. 일부 측면에서, 레트로바이러스 벡터는 렌티바이러스 기반 발현 구축물이다. 렌티바이러스 벡터는 분열 및 비-분열 세포의 게놈을 감염시키고 그 내로 안정하게 통합되는 능력을 갖는다 (Amado and Chen, 1999 Science 285: 674-6). 렌티바이러스 기반 발현 구축물의 구축 및 사용을 위한 방법은 미국 특허 번호 6,165,782, 6,207,455, 6,218,181, 6,277,633 및 6,323,031 및 문헌 [Federico (1999, Curr Opin Biotechnol 10: 448-53)] 및 [Vigna et al. (2000, J Gene Med 2000; 2: 308-16)]에 기재되어 있다.

일부 측면에서, 유전자 요법 벡터는 포진 바이러스 벡터, 폴리오마 바이러스 벡터 또는 백시니아 바이러스 벡터이다.

일부 측면에서, 유전자 요법 벡터는 인슐린 및/또는 글루코키나제를 코딩하는 변형된 뉴클레오티드 서열을 포함하고, 그에 의해 상기 변형된 뉴클레오티드 서열의 각각은 적절한 조절 서열에 작동가능하게 연결된다. 이러한 조절 서열은 적어도 프로모터 서열을 포함할 수 있다. 유전자 요법 벡터로부터 인슐린 및/또는 글루코키나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 적합한 프로모터는 예를 들어 시토메갈로바이러스 (CMV) 극초기 프로모터, 바이러스 긴 말단 반복부 프로모터 (LTR), 예컨대 뮤린 몰로니 백혈병 바이러스 (MMLV) 라우스 육종 바이러스, 또는 HTLV-1로부터의 것들, 원숭이 바이러스 40 (SV 40) 초기 프로모터 및 단순 포진 바이러스 티미딘 키나제 프로모터를 포함할 수 있다.

일부 측면에서, 유전자 요법 벡터는 추가의 폴리펩티드를 코딩하는 추가의 뉴클레오티드 서열을 포함한다. 추가의 폴리펩티드는 발현 구축물을 함유하는 세포에 대한 확인, 선택 및/또는 스크리닝을 허용하는 (선택가능한) 마커 폴리펩티드일 수 있다. 일부 측면에서, 이 목적을 위한 적합한 마커 단백질은 예를 들어 형광 단백질 GFP, 및 선택가능한 마커 유전자 HSV 티미딘 키나제 (HAT 배지 상의 선택을 위해), 박테리아 히그로마이신 B 포스포트랜스퍼라제 (히그로마이신 B 상의 선택을 위해), Tn5 아미노글리코시드 포스포트랜스퍼라제 (G418 상의 선택을 위해), 및 디히드로폴레이트 리덕타제 (DHFR) (메토트렉세이트 상의 선택을 위해), CD20, 낮은 친화도 신경 성장 인자 유전자이다. 이들 마커 유전자를 수득하기 위한 공급원 및 그들의 사용을 위한 방법은 문헌 [Sambrook and Russel (2001) "Molecular Cloning: A Laboratory Manual (3^rdedition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York]에서 제공된다.

비-바이러스 벡터

일부 측면에서, 본 개시내용의 변형된 핵산, 폴리뉴클레오티드, 또는 발현 구축물은 비-바이러스 벡터를 사용하여 투여될 수 있다. 본원에 사용된 "비-바이러스 벡터"는 네이키드 DNA, 네이키드 DNA를 함유하는 화학적 제제 (예를 들어, DNA 및 양이온성 화합물 (예를 들어, 덱스트란 술페이트)의 제제), 및 아주반트, 예컨대 바이러스 입자와 혼합된 네이키드 DNA (즉, 관심의 DNA는 바이러스 입자 내에 함유되지 않지만, 전환 제제는 네이키드 DNA 및 바이러스 입자 (예를 들어, AAV 입자) 둘 다로 구성됨 (예를 들어, 문헌 [Curiel et al., Am. J. Respir. Cell Mol. Biol. 6:247-52 (1992)] 참조)를 포함하는 것으로 의미된다. 따라서, "비-바이러스 벡터"는 DNA 더하기 바이러스 입자로 구성된 벡터를 포함할 수 있으며, 여기서 바이러스 입자는 바이러스 게놈 내에 관심의 DNA를 함유하지 않는다.

일부 측면에서, 본 개시내용의 변형된 핵산, 폴리뉴클레오티드, 또는 발현 구축물은 다가양이온성 물질, 예컨대 폴리-L-리신 또는 DEAC-덱스트란, 표적화 리간드, 및/또는 DNA 결합 단백질 (예를 들어, 히스톤)과 복합체화될 수 있다. DNA- 또는 RNA-리포솜 복합체 제제는 유전 물질 (DNA 또는 RNA)에 결합하고 세포 내로의 핵산의 전달을 용이하게 하는 지질의 혼합물을 포함한다. 본 개시내용에 따라 사용될 수 있는 리포솜은 DOPE (디올레일 포스파티딜 에탄올 아민), CUDMEDA (N-(5-콜레스트룸-3-β-올 3-우레타닐)-N',N'-디메틸에틸렌 디아민)를 포함한다.

일부 측면에서, 본 개시내용의 변형된 핵산, 폴리뉴클레오티드, 또는 발현 구축물은 또한 숙주 세포의 생물학적 특성을 변경시킬 목적으로 숙주 세포에의 전달을 용이하게 하는 운반체 분자 (예를 들어, 항체 또는 수용체 리간드)에 커플링된 DNA 또는 RNA의 화학적 제제로서 투여될 수 있다. 용어 "화학적 제제"는 운반체 분자, 예컨대 단백질 또는 지질, 또는 그의 유도체에의 핵산 화합물의 커플링을 허용하는 핵산의 변형을 지칭한다. 예시적인 단백질 운반체 분자는 표적 세포에 특이적인 항체, 즉, 전달을 위해 표적화되는 세포와 회합된 수용체와 상호작용할 수 있는 분자를 포함한다.

아데노 연관 바이러스 벡터 (AAV 벡터)

일부 측면에서, 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 또는 발현 구축물은 패키징된 바이러스 벡터의 성분으로서 투여될 수 있다. 일반적으로, 패키징된 바이러스 벡터는 캡시드에 패키징된 바이러스 벡터를 포함한다.

일부 측면에서, 바이러스 벡터는 AAV 벡터이다. 일부 측면에서, 본원에 사용된 AAV 벡터는 재조합 AAV 벡터 (rAAV)를 포함할 수 있다. 본원에 사용된 "rAAV 벡터"는 본원에 개시된 바와 같은 AAV 혈청형으로부터 유래된 캡시드 단백질의 단백질 쉘에 캡시드화된 AAV 게놈의 부분을 포함하는 재조합 벡터를 지칭한다. AAV 게놈의 부분은 아데노-연관 바이러스 혈청형, 예컨대 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAV9, AAV10, AAVRH10, AAV11, AAV12, 및 다른 것들로부터 유래된 역위 말단 반복부 (ITR)를 함유할 수 있다. 일부 측면에서, ITR은 AAV2로부터 유래된다.

전형적으로, 벡터 게놈은 rAAV 캡시드 내로의 벡터 게놈의 효율적인 패키징을 허용하는 플랭킹 5' 및 3' ITR 서열의 사용을 요구한다. 일부 측면에서, rAAV 벡터에 존재하는 rAAV 게놈은 적어도 AAV 혈청형 중 (예를 들어, 본원에서 앞서 개시된 바와 같은 혈청형 AAV2 중) 하나의 역위 말단 반복부 영역 (ITR)의 뉴클레오티드 서열, 또는 그와 실질적으로 동일한 뉴클레오티드 서열, 및 적합한 조절 요소 (예를 들어, 프로모터)의 제어 하에서 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 서열을 포함하고, 여기서 조절 요소 및 변형된 핵산 서열(들)은 2개의 ITR 사이에 삽입된다.

몇몇 AAV 혈청형의 완전한 게놈 및 상응하는 ITR은 시퀀싱되었다 (Chiorini et al. 1999, J. of Virology Vol. 73, No. 2, p 1309-1319). 이들은 관련 기술분야에 공지된 바와 같은 화학적 합성에 의해, 예를 들어 어플라이드 바이오시스템스 인크.(Applied Biosystems Inc.) (미국 캘리포니아주 포스터스)에 의해 공급된 바와 같은 올리고뉴클레오티드 합성기를 사용하여 또는 표준 분자 생물학 기술에 의해 클로닝되거나 제조될 수 있다. ITR은 AAV 바이러스 게놈으로부터 클로닝되거나 AAV ITR을 포함하는 벡터로부터 삭제될 수 있다. ITR 뉴클레오티드 서열은 표준 분자 생물학 기술을 사용하여 하나 이상의 치료 단백질을 코딩하는 뉴클레오티드 서열에 대해 양쪽 말단에서 라이게이션될 수 있거나, ITR 사이의 야생형 AAV 서열은 목적하는 뉴클레오티드 서열로 대체될 수 있다.

패키징된 바이러스 벡터의 바이러스 캡시드 성분은 파르보바이러스 캡시드, 예를 들어, AAV Cap 및/또는 키메라 캡시드일 수 있다. 적합한 파르보바이러스 바이러스 캡시드 성분의 예는 파르보비리다에(Parvoviridae) 과, 예컨대 자율 파르보바이러스 또는 데펜도바이러스(Dependovirus)로부터의 캡시드 성분이다. 예를 들어, 바이러스 캡시드는 AAV 캡시드 (예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVRH8 AAV 9, AAV10, AAVRH10, AAV11 또는 AAV12 캡시드; 관련 기술분야의 통상의 기술자는 동일하거나 유사한 기능을 수행하는 아직 확인되지 않는 다른 변이체가 있을 가능성이 있음을 알 것임)일 수 있거나, 2개 이상의 AAV 캡시드로부터의 성분을 포함할 수 있다. AAV Cap 단백질의 전체 상보체는 VP1, VP2, 및 VP3을 포함한다. AAV VP 캡시드 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 ORF는 전체 상보체 AAV Cap 단백질 미만을 포함할 수 있거나, AAV Cap 단백질의 전체 상보체가 제공될 수 있다.

AAV Cap 단백질 중 하나 이상은 2개 이상의 바이러스, 바람직하게는 2개 이상의 AAV로부터의 아미노산 서열 AAV Cap를 포함하는 키메라 단백질일 수 있다. 예를 들어, 키메라 바이러스 캡시드는 AAV1 Cap 단백질 또는 서브유닛 및 적어도 하나의 AAV2 Cap 또는 서브유닛을 포함할 수 있다. 일부 측면에서, rAAV 벡터에 존재하는 바와 같은 rAAV 게놈은 바이러스 단백질을 코딩하는 임의의 뉴클레오티드 서열, 예컨대 AAV의 rep (복제) 또는 cap (캡시드) 유전자를 포함하지 않는다. 이 rAAV 게놈은 마커 또는 리포터 유전자, 예컨대 예를 들어 항생제 저항성 유전자, 형광 단백질 (예를 들어 gfp)을 코딩하는 유전자 또는 관련 기술분야에 공지된 화학적으로, 효소적으로 또는 다르게 검출가능한 및/또는 선택가능한 생성물 (예를 들어 lacZ, aph 등)을 코딩하는 유전자를 추가로 포함할 수 있다.

일부 측면에서, 상기 rAAV 벡터에 존재하는 바와 같은 rAAV 게놈은 인슐린 및/또는 글루코키나제를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터 서열을 추가로 포함한다. 일부 측면에서, 프로모터 서열은 근육 세포 및/또는 근육 조직에서 발현을 부여하는 프로모터이다. 이러한 프로모터의 예는 본원에 개시된 바와 같은 CMV 및 RSV 프로모터를 포함한다.

일부 측면에서, 적합한 3' 비번역된 서열은 또한 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 서열에 작동가능하게 연결될 수 있다. 적합한 3' 비번역된 영역은 뉴클레오티드 서열과 자연적으로 회합된 것들일 수 있거나, 상이한 유전자, 예컨대 예를 들어 소 성장 호르몬 3' 비번역된 영역 (예를 들어, bGH 폴리아데닐화 신호, SV40 폴리아데닐화 신호, SV40 폴리아데닐화 신호 및 인핸서 서열)으로부터 유래될 수 있다.

일부 측면에서, 추가의 뉴클레오티드 서열은 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 서열(들), 예컨대 신호 서열, 핵 국재화 신호, 발현 인핸서 등을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결될 수 있다.

달리 지시되는 바를 제외하고, 관련 기술분야의 통상의 기술자에게 공지된 방법은 재조합 파르보바이러스 및 AAV (rAAV) 구축물, 파르보바이러스 Rep 및/또는 Cap 서열을 발현하는 패키징 벡터, 및 일시적으로 및 안정하게 처리된 패키징 세포의 구축에 사용될 수 있다. 이러한 기술은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 예를 들어, 문헌 [SAMBROOK et al., MOLECULAR CLONING: A LABORATORY MANUAL 2nd Ed. (Cold Spring Harbor, N.Y., 1989)]; [AUSUBEL et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (Green Publishing Associates, Inc. and John Wiley Sons, Inc., New York)]을 참조한다.

렌티바이러스 발현 구축물

렌티바이러스는 통상적인 레트로바이러스 유전자 gag, pol 및 env 외에도, 조절 또는 구조적 기능을 갖는 다른 유전자를 함유하는 복합체 레트로바이러스이다. 보다 높은 복잡성은 잠재적 감염의 과정에서와 같이, 렌티바이러스가 그의 생활 주기를 조정하는 것을 가능하게 한다.

전형적인 렌티바이러스는 AIDS의 병인체인 인간 면역결핍 바이러스 (HIV)이다. 생체내에서, HIV는 드물게 분열하는 말단 분화된 세포, 예컨대 림프구 및 대식세포를 감염시킬 수 있다. 시험관내에서, HIV는 아피디콜린 또는 γ 조사로의 처리에 의해 세포 주기에서 정지된 단핵구-유래 대식세포 (MDM) 뿐만 아니라 HeLa-Cd4 또는 T 림프 세포의 1차 배양물을 감염시킬 수 있다.

세포의 감염은 표적 세포의 핵공을 통한 HIV 통합전 복합체의 활성 핵 유입에 의존한다. 이는 표적 세포의 핵 유입 기구와의 복합체에서 다중의 부분적으로 중복적인 분자 결정자의 상호작용에 의해 일어난다. 확인된 결정자는 gag 매트릭스 (MA) 단백질, 핵친화성 비리온-연관 단백질, vpr, 및 gag MA 단백질에서의 C-말단 포스포티로신 잔기에서의 기능적 핵 국재화 신호 (NLS)를 포함한다.

렌티바이러스 게놈 및 프로바이러스 DNA는 레트로바이러스에서 발견된 3개의 유전자를 갖는다: 2개의 긴 말단 반복부 (LTR) 서열에 의해 플랭킹된 gag, pol 및 env. gag 유전자는 내부 구조 (매트릭스, 캡시드 및 뉴클레오캡시드) 단백질을 코딩하고; pol 유전자는 RNA-지정 DNA 폴리머라제 (리버스 트랜스크립타제), 프로테아제 및 인테그라제를 코딩하고; env 유전자는 바이러스 외피 당단백질을 코딩한다. 5' 및 3' LTR은 비리온 RNA의 전사 및 폴리아데닐화를 촉진시키는 역할을 한다. LTR은 바이러스 복제에 필요한 모든 다른 시스-작용 서열을 함유한다. 렌티바이러스는 vif, vpr, tat, rev, vpu, nef 및 vpx (HIV-1, HIV-2 및/또는 SIV에서)를 포함한 추가의 유전자를 갖는다.

5' LTR에 인접하여 게놈의 역전사에 (tRNA 프라이머 결합 부위) 및 입자 내로의 바이러스 RNA의 효율적인 캡시드화에 (Psi 부위) 필요한 서열이 있다. 캡시드화 (또는 감염성 비리온 내로의 레트로바이러스 RNA의 패키징)에 필요한 서열이 바이러스 게놈으로부터 소실되는 경우, 시스 결함은 게놈 RNA의 캡시드화를 방지한다. 그러나, 생성된 돌연변이체는 모든 비리온 단백질의 합성을 지정할 수 있게 잔류한다.

일부 측면에서, 재조합 렌티바이러스는 적합한 숙주 세포를 패키징 기능을 보유하는 2개 이상의 벡터, 즉, gag, pol 및 env, 뿐만 아니라 rev 및 tat로 형질감염시킴으로써 비-분열 세포를 감염시킬 수 있다. 일부 예에서, 기능적 tat 유전자가 결여된 벡터가 요망된다. 따라서, 예를 들어, 제1 벡터는 바이러스 gag 및 바이러스 pol을 코딩하는 핵산을 제공할 수 있고, 또 다른 벡터는 바이러스 env를 코딩하는 핵산을 제공하여 패키징 세포를 생산할 수 있다. 그 패키징 세포 내로 전달 벡터로서 확인된 이종 유전자를 제공하는 벡터를 도입하는 것은 관심의 외래 유전자를 보유하는 감염성 바이러스 입자를 방출하는 생산자 세포를 생성한다.

관심의 벡터의 gag, pol 및 env 유전자는 또한 관련 기술분야에 공지되어 있다. 따라서, 관련된 유전자는 선택된 벡터 내로 클로닝되고, 이어서 관심의 표적 세포를 형질전환시키는데 사용된다.

벡터 및 외래 유전자의 상기-지시된 구성에 따르면, 제2 벡터는 바이러스 외피 (env) 유전자를 코딩하는 핵산을 제공할 수 있다. env 유전자는 레트로바이러스를 포함하는 임의의 바이러스로부터 유래될 수 있다. env는 바람직하게는 인간 및 다른 종의 세포의 형질도입을 허용하는 암포트로픽 외피 단백질이다.

특정한 세포-유형의 수용체에 표적화하기 위한 항체 또는 특정한 리간드와의 외피 단백질의 연결에 의해 재조합 바이러스를 표적화하는 것이 요망될 수 있다. 특이적 표적 세포 상의 수용체에 대한 리간드를 코딩하는 또 다른 유전자와 함께, 관심의 서열 (조절 영역을 포함함)을 바이러스 벡터 내로 삽입함으로써, 예를 들어, 벡터는 이제 표적-특이적이다. 레트로바이러스 벡터는 예를 들어, 당지질 또는 단백질을 삽입함으로써 표적-특이적이 될 수 있다. 표적화는 종종 레트로바이러스 벡터를 표적화하는 항체 또는 재조합 항체-유형 분자, 예컨대 단일 쇄 항체의 항원-결합 부분을 사용함으로써 달성된다. 관련 기술분야의 통상의 기술자는 과도한 실험 없이, 특이적 표적에의 레트로바이러스 벡터의 전달을 달성하는 구체적인 방법을 알 것이거나, 용이하게 확인할 수 있다.

레트로바이러스-유래 env 유전자의 예는 몰로니 뮤린 백혈병 바이러스 (MoMuLV 또는 MMLV), 하비 뮤린 육종 바이러스 (HaMuSV 또는 HSV), 뮤린 유방 종양 바이러스 (MuMTV 또는 MMTV), 긴팔원숭이 백혈병 바이러스 (GaLV 또는 GALV), 인간 면역결핍 바이러스 (HIV) 및 라우스 육종 바이러스 (RSV)를 포함하나 이에 제한되지는 않는다. 다른 env 유전자, 예컨대 수포성 구내염 바이러스 (VSV) 단백질 G (VSV G), 간염 바이러스 및 인플루엔자의 그것은 또한 사용될 수 있다.

바이러스 env 핵산 서열을 제공하는 벡터는 조절 서열, 예를 들어, 프로모터 또는 인핸서와 작동가능하게 회합된다. 조절 서열은 예를 들어, 몰로니 뮤린 백혈병 바이러스 프로모터-인핸서 요소, 인간 시토메갈로바이러스 인핸서 또는 백시니아 P7.5 프로모터를 포함하는 임의의 진핵 프로모터 또는 인핸서일 수 있다. 일부 경우에, 예컨대 몰로니 뮤린 백혈병 바이러스 프로모터-인핸서 요소의 경우에, 프로모터-인핸서 요소는 LTR 서열 내에 또는 그에 인접하게 위치한다.

일부 측면에서, 상기 렌티바이러스 벡터에 존재하는 바와 같은 렌티바이러스 게놈은 인슐린 및/또는 글루코키나제를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터 서열을 추가로 포함한다. 일부 측면에서, 프로모터 서열은 근육 세포 및/또는 근육 조직에서 발현을 부여하는 프로모터이다. 이러한 프로모터의 예는 본원에 개시된 바와 같은 CMV 및 RSV 프로모터를 포함한다.

달리 지시되는 바를 제외하고는, 관련 기술분야의 통상의 기술자에게 공지된 방법은 렌티바이러스 구축물, 벡터, 및 일시적으로 및 안정하게 처리된 패키징 세포의 구축에 사용될 수 있다. 이러한 기술은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 예를 들어, 문헌 [SAMBROOK et al., MOLECULAR CLONING: A LABORATORY MANUAL 2nd Ed. (Cold Spring Harbor, N.Y., 1989)]; [AUSUBEL et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (Green Publishing Associates, Inc. and John Wiley Sons, Inc., New York)]을 참조한다.

숙주 세포

일부 측면에서, 본 개시내용은 또한 본원에 개시된 변형된 핵산 서열, 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 발현 구축물을 포함하는 숙주 세포를 제공한다. 일부 측면에서, 숙주 세포는 포유동물 세포이다.

특정한 숙주 내로의 도입을 위해 제조된 구축물은 숙주에 의해 인식되는 복제 시스템, 목적하는 폴리펩티드를 코딩하는 의도된 DNA 절편, 및 폴리펩티드-코딩 절편에 작동가능하게 연결된 전사 및 번역 개시 및 종결 조절 서열을 포함할 수 있다. 용어 "작동가능하게 연결된"은 본원에서 이미 정의되었다. 예를 들어, 프로모터 또는 인핸서는 그것이 서열의 전사를 자극하는 경우 코딩 서열에 작동가능하게 연결된다. 신호 서열에 대한 DNA는 그것이 폴리펩티드의 분비에 참여하는 프리단백질로서 발현되는 경우 폴리펩티드를 코딩하는 DNA에 작동가능하게 연결된다. 일반적으로, 작동가능하게 연결된 DNA 서열은 인접하며, 신호 서열의 경우에, 인접하고 리딩 프레임에 있는 둘 다이다. 그러나, 인핸서는 그의 전사를 그들이 제어하는 코딩 서열과 인접할 필요는 없다. 연결은 편리한 제한 부위에서의 또는 그 대신에 삽입된 어댑터 또는 링커에서의 라이게이션에 의해, 또는 유전자 합성에 의해 달성된다.

적절한 프로모터 서열의 선택은 일반적으로 DNA 절편의 발현을 위해 선택되는 숙주 세포에 의존한다. 적합한 프로모터 서열의 예는 관련 기술분야에 널리 공지된 원핵, 및 진핵 프로모터를 포함한다 (예를 들어 [Sambrook and Russell, 2001], 상기 문헌 참조). 전사 조절 서열은 전형적으로 숙주에 의해 인식되는 이종 인핸서 또는 프로모터를 포함한다. 적절한 프로모터의 선택은 숙주에 의존하지만, 프로모터, 예컨대 trp, lac 및 파지 프로모터, tRNA 프로모터 및 당분해 효소 프로모터는 공지되어 있으며 이용가능하다 (예를 들어 [Sambrook and Russell, 2001], 상기 문헌 참조). 발현 벡터는 복제 시스템을 포함하고, 폴리펩티드 코딩 절편에 대한 삽입 부위와 함께 전사 및 번역 조절 서열이 채용될 수 있다. 대부분의 경우에, 복제 시스템은 단지 벡터 (이. 콜라이로서 박테리아 세포)를 제조하는데 사용되는 세포에서 기능적이다. 대부분의 플라스미드 및 벡터는 벡터로 감염된 세포에서 복제하지 않는다. 세포주 및 발현 벡터의 운용가능한 조합의 예는 [Sambrook and Russell] (2001, 상기 문헌) 및 문헌 [Metzger et al. (1988) Nature 334: 31-36]에 기재되어 있다. 예를 들어, 적합한 발현 벡터는 효모, 예를 들어, 에스. 세레비지아에(S. cerevisiae), 예를 들어, 곤충 세포, 예를 들어, Sf9 세포, 포유동물 세포, 예를 들어, CHO 세포 및 박테리아 세포, 예를 들어, 이. 콜라이에서 발현될 수 있다. 따라서, 세포는 원핵 또는 진핵 숙주 세포일 수 있다. 세포는 액체 배지에서의 또는 고체 배지 상에서의 배양에 적합한 세포일 수 있다.

숙주 세포 내로 외인성 핵산을 도입하는 방법은 관련 기술분야에 널리 공지되어 있으며, 사용되는 숙주 세포에 따라 다양할 것이다. 기술은 덱스트란-매개 형질감염, 인산칼슘 침전, 염화칼슘 처리, 폴리에틸렌이민 매개 형질감염, 폴리브렌 매개 형질감염, 원형질체 융합, 전기천공, 바이러스 또는 파지 감염, 리포솜에서의 폴리뉴클레오티드(들)의 캡슐화, 및 핵 내로의 DNA의 직접 미세주사를 포함하나 이에 제한되지는 않는다. 포유동물 세포의 경우에, 형질감염은 일시적이거나 안정할 수 있다.

숙주 세포는 효모, 예를 들어 에스. 세레비지아에, 예를 들어, 곤충 세포, 예를 들어, Sf9 세포, 포유동물 세포, 예를 들어, CHO 세포, 및 박테리아 세포, 예를 들어, 이. 콜라이일 수 있다. 따라서, 세포는 원핵 또는 진핵 숙주 세포일 수 있다. 세포는 액체 배지에서의 또는 고체 배지 상에서의 배양에 적합한 세포일 수 있다. 대안적으로, 숙주 세포는 다세포 유기체, 예컨대 트랜스제닉 식물 또는 동물의 부분인 세포이다. 일부 측면에서, 숙주 세포는 포유동물 세포이다.

일부 측면에서, 전기천공, 인산칼슘 침전, 미세주사, 양이온성 또는 음이온성 리포솜, 및 핵 국재화 신호와 조합으로의 리포솜을 포함하나 이에 제한되지는 않는, 복제 및 패키징을 위한 세포 숙주 내로 본원에 개시된 변형된 핵산을 포함하는 바이러스 벡터를 도입하는 방법이 채용될 수 있다. 바이러스 벡터 기능이 바이러스 벡터를 사용한 형질감염에 의해 제공되는 실시양태에서; 바이러스 감염을 생성하는 표준 방법이 사용될 수 있다.

일부 측면에서, 패키징 기능은 바이러스 벡터 복제 및 패키징을 위한 유전자를 포함할 수 있다. 따라서, 예를 들어, 패키징 기능은 필요에 따라 바이러스 유전자 발현, 바이러스 벡터 복제, 통합된 상태로부터 바이러스 벡터의 구제, 바이러스 유전자 발현, 및 바이러스 입자 내로의 바이러스 벡터의 패키징에 필요한 기능을 포함할 수 있다. 패키징 기능은 유전자 구축물, 예컨대 플라스미드 또는 앰플리콘을 사용하여 패키징 세포에 함께 또는 별개로 공급될 수 있다. 패키징 기능은 패키징 세포 내에 염색체외적으로 존재할 수 있거나, 세포의 염색체 DNA 내로 통합될 수 있다. 예는 AAV Rep 및 Cap 단백질을 코딩하는 유전자를 포함한다.

일부 측면에서, 헬퍼 기능은 바이러스 벡터의 패키징을 개시하는데 요구되는 패키징 세포의 활성 감염을 확립하는데 필요한 헬퍼 바이러스 요소를 포함할 수 있다. 예는 바이러스 벡터의 패키징을 발생시키는데 충분한 아데노바이러스, 바쿨로바이러스 및/또는 포진 바이러스로부터 유래된 기능을 포함한다. 예를 들어, 아데노바이러스 헬퍼 기능은 전형적으로 아데노바이러스 성분 E1a, E1b, E2a, E4, 및 VA RNA를 포함할 것이다. 패키징 기능은 요구되는 바이러스로의 패키징 세포의 감염에 의해 공급될 수 있다. 패키징 기능은 유전자 구축물, 예컨대 플라스미드 또는 앰플리콘을 사용하여 패키징 세포에 함께 또는 별개로 공급될 수 있다. 패키징 기능은 패키징 세포 내에 염색체외적으로 존재할 수 있거나, 세포의 염색체 DNA 내로 통합될 수 있다.

임의의 적합한 헬퍼 바이러스 기능이 채용될 수 있다. 예를 들어, 패키징 세포가 곤충 세포인 경우, 바쿨로바이러스는 헬퍼 바이러스로서 역할을 할 수 있다. 포진 바이러스는 또한 AAV 패키징 방법에서 헬퍼 바이러스로서 사용될 수 있다.

전기천공, 인산칼슘 침전, 미세주사, 양이온성 또는 음이온성 리포솜, 및 핵 국재화 신호와 조합으로의 리포솜을 포함하나 이에 제한되지는 않는, 복제 및 패키징을 위한 세포 숙주 내로 헬퍼 기능을 보유하는 뉴클레오티드 서열을 도입하는 임의의 방법이 채용될 수 있다. 헬퍼 기능이 바이러스 벡터를 사용한 형질감염 또는 헬퍼 바이러스를 사용한 감염에 의해 제공되는 실시양태에서; 바이러스 감염을 생성하는 표준 방법이 사용될 수 있다.

관련 기술분야에 공지된 임의의 적합한 허용적 또는 패키징 세포는 패키징된 바이러스 벡터의 생산에 채용될 수 있다. 포유동물 세포 또는 곤충 세포가 바람직하다. 본 발명의 실시에서 패키징 세포의 생산에 유용한 세포의 예는 예를 들어, 인간 세포주 또는 영장류 세포, 예컨대 VERO, WI38, MRC5, A549, 293 세포, B-50 또는 임의의 다른 HeLa 세포, HepG2, Saos-2, HuH7, 및 HT1080 세포주를 포함한다.

일부 측면에서, 패키징 세포로서 사용하기 위한 세포주는 곤충 세포주이다. AAV의 복제를 허용하고 배양에서 유지될 수 있는 임의의 곤충 세포는 본 발명에 따라 사용될 수 있다. 예는 스포도프테라 프루기페르다(Spodoptera frugiperda), 예컨대 Sf9 또는 Sf21 세포주, 드로소필라(Drosophila) 종 세포주, 또는 모기 세포주, 예를 들어, 아에데스 알보픽투스(Aedes albopictus) 유래 세포주를 포함한다. 바람직한 세포주는 스포도프테라 프루기페르다 Sf9 세포주이다. 하기 참고문헌은 이종 폴리펩티드의 발현을 위한 곤충 세포의 용도, 이러한 세포 내로 핵산을 도입하는 방법, 및 배양에서 이러한 세포를 유지하는 방법에 관한 그들의 교시내용에 대해 본원에 포함된다: Methods in Molecular Biology, ed. Richard, Humana Press, NJ (1995); O'Reilly et al., Baculovirus Expression Vectors: A Laboratory Manual, Oxford Univ. Press (1994); Samulski et al., J. Vir. 63:3822-8 (1989); Kajigaya et al., Proc. Nat'l. Acad. Sci. USA 88: 4646-50 (1991); Ruffing et al., J. Vir. 66:6922-30 (1992); Kimbauer et al., Vir. 219:37-44 (1996); Zhao et al., Vir. 272:382-93 (2000); 및 사물스키(Samulski) 등, 미국 특허 번호 6,204,059.

생산 동안, 패키징 세포는 헬퍼 기능과 함께 하나 이상의 바이러스 벡터 기능 및 바이러스 벡터의 복제 및 패키징을 발생시키는데 충분한 패키징 기능을 포함할 수 있다. 이들 다양한 기능은 유전자 구축물, 예컨대 플라스미드 또는 앰플리콘을 사용하여 패키징 세포에 함께 또는 별개로 공급될 수 있으며, 이들은 세포주 내에 염색체외적으로 존재하거나 세포의 염색체 내로 통합될 수 있다.

세포는 이미 혼입된 기능 중 임의의 하나 이상, 예를 들어, 염색체외적으로 혼입되거나 세포의 염색체 DNA 내로 통합된 하나 이상의 벡터 기능을 갖는 세포주, 염색체외적으로 혼입되거나 세포의 염색체 DNA 내로 통합된 하나 이상의 패키징 기능을 갖는 세포주, 또는 염색체외적으로 혼입되거나 세포의 염색체 DNA 내로 통합된 헬퍼 기능을 갖는 세포주로 공급될 수 있다.

제약 조성물

일부 측면에서, 본 개시내용은 또한 본원에 개시된 변형된 핵산 서열, 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 발현 구축물을 포함하는 제약 조성물을 제공한다. 일부 측면에서 본원에 개시된 바와 같은 인슐린 및/또는 글루코키나제를 코딩하는 변형된 핵산 서열을 포함하는 발현 구축물 또는 전달 벡터 (예를 들어, AAV 캡시드에 패키징된 바이러스 벡터)를 포함하는 조성물이 제공된다. 일부 측면에서, 조성물은 유전자 요법 조성물이다. 일부 측면에서, 조성물은 제약 조성물이며, 상기 제약 조성물은 제약상 허용되는 담체, 아주반트, 희석제, 가용화제, 충전제, 보존제 및/또는 부형제를 포함한다.

이러한 제약상 허용되는 담체, 충전제, 보존제, 가용화제, 희석제 및/또는 부형제는 예를 들어 문헌 [Remington: The Science and Practice of Pharmacy, 20th Edition. Baltimore, Md.: Lippincott Williams & Wilkins, 2000]에서 발견될 수 있다.

일부 측면에서, 조성물은 의약으로서 사용하기 위한 것이다. 일부 측면에서, 의약은 당뇨병의 증상을 예방하거나, 감소시키거나, 개선시키거나, 당뇨병을 지연시키고/거나, 치유하고/거나, 반전시키고/거나 치료하기 위해 사용된다. 일부 측면에서, 당뇨병은 제1형 당뇨병, 제2형 당뇨병 또는 단성 당뇨병일 수 있다. 일부 측면에서, 치료되는 대상체는 포유동물, 예를 들어 고양이, 설치류 (마우스, 래트, 거빌, 기니아 피그, 마우스 또는 래트), 개, 또는 인간이다.

일부 측면에서, 변형된 핵산, 발현 구축물, 전달 벡터 및/또는 조성물은 상기 변형된 핵산, 발현 구축물, 전달 벡터 및/또는 조성물이 항-당뇨병 효과를 나타낼 수 있는 경우, 당뇨병의 증상을 예방하거나, 감소시키거나, 개선시거나, 당뇨병을 지연시키고/거나, 반전시키고/거나, 치유하고/거나 치료하기 위해 사용된다. 항-당뇨병 효과는 혈액에서의 글루코스 처리가 증가되는 경우 및/또는 글루코스 내성이 개선되는 경우 도달될 수 있다. 이는 통상의 기술자에게 공지된 기술을 사용하여 평가될 수 있다. 이 맥락에서, "증가" (각각 "개선")는 통상의 기술자에게 공지된 검정을 사용하여 또는 실험 부분에서 수행된 바와 같은 검정을 사용하여 적어도 검출가능한 증가 (각각 검출가능한 개선)를 의미한다.

항-당뇨병 효과는 또한 전형적인 증상 (즉, 췌도염, 베타 세포 소실)이 의사에 의해 평가된 바와 같이 감속된 경우 관찰될 수 있다. 당뇨병과 연관된 전형적인 증상의 감소는 증상 발달의 진행의 감속 또는 증상의 완전한 소멸을 의미할 수 있다. 증상, 및 또한 증상의 감소는 다양한 방법, 임상적 검사 및 통상적인 실험실 시험을 포함하는 당뇨병의 진단에 사용되는 것과 크게 동일한 방법을 사용하여 평가될 수 있다. 이러한 방법은 거시적 및 미시적 방법 둘 다, 뿐만 아니라 분자적 방법, 생화학적, 면역조직화학적 및 다른 것들을 포함한다.

본원에서 정의된 바와 같은 의약 (변형된 핵산, 발현 구축물, 전달 벡터, 조성물 등)은 바람직하게는 환자의 또는 상기 당뇨병 환자의 세포, 조직 또는 기관의 하나의 증상 또는 하나의 특징을, 본원에 개시된 변형된 핵산, 바이러스 발현 구축물, 바이러스 벡터, 또는 조성물을 사용한 치료의 적어도 1주, 1개월, 6개월, 1년 또는 그 초과 후, 상기 증상 또는 특징이 감소되거나 더 이상 검출가능하지 않은 경우, 경감시킬 수 있다.

당뇨병의 증상을 예방하거나, 감소시키거나, 개선시키거나, 당뇨병을 지연시키고/거나, 반전시키고/거나, 치유하고/거나, 치료하는데 사용하기 위한 본원에 개시된 바와 같은 변형된 핵산, 발현 구축물, 전달 벡터, 또는 조성물은 당뇨병에 걸린 또는 당뇨병을 발달시킬 위험이 있는 개체의 생체내에서의 세포, 조직 및/또는 기관에의 투여에 적합할 수 있으며, 생체내에서, 생체외에서 또는 시험관내에서 투여될 수 있다. 상기 조합물 및/또는 조성물은 당뇨병에 걸린 또는 당뇨병을 발달시킬 위험이 있는 개체의 생체내에서의 세포, 조직 및/또는 기관에 직접적으로 또는 간접적으로 투여될 수 있으며, 생체내에서, 생체외에서 또는 시험관내에서 직접적으로 또는 간접적으로 투여될 수 있다. 일부 측면에서, 투여 방식은 근육내이다.

일부 측면에서, 본원에 개시된 바와 같은 변형된 핵산, 발현 구축물, 전달 벡터, 또는 조성물은 관련 기술분야에 공지된 적합한 수단을 사용하여 직접적으로 또는 간접적으로 투여될 수 있다. 일부 측면에서, 본원에 개시된 바와 같은 변형된 핵산, 발현 구축물, 전달 벡터, 또는 조성물은 개체, 상기 개체의 세포, 조직 또는 기관에 그 자체로 전달될 수 있다. 질환 또는 상태에 따라, 상기 개체의 세포, 조직 또는 기관은 본원에서 앞서 정의된 바와 같을 수 있다. 일부 측면에서, 본원에 개시된 바와 같은 변형된 핵산, 발현 구축물, 전달 벡터, 또는 조성물은 전달 방법과 혼화성인 용액에 용해된다. 정맥내, 피하, 근육내, 경막내, 관절내 및/또는 심실내 투여를 위해, 용액은 생리학적 염 용액일 수 있다. 일부 측면에서, 투여는 근육내 투여이다. 일부 측면에서, 근육내 투여는 멀티니들을 사용하여 수행된다. 일부 측면에서, 본원에 기재된 바와 같은 변형된 핵산, 발현 구축물, 벡터, 또는 조성물의 치료 유효 용량은 단일 및 고유한 용량으로 투여되며, 따라서 반복된 주기적 투여를 회피한다. 일부 측면에서, 단일 용량은 근육 조직에 투여된다. 일부 측면에서, 단일 용량은 골격근 조직에 투여된다. 일부 측면에서, 단일 용량은 하나 이상의 근육 (예를 들어, 다중 근육 그룹)에의 다중 주사 (예를 들어, 2, 3, 4, 또는 5)를 포함한다.

일부 측면에서, 화합물은 본 발명의 조성물에 존재할 수 있다. 상기 화합물은 변형된 핵산 또는 이를 포함하는 조성물의 전달에 도움이 될 수 있다. 일부 측면에서, 화합물은 세포막을 통해 소포 또는 리포솜, 또는 이들의 조합에서 복합체화되거나 트랩핑된 본원에서 정의된 바와 같은 각각의 구성요소를 전달하는 복합체, 나노입자, 미셀, 리포솜을 형성할 수 있는 화합물이다. 이들 화합물 중 많은 것은 관련 기술분야에 공지되어 있다. 일부 측면에서, 추가의 화합물은 폴리에틸렌이민 (PEI), 또는 폴리프로필렌이민 또는 폴리에틸렌이민 공중합체 (PEC) 및 유도체를 포함하는 유사한 양이온성 중합체, 합성 양친매성 물질 (SAINT-18), 리포펙틴(Lipofectin)™, DOTAP, 또는 이들의 조합이다.

사용 방법

본 개시내용은 또한 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물 중 임의의 것을 당뇨병의 증상의 예방, 감소 또는 개선, 당뇨병의 지연, 반전, 치유 및/또는 치료를 필요로 하는 대상체에게 투여하는 것을 포함하는, 당뇨병의 증상을 예방하거나, 감소시키거나, 개선시키거나, 당뇨병을 지연시키고/거나, 반전시키고/거나, 치유하고/거나, 치료하는 방법을 제공한다. 일부 측면에서, 당뇨병은 T1DM일 수 있다. 일부 측면에서, 당뇨병은 T2DM일 수 있다. 일부 측면에서, 방법은 유전자 요법이다. 특정 측면에서, 본 개시내용의 방법은 이를 필요로 하는 세포, 조직, 또는 대상체에의 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물 중 임의의 것의 투여 (예를 들어, 근육내 투여)를 포함한다. 특정 측면에서, 방법은 (i) 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하는 변형된 (또는 야생형 또는 비변형된) 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물 및/또는 (ii) 인간 글루코키나제 (Gck) 단백질을 코딩하는 핵산을 포함하는 변형된 (또는 야생형 또는 비변형된) 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물의 투여를 포함한다. 일부 측면에서, hIns 핵산 서열은 본원에 개시된 변형된 hIns 서열이고, hGck 핵산 서열은 본원에 개시된 변형된 hGck 서열이다. 일부 측면에서, hIns 핵산 서열은 본원에 개시된 야생형 또는 비변형된 hIns 서열이고, hGck 서열은 본원에 개시된 변형된 hGck 서열이다. 특정 측면에서, (i) 및 (ii)의 투여는 동시 또는 순차적이다.

본 개시내용의 특정 측면은 (i) 신호 펩티드를 코딩하는 뉴클레오티드 서열로서, 임의로 여기서 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아닌 것인 뉴클레오티드 서열, 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산 위치에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는, 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하고, 임의로 절단 부위를 추가로 포함하는 폴리뉴클레오티드를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 신호 펩티드는 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열이다. 일부 측면에서, 절단 부위는 푸린 절단 부위이다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 (i) 신호 펩티드를 코딩하는 뉴클레오티드 서열 및 (ii) 서열식별번호: 43-57, 110-116, 150-151, 154-155, 및 157-159 중 어느 것의 핵산 73-330, 서열식별번호: 117-122, 152, 및 156 중 어느 것의 핵산 88-345, 또는 서열식별번호: 153의 핵산 79-336과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하는 것인 폴리뉴클레오티드를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 코딩된 인간 Ins 단백질은 (i) 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열) 및 (ii) 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110을 포함한다. 일부 측면에서, 코딩된 인간 인슐린 단백질은 절단 부위 (예를 들어, 푸린 절단 부위)를 추가로 포함한다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 서열식별번호: 43-57, 110-122, 또는 150-159 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하는 것인 폴리뉴클레오티드를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 폴리뉴클레오티드는 인간 Ins 단백질을 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 43-57, 110-122, 또는 150-159 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 적어도 2개의 ORF 뉴클레오티드 서열을 포함하고, 여기서 2개의 ORF 뉴클레오티드 서열은 동일하거나 상이할 수 있다. 일부 측면에서, 폴리뉴클레오티드는 IRES 서열을 추가로 포함한다. 일부 측면에서, 적어도 2개의 ORF 뉴클레오티드 서열은 IRES 서열에 의해 분리된다. 일부 측면에서, 코딩된 인간 Ins 단백질은 신호 서열 및 프로인슐린 폴리펩티드를 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110 중 어느 것의 아미노산 서열을 포함한다. 일부 측면에서, 코딩된 인간 Ins 단백질은 프리프로인슐린이다. 일부 측면에서, 코딩된 인간 Ins 단백질은 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145의 아미노산 서열을 포함한다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산 서열은 5' UTR 및/또는 3' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산은 서열식별번호: 1-16, 84-88, 123-141, 또는 160-161 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함한다.

본 개시내용의 특정 측면은 인간 인슐린 (Ins) 단백질 (예를 들어, 프리프로인슐린 또는 그의 변이체)을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 (i) 신호 펩티드 (예를 들어, 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열)를 코딩하는 뉴클레오티드 서열 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형 (또는 야생형 프리프로인슐린에서의 상응하는 아미노산에 비해 아미노산 H34, P52, K53, R55, L86, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형)을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아니다 (예를 들어, 야생형 프리프로인슐린 서열은 IL-6 신호 서열 또는 피브로넥틴 신호 서열로 대체됨). 일부 측면에서, 프로인슐린 폴리펩티드는 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110 중 어느 것의 아미노산 서열을 포함한다. 일부 측면에서, 폴리뉴클레오티드는 절단 부위 (예를 들어, 푸린 절단 부위)를 추가로 포함한다.

본 개시내용의 특정 측면은 인간 글루코키나제 (Gck) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 서열식별번호: 61-80 또는 162 중 어느 것의 핵산 1-1398; 또는 서열식별번호: 61-80 및 162 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 ORF를 포함하는 것인 폴리뉴클레오티드를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 코딩된 인간 Gck 단백질은 서열식별번호: 82의 아미노산 서열을 포함한다. 일부 측면에서, Gck 단백질을 코딩하는 폴리뉴클레오티드 또는 핵산 서열은 5' UTR 및/또는 3' UTR을 추가로 포함한다. 일부 측면에서, 핵산은 서열식별번호: 42, 서열식별번호: 42의 5-329, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함한다. 일부 측면에서, 핵산은 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 3' UTR을 추가로 포함한다. 일부 측면에서, 폴리뉴클레오티드 또는 핵산은 서열식별번호: 20-39 및 89-96, 및 163-164 중 어느 것과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함한다. 일부 측면에서, 핵산은 프로모터 (예를 들어, 진핵 프로모터)에 작동가능하게 연결된다. 본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드 및 핵산 서열에 작동가능하게 연결된 이종 발현 제어 서열을 포함하는 발현 카세트에 관한 것이다. 일부 측면에서, 핵산은 폴리아데닐화 (폴리A) 요소에 작동가능하게 연결된다.

본 개시내용의 특정 측면은 본 개시내용의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 (예를 들어, 바이러스 벡터, 비-바이러스 벡터, 플라스미드, 지질, 또는 리소좀)를 투여하는 것을 포함하는 사용 방법에 관한 것이다. 일부 측면에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터 또는 렌티바이러스 벡터이다. 본 개시내용의 특정 측면은 AAV 캡시드 및 본 개시내용의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 게놈을 포함하는 재조합 AAV (rAAV) 입자를 투여하는 방법에 관한 것이다. 일부 측면에서, AAV 혈청형은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVRH8, AAVrh9, AAV9, AAVrh10, AAV10, AAVRH10, AAV11, 및 AAV12로 이루어진 군으로부터 선택된다.

본원에 개시된 유전자 요법 방법에 대한 특징 이점은 당뇨병 대상체의 일생을 통해 치료 유전자 발현을 제공하는 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물의 투여를 위한 잠재성을 포함한다. WO 2012/007458은 당뇨병의 치료로서 2개의 바이러스 벡터, 즉, 인슐린 유전자를 발현하는 것 및 글루코키나제 유전자를 발현하는 것의 생성을 개시한다. 더욱이, WO 2016/110518은 인슐린 및 글루코키나제 유전자를 포함하는 단일-벡터 유전자 구축물을 개시한다. 특정 측면에서, 본 개시내용은 인슐린 및/또는 글루코키나제의 증가된 발현, 감소된 유해 면역 반응을 갖고/거나, 바이러스 벡터의 보다 낮은 용량의 투여를 허용하는 당뇨병 치료 또는 예방을 위한 개선된 핵산 서열, 발현 구축물, 및/또는 전달 벡터를 제공한다.

일부 측면에서, 본 개시내용의 방법은 개체에서, 상기 개체의 세포, 조직 또는 기관에서 당뇨병의 하나 이상의 증상(들)을 경감시키거나 감소시키거나, 상기 개체의 세포, 조직 또는 기관의 하나 이상의 특징(들) 또는 증상(들)을 경감시키거나 감소시키며, 방법은 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 발현 구축물 중 하나 이상을 상기 개체에게 투여하는 것을 포함한다.

당뇨병을 갖는 성인에 대한 치료 권고사항은 일반적으로 유의한 저혈당증 없이 HbA1c <7.0%를 표적화한다. 일부 측면에서, HbA1c에 대한 '정상 범위'는 <7.0%, 예를 들어, <6.5%, <6.0%, <5.7%, 예를 들어, 약 5.0% 내지 약 6.5%이다. 대부분의 시판 제품은 HbA1c를 0.5% 내지 1.50% 저하시킨다. 일부 측면에서, 본 개시내용의 방법은 치료되는 당뇨병 대상체에서 HbA1c 수준을 예를 들어 8주 내에 비-당뇨병 대상체에서의 HbA1c 수준으로 정상화시킨다. 일부 측면에서, 본 개시내용의 방법은 대상체에서 당화 혈액 헤모글로빈 (HbA1c) 수준의 감소 및/또는 조절을 허용한다. 일부 측면에서, 치료 후의 대상체에서의 HbA1c 수준은 예를 들어 치료 후 8주 내에 <7.0% (예를 들어, <6.5%, <6.0%, <5.7%, 예를 들어, 5.0% 내지 6.5%)이다.

인슐린은 간, 지방, 및 장에서 지질 대사의 조절에 있어서 중심적 역할을 한다 (Verges B. Insulin sensitivity and lipids. Diabetes Metab. 2001 Apr;27(2 Pt 2):223-7. PMID: 11452214.). 비제어된 제1형 당뇨병에서, 환자는 글루코스를 이용할 수 없어, 대안적인 연료 공급원을 요구한다. 지방 조직에서, 인슐린은 지방세포에서 트리글리세리드의 저장을 통상적으로 촉진시키고 순환에서 지방 조직으로부터 유리 지방산의 방출을 감소시키는 호르몬-민감성 리파제를 억제한다. 순환 인슐린 수준이 낮은 경우, 지단백질 이화의 현저한 감소가 있다 (Taskinen MR. Lipoprotein lipase in diabetes. Diabetes Metab Rev. 3:551-570. 1987 doi: 10.1002/dmr.5610030208. 1987). 순환 트리글리세리드-풍부 지단백질 (킬로미크론, VLDL)의 증가된 수준을 발생시키는 지방분해가 발생하여 고트리글리세리드혈증을 초래한다. 일부 측면에서, 본 개시내용의 방법은 대상체 (예를 들어, 당뇨병을 앓고 있는 대상체)에서, 상기 대상체의 세포, 조직 또는 기관에서 트리글리세리드-풍부 지단백질 (예를 들어, 킬로미크론 또는 VLDL)의 수준을 감소시키며, 방법은 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 발현 구축물 중 하나 이상을 대상체에게 투여하는 것을 포함한다.

간에서, 케톤체 (β-히드록시부티레이트 (β-HB) 및 아세토아세테이트 (AcAc))는 지방산의 β-산화에 의해 생산된다. 절식 또는 식이 탄수화물 제한 동안, 케톤은 글루코스 제한 상태에서 대안적인 에너지의 공급원으로서 역할을 하며, 뇌의 에너지 요구의 최대 80%를 제공할 수 있다. 단기에서는 유용하지만, 순환 케톤의 만성 상승은 뇌, 신장, 간, 및 미세혈관구조에서 원하지 않는 효과 (Kanikarla-Marie P, Jain SK. Hyperketonemia and ketosis increase the risk of complications in type 1 diabetes. Free Radic Biol Med. 95:268-277, 2016. doi:10.1016/j.freeradbiomed.2016.03.020) 및 치명적일 수 있는 생성되는 케톤산증을 생성할 수 있다. 일부 측면에서, 본 개시내용의 방법은 대상체 (예를 들어, 당뇨병을 앓고 있는 대상체)에서, 상기 대상체의 세포, 조직 또는 기관에서 케톤의 수준을 감소시키며, 방법은 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 발현 구축물 중 하나 이상을 대상체에게 투여하는 것을 포함한다.

일부 측면에서, 본 개시내용의 방법은 (i) 대상체에서의 당화 혈액 헤모글로빈 (HbA1c) 수준의 감소 및/또는 조절; (ii) 대상체에서의 순환 케톤의 감소, (iii) 대상체에서의 트리글리세리드의 감소, 또는 (iv) 이들의 임의의 조합을 제공한다.

일부 측면에서, 방법 또는 용도는 시험관내에서, 예를 들어 세포 배양을 사용하여 수행된다. 일부 측면에서, 방법 또는 용도는 생체내에서 수행된다. 일부 측면에서, 본원에 개시된 변형된 핵산, 폴리뉴클레오티드, 발현 카세트, 전달 벡터, 또는 발현 구축물은 개체에서 당뇨병을 치료하기 위해 사용되는 공지된 추가의 화합물과 조합된다. 일부 측면에서, 방법은 예를 들어, 규칙적인 주사를 통해 재조합 인슐린을 투여하는 것을 추가로 포함한다.

일부 측면에서, 본원에 개시된 방법은 반복되지 않는다. 일부 측면에서, 본원에 개시된 방법은 매년 또는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10년마다 반복된다.

일부 측면에서, 방법은 본원에 기재된 바와 같은 변형된 핵산, 발현 구축물, 벡터, 또는 조성물의 치료 유효 용량을 투여하는 것을 포함하고, 여기서 투여는 단일이며, 예를 들어 반복된 주기적 투여를 회피한다. 일부 측면에서, 단일 용량은 근육 조직에 투여된다. 일부 측면에서, 단일 용량은 골격근 조직에 투여된다. 일부 측면에서, 단일 용량은 하나 이상의 근육 (예를 들어, 다중 근육 그룹)에의 다중 주사 (예를 들어, 2, 3, 4, 또는 5)를 포함한다.

상세한 설명 섹션은 청구범위를 해석하는데 사용되는 것으로 의도되며, 요약 및 요약서 섹션은 그렇지 않음이 인정되어야 한다. 요약 및 요약서 섹션은 본 발명자(들)에 의해 고려된 바와 같은 본 발명의 하나 이상의 그러나 전부는 아닌 예시적인 실시양태를 제시할 수 있으며, 따라서, 본 발명 및 첨부된 청구범위를 어떤 식으로도 제한하는 것으로 의도되지 않는다.

본 발명의 범위 및 범주는 상기-기재된 예시적인 실시양태 중 임의의 것에 의해 제한되지 않아야 하지만, 하기 청구범위 및 그들의 등가물에 따라 정의되어야 한다.

본 발명을 설명하였지만, 이는 단지 예시적 목적을 위해 본원에 포함되고, 본 발명을 제한하는 것으로 의도되지 않는 하기 실시예에서 보다 상세하게 설명될 것이다.

실시예

실시예 1: 변형된 인슐린 핵산

서열식별번호: 1-16, 84-88, 123-141, 및 160-161에 상응하는 하기 변형된 인간 인슐린 핵산 서열 (표 1에 제시됨)은 가상 환경에서 디자인되었다. 5'UTR 서열 (서열식별번호: 42, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148)은 볼드체이고, ORF 서열은 밑줄치고 (서열식별번호: 43-57, 110-122), 3' UTR 서열은 이탤릭체이다 (서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 서열식별번호: 101, 또는 서열식별번호: 149). 서열식별번호: 42의 서열을 갖는 5'UTR은 위치 1-4에서 CTAG를 제거하도록 추가로 변형되었다. 따라서, 특정 구축물에서 5'UTR은 서열식별번호: 42의 핵산 5-329를 포함하였다. 일부 구축물에서, IRES 서열은 2개의 인슐린 ORF 서열 사이에 첨가되었고, IRES 서열은 볼드체 및 이탤릭체로 제시된다 (서열식별번호: 143).

표 1: 인간 인슐린을 코딩하는 변형된 핵산 서열

일부 측면에서, 핵산은 야생형 및/또는 비변형된 인간 인슐린 핵산 서열 (예를 들어, 서열식별번호: 1)에 비해 코돈 최적화된 및 CpG 감소된 서열을 포함한다. 변형된 핵산을 화학적으로 합성하고, CMV 프로모터를 포함하는 발현 카세트에서 제조하고, 발현 플라스미드 내로 클로닝하였다. 변형된 서열을 생거(Sanger) 시퀀싱에 의해 확인하였다.

pAAV-인슐린 플라스미드로 형질감염된 HEK 세포로부터의 인슐린의 분비를 시험하였다. pAAV-인슐린 플라스미드 AAV1-CMV-hInsB10D_2 (서열식별번호: 160), AAV1-CMV-비변형된 hIns (서열식별번호: 1), AAV1-CMV-변형된 hIns22 (서열식별번호: 123), AAV1-CMV-변형된 hIns6 (서열식별번호: 6), AAV1-CMV-변형된 hIns8 (서열식별번호: 8), AAV1-CMV-변형된 hIns23 (서열식별번호: 124), AAV1-CMV-변형된 hIns24 (서열식별번호: 125), AAV1-CMV-변형된 hIns25 (서열식별번호: 126), AAV1-CMV-변형된 hIns_2 (서열식별번호: 127), AAV1-CMV-변형된 hIns27 (서열식별번호: 128), AAV1-CMV-변형된 hIns28 (서열식별번호: 129), AAV1-CMV-변형된 hIns29 (서열식별번호: 130), AAV1-CMV-변형된 hIns30 (서열식별번호: 131), AAV1-CMV-변형된 hIns31 (서열식별번호: 132), AAV1-CMV-변형된 hIns32 (서열식별번호: 133), AAV1-CMV-변형된 hIns33 (서열식별번호: 134), AAV1-CMV-변형된 hIns34 (서열식별번호: 135), AAV1-CMV-변형된 hIns35 (서열식별번호: 136), AAV1-CMV-변형된 hIns36 (서열식별번호: 137), AAV1-CMV-변형된 hIns37 (서열식별번호: 138), AAV1-CMV-변형된 hIns38 (서열식별번호: 139), AAV1-CMV-변형된 hIns39 (서열식별번호: 140), 또는 AAV1-CMV-변형된 Ins40 (서열식별번호: 141)을 0.5ug (도 1B) 또는 0.1ug (도 1C)로 24-웰 플레이트에서 HEK293 세포 내로 형질감염시켰다. 세포외 인슐린 수준을 ELISA 검정에 의해 결정하였다. pAAV-인슐린 플라스미드는 형질감염 후 인슐린 발현을 나타낸다.

실시예 2: 변형된 Gck 핵산

서열식별번호: 20-39 89-96, 및 163-164에 상응하는 하기 변형된 인간 글루코키나제 (Gck) 핵산 서열 (표 2에 제시됨)은 가상 환경에서 디자인되었다. 5'UTR 서열 (서열식별번호: 42 또는 서열식별번호: 83)은 볼드체이고, ORF 서열은 밑줄치고 (서열식별번호: 61-80 및 162), 3' UTR은 이탤릭체이다 (서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 또는 서열식별번호: 109). 서열식별번호: 42의 서열을 갖는 5'UTR은 위치 1-4에서 CTAG를 제거하도록 추가로 변형되었다. 따라서, 특정 구축물에서 5'UTR은 서열식별번호: 42의 핵산 5-329를 포함하였다.

표 2: 글루코키나제를 코딩하는 변형된 핵산 서열

일부 측면에서, 핵산은 야생형 및/또는 비변형된 인간 Gck 핵산 서열 (예를 들어, 서열식별번호: 19)에 비해 코돈 최적화된 및 CpG 감소된 서열을 포함한다. 변형된 핵산을 화학적으로 합성하고, CMV 프로모터를 포함하는 발현 카세트에서 제조하고, 발현 플라스미드 내로 클로닝하였다. 변형된 서열을 생거 시퀀싱에 의해 확인하였다.

pAAV-Gck 플라스미드로 형질감염된 HEK 세포에서의 GcK 발현을 시험하였다. pAAV-GcK 플라스미드 AAV1-CMV-hGckWT (서열식별번호: 19), AAV1-CMV-hGckWT_2 (서열식별번호: 163), AAV1-CMV-변형된 hGck9 (서열식별번호: 68), AAV1-CMV-변형된 hGck10 (서열식별번호: 69), AAV1-CMV-변형된 hGck11 (서열식별번호: 70), AAV1-CMV-변형된 hGck12 (서열식별번호: 71), AAV1-CMV-변형된 hGck13 (서열식별번호: 72), AAV1-CMV-변형된 hGck14 (서열식별번호: 73), AAV1-CMV-변형된 hGck15 (서열식별번호: 74), 및 AAV1-CMV-변형된 hGck16 (서열식별번호: 75)을 웰당 2.5ug으로 6-웰 플레이트에서 HEK293 세포 내로 형질감염시켰다. 세포 펠릿을 형질감염 후 48시간에 수집하고, 세포내 인슐린 수준을 ELISA 검정에 의해 결정하였다. pAAV-GcK 플라스미드는 형질감염 후 GcK 발현을 나타내었다.

실시예 3: h인슐린 벡터의 시험관내 비교 분석

인슐린 변이체를 보유하는 AAV1-CMV-h인슐린 벡터 (서열식별번호: 1, 서열식별번호: 87 및 서열식별번호: 88)를 감염력 및 효력 (인슐린 mRNA 발현, 세포 배지 내로의 인슐린 분비 및 분비된 인슐린의 생물학적 활성)에 대해 연구하였다. 2v6.11 세포를 상이한 MOI로 AAV1-CMV-hInsWT (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88) 벡터로 감염시켰다. 감염력 검정을 위해, 벡터 게놈의 세포내 함량을 정량화하였다. 효력 검정을 위해, 인간 인슐린 mRNA 발현 및 세포 배지 내로 분비된 인슐린을 측정하였다. 분비된 인슐린을 또한 기능성에 대해 평가하였다.

방법

3.1 AAV1-CMV-h인슐린 벡터로의 2v6.11 세포의 감염

감염 전날, 2v6.11 세포를 24-웰 플레이트에 2E+05개의 세포/웰의 밀도로 시딩하였다. 세포를 37℃ 및 8.5% CO₂에서 항생제 (페니실린= 10,000 U/ml, 스트렙토마이신= 10,000 μg/ml) 및 1 μg/ml 포나스테론 A로 보충된 성장 배지 (DMEM + 10% FBS)에서 성장시켰다.

감염 전에, 세포를 명시야 현미경에서 정확한 세포 전면생장률 (70-80%)에 대해 평가하였다. 세포 카운트를 평가하기 위해, 4개의 웰의 세포를 트립신화하고, 셉터(Scepter) 2.0 핸드헬드 자동화 세포 카운터 (머크-밀리포어(Merck-Millipore))로 정량화하였다. 세포를 MOI= 1000, 2000 및 4000 vg/세포로 AAV1-CMV-h인슐린 벡터 AAV1-CMV-hInsB10D (야생형) (서열식별번호: 110), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88) (표 3)로 감염시켰다. 세포를 감염력 시험 및 효력 시험 둘 다를 위해 사중으로 감염시켰다. 비-감염된 2v6.11 세포 (NI)를 음성 대조군으로서 사용하였다. 감염을 상이한 세포 계대에서의 세포를 사용하여 상이한 날에 3회 반복하였다.

표 3: AAV1-CMV-h인슐린 벡터

3.2 감염력 시험

감염 후 24시간에, 세포를 생존력에 대해 명시야 현미경 하에서 관찰하였다. 다음으로, 세포 배지를 흡인하고, 세포를 500 μl 1x PBS로 2회 세척하고, 200 μl 1x PBS에서 세포 스크래퍼로 수집하였다. 세포내 벡터 게놈을 DN이지(DNeasy) 혈액 및 조직 키트 (퀴아젠(Qiagen))로 추출하고, ITR2 서열을 표적화하는 올리고 세트를 갖는 택맨(Taqman) qPCR에 의해 증폭시켰다. 벡터 게놈을 표준 DNA의 계열 희석으로 생성된 표준 곡선으로부터의 내삽에 의해 졍량화하였다.

3.3 효력 시험을 위한 샘플 수집

감염 후 48시간에 및 세포 생존력을 평가한 후에, 세포 배지를 흡인하고, 37℃로 가온된 400 μl의 DMEM + 1% BSA로 대체하고, 플레이트를 인큐베이터로 복귀시켰다. 5-시간 인큐베이션 후 및 단백질 판독을 위해, 350 μl의 세포 배지를 1.5 ml 마이크로튜브 내로 수집하고, 600 x g에서 10분 동안 4℃에서 원심분리하고, 300 μl 상청액을 새로운 튜브에 옮겼다. mRNA 발현을 위해, 나머지 배지를 웰로부터 흡인하고, 세포를 500 μl 1x PBS로 부드럽게 세척하고, 350 μl RLT+β-메르캅토에탄올 (10 μl/ml) (RN이지 미니 키트(RNeasy Mini Kit), 퀴아젠)에서 수집하였다. 샘플을 프로세싱까지 -80℃에서 저장하였다.

3.4 h인슐린 mRNA 발현

감염된 AAV 벡터 게놈의 적절한 분해를 보장하기 위해, 표준 15분 내지 30분으로부터 칼럼-상 DN아제 I 소화의 연장을 제외하고는 제조업체에 의해 제공된 프로토콜에 따라 RNA를 RN이지 미니 키트 (퀴아젠) 및 RN아제-무함유 DN아제 I (퀴아젠)로 추출하였다. 1 μg의 각각의 RNA 샘플을 트랜스크립터 퍼스트스트랜드(Transcriptor FirstStrand) cDNA 합성 키트 (로슈(Roche))를 사용하여 역전사하였다. qPCR을 택맨 프로브 마스터(Taqman Probes Master) (로슈) 및 2 μl의 샘플 (1/10 희석됨)을 사용하여 삼중으로 수행하였다. 발현을 정량화하기 위해, SV40 폴리A 신호 (모든 h인슐린 플라스미드에 대해 공통적인 서열)를 표적화하는 프라이머-프로브 믹스를 사용하였다 (정방향 프라이머: AGC AAT AGC ATC ACA AAT TTC ACA A; 역방향 프라이머: CAG ACA TGA TAA GAT ACA TTG ATG AGT T; 프로브: /56-FAM/ AGC ATT TTT TT/ZEN/CAC TGC ATT CTA GTT GTG GTT TGT C /3IABkFQ/). 하우스키핑 유전자 hRplp0에 대한 프라이머-프로브 믹스를 사용하여 정규화하였다 (정방향 프라이머: CAG ACA GAC ACT GGC AAC AT; 역방향 프라이머: GCA GCA TCT ACA ACC CTG AA; 프로브: /5HEX/AA CTC TGC A/ZEN/TT CTC GCT TCC TGG A/3IABkFQ).

3.5 분비된 h인슐린의 정량적 분석

분비된 인슐린을 인슐린 ELISA 키트 (크리스탈 켐(Crystal Chem))를 사용하여 밀리Q 물에서 1/10 희석된 배지 샘플에서 이중으로 측정하였다.

3.6 분비된 h인슐린의 기능적 분석

감염된 세포에 의해 생산되고 세포 배지 내로 분비된 인슐린의 생물학적 활성을 아이라이트 인슐린 검정 레디 세포(iLite Insulin Assay Ready Cells) (스바 라이프 사이언스(Svar Life Science))로 측정하였다. 간략하게, 이전에 해동되고 9% FBS (열 불활성화됨) 및 항생제 (페니실린= 10,000 U/ml, 스트렙토마이신= 10,000 μg/ml)로 보충된 RPMI에 재현탁된 감염된 세포로부터의 40 μl의 표준물 또는 세포 배지 및 40 μl의 아이라이트 인슐린 검정 레디 세포를 96-웰 백색 플레이트에 첨가하였다. 37℃ 및 5% CO₂에서 5-시간 인큐베이션 후, 플레이트를 실온으로 평형화하고, 80 μl의 원-글로(ONE-Glo) 루시페라제 검정 시약을 웰 내로 첨가하였다. 세포를 10분 동안 용해시키고, 발광을 플레이트 판독기에서 측정하였다. 재조합 인간 인슐린 (라이프 테크놀로지스)을 표준 곡선을 위해 사용하였다.

3.7 통계적 분석

각각의 MOI를 아노바(Anova) 및 터키(Tukey) 다중 비교 검정을 사용하여 수행된 3회의 연구에 대해 독립적으로 분석하였다.

결과

2v6.11 세포를 h인슐린 변이체 Ins5 및 Ins7 및 WT h인슐린을 보유하는 AAV1-h인슐린 벡터로 감염시켜 벡터 감염력 및 효력을 3회의 독립적인 연구에서 평가하였다.

3.8 감염력 검정

AAV1-h인슐린 벡터 AAV1-CMV-hInsB10D (서열식별번호: 1), AAV1-CMV-Ins5 (서열식별번호: 87) 및 AAV1-CMV-Ins7 (서열식별번호: 88)로 2v6.11 세포에서 수행된 3회의 독립적인 감염 연구는 세포내 벡터 게놈 함량 (vg/ng DNA)에 의해 지시된 바와 같이 시험된 3개의 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))에서 세포를 감염시키는 상이한 벡터의 능력에 있어서 유의한 차이를 나타내지 않았다 (도 3A-3C 및 표 4).

표 4: 상이한 AAV1-h인슐린 벡터에 대한 감염력 검정의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 감염력 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다.

3.9 효력 검정

3.9.1 인간 인슐린 mRNA 발현

h인슐린 발현 수준의 정량화는 수행된 3회의 연구에서 벡터 AAV1-CMV-hInsB10D (서열식별번호: 1) 및 AAV1-CMV-Ins5 (서열식별번호: 87) 사이에 유의한 차이를 밝혀내지 않았다 (도 4A-4C 및 표 5). 한편, 벡터 AAV1-CMV-Ins7 (서열식별번호: 88)로의 감염에 의해 매개된 mRNA 발현 수준은 AAV1-CMV-hInsB10D (서열식별번호: 110) 및 AAV1-CMV-Ins5 (서열식별번호: 87)에 의해 매개된 것들보다 유의하게 더 낮았다 (도 4A-4C 및 표 5).

표 5: 상이한 AAV1-h인슐린 벡터에 대한 h인슐린 mRNA 발현의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 h인슐린 mRNA 발현 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

3.9.2 분비된 h인슐린의 정량적 분석

상이한 AAV1-h인슐린 벡터로 감염된 2v6.11 세포에 의해 세포 배지 내로 분비된 인슐린을 인슐린 ELISA 키트 (크리스탈 켐)를 사용하여 정량화한 경우, 벡터 AAV1-CMV-hInsB10D (서열식별번호: 110) 및 AAV1-CMV-Ins5 (서열식별번호: 87) 사이에 유의한 차이는 관찰되지 않았다 (도 5A-5C 및 표 6). mRNA 발현 판독에 대해 관찰된 바와 같이 (도 4A-4C 및 표 5), 벡터 AAV1-CMV-Ins7 (서열식별번호: 88)에 의해 매개된 분비된 인슐린의 수준은 AAV1-CMV-hInsB10D (서열식별번호: 1) 및 AAV1-CMV-Ins5 (서열식별번호: 87) 벡터에 의해 제공된 것들보다 유의하게 더 낮았다 (도 5A-5C 및 표 6). 통계적 분석을 2K 및 4K로의 감염으로부터의 데이터로 수행하였는데, 이는 1K로부터의 데이터가 최저 표준 미만이었고, 정량화될 수 없었기 때문이다.

표 6: 상이한 AAV1-h인슐린 벡터에 대한 분비된 h인슐린의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 분비된 h인슐린의 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

3.9.3 분비된 h인슐린의 기능적 분석

감염된 세포에 의해 생산되고 세포 배지 내로 분비된 인슐린의 활성을 아이라이트 인슐린 검정 레디 세포 (스바 라이프 사이언스)로 측정하였다. mRNA 발현 및 h인슐린 단백질 판독에 대해 수득된 결과 (도 4A-4C 및 5A-5C 및 표 5 및 6)에 따르면, 벡터 AAV1-CMV-hIns_B10D (서열식별번호: 1) 및 AAV1-CMV-Ins5 (서열식별번호: 87)에 대해 관찰된 인슐린 활성은 유의하게 상이하지 않은 반면, AAV1-CMV-Ins7 (서열식별번호: 88)은 다시 현저하게 더 낮은 인슐린 활성을 나타내었다 (도 6A-6C 및 표 7).

표 7: 상이한 AAV1-h인슐린 벡터에 대한 h인슐린 활성의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 h인슐린 활성의 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

실시예 4: h글루코키나제 벡터의 시험관내 비교 분석

야생형 (서열식별번호: 19) 및 Gck8 (서열식별번호: 93) 및 Gck12 (서열식별번호: 95) h글루코키나제 변이체를 보유하는 AAV1-CMV-h글루코키나제 벡터를 감염력 및 효력 (mRNA 발현, 단백질 함량 및 생물학적 활성)에 대해 연구하였다. 이를 위해, 2v6.11 세포를 상이한 MOI로 AAV1-CMV-hGckWT (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)로 감염시켰다. 감염력 검정을 위해, 벡터 게놈의 세포내 함량을 정량화하였다. 효력 검정을 위해, 인간 글루코키나제 mRNA 발현, 글루코키나제 세포내 함량 및 글루코키나제 활성을 측정하였다.

방법

4.1 AAV1-CMV-h글루코키나제 벡터로의 2v6.11 세포의 감염

감염 전날, 2v6.11 세포를 2E+05개의 세포/웰의 밀도로 24-웰 플레이트에 시딩하였다. 세포를 37℃ 및 8.5% CO₂에서항생제 (페니실린= 10,000 U/ml, 스트렙토마이신= 10,000 μg/ml) 및 1 μg/ml 포나스테론 A로 보충된 성장 배지 (DMEM + 10% FBS)에서 성장시켰다.

감염 전에, 세포를 명시야 현미경에서 정확한 세포 전면생장률 (70-80%)에 대해 평가하였다. 세포 카운트를 평가하기 위해, 4개의 웰의 세포를 트립신화하고, 셉터 2.0 핸드헬드 자동화 세포 카운터 (머크-밀리포어)로 정량화하였다. 세포를 MOI= 1000, 2000 및 4000 vg/세포로 AAV1-CMV-h글루코키나제 벡터 AAV1-CMV-hGckWT, AAV1-CMV-Gck8 및 AAV1-CMV-Gck12 (표 8)로 감염시켰다. 세포를 각각의 특이적 분석을 위해 사중으로 감염시켰다: 감염력, h글루코키나제 mRNA 발현, 세포내 h글루코키나제 및 글루코키나제 활성. 비-감염된 2v6.11 세포 (NI)를 음성 대조군으로서 사용하였다. 감염을 상이한 세포 계대에서의 세포를 사용하여 상이한 날에 3회 반복하였다.

표 8: AAV1-CMV-hGck 벡터

4.2 감염력 검정

감염 후 24시간에, 세포를 생존력에 대해 명시야 현미경 하에서 관찰하였다. 다음으로, 세포 배지를 흡인하고, 세포를 500 μl 1x PBS로 2회 세척하고, 200 μl 1x PBS에서 세포 스크래퍼로 수집하였다. 세포내 벡터 게놈을 DN이지 혈액 및 조직 키트 (퀴아젠)로 추출하고, ITR2 서열을 표적화하는 올리고 세트를 갖는 택맨 qPCR에 의해 증폭시켰다. 벡터 게놈을 표준 DNA의 계열 희석으로 생성된 표준 곡선으로부터의 내삽에 의해 정량화하였다.

4.3 인간 글루코키나제 mRNA 발현

감염 후 48시간에 및 세포 생존력을 평가한 후에, 세포를 500 μl 1x PBS로 부드럽게 세척하고, 350 μl RLT+β-메르캅토에탄올 (10 μl/ml) (RN이지 미니 키트, 퀴아젠)에서 수집하였다. 감염된 AAV 벡터 게놈의 적절한 분해를 보장하기 위해, 표준 15분 내지 30분로부터의 칼럼-상 DN아제 I 소화의 연장을 제외하고는 제조업체에 의해 제공된 프로토콜에 따라 RNA를 RN이지 미니 키트 (퀴아젠) 및 RN아제-무함유 DN아제 I (퀴아젠)로 추출하였다. 1 μg의 각각의 RNA 샘플을 트랜스크립터 퍼스트스트랜드 cDNA 합성 키트 (로슈)를 사용하여 역전사하였다. qPCR을 택맨 프로브 마스터 (로슈) 및 2 μl의 샘플 (1/10 희석됨)을 사용하여 삼중으로 수행하였다. 발현을 정량화하기 위해, SV40 폴리A 신호 (모든 h글루코키나제 변이체에 대해 공통적인 서열)를 표적화하는 프라이머-프로브 믹스를 사용하였다 (정방향 프라이머: AGC AAT AGC ATC ACA AAT TTC ACA A; 역방향 프라이머: CAG ACA TGA TAA GAT ACA TTG ATG AGT T; 프로브: /56-FAM/ AGC ATT TTT TT/ZEN/CAC TGC ATT CTA GTT GTG GTT TGT C /3IABkFQ/). 하우스키핑 유전자 hRplp0에 대한 프라이머-프로브 믹스를 사용하여 정규화하였다 (정방향 프라이머: CAG ACA GAC ACT GGC AAC AT; 역방향 프라이머: GCA GCA TCT ACA ACC CTG AA; 프로브: /5HEX/AA CTC TGC A/ZEN/TT CTC GCT TCC TGG A/3IABkFQ).

4.4 세포내 글루코키나제 함량의 정량적 분석

감염 후 48시간에, 세포를 500 μl 1x PBS/웰로 부드럽게 세척하였다. 이어서, 세포를 200 μl의 빙냉 1x PBS에서 스크래핑하고, 마이크로튜브에서 수집하였다. 세포 추출물을 수득하기 위해, 세포를 3회 동결 (액체 질소) 및 해동 (37℃ 수조)시키고, 5000xg에서 10분 동안 4℃에서 원심분리하고, 상청액을 모으고, -80℃에서 저장하였다. h글루코키나제를 인간 글루코키나제 ELISA 키트 (앱캠(Abcam))를 사용하여 중복으로 (표준물 및 샘플) 측정하였다. 샘플을 ELISA 키트에 의해 제공된 1x 희석제 N을 사용하여 1/20 희석하였다. 글루코키나제 함량을 밀리Q 물에서 샘플의 1/10 희석을 사용하여 BCA 방법에 의해 세포 추출물에서 중복으로 정량화된 총 단백질 함량에 의해 정규화하였다.

4.5 글루코키나제 활성 검정

감염 후 48시간에, 세포를 500 μl 1x PBS/웰로 부드럽게 세척하였다. 이어서, 250 μl의 트립신을 웰에 부드럽게 첨가하고, 선회시키고, 과량의 트립신을 흡인에 의해 제거하였다. 실온에서 2-분 인큐베이션 후, 세포를 상하로 피펫팅함으로써 750 μl DMEM + 10% FBS에서 수집하고, 1.5 ml 마이크로튜브 내로 옮겼다. 세포를 600 x g에서 10분 동안 4℃에서 펠릿화하고, 상청액을 흡인하고, 세포 펠릿을 프로세싱까지 -80℃에서 저장하였다.

글루코키나제 활성을 글루코키나제 활성 검정 키트 (어세이제니(AssayGenie))로 측정하였다. 세포 펠릿을 2.5 mM DTT를 함유하는 250 μl의 Gck 검정 완충제에서 초음파처리한 것을 제외하고는 제조업체에 의해 제공된 프로토콜을 따랐다. 샘플의 10배 희석물 10 μl를 검정에 사용하였다.

4.6 통계적 분석

각각의 MOI를 아노바 및 터키 다중 비교 검정을 사용하여 수행된 3회의 연구에 대해 독립적으로 분석하였다.

결과

2v6.11 세포를 h글루코키나제 변이체 Gck8 및 Gck12 및 WT hGck를 보유하는 AAV1-h글루코키나제 벡터로 감염시켜 벡터 감염력 및 효력을 3회의 독립적인 연구에서 평가하였다.

4.7 감염력 검정

3개의 AAV1-h글루코키나제 벡터 AAV1-CMV-hGckWT (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)는 3개의 상이한 검정에서 세포내 벡터 게놈 함량 (vg/ng DNA)에 의해 지시된 바와 같이 시험된 3개의 MOI (1000 vg/세포 (1K), 2000 vg/세포 (2K) 및 4000 vg/세포 (4K))에서 2v6.11 세포를 감염시키는 그들의 능력에 있어서 일관된 유의한 차이를 나타내지 않았다 (도 7A-7C 및 표 9).

표 9: 상이한 AAV1-h글루코키나제 벡터에 대한 감염력 검정의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 감염력 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

4.8 효력 검정

4.8.1 인간 글루코키나제 mRNA 발현

h글루코키나제 발현 수준의 정량화는 각각 hGckWT 및 글루코키나제 변이체 Gck8을 보유하는 벡터 AAV1-CMV-hGckWT (서열식별번호: 19) 및 AAV1-CMV-Gck8 (서열식별번호: 93) 사이에 일관된 유의한 차이를 밝혀내지 않았다 (도 8A-8C 및 표 10). 글루코키나제 변이체 Gck12를 함유하는 AAV1-CMV-Gck12 (서열식별번호: 95)는 AAV1-CMV-hGckWT (서열식별번호: 19) 및 특히 AAV1-CMV-Gck8 (서열식별번호: 93)과 비교할 경우, 검정 및 MOI 사이에 일관되지는 않지만 더 낮은 mRNA 발현을 매개하는 경향을 나타내었다 (도 8A-8C 및 표 10).

표 10: 상이한 AAV1-h글루코키나제 벡터에 대한 h글루코키나제 mRNA 발현의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 h글루코키나제 mRNA 발현 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

4.8.2 세포내 글루코키나제 함량의 정량적 분석

상이한 AAV1-h글루코키나제 벡터로 감염된 2v6.11 세포의 세포내 글루코키나제 함량을 글루코키나제 ELISA 키트 (앱캠)를 사용하여 정량화한 경우, MOI 및 검정 전반에 걸쳐 일관된 유의한 차이는 벡터 사이에 관찰되지 않았다 (도 9A-9C 및 표 11).

표 11: 상이한 AAV1-h글루코키나제 벡터에 대한 세포내 글루코키나제 함량의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 세포내 글루코키나제 함량의 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

4.8.3 글루코키나제 활성 검정

감염된 세포의 세포 추출물에서의 글루코키나제 활성을 글루코키나제 활성 검정 키트 (어세이제니)로 측정하였다. mRNA 발현 및 단백질 판독에 대해 관찰된 결과 (도 8A-8C 및 9A-9C 및 표 10 및 11)와 일치하게, 벡터 AAV1-CMV-hGckWT (서열식별번호: 19), AAV1-CMV-Gck8 (서열식별번호: 93) 및 AAV1-CMV-Gck12 (서열식별번호: 95)에 대해 관찰된 글루코키나제 활성은 MOI 및 검정 전반에 걸쳐 벡터 사이에 유의하게 상이하지 않았다 (도 10A-10C 및 표 12).

표 12: 상이한 AAV1-h글루코키나제 벡터에 대한 글루코키나제 활성의 통계적 유의성 (조정된 P 값).

각각의 MOI 및 각각의 검정에 상응하는 글루코키나제 활성의 데이터를 아노바 및 터키 다중 비교 검정으로 분석하였다. 볼드체 및 이탤릭체는 통계적 유의성을 지시한다.

실시예 5: 골격근에서의 인슐린 및 글루코키나제의 발현을 통한 제1형 당뇨병 마우스의 반전

혈액으로부터 글루코스를 제거하는 AAV 벡터 인슐린 및 글루코키나제 구축물의 1회 투여의 유효성을 평가하기 위해, C57Blk6 마우스의 둘 다의 뒷다리에서의 골격근 (사두근, 장딴지근, 및 앞정강근)을 인간 인슐린 유전자를 함유하는 AAV1 (서열식별번호: 1) 및 래트 글루코키나제 유전자를 함유하는 AAV1로 감염시켰다.

마우스를 먼저 연이은 5일 동안 40 mg의 스트렙토조토신 (STZ)으로 처리하여 췌장에서의 베타 세포를 고갈시키고, 그에 의해 천연 마우스 인슐린의 생산을 제거하고, 혈액 글루코스 수준이 ~600 mg/dL에 도달하게 하였다. 이어서 동물을 둘 다의 뒷다리에서의 3개의 확인된 근육에서 AAV1-인슐린 (서열식별번호: 1) 및 AAV1-래트 글루코키나제의 동등한 혼합물로 제공하였다. 별개의 그룹에서, 동물을 보다 낮은 총 부피로 2개의 뒷다리 근육 (사두근 및 장딴지근)에 AAV1-인슐린 (서열식별번호: 1) 및 AAV1-래트 글루코키나제의 동일한 총 용량으로 투여하였다. 이들 동물을 STZ-비히클-처리된 및 비-당뇨병 비히클-처리된 동물 (n=10-11/그룹)과 비교하였다. AAV1-인슐린 (서열식별번호: 1) 및 AAV1-래트 글루코키나제를 받은 STZ-처리된 당뇨병 마우스는 앞선 연구에서 관찰된 바와 같이, 급식된 및 절식된 상태에서 정상혈당 및 HbA1C 수준을 복원하고 유지하였다.

2개의 근육에의 유전자 요법의 투여는 그것이 3개의 근육에 투여된 경우와 같이 동등하게 효과적이었다. AAV1-인슐린 (서열식별번호: 1) 및 AAV1-래트 글루코키나제를 받은 스트렙토조토신-처리된 당뇨병 마우스는 주사 후 5주까지 급식된 (도 11A-11C 및 도 12) 및 절식된 상태 (제4주 데이터가 제시됨)에서 정상혈당을 복원하고 유지하였다. 또한, 보다 높은 농도의 벡터로 단지 2개의 보다 큰 근육 그룹 (사두근 및 장딴지근)에서 처리된 마우스는 3개의 근육 그룹에서 처리된 마우스와 등가이거나 그보다 더 양호하게 수행하는 것으로 나타났다 (도 11A-11C 및 도 12). 이들 결과는 근육 해부구조 및 혈류가 상대계측 해석에서 고려사항일 수 있음을 지시한다. 치료 효과는 투여 후 1주만큼 빨리 관찰되었으며, 고혈당증의 유의한 감소는 비처리된 대조군 동물의 범위에서 2주까지 관찰되었다. AAV-매개 기저 인슐린 생산 및 글루코키나제 활성의 공동 작용은 당뇨병 동물에서 글루코스의 적절한 조절을 허용하는 골격근에서 "글루코스 센서"를 생성하여, 처리된 동물에서 당뇨병의 완전한 반전을 유도할 수 있다.

실시예 6: 추가의 프로인슐린 변이체의 개발

서열식별번호: 150-159에 상응하는 프리프로인슐린 변이체를 코딩하는 10개의 추가의 변형된 핵산 인간 인슐린 ORF 서열을 디자인하였다 (표 13에 제시됨). ORF는 B 쇄 및/또는 C 쇄에서의 아미노산 돌연변이, 신호 서열에서의 치환, 푸린 엔도프로테아제 절단 부위의 부가, 또는 이들의 조합을 포함하는 프리프로인슐린 변이체를 코딩한다.

표 13: 변형된 인슐린 ORF 서열

실시예 7: 프리프로인슐린 변이체의 시험관내 평가

시험관내에서 서열식별번호: 150-159에 의해 매개된 인슐린 생산 및 분비 수준을 평가하기 위해, 각각의 인슐린 변이체를 먼저 미니CMV 프로모터 (pAAV-미니CMV-InsX, 여기서 X는 특이적 ORF, 즉, 서열식별번호: 150-159를 지시함)의 제어 하에서 AAV 플라스미드 (pAAV)에서 클로닝하였다. 플라스미드 명칭 및 상응하는 ORF 서열은 표 14에 열거된다.

표 14: 인슐린 플라스미드 명칭

AAV 발현 카세트를 AAV2의 ITR 사이에서 미니CMV 프로모터 (pAAV-미니CMV-InsX, 여기서 X는 특이적 인슐린 변이체를 지시함)의 제어 하에서 인간 프리프로인슐린 변이체를 클로닝함으로써 수득하였다.

RSV 프로모터 (AAV1-InsX, 여기서 X는 특이적 프로인슐린 변이체를 지시함)의 제어 하에서 미니CMV 프로모터 및 인간 글루코키나제의 제어 하에서 프리프로인슐린 변이체를 코딩하는 혈청형 1의 단일-가닥 AAV 벡터를 표준 방법에 따라 HEK293 세포의 삼중 형질감염에 의해 생산하였다 (Ayuso, E. et al., 2010. Curr Gene Ther. 10(6):423-36). 세포를 DMEM 10% FBS에서 10개의 롤러 보틀 (850 cm², 평평함; 코닝(Corning)™, 시그마-알드리치 컴퍼니(Sigma-Aldrich Co.), 미국 미주리주 세인트 루이스)에서 80% 전면생장률로 배양하고, AAV2 ITR에 의해 플랭킹된 발현 카세트를 보유하는 플라스미드, AAV2 rep 유전자 및 혈청형 1의 AAV cap 유전자를 보유하는 헬퍼 플라스미드, 및 아데노바이러스 헬퍼 기능을 보유하는 플라스미드로 인산칼슘 방법에 의해 공동-형질감염시켰다. 비코딩 플라스미드를 널(null) 벡터 (pAAV-널)를 생산하는데 사용하였다. AAV를 폴리에틸렌 글리콜 침전 단계 및 2개의 연속적 염화세슘 (CsCl) 구배에 기반한 최적화된 방법으로 정제하였다. 이 제2-세대 CsCl-기반 프로토콜은 비어 있는 AAV 캡시드 및 DNA 및 단백질 불순물을 극적으로 감소시켰다 (Ayuso, E. et al., 2010. Curr Gene Ther . 10(6):423-36). 정제된 AAV 벡터를 PBS에 대해 투석하고, 여과하고, -80℃에서 저장하였다. 바이러스 게놈의 역가를 표준 곡선으로서 선형화된 플라스미드 DNA를 사용하여 AAV2 참조 표준 물질에 대해 기재된 프로토콜에 따라 정량적 PCR에 의해 결정하였다 (Lock M, et al., Hum. Gene Ther. 2010; 21:1273-1285). 벡터를 관련 기술분야에 널리 공지된 분자 생물학 기술에 따라 구축하였다.

먼저, HEK293 세포를 등몰량의 pAAV-미니CMV-Ins1 내지 8 플라스미드로 형질감염시켰다. HEK293 세포를 24-웰 플레이트에서 배양하고, 리포펙타민(Lipofectamine) 2000을 사용하여 제조업체의 지시서 (써모 피셔 사이언티픽(Thermo Fisher Scientific))에 따라 웰당 0.8 μg의 DNA로 형질감염시켰다. 비-형질감염된 HEK293 세포 및 트랜스진을 포함하지 않는 AAV 플라스미드 (pAAV-널)로 형질감염된 HEK293 세포는 대조군으로서 역할을 하였다. pAAV-미니CMV-Ins3 플라스미드는 가장 높은 세포내 인슐린 함량 및 배양 배지 내로의 인슐린의 분비 둘 다를 매개하였다 (도 13A-13B). 이들 결과는 변이체의 나머지와 비교하여 pAAV-미니CMV-Ins3 플라스미드로 형질감염된 HEK293 세포에서의 개선된 인슐린 발현 수준에 기인하지 않았다 (도 14A-14D).

다음으로, HEK293 세포를 pAAV-미니CMV-Ins3, pAAV-미니CMV-Ins9 또는 pAAV-미니CMV-Ins10으로 형질감염시켰다. pAAV-널 플라스미드로 형질감염된 HK293 세포를 대조군으로서 사용하였다. 이전의 관찰과 유사하게, pAAV-미니CMV-Ins3으로 형질감염된 세포는 pAAV-미니CMV-Ins9 또는 pAAV-미니CMV-Ins9로 형질도입된 것들을 능가하였다 (도 15).

실시예 8: 프리프로인슐린 변이체의 생물학적 활성의 생체내 평가

생물학적 활성을 평가하기 위해, 프리프로인슐린 변이체 AAV1-Ins1, AAV1-Ins3, AAV1-Ins4, AAV1-Ins5 또는 AAV1-Ins6을 코딩하는 AAV1 벡터 (표 13 참조)를 생성하고, 생체내에서 글루코스 처리를 증진시키는 그들의 효능을 건강한 마우스에서 평가하였다. 이를 위해, CD1 마우스를 3x10¹¹ 바이러스 게놈 (vg)의 AAV-Ins 또는 AAV1-널 벡터로 처리하였다. 마우스를 케타민 (100 mg/kg) 및 크실라진 (10 mg/kg)의 복강내 주사로 마취시켰다. 뒷다리를 면도하고, 벡터를 각각의 뒷다리의 사두근, 장딴지근, 및 앞정강근에 분포된 6개의 주사 부위로 나누어진 180 μl의 총 부피로 근육내 주사에 의해 투여하였다.

AAV 투여 후 3주에, 글루코스 내성 시험을 수행하였다. 글루코스 내성 시험을 수행하기 위해, 깨어 있는 마우스를 밤새 (16시간) 절식시키고, 글루코스 (2 g/kg 체중)의 복강내 주사로 투여하였다. 당혈증을 지시된 시점에서 꼬리 정맥 혈액 샘플에서 측정하였다.

WT 프리프로인슐린, 프리프로인슐린 변이체 1 또는 4를 코딩하는 AAV1 벡터로 처리된 대조군 마우스의 코호트 사이에 복강내 글루코스 내성 시험 후 혈액 글루코스 수준의 차이는 관찰되지 않았다 (도 16A-16C 및 도 17). 대조적으로, AAV1-Ins3 벡터를 받은 마우스는 건강한 마우스와 비교하여 개선된 글루코스 내성을 나타내었다 (도 16D 및 도 17). AAV1-Ins6으로의 처리는 글루코스 처리를 부분적으로 증진시켰다 (도 16E 및 도 17). 6x10¹¹ vg의 AAV-Ins6 벡터로 처리된 마우스 및 3x10¹¹ vg의 AAV1-Ins3 벡터로 처리된 대조군 마우스에 대한 결과는 도 16F 및 도 17에 제시된다.

실시예 9: TLR9의 AAV-Ins 또는 AAV-Gck 자극의 시험관내 평가

TLR9 자극의 차이는 AAV1-ratGck 또는 AAV1-hInsB10D_2로 형질도입된 HEK-듀얼(Dual)™ hTLR9 세포에서 검출되었다 (도 18A). TLR9 자극은 CMV 프로모터 및 hGckWT 코딩 서열을 포함하는 야생형 AAV1-GCK 대조군 구축물 (AAV1-hGckWT)에 비해, (1) CMV 프로모터 및 변형된 hGck8 코딩 서열 (AAV1-hGck8) 및 (2) CMV 프로모터 및 변형된 hGck12 코딩 서열 (AAV1-hGck12)을 포함하는 변형된 AAV1-GCK 구축물로 형질도입된 세포에서 감소되었다 (도 18B). TLR9 자극은 대조군 AAV1-CMV-hInsB10D 및 (1) CMV 프로모터 및 변형된 hIns5 코딩 서열 (AAV1-hIns5) 및 (2) CMV 프로모터 및 변형된 hIns7 코딩 서열 (AAV1-hIns7)을 포함하는 변형된 AAV1-Ins 구축물로 형질도입된 세포 사이에 유사하였다 (도 18C). TLR9 자극의 기울기는 표 15에 제공된다. 결과는 변형된 GcK 코딩 서열을 포함하는 구축물로의 TLR9의 감소된 자극을 제시하며, 변형된 구축물로의 감소된 면역 활성화를 시사한다.

표 15. AAV-Ins 및 AAV-Gck 벡터의 투여 후 TLR9 자극의 기울기.

실시예 10: 당뇨병 마우스에서의 AAV-Ins 및 AAV-Gck 벡터의 생체내 평가

래트 글루코키나제 및 인간 인슐린을 발현하는 AAV1 벡터 구축물의 효능을 6개의 근육내 주사의 투여 후 당뇨병 C57BL/6J 마우스의 스트렙토조토신-유도된 모델에서 평가하였다. 마우스 (투여의 개시에서 8-9주령)의 2개의 코호트를 수득하였다. 하나의 코호트를 스트렙토조토신 (50 mg/kg; STZ)의 5개의 매일 i.p. 용량으로 투여하여 당뇨병을 유도하였다. 제2 코호트를 Na-시트레이트 완충제의 5개의 매일 i.p. 용량으로 투여하여 비-당뇨병 대조군으로서 역할을 하게 하였다.

유도 후, 동물을 먹이 및 역삼투에 의해 처리되고 자동 급수 시스템을 통해 1-6 ppm의 염소를 유지하도록 염소처리된 지역 수돗물에 대한 무제한 접근을 허용하였다. 동물을 기준선 체중, 비-절식 혈액 글루코스, 및 순환 마우스 인슐린 수준의 측정 전에 4일 동안 사육장에 대해 순응시켰다. 이어서 동물을 차단하고, 이들 파라미터 중 임의의 것에 관하여 그룹 내에 또는 사이에 유의한 차이가 없도록 처리 그룹으로 할당하였다.

처리 전에, 동물을 산소 중 이소플루란으로 마취시키고, 30 마이크로리터 (μL) 용량을 각각의 뒷다리의 사두근, 장딴지근, 및 앞정강근 내로 인슐린 시린지로 직접 주사에 의해 투여하였다. 구축물 AAV1-926+AAV1-927 (본원에 참조로 포함되는 보쉬 래버러토리(Bosch laboratory) (Mas et al. 2006) 및 미국 특허 번호 9,309,534로부터의 공개된 연구에 이전에 기재된 각각 래트 GcK 및 인간 인슐린의 1:1 혼합물)을 비교를 위한 대조군으로서 투여하였다. 벡터를 높은, 중간 (mid), 또는 낮은 용량 중 어느 하나로 투여하였다. 높은 용량은 낮은 용량보다 3배 더 크고, 중간 용량보다 1.5배 더 컸다. 투여는 모든 실험 사이에 일관되었다. 각각의 주사 (마우스당 총 6개)는 선택된 근육 번들 (앞정강근, 사두근, 및 장딴지근) 내로 양측으로 주사당 전체 벡터 현탁액 (30 uL)을 침착시켰다. 처리 그룹은 표 16에 개요된다.

표 16. 당뇨병 마우스 모델 처리 그룹

체중 및 비-절식된 혈액 글루코스를 매주 결정하였다. 일관성을 위해, 모든 측정을 하루 중 동일한 시간 (오후 1-3시)에서 수행하였다. 절식된 혈액 글루코스를 제4주에 결정하고, 경구 글루코스 내성 시험 (OGTT)을 제8주에 수행하였다. 연구의 종결시, 혈액 샘플을 모든 동물로부터 수집하여 혈액 글루코스, 마우스 및 인간 순환 인슐린, HbA1c 및 다른 대사 파라미터를 측정하였다. 근육, 간, 및 췌장의 조직 샘플을 수집하고, 칭량하고, mRNA, 단백질 수준 및 단백질 활성의 평가를 위해 보존하였다. STZ 또는 Na 시트레이트 완충제 중 어느 하나로 처리된 모든 마우스에 대한 기준선 값은 표 17에 제시된다.

표 17. STZ 또는 Na 시트레이트 완충제로 처리된 마우스에 대한 기준선 값

시험품은 혈액 글루코스를 제33일까지 비-당뇨병 대조군의 수준으로 유의하게 저하시키는데 효과적이었다 (도 19). 정상혈당이 도달되었으면, 효과는 연구의 과정 전반에 걸쳐 유지되었다. 처리는 비처리된 제1형 당뇨병과 종종 연관된 체중 감소에 대해 보호하는 것으로 나타났으며, 다수의 대사 파라미터를 정상혈당과 연관된 수준으로 복원하였다. 동역학 및 글루코스 저하 효과에 대한 최적 프로파일은 천연 인슐린 신호 펩티드를 함유하는 B10H 구축물 (높은 용량) 및 IL-6 신호 펩티드를 함유하는 B10H 구축물 (낮은 용량)로 입증되었다.

이들 데이터는 인슐린 및 글루코키나제가 AAV1 벡터를 사용하여 골격근에서 발현될 수 있음을 추가로 제시하였다. 제1형 당뇨병의 마우스 모델에서 이들 벡터로의 처리는 8주 동안 급식된 및 절식된 상태에서 정상혈당을 신속하게 복원하고 유지하였다.

10.1 AAV-Ins 및 AAV-Gck 벡터의 투여 후의 당뇨병 마우스에서의 순환 인슐린 수준

STZ의 투여는 모든 검출가능한 순환 마우스 인슐린을 제거하였다. 천연 또는 IL-6 신호 서열을 갖는 hInsB10D 또는 hInsB10H 중 어느 하나에 대한 코딩 서열을 포함하는 AAV1 벡터 구축물의 효능을 평가하기 위해, 순환 인간 인슐린을 AAV1 벡터 구축물의 i.m. 주사 후 4주에 6-시간 절식 후 STZ 마우스에서 측정하였다. 모든 샘플을 입증된 플레이트-기반 ELISA 방법을 통해 분석하였다.

문헌에서 보고된 C57Bl/6 마우스에서의 절식 순환 인슐린 수준은 전형적으로 0.75 내지 1.0 ng/mL의 범위이다. 제4주까지, AAV1-926 + AAV1-927 (높은 용량) 및 hINSB10D (서열식별번호: 110의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (중간 용량)로 주사된 마우스는 지속적인 저혈당증으로 인해 안락사되었다. 종결 종점에서, 그들 그룹에 대한 평균 순환 인간 인슐린 수준은 각각 10.1 ng/mL 및 4.5 ng/mL였다. 제4주에, hInsB10D (서열식별번호: 110의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (낮은 용량) 및 hInsB10H+IL6 (서열식별번호: 120의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (높은 용량)로 주사된 마우스의 순환 인간 인슐린은 각각 5.27 ± 0.34 및 3.39 ± 0.25 ng/ml의 수준에 도달하였다 (도 20A). 궁극적으로, 이들 2개의 그룹은 또한 저혈당증으로 인해 안락사되었다.

도 19에 제시된 바와 같이, hInsB10H (서열식별번호: 111의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (높은 용량) 및 hInsB10H+IL6 (서열식별번호: 120의 코딩 서열을 포함하였음)+ AAV1-GCK (AAV926) (낮은 용량)로 투여된 동물은 둘 다 혈액 글루코스를 연구의 지속기간 동안 비-당뇨병 대조군 마우스의 수준에서 또는 부근에서 감소시키고 유지하였다. 이들 마우스에 대한 순환 인간 인슐린 값은 각각 1.33 ± 0.14 및 0.6 ± 0.1 ng/mL였다 (도 20A 및 20B). 이들 데이터는 STZ-처리된 마우스의 골격근에의 hINS 및 hGCK의 공동투여가 순환 인슐린 수준이 정상 절식 (즉, 기저) 수준의 범위 내인 경우 혈액 글루코스를 효과적으로 제어할 수 있음을 제시한다.

10.2 AAV-Ins 및 AAV-Gck 벡터의 투여 후의 당뇨병 마우스에서의 경구 글루코스 내성

제54일에 최종 급식된-글루코스 측정 후, 및 12시간 암기로 들어가기 전에, 동물을 깨끗한 우리에 두었다. 먹이를 제거하였지만, 물에 대한 접근은 절차 전반에 걸쳐 제공하였다. 4-6시간 절식 후, 동물을 칭량하고, 2 g/kg 글루코스의 용량으로 경구 섭식에 의해 글루코스 용액 (10 mL/kg으로 0.2 mg/mL 글루코스)을 투여하였다. 이어서 혈액 글루코스를 꼬리로부터 두번째 방울 (5-10 μL)의 혈액으로 핸드-헬드 혈당측정기를 사용하여 꼬리 절단을 통해 결정하였다. 측정을 글루코스 용량에 비해 하기 시간에 수행하였다: T=0 (글루코스 용량 직전), 15, 30, 60, 90, 및 120분. 최종 혈액 글루코스 측정 후, 먹이를 우리로 복귀시켰다.

비-당뇨병 대조군 마우스의 절식 혈액 글루코스 (T=0)는 STZ-처리된 동물의 그것보다 유의하게 더 적었다 (도 21). AAV1 벡터 구축물로의 처리는 STZ 대조군 마우스 및 비-당뇨병 대조군의 수준에 비해 절식 글루코스를 유의하게 감소시켰다. 글루코스 (2 g/kg)로의 경구 섭식 후, 비-STZ 대조군의 혈액 글루코스는 15분에서 피크로 189 ± 17 mg/dL 증가하였으며, 90분에 거의-대조군 수준으로 복귀한다. 대조적으로, STZ 처리된 마우스는 30분에 보다 가깝게 발생하는 피크로 264 ± 37 mg/dL 증가하였으며, 심지어 120분에서도 대조군 수준으로 복귀하는데 실패하였다. 이 데이터는 STZ 처리된 마우스가 식사 후 운동 후에 정상적으로 글루코스 처리를 조절할 수 없었음을 입증하였다. 비-당뇨병 대조군과 유사하게, 벡터 구축물 hInsB10H (서열식별번호: 111의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (높은 용량) 및 hInsB10H+IL6 (서열식별번호: 120의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) (낮은 용량)로의 IM 주사는 챌린지 후 15분에서 각각 154 ± 16 및 218 ± 22 mg/dL의 피크 글루코스 변동폭을 생성하였다. 둘 다의 처리는 혈액 글루코스를 60분 내에 T=0 수준으로 복귀시켰다. AUC를 이용한 ANCOVA 분석으로부터의 결과는 이들 해석을 뒷받침하였다 (도 22). 전체적으로, 이들 데이터는 이들 구축물의 IM 주사가 절식 글루코스 수준을 제어할 수 있을 뿐만 아니라, 당뇨병 환자에서 전형적으로 관찰되는 큰 식사 후 글루코스 변동폭을 둔화시킬 수 있음을 시사한다.

제1형 당뇨병에 대한 목표는 당뇨병성 케톤산증 및 의학적으로 결과적인 저혈당증을 예방하면서 체중의 변화 없이 혈당 제어를 정상화하는 것이다. 제1형 당뇨병 환자는 순환 인슐린을 거의 또는 전혀 갖지 않기 때문에, 이들은 살아 있기 위해 매일 인슐린을 취해야 한다. 또한, 스트렙토조토신 (STZ)-유도된 당뇨병에 의해 생성된 고혈당증은 말초 조직의 진행성 인슐린 저항성을 초래하는 것으로 보고되었다 (Ordonez P, Moreno M, Alonso A, Fernandez R, Diaz F and Gonzalez C. Insulin sensitivity in streptozotocin-induced diabetic rats treated with different doses of 17beta-oestradiol or progesterone. Exp Physiol 92:241-9, 2007. doi: 10.1113/expphysiol.2006.035006. Epub 2006 Oct 26.). 여기에 제시된 결과는 말초 조직의 인슐린 민감성을 개선시키는 것 외에도 근육에의 인슐린의 대안적인 공급을 제공할 수 있는 것이 혈당 제어를 복원하는 다중 수단을 제공함을 뒷받침한다.

10.3 AAV-Ins 및 AAV-Gck 벡터의 투여 후의 당뇨병 마우스에서의 HbA1c 수준

혈액 샘플을 주사 후 8-주에 최종 비-절식된 혈액 수집 동안 수득하였다. 당화 혈액 헤모글로빈 (HbA1c)을 핸드-헬드 HbA1c 측정기를 사용하여 꼬리 절단으로부터 두번째 방울의 혈액 (5-10 μL)으로부터 결정하였다. 이 방법은 금 표준 참조물로서 국립 글리코헤모글로빈 표준화 프로그램 (NGSP) 인증된 방법에 대한 비교 시험으로 입증되었다. HbA1c는 불량한 건강/저혈당증으로 인해 죽거나 안락사된 동물 (AAV1-Ins + AAV1 GCK 높은 용량)에서는 결정되지 않았다.

비-당뇨병 마우스에서의 HbA1c의 정상 범위는 4%-5.6%이며, 당뇨병은 HbA1c >6.5%로서 정의된다. 이 연구로부터의 데이터는 도 23에 제시된다. 비-STZ 대조군 마우스에 대한 HbA1c 값은 4.3 ± 0.05%였다. STZ의 투여는 비-당뇨병 대조군에 비해 HbA1c의 유의한 증가를 생성하였다 (9.48 ± 0.64%; p<0.001). 벡터 구축물 hInsB10H + AAV1-GCK (서열식별번호: 111의 코딩 서열을 포함하였음) (AAV926) 높은 용량 (4.89 ± 0.15) 및 hInsB10H+IL6 (서열식별번호: 120의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) 낮은 용량 (5.03 ± 0.27%)으로의 처리는 혈액 글루코스 및 HbA1c를 비-당뇨병 대조군의 수준으로 유의하게 감소시켰다.

HbA1c는 시간의 기간에 걸쳐 평균 당혈증을 반영하는 통합된 신호이며; 마우스의 경우에, 적혈구 t_1/2은 ~14일이다. 임상적으로, 이 시험은 혈당 제어를 평가하기 위한 주요한 도구이며, 당뇨병 및 동반질환에 대한 강한 예측적 값을 갖는다. 당뇨병 요법의 목표는 HbA1c를 정상 범위 (<6.5%)에서 유지하는 것이며, 대부분의 시판 제품은 HBA1C를 0.5 내지 1.25% 저하시킨다. 여기서, STZ로의 마우스에서의 제1형 당뇨병의 화학적 유도는 HbA1c를 4.3 내지 9.48 % 증가시켰다. hINS 및 rGCK를 함유하는 AAV1 벡터로의 IM 주사는 본질적으로 HbA1c를 8주 내에 비-당뇨병 대조군의 그것들로 정상화하였다. 또한, 이들 벡터는 STZ 대조군에 비해 HbA1c의 >4% 감소를 생성하였다. 모든 그룹은 HbA1c를 저하시켰지만, 단지 hInsB10H (서열식별번호: 111의 코딩 서열을 포함하였음) + AAV1-Gck (높은 용량) 및 hIns-B10H-IL6 (서열식별번호: 120의 코딩 서열을 포함하였음) + AAV1-Gck (낮은 용량)는 8주 혈액 채혈까지 생존하였으며, 이는 HbA1c 수준이 8주에 걸쳐 평균임을 의미한다.

매주 혈액 글루코스의 시간적 측정과 함께 HbA1c는 시간의 기간에 걸쳐 개선된 식사 후 글루코스 변동폭 및 감소된 정도의 혈당 가변성 둘 다의 정량적 척도를 제공하였으며, 이는 둘 다의 인자가 이 처리로 정상화될 수 있음을 시사한다. 결과는 제1형 당뇨병 환자에게 IM 공동-투여된 hIns 및 GcK AAV 구축물이 이 만성이고 쇠약하게 하는 질환의 단일 용량 반전을 나타낼 수 있음을 뒷받침한다.

10.4 AAV-Ins 및 AAV-Gck 벡터의 투여 후의 당뇨병 마우스에서의 혈청 트리글리세리드 및 케톤체 수준

STZ-유도된 당뇨병의 마우스 모델은 비-당뇨병 대조군에 비해 상승된 혈액 트리글리세리드 및 케톤 수준 둘 다를 가지며, 우세하게 지질-기반 에너지 공급원으로 이동하였다. 벡터 구축물 hInsB10H (서열식별번호: 111의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) 높은 용량 및 hInsB10H+IL6 (서열식별번호: 120의 코딩 서열을 포함하였음) + AAV1-GCK (AAV926) 낮은 용량의 IM 주사는 순환 트리글리세리드 (도 24A) 및 케톤 (도 24B) 수준을 비-당뇨병 대조군의 수준 또는 그 미만으로 감소시켰다. 이 데이터는 다중 대사 종점이 AAV-hInsB10H (천연 또는 IL-6 신호 서열을 가짐) 및 AAV-Gck 벡터의 투여 후에 정상화되었음을 제시하였다.

10.5 AAV-Ins 및 AAV-Gck 벡터의 투여 후의 당뇨병 마우스에서의 간 hINS mRNA 수준

qPCR 분석을 사용하여 AAV-Ins 및 AAV-Gck 구축물의 투여 후의 STZ-유도된 당뇨병 마우스에서의 mRNA 발현을 평가하였다. 간에서의 hINS mRNA 수준을 평가하여 AAV-1 벡터가 근육을 탈출하고, 순환에 들어가고, 간을 형질도입하고, 이어서 검출가능한 수준으로 전사되게 되는지 여부를 결정하였다. 샘플은 비-당뇨병 대조군 또는 STZ-대조군 마우스에서는 측정되지 않았는데, 이는 그러한 그룹에서는 벡터가 주사되지 않았기 때문이다. 예상치 못한 사망을 경험하였거나 고통을 나타낸 동물은 분석하지 않았다. 결과는 표 18 및 도 25에 제시된다.

표 18. hINS의 간 발현

이 검정의 결과는 >5 사이클의 Δ Ct를 제시하고, 이는 시험된 3개의 구축물 (AAV1-mWTIns + AAV1-rGck (AAV926) 높은 용량; AAV1-mWTIns (Ins17) + AAV1-rGck (AAV926) 낮은 용량; 및 AAV1-mWTIns (Ins17) + AAV1-rGck (AAV926) 높은 용량)로 투여된 마우스의 간에 존재하는 hINS mRNA가 매우 낮거나 없음을 시사하며, 따라서 IM 주사된 AAV는 표적 근육에서 대부분 잔류한다. 이들 결과는 IM 전달된 AAV1-Ins 구축물이 AAV-Ins 및 AAV-Gck 벡터의 형질도입 및 근육에서의 단백질 발현으로 인해 혈액 글루코스, HbA1c, 케톤, 및 트리글리세리드의 관찰된 정상화를 발생시켰음을 제시한다.

SEQUENCE LISTING <110> KRIYA THERAPEUTICS, INC. UNIVERSITAT AUTONOMA DE BARCELONA GUPTA, NACHI SHEN, WEIRAN GARCIA MARTINEZ, MIQUEL JIMENEZ CENZANO, VERONICA BOSCH TUBERT, MARIA FATIMA <120> MODIFIED INSULIN AND GLUCOKINASE NUCLEIC ACIDS FOR TREATING DIABETES <130> 4525.016PC05 <150> US 63/188,778 <151> 2021-05-14 <150> US 63/141,918 <151> 2021-01-26 <150> US 63/067,264 <151> 2020-08-18 <150> US 63/054,162 <151> 2020-07-20 <150> US 63/047,965 <151> 2020-07-03 <160> 167 <170> PatentIn version 3.5 <210> 1 <211> 1046 <212> DNA <213> Homo sapiens <400> 1 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc atggccctgt 360 ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac ccagccgcag 420 cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg 480 gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg 540 ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg 600 ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc 660 agctggagaa ctactgcaac tagacgcagc tgctagctaa tcgataccgt cgacctcgag 720 gaattcacgc gtggtacctc tagagtcgac ccgggcggcc gcttcccttt agtgagggtt 780 aatgcttcga gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat 840 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 900 tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 960 gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatccg 1020 ataagggact agagcagaag cttttg 1046 <210> 2 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 2 <400> 2 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360 tggcactgct ggccctctgg ggacctgacc cagcagcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480 cacccaggac caagagggag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtccagacag aagagaggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 3 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 3 <400> 3 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgaggctc ctgcccctgc 360 tggccctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaaggggc ttcttctaca 480 cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcaggcag aagaggggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 4 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 4 <400> 4 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgaggctc ctgcccctgc 360 tggctctgct ggccctctgg ggacctgacc cagcagcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaaggggc ttcttctaca 480 cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcaggcag aagagaggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 5 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 5 <400> 5 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactg ctccccctcc 360 tggctttgct ggccctgtgg ggaccagatc ctgcagctgc ctttgtgaat cagcacctgt 420 gtggctcaga tctggttgag gcactctacc tggtgtgtgg ggagagaggc ttcttttaca 480 caccaaggac caagagggag gcagaggatc tgcaggtagg tcaggtggag ctgggaggtg 540 gccctggagc aggatccctg cagcccttgg cactggaggg ctccagacag aagaggggca 600 ttgtggaaca gtgttgcact agcatctgca gcctgtacca gctggagaac tactgcaact 660 aaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 6 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 6 <400> 6 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360 gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420 ctcagatctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480 caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 7 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 7 <400> 7 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcgcctc ctgcccctgc 360 tggcgctgct ggccctctgg ggacctgacc cagccgcagc ctttgtgaac caacacctgt 420 gcggctcaga tctggtggaa gctctctacc tagtgtgcgg ggaaagaggc ttcttctaca 480 cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag ctgggcgggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag aagagaggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 8 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns -8 <400> 8 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360 tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420 ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480 caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 9 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 9 <400> 9 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360 tggccctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480 cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagcagacag aagagaggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 10 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 10 <400> 10 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360 tggctctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480 cacccaggac caagagggag gcagaggacc tgcaggtggg gcaggtggag ctgggagggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gagtagacag aagaggggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 11 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 11 <400> 11 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ctgcccctgc 360 tggctctgct ggccctctgg ggacctgacc cagctgcagc ctttgtgaac caacacctgt 420 gtggctcaga tctggtggaa gctctctacc tagtgtgtgg ggaaagaggc ttcttctaca 480 cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag ctgggtgggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtctagacag aagagaggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 12 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns -12 <400> 12 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360 tggctttact ggcactatgg ggccctgacc cagcggccgc tttcgtgaac cagcacctct 420 gcggaagcga tctggtcgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480 ccccgaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctcggagggg 540 gccccggtgc cggatccctg cagcctctgg ctctcgaagg gtctcgacaa aaacgtggca 600 tcgtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660 gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 13 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 13 <400> 13 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360 tggctttact ggcactatgg ggccctgacc cagcggccgc ttttgtgaac cagcacctct 420 gcggatctga tctggttgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480 ccccaaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540 gcccgggtgc aggatccctg cagcctctgg ctctagaagg gtctagacaa aaaaggggca 600 tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660 gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 14 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 14 <400> 14 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcggctc ttgccccttc 360 tggctttact ggcactatgg ggccctgacc cagcggccgc ttttgtgaac cagcacctct 420 gcggatctga tctggtggag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480 cccccaggac aaagcgcgag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540 gcccgggtgc aggatccctg cagcctctgg ctctggaagg gtctagacaa aaaaggggca 600 tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660 gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 15 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 15 <400> 15 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ttgccccttc 360 tggctttact ggcactatgg ggccctgacc cagcagctgc ttttgtgaac cagcacctct 420 gtggatctga tctggttgag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480 ccccaaggac aaagagggag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540 gccctggtgc aggatccctg cagcctctgg ctctagaagg gtctagacaa aaaaggggca 600 tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660 gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 16 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 16 <400> 16 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgagactc ttgccccttc 360 tggctttact ggcactatgg ggccctgacc cagcagctgc ttttgtgaac cagcacctct 420 gtggatctga tctggtggag gccttgtacc tggtttgtgg ggaaagaggt tttttctata 480 cccccaggac aaagagagag gcagaagacc ttcaagtggg ccaggtagag ctgggagggg 540 gcccaggtgc aggatccctg cagcctctgg ctctggaagg gtctagacaa aaaagaggca 600 tagtggagca gtgctgtact tcaatttgca gtttgtacca gcttgagaat tattgtaact 660 gaagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 17 <400> 17 000 <210> 18 <400> 18 000 <210> 19 <211> 2118 <212> DNA <213> Homo sapiens <400> 19 ctagaagctt tattgcggta gtttatcaca gttaaattgc taacgcagtc agtgcttctg 60 acacaacagt ctcgaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcgtgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtacttaata cgactcacta taggctagcc tcgagaattc tgccatggcg 360 atggatgtca caaggagcca ggcccagaca gccttgactc tggtagagca gatcctggca 420 gagttccagc tgcaggagga ggacctgaag aaggtgatga gacggatgca gaaggagatg 480 gaccgcggcc tgaggctgga gacccatgaa gaggccagtg tgaagatgct gcccacctac 540 gtgcgctcca ccccagaagg ctcagaagtc ggggacttcc tctccctgga cctgggtggc 600 actaacttca gggtgatgct ggtgaaggtg ggagaaggtg aggaggggca gtggagcgtg 660 aagaccaaac accagatgta ctccatcccc gaggacgcca tgaccggcac tgctgagatg 720 ctcttcgact acatctctga gtgcatctcc gacttcctgg acaagcatca gatgaaacac 780 aagaagctgc ccctgggctt caccttctcc tttcctgtga ggcacgaaga catcgataag 840 ggcatccttc tcaactggac caagggcttc aaggcctcag gagcagaagg gaacaatgtc 900 gtggggcttc tgcgagacgc tatcaaacgg agaggggact ttgaaatgga tgtggtggca 960 atggtgaatg acacggtggc cacgatgatc tcctgctact acgaagacca tcagtgcgag 1020 gtcggcatga tcgtgggcac gggctgcaat gcctgctaca tggaggagat gcagaatgtg 1080 gagctggtgg agggggacga gggccgcatg tgcgtcaata ccgagtgggg cgccttcggg 1140 gactccggcg agctggacga gttcctgctg gagtatgacc gcctggtgga cgagagctct 1200 gcaaaccccg gtcagcagct gtatgagaag ctcataggtg gcaagtacat gggcgagctg 1260 gtgcggcttg tgctgctcag gctcgtggac gaaaacctgc tcttccacgg ggaggcctcc 1320 gagcagctgc gcacacgcgg agccttcgag acgcgcttcg tgtcgcaggt ggagagcgac 1380 acgggcgacc gcaagcagat ctacaacatc ctgagcacgc tggggctgcg accctcgacc 1440 accgactgcg acatcgtgcg ccgcgcctgc gagagcgtgt ctacgcgcgc tgcgcacatg 1500 tgctcggcgg ggctggcggg cgtcatcaac cgcatgcgcg agagccgcag cgaggacgta 1560 atgcgcatca ctgtgggcgt ggatggctcc gtgtacaagc tgcaccccag cttcaaggag 1620 cggttccatg ccagcgtgcg caggctgacg cccagctgcg agatcacctt catcgagtcg 1680 gaggagggca gtggccgggg cgcggccctg gtctcggcgg tggcctgtaa gaaggcctgt 1740 atgctgggcc agtgaacgca gctgctagct aatcgatacc gtcgacctcg aggaattcac 1800 gcgtggtacc tctagagtcg acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc 1860 gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 1920 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 1980 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga 2040 tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga 2100 ctagagcaga agcttttg 2118 <210> 20 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 2 <400> 20 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacca 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgaggaca aggggagcct 1320 ttgagaccag gtttgtgtcc caggtggaga gtgacacagg agacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgagaccct ccaccacaga ctgtgacatt gtgaggaggg 1440 cttgtgagag tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggggtca 1500 tcaacaggat gagggagagc aggagtgagg atgtaatgag gatcactgtg ggagtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgaggaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc aggggagcag 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 21 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-3 <400> 21 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgagg gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacaa 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 gaatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320 ttgagaccag atttgtgtcc caggtggagt ctgacacagg agacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgaggccct ccaccacaga ctgtgacatt gtgagaagag 1440 cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggggtca 1500 tcaacagaat gagggagagc aggtctgagg atgtaatgag aatcactgtg ggagtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagagatt ccatgcctct gtgagaaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggagctg 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 22 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-4 <400> 22 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgagg gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 gaatgtgtgt caatactgag tggggtgcct ttggggactc aggggagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320 ttgagaccag atttgtgtcc caggtggagt ctgacactgg tgacaggaag cagatctaca 1380 acatcctgag cacactgggg ctgaggccct ccaccacaga ctgtgacatt gtgagaagag 1440 cttgtgagag tgtgtctacc agggctgctc acatgtgcag tgctgggctg gctggggtca 1500 tcaacagaat gagggagagc aggtctgagg atgtaatgag aatcactgtg ggtgtggatg 1560 gcagtgtgta caagctgcac ccctcattca aggagagatt ccatgccagt gtgagaaggc 1620 tgacccccag ctgtgagatc accttcattg agtctgagga gggcagtggc aggggtgcag 1680 ccctggtcag tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 23 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-5 <400> 23 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacatag ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatggggg agctggtgag gcttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca aggggagcct 1320 ttgagaccag gtttgtgtcc caggtggagt ctgacactgg ggacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgaggccct ccaccactga ctgtgacata gtgaggagag 1440 cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gcaggggtca 1500 tcaacaggat gagggagagc agatctgagg atgtaatgag gatcactgtg ggtgtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgcctct gtgaggaggc 1620 tgacccccag ctgtgagatc acctttatag agtctgagga gggcagtggc agaggggcag 1680 ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 24 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-6 <400> 24 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatggggg agctggtgag gcttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctcagagca gctgagaaca aggggagcct 1320 ttgagaccag gtttgtgtcc caggtggaga gtgacacagg tgacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgagaccct ccaccacaga ctgtgacatt gtgaggaggg 1440 cctgtgagag tgtgtctacc agggctgccc acatgtgctc tgctgggctg gcaggagtca 1500 tcaacaggat gagggagagc aggagtgagg atgtaatgag gatcactgtg ggagtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgagaaggc 1620 tgacccccag ctgtgagatc acctttatag agtctgagga gggcagtggc aggggagcag 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 25 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-7 <400> 25 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacaa 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgatagtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 gaatgtgtgt caatacagag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgaggaca agaggagcct 1320 ttgagaccag atttgtgtca caggtggagt ctgacactgg agacagaaag cagatctaca 1380 acatcctgag cacactgggg ctgaggccct ccaccactga ctgtgacata gtgaggagag 1440 cttgtgagag tgtgtctacc agagctgccc acatgtgctc tgctgggctg gctggggtca 1500 tcaacaggat gagagagagc aggagtgagg atgtaatgag aatcactgtg ggggtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgcctct gtgaggaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtgga aggggagcag 1680 ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 26 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-8 <400> 26 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaagg atgcagaagg agatggacag gggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag gtccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaaggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatactgag tggggagcct ttggggactc tggggagctg gatgagttcc 1140 tgctggagta tgacaggctg gtggatgaga gctcagcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctcagagca gctgaggaca aggggagcct 1320 ttgagaccag gtttgtgtcc caggtggaga gtgacactgg agacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgaggccct ctaccacaga ctgtgacata gtgagaaggg 1440 cctgtgagtc tgtgtctacc agggctgccc acatgtgctc tgctgggctg gctggagtca 1500 tcaacagaat gagggagagc agaagtgagg atgtaatgag gatcactgtg ggagtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagaggtt ccatgccagt gtgaggaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc aggggagctg 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 27 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-9 <400> 27 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080 gcatgtgtgt caatactgag tggggcgcct ttggggactc tggagagctg gatgagttcc 1140 tgctggagta tgaccgcctg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggttgg 1260 tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgcgcaca cgcggagcct 1320 ttgagacgcg ctttgtgtca caagtggagt ctgacacagg agaccgcaag cagatctaca 1380 acatcctgag cacactgggg ctgcggccct ccaccactga ctgtgacatt gtgcgccgcg 1440 cctgtgagag tgtgtctacg cgcgctgcgc acatgtgctc agcggggctg gcgggagtca 1500 tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggagtggatg 1560 gcagtgtgta caagctgcac cccagcttca aggagcggtt ccatgcctca gtgcgcaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680 ccctggtcag cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 28 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-10 <400> 28 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgcgg gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080 gcatgtgtgt caatacagag tggggcgcct ttggggacag cggagagctg gatgagttcc 1140 tgctggagta tgaccgcctg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgcgcaca cgcggagcct 1320 ttgagacgcg ctttgtgagc caggtggaga gtgacacagg agaccgcaag cagatctaca 1380 acatcctgag caccctgggg ctgcggccca gcaccactga ctgtgacatt gtgcgccgcg 1440 cctgtgagtc agtgtctacg cgcgctgcgc acatgtgcag cgcggggctg gcgggagtca 1500 tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggagtggatg 1560 gcagtgtgta caagctgcac cccagcttca aggagcggtt ccatgcctca gtgcgcaggc 1620 tgacccccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680 ccctggtcag cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 29 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-11 <400> 29 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tcccggagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgatagtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080 gcatgtgtgt caatactgag tggggcgcct ttggggacag tggagagctg gatgagttcc 1140 tgctggagta tgaccgcctg gtggatgaga gctctgcaaa cccaggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgcg gcttgtgctg ctcaggctag 1260 tggatgaaaa cctgctcttc catggggagg cctcagagca gctgcgcaca cgcggagcct 1320 ttgagacgcg ctttgtgtct caagtggaga gtgacacagg tgaccgcaag cagatctaca 1380 acatcctgag cactctgggg ctgcggccct caaccacaga ctgtgacatt gtgcgccgcg 1440 cctgtgagtc tgtgtctacg cgcgctgcgc acatgtgcag tgcggggctg gcgggagtca 1500 tcaaccgcat gcgcgagagc cgctcagagg atgtaatgcg catcactgtg ggtgtggatg 1560 gctctgtgta caagctgcac cccagcttca aggagcggtt ccatgccagt gtgcgcaggc 1620 tgactcccag ctgtgagatc acctttatag agtcagagga gggcagtggc agaggcgcgg 1680 ccctggtctc cgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 30 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-12 <400> 30 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgcg ctccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggcc 1080 gcatgtgtgt caatactgag tggggcgcct ttggggactc tggtgagctg gatgagttcc 1140 tgctggagta tgaccgcctg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggtg agctggtgcg gcttgtgctg ctcaggttag 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgcgcaca cgcggagcct 1320 ttgagacgcg ctttgtgtct caagtggagt ctgacactgg tgaccgcaag cagatctaca 1380 acatcctgag cactctgggg ctgagaccct ctaccactga ctgtgacatt gtgcgccgcg 1440 cctgtgagtc tgtgtctacg cgcgctgcgc acatgtgctc tgcggggctg gcgggtgtca 1500 tcaaccgcat gcgcgagagc cgctctgagg atgtaatgcg catcactgtg ggtgtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagcggtt ccatgcctct gtgcgcaggc 1620 tgactcccag ctgtgagatc acctttattg agtctgagga gggcagtggc agaggcgcgg 1680 ccctggtctc tgcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 31 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-13 <400> 31 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatactgag tggggagcct ttggggactc tggagagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag gcttgtgctg ctcaggttgg 1260 tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgagaaca aggggagcct 1320 ttgagacaag atttgtgtca caggtggagt ctgacacagg agacaggaag cagatctaca 1380 acatcctgag caccctgggg ctgagaccct ccaccactga ctgtgacatt gtgaggagag 1440 cctgtgagag tgtgtctacc agggctgctc acatgtgctc agcagggctg gctggagtca 1500 tcaacagaat gagggagagc agatctgagg atgtaatgag gatcactgtg ggtgtggatg 1560 gcagtgtgta caagctgcac cccagcttca aggagagatt ccatgcctca gtgaggaggc 1620 tgacccccag ctgtgagatc accttcattg agtctgagga gggcagtggc agaggagcag 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 32 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-14 <400> 32 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540 aagtggggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtggtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacca 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtggg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 gaatgtgtgt caatacagag tggggagcct ttggggactc tggagagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctcagcaaa cccaggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggag agctggtgag acttgtgctg ctcaggctgg 1260 tggatgaaaa cctgctcttc catggggagg ccagtgagca gctgagaaca agaggagcct 1320 ttgagaccag atttgtgagc caggtggagt cagacacagg agacagaaag cagatctaca 1380 acatcctgag caccctgggg ctgagaccca gcaccactga ctgtgacatt gtgagaagag 1440 cctgtgagtc tgtgtctacc agagctgccc acatgtgcag tgctgggctg gctggagtca 1500 tcaacagaat gagagagagc agatcagagg atgtaatgag aatcactgtg ggtgtggatg 1560 gctctgtgta caagctgcac cccagcttca aggagagatt ccatgccagt gtgagaaggc 1620 tgacccccag ctgtgagatc acctttattg agtcagagga gggcagtggc agaggagcag 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 33 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-15 <400> 33 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gtgtgaagac caaacaccag atgtactcca 660 tcccagagga tgccatgaca ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctcagactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacaca gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggtagg catgatagtg ggcacaggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 ggatgtgtgt caatactgag tggggagcct ttggggacag tggagagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggtg agctggtgag gcttgtgctg ctcaggctag 1260 tggatgaaaa cctgctcttc catggggagg cctcagagca gctgagaaca aggggagcct 1320 ttgagacaag atttgtgtct caggtggaga gtgacactgg agacaggaag cagatctaca 1380 acatcctgag cacactgggg ctgagaccct caaccactga ctgtgacatt gtgaggagag 1440 cctgtgagtc tgtgtctaca agggctgcac acatgtgcag tgctgggctg gcaggtgtca 1500 tcaacagaat gagggagagc agatcagagg atgtaatgag gatcactgtg ggagtggatg 1560 gctctgtgta caagctgcac cccagcttca aggagagatt ccatgccagt gtgaggaggc 1620 tgacccccag ctgtgagatc acctttatag agtcagagga gggcagtggc agaggtgctg 1680 ccctggtctc tgcagtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 34 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-16 <400> 34 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggctatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagaaga atgcagaagg agatggacag aggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctatgtgag atccacccca gaaggctcag 540 aagttgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtggt ctgtgaagac caaacaccag atgtactcca 660 tccctgagga tgccatgact ggcactgctg agatgctctt tgactacatc tctgagtgca 720 tctctgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcatttcc tgtgaggcat gaagacattg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgttgtggg gcttctgaga gatgctatca 900 aaagaagagg ggactttgaa atggatgtgg tggcaatggt gaatgacact gtggccacta 960 tgatctcctg ctactatgaa gaccatcagt gtgaggttgg catgattgtg ggcactggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gatgagggca 1080 gaatgtgtgt caatactgag tggggtgcct ttggggactc tggtgagctg gatgagttcc 1140 tgctggagta tgacagactg gtggatgaga gctctgcaaa ccctggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggtg agctggtgag acttgtgctg ctcaggttag 1260 tggatgaaaa cctgctcttc catggggagg cctctgagca gctgagaaca agaggagcct 1320 ttgagactag atttgtgtct caggtggagt ctgacactgg tgacagaaag cagatctaca 1380 acatcctgag cactctgggg ctgagaccct ctaccactga ctgtgacatt gtgagaagag 1440 cctgtgagtc tgtgtctact agagctgctc acatgtgctc tgctgggctg gctggtgtca 1500 tcaacagaat gagagagagc agatctgagg atgtaatgag aatcactgtg ggtgtggatg 1560 gctctgtgta caagctgcac ccctcattca aggagagatt ccatgcctct gtgagaaggc 1620 tgactcccag ctgtgagatc accttcattg agtctgagga gggcagtggc agaggtgctg 1680 ccctggtctc tgctgtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 35 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-17 <400> 35 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga cgtgacccgg agccaggctc 360 aaacagcact gactctcgtc gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420 tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttacga ctggaaacgc 480 acgaggaggc ctccgtgaaa atgctaccca cctacgtgcg ttctacacct gaaggatcag 540 aggtggggga ttttctcagt ctggacttgg gtggcactaa cttccgggtc atgctggtga 600 aggttggaga aggggaggaa ggccagtggt cggtgaaaac caagcatcag atgtatagca 660 ttccagagga tgctatgaca ggcaccgccg agatgctttt tgactacata tccgaatgca 720 tctctgattt cctcgacaag caccaaatga aacataagaa actgccgctg ggatttactt 780 tctcatttcc cgtgagacac gaggatattg acaaggggat cctcttgaat tggacgaaag 840 gcttcaaggc aagtggcgcc gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900 agcgccgggg tgactttgag atggacgttg tggcaatggt caacgataca gtggccacaa 960 tgatcagctg ttattacgag gaccatcagt gcgaagtcgg catgatagtg ggaactgggt 1020 gtaatgcgtg ctatatggag gaaatgcaga acgttgagtt agtggaaggc gatgagggta 1080 gaatgtgtgt aaataccgag tggggagctt tcggggactc cggcgaactg gatgagttcc 1140 tactcgaata cgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200 aaaaactgat cggagggaag tacatgggtg agcttgtccg cctcgttctg ctgcgattag 1260 tggacgagaa tctcctgttt cacggcgaag catccgagca gttgcgtaca cggggagcct 1320 tcgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380 acatccttag cacactgggc ctacgcccat ctacgaccga ttgcgacatt gtgcggcgag 1440 cttgtgagtc cgtttcgact agagccgcac acatgtgctc agctggtctc gccggagtaa 1500 tcaataggat gcgcgaaagc cggagtgagg acgtgatgag aataacagtc ggcgtggatg 1560 ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgagc gtgcgccgtc 1620 tgaccccttc atgtgagatt actttcatcg aatccgagga gggcagtgga cggggggcag 1680 ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 36 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-18 <400> 36 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360 aaacagcact gactctggta gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420 tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttaagg ctggaaaccc 480 atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540 aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagggtc atgctggtga 600 aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660 ttccagagga tgctatgaca ggtaccgctg agatgctttt tgactacata tctgaatgca 720 tctctgattt cctagacaag caccaaatga aacataagaa actgccgctg ggatttactt 780 tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggacaaaag 840 gcttcaaggc aagtggcgca gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900 agcgcagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960 tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020 gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaaggt gatgagggta 1080 gaatgtgtgt aaatacagag tggggagctt ttggggacag cggagaactg gatgagttcc 1140 tattagaata tgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200 aaaaactgat tggagggaag tacatgggtg agcttgtccg ccttgttctg ctgcggttag 1260 tggatgagaa tctcctgttt catggggaag caagtgagca gttgcggaca aggggagcct 1320 ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380 acatccttag cacactgggc ctaagaccat ctaccactga ttgtgacatt gtgcggcggg 1440 cttgtgagtc agtttccact agagccgcac acatgtgctc agctggtttg gctggagtaa 1500 tcaataggat gcgcgaaagc aggagtgagg atgtgatgag aataacagtt ggtgtggatg 1560 ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgtct gtgcgcagac 1620 tgaccccttc atgtgagatt actttcatag aatctgagga gggcagtgga aggggggcag 1680 ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 37 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-19 <400> 37 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360 aaacagcact gactctggtg gagcagatct tggcggaatt ccagcttcaa gaggaagatc 420 tgaagaaagt tatgagaagg atgcagaagg agatggaccg cggcttaagg ctggaaaccc 480 atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540 aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagggtc atgctggtga 600 aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660 ttccagagga tgctatgaca ggtaccgctg agatgctttt tgactacata tctgaatgca 720 tctctgattt cctggacaag caccaaatga aacataagaa actgccgctg ggatttactt 780 tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840 gcttcaaggc aagtggcgca gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900 agcgcagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960 tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020 gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaaggt gatgagggta 1080 gaatgtgtgt aaatacagag tggggagctt ttggggacag cggagaactg gatgagttcc 1140 tactggaata tgacaggctg gtggatgagt ctagcgccaa ccctggccag caattgtatg 1200 aaaaactgat tggagggaag tacatgggtg agcttgtccg cctggttctg ctgcggttag 1260 tggatgagaa tctcctgttt catggggaag caagtgagca gttgcggaca aggggagcct 1320 ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380 acatccttag cacactgggc ctaagaccat ctaccacaga ttgtgacatt gtgcggcggg 1440 cttgtgagtc agttagcact agagccgcac acatgtgctc agctggtctg gctggagtaa 1500 tcaataggat gcgcgaaagc aggagtgagg atgtgatgag aataacagtg ggtgtggatg 1560 ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcacgcgtct gtgcgcagac 1620 tgaccccttc atgtgagatt actttcatag aatctgagga gggcagtgga aggggggcag 1680 ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 38 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-20 <400> 38 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360 aaacagcact gactctggta gagcagatct tggctgaatt ccagcttcaa gaggaagatc 420 tgaagaaagt tatgagaagg atgcagaagg agatggacag gggcttaaga ctggaaaccc 480 atgaggaggc cagtgtgaaa atgctaccca cctatgtaag gtctacacct gaaggatcag 540 aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagagtc atgctggtga 600 aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660 ttccagagga tgctatgaca ggcacagcag agatgctttt tgactacata tctgaatgca 720 tctctgattt cctagacaag caccaaatga aacataagaa actgccactg ggatttactt 780 tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840 gcttcaaggc aagtggtgct gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900 agaggagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960 tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020 gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaagga gatgagggta 1080 gaatgtgtgt aaatacagag tggggagctt ttggggacag tggggaactg gatgagttcc 1140 tattagaata tgacaggctg gtggatgagt cttcagccaa ccctggccag caattgtatg 1200 aaaaactgat tggagggaag tacatgggtg agcttgtcag gcttgttctg ctgagattag 1260 tggatgagaa tctcctgttt catggtgaag catctgagca gttgaggaca agaggagcct 1320 ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380 acatccttag cacactgggc ctaaggccat ctaccactga ttgtgacatt gtgagaaggg 1440 cttgtgagag tgtttccact agagcagcac acatgtgctc agctggtttg gctggagtaa 1500 tcaataggat gagagaaagc aggagtgagg atgtgatgag aataacagtt ggagtggatg 1560 ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcatgcctct gtgagaaggc 1620 tgaccccttc atgtgagatt actttcatag aatcagagga gggcagtgga agaggggcag 1680 ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 39 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck-21 <400> 39 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccatgga tgtgaccaga agccaggctc 360 aaacagcact gactctggtg gagcagatct tggctgaatt ccagcttcaa gaggaagatc 420 tgaagaaagt tatgagaagg atgcagaagg agatggacag aggcttaaga ctggaaaccc 480 atgaggaggc cagtgtgaaa atgctaccca cctatgtaag atctacacct gaaggatcag 540 aggtggggga ttttctcagt ctggacttgg gtggcactaa cttcagagtc atgctggtga 600 aggttggaga aggggaggaa ggccagtggt cagtgaaaac caagcatcag atgtatagca 660 ttccagagga tgctatgaca ggcacagcag agatgctttt tgactacata tctgaatgca 720 tctctgattt cctggacaag caccaaatga aacataagaa actgcccctg ggatttactt 780 tctcatttcc tgtgagacat gaggatattg acaaggggat cctcttgaat tggaccaaag 840 gcttcaaggc aagtggtgct gaaggaaaca atgtagtggg gcttctgagg gatgctatta 900 agagaagagg tgactttgag atggatgttg tggcaatggt caatgataca gtggccacaa 960 tgatcagctg ttattatgag gaccatcagt gtgaagtggg catgatagtg ggaactgggt 1020 gtaatgcctg ctatatggag gaaatgcaga atgttgagtt agtggaagga gatgagggta 1080 gaatgtgtgt aaatacagag tggggagctt ttggggacag tggggaactg gatgagttcc 1140 tactggaata tgacaggctg gtggatgagt cttcagccaa ccctggccag caattgtatg 1200 aaaaactgat tggagggaag tacatgggtg agcttgtcag actggttctg ctgagattag 1260 tggatgagaa tctcctgttt catggtgaag catctgagca gttgagaaca agaggagcct 1320 ttgaaaccag atttgtctca caagtggaga gtgatactgg ggacaggaaa cagatttaca 1380 acatccttag cacactgggc ctaagaccat ctaccactga ttgtgacatt gtgagaagag 1440 cttgtgagag tgttagcact agagcagcac acatgtgctc agctggtctg gctggagtaa 1500 tcaataggat gagagaaagc agaagtgagg atgtgatgag aataacagtg ggagtggatg 1560 ggtctgtcta taagctgcat ccctccttca aggaaaggtt tcatgcctct gtgagaagac 1620 tgaccccttc atgtgagatt actttcatag aatcagagga gggcagtgga agaggggcag 1680 ccttggtttc tgctgtggcc tgcaaaaagg catgcatgct tggccaatga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 40 <400> 40 000 <210> 41 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> wild type insulin aa <400> 41 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15 Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly 20 25 30 Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45 Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly 50 55 60 Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu 65 70 75 80 Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys 85 90 95 Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 42 <211> 329 <212> DNA <213> Artificial Sequence <220> <223> 5' UTR <400> 42 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacc 329 <210> 43 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 43 atggccctgt ggatgagact cctgcccctg ctggcactgc tggccctctg gggacctgac 60 ccagcagcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtccagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 44 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 44 atggccctgt ggatgaggct cctgcccctg ctggccctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagggg cttcttctac acacccagga ccaagagaga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggagcaggca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 45 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 45 atggccctgt ggatgaggct cctgcccctg ctggctctgc tggccctctg gggacctgac 60 ccagcagcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagggg cttcttctac acacccagga ccaagagaga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggagcaggca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 46 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 46 atggccctgt ggatgagact gctccccctc ctggctttgc tggccctgtg gggaccagat 60 cctgcagctg cctttgtgaa tcagcacctg tgtggctcag atctggttga ggcactctac 120 ctggtgtgtg gggagagagg cttcttttac acaccaagga ccaagaggga ggcagaggat 180 ctgcaggtag gtcaggtgga gctgggaggt ggccctggag caggatccct gcagcccttg 240 gcactggagg gctccagaca gaagaggggc attgtggaac agtgttgcac tagcatctgc 300 agcctgtacc agctggagaa ctactgcaac taa 333 <210> 47 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 47 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120 ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtcgcgaca gaagcggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 48 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 48 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120 ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtcgcgaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 49 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 49 atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtctagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 50 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 50 atggccctgt ggatgagact cctgcccctg ctggccctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagagaga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggagcagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 51 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 51 atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggagtagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 52 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 52 atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcag atctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagagaga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggtggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtctagaca gaagagaggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 53 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 53 atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcggccg ctttcgtgaa ccagcacctc tgcggaagcg atctggtcga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccgagga caaagcgcga ggcagaagac 180 cttcaagtgg gccaggtaga gctcggaggg ggccccggtg ccggatccct gcagcctctg 240 gctctcgaag ggtctcgaca aaaacgtggc atcgtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 54 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 54 atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcggccg cttttgtgaa ccagcacctc tgcggatctg atctggttga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccaagga caaagcgcga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240 gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 55 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 55 atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcggccg cttttgtgaa ccagcacctc tgcggatctg atctggtgga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat acccccagga caaagcgcga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240 gctctggaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 56 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 56 atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcagctg cttttgtgaa ccagcacctc tgtggatctg atctggttga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccaagga caaagaggga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggccctggtg caggatccct gcagcctctg 240 gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 57 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> ORF insulin <400> 57 atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcagctg cttttgtgaa ccagcacctc tgtggatctg atctggtgga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat acccccagga caaagagaga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggcccaggtg caggatccct gcagcctctg 240 gctctggaag ggtctagaca aaaaagaggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 58 <400> 58 000 <210> 59 <400> 59 000 <210> 60 <211> 295 <212> DNA <213> Artificial Sequence <220> <223> 3' UTR <400> 60 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 295 <210> 61 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 61 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccacc atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatacaga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgaggac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020 agtgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080 tccaccacag actgtgacat tgtgaggagg gcttgtgaga gtgtgtctac cagggctgcc 1140 cacatgtgct ctgctgggct ggctggggtc atcaacagga tgagggagag caggagtgag 1200 gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagaggt tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg caggggagca gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 62 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 62 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag ggatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccaca atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgagaac aagaggagcc tttgagacca gatttgtgtc ccaggtggag 1020 tctgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080 tccaccacag actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac cagggctgcc 1140 cacatgtgct ctgctgggct ggctggggtc atcaacagaa tgagggagag caggtctgag 1200 gatgtaatga gaatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagagat tccatgcctc tgtgagaagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg cagaggagct gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 63 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 63 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag ggatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggtag gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatactga gtggggtgcc 780 tttggggact caggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgagaac aagaggagcc tttgagacca gatttgtgtc ccaggtggag 1020 tctgacactg gtgacaggaa gcagatctac aacatcctga gcacactggg gctgaggccc 1080 tccaccacag actgtgacat tgtgagaaga gcttgtgaga gtgtgtctac cagggctgct 1140 cacatgtgca gtgctgggct ggctggggtc atcaacagaa tgagggagag caggtctgag 1200 gatgtaatga gaatcactgt gggtgtggat ggcagtgtgt acaagctgca cccctcattc 1260 aaggagagat tccatgccag tgtgagaagg ctgaccccca gctgtgagat caccttcatt 1320 gagtctgagg agggcagtgg caggggtgca gccctggtca gtgcagtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 64 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 64 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacata 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgatagt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggg 900 gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgagaac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020 tctgacactg gggacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080 tccaccactg actgtgacat agtgaggaga gcctgtgagt ctgtgtctac cagggctgcc 1140 cacatgtgct ctgctgggct ggcaggggtc atcaacagga tgagggagag cagatctgag 1200 gatgtaatga ggatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagaggt tccatgcctc tgtgaggagg ctgaccccca gctgtgagat cacctttata 1320 gagtctgagg agggcagtgg cagaggggca gccctggtct ctgcagtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 65 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 65 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggg 900 gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctcagagc agctgagaac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020 agtgacacag gtgacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080 tccaccacag actgtgacat tgtgaggagg gcctgtgaga gtgtgtctac cagggctgcc 1140 cacatgtgct ctgctgggct ggcaggagtc atcaacagga tgagggagag caggagtgag 1200 gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagaggt tccatgccag tgtgagaagg ctgaccccca gctgtgagat cacctttata 1320 gagtctgagg agggcagtgg caggggagca gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 66 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 66 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccaca atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgaggac aagaggagcc tttgagacca gatttgtgtc acaggtggag 1020 tctgacactg gagacagaaa gcagatctac aacatcctga gcacactggg gctgaggccc 1080 tccaccactg actgtgacat agtgaggaga gcttgtgaga gtgtgtctac cagagctgcc 1140 cacatgtgct ctgctgggct ggctggggtc atcaacagga tgagagagag caggagtgag 1200 gatgtaatga gaatcactgt gggggtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagaggt tccatgcctc tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg aaggggagca gccctggtct ctgcagtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 67 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 67 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag gatgcagaag 120 gagatggaca ggggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga ggtccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaaggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780 tttggggact ctggggagct ggatgagttc ctgctggagt atgacaggct ggtggatgag 840 agctcagcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctcagagc agctgaggac aaggggagcc tttgagacca ggtttgtgtc ccaggtggag 1020 agtgacactg gagacaggaa gcagatctac aacatcctga gcaccctggg gctgaggccc 1080 tctaccacag actgtgacat agtgagaagg gcctgtgagt ctgtgtctac cagggctgcc 1140 cacatgtgct ctgctgggct ggctggagtc atcaacagaa tgagggagag cagaagtgag 1200 gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagaggt tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg caggggagct gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 68 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 68 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggttg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780 tttggggact ctggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840 agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtgc ggcttgtgct gctcaggttg gtggatgaaa acctgctctt ccatggggag 960 gccagtgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc acaagtggag 1020 tctgacacag gagaccgcaa gcagatctac aacatcctga gcacactggg gctgcggccc 1080 tccaccactg actgtgacat tgtgcgccgc gcctgtgaga gtgtgtctac gcgcgctgcg 1140 cacatgtgct cagcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctctgag 1200 gatgtaatgc gcatcactgt gggagtggat ggcagtgtgt acaagctgca ccccagcttc 1260 aaggagcggt tccatgcctc agtgcgcagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg cagaggcgcg gccctggtca gcgcggtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 69 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 69 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtgc gctccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgcg ggatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatacaga gtggggcgcc 780 tttggggaca gcggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840 agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtgc ggcttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgag ccaggtggag 1020 agtgacacag gagaccgcaa gcagatctac aacatcctga gcaccctggg gctgcggccc 1080 agcaccactg actgtgacat tgtgcgccgc gcctgtgagt cagtgtctac gcgcgctgcg 1140 cacatgtgca gcgcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctctgag 1200 gatgtaatgc gcatcactgt gggagtggat ggcagtgtgt acaagctgca ccccagcttc 1260 aaggagcggt tccatgcctc agtgcgcagg ctgaccccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg cagaggcgcg gccctggtca gcgcggtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 70 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 70 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atcccggagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggtag gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780 tttggggaca gtggagagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840 agctctgcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtgc ggcttgtgct gctcaggcta gtggatgaaa acctgctctt ccatggggag 960 gcctcagagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc tcaagtggag 1020 agtgacacag gtgaccgcaa gcagatctac aacatcctga gcactctggg gctgcggccc 1080 tcaaccacag actgtgacat tgtgcgccgc gcctgtgagt ctgtgtctac gcgcgctgcg 1140 cacatgtgca gtgcggggct ggcgggagtc atcaaccgca tgcgcgagag ccgctcagag 1200 gatgtaatgc gcatcactgt gggtgtggat ggctctgtgt acaagctgca ccccagcttc 1260 aaggagcggt tccatgccag tgtgcgcagg ctgactccca gctgtgagat cacctttata 1320 gagtcagagg agggcagtgg cagaggcgcg gccctggtct ccgcggtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 71 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 71 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtgc gctccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggttg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc cgcatgtgtg tcaatactga gtggggcgcc 780 tttggggact ctggtgagct ggatgagttc ctgctggagt atgaccgcct ggtggatgag 840 agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900 gagctggtgc ggcttgtgct gctcaggtta gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgcgcac acgcggagcc tttgagacgc gctttgtgtc tcaagtggag 1020 tctgacactg gtgaccgcaa gcagatctac aacatcctga gcactctggg gctgagaccc 1080 tctaccactg actgtgacat tgtgcgccgc gcctgtgagt ctgtgtctac gcgcgctgcg 1140 cacatgtgct ctgcggggct ggcgggtgtc atcaaccgca tgcgcgagag ccgctctgag 1200 gatgtaatgc gcatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagcggt tccatgcctc tgtgcgcagg ctgactccca gctgtgagat cacctttatt 1320 gagtctgagg agggcagtgg cagaggcgcg gccctggtct ctgcggtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 72 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 72 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggttg gcatgattgt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780 tttggggact ctggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga ggcttgtgct gctcaggttg gtggatgaaa acctgctctt ccatggggag 960 gccagtgagc agctgagaac aaggggagcc tttgagacaa gatttgtgtc acaggtggag 1020 tctgacacag gagacaggaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080 tccaccactg actgtgacat tgtgaggaga gcctgtgaga gtgtgtctac cagggctgct 1140 cacatgtgct cagcagggct ggctggagtc atcaacagaa tgagggagag cagatctgag 1200 gatgtaatga ggatcactgt gggtgtggat ggcagtgtgt acaagctgca ccccagcttc 1260 aaggagagat tccatgcctc agtgaggagg ctgaccccca gctgtgagat caccttcatt 1320 gagtctgagg agggcagtgg cagaggagca gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 73 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 73 atggccatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga gatccacccc agaaggctca gaagtggggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtggtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccacc atgatctcct gctactatga agaccatcag 660 tgtgaggtgg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatacaga gtggggagcc 780 tttggggact ctggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctcagcaa acccaggtca gcagctgtat gagaagctca taggtggcaa gtacatggga 900 gagctggtga gacttgtgct gctcaggctg gtggatgaaa acctgctctt ccatggggag 960 gccagtgagc agctgagaac aagaggagcc tttgagacca gatttgtgag ccaggtggag 1020 tcagacacag gagacagaaa gcagatctac aacatcctga gcaccctggg gctgagaccc 1080 agcaccactg actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac cagagctgcc 1140 cacatgtgca gtgctgggct ggctggagtc atcaacagaa tgagagagag cagatcagag 1200 gatgtaatga gaatcactgt gggtgtggat ggctctgtgt acaagctgca ccccagcttc 1260 aaggagagat tccatgccag tgtgagaagg ctgaccccca gctgtgagat cacctttatt 1320 gagtcagagg agggcagtgg cagaggagca gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 74 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 74 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agtgtgaaga ccaaacacca gatgtactcc atcccagagg atgccatgac aggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctcagact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac agtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggtag gcatgatagt gggcacaggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc aggatgtgtg tcaatactga gtggggagcc 780 tttggggaca gtggagagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900 gagctggtga ggcttgtgct gctcaggcta gtggatgaaa acctgctctt ccatggggag 960 gcctcagagc agctgagaac aaggggagcc tttgagacaa gatttgtgtc tcaggtggag 1020 agtgacactg gagacaggaa gcagatctac aacatcctga gcacactggg gctgagaccc 1080 tcaaccactg actgtgacat tgtgaggaga gcctgtgagt ctgtgtctac aagggctgca 1140 cacatgtgca gtgctgggct ggcaggtgtc atcaacagaa tgagggagag cagatcagag 1200 gatgtaatga ggatcactgt gggagtggat ggctctgtgt acaagctgca ccccagcttc 1260 aaggagagat tccatgccag tgtgaggagg ctgaccccca gctgtgagat cacctttata 1320 gagtcagagg agggcagtgg cagaggtgct gccctggtct ctgcagtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 75 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 75 atggctatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagaag aatgcagaag 120 gagatggaca gaggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctatgtga gatccacccc agaaggctca gaagttgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 tctgtgaaga ccaaacacca gatgtactcc atccctgagg atgccatgac tggcactgct 360 gagatgctct ttgactacat ctctgagtgc atctctgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcatttc ctgtgaggca tgaagacatt 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgttgtgg ggcttctgag agatgctatc aaaagaagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac tgtggccact atgatctcct gctactatga agaccatcag 660 tgtgaggttg gcatgattgt gggcactggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggatgagggc agaatgtgtg tcaatactga gtggggtgcc 780 tttggggact ctggtgagct ggatgagttc ctgctggagt atgacagact ggtggatgag 840 agctctgcaa accctggtca gcagctgtat gagaagctca taggtggcaa gtacatgggt 900 gagctggtga gacttgtgct gctcaggtta gtggatgaaa acctgctctt ccatggggag 960 gcctctgagc agctgagaac aagaggagcc tttgagacta gatttgtgtc tcaggtggag 1020 tctgacactg gtgacagaaa gcagatctac aacatcctga gcactctggg gctgagaccc 1080 tctaccactg actgtgacat tgtgagaaga gcctgtgagt ctgtgtctac tagagctgct 1140 cacatgtgct ctgctgggct ggctggtgtc atcaacagaa tgagagagag cagatctgag 1200 gatgtaatga gaatcactgt gggtgtggat ggctctgtgt acaagctgca cccctcattc 1260 aaggagagat tccatgcctc tgtgagaagg ctgactccca gctgtgagat caccttcatt 1320 gagtctgagg agggcagtgg cagaggtgct gccctggtct ctgctgtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 76 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 76 atggccatgg acgtgacccg gagccaggct caaacagcac tgactctcgt cgagcagatc 60 ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120 gagatggacc gcggcttacg actggaaacg cacgaggagg cctccgtgaa aatgctaccc 180 acctacgtgc gttctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240 ggtggcacta acttccgggt catgctggtg aaggttggag aaggggagga aggccagtgg 300 tcggtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcaccgcc 360 gagatgcttt ttgactacat atccgaatgc atctctgatt tcctcgacaa gcaccaaatg 420 aaacataaga aactgccgct gggatttact ttctcatttc ccgtgagaca cgaggatatt 480 gacaagggga tcctcttgaa ttggacgaaa ggcttcaagg caagtggcgc cgaaggaaac 540 aatgtagtgg ggcttctgag ggatgctatt aagcgccggg gtgactttga gatggacgtt 600 gtggcaatgg tcaacgatac agtggccaca atgatcagct gttattacga ggaccatcag 660 tgcgaagtcg gcatgatagt gggaactggg tgtaatgcgt gctatatgga ggaaatgcag 720 aacgttgagt tagtggaagg cgatgagggt agaatgtgtg taaataccga gtggggagct 780 ttcggggact ccggcgaact ggatgagttc ctactcgaat acgacaggct ggtggatgag 840 tctagcgcca accctggcca gcaattgtat gaaaaactga tcggagggaa gtacatgggt 900 gagcttgtcc gcctcgttct gctgcgatta gtggacgaga atctcctgtt tcacggcgaa 960 gcatccgagc agttgcgtac acggggagcc ttcgaaacca gatttgtctc acaagtggag 1020 agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctacgccca 1080 tctacgaccg attgcgacat tgtgcggcga gcttgtgagt ccgtttcgac tagagccgca 1140 cacatgtgct cagctggtct cgccggagta atcaatagga tgcgcgaaag ccggagtgag 1200 gacgtgatga gaataacagt cggcgtggat gggtctgtct ataagctgca tccctccttc 1260 aaggaaaggt ttcacgcgag cgtgcgccgt ctgacccctt catgtgagat tactttcatc 1320 gaatccgagg agggcagtgg acggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380 gcatgcatgc ttggccaatg a 1401 <210> 77 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 77 atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt agagcagatc 60 ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120 gagatggacc gcggcttaag gctggaaacc catgaggagg ccagtgtgaa aatgctaccc 180 acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240 ggtggcacta acttcagggt catgctggtg aaggttggag aaggggagga aggccagtgg 300 tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggtaccgct 360 gagatgcttt ttgactacat atctgaatgc atctctgatt tcctagacaa gcaccaaatg 420 aaacataaga aactgccgct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480 gacaagggga tcctcttgaa ttggacaaaa ggcttcaagg caagtggcgc agaaggaaac 540 aatgtagtgg ggcttctgag ggatgctatt aagcgcagag gtgactttga gatggatgtt 600 gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660 tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720 aatgttgagt tagtggaagg tgatgagggt agaatgtgtg taaatacaga gtggggagct 780 tttggggaca gcggagaact ggatgagttc ctattagaat atgacaggct ggtggatgag 840 tctagcgcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900 gagcttgtcc gccttgttct gctgcggtta gtggatgaga atctcctgtt tcatggggaa 960 gcaagtgagc agttgcggac aaggggagcc tttgaaacca gatttgtctc acaagtggag 1020 agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080 tctaccactg attgtgacat tgtgcggcgg gcttgtgagt cagtttccac tagagccgca 1140 cacatgtgct cagctggttt ggctggagta atcaatagga tgcgcgaaag caggagtgag 1200 gatgtgatga gaataacagt tggtgtggat gggtctgtct ataagctgca tccctccttc 1260 aaggaaaggt ttcacgcgtc tgtgcgcaga ctgacccctt catgtgagat tactttcata 1320 gaatctgagg agggcagtgg aaggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380 gcatgcatgc ttggccaatg a 1401 <210> 78 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 78 atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt ggagcagatc 60 ttggcggaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120 gagatggacc gcggcttaag gctggaaacc catgaggagg ccagtgtgaa aatgctaccc 180 acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240 ggtggcacta acttcagggt catgctggtg aaggttggag aaggggagga aggccagtgg 300 tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggtaccgct 360 gagatgcttt ttgactacat atctgaatgc atctctgatt tcctggacaa gcaccaaatg 420 aaacataaga aactgccgct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480 gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggcgc agaaggaaac 540 aatgtagtgg ggcttctgag ggatgctatt aagcgcagag gtgactttga gatggatgtt 600 gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660 tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720 aatgttgagt tagtggaagg tgatgagggt agaatgtgtg taaatacaga gtggggagct 780 tttggggaca gcggagaact ggatgagttc ctactggaat atgacaggct ggtggatgag 840 tctagcgcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900 gagcttgtcc gcctggttct gctgcggtta gtggatgaga atctcctgtt tcatggggaa 960 gcaagtgagc agttgcggac aaggggagcc tttgaaacca gatttgtctc acaagtggag 1020 agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080 tctaccacag attgtgacat tgtgcggcgg gcttgtgagt cagttagcac tagagccgca 1140 cacatgtgct cagctggtct ggctggagta atcaatagga tgcgcgaaag caggagtgag 1200 gatgtgatga gaataacagt gggtgtggat gggtctgtct ataagctgca tccctccttc 1260 aaggaaaggt ttcacgcgtc tgtgcgcaga ctgacccctt catgtgagat tactttcata 1320 gaatctgagg agggcagtgg aaggggggca gccttggttt ctgctgtggc ctgcaaaaag 1380 gcatgcatgc ttggccaatg a 1401 <210> 79 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 79 atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt agagcagatc 60 ttggctgaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120 gagatggaca ggggcttaag actggaaacc catgaggagg ccagtgtgaa aatgctaccc 180 acctatgtaa ggtctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240 ggtggcacta acttcagagt catgctggtg aaggttggag aaggggagga aggccagtgg 300 tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcacagca 360 gagatgcttt ttgactacat atctgaatgc atctctgatt tcctagacaa gcaccaaatg 420 aaacataaga aactgccact gggatttact ttctcatttc ctgtgagaca tgaggatatt 480 gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggtgc tgaaggaaac 540 aatgtagtgg ggcttctgag ggatgctatt aagaggagag gtgactttga gatggatgtt 600 gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660 tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720 aatgttgagt tagtggaagg agatgagggt agaatgtgtg taaatacaga gtggggagct 780 tttggggaca gtggggaact ggatgagttc ctattagaat atgacaggct ggtggatgag 840 tcttcagcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900 gagcttgtca ggcttgttct gctgagatta gtggatgaga atctcctgtt tcatggtgaa 960 gcatctgagc agttgaggac aagaggagcc tttgaaacca gatttgtctc acaagtggag 1020 agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaaggcca 1080 tctaccactg attgtgacat tgtgagaagg gcttgtgaga gtgtttccac tagagcagca 1140 cacatgtgct cagctggttt ggctggagta atcaatagga tgagagaaag caggagtgag 1200 gatgtgatga gaataacagt tggagtggat gggtctgtct ataagctgca tccctccttc 1260 aaggaaaggt ttcatgcctc tgtgagaagg ctgacccctt catgtgagat tactttcata 1320 gaatcagagg agggcagtgg aagaggggca gccttggttt ctgctgtggc ctgcaaaaag 1380 gcatgcatgc ttggccaatg a 1401 <210> 80 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> ORF Gck <400> 80 atggccatgg atgtgaccag aagccaggct caaacagcac tgactctggt ggagcagatc 60 ttggctgaat tccagcttca agaggaagat ctgaagaaag ttatgagaag gatgcagaag 120 gagatggaca gaggcttaag actggaaacc catgaggagg ccagtgtgaa aatgctaccc 180 acctatgtaa gatctacacc tgaaggatca gaggtggggg attttctcag tctggacttg 240 ggtggcacta acttcagagt catgctggtg aaggttggag aaggggagga aggccagtgg 300 tcagtgaaaa ccaagcatca gatgtatagc attccagagg atgctatgac aggcacagca 360 gagatgcttt ttgactacat atctgaatgc atctctgatt tcctggacaa gcaccaaatg 420 aaacataaga aactgcccct gggatttact ttctcatttc ctgtgagaca tgaggatatt 480 gacaagggga tcctcttgaa ttggaccaaa ggcttcaagg caagtggtgc tgaaggaaac 540 aatgtagtgg ggcttctgag ggatgctatt aagagaagag gtgactttga gatggatgtt 600 gtggcaatgg tcaatgatac agtggccaca atgatcagct gttattatga ggaccatcag 660 tgtgaagtgg gcatgatagt gggaactggg tgtaatgcct gctatatgga ggaaatgcag 720 aatgttgagt tagtggaagg agatgagggt agaatgtgtg taaatacaga gtggggagct 780 tttggggaca gtggggaact ggatgagttc ctactggaat atgacaggct ggtggatgag 840 tcttcagcca accctggcca gcaattgtat gaaaaactga ttggagggaa gtacatgggt 900 gagcttgtca gactggttct gctgagatta gtggatgaga atctcctgtt tcatggtgaa 960 gcatctgagc agttgagaac aagaggagcc tttgaaacca gatttgtctc acaagtggag 1020 agtgatactg gggacaggaa acagatttac aacatcctta gcacactggg cctaagacca 1080 tctaccactg attgtgacat tgtgagaaga gcttgtgaga gtgttagcac tagagcagca 1140 cacatgtgct cagctggtct ggctggagta atcaatagga tgagagaaag cagaagtgag 1200 gatgtgatga gaataacagt gggagtggat gggtctgtct ataagctgca tccctccttc 1260 aaggaaaggt ttcatgcctc tgtgagaaga ctgacccctt catgtgagat tactttcata 1320 gaatcagagg agggcagtgg aagaggggca gccttggttt ctgctgtggc ctgcaaaaag 1380 gcatgcatgc ttggccaatg a 1401 <210> 81 <400> 81 000 <210> 82 <211> 465 <212> PRT <213> Artificial Sequence <220> <223> wild type gck <400> 82 Met Leu Asp Asp Arg Ala Arg Met Glu Ala Ala Lys Lys Glu Lys Val 1 5 10 15 Glu Gln Ile Leu Ala Glu Phe Gln Leu Gln Glu Glu Asp Leu Lys Lys 20 25 30 Val Met Arg Arg Met Gln Lys Glu Met Asp Arg Gly Leu Arg Leu Glu 35 40 45 Thr His Glu Glu Ala Ser Val Lys Met Leu Pro Thr Tyr Val Arg Ser 50 55 60 Thr Pro Glu Gly Ser Glu Val Gly Asp Phe Leu Ser Leu Asp Leu Gly 65 70 75 80 Gly Thr Asn Phe Arg Val Met Leu Val Lys Val Gly Glu Gly Glu Glu 85 90 95 Gly Gln Trp Ser Val Lys Thr Lys His Gln Met Tyr Ser Ile Pro Glu 100 105 110 Asp Ala Met Thr Gly Thr Ala Glu Met Leu Phe Asp Tyr Ile Ser Glu 115 120 125 Cys Ile Ser Asp Phe Leu Asp Lys His Gln Met Lys His Lys Lys Leu 130 135 140 Pro Leu Gly Phe Thr Phe Ser Phe Pro Val Arg His Glu Asp Ile Asp 145 150 155 160 Lys Gly Ile Leu Leu Asn Trp Thr Lys Gly Phe Lys Ala Ser Gly Ala 165 170 175 Glu Gly Asn Asn Val Val Gly Leu Leu Arg Asp Ala Ile Lys Arg Arg 180 185 190 Gly Asp Phe Glu Met Asp Val Val Ala Met Val Asn Asp Thr Val Ala 195 200 205 Thr Met Ile Ser Cys Tyr Tyr Glu Asp His Gln Cys Glu Val Gly Met 210 215 220 Ile Val Gly Thr Gly Cys Asn Ala Cys Tyr Met Glu Glu Met Gln Asn 225 230 235 240 Val Glu Leu Val Glu Gly Asp Glu Gly Arg Met Cys Val Asn Thr Glu 245 250 255 Trp Gly Ala Phe Gly Asp Ser Gly Glu Leu Asp Glu Phe Leu Leu Glu 260 265 270 Tyr Asp Arg Leu Val Asp Glu Ser Ser Ala Asn Pro Gly Gln Gln Leu 275 280 285 Tyr Glu Lys Leu Ile Gly Gly Lys Tyr Met Gly Glu Leu Val Arg Leu 290 295 300 Val Leu Leu Arg Leu Val Asp Glu Asn Leu Leu Phe His Gly Glu Ala 305 310 315 320 Ser Glu Gln Leu Arg Thr Arg Gly Ala Phe Glu Thr Arg Phe Val Ser 325 330 335 Gln Val Glu Ser Asp Thr Gly Asp Arg Lys Gln Ile Tyr Asn Ile Leu 340 345 350 Ser Thr Leu Gly Leu Arg Pro Ser Thr Thr Asp Cys Asp Ile Val Arg 355 360 365 Arg Ala Cys Glu Ser Val Ser Thr Arg Ala Ala His Met Cys Ser Ala 370 375 380 Gly Leu Ala Gly Val Ile Asn Arg Met Arg Glu Ser Arg Ser Glu Asp 385 390 395 400 Val Met Arg Ile Thr Val Gly Val Asp Gly Ser Val Tyr Lys Leu His 405 410 415 Pro Ser Phe Lys Glu Arg Phe His Ala Ser Val Arg Arg Leu Thr Pro 420 425 430 Ser Cys Glu Ile Thr Phe Ile Glu Ser Glu Glu Gly Ser Gly Arg Gly 435 440 445 Ala Ala Leu Val Ser Ala Val Ala Cys Lys Lys Ala Cys Met Leu Gly 450 455 460 Gln 465 <210> 83 <211> 325 <212> DNA <213> Artificial Sequence <220> <223> 5' UTR <400> 83 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccacc 325 <210> 84 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 17 <400> 84 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360 actgctggcc ctctggggac ctgacccagc agcagccttt gtgaaccaac acctgtgtgg 420 ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480 caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcc agacagaaga gaggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaataaggga ctagagcagg gatccaagct t 951 <210> 85 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns18 <400> 85 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360 actgctggcc ctctggggac ctgacccagc agcagccttt gtgaaccaac acctgtgtgg 420 ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480 caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcc agacagaaga gaggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaataaggga ctagagcagg aattcaagct t 951 <210> 86 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 19 <400> 86 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactgctcc ccctcctggc 360 tttgctggcc ctgtggggac cagatcctgc agctgccttt gtgaatcagc acctgtgtgg 420 ctcagatctg gttgaggcac tctacctggt gtgtggggag agaggcttct tttacacacc 480 aaggaccaag agggaggcag aggatctgca ggtaggtcag gtggagctgg gaggtggccc 540 tggagcagga tccctgcagc ccttggcact ggagggctcc agacagaaga ggggcattgt 600 ggaacagtgt tgcactagca tctgcagcct gtaccagctg gagaactact gcaactaaag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaataaggga ctagagcagc atatgaagct t 951 <210> 87 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 20 <400> 87 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360 gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420 ctcagatctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480 caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaataaggga ctagagcagg atatcaagct t 951 <210> 88 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Modified hIns - 21 <400> 88 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360 tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420 ctcagatctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480 caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaataaggga ctagagcaga ctagtaagct t 951 <210> 89 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 22 <400> 89 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900 gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacactgtgg ccaccatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca caggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080 gtgtgtcaat acagagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140 ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggcctc tgagcagctg aggacaaggg gagcctttga 1320 gaccaggttt gtgtcccagg tggagagtga cacaggagac aggaagcaga tctacaacat 1380 cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcttg 1440 tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gggtcatcaa 1500 caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560 tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620 ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagcagccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagtct agaaagctt 2019 <210> 90 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 23 <400> 90 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900 gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacactgtgg ccaccatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca caggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080 gtgtgtcaat acagagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140 ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggcctc tgagcagctg aggacaaggg gagcctttga 1320 gaccaggttt gtgtcccagg tggagagtga cacaggagac aggaagcaga tctacaacat 1380 cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcttg 1440 tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gggtcatcaa 1500 caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560 tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620 ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagcagccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcaggct agcaagctt 2019 <210> 91 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 24 <400> 91 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900 gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg atagtgggca caggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080 gtgtgtcaat actgagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140 ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggggagct ggtgaggctt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggcctc agagcagctg agaacaaggg gagcctttga 1320 gaccaggttt gtgtcccagg tggagagtga cacaggtgac aggaagcaga tctacaacat 1380 cctgagcacc ctggggctga gaccctccac cacagactgt gacattgtga ggagggcctg 1440 tgagagtgtg tctaccaggg ctgcccacat gtgctctgct gggctggcag gagtcatcaa 1500 caggatgagg gagagcagga gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560 tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga gaaggctgac 1620 ccccagctgt gagatcacct ttatagagtc tgaggagggc agtggcaggg gagcagccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagatt aataagctt 2019 <210> 92 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 25 <400> 92 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaaggatgc agaaggagat ggacaggggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgaggtcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 tgacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 atttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900 gagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080 gtgtgtcaat actgagtggg gagcctttgg ggactctggg gagctggatg agttcctgct 1140 ggagtatgac aggctggtgg atgagagctc agcaaaccct ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgagactt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggcctc agagcagctg aggacaaggg gagcctttga 1320 gaccaggttt gtgtcccagg tggagagtga cactggagac aggaagcaga tctacaacat 1380 cctgagcacc ctggggctga ggccctctac cacagactgt gacatagtga gaagggcctg 1440 tgagtctgtg tctaccaggg ctgcccacat gtgctctgct gggctggctg gagtcatcaa 1500 cagaatgagg gagagcagaa gtgaggatgt aatgaggatc actgtgggag tggatggctc 1560 tgtgtacaag ctgcacccct cattcaagga gaggttccat gccagtgtga ggaggctgac 1620 ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcaggg gagctgccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagatg cataagctt 2019 <210> 93 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 26 <400> 93 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc tatggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaagaatgc agaaggagat ggaccgcggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgcgctcc accccagaag gctcagaagt 540 tggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt tgtggggctt ctgagagatg ctatcaaaag 900 aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960 ctcctgctac tatgaagacc atcagtgtga ggttggcatg attgtgggca caggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggccgcat 1080 gtgtgtcaat actgagtggg gcgcctttgg ggactctgga gagctggatg agttcctgct 1140 ggagtatgac cgcctggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgcggctt gtgctgctca ggttggtgga 1260 tgaaaacctg ctcttccatg gggaggccag tgagcagctg cgcacacgcg gagcctttga 1320 gacgcgcttt gtgtcacaag tggagtctga cacaggagac cgcaagcaga tctacaacat 1380 cctgagcaca ctggggctgc ggccctccac cactgactgt gacattgtgc gccgcgcctg 1440 tgagagtgtg tctacgcgcg ctgcgcacat gtgctcagcg gggctggcgg gagtcatcaa 1500 ccgcatgcgc gagagccgct ctgaggatgt aatgcgcatc actgtgggag tggatggcag 1560 tgtgtacaag ctgcacccca gcttcaagga gcggttccat gcctcagtgc gcaggctgac 1620 ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcagag gcgcggccct 1680 ggtcagcgcg gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagagt actaagctt 2019 <210> 94 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 27 <400> 94 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaagaatgc agaaggagat ggaccgcggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgcgctcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgcgggatg ctatcaaaag 900 aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggccgcat 1080 gtgtgtcaat acagagtggg gcgcctttgg ggacagcgga gagctggatg agttcctgct 1140 ggagtatgac cgcctggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgcggctt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggcctc tgagcagctg cgcacacgcg gagcctttga 1320 gacgcgcttt gtgagccagg tggagagtga cacaggagac cgcaagcaga tctacaacat 1380 cctgagcacc ctggggctgc ggcccagcac cactgactgt gacattgtgc gccgcgcctg 1440 tgagtcagtg tctacgcgcg ctgcgcacat gtgcagcgcg gggctggcgg gagtcatcaa 1500 ccgcatgcgc gagagccgct ctgaggatgt aatgcgcatc actgtgggag tggatggcag 1560 tgtgtacaag ctgcacccca gcttcaagga gcggttccat gcctcagtgc gcaggctgac 1620 ccccagctgt gagatcacct ttattgagtc tgaggagggc agtggcagag gcgcggccct 1680 ggtcagcgcg gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagggt accaagctt 2019 <210> 95 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 28 <400> 95 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc tatggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaagaatgc agaaggagat ggacagaggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgagatcc accccagaag gctcagaagt 540 tggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt tgtggggctt ctgagagatg ctatcaaaag 900 aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccactatgat 960 ctcctgctac tatgaagacc atcagtgtga ggttggcatg attgtgggca caggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcaggat 1080 gtgtgtcaat actgagtggg gagcctttgg ggactctgga gagctggatg agttcctgct 1140 ggagtatgac agactggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgaggctt gtgctgctca ggttggtgga 1260 tgaaaacctg ctcttccatg gggaggccag tgagcagctg agaacaaggg gagcctttga 1320 gacaagattt gtgtcacagg tggagtctga cacaggagac aggaagcaga tctacaacat 1380 cctgagcacc ctggggctga gaccctccac cactgactgt gacattgtga ggagagcctg 1440 tgagagtgtg tctaccaggg ctgctcacat gtgctcagca gggctggctg gagtcatcaa 1500 cagaatgagg gagagcagat ctgaggatgt aatgaggatc actgtgggtg tggatggcag 1560 tgtgtacaag ctgcacccca gcttcaagga gagattccat gcctcagtga ggaggctgac 1620 ccccagctgt gagatcacct tcattgagtc tgaggagggc agtggcagag gagcagccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagaat attaagctt 2019 <210> 96 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Modified hGck - 29 <400> 96 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc catggatgtc acaaggagcc aggcccagac 360 agccttgact ctggtagagc agatcctggc agagttccag ctgcaggagg aggacctgaa 420 gaaggtgatg agaagaatgc agaaggagat ggacagaggc ctgaggctgg agacccatga 480 agaggccagt gtgaagatgc tgcccaccta tgtgagatcc accccagaag gctcagaagt 540 gggggacttc ctctccctgg acctgggtgg cactaacttc agggtgatgc tggtgaaggt 600 gggagaaggt gaggaggggc agtggagtgt gaagaccaaa caccagatgt actccatccc 660 tgaggatgcc atgacaggca ctgctgagat gctctttgac tacatctctg agtgcatctc 720 agacttcctg gacaagcatc agatgaaaca caagaagctg cccctgggct tcaccttctc 780 ctttcctgtg aggcatgaag acattgataa gggcatcctt ctcaactgga ccaagggctt 840 caaggcctca ggagcagaag ggaacaatgt ggtggggctt ctgagagatg ctatcaaaag 900 aagaggggac tttgaaatgg atgtggtggc aatggtgaat gacacagtgg ccaccatgat 960 ctcctgctac tatgaagacc atcagtgtga ggtgggcatg attgtgggca ctggctgcaa 1020 tgcctgctac atggaggaga tgcagaatgt ggagctggtg gagggggatg agggcagaat 1080 gtgtgtcaat acagagtggg gagcctttgg ggactctgga gagctggatg agttcctgct 1140 ggagtatgac agactggtgg atgagagctc agcaaaccca ggtcagcagc tgtatgagaa 1200 gctcataggt ggcaagtaca tgggagagct ggtgagactt gtgctgctca ggctggtgga 1260 tgaaaacctg ctcttccatg gggaggccag tgagcagctg agaacaagag gagcctttga 1320 gaccagattt gtgagccagg tggagtcaga cacaggagac agaaagcaga tctacaacat 1380 cctgagcacc ctggggctga gacccagcac cactgactgt gacattgtga gaagagcctg 1440 tgagtctgtg tctaccagag ctgcccacat gtgcagtgct gggctggctg gagtcatcaa 1500 cagaatgaga gagagcagat cagaggatgt aatgagaatc actgtgggtg tggatggctc 1560 tgtgtacaag ctgcacccca gcttcaagga gagattccat gccagtgtga gaaggctgac 1620 ccccagctgt gagatcacct ttattgagtc agaggagggc agtggcagag gagcagccct 1680 ggtctctgct gtggcctgta agaaggcctg tatgctgggc cagtgaagcc agctgccttc 1740 cctttactgt gggttaatgc ttgcagcaga catgataaga tacattgatg agtttggaca 1800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1860 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1920 tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1980 atgtggtaaa ataagggact agagcagtta attaagctt 2019 <210> 97 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hIns 3' UTR <400> 97 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gggatccaag ctt 293 <210> 98 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hIns 3' UTR <400> 98 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca ggaattcaag ctt 293 <210> 99 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hIns 3' UTR <400> 99 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gcatatgaag ctt 293 <210> 100 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hIns 3' UTR <400> 100 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca ggatatcaag ctt 293 <210> 101 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hIns 3' UTR <400> 101 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gactagtaag ctt 293 <210> 102 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 102 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gtctagaaag ctt 293 <210> 103 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 103 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca ggctagcaag ctt 293 <210> 104 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 104 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gattaataag ctt 293 <210> 105 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 105 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gatgcataag ctt 293 <210> 106 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 106 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gagtactaag ctt 293 <210> 107 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 107 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gggtaccaag ctt 293 <210> 108 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 108 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gaatattaag ctt 293 <210> 109 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> hGck 3' UTR <400> 109 agccagctgc cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt 60 gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 120 tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 180 aattgcattc attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag 240 taaaacctct acaaatgtgg taaaataagg gactagagca gttaattaag ctt 293 <210> 110 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10D) ORF - 22 <400> 110 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac 120 ctagtgtgcg gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 111 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF - 2 <400> 111 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120 ctagtgtgcg gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 112 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF - 27 <400> 112 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120 ctagtgtgcg gggaaagagg cttcttctac acacccagga ccaagcggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtcgcgaca gaagcggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 113 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF -28 <400> 113 atggccctgt ggatgagact cctgcccctg ctggctctgc tggccctctg gggacctgac 60 ccagctgcag cctttgtgaa ccaacacctg tgtggctcac acctggtgga agctctctac 120 ctagtgtgtg gggaaagagg cttcttctac acacccagga ccaagaggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggaggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtctagaca gaagaggggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 114 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF <400> 114 atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcggccg ctttcgtgaa ccagcacctc tgcggaagcc acctggtcga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccgagga caaagcgcga ggcagaagac 180 cttcaagtgg gccaggtaga gctcggaggg ggccccggtg ccggatccct gcagcctctg 240 gctctcgaag ggtctcgaca aaaacgtggc atcgtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 115 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF <400> 115 atggccctgt ggatgcggct cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcggccg cttttgtgaa ccagcacctc tgcggatctc acctggttga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccaagga caaagcgcga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggcccgggtg caggatccct gcagcctctg 240 gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 116 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H) ORF <400> 116 atggccctgt ggatgagact cttgcccctt ctggctttac tggcactatg gggccctgac 60 ccagcagctg cttttgtgaa ccagcacctc tgtggatctc acctggttga ggccttgtac 120 ctggtttgtg gggaaagagg ttttttctat accccaagga caaagaggga ggcagaagac 180 cttcaagtgg gccaggtaga gctgggaggg ggccctggtg caggatccct gcagcctctg 240 gctctagaag ggtctagaca aaaaaggggc atagtggagc agtgctgtac ttcaatttgc 300 agtttgtacc agcttgagaa ttattgtaac tga 333 <210> 117 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10D[IL-6]) ORF - 32 <400> 117 atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60 gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcagatctg 120 gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc caggaccaag 180 cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 118 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10D[IL-6]) ORF - 33 <400> 118 atgaacagct tcagcacaag cgcctttggc ccagtggctt tctctctggg actgctgctg 60 gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcagatctg 120 gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc caggaccaag 180 cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 119 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10D[IL-6]) ORF - 34 <400> 119 atgaacagct tcagcacaag tgcctttggc ccagtggctt tctctctggg actgctgctg 60 gtgctgcctg cagctttccc tgcccctttt gtgaaccaac acctgtgtgg ctcagatctg 120 gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc caggaccaag 180 agagaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcc aggcagaaga gaggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 120 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H[IL-6]) ORF -35 <400> 120 atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60 gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcacacctg 120 gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc caggaccaag 180 cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 121 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H[IL-6]) ORF - 36 <400> 121 atgaacagct tcagcacaag cgcctttggc ccagtggctt tctctctggg actgctgctg 60 gtgctgcctg ccgctttccc tgcccctttt gtgaaccaac acctgtgcgg ctcacacctg 120 gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc caggaccaag 180 cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 122 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> hIns (B10H[IL-6]) ORF - 37 <400> 122 atgaacagct tcagcacaag tgcctttggc ccagtggctt tctctctggg actgctgctg 60 gtgctgcctg cagctttccc tgcccctttt gtgaaccaac acctgtgtgg ctcacacctg 120 gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc caggaccaag 180 agagaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc tggtgcaggc 240 agcctgcagc ccttggccct ggaggggtcc aggcagaaga gaggcattgt ggaacaatgc 300 tgtaccagca tctgctccct ctaccagctg gagaactact gcaactag 348 <210> 123 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Ins B10D: 4 mutations - 22 <400> 123 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360 gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420 ctcagatctg gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc 480 caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 124 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Dx2: B10D->IRES->RE - 23 <400> 124 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360 ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420 tcagatctgg tggaagctct ctacctagtg tgcggggaac gaggcttctt ctacacaccc 480 aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg tggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgctttcgtg 1320 aaccagcacc tctgcggaag cgatctggtc gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccgag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440 gagctcggag ggggccccgg tgccggatcc ctgcagcctc tggctctcga agggtctcga 1500 caaaaacgtg gcatcgtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 125 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Dx2: 111->IRES->RE-111 - 24 <400> 125 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360 ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420 tcagatctgg tggaagctct ctacctagtg tgcggggaaa gaggcttctt ctacacaccc 480 aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg gggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgcttttgtg 1320 aaccagcacc tctgcggatc tgatctggtt gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccaag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440 gagctgggag ggggcccggg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500 caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 126 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Dx2: 211->IRES->RE-211 - 25 <400> 126 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatga gactcctgcc cctgctggct 360 ctgctggccc tctggggacc tgacccagct gcagcctttg tgaaccaaca cctgtgtggc 420 tcagatctgg tggaagctct ctacctagtg tgtggggaaa gaggcttctt ctacacaccc 480 aggaccaaga gggaggcaga ggacctgcag gtggggcagg tggagctggg agggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcta gacagaagag gggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgaga 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcagc tgcttttgtg 1320 aaccagcacc tctgtggatc tgatctggtt gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccaag gacaaagagg gaggcagaag accttcaagt gggccaggta 1440 gagctgggag ggggccctgg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500 caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 127 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H)_2 <400> 127 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360 gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420 ctcacacctg gtggaagctc tctacctagt gtgcggggaa cgaggcttct tctacacacc 480 caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc gtggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 128 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H) - 27 <400> 128 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg cgcctcctgc ccctgctggc 360 gctgctggcc ctctggggac ctgacccagc cgcagccttt gtgaaccaac acctgtgcgg 420 ctcacacctg gtggaagctc tctacctagt gtgcggggaa agaggcttct tctacacacc 480 caggaccaag cgggaggcag aggacctgca ggtggggcag gtggagctgg gcgggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtcg cgacagaagc ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 129 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H) - 28 <400> 129 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatggc cctgtggatg agactcctgc ccctgctggc 360 tctgctggcc ctctggggac ctgacccagc tgcagccttt gtgaaccaac acctgtgtgg 420 ctcacacctg gtggaagctc tctacctagt gtgtggggaa agaggcttct tctacacacc 480 caggaccaag agggaggcag aggacctgca ggtggggcag gtggagctgg gagggggccc 540 tggtgcaggc agcctgcagc ccttggccct ggaggggtct agacagaaga ggggcattgt 600 ggaacaatgc tgtaccagca tctgctccct ctaccagctg gagaactact gcaactagag 660 ccagctgcct tccctttact gtgggttaat gcttgcagca gacatgataa gatacattga 720 tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg 780 tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 840 ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt aaagcaagta 900 aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt ttg 953 <210> 130 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2: B10H->IRES->RE - 29 <400> 130 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360 ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420 tcacacctgg tggaagctct ctacctagtg tgcggggaac gaggcttctt ctacacaccc 480 aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg tggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgctttcgtg 1320 aaccagcacc tctgcggaag ccacctggtc gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccgag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440 gagctcggag ggggccccgg tgccggatcc ctgcagcctc tggctctcga agggtctcga 1500 caaaaacgtg gcatcgtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 131 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2: 111->IRES->RE-111 - 30 <400> 131 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatgc gcctcctgcc cctgctggcg 360 ctgctggccc tctggggacc tgacccagcc gcagcctttg tgaaccaaca cctgtgcggc 420 tcacacctgg tggaagctct ctacctagtg tgcggggaaa gaggcttctt ctacacaccc 480 aggaccaagc gggaggcaga ggacctgcag gtggggcagg tggagctggg cgggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcgc gacagaagcg gggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgcgg 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcggc cgcttttgtg 1320 aaccagcacc tctgcggatc tcacctggtt gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccaag gacaaagcgc gaggcagaag accttcaagt gggccaggta 1440 gagctgggag ggggcccggg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500 caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 132 <211> 1870 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2: 211->IRES->RE-211 -31 <400> 132 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatggcc ctgtggatga gactcctgcc cctgctggct 360 ctgctggccc tctggggacc tgacccagct gcagcctttg tgaaccaaca cctgtgtggc 420 tcacacctgg tggaagctct ctacctagtg tgtggggaaa gaggcttctt ctacacaccc 480 aggaccaaga gggaggcaga ggacctgcag gtggggcagg tggagctggg agggggccct 540 ggtgcaggca gcctgcagcc cttggccctg gaggggtcta gacagaagag gggcattgtg 600 gaacaatgct gtaccagcat ctgctccctc taccagctgg agaactactg caactaggcc 660 cctctccctc ccccccccct aacgttactg gccgaagccg cttggaataa ggccggtgtg 720 cgtttgtcta tatgttattt tccaccatat tgccgtcttt tggcaatgtg agggcccgga 780 aacctggccc tgtcttcttg acgagcattc ctaggggtct ttcccctctc gccaaaggaa 840 tgcaaggtct gttgaatgtc gtgaaggaag cagttcctct ggaagcttct tgaagacaaa 900 caacgtctgt agcgaccctt tgcaggcagc ggaacccccc acctggcgac aggtgcctct 960 gcggccaaaa gccacgtgta taagatacac ctgcaaaggc ggcacaaccc cagtgccacg 1020 ttgtgagttg gatagttgtg gaaagagtca aatggctctc ctcaagcgta ttcaacaagg 1080 ggctgaagga tgcccagaag gtaccccatt gtatgggatc tgatctgggg cctcggtaca 1140 catgctttac atgtgtttag tcgaggttaa aaaaacgtct aggccccccg aaccacgggg 1200 acgtggtttt cctttgaaaa acacgatgat aatatggcca caatggccct gtggatgaga 1260 ctcttgcccc ttctggcttt actggcacta tggggccctg acccagcagc tgcttttgtg 1320 aaccagcacc tctgtggatc tcacctggtt gaggccttgt acctggtttg tggggaaaga 1380 ggttttttct ataccccaag gacaaagagg gaggcagaag accttcaagt gggccaggta 1440 gagctgggag ggggccctgg tgcaggatcc ctgcagcctc tggctctaga agggtctaga 1500 caaaaaaggg gcatagtgga gcagtgctgt acttcaattt gcagtttgta ccagcttgag 1560 aattattgta actgaagcca gctgccttcc ctttactgtg ggttaatgct tgcagcagac 1620 atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 1680 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 1740 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga gatgtgggag 1800 gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tccgataagg gactagagca 1860 gaagcttttg 1870 <210> 133 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10D[IL-6]) - 32 <400> 133 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct tcggccccgt 360 ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420 ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg gggaacgagg 480 cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600 gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 134 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10D[IL-6]) - 33 <400> 134 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct ttggcccagt 360 ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420 ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg gggaaagagg 480 cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600 gaagcggggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 135 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10D[IL-6]) - 34 <400> 135 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagtgcct ttggcccagt 360 ggctttctct ctgggactgc tgctggtgct gcctgcagct ttccctgccc cttttgtgaa 420 ccaacacctg tgtggctcag atctggtgga agctctctac ctagtgtgtg gggaaagagg 480 cttcttctac acacccagga ccaagagaga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggaggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtccaggca 600 gaagagaggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 136 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H[IL-6]) - 35 <400> 136 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct tcggccccgt 360 ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420 ccaacacctg tgcggctcac acctggtgga agctctctac ctagtgtgcg gggaacgagg 480 cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600 gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 137 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H[IL-6]) - 36 <400> 137 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagcgcct ttggcccagt 360 ggctttctct ctgggactgc tgctggtgct gcctgccgct ttccctgccc cttttgtgaa 420 ccaacacctg tgcggctcac acctggtgga agctctctac ctagtgtgcg gggaaagagg 480 cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtcgcgaca 600 gaagcggggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 138 <211> 968 <212> DNA <213> Artificial Sequence <220> <223> Ins (B10H[IL-6]) - 37 <400> 138 aagctttatt gtggtagttt atcacagtta aattgctaag gcagtcagtg cttctgacac 60 aacagtctcc aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcct 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtg gagacagaga agactcttgg ctttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtcc tgcagaattg ccaccatgaa cagcttcagc acaagtgcct ttggcccagt 360 ggctttctct ctgggactgc tgctggtgct gcctgcagct ttccctgccc cttttgtgaa 420 ccaacacctg tgtggctcac acctggtgga agctctctac ctagtgtgtg gggaaagagg 480 cttcttctac acacccagga ccaagagaga ggcagaggac ctgcaggtgg ggcaggtgga 540 gctgggaggg ggccctggtg caggcagcct gcagcccttg gccctggagg ggtccaggca 600 gaagagaggc attgtggaac aatgctgtac cagcatctgc tccctctacc agctggagaa 660 ctactgcaac tagagccagc tgccttccct ttactgtggg ttaatgcttg cagcagacat 720 gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 780 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 840 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt 900 tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc cgataaggga ctagagcaga 960 agcttttg 968 <210> 139 <211> 1885 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2[IL-6/ISP]: IL-6->B10H->IRES->ISP->RE - 38 <400> 139 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatgaac agcttcagca caagcgcctt cggccccgtg 360 gctttctctc tgggactgct gctggtgctg cctgccgctt tccctgcccc ttttgtgaac 420 caacacctgt gcggctcaca cctggtggaa gctctctacc tagtgtgcgg ggaacgaggc 480 ttcttctaca cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag 540 ctgggcgggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag 600 aagcgtggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660 tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720 aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780 atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840 ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900 cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960 gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020 aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080 gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140 tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200 ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260 gccctgtgga tgcggctctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320 gcggccgctt tcgtgaacca gcacctctgc ggaagccacc tggtcgaggc cttgtacctg 1380 gtttgtgggg aaagaggttt tttctatacc ccgaggacaa agcgcgaggc agaagacctt 1440 caagtgggcc aggtagagct cggagggggc cccggtgccg gatccctgca gcctctggct 1500 ctcgaagggt ctcgacaaaa acgtggcatc gtggagcagt gctgtacttc aatttgcagt 1560 ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620 atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680 cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740 ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800 ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860 taagggacta gagcagaagc ttttg 1885 <210> 140 <211> 1885 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2[IL-6/ISP]: IL-6->111->IRES->ISP->RE-111 - 39 <400> 140 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatgaac agcttcagca caagcgcctt tggcccagtg 360 gctttctctc tgggactgct gctggtgctg cctgccgctt tccctgcccc ttttgtgaac 420 caacacctgt gcggctcaca cctggtggaa gctctctacc tagtgtgcgg ggaaagaggc 480 ttcttctaca cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag 540 ctgggcgggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag 600 aagcggggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660 tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720 aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780 atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840 ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900 cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960 gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020 aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080 gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140 tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200 ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260 gccctgtgga tgcggctctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320 gcggccgctt ttgtgaacca gcacctctgc ggatctcacc tggttgaggc cttgtacctg 1380 gtttgtgggg aaagaggttt tttctatacc ccaaggacaa agcgcgaggc agaagacctt 1440 caagtgggcc aggtagagct gggagggggc ccgggtgcag gatccctgca gcctctggct 1500 ctagaagggt ctagacaaaa aaggggcata gtggagcagt gctgtacttc aatttgcagt 1560 ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620 atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680 cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740 ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800 ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860 taagggacta gagcagaagc ttttg 1885 <210> 141 <211> 1885 <212> DNA <213> Artificial Sequence <220> <223> Ins B10Hx2[IL-6/ISP]: IL-6->211->IRES->ISP->RE-211 - 40 <400> 141 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc caccatgaac agcttcagca caagtgcctt tggcccagtg 360 gctttctctc tgggactgct gctggtgctg cctgcagctt tccctgcccc ttttgtgaac 420 caacacctgt gtggctcaca cctggtggaa gctctctacc tagtgtgtgg ggaaagaggc 480 ttcttctaca cacccaggac caagagagag gcagaggacc tgcaggtggg gcaggtggag 540 ctgggagggg gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtccaggcag 600 aagagaggca ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac 660 tactgcaact aggcccctct ccctcccccc cccctaacgt tactggccga agccgcttgg 720 aataaggccg gtgtgcgttt gtctatatgt tattttccac catattgccg tcttttggca 780 atgtgagggc ccggaaacct ggccctgtct tcttgacgag cattcctagg ggtctttccc 840 ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag 900 cttcttgaag acaaacaacg tctgtagcga ccctttgcag gcagcggaac cccccacctg 960 gcgacaggtg cctctgcggc caaaagccac gtgtataaga tacacctgca aaggcggcac 1020 aaccccagtg ccacgttgtg agttggatag ttgtggaaag agtcaaatgg ctctcctcaa 1080 gcgtattcaa caaggggctg aaggatgccc agaaggtacc ccattgtatg ggatctgatc 1140 tggggcctcg gtacacatgc tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc 1200 ccccgaacca cggggacgtg gttttccttt gaaaaacacg atgataatat ggccacaatg 1260 gccctgtgga tgagactctt gccccttctg gctttactgg cactatgggg ccctgaccca 1320 gcagctgctt ttgtgaacca gcacctctgt ggatctcacc tggttgaggc cttgtacctg 1380 gtttgtgggg aaagaggttt tttctatacc ccaaggacaa agagggaggc agaagacctt 1440 caagtgggcc aggtagagct gggagggggc cctggtgcag gatccctgca gcctctggct 1500 ctagaagggt ctagacaaaa aaggggcata gtggagcagt gctgtacttc aatttgcagt 1560 ttgtaccagc ttgagaatta ttgtaactga agccagctgc cttcccttta ctgtgggtta 1620 atgcttgcag cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg 1680 cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt 1740 ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag 1800 ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatccga 1860 taagggacta gagcagaagc ttttg 1885 <210> 142 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> IRES <400> 142 tccctccccc ccccctaacg ttactggccg aagccgcttg gaataaggcc ggtgtgcgtt 60 tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg cccggaaacc 120 tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca aaggaatgca 180 aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa gacaaacaac 240 gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt gcctctgcgg 300 ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt gccacgttgt 360 gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca acaaggggct 420 gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc ggtgcacatg 480 ctttacatgt gtttagtcga ggttaaaaaa acgtctaggc cccccgaacc acggggacgt 540 ggttttcctt tgaaaacacg atgataa 567 <210> 143 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> IRES v2 <400> 143 gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 60 gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 120 ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 180 gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 240 aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 300 tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 360 acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 420 aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 480 acacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 540 gggacgtggt tttcctttga aaaacacgat gataatatgg ccaca 585 <210> 144 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> mutant ins B10D <400> 144 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15 Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly 20 25 30 Ser Asp Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45 Phe Tyr Thr Pro Arg Thr Lys Arg Glu Ala Glu Asp Leu Gln Val Gly 50 55 60 Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu 65 70 75 80 Ala Leu Glu Gly Ser Arg Gln Lys Arg Gly Ile Val Glu Gln Cys Cys 85 90 95 Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 145 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> mutant ins B10H <400> 145 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15 Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly 20 25 30 Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe 35 40 45 Phe Tyr Thr Pro Arg Thr Lys Arg Glu Ala Glu Asp Leu Gln Val Gly 50 55 60 Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu 65 70 75 80 Ala Leu Glu Gly Ser Arg Gln Lys Arg Gly Ile Val Glu Gln Cys Cys 85 90 95 Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn 100 105 110 <210> 146 <211> 324 <212> DNA <213> Artificial Sequence <220> <223> 5' UTR <400> 146 agctttattg tggtagttta tcacagttaa attgctaagg cagtcagtgc ttctgacaca 60 acagtctcca acttaagctg cagtgactct cttaaggtag ccttgcagaa gttggtcctg 120 aggcactggg caggtaagta tcaaggttac aagacaggtt taaggagacc aatagaaact 180 gggcttgtgg agacagagaa gactcttggc tttctgatag gcacctattg gtcttactga 240 catccacttt gcctttctct ccacaggtgt ccactcccag ttcaattaca gctcttaagg 300 ctagagtcct gcagaattgc cacc 324 <210> 147 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> wildtype sequence <400> 147 atggccctgt ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac 60 ccagccgcag cctttgtgaa ccaacacctg tgcggctcac acctggtgga agctctctac 120 ctagtgtgcg gggaacgagg cttcttctac acacccaaga cccgccggga ggcagaggac 180 ctgcaggtgg ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg 240 gccctggagg ggtccctgca gaagcgtggc attgtggaac aatgctgtac cagcatctgc 300 tccctctacc agctggagaa ctactgcaac tag 333 <210> 148 <211> 350 <212> DNA <213> Artificial Sequence <220> <223> 5 UTR (B10D-Ins unmodified) <400> 148 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc 350 <210> 149 <211> 363 <212> DNA <213> Artificial Sequence <220> <223> 3' UTR (B10D-Ins unmodified) <400> 149 acgcagctgc tagctaatcg ataccgtcga cctcgaggaa ttcacgcgtg gtacctctag 60 agtcgacccg ggcggccgct tccctttagt gagggttaat gcttcgagca gacatgataa 120 gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt 180 gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 240 acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt 300 aaagcaagta aaacctctac aaatgtggta aaatccgata agggactaga gcagaagctt 360 ttg 363 <210> 150 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins1 - furin cleavage sites and histidine substituted by ileucine in B10 position <400> 150 atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60 cctgccgccg ctttcgtgaa ccagcacctg tgtggcagca tcctggtgga agccctgtac 120 ctcgtgtgcg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180 ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240 gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300 tccctgtacc agctggaaaa ctactgcaac tga 333 <210> 151 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins2 - furin cleavage sites and histidine substituted by valine in B10 position <400> 151 atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60 cctgccgccg ctttcgtgaa ccagcacctg tgtggaagcg tgctggtgga agccctgtac 120 ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180 ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240 gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300 tccctgtacc agctggaaaa ctactgcaac tga 333 <210> 152 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Ins3 - furin cleavage sites and WT signal peptide substituted by signal peptide of interleukin 6 (IL6) <400> 152 atgaacagct tcagcacaag cgccttcggc cccgtggctt tctctctggg actgctgctg 60 gtgctgcctg ccgctttccc tgcccctttc gtgaaccagc acctgtgcgg cagccacctg 120 gtggaagctc tgtacctcgt gtgcggcgag agaggcttct tctacacccc taggaccaag 180 agagaggccg aggatctgca agtgggccag gtggaactgg gcggaggacc tggcgctgga 240 tctctgcagc ctctggctct ggaaggcagc agacagaaaa ggggcatcgt ggaacagtgc 300 tgcaccagca tctgctccct gtaccagctg gaaaactact gcaactga 348 <210> 153 <211> 339 <212> DNA <213> Artificial Sequence <220> <223> Ins4 - furin cleavage sites and WT signal peptide substituted by signal peptide of fibronectin <400> 153 atgctgagag gacctggacc aggactgctg ctgctggccg tgcagtgtct gggaacagcc 60 gtgcctagca caggcgcctt cgtgaaccag cacctgtgtg gcagccacct ggtggaagcc 120 ctgtacctcg tgtgtggcga gagaggcttc ttctacaccc ctaggaccaa gagagaggcc 180 gaggatctgc aagtgggcca ggtggaactg ggcggaggac caggcgctgg atctctgcag 240 cctctggctc tggaaggcag cagacagaaa aggggcatcg tggaacagtg ctgcaccagc 300 atctgctccc tgtaccagct ggaaaactac tgcaactga 339 <210> 154 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins5 - furin cleavage sites <400> 154 atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60 cctgccgccg ctttcgtgaa ccagcacctg tgtggcagcc acctggtgga agccctgtac 120 ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180 ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240 gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300 tccctgtacc agctggaaaa ctactgcaac tga 333 <210> 155 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins6 - furin cleavage sites <400> 155 atggctctgt ggatgagact gctgcccctg ctggctctgc tggcactgtg gggacctgat 60 cctgccgccg ctttcgtgaa ccagcacctg tgtggcagcc acctggtgga agccctgtac 120 ctcgtgtgtg gcgagagagg cttcttctac acccctagga ccaagagaga ggccgaggat 180 ctgcaagtgg gccaggtgga actgggcgga ggacctggcg ctggatctct gcagcctctg 240 gctctggaag gcagcagaca gaaaaggggc atcgtggaac agtgctgcac cagcatctgc 300 tccctgtacc agctggaaaa ctactgcaac tga 333 <210> 156 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Ins7 - furin cleavage sites, WT signal peptide substituted signal peptide of IL6 and histidine substituted by valine in position B10 <400> 156 atgaacagct tcagcacaag cgctttcggc cccgtggctt tttctctggg actgctgctg 60 gttctgcctg ccgcttttcc tgctcctttc gtgaaccagc acctgtgcgg aagcgtgctg 120 gtggaagctc tgtatctcgt gtgtggcgag agaggcttct tctacacccc taggaccaag 180 agagaggccg aggatctgca agtcggccag gttgaacttg gcggaggacc tggtgctgga 240 tctctgcagc ctcttgctct ggaaggcagc agacagaaga ggggcatcgt cgagcagtgc 300 tgcaccagca tctgtagcct gtaccagctg gaaaactact gcaactga 348 <210> 157 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins8 - furin cleavage sites and proline substituted by aspart in B28 position <400> 157 atggcacttt ggatgagact gctgccactg ctggccctgc ttgctctttg gggacctgat 60 cctgctgccg cctttgtgaa ccagcacctg tgtggaagcc atctggtgga agccctgtac 120 ctcgtgtgtg gcgagagagg cttcttctac accgacagga ccaagagaga ggccgaggat 180 ctgcaagtcg gccaggttga acttggcgga ggacctggtg ctggatctct gcagcctctt 240 gctctggaag gcagcagaca gaagaggggc atcgtcgagc agtgctgcac cagcatctgt 300 agcctgtacc agctggaaaa ctactgcaac tga 333 <210> 158 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins9 - furin cleavage sites <400> 158 atggccttgt ggatgcggct tttgccgctg ctcgcgctct tggccctctg ggggcccgac 60 ccggctgccg ctttcgtcaa tcagcacctc tgcggcagcc acctcgtgga agcgctttac 120 ttggtctgcg gcgagagggg cttcttttat actccacgga ctaagcggga ggccgaagac 180 ttgcaagtcg ggcaagtgga actgggaggc gggccgggtg cggggtctct gcaacctctt 240 gcccttgagg ggtcacgaca aaagagaggg atagttgagc agtgttgtac gtcaatttgt 300 tccctgtatc aacttgaaaa ttattgcaat tag 333 <210> 159 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> Ins10 - furin cleavage sites <400> 159 atggctctgt ggatgagact tcttcctctt ttggccctgc tggccctttg gggccctgat 60 cctgccgccg ccttcgttaa ccaacatctg tgcggttcac acctggttga agctctttac 120 ctcgtttgtg gagaaagagg ctttttttac acaccacgga ccaaaaggga ggcagaggac 180 ctgcaggtgg gacaggttga gctgggcggg ggccctgggg caggctcact tcagccactc 240 gccctggagg gctctcgcca gaagagaggt atagtggagc aatgctgtac cagcatttgt 300 tctctctatc agctggagaa ttactgtaac taa 333 <210> 160 <211> 683 <212> DNA <213> Artificial Sequence <220> <223> Unmodified hIns_2 (B10D) <400> 160 aagctttatt gcggtagttt atcacagtta aattgctaac gcagtcagtg cttctgacac 60 aacagtctcg aacttaagct gcagtgactc tcttaaggta gccttgcaga agttggtcgt 120 gaggcactgg gcaggtaagt atcaaggtta caagacaggt ttaaggagac caatagaaac 180 tgggcttgtc gagacagaga agactcttgc gtttctgata ggcacctatt ggtcttactg 240 acatccactt tgcctttctc tccacaggtg tccactccca gttcaattac agctcttaag 300 gctagagtac ttaatacgac tcactatagg ctagcctcga gaattctgcc atggccctgt 360 ggatgcgcct cctgcccctg ctggcgctgc tggccctctg gggacctgac ccagccgcag 420 cctttgtgaa ccaacacctg tgcggctcag atctggtgga agctctctac ctagtgtgcg 480 gggaacgagg cttcttctac acacccagga ccaagcggga ggcagaggac ctgcaggtgg 540 ggcaggtgga gctgggcggg ggccctggtg caggcagcct gcagcccttg gccctggagg 600 ggtcgcgaca gaagcgtggc attgtggaac aatgctgtac cagcatctgc tccctctacc 660 agctggagaa ctactgcaac tag 683 <210> 161 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Unmodified hIns_3 (B10D) <400> 161 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggccctgtg gatgcgcctc ctgcccctgc 360 tggcgctgct ggccctctgg ggacctgacc cagccgcagc ctttgtgaac caacacctgt 420 gcggctcaga tctggtggaa gctctctacc tagtgtgcgg ggaacgaggc ttcttctaca 480 cacccaggac caagcgggag gcagaggacc tgcaggtggg gcaggtggag ctgggcgggg 540 gccctggtgc aggcagcctg cagcccttgg ccctggaggg gtcgcgacag aagcgtggca 600 ttgtggaaca atgctgtacc agcatctgct ccctctacca gctggagaac tactgcaact 660 agagccagct gccttccctt tactgtgggt taatgcttgc agcagacatg ataagataca 720 ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa 780 tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca 840 acaattgcat tcattttatg tttcaggttc agggggagat gtgggaggtt ttttaaagca 900 agtaaaacct ctacaaatgt ggtaaaatcc gataagggac tagagcagaa gcttttg 957 <210> 162 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> Unmodified hGck_2 ORF <400> 162 atggcgatgg atgtcacaag gagccaggcc cagacagcct tgactctggt agagcagatc 60 ctggcagagt tccagctgca ggaggaggac ctgaagaagg tgatgagacg gatgcagaag 120 gagatggacc gcggcctgag gctggagacc catgaagagg ccagtgtgaa gatgctgccc 180 acctacgtgc gctccacccc agaaggctca gaagtcgggg acttcctctc cctggacctg 240 ggtggcacta acttcagggt gatgctggtg aaggtgggag aaggtgagga ggggcagtgg 300 agcgtgaaga ccaaacacca gatgtactcc atccccgagg acgccatgac cggcactgct 360 gagatgctct tcgactacat ctctgagtgc atctccgact tcctggacaa gcatcagatg 420 aaacacaaga agctgcccct gggcttcacc ttctcctttc ctgtgaggca cgaagacatc 480 gataagggca tccttctcaa ctggaccaag ggcttcaagg cctcaggagc agaagggaac 540 aatgtcgtgg ggcttctgcg agacgctatc aaacggagag gggactttga aatggatgtg 600 gtggcaatgg tgaatgacac ggtggccacg atgatctcct gctactacga agaccatcag 660 tgcgaggtcg gcatgatcgt gggcacgggc tgcaatgcct gctacatgga ggagatgcag 720 aatgtggagc tggtggaggg ggacgagggc cgcatgtgcg tcaataccga gtggggcgcc 780 ttcggggact ccggcgagct ggacgagttc ctgctggagt atgaccgcct ggtggacgag 840 agctctgcaa accccggtca gcagctgtat gagaagctca taggtggcaa gtacatgggc 900 gagctggtgc ggcttgtgct gctcaggctc gtggacgaaa acctgctctt ccacggggag 960 gcctccgagc agctgcgcac acgcggagcc ttcgagacgc gcttcgtgtc gcaggtggag 1020 agcgacacgg gcgaccgcaa gcagatctac aacatcctga gcacgctggg gctgcgaccc 1080 tcgaccaccg actgcgacat cgtgcgccgc gcctgcgaga gcgtgtctac gcgcgctgcg 1140 cacatgtgct cggcggggct ggcgggcgtc atcaaccgca tgcgcgagag ccgcagcgag 1200 gacgtaatgc gcatcactgt gggcgtggat ggctccgtgt acaagctgca ccccagcttc 1260 aaggagcggt tccatgccag cgtgcgcagg ctgacgccca gctgcgagat caccttcatc 1320 gagtcggagg agggcagtgg ccggggcgcg gccctggtct cggcggtggc ctgtaagaag 1380 gcctgtatgc tgggccagtg a 1401 <210> 163 <211> 2016 <212> DNA <213> Artificial Sequence <220> <223> Unmodified hGck_2 <400> 163 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggcgatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagacgg atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctacgtgcg ctccacccca gaaggctcag 540 aagtcgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gcgtgaagac caaacaccag atgtactcca 660 tccccgagga cgccatgacc ggcactgctg agatgctctt cgactacatc tctgagtgca 720 tctccgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcac gaagacatcg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtcgtggg gcttctgcga gacgctatca 900 aacggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacacg gtggccacga 960 tgatctcctg ctactacgaa gaccatcagt gcgaggtcgg catgatcgtg ggcacgggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gacgagggcc 1080 gcatgtgcgt caataccgag tggggcgcct tcggggactc cggcgagctg gacgagttcc 1140 tgctggagta tgaccgcctg gtggacgaga gctctgcaaa ccccggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggcg agctggtgcg gcttgtgctg ctcaggctcg 1260 tggacgaaaa cctgctcttc cacggggagg cctccgagca gctgcgcaca cgcggagcct 1320 tcgagacgcg cttcgtgtcg caggtggaga gcgacacggg cgaccgcaag cagatctaca 1380 acatcctgag cacgctgggg ctgcgaccct cgaccaccga ctgcgacatc gtgcgccgcg 1440 cctgcgagag cgtgtctacg cgcgctgcgc acatgtgctc ggcggggctg gcgggcgtca 1500 tcaaccgcat gcgcgagagc cgcagcgagg acgtaatgcg catcactgtg ggcgtggatg 1560 gctccgtgta caagctgcac cccagcttca aggagcggtt ccatgccagc gtgcgcaggc 1620 tgacgcccag ctgcgagatc accttcatcg agtcggagga gggcagtggc cggggcgcgg 1680 ccctggtctc ggcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcat 2016 <210> 164 <211> 2025 <212> DNA <213> Artificial Sequence <220> <223> Unmodified hGck_3 <400> 164 ctagaagctt tattgtggta gtttatcaca gttaaattgc taaggcagtc agtgcttctg 60 acacaacagt ctccaactta agctgcagtg actctcttaa ggtagccttg cagaagttgg 120 tcctgaggca ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag 180 aaactgggct tgtggagaca gagaagactc ttggctttct gataggcacc tattggtctt 240 actgacatcc actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct 300 taaggctaga gtcctgcaga attgccacca tggcgatgga tgtcacaagg agccaggccc 360 agacagcctt gactctggta gagcagatcc tggcagagtt ccagctgcag gaggaggacc 420 tgaagaaggt gatgagacgg atgcagaagg agatggaccg cggcctgagg ctggagaccc 480 atgaagaggc cagtgtgaag atgctgccca cctacgtgcg ctccacccca gaaggctcag 540 aagtcgggga cttcctctcc ctggacctgg gtggcactaa cttcagggtg atgctggtga 600 aggtgggaga aggtgaggag gggcagtgga gcgtgaagac caaacaccag atgtactcca 660 tccccgagga cgccatgacc ggcactgctg agatgctctt cgactacatc tctgagtgca 720 tctccgactt cctggacaag catcagatga aacacaagaa gctgcccctg ggcttcacct 780 tctcctttcc tgtgaggcac gaagacatcg ataagggcat ccttctcaac tggaccaagg 840 gcttcaaggc ctcaggagca gaagggaaca atgtcgtggg gcttctgcga gacgctatca 900 aacggagagg ggactttgaa atggatgtgg tggcaatggt gaatgacacg gtggccacga 960 tgatctcctg ctactacgaa gaccatcagt gcgaggtcgg catgatcgtg ggcacgggct 1020 gcaatgcctg ctacatggag gagatgcaga atgtggagct ggtggagggg gacgagggcc 1080 gcatgtgcgt caataccgag tggggcgcct tcggggactc cggcgagctg gacgagttcc 1140 tgctggagta tgaccgcctg gtggacgaga gctctgcaaa ccccggtcag cagctgtatg 1200 agaagctcat aggtggcaag tacatgggcg agctggtgcg gcttgtgctg ctcaggctcg 1260 tggacgaaaa cctgctcttc cacggggagg cctccgagca gctgcgcaca cgcggagcct 1320 tcgagacgcg cttcgtgtcg caggtggaga gcgacacggg cgaccgcaag cagatctaca 1380 acatcctgag cacgctgggg ctgcgaccct cgaccaccga ctgcgacatc gtgcgccgcg 1440 cctgcgagag cgtgtctacg cgcgctgcgc acatgtgctc ggcggggctg gcgggcgtca 1500 tcaaccgcat gcgcgagagc cgcagcgagg acgtaatgcg catcactgtg ggcgtggatg 1560 gctccgtgta caagctgcac cccagcttca aggagcggtt ccatgccagc gtgcgcaggc 1620 tgacgcccag ctgcgagatc accttcatcg agtcggagga gggcagtggc cggggcgcgg 1680 ccctggtctc ggcggtggcc tgtaagaagg cctgtatgct gggccagtga agccagctgc 1740 cttcccttta ctgtgggtta atgcttgcag cagacatgat aagatacatt gatgagtttg 1800 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 1860 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 1920 attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct 1980 acaaatgtgg taaaatccga taagggacta gagcagaagc ttttg 2025 <210> 165 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Wild-type insulin signal sequence <400> 165 Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu 1 5 10 15 Trp Gly Pro Asp Pro Ala Ala Ala 20 <210> 166 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> IL-6 signal sequence <400> 166 Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu 1 5 10 15 Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro 20 25 <210> 167 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Fibronectin signal sequence <400> 167 Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys 1 5 10 15 Leu Gly Thr Ala Val Pro Ser Thr Gly Ala 20 25

Claims

(i) 신호 펩티드를 코딩하는 뉴클레오티드 서열로서, 임의로 여기서 신호 펩티드는 야생형 프리프로인슐린 신호 서열이 아닌 것인 뉴클레오티드 서열, 및 (ii) 야생형 프로인슐린에서의 상응하는 아미노산 위치에 비해 인간 인슐린 B-쇄의 아미노산 B10, B28, 및/또는 B29, 인간 인슐린 C-쇄의 C1 및/또는 C32, 또는 이들의 임의의 조합으로부터 선택되는 위치에 아미노산 변형을 포함하는 프로인슐린 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는, 인간 인슐린 (Ins) 단백질을 코딩하고, 임의로 푸린 절단 부위를 추가로 포함하는 폴리뉴클레오티드.
인간 인슐린 (Ins) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은 (a) 서열식별번호: 43-57, 110-116, 150-151, 154-155 또는 157-159 중 어느 것의 핵산 73-330, 서열식별번호: 117-122, 152 또는 156 중 어느 것의 핵산 88-345, 또는 서열식별번호: 153의 핵산 79-336; 또는 (b) 서열식별번호: 43-57, 서열식별번호: 110-122, 또는 서열식별번호: 150-159 중 어느 하나와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 오픈 리딩 프레임 (ORF)을 포함하는 것인 폴리뉴클레오티드.
제2항에 있어서, 코딩된 인간 Ins 단백질이 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 서열식별번호: 145의 아미노산 25-110, 서열식별번호: 41, 서열식별번호: 144, 또는 서열식별번호: 145 중 어느 것의 아미노산 서열을 포함하는 것인 폴리뉴클레오티드.
제2항 또는 제3항에 있어서, 인간 Ins 단백질이 신호 펩티드를 포함하는 것인 폴리뉴클레오티드.
제1항 또는 제4항에 있어서, 신호 펩티드가 야생형 프리프로인슐린 신호 서열, IL-6 신호 서열, 또는 피브로넥틴 신호 서열인 폴리뉴클레오티드.
제5항에 있어서, 신호 펩티드가 서열식별번호: 41의 아미노산 25-110, 서열식별번호: 144의 아미노산 25-110, 또는 서열식별번호: 145의 아미노산 25-110을 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제6항 중 어느 한 항에 있어서, 인간 Ins 단백질이 절단 부위를 추가로 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제7항 중 어느 한 항에 있어서, 핵산이 서열식별번호: 42의 핵산 5-329와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제8항 중 어느 한 항에 있어서, 핵산이 서열식별번호: 42, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제9항 중 어느 한 항에 있어서, 핵산이 서열식별번호: 60, 서열식별번호: 97, 서열식별번호: 98, 서열식별번호: 99, 서열식별번호: 100, 또는 서열식별번호: 101, 또는 서열식별번호: 149와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 3' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제10항 중 어느 한 항에 있어서, 3' UTR이 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI로 이루어진 군으로부터 선택되는 제한 부위를 추가로 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제11항 중 어느 한 항에 있어서, 인간 Ins 단백질을 코딩하는 적어도 2개의 오픈 리딩 프레임 (ORF)을 포함하는 폴리뉴클레오티드.
제12항에 있어서, 적어도 2개의 ORF가 IRES 서열에 의해 작동가능하게 연결된 것인 폴리뉴클레오티드.
제13항에 있어서, IRES 서열이 서열식별번호: 142 또는 서열식별번호: 143과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제10항 중 어느 한 항에 있어서, 핵산이
(a) 서열식별번호: 1-16 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제11항 중 어느 한 항에 있어서, 핵산이
(a) 서열식별번호: 84-88 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 것인 폴리뉴클레오티드.
제12항 내지 제14항 중 어느 한 항에 있어서, 핵산이
(a) 서열식별번호: 124-126, 130-132, 및 139-141 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 것인 폴리뉴클레오티드.
제1항 내지 제17항 중 어느 한 항에 있어서, 핵산이 프로모터에 작동가능하게 연결된 것인 폴리뉴클레오티드.
제1항 내지 제18항 중 어느 한 항의 폴리뉴클레오티드 및 핵산 서열에 작동가능하게 연결된 이종 발현 제어 서열을 포함하는 발현 카세트.
제19항에 있어서, 이종 발현 제어 서열이 프로모터인 발현 카세트.
제20항에 있어서, 프로모터가 진핵 프로모터인 폴리뉴클레오티드 또는 발현 카세트.
제21항에 있어서, 프로모터가 CMV 프로모터인 폴리뉴클레오티드 또는 발현 카세트.
제1항 내지 제22항 중 어느 한 항에 있어서, 핵산이 폴리아데닐화 (폴리A) 요소에 작동가능하게 연결된 것인 폴리뉴클레오티드 또는 발현 카세트.
제1항 내지 제23항 중 어느 한 항의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터.
제24항에 있어서, 벡터가 바이러스 벡터, 비-바이러스 벡터, 플라스미드, 지질, 또는 리소좀인 벡터.
제24항에 있어서, 벡터가 아데노-연관 바이러스 (AAV) 벡터 또는 렌티바이러스 벡터인 벡터.
AAV 캡시드 및 제1항 내지 제23항 중 어느 한 항의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 게놈을 포함하는 재조합 AAV (rAAV) 입자.
제26항 또는 제27항에 있어서, AAV 혈청형이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVRH8, AAVrh9, AAV9, AAVrh10, AAV10, AAVRH10, AAV11, AAV12로 이루어진 군으로부터 선택되는 것인 벡터 또는 rAAV 입자.
제1항 내지 제28항 중 어느 한 항에 있어서, 신호 펩티드가 IL-6 신호 펩티드 또는 피브로넥틴 신호 펩티드인 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자.
제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 포함하는 숙주 세포.
제30항에 있어서, 숙주 세포가 포유동물 세포인 숙주 세포.
세포를 제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자와 접촉시키고/거나 이로 형질전환시키고, 그에 의해 세포에서 인간 Ins 단백질을 생산하는 것을 포함하는, 세포에서 인간 Ins 단백질을 생산하는 방법.
제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 대상체에게 투여하고, 그에 의해 대상체에서 인간 Ins 단백질을 생산하는 것을 포함하는, 대상체에서 인간 Ins 단백질을 생산하는 방법.
당뇨병과 연관된 증상의 치료 또는 개선을 필요로 하는 대상체에서 당뇨병과 연관된 증상을 치료하거나 개선시키는 방법으로서, 제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자의 치료 유효량을 대상체에게 전달하고, 그에 의해 대상체에서 당뇨병을 치료하는 것을 포함하는 방법.
제34항에 있어서, 당뇨병이 제1형 진성 당뇨병 (T1DM) 또는 제2형 진성 당뇨병 (T2DM)인 방법.
인간 글루코키나제 (Gck) 단백질을 코딩하는 핵산을 포함하는 폴리뉴클레오티드로서, 여기서 핵산은
(a) (a) 서열식별번호: 61-80 또는 162 중 어느 것의 핵산 1-1398; 또는 (b) 서열식별번호: 61-80 및 162 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 ORF를 포함하는 것인 폴리뉴클레오티드.
제36항에 있어서, 코딩된 인간 Gck 단백질이 서열식별번호: 82의 아미노산 서열을 포함하는 것인 폴리뉴클레오티드.
제36항 또는 제37항에 있어서, 핵산이 서열식별번호: 42의 핵산 5-329와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제36항 내지 제38항 중 어느 한 항에 있어서, 핵산이 서열식별번호: 42, 서열식별번호: 83, 서열식별번호: 146, 또는 서열식별번호: 148과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제36항 내지 제39항 중 어느 한 항에 있어서, 핵산이 서열식별번호: 60, 서열식별번호: 102, 서열식별번호: 103, 서열식별번호: 104, 서열식별번호: 105, 서열식별번호: 106, 서열식별번호: 107, 서열식별번호: 108, 서열식별번호: 109, 또는 서열식별번호: 149와 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함하는 3' UTR을 추가로 포함하는 것인 폴리뉴클레오티드.
제36항 내지 제40항 중 어느 한 항에 있어서, 3' UTR이 BamHI, EcoRI, NdeI, EcoRV, SpeI, XbaI, NheI, VspI, NsiI, ScaI, KpnI, SspI, 및 PacI로 이루어진 군으로부터 선택되는 제한 부위를 추가로 포함하는 것인 폴리뉴클레오티드.
제36항 내지 제40항 중 어느 한 항에 있어서, 핵산이
(a) 서열식별번호: 20-39 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 것인 폴리뉴클레오티드.
제36항 내지 제40항 중 어느 한 항에 있어서, 핵산이
(a) 서열식별번호: 89-96 및 163-164 중 어느 것 또는 이들의 임의의 조합으로부터 선택되는 서열과 적어도 85%, 90%, 95%, 99%, 또는 100% 동일한 뉴클레오티드 서열
을 포함하는 것인 뉴클레오티드.
제36항 내지 제43항 중 어느 한 항에 있어서, 핵산이 프로모터에 작동가능하게 연결된 것인 폴리뉴클레오티드.
제36항 내지 제44항 중 어느 한 항의 폴리뉴클레오티드 및 핵산 서열에 작동가능하게 연결된 이종 발현 제어 서열을 포함하는 발현 카세트.
제45항에 있어서, 이종 발현 제어 서열이 프로모터인 발현 카세트.
제46항에 있어서, 프로모터가 진핵 프로모터인 폴리뉴클레오티드 또는 발현 카세트.
제46항에 있어서, 프로모터가 CMV 프로모터인 폴리뉴클레오티드 또는 발현 카세트.
제36항 내지 제48항 중 어느 한 항에 있어서, 핵산이 폴리아데닐화 (폴리A) 요소에 작동가능하게 연결된 것인 폴리뉴클레오티드 또는 발현 카세트.
제36항 내지 제49항 중 어느 한 항의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터.
제50항에 있어서, 벡터가 바이러스 벡터, 비-바이러스 벡터, 플라스미드, 지질, 또는 리소좀인 벡터.
제51항에 있어서, 벡터가 아데노-연관 바이러스 (AAV) 벡터 또는 렌티바이러스 벡터인 벡터.
AAV 캡시드 및 제36항 내지 제49항 중 어느 한 항의 폴리뉴클레오티드 또는 발현 카세트를 포함하는 벡터 게놈을 포함하는 재조합 AAV (rAAV) 입자.
제52항 또는 제53항에 있어서, AAV 혈청형이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVRH8, AAVrh9, AAV9, AAVrh10, 및 AAV10, AAV11, AAV12로 이루어진 군으로부터 선택되는 것인 벡터 또는 rAAV 입자.
제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 포함하는 숙주 세포.
제55항에 있어서, 숙주 세포가 포유동물 세포인 숙주 세포.
세포를 제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자와 접촉시키고/거나 이로 형질전환시키고, 그에 의해 세포에서 인간 Gck 단백질을 생산하는 것을 포함하는, 세포에서 인간 Gck 단백질을 생산하는 방법.
제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 대상체에게 투여하고, 그에 의해 대상체에서 인간 Gck 단백질을 생산하는 것을 포함하는, 대상체에서 인간 Gck 단백질을 생산하는 방법.
당뇨병과 연관된 증상의 치료 또는 개선을 필요로 하는 대상체에서 당뇨병과 연관된 증상을 치료하거나 개선시키는 방법으로서, 제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자의 치료 유효량을 대상체에게 전달하고, 그에 의해 대상체에서 당뇨병을 치료하는 것을 포함하는 방법.
제59항에 있어서, 당뇨병이 제1형 진성 당뇨병 (T1DM) 또는 제2형 진성 당뇨병 (T2DM)인 방법.
당뇨병과 연관된 증상의 치료 또는 개선을 필요로 하는 대상체에서 당뇨병과 연관된 증상을 치료하거나 개선시키는 방법으로서, (i) 제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자 및 (ii) 제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자의 치료 유효량을 대상체에게 전달하고, 그에 의해 대상체에서 당뇨병을 치료하는 것을 포함하는 방법.
인간 Ins 단백질 및 인간 Gck 단백질의 생산을 필요로 하는 대상체에서 인간 Ins 단백질 및 인간 Gck 단백질을 생산하고/거나 당뇨병과 연관된 증상의 치료 또는 개선을 필요로 하는 대상체에서 당뇨병과 연관된 증상을 치료하거나 개선시키는 방법으로서, (i) 제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자 및 (ii) 제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자를 포함하는 복수의 폴리뉴클레오티드, 복수의 발현 카세트, 복수의 벡터, 또는 복수의 rAAV 입자를 대상체에게 투여하고, 그에 의해 대상체에서 인간 Ins 단백질 및 인간 Gck 단백질을 생산하고/거나 당뇨병을 치료하는 것을 포함하는 방법.
제61항 또는 제62항에 있어서, 당뇨병이 제1형 진성 당뇨병 (T1DM) 또는 제2형 진성 당뇨병 (T2DM)인 방법.
제61항 내지 제63항 중 어느 한 항에 있어서, (i) 제1항 내지 제29항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자 및 (ii) 제36항 내지 제54항 중 어느 한 항의 폴리뉴클레오티드, 발현 카세트, 벡터, 또는 rAAV 입자가 동시에 또는 순차적으로 투여되는 것인 방법.
제32항 내지 제35항, 제57항 내지 제60항, 및 제61항 내지 제64항 중 어느 한 항에 있어서, 전달 및/또는 투여가 근육내인 방법.
제32항 내지 35항, 제57항 내지 제60항, 및 제61항 내지 제65항 중 어느 한 항에 있어서, (i) 당화 혈액 헤모글로빈 (HbA1c) 수준이 대상체에서 감소되고/거나 조절되거나; (ii) 순환 케톤이 대상체에서 감소되거나, (iii) 트리글리세리드가 대상체에서 감소되거나, 또는 (iv) 이들의 임의의 조합인 방법.