KR20140026478A

KR20140026478A - G-단백질 결합된 수용체들의 결정화를 목적으로 새로운 융합 짝들

Info

Publication number: KR20140026478A
Application number: KR1020137029904A
Authority: KR
Inventors: 마이클 에이. 핸슨; 크리스토퍼 비. 로스; 레이몬드 씨. 스티븐스; 조슈아 엠. 쿤켄; 마크 티. 그리피스; 아론 에이. 톰슨; 웨이 리우; 페이 쉬; 브세볼로드 카트리체
Original assignee: 레셉토스, 인코포레이티드; 더 스크립스 리서치 인스티튜트
Priority date: 2011-05-13
Filing date: 2012-05-11
Publication date: 2014-03-05
Also published as: WO2012158555A3; US20170218047A1; EP2707395A2; SG194522A1; EP2707395B1; AU2012256101A8; CA2832739A1; US20120288913A1; JP2014516963A; IL228790A0; CN103874711A; AU2012256101A1; EA201391514A1; WO2012158555A2; EP2707395A4; NZ617631A

Abstract

GPCR의 5번째와 6번째 나선 사이에서 GPCR의 세 번째 세포내 루프의 일부 또는 전부를 대체한 루브레독신, 사이토크롬 b562 RIL (Bril, bRIL, BRIL), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈와 같은 융합짝들과 GPCR의 G 단백질 연결된 수용체들을 포함하는 GPCR-융합 짝 단백질들이 설명되며, 또는 GPCR의 C-말단에 부착된다. 결정 형태의 GPCR-융합 짝 단백질들, GPCR의 X-선 결정학적 구조 결정에 선택적으로 적합한 성질의 결정 형태의 GPCR-융합 짝 단백질들이 설명된다. GPCR의 X-선 결정학적 구조 결정을 위하여 GPCR-융합 짝 단백질들의 결정화를 지원하기 위하여 GPCR-융합 짝 단백질들에서 융합 짝들을 이용하는 방법들이 설명된다. 단백질 데이터 뱅크의 선별을 통하여 기타 적합한 융합 짝들을 확인하는 방법들 또한 설명된다.

Description

G-단백질 결합된 수용체들의 결정화를 목적으로 새로운 융합 짝들{NOVEL FUSION PARTNERS FOR THE PURPOSE OF CRYSTALLIZING G-PROTEIN COUPLED RECEPTORS}

관련 출원들

본 출원은 2011년 5월 13일자로 제출된 미국 가출원 번호 61/485,872 및 2012년 3월 30일자로 제출된 미국 가출원 번호 61/618,424를 우선권으로 주장하며, 이들 각각은 전문이 여기에 참고자료로 편입된다.

연방정부 지원된 연구 및 개발에 대한 진술

미국 정부는 National Institutes of Health, National Institute of General Medical Sciences (NIH NIGMS)에 의해 부여되는 허가 번호 P50 GM073197에 따라 본 발명에 대해 특정 권리를 보유한다.

발명의 분야

G 단백질 연결된 수용체들(GPCR)의 세포내 도메인의 일부를 대신하여 융합 짝(partner)을 보유하는, 또는 GPCR의 N 또는 C 말단에 부착된 융합 짝을 보유하는 G 단백질 연결된 수용체들 (GPCR)을 포함하는 융합 짝 단백질, 이때 이러한 융합 짝 단백질은 이러한 GPCR의 구조적 측정을 지원하는 회절 특징 결정의 형성에 잘 따른다.

관련 기술의 설명

G-단백질 연결된 수용체들은 다양한 구조적 그리고 기능적 속성을 공유하는 광범위한 분류의 막-결합된 단백질들을 포함한다(Friedricksson et al. Mol. Pharmacol. 63(6): 1256-1272, 2003; 및 Friedricksson et al., Mol. Pharmacol. 67(5): 1414-1425, 2005). GPCR은 6개 분류중 1개로 분류된다: A, B, C, D, E, 및 F, Friedricksson et al. (2003) 및 Friedricksson et al. (2005) 참고. GPCR은 7가지 막통과 나선 부분들과 내생성(endogenous) 리간드들에 결합하는 세포외(extracellular) 부분을 포함한다. 이 세포외 리간드 결합 도메인은 흔히 GPCR 기능을 조절하는 제약학적 물질에 대한 표적 부위다.

단백질들의 결정화(Crystallization)를 실시하여 이 단백질의 정확한 3차 구조, 가령, 활성 부위 또는 리간드-결합 부위를 만들기 위하여 고-해상 구조 분석이 허용되는 결정 구조를 얻을 수 있는데, 이때 이러한 구조적 정보를 이용하여 이 단백질의 기능 및 거동을 예측할 수 있다. X-선 결정학에 의한 결정화 및 구조 결정은 결정화 스크린에서 안정적이며 고도로 정제되고 농축된 수용체로부터 일관성있게 성장하는 잘-회절되는 결정들을 필요로 한다. GPCR들은 정제에 이용되는 세제 미셀 안에서 종종 불안정하기 때문에 변형안된 형태(unmodified form)로 결정화하는데 어려움이 있고, 그리고 결정 접촉을 형성하는데 이용되는 충분한 단백질 표면적이 부족할 수 있다.

융합 짝이 단백질로의 통합을 이용하여 변형안된 형태로 결정화시키는데 어려운 단백질들의 결정화를 뒷받침하여왔었다. (Engel; et al ., "Insertion of carrier proteins into hydrophilic loops of the Escherichia coli lactose permease," Biochemica et Biophysica Acta (2002), 1564:38-46; Prive, "Fusion proteins as Tools for Crystallization: the Lactose Permease from Escherichia coli," Acta Cryst. (1994), D50:375-379; Prive; et al ., "Engineering the Lac Permease for Purification and Crystallization," Journal of Bioenergetics and Biomembranes (1996), 28(1):29-34).

T4 라이소자임 (T4L)은 바람직한 생화학적, 약리학적 그리고 구조적 성질들을 유지하여 GPCR 융합 단백질에서 융합 짝으로 이용되어 왔고, 결정화될 수 있다. T4L은 수용체 안정화 및 결정화에 보조물로써 β2-아드레날린성 수용체 (β2AR) 및 A2A-아데노신 수용체 (A2A)의 이용가능한 세포내 루프 안에 융합 짝으로 통합되어, 생성된 GPCR 융합 단백질들의 구조 결정을 한다. T4L이 포함되면 이들 두 수용체들의 발현, 정제 및 결정화가 상당히 개선되었다는는 것이 밝혀졌다. (Cherezov, V., Rosenbaum, D.M., Hanson, M.A., Rasmussen, S. G., Thian, F. S., Kobilka, T.S., Choi, H.J., Kuhn, P., Weis, W.I., Kobilka, B.K., and Stevens, R.C., "High-resolution crystal structure of an engineered human beta2-adrenalin G protein-coupled receptor," Science 318: 1258-1265, 2007 (Cherezov et al., 2007); Rosenbaum, D.M., Cherezov, V., Hanson, M.A., Rasmussen, S. G., Thian, F. S., Kobilka, T.S., Choi, H.J., Yao, X.J., Weis, W.I., Stevens, R.C., and Kobilka, B.K., "GPCR engineering yields high-resolution structure insights into beta2-adrenalic receptor function," Science 318: 1266-1273, 2007 (Rosenbaum et al . 2007); Jaakola, E.P. et al. "The 2.6 angstrom crystal structure of a human A2A adenisine receptor bound to an antagoinst," Science 322:1211-1217 , 2008 (Jaakola et al ., 2008); U.S. Patent No. 7,790,950 B2, PCT Publication WO 2009/055509 A2) β2AR(확산성 호르몬들 및 신경전달물질들에 반응하는 GPCR의 잘-연구된 표준)의 구조적 유연성을 극복하고, 결정화를 용이하게 실행하기 위하여, T4L이 GPCR의 세 번째 세포내 루프의 대부분을 대체하도록 β2AR 융합 단백질을 조작하여, 대체로-고유한 약리학 성질들을 보유하는 β2AR-T4L이 만들어지고, 그리고 고-해상 구조 분석을 위하여 결정화될 수 있다. 2.4 해상도에서 부분적으로 역 항진물질 크라졸올(partial inverse agonist carazolol)에 결합된 인간 β2AR-T4L의 결정 구조가 결정되었고, 그리고 이 구조는 확산성 리간드에 결합된 인간 G 단백질-연결된 수용체의 고-해상 뷰를 제공하였고, 이는 리간드-결합 부위 접근성이 두 번째 세포외 루프에 의해 가능하다는 것이 설명되었으며, 이는 공간적으로 근접해있는 이황화결합 다리 한쌍과 루프내 짧은 나선 분절(segment)에 의해 결합 공동(cavity) 밖에서 유지된다(Cherezov et al., 2007, Science 318:1258). β2AR-T4L의 보고된 고-해상 구조 배경내에서 아드레날린성 수용체 리간드-결합 돌연변이체들의 분석으로 카테콜아민 항진물질들을 수용하는데 요구되는 역-항진물질 결합 및 구조적 변화에 대한 식견을 제공한다. (Rosenbaum et al. 2007, Science 318:1266)

발명의 간단한 요약

본 발명은 GPCR과 융합 짝들, 가령, 루브레독신(rubredoxin), 사이토크롬 b₅₆₂ RIL (Bril, bRIL, BRIL), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 크실라네이즈(xylanase), 또는 본 발명의 방법에 따라 선택된 기타 융합 짝들과 복합된 융합 짝 단백질들을 포함하는 조성물들을 특정 구체예들에서 제공한다. 특정 구체예들에서 융합 짝은 GPCR의 5번째와 6번째 나선 사이의 GPCR의 3번째 세포내 루프의 일부 또는 전부를 대체한다. 기타 특정 구체예들에서, 이 융합 짝은 GPCR의 C-말단 또는 N-말단에 부착된다. 기타 특정 구체예들에서 GPCR의 C-말단 또는 N-말단은 절두(truncated)되고, 그리고 이 융합 짝은 이러한 절두된 말단에 부착된다. 특정 구체예들에서 이 융합 짝 단백질은 결정 형태이다. 추가 구체예들에서 이러한 결정들은 GPCR의 X-선 결정성 구조 판단에 적합한 특성이다. 특정 구체예들에서 이러한 구조(또는 이의 일부분)은 최소한 3.5 내지 최소한 1.5 의 해상도로 수득될 수 있다. 특정한 추가적인 비-제한적 구체예들에서, 이러한 구조(또는 이의 일부는 최소한, 3.5 Å , 3.4 Å, 3.3 Å, 3.2 Å, 3.1 Å, 3.0 Å , 2.9 Å, 2.8 Å, 2.7 Å, 2.6 Å, 2.4 Å, 또는 2.4 Å 의 해상도로 얻을 수 있다.

특정 구체예들에서 본 발명은 결정 형태의 GPCR을 준비하는 방법을 제공하는데, 이 방법은 N-말단으로부터 GPCR의 첫 5개의 막통과 도메인들, 융합 짝 도메인, 그리고 이러한 GPCR의 6번째와 7번째 막통과 도메인들을 포함하는 아미노산 서열의 발현에 적합한 뉴클레오티드 서열을 준비하는 것을 포함한다.

특정 구체예들에서, 본 발명은 본 발명에 따른 용도의 추가 평가를 위하여 적합한 후보 융합 짝을 선택하는 방법을 제공한다. 이러한 특정 구체예들에서, 본 발명은 다음 기준들중 하나 또는 그 이상에 부합되는 후보 융합 짝들을 선택하는 단계를 포함하는 후보 융합 짝들에 대해 이용가능한 데이터에 대해 다수의 후보 융합 짝들을 스크리닝하는 과정을 포함하는 방법을 제공한다: (i) 15 Å, 또는 10 Å, 또는 5 Å에 의해 분리된 N과 C 말단을 보유함; (ii) 25kD 미만 (또는 20kD 또는 15kD)의 분자량을 가짐; (iii) 최소한 3 Å 또는 2.9 Å 또는 2.8 Å 또는 2.7 Å 또는 2.6 Å 또는 2.5 Å 또는 2.4 Å 또는 2.3 Å의 회절 해상도로 결정화될 수 있다고 설명됨; (iv) 한 가지 이상의 화학적 조건에서 결정을 형성할 수 있는 능력이 있음; 그리고 (v) 한 개 이상의 스페이스 기를 보유하는 결정들을 만들 수 있는 능력이 있음. 특정 구체예들에서, 상기 방법들은 상기(i)로 표시된 기준 없이 실시된다.

도 1A-1F는 β2AR-융합 짝 단백질들을 만들기 위하여, β2-아드레날린성 수용체 (β2AR) 안으로 삽입된 후보 융합 짝들의 패널과 관련된 데이터를 보여주는데, 이때 도 1A-1E는 리간드 존재하에 (티몰올-NA로 라벨됨) 그리고 리간드 없이(NA-NA로 표시됨) 각 β2AR-융합 짝 단백질의 추출 및 1차 정제 그리고 β2AR-융합 짝 단백질들의 리간드-결합된 종들의 2차 정제 (티몰올-Ni로 라벨됨)에 대응하는 SEC 데이터를 보여주고, 그리고 도 1F는 각 β2AR-융합 짝 단백질의 최종 정제된 산물에 대해 10% 겔 상에서의 SDS-PAGE를 보여주는데, 좌측에서 우측 방향으로, MW 표준들, β2AR-T4L, β2AR-C-term-T4L, β2AR-Bril, β2AR-루브레독신, β2AR-크실라네이즈, 그리고 β2AR-플라보독신이다.
도 2A-2F는 안정화된 β2AR-사이토크롬 B562 융합 짝 단백질 (β2AR-Bril) 결정화 및 예비 회절과 관련된 데이터를 보여주는데, 이때 도 2A-2C는 β2AR-Bril 구조체가 발현되고, 정제되어(도 2A, 단백질의 양을 보여주는 상이한 농도의 분취액의 분석학적 SEC 추적; 도 2B, 존재하는 단백질 양에 대해 표준화된 상이한 농도들로부터 취한 분취액의 SEC 추적), 고품질 단분산(high quality monodisperse) 단백질이 생성되며(도 2C, SEC 이후 β2AR-Bril의SDS-PAGE), 그리고 도 2D-2F는 정제된 β2AR-Bril가 결정을 형성할 수 있고, 한 크기에서 커지는 큰, 복굴절(birefringent)의 결정이 얻어지고(도 2D, β2AR-Bril 결정의 복굴절을 보여주는 디지털화된 영상) 그리고 트립토판 형광(도 2E, β2AR-Bril 결정의 트립토판 형광을 보여주는 디지털화된 영상) 그리고 회절 (도 2F, β2AR-Bril 결정의 회절의 디지털화된 영상)에 의해 단백질 결정을 확인하였다는 것을 보여준다.
도 3A-3B는 결정성 첨가제 트리-메틸 아민 N-산화물의 포함으로 인한 β2AR-Bril 결정과 관련된 데이터를 보여주는데, 이는 우수한 결정 성장 및 회절 성질을 야기하고, 이때 도 3A는 존재하는 트리-메틸 아민 N-산화물 첨가제와 함께 최적화된 조건하에 수득된 β2AR-Bril 결정의 디지털화된 영상을 보여주고, 도 3B는 회절 결과 이들 결정은 x-선을 2.8 Å의 명목적 해상도로 회절시킨다는 것을 보여준다.
도 4A-4D는 아데노신 A2A 수용체 (A2A)로 삽입된 후보물질 융합 짝들의 패널과 관련된 데이터를 보여주는데, 이때 도 4A는 좌측에서 우측 방향으로, 맨 좌측 MW 표준, A2A-BRIL, A2A-플라보독신, A2A-T4L-Cterm, A2A-루브레독신, A2A-크실라네이즈, A2A-T4L의 발현 및 정제를 특징화하는 10% SDS-PAGE 겔의 디지털화된 영상이며, 도 4B는 단분산(monodispersity) 및 동질성 분석용으로 각 A2A-융합 짝 단백질의 분석학적 크기 압출 크로마토그래피(aSEC)용 추적(280nm에서 UV 흡수로 측정된 단백질 수준)를 나타내며, 그리고 도 4C 및 4D는 A2A 길항물질 ZM241285 존재하에 (도 4C) 그리고 A2A 항진물질 UK432097 존재하에 (도 4D) A2A-BRIL, A2A-플라보독신, A2A-루브레독신, 및 A2A-T4L에 대한 공지의 아데노신 A2A 수용체 리간드의 안정화 유도를 측정하는 열 변성 분석의 데이터를 나타낸다.
도 5는 항진물질 UK432097에 결합된 β2AR-BRIL 결정들의 디지털화된 영상을 보여준다.
도 6A-6B는 NOP1 수용체 안으로 삽입된 후보물질 융합 짝 패널과 관련된 데이터를 보여주는데, 이때 도 6A는 좌측에서 우측으로, NOP1-BRIL, NOP1-플라보독신, NOP1-T4L-Cterm, NOP1-루브레독신, NOP1-크실라네이즈, NOP1-T4L-727, NOP1-T4L-722, MW 표준, NOP1-37A의 발현 및 정제를 특징화하는, 항-FLAG 항체로 프로브된 10% SDS-PAGE 겔의 웨스턴 블랏의 디지털화된 영상이며, 그리고 도 6B는 단분산 및 동질성 분석용으로 각 NOP1-융합 짝 단백질의 분석학적 크기 압출 크로마토그래피(aSEC)용 추적을 나타낸다.
도 7A-7B는 NOP1-BRIL, NOP1-플라보독신, 그리고 NOP1 고유한 IL3-37A (대조군) in 도 7A에서는 NOP1-BRIL, NOP1-플라보독신, 그리고 NOP1 고유한 IL3-37A (대조군)에 대한 결과들과, NOP1-T4L 의 다중 변이체의 결과들(도 7B)을 비교하는, 열 변성 분석 결과들을 보여준다.
도 8A-8B는 CCR5 수용체 안으로 삽입된 후보물질 융합 짝 패널과 관련된 데이터를 보여주는데, 이때 도 8A는 좌측에서 우측으로, CCR5-BRIL ("1423 (CytB)"로 라벨됨), CCR5-플라보독신 ("1424 (Flavo-)"로 라벨됨), CCR5-T4L-Cterm ("1425 (T4L_C)"로 라벨됨), CCR5-루브레독신 ("1426 (Rubre-)"로 라벨됨), CCR5-크실라네이즈 ("1427 (크실라네이즈)"로 라벨됨), 그리고 MW 표준들의 발현 및 정제를 특징화하는, 항-FLAG 항체로 프로브된 10% SDS-PAGE 겔의 웨스턴 블랏의 디지털화된 영상이며, 그리고 도 6B는 단분산 및 동질성 분석용으로 CCR5-T4L, CCR5-BRIL ("CCR5-CytB"), CCR5-플라보독신, CCR5-T4L-Cterm (CCR5-T4L_C"로 라벨됨), CCR5-루브레독신, 그리고 CCR5-크실라네이즈의 분석학적 크기 압출 크로마토그래피(aSEC)용 추적을 나타낸다.
도 9는 본 발명의 방법들의 적용을 통하여 확인된 적합한 융합 짝으로 제안되는 가용성 단백질 도메인들의 세트를 확인하는 표다.

방법들과 조성물들이 제공된다. 조성물들은 GPCR과 융합 짝이 복합된 융합 짝 단백질들을 포함하는 조성물의 형태로 제공되며, 이때 이 융합 짝은 여기에서 제시된 원칙에 따라 선택된다. 특정 구체예들에서, 이 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈로부터 선택된다. 특정 구체예들에서 이 융합 짝 단백질 아미노산 서열은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈중 하나에 최소한 90% 상동성인 서열이다. 특정 구체예들에서 이 융합 짝 단백질 아미노산 서열은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈중 하나에 최소한 70% 상동성인 서열이며, 그리고 이러한 융합 짝의 고유한 형태와 폴드 유사성을 설명한다.

여기에서 설명되는 것과 같이 GPCR은 자연적으로 생성되는 GPCR 뿐만 아니라 이의 변이체들을 모두 포함하고, 그리고 하나 또는 그 이상의 세포내 또는 세포외 영역들 또는 한쪽 말단 또는 양쪽 말단에 치환들 또는 결손들을 가진 GPCR의 7개 막 통과 도메인들을 보유하는 단백질들을 포함할 수 있다. 특정 구체예들에서 본 발명은 5번째와 6번째 막통과 도메인들 사이에서 세포내 도메인중 일부 또는 실질적으로 전부를 대체한 융합 짝과 GPCR을 포함하는 융합 짝 단백질 구조체를 제공한다. 특정 구체예들에서, 본 발명은 GPCR 또는 C-말단 및/또는 N-말단에서 절두된 GPCR과 이러한 GPCR 또는 절두된 GPCR의 C-말단 또는 N-말단에 부착된 융합 짝을 포함하는 융합 짝 단백질 구조체를 제공한다.

GPCR의 결정학적 구조 연구에 적합한, 가령, GPCR-융합 짝 단백질의 X-선 결정학에 의해 GPCR의 구조 결정을 위한 단백질의 결정화를 지원하기 위한 새로운 융합 짝을 이용하는 방법들을 제공한다. 본 방법들로부터 생성된 조성물들이 제공된다.

GPCR-융합 짝 단백질을 형성하기 위하여 세포내 도메인 안에 융합 짝을 결합시키고, GPCR-융합 짝 단백질을 발현 및 정제하고, 이어서 정제된 GPCR-융합 짝 단백질을 결정화하고, 결정화된 GPCR-융합 짝 단백질의 결정학적 구조 연구를 실시하고, 그리고 결정화된 GPCR-융합 짝 단백질의 결정학적 구조 연구로부터 GPCR의 구조적 특징들을 결정함으로써, GPCR의 결정학적 구조 연구에 적합한 단백질의 결정화를 지원하는 새로운 융합 짝을 이용하는 방법들이 제공되는데, 이때 이 융합 짝은 루브레독신, 사이토크롬 b562 RIL (Bril), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈의 아미노산 서열로부터 선택된 아미노산 서열을 포함한다.

GPCR-융합 짝 단백질을 형성하기 위하여 GPCR의 N-말단 또는 C-말단에 융합 짝을 부착시키고, GPCR-융합 짝 단백질을 발현 및 정제하고, 이어서 정제된 GPCR-융합 짝 단백질을 결정화하고, 결정화된 GPCR-융합 짝 단백질의 결정학적 구조 연구를 실시하고, 그리고 결정화된 GPCR-융합 짝 단백질의 결정학적 구조 연구로부터 GPCR의 구조적 특징들을 결정함으로써, GPCR의 결정학적 구조 연구에 적합한 단백질의 결정화를 지원하는 새로운 융합 짝을 이용하는 방법들이 제공되는데, 이때 이 융합 짝은 루브레독신, 사이토크롬 b562 RIL (Bril), T4 라이소자임 C-말단 단편 (Cterm-T4L), 플라보독신, 또는 크실라네이즈의 아미노산 서열로부터 선택된 아미노산 서열을 포함한다.

결정학적구조 연구에 적합한 GPCR-융합 짝 단백질들을 만들기 위하여, GPCR-융합 짝 단백질들의 결정화를 개선하기 위한 새로운 융합 짝들을 이용하는 방법들이 제공된다. GPCR-융합 짝 단백질들의 결정화를 지원하기 위하여, GPCR-융합 짝 단백질들의 발현을 개선시키기 위한 새로운 융합 짝들을 이용하는 방법들이 제공된다. GPCR-융합 짝 단백질들의 결정화를 지원하기 위하여, GPCR-융합 짝 단백질들의 정제를 개선시키기 위한 새로운 융합 짝들을 이용하는 방법들이 제공된다.

결정화 및 X-선 결정학에 의한 구조 측정을 위한 바람직한 생화학 및 구조적 성질들을 보유하는 GPCR-융합 짝 단백질을 만들기 위하여 GPCR의 이용가능한 세포내 루프 안으로 결합시키기 위한 잠재적으로 새로운 융합 짝들을 확인, 예측, 선택, 선별 및 평가하는 방법들을 제공한다. GPCR-융합 짝 단백질들을 확인, 선택, 선별, 평가하는 방법들이 제공된다.

결정학적 구조 연구에 적합한 GPCR-융합 짝 단백질들의 결정화를 지원하기 위한 융합 짝으로 이용될 수 있는 새로운 단백질 구조들, 도메인 구조들, 단백질들, 폴리펩티드들, 도메인들, 또는 이의 등가물질들을 확인하기 위하여 데이터베이스를 조사, 선별, 그리고 마이닝(mining)하는 방법들이 제공된다.

결정학적 구조 연구에 적합한 GPCR-융합 짝 단백질들의 결정화를 지원하기 위하여 융합 짝들로 적합한 잠재적인 새로운 융합 짝들을 확인, 예측, 선택, 선별 그리고 평가하는 방법들이 제공된다. 이러한 특정 구체예들에서 이 융합 짝들은 T4L과 비교하였을 때 개선된 성과를 제공한다.

결정학적 구조 연구에 적합한 GPCR-융합 짝 단백질들의 결정화를 지원하기 위한 적합한 융합 짝을 제공할 수 있는 새로운 단백질 구조들, 도메인 구조들, 단백질들, 폴리펩티드들, 도메인들, 또는 이의 등가물질들을 확인하기 위하여 데이터베이스를 조사, 선별, 그리고 마이닝(mining)하는 방법들이 제공된다. 이러한 특정 구체예들에서 이 융합 짝들은 T4L과 비교하였을 때 개선된 성과를 제공한다.

결정화 및 결정학적 구조 연구를 위하여, 바람직한 생화학적 그리고 구조 성질들을 보유하는 GPCR-융합 짝 단백질들이 제공된다.

결정화 및 결정학적 구조 연구를 위하여, 바람직한 생화학적 및 구조 성질들을 보유한 GPCR-융합 짝 단백질들의 결정들이 제공된다.

결정화 및 X-선 결정학에 의한 구조 결정을 위한 바람직한 생화학적 그리고 구조적 성질을 보유한 GPCR-융합 짝 단백질을 만들기 위하여 GPCR의 이용가능한 세포내 루프 안에 결합시키기 위한 잠재적 새로운 융합 짝들을 확인하는 방법들이 제공된다. 확인을 위한 본 방법들에 따른 GPCR-융합 짝 단백질들이 제공된다.

결정화 및 X-선 결정학에 의한 구조 결정을 위한 바람직한 생화학적 그리고 구조적 성질을 보유한 GPCR-융합 짝 단백질을 만들기 위하여 GPCR의 이용가능한 세포내 루프 안에 결합시키기 위한, 또는 GPCR의 N-말단 또는 C-말단에 부착시키기 위한, 잠재적 새로운 융합 짝들을 선택하는 방법들이 제공된다. 선택을 위한 본 방법들에 따른 GPCR-융합 짝 단백질들이 제공된다.

결정화 및 X-선 결정학에 의한 구조 결정을 위한 바람직한 생화학적 그리고 구조적 성질을 보유한 GPCR-융합 짝 단백질을 만들기 위하여, GPCR의 이용가능한 세포내 루프 안에 결합시키기 위한, 또는 GPCR의 N-말단 또는 C-말단에 부착시키기 위한, 잠재적 새로운 융합 짝들을 선별하기 위한 방법들이 제공된다. 선별을 위한 본 방법들에 따른 GPCR-융합 짝 단백질들이 제공된다.

결정화 및 X-선 결정학에 의한 구조 결정을 위한 바람직한 생화학적 그리고 구조적 성질을 보유한 GPCR-융합 짝 단백질을 만들기 위하여, GPCR의 이용가능한 세포내 루프 안에 결합시키기 위한, 또는 GPCR의 N-말단 또는 C-말단에 부착시키기 위한 잠재적 새로운 융합 짝들을 평가하는 방법들이 제공된다. 후보 융합 짝들을 평가하기 위한 본 발명의 방법들에 따른 GPCR-융합 짝 단백질들이 제공된다.

대장균(E. coli) 플라보독신 (PDB ID:1AG9, MW: 20 kD), M. 튜베르쿨로시스(M. tuberculosis) 가상(hypothetical) 단백질, (PDB ID: 2ASF, MW: 15 kD), 대장균(E. coli) CHEY (PDB ID: 1JBE, MW: 14kD), 보스 타우루스(Bos taurus) BPT1 (PDB ID: 1G6X, MW: 7 kD), T4 라이소자임 C-말단 단편 ("Cterm-T4L" PDB ID: 2O7A, T4 엔테로박테리아 파아지, 14 kD); 플라보독신 (PDB ID: 1I1O, 데술포비브리오 불가리스(Desulfovibrio vulgaris), 돌연변이체 Y98H, 16kD); 사이토크롬 b₅₆₂RIL ("Bril" PDB ID: 1M6T, 대장균(Escherichia coli) 가용성 사이토크롬 b₅₆₂, 12 kD); 그리고 화학주성 단백질 cheA (PDB ID: 1TQG, 터모토가 마리티마(Thermotoga maritima)로부터 CheA 포스포트란스퍼라제 도메인, 11.9 kD)을 포함하나 이에 한정되지 않는, 새로운 융합 짝들을 이용하는 방법들이 제공된다. 특정 구체예들에서, 본 발명은 상기 융합 짝들중 임의의 것과 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 상동성을 가지는 융합 짝들을 제공하는데, 특정 구체예들에서 또한 이러한 융합 짝과 높은 수준의 폴드 유사성 또는 실질적으로 폴드 유사성을 보유하는 융합 짝들을 제공한다.

5-HT1A, 5-HT1B, 5-HT1D, 5-ht1e, 5-HT1F, 5-HT2A, 5-HT2B, 5-HT2C, 5-HT4, 5-ht5a, 5-HT6, 5-HT7, M1, M2, M3, M4, M5, A1, A2A, A2B, A3, 알파 1A-아드레노셉터(adrenoceptor), 알파 1B-아드레노셉터, 알파 1D-아드레노셉터, 알파 2A-아드레노셉터, 알파 2B-아드레노셉터, 알파 2C-아드레노셉터, 베타 1-아드레노셉터, 베타 2-아드레노셉터, 베타 3-아드레노셉터, C3a, C5a, C5L2, AT1, AT2, APJ, GPBA, BB1, BB2, BB3, B1, B2, CB1, CB2, CCR1, CCR2, CCR3, CCR4, CCR5, CCR6, CCR7, CCR8, CCR9, CCR10, CXCR1, CXCR2, CXCR3, CXCR4, CXCR5, CXCR6, CXCR7, CX3CR1, XCR1, CCK1, CCK2, D1, D2, D3, D4, D5, ETA, ETB, GPER, FPR1, FPR2/ALX, FPR3, FFA1, FFA2, FFA3, GPR42, GAL1, GAL2, GAL3, 그렐린(ghrelin), FSH, LH, TSH, GnRH, GnRH2, H1, H2, H3, H4, HCA1, HCA2, HCA3, 키스펩틴, BLT1, BLT2, CysLT1, CysLT2, OXE, FPR2/ALX, LPA1, LPA2, LPA3, LPA4, LPA5, S1P1, S1P2, S1P3, S1P4, S1P5, MCH1, MCH2, MC1, MC2, MC3, MC4, MC5, MT1, MT2, 모티린(motilin), NMU1, NMU2, NPFF1, NPFF2, NPS, NPBW1, NPBW2, Y1, Y2, Y4, Y5, NTS1, NTS2, 델타, 카파, 뮤(mu), NOP, OX1, OX2, P2Y1, P2Y2, P2Y4, P2Y6, P2Y11, P2Y12, P2Y13, P2Y14, QRFP, PAF, PKR1, PKR2, PRRP, DP1, DP2, EP1, EP2, EP3, EP4, FP, IP1, TP, PAR1, PAR2, PAR3, PAR4, RXFP1, RXFP2, RXFP3, RXFP4, sst1, sst2, sst3, sst4, sst5, NK1, NK2, NK3, TRH1, TA1, UT, V1A, V1B, V2, OT, CCRL2, CMKLR1, GPR1, GPR3, GPR4, GPR6, GPR12, GPR15, GPR17, GPR18, GPR19, GPR20, GPR21, GPR22, GPR25, GPR26, GPR27, GPR31, GPR32, GPR33, GPR34, GPR35, GPR37, GPR37L1, GPR39, GPR42, GPR45, GPR50, GPR52, GPR55, GPR61, GPR62, GPR63, GPR65, GPR68, GPR75, GPR78, GPR79, GPR82, GPR83, GPR84, GPR85, GPR87, GPR88, GPR101, GPR119, GPR120, GPR132, GPR135, GPR139, GPR141, GPR142, GPR146, GPR148, GPR149, GPR150, GPR151, GPR152, GPR153, GPR160, GPR161, GPR162, GPR171, GPR173, GPR174, GPR176, GPR182, GPR183, LGR4, LGR5, LGR6, LPAR6, MAS1, MAS1L, MRGPRD, MRGPRE, MRGPRF, MRGPRG, MRGPRX1, MRGPRX2, MRGPRX3, MRGPRX4, OPN3, OPN5, OXGR1, P2RY8, P2RY10, SUCNR1, TAAR2, TAAR3, TAAR4 , TAAR5, TAAR6, TAAR8, TAAR9, CCPB2, CCRL1, FY, CT, 칼시토닌 수용체-유사, CRF1, CRF2, GHRH, GIP, GLP-1, GLP-2, 글루카곤, 세크레틴(secretin), PTH1, PTH2, PAC1, VPAC1, VPAC2, BAI1, BAI2, BAI3, CD97, CELSR1, CELSR2, CELSR3, ELTD1, EMR1, EMR2, EMR3, EMR4P, GPR56, GPR64, GPR97, GPR98, GPR110, GPR111, GPR112, GPR113, GPR114, GPR115, GPR116, GPR123, GPR124, GPR125, GPR126, GPR128, GPR133, GPR143, GPR144, GPR157, LPHN1, LPHN2, LPHN3, CaS, GPRC6, GABAB1, GABAB2, mGlu1, mGlu2, mGlu3, mGlu4, mGlu5, mGlu6, mGlu7, mGlu8, GPR156, GPR158, GPR179, GPRC5A, GPRC5B, GPRC5C, GPRC5D, 프리즐화된(frizzled), FZD1, FZD2, FZD3, FZD4, FZD5, FZD6, FZD7, FZD8, FZD9, FZD10, SMO을 포함하나 이에 한정되지 않는, GPCR의 결정학적 구조 연구에 적합한 단백질의 결정화를 지원하는 새로운 융합 짝들을 이용하는 방법들이 제공된다. 평가되는 GPCR은 다음을 포함하나 이에 한정되지 않는다: Class A 로봅신-유사 GPCR; Class B 세크레틴-유사 GPCR; Class C 대사성(Metabotropic) 글루타메이트/페르몬 GPCR; cAMP 수용체들 서골코(Vomeronasal) 수용체들 (V1R 및 V3R); 그리고 맛(Taste) 수용체들 T2R. 평가되는 GPCR은 다음을 포함하나 이에 한정되지 않는다: 클라스 A GPCR, 클라스 B GPCR, 클라스 C GPCR, 클라스 D GPCR, 클라스 E GPCR, 그리고 클라스 F GPCR.

후보 GPCR은 β2-아드레날린성 수용체 (β2AR), A2A-아데노신 수용체 (A2A), S1P1, NOP1을 포함하는 오피오이드 수용체 (OLR), 케모킨 수용체 CXCR3 (CXCR3), 케모킨 수용체 CCR5 (CCR5), GLP1R, PTHR1, LPA1, LPA2, LPA3, S1P2, S1P3, S1P4, 및 S1P5를 포함하나 이에 한정되지 않는다.

평가 기준 및 매개변수들

잠재적 융합 짝들과 생성된 GPCR-융합 짝 단백질을 확인 및 평가하기 위하여, 단백질 데이터의 데이터베이스를 조사, 선별 또는 "마인(mine)하기 위한 다음의 기준중 최소한 일부를 이용하는 방법들이 본 명세서에서 제공된다. 한 측면에 따르면, 결정학적 구조 연구에 적합한 GPCR-융합 짝 단백질들의 결정화를 지원하기 위하여 적합한 융합 짝들을 제공하기 위한 잠재적 융합 짝을 확인하고 평가하기 위한 다음의 기준을 이용하는 방법들이 제공되는데, 특정 구체예들에서 융합 짝들 T4L과 비교하여 개선된 성능을 제공하는 융합 짝들이 포함된다. 처음 연구 기준은 하기 표 1에 있는 기준을 포함하나 이에 한정되지 않는다:

초기 조사 기준의 비-제한적 목록

조사 매개변수	잠재적 융합 짝을 위한 기준
N 및 C 말단의 상대적 위치	잠재적 융합 짝의 N 및 C 말단은 단지 15 Å 만큼 떨어져 있어야 한다.
정제된 단백질의 분자량	25 kD 미만
정제된 단백질의 결정 구조	잠재적 융합 짝의 결정은 3 Å 이상의 회절 해상도를 가져야 한다.
결정 형성을 위한 필요 조건들	잠재적 융합 짝의 결정은 최소한 두 가지 상이한 화학적 상태로 형성되어야 한다.
정제된 단백질의 결정 패킹	잠재적 융합 짝의 결정은 하나 이상의 스페이스 기를 야기한다.

잠재적 새로운 융합 짝을 선택하고 평가하는 추가 특징 또는 기준은 상대적인 특징들을 포함할 수 있는데, 가령, 크기(kD), 폴드의 수(폴드 다양성)과 같은 상이한 매개변수 값들을 보유한 잠재적 새로운 융합 짝들의 세트가 선택될 수 있다.

GPCR의 말단에 부착된 융합 짝으로써의 용도 평가를 위해 융합 짝들을 찾는 특정 구체예들에서, 이 융합 짝들 N 및 C 말단의 근접(proximity)에 대한 기준은 더 적은 비중으로 또는 비중없이 제공될 수 있다.

특정 구체예들에서, 본 발명은 본 발명에 따른 용도에 대한 추가 평가용으로 적합한 후보 융합 짝을 선택하는 방법을 제공한다. 이러한 특정 구체예들에서, 본 발명은 다음의 기준중 하나 또는 그 이상에 부합되는 후보 융합 짝을 선택하는 단계를 포함하는 이러한 후보 융합 짝에 대해 이용가능한 데이터에 대하여 다수의 후보 융합 짝들을 선별하는 과정을 포함한 방법이 제공된다: (i) 15 Å, 또는 10 Å, 또는 5 Å에 의해 분리된 N과 C 말단을 보유함; (ii) 25kD 미만 (또는 20kD 또는 15kD)의 분자량을 가짐; (iii) 최소한 3 Å 또는 2.9 Å 또는 2.8 Å 또는 2.7 Å 또는 2.6 Å 또는 2.5 Å 또는 2.4 Å 또는 2.3 Å의 회절 해상도로 결정화될 수 있다고 설명됨; (iv) 한 가지 이상의 화학적 조건에서 결정을 형성할 수 있는 능력이 있음; 그리고 (v) 한 개 이상의 스페이스 기를 보유하는 결정들을 만들 수 있는 능력이 있음. 특정 구체예들에서, 상기 방법은 상기 (i)로 표시된 기준 없이 실시된다. 특정 구체예들에서, 상기 방법은 다음의 추가 기준을 또한 적용함으로써 실시된다: (vi) 최소한 50% 알파-나선 함량을 가짐; 그리고 (vii) N-말단, 또는 C-말단 또는 N-말단과 C-말단 모두에서 알파-나선 도메인들을 가짐. 임의의 특정 이론에 결부되지 않고, 높은 알파-나선 함량은 융합 단백질의 안정화를 개선시키고, 그리고 폴딩을 교정할 수 있는 더 신속한 폴딩 속도(kinetics)와 관련있다고 제안된다. 추가적으로, 말단에서 알파-나선 도메인들은 GPCR의 인접 막통과 도메인의 알파-나선 모니프를 연결시켜 더 안정적인 폴딩을 촉진시킬 수 있는데, 특히, GPCR과 이 융합 짝의 알파-나선 도메인들의 연속성에 대해 접합(junction)이 선택된다면, 연속적인 알파-나선 도메인은 GPCR과 이 융합 짝 사이에 접합(또는 양쪽 접합들)에 걸쳐있다.

기준 (i) ~(vii)을 포함하는 본 발명의 방법들을 적용함으로써, 다음의 후보 융합 짝들이 확인되었다(Protein Data Bank IDs를 이용하여 열거함): 2rhf, 2ehs, 2ip6, 3i7m, 1x3o, 1u84, 1h75, 2huj, 1ysq, 3ls0, 2qr3, 1zuh, 2b8i, 2cgq, 3fxh, 3nph, 2o4d, 1tmy, 1vku, 그리고 2es9. 이러한 연구의 요약된 결과들과 기준 (i) ~(vii)에 부합되는 확인된 후보 융합 짝들은 도 9에 나타낸다.

잠재적 융합 짝들을 조사, 선별, 마이닝 및 확인

표 1에 열거된 기준을 최소한 만족시키는 잠재적 융합 짝에 대한 데이터베이스 입력을 위한 단백질 정보의 조사가능한 데이터베이스를 조사, 선별 및/또는 "마인(mine)"하기 위한 방법들이 제공된다. 여기에서 제공된 조사, 선별 및/또는 마이닝 방법들에서 이용된 기준들을 적어도 만족시키는 잠재적 융합 짝들을 확인하는 방법들이 본 명세서에서 제공된다. 결정학적 구조 연구에 적합한 GPCR-융합 짝 단백질들의 결정화용으로 적합한 융합 짝들을 제공하기 위하여, 여기에서 제공된 조사, 선별 및/또는 마이닝 방법들에서 이용된 기준들을 최소한 만족시키는 잠재적 융합 짝들을 확인하는 방법들이 본 명세서에서 제공된다. 특정 구체예들에서, T4L과 비교하였을 때, 개선된 성능을 가지는 융합 짝들이 제공된다.

예시적인 데이터베이스는 Protein Data Bank (PDB; Worldwide Protein Data Bank, www.wwpdb.org), JenaLib; ModBase; OCA; SCOP; CATH; Iditis을 포함하나 이에 한정되지 않는다.

잠재적 융합 단백질들의 실험적 유연성, 실험적 열 안정화를 포함하나 이에 국한되지 않은 매개변수들에 의해 잠재적 융합 단백질들을 추가 특징화하고, 호열성 생물(thermophiles)로부터 구조들을 사전선택하고, 그리고 공-인자 또는 금속 결합 필요조건들을 가진 단백질들은 배제할 수 있다.

본 명세서에서 제공된 데이터베이스 조사, 선별 및/또는 마이닝 방법들에 의해 확인된 잠재적 융합 짝들을 추가 평가하기 위한 방법들이 본 명세서에서 제공된다. 표 1의 비-제한적인 초기 조사 기준을 이용하여 확인된 각 잠재적 융합 짝에 대한 하나 또는 그 이상의 데이터베이스에서 제공된 정보를 평가하는데 추가 기준이 이용된다.

데이터베이스에 보관된(데이터베이스에 포함된 항목들) 분자 구조들의 수집물을 선별하기 위한 대상-지향적으로 구조화된 접근을 이용하는 방법들이 제공된다. 한 측면에 따르면, 대상-지향적으로 구조화된 접근은 호환적 형태로 데이터베이스에 보관된 분자 구조들("대상(objects)")을 선별하기 위해 제공되며, 그리고 실험적 조건들, 회절 해상도, 그리고 출처(authorship)와 같은 관련된 메타데이터의 조사를 포함하는 "대상들"에서 작업이 실행되고, 사용자들은 그래픽 유저 인터페이스(GUI)내에서 사용자들이 특징짓는 임의의 다양한 메타데이터에 근거하여 데이터베이스 항복을 프로그램적으로 필터 및/또는 선별한다. 또다른 측면에 따르면, 데이터베이스에 의해 제공되는 일부 속성들, 많은 속성들 또는 모든 속성들을 사용자가 조사할 수 잇는 인터페이스 대조군(control)과 함께 GUI가 제공된다.

비-제한적 구체예에서, Visual Studio Professional 2008 (Microsoft Corporation)을 이용하여 C# 프로그래밍 언어("C Sharp Language" 또는 "C# Language")의 Windows Presentation Foundation (WPF) 그래픽 서브시스템을 포함하는 .NET framework v.3.5 (Microsoft Corporation)을 레버리징하는, 현재 제공된 방법들을 실시하기 위한 어플리케이션을 개발한다. 추가 비-제한적 구체예에서, Windows Presentation Foundation (WPF)는 어플리케이션을 구축하기 위한 프로그래밍 모델을 제공하는 .NET framework v.3.5의 그래픽 서브시스템으로, 프로그램의 필터링 및/또는 백엔드 프로세싱과 같은 어플리케이션의 비즈니스 로직과 소프트웨어 클라이언트 어플리케이션의 그래픽 유저 인터페이스(GUI) 간을 구별할 수 있게 한다.

비-제한적 구체예에서, 대상-지향적으로 구조화된 접근을 이용하여 각 단백질 구조에 대한 PDBXML 파일에서 PDB 저장소에 보관된 분자 구조들을 선별하고, 그리고 단일 단백질 구조("대상")를 나타내는 각 PDBXML 파일은 XML 포맷과 필적되는 .Net 데이터 구조내에서 언급되며, 그리고 조작은 실험적 조건들, 회절 해상도, 그리고 출처(authorship)와 같은 관련된 메타데이터의 조사를 포함하는 "대상"에서 작업이 실행되고, 사용자들은 그래픽 유저 인터페이스(GUI)내에서 사용자들이 특징짓는 임의의 다양한 메타데이터에 근거하여 데이터베이스 항복을 프로그램적으로 필터 및/또는 선별한다. 또다른 비-제한적인 구체예에서, GUI는 사용자가 가령, RCSB 보관소와 같은 데이터베이스에 의해 제공되는 모든 속성들의 조사를 가능하게 하는 전략적 인터페이스 대조군들을 포함한다.

마이닝이 1회 또는 다수 발생될 수 있는 잠재적 융합 짝들에 대한 데이터베이스를 마이닝하는 방법들이 제공되고, 그리고 마이닝은 연속적 또는 간헐적이 될 수 있다. 데이터베이스를 마이닝하는 방법은 이용가능한 구조들을 조사하기 위한 데이터를 수집하기 위하여, 데이터베이스내에 포함된 항목들의 검색(retrieval)용으로 제공된다. 로컬 데이터 저장과 데이터베이스를 동조화시키는 방법들이 제공된다. 한 측면에 따르면, 데이터베이스내에 포함된 모든 항목들의 자동화된 검색, 데이터베이스내에 포함된 일부 항목들의 자동화된 검색, 데이터베이스내에 포함된 선택된 항목들의 자동화된 검색, 그리고 하나 또는 그 이상의 조사 기준을 만족시키는 항목들의 자동화된 검색을 포함하나 이에 한정되지 않는, 데이터베이스내에 포함된 항목들의 자동화된 검색(automated retrieval)을 위한 방법들이 제공된다. 데이터베이스 안에 최근 디포짓(새로운 항목들), 데이터베이스내에 포함된 항목들의 수정, 그리고 데이터베이스내에 포함된 항목들에 대한 추가 주석달기(annotations)를 포함하나 이에 한정되지 않는 업데이트의 검색용 방법들이 추가 제공되는데, 이때 업데이트는 자동적으로 검색되거나, 또는 예정된 조사 또는 검색과 같은 수단들에 의해 검색될 수 있다. 한 측면에 따르면, 자동화된 데이터 수집은 데이터베이스 내에 모든 기존 항목들의 완전한 다운로드, 그리고 최근 디포짓의 로컬 증대식 자동화된 업데이트와, 데이터베이스에 다른 업데이트를 포함한다.

비-제한적인 구체예에서, 데이터베이스 내에 모든 항목들은 자동화된 검색에 의해 데이터들이 수집된다. 또다른 비-제한적인 구체예에서, 데이터는 데이터베이스내에 모든 항목들의 초기 자동화된 검색에 의해 수집되고, 이어서 데이터베이스에 최근 디포짓의 로컬 증대식 업데이트에 의해 수집된다. 비-제한적 실시예에서, Research Collaboratory for Structural Bioinformatics (RCSB) 내에 포함된 모든 Protein Data Back (PDB) 항목들의 자동화된 검색은 (1) 모든 기존 PDB 항목들의 완전한 다운로드, 이때 로컬 데이터 스토어는 PDB의 PDBXML 저장실과 동기화되고, 그리고 (2) RCSB 저장소에 최근 디포짓의 로컬 증대식 업데이트로 구성된다. 이 실시예에서, 데이터는 서브의 wwPDB 전세계적 수집으로부터 직접적으로 파일을 얻기 위하여(www.wwpdb.org을 통하여) http: 프로토콜을 이용하여 로컬적으로 동기화된다. 다양한 비-제한적 구체예들에서, 선별이 일어나는 시간에 따라 수집된 모든 Protein Data Bank (PDB) 항목들은 크기가 200 GB 내지 320 GB 범위가 된다. PDB 저장소는 60,000개 이상의 구조들에 대한 항목들을 포함하였고, PDB 저장소의 로컬 카피는 크기가 320 GB에 이른다.

비-제한적 구체예에서, 데이터는 데이터베이스 안에서 후보를 확인하기 위하여 조사 기준을 이용하여 수집하고, 그리고 조사 기준을 이용하여 데이터베이스로부터 모든 항목들의 검색도 확인되었다.

새로운 융합 짝들과 GPCR-융합 짝 단백질들의 평가

잠재적 새로운 융합 짝 (또는, 후보 융합 짝)은 GPCR에서 최소한 한 위치에서 최소한 하나의 GPCR에 결합되고, 그리고 생성된 GPCR-융합 짝 단백질을 측정할 것이다. 한 측면에 따르면, 각 잠재적 새로운 융합 짝은 최소한 두 개의 상이한 수용체들에 결합될 것이다. 또다른 측면에 따르면, 각 잠재적 새로운 융합 짝은 동일한 수용체와 동일한 융합 짝을 보유하지만, 각각의 별개 GPCR은 서로 상이한 위치에서 결합된 융합 짝을 가지는, 최소한 2개의 별개 GPCR을 만들기 위하여 동일한 수용체에서 최소한 2개의 별개 위치에 결합될 것이다. 또다른 측면에 따르면, 최소한 2개의 별개 GPCR-융합 짝 단백질들이 각 수용체로부터 만들어질 것이고, 이때 각 별개의 GPCR-융합 짝 단백질은 상이한 수용체를 보유한다.

GPCR-융합 짝 단백질들을 만들기 위하여 GPCR에 결합을 위하여 PDB로부터 검색된(mined) 일련의 잠재적 융합 짝들의 비-제한적 예들은 다음을 포함한다: 대장균(E. coli) 플라보독신 (PDB ID:1AG9, MW: 20 kD), M. 튜베르쿨로시스(M. tuberculosis) 가상 단백질 Rv2074, (PDB ID: 2ASF, MW: 15 kD), 대장균(E coli) 화학주성 단백질 CHEY (PDB ID: 1JBE, MW: 14kD), 보스 타우루스(Bos taurus) 소의 췌장 트립신 억제제 BPT1 (PDB ID: 1G6X, MW: 7 kD). GPCR-융합 짝 단백질들을 만들기 위하여 GPCR에 결합되기 위하여 PDB로부터 검색된 일련의 잠재적 융합 짝들의 또다른 비-제한적 예는 다음을 포함한다: T4 라이소자임 C-말단 단편 (PDB ID: 2O7A, T4 엔테로박테리아 파아지, 14 kD); 플라보독신 (PDB ID: 1I1O, 데술포비브리오 불가리스(Desulfovibrio vulgaris), 돌연변이체 Y98H, 16kD); 사이토크롬 b₅₆₂ RIL ("Bril" PDB ID: 1M6T, 대장균(Escherichia coli) 가용성 사이토크롬 b562, 12 kD); 그리고 화학주성 단백질 cheA (PDB ID: 1TQG, 터모토가 마리티마(Thermotoga maritima)로부터 CheA 포스포트란스퍼라제 도메인, 11.9 kD). 다양한 크기 및 폴드(폴드 다양성)를 보유하고, 상기 기준을 이용하여 확인된 일련의 잠재적 새로운 융합 짝들의 또다른 비-제한적 예로는 루브레독신 (PDB ID: 1FHM, 클로스트리디움 파스네리아눔(Clostridium pasteurianum) 루브레독신, 6 kD), 사이토크롬 b₅₆₂ RIL ("Bril" PDB ID: 1M6T, 가용성 사이토크롬 b₅₆₂, 12 kD), T4 라이소자임 C-말단 단편 (C-term-T4L" PDB ID: 2O7A, T4 엔테로박테리아 파아지, T4 라이소자임 순환 퍼뮤턴트(permutant), 14 kD), 플라보독신 (PDB ID: 1I1O, 데술포비브리오 불가리스(Desulfovibrio vulgaris), 돌연변이체 Y98H, 16 kD), 그리고 크실라네이즈 (PDB ID: 2B45, 엔도-1,4-베타-크실라네이즈 A, 21 kD)를 포함한다. 또다른 비-제한적 실시예에서, 이 세트는 대조군으로 T4 라이소자임 (T4L, 18 kD)을 더 포함한다.

각 GPCR-융합 짝 단백질은 TM-V 및 TM-VI의 세포내 단부(end)에 대해 상이한 위치에서 GPCR에 복합적 삽입후, 결정화능력에 대해 테스트된다.

평가되는 GPCR은 클라스 A GPCR, 클라스 B GPCR, 클라스 C GPCR, 클라스 D GPCR, 클라스 E GPCR, 및 클라스 F GPCR을 포함하나 이에 한정되지 않는다. 후보 GPCR은 β2-아드레날린성 수용체 (β2AR), A2A-아데노신 수용체 (A2A), 스핑고신 1-포스페이트 수용체 유형 1 (S1P1), NOP1을 포함하는 오피오이드 수용체 (OLR), 케모킨 수용체 CXCR3 (CXCR3), 케모킨 수용체 CCR5 (CCR5)을 포함하나 이에 한정되지 않는다.

GPCR의 세포내 도메인 안으로 융합 짝의 결합

기대되는 융합 짝들에 대한 최적의 위치는 현재까지 해결된 구조들의 분석을 통하여 확립될 수 있다. 융합 단백질의 결합은 임의의 2차 구조 요소들 또는 제3의 패킹 상호작용을 방해하지 않아야 하고, 그리고 리간드 결합 포켓과 충돌되지 않아야 한다. 클래스 A 수용체들에 대해 이런 고려사항이 주어진다면, 루프 대체를 위한 신뢰할 수 있는 선택은 구조 무질서가 최대인 3번째 세포내 루프다. 다른 클라스의 7TM 수용체들 가령, 클라스 B GPCR(영역들 및 루프들의 상대적 질서에 대해 거의 알려지지 않음)에 대해 기타 위치들이 적절할 수도 있다. 세 번째 세포내 루프안에 정확한 위치에 대한 변형은 이러한 구조체의 최적화 과정중의 일부다.

특정 구체예들에서, 각 GPCR-융합 짝 단백질은 TM-V 및 TM-VI의 세포내 세포내 단부(end)에 대해 상이한 위치에서 이 융합 짝의 GPCR에 복합적 삽입후, 결정화능력에 대해 테스트된다. 변화의 양은 공지의 구조들에 대한 루프 길이 및 서열 상동성에 관련될 것이다. 평균적으로, 2-3개의 초기 삽입 점들이 평가되는데, 본 발명은 TM-V 및 TM-VI의 세포내 단부(end)에 대해 1, 4, 5, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 또는 그 이상의 위치들에서 삽입을 포괄한다. 특정 구체예들에서, 각 GPCR-융합 짝 단백질은 GPCR의 N 또는 C 말단 또는 GPCR의 N 또는 C 말단 절두된 형태에 융합 짝을 부착시킨 후 결정화능력에 대해 테스트된다.

본 발명의 특정 구체예들에서, TM-V와 TM-VI 사이에 융합 짝에 대한 대안적 접합 위치들은 결정화에 대한 잠재적 적합성에 대한 표지물질로써 융합 단백질의 열 안정화에 대해 이들의 효과가 평가된다.

평가(Evaluation)

본 명세서에서 제공되는 조사에 의해 확인된 잠재적 융합 짝 (그중에서도 특히 융합 짝 후보 단백질, 대안(alternate) 융합 짝들, 잠재적 운반체 단백질들, 기대되는 융합 짝으로도 불림, usw.)의 가능성은 본 명세서에서 제공되는 바와 같이 평가된다. 비-제한적 예시적 구체예에서, β2-아드레날린성 수용체 (β2AR)는 모델 시스템으로 기능하는데, 이때 본 명세서에서 제공된 것과 같은 조사에 의해 확인된 6개의 잠재적 융합 짝 단백질들 각각은 구조들이 해결된 β2AR-T4L의 경우 T4-라이소자임이 클론된 것과 동일한 β2AR 부위로 클론되었다. 즉, 각 β2AR-잠재적 융합 짝 구조체에 대한 발현 벡터들은 발현 산물로써 바람직한 β2AR-잠재적 융합 짝 구조체를 제공하도록 작제되었고, 그리고 각 β2AR-잠재적 융합 짝 구조체는 발현 벡터의 바이러스성 생성, 중간 규모의 발현 그리고 β2AR-잠재적 융합 짝 구조체들의 안정화 및 단분산의 예비적 특징을 통하여 진행되었다. β2AR-잠재적 융합 짝 구조체들을 이용한 비-제한적인 예시적 구체예에서, 2개의 잠재적 융합 짝 단백질들은 고려대상에서 제외되고, 나머지 4개의 β2AR-잠재적 융합 짝 구조체들은 스케일업시키고 β2AR-잠재적 융합 짝 단백질 결정화 시도하였다. 예비 결정 히트(hits)는 3개의 별개 결정화 조건에서 β2AR-BRIL 구조체 결정화와 함께, 스케일업되고, 결정화 시도를 겪은 4개의 구조체중 2개에서 수득되었다. 추가 최적화는 고-해상도 구조 측정을 지원하기 위하여 이들의 잠재력을 결정하기 위하여 예비 회절 연구에 결정의 크기가 충분하게 자라게 하는 조건을 확인하게 된다. 이러한 비-제한적 예시적인 구체예에서, 최고의 결정들은 대략 2.8 Å으로 회절된다. 이러한 비-제한적 예시적인 구체예에서, 최고의 결정을 만드는 조건들은 과거 결정화 작업에서 바람직한 수준의 해상도를 수득하는 것과 관련된 것으로 알려진 매개변수들을 조정함으로써, 크기, 두께 및 복굴절을 증가시키도록 추가 최적화되었다.

본 명세서에서 설명된 것과 같이 다양한 잠재적 융합 짝들 (대안 융합 짝들)을 β2AR에 결합시키는 비-제한적인 예시적 구체예에 추가하여, 다수의 추가적인 GPCR에서 다양한 잠재적 융합 짝들의 용도를 조사하기 위하여 추가 비-제한적인 구체예들이 실시되었다. 최적화된 접합 부위에 결합된 잠재적 융합 짝과 함께, 5개의 상이한 잠재적 융합 짝들 각각은 GPCR, 아데노신 A2A, NOP1, 및 CXCR3에 각각 클론되었다. 이들 추가 비-제한적 구체예들에서, 각 GPCR-잠재적 융합 짝 구조체는 소규모 발현 연구 및 생물물리학적 특징화를 통하여 취하였다. 특정 비-제한적인 구체예들에서, 아데노신 A2A-융합 짝 단백질들의 평가는 예비 결과들을 가진 결정화 시도에서 추가 진행되었다. 이 관찰에 의해 제한되는 것을 원하지 않지만, 전반적으로 결과는 양호하며, 각 표적 GPCR에 대한 융합 짝으로 T4L과 비교하였을 때 최소한 2개의 잠재적 융합 짝들은 유사한 또는 더 나은 결과를 초래한다. 본 명세서에서 제공된 방법들과 조성물들에 따르면, β2AR-T4L 결정의 형성에 대한 특이적 조건들은 일반적으로 β2AR-BRIL 구조체로 해석되었다.

본 명세서에서 제공된 방법들과 조성물들은 다른 언급이 없는 한, 공지된 방법들을 이용하여, 특히 구조체들의 어셈블링, 클로닝, 발현, 정제, 지질 정육면체 결정화를 포함하나 이에 국한되지 않는 결정화, 열 안정화 분석을 포함하나 이에 국한되지 않는 평가, 포화 등온선 및 경쟁 결합 분석을 포함하는 리간드 결합 분석을 이용하여 당업계 숙련자의 지식에 따라 실행된다(Cherezov et al., 2004 (Cherezov, V., Peddi, A., Muthusubramaniam, L., Zheng, Y. F., and Caffrey, M., "A robotic system for crystallizing membrane and soluble proteins in lipidic mesophases," Acta Crystallogr D Biol Crystallogr 60: 1795-1807, 2004), Cherezov et al. 2007 (Science 318: 1258-1265, 2007), Rosenbaum et al., 2007 (Science 318: 1266-1273, 2007), Stevens et al., WO 2009/055509 A2로 공개된 PCT/US08/80847 WO 2009/055509 A2, 그리고 US 특허 출원 12/739,134, -US 20110031438 A1 (Feb. 10, 2011)로 공개됨, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2^nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences (Easton, Pennsylvania: Mack Publishing Company, 18th Edition, 1990); Carey and Sundberg, Advanced Organic Chemistry, Vols. A and B (Plenum Press, 3rd Edition 1992), 이들 각각은 전문이 여기에 참고자료로 편입된다.

실시예

실시예 1. GPCR에 결합용 잠재적 융합 짝들을 확인하기 위한 데이터 마이닝

Protein Data Bank (PDB; Worldwide Protein Data Bank, www.wwpdb.org)의 초기 선별은 상기 표 1에 열거된 기준을 충족시키는 잠재적 새로운 융합 짝들을 확인하기 위하여 실행되었다: 잠재적 융합 짝의 후보 N 및 C 말단은 15 Å 만큼 분리되어 있어야 하고; 분자량은 25 kD 미만이어야 하며; 잠재적 융합 짝의 결정들은 3 Å이상의 회절 해상도를 보유해야 하고; 잠재적 융합 짝의 결정은 최소한 2가지 상이한 화학 조건에서 형성되어야 한다; 그리고 잠재적 융합 짝의 결정들은 1개 이상의 스페이스 기를 야기해야 한다. 다음의 잠재적 융합 짝들은 본 선별에 의해 확인되었다: 대장균(E. coli) 플라보독신 (PDB ID:1AG9, MW: 20 kD), M. 튜베르쿨로시스(M. tuberculosis) 가상 단백질, (PDB ID: 2ASF, MW: 15 kD), 대장균(E coli) CHEY (PDB ID: 1JBE, MW: 14kD), 보스 타우루스(Bos taurus) BPT1 (PDB ID: 1G6X, MW: 7 kD).

실시예 2. S1P1-융합 짝 단백질들

S1P1은 S1P1-5로 명명된 5개 GPCR에 결합하는 순환 지질인 지질 신호 분자 스핑고신 1-포스페이트 (S1P)에 결합하는 GPCR이다. S1P1은 면역 세포 추적(immune cell trafficking)과 내피 일체성의 유지를 포함하는 면역 및 심혈관계에서 생리학적 기능을 선별적으로 조절한다. 하기에서 설명되는 것과 같이 4개의 새로운 S1P1-융합 짝 단백질들이 만들어졌고, 평가되었다.

다음의 각 단백질은 잠재적 융합 짝으로써 평가되었다: T4 라이소자임 C-말단 단편 ("Cterm-T4L" PDB ID: 2O7A, T4 엔테로박테리아 파아지, 14 kD); 플라보독신 (PDB ID: 1I1O, 데술포비브리오 불가리스(Desulfovibrio vulgaris), 돌연변이체 Y98H, 16kD); 사이토크롬 b₅₆₂ RIL ("Bril" PDB ID: 1M6T, 대장균(Escherichia coli) 가용성 사이토크롬 b₅₆₂, 12 kD); 그리고 화학주성 단백질 cheA (PDB ID: 1TQG, 터모토가 마리티마(Thermotoga maritima)로부터 CheA 포스포트란스퍼라제 도메인, 11.9 kD).

각 잠재적 융합 짝은 다음과 같이 S1P1에 결합되었다: 융합 짝들을 인코드하는 cDNA 구조체들은 이들의 각 결정 구조에서 관찰되는 모든 아미노산을 인코드하도록 합성되었다. S1P1 융합을 만들기 위하여, 독특한 제한효소 부위들은 S1P1 cDNA안의 아미노산 코돈 S232/R233과 K243/A244 사이에 PCR-기반 부위-지향된 돌연변이생성에 의해 도입되어, 융합 짝 cDNA의 삽입용 부위를 만들었다. 융합 짝 cDNAs (가령, 융합 짝들을 인코드하는 cDNA)는 그 다음 S1P1 수용체 DNA 안에 도입된 부위에 부합되는 인코드된 말단 제한효소 부위를 포함하는 프라이머들과 함께 PCR에 의해 증폭되었다. S1P1 수용체 (GenBank: M31210.1)에 대한 cDNA는 추가 변형을 위한 기본 구조체로 이용되었고, 이의 아미노산 서열은 아래에 나타낸다:

인간 S1P1 수용체의 아미노산 서열, GenBank Accession No. M31210.1

MGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRSRRLTFRKNISKASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIMSCCKCPSGDSAGKFKRPIIAGMEFSRSKSDNSSHPQKDEGDNPETIMSSGNVNSSS [서열 번호: 1]

융합 짝 cDNA들은 표준 분자 생물학 기술을 이용하여 S1P1 수용체 코딩 서열 안으로 삽입되었다. 우선, 융합 짝들을 인코드하는 cDNA와 변형된 S1P1 cDNA는 제한효소 절단시키고, 정제하였다. 둘째, 절단된 PCR 산물과 벡터는 결찰시키고, 대장균(E. coli) 안으로 형질도입시켰다. 생성된 클론들은 DNA 서열화에 의해 확인되었다. 이 과정에서, S1P1 벡터의 제한효소 절단으로 삽입된 융합 짝 cDNA에 의해 후속적으로 대체된 수용체 ICL3 (S232-K243)의 짧은 분절이 제거되어, S1P1 수용체 잔기 R231과 K243 사이에 삽입이 생성된다. 수용체 융합의 거동을 개선시키기 위하여, S1P1 수용체 C-말단은 S1P1 M325으로 절두되었다. 각 수용체 융합 구조체의 완전한 아미노산 서열은 하기에 나타낸다(이태리체로 표시된 것이 이 융합 짝 서열):

S1P1-BRIL의 아미노산 서열

MGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRADLEDNWETLNDNLKVIEKADNAAQVKDALTKMRAAALDAQKATPPKLEDKSPDSPEMKDFRHGFDILVGQIDDALKLANEGKVKEAQAAAEQLKTTRNAYIQKYLASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIM [서열 번호:2]

S1P1-플라보독신의 아미노산 서열

MGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRAKALIVYGSTTGNTEYTAETIARELADAGYEVDSRDAASVEAGGLFEGFDLVLLGCSTWGDDSIELQDDFIPLFDSLEETGAQGRKVACFGCGDSSWEYFCGAVDAIEEKLKNLGAEIVQDGLRIDGDPRAARDDIVGWAHDVRGAIASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIM [서열 번호:3]

S1P1-크실라네이즈의 아미노산 서열

MGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRASTDYWQNWTFGGGIVNAVNGSGGNYSVNWSNTGNFVVGKGWTTGSPFRTINYNAGVWAPNGNGYLTLYGWTRSPLIEYYVVDSWGTYRPTGTYKGTVKSDGGTYDIYTTTRYNAPSIDGDDTTFTQYWSVRQSKRPTGSNATITFTNHVNAWKSHGMNLGSNWAYQVMATEGYQSSGSSNVTVWASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIM [서열 번호:4]

S1P1-루브레독신의 아미노산 서열

MGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRMKKYTCTVCGYIYNPEDGDPDNGVNPGTDFKDIPDDWVCPLCGVGKDQFEEVEEASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIM [서열 번호:5]

추가 N- 및 C-말단 변형들을 인코드하는 발현 구조체. S1P1 수용체 융합 세트를 인코드하는 합성 cDNA는 N-말단 헤마글루티닌 신호 서열 및 C-말단 10 히스티딘 테그에 이어서 FLAG 에피토프를 포함하도록 변형된 pFastBac으로 클론되었다. 추가된 아미노산과 함께(이태리체), 완성된 S1P1-BRIL 구조체에 의해 인코드된 아미노산 서열은 아래에 나타낸다.

S1P1-BRIL 발현 구조체의 발현 산물의 아미노산 서열

MKTIIALSYIFCLVFAGAPGPTSVPLVKAHRSSVSDYVNYDIIVRHYNYTGKLNISADKENSIKLTSVVFILICCFIILENIFVLLTIWKTKKFHRPMYYFIGNLALSDLLAGVAYTANLLLSGATTYKLTPAQWFLREGSMFVALSASVFSLLAIAIERYITMLKMKLHNGSNNFRLFLLISACWVISLILGGLPIMGWNCISALSSCSTVLPLYHKHYILFCTTVFTLLLLSIVILYCRIYSLVRTRADLEDNWETLNDNLKVIEKADNAAQVKDALTKMRAAALDAQKATPPKLEDKSPDSPEMKDFRHGFDILVGQIDDALKLANEGKVKEAQAAAEQLKTTRNAYIQKYLASRSSENVALLKTVIIVLSVFIACWAPLFILLLLDVGCKVKTCDILFRAEYFLVLAVLNSGTNPIIYTLTNKEMRRAFIRIMGRPLEVLFQGPHHHHHHHHHHDYKDDDDK [서열 번호:6]

S1P1 수용체 융합 발현 구조체들을 포함하는 재조합 백미드(bacmid) DNA는 Invitrogen Bac-to-Bac® Baculovirus Expression System 매뉴얼에서 대략 설명된 표준 프로토콜을 이용하여 만들었다. 간략하게 설명하자면, 관심 유전자를 포함하는 pFastBac 플라스미드를 DH10bac 세포 안으로 형질도입시키고, 형질변환체는 적절한 한천 플레이트 상에서 색-선별하였다. 형질변환 플레이스로부터 백색 콜로니를 선택하고, 액체 배양으로 생장시켰다. 고-비중 재조합 백미드(bacmid) DNA는 이들 하룻밤동안 세균 배양물로부터 정제되었다. 스포도프테라 푸루기페르다(Spodoptera frugiperda) (Sf-9) 세포들은 Fugene HD (Promega)를 이용하여 정제된 벡미드 DNA로 형질감염되었고, 재조합 바이러스는 4일 후 수거하였다. 고역가 스톡(stock)을 만들기 위하여 증폭시킨 후, Sf-9 세포들은 감염되었고, 분석을 위하여 48시간 후 수거하였다. 각 클론의 세포 표면 발현은 형광단-라벨된 항-FLAG 항체를 이용하여 유동 세포분석법으로 평가되었고, 수용체 융합 단백질들의 적절한 폴딩을 계측하고 추적하기 위한 측정 기준(metric)으로 이용되었다.

그 다음 전체 막 분획물은 가용성 단백질들과 세포기관을 제거하기 위하여 반복된 균질화 및 원심분리에 의해 동결된 전체 세포로부터 단리되었다.

S1P1-융합 짝 단백질들 ("S1P1 융합 수용체들")은 하기에서 상세하게 설명되는 것과 같이, 도데실-말토시드(DDM) 추출에 이어, Talon 수지(Clontech)상에서 고정된 금속 친화력 크로마토그래피(IMAC)에 의해 막으로부터 정제되었다. 냉동된 세포 막은 실온 용해 완충액을 총 25mL의 용적으로 첨가하여 해동시켰다. S1P1 수용체 길항물질 W146은 최종 농도 125 μM가 되도록 첨가되었다. 혼합물은 실온에서 1시간 동안 항온처리하여, 수용체와 리간드의 완전한 포화를 확보하였고, 이어서 요오드아세타미드를 1mg/mL 농도로 추가하고, 4℃에서 추가 1시간 동안 항온처리하였다. 수용체 가용화(solubilization)는 0.5% DDM 0.1% CHS의 최종 농도를 얻기 위하여 세제 및 콜레스테릴 헤미숙시네이트(CHS)를 첨가함으로서 시작되었다. 가용화 완충액은 다음의 혼합물로 구성되었다: 50mM Hepes pH 7.5; 800mM NaCl; 30mM 이미다졸; 0.1% DDM 0.02% CHS; 125 μM W146. 가용화는 4℃에서 2시간 동안 진행되도록 한 후, 혼합물은 Ti70 로터(Beckman)에서 35분간 70,000rpm에서 원심분리되었다. 상청액을 이용하여 1mL의 물 세척된 Talon superflow IMAC 수지를 재현탁시키고, 그리고 현탁액은 4℃에서 하룻밤 동안 항온처리되도록 하였다. Talon 수지로 항온처리한 후, 현탁액을 25mL BioRad 1회용 컬럼에 따르고, 통과 유체(flow-through)는 수거하여 추후 분석을 위해 보관하였다. 수집된 Talon 수지는 다음의 성분들을 포함하는 20 ml 완충액으로 세척되었다: 20mM Hepes pH 7.5; 500mM NaCl; 0.05% DDM; 0.01% CHS; 250 μM W146. 이 수용체는 200 mM 이미다졸이 보충된 동일한 완충액으로 용리되었다.

용리된 단백질들은 크기-압출 크로마토그래피 (SEC)와 이어서 SDS-PAGE에 의해 분석되었다. 간략하게 설명하자면, 각 S1P1-융합 짝 단백질은 결정화 농도, 가령, 50mg/mL에서 형성되었고, 30-배 희석되었고, 분석용 HPLC에 주입되고, 여기에서 시료들은 크기 압출 크로마토그래피 (SEC)에 의해 분리되어, 거의 동질인 S1P1-융합 짝 단백질들을 얻는다. S1P1-Cterm-T4L, S1P1-플라보독신, 및 S1P1-Bril S1P1-융합 짝 단백질들은 리간드 존재 또는 부재시에 안정적이었고, 그리고 크기 압출 크로마토그래피 (SEC)를 이용한 분석의 추적에서 나타난 것과 같이(데이터 나타내지 않음), >50 mg/mL로 농축된 후에도 단분산을 유지하였다. S1P1-융합 짝 단백질들에 대응하는 SEC 분획물은 10% 겔상에서 SDS-PAGE에 의해 분리, 착색되어, 각 S1P1-융합 짝 단백질은 거의-동질하게 정제될 수 있다는 것을 확인시켜준다(데이터 나타내지 않음).

각 S1P1-융합 짝 단백질의 발현 수준의 초기 평가, 소규모 정제와 SEC 분석 후, S1P1-cheA (PDB ID: 1TQG) 단백질에 대한 추가 작업은 낮은 발현 수준과 열악한 SEC 피크 프로파일로 인하여 취소되었다. S1P1-Cterm-T4L, S1P1-플라보독신, 및 S1P1-Bril을 인코드하는 나머지 3개의 구조체들은 과다발현되었고, 상기에서 개략적으로 설명된 프로토콜을 이용하여 거의 동질하게 정제되었다.

실시예 3. β2 아드레날린 수용체 융합 짝 단백질들

후보 융합 짝들의 패널 각각은 β2-아드레날린성 수용체 (β2AR; b2 아드레날린성 수용체)에 삽입되었고, 그리고 각 생성된 β2AR-융합 짝 단백질은 발현되고, 추출되고, 그리고 정제되어 다양한 성질들을 측정하였다. β2AR 융합이 작제되고, 발현되엇고, 그리고 다음의 β2AR-융합 짝 단백질들에 대해 평가되었다: β2AR-T4L, β2AR-C-term T4L, β2AR-Bril, β2AR-루브레독신, β2AR-크실라네이즈, 그리고 β2AR-플라보독신.

β2AR-T4L라고 명명되는 ("베타-2 아드레날린성 수용체/T4-라이소자임 키메라" PDB ID 3D4S) T4-라이소자임에 융합된 β2 아드레날린성 수용체의 기존에 밝혀진 X-선 결정 구조를 지침(guide)으로 이용하여, 후보 융합 짝들은 원래 β2AR-T4L (가령, PDB ID 3D4S)에서 융합된 T4L 서열을 바로 대체하는 것에 상응하는 위치에서 β2AR 안에 삽입되었다. 따라서, 접합 부위들은 원래 β2AR-T4L 단백질과 동일하게 유지되었다. 모든 발현 구조체들은 N-말단 헤마글루티닌 신호 서열에 이어서 FLAG M2 에피토프를 운반하였다. 기본 구조체의 C-말단은 정제를 용이하게 하기 위하여 원래 히스티딘 정제 테그를 6개의 히스티딘에서 10개의 히스티딘으로 연장되도록 추가 변형되었다. 모든 β2AR-융합 단백질-인코딩 서열들 ("수용체 융합 유전자들")은 합성 cDNA 중첩 발현 PCR에 의해 작제되었고, 제한효소 절단 및 결찰에 의해 발현 벡터 pFastBac1 안에 클론되었다.

발현 구조체에서 이용된 β2AR의 아미노산 서열(GenBank Accession No. NP_000015.1)

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQL [서열 번호: 7]

β2AR-T4L의 아미노산 서열

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLNIFEMLRIDEGLRLKIYKDTEGYYTIGIGHLLTKSPSLNAAKSELDKAIGRNTNGVITKDEAEKLFNQDVDAAVRGILRNAKLKPVYDSLDAVRRAALINMVFQMGETGVAGFTNSLRMLQQKRWDEAAVNLAKSRWYNQTPNRAKRVITTFRTGTWDAYKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHH [서열 번호: 8]

β2AR-C-term T4L의 아미노산 서열(Hanson et al., 2008)

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLKDEAEKLFNQDVDAAVRGILRNAKLKPVYDSLDAVRRAALINMVFQMGETGVAGFTNSLRMLQQKRWDEAAVNLAKSRWYNQTPNRAKRVITTFRTGTWDAYKNLSGGGGAMDIFEMLRIDEGKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHHHHHH [서열 번호: 9]

β2AR-Bril의 아미노산 서열

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLADLEDNWETLNDNLKVIEKADNAAQVKDALTKMRAAALDAQKATPPKLEDKSPDSPEMKDFRHGFDILVGQIDDALKLANEGKVKEAQAAAEQLKTTRNAYIQKYLKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHHHHHH [서열 번호: 10]

β2AR-루브레독신의 아미노산 서열

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLMKKYTCTVCGYIYNPEDGDPDNGVNPGTDFKDIPDDWVCPLCGVGKDQFEEVEEKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHHHHHH [서열 번호: 11]

β2AR-크실라네이즈의 아미노산 서열

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLASTDYWQNWTFGGGIVNAVNGSGGNYSVNWSNTGNFVVGKGWTTGSPFRTINYNAGVWAPNGNGYLTLYGWTRSPLIEYYVVDSWGTYRPTGTYKGTVKSDGGTYDIYTTTRYNAPSIDGDDTTFTQYWSVRQSKRPTGSNATITFTNHVNAWKSHGMNLGSNWAYQVMATEGYQSSGSSNVTVWKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHHHHHH [서열 번호: 12]

β2AR-플라보독신의 아미노산 서열

MKTIIALSYIFCLVFADYKDDDDAMGQPGNGSAFLLAPNRSHAPDHDVTQQRDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIWTLCVIAVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAEETCCDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLAKALIVYGSTTGNTEYTAETIARELADAGYEVDSRDAASVEAGGLFEGFDLVLLGCSTWGDDSIELQDDFIPLFDSLEETGAQGRKVACFGCGDSSWEYFCGAVDAIEEKLKNLGAEIVQDGLRIDGDPRAARDDIVGWAHDVRGAIKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLIRKEVYILLNWIGYVNSGFNPLIYCRSPDFRIAFQELLCLRRSSLKHHHHHHHHHH [서열 번호: 13]

각 β2AR-융합 짝 단백질은 0.5 mM 티몰올(리간드) 존재하에 0.5% w/v DDM/CHS 세제 혼합물과 항온처리에 의해 혈장 막으로부터 추출되고, 이어서 0.5 mM 티몰올 존재하에 고정화된 금속 친화력 크로마토그래피(IMAC)로 정제되었다. 동일한 프로토콜을 리간드 없이 이용하여 리간드 결합에 대한 안정화 및 선호하는 반응에 대해 각 구조체를 테스트하였다. 리간드-결합된 정제의 경우, 단백질은 더 적은 양의 제 2의 IMAC 수지를 이용하여 2차 정제를 받았다.

12.5 ml의 냉동된 세포 막은 25mL의 용적으로 첨가시켜 해동되었다. 혼합물은 수용체가 리간드에 완전하게 포화되도록 4℃에서 1시간 동안 항온처리되었고, 이어서 요오드아세타미드를 1mg/mL의 농도로 첨가하고 추가로 4℃에서 1시간 항온처리하였다. 수용체 가용화(solubilization)는 0.5% DDM 0.1% CHS의 최종 농도를 얻기 위하여 세제 및 콜레스테릴 헤미숙시네이트(CHS)를 첨가함으로서 시작되었다. 가용화 완충액은 다음의 혼합물로 구성되었다: 50mM Hepes pH 7.5; 150 mM NaCl; 25 mM 이미다졸; 0.1% DDM 0.02% CHS; 500 μM 티몰올. 가용화는 4℃에서 2.5시간 동안 진행되도록 한 후, 혼합물은 Ti70 로터(Beckman)에서 35분간 70,000rpm에서 원심분리되었다. 상청액을 이용하여 1mL의 물 세척된 Talon superflow IMAC 수지를 재현탁시키고, 그리고 현탁액은 4℃에서 하룻밤 동안 항온처리되도록 하였다. Talon 수지로 항온처리한 후, 현탁액을 25mL BioRad 1회용 컬럼에 따르고, 통과 유체(flow-through)는 수거하여 추후 분석을 위해 보관하였다. 수집된 Talon 수지는 다음의 성분들을 포함하는 20 ml 완충액으로 세척되었다: 50mM Hepes pH 7.5; 500mM NaCl; 0.05% DDM; 0.01% CHS; 500 μM 티몰올. 이 수용체는 200 mM 이미다졸이 보충된 동일한 완충액으로 용리되었다. 리간드-없는 정제는 길항물질 티몰올을 제외한, 동일한 단계에 의해 실시되었다.

IMAC 정제로부터 수집된 용출액은 분석용 SEC 컬럼상에 주입하였고, 그리고 UV 흡수 및 트립토판 형광에 의해 자취를 모니터하였다. 피크 프로파일을 이용하여 수용체 융합 단백질들의 산출량과 상대적인 질을 비교하였다. 간략하게 설명하자면, 기능적으로 폴드된 단백질의 수율은 피크 아래 면적을 통합하고, 이 면적으로 공지의 농도 및 소멸 계수를 가진 참조 표준, 가령, 소의 혈청 알부민의 것과 비교하여 예측할 수 있다. 단백질의 질은 단백질 SEC 피크의 단분산에 근거하여 예측되는데, 이때 2차 피부의 부재 또는 주요 피크의 쇼더(shoulder)는 고품질임을 나타내고(도 1, A-E) 뿐만 아니라 전체 단백질 착색과 함께 10% SDS-PAGE 겔상에서 전기영동에 의해 예측된다(도 1F).

도 1은 β2AR 안으로 삽입된 후보 융합 짝들의 각 패널의 결과 및 성질들을 보여준다. 도 1A-1E는 리간드 존재하에 (검정색 자취) 그리고 리간드 없이(붉은색 자취) 각 β2AR-융합 짝 단백질의 추출 및 1차 정제와 그리고 리간드-결합된 융합 종의 2차 정제(녹색 자취)에 상응하는 SEC 데이터를 보여준다.

도 1F는 좌측에서 우측방향으로 β2AR 융합 짝 단백질의 최종 산물, MW 표준들, β2AR-T4L, β2AR-C-term T4L, β2AR-Bril, β2AR-루브레독신, β2AR-크실라네이즈, 그리고 β2AR-플라보독신에 대한 10% 겔상에서 SDS-PAGE를 나타낸다.

후보 융합 짝 단백질들의 패널의 초기 평가에 근거하여, 대규모 발현 및 정제 후 지질 정방 상에서 결정화되는 능력에 대해 추가 분석을 위하여 4가지 구조체들이 선택되었다. 대규모 발현 및 정제 후 지질 정방 상에서 결정화되는 능력에 대해 추가 분석을 위하여 4가지 β2AR-융합 짝 단백질들중, β2AR-Bril는 결정 히트를 야기하는데, 가령, 수용가능한 결정들을 만들었다. β2AR-Bril 융합 짝 단백질은 초기 미세결정 히트를 제공하였고, 추가 최적화되어 고-해상도 회절 및 구조 해결을 지원하였다. 추가적으로, β2AR-크실라네이즈는 성공적으로 결정화되어 대략적으로 5 Å의 해상도로 분절되는 결정들이 형성되었다.

β2AR-Bril의 발현 및 정제는 본 명세서에서 설명되는 것과 같이 실행되는데, 티몰올을 대신하여 완충액에는 크라졸올(carazolol) 함유를 배제하고, SDS-PAGE에 의해 분석하였을 때 95% 이상의 순도를 가진 단백질 시료를 만든다. 생성된 정제된 단백질은 60mg/mL로 농축시키고, 분석용 SEC에 의해 분석하여 최종 농도 및 이종성(heterogeneity) 수준을 측정하였다(도 2 A-C). 그 다음 정제된, 농축된 재료는 10% w/w 콜레스테롤을 함유하는 지질 정방 상으로 재구성되었다. 재구성된 단백질 지질 혼합물의 소량을 96-웰 유리 결정화 플레이트상에 분산시키고, 잠재적 결정화 유도 완충액과 시약들을 적층시켰다. 결정화를 유도하는 특정 시약들이 측정되어 큰, 복굴절 결정(도 2D)이 생성되었고, 이는 결정의 트립토판 형광(도 2E) 및 회절 (도 2F)에 의해 실재 단백질로 확인된다.

β 2AR-Bril 융합 짝 단백질의 FRAP 연구

β2AR-Bril의 FRAP 분석을 실시하여 더 높은 해상도의 결정을 만들 목적으로 조사되는 대안 결정화 조건들을 확인하였다. β2AR-Bril은 Cy3 형광 염료(~550 nm 여기(excitation), ~570nm 방사(emission))로 라벨되었다. Cy3 단기능성 N-히드록시숙시니미드 에스테르(Cy3 NHS) (GE Healthcare)는 정제 프로토콜에서 제 2 IMAC 정제 컬럼에 결합된 정제된 단백질에 대해 염료/단백질이 2-5 몰비에서 DMF 안에 5 mg/mL 스톡으로부터 첨가되었다. 생성된 용액을 혼합하였고, 빛이 없는 상태에서 4℃에서 2-3시간 동안 항온처리되었다. 항온처리 후, 과량의 정제 완충액을 이용하여 컬럼으로부터 반응안된 염료는 씻어내었다. 컬럼은 과량의 완충액을 추가하여 더 세척하였고, 그 다음 컬럼은 어두운 상태에서 4℃에서 최소한 12시간 동안 항온처리되었다. 이 항온처리 후, 단백질이 결합된 컬럼은 분광학적 분석을 통하여 반응안된 염료가 더 이상 관찰되지 않을 때까지 추가 완충액으로 세척하였다. 라벨된 단백질은 IMAC 컬럼으로부터 용리시키고, 농축시키고, 그리고 지질 정방 상 결정화 환경으로 재구성시켰다. 소량의 지질 정방 상 β2AR-Bril ("LCP/b2bril") 물질을 결정화를 가능하게 하는 것으로 생각되는 다양한 조건들과 함께 항온처리한 후, 광표백후 형광 회수(FRAP)을 이용하여 Cy3-라벨된 β2AR-Bril의 2차원적 측면 확산을 측정하였다. 지질 정방 상의 결정화 매트릭스내에 확산 분석 결과를 이용하여 공지의 결정화 조건이 존재하지 않는 경우 결정화 공간에 대한 연구를 좁힐 수 있다. 대안으로, FRAP 분석을 이용하여 라벨된 단백질의 회수 비율을 최대화시키고, 그리고 더 큰 결정을 지원하기 위한 확산율을 최적화시킴으로써 공지의 조건들을 최적화시킬 수 있다. β2AR-Bril의 경우, FRAP 분석을 이용하여 더 높은 해상도 결정의 생성에 대해 알아보기 위한 대안 결정화 조건을 확인하였다. 일부 구체예들에서, β2AR-Bril 융합 짝 단백질은 β2AR wtN187을 이용하여 상기에서 설명된 것과 같이 준비되었고, 생성된 β2AR-Bril은 "IMPT-1497"으로 명명하였다.

LCP-FRAP. LCP-FRAP 분석용 Cy3 라벨된 단백질은 LCP로 재구성되었고, 결정화 단락에서 설명된 것과 같이 유리 샌드위치 플레이트 상에 분배시켰다. 자동화된 고-처리량 LCP-FRAP 분석용 셋업에 대해 설명되었다. 간략하게 설명하자면, LCP 샌드위치 플레이트는 Zeiss AxioImager A1 형광 현미경, Micropoint 염료 세포 레이져(Photonic Instruments), 냉각된 CCD FireWire 카메라 CoolSnap HQ2 (Photometrics), 그리고 자동화된 XYZ 현미경 스테이지 MS-2000 (Applied Scientific Instrumentation)로 구성된 주문생산된 LCP-FRAP 스테이션 상에 두었다. 각 LCP 드롭은 25 Hz 펄스 속도에서 15-20 레이져 펄스를 발사함으로써 표백된다. 형광 영상은 표백 전후에 바로 찍었다. 30분의 회수 기간 후, 영상을 다시 찍어서 ImagePro Advanced Microscopy Suite (Media Cybernetics)으로 분석하였다.

열안정화 분석.

N-[4-(7-디에틸아미노-4-메틸-3-쿠마리닐)페닐]말레이미드(CPM) 염료는 Invitrogen에서 구입하였고, 앞으로 사용을 위하여 원액으로 4 mg/mL에서 DMSO (Sigma)에 용해시켰다. 원액(stock solution)은 80℃에서 보관되었고, 사용전 염료 희석 용액(10 mM 완충액, 500 mM NaCl, 10% 글리세롤, 0.025% DDM 및 0.005% CHS)에서 1:40으로 희석되었다. 열 변성 분석은 석영 형광계 큐벳(Starna Cells, Inc., Atascadero, CA)에서 총 용적 200 μL의 시료로 실시되었다. 수용체 (4 μg)는 적절한 완충 용액에서 200 μL의 최종 용적으로 희석되었고, 희석된 염료의 5 μL를 단백질 용액에 추가하였고, 4℃에서 30분간 항온처리되었다. 혼합된 용액을 큐벳으로 이동시키고, 데이터는 분당 2℃의 경사율의 온도에서 Cary Eclipse 분광형광계(Varian, USA)로 수집하였다. 여기 파장은 387 nm이었고, 방사 파장은 463 nm이었다. 모든 분석은 20℃에서 출발하여 95℃의 온도 범위에서 실시되었다. 안정화 데이터는 GraphPad Prism 프로그램(GraphPad Prism, Graphpad Software, San Diego, CA, USA)으로 처리되었다. 용융점(Tm)을 결정하기 위하여, Boltzmann S자형 식(sigmoidal equation)을 이용하여 데이터를 맞추었다.

열안정화(Thermostability). 상이한 β2AR 구조체들의 열안정화가 평가되었다. 가열하는 동안 수용체 안정화를 유지하기 위하여 100 μM 티몰올 존재하에 분석이 실시되었다. β2AR-T4L과 관련하여, β2AR-플라보독신과 β2AR-CtermT4L은 각각 약 9℃ 및 4℃ 덜 안정적이었다. β2AR크실라네이즈는 β2AR-T4L보다 약 3℃ 더 안정적이었으며, β2AR-BRIL 및 β2AR-루브레독신은 모두 β2AR-T4L보다 약 8℃ 더 안정적이었다. 따라서, 추가 결정화 연구용으로 β2AR-BRIL 및 β2AR루브레독신을 선택하였다.

결정화. 막 단백질들에 대한 메소(meso) 결정화 방법들이 상세하게 설명되어 있다. 단백질 용액은 주문 주사기 믹서 안에서 40% 단백질과 60% 지질의 비율로 9:1 모노올레인:콜레스테롤의 용융된 지질 혼합물과 혼합되었다. 재구성된 LCP를 포함하는 주사기를 자동화된 결정화 로봇(NT8-LCP, Formulatrix) 상에 얹고, 그리고 35-50 nL의 LCP는 96-웰 유리 샌드위치 플레이트 (MarienFeld)상에 분배하고, 그리고 800 nL의 침전 용액을 덮었다. 드롭은 커버슬립으로 봉하고, 자동 인큐베이터/화상 촬영기 RockImager 1000 (Formulatrix) 안에서 20℃에서 항온처리하고, 그리고 영상촬영하였다. β2AR-BRIL 및 A_2AAR-BRIL의 결정들은 모두 7일 이내에 자랐다.

LCP 에서 단백질 확산 및 결정화. A_2AAR-BRIL의 경우에 필수적이었던 접합 부위 최적화의 필요성 없이 LCP에서 β2AR-BRIL의 결정을 성장시킬 수 있었다. LCP-FRAP 분석은 결정화 시도를 안내하기 위하여 A_2AAR-BRIL와 유사한 방식으로 실시되었다. 단백질들은 pH 7.5 완충액내에서 Cy3-모노 NHS 에스테르로 라벨되었고, 유사하게 LCP-FRAP 시료 준비 전, 분석용 크기-압출 크로마토그래피 (aSEC)에 의해 순도, 단분산 및 라벨링 효과에 대해 평가되었다. 라벨된 단백질은 단백질 용액을 40% (w/w) 단백질 용액, 54% (w/w) 모노올레인, 6% (w/w) 콜레스테롤의 최종 비율로 용융 모노올레인과 혼합하여 LCP 안으로 재구성시켰고, 그리고 기존에 도입된 제작한 스크린상에 항온처리하였다. 스크린의 pH는 기존 β2AR 결정화 조건을 근거로 6, 7 및 8로 조정되었다. 세 가지 pH중에서, β2AR-BRIL은 pH 7에서 최적의 이동 분획을 나타내었고, 이는 특정 침전물과 함께 60%보다 더 높았다(추가 도 8a). 높은 확산 회수를 보이는 조건들은 결정화 시도를 위하여 최적화되었다. 최적화된 결정들은 대략적으로 80 x 15 미크론으로 성장하고, 2.8 Å로 회절되었다.

X-선 데이터 수집. 결정학적 데이터는 1.0330 Å의 파장과 MarMosaic 300 탐지기에서 10 μm 조준된 미니빔을 이용하여 Argonne National Laboratory에서 Advanced Photon Source의 23ID-B/D 빔라인 (GM/CA CAT)에서 수집되었다. 방사선 손상을 감소시키기 위하여, 결정은 새로운 위치로 해독되었고, 가능하다면, 약해지지 않은 빔으로 3초 노출과 1°진동에서 5-10개의 프레임을 수집한 후 대체되었다. 구조 측정을 위하여, HKL2000를 이용하여 55개의 A2AAR 결정으로부터 데이터세트는 통합되고, 축적하고(scaled) 그리고 함께 통합되었다. 초기 분자 대체 용액은 조사 모델로써 A2AAR-T4L/ZM 구조의 A2AAR 부분(PDB code 3EML)을 이용하여 Phaser로부터 수득하였다. BRIL 잔기들(residues)은 Coot와 Refmac5 사이의 반복적인 사이클링에 의해 과도한 ΣA-가중된 2|Fo|-|Fc| 밀도에서 수작업으로 구축되었으며, 생성 모델은 수렴(convergence)될 때까지 동일한 과정을 이용하여 추가적으로 정교하게 되었다.

β2AR-Bril 결정화 조건들의 추가 최적화는 우수한 결정 성장 및 회절 성질들을 초래하는 결정성 첨가제 (트리-메틸 아민 N-산화물)를 확인하였다(도 3A). 트리-메틸 아민 N-산화물이 포함되었을 때, β2AR-Bril 결정은 X-선을 정상적인 해상도 2.8 Å로 회절되었다(도 3B).

실시예 4 후보 융합 짝들과 아데노신 A2a 수용체 융합 짝 단백질들

후보 융합 짝들의 각 패널을 아데노신 A2a 수용체 ("A_2A"는 A2A-아데노신 수용체, ADORA2A, 아데노신 A_2A 수용체, A2a로 지칭됨) 안으로 삽입되었고, 그리고 각 생성된 A_2A-융합 짝 단백질은 다양한 성질들을 결정하기 위하여 발현되고, 추출되고, 그리고 정제되었다.

각 A_2A-융합 짝 구조체는 유전자 합성 기술에 의해 만들었는데, 이때 DNA의 짧은 올리고머는 중첩 연장 PCR에 의해 복합되었다. A_2A의 각 융합 짝은 후속적으로 수용체의 N-말단에 Flag 에피토프 친화력 테그와 수용체의 C-말단에 10x 히스티딘 테그를 통합한 우리의 표준 발현 카세트 안으로 서브-클론되었다.

모든 단백질들은 상기에서 설명된 기본적으로 동일한 프로토콜을 이용하여 발현되었고, 수거되었고, 그리고 정제되었다. A_2A-융합 짝 단백질 발현 구조체들을 포함하는 재조합 박미드 DNA는 Invitrogen Bac-to-Bac® Baculovirus Expression System 매뉴얼에서 설명된 것과 같은 표준 프로토콜을 이용하여 생성되었다. 스포도프테라 푸루기페르다(Spodoptera frugiperda) (Sf-9) 세포는 정제된 정제된 박미드 DNA로 형질감염되었고, 그리고 재조합 바이러스는 수거되고, 그리고 고-역가 원액을 만들기 위하여 증폭되었다. Sf-9 세포들은 감염되고, 분석을 위하여 48시간 후 수거되었다. 전체 막 분획은 냉동된 전체 세포로부터 단리되었다. A_2A-융합 짝 단백질들 ("A2a 수용체 융합"이라고도 부름)은 도데실-말토시드 (DDM) 추출과 이어서 Talon 수지(Clontech) 상에서 고정된 금속 친화력 크로마토그래피(IMAC)에 의해 막으로부터 정제되었다. 용리된 단백질들은 전기영동 및 분석용 크기 압출 크로마토그래피에 의해 수율 및 동질성에 대해 분석되었다. 수용가능한 고발현 수준을 보여준 선택된 A_2A-융합 짝 단백질 구조체들은 두 가지 상이한 리간드, ZM241385 (길항물질) 및 UK-432097 (항진물질) 존재하에 열 변성 분석(CPM 분석)에서 A_2A-융합 짝 단백질의 추가 분석을 위하여 선택되었다.

다음의 A_2A-융합 짝 단백질들을 만들었고, 평가하였다: A_2A-BRIL, A_2A-플라보독신, A_2A-T4L- Cterm-T4L 라이소자임 단편 (T4l-Cterm, 도 4에서 "T4L-frag"으 표시됨), A_2A-루브레독신, A_2A-크실라네이즈, 그리고 A_2A-T4L. 발현 및 정제 후, A_2A-융합 짝 단백질들의 생물물리적 특징화는 도 4에 나타낸 것과 같이 실시되었다. 용리된 단백질들은 전기영동, 단분산에 의해 수율 및 동질성에 대해 분석되었으며, 그리고 분석용 크기 압출 크로마토그래피에 의해 동질성이 분석되었으며, 열 변성 분석에 의해 공지의 A_2A 수용체 리간드의 안정화 유도에 대해 분석되었다.

도 4A는 용리된 정제된 A_2A-BRIL, A_2A-플라보독신, A_2A-T4L-Cterm ("T4L-frag"), A_2A-루브레독신, A_2A-크실라네이즈, A_2A-T4L에 대해 전체 단백질 착색과 함께 10% SDS-PAGE 겔을 이용하여 수율 및 동질성 분석을 보여준다. 도 4B는 A_2A-BRIL, A_2A-플라보독신, A_2A-T4L-Cterm (labeled "T4L-frag"), A_2A-루브레독신, A_2A-크실라네이즈, 그리고 A_2A-T4L의 용리된 정제된 조제물의 aSEC를 위하여 단백질 수준(280nm에서 UV 흡수)을 보여주는 분석용 크기-압출 크로마토그래피 (aSEC)의 단분산 및 동질성 분석을 보여준다.

추가 특징화에서, A_2A-융합 짝 단백질들은 40 mL 배양물에서 발현되었고, 발현 수준들이 측정되었으며, 각 A_2A-융합 짝 단백질의 분자량이 예측되었으며, 그리고 아래 표 2에서 나타낸 것과 같이 융합 짝의 N과 C 말단사이의 거리 ("N-C 거리")과 관련있었다. 융합 짝이 더 짧은 N-C 거리, 가령 10Å 미만을 가지는 구조체들은 대응하는 A_2A-융합 짝 단백질에 대해 더 낮은 발현 수준을 가졌던 것으로 관찰되었다.

표 2.
	MW of 융합 짝 (kDa)	N-C 거리 (Å)
A_2A-BRIL	12	13.73
A_2A-플라보독신	16	11.06
A_2A-Cterm-T4L 라이소자임 단편	14	7.74
A_2A-루브레독신	6	11.62
A_2A-크실라네이즈	21	7.22
A_2A-T4L (대조군)	18	9.01

수용가능한 높은 발현 수준을 보여주었던 선택된 A_2A-융합 짝 단백질 구조체들은 A_2A 수용체의 두 가지 상이한 리간드, ZM241385 (길항물질) 및UK-432097 (항진물질) 존재하에서 열 변성 분석(CPM 분석)에서 추가 분석되었다. A_2A-BRIL, A_2A-플라보독신, 및 A_2A-루브레독신은 우호적인 특징들을 바탕으로 선택되었고, 그리고 A_2A-T4L은 대조군으로 포함되었다. 각 A_2A-융합 짝 단백질은 정제되었고, 그리고 각 A_2A-융합 짝 단백질의 원액은 두 리간드 (ZM241385 (길항물질) 및 UK-432097 (항진물질)) 각각과 복합되었고, 그리고 20와 90℃ 사이에서 열 변성 점에 대해 분석되었다. 각 A_2A-융합 짝 단백질은 결합된 화합물에 따라 다변하는 대표적인 열 변성 점(Tm)을 가진다. 도 4C는 길항물질 ZM241285 존재하에 A_2A-BRIL, A_2A-플라보독신, A_2A-루브레독신, 및 A_2A-T4L에 대해 열 변성 분석 결과를 보여준다. 도 4D는 항진물질 UK432097 존재하에 A_2A-BRIL, A_2A-플라보독신, A_2A-루브레독신, 및 A_2A-T4L에 대해 열 변성 분석 결과를 보여준다. 각 경우에서 최소한 하나의 대안 융합 짝은 A_2A-T4L과 우호적으로 비교되었고, 이때 A_2A-BRIL 및 A_2A-루브레독신은 두 리간드 조건 모두에서 A_2A-T4l과 필적되는 또는 더 나은 안정화를 보여주었다. 이 분석에 근거하여, A_2A-BRIL 및 A_2A-루브레독신은 대규모 발현, 정제 및 결정화 연구에 선택되었다.

리간드 결합 & 하류 신호생성(downstream signaling). 리간드 결합 및 및 하류 신호생성 분석은 A2AAR의 기능적 활성에서 융합 도메인들의 표과를 테스트하기 위하여 실시되었다. 방사능활성 리간드 결합 분석은 1 M NaCl 존재 및 부재하에 항진물질 (UK432,097) 및 길항물질 (ZM241385) 모두와 함께 실시되었다. 융합 도메인들은 길항물질 친화력에 거의 효과를 가지지 않지만, 항진물질 친화력은 WT A2AAR에 비교하여 모든 A2AAR 키메라에 대해 일관적으로 강화되었다. 모든 키메라의 경우, 항진물질 친화력은 1 M NaCl 존재에 의해 감소되었다. cAMP 축적 분석은 융합 도메인들이 하류 신호생성을 방해하는지를 테스트하기 위하여 두 리간드 존재하에 실시되었다. A2AARCtermT4L을 제외하고, 각 키메라의 기본 활성은 항진물질 또는 길항물질 존재하에 사소하거나 반응이 없음을 보여주었다. A2AAR-CtermT4L은 항진물질 존재하에 50% 신호생성을 할 수 있었다(100%는 대응하는 리간드 존재하에서 WT A2AAR에 의해 생성된 신호로 정의된다).

열안정화. 이들의 고유한 유연성으로 인하여, 높은 열안정화는 GPCR의 결정화에 중요한 측정기준이다. 단백질에서 융합 도메인들의 효과를 테스트하기 위하여, 형광을 기초로 한 열안정화 분석이 실시되었다. A2AAR 구조체들은 가열 전 수용체를 안정화시키기 위하여 길항물질, ZM241385, 또는 항진물질, UK432,097과 함께 항온처리되었다. ZM241385과 결합될 때, A2AAR-BRIL, A2AAR-플라보독신, 및 A2AAR-루브레독신 모두 A2AAR-T4L의 것보다는 약 6℃ 더 높게, 서로 거의 동일한 열 전이 온도(transition temperature)를 보유하였다. UK432,097과 결합될 때, A2AAR-BRIL 및 A2AAR-루브레독신은 유사한 열 전이 온도를 보였으며, A2AAR-플라보독신의 전이 온도는 A2AAR-T4L과 비교하였을 때 10℃ 넘게 감소되었다. 길항물질 또는 항진물질 결합된 형태에서 A2AAR-BRIL 및 A2AAR-루브레독신의 개선된 열안정화는 이들을 결정화 시도에 대한 매력적인 후보로 만드는데, 그 이유는 다수의 높은 안정화 리간드들의 이용가능성은 성공적인 결정화 조건을 발견할 가능성을 증가시키기 때문이다. A2AAR-BRIL 및 A2AAR-루브레독신은 추가 결정화 연구를 위하여 선택되었다.

접합 최적화(Junction optimization). 지질 입상 상(LCP)에서 A2AAR-BRIL 또는 A2AAR-루브레독신과의 초기 결정화 시도는 접합의 A2AAR 측면에 인터페이스가 T4L의 삽입을 위하여 원래 최적화된 접합들에 근거하여 선택되어 BRIL (13.7Å ) 및 루브레독신 (11.6Å )의 것보다 N- 및 C- 말단 사이의 거리가 상이하여, 임의의 결정들을 만들지 않았다. 이 인터페이스에서 2차 구조는 세 가지 도메인 모두 사이에서 또한 상이하다: T4L 인터페이스는 수직 α-나선들로 구성되며, BRIL은 역평행(anti parallel) α-나선들로 구성되며, 그리고 루브레독신은 루프를 포함한다. 이들 고찰들은 단백질의 열안정화를 개선시키기 위하여 접합의 A2AAR 측면에서 고유한 잔기들의 추가 또는 제거 테스트로 이어졌다. A2AAR-BRIL 및 A2AAR-루브레독신 모두의 안정화를 개선시킬 수 있는 다수의 대안 접합이 확인되었다. 이들 중, A2AAR-BRIL의 경우 가장 안정적인 접합은 접합의 TM6 측면에서 3개의 잔기를 제거 또는 추가하는 것으로 이 단백질의 안정화를 대략 4℃ 증가시켰다. A2AAR-루브레독신의 경우, 가장 안정적인 접합은 TM5상에 2개의 잔기 추가 또는 TM6상에 3개의 잔기 제거였고, 이들 모두 이 단백질의 안정화를 약 4℃ 상승시켰다.

LCP에서 단백질 확산 및 결정화. ZM241385와의 복합에서 열안정화된 A2AAR-BRIL 및 A2AAR-루브레독신 구조체들은 고처리량 LCP-FRAP 분석에 의해 추가 평가되었다. 단백질들은 이 단백질 코어에 간섭을 최소화시키기 위하여 pH 7.5에서 Cy3-모노 NHS 에스테르로 N 말단에 선호적으로 라벨되었다. 모든 단백질 시료는 LCP-FRAP 시료 준비전, 분석용 크기-압출 크로마토그래피 (aSEC)에 의해 순도, 단분산 및 라벨링 효과에 대해 평가되었다. 라벨된 단백질은 단백질 용액을 40% (w/w) 단백질 용액, 54% (w/w) 모노올레인 6% (w/w) 콜레스테롤의 최종 비율로 용융된 모노올레인과 혼합함으로써 LCP에서 재구성되었고, 그리고 이미 도입된 것과 같이 자체-제작된 스크린과 함께 항온처리되었다. 스크린의 경우 pH는 기존 A2AAR 결정화 조건에 근거하여 4, 5 및 6으로 조정되었다. 세 가지 pH 중에서 A2AAR-BRIL 및 A2AAR-루브레독신은 모두 pH 5에서 최적의 이동 분획을 보여주는데, 이는 특정 침전제의 경우 70%보다 더 높았다. 96-웰 조건을 통하여 A2AAR-BRIL의 수득된 이동 분획이 A2AAR-루브레독신의 것보다 일관적으로 더 높았고, A2AAR-BRIL와 함께 구연산염, 타르타르산염, 질산염 그리고 티오시안산염을 포함하여 70% 이상의 이동 분획 회수를 얻는 조건에 중점을 둔, 추가 결정화 시도를 진행하였다. 결정화 시도는 각 웰에서 0.8 μL 침전제 용액으로 덮은 40-50 nL 단백질을 실은 LCP를 이용하여 NT8-LCP 결정화 로봇(Formulatrix)에 의해 96-웰 유리 샌드위치 플레이트에서 실행하였고, 그리고 유리 커버슬립으로 봉하였다(Cherezov et al. 2004; Caffrey & Cherezov, 2009). 최고의 회절 특성 결정은 25-28% (v/v) PEG 400, 0.04 to 0.06 M 티오시안산 나트륨염, 2% (v/v) 2,5-헥산디올, 100 mM 구연산나트륨 pH 5.0에서 7일 이내에 수득되었다. 결정들은 60x10x3 μm의 평균 크기로 자랐고, 1.7 Å으로 회절되었다. A2AAR-BRIL의 고-해상 결정 구조는 1.8 Å에서 해결되었다.

실시예 5 b562RIL와 함께 아데노신 A2a 수용체 융합 짝 단백질 접합체

융합 짝-GPCR 단백질 접합체는 이의 3번째 세포내 루프를 아포-사이토크롬 b562RIL과 대체함으로써 아데노신 수용체와 함께 만들어졌고, 결정은 1.8 Å 해상도에서 이의 구조를 설명함으로써 결정들이 수득되었다. 여기에서 인간 A2A 아데노신 수용체 (A2AAR)의 세 번째 세포내 루프(ICL3)는 열안정화된 아포사이토크롬 b562RIL (BRIL)로 대체시켰고, 그리고 고-친화력, 하위유형-선택적 길항물질, ZM241385와 복합된 이의 키메라 단백질(A2AAR-BRIL-ΔC)라고 칭함)의 결정 구조는 1.8 Å 해상도에서 결정하였다(표 3).

ZM241385와 복합된 A2AAR-BRIL-ΔC 구조체는 지질 정방 상의 콜레스테롤-풍부한 막과 유사한 환경에서 결정화되었다. 전반적인 1.8 Å 해상도 구조는 A2AAR-T4L-ΔC/ZM241385 (PDB ID 3EML; 2.6 Å 해상도)의 원래 결정 구조와 거의 동일하고(A2AAR의 82% 이상에서 모든-원자 RMSD = 0.44 Å), 그리고 열안정화된 돌연변이체 A2AAR/ZM241385의 구조와 거의 동일하다(PDB ID 3PWH; 3.3 Å) (A2AAR의 82% 이상에서 RMSD = 0.70 Å). A2AAR의 모둔 비활성 상태 구조들이 상실되었던, 세포외 루프 2(ECL2)의 말단 부분이 완전히 해결된다. BRIL 접합 부위 부근 나선 V와 퍄의 세포질 말단의 형태는 변형안된 ICL3을 가진 A2AAR 구조의 형태와 매우 닯았는데, 이는 A2AAR-T4L-ΔC/ZM241385에서 T4L 융합에 의해 야기되는 뒤틀린 형태와는 대조적이다.

1.8 Å 구조는 수용체당 23개의 정렬된 지질 쇄와 3개 콜레스테롤을 포함한다. 함께, 이들은 각 단백질 분자 주변에 거의 완전한 지질 이중층을 형성하여 결정 접촉을 중재한다. 세포외 측면에 있는 지질들은 더 강력한 전자 밀도를 보유하고, 더 잘 정렬된 것으로 보인다. 이 구조에서 3가지 콜레스테롤 모두 이 수용체의 세포외 절단에 결합되며, 다른 지질(43 내지 75 Å²)과 비교하여 낮은 B-인자들 (25 내지 27 Å²)을 가진다. 이들 콜레스테롤중 2개(CLR1 및 CLR3)는 대칭-관련된 수용체들에 결합되며, 그리고 마주보는(face-to-face) 상호작용을 형성함으로써 결정 격자 패킹을 중재한다. 3번째 콜레스테롤 분자(CLR2)는 결정 접촉에 참여하지 않는다. 흥미로운 것은, CLR2 및 CLR3은 나선 VI을 따라 소수성 홈을 차지하고, Phe2556.57의 방향족 고리와 광범위한 접촉을 형성하여, 이들 사이에 끼어있다(도 3C). 수용체의 아데노신 패밀리에서, 위치 6.57은 Ile, Val, 또는 Phe으로 보존되며: 이 구조에서 관찰된 스태킹(stacking) 상호작용 유형을 모두 지원할 수 있는 소수성 잔기들이다. 추가로, CLR2는 Ser263의 주요-쇄 카르복실과 함께 수소 결합(2.6 Å)을 형성하고, 그리고 CLR3의 하이드록실은 Cys259-Cys262 이황화결합에 의해 안정화된 루프인 ECL3에서 Cys259의 황과 극(polar) 상호작용(4.0 Å)을 가진다. 콜레스테롤에 의해 나선 VI의 이 영역의 특이적 결합 및 형태학적 안정화는 수용체의 리간드 결합 포켓 안에 Asn2536.55 측쇄의 위치를 고정시킴으로써 A2AAR에서 기능적 역할을 할 수 있다. 이 주요 잔기는 모든 아데노신 수용체들에서 존재하고, 항진물질들 및 길항물질 복합체들 모두에서 리간드의 중심 코어의 고리밖(exocyclic) 아민을 고정시킨다.

A2AAR-BRIL-ΔC DNA는 GenScript에 의해 5'단부에 제한효소 부위 AscI와 3'단부에 HindIII가 측면에 위치되도록 합성되었다. 야생형 인간 A2AAR와 대장균(E. coli) (M7W, H102I, K106L)의 열안정화된 아포사이토크롬 b562의 서열에 근거하여(BRIL으로 불림) 이 유전자는 다음의 특징들을 포함한다: (a) BRIL의 잔기 Ala1 내지 Leu106은 A2AAR ICL3 영역내 Lys209 내지 Gly218 영역 사이에 삽입되었다. (b) A2AAR의 C-말단 잔기 317-412는 절두되었다. pFastBac1-830400으로 지정된 발현 벡터는 BamHI 측면에 있는 HA 신호 서열과 이어서 N-말단에 FLAG 테그와 C-말단에 10xHis 테그를 가진 발현 카세트를 포함하는 변형된 pFastBac1 벡터(Invitrogen)이다. 발현 카세트의 성분들은 표준 PCR 기반의 부위-지향된 돌연변이생성을 이용하여 도입되었다. 이 발현 카세트는 표준 제한효소 절단 및 합성된 A2AAR-BRIL-ΔC DNA의 후속적인 결찰을 허용하는 AscI 및 HindIII에 대한 대응하는 제한효소 부위들을 또한 포함하였다.

생화학적 특징화를 위하여, 모든 구조체들은 pFastBac1-830400 발현 벡터들로부터 BamHI 및 HindIII 제한효소들을 이용하여 절단하였다. 절단 후, 삽입물들은 내생성 제한효소 부위 BamHI 및 HindIII를 이용하여 pcDNA3.1(-) 안으로 서브클론시키고, 이들의 서열들을 확인하였다. HEK293 세포들은 10% 새로 태어난 송아지 혈청(NCS), 50 μg/ml 스트렙토마이신과 50 IU/ml 페니실린이 보충된 Dulbecco 변형된 Eagle 배지(DMEM)로 구성된 배양 배지에서 37℃에서 7% CO₂ 상태에서 성장되었다. 세포들은 10 cm

플레이트에서 1:15의 비율로 주당 2회 2차배양되었다(subcultured). 인산칼슘 침전법(40)을 이용하여 세포들은 지정된 플라스미드 (각 10 μg)로 형질감염되었다. 모든 실험들은 형질감염 후 48시간에 실행되었다. 형질감염 후 세포-표면 수용체 측정 및 효소-연계된 면역흡착 분석을 위하여, 웰당 10⁵의 밀도에서 96-웰 폴리-D-리신-피복된 플레이트에 세포들을 나누었다. 추가 24시간 후, 세포-표면 수용체들에게 37℃에서 30분간 배양 배지 내에서 마우스 항-FLAG (M2) 1차 항체(Sigma, 1:1000)로 라벨링시켰다. 그 다음 이 세포들은 25 mM HEPES가 보충된 DMEM으로 1회 세척되었고, 그 다음 2차 항체로써 염소에서 생산된 양고추냉이 과산화효소-접합된 항-마우스 IgG(Brunswig) (1:5000)가 보충된 배양 배지내에서 37℃에서 추가 30분 동안 항온처리되었다. 세포들은 2회 인산염-완충된 염수(PBS)로 세척되었다. 끝으로, 이 세포들은 실온 암 상태에서 5분 동안 3,3',5,5'-테트라메틸벤지딘(TMB)과 함께 항온처리되었다. 반응은 1M H₃PO₄로 중단되었고, 그리고 5분 후 VICTOR2 플레이트 판독기(PerkinElmer Life Sciences)를 이용하여 450nm에서 흡수도를 읽었다. 대조군 실험들은 2차 또는 1차 항체 추가없이 실행되었다. 두 경우 모두에서 흡수가 관찰되지 않았다.

HEK293 세포 막[³H]ZM241385 (27.4 Ci/mmol)을 이용한 경쟁 결합 분석은 ARC Inc. (St. Louis, MO, USA)으로부터 수득하였다. ZM241385 및 CGS21680은 Ascent Scientific (Bristol, UK)으로부터 수득하였고, UK432,097은 Axon (Groningen, The Netherlands)으로부터 수득하였다. 모든 기타 재료들은 시판되는 것으로 구입되었고, 이용가능한 최대 순도를 가지고 있었다. HEK293 세포들은 상기에서 설명된 것과 같이 성장되었고, 형질감염되었다. 막들은 다음과 같이 준비되었다. 형질감염 후 48시간에, 5 ml PBS 안으로 세포들을 긁어내어 플레이트로부터 분리시키고, 수거하고, 5분간 700 ×g (3000 r.p.m.)에서 원심분리시켰다. 8개 플레이트(10 cm

)로부터 유도된 펠렛들을 모우고, 5 mM MgCl₂, pH 7.4와 함께 얼음-냉각된 50 mM Tris-HCl 완충액 8ml에 재현탁시켰다. UltraThurrax를 이용하여 세포 현탁액을 균질화시켰다. 세포 막과 시토졸 분획은 Beckman Optima LE-80K 초원심분리기에서 4℃에서 20분간 100,000 ×g (31,000 r.p.m.)에서 원심분리시켜 분리되었다. 이 펠렛은 4 ml의 Tris 완충액에서 재현탁되었고, 균질화 및 원심분리 단계가 반복되었다. Tris 완충액(2 ml)을 이용하여 펠렛은 재현탁되었고, 아데노신 데아미네이즈(ADA)가 추가되어(0.8 IU/ml) 내생성 아데노신이 분해되었다. 막들은 -80 ℃에서 250 μL 분액으로 보관되었다. 막 단백질 농도는 BCA (비신코닌산) 방법을 이용하여 측정되었다. 경쟁 결합 실험들을 위하여, 단일 점 실험에 25 μg의 막이 우선 이용되었고, 총 결합은 방사능리간드 고갈을 방지하기 위하여 첨가된 전체 방사능 활성의 10% 미만이었다는 것을 확인하기 위하여, 전(whole) 곡선을 가진 실험에 후속적으로 6 내지 20 μg의 단백질이 이용되었다. 막 분획(Membrane aliquots)은 25℃에서 2시간 동안 총 100 μl 용적의 분석 완충액(50 mM Tris-HCl, pH 7.4, 5 mM MgCl₂가 보충됨)에서 항온처리되었다. 방사능리간드 대체 실험은 1M NaCl 존재 및 부재하에 경쟁 리간드(ZM241385 또는 UK432,097)의 5가지 농도를 이용하여 실시되었다. [³H]ZM241385는 ~ 4.0 nM의 농도로 이용되었다. 100 μM CGS21680 존재하에서 비특이적 결합을 측정하였고, 총 결합의 10% 미만을 나타내었다. Filtermate-수확기(PerkinElmer Life Sciences)를 이용하여 96-웰 GF/B 필터 플레이트를 통하여 결합된 그리고 자유 방사능리간드를 분리시키기 위하여 신속한 진공 여과에 의해 항온처리는 종료되었다. 필터는 후속적으로 얼음-냉각된 완충액(5 mM MgCl₂가 보충된 50mM Tris HCl, pH 7.4)으로 3회 세척되었다. 필터-결합된 방사능활성은 PE 1450 Microbeta Wallac Trilux 신틸레이션 계수기 (PerkinElmer Life Sciences)를 이용하여 신틸레이션 분광계에 의해 측정되었다.

세포내 cAMP 측정에 의해 하류 신호생성의 설명. HEK293T 세포들은 상기에서 설명된 것과 같이 성장되었고, 형질감염되었다. 세포들은 형질감염 후 48시간에 수거되엇고, 생성된 cAMP의 양은 추천 프로토콜(PerkinElmer Life Sciences)에 따라 LANCE Ultra cAMP 384 키트로 측정되었다. 요약하면, 4000개 세포/웰은 자극 완충액(5 mM HEPES, 0.1% BSA, 50 μM rolipram, 50 μM 실로스타미드(cilostamide)와 0.8 IU/ml ADA가 보충된 PBS)에서 37℃, 30분 동안 ZM241385 (100 nM, approx. 100 × Ki) 부재 또는 존재하에 UK432,097 (30 nM, approx. EC80)와 함께 또는 ZM241385 (100 nM)와 함께 단일 농도로 사전-항온처리되었다. 후속적으로, 탐지 및 항체 용액들은 제조업자의 지시에 따라 첨가되었고, 그 다음 실온, 암상태에서 1시간 동안 항온처리되었다. 생성된 형광 강도는 EnVision® Multilabel Reader (PerkinElmer, Groningen, Netherlands)에서 정량화되었다.

Sf9 세포에서 수용체 발현 및 정제. 고-역가 재조합 베귤로바이러스(viral ml 당 >10⁸ 의 바이러스 입자들)는 Bac-to-Bac Baculovirus Expression System (Invitrogen)을 이용하여 수득되었다. 간략하게 설명하자면, 재조합 베큘로바이러스는 3 μl의 FuGENE HD Transfection Reagent (Roche) 및 Transfection Medium (Expression Systems)을 이용하여 표적 유전자 서열을 포함하는 5 μg의 박미드를 스포도프테라 푸루기페르다(Spodoptera frugiperda) (Sf9) 세포 안으로 형질감염시킴으로써 생성되었다. 세포 현탁액은 27℃에서 쉐이킹하면서 4 d 동안 항온처리되었다. P0 바이러스 원액은 4 d 후 단리되었고, 이를 이용하여 고-역가 베큘로바이러스 원액을 만들었다. 바이러스 역가는 gp64-PE (Expression Systems) 으로 (42) 세포를 착색시킨 후 유동-세포측정 방법으로 실시되었다. 2-3 × 10⁶ 세포/ml 밀도에서 Sf9 세포는 3의 MOI (감염 다중성)에서 P2 바이러스로 감염되었다. 감염 48 시간 후 원심분리에 의해 세포들을 수확하였고, 사용할 때까지 - 80℃에서 보관하였다. 곤충 세포 막들은 10 mM HEPES (pH 7.5), 10 mM MgCl2, 20 mM KCl 및 EDTA-없는 완전 프로테아제 억제제 칵테일(Roche)을 포함하는 저장성(hypotonic) 완충액에 냉동된 세포 펠렛을 해동시킴으로써 파괴되었다. 단리된 가공안된(raw) 막들의 광범위한 세척은 가용성 및 막 연합된 단백질들을 제거하기 위하여 동일한 저장성 완충액(~2-3회)과 그 다음 높은 삼투성 완충액(1.0 M NaCl, 10 mM HEPES (pH 7.5), 10 mM MgCl₂, 20 mM KCl을 포함)(~3-4회)으로 둔스(dounce) 균질화 및 원심분리를 반복함으로써(~2-3회) 실시되었다. 정제된 막들은 10 mM HEPES (pH 7.5), 10 mM MgCl2, 20 mM KCl, 그리고 40% 글리세롤에서 재현탁되고, 액화 질소에서 순간-냉동되고(flash-frozen) 그리고 추가 이용시까지 80℃에서 보관되었다. 가용성화(solubilization)전에, 정제된 막들은 얼음위 4 mM 테오필린(Sigma), 2.0 mg/ml 요오드아세타미드(Sigma), 그리고 EDTA-없는 완전한 프로테아제 억제제 칵테일(Roche)에서 해동되었다. 4℃에서 30분간 항온처리 후, 막들은 0.5% (w/v) n-도데실-β-D-말토피라노시드(DDM) (Anatrace)와 0.1% (w/v) 콜레스테릴 헤미숙신산염(CHS) (Sigma) 존재하에 4℃에서 2.5-4 h 동안 항온처리함으로써 가용화되었다. 가용화안된 물질들은 45분간 150,000 ×g에서 원심분리에 의해 제거되었다. 상청액은 50 mM HEPES (pH 7.5), 800 mM NaCl, 0.5% (w/v) DDM, 0.1% (w/v) CHS, 및 20 mM 이미다졸을 함유하는 완충액에서 TALON IMAC 수지(Clontech)와 함께 항온처리되었다. 하룻밤 결합 후, 수지는 10배 용적의 50 mM HEPES (pH 7.5), 800 mM NaCl, 10% (v/v) 글리세롤, 25 mM 이미다졸, 0.1% (w/v) DDM, 0.02% (w/v) CHS, 10 mM MgCl₂, 8 mM ATP (Sigma) 그리고 25 μM ZM241385 (Tocris, DMSO에서 100mM 원액으로 준비됨)으로 세척하고, 이어서, 컬럼 4배 용적의 50 mM HEPES (pH 7.5), 800 mM NaCl, 10% (v/v) 글리세롤, 50 mM 이미다졸, 0.05% (w/v) DDM, 0.01% (w/v) CHS 및 25 μM ZM241385으로 세척한다. 이 수용체는 최저 용적에서 25 mM HEPES (pH 7.5), 800 mM NaCl, 10% (v/v) 글리세롤, 220 mM 이미다졸, 0.025% (w/v) DDM, 0.005% (w/v) CHS 및 25 μM ZM241385로 용리되었다. ZM241385 존재하에 정제된 수용체는 100 kDa 분자량 컷-오프 Vivaspin 농축기(GE Healthcare)로 ~0.4 mg/ml 내지 60 mg/ml로 농축되었다. 수용체 순도 및 단분산은 SDS-PAGE와 분석용 크기 압출 크로마토그래피 (aSEC)에 따랐다.

결정화. ZM241385와의 복합체에서 A2AAR-BRIL-ΔC의 단백질 시료는 기계적 주사기 믹서를 이용하여 용융 지질과 혼합함으로써 지질 정방 상(LCP)로 재구성되었다. 단백질-LCP 혼합물은 40% (w/w) 단백질 용액, 54% (w/w) 모노올레인 (Sigma) 및 6% (w/w) 콜레스테롤 (AvantiPolar Lipids)을 포함하였다. 결정화 시도는 각 웰에서 0.8 μL 침전제 용액으로 덮은 40-50 nL 단백질을 실은 LCP를 이용하여 NT8-LCP 결정화 로봇(Formulatrix)에 의해 96-웰 유리 샌드위치 플레이트(Marienfeld)에서 실행하였고, 그리고 유리 커버슬립으로 봉하였다. LCP에서 단백질 재구성과 결정화 시도는 실온(~21-23℃)에서 실행되었다. 결정화 플레이트는 20℃에서 인큐베이터/화상촬영기(RockImager 1000, Formulatrix)에서 보관되었고, 영상촬영되었다. 60×10×3 μm의 평균 크기의 회절 특성 결정들은 25-28% (v/v) PEG 400, 0.04 내지 0.06 M 티오시안산 나트륨염, 2% (v/v) 2,5-헥센디올, 100 mM 구연산 나트륨 pH 5.0에서 7일 이내에 수득되었다. 50 μm MiTeGen 마이크로마운트(micromounts)를 이용하여 LCP로부터 결정들을 직접 수거하였고, 추가 동결보호제 없이 액화 질소에서 즉시 냉동시켰다.

X-선 데이터 수거 및 처리. 결정학적 데이터는 1.0330 Å의 파장 및 MarMosaic 300 탐지기에서 10 μm 조준된 미니빔을 이용하여 Advanced Photon Source의 23ID-B/D 빔라인(GM/CA CAT)에서 수거되었다. 방사능 손상을 감소시키기 위하여 결정들은 새로운 위치로 옮겨졌고, 가능하다면, 감쇠안된 빔으로 3초 노출 및 0.5°진동에서 5개 프레임을 수집한 후 대체되었다. 55개의 결정으로부터 데이터세트를 통합하고, 계측하고, 그리고 HKL2000을 이용하여 합병시켰다.

구조 측정 및 순화(refinement). 초기 분자 대체 용액은 조사 모델로 A2AAR-T4L-ΔC/ZM 구조(PDB ID 3EML)의 A2AAR 도메인을 이용하여 Phaser에 의해 수득되었다. BRIL 잔기들(residues)은 Coot와 Refmac5 사이의 반복적인 사이클링에 의해 과도한 ΣA-가중된 2|Fo|-|Fc| 밀도에서 수작업으로 구축되었으며, 생성 모델은 수렴(convergence)될 때까지 동일한 과정을 이용하여 추가적으로 정교하게 되었다. 모든 콜레스테롤에서 관찰된 우수한 전자 밀도는 다른 단백질-결합된 지질로부터 이러한 유형의 분자의 신뢰할 수 있는 구별 및 이들의 확실한 배치 및 방향을 허용하였다(도 3C 및 D). 그러나, 다른 지질들의 전자 밀도는 이들의 머리기(headgroups)를 명백하게 확인하는데 있어서 충분히 명확하지 않았다. 따라서, 결정화에 이용되는 주요 지질 성분인 모노올레인(OLC)에 더 적합한 일부를 제외하고,단백질 소수성 표면 부근의 가늘고 긴 전자 밀도 튜브의 대부분은 연장된 올레산(OLA)으로 모형화되었다. 데이터 수집 및 순화는 표 3에 보여준다.

표 3. X-선 데이터 수집 및 순화 통계.

구조 A2AAR-BRIL-ΔC

데이터 수집

결정의 수 55

스페이스 기 C2221

세포 크기

a, b, c (Å)

39.44, 179.52, 140.31

측정된 반사 수 176,392

독특한 반사 수 44,413

해상도(Å) 29.73 - 1.80 (1.86 - 1.80)

Rmerge 0.10 (0.81)

평균 I/σ(I) 17.7 (1.8)

완전성 (%) 95.1 (92.8)

반복 4.0 (3.3)

순화

해상도 (Å) 29.73 - 1.80

반사 수 (테스트 세트) 2,032 (2,222)

Rwork / Rfree 0.18 / 0.22

원자 수

단백질들 3,137

리간드 (ZM241385) 25

지질 447

Na+ 1

기타 189

평균 B 값(Å²)

A2AAR 22.8

BRIL 48.0

리간드 (ZM241385) 18.6

지질 52.1

Na+ 26.2

기타 38.8

R.m.s. 편차(deviations)

결합 길이(Å) 0.014

결합 각(°) 1.54

Ramachandran 플롯 통계(%)*

가장 선호되는 영역들 99.5

추가적으로 허용된 영역들 0.5

허용안된 영역들 0.0

* MolProbity에서 정의된 것과 같음.

실시예 6. 후보 융합 짝들과 오피오이드 수용체 융합 짝 단백질들

후보 융합 짝들의 패널은 각각 오피오이드 수용체 1 ("NOP1") 안으로 삽입되어 각각 생성된 NOP1-융합 짝 단백질은 발현되고, 추출되고, 그리고 정제되어 다양한 성질들이 측정되었다. 하기에서 설명된 연구를 위하여 NOP1을 이용하여 융합 짝들 Bril (BRIL, bRIL), 플라보독신, Cterm-T4L, 루브레독신, 크실라네이즈, 그리고 T4L (대조군으로)과의 융합 짝 단백질을 준비하였다.

각 NOP1-융합 짝 구조체는 DNA의 짧은 올리고머가 중첩 연장 PCR에 의해 복합된 유전자 합성 기술에 의해 만들어졌다. NOP1을 위한 각 융합 짝은 이 수용체의 N-말단에 Flag 에피토프 친화력 테그를 통합하고, 수용체의 C-말단에 10x 히스티딘 테그를 통합한 우리의 표준 발현 카세트 안으로 후속적으로 서브-클론되었다.

발현 결과의 예비 분석에서 NOP1-플라보독신 융합 짝 단백질 ("NOP1-플라보독신")은 최대 수준의 발현되었음이 드러났다. NOP1-BRIL은 두 번째로 높은 발현 수준을 가졌다.

모든 융합 단백질들은 기본적으로 동일한 프로토콜을 이용하여 발현되고, 수거되고, 그리고 정제되었다. NOP1 수용체 융합 발현 구조체들을 포함하는 재조합 박미드 DNA는 Invitrogen Bac-to-Bac® Baculovirus Expression System 매뉴얼에서 설명된 것과 같이 표준 프로토콜을 이용하여 생성되었다. 스포도프테라 푸루기페르다(Spodoptera frugiperda) (Sf-9) 세포들은 정제된 박미드 DNA로 형질감염되었고, 그리고 재조합 바이러스는 수거되었고, 고-역가 원액을 만들기 위하여 증폭되었다. Sf-9 세포들은 감염되었고, 분석을 위하여 48시간 후 수거되었다. 전체 막 분획은 냉동된 전체 세포로부터 단리되었다. NOP1 융합 짝 단백질들은 도데실-말토시드(DDM) 추출과 이어서 Talon 수지 (Clontech) 상에서 고정된 금속 친화력 크로마토그래피(IMAC)에 의해 막으로부터 정제되었다. 용리된 단백질들은 수용체의 N-말단에서 Flag 에피토프를 지향하는 항체를 이용한 웨스턴 블랏을 이용하여 10% SDS-PAGE 겔 상에서 전기영동에 의해 수율 및 동질성에 대해 분석되었고(도 6A), 뿐만 아니라 분석용 크기-압출 크로마토그래피 (aSEC)를 이용하여 단분산에 대해 분석되었다 (도 6B).

항-FLAG 항체를 이용한 웨스턴 블랏과 함께 SDS-PAGE 겔 분석과, 그리고 분석용 SEC에서, 융합 짝으로 전장의 T4L의 삽입은 야생형 NOP1과 비교하여 구조체(NOP1-T4L을 인코드하는 구조체)가 상당히 더 적게 발현되고, 뿐만 아니라 열악한 단분산을 나타내며, 이는 모두 안정화가 더 낮은 구조체임을 나타낸다. 대조적으로, NOP1-플라보독신 및 NOP1-bRIL 구조체들은 상당히 더 큰 발현 수준(도 6A)과 개선된 단분산 (도 6B)을 보유하였다.

구조체들은 도 7에 나타낸 것과 같이 열 전이 온도를 결정하기 위하여 열 변성 분석에서 분석되었다. 대안 융합 단백질들 NOP1-플라보독신과 NOP1-bRIL에 대해 전장의 NOP1-T4L 대조군을 비교하면 플라보독신 및 bRIL 대안 융합 짝들 모두 다 더 큰 안정화를 나타낸다(도 7A). 융합 짝으로써 전장의 T4L은 NOP1 안으로 삽입되는 접합 위치와 무관하게 야생형과 비교하여 Tm이 10℃ 감소되는 것으로 보이며(도 7B), 대조적으로, NOP1-플라보독신 또는 NOP1-bRIL은 전이 온도에서 네가티브 효과를 가졌다(도 7A).

접합 최적화(Junction optimization) 예를 들면, NOP1과 같은 새로운 수용체 표적을 따를 때 세 번째 세포내 루프 안에서 융합 짝의 최적의 배치를 위한 초기 예측은 대개 이상적이 아닌 것으로 간주되었다. 초기 발현 및 aSEC 결과에 근거하여, 플라보독신은 수용체와 융합 단백질 사이에 접합 위치의 최적화를 조사하기 위한 좋은 후보로 선택되었다. N-말단 Flag 에피토프의 웨스턴 블랏팅과 결합된 SDS-PAGE에 근거하여, 최적의 플라보독신 배치는 흔히 열악한 안정화를 나타내는 고분자량 올리고머 종의 사라짐에 의해 탐지될 수 있다는 것이 밝혀졌다(도 7A).

실시예 7. 케모킨 CCR5 수용체 융합 짝 단백질들

케모킨 수용체 CCR5를 이용하여 하기에서 설명되는 연구를 위하여 융합 짝들 Bril (cytB, BRIL, bRIL), 플라보독신, Cterm-T4L, 루브레독신, 크실라네이즈, 그리고 T4L (대조군으로써)과의 융합 짝 단백질을 준비하였다.

각 CCR5-융합 짝 구조체는 유전자 합성 기술에 의해 만들었는데, 이때 DNA의 짧은 올리고머는 중첩 연장 PCR에 의해 복합되었다. CCR5의 각 융합 짝은 후속적으로 수용체의 N-말단에 Flag 에피토프 친화력 테그와 수용체의 C-말단에 10x 히스티딘 테스를 통합한 우리의 표준 발현 카세트 안으로 서브-클론되었다.

발현 결과의 예비 분석에서 CCR5-루브레독신 및 CCR5-Cterm-T4L은 최대 수준의 발현을 생성하였음이 드러났다(도 8A).

모든 융합 단백질들은 기본적으로 동일한 프로토콜을 이용하여 발현되고, 수거되고, 그리고 정제되었다. CCR5 수용체 융합 발현 구조체들을 포함하는 재조합 박미드 DNA는 Invitrogen Bac-to-Bac® Baculovirus Expression System 매뉴얼에서 설명된 것과 같이 표준 프로토콜을 이용하여 생성되었다. 스포도프테라 푸루기페르다(Spodoptera frugiperda) (Sf-9) 세포들은 정제된 박미드 DNA로 형질감염되었고, 그리고 재조합 바이러스는 수거되었고, 고-역가 원액을 만들기 위하여 증폭되었다. Sf-9 세포들은 감염되었고, 분석을 위하여 48시간 후 수거되었다. 전체 막 분획은 냉동된 전체 세포로부터 단리되었다. CCR5 융합 짝 단백질들은 도데실-말토시드(DDM) 추출과 이어서 Talon 수지 (Clontech) 상에서 고정된 금속 친화력 크로마토그래피(IMAC)에 의해 막으로부터 정제되었다. 용리된 단백질들은 수용체의 N-말단에서 Flag 에피토프를 지향하는 항체를 이용한 웨스턴 블랏을 이용하여 10% SDS-PAGE 겔 상에서 전기영동에 의해 수율 및 동질성에 대해 분석되었고(도 8A), 뿐만 아니라 분석용 크기-압출 크로마토그래피 (aSEC)를 이용하여 단분산에 대해 분석되었다 (도 8B).

수용체의 N-말단에서 FLAG 에피토프를 지향하는 항체를 이용한 웨스턴 블랏과 함께 SDS-PAGE 겔 분석과, 그리고 분석용 SEC에서, 전장의 T4L의 삽입은 야생형 과 비교하여 상당히 더 적게 발현되고, 뿐만 아니라 열악한 단분산을 나타내며, 이는 모두 안정화가 더 낮은 구조체임을 나타낸다. 대조적으로, 루브레독신 및 CCR5-cterm-T4L 단백질은 상당히 더 큰 발현 수준(도 8A)과 개선된 단분산 (도 8B)을 보유하였다.

실시예 8 BRIL과 접합된 노시셉틴/오르파닌 FQ 펩티드 수용체 융합 짝 단백질

노시셉틴/오르파닌 FQ (N/OFQ) 펩티드 (NOP) 수용체의 결정 구조는 Banyu Compound-24 (C-24)으로부터 작은 분자 길항물질과 복합되어 해결되었는데, 리간드 수용체 인지 및 선택성의 원자의 세부사항이 드러났다. C-24는 N/OFQ의 가까운 유사체인 NOP 선택성 펩티드 길항물질 UFP-101의 처음 4개의 N-말단 잔기를 닮았다 hNOP의 N-말단은 열안정화된 아포사이토크롬 b562RIL (BRIL)으로 대체되었으며, Compound-24 (C-24)과 복합된 이 수용체-융합의 X-선 결정 구조가 측정되었다. C-24는 이 수용체에 부여된 열안정화에 근거하여 hNOP-BRIL 구조체와 함께 공동-결정화를 위해 선택되었다. BRIL-△N-hNOP-△C 융합 단백질은 다른 리간드 존재하에서 또한 성공적으로 결정화되었다.

BRIL-△N-hNOP-△C. 지질 정방 상(LCP)에서 성장된 막 단백질과 일관되게, BRIL-△N-hNOP-△C 융합 단백질은 적층된 유형 I 결정 패킹 격자를 형성하였다. P21 격자의 비대칭 단위에서 2개의 역평행 수용체 분자와 함께, BRIL 도메인들중 하나는 무질서하지만, 두 번째는 인접 층으로부터 두 수용체들과 결정 격자 접촉을 형성한다. 두 수용체들의 전자 밀도는 해결된 BRIL 융합 도메인 (hNOP:A = 52.7, hNOP:B = 52.3 versus BRIL = 82.4 Å2)과 비교하였을 때 더 낮은 B-인자들을 가지며 우수하였다. 두 개의 hNOP 분자들의 막통과(TM) 코어는 0.6 Å의 CαRMSD와 거의 동일하다.

SEQUENCE LISTING <110> Receptos, Inc. The Scripps Research Institute HANSON, Michael A. ROTH, Christopher B. STEVENS, Raymond C. KUNKEN, Joshua M. GRIFFITH, Mark T. THOMPSON, Aaron A. LIU, Wei XU, Fei KATRITCH, Vsevolod <120> NOVEL FUSION PARTNERS FOR THE PURPOSE OF CRYSTALLIZING G-PROTEIN COUPLED RECEPTORS <130> 018410-0406491 <140> To Be Assigned <141> 2012-05-10 <150> 61/485,872 <151> 2011-05-13 <160> 13 <170> PatentIn version 3.5 <210> 1 <211> 381 <212> PRT <213> Homo sapiens <400> 1 Met Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser Ser Val 1 5 10 15 Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn Tyr Thr 20 25 30 Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys Leu Thr 35 40 45 Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu Asn Ile 50 55 60 Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg Pro Met 65 70 75 80 Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala Gly Val 85 90 95 Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr Lys Leu 100 105 110 Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val Ala Leu 115 120 125 Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg Tyr Ile 130 135 140 Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe Arg Leu 145 150 155 160 Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu Gly Gly 165 170 175 Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser Cys Ser 180 185 190 Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys Thr Thr 195 200 205 Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys Arg Ile 210 215 220 Tyr Ser Leu Val Arg Thr Arg Ser Arg Arg Leu Thr Phe Arg Lys Asn 225 230 235 240 Ile Ser Lys Ala Ser Arg Ser Ser Glu Asn Val Ala Leu Leu Lys Thr 245 250 255 Val Ile Ile Val Leu Ser Val Phe Ile Ala Cys Trp Ala Pro Leu Phe 260 265 270 Ile Leu Leu Leu Leu Asp Val Gly Cys Lys Val Lys Thr Cys Asp Ile 275 280 285 Leu Phe Arg Ala Glu Tyr Phe Leu Val Leu Ala Val Leu Asn Ser Gly 290 295 300 Thr Asn Pro Ile Ile Tyr Thr Leu Thr Asn Lys Glu Met Arg Arg Ala 305 310 315 320 Phe Ile Arg Ile Met Ser Cys Cys Lys Cys Pro Ser Gly Asp Ser Ala 325 330 335 Gly Lys Phe Lys Arg Pro Ile Ile Ala Gly Met Glu Phe Ser Arg Ser 340 345 350 Lys Ser Asp Asn Ser Ser His Pro Gln Lys Asp Glu Gly Asp Asn Pro 355 360 365 Glu Thr Ile Met Ser Ser Gly Asn Val Asn Ser Ser Ser 370 375 380 <210> 2 <211> 419 <212> PRT <213> Homo sapiens <400> 2 Met Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser Ser Val 1 5 10 15 Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn Tyr Thr 20 25 30 Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys Leu Thr 35 40 45 Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu Asn Ile 50 55 60 Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg Pro Met 65 70 75 80 Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala Gly Val 85 90 95 Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr Lys Leu 100 105 110 Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val Ala Leu 115 120 125 Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg Tyr Ile 130 135 140 Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe Arg Leu 145 150 155 160 Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu Gly Gly 165 170 175 Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser Cys Ser 180 185 190 Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys Thr Thr 195 200 205 Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys Arg Ile 210 215 220 Tyr Ser Leu Val Arg Thr Arg Ala Asp Leu Glu Asp Asn Trp Glu Thr 225 230 235 240 Leu Asn Asp Asn Leu Lys Val Ile Glu Lys Ala Asp Asn Ala Ala Gln 245 250 255 Val Lys Asp Ala Leu Thr Lys Met Arg Ala Ala Ala Leu Asp Ala Gln 260 265 270 Lys Ala Thr Pro Pro Lys Leu Glu Asp Lys Ser Pro Asp Ser Pro Glu 275 280 285 Met Lys Asp Phe Arg His Gly Phe Asp Ile Leu Val Gly Gln Ile Asp 290 295 300 Asp Ala Leu Lys Leu Ala Asn Glu Gly Lys Val Lys Glu Ala Gln Ala 305 310 315 320 Ala Ala Glu Gln Leu Lys Thr Thr Arg Asn Ala Tyr Ile Gln Lys Tyr 325 330 335 Leu Ala Ser Arg Ser Ser Glu Asn Val Ala Leu Leu Lys Thr Val Ile 340 345 350 Ile Val Leu Ser Val Phe Ile Ala Cys Trp Ala Pro Leu Phe Ile Leu 355 360 365 Leu Leu Leu Asp Val Gly Cys Lys Val Lys Thr Cys Asp Ile Leu Phe 370 375 380 Arg Ala Glu Tyr Phe Leu Val Leu Ala Val Leu Asn Ser Gly Thr Asn 385 390 395 400 Pro Ile Ile Tyr Thr Leu Thr Asn Lys Glu Met Arg Arg Ala Phe Ile 405 410 415 Arg Ile Met <210> 3 <211> 460 <212> PRT <213> Homo sapiens <400> 3 Met Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser Ser Val 1 5 10 15 Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn Tyr Thr 20 25 30 Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys Leu Thr 35 40 45 Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu Asn Ile 50 55 60 Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg Pro Met 65 70 75 80 Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala Gly Val 85 90 95 Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr Lys Leu 100 105 110 Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val Ala Leu 115 120 125 Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg Tyr Ile 130 135 140 Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe Arg Leu 145 150 155 160 Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu Gly Gly 165 170 175 Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser Cys Ser 180 185 190 Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys Thr Thr 195 200 205 Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys Arg Ile 210 215 220 Tyr Ser Leu Val Arg Thr Arg Ala Lys Ala Leu Ile Val Tyr Gly Ser 225 230 235 240 Thr Thr Gly Asn Thr Glu Tyr Thr Ala Glu Thr Ile Ala Arg Glu Leu 245 250 255 Ala Asp Ala Gly Tyr Glu Val Asp Ser Arg Asp Ala Ala Ser Val Glu 260 265 270 Ala Gly Gly Leu Phe Glu Gly Phe Asp Leu Val Leu Leu Gly Cys Ser 275 280 285 Thr Trp Gly Asp Asp Ser Ile Glu Leu Gln Asp Asp Phe Ile Pro Leu 290 295 300 Phe Asp Ser Leu Glu Glu Thr Gly Ala Gln Gly Arg Lys Val Ala Cys 305 310 315 320 Phe Gly Cys Gly Asp Ser Ser Trp Glu Tyr Phe Cys Gly Ala Val Asp 325 330 335 Ala Ile Glu Glu Lys Leu Lys Asn Leu Gly Ala Glu Ile Val Gln Asp 340 345 350 Gly Leu Arg Ile Asp Gly Asp Pro Arg Ala Ala Arg Asp Asp Ile Val 355 360 365 Gly Trp Ala His Asp Val Arg Gly Ala Ile Ala Ser Arg Ser Ser Glu 370 375 380 Asn Val Ala Leu Leu Lys Thr Val Ile Ile Val Leu Ser Val Phe Ile 385 390 395 400 Ala Cys Trp Ala Pro Leu Phe Ile Leu Leu Leu Leu Asp Val Gly Cys 405 410 415 Lys Val Lys Thr Cys Asp Ile Leu Phe Arg Ala Glu Tyr Phe Leu Val 420 425 430 Leu Ala Val Leu Asn Ser Gly Thr Asn Pro Ile Ile Tyr Thr Leu Thr 435 440 445 Asn Lys Glu Met Arg Arg Ala Phe Ile Arg Ile Met 450 455 460 <210> 4 <211> 498 <212> PRT <213> Homo sapiens <400> 4 Met Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser Ser Val 1 5 10 15 Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn Tyr Thr 20 25 30 Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys Leu Thr 35 40 45 Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu Asn Ile 50 55 60 Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg Pro Met 65 70 75 80 Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala Gly Val 85 90 95 Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr Lys Leu 100 105 110 Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val Ala Leu 115 120 125 Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg Tyr Ile 130 135 140 Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe Arg Leu 145 150 155 160 Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu Gly Gly 165 170 175 Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser Cys Ser 180 185 190 Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys Thr Thr 195 200 205 Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys Arg Ile 210 215 220 Tyr Ser Leu Val Arg Thr Arg Ala Ser Thr Asp Tyr Trp Gln Asn Trp 225 230 235 240 Thr Phe Gly Gly Gly Ile Val Asn Ala Val Asn Gly Ser Gly Gly Asn 245 250 255 Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe Val Val Gly Lys Gly 260 265 270 Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn Tyr Asn Ala Gly Val 275 280 285 Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Arg 290 295 300 Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg 305 310 315 320 Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser Asp Gly Gly Thr Tyr 325 330 335 Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro Ser Ile Asp Gly Asp 340 345 350 Asp Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Pro 355 360 365 Thr Gly Ser Asn Ala Thr Ile Thr Phe Thr Asn His Val Asn Ala Trp 370 375 380 Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp Ala Tyr Gln Val Met 385 390 395 400 Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val Thr Val Trp 405 410 415 Ala Ser Arg Ser Ser Glu Asn Val Ala Leu Leu Lys Thr Val Ile Ile 420 425 430 Val Leu Ser Val Phe Ile Ala Cys Trp Ala Pro Leu Phe Ile Leu Leu 435 440 445 Leu Leu Asp Val Gly Cys Lys Val Lys Thr Cys Asp Ile Leu Phe Arg 450 455 460 Ala Glu Tyr Phe Leu Val Leu Ala Val Leu Asn Ser Gly Thr Asn Pro 465 470 475 480 Ile Ile Tyr Thr Leu Thr Asn Lys Glu Met Arg Arg Ala Phe Ile Arg 485 490 495 Ile Met <210> 5 <211> 367 <212> PRT <213> Homo sapiens <400> 5 Met Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser Ser Val 1 5 10 15 Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn Tyr Thr 20 25 30 Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys Leu Thr 35 40 45 Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu Asn Ile 50 55 60 Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg Pro Met 65 70 75 80 Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala Gly Val 85 90 95 Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr Lys Leu 100 105 110 Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val Ala Leu 115 120 125 Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg Tyr Ile 130 135 140 Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe Arg Leu 145 150 155 160 Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu Gly Gly 165 170 175 Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser Cys Ser 180 185 190 Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys Thr Thr 195 200 205 Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys Arg Ile 210 215 220 Tyr Ser Leu Val Arg Thr Arg Met Lys Lys Tyr Thr Cys Thr Val Cys 225 230 235 240 Gly Tyr Ile Tyr Asn Pro Glu Asp Gly Asp Pro Asp Asn Gly Val Asn 245 250 255 Pro Gly Thr Asp Phe Lys Asp Ile Pro Asp Asp Trp Val Cys Pro Leu 260 265 270 Cys Gly Val Gly Lys Asp Gln Phe Glu Glu Val Glu Glu Ala Ser Arg 275 280 285 Ser Ser Glu Asn Val Ala Leu Leu Lys Thr Val Ile Ile Val Leu Ser 290 295 300 Val Phe Ile Ala Cys Trp Ala Pro Leu Phe Ile Leu Leu Leu Leu Asp 305 310 315 320 Val Gly Cys Lys Val Lys Thr Cys Asp Ile Leu Phe Arg Ala Glu Tyr 325 330 335 Phe Leu Val Leu Ala Val Leu Asn Ser Gly Thr Asn Pro Ile Ile Tyr 340 345 350 Thr Leu Thr Asn Lys Glu Met Arg Arg Ala Phe Ile Arg Ile Met 355 360 365 <210> 6 <211> 466 <212> PRT <213> Homo sapiens <400> 6 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Gly Ala Pro Gly Pro Thr Ser Val Pro Leu Val Lys Ala His Arg Ser 20 25 30 Ser Val Ser Asp Tyr Val Asn Tyr Asp Ile Ile Val Arg His Tyr Asn 35 40 45 Tyr Thr Gly Lys Leu Asn Ile Ser Ala Asp Lys Glu Asn Ser Ile Lys 50 55 60 Leu Thr Ser Val Val Phe Ile Leu Ile Cys Cys Phe Ile Ile Leu Glu 65 70 75 80 Asn Ile Phe Val Leu Leu Thr Ile Trp Lys Thr Lys Lys Phe His Arg 85 90 95 Pro Met Tyr Tyr Phe Ile Gly Asn Leu Ala Leu Ser Asp Leu Leu Ala 100 105 110 Gly Val Ala Tyr Thr Ala Asn Leu Leu Leu Ser Gly Ala Thr Thr Tyr 115 120 125 Lys Leu Thr Pro Ala Gln Trp Phe Leu Arg Glu Gly Ser Met Phe Val 130 135 140 Ala Leu Ser Ala Ser Val Phe Ser Leu Leu Ala Ile Ala Ile Glu Arg 145 150 155 160 Tyr Ile Thr Met Leu Lys Met Lys Leu His Asn Gly Ser Asn Asn Phe 165 170 175 Arg Leu Phe Leu Leu Ile Ser Ala Cys Trp Val Ile Ser Leu Ile Leu 180 185 190 Gly Gly Leu Pro Ile Met Gly Trp Asn Cys Ile Ser Ala Leu Ser Ser 195 200 205 Cys Ser Thr Val Leu Pro Leu Tyr His Lys His Tyr Ile Leu Phe Cys 210 215 220 Thr Thr Val Phe Thr Leu Leu Leu Leu Ser Ile Val Ile Leu Tyr Cys 225 230 235 240 Arg Ile Tyr Ser Leu Val Arg Thr Arg Ala Asp Leu Glu Asp Asn Trp 245 250 255 Glu Thr Leu Asn Asp Asn Leu Lys Val Ile Glu Lys Ala Asp Asn Ala 260 265 270 Ala Gln Val Lys Asp Ala Leu Thr Lys Met Arg Ala Ala Ala Leu Asp 275 280 285 Ala Gln Lys Ala Thr Pro Pro Lys Leu Glu Asp Lys Ser Pro Asp Ser 290 295 300 Pro Glu Met Lys Asp Phe Arg His Gly Phe Asp Ile Leu Val Gly Gln 305 310 315 320 Ile Asp Asp Ala Leu Lys Leu Ala Asn Glu Gly Lys Val Lys Glu Ala 325 330 335 Gln Ala Ala Ala Glu Gln Leu Lys Thr Thr Arg Asn Ala Tyr Ile Gln 340 345 350 Lys Tyr Leu Ala Ser Arg Ser Ser Glu Asn Val Ala Leu Leu Lys Thr 355 360 365 Val Ile Ile Val Leu Ser Val Phe Ile Ala Cys Trp Ala Pro Leu Phe 370 375 380 Ile Leu Leu Leu Leu Asp Val Gly Cys Lys Val Lys Thr Cys Asp Ile 385 390 395 400 Leu Phe Arg Ala Glu Tyr Phe Leu Val Leu Ala Val Leu Asn Ser Gly 405 410 415 Thr Asn Pro Ile Ile Tyr Thr Leu Thr Asn Lys Glu Met Arg Arg Ala 420 425 430 Phe Ile Arg Ile Met Gly Arg Pro Leu Glu Val Leu Phe Gln Gly Pro 435 440 445 His His His His His His His His His His Asp Tyr Lys Asp Asp Asp 450 455 460 Asp Lys 465 <210> 7 <211> 254 <212> PRT <213> Homo sapiens <400> 7 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys 195 200 205 Tyr Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala 210 215 220 Ile Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val 225 230 235 240 Phe Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu 245 250 <210> 8 <211> 506 <212> PRT <213> Homo sapiens <400> 8 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys 195 200 205 Tyr Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala 210 215 220 Ile Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val 225 230 235 240 Phe Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Asn Ile 245 250 255 Phe Glu Met Leu Arg Ile Asp Glu Gly Leu Arg Leu Lys Ile Tyr Lys 260 265 270 Asp Thr Glu Gly Tyr Tyr Thr Ile Gly Ile Gly His Leu Leu Thr Lys 275 280 285 Ser Pro Ser Leu Asn Ala Ala Lys Ser Glu Leu Asp Lys Ala Ile Gly 290 295 300 Arg Asn Thr Asn Gly Val Ile Thr Lys Asp Glu Ala Glu Lys Leu Phe 305 310 315 320 Asn Gln Asp Val Asp Ala Ala Val Arg Gly Ile Leu Arg Asn Ala Lys 325 330 335 Leu Lys Pro Val Tyr Asp Ser Leu Asp Ala Val Arg Arg Ala Ala Leu 340 345 350 Ile Asn Met Val Phe Gln Met Gly Glu Thr Gly Val Ala Gly Phe Thr 355 360 365 Asn Ser Leu Arg Met Leu Gln Gln Lys Arg Trp Asp Glu Ala Ala Val 370 375 380 Asn Leu Ala Lys Ser Arg Trp Tyr Asn Gln Thr Pro Asn Arg Ala Lys 385 390 395 400 Arg Val Ile Thr Thr Phe Arg Thr Gly Thr Trp Asp Ala Tyr Lys Phe 405 410 415 Cys Leu Lys Glu His Lys Ala Leu Lys Thr Leu Gly Ile Ile Met Gly 420 425 430 Thr Phe Thr Leu Cys Trp Leu Pro Phe Phe Ile Val Asn Ile Val His 435 440 445 Val Ile Gln Asp Asn Leu Ile Arg Lys Glu Val Tyr Ile Leu Leu Asn 450 455 460 Trp Ile Gly Tyr Val Asn Ser Gly Phe Asn Pro Leu Ile Tyr Cys Arg 465 470 475 480 Ser Pro Asp Phe Arg Ile Ala Phe Gln Glu Leu Leu Cys Leu Arg Arg 485 490 495 Ser Ser Leu Lys His His His His His His 500 505 <210> 9 <211> 473 <212> PRT <213> Homo sapiens <400> 9 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys 195 200 205 Tyr Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala 210 215 220 Ile Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val 225 230 235 240 Phe Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Lys Asp 245 250 255 Glu Ala Glu Lys Leu Phe Asn Gln Asp Val Asp Ala Ala Val Arg Gly 260 265 270 Ile Leu Arg Asn Ala Lys Leu Lys Pro Val Tyr Asp Ser Leu Asp Ala 275 280 285 Val Arg Arg Ala Ala Leu Ile Asn Met Val Phe Gln Met Gly Glu Thr 290 295 300 Gly Val Ala Gly Phe Thr Asn Ser Leu Arg Met Leu Gln Gln Lys Arg 305 310 315 320 Trp Asp Glu Ala Ala Val Asn Leu Ala Lys Ser Arg Trp Tyr Asn Gln 325 330 335 Thr Pro Asn Arg Ala Lys Arg Val Ile Thr Thr Phe Arg Thr Gly Thr 340 345 350 Trp Asp Ala Tyr Lys Asn Leu Ser Gly Gly Gly Gly Ala Met Asp Ile 355 360 365 Phe Glu Met Leu Arg Ile Asp Glu Gly Lys Phe Cys Leu Lys Glu His 370 375 380 Lys Ala Leu Lys Thr Leu Gly Ile Ile Met Gly Thr Phe Thr Leu Cys 385 390 395 400 Trp Leu Pro Phe Phe Ile Val Asn Ile Val His Val Ile Gln Asp Asn 405 410 415 Leu Ile Arg Lys Glu Val Tyr Ile Leu Leu Asn Trp Ile Gly Tyr Val 420 425 430 Asn Ser Gly Phe Asn Pro Leu Ile Tyr Cys Arg Ser Pro Asp Phe Arg 435 440 445 Ile Ala Phe Gln Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys His 450 455 460 His His His His His His His His His 465 470 <210> 10 <211> 455 <212> PRT <213> Homo sapiens <400> 10 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Trp Thr Phe Gly Asn Phe Trp 115 120 125 Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser Ile 130 135 140 Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr Ser 145 150 155 160 Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val Ile 165 170 175 Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro Ile 180 185 190 Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys Tyr 195 200 205 Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala Ile 210 215 220 Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val Phe 225 230 235 240 Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Ala Asp Leu 245 250 255 Glu Asp Asn Trp Glu Thr Leu Asn Asp Asn Leu Lys Val Ile Glu Lys 260 265 270 Ala Asp Asn Ala Ala Gln Val Lys Asp Ala Leu Thr Lys Met Arg Ala 275 280 285 Ala Ala Leu Asp Ala Gln Lys Ala Thr Pro Pro Lys Leu Glu Asp Lys 290 295 300 Ser Pro Asp Ser Pro Glu Met Lys Asp Phe Arg His Gly Phe Asp Ile 305 310 315 320 Leu Val Gly Gln Ile Asp Asp Ala Leu Lys Leu Ala Asn Glu Gly Lys 325 330 335 Val Lys Glu Ala Gln Ala Ala Ala Glu Gln Leu Lys Thr Thr Arg Asn 340 345 350 Ala Tyr Ile Gln Lys Tyr Leu Lys Phe Cys Leu Lys Glu His Lys Ala 355 360 365 Leu Lys Thr Leu Gly Ile Ile Met Gly Thr Phe Thr Leu Cys Trp Leu 370 375 380 Pro Phe Phe Ile Val Asn Ile Val His Val Ile Gln Asp Asn Leu Ile 385 390 395 400 Arg Lys Glu Val Tyr Ile Leu Leu Asn Trp Ile Gly Tyr Val Asn Ser 405 410 415 Gly Phe Asn Pro Leu Ile Tyr Cys Arg Ser Pro Asp Phe Arg Ile Ala 420 425 430 Phe Gln Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys His His His 435 440 445 His His His His His His His 450 455 <210> 11 <211> 403 <212> PRT <213> Homo sapiens <400> 11 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys Tyr 195 200 205 Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala Ile 210 215 220 Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val Phe 225 230 235 240 Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Met Lys Lys 245 250 255 Tyr Thr Cys Thr Val Cys Gly Tyr Ile Tyr Asn Pro Glu Asp Gly Asp 260 265 270 Pro Asp Asn Gly Val Asn Pro Gly Thr Asp Phe Lys Asp Ile Pro Asp 275 280 285 Asp Trp Val Cys Pro Leu Cys Gly Val Gly Lys Asp Gln Phe Glu Glu 290 295 300 Val Glu Glu Lys Phe Cys Leu Lys Glu His Lys Ala Leu Lys Thr Leu 305 310 315 320 Gly Ile Ile Met Gly Thr Phe Thr Leu Cys Trp Leu Pro Phe Phe Ile 325 330 335 Val Asn Ile Val His Val Ile Gln Asp Asn Leu Ile Arg Lys Glu Val 340 345 350 Tyr Ile Leu Leu Asn Trp Ile Gly Tyr Val Asn Ser Gly Phe Asn Pro 355 360 365 Leu Ile Tyr Cys Arg Ser Pro Asp Phe Arg Ile Ala Phe Gln Glu Leu 370 375 380 Leu Cys Leu Arg Arg Ser Ser Leu Lys His His His His His His His 385 390 395 400 His His His <210> 12 <211> 535 <212> PRT <213> Homo sapiens <400> 12 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys 195 200 205 Tyr Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala 210 215 220 Ile Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val 225 230 235 240 Phe Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Ala Ser 245 250 255 Thr Asp Tyr Trp Gln Asn Trp Thr Phe Gly Gly Gly Ile Val Asn Ala 260 265 270 Val Asn Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly 275 280 285 Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr 290 295 300 Ile Asn Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu 305 310 315 320 Thr Leu Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val 325 330 335 Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val 340 345 350 Lys Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn 355 360 365 Ala Pro Ser Ile Asp Gly Asp Asp Thr Thr Phe Thr Gln Tyr Trp Ser 370 375 380 Val Arg Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe 385 390 395 400 Thr Asn His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser 405 410 415 Asn Trp Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 420 425 430 Ser Ser Asn Val Thr Val Trp Lys Phe Cys Leu Lys Glu His Lys Ala 435 440 445 Leu Lys Thr Leu Gly Ile Ile Met Gly Thr Phe Thr Leu Cys Trp Leu 450 455 460 Pro Phe Phe Ile Val Asn Ile Val His Val Ile Gln Asp Asn Leu Ile 465 470 475 480 Arg Lys Glu Val Tyr Ile Leu Leu Asn Trp Ile Gly Tyr Val Asn Ser 485 490 495 Gly Phe Asn Pro Leu Ile Tyr Cys Arg Ser Pro Asp Phe Arg Ile Ala 500 505 510 Phe Gln Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys His His His 515 520 525 His His His His His His His 530 535 <210> 13 <211> 497 <212> PRT <213> Homo sapiens <400> 13 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Phe Cys Leu Val Phe Ala 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Ala Met Gly Gln Pro Gly Asn Gly Ser 20 25 30 Ala Phe Leu Leu Ala Pro Asn Arg Ser His Ala Pro Asp His Asp Val 35 40 45 Thr Gln Gln Arg Asp Glu Val Trp Val Val Gly Met Gly Ile Val Met 50 55 60 Ser Leu Ile Val Leu Ala Ile Val Phe Gly Asn Val Leu Val Ile Thr 65 70 75 80 Ala Ile Ala Lys Phe Glu Arg Leu Gln Thr Val Thr Asn Tyr Phe Ile 85 90 95 Thr Ser Leu Ala Cys Ala Asp Leu Val Met Gly Leu Ala Val Val Pro 100 105 110 Phe Gly Ala Ala His Ile Leu Met Lys Met Trp Thr Phe Gly Asn Phe 115 120 125 Trp Cys Glu Phe Trp Thr Ser Ile Asp Val Leu Cys Val Thr Ala Ser 130 135 140 Ile Trp Thr Leu Cys Val Ile Ala Val Asp Arg Tyr Phe Ala Ile Thr 145 150 155 160 Ser Pro Phe Lys Tyr Gln Ser Leu Leu Thr Lys Asn Lys Ala Arg Val 165 170 175 Ile Ile Leu Met Val Trp Ile Val Ser Gly Leu Thr Ser Phe Leu Pro 180 185 190 Ile Gln Met His Trp Tyr Arg Ala Thr His Gln Glu Ala Ile Asn Cys 195 200 205 Tyr Ala Glu Glu Thr Cys Cys Asp Phe Phe Thr Asn Gln Ala Tyr Ala 210 215 220 Ile Ala Ser Ser Ile Val Ser Phe Tyr Val Pro Leu Val Ile Met Val 225 230 235 240 Phe Val Tyr Ser Arg Val Phe Gln Glu Ala Lys Arg Gln Leu Ala Lys 245 250 255 Ala Leu Ile Val Tyr Gly Ser Thr Thr Gly Asn Thr Glu Tyr Thr Ala 260 265 270 Glu Thr Ile Ala Arg Glu Leu Ala Asp Ala Gly Tyr Glu Val Asp Ser 275 280 285 Arg Asp Ala Ala Ser Val Glu Ala Gly Gly Leu Phe Glu Gly Phe Asp 290 295 300 Leu Val Leu Leu Gly Cys Ser Thr Trp Gly Asp Asp Ser Ile Glu Leu 305 310 315 320 Gln Asp Asp Phe Ile Pro Leu Phe Asp Ser Leu Glu Glu Thr Gly Ala 325 330 335 Gln Gly Arg Lys Val Ala Cys Phe Gly Cys Gly Asp Ser Ser Trp Glu 340 345 350 Tyr Phe Cys Gly Ala Val Asp Ala Ile Glu Glu Lys Leu Lys Asn Leu 355 360 365 Gly Ala Glu Ile Val Gln Asp Gly Leu Arg Ile Asp Gly Asp Pro Arg 370 375 380 Ala Ala Arg Asp Asp Ile Val Gly Trp Ala His Asp Val Arg Gly Ala 385 390 395 400 Ile Lys Phe Cys Leu Lys Glu His Lys Ala Leu Lys Thr Leu Gly Ile 405 410 415 Ile Met Gly Thr Phe Thr Leu Cys Trp Leu Pro Phe Phe Ile Val Asn 420 425 430 Ile Val His Val Ile Gln Asp Asn Leu Ile Arg Lys Glu Val Tyr Ile 435 440 445 Leu Leu Asn Trp Ile Gly Tyr Val Asn Ser Gly Phe Asn Pro Leu Ile 450 455 460 Tyr Cys Arg Ser Pro Asp Phe Arg Ile Ala Phe Gln Glu Leu Leu Cys 465 470 475 480 Leu Arg Arg Ser Ser Leu Lys His His His His His His His His His 485 490 495 His

Claims

N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) G-단백질-연결된 수용체 (GPCR)의 일부를 포함하는 제 1 도메인, 이때 제 1 도메인은 GPCR의 제1 내지 5번째 막통과 도메인들을 포함하고, (ii) 융합 짝 아미노산 서열을 포함하는 제 2 도메인, 이때 전술한 서열은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 크실라네이즈, 또는 T4라이소자임의 C-말단 단편으로 구성된 목록에서 선택된 단백질에 최소한 90% 상동성이며, 그리고 (iii) GPCR의 일부를 포함하는 제 3 도메인, 이때 제3 도메인은 GPCR의 6번째와 7번째 막통과 도메인들을 포함한다.
N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) G-단백질-연결된 수용체 (GPCR)을 포함하는 제 1 도메인, 그리고 (ii) 융합 짝 아미노산 서열을 포함하는 제 2 도메인, 이때 전술한 서열은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 크실라네이즈, 또는 T4라이소자임의 C-말단 단편으로 구성된 목록에서 선택된 단백질에 최소한 90% 상동성이다.
N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) 융합 짝 아미노산 서열을 포함하는 제 1 도메인, 이때 전술한 서열은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 크실라네이즈, 또는 T4라이소자임의 C-말단 단편으로 구성된 목록에서 선택된 단백질에 최소한 90% 상동성이며, 그리고 (ii) GPCR을 포함하는 제 2 도메인.
N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) G-단백질-연결된 수용체 (GPCR)의 일부를 포함하는 제 1 도메인, 이때 제 1 도메인은 GPCR의 1번째 내지 5번째 막통과 도메인들을 포함하며, (ii) 융합 짝 아미노산 서열을 포함하는 제 2 도메인, 이때 전술한 서열은 2rhf, 2ehs, 2ip6, 3i7m, 1x3o, 1u84, 1h75, 2huj, 1ysq, 3ls0, 2qr3, 1zuh, 2b8i, 2cgq, 3fxh, 3nph, 2o4d, 1tmy, 1vku, 및 2es9로 구성된 목록으로부터 선택된 단백질에 최소한 90% 상동성이며, 그리고 (iii) GPCR의 일부를 포함하는 제 3 도메인, 이때 제3 도메인은 GPCR의 6번째와 7번째 막통과 도메인들을 포함한다.
N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) G-단백질-연결된 수용체 (GPCR)를 포함하는 제 1 도메인, 그리고 (ii) 융합 짝 아미노산 서열을 포함하는 제 2 도메인, 이때 전술한 서열은 2rhf, 2ehs, 2ip6, 3i7m, 1x3o, 1u84, 1h75, 2huj, 1ysq, 3ls0, 2qr3, 1zuh, 2b8i, 2cgq, 3fxh, 3nph, 2o4d, 1tmy, 1vku, 및 2es9로 구성된 목록으로부터 선택된 단백질에 최소한 90% 상동성이다.
N-말단에서 C 말단으로 다음을 포함하는 GPCR-융합 짝 단백질을 포함하는 조성물: (i) 융합 짝 아미노산 서열을 포함하는 제 1 도메인, 이때 전술한 서열은 2rhf, 2ehs, 2ip6, 3i7m, 1x3o, 1u84, 1h75, 2huj, 1ysq, 3ls0, 2qr3, 1zuh, 2b8i, 2cgq, 3fxh, 3nph, 2o4d, 1tmy, 1vku, 및 2es9로 구성된 목록으로부터 선택된 단백질에 최소한 90% 상동성이며 그리고 (ii) GPCR을 포함하는 제 2 도메인.
청구항 1-6에 있어서, GPCR-융합 짝 단백질은 결정 형태인, 조성물.
청구항 7에 있어서, GPCR-융합 짝 단백질은 최소한 3 Å의 해상도에서 GPCR의 X-선 결정학적 구조 측정을 지원하는데 충분한 특성을 가진, 조성물.
청구항 1 또는 4에 있어서, 융합 짝은 GPCR의 5번째 그리고 6번째 막통과 도메인들 사이에서 GPCR의 제 3 세포내 도메인에 대응하는 도메인을 실질적으로 포함하는, 조성물.
청구항 1-9에 있어서, 이 융합 짝 아미노산 서열은 루브레독신과 최소한 95% 상동성을 보유하는, 조성물.
청구항 1-9에 있어서, 이 융합 짝 아미노산 서열은 사이토크롬 b₅₆₂ RIL (Bril)과 최소한 95% 서열 상동성을 보유하는, 조성물.
청구항 1-9에 있어서, 이 융합 짝 아미노산 서열은 플라보독신과 최소한 95% 서열 상동성을 보유하는, 조성물.
청구항 1-9에 있어서, 이 융합 짝 아미노산 서열은 크실라네이즈와 최소한 95% 서열 상동성을 보유하는, 조성물.
청구항 1-9에 있어서, GPCR은 자연적으로 생성되는 GPCR인, 조성물.
청구항 1-9에 있어서, GPCR은 자연적으로 생성되는 GPCR의 변이체인, 조성물.
청구항 1-9에 있어서, GPCR은 클라스 A GPCR인, 조성물.
청구항 1-9에 있어서, GPCR은 S1P1 수용체인, 조성물.
청구항 1-9에 있어서, GPCR은 β2-아드레날린성 수용체 (β2AR)인, 조성물.
청구항 1-6에 있어서, 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 또는 크실라네이즈로부터 선택되는, 조성물.
청구항 18에 있어서, GPCR-융합 짝 단백질은 β2AR-Bril인, 조성물.
청구항 1-9에 있어서, GPCR은 아데노신 A2a 수용체인, 조성물.
청구항 21에 있어서, 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 또는 크실라네이즈인, 조성물.
청구항 1-9에 있어서, GPCR은 NOP1 수용체인, 조성물.
청구항 23에 있어서, 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 또는 크실라네이즈인, 조성물.
청구항 1-9에 있어서, GPCR은 CCR5 수용체인, 조성물.
청구항 25에 있어서, 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 또는 크실라네이즈로부터 선택되는, 조성물.
청구항 1-26에 있어서, 트리-메틸 아민 N-산화물을 결정성 첨가제로 더 포함하는, 조성물.
G-단백질-연결된 수용체 (GPCR)의 결정학적 구조 연구에 적합한 단백질의 결정화를 지원하기 위하여 다음을 포함하는 융합 짝을 이용하는 방법:
(a) GPCR-융합 짝 단백질을 만들기 위하여 융합 짝을 GPCR의 세포내 도메인에 통합시키고, 이때 이 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 및 크실라네이즈로 구성된 군으로부터 선택된 단백질의 아미노산 서열과 최소한 90% 상동성인 아미노산 서열을 포함하며;
(b) GPCR-융합 짝 단백질을 발현시키고, 그리고 정제하며; 그리고
(c) 정제된 GPCR-융합 짝 단백질을 결정화시킨다.
G-단백질-연결된 수용체 (GPCR)의 결정학적 구조 연구에 적합한 단백질의 결정화를 지원하기 위한 다음을 포함하는 융합 짝을 이용하는 방법:
(a) GPCR-융합 짝 단백질을 만들기 위하여 융합 짝을 GPCR의 N-말단 또는 C-말단에 부착시키고, 이때 이 융합 짝은 루브레독신, 사이토크롬 b₅₆₂ RIL (Bril), 플라보독신, 및 크실라네이즈로 구성된 군으로부터 선택된 단백질의 아미노산 서열과 최소한 90% 상동성인 아미노산 서열을 포함하며;
(b) GPCR-융합 짝 단백질을 발현시키고, 그리고 정제하며; 그리고
(c) 정제된 GPCR-융합 짝 단백질을 결정화시킨다.
청구항 28-29에 있어서, GPCR은 클라스 A GPCR인, 방법.
청구항 30에 있어서, GPCR은 β2-아드레날린성 수용체 (β2AR), A2A-아데노신 수용체, S1P1 수용체, OLR1 수용체, 또는 CCR5 수용체로부터 선택되는, 방법.
청구항 28-29에 있어서, 융합 짝은 루브레독신의 아미노산 서열을 포함하는, 방법.
청구항 28-29에 있어서, 융합 짝은 사이토크롬 b₅₆₂ RIL (Bril)의 아미노산 서열을 포함하는, 방법.
청구항 28-29에 있어서, 융합 짝은 T4 라이소자임 C-말단 단편 (Cterm-T4L)의 아미노산 서열을 포함하는, 방법.
청구항 28-29에 있어서, 융합 짝은 플라보독신의 아미노산 서열을 포함하는, 방법.
청구항 28-29에 있어서, 융합 짝은 크실라네이즈의 아미노산 서열을 포함하는, 방법.
청구항 28-29에 있어서, 융합 짝은 GPCR의 TM5와 TM6 영역 사이에 통합되는, 방법
청구항 28-37에 있어서, 결정성 첨가제 존재하여 정제된 GPCR-융합 짝 단백질의 결정화를 실행하는 단계를 더 포함하는, 방법.
청구항 38에 있어서, 결정성 첨가제는 트리-메틸 아민 N-산화물인, 방법.
GPCR 단백질과 융합 짝의 융합 단백질에 사용하기 위한 후보 융합 짝을 선택하는 다음의 단계들을 포함하는 방법에 있어서, 이때 생성된 융합 단백질이 회절 특정 결정 형성을 지원한다:
(a) 단백질들에 관한 정보를 보유하는 하나 또는 그 이상의 데이터베이스를 제공하고,
(b) 다음의 기준에 부합되는 단백질에 대한 하나 또는 그 이상의 데이터베이스를 조사하고: (i) 15 Å에 의해 떨어져 있는 N 및 C 말단을 보유하고; (ii) 25kD 미만의 분자량을 보유하고; (iii) 최소한 3 Å의 해상도로 결정화되는 것으로 나타나며; (iv) 한 가지 이상의 화학적 조건에서 결정을 형성하는 능력을 보유하고; 그리고 (v) 한 가지 이상의 스페이스 기를 보유하는 결정을 형성하는 능력을 보유한다; 그리고
(c) 기준 (i)~(v)을 만족시키는 하나 또는 그 이상의 단백질들을 후보 융합 짝으로 선택한다.
청구항 40에 있어서, 단계 (b)에서 하나 또는 그 이상의 데이터베이스는 다음의 기준에 또한 부합되는 단백질에 대해 조사하는, 방법:
(vi) 최소한 50% 알파-나선 함량을 보유하고; 그리고 (vii) N-말단, 또는 C-말단 또는 이 둘 모두에서 알파-나선 도메인들을 보유하고; 그리고 단계 (c)에서 기준(i) ~ (vii)를 만족시키는 후보 융합 짝들이 선택된다.