KR20020033627A - 콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물 - Google Patents

콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물 Download PDF

Info

Publication number
KR20020033627A
KR20020033627A KR1020017015017A KR20017015017A KR20020033627A KR 20020033627 A KR20020033627 A KR 20020033627A KR 1020017015017 A KR1020017015017 A KR 1020017015017A KR 20017015017 A KR20017015017 A KR 20017015017A KR 20020033627 A KR20020033627 A KR 20020033627A
Authority
KR
South Korea
Prior art keywords
sequence
seq
nucleic acid
nucleotide
polypeptide
Prior art date
Application number
KR1020017015017A
Other languages
English (en)
Inventor
드네플파트리스
로지에몽튀마리-프랑수아
아르눌드-레기녜이자벨
프라드카트린
클레펫크리스티앙
Original Assignee
추후제출
아방티 파르마 소시에테 아노님
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR9906587A external-priority patent/FR2794131B1/fr
Application filed by 추후제출, 아방티 파르마 소시에테 아노님 filed Critical 추후제출
Publication of KR20020033627A publication Critical patent/KR20020033627A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 염색체 좌위와 유전적으로 관련된 질환, 특히 혈장 지방단백질 대사의 질환, 좀더 구체적으로는 콜레스테롤의 역수송에 관여된 것으로 보이는, 인간 게놈내 9번 염색체의 9q31-34 영역에 위치한 유전자로부터 발현된 핵산에 관한 것이다. 본 발명은 또한, 진단시약으로 유용한, 특정 핵산에 의해 암호화된 폴리펩타이드 및 이러한 폴리펩타이드에 대해 특이적인 항체에 관한 것이다. 본 발명은 또한, 상기 핵산 또는 이의 단편을 포함하는 벡터 및 재조합 숙주 세포에 관한 것이다.

Description

콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물{EXPRESSION PRODUCTS OF GENES INVOLVED IN DISEASES RELATED TO CHOLESTEROL METABOLISM}
보통 혈장에 존재하는, 혈류내 지질의 수송을 허용하는 지질을 혼입하는 단백질 복합체인 지방단백질은 크기 및 조성면에서 다양하지만 모두 마크로에멀션 형태로 나타난다.
지방단백질 입자는 구형이고 무극성 지질(대부분 트리글리세라이드 및 콜레스테롤 에스테르)의 중심 코어 및 극성 지질(콜레스테롤 및 주로 인지질)의 표면 단일층 및 아포지방단백질(apo)로 불리는 단백질을 함유한다.
인지질과 같이 표면 단일층의 대부분의 단백질 성분은 양친매성을 가진다. 지방단백질과 극성 지질 및 단백질의 결합은 소수성 힘에 의해 달성되며 이로 인해 지방산 쇄와 무극성 아미노산 측쇄가 수성 환경으로부터 배제된다.
대부분의 아포지방단백질은 나선형 양친매성 영역(아포지방단백질 A-I, A-II, A-IV, C-I, C-II, C-III 및 E)을 보유한다.
지방단백질 입자의 밀도는 크기에 반비례하고, 밀도는 코어에 함유된 저밀도의 무극성 지질과 고밀도의 표면 단백질의 상대적인 양을 반영한다.
대형 크기의 지방단백질로는 장세포에서 분비되고 apo B-48이 압도적인 카일로마이크론과, 간세포에서 분비되고 단백질 apo B-100을 함유한 VLDL이 있다.
가장 작은 지방단백질, LDL 및 HDL을 포함하는 부류는 이들의 코어에 주로 콜레스테롤 에스테르를 함유한다. 이들 입자의 성숙 형태는 세포에서 직접 분비되는 것이 아니라 좀더 구체적으로 말하면 혈장에서 대사 경로에 의해 생성된다.
LDL 입자는 VLDL 입자의 대사의 최종 산물을 나타낸다.
HDL 입자의 몇몇 성분은 카일로마이크론으로부터 유도된다.
따라서, 고밀도 지방단백질(HDL)은 혈장에서 순환하는 지방단백질의 주된 4 부류 중 하나이다.
이러한 지방단백질은 지질 수송, 담즙 산의 형성, 스테로이드 생성, 세포 증식 및 부가적으로 혈장 프로테이나제 시스템의 방해와 같은 각종 대사 경로에 수반된다.
HDL은 완전한 유리 콜레스테롤 수용체이고 콜레스테롤 에스테르 수송단백질(CETP), 지방단백질 리파제(LPL), 간 리파제(HL) 및 레시틴-콜레스테롤 아실트랜스퍼라제(LCAT)와 조합하여 콜레스테롤의 역수송에 주된 역할을 담당하는데, 즉, 신체로부터 담즙산 형태로 제거하기 위해 과잉 콜레스테롤을 주변 세포에서 간으로 수송하는 역할을 한다.
HDL은 콜레스테롤을 주변 세포로부터 간으로 수송할 뿐만 아니라 이를 스테로이드-생성 세포 또는 콜레스테롤이 낮은 주변 세포로 분배시킨다.
HDL의 전구체는 장과 간으로부터 원반 형태로 분비되고, 구형 입자는 지방단백질 입자의 코어로 이동하는 콜레스테롤 에스테르의 형성에 의해 형성된다.
초기 HDL 입자는 apo A-I와 apo A-IV를 함유하지만, 초기 간 HDL 입자에는 apo A-I, apo E 및 apo A-II가 풍부하다.
이들 입자의 지질 부위는 인지질과 소량의 유리 콜레스테롤 및 트리글리세라이드로 구성된다.
HDL이 콜레스테롤을 주변 조직으로부터 간으로 수송하는 데 있어 중심 역할을 함이 입증되었다.
콜레스테롤이 풍부한 주변 세포내의 과잉 비에스테르화 콜레스테롤은 HDL에 의해 포착되어 LCAT의 작용에 의해 에스테르화를 겪는다. 콜레스테롤 에스테르가 풍부한 HDL은 간세포 표면에서 HDL-결합 단백질 또는 수용체에 의해 포착되어 이의 콜레스테롤 에스테르를 분비한다.
콜레스테롤의 역수송에서 HDL의 보호 역할은 이러한 HDL내 콜레스테롤의 농도와 관상 동맥 질환의 출현 위험간의 역 상관관계를 입증하는 역학 연구에 의하거나, HDL이 각종 세포형으로부터 과잉의 세포내 콜레스테롤을 효과적으로 받아들이는 관찰에 의해 확인된다.
아테로제닉(atherogenic) 지방단백질은 주변 세포 또는 대식세포에 의해 섭취된 다음 리포솜에서 파괴된다. 콜레스테롤은 리포솜에서 방출된 다음 세포질 구획에서 다시 에스테르화 된다.
특히 apo A-I가 풍부한 HDL이 대식세포 또는 주변 세포의 표면에 존재하는 HDL-결합 단백질과 상호작용한데 이어, 이들 세포로부터 세포외 구획으로 콜레스테롤 유동을 자극하는 것으로 나타났다.
탠지어병, HDL 결핍증 및 LCAT 결핍증을 포함한 HDL 결핍증과 연관된 각종 질환이 설명되어 있다.
탠지어병에 수반된 결핍증은 HDL 전구체가 리포솜에서 붕괴되는 세포 콜레스테롤의 전좌에 있어서 세포 결함과 연관되어 있다. 그럼에도 불구하고, 탠지어병의 경우, 결함의 정확한 성질은 아직 정확히 규명되지 않았다.
탠지어병에서, 이러한 세포 결함은 지방단백질 대사의 붕괴를 야기한다. 주변 세포로부터 콜레스테롤을 혼입하지 않고 정확하게 대사될 수 없는 HDL은 신체로부터 빠르게 제거된다. 이러한 환자에서 혈장 HDL 농도는 엄청나게 감소되며 HDL은 간으로 콜레스테롤의 복귀를 더 이상 보장하지 못한다. 이러한 콜레스테롤은 주변 세포에 축적되어 오렌지색 편도선 형성과 같은 특징적인 임상 징후를 야기한다. 또한, 인지질의 증가된 합성과 세포내 이화작용뿐만 아니라 트리글리세라이드의 과잉생산과 같은 기타 지방단백질의 붕괴도 관찰된다.
앞서와 같은 증상의 탠지어병은 관상 동맥 질환을 앓고 있는 환자에서 가장 일반적으로 검출되는 HDL의 대사와 연관된 가족성 질환으로 분류된다.
감소된 콜레스테롤 HDL 수준이 관상 동맥 질환을 검출할 수 있게 하는 우수한 위험 인자인 것으로 다수의 연구결과 나타났다.
이러한 관점에서, HDL 결핍과 연관된 증상은 과거 십년 간 관심이 증가되었는데, 그 이유는 이것이 아테로제닉 증상에서 HDL의 역할 이해를 증가시킬 수 있게 하기 때문이다.
apo A-I 유전자에서 다수의 돌연변이가 특징분석되었다. 이러한 돌연변이는 희귀하고 apo A-I의 생성 부족을 야기할 수 있다.
지방단백질 리파제(LPL) 또는 이의 활성자 apoC-II를 암호화하는 유전자에서 돌연변이는 심한 과트리글리세라이드혈증과 상당히 감소된 HDL-c 수준과 관련되어 있다.
효소 레시틴-콜레스테롤 아실트랜스퍼라제(LCAT)를 암호화하는 유전자에서 돌연변이는 또한 심한 HDL 결핍과 관련된다.
따라서 콜레스테롤 및/또는 지방단백질의 대사에 수반된 유전자, 특히 주변세포에서 간으로 콜레스테롤의 역수송에서의 기능장애와 관련된 유전자를 동정할 신기술의 필요성이 증가하고 있다.
최근에, 전체 게놈에 걸쳐 분포되고 평균 서로 10.3 cM 떨어진 343개의 초부수체(microsatellite) 마커의 다양한 대립유전자 형태의 분리 연구가 수행되었다.
11 세대에 걸쳐 충분히 특징분석된 일 가족에서 유전 연관 연구를 수행했으며, 여기에서 다수의 가족 구성원은 탠지어병을 앓고 있고, 그 가족은 5촌까지를 포함한다.
이 연구는 질환과 통계적으로 관련되어 있는 인간 9번 염색체의 9q31 좌위에 위치된 영역을 확인할 수 있게 해 주었다(Rust S. et al., Nature Genetics, Vol. 20, September 1998, pages 96-98).
그러나, RUST 등의 연구는 손상이 탠지어병과 관련될 수 있는 게놈의 광범위 영역을 규정할 뿐이다. 이는 단순히 9q31-34 좌위의 해당 영역이 공지된 유전자 없이 EST를 함유하고 있다고만 명시하고 있다.
인간에서 9q31-34 좌위에 위치된 약 15 cM 영역이 일반적으로 가족성 HDL 결핍과 관련되었음을 보여주었다.
좀더 구체적으로 말하면, 본 발명에 따르면 메신저 RNA 분자가 가족성 HDL 결핍 및 탠지어병과의 가장 강한 유전적 연관을 제공하는 초부수체 마커로서 확인된 초부수체 마커 D9S1784 주변에 집중된 약 15 cM의 영역내 게놈에 위치된 서열로부터 발현되었음을 보여 주었다.
또한, 해당 9q31-34 영역은 잠재적으로 하기와 같은 각종 질환의 개시 또는 발생에 일정 역할을 할 수 있는 유전자를 함유한다:
- 점막 비슷한 연골육종과 같은 골 질환, 9번 염색체 이상과 연관된 정신 착란(MRD);
- 유아성 신장결핵증(NPH2)과 같은 신장 질환;
- 사지 근위축증(LGMD2H)과 같은 근육 질환;
- 정신 분열증과 같은 정신 질환;
- RET와 연관된 히르치프룽병과 같은 소화기 질환(SHSCR2).
이러한 염색체 간격에서 위치적 후보 유전자의 위치로 인해, 본 발명에 따라 분리되어 특징분석된 메신저 RNA와 상응하는 폴리펩타이드는 잠재적으로 앞서 기술된 몇몇 인간 병리 질환 또는 9번 염색체 영역과 유전적으로 연관되어 있는 타 병리 질환과 관련된다.
출원인에 의해 분리된 다음 특징분석된 이러한 메신저 RNA에 함유된 몇몇 서열의 경우, 추정상 개방 판독 프레임을 결정하고 이로부터 상응하는 단백질 서열을 밝혀내었다. 상응하는 폴리펩타이드는 지방단백질의 대사와 연관된 질환, 좀더 구체적으로 말하면 콜레스테롤의 역수송에서의 결함과 연관된 질환과 잠재적으로 관련된다.
본 발명은 염색체 좌위와 연관된 유전 질환, 좀더 구체적으로 말하면 콜레스테롤의 역수송에 수반되는, 9번 염색체 q31-34 영역의 인간 게놈에 위치된 유전자로부터 발현되는 핵산에 관한 것이다.
본 발명은 또한 이러한 핵산 중 몇몇 핵산에 의해 암호화된 폴리펩타이드와 이러한 폴리펩타이드에 대해 특이적인 항체에 관한 것으로, 이는 진단 시약으로서 유용하다.
본 발명은 결국 이러한 핵산 또는 이의 단편을 포함하는 벡터 및 재조합 숙주 세포에 관한 것이다.
본 발명은 서열 또는 발현 손상이 혈장 지방단백질의 대사에서의 결함, 좀더 구체적으로 말하면 HDL의 역수송에서의 결함과 잠재적으로 관련되는 폴리뉴클레오타이드 및 폴리펩타이드에 관해 기술한다.
본 발명은 또한 서열 또는 발현 손상이 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환과 잠재적으로 관련된 폴리뉴클레오타이드 및 폴리펩타이드에 관해 기술한다.
일반적 정의
본 발명의 목적상 용어 "분리된"은 본래 환경(자연상태로 위치된 환경)으로부터 제거된 생물학적 물질(핵산 또는 단백질)을 지칭한다.
예를 들어, 식물 또는 동물에 자연 상태로 존재하는 폴리뉴클레오타이드는 분리되지 않는다. 식물 또는 동물의 게놈에 자연스레 삽입된 이웃한 핵산으로부터 분리된 동일한 폴리뉴클레오타이드는 "분리된" 것으로 간주된다.
이러한 폴리뉴클레오타이드는 벡터에 포함되고/포함되거나 폴리뉴클레오타이드는 조성물에 포함되어 분리된 상태로 존재할 수 있는데 그 이유는 벡터 또는 조성물이 자연 환경을 구성하지 않기 때문이다.
용어 "정제된"은 타 화합물의 존재를 배제하고, 물질이 절대적 순도를 나타내는 형태로 존재할 것을 요구하지 않는다. 이는 오히려 상대적인 정의이다.
폴리뉴클레오타이드는 출발 물질 또는 천연 물질의 적어도 1배, 바람직하게는 2 또는 3배, 선호적으로는 4 또는 5배 정제 후 "정제된" 상태로 존재한다.
본 발명의 목적상, 표현 "뉴클레오타이드 서열"은 폴리뉴클레오타이드 또는 핵산을 지칭하는 것으로 대등하게 사용될 수 있다. 표현 "뉴클레오타이드 서열"은 유전 물질 자체를 포함하고 서열과 관련된 정보에 한정되지 않는다.
용어 "핵산", "폴리뉴클레오타이드", "올리고뉴클레오타이드" 또는 "뉴클레오타이드 서열"은 단일쇄 형태 또는 이중나선 형태의 RNA, DNA 또는 cDNA 서열 또는 일 뉴클레오타이드 이상의 RNA/DNA 하이브리드 서열을 포함한다.
용어 "뉴클레오타이드"는 천연 뉴클레오타이드(A, T, G, C) 및 (1) 퓨린의 동족체, (2) 피리미딘의 동족체, 또는 (3) 유사 당과 같은 적어도 1 변형을 포함하는 변형된 뉴클레오타이드 모두를 나타내며, 이러한 변형된 뉴클레오타이드의 예는PCT 출원 WO 95/04064에 기재되어 있다.
본 발명의 목적상, 제 1 폴리뉴클레오타이드는 제 1 뉴클레오타이드의 각 염기가 역배향의 제 2 폴리뉴클레오타이드의 상보성 염기와 쌍을 이룰 경우 제 2 폴리뉴클레오타이드에 대해 "상보적인" 것으로 간주된다. 상보성 염기는 A와 T (또는 A와 U), 또는 C와 G이다.
본 발명에 따른 핵산의 "변이체"는 기준 폴리뉴클레오타이드에 비해 1 이상의 염기가 차이나는 핵산을 의미하는 것으로 이해된다. 변이체 핵산은 자연에 존재하는 대립유전자 변이체와 같은 천연 기원이거나, 예를 들어 돌연변이 기술에 의해 얻어진 비-천연 변이체일 수 있다.
일반적으로, 기준 핵산과 변이체 핵산간의 차이는 기준 핵산과 변이체 핵산의 뉴클레오타이드 서열이 매우 유사하고 다수의 영역에서 일치할 정도로 작다. 변이체 핵산에 존재하는 뉴클레오타이드의 변형은 침묵성일 수 있는데, 이는 변이체 핵산에 의해 암호화된 아미노산 서열이 바뀌지 않음을 의미한다.
그러나, 변이체 핵산에서 뉴클레오타이드 변화는 또한 기준 핵산에 의해 암호화된 펩타이드와 비교하여 변이체 핵산에 의해 암호화된 폴리펩타이드에서 치환, 첨가, 결실을 일으킬 수 있다. 부가적으로, 암호화 영역에서 뉴클레오타이드의 변형은 아미노산 서열에서 보존성 또는 비보존성 치환을 일으킬 수 있다.
바람직하게는, 본 발명에 따른 변이체 핵산은 기준 핵산에서 나온 폴리펩타이드와 동일한 기능 또는 생물학적 활성, 또는 초기 핵산에 의해 암호화된 폴리펩타이드에 대한 항체에 의해 인식될 수 있는 능력을 실질적으로 보존하는 폴리펩타이드를 암호화한다.
몇몇 변이체 핵산은 폴리펩타이드의 돌연변이된 형태를 암호화할 것이며, 이의 체계적인 연구는 해당 단백질에 대한 구조 활성 상관관계를 밝혀낼 수 있게 할 것이다. 연구된 질환과 관련된 돌연변이에 관한 지식이 필수적인데 그 이유는 병리의 분자상 원인을 이해할 수 있게 하기 때문이다.
본 발명에 따른 기준 핵산 "단편"은 기준 핵산과 비교하여 길이가 감소하고 공통 부위에 기준 핵산과 일치하는 뉴클레오타이드 서열을 포함하는 뉴클레오타이드 서열을 의미하는 것으로 해석한다.
본 발명에 따른 이러한 핵산 "단편"은 경우에 따라 구성요소로서 보다 큰 폴리뉴클레오타이드에 포함될 수 있다.
이러한 단편은 본 발명에 따른 핵산의 8, 10, 12, 15, 18, 20-25, 30, 40, 50, 70, 80, 100, 200, 500, 1000 또는 1500개의 연속 뉴클레오타이드 길이 범위의 올리고뉴클레오타이드를 포함하거나 이들로 구성된다.
본 발명에 따른 폴리펩타이드의 "변이체"는 기준 폴리펩타이드의 아미노산 서열에 비해 아미노산 서열이 적어도 하나의 아미노산 잔기의 1 이상의 치환, 첨가 또는 결실을 함유하는 주로 폴리펩타이드를 의미하는 것으로 해석되며, 아미노산 치환은 보존성 또는 비보존성일 수 있다.
본 발명에 따른 폴리펩타이드의 "단편"은 아미노산 서열이 기준 폴리펩타이드보다 짧고 이러한 기준 폴리펩타이드와의 전체 공통 부위에 걸쳐서 동일한 아미노산 서열을 포함하는 폴리펩타이드를 의미하는 것으로 해석된다.
이러한 단편은 경우에 따라 이것이 일부분으로 있는 보다 큰 폴리펩타이드에 포함될 수 있다.
본 발명에 따른 폴리펩타이드의 이러한 단편은 10, 15, 20, 30-40, 50, 100, 200 또는 300 아미노산 길이를 가질 수 있다.
본 발명의 목적상 두 뉴클레오타이드 또는 아미노산 서열간의 "% 동일성" 은 비교창을 통해 최적으로 배열된 두 서열을 비교하여 측정될 수 있다.
비교창에서 뉴클레오타이드 또는 폴리펩타이드 서열의 일부는 두 서열의 최적 배열을 얻기 위해 (첨가 또는 결실을 포함하지 않은) 기준 서열과 비교하여 첨가 또는 결실(예를 들어 "갭")을 포함할 수 있다.
%는 비교되는 두 (핵산 또는 펩타이드) 서열에 대해 동일한 핵산 염기 또는 동일한 아미노산 잔기가 관찰되는 위치의 수를 결정하고, 두 염기 또는 아미노산 잔기간에 동일성이 존재하는 위치의 수를 비교창에서 위치의 총수로 나눈 다음 나온 결과에 100을 곱하여 % 서열 동일성을 얻음으로써 계산된다.
비교를 위한 최적 서열 배열은 미국 위스콘신 매디슨 사이언스 닥터 575에 소재하는 WISCONSIN GENETICS SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG)사의 패키지에 내장된 공지 알고리듬에 의해 컴퓨터로 달성될 수 있다.
구체적으로 설명하자면, % 서열 상동성은 주로 결핍 파라미터(S.F. Altschul et al., J. Mol. Biol. 1990 215: 403-410, S.F. Altschul et al., Nucleic Acids Res. 1997 25: 3389-3402)를 이용하여 BLAST 소프트웨어(1996년 3월의 버전 BLAST 1.4.9, 1998년 2월의 BLAST 2.0.4 및 1998년 9월의 BLAST 2.0.6)에 의해 산출될 수있다. Blast는 Altschul 등의 알고리듬을 이용하여 기준 "청구" 서열과 유사/상동성인 서열을 찾는다. 청구 서열 및 사용된 데이터베이스는 펩타이드 또는 핵산형일 수 있으며, 임의 조합도 가능하다.
본 발명의 목적상 "고 엄격성 하이브리드화 조건"은 하기 조건을 의미하는 것으로 이해한다:
1 -막 경쟁 및 예비 하이브리드화:
- 혼합: 연어 정충 DNA 40 ㎕ (10 mg/ml)
+ 인간 태반 DNA 40 ㎕ (10 mg/ml)
- 96℃에서 5분간 변성시킨 다음 혼합물을 얼음에 침지.
- 2X SSC 제거하고 막을 함유한 하이브리드화 튜브에 4 ml 포름알데하이드 믹스를 붓는다.
- 변성된 두 DNA의 혼합물 첨가.
- 회전하면서 42℃에서 5 내지 6시간 동안 배양.
2 -표지된 탐침 경쟁:
- 반복량에 따라, 표지되고 정제된 탐침에 10 내지 50 ㎕ Cot I DNA 첨가.
- 95℃에서 7 내지 10분간 변성.
- 65℃에서 2 내지 5시간 동안 배양.
3 -하이브리드화:
- 예비 하이브리드화 믹스 제거.
- 연어 정충 DNA 40 ㎕ + 인간 태반 DNA 40 ㎕ 혼합; 96℃에서 5분간 변성한다음 얼음에 침지.
- 하이브리드화 튜브에 4 ml 포름알데하이드 믹스, 두 DNA의 혼합물 및 변성된 표지된 탐침/Cot I DNA 첨가.
- 회전하면서 42℃에서 15 내지 20시간 동안 배양.
4 -세척:
- 2x SSC에서 실온에서 1회 세척하여 세정.
- 실온에서 2x SSC 및 65℃에서 0.1% SDS로 5분간 2회.
- 65℃에서 1x SSC 및 65℃에서 0.1% SDS로 15분간 2회.
막을 Saran에 봉하여 노출.
전술된 하이브리드화 조건은 고 엄격성 조건하에 20개 뉴클레오타이드에서 수백 개 뉴클레오타이드 길이까지 다양한 핵산 분자의 하이브리드화에 적합할 수 있다.
물론 전술된 하이브리드화 조건은 당업자에게 공지된 기술에 따라 하이브리드화를 추구하는 핵산의 길이 또는 선택된 표지 종류에 따라 조정될 수 있다.
적절한 하이브리드화 조건은 예를 들면 HAMES and HIGGINS (1985)의 매뉴얼 또는 F.AUSUBEL et al.(1999)의 매뉴얼에 내포된 교시에 따라 조정될 수 있다.
본 발명에 따른 핵산 및 폴리펩타이드에 관한 상세한 설명
본 발명에 따른 핵산 서열과 아미노산 서열의 간단한 설명은 예들에 뒤이은 표 I에 나타나 있다.
GS9002S31 유전자
핵산
이하 번호 GS9002S31로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이러한 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 1의 서열을 구성한다.
서열번호 1의 서열은 552개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 설명하고 있듯이, 서열번호 1 서열의 전사체의 발현 분석을 RT PCR에 의해 수행했다. 여러 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS9002S31 유전자가 태아 뇌, 간 및 태반에서 발현됨을 보여줄 수 있었다.
GS910331 유전자
핵산
이하 번호 GS910331로 명명된 유전자의 전사체에 상응하는 메신저 RNA의 두 서열을 본 발명에 따라 분리했다.
이러한 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 2의 서열을 구성한다.
서열번호 2의 서열은 1246개 뉴클레오타이드 길이를 가진다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 3의 서열을 구성한다.
서열번호 3의 서열은 3035개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110 및 버전 115)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 2 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS310331 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 서열번호 82 및 83의 서열을 가진 탐침을 이용하는 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 보여주었다.
서열번호 82의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 각각 간과 심장에서 1.65 kb이고 뇌에서 1.4 kb이다.
서열번호 83의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 각각 심장에서 1.65 kb 및 2.4 kb이고 간에서 1.65 kb이다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
GS914554 유전자
핵산
이하 번호 GS94554로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 4의 서열을 구성한다.
서열번호 4의 서열은 1479개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 3 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS94554 유전자가 태아 뇌, 태반 및 간에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라 서열번호 84의 서열을 가진 탐침에 의해 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(Ref. No. 7759-1)가 판매하는 블롯에서 전사체의 존재를 보여 주었다.
서열번호 58의 서열을 가진 탐침에 의해 검출된 전사체의 크기는 각각 하기와 같다:
- 췌장 및 태반에서 1.0, 1.3, 1.7 및 2.8 kb;
- 신장, 골격근, 심장 및 간에서 1.0, 1.3 및 1.7 kb;
- 뇌와 폐에서 1.7 kb.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
GS914739 유전자
핵산
본 발명에 따라 이하 번호 GS14739로 명명된 유전자의 전사체에 상응하는 두 메신저 RNA 서열을 분리했다.
이러한 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 5의 서열을 구성한다.
서열번호 5의 서열은 5169개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열번호 5의 서열과의 서열 상동성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 6의 서열을 구성한다.
서열번호 6의 서열은 7723개 뉴클레오타이드 길이를 가진다. 이러한 서열은 서열번호 6 서열의 위치 121의 뉴클레오타이드에서 위치 1517의 뉴클레오타이드 범위의 개방 판독 프레임(ORF)을 포함한다. 해독 개시 코돈은 서열번호 6 서열의 위치 132의 뉴클레오타이드에서 시작된다. 암호화 서열은 서열번호 6 서열의 위치 132의 뉴클레오타이드에서 출발하여 위치 1517의 뉴클레오타이드에서 끝난다. 서열번호 6의 서열은 서열번호 6 서열의 위치 7686의 뉴클레오타이드에서 출발하는 서열 "ATTAAA"를 지닌 폴리아데닐화 시그널을 포함한다. 서열 "CCA CTC GCC ATG"를 지닌 코작 단위는 서열번호 6 서열의 위치 123의 뉴클레오타이드에서 시작한다.
데이터베이스 GenBank(버전 115, 기탁번호 AF088031)에서 조사하는 동안 두서열의 100% 상동성을 발견했다, 각각:
- 서열번호 6 서열의 위치 1의 뉴클레오타이드에서 위치 146의 뉴클레오타이드까지; 및
- 서열번호 6 서열의 위치 243의 뉴클레오타이드에서 위치 573의 뉴클레오타이드까지.
실시예 1에 기재된 바와 같이 RT PCR을 이용하여 서열번호 5 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS914739 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 서열번호 85의 서열을 지닌 탐침을 이용하여 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)가 판매한 블롯에서 전사체의 존재를 보여주었다.
서열번호 85의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 심장, 간, 골격근 및 신장에서 1 kb이다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 6의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
서열번호 6의 뉴클레오타이드 서열의 개방 판독 프레임은 잠재적으로 서열번호 129의 서열을 구성하는 461개 아미노산 길이의 폴리펩타이드를 암호화한다.
서열번호 129의 뉴클레오타이드 영역 240-1481 및 1511-1675에 걸쳐,Genpept115, Swissprot38, trEMBL및 PIR 베이스 염기에서 하기 기탁번호: AF035360(호모), AF186461(라투스), AF186460(무스스프레투스); AF196481(호모 사피엔스), AF196480(무스무스크) 및 T09482(호메) 및 T09013(마우스)(ring finger Fxy)와 약 30%의 서열 동일성을 발견했다. 하기 기탁번호: DA191P20.2, A49656 및 I49642도 약간의 서열 상동성이 밝혀졌다.
서열번호 129의 서열을 가진 폴리펩타이드는 콜레스테롤 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절과 관련될 수 있다.
S915574 유전자
핵산
이하 번호 GS915574로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 7의 서열을 구성한다.
서열번호 7의 서열은 1046개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 7 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS915574 유전자가 태아 뇌, 자궁, 뇌, 심장, 전립선, 태아 간, 간, 태반, 고환 및 신장에서 발현됨을 보여줄 수 있었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
GS930321 유전자
핵산
이하 번호 GS930321로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 8의 서열을 구성한다.
서열번호 8의 서열은 280개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 8 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS930321 유전자가 태아 뇌, 간 및 심장에서 발현됨을 보여줄 수 있었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
S931311 유전자
핵산
이하 번호 GS931311로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 9의 서열을 구성한다.
서열번호 9의 서열은 479개 뉴클레오타이드 길이를 가진다.
이 서열은 서열번호 9 서열의 위치 3의 뉴클레오타이드에서 위치 98의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 9 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS931311 유전자가 태아 뇌, 간, 심장, 태반, 고환 및 신장에서 발현됨을 보여줄 수 있었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 9의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
핵산 서열번호 7 서열의 부분 개방 판독 프레임은 잠재적으로 서열번호 130의 서열을 구성하는 32개 아미노산 길이의 폴리펩타이드를 암호화한다.
BLAST에 따르면 데이터베이스 Swissprot(버전 36, 1999년 5월 3일자 최신 업데이트) 및 PRODOM: (Swissprot에서 얻어진 상동성 도메인, 버전 34.2, 1997년 11월)에서 기준으로 확인된 서열과 의미있는 상동성을 발견하지 못했다.
서열번호 130의 서열을 가진 폴리펩타이드는 콜레스테롤 유동 조절, 좀더 구체적으로는 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절과 관련될 수 있다.
S934660 유전자
핵산
이하 번호 GS934660으로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 10의 서열을 구성한다.
서열번호 10의 서열은 2599개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 10 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS934660 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라 서열번호 86의 서열을 지닌 탐침을 이용하여 노던 블롯팅에 의해 전사체 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 확인시켜 주었다.
서열번호 86의 서열을 지닌 탐침을 이용하여 검출된 전사체의 크기는 각각 하기와 같다:
- 태반에서 1 kb, 2 kb, 3 kb 및 7.5 kb;
- 심장에서 1, 3 및 7.5 kb;
- 신장, 췌장, 골격근, 폐 및 뇌에서 7.5 kb.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
GS938315 유전자
핵산
이하 번호 GS938315로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 11의 서열을 구성한다.
서열번호 11의 서열은 222개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 11 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS938315 유전자가 태아 뇌, 간, 심장 및 신장에서 발현됨을 보여줄 수 있었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
GS93953 유전자
핵산
이하 번호 GS93953으로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 12의 서열을 구성한다.
서열번호 12의 서열은 3422개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 13의 서열을 구성한다.
서열번호 13의 서열은 5791개 뉴클레오타이드 길이를 가진다. 이는 서열번호 13 서열의 위치 3의 뉴클레오타이드에서 위치 554의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 13의 서열과 GenBank 데이터베이스(버전 116)에 따른 기탁번호: AC013740.2, AC013783.2 및 AF086175.1간에 약간의 서열 상동성이 관찰되었다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 12 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS93953 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라 서열번호 87의 서열을 지닌 탐침을 이용하여 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 확인시켜 주었다.
서열번호 87의 서열을 지닌 탐침을 이용하여 검출된 전사체의 크기는 심장, 뇌, 태반, 폐, 간, 골격근, 신장 및 췌장에서 8 kb이다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 13의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
핵산 서열번호 13의 핵산 서열의 부분 개방 판독 프레임은 잠재적으로 서열번호 131의 서열을 구성하는 183개 아미노산 길이의 폴리펩타이드를 암호화한다.
서열번호 131 서열의 영역 6-162와 GenBank 데이터베이스(버전 115)의 서열번호 g3878571(Z46381) 및 서열번호 EM:trEMBL 데이터베이스(1999년 8월 버전)의 Q21453 MO1F1.4 PROTEIN간에 45% 상동성이 관찰되었다.
서열번호 131의 서열을 지닌 폴리펩타이드는 콜레스테롤 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절에 관련될 수 있다.
GS939874 유전자
핵산
이하 번호 GS939874로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 14의 서열을 구성한다.
서열번호 14의 서열은 2615개 뉴클레오타이드 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 15의 서열을 구성한다.
서열번호 15의 서열은 2551개 뉴클레오타이드 길이를 가진다. 이는 위치 50의 뉴클레오타이드에서 위치 958의 뉴클레오타이드에 이르는 개방 판독 프레임과, 위치 67의 뉴클레오타이드에서 위치 958의 뉴클레오타이드에 이르는 암호화 서열을 포함한다.
서열번호 15 서열의 2044개 뉴클레오타이드상에서 기탁번호 AK001355의 GenBank 데이터베이스(버전 116) 서열과 99% 서열 상동성이 관찰되었다.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 14 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS939874 유전자가 태아 뇌, 자궁, 뇌, 심장, 전립선, 태아 간, 간, 태반, 고환 및 신장에서 발현됨을 보여줄 수 있었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 15의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
서열번호 15의 서열을 지닌 핵산의 개방 판독 프레임은 잠재적으로 서열번호 132의 서열을 구성하는 291개 아미노산 길이의 폴리펩타이드를 암호화한다.
233개 아미노산(서열번호 132의 14-246)에서 번호 g5832945(AL117195)하에 GenPept 데이터베이스(버전 115)에서 기준으로 확인된 서열과 35% 서열 상동성이 발견되었다.
245개 아미노산(서열번호 132의 30-274)에서 번호 g5832942(AL117195)하에 GenPept 데이터베이스(버전 115)에서 기준으로 확인된 서열과 32% 서열 상동성이 발견되었다.
서열번호 132의 서열을 지닌 폴리펩타이드는 콜레스테롤 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절에 관련될 수 있다.
GS911370 유전자
핵산
이하 번호 GS911370으로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 16의 서열을 구성한다.
서열번호 16의 서열은 775개 뉴클레오타이드 길이를 가진다.
이 서열은 서열번호 16 서열의 위치 1의 뉴클레오타이드에서 위치 144의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
뉴클레오타이드 상동성은 하기 서열에서 관찰되었다:
- GenBank 서열: gi|1022224| - CpG 아일랜드(클론 92e10, cpg92e10.rt1a의 역 판독)를 함유한 호모 사피엔스 게놈 DNA의 Mse1 단편과 229 bp (위치 52-280 bp)에서 96% 상동성
- GenBank 서열: Sec61 복합체의 베타 서브유닛의 인간 mRNA의 gi|459833|과 145 bp(위치 1-144 bp)에서 100% 상동성.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 16 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS911370 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라 서열번호 88 및 89의 서열을 지닌 탐침을 이용하여 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 확인시켜 주었다.
서열번호 88의 서열을 지닌 탐침과 서열번호 89의 서열을 지닌 탐침을 이용하여 검출된 전사체의 크기는 췌장에서 7.4 kb이다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 16의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
핵산 서열번호 16 서열의 부분 개방 판독 프레임은 잠재적으로 서열번호 133의 서열을 구성하는 48개 아미노산 길이의 폴리펩타이드를 암호화한다.
단백질 서열 수준에서 관찰된 상동성:
이러한 잠재성 ORF(48 aa)는 서열 sp|P38391|, gb|AAA19639.1|, PIR:(데이터베이스 Swissprot(버전 36, 1999년 5월 3일자 최신 업데이트)에서 각각 비반복성 PIR 서열, 버전 57)|S|S42410 및 18652 p34.2(1))Genpept: (Genbank v110과 111의 해독, 1999년 5월 7일자에 최신 업데이트), 비반복성 PIR: (NONREPETITIVE PIR SEQUENCES, VERSION 57) 및 PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월)의 인간 Sec61 복합체의 수송 단백질 베타 서브유닛과 33 aa(위치 16-48 aa)에서 동일성을 보유한다.
이러한 동일성은 각종 단백질 데이터베이스(PIR: (NONREPETITIVE PIR SEQUENCES, VERSION 57), PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월)) 및 Genbank 및 EMBL(TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월), Genpept: (Genbank v110과 111의 해독, 1999년 5월 7일자에 최신 업데이트))의 해독에서 발견된다.
추정상의 기능:
단백질 복합체 sec61은 소포체에서 초기 단백질의 전좌를 위한 세포 기구의 중추 성분이다. GS911370 유전자는 sec61 복합체의 베타 서브유닛과의 상동성에 의해 이러한 기구의 새로운 성분을 암호화하는 유전자일 수 있다. 결과적으로, 단백질의 전좌에 있어서 이의 가능한 역할, 및 이에 따라 콜레스테롤 유출 메커니즘에 수반된 단백질의 트래픽은 이를 탠지어병 환자/FHD에서 관찰된 결함 연구에서 해당 유전자로 만든다.
서열번호 133의 서열을 지닌 폴리펩타이드는 콜레스테롤의 유동 조절, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증과 관련될 수 있다.
서열번호 133의 서열을 지닌 폴리펩타이드는 HDL에 의한 콜레스테롤의 역수송을 수반하는 중요한 단계와 관련될 수 있다.
서열번호 133의 서열을 지닌 폴리펩타이드는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환과 관련될 수 있다.
GS913920 유전자
핵산
이하 번호 GS913920으로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리했다.
제 1 서열을 분리하여 특징분석했고; 이는 서열번호 17의 서열을 구성하는 cDNA의 핵산 서열이다.
서열번호 17의 서열은 491개 뉴클레오타이드의 길이를 가진다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
실시예 1에 기재된 바와 같이, RT PCR에 의해 서열번호 17 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석은 GS913920 유전자가 간과 심장에서 발현됨을 보여줄 수 있었다.
서열번호 17의 서열로부터, 각각 서열번호 102 및 서열번호 103의 서열을 지닌 두 뉴클레오타이드 프라이머를 합성했다. 이러한 뉴클레오타이드 프라이머는 서열번호 18의 서열을 구성하는 GS913920 유전자의 cDNA를 증폭시킬 수 있게 한다.
증폭반응은 하기 조건하에 수행되었으며, 이는 특정 프라이머가 기재되고 해당 전사체의 서열을 분리하는 데 이용되는 본 발명에 따른 모든 후보 유전자에 적용될 수 있다:
각 PCR 반응을 완충액의 존재하에 각 dNTP 400 μM, 각 프라이머 0.5 μM, MgCl2 2.5 mM, DNA 50 ng 또는 cDNA 25 ng 및 터무스 아쿠아티쿠스(Taq) DNA 폴리머라제(Ampli Taq Gold; Perkin Elmer) 2 단위를 이용하여 수행했다. 반응을 써모사이클러 9700 (Perkin Elmer) 중 96-웰 마이크로플레이트에서 수행한다. 94℃에서 10분간 우선 변성시킨 후, 30 사이클의 프로그램을 적용한다: 94℃에서 30초 변성, 64℃에서 30초 어닐링(2회), 61℃(2회), 58℃ (2회) 및 55℃(28회), 72℃에서 1분/kb의 연장. 프로그램은 72℃에서 7분 연장으로 종결한다.
서열번호 18의 핵산 서열은 293개 뉴클레오타이드의 길이를 가진다. 이는 위치 227의 뉴클레오타이드에서 위치 293의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 가진다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 18의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 18의 핵산 서열의 개방 판독 프레임은 잠재적으로 서열번호 134의 서열을 구성하는 22개 아미노산 길이의 폴리펩타이드를 암호화한다.
BLAST를 이용하는 경우 데이터베이스 GenPept:(Genbank v115의 해독), TrEMBL (SP-TrEMBL, 1999년 8월 버전), Swissprot(버전 38) 및 PIR:(NONREPETITIVE PIR SEQUENCES, 버전 62-1999년 9월)에서 기준으로 확인된 서열과 의미있는 서열 상동성은 발견되지 않았다.
서열번호 134의 서열을 가진 폴리펩타이드는 콜레스테롤의 유동 조절, 좀더 구체적으로는 탠지어병 또는 가족성 HDL 결핍증의 조절과 관련될 수 있다.
서열번호 134의 서열을 가진 폴리펩타이드는 HDL에 의한 콜레스테롤의 역수송과 관련된 중요한 단계에 수반될 수 있다.
서열번호 134의 서열을 가진 폴리펩타이드는 또한 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환에 관련될 수 있다.
GS91437 유전자
핵산
이하 번호 GS91437로 명명된 유전자의 전사체에 상응하는 두 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 19의 서열을 구성한다.
서열번호 19의 서열은 2442개 뉴클레오타이드 길이를 가진다.
이 서열은 서열번호 19 서열의 위치 2의 뉴클레오타이드에서 위치 286의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 20의 서열을 구성한다.
서열번호 20의 서열은 4608개 뉴클레오타이드 길이를 가진다. 이는 위치 1의 뉴클레오타이드에서 위치 327의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 20의 서열을 지닌 GenBank 데이터베이스(버전 116)에서 하기의 서열 상동성을 발견했다:
- Genbank에 2000년 2월 22일자로 제출된 서열 g7020279(AK000294) 호모 사피엔스 cDNA FLJ20287 fis, 클론 HEP04390 길이 = 3043의 위치 [2807-2595]와 213 bp(위치 [85-297])에서 100% 상동성.
- 서열 g3850048 (AJ 004828) Mus 머스쿨러스 클론 XX-BAC394(길이 = 170351 *** 서열분석 진행 중***, 비정렬 피스에서)와 219 bp(위치 [82-300])에서 88%;
실시예 1에 기재된 바와 같이, RT PCR에 의해 서열번호 19 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석에 의해 GS91437 유전자가 태아 뇌, 간, 심장, 전립선, 태반, 자궁, 고환, 신장, 골격근에서 발현됨을 보여주었다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 19의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 19의 핵산 서열의 부분 개방 판독 프레임은 잠재적으로 서열번호 135의 서열을 구성하는 95개 아미노산 길이의 폴리펩타이드를 암호화한다.
BLAST에 따르면 데이터베이스 Swissprot(버전 36, 1999년 5월 3일자 최신 업데이트), PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2 및 38) Genpept: (Genbank v110과 111 및 115의 해독), PIR: (비반복성 PIR 서열, 버전 57), PDB: (단백질 데이터은행, 1999년 2월) 및 TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월)에서 기준으로 확인된 서열과 의미있는 상동성을 발견하지 못했다.
서열번호 135의 서열을 가진 폴리펩타이드는 콜레스테롤의 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절과 관련될 수 있다.
서열번호 20의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 20의 서열을 가진 핵산에 함유된 개방 판독 프레임(ORF)은 잠재적으로 서열번호 136의 서열을 구성하는 108개 아미노산의 폴리펩타이드를 암호화한다.
데이터베이스 Swissprot(버전 38), Genpept(버전 115), PIR(버전 62, 1999년 9월) 및 trEMBL(1999년 8월 버전)과 서열 상동성을 발견하지 못했다.
서열번호 136의 서열을 가진 폴리펩타이드는 콜레스테롤의 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절과 관련될 수 있다.
GS91507 유전자
핵산
이하 번호 GS91507로 명명된 유전자의 전사체에 상응하는 두 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 21의 서열을 구성한다.
서열번호 21의 서열은 1627개 뉴클레오타이드 길이를 가진다.
이 서열은 서열번호 21 서열의 위치 1의 뉴클레오타이드에서 위치 640의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 22의 서열을 구성한다.
서열번호 22의 서열은 2333개 뉴클레오타이드 길이를 가진다. 이는 위치 368의 뉴클레오타이드에서 위치 1348의 뉴클레오타이드에 이르는 완전한 개방 판독 프레임(ORF)을 포함한다. 해독 개시 코돈의 시작부는 서열번호 22의 위치 371의 뉴클레오타이드에 위치한다. 이러한 암호화 서열은 위치 371의 뉴클레오타이드에서 출발하여 위치 1348의 뉴클레오타이드에서 끝난다.
서열번호 22의 서열은 하기 GenBank 데이터베이스(버전 116)에서 기준으로 확인된 하기 서열과 상동성을 보유한다:
호모 사피엔스 cDNA FLJ20300 fis, 클론 HEP06465(2331 bp)와 2316 bp(위치 115에서 2420 bp)에서 99% 핵산 동일성.
기탁번호 AK000307
실시예 1에 기재된 바와 같이, 서열번호 21 서열의 전사체의 발현 분석을 RT PCR을 이용하여 수행했다. 다양한 조직의 poly+ RNA를 이용하여 수행된 이러한 분석에 의해 GS91507 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라, 서열번호 90의 서열을 가진 탐침을 이용하여, 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 보여주었다.
서열번호 90의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 각각 하기와 같다:
- 췌장, 신장, 골격근, 폐, 태반 및 뇌에서 2 kb 및 7.5 kb.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증의 경우 원인 위치적 후보를 구성한다.
서열번호 21의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 21의 핵산 서열의 개방 판독 프레임은 잠재적으로 서열번호 137의 서열을 구성하는 213개 아미노산 길이의 폴리펩타이드를 암호화한다.
단백질 서열 수준에서 관찰된 상동성:
213 aa의 이러한 잠재성 ORF는 하기와 같은 다양한 단백질과 모티프형 상동성을 지닌 도메인을 보유한다:
- Swissprot(버전 36, 1999년 5월 3일자 최신 업데이트) 서열 sp|Q10022| 및 PRODOM 서열: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월) 28705 p34.2(1) YSX3_CAEEL - 염색체 II에 위치된 가정상의 단백질 (39 KD) T28D9.3의 도메인과 155 aa(위치 4-158 aa)에서 28% 상동성.
- 비반복성 PIR 서열:(비반복성 PIR 서열, 버전 57): PIR:(비반복성 PIR 서열, 버전 57)|S|S66668 - 과산화수소에 의해 유도된 단백질 - (마우스 서열의 단편)과 127 aa(위치 6-132 aa)에서 25% 상동성.
또한, Genbank 및 EMBL(TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월), Genpept:(Genbank v110과 111의 해독, 1999년 5월 7일자 최신 업데이트)) 해독된 암호화 서열과의 상동성은 "포스파티드산 포스파타제"형의 잠재성 단백질에 대해 주석을 달고 있다
- SP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|P97544|P97544 - 소포체의 막횡단 단백질과 200 aa(위치 6-205 aa)에서 34% 상동성.
- Genpept 서열: (Genbank v110과 111의 해독, 1999년 5월 7일자에 최신 업데이트): gi|4105139|-베타-포스파티드산 포스파타제, 2형; 포스파티데이트 포스포하이드롤라제; 인간에서 인지질 포스파타제; 및 Genpept 서열:(Genbank v110과 111의 해독, 1999년 5월 7일자에 최신 업데이트): 인간에서 포스파티드산 포스포하이드롤라제의 gi|3047173| 상동체, 및 gi|2467300|| - 포스파티드산 포스파타제 2b와 204 aa(위치 6-209 aa)에서 33% 상동성.
- Genpept 서열: (Genbank v110과 111의 해독, 1999년 5월 7일자에 최신 업데이트):gi|1487873||-마우스 포스파티드산 포스파타제와 203 aa(위치 6-208 aa)에서 31% 상동성
- SP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|Q61469|-Q61469|-포스파티드산 포스파타제 2A와 203 aa(위치 6-208 aa)에서 31% 상동성
서열번호 22의 서열을 지닌 핵산에 의해 암호화된 폴리펩타이드
서열번호 22의 핵산 서열의 개방 판독 프레임은 잠재적으로 서열번호 138의 서열을 구성하는 325개 아미노산 길이의 폴리펩타이드를 암호화한다.
단백질 서열 수준에서 관찰된 상동성
Genbank(버전 116)과 EMBL(TrEMBL(1999년 8월 버전), Genpept[버전 115])의 해독된 암호화 서열과의 상동성은 "포스파티드산 포스파타제"형의 잠재성 단백질에 대해 주석을 달고 있다.
- SP-trEMBL: sp|P97544|P97544 ER 막횡단 단백질과 316 aa(위치 2-317 aa)에서 30% 상동성
- Genpept116 gi|4105139|AF043329 2형 포스파티드산 포스파타제-베타; 포스파티데이트 포스포하이드롤라제; 인지질 포스파타제[호모 사피엔스] 및 Genpept116: gi|3047173|AF01786 포스파티드산 포스포하이드롤라제 상동체[호모 사피엔스] 및 gi|2467300|AB000889 포스파티드산 포스파타제 2b와 320 aa (위치 2-321 aa)에서 30% 상동성
- Genpept116 gi 1684745 Y07783 막횡단 단백질 [라투스 노르베기쿠스] 길이 = 312 aa와 316 aa(2-317 aa)에서 30% 상동성
- SP-trEMBL EM: 014495 포스파티드산 포스파타제 2B: 길이 = 311 aa와 320 aa(위치 2-317 aa)에서 30% 상동성.
서열번호 137 및 138의 서열을 지닌 폴리펩타이드의 추정상의 기능:
GS91507 유전자는 위치적 후보 및, 추정상의 기능(포스파티드산 포스파타제)이 탠지어병과 가족성 HDL 결핍증(FHD)에 관련된 HDL 입자에 의해 매개된 세포내 콜레스테롤 유출과 연관된 세포내 시그널링 캐스케이드에서 일정 역할을 할 수 있는 신규 단백질을 암호화하는 유전자라는 점에서 탠지어병과 FHD의 기능 연구에 중요하다.
서열번호 137 및 138의 서열을 가진 폴리펩타이드는 콜레스테롤 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절에 관련될 수 있다.
GS915231 유전자
핵산
이하 번호 GS915231로 명명된 유전자의 전사체에 상응하는 두 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 23의 서열을 구성한다.
서열번호 23의 서열은 2764개 뉴클레오타이드의 길이를 가진다.
이 서열은 서열번호 23 서열의 위치 3의 뉴클레오타이드에서 위치 1220의 뉴클레오타이드에 해당하는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 24의 서열을 구성한다.
서열번호 24의 서열은 3228개 뉴클레오타이드 길이를 가진다. 이는 위치 37의 뉴클레오타이드에서 위치 1304의 뉴클레오타이드에 해당하는 개방 판독 프레임(ORF)을 포함한다. 암호화 서열은 서열번호 24 서열의 위치 49의 뉴클레오타이드에서 출발하여 위치 1304의 뉴클레오타이드에서 끝난다. 해독 개시 코돈의 시작부는 위치 49의 뉴클레오타이드상에 위치한다. 서열번호 24 서열의 위치 3142의 뉴클레오타이드상에서 출발하는 폴리아데닐화 시그널이 존재한다.
서열번호 24와 GenBank 데이터베이스(버전 116)에서 기준으로 확인된 하기 서열간에 서열 상동성이 관찰되었다:
- 서열 g4884337 (AL050130) 호모 사피엔스 mRNA; cDNA DKFZp586H051(클론 DKFZp586H051에서)의 위치 [1-217]과 매치되는 217 bp(위치[2704-2920])에서 100% 상동성. 길이 = 1795; 2000년 2월 18일자 제출; 직접 제출; 제출된 (1999년 5월 15일) MIPS, Am Klopferspitz 18a, D-82152, Martinsried, 독일,
- 4개의 상동성 단편: 393 bp[2773-315]에서 100%; 1563 bp[913-1065]에서 100%; 111 bp[1083-1193]에서 100%; 서열 g6539402(AC016904) 호모 사피엔스 클론RP11-307P9와 84 bp[2341-2424]에서 84%, *** 서열분석 진행 중***, 비정렬된 36개 피스. 길이 = 203456;
- 다양한 상동성 단편: 258 bp[529-786]에서 83%; 66 bp[1195-1260]에서 89%; 서열 g5305227(AF029260) 갤루스 갤루스 전사 인자 RelB(relb) mRNA와 185 bp[91-275]에서 80%, 완전 코드. 길이 = 2851
실시예 1에 기재된 바와 같이, 서열번호 23 서열의 전사체의 발현 분석을 RT PCR에 의해 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석에 의해 GS915231 유전자가 태아 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라, 서열번호 91의 서열을 지닌 탐침을 이용하여, 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 보여주었다.
서열번호 91의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 각각 하기와 같다:
- 심장 및 골격근에서 1.3 kb, 2 kb, 4 kb, 4.4 kb 및 7.5 kb:
- 간과 신장에서 1.3 kb, 2 kb, 4 kb 및 4.4 kb;
- 뇌에서 1.3 kb, 2 kb, 4.4 kb 및 7.5 kb;
- 췌장에서 1.3 kb, 2 kb 및 4.4 kb.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 경우 원인 위치적 후보를 구성한다.
서열번호 23의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 23의 핵산 서열의 부분 개방 판독 프레임은 잠재적으로 서열번호 139의 서열을 구성하는 406개 아미노산 길이의 폴리펩타이드를 암호화한다.
단백질 서열 수준에서 관찰된 상동성:
- Genpept 서열: (Genbank v100과 111의 해독, 1999년 5월 7일자에 최신 업데이트): 씨. 엘레간스의 알콜 데하이드로게나제/리비톨 데하이드로게나제와 유사한 서열 gb|AAB93456.1|(U28739)의 단백질 해독인 gi:2731377 및 SP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: 401 aa(위치 1-401 aa)에서 Q09979과 51% 상동성.
- 단백질 데이터은행 서열:: 단백질 1AHI|A 쇄 A, Nadh 및 7-옥소 글리코케노데옥시콜산과 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827713| 및 단백질 1AHI|B 쇄 B, Nadh 및 7-옥소 글리코케노데옥시콜산과 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827714| 및 단백질 1AHH|A 쇄 A, Nad+와 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827715| 및 단백질 1AHH|B 쇄 B, Nad+와 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827716| 및 단백질 1FMC|A 쇄 A, Nadh 및 7-옥소 글리코케노데옥시콜산과 7-알파-하이드록시스테로이드 데하이드로게나제 복합체에 상응하는 gi|1943533|및 단백질 1FMC|B 쇄 B, Nadh 및 7-옥소 글리코케노데옥시콜산과 7-알파-하이드록시스테로이드 데하이드로게나제 복합체에 상응하는 gi|1943534|와 164 aa(위치47-205 aa)에서 30% 상동성
- 단백질 데이터은행 서열: 슈도모나스 종 LB400의 단백질 시스-비페닐-2,3-디하이드로디올-2,3-데하이드로게나제에 상응하는 gi|26244971|과 131 aa(위치 53-183 aa)에서 29% 상동성
- PIR 염기 서열: (비반복성 PIR 서열, 버전 57): PIR: (비반복성 PIR 서열, 버전 57)바실러스 서브틸리스의 단백질 3-옥소아실-아실-캐리어 단백질 리덕타제 상동체 yoxD에 상응하는 |D69930| 및 Swissprot(버전 36, 1999년 5월 3일자에 최신 업데이트) 서열: 단백질 YOXD_BACSU-RTP-PELB 영역(ORF238)에 존재하는 가정상의 옥시도리덕타제에 상응하는 sp|P14802|와 194 aa (위치 3-196 aa)에서 27% 상동성
- PRODOM 서열: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월)(Swissprot에서 검출된 상동성 도메인(버전 36, 1999년 5월 3일자에 최신 업데이트)): 단백질 지질-전달 스테롤 캐리어 SCP-2 비특이성 전구체 에스트라디올 베타-데하이드로게나제 17-베타-하이드록시스테로이드에 상응하는 2675 p34.2(11) NLTP(5) DHB4(3) PX18(2)와 44 aa(위치 353-396 aa)에서 52% 상동성
- Swissprot(버전 36, 1999년 5월 3일자에 최신 업데이트) 서열: 단백질 DHB4_인간 에스트라디올 17 베타-데하이드로게나제 4 (EC 1.1.1.62) (17-베타-HSD 4)(17-베타-하이드록시스테로이드 데하이드로게나제 4)에 상응하는 sp|P51659|와 167 aa(위치 233-399 aa)에서 27% 상동성
서열번호 24의 서열을 가진 핵산에 의해 암호화된 폴리펩타이드
서열번호 24의 핵산 서열의 개방 판독 프레임(ORF)은 잠재적으로 서열번호 140의 서열을 구성하는 422개 아미노산 길이의 폴리펩타이드를 암호화한다.
하기 서열 상동성을 발견했다: 단백질 서열 수준에서 관찰된 상동성:
- Genpept:gi:2731377 및 416 aa(위치 11-417 aa)에서 SP-trEMBL:Q09979와 51% 상동성.
Genpept:gi:2731377은 씨. 엘레간스의 알콜 데하이드로게나제/리비톨 데하이드로게나제와 유사한 서열 gb|AAB93456.1|(U28739)의 단백질 해독이다
- 단백질 데이터 은행: 단백질 1AHI|A 쇄 A, Nadh 및 7-옥소 글리코케노데옥시콜산과 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827713| 및 단백질 1AHI|B 쇄 B, Nadh 및 7-옥소 글리코케노데옥시콜산과 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827714| 및 단백질 1AHH|A 쇄 A, Nad+와 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827715| 및 단백질 1AHH|B 쇄 B, Nad+와 복합체 형성된 7 알파-하이드록시스테로이드 데하이드로게나제에 상응하는 gi|1827716| 및 단백질 1FMC|A 쇄 A, Nadh 및 7-옥소 글리코케노데옥시콜산과 7-알파-하이드록시스테로이드 데하이드로게나제 복합체에 상응하는 gi|1943533| 및 단백질 1FMC|B 쇄 B, Nadh 및 7-옥소 글리코케노데옥시콜산과 7-알파-하이드록시스테로이드 데하이드로게나제 복합체에 상응하는 gi|1943534|와 164 aa(위치 47-205 aa)에서 30% 상동성
- 단백질 데이터 은행: 슈도모나스 종 Lb400에서 나온 단백질 시스-비페닐-2,3-디하이드로디올-2,3-데하이드로게나제에 상응하는 gi|2624497|과 131 aa(위치 53-183 aa)에서 29% 상동성
- 비과잉 PIR: 단백질 3-옥소아실-아실-캐리어 단백질 리덕타제 상동체 yoxD - 바실러스 서브틸리스에 상응하는 pir|D69930|및, Swissprot: RTP-PELB 인터게닉 영역(EC 1.-.-.-.)(ORF238)에서 단백질 YOXD_BACSU 가정 옥시도리덕타제에 상응하는 sp|P14802|와 202 aa(위치 6-212)에서 27% 상동성
- Prodom(Swissprot에서 검출된 상동성 도메인): 단백질 지질-전달 스테롤 캐리어 SCP-2 비특이성 전구체 에스트라디올 베타-데하이드로게나제 17-베타-하이드록시스테로이드에 상응하는 2675 p34.2 (11) NLTP(5) DHB4(3) PX18(2)과 44 aa(위치 353-396 aa)에서 52% 상동성
- Swissprot: 단백질 DHB4_인간 에스트라디올 17 베타-데하이드로게나제 4(EC 1.1.1.62)(17-베타-HSD 4)(17-베타-하이드록시스테로이드 데하이드로게나제 4)에 상응하는 sp|P51659|와 183 aa(위치 249-415 aa)에서 27% 상동성
- 서열 g2072661(Z95120) 가정상의 단백질 Rv3224[마이코박테리움 튜버큘로시스] 길이 = 282와 272 AA(위치 12-280)에서 44% 상동성
- 비특이성 지질-전달 단백질 전구체(NSL-TP)와 상동성: 서열 SP:NLTP_소 비특이성 지질-전달 단백질(스테롤 캐리어 단백질 2)(SCP-2)와 106 AA([318-417])에서 35%. 길이 = 121, 및 서열 SP:NLTP_래트 비특이성 지질-전달 단백질 전구체(NSL-TP)(스테롤 캐리어 단백질 2)(SCP-2)(스테롤 캐리어 단백질 X)(SCP-X)(SCPX)와 133 AA[294-417]에서 30%. 길이 = 547
추정상의 기능:
422개 아미노산의 ORF는 몇몇 유기체: 인간, 마우스, 이.콜라이, 에스. 세레비지에, 씨. 엘레간스의 스테롤의 탈수소화 메커니즘에 관련된 각종 추정 효소 단백질과 상동성을 보유한다. 또한, 본 출원인은 지질의 세포내 수송에 관련된 SCP-2 단백질의 서열과의 상동성을 입증할 수 있었다. 이로 인해, GS15231 유전자는 FHD/탠지어 환자에서 세포내 콜레스테롤 트래픽의 결함에서 가능한 기능에 의해 해당 단백질을 암호화 하며, 이는 GS15231 유전자 연구의 중요성을 강조한다.
또한, GS15231 유전자는 이의 위치에 의해 탠지어병 또는 가족성 HDL 결핍증에서 관찰된 유전자 결함 연구 및 이의 특징분석을 위한 위치적 후보 유전자이다.
서열번호 139 및 140의 서열을 지닌 폴리펩타이드는 콜레스테롤의 유동 조절, 좀더 구체적으로 말하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관된 질환의 조절과 관련될 수 있다.
GS915528 유전자
핵산
이하 번호 GS915528로 명명된 유전자의 전사체에 상응하는 두 메신저 RNA를 본 발명에 따라 분리했다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 25의 서열을 구성한다.
서열번호 25의 서열은 3106개 뉴클레오타이드 길이를 가진다.
이 서열은 서열번호 25 서열의 위치 1의 뉴클레오타이드에서 위치 1272의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)에서 조사하는 동안 서열 동일성을 발견하지 못했다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 26의 서열을 구성한다.
서열번호 26의 서열은 3313개 뉴클레오타이드 길이를 가진다. 이는 위치 3의 뉴클레오타이드에서 위치 1370의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함하며, 이는 또한 암호화 서열에 상응한다. 폴리아데닐화 시그널은 서열번호 26 서열의 위치 3280의 뉴클레오타이드에서 시작한다.
GenBank 데이터베이스(버전 116)에서 기준으로 나타낸 서열과 서열번호 26의 서열에 대한 서열 상동성을 발견했다:
- g7020444 AK000388 호모 사피엔스 cDNA FLJ20381 fis, 클론 KAIA2329 길이 = 2970 bp와 2755 bp (위치 119-2873)에서 99% 핵산 동일성.
- g6514007 AC13568 호모 사피엔스 클론 RP11-1B9, 워킹 드래프트 서열 10 비정렬 단편을 서열분석하는 동안 BAC와 99% 핵산 동일성.
실시예 1에 기재된 바와 같이, RT PCR을 이용하여 서열번호 25 서열의 전사체의 발현 분석을 수행했다. 다양한 조직의 polyA+ RNA를 이용하여 수행된 이러한 분석에 의해 GS915528 유전자가 태아 뇌, 간, 전립선, 심장, 태반, 자궁, 고환 및 뇌에서 발현됨을 보여줄 수 있었다.
또한, 실시예 1에 기재된 프로토콜에 따라, 서열번호 92의 서열을 지닌 탐침을 이용하여, 노던 블롯팅에 의해 전사체의 발현을 분석하여 Clontech사(Ref. No. 7759-1)에서 시판된 블롯에서 전사체의 존재를 보여주었다.
서열번호 92의 서열을 가진 탐침을 이용하여 검출된 전사체의 크기는 각각 하기와 같다:
- 췌장에서 1.9 kb, 3.2 kb 및 3.8 kb;
- 심장에서 1 kb, 1.9 kb 및 3.8 kb;
- 간에서 1 kb, 1.9 kb 및 3.2 kb;
- 신장에서 1 kb 및 1.9 kb;
- 골격근과 뇌에서 1.9 kb.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애로 인한 질환, 좀더 구체적으로 말하면 탠지어병 또는 가족성 HDL 결핍증의 경우 원인 위치적 후보를 구성한다.
서열번호 25의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 25의 핵산 서열의 개방 판독 프레임은 서열번호 141의 서열을 구성하는 424개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 서열의 수준에서 관찰된 상동성:
424개 아미노산의 이러한 ORF는 하기와 같은 다양한 단백질 데이터베이스중 각종 티로신 포스파타제 단백질의 보존 도메인과 모티프형 상동성을 가진다:
ㆍSP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: 씨. 엘레간스의 cDNAYK65E9.3에 의해 암호화된 sp|P91433|P91433 및 Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): 씨. 엘레간스의 4.1 밴드, 에즈린, 모에신, 라딕신 및 탈린에서 발견되는 도메인을 함유하는 gi|1708767|과 364개 아미노산(3-366 아미노산 위치)에 걸쳐서 49% 상동성
ㆍSP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|O43491|O43491 단백질 4.1-G와 322개 아미노산(1-322 아미노산 위치)에 걸쳐서 44% 상동성
ㆍPRODOM 서열: (Swissprot에서 검출되는 상동성 도메인, 버전 34.2, 1997년 11월): 막 구성에 관여하는 단백질 모에신 밴드 P81 빌린-2 에즈린 라딕신의 티로신 포스파타제 단백질 도메인에 상응하는 894 p34.2 (29) MOES(4) RADI(3) EZRI(3)과 227개 아미노산(7-233 아미노산 위치)에 걸쳐서 43% 상동성
ㆍSwissprot(버전 36, 1999년 5월 3일 최신 업데이트) 서열: sp|P29074|PTN4_HUMAN - 인간 티로신 포스파타제 단백질 MEG1 (EC 3.1.3.48)과 313개 아미노산(9-321 아미노산 위치)에 걸쳐서 42% 상동성
ㆍ비반복성 PIR 서열: (비반복성 PIR 서열, 버전 57): PIR: (비반복성 PIR 서열, 버전 57)|S|JU0188 - 마우스 티로신 포스파타제 단백질의 상과에 속하는 단백질 밴드 4.1 및 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 서열: sp|P52963|NBL4_마우스-단백질 NBL4 및 SP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|O57457|단백질 밴드 4.1과 유사한 단백질 및 Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|466548| - mus 근육의 단백질 NBL4와 320개 아미노산(7-326 아미노산 위치)에 걸쳐서 41% 상동성
ㆍSwissprot(버전 36, 1999년 5월 3일 최신 업데이트) 서열: sp|P11171|41_HUMANPROTEIN 4.1(밴드 4.1)(P4.1)과 314개 아미노산(9-322 아미노산 위치)에 걸쳐서 41% 상동성
서열번호 26의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 26의 서열을 가지는 핵산의 개방 판독 프레임은 서열번호 142의 서열을 구성하는 455개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 서열 수준에서 관찰된 상동성:
455개 아미노산의 이 ORF는 하기와 같은 다양한 단백질 데이터베이스중 각종 티로신 포스파타제 단백질의 보존 도메인과 모티프형 상동성을 가진다:
ㆍSP-TrEMBL: 씨. 엘레간스 CDNA YK65E9.3에 의해 암호화된 sp|P91433|P91433 및 Genpept115: 씨. 엘레간스의 4.1 밴드, 에즈린, 모에신, 라딕신 및 탈린에서 발견되는 도메인을 함유하는 gi|1708767|U80955과 374개 아미노산(24-397 아미노산 위치)에 걸쳐서 50% 상동성
ㆍSP-TrEMBL: sp|O43491|O43491 단백질 4.1-G와 333개 아미노산(21-353 아미노산 위치)에 걸쳐서 45% 상동성
ㆍProdom: 막 구성에 관여하는 단백질 포스파타제 단백질-티로신 모에신 밴드 P81 빌린-2 에즈린 라딕신에 상응하는 894 p34.2 (29) MOES(4) RADI(3) EZRI(3)과 227개 아미노산(7-233 아미노산 위치)에 걸쳐서 43% 상동성
ㆍSwissprot38: sp|P29074|PTN4_HUMAN 단백질-티로신 포스파타제 MEG1 (EC3.1.3.48)(PTPASE-MEG1)(MEG)과 329개 아미노산(24-352 아미노산 위치)에 걸쳐서 42% 상동성
ㆍ비-여분 PIR: 마우스의 pir|S|JU0188 밴드 4.1 단백질 티로신-포스파타제 상과 멤버 단백질 및 Swissprot: sp|P52963|NBL4_마우스 NBL4 단백질 및 SP-TrEMBL: sp|O57457|밴드 4.1-유사 단백질 4 및 Genpept: gi|466548|NBL4 mus 근육 단백질과 335개 아미노산(23-357 아미노산 위치)에 걸쳐서 42% 상동성
ㆍSwissprot: sp|P11171|41_HUMANPROTEIN 4.1(밴드 4.1)(P4.1)과 322개 아미노산(22-353 아미노산 위치)에 걸쳐서 41% 상동성.
추정상의 기능:
GS915528 유전자는 추정상의 기능(티로신 포스파타제)이 탠지어병 및 가족성 HDL 결핍증(FHD)에 관여하는, HDL 입자에 의해 매개되는 세포내 콜레스테롤 분비와 연결된 세포내 시그널링 캐스케이드에서 특정 역할을 할 수 있는 신규 단백질을 암호화하는 위치적 후보 및 유전자라는 점에서 탠지어병 및 FHD의 기능 연구를 위한 해당 유전자이다.
서열번호 141 및 142의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS99817 유전자
핵산
여기에서 No. GS99817로 명명되는 유전자의 전사체에 상응하는 두 메신저RNA가 본 발명에 따라 분리되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 27의 서열을 구성한다.
서열번호 27의 서열은 1539개 뉴클레오타이드의 길이이다.
이 서열은 서열번호 27 서열의 3 위치의 뉴클레오타이드부터 698 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 28의 서열을 구성한다.
서열번호 28의 서열은 3404개 뉴클레오타이드의 길이이다. 이는 서열번호 28 서열의 1 위치의 뉴클레오타이드에서 792 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 28 서열의 GenBank 데이터베이스(버전 116)중에서 참조로 표시된 서열과의 서열 상동성이 발견된다:
- BAC END CIT-HSP-2166G6.TR CIT-HSP 호모 사피엔스 게놈 클론 2166G6과 380개 염기쌍에 걸쳐서 97% 상동성, 게놈 조사 서열 길이 = 380gi|2975337|gb|B93000.1|B93000[2975337]
- BAC END HS_2166_A2_D03_MR CIT 승인된 인간 게놈 정자 라이브러리 D 호모 사피엔스 게놈 클론 플레이트=2166 Col=6 Row=G와 315개 염기쌍에 걸쳐서 100% 상동성, 게놈 조사 서열. 길이 = 316gi|3480271|gb|AQ104915.1|AQ104915[3480271]
서열번호 27 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR로 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는, 이 분석은 GS99817 유전자가 태아 뇌에서 발현됨을 보여줄 수 있다.
또한, 실시예 1에 설명된 프로토콜에 따라, 서열번호 93 서열의 탐침의 도움을 통한 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(참조번호 7795-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 93의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 심장과 뇌에서 1.5 kb, 2 kb 및 4.4 kb;
- 췌장에서 2 kb 및 4.4 kb;
- 신장과 골격근에서 1.5 kb 및 4.4 kb이다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 27의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 27의 서열을 가지는 핵산의 개방 판독 프레임은 서열번호 143의 서열을 구성하는 232개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 서열의 수준에서 관찰된 상동성:
Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|3876730| 및 TrEMBL 서열(SP-TrEMBL, 버전 7, 1998년 11월): 선충류 코스미드 F35C11.4(Caenorhabditis elegans)의 서열 해독에 상응하는 sp|Q20021|과 211개 아미노산(11-221 아미노산 위치)에 걸쳐서 27% 상동성
서열번호 28의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 28의 서열을 가지는 핵산의 개방 판독 프레임은 서열번호 144의 서열을 구성하는 263개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
서열번호 144의 서열과 하기의 서열간의 상동성이 관찰된다:
단백질 서열 수준에서 관찰된 상동성:
Genpept: gi|3876730| 및 trEMBL: 선충류 코스미드 F35C11.4(Caenorhabditis elegans)의 서열 해독에 상응하는 sp|Q20021|과 255개 아미노산(1-255 아미노산 위치)에 걸쳐서 28% 상동성.
추정상의 기능:
이 유전자는 염색체 위치 때문에 FHD/탠지어병의 연구를 위한 후보이다.
서열번호 143 및 144의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 유전자좌 9q31-34와 유전적으로 연관된 질환에 관여할 수 있다.
GS916229 유전자
핵산
여기에서 No. GS916229로 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 29의 서열을 구성한다.
서열번호 29의 서열은 792개 뉴클레오타이드의 길이이다.
이 서열은 서열번호 29 서열의 1 위치의 뉴클레오타이드에서 203 위치의 뉴클레오타이드에 이르는 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 29 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼 RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이 분석은 GS916229 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환 및 신장에서 발현됨을 보여줄 수 있다. 이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 29의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 29의 핵산 서열의 개방 판독 프레임은 서열번호 145의 서열을 구성하는 68개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 및 PRODOM: (Swissprot에서 검출되는 상동성 도메인, 버전 34.2, 1997년 11월)중에서 참조로 동정된 서열로는 발견되지 않았다.
서열번호 145의 서열을 가지는 폴리펩타이드는 콜레스테롤 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS92544 유전자
핵산
여기에서 No. GS92544로 명명되는 유전자의 긴 전사체 및 두 개의 짧은 전사체에 각각 상응하는 3 가지 메신저 RNA가 본 발명에 따라 분리된다.
긴 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 30의 서열을 구성한다.
서열번호 30의 서열은 2733개 뉴클레오타이드 길이이다.
이 서열은 서열번호 30 서열의 1 위치의 뉴클레오타이드에서 2160 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
짧은 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 131의 서열을 구성한다.
서열번호 131의 서열은 2694개 뉴클레오타이드 길이이다.
이 서열은 서열번호 31 서열의 1 위치의 뉴클레오타이드에서 2121 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
두번째 짧은 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 32의 서열을 구성한다.
서열번호 32의 서열은 2765개 뉴클레오타이드 길이이다. 이는 서열번호 32서열의 56 위치의 뉴클레오타이드에서 2287 위치의 뉴클레오타이드에 이르는 완전한 개방 판독 프레임을 포함한다. 이 암호화 서열은 서열번호 32 서열의 410 위치의 뉴클레오타이드에서 시작되어 2160 위치의 뉴클레오타이드에서 끝난다. 해독 개시 코돈은 서열번호 32 서열의 410 위치의 뉴클레오타이드에서 시작된다.
서열번호 32의 서열은 GenBank 데이터베이스(버전 116)중에서 참조로 동정되는 하기 서열과 상동성을 가진다:
ㆍ서열 g6807990(AL137432) 호모 사피엔스 mRNA: (클론 DKFZp761E1824로부터의) cDNA DKFZp761E1824)의 [1-2419] 위치와 매치되는 2419개 염기쌍([485-2903] 위치)에 걸쳐서 100% 상동성(부분적인 cds, 길이 = 2438 염기쌍, 2000년 2월 18일 제출, 9번 염색체 상에서, "CR2 수용체와 유사"하다고 주석).
ㆍg3590696(AQ192074)HS_3228_B2_H11_T7 CIT 승인된 인간 게놈 정자 라이브러리 D 호모 사피엔스 게놈 클론 플레이트 = 3228 Col = 22 Row = P의 [431-277] 위치와 157개 염기쌍([1271-1427] 위치)에 걸쳐서 97% 상동성, 게놈 조사 서열. 길이 = 513
ㆍ서열 gi|6982613||AL138756: 호모 사피엔스 9번 염색체 클론 RP11-401 map q31.3-33.1과 99% 내지 100% 일치하는 다수의 단편, ***서열분석 진행 중***, 41개 비정렬 피스
ㆍ서열 g7230026 (AC010824) 호모 사피엔스 클론 RP11-5A23과 100% 일치하는 다수의 단펀, ***서열분석 진행 중***, 32개 비정렬 피스. 길이 = 162010
긴 전사체 및 짧은 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행된 이 분석은 GS92544 유전자가 태아 뇌에서 발현됨을 보여줄 수 있다.
추가로, 각각 서열번호 94의 서열을 가지는 탐침의 도움을 통한 노던 블롯팅에 의한 이러한 전사체의 발현 분석은 Clontech사(참조번호 7759-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 94의 서열을 가지는 탐침으로 검출된 전사체의 크기는 태반에서 각각 4 kb 및 6 kb이다. 이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 30 및 31의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 30의 핵산 서열(긴 전사체)의 개방 판독 프레임은 서열번호 146의 서열을 구성하는 720개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
서열번호 31의 핵산 서열(짧은 전사체)의 개방 판독 프레임은 서열번호 147의 서열을 구성하는 707개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 수준에서 관찰된 상동성:
이 서열은 Pfam 데이터베이스(HMMER 2.0, 1998년 6월)의 보존 도메인 sushi.HMM과 139-194 아미노산 / 199-254 아미노산 위치에 대해 상당한 상동성을 가진다.
이 ORF는 Genpept: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트) 및 TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월)중에서 하기와 같은 다수 서열의 BlastX 해독으로 주석을 단다:
ㆍGenpept: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트)중에서 gi|340164|인간 우로모둘린 전구체 및 gi|340166|우로모둘린 [호모 사피엔스]의 서열과 115개 아미노산(2-116 아미노산 위치)에 걸쳐서 42% 상동성
ㆍSP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|P87363|P87363(FIBRILLIN-1의 단편)과 141개 아미노산(2-142 아미노산 위치)에 걸쳐서 37% 상동성.
ㆍGenpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|306747|및 gi|1335064|인간 피브릴린과 234개 아미노산(7-240 아미노산 위치)에 걸쳐서 30% 상동성.
ㆍSP-TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 서열: sp|O35806|O35806 잠복하는 TGF-베타 결합 단백질-2 유사 단백질과 194개 아미노산(8-201 아미노산 위치)에 걸쳐서 30% 상동성
서열번호 32의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 32의 핵산 서열의 개방 판독 프레임은 서열번호 148의 서열을 구성하는 713개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
서열번호 148 서열의 데이터베이스중에서 참조로 동정된 서열과의 상동성이 관찰되었다. 상동성은 하기와 같다:
ㆍGenpept: gi|340164|우로모둘린 전구체 [호모 사피엔스] 및 Genpept: gi|340166|우로모둘린 [호모 사피엔스]와 상동성
ㆍSP-TrEMBL: sp|P87363|P87363 FIBRILLIN-1(단편)과 상동성
ㆍGenpept: gi|306746| 및 gi|1335064|피브릴린 [호모 사피엔스]와 상동성
ㆍSP-TrEMBL: sp|O35806|O35806 잠복하는 TGF-베타 결합 단백질-2 유사 단백질과 상동성
ㆍg784994(X81479) EMR1 [호모 사피엔스]와 상동성, 길이 = 886
ㆍg4379069(X94630) 7-스판(span) 막횡단 단백질 [호모 사피엔스]와 상동성
ㆍEMR1, CD97, 피불린, 보체 수용체 등과 같은 단백질과 기타 상동성
서열번호 148의 서열은 2 칼슘 결합, 티로신 포스파타제 부위, N-말단의 소수성 도메인; 다수의 글리코실화 부위; 포스포릴화를 위한 2 camp 부위; 2 Asp 하이드록실화 부위중 3 EGF 도메인과 같은 특징적인 모티프를 지닌다.
추정상의 기능:
우로모둘린과의 상동성에 의해, GS92544 유전자의 산물은 글리코실포스파티딜이노시톨(GPI)에 의해 고정된 단백질인 막과 유사한 우로모둘린과 관련있는 단백질이라고 추정된다. 부분적인 아미노산 서열 상동성의 연구를 기본으로 하는, 이러한 결과는 GS92544 유전자의 산물이 막 지질과의 결합을 통해 막과 결합할 수 있어서 FHD 또는 탠지어병 환자에서 관찰되는 세포성 콜레스테롤 분비의 결손과 관련있을 수 있음을 설명해준다.
서열번호 146, 147 및 148의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS930824 유전자
핵산
여기에서 No. GS930824라고 명명되는 유전자의 전사체에 상응하는 두 메신저 RNA가 본 발명에 따라 분리되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 33의 서열을 구성한다.
서열번호 33의 서열은 4745개 뉴클레오타이드 길이이다.
이 서열은 서열번호 33 서열의 2 위치의 뉴클레오타이드에서 514 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
뉴클레오타이드 서열의 수준에서 관찰된 상동성:
Genbank: AF115435, 래트 신탁신 17과 510개 염기쌍(22-531 염기쌍 위치)에 걸쳐서 90% 상동성.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 34의 서열을 구성한다.
서열번호 34의 서열은 5241개 뉴클레오타이드 길이이다. 이는 서열번호 34 서열의 57 위치의 뉴클레오타이드에서 1013 위치의 뉴클레오타이드에 이르는 완전한 개방 판독 프레임(ORF)을 포함한다. 암호화 서열은 서열번호 34 서열의 105 위치의 뉴클레오타이드에서 시작되어 1013 위치의 뉴클레오타이드에서 끝난다. 해독개시 코돈은 서열번호 34 서열의 105 위치의 뉴클레오타이드에서 시작된다.
서열번호 34의 서열은 GenBank 데이터베이스(버전 116)중에서 참조로 동정된 서열과 상동성을 가진다. 상동성은 하기와 같다:
ㆍGenbank: AF115435, 래트 신탁신 17과 510개 염기쌍(22-531 염기쌍 위치)에 걸쳐서 90% 상동성
ㆍ서열 g4206160(AF115435) 래투스 노르베기쿠스 신탁신 17 mRNA와 475개 염기쌍([540-1036] 위치)에 걸쳐서 92% 및 406개 염기쌍([102-507] 위치)에 걸쳐서 84% 상동성, 완전한 cds, 길이 = 1678;
ㆍ서열 g4652677(AQ474416) CITBI-E1-258819.TF CITBI-E1 호모 사피엔스 게놈 클론 258819와 431개 염기쌍([1899-2329] 위치)에 걸쳐서 98% 및 62개 염기쌍([1819-1880] 위치)에 걸쳐서 91% 상동성, 게놈 조사 서열. 길이- 525;
ㆍ서열 g2929043(B87911) RPCI11-30N20.TP RPCI-11 호모 사피엔스 게놈 클론 RPCI-11-30N20과 331개 염기쌍([6394-6724] 위치)에 걸쳐서 99% 상동성, 게놈 조사 서열. 길이 = 425
ㆍ서열 g7020892(AK000658) 호모 사피엔스 cDNA FLJ20651 fis, 클론 KAT01814와 2662개 염기쌍([20-2681] 위치)에 걸쳐서 99% 상동성. 길이 = 2678; DDBJ/EMBL/GenBank 데이터베이스에 2000년 2월 15일 제출, NEDO 프로젝트.
서열번호 33 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행된 이러한 분석은 GS930824 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환,신장 및 골격근에서 발현됨을 보여줄 수 있다.
추가로, 실시예 1에 설명된 프로토콜에 따라 각각 서열번호 95 및 96의 서열을 가지는 탐침의 도움을 통한 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(참조번호 7759-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 95의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 췌장, 신장, 골격근, 간, 뇌 및 심장에서 1.1 kb, 1.6 kb, 2.6 kb, 4.9 kb 및 7 kb;
- 폐 및 태반에서 1.6 kb, 2.6 kb, 4.9 kb 및 7 kb이다.
서열번호 70의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 태반에서 1.35 kb, 2.4 kb, 3.5 kb 및 10 kb;
- 췌장, 신장 및 간에서 1.35 kb 및 2.4 kb;
- 폐에서 1.35 kb;
- 골격근, 뇌 및 심장에서 2.4 kb이다.
이 유전자는 콜레스테롤 역류에서의 기능 장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증의 원인 위치적 후보를 구성한다.
서열번호 33의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 33의 핵산 서열의 개방 판독 프레임은 서열번호 149의 서열을 구성하는 170개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 및 PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2,1997년 11월)중에서 참조로 동정된 서열로는 관찰되지 않았다.
단백질 서열 수준에서 관찰된 상동성:
Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi4206161과 170개 아미노산(1-170 아미노산 위치)에 걸쳐서 72% 상동성
gi4206161은 래트 신탁신 17: Genpept: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트)을 암호화하는 유전자의 단백질 해독이다.
서열번호 34의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 34 서열의 개방 판독 프레임은 서열번호 150의 서열을 구성하는 318개 아미노산의 폴리펩타이드를 잠재적으로 암호화한다.
하기의 상동성이 관찰된다:
Genpept: gi4206161과 170개 아미노산(1-170 아미노산 위치)에 걸쳐서 72% 상동성. Genpept: gi4206161은 래트 신탁신 17을 암호화하는 유전자의 단백질 해독이다.
Genpept115, Trembl 및 PIR에서의 단백질 상동성:
- g4206161의 전체 길이의 해독된 서열 g4206161(AF115435) 신탁신 17[래투스 노르베기쿠스](길이 = 301)와 302개 아미노산([105-1010] 위치)에 걸쳐서 75% 상동성
서열번호 150의 서열을 가지는 폴리펩타이드는 개방 판독 프레임의 1 위치와 243 위치의 뉴클레오다이드 사이에 신탁신의 특징적인 모티프를 지닌다.
추정상의 기능:
따라서 서열번호 149 및 150의 서열을 가지는 폴리펩타이드는 세포내 소포 수송과 관련있는 신탁신 부류의 단백질과 관련있다. 이러한 단백질에 의해 매개되는 특정 어드레싱에 의해 보강되는 이러한 메커니즘은 세포내 콜레스테롤 풀의 수용체 HDL 입자로의 수송 및 전좌 메커니즘의 결함으로 설명되는 탠지어병/FHD 측면에서 관심사이다. 따라서 서열번호 149 및 150의 서열을 가지는 폴리펩타이드는 HDL에 의한 콜레스테롤의 역수송과 관련있는 중요한 단계에 관여할 수 있다.
서열번호 149 및 150의 서열을 가지는 폴리펩타이드는 또한 9번 염색체의 유전자좌 9q31-34와 유전적으로 연관된 질환에 관여할 수 있다.
GS93382 유전자
핵산
여기에서 No. GS93382로 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 35의 서열을 구성한다.
서열번호 35의 서열은 3014개 뉴클레오타이드 길이이다.
이 서열은 서열번호 35 서열의 3 위치의 뉴클레오타이드에서 371 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성이가 조사 중에 관찰되지 않았다.
서열번호 35 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS93382 유전자가 태아 뇌에서 발현됨을 보여줄 수 있다.
추가로, 실시예 1에 설명된 프로토콜에 따라, 서열번호 97의 서열을 가지는 탐침의 도움을 통한 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(참조번호 7759-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 97의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 뇌에서 2 kb 및 7.5 kb;
- 췌장, 신장, 골격근, 간 및 심장에서 2 kb이다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 35의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 35의 핵산 서열의 개방 판독 프레임은 서열번호 151의 서열을 구성하는 123개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트), PRODOM: (Swissprot에서 검출되는 상동성 도메인, 버전 34.2, 1997년 11월), Genpept: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트), Swissprot(버전 36, 1999년 5월 3일 최신 업데이트), TrEMBL(SP-TrEMBL, 버전 7, 1998년 11월), PIR: (비반복성 PIR 서열, 버전 57) 및 PDB: (단백질 데이터벵크, 1999년 2월)중에서 참조로 동정된 서열로는 발견되지 않았다.
서열번호 151의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS946300 유전자
핵산
여기에서 No. GS946300으로 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다.
이 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 36의 서열을 구성한다.
서열번호 36의 서열은 1575개 뉴클레오타이드 길이이다.
이 서열은 서열번호 36 서열의 3 위치의 뉴클레오타이드에서 176 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 36 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS946300 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환 및 신장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 36의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 36의 핵산 서열의 개방 판독 프레임은 서열번호 152의 서열을 구성하는 58개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 및 PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월)에서 참조로 동정된 서열로는 관찰되지 않았다.
서열번호 152의 서열을 가지는 폴리펩타이드는 콜레스테롤 유동 조절, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증에 관여할 수 있다.
따라서 서열번호 152의 서열을 가지는 폴리펩타이드는 HDL에 의한 콜레스테롤의 역수송과 관련있는 중요한 단계에 관여할 수 있다.
GS937345 유전자
핵산
여기에서 No. GS937345로 명명되는 유전자의 긴 전사체 및 짧은 전사체에 각각 상응하는 두 메신저 RNA가 본 발명에 따라 분리되었다.
긴 전사체에 상응하는 cDNA의 제 1 핵산 서열이 분리되고 서열번호 37의 서열을 구성한다.
서열번호 37의 서열은 1607개 뉴클레오타이드 길이이다.
이 서열은 서열번호 37 서열의 2 위치의 뉴클레오타이드에서 109 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 37의 서열로부터, 각각 서열번호 104 및 105의 서열을 가지는 두프라이머가 합성되어 Clontech사에 의해 시판되고 있는 상이한 인간 조직의 polyA+ mRNA 라이브러리로부터의 cDNA를 증폭시킬 수 있다.
서열번호 104 및 105의 서열을 가지는 프라이머의 도움을 통해 증폭된 cDNA 서열은 서열번호 38의 서열을 구성한다. 서열번호 38의 서열은 1161개 뉴클레오타이드 길이이다.
서열번호 38의 서열과 GenBank 데이터베이스(버전 116)중에서 참조로 동정된 서열간의 상동성이 발견되었다. 상동성은 하기와 같다:
ㆍ서열 gi|6841231|gb|AF161409.1|AF161409[6841231] 호모 사피엔스 HSPC291 mRNA의 [8-1102] 위치와 매치되는 1096개 염기쌍([1-1093] 위치)에 걸쳐서 99% 상동성, 부분적인 cds. 길이 = 1102; 비공개;
ㆍ서열 gi|6841235|gb|AF161411.1|AF161411[6841235] 호모 사피엔스 HSPC293 mRNA의 [8-1030] 위치와 매치되는 1025개 염기쌍([119-1148] 위치)에 걸쳐서 99% 상동성, 부분적인 cds. 길이 = 1045; 비공개;
ㆍ서열 gi|7020861|dbj|AK000637.1|AK000637[7020861] 호모 사피엔스 cDNA FLJ20630 fis, 클론 KAT03874의 [43-1202] 위치와 매치되는 1161개 염기쌍([1-1161] 위치)에 걸쳐서 99% 상동성. 길이 = 1538; 2000년 2월 22일 제출, NEDO 프로젝트; 비공개
ㆍ서열 gb|AC021286.2|AC021286[6899766] 호모 사피엔스 클론 RP11-21H22과 1003개 염기쌍([1-1043] 위치)에 걸쳐서 92% 및 38개 염기쌍([1048-1085] 위치)에 걸쳐서 94% 상동성, 워킹 드래프트 서열, 19개 비정렬 피스. 길이 = 175143;
짧은 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 39의 서열을 구성한다.
서열번호 39의 서열은 1332개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110)중에서 조사 중에 각각 긴 전사체 및 짧은 전사체의 서열에 대한 서열 동일성은 관찰되지 않았다. 이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 37의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 37의 핵산 서열을 가지는 긴 전사체의 부분 개방 판독 프레임은 서열번호 153의 서열을 구성하는 36개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
뉴클레오타이드 서열 수준에서 관찰된 상동성:
Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 서열: sp|P23596|PRTD_ERWCH 프로테아제 분비 ATP-결합 단백질 PRTD와 22개 아미노산(6 부터 29 아미노산 위치)에 걸쳐서 41% 상동성.
이 유전자는 염색체 위치 때문에 탠지어병/FHD의 연구를 위한 후보이다.
GS99556 유전자
핵산
여기에서 No. GS99556이라고 명명되는 유전자의 긴 전사체 및 짧은 전사체에각각 상응하는 두 메신저 RNA가 본 발명에 따라 분리되었다.
긴 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 40의 서열을 구성한다.
서열번호 40의 서열은 10419개 뉴클레오타이드 길이이다.
이 서열은 서열번호 40의 2 위치의 뉴클레오타이드에서 1954 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
개시 코돈(ATG)은 서열번호 40의 서열을 가지는 긴 전사체의 29 위치의 뉴클레오타이드에서 시작된다.
짧은 전사체에 상응하는 cDNA의 핵산 서열은 서열번호 41의 서열을 구성한다.
서열번호 41의 서열은 1813개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 40 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS99556 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반 및 태아 간에서 발현됨을 보여줄 수 있다.
추가로, 실시예 1에 설명된 프로토콜에 따라 각각 서열번호 98 및 99의 서열을 가지는 탐침의 도움을 통한 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(참조번호 7759-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 98의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 뇌에서 2.6 kb, 4.2 kb, 5 kb 및 10 kb;
- 간, 폐, 태반 및 심장에서 2.6 kb 및 5 kb;
- 신장에서 2.6 kb 및 5 kb;
- 골격근에서 2.6 kb;
- 췌장에서 5 kb이다.
서열번호 99의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각:
- 간에서 2.2 kb;
- 심장에서 2.4 kb 및 4.4 kb;
- 뇌, 태반, 신장, 췌장 및 폐에서 9 kb이다.
서열번호 100의 서열을 가지는 탐침으로 검출된 전사체의 크기는 각각 :
- 태반 및 심장에서 5 kb 및 7 kb;
- 뇌, 신장 및 췌장에서 5 kb이다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 겹핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 40의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 40의 핵산 서열을 가지는 부분 개방 판독 프레임은 서열번호 154의 서열을 구성하는 651개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 서열의 수준에서 관찰된 상동성:
이 ORF는 Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신업데이트) 및 TrEMBL 서열(SP-TrEMBL, 버전 7, 1998년 11월)과 상동성을 가진다(하기 서열의 BlastX 해독):
ㆍGenpept: (GenBank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|4529890|NG22 [호모 사피엔스]와 403개 아미노산에 걸쳐서 32% 상동성
ㆍGenpept: (GenBank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|3986770|NG22 [Mus 근육]와 693개 아미노산에 걸쳐서 25% 상동성
ㆍGenpept: (GenBank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): 씨. 엘레간스의 cDNA CEESB82F에 상응하는 gi|1072187|과 683개 아미노산에 걸쳐서 24% 상동성
ㆍTrEMBL(SP-TrEMBL, 버전 7, 1998년 11월) 씨. 엘레간스의 cDNA CEESB82F에 의해 암호화된 sp|Q20026|과 683개 아미노산에 걸쳐서 24% 상동성
추정상의 기능:
이 유전자는 염색체 위치 때문에 탠지어병/FHD의 연구를 위한 후보이다.
서열번호 154의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더욱 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS96663 유전자
핵산
여기에서 No. GS96663으로 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 6종의 대표 핵산 서열이 결정되었다:
이 전사체에 상응하는 cDNA의 제 1 부분 핵산 서열은 서열번호 42의 서열을 구성한다.
서열번호 42의 서열은 1377개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 2 부분 핵산 서열은 서열번호 43의 서열을 구성한다.
서열번호 43의 서열은 452개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 3 부분 핵산 서열은 서열번호 44의 서열을 구성한다.
서열번호 44의 서열은 562개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 4 부분 핵산 서열은 서열번호 45의 서열을 구성한다.
서열번호 45의 서열은 1766개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 42의 서열로부터, 두 뉴클레오타이드 프라이머(프라이머는 각각 서열번호 106 및 107의 서열을 가짐)가 합성되었다.
서열번호 43의 서열로부터, 서열번호 108의 서열을 가지는 뉴클레오타이드 프라이머가 합성되었다.
서열번호 45의 서열로부터, 각각 서열번호 109 및 110의 서열을 가지는 두 뉴클레오타이드 프라이머가 합성되었다.
이러한 프라이머는 GS96663 유전자의 전사체의 대표인 제 5 및 제 6 뉴클레오타이드 서열을 증폭시킬 수 있다.
GS96663 유전자의 전사체에 상응하는 제 5 핵산 서열은 서열번호 46의 서열을 구성한다. 서열번호 46의 핵산 서열은 601개 뉴클레오타이드 길이이다.
GS96663 유전자의 전사체에 상응하는 제 6 핵산 서열은 서열번호 47의 서열을 구성한다. 서열번호 47의 서열은 3706개 뉴클레오타이드의 길이이다. 이는 서열번호 47 서열의 1 위치의 뉴클레오타이드에서 3202 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임을 포함한다.
서열번호 47의 서열과 GenBank 데이터베이스(버전 116)중에서 참조로 동정된 서열간의 상동성이 관찰되었다. 이러한 상동성은 하기와 같다:
ㆍ서열 gi|5102585|emb|AL079279.1|HST000009[5102585] 호모 사피엔스 mRNA 전체 길이 삽입 cDNA 클론 EUROIMAGE 248114의 [1-2419] 위치와 매치되는 2423개 염기쌍([1030-3451] 위치)에 걸쳐서 99% 상동성. 길이 = 2450; /염색체 = "9"/map = "D9S176-D9S279"; 1999년 6월 14일 제출; 비공개;
ㆍUS 특허 5691147로부터의 서열 1인 g3012351(I76197)의 [16-1638] 위치에 매치되는 1623개 염기쌍([1946-3559] 위치)에 걸쳐서 98% 상동성. 길이 = 1638개 염기쌍; 1998년 4월 3일 제출; AUTHORS: Draetta, G. and Gyuris, J. TITLE: CDK4 결합 분석 JOURNAL: 특허: US 5691147-A 1 1997년 11월 25일;
ㆍ서열 gi|7228016|emb|AL158158.3|AL158158[7228016]; 호모 사피엔스 9번 염색체 클론 RP11-427L11 map q31.2-32와 2372개 염기쌍([1-2372] 위치)에 걸쳐서 99% 내지 100% 및 1160개 염기쌍([2547-3706] 위치)에 걸쳐서 97% 내지 100% 상동성을 가지는 각종 단편, *** 서열분석 진행 중 ***, 37개 비정렬 피스, 2000년 3월 8일 제출.
서열번호 42 내지 47 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS96663 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환, 신장 및 골격근에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증의 원인 위치적 후보를 구성한다.
서열번호 47의 서열을 가지는 핵산에 의해 암호화되는 폴리펩타이드
서열번호 47의 제 1 핵산 서열의 부분 개방 판독 프레임은 서열번호 155의 서열을 구성하는 1066개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
서열번호 155의 서열과 데이터베이스에 수록된 서열간의 상동성. 이러한 상동성은 하기와 같다:
ㆍ"보체 수용체" CR1(g30186; g809019; g451303; g306680) 및 CR2(g18192; g181940; g599776)를 포함하는 유형의 서열과 1068개 아미노산에 걸쳐서 27% 상동성
ㆍ서열 "상보성 인자 H"; 서열 gi|31965|emb|CAA68704.1|[31965](Y00716) 인자 H[호모 사피엔스], PIR:NBHUH 및 PIR:NBMSH; EM:Q14006 및 EM:Q61408과 약 1000개 아미노산에 걸쳐서 24% 상동성
ㆍP-셀렉틴 및 E-셀렉틴 서열: 서열 sp|p16581|lem2_인간 e-셀렉틴 전구체(내피 백혈구 유착 분자 1)(elam-1)(백혈구-내피세포 유착 분자 2)(lecam2)(cd62e) 및 sp|p16109|lem3_인간 p-셀렉틴 전구체(과립구 막 단백질 140)(gmp-140)(padgem)(cd62p)(백혈구-내피세포 유착 분자 3)(lecam3) 및 비-여분 pir: pir|s|a30359 p-셀렉틴 전구체-인간과 900개 아미노산에 걸쳐서 25% 상동성
ㆍ서열 g183391(M25322) 과립구 막 단백질-140(GMP-140) 전구체 [호모 사피엔스]와 637개 아미노산에 걸쳐서 24% 상동성, 길이 = 830
ㆍ"세포 유착 분자" trEMBL: sp|Q28290|Q28290 세포 유착 분자 전구체(단편)와 상동성
ㆍ서열 "아포지방단백질 H 전구체 - 인간 PIR: NHBU 길이 = 345에 걸쳐서 25% 내지 29% 상동한 각종 단편; 256개 아미노산에 걸쳐서 29% 상동한 아포지방단백질 H 전구체-인간
ㆍ서열 "막 보조인자 단백질 보조인자" (PIR:S01896, PIR:I54479, PIR:A57278 및 EM:P79138, EM:Q9Z0M4, EM:O19121) 및 EM:O62837: 막 보조인자 단백질 CD46과 상동성
ㆍ서열 PIR:T16833 가정상의 단백질 T07H6.5 - genpept에서 발견되는 Caenorhabditis elegans(g1255889(U53344))과 25% 내지 27% 각종 다양한 단편(400개 내지 500개 아미노산).
추정상의 기능:
인간 P-셀렉틴 및 E-셀렉틴의 전구체와의 아미노산 상동성에 의한, GS96663유전자의 산물은 이 부류의 막 단백질과 관련있다. 막 단백질에 의해 매개되는 세포내 콜레스테롤 분비에서 이의 역할은 특히 유전자가 위치상의 클로닝에 의해 한정되는 유전자 간격으로 위치할 때 배제되지 않는다.
서열번호 155의 서열을 가지는 폴리펩타이드는 콜레스테를의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS941675 유전자
핵산
여기에서 No. GS941675로 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 두 핵산 서열은 이 전사체의 대표이다:
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 48의 서열을 구성한다.
서열번호 48의 서열은 373개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 49의 서열을 구성한다.
서열번호 49의 서열은 459개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110)중에서 서열 동일성은 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 50의 서열을 구성한다.
서열번호 50의 서열은 2575개 뉴클레오타이드의 길이이다.
서열번호 50의 서열과 GenBank 데이터베이스(버전 116)중에서 참조로 동정된 서열간의 상동성이 관찰되었다. 이러한 상동성은 하기와 같다:
- BAC END g6348761 AQ892571 HS_3143_A1_G01_T7C CIT 승인된 인간 게놈 정자 라이브러리(길이 848개 염기쌍)와 720개 염기쌍에 걸쳐서 98% 상동성
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
GS929341 유전자
핵산
여기에서 No. GS929341이라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 두 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 51의 서열을 구성한다.
서열번호 51의 서열은 231개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 52의 서열을 구성한다.
서열번호 52의 서열은 344개 뉴클레오타이드의 길이이다.
이 서열은 서열번호 52 서열의 3 위치의 뉴클레오타이드에서 131 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 51 및 52와의 동일성이 GenBank 데이터베이스(버전 110)중에서는 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 53의 서열을 구성한다.
서열번호 53의 서열은 402개 뉴클레오타이드의 길이이다. 이 서열은 서열번호 53 서열의 1 위치의 뉴클레오타이드에서 188 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
서열번호 51 내지 53 서열과의 동일성은 GenBank 데이터베이스(버전 116)중에서는 조사 중에 관찰되지 않았다.
서열번호 51 및 52 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS929341 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환, 신장, 골격근 및 폐에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 52의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 52 핵산 서열의 개방 판독 프레임은 서열번호 156의 서열을 구성하는 43개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 36, 1999년 5월 3일 최신 업데이트) 및 PRODOM: (Swissprot에서 검출된 상동성 도메인, 버전 34.2, 1997년 11월)중에서 참조로 동정된 서열로는 발견되지 않았다.
서열번호 53의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 53의 핵산 서열의 개방 판독 프레임은 서열번호 157의 서열을 구성하는 61개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
BLAST와의 상당한 상동성이 데이터베이스 Swissprot(버전 38), PIR(버전 62, 1999년 9월), trEMBL(1999년 8월 버전) 및 GemPept(버전 115)중에서 참조로 동정된 서열로는 발견되지 않았다.
서열번호 156 및 157의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS915742 유전자
핵산
여기에서 No. GS915742라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 3 가지 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 54의 서열을 구성한다.
서열번호 54의 서열은 228개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 55의 서열을 구성한다.
서열번호 55의 서열은 270개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 56의 서열을 구성한다.
서열번호 56의 서열은 1130개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110 및 116)중에서 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 54 및 55 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS915742 유전자가 태아 뇌, 간, 태반 및 신장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
GS913018 유전자
핵산
여기에서 No. GS913018이라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 두 가지 서열 대표가 하기에 나타나 있다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 57의 서열을 구성한다.
서열번호 57의 서열은 463개 뉴클레오타이드 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 58의 서열을 구성한다.
서열번호 58의 서열은 289개 뉴클레오타이드의 길이이다.
서열번호 57 및 58과의 서열 동일성이 GenBank 데이터베이스(버전 110)중에서는 조사 중에 발견되지 않았다.
서열번호 57의 서열로부터, 각각 서열번호 111 및 112의 서열을 가지는 두 뉴클레오타이드 프라이머가 합성되었다.
서열번호 58의 서열로부터, 각각 서열번호 113 및 114의 서열을 가지는 두 가지 뉴클레오타이드 프라이머가 합성되었다.
서열번호 111 내지 114의 서열을 가지는 프라이머는 Clontech사에 의해 시판되고 있는 상이한 인간 조직의 polyA+ mRNA 라이브러리를 사용하여, cDNA(GS913018 유전자의 전사체에 상응하는 cDNA의 제 3 핵산 서열)를 증폭시킬 수 있다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 59의 서열을 구성한다.
서열번호 59의 서열은 1542개 뉴클레오타이드의 길이이다.
서열번호 59의 서열에서의 상동성, 특히 서열번호 59 서열의 [735-1268][1-357][559-710] 및 [373-501] 위치에 걸쳐 서열 g6563616(AC013740) 호모 사피엔스 클론 RP11-115J22과의 각종 일치 단편이 발견되었다(워킹 드래프트 서열, 15개 비정렬 피스, 길이 = 180711, GenBank(버전 116)에 일람).
서열번호 57 및 58 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS913018 유전자가 태아 뇌, 간, 뇌, 심장, 전립선, 태반, 태아 간, 자궁, 고환 및 신장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
GS911742 유전자
핵산
여기에서 No. GS911742라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 3 가지 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 60의 서열을 구성한다.
서열번호 60의 서열은 1417개 뉴클레오타이드의 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 61의 서열을 구성한다.
서열번호 61의 서열은 696개 뉴클레오타이드의 길이이다.
서열번호 60 및 61 서열과의 서열 동일성이 GenBank 데이터베이스(버전 110)중에서는 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 62의 서열을 구성한다.
서열번호 62의 서열은 2702개 뉴클레오타이드의 길이이다. 이 서열은 서열번호 62 서열의 1 위치의 뉴클레오타이드에서 792 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다. 잠재적인 암호화 서열은 서열번호 62 서열의 49 위치의 뉴클레오타이드에서 시작되고 792 위치의 뉴클레오타이드에서 끝난다. 해독 개시 코돈은 서열번호 62 서열의 49 위치의 뉴클레오타이드에서 시작된다. 이 서열은 서열번호 62 서열의 41 위치의 뉴클레오타이드에서 시작되는 서열 "GC CGC GCC ATG C"을 가지는 Kozak 모티프를 포함한다.
서열번호 62 서열의 GenBank 데이터베이스(버전 116)에 일람된 서열과의 상동성이 관찰되었다. 이러한 상동성은 하기와 같다:
ㆍ서열 gi|5912095|emb|AL117557.1|HSM801083[5912095] 호모 사피엔스 mRNA; (클론 DKFZp564D177로부터의) cDNA DKFZp564D177과 1410개 염기쌍([4-1413] 위치)에 걸쳐서 98% 상동성; 부분적인 cds. 길이 = 1431; 2000년 2월 18일 제출; 1999년 9월 15일 제출된 MIPS, Am Klopferspitz 18a, D-82152 Martinsried, GERMANY, Bloecker, H., Boecher, M., Brandt, P., Wiemann, S.
ㆍ서열 gi|6841247|gb|AF161417.1|AF161417[6841247] 호모 사피엔스 HSPC299 mRNA와 10139개 염기쌍[1-1039]에 걸쳐서 97% 및 380개 염기쌍[1082-1458]에 걸쳐서 97% 및 51개 염기쌍[1506-1556]에 걸쳐서 90% 상동성, 부분적인 cds. 길이 = 1659; 2000년 2월 1일 제출; 직접 제출; 1999년 5월 14일에 ShanghaiInstitute of Hematology, Shanghai Second Medical University, Rui-Jin Hospital, 197 Rui-Jin Road II 제출,
ㆍ서열 g5912095(AL117557) 호모 사피엔스 mRNA; (클론 DKFZp564D177로부터의) cDNA DKFZp564D177와 1410개 염기쌍[4-1413]에 걸쳐서 98% 상동성; 부분적인 cds. 길이 = 1431; 2000년 2월 18일 제출; 직접 제출; 1999년 9월 15일 제출된 MIPS, Am Klopferspitz 18a, D-82152; Martinsried, GERMANY, Bloecker, H., Boecher, M., Brandt, P., Mewes, H. W., Gassenhuber, J. and Wiemann, S.
ㆍ서열 gi|7023832|dbj|AK002137.1|AK002137[7023832] 호모 사피엔스 cDNA FLJ11275 fis, 클론 PLACE1009375와 911개 염기쌍([1-911] 위치)에 걸쳐서 93% 및 179개 염기쌍([1395-1573] 위치)에 걸쳐서 93% 및 131개 염기쌍([992-1122] 위치)에 걸쳐서 81% 상동성. 길이 = 1564; 2000년 2월 22일 제출; NEDO 인간 cDNA 서열분석 프로젝트; 비공개
ㆍ서열 g5932616(AC009594) 호모 사피엔스 염색체 4 클론 363_G_01 map 4와 상동성(90% 내지 100%)를 가지는 각종 단편, ***서열분석 진행 중***, 9개 비정렬 피스. 길이 = 150108;
서열번호 60 및 61 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS911742 유전자가 태아 뇌, 간, 심장 및 태반에서 발현됨을 보여줄 수 있다.
추가로, 실시예 1에 설명된 프로토콜에 따라, 각각 서열번호 101의 서열을가지는 탐침의 도움을 통한 노던 블롯팅에 의한 전사체의 발현 분석은 Clontech사(참조번호 7759-1)에 의해 시판되고 있는 블롯에 전사체의 존재를 나타낸다.
서열번호 101의 서열을 가지는 탐침으로 검출된 전사체의 크기는 췌장, 신장, 골격근, 폐 및 태반에서 1.9 kb이다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증의 원인 위치적 후보를 구성한다.
서열번호 62의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 62의 핵산 서열의 부분 개방 판독 프레임은 서열번호 158의 서열을 구성하는 263개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
6가지 상으로 해독된 단백질 서열의 수준에서 관찰된 상동성:
ㆍ서열 g5912096(AL117557) 가정상의 단백질 [호모 사피엔스]와 262개 아미노산([4-789] 위치)에 걸쳐서 99% 상동성, 길이 = 263; 주 = "NIPSNAP1와의 유사성"; 2000년 2월 18일 제출; 직접 기탁; 1999년 9월 15일 제출된 MIPS, Am Klopferspitz 18a, D-82152, Martinsried, GERMANY, Bloecker, H., Boecher, M., Brandt, P., Mewes, H. W., Gassenhuber, J. and Wiemann, S,
ㆍ서열 NISNAP2 및 NISNAP2와 상동성:
서열 g2769254(AJ001259) NIPSNAP2 단백질 [호모 사피엔스]와 179개 아미노산에 걸쳐서 27% 상동성(길이 = 285) 및 서열 g2769649(AJ001258) NIPSNAP1 단백질 [호모 사피엔스]와 211개 아미노산에 걸쳐서 24% 상동성(길이 = 284)
ㆍ서열 g3403167(AF029786) GBAS [호모 사피엔스]와 179개 아미노산에 걸쳐서 27% 상동성(길이 = 286). GBAS: 구아닌 뉴클레오타이드-결합 단백질, 알파-서브유닛 (아데닐화 사이클라제-자극 G 알파 단백질).
이 단백질은 포스포릴화 부위 및 막횡단 영역으로 설명된다.
"구아닌 뉴클레오타이드-결합 단백질"은 다양한 막횡단 시그널링 시스템에서 조절제 또는 변환기의 역할을 한다.
단백질 SNAP25 및 4-니트로페닐포스파타제와 유사한 단백질 YMQ1_CAEEL(Prodom 데이터베이스, 버전 ?)과 21% 일치.
서열번호 158의 서열을 가지는 폴리펩타이드는 단백질 키나제 및 카세인 키나제 유형 II를 위한 글리코실화 부위, cAMP- 및 cGMP-의존성 포스포릴화 부위와 같은 포스포릴화 부위를 포함한다.
추정상의 기능:
따라서 서열번호 158 서열의 폴리펩타이드는 PRODOM의 PD013981 도메인: (Swissprot에서 검출되는 상동성 도메인, 버전 34.2, 1997년 11월)에서 발견되는 모티프에 의해, 세포내 소포 수송에 관여한다고 추정상의 단백질과 관련있다. 이러한 단백질에 의해 매개되는 특정 어드레싱에 의해 보강된 이러한 메커니즘은 세포내 콜레스테롤 풀의 수용체 HDL 입자로의 수송 및 전좌 메커니즘의 결손으로 설명되는 탠지어병/FHD 측면에서 관심사다. 따라서 서열번호 158의 서열을 가지는 폴리펩타이드는 HDL에 의한 콜레스테롤의 역수송에 포함되는 중요한 단계에 관여할 수 있다.
서열번호 158의 서열을 가지는 폴리펩타이드는 콜레스테를의 유동 조절, 더자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
GS98601 유전자
핵산
여기에서 No. GS98601이라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 3 가지 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 63의 서열을 구성한다.
서열번호 63의 서열은 355개 뉴클레오타이드 길이이다.
GenBank 데이터베이스(버전 110)중에서는 서열 동일성이 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 64의 서열을 구성한다.
서열번호 64의 서열은 447개 뉴클레오타이드 길이이다.
GenBank 데이터베이스(버전 110)중에서는 서열 동일성이 조사 중에 발견되지 않았다.
이 전사체에 상응하는 cDNA의 제 3 핵산 서열은 서열번호 65의 서열을 구성한다.
서열번호 65의 서열은 2324개 뉴클레오타이드 길이이다.
이 서열은 서열번호 65 서열의 3 위치의 뉴클레오타이드에서 611 위치의 뉴클레오타이드에 이르는 부분 개방 판독 프레임(ORF)을 포함한다.
뉴클레오타이드 서열 수준에서 관찰된 상동성: (307)
ㆍGenBank 서열: 서열이 완전한 cDNA(호모 사피엔스)의 클론 ZB95F02에 상응하는 gi|3483520|과 514개 염기쌍(1508-2021 염기쌍 위치)에 걸쳐서 99% 상동성.
ㆍGenBank 서열: gi|1184671|(뉴캐슬병 바이러스의 유도가능한 단백질을 암호화하는, mRNA의 부분적인 3'UTR 영역)과 170개 염기쌍(862-1031 염기쌍 위치)에 걸쳐서 98% 상동성
서열번호 45 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS98601 유전자가 뇌, 태반 및 자궁에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 65의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 65의 제 3 핵산 서열의 개방 판독 프레임은 서열번호 159의 서열을 구성하는 203개 아미노산 길이의 폴리펩타이드를 잠재적으로 암호화한다.
단백질 서열의 수준에서 관찰된 상동성(307):
Genpept 서열: (Genbank v110 및 111의 해독, 1999년 5월 7일 최신 업데이트): gi|3878571|gnl|PID|e1348103(Z46381) - 효모 단백질 Ysy6과 약간 유사 -(PIR: (비반복성 PIR 서열, 버전 57) 기탁번호 JQ0912)(cDNA EMBL의 EST:D32318이 이 유전자로부터 수득되고; cDNA EMBL의 EST:D33688이 이 유전자로부터 수득되며; cDNA EMBL의 EST:D34664가 이 유전자로부터 수득되며; cDNA EMBL의 EST:D36574가 이 유전자로부터 수득됨) 및 SP-TrEMBL 서열(SP-TrEMBL, 버전 7, 1998년 11월): 씨. 엘레간스 M01F1.4 단백질에 상응하는 sp|Q21453|과 180개 아미노산(3-182 아미노산 위치)에 걸쳐서 34% 상동성.
서열번호 159의 서열을 가지는 폴리펩타이드는 콜레스테롤의 유동 조절, 더 자세히 설명하면 탠지어병, 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환에 관여할 수 있다.
추정상의 기능:
이 유전자는 염색체 위치에 의해, 탠지어병/FHD 병리학을 위한 후보이다.
GS94852 유전자
핵산
여기에서 No. GS94852라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 3 가지 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 66의 서열을 구성한다.
서열번호 66의 서열은 447개 뉴클레오타이드 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 67의 서열을 구성한다.
서열번호 67의 서열은 564개 뉴클레오타이드 길이이다.
서열번호 66의 서열로부터, 각각 서열번호 115 및 116의 서열을 가지는 두 가지 뉴클레오타이드 프라이머가 합성되었다.
서열번호 67의 서열로부터, 각각 서열번호 117 및 118의 서열을 가지는 두 가지 뉴클레오타이드 프라이머가 합성되었다.
서열번호 115 내지 118의 서열을 가지는 프라이머는 Clontech사에 의해 시판되고 있는 상이한 인간 조직의 polyA+ mRNA 라이브러리를 사용하여 cDNA(GS94852 유전자의 전사체에 상응하는 cDNA의 제 3 핵산 서열)를 증폭시킬 수 있다.
GS94852의 전사체에 상응하는 제 3 핵산 서열은 서열번호 68의 서열을 구성한다.
서열번호 68의 서열은 604개 뉴클레오타이드의 길이이다.
GenBank 데이터베이스(버전 110 및 116)중에서 서열번호 66 내지 68과의 서열 동일성은 조사 중에 발견되지 않았다.
서열번호 67 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS94852 유전자가 간 및 심장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
S935135 유전자
핵산
여기에서 No. GS935135라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 3 가지 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 69의 서열을 구성한다.
서열번호 69의 서열은 482개 뉴클레오타이드 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 70의 서열을 구성한다.
서열번호 70의 서열은 402개 뉴클레오타이드 길이이다.
GenBank 데이터베이스(버전 110)중에서는 서열번호 69 및 70과의 서열 동일성이 조사 중에 발견되지 않았다.
서열번호 119의 서열을 가지는 제 1 뉴클레오타이드 프라이머가 서열번호 69의 서열로부터 합성되었고 서열번호 120의 서열을 가지는 제 2 뉴클레오타이드 프라이머가 서열번호 70의 서열로부터 합성되었다. 이러한 프라이머는 서열번호 71의 서열을 구성하는 GS935135 유전자의 전사체의 제 3 핵산 서열 대표를 증폭시킬 수 있다.
서열번호 71의 핵산 서열은 758개 뉴클레오타이드 길이이다.
GenBank 데이터베이스(버전 116)에 일람된 서열과의 상동성이 밝혀졌다. 이러한 상동성은 하기와 같다:
ㆍ말레이트 데하이드로게나제 위유전자 및 STS를 함유하는 염색체 X 상의 PAC 49C23으로부터의 서열 g2168141(gi|2168141|emb|Z93019.1|HS49C23[2168141) 인간 DNA 서열과 3 단편(156+197+93 염기쌍)에 걸쳐서 80 내지 85% 상동성. 길이 = 153078
ㆍ서열 g2828782(gi|2828782|gb|AC002319.1|AC002319[2828782] 호모 사피엔스 9번 염색체 q34, 클론 70C11, 완전한 서열과 4 단편(144+86+197+137 염기쌍)에 걸쳐서 81% 내지 90% 상동성. 길이 = 46305
서열번호 69 또는 70 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS935135 유전자가 태아 뇌, 간, 뇌, 전립선, 태반, 태아 간, 자궁, 고환 및 신장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
GS914669 유전자
핵산
여기에서 No. GS914669라고 명명되는 유전자의 전사체에 상응하는 메신저 RNA가 본 발명에 따라 분리되었다. 이 전사체의 세 가지 핵산 서열 대표가 결정되었다.
이 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 72의 서열을 구성한다.
서열번호 72의 서열은 673개 뉴클레오타이드 길이이다.
이 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 73의 서열을 구성한다.
서열번호 73의 서열은 554개 뉴클레오타이드 길이이다.
서열번호 72 및 73의 서열과의 서열 동일성이 GenBank 데이터베이스(버전 110)중에서는 조사 중에 발견되지 않았다.
서열번호 72의 서열로부터, 각각 서열번호 121 및 122의 서열을 가지는 두 뉴클레오타이드 프라이머가 합성되었다.
서열번호 73의 서열로부터, 각각 서열번호 123 및 124의 서열을 가지는 두 뉴클레오타이드 프라이머가 합성되었다.
서열번호 121 내지 124의 서열을 가지는 프라이머는 Clontech사에 의해 시판되고 있는 상이한 인간 조직의 polyA+ mRNA 라이브러리를 사용하여 cDNA(GS914669 유전자의 전사체에 상응하는 cDNA의 제 3 핵산 서열)를 증폭시킬 수 있다. 이 서열은 서열번호 74의 서열을 구성한다. 서열번호 74의 서열은 1794개 뉴클레오타이드 길이이다. 이는 서열번호 74의 서열 및 동일한 방식으로 위치하는 암호화 서열의 1 위치의 뉴클레오타이드에서 258 위치의 뉴클레오타이드에 이르는 개방 판독 프레임을 포함한다. 이 서열은 서열번호 74 서열의 1751 위치의 뉴클레오타이드에서 시작되는 폴리아데닐화 부위를 포함한다.
서열번호 74의 서열과의 상동성이 GenBank 데이터베이스(버전 116)에 일람된 서열에서 발견된다. 이러한 상동성은 하기와 같다:
g6807977 AL137422 호모 사피엔스 mRNA; (클론 DKFZp761A1623으로부터의) cDNA DKFZp761A1623과 1000개 염기쌍(792 내지 1793 염기쌍)에 걸쳐서 99% 일치; 부분적인 cds 길이 = 1000
AL137023 g6982086 호모 사피엔스 9번 염색체 클론 RP11-403A22 map q34.13-34.3을 서열분석하는 중에 BAC와 일치, ***서열분석 진행 중***, 19개 비정렬 피스. 길이 = 184814
서열번호 72 또는 73 서열의 전사체의 발현 분석이 실시예 1에 설명된 것처럼, RT PCR에 의해 수행된다. 상이한 조직의 polyA+ RNA를 사용하여 수행되는 이러한 분석은 GS914669 유전자가 태아 뇌 및 심장에서 발현됨을 보여줄 수 있다.
이 유전자는 콜레스테롤 역류에서의 기능장애로 인한 질환, 더 자세히 설명하면 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 유전자좌와 유전적으로 연관된 질환의 원인 위치적 후보를 구성한다.
서열번호 74의 서열을 가지는 핵산에 의해 암호화된 폴리펩타이드
서열번호 74의 핵산 서열의 개방 판독 프레임은 85개 아미노산의 길이인 서열번호 160의 서열을 가지는 폴리펩타이드를 잠재적으로 암호화한다.
데이터 베이스 Genpept(버전 115), Swissprot(버전 38), trEMBL(1999년 8월버전) 및 PIR(1999년 9월의 버전 62)에 수록된 서열로는 어떠한 서열 상동성도 발견되지 않았다.
GS913839 유전자
핵산
본원에서 No. GS913839로 명명한 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리한다. 이러한 전사체의 대표적인 3종의 핵산 서열을 결정한다.
이러한 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 75의 서열을 구성한다.
서열번호 75의 서열은 507 뉴클레오타이드의 길이를 갖는다.
이러한 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 76의 서열을 구성한다.
서열번호 76의 서열은 415 뉴클레오타이드의 길이를 갖는다.
서열번호 75 및 76의 서열과의 어떠한 서열 동일성도 GenBank 데이터 베이스(버전 110)에서의 조사 동안 발견되지 않았다.
서열번호 75의 서열로부터, 서열번호 125의 서열을 갖는 뉴클레오타이드 프라이머를 합성한다.
서열번호 76의 서열로부터, 서열번호 1126의 서열을 갖는 뉴클레오타이드 프라이머를 합성한다.
서열번호 125 및 126의 서열을 갖는 프라이머는 GS94852 유전자의 전사체에 상응하는 cDNA의 제 3 핵산 서열인 Clontech사가 판매하는 상이한 인간 조직의 폴리A+ mRNA 라이브러리를 사용하여 cDNA를 증폭시킬 수 있게 한다. 이러한 서열은 서열번호 77의 서열을 구성한다.
서열번호 77의 서열은 1318 뉴클레오타이드의 길이를 갖는다.
서열번호 77의 서열에 대한 상동성이 GenBank 데이터 베이스(버전 116)에 수록된 서열로 관찰되었다. 이러한 상동성은 다음과 같다:
- 서열 g6006243(AC011096) 호모 사피엔스 클론 2-D-21, *** 서열분석 진행 중 ***, 15 비-정렬 피스와 1320 bp(위치 [1-1318])에 걸쳐서 99% 상동성. 길이 = 135130;
- 서열 g7263520(AL161631 호모 사피엔스 9번 염색체 클론 RP11-70K10, *** 서열분석 진행 중 ***, 45 비-정렬 피스와 1320 bp(위치 [1-1318])에 걸쳐서 99% 상동성. 길이 = 100562;
서열번호 75 또는 76 서열의 전사체의 발현 분석을 실시예 1에서 기술한 바와 같이 RT PCR에 의해 수행한다. 상이한 조직의 폴리A+ RNA를 사용하여 수행된 이러한 분석은 GS913839 유전자가 태아의 뇌 및 간에서 발현되었음을 보여줄 수 있게 한다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애에 기인한 질환, 특히 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관되는 질환에 대한 원인 위치적 후보를 구성한다.
GS912639 유전자
핵산
본원에서 No. GS912639로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리한다. 이러한 전사체의 대표적인 3종의 핵산 서열을 결정하였다.
이러한 전사체에 상응하는 cDNA의 제 1 핵산 서열은 서열번호 78의 서열을 구성한다.
서열번호 78의 서열은 530 뉴클레오타이드의 길이를 갖는다.
이러한 전사체에 상응하는 cDNA의 제 2 핵산 서열은 서열번호 79의 서열을 구성한다.
서열번호 79의 서열은 495 뉴클레오타이드의 길이를 갖는다.
서열번호 78 및 79의 서열과의 어떠한 서열 동일성도 GenBank 데이터 베이스(버전 110)에서의 조사 동안 발견되지 않았다.
서열번호 78의 서열로부터, 서열번호 127의 서열을 갖는 뉴클레오타이드 프라이머를 합성한다.
서열번호 79의 서열로부터, 서열번호 128의 서열을 갖는 뉴클레오타이드 프라이머를 합성한다.
서열번호 127 및 128의 서열을 갖는 프라이머는 GS912639 유전자의 전사체에 상응하는 cDNA의 제 3 핵산 서열인 Clontech사가 판매하는 상이한 인간 조직의 폴리A+ mRNA 라이브러리를 사용하여 cDNA를 증폭시킬 수 있게 한다. 이러한 서열은 서열번호 80의 서열을 구성한다.
서열번호 80의 서열은 594 뉴클레오타이드의 길이를 갖는다.
서열번호 80에 대한 서열 상동성은 GenBank 데이터 베이스(버전 116)에서 참조로 확인된 서열로 발견되었다. 이러한 상동성은 다음과 같다:
- 서열 g2603415 (gi│2603415 │gb │B51178.1 │B51178[2603415]) CIT978SK-95K15.TV CIT978SK 호모 사피엔스 게놈 클론 95K15, 게놈 조사 서열과 522 bp(위치 [204-725])에 걸쳐서 99% 상동성. 길이 = 524;
- 서열 g2866378 (gi│2866378 │gb │B79355.1 │B79355[2866378]) CIT978SK-95K15.TV.1 CIT978SK 호모 사피엔스 게놈 클론 95K15, 게놈 조사 서열과 501 bp(위치 [204-704])에 걸쳐서 99% 상동성. 길이 = 529;
- 서열 g2602442 (i│2602442 │gb │B50205.1 │B50205[2602442]) CIT978SK-96F5.TV CIT978SK 호모 사피엔스 게놈 클론 96F5, 게놈 조사 서열과 309 bp(위치 [205-513])에 걸쳐서 94% 상동성. 길이 = 309;
서열번호 78 또는 79 서열의 전사체의 발현 분석을 실시예 1에서 기술한 바와 같이 RT PCR에 의해 수행한다. 상이한 조직의 폴리A+ RNA를 사용하여 수행된 이러한 분석은 GS912639 유전자가 간에서 발현되었음을 보여줄 수 있게 한다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애에 기인한 질환, 특히 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관되는 질환에 대한 원인 위치적 후보를 구성한다.
GS933630 유전자
핵산
본원에서 No. GS933630으로 명명된 유전자의 전사체에 상응하는 메신저 RNA를 본 발명에 따라 분리한다. 이러한 전사체의 대표적인 핵산 서열을 결정하였다.
이러한 전사체에 상응하는 cDNA의 이러한 핵산 서열은 서열번호 81의 서열을구성한다.
서열번호 81의 서열은 582 뉴클레오타이드의 길이를 갖는다.
GenBank 데이터 베이스(버전 116)에서 참조로 확인된 서열과 어떠한 상동성도 관찰되지 않았다.
이러한 유전자는 콜레스테롤의 역류에서의 기능장애에 기인한 질환, 특히 탠지어병 또는 가족성 HDL 결핍증, 또는 9번 염색체의 9q31-34 좌위와 유전적으로 연관되는 질환에 대한 원인 위치적 후보를 구성한다.
본 발명의 특징 규명
따라서 본 발명은 서열번호 129 내지 서열번호 160의 아미노산 서열로 이루어진 그룹 중에서 선택된 아미노산 서열을 갖는 단백질 또는 이의 펩타이드 단편이나 변이체를 암호화하는 핵산 또는 상보 서열을 갖는 핵산에 관한 것이다.
일반적으로, 본 발명에 따른 핵산은 분리되거나 정제된 형태로 제공된다.
본 발명은 또한, 서열번호 1 내지 서열번호 81 및 서열번호 82 내지 서열번호 101의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 폴리뉴클레오타이드의 적어도 8개의 연속 뉴클레오타이드를 포함하는 핵산, 또는 상보 서열을 갖는 핵산에 관한 것이다.
본 발명은 또한, 서열번호 1 내지 서열번호 81 및 서열번호 82 내지 서열번호 101의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 폴리뉴클레오타이드의 적어도 20, 30, 40, 50, 100 또는 150개의 연속 뉴클레오타이드를 포함하는 핵산 또는 상보 서열을 갖는 핵산에 관한 것이다.
다른 양태에 따르면, 본 발명은 또한, 서열번호 1 내지 서열번호 81 및 서열번호 82 내지 서열번호 101의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 핵산과 적어도 90% 뉴클레오타이드 동일성, 서열번호 1 내지 서열번호 81 및 서열번호 82 내지 서열번호 101의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 핵산과 유리하게는 80%, 바람직하게는 95%, 99%, 99.5%, 가장 바람직하게는 99.8% 뉴클레오타이드 동일성을 갖는 핵산, 또는 상보 서열을 갖는 핵산에 관한 것이다.
다른 양태에 따르면, 본 발명은 고 엄격성 하이브리드화 조건하에서, 전술한 핵산, 좀더 바람직하게는 서열번호 1 내지 서열번호 81 및 서열번호 82 내지 서열번호 101의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 핵산, 또는 상보 서열을 갖는 핵산과 하이브리드화 하는 핵산에 관한 것이다.
앞서 상세히 설명한 바와 같이, 서열번호 1 내지 서열번호 81의 뉴클레오타이드 서열 각각은 뉴클레오타이드 서열이 지방단백질 대사에서의 기능장애, 특히 콜레스테롤의 역수송과 연관된 증상에 잠재적으로 관여된 유전자의 전사체에서 발견되는 cDNA를 구성한다.
이들 핵산 중 일부의 경우, 아미노산 서열 또는 발현의 변화가 이들 증상 중 하나와 잠재적으로 연관되는 폴리펩타이드를 암호화하는 개방 판독 프레임이 결정되었으며, 이는 개방 판독 프레임을 포함하는 뉴클레오타이드 서열이 잠재적으로 치료적 관심을 끄는 핵산을 구성함을 나타낸다.
결과적으로, 본 발명의 주제는 또한, 본 발명의 설명에서 전술한 바와 같이, 완전 또는 부분 개방 판독 프레임을 포함하거나 이로 구성되는 폴리뉴클레오타이드와 적어도 80% 뉴클레오타이드 동일성을 갖는 핵산이다.
서열번호 1 내지 서열번호 81 서열의 전사 산물의 암호화 영역을 완전하게 또는 부분적으로 포함하는 상기 핵산은 이들 핵산이 적당한 발현 시그널의 조절하에 놓일 때 원하는 숙주세포에서 발현될 수 있다.
이러한 발현 시그널은 상응하는 유전자 각각의 조절 영역에 함유된 발현 시그널일 수 있거나, 이와 반대로 외생성 조절 핵산 서열로 이루어질 수도 있다.
목적하는 숙주세포에서 기능을 띠는 조절 서열의 조절하에 놓인 그러한 핵산은 또한 발현을 위해 벡터 중으로 삽입시킬 수도 있다.
뉴클레오타이드 탐침 및 프라이머
서열번호 1 내지 서열번호 81의 뉴클레오타이드 서열 중 임의 하나로부터 유도된 핵산 단편은 샘플 중의 서열번호 1 내지 서열번호 81의 서열로부터 선택된 뉴클레오타이드 서열의 적어도 하나의 카피 또는 이의 단편이나 변이체의 존재 검출에 유용하다.
본 발명에 따른 뉴클레오타이드 탐침 또는 프라이머는 서열번호 1 내지 서열번호 81의 서열로 이루어진 그룹 중에서 선택된 핵산, 또는 상보 서열을 갖는 핵산의 적어도 8개의 연속 뉴클레오타이드를 포함한다.
바람직하게는, 본 발명에 따른 뉴클레오타이드 탐침 또는 프라이머는 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열 중에서 선택된 뉴클레오타이드 서열을 갖는 핵산 또는 상보 서열을 갖는 핵산의 10, 12, 15, 18 또는 20 내지 25, 35, 40, 50, 70, 80, 100, 200, 500, 1000, 1500개의 연속 뉴클레오타이드의 길이를 갖게 된다.
또한, 본 발명에 따른 뉴클레오타이드 탐침 또는 프라이머는 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열로부터 선택된 핵산, 또는 상보 서열을 갖는 핵산의 12, 15, 18, 20, 25, 35, 40, 50, 100, 200, 500, 1000, 1500개의 연속 뉴클레오타이드의 길이를 갖는 단편으로 구성되고/구성되거나 이를 포함할 것이다.
따라서, 본 발명에 따른 뉴클레오타이드 탐침 및 프라이머의 정의는 전술한 고 엄격 하이브리드화 조건하에서, 서열번호 1 내지 서열번호 81의 서열로부터 선택된 핵산과 또는 이와 상보적인 서열과 하이브리드화 하는 올리고뉴클레오타이드를 포함한다.
본 발명에 따른 바람직한 탐침 및 프라이머는 서열번호 102 내지 128의 뉴클레오타이드 서열로부터 선택된 폴리뉴클레오타이드, 또는 상보 서열을 갖는 핵산의 전부 또는 일부를 포함한다.
본 발명에 따른 뉴클레오타이드 프라이머 또는 탐침은 클로닝 및 제한 효소의 작용 또는 NARANG 등(1979) 또는 BROWN 등(1979)에 의한 포스포디에스테르법, BEAUCAGE 등(1980)에 의한 디에틸포스포라미다이트법 또는 EU 특허 No. EP 0,707,592에 기재된 고체 지지체 상에서의 기술과 같은 기술에 따른 직접 화학적 합성을 포함하여, 당업자에 익히 공지된 적당한 방법에 의해 제조될 수 있다.
전술한 올리고뉴클레오타이드 탐침 및 프라이머를 포함한 본 발명에 따른 핵산 각각은 필요하다면, 분광학, 광화학, 생화학, 면역화학 또는 화학 수단에 의해검출 가능한 마커를 혼입함으로써 표지시킬 수 있다.
예를 들면, 이러한 마커는 방사능 동위원소(32P, 33P, 3H, 35S), 형광성 분자(5-브로모데옥시우리딘, 플루오레신, 아세틸아미노플루오렌, 디곡시게닌) 또는 바이오틴과 같은 리간드로 이루어질 수 있다.
탐침의 표지는 바람직하게는, 표지된 분자를 프라이머 연장, 또는 5′또는 3′말단에의 첨가에 의해 폴리뉴클레오타이드 중으로 혼입시켜 수행된다.
핵산 단편의 비-방사능 표지의 예는 특히 프랑스 특허 No. FR 78 109 75에 또는 URDEA 등(1988) 또는 SANCHEZ-PESCADOR 등(1988)의 논문에 기재되어 있다.
유리하게는, 본 발명에 따른 탐침은 URDEA 등(1991)에 의해 또는 유럽 특허 No. EP-0,225,807(CHIRON)에 기술된 탐침과 같이, 시그널의 증폭을 허용하는 구조적 특징을 지닐 수 있다.
본 발명에 따른 올리고뉴클레오타이드 탐침은 특히 게놈 DNA와의 서던형 하이브리드화 또는 상응하는 전사체의 발현을 샘플에서 원할 때 상응하는 메신저 RNA와의 하이브리드화에 사용될 수 있다.
본 발명에 따른 탐침은 또한, PCR 증폭 산물의 검출에 또는 미스매치의 검출에 사용될 수 있다.
본 발명에 따른 뉴클레오타이드 탐침 또는 프라이머는 고체 지지체 상에 고정될 수 있다. 이러한 고체 지지체는 당업자에 익히 공지되어 있으며 마이크로타이터 플레이트, 폴리스티렌 베드, 마그네틱 베드, 니트로셀룰로스 밴드 또는 마이크로 입자, 예를 들면 라텍스 입자의 웰 표면을 포함한다.
결과적으로, 본 발명은 또한, 샘플내 전술한 핵산의 존재을 검출하는 방법에 관한 것으로,
1)본 발명에 따른 하나 이상의 뉴클레오타이드 탐침을 시험할 샘플과 접촉시키고;
2)샘플에 존재하는 핵산과 탐침 사이에 형성될 수 있는 복합체를 검출하는 단계를 포함한다.
본 발명에 따른 검출법의 특정 양태에 따라, 올리고뉴클레오타이드 탐침은 지지체 상에 고정된다.
다른 양태에 따라, 올리고뉴클레오타이드 탐침은 검출 가능한 마커를 포함한다.
본 발명은 또한, 샘플내 본 발명에 따른 핵산 존재의 검출용 박스 또는 키트에 관한 것으로, 박스는
a)전술한 바와 같은 하나 이상의 뉴클레오타이드 탐침;
b)경우에 따라, 하이브리드화 반응에 필요한 시약을 포함한다.
제 1 양태에 따라, 검출 박스 또는 키트는 탐침이 지지체 상에 고정됨을 특징으로 한다.
제 2 양태에 따라, 검출 박스 또는 키트는 올리고뉴클레오타이드 탐침이 검출 가능한 마커를 포함함을 특징으로 한다.
전술한 검출 키트의 특정 양태에 따라, 그러한 키트는 해당 표적 서열의 검출 또는 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열을 갖는핵산 또는 상보 서열을 갖는 핵산의 암호화 영역 또는 비-암호화 영역에서의 돌연변이 검출에 사용될 수 있는 본 발명에 따른 복수개의 올리고뉴클레오타이드 탐침을 포함할 것이다.
바람직한 탐침은 서열번호 82 내지 서열번호 101의 서열을 갖는 폴리뉴클레오타이드의 전부 또는 일부를 포함할 것이다.
따라서, 지지체 상에 고정된 본 발명에 따른 탐침은 "DNA 칩"과 같은 매트릭스에 정렬될 수 있다. 그러한 정렬된 매트릭스는 특히 US 특허 No. 5,143,854, PCT 출원 No. WO 90/15070 및 92/10092에 기재되어 있다.
올리고뉴클레오타이드 탐침이 고밀도로 고정된 지지 매트릭스는 예를 들면, US 특허 No. 5,412,087 및 PCT 출원 No. WO 95/11995에 기재되어 있다.
본 발명에 따른 뉴클레오타이드 프라이머는 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열을 갖는 핵산, 또는 이의 변이체의 전부 또는 일부 증폭에 사용될 수 있다.
본 발명의 다른 양태는 본 발명에 따른 핵산, 특히 샘플에 함유된 서열번호 81의 서열을 갖는 핵산 또는 이의 단편이나 변이체의 증폭방법에 관한 것으로,
a)증폭반응에 필요한 시약의 존재하에서, 표적 핵산의 존재가 추정되는 샘플을 하이브리드화 위치가 증폭시키고자 하는 표적 핵산 영역의 5′사이드 및 3′사이드에 각각 위치하고 있는 뉴클레오타이드 프라이머의 쌍과 접촉시킨 다음;
b)증폭된 핵산을 검출하는 단계를 포함한다.
전술한 증폭방법을 수행하기 위해서는, 전술한 뉴클레오타이드 프라이머를사용하는 것이 유리할 것이다.
또한, 본 발명의 주제는 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열을 갖는 핵산의 전부 또는 일부 증폭을 위한 박스 또는 키트로서, 박스 또는 키트는
a)하이브리드화 위치가 증폭시키고자 하는 표적 핵산의 5′사이드와 3′사이드에 각각 위치되어 있는 본 발명에 따른 뉴클레오타이드 프라이머의 쌍;
b)경우에 따라, 증폭반응에 필요한 시약을 포함한다.
그러한 증폭 박스 또는 키트는 유리하게는 전술한 바와 같은 뉴클레오타이드 프라이머의 적어도 한 쌍을 포함할 것이다.
재조합 벡터
본 발명은 또한 본 발명에 따른 핵산을 포함하는 재조합 베터에 관한 것이다.
유리하게는, 그러한 재조합 벡터는 하기의 핵산 중에서 선택된 핵산을 포함할 것이다:
a)서열번호 129 내지 서열번호 160의 서열로 된 그룹 중에서 선택된 아미노산 서열을 갖는 단백질 또는 이의 펩타이드 단편이나 변이체를 암호화하는 핵산;
b)서열번호 1 내지 서열번호 81의 서열로 이루어진 그룹 중에서 선택된 폴리뉴클레오타이드를 포함하는 핵산, 또는 이의 단편이나 변이체;
c)서열번호 1 내지 서열번호 81의 서열로 이루어진 그룹 중에서 선택된 핵산과 적어도 80% 뉴클레오타이드 동일성을 갖는 핵산 또는 이의 단편이나 변이체;
d)고 엄격 하이브리드화 조건하에서, 서열번호 1 내지 서열번호 81의 서열을 갖는 핵산과 하이브리드화 하는 핵산, 또는 이의 단편이나 변이체.
본 발명의 목적상 "벡터"는 일본쇄 또는 이본쇄 형태의 원형 또는 선형 DNA 또는 RNA 분자를 의미하는 것으로 이해된다.
제 1 양태에 따라, 본 발명에 따른 재조합 벡터는 목적하는 세포 숙주의 형질전환 또는 형질감염 후 벡터 안으로 삽입되는 핵산의 증폭에 사용된다.
제 2 양태에 따라, 벡터는 본 발명에 따른 핵산 외에, 이의 전사 및/또는 해독을 지시할 수 있는 조절 서열을 포함하는 발현 벡터로 이루어진다.
유리한 양태에 따라, 본 발명에 따른 재조합 벡터는 특히 하기 요소를 포함할 것이다:
(1)프로모터 및 인핸서와 같이 삽입시킬 핵산의 발현 조절 요소;
(2)그러한 벡터 중으로 삽입시킬 본 발명에 따른 핵산에 포함된 암호화 서열(암호화 서열은 (1)에서 기술한 조절 시그널과 동 위상으로 배치된다); 및
(3)전사의 개시와 종결을 위한 적당한 서열.
또한, 본 발명에 따른 재조합 벡터는 증폭 또는 발현시키고자 하는 세포 숙주에서의 복제를 위한 하나 이상의 기원, 마커 또는 선별 마커를 포함할 수 있다.
예를 들면, 박테리아 프로모터는 LacI 및 LacZ 프로모터, 박테리오파지 T3 또는 T7 RNA 폴리머라제 프로모터, 람다 파지 PR 또는 PL 프로모터일 수 있다.
진핵세포에 대한 프로모터는 HSV 바이러스 티미딘 키나제 프로모터 또는 마우스 메탈로티오네인-L 프로모터를 포함할 것이다.
일반적으로, 적당한 프로모터의 선택을 위해, 당업자는 상기 인용된 SAMBROOK 등(1989)에 의한 매뉴얼 또는 FULLER 등(1996)에 의해 기술된 기술을 유리하게 참조할 수 있다.
본 발명에 따른 바람직한 박테리아 벡터, 예를 들면, 벡터 pBR322(ATCC37017) 또는 벡터, 예를 들면 pAA223-3(Pharmacia, Uppsala, Sweden), 및 pGEM1(Promega Biotech, Madison, WI, 미국)이다.
아울러, 다른 시판 벡터, 예를 들면 벡터 pQE70, pQE60, pQE9(Qiagen), psiX174, pBluescript SA, pNH8A, pNH16A, pNH18A, pNH46A, pWLNEO, pSV2CAT, pOG44, pXTI, pSG(Stratagene)를 들 수 있다.
이들은 또한, 바큘로바이러스형의 벡터, 예를 들면 Spodoptera frugiperda로부터 유도된 Sf9 주(ATCC No. CRL 1711)의 세포를 형질감염시키는 데 사용되는 벡터 pVL1392/1393(Pharmingen)일 수 있다.
이들은 또한 인간 아데노바이러스 2형 또는 5형과 같은 아데노바이러스 벡터일 수 있다.
본 발명에 따른 재조합 벡터는 또한 레트로바이러스 벡터 또는 아데노-수반 벡터(AAV)일 수 있다. 이러한 아데노-수반 벡터는 예를 들면 FLOTTE 등(1992), SAMULSKI 등(1989) 또는 McLAUGHLIN BA 등(1996)에 의해 기술되어 있다.
재조합 숙수세포
본 발명은 또한 본 발명에 따른 핵산, 특히 서열번호 1 내지 서열번호 81의 서열을 갖는 핵산 또는 이의 암호화 영역 전부 또는 일부를 포함하는 핵산을 포함하는 재조합 숙주세포에 관한 것이다.
다른 양태에 따라, 본 발명은 또한 전술한 바와 같은 재조합 벡터를 포함하는 재조합 숙주 세포에 관한 것이다.
본 발명에 따른 바람직한 숙주 세포는 예를 들면, 다음과 같다:
a)원핵 숙주 세포: 에쉐리키아 콜라이(균주 DH5α), 바실러스 서브틸리스, 살모넬라 티피무리움 균주, 또는 슈도모나스, 스트렙토마이세스 및 스태필로코커스와 같은 종의 균주;
b)진핵 숙주 세포: 헬라 세포(ATCC No. CCL2), Cv 1 세포(ATCC No. CCL70), COS 세포(ATCC No. CRL 1650), Sf-9 세포(ATCC No. CRL 1711), CHO 세포(ATCC No. CCL-61) 또는 3T3 세포(ATCC No. CRL-6361).
다른 일면에 따라, 본 발명은 서열번호 129 내지 서열번호 160의 서열을 갖는 펩타이드로 이루어진 그룹 중에서 선택된 아미노산 서열을 포함하는 폴리펩타이드, 또는 이들의 펩타이드 단편이나 변이체에 관한 것이다.
본 발명은 또한 서열번호 129 내지 서열번호 160의 서열을 갖는 펩타이드로 이루어진 그룹 중에서 선택된 아미노산 서열의 적어도 15개의 연속 아미노산을 포함하는 폴리펩타이드, 또는 이의 펩타이드 단편이나 변이체에 관한 것이다.
본 발명은 또한 서열번호 129 내지 서열번호 160의 서열을 갖는 펩타이드로 이루어진 그룹 중에서 선택된 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산을 포함하는 폴리펩타이드, 또는 이의 펩타이드 단편이나 변이체에 관한 것이다.
유리하게는, 본 발명의 구성부는 서열번호 129 내지 서열번호 160의 서열을 갖는 펩타이드로 이루어진 그룹 중에서 선택된 아미노산 서열과 적어도 85%, 90%, 95% 또는 99% 아미노산 동일성을 갖는 폴리펩타이드, 또는 이의 펩타이드 단편이나 변이체이다.
바람직하게는, 본 발명에 따른 폴리펩타이드는 본 발명에 따른 핵산, 특히 서열번호 129 내지 서열번호 160의 서열 중에서 선택된 아미노산 서열을 갖는 폴리펩타이드의 15, 18 또는 20 내지 25, 35, 40, 50, 70, 80, 100 또는 200개의 연속 아미노산 길이를 갖게 될 것이다.
또한, 본 발명에 따른 폴리펩타이드는 본 발명에 따른 폴리펩타이드, 특히 서열번호 129 내지 서열번호 160의 서열 중에서 선택된 폴리펩타이드의 15, 18, 20, 25, 35, 40, 50, 100 또는 200개의 연속 아미노산의 길이를 갖는 단편으로 이루어지고/이루어지거나 이를 포함하게 될 것이다.
일반적으로, 본 발명에 따른 폴리펩타이드는 분리되거나 정제된 형태로 제공된다.
본 발명은 또한 서열번호 129 내지 서열번호 160의 서열을 갖는 폴리펩타이드의 아미노산 서열에 대해 아미노산의 1, 2, 3, 4, 5, 10 내지 20개의 치환, 첨가 또는 결실의 아미노산 변형을 포함하는 폴리펩타이드, 또는 이의 단편이나 변이체에 관한 것이다.
본 발명은 또한 서열번호 129 내지 서열번호 160의 서열을 갖는 폴리펩타이드 또는 이의 단편이나 변이체 중 하나의 제조방법에 관한 것으로,
a)상기 폴리펩타이드를 암호화하는 핵산을 적당한 벡터에 삽입시키고;
b)적당한 배양 배지에서, 사전에 단계 a)의 재조합 벡터로 형질전환시키거나 형질감염시킨 숙주 세포를 배양하며;
c)예를 들면, 음파처리나 삼투 쇼크에 의해, 조건화된 배양 배지를 회수하거나 숙주 세포를 용해시키며;
d)배양 배지로부터 또는 단계 c)에서 수득한 세포 용해물로부터 폴리펩타이드를 분리 정제하며;
e)경우에 따라, 생성된 재조합 폴리펩타이드를 특징 분석하는 단계를 포함한다.
본 발명에 따른 펩타이드는 이러한 폴리펩타이드에 대한 또는 이의 단편이나 변이체에 대한 항체를 미리 고정시킨 면역친화성 크로마토그래피 칼럼에의 부착을 특징으로 할 수 있다.
다른 일면에 따라, 본 발명에 따른 재조합 폴리펩타이드는 당업자에 공지되고 예를 들면, F. Ausubel 등(1999)에 기술된 방법에 따라, 크로마토그래피 칼럼의 적당한 시리즈 위에 통과시킴으로써 정제될 수 있다.
본 발명에 따른 폴리펩타이드는 또한, 균질 용액에서 또는 고체상에서 통상의 화학적 합성 기술로 제조될 수 있다.
예로 들자면, 본 발명에 따른 폴리펩타이드는 HOUBENWEYL(1974)에 기재된 균질 용액에서 또는 MERRIFIELD(1965a; 1965b)에 의해 기재된 고체상 합성 기술로 제조될 수 있다.
또한, 본 발명의 구성부는 서열번호 129 내지 서열번호 160의 아미노산 서열을 갖는 폴리펩타이드 중 임의의 하나와 '상동성인" 폴리펩타이드, 또는 이의 단편이나 변이체이다.
이러한 상동성 폴리펩타이드는 참조 폴리펩타이드에 대해, 등가 아미노산에 의한 하나 이상의 아미노산 치환을 보유하는 아미노산 서열을 갖는다.
등가 아미노산이란 본 밤명에 따르면, 예를 들어 D형 잔기에 의한 L형 잔기의 치환 또는 당업자에 잘 알려진 기술에 따른 파이로-글루탐산에 의한 글루탐산(E)의 치환을 의미하는 것으로 이해될 것이다. 예로 들자면, D형의 적어도 하나의 잔기를 함유하는 펩타이드의 합성은 KOCH(1977)에 의해 기재되었다.
다른 일면에 따르면, 등가 아미노산으로는 동일 계통에 속하는 두 아미노산, 즉 산성, 염기성, 비극성 또는 하전되지 않은 극성을 띠는 두 아미노산도 고려된다.
또한, 본 발명의 구성부는 레트로-인버스 결합(NHCO), 카바 결합(CH2CH2) 또는 케토메틸렌 결합(CO-CH2)과 같은 적어도 하나의 비-펩타이드 결합을 포함하는 폴리펩타이드이다.
바람직하게는, 적어도 1 아미노산의 하나 이상의 첨가, 결실 또는 치환을 포함하는 본 발명에 따른 폴리펩타이드는 비-변형 폴리펩타이드에 대한 항체에 의해 인식될 능력을 보존할 것이다.
항체
본 발명에 따른 폴리펩타이드, 특히 서열번호 129 내지 서열번호 160의 아미노산 서열을 갖는 폴리펩타이드 또는 이의 단편이나 변이체 및 상동성 펩타이드는 항체 제조에 사용될 수 있다.
본 발명의 목적상 "항체"는 특히 폴리클로날 또는 모노클로날 항체, 또는 단편(예를 들면 F(ab)′2 및 Fab 단편), 또는 본 발명에 따른 폴리펩타이드 또는 표적 폴리펩타이드 단편을 인식하는 초기 항체의 도메인을 포함하는 임의 폴리펩타이드를 의미하는 것으로 이해될 것이다.
모노클로날 항체는 KOHLER and MILSTEIN(1975)에 의해 기재된 기술에 따라 하이브리도마로부터 제조될 수 있다.
본 발명은 또한, 트리오마 기술이나 KOZBOR 등(1983)에 의해 기재된 하이브리도마 기술로 생성된, 전술한 폴리펩타이드 또는 이의 단편이나 변이체에 대한 항체에 관한 것이다.
본 발명은 또한, US 특허 No. 4,946,778에 또는 MARTINEAU 등(1998)에 의해 기재된 바와 같은 일본쇄 항체 단편 Fv(ScFv)에 관한 것이다.
본 발명에 따른 항체는 또한 파지 라이브러리 RIDDER 등(1995) 또는 인간화된 항체 REIMANN 등(1997); LEGER 등(1997)의 도움으로 수득된 항체 단편을 포함한다.
본 발명에 따른 항체 제제는 샘플에 존재하는 항원의 존재 및/또는 양의 확인을 위한 면역학적 검출 시험에 유용하다.
본 발명에 따른 항체는 아울러, 동위원소 또는 비-동위원소, 예를 들면, 형광성의 검출 가능한 마커를 포함할 수 있거나 당업자에 잘 알려진 기술에 따라 바이오틴과 같은 분자에 커플링시킬 수 있다.
따라서, 언급되는 주제는 샘플내 본 발명에 따른 폴리펩타이드의 존재 검출 방법이며, 이러한 방법은
a)시험될 샘플을 전술한 항체와 접촉시키고;
b)형성된 항원/항체 복합체를 검출하는 단계를 포함한다.
본 발명은 또한, 샘플내 본 발명에 따른 폴리펩타이드의 존재를 진단하거나 검출하기 위한 박스 또는 키트에 관한 것으로, 박스는
a)상기 정의한 항체;
b)형성된 항원/항체 복합체의 검출을 허용하는 시약을 포함한다.
본 발명에 따른 폴리펩타이드에 결합하는 분자 또는 물질의 스크리닝 방법
본 발명에 따른 폴리펩타이드는 이와 결합하는 분자의 스크리닝에 사용될 수 있다.
분자 또는 물질과 폴리펩타이드의 결합은 상기 폴리펩타이드의 활성을 활성화시키거나(효능제 분자) 억제시킬(길항제 분자) 수 있다.
본 발명에 따른 임의 폴리펩타이드와 결합할 수 있는 그러한 분자는 항체, 올리고뉴클레오타이드, 기타 단백질 및 일반적으로 임의 종류의 소형 분자를 포함한다.
이러한 스크리닝 시험에서, 폴리펩타이드에의 후보 분자 결합을 간단하게 검출할 수 있으며, 두 파트너 중 하나는 검출 가능한 화합물로 표지되고(해당 폴리펩타이드 또는 후보 분자), 이어서 폴리펩타이드/후보 분자 복합체의 가시화는 특이적으로 결합되지 않은 후보 분자를 제거한 후, 검출 가능한 마커를 검출함으로써 가시화된다.
예를 들면, 본 발명에 따른 폴리펩타이드와 결합할 수 있는 후보 분자의 스크리닝 시험은 유리하게는, 해당 폴리펩타이드 또는 후보 분자가 지지체상에 고정되는 동안의 제 1 단계, 제 2 파트너(후보 분자 또는 해당 폴리펩타이드)가 지지체상에 미리 고정된 제 1 화합물에 노출되는 동안의 제 2 단계, 1회 이상의 세척이 특이적으로 결합되지 않은 화합물의 제거에 적당한 조건하에서 수행되는 동안의 제 3 단계, 및 마지막으로 해당 폴리펩타이드와 후보 분자 간에 형성될 수 있는 복합체가 검출되는 동안의 제 4 단계를 포함할 수 있다.
후보 분자를 지지체상에 사전에 고정시킨 다음, 본 발명에 따른 해당 폴리펩타이드에 노출시키는 스크리닝 시험의 양태에서, 후보 분자와 본 발명에 따른 해당 폴리펩타이드에 의해 형성된 복합체의 검출은 유리하게는 전술한 항체의 도움하에 수행될 수 있다.
지지체에 사전에 고정시킨 본 발명에 따른 해당 폴리펩타이드인 스크리닝 시험의 다른 양태에서, 후보 분자는 유리하게는 해당 고정 폴리펩타이드와 접촉시키기에 앞서 검출 가능한 마커의 도움하에 표지된다.
그러한 검출 가능한 마커는 방사능성 또는 비-방사능성, 예를 들면, 형광성일 수 있거나 바이오틴 분자와 같은 검출용으로 사용되는 제 3 파트너를 위한 리간드에 상응할 수 있다.
결과적으로, 본 발명의 주제는 또한, 본 발명에 따른 폴리펩타이드와 상호작용하는 후보 분자 또는 물질의 스크리닝 방법으로서,
a)본 발명에 따른 폴리펩타이드를 검출할 후보 물질이나 분자와 접촉시키고;
b)폴리펩타이드와 후보 물질 또는 분자간에 형성될 수 있는 복합체를 검출하는 단계를 포함한다.
본 발명은 또한, 본 발명에 따른 폴리펩타이드와 상호작용하는 후보 분자 또는 물질의 스크리닝을 위한 박스 또는 키트에 관한 것으로, 이러한 박스는
a)본 발명에 따른 폴리펩타이드;
b)경우에 따라, 폴리펩타이드와 후보 분자 또는 물질 사이에 형성된 복합체의 검출에 필요한 수단을 포함한다.
본 발명은 또한, 결과적으로 하기 실시예로 설명되며 이에 제한되지 않는다.
실시예 1: 본 발명에 따른 전사체의 조직 분포
본 발명에 따른 폴리뉴클레오타이드의 발현 프로필은 특히 Sambrook 등(참조: CSH Sambrook, J., Fritsch, E.F., and Maniatis, T. (1989); "Molecular Cloning: A Laboratory Manual, " 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY.)에 의해 기재된 노던 블롯 분석 및 PCR-커플링 역전사 프로토콜에 따라 측정된다.
예를 들면, 역전사에 의한 분석의 경우에, 서열번호 1 내지 서열번호 81의 전사체의 뉴클레오타이드 서열 중 임의의 하나로부터 합성된 프라이머의 쌍이 상응하는 cDNA의 검출에 사용된다.
폴리머라제 연쇄 반응(PCR)은 역전사된 폴리A+mRNA(Clontech)에 상응하는 cDNA 주형상에서 수행된다. cDNA로의 역전사는 제조업자에 의해 기재된 조건에 따라 효소 SUPERSCRIPT II(GibcoBRL, Life Technologies)로 수행된다.
폴리머라제 연쇄 반응은 25 ng의 cDNA 제제와의 반응 혼합물 20 ㎕에서, 표준 조건에 따라 수행된다. 반응 혼합물은 dNTP 각각 400 μM, Thermus aquaticus(Taq) DNA 폴리머라제(Ampli Taq Gold; Perkin Elmer) 2 단위, 각각의 프라이머 0.5 μM, MgCl2 2.5 mM 및 PCR 완충제로 구성된다. 34 PCR 사이클(94℃에서 변성 30 s, 34 사이클 동안 다음으로 이루어진 어닐링 30 s: 64℃ 2 사이클, 61℃ 2 사이클, 58℃ 2 사이클 및 55℃ 28 사이클 및 72℃에서 킬로 염기당 1분간의 연장)을 94℃에서 10분간 Perkin Elmer 9700 써모사이클러에서 1차 변성 후 수행한다. PCR 반응은 전기영동에 의해 아가로스 겔 상에서 가시화한다. 수득된 cDNA 단편은 노던 블롯 분석을 위한 탐침으로 사용될 수 있고 아울러 폴리뉴클레오타이드 서열의 정확한 결정을 위해 사용될 수 있다.
노던 블롯 분석의 경우에, 전술한 바와 같이 생성된 cDNA 탐침을 제조업자에 의해 표시된 지시에 따라 High Prime DNA 표지 시스템(Boehringer)을 사용하여 32P로 표지한다. 표지한 후, 탐침을 제조업자에 의해 표시된 지시에 따라 Sephadex G50 마이크로칼럼(Pharmacia) 상에서 정제한다. 이어서, 표지되고 정제된 탐침을 각종 조직에서 mRNA의 발현 검출에 사용한다.
각종 인간 조직으로부터의 RNA 샘플을 함유하는 노던 블롯((다중 조직 노던, MTN, Clontech), Blot 2, 참조 77759-1)을 표지된 탐침과 하이브리드화시킨다.
하이브리드화 및 세척을 위한 프로토콜은 제조업자에 의해 기술된 것(적용 매뉴얼 PT1200-1)이거나 당업자에 공지되고 예를 들면, F.AUSUBEL 등(1999)에 기재된 방법을 사용하는 이러한 프로토콜의 변형일 수 있다.
따라서, 예를 들면 포름아미드의 존재하에 예비 하이브리드화 및 하이브리드화 온도를 변화시킬 수 있다.
예를 들면, 다음의 프로토콜을 사용할 수 있을 것이다.
1 -막 경쟁 및 예비 하이브리드화:
- 혼합: 연어 정충 DNA 40 ㎕(10 mg/ml) + 40 ㎕ 인간 태반 DNA(10 mg/ml)
- 96℃에서 5분간 변성, 이어서 얼음에 혼합물 침지.
- 2X SSC 제거 및 막을 함유하는 하이브리드화 튜브에 포름아미드 믹스 4 ml 붓기.
- 두 변성 DNA의 혼합물 첨가.
- 회전하에 42℃에서 5 내지 6시간 동안 배양.
2 -표지된 탐침 경쟁;
- 반복량에 따라, 표지되고 정제된 탐침에 10 내지 50㎕ Cot I DNA 첨가.
- 95℃에서 7 내지 10분간 변성.
- 65℃에서 2 내지 5시간 동안 배양.
3 -하이브리드화:
- 예비 하이브리드화 믹스 제거
- 연어 정충 DNA 40 ㎕ + 인간 태반 DNA 40 ㎕ 혼합; 96℃에서 5분간 변성,이어서 얼음에 침지.
- 하이브리드화 튜브에 포름아미드 믹스 4 ml, 두 DNA의 혼합물 및 변성되고 표지된 탐침/Cot I DNA 첨가.
- 회전하에 42℃에서 15 내지 20시간 동안 배양.
4 -세척:
- 실온에서 2X SSC에서 1회 세척하여 세정.
- 실온에서 2X SSC 및 65℃에서 0.1% SDS로 5분간 2회.
- 65℃에서 1X SSC 및 65℃에서 0.1% SDS에서 15분간 2회.
하이브리드화 및 세척 후, 블롯을 Storm(Molecular Dynamics, Sunnyvale, CA)의 도움하에 드러난 인 스크린과의 접촉에 밤새 노출시킨 후 분석한다.
실시예 2: 본 발명에 따른 전사체에 상응하는 완전한 cDNA 단편의 생성
서열번호 1 내지 서열번호 81의 서열 가운데 특이적 클론의 하나에 상응하는 cDNA를 분리하는 데 다양한 접근방법이 이용될 수 있다.
예를 들면, 완전한 클론은 해당 유전자의 서열에 특이적인 폴리뉴클레오타이드 탐침에 의해 cDNA 라이브러리를 스크리닝함으로써 하이브리드화에 의해 직접 분리시킬 수 있다.
특히, 30-40 뉴클레오타이드의 특이적 탐침은 선택된 서열에 따라 Applied Biosystem/Perkin Elmer 브랜드의 합성기를 사용하여 합성된다.
수득된 올리고뉴클레오타이드는 예를 들면, T4 폴리뉴클레오타이드 키나제를 사용하여 32P-γ-ATP로 방사능 표지되며 통상의 방법(예를 들면, Maniatis et al.,Molecular cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring, NY 1982 또는 F.Ausbel et al. (Current Protocols in Molecular Biology, J.Wiley and Sons Eds, 1999)에 따라 정제된다.
스크리닝을 원하는 cDNA를 함유하는 클론 라이브러리를를 상기 인용된 통상의 방법(F.Ausubel et al.)에 따라 적당한 항생물질을 함유하는 페트리 디시 중의 배양 배지(1.5% 아가)에 플레이팅한다. 배양 후에 생성된 콜로니를 통상의 방법에 따라 니트로셀룰로스 필터에 옮기고 방사능 표지된 뉴클레오타이드 탐침으로 스크리닝한 다음 탐침과 하이브리드화하는 콜로니를 분리하여 계대배양한다.
이렇게 동정되는 클론의 DNA를 제조하여 서열분석에 의해 분석한다. 완전한 cDNA에 상응하는 단편을 함유하는 클론을 정제하고 당업자에 공지되고 예를 들면, F.Ausubel 등(1999)에 제시된 프로토콜에 따라 벡터 pcDNA3에 재클로닝한다.
본 출원에 기재된 유전자에 상응하는 cDNA의 5′및 3′말단을 확인하기 위한 다양한 방법이 알려져 있다. 이러한 방법은 당업자에게 잘 알려진 3′또는 5′RACE-PCR(cDNA 말단-PCR의 고속 증폭)과 동일하거나 유사한 프로토콜을 사용하는 클로닝인 하이브리드화에 의한 클로닝을 포함하며 이에 한정되지는 않는다.
예를 들면, Clontech사가 판매하는 키트(Marathon ReadyTM cDNA 키트, 참조 PT1156-1로 확인되는 프로토콜)를 사용할 수 있거나 또는 5′RACE와 유사한 방법이 cDNA의 소실 5′말단의 특징 분석에 이용 가능하다(Fromont-Racine et al., Nucleic Acid Res. 21(7): 1683-1684(1993)). 간단히 말하면, RNA 올리고뉴클레오타이드를 mRNA 집단의 5′말단에 연결시킨다. cDNA로의 역전사 후에, 5′에 연결된아답터 및 해당 유전자의 3′에 위치한 서열 각각에 대해 특이적인 프라이머의 세트를 PCR에 사용하여 목적 cDNA의 5′부분을 증폭시킨다. 이어서, 증폭된 단편을 사용하여 완전한 cDNA를 재구성한다.
실시예 3: 탠지어병에 대한 유전자 발현 프로필의 분석
탠지어 세포 표현형을 일으키는 후보 유전자의 발현 좌위의 입증은 이들 서열을 후술하는 방법에 따라, 그 질환에 걸리거나 걸리지 않은 피험자의 섬유아세포로부터 수득된 mRNA에 상응하는 탐침과 하이브리드화하여 측정될 수 있다:
1.폴리(A)+ mRNA 및 cDNA 탐침의 전체 RNA의 제조
전체 RNA는 구아니딘 이소티오시아네이트법(Chomczynski & Sacchi, 1987)에 의해 정상 피험자 또는 탠지어병에 걸린 피험자로부터의 섬유아세포의 세포 배양액으로부터 수득된다. 폴리(A)+ mRNA는 올리고(dT)-셀룰로스 칼럼(Sambrook et al., 1989) 상에서 친화성 크로마토그래피로 수득되고 탐침으로 사용되는 cDNA는 형광물(Amersham Pharmacia Biotech; CyDyeTM)로 표지된 올리고뉴클레오타이드를 사용하여 RT-PCR(DeRisi et al., 1997)에 의해 수득된다.
2.하이브리드화 및 발현 수준의 검출
탠지어 유전자에 상응하는, 본원에 제시된 서열을 함유하는 유리막을 섬유아세포로부터 수득한 cDNA 탐침과 하이브리드화시킨다(Iyer et al., 1999). Amersham/molecular Dynamics 시스템(Avalanche MicroscannerTM)의 사용은 건강하거나 병에 걸린 세포형에서 서열의 산물의 발현 정량을 허용한다.
실시예 4: 포유동물 세포에서의 발현을 위한 벡터의 작제
해당 유전자는 포유동물 세포에서 발현시킬 수 있다. 전형적인 진핵세포 발현 벡터는 mRNA, 단백질을 암호화하는 서열, 및 전사의 종결 및 전사체의 폴리아데닐화에 요구되는 시그널의 전사 개시를 허용하는 프로모터를 함유한다. 이는 또한, 인핸서, 코작 서열 및 mRNA의 스플라이싱에 필요한 서열과 같은 부수적인 시그널도 함유한다. 효율적인 전사는 SV40 바이러스 프로모터의 초기 및 후기 요소, 레트로바이러스 LTR 또는 CMV 바이러스 초기 프로모터로 수득된다. 그러나, 액틴 프로모터와 같은 세포 요소도 사용될 수 있다. 다수의 발현 벡터를 사용하여 벡터 pcDNA3와 같은 본 발명을 수행할 수 있다.
실시예 5: 폴리펩타이드의 생성
GS 유전자 No. XX의 부분 전사체 또는 실시예 2에 기재된 완전한 cDNA(완전한 cDNA의 클로닝)에 상응하는 폴리펩타이드는 바큘로바이러스 벡터를 사용하는 곤충 세포 또는 박테리아 발현 시스템에서 또는 백시니아 바이러스 벡터를 사용하거나 사용하지 않는 포유동물 세포에서 용이하게 생성될 수 있다. 모든 방법이 현재 널리 기재되어 있고 당업자에 공지되어 있다. 이들의 상세한 설명은 예를 들면, F.Ausubel 등(1999)에서 찾아볼 수 있다.
실시예 6: 폴리펩타이드로부터 유도된 항체의 생성
본 발명에서의 항체는 다양한 방법으로 제조될 수 있다(Current Protocols In Molecular Biology Volume 1 edited by Frederick M. Ausubel, Roger Brent, Robert E. Kingston, David D. Moore, J.G. Seidman, John A. Smith, Kevin Struhl- Massachusetts General Hospital Harvard Medical School, chapter 11). 예를 들면, 본 발명의 폴리펩타이드를 발현하는 세포를 동물에 주사하여 항체를 함유하는 혈청의 생성을 유도한다. 기재된 방법 중 하나에서, 단백질을 제조하고 정제하여 오염을 피한다. 이러한 제제를 이어서 고 활성을 띠는 생성 폴리클로날 항혈청의 도움하에 동물에 도입한다.
바람직한 방법에서, 본 발명의 항체는 모노클로날 항체이다. 이러한 모노클로날 항체는 하이브리도마 기술(Koller et al., Nature 256:495(1975); Kohler et al., Eur. J. Immunol. 6:511 (1976); Kohler et al., Eur. J. Immunol. 6:292 (1976); Hammeling et al., in: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., pp. 563-681 51981)을 이용하여 제조할 수 있다. 일반적으로, 이러한 방법은 동물을(바람직하게는 마우스를) 폴리펩타이드, 또는 더 양호하게는 폴리펩타이드 발현 세포로 면역시키는 과정을 수반한다. 이러한 세포는 적당한 조직 배양 배지에서 배양시킬 수 있다. 그러나, 10% 태 송아지 혈청(56℃에서 불활성화시킴)으로 보충되고 비-필수 아미노산 약 10 g/l, 페닐실린 1000 U/ml 및 스트렙토마이신 약 100 ㎍/ml로 보충한 이글 배지(변형된 Earle)에서 세포를 배양하는 것이 바람직하다.
이러한 마우스로부터 비장세포를 추출하여 적당한 골수종 세포주와 융합시킨다. 그러나, ATCC에서 이용 가능한 친주 골수종 세포주(SP20)를 사용하는 것이 바람직하다. 융합 후, Wands 등(Gastroenterology 80:225-232 (1981))에 의해 기재된 바와 같이 생성 하이브리도마 세포를 HAT 배지에서 선택적으로 유지시킨 다음 제한희석에 의해 클로닝시킨다. 이러한 선별 후 수득된 하이브리도마 세포를 시험하여 폴리펩타이드와 결합할 수 있는 항체를 분비하는 클론을 동정한다.
또한, 폴리펩타이드와 결합할 수 있는 타 항체도 안티-이디오타입 항체를 사용하여 2 단계 절차에 따라 생성될 수 있으며; 이러한 방법은 항체 자신이 항원이고 결과적으로 다른 항체를 인식하는 항체를 수득할 수 있다는 사실에 근거한다. 이러한 방법에 따라, 단백질에 특이성인 항체를 사용하여 동물, 바람직하게는 마우스를 면역시킨다. 이어서, 이 동물로부터의 비장 세포를 사용하여 하이브리도마 세포를 생성하고, 후자를 스크리닝하여 단백질-특이성 항체 복합체와의 결합능이 폴리펩타이드에 의해 차단될 수 있는 항체를 생성하는 클론을 동정한다. 이들 항체를 사용하여 동물을 면역시켜 단백질 특이성 항체의 다량 형성을 유도할 수 있다.
본 발명 항체의 Fab 및 F(ab′)2 및 타 단편이 여기에서 기재된 방법에 따라 사용될 수 있으면 유리할 것이다. 이러한 단편은 전형적으로 파파인(Fab 단편 생성) 또는 펩신(F(ab′)2 단편 생성) 같은 효소의 도움하에 단백질 절단에 의해 생성된다. 이와 달리, 단백질을 인식하는 분비된 단편은 재조합 DNA 또는 합성 화학 기술을 적용하여 생성될 수 있다.
인간에서 항체의 생체내 사용을 위해, "인간화된" 키메릭 모노클로날 항체를 사용하는 것이 바람직할 것이다. 이러한 항체는 전술한 모노클로날 항체를 생성하는 하이브리도마 세포로부터 유도된 유전자 작제물을 사용하여 생성될 수 있다. 키메릭 항체 생성방법은 당업자에 공지되어 있다(검토를 위해, Morrison, Science 229:1202 (1985); Oi et al., (Biotechnique 4:214 (1986); Cabilly et al., US 특허 No. 4,816,567; Taniguchi et al., EP 171496; Morrison et al., EP 173494; Neuberger et al., WO 8601533; Robinson et al., WO 8702671, Boulianne et al.,; Nature 312:643 (1984); Neuberger et al., Nature 314:268 (1985) 참조).
실시예 7: 탠지어병의 세포 표현형의 교정
탠지어병은 고밀도 지방단백질(HDL) 입자의 촉진된 이화작용 및 조직내 콜레스테롤 축적을 특징으로 한다. 특히, 탠지어병에 걸린 환자의 피부의 섬유아세포는 주요 HDL 단백질인 아포리포단백질 A-I(apoA-I)에 의해 제공된 콜레스테롤 유출 과정에 의한 콜레스테롤 함량 제거능이 감소되어 있다(Francis et al., 1995). 이러한 특징은 기능의 상실에 상응하며, 가족성 HDL 결핍증에 걸린 환자로부터의 다른 섬유아세포에서도 발견된다(Marcil et al., 1999).
탠지어 섬유아세포의 표현형의 교정은 제안된 서열에 상응하는 완전한 cDNA을 세포 중으로 형질감염시킴으로써 일어날 수 있다. cDNA를 발현 벡터에 삽입한 다음 후술되는 방법에 다라 형질감염시킨다:
1.정상 피험자 및 탠지어병에 걸린 피험자의 섬유아세포 배양액의 제조
인간 피부내 1차 섬유아세포는 팔뚝으로부터 수득한 피부 생검을 배양함으로써 수득된다. 이러한 생검은 "동형접합체"의 임상적 및 생화학적 특징, 즉 오렌지색 편도선, 제 5 퍼센틸 이하의 apo-I 및 콜레스테롤-HDL의 혈장 농도를 지닌 탠지어병 환자로부터 채취된다. 정상 섬유아세포주는 아메리칸 타입 컬춰 컬렉션(Rockville, MD)로부터 수득한다. 섬유아세포를 10% 태 송아지 혈청, 2 mM 글루타민, 페니실린 100 IU/ml 및 스트렙토마이신 100 ㎍/ml로 보충된(EMMEM10으로명명된 배지) EMMEM 배지(이글 변형 최소 필수 배지;GIBCO)에서 배양한다. 콜레스테롤 유출 연구를 수행하기 위해, 이들 세포를 송아지 혈청은 없지만 소 알부민(BSA, 분획 V) 2 mg/ml를 함유하는 전술한 배지에서 콜레스테롤 50 ㎍/ml와 24시간 동안 배양함으로써 콜레스테롤로 예비 로딩한다.
2.콜레스테롤 유출의 연구
24-웰 플레이트에 유착상태로 콜레스테롤로 예비 로딩한 섬유아세포를 EMMEM10 배지 및 1 μCi/ml의 1,2-3H-콜레스테롤(50 Ci/mmol; Dupont; Wilmington, DE)에서 48시간 배양시킨다. 분당 약 100,000 카운트가 웰당 또는 분당 세포 단백질 ㎍당 1000 카운트가 수득되었다. 세포를 EMMEM/BSA 배지로 3회 세척한 다음, 해당 유전자를 옮기고 EMMEM/BSA 배지에 apoA-I를 함유하는 프로테오리포솜 10 ㎍/ml를 첨가함으로써 유출을 개시하기 전에 이 배지와 24시간 동안 배양한다. 이들 프로테오리포솜은 포스파티딜콜린 및 정제된 인간 apoA-I의 음파처리에 의해 제조된다(Jonas, 1986). 세포 형질감염은 칼슘 포스페이트 침전 기술(Sambrook et al., 1989)에 의해 수행된다. 유출기 후, 일반적으로 20시간 후, 배지를 수집하여 원심분리한 다음(1000 g, 5분), 액체 신틸레이션 카운팅에 의해 방사능을 측정한다. 세포내 잔류 방사능도 이소프로판올에서 지질의 추출 후에 밤새 측정한다. 유출물의 %는 상등액 및 세포 추출물에서, 측정된 방사능의 합으로 상등액에서 측정된 방사능을 나눔으로써 계산된다. 내부 표준은 마커 유전자의 형질감염 및 apoA-I를 함유하는 프로테오리포솜 없이 EMMEM/BSA 배지와 24시간에 걸친 배양에 의해 제조된다. 대조 유전자로 형질감염된 정상 섬유아세포로부터 세포 콜레스테롤의 유출은 6 ±2%에 상응하는 반면에, 탠지어병에 걸리고 이 대조 유전자로 형질감염된 섬유아세포로부터 수득된 것은 1% 이하이다. 한편, 이러한 사건 기록에 제안된 유전자에 상응하는 플라스미드로 탠지어병에 걸린 섬유아세포를 형질감염시키면 정상 섬유아세포의 것에 상응하는 수준에서 콜레스테롤 과잉을 제거하는 이들 세포의 능력을 회복시킬 수 있을 것이다.
실시예 8: 폴리뉴클레오타이드에 상응하는 게놈 클론의 분리
전사체에 상응하는 게놈 클론의 분리는 실시예 1에 기재된 방법에 따라, 본 발명에 따른 서열번호 1 내지 서열번호 81의 전사체의 서열에 상응하는 cDNA 서열에 특이적인 프라이머를 사용한 PCR에 의해 인간 게놈 DNA BAC 라이브러리(예를 들면, Mel Simon, CalTech., ref: Kim et al., Genomics (1996), 34:213-218))를 스크리닝함으로써 수행된다.
실시예 9: 본 발명에 따른 전사체에 상응하는 유전자 중 하나의 다형성/돌연변이의 측정
전사체의 서열에서의 다형성 및/또는 돌연변이의 검출은 다양한 프로토콜에 따라 수행될 수 있다. 선택되는 방법은 직접 서열분석이다.
상응하는 유전자의 구조가 알려져 있지 않거나 부분적으로 알려진 전사체의 경우에, 상응하는 유전자의 게놈 서열 뿐만 아니라 이의 인트론-엑손 구조를 정확히 결정하는 것이 필요하다. 따라서, 제 1 단계에서는, 실시예 8에 기재된 방법에 따라 연구된 전사체에 상응하는 게놈 DNA BAC 클론을 분리하고, 상응하는 클론의 삽입체를 서열분석한 다음 수득된 게놈 DNA의 것과 cDNA 서열을 비교함으로써 인트론-엑손 구조를 결정하는 단계를 수반한다.
직접 서열분석에 의한 돌연변이 검출기술은 적어도 8 개체(검토된 병리에 감염된 4 개체 및 비-감염 4 개체)로부터 수득된 서열번호 1 내지 서열번호 81의 cDNA에 상응하는 유전자의 게놈 서열을 비교하는 것으로 이루어진다. 서열 상이는 다형성을 구성한다. 야생형 단백질의 아미노산 서열을 변형시키는 모든 것들은 특히 실시예 8에서 기재된 사례/대조 조합의 연구에서 고려하는 것이 유리한 단백질의 기능에 영향을 줄 수 있는 돌연변이이다.
실시예 10: 원인 돌연변이 또는 전사 차이에 의한 원인 유전자의 동정
실시예 9에 기재된 방법에 따라 동정된 돌연변이 가운데, 질환 표현형과 관련된 모든 것들은 원인성일 수 있다. 이러한 결과의 증명은 모든 병에 걸린 개체에서의 유전자 서열분석 및 이들의 관계(DNA가 이용 가능한 경우)에 의해 수행된다.
더욱이, 병에 걸린 및 병에 걸리지 않은 개체에 특이적인 RNA를 사용하여, 실시예 1에 기재된 방법에 따라, 노던 블롯팅 또는 RT-PCR을 수행하면 연구된 유전자의 발현 수준에서 주목할 만한 변동, 특히 유전자의 전사 부재를 검출할 수 있다.
표 1a
본 발명에 따른 서열의 간단한 설명
표 1b
본 발명에 따른 서열의 간단한 설명
표 1c
본 발명에 따른 서열의 간단한 설명
표 1d
본 발명에 따른 서열의 간단한 설명
참조문헌:

Claims (29)

  1. 서열번호 129 내지 서열번호 160의 아미노산 서열로 이루어진 그룹 중에서 선택된 아미노산 서열을 갖는 단백질 또는 이의 펩타이드 단편이나 변이체를 암호화하는 핵산, 또는 상보 서열을 갖는 핵산.
  2. 서열번호 1 내지 서열번호 81의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 폴리뉴클레오타이드의 적어도 8개의 연속 뉴클레오타이드를 포함하는 핵산, 또는 상보 서열을 갖는 핵산.
  3. 제 2 항에 있어서, 서열번호 1 내지 서열번호 81의 뉴클레오타이드 서열로 이루어진 그룹 중에서 선택된 폴리뉴클레오타이드의 적어도 20개의 연속 뉴클레오타이드를 포함하는 핵산, 또는 상보 서열을 갖는 핵산.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산과 적어도 80% 뉴클레오타이드 동일성을 갖는 핵산, 또는 상보 서열을 갖는 핵산.
  5. 고 엄격 하이브리드화 조건하에서, 제 1 항 내지 제 4 항 중 어느 한 항에 따른 핵산과 하이브리드화하는 핵산, 또는 상보 서열을 갖는 핵산.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산의 적어도 8개의 연속 뉴클레오타이드를 포함하는 뉴클레오타이드 탐침 또는 프라이머.
  7. 제 6 항에 있어서, 15 내지 300 뉴클레오타이드 길이를 갖는 뉴클레오타이드 탐침 또는 프라이머.
  8. 제 6 항에 있어서, 20 내지 200 뉴클레오타이드 길이를 갖는 뉴클레오타이드 탐침 또는 프라이머.
  9. 서열번호 82 내지 101 및 102 내지 128의 서열 중에서 선택된 폴리뉴클레오타이드의 적어도 8개의 연속 뉴클레오타이드를 포함하는 뉴클레오타이드 탐침 또는 프라이머.
  10. a)증폭반응에 필요한 시약의 존재하에서, 표적 핵산의 존재가 추정되는 샘플을, 하이브리드화 위치가 증폭시키고자 하는 표적 핵산 영역의 5′사이드 및 3′사이드에 각각 위치하는 뉴클레오타이드 프라이머의 쌍과 접촉시킨 다음;
    b)증폭된 핵산을 검출하는 단계를 포함하는, 샘플에 함유된 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산의 증폭방법.
  11. 제 10 항에 있어서, 뉴클레오타이드 프라이머가 제 6 항 내지 제 9 항 중 어느 한 항에 따른 프라이머 중에서 선택됨을 특징으로 하는 증폭방법.
  12. a)하이브리드화 위치가 증폭시키고자 하는 표적 핵산의 5′사이드 및 3′사이드에 각각 위치하는 뉴클레오타이드 프라이머의 쌍;
    b)경우에 따라, 증폭반응에 필요한 시약을 포함하는, 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산의 증폭 박스.
  13. 제 12 항에 있어서, 뉴클레오타이드 프라이머가 제 6 항 내지 제 9 항에 따른 프라이머로 이루어진 그룹 중에서 선택됨을 특징으로 하는 핵산 증폭 박스.
  14. 제 6 항 내지 제 9 항 중 어느 한 항에 있어서, 존재가 검출 가능한 마커 화합물을 포함함을 특징으로 하는 뉴클레오타이드 탐침.
  15. a)제 6 항 내지 제 9 항 및 제 14 항 중 어느 한 항에 따른 하나 이상의 핵산 탐침을 시험될 샘플과 접촉시킨 다음;
    b)탐침과 샘플에 존재하는 핵산간에 형성될 수 있는 복합체를 검출하는 단계를 포함하는, 샘플내 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산의 존재를 검출하는 방법.
  16. 제 15 항에 있어서, 탐침이 지지체상에 고정됨을 특징으로 하는 검출방법.
  17. a)제 6 항 내지 제 9 항 및 제 14 항 중 어느 한 항에 따른 하나 이상의 뉴클레오타이드 탐침;
    b)경우에 따라, 하이브리드화 반응에 필요한 시약을 포함하는, 샘플내 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산의 존재 검출 박스.
  18. 제 17 항에 있어서, 탐침이 지지체상에 고정됨을 특징으로 하는 검출 박스.
  19. 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산을 포함하는 재조합 벡터.
  20. 제 1 항 내지 제 5 항 중 어느 한 항에 따른 핵산을 포함하는 재조합 숙주 세포.
  21. 제 18 항에 따른 재조합 벡터를 포함하는 재조합 숙주 세포.
  22. a)서열번호 129 내지 서열번호 160의 서열을 갖는 펩타이드로 이루어진 그룹 중에서 선택된 적어도 15개의 아미노산으로 된 서열을 포함하는 폴리펩타이드, 또는 이의 펩타이드 단편이나 변이체;
    b)단계 a)에서 정의된 폴리펩타이드와 적어도 80% 아미노산 동일성을 갖는 폴리펩타이드로 이루어진 그룹에서 선택된 폴리펩타이드.
  23. 제 21 항에 따른 폴리펩타이드의 아미노산 서열에 대해 아미노산의 1, 2, 3, 4, 5, 10 내지 20개의 치환, 첨가 또는 결실의 아미노산 변형을 포함하는 폴리펩타이드.
  24. 제 21 항 또는 제 22 항에 따른 폴리펩타이드에 대한 항체.
  25. 제 23 항에 있어서, 검출 가능한 화합물을 포함함을 특징으로 하는 항체.
  26. a)샘플을 제 23 항 또는 제 24 항에 따른 항체와 접촉시킨 다음;
    b)형성된 항원/항체 복합체를 검출하는 단계를 포함하는, 샘플내 제 20 항 또는 제 22 항에 따른 폴리펩타이드의 존재 검출방법.
  27. a)제 23 항 또는 제 24 항에 따른 항체;
    b)형성된 항원/항체 복합체의 검출을 허용하는 시약을 포함하는, 샘플내 제 21 항 또는 제 22 항에 따른 폴리펩타이드의 존재 검출용 진단박스.
  28. a)제 21 항 또는 제 22 항에 따른 폴리펩타이드를 후보 물질 또는 분자와 접촉시킨 다음;
    b)폴리펩타이드와 후보 물질간에 형성될 수 있는 복합체를 검출하는 단계를 포함하는, 제 21 항 또는 제 22 항에 따른 폴리펩타이드와 상호작용하는 후보 분자 또는 물질의 스크리닝 방법.
  29. a)제 21 항 또는 제 22 항에 따른 폴리펩타이드;
    b)경우에 따라, 폴리펩타이드와 후보 분자 또는 물질간에 형성된 복합체의 검출에 필요한 수단을 포함하는, 제 21 항 또는 제 22 항에 따른 폴리펩타이드와 상호작용하는 후보 분자 또는 물질의 스크리닝 박스.
KR1020017015017A 1999-05-25 2000-05-25 콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물 KR20020033627A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR99/06587 1999-05-25
FR9906587A FR2794131B1 (fr) 1999-05-25 1999-05-25 Produits d'expression de genes impliques dans des affections associees au metabolisme du cholesterol
US13945099P 1999-06-16 1999-06-16
US60/139,450 1999-06-16
PCT/FR2000/001426 WO2000071710A2 (fr) 1999-05-25 2000-05-25 Produits d'expression de genes impliques dans des affections du metabolisme du cholesterol

Publications (1)

Publication Number Publication Date
KR20020033627A true KR20020033627A (ko) 2002-05-07

Family

ID=26234967

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017015017A KR20020033627A (ko) 1999-05-25 2000-05-25 콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물

Country Status (11)

Country Link
EP (1) EP1183350A2 (ko)
JP (1) JP2003518918A (ko)
KR (1) KR20020033627A (ko)
AU (1) AU4931800A (ko)
BR (1) BR0010916A (ko)
CA (1) CA2371500A1 (ko)
HU (1) HUP0203164A2 (ko)
IL (1) IL145835A0 (ko)
MX (1) MXPA01011882A (ko)
NO (1) NO20015729L (ko)
WO (1) WO2000071710A2 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2367955C (en) 1999-03-15 2009-05-19 University Of British Columbia Abc1 polypeptide and methods and reagents for modulating cholesterol levels
CA2417900A1 (en) 2000-08-01 2002-02-07 Amgen Inc. C3b/c4b complement receptor-like molecules and uses thereof
AT413701B (de) * 2001-11-06 2006-05-15 Bmt Medizinische Forschung Und Strukturelle und funktionelle charakterisierung von cdw92
EP2123676A4 (en) * 2007-01-05 2011-01-05 Univ Tokyo DIAGNOSIS AND TREATMENT OF CANCER USING ANTI-PRG-3 ANTIBODIES
AU2008321840B2 (en) 2007-11-14 2014-02-06 Chugai Seiyaku Kabushiki Kaisha Diagnosis and treatment of cancer using anti-GPR49 antibody

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998020165A2 (en) * 1996-11-06 1998-05-14 Whitehead Institute For Biomedical Research Biallelic markers

Also Published As

Publication number Publication date
JP2003518918A (ja) 2003-06-17
EP1183350A2 (fr) 2002-03-06
HUP0203164A2 (hu) 2002-12-28
WO2000071710A3 (fr) 2001-05-17
WO2000071710A2 (fr) 2000-11-30
MXPA01011882A (es) 2002-05-06
AU4931800A (en) 2000-12-12
BR0010916A (pt) 2002-02-19
NO20015729D0 (no) 2001-11-23
IL145835A0 (en) 2002-07-25
NO20015729L (no) 2002-01-22
CA2371500A1 (fr) 2000-11-30

Similar Documents

Publication Publication Date Title
WO1996038463A1 (en) Dna sequence and encoded mammary-specific breast cancer protein
WO2002072596A1 (en) Steap-related protein
US5872237A (en) Megabase transcript map: novel sequences and antibodies thereto
US6114123A (en) Lipocalin family protein
US20020197602A1 (en) Nucleic acid sequences and proteins associated with aging
US20040058358A1 (en) Lipid metabolism transcription factor
US5585462A (en) Cloning of perilipin proteins
KR20020033627A (ko) 콜레스테롤 대사 관련 질환에 관여된 유전자의 발현산물
EP1854881B1 (en) METHODS FOR IDENTIFYING PURKINJE CELLS USING THE Corl2 GENE AS A TARGET
US20060154277A1 (en) Compositions and methods for diagnosing or treating psoriasis
US6596855B2 (en) Probes for chondrogenesis
JP2004500077A (ja) ステロイド抵抗性ネフローゼ症候群に関与するnphs2遺伝子、上記遺伝子によりコードされるタンパク質、並びにそれらの診断的及び治療的使用
JP2003508074A (ja) 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定
AU1239701A (en) Nope polypeptides, encoding nucleic acids and methods of use
US7166713B2 (en) Variant cleavage stimulation factor and its encoding nucleic acid
Hayes et al. A high-resolution genetic, physical, and comparative gene map of the doublefoot (Dbf) region of mouse chromosome 1 and the region of conserved synteny on human chromosome 2q35
FR2794131A1 (fr) Produits d'expression de genes impliques dans des affections associees au metabolisme du cholesterol
WO2002059149A2 (en) Pro-apoptotic proteins and dna molecules encoding them
WO2001094371A1 (fr) Nouveau polypeptide, proteine ribosomale humaine s4-10, et polynucleotide codant ce polypeptide
WO2003064591A2 (en) Abca8 nucleic acids and proteins, and uses thereof
WO2001046248A1 (fr) Nouveau polypeptide, proteine ribosomale s9 26, et polynucleotide codant pour ce polypeptide
US20030040615A1 (en) Polynucleotides encoding or regulating electron transfer molecules
JP2001017174A (ja) 胎盤型有機アニオントランスポーターとその遺伝子
WO2001075021A2 (fr) Nouveau polypeptide, proteine humaine associee au transport de glucose 10, et polynucleotide codant pour ce polypeptide
WO2001087972A1 (fr) Nouveau polypeptide, proteine dpc4 humaine 9 du facteur d'inhibition de la croissance tumorale, et polynucleotide codant ce polypeptide

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid