KR20060104681A - Dna 단편 번호를 이용한 특허 검색 시스템 및 방법 - Google Patents

Dna 단편 번호를 이용한 특허 검색 시스템 및 방법 Download PDF

Info

Publication number
KR20060104681A
KR20060104681A KR1020050027026A KR20050027026A KR20060104681A KR 20060104681 A KR20060104681 A KR 20060104681A KR 1020050027026 A KR1020050027026 A KR 1020050027026A KR 20050027026 A KR20050027026 A KR 20050027026A KR 20060104681 A KR20060104681 A KR 20060104681A
Authority
KR
South Korea
Prior art keywords
dna fragment
sequence
search
database
information
Prior art date
Application number
KR1020050027026A
Other languages
English (en)
Inventor
김기은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050027026A priority Critical patent/KR20060104681A/ko
Priority to US11/264,730 priority patent/US20060224328A1/en
Publication of KR20060104681A publication Critical patent/KR20060104681A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 DNA 단편 서열을 입력할 필요 없이 DNA 단편 번호만을 입력하여 상기 DNA 단편에 관한 특허를 검색할 수 있는 시스템 및 방법에 관한 것으로, 상기 시스템은 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스; 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스; 특허 문서에 관한 정보를 저장하는 특허 데이터베이스; 클라이언트로부터 DNA 단편 번호 정보를 받아들이는 인터페이스; 상기 DNA 단편 번호에 응답하여 상기 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 서열 추출부; 상기 추출된 DNA 단편 서열과 매칭되는 서열을 상기 특허 서열 데이터베이스로부터 검색하는 매칭 서열 검색부; 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 상기 특허 서열 데이터베이스로부터 추출하는 특허 번호 추출부; 및 상기 추출된 특허 번호를 입력하여 상기 특허 데이터베이스로부터 특허를 검색하고 그 결과가 상기 인터페이스를 통해 받아들여지는 특허 검색부를 포함한다.
DNA 단편 번호, SNP, rs 번호, 특허 검색

Description

DNA 단편 번호를 이용한 특허 검색 시스템 및 방법{System and method for searching patent using DNA fragment number}
도 1은 본 발명의 바람직한 실시예에 따른 DNA 단편 번호를 이용한 특허 검색 시스템의 구성을 개략적으로 도시한 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 DNA 단편 번호를 이용한 특허 검색 방법을 순차적으로 도시한 흐름도이다.
도 3은 본 발명에 따른 검색 방법의 a) DNA 단편 번호 정보를 받아들이는 단계의 바람직한 일 실시예를 나타내는 화면이다.
도 4는 본 발명에 따른 검색 방법의 b) DNA 단편 서열 추출 단계의 바람직한 일 실시예가 수행되고 있는 상태를 나타내는 화면이다.
도 5는 본 발명에 따른 검색 방법의 b) DNA 단편 서열 추출 단계의 다른 실시예가 수행된 결과를 나타내는 화면이다.
도 6은 상기 도 5에 따른 실시예의 c) 매칭 서열 검색 단계가 수행된 결과를 나타내는 화면이다.
도 7은 상기 도 5에 따른 실시예의 d) 특허 검색 단계가 수행된 결과를 나타내는 화면이다.
본 발명은 DNA 단편 번호를 이용한 특허 검색 시스템 및 방법에 관한 것으로, 보다 상세하게는 DNA 단편 서열을 입력할 필요 없이 DNA 단편 번호만을 입력하여 상기 DNA 단편에 관한 특허를 검색할 수 있는 시스템 및 방법에 관한 것이다.
최근 인간 게놈 전체의 염기서열을 판독하는 인간 게놈 프로젝트(Human Genome Project)가 완성되어 유전자를 이용한 난치성 질환의 진단과 치료에 획기적인 발전이 이루어지고 있으며, 소위 맞춤의학, 예측의학의 시대가 열리고 있다. 유전자가 주어진 역할과 기능을 적절히 수행할 때, 인체는 정상적으로 발생하고, 기능을 발휘하며, 생명을 유지해 갈 수 있다. 그러나 유전자의 아주 작은 부분이라도 돌연변이가 일어나 이상이 생기면 이로 인해 각종 질환과 기형, 심한 경우 사망을 초래할 수 있다. 유전학의 발전에 따라 각 유전자의 기능이 무엇이며, 각 유전자가 질병과 어떠한 연관성을 가지고 있는지가 밝혀지고 있으며, 특정 질환과 관련된 유전자 변이도 확인이 가능하게 되었고, 이에 따라 유전자 진단법이 임상 진료에 이용되고 있다.
특정 질병과 관련된 것으로 유전자 이외에 SNP(single nucleotide polymorphism)가 알려져 있다. SNP는 개인과 개인간의 DNA에 존재하는 한 염기쌍(single base-pair variation)의 차이로 DNA 서열 다형성(polymorphism) 중에서 가장 많이 존재하는 형태로, 게놈 상의 어떤 부위에서도 발생할 수 있다. 예컨대, SNP가 코딩 영역 서열에 발생하는 경우, 다형 형태 중 어느 하나에 의하여 결함 있 거나 변이된 단백질이 발현될 수도 있다. 다른 경우에는 비코딩 영역 서열에 SNP가 발생할 수 있다. 이들 중 일부는 결함 있거나 변이된 단백질의 발현을 초래할 수 있다(예를 들면, 결함 있는 스플라이싱의 결과로서). 어떤 SNP는 표현형에 아무런 영향을 미치지 않을 수도 있다. SNP는 인간의 경우 약 1,000bp 마다 1회의 빈도로 발생하는 것으로 알려져 있다. 이들 SNP가 질병과 같은 표현형에 영향을 미치는 경우, 상기 단일 염기 다형을 포함하는 폴리뉴클레오티드는 이러한 질병을 진단하는 데에 프라이머 또는 프로브로서 사용될 수 있다. 상기 SNP에 특이적으로 결합하는 모노클로날 항체 또한, 질병의 진단에 사용될 수 있다. 현재 여러 연구 기관에서 단일염기 분석 및 그 기능 분석에 관한 연구를 수행하고 있다.
이렇게 찾아낸 유전자 및 SNP의 염기서열 및 기타 실험결과를 데이터베이스화하여 공개, 누구나 접근하여 연구에 이용할 수 있도록 하고 있다. 또한, 상기 유전자 또는 SNP에 고유 번호를 부여함으로써, 전세계 연구자들이 상기 번호를 이용하여 해당 유전자 또는 SNP 서열을 데이터베이스로부터 쉽게 확인 할 수 있다. 유전자의 고유 번호는 예컨대, X12345이고, SNP의 고유 번호는 예컨대, rs12345이다.
생명공학이 급속히 발전함에 따라 막대한 부가가치를 창출하기 시작하면서 그 기초 자원이라 할 수 있는 유전자의 해석과 기능을 밝히는데 세계 각국은 총력을 기울이고 있으며, 그 권리를 보호 받기 위해 유전자 서열을 특허의 청구 범위로 지정하고 있다. 유전자 서열이 특허청구범위로 지정됨에 따라, 세계지적재산권기구(WIPO)와 미국, 일본, 유럽 등을 중심으로 이들 서열을 신속, 정확하게 심사하기 위하여 명세서 내의 서열의 표기를 통일화하고 있다.
하지만, 특허 문서에는 DNA 서열의 특성상 DNA 서열 정보가 수십 페이지에서 수백 페이지에 이르고, 유전자 또는 SNP의 고유 번호가 기재되어 있지 않은 경우가 대부분이다. 따라서, 그의 서열을 정확히 알지 못하는 경우 특허 검색이 불가능한 문제점이 있다. 또한, 그의 서열을 이용하여 특허를 검색한 경우에도 검색된 특허의 수가 너무 많고 리스트 중 관련된 서열을 확인하기는 어려울 뿐만 아니라, 해당 서열을 찾은 경우에도 SNP의 경우 정확한 위치 정보를 확인하기가 어려운 문제점이 있다.
본 발명자는 상기와 같은 종래의 문제점을 해결하기 위하여 연구를 계속하던 중, DNA 단편, 특히 SNP의 서열을 알지 못하는 경우에도 상기 DNA 단편의 고유 번호 및 질병명을 검색어로 하여 상기 DNA 단편 및 그에 관련된 질병에 관한 특허 문서를 효과적으로 검색할 수 있는 시스템 및 방법을 개발함으로써 본 발명을 완성하였다.
본 발명의 목적은 DNA 단편 번호를 이용한 특허 검색 시스템을 제공하는 것이다.
본 발명의 다른 목적은 DNA 단편 번호를 이용한 특허 검색 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 DNA 단편 번호를 이용한 특허 검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공 하는 것이다.
본 발명의 목적을 달성하기 위하여, 본 발명은 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스; 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스; 특허 문서에 관한 정보를 저장하는 특허 데이터베이스; 클라이언트로부터 DNA 단편 번호 정보를 받아들이는 인터페이스; 상기 DNA 단편 번호에 응답하여 상기 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 서열 추출부; 상기 추출된 DNA 단편 서열과 매칭되는 서열을 상기 특허 서열 데이터베이스로부터 검색하는 매칭 서열 검색부; 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 상기 특허 서열 데이터베이스로부터 추출하는 특허 번호 추출부; 및 상기 추출된 특허 번호를 입력하여 상기 특허 데이터베이스로부터 특허를 검색하고 그 결과를 상기 인터페이스를 통해 클라이언트에게 전달하는 특허 검색부를 포함하는 DNA 단편 번호를 이용한 특허 검색 시스템을 제공한다.
본 발명의 다른 목적을 달성하기 위하여, 본 발명은 a) 클라이언트로부터 DNA 단편 번호 정보를 받아들이는 단계; b) 상기 DNA 단편 번호에 응답하여 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 단계; c) 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계; d) 상기 특허 서열 데이터베이스로부터 상기 검색 된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 추출하는 단계; 및 e) 상기 추출된 특허 번호를 입력하여 특허 문서에 관한 정보를 저장하는 특허 데이터베이스로부터 특허를 검색하는 단계를 포함하는 DNA 단편 번호를 이용한 특허 검색 방법을 제공한다.
본 발명의 또 다른 목적을 달성하기 위하여, 본 발명은 상기 DNA 단편 번호를 이용한 특허 검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하에서, 첨부된 도면들을 참조하여 본 발명에 따른 특허 검색 시스템 및 방법에 관해 상세히 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 DNA 단편 번호를 이용한 특허 검색 시스템의 구성을 개략적으로 도시한 블록도이다.
도 1을 참조하면, 본 발명에 따른 특허 검색 시스템(100)은 DNA 단편 서열 데이터베이스(110), 특허 서열 데이터베이스(130), 특허 데이터베이스(160), 인터페이스(180), 서열 추출부(120), 매칭 서열 검색부(140), 특허 번호 추출부(150) 및 특허 검색부(170)를 포함한다. 본 발명에 따른 특허 검색 시스템(100)은 네트워크(2)를 통해 하나 이상의 클라이언트(1)에 연결되어 있다.
DNA 단편 서열 데이터베이스(110)은 DNA 단편 서열에 관한 정보를 저장한다. 본 발명에 있어서, DNA 단편(DNA fragment)은 뉴클레오티드로 이루어진 폴리뉴클레오티드이면 그의 종류에 제한되는 것은 아니지만, SNP 또는 유전자인 것이 바람직하다.
상기 DNA 단편 서열에 관한 정보는 상기 DNA 단편의 번호 정보 및 서열 정보를 포함하고, 추가적으로 등록일자, 등록자, 관련 연구 결과 및 해당 염색체 번호 등을 포함할 수 있다. 상기 DNA 단편이 SNP인 경우 상기 DNA 단편 서열에 관한 정보는 추가적으로 SNP 위치, SNP 위치의 염기 서열 및 출현 빈도 등을 포함할 수 있다.
상기 DNA 단편 서열 데이터베이스(110)는 직접 제작하여 이용될 수도 있고, 그의 출처는 특정 제공 기관에 한정되는 것은 아니다. 상기 DNA 단편 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 데이터베이스가 바람직하다.
특허 서열 데이터베이스(130)는 특허 명세서에 기재된 서열에 관한 정보를 저장한다. 상기 특허 명세서에 기재된 서열에 관한 정보란 본 발명에 따른 DNA 단편의 서열 및 그에 관련된 특허 번호를 포함한다.
상기 특허 서열 데이터베이스(130)는 직접 제작하여 이용될 수도 있고, 그의 출처는 특정 제공 기관에 한정되는 것은 아니다. 상기 특허 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 데이터베이스가 바람직하다.
특허 데이터베이스(160)는 특허 문서에 관한 정보를 저장한다. 상기 특허 문서는 서지사항, 발명의 명칭, 명세서, 청구범위, 도면 및 서열 목록을 포함할 수 있다. 상기 특허 데이터베이스(160)는 미국, 유럽, 일본 또는 한국의 특허청이 제공하는 것일 수 있다. 또한, 상기 특허 데이터베이스(160)는 특허 검색 서비스 제공 회사, 예컨대, 델피온(Delphion) 또는 윕스(Wips)가 제공하는 것일 수도 있다.
인터페이스(180)는 클라이언트로부터 DNA 단편 번호 정보를 받아들인다. 상기 DNA 단편 번호란 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)와 같은 기관에 의해 부여되고 전세계 연구자들에 의해 해당 DNA 단편을 지칭하는 것으로 일반적으로 받아들여지고 있는 번호를 말한다. 상기 DNA 단편 번호는 당업자에 의해 용이하게 이해될 수 있을 것이다. 예컨대, 상기 DNA 단편 번호는 유전자의 경우 X12345의 형태일 수 있고, SNP의 경우 rs12345의 형태일 수 있다.
상기 인터페이스(180)는 네트워크(2)를 통해 하나 이상의 클라이언트(1)에게 신호적으로 연결되어 있고, 서열 추출부(120), 매칭 서열 검색부(140), 특허 번호 추출부(150) 및 특허 검색부(170)와 신호적으로 연결되어 있다.
상기 인터페이스(180)는 추가 검색어 정보 또는 검색 범위 정보를 추가로 받아들이는 것이 바람직하다. 이 경우 상기 인터페이스(180)는 네트워크(2)를 통해 연결된 적어도 하나의 클라이언트(1)로부터 상기 DNA 단편 번호 정보를 받아들여 서열 추출부(120)로 전달하고 상기 추가 검색어 정보 또는 검색 범위 정보를 받아들여 특허 검색부(170)로 전달하고, 상기 특허 검색 결과를 상기 네트워크(2)를 통해 상기 클라이언트(1)에게 전달하게 된다.
또한, 상기 인터페이스(180)는 상기 특허 검색 결과 뿐만 아니라, 서열 추출 결과, 매칭 서열 검색 결과 및 특허 번호 추출 결과를 각각 서열 추출부(120), 매칭 서열 검색부(140) 및 특허 번호 추출부(150)로부터 받아들여 상기 네트워크(2)를 통해 상기 클라이언트(1)에게 전달할 수도 있다.
상기 추가 검색어는 모든 종류의 추가 검색어를 포함할 수 있고, 바람직하게 질병명일 수 있다. 이 경우 특정 SNP와 특정 질병명을 포함하는 특허들을 검색할 수 있다. 또한, 상기 추가 검색어는 발명의 실질적 내용뿐만 아니라, 출원인 또는 발명자와 같은 서지적 사항에 대한 내용일 수도 있다.
상기 검색 범위는 예컨대 발명의 명칭, 요약, 청구항, 색인어, 상세한 설명 또는 서지 사항일 수 있지만, 청구항으로 한정되는 것이 바람직하다. 이 경우 특정 SNP가 청구항에 기재되어 있는 특허를 검색할 수 있다. 또한, 추가 검색어로서 특정 질병명을 선택하고 검색 범위로서 청구항을 선택하는 경우, 특정 SNP와 특정 질병명이 청구항에 기재되어 있는 특허를 검색할 수 있다.
서열 추출부(120)는 상기 DNA 단편 번호에 응답하여 상기 DNA 단편 서열 데이터베이스(110)로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하고, 매칭 서열 검색부(140)로 전달한다. 필요한 경우, 서열 추출부(120)는 상기 추출한 DNA 단편 서열을 인터페이스(180)를 통해 클라이언트(1)에게 전달할 수 있다.
매칭 서열 검색부(140)는 상기 추출된 DNA 단편 서열과 매칭되는 서열을 상기 특허 서열 데이터베이스(130)로부터 검색한다. 상기 DNA 단편이 SNP인 경우에는 서열의 매칭 여부뿐만 아니라, SNP 위치의 동일성도 함께 고려하여 검색한다. 상기 매칭 서열 검색부는 BLAST(Basic Local Alignment Search Tool), FASTA 또는 스미스-워터맨 알고리즘(Smith-Waterman algorithm)과 같은 상용 프로그램일 수 있고, BLAST가 보다 바람직하다. 필요한 경우, 매칭 서열 검색부(140)는 상기 검색된 매칭 서열을 인터페이스(180)를 통해 클라이언트(1)에게 전달할 수 있다.
특허 번호 추출부(150)는 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 상기 특허 서열 데이터베이스(130)로부터 추출한다. 필요한 경우, 특허 번호 추출부(150)는 상기 추출된 특허 번호를 인터페이스(180)를 통해 클라이언트(1)에게 전달할 수 있다.
특허 검색부(170)는 상기 추출된 특허 번호를 입력하여 상기 특허 데이터베이스(160)로부터 특허를 검색하고 그 결과를 상기 인터페이스(180)를 통해 클라이언트(1)에게 전달한다. 상기 특허 검색부(170)는 상기 인터페이스(180)를 통해 추가 검색어 정보 또는 검색 범위 정보를 추가로 받아들일 수 있다. 상기 추가 검색어 정보 또는 검색 범위 정보는 상기에서 설명한 바와 같다. 상기 특허 검색 결과는 예컨대 특허 출원/등록 번호, 발명의 명칭, 요약서, 대표 청구항, DNA 단편 번호, DNA 단편 서열, 해당 서열 목록 또는 질병명 등을 포함할 수 있다. 또한, 상기 특허 검색 결과 페이지 중의 특허 출원/등록 번호 또는 DNA 단편 번호 등에 DNA 단편 서열 데이터베이스(110)의 해당 페이지, 특허 서열 데이터베이스(130)의 해당 페이지 및 특허 데이터베이스(160)의 해당 페이지를 하이퍼링크 시킬 수 있다.
이와 같은 구성을 가지는 상기 시스템(100)은 클라이언트/서버 방식의 시스템이기 때문에 클라이언트(1) 부분에서 수행되는 프로그램에 서버 관련 정보를 입 력해야만 클라이언트/서버간의 통신이 원활하게 이루어지게 된다. 이를 위해 클라이언트(1)측에서 입력해야 하는 기본적인 서버측 정보로는 서버 IP 주소(internet protocol address)와 포트 번호 등이 있다. 본 발명의 시스템을 클라이언트/서버 환경을 기초로 하여 설명하였지만, 그 이외에 웹 환경이나 로컬 환경에서도 적용될 수 있음은 당업자에게 자명할 것이다.
도 2는 본 발명의 바람직한 실시예에 따른 DNA 단편 번호를 이용한 특허 검색 방법을 순차적으로 도시한 흐름도이다.
도 2를 참조하면, 본 발명에 따른 DNA 단편 번호를 이용한 특허 검색 방법은 a) 클라이언트로부터 DNA 단편 번호 정보를 받아들이는 단계(201); b) 상기 DNA 단편 번호에 응답하여 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 단계(202); c) 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계(203); d) 상기 특허 서열 데이터베이스로부터 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 추출하는 단계(208); 및 e) 상기 추출된 특허 번호를 입력하여 특허 문서에 관한 정보를 저장하는 특허 데이터베이스로부터 특허를 검색하는 단계(213)를 포함한다.
본 발명에 따른 특허 검색 방법은 먼저 a) 클라이언트(1)로부터 DNA 단편 번호 정보를 받아들이는 단계(201)를 수행한다. 상기 DNA 단편 번호 정보는 클라이언트(1)로부터 네트워크(2)를 통해 인터페이스(180)에 의해 받아들여지며, 상기 인 터페이스(180)는 상기 DNA 단편 번호 정보를 서열 추출부(120)로 보낸다. 상기 DNA 단편은 뉴클레오티드로 이루어진 폴리뉴클레오티드이면 그의 종류에 제한되는 것은 아니지만, SNP 또는 유전자인 것이 바람직하고, SNP인 것이 보다 바람직하다. 상기 DNA 단편 번호는 하나일 수도 있지만, 둘 이상이라도 무방하다.
도 3은 본 발명에 따른 검색 방법의 a) DNA 단편 번호 정보를 받아들이는 단계(201)의 바람직한 일 실시예를 나타내는 화면이다. 도 3을 참조하면, 복수의 SNP 번호, 즉 rs502612, rs800789, rs1483, rs1513617, rs632585, rs1808597, rs598373, rs177560, rs1394720, rs3741251, rs488115, rs2063728 및 rs372803을 입력하였다. 본 발명의 실시예에서는 Active State ActivePerl5.6을 기본 프로그램으로서 요구한다.
다음으로, 본 발명에 따른 특허 검색 방법은 b) 상기 DNA 단편 번호에 응답하여 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스(110)로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 단계(202)를 수행한다. 상기 DNA 단편 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 데이터베이스가 바람직하다.
도 4는 본 발명에 따른 검색 방법의 b) DNA 단편 서열 추출 단계(202)의 바람직한 일 실시예가 수행되고 있는 상태를 나타내는 화면이다. 도 4에 있어서, 상기 DNA 단편 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information)의 SNP 데이터베이스가 사용되었다.
상기 b) DNA 단편 서열 추출 단계(202)의 결과는 클라이언트(1)에게 전달될 수도 있고, 전달되지 않고 다음 단계로 진행될 수도 있다. 도 5는 본 발명에 따른 검색 방법의 b) DNA 단편 서열 추출 단계(202)의 다른 실시예가 수행된 결과를 나타내는 화면이다. 본 실시예에 있어서, 상기 DNA 단편 번호로서 SNP 번호인 rs1808597을 사용하였고, DNA 단편 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information)의 SNP 데이터베이스를 사용하였다.
다음으로, 본 발명에 따른 특허 검색 방법은 c) 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스(130)로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계(203)를 수행한다. 상기 특허 서열 데이터베이스(110)로서 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 데이터베이스가 바람직하다.
또한, 상기 매칭 서열 검색 단계(203)는 BLAST(Basic Local Alignment Search Tool), FASTA 또는 스미스-워터맨 알고리즘(Smith-Waterman algorithm)과 같은 상용 프로그램에 의해 수행될 수 있고, BLAST에 의해 수행되는 것이 보다 바람직하다.
또한, 본 발명에 따른 검색 방법은 상기 추출된 DNA 단편 서열과 100% 완전 일치되는 특허 서열의 검색이 필요한 경우(204) 완전 매칭 서열 검색 단계(205)를 추가로 수행한다. 이 경우, 상기 c) 단계는 c-1) 상기 특허 서열 데이터베이스로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계(203); 및 c-2) 상기 검색된 매칭 서열 중 상기 추출된 DNA 단편 서열과 완전히 매칭되는 서열을 검색하는 단계(205)를 포함한다.
본 발명에 따른 DNA 단편이 SNP인 경우, 상기 c) 단계는 상기 특허 서열 데이터베이스로부터 추출된 SNP 서열과 매칭됨과 동시에 동일한 SNP 부위를 갖는 서열을 검색하는 것이 필요하다.
상기 c) 매칭 서열 검색 단계(203)의 결과는 클라이언트(1)에게 전달될 수도 있고, 전달되지 않고 다음 단계로 진행될 수도 있다. 도 6은 상기 도 5에 따른 실시예의 c) 매칭 서열 검색 단계(203)가 수행된 결과를 나타내는 화면이다. 본 실시예에 있어서, 상기 매칭 서열 검색부(140)로서 BLAST를 사용하였다. 검색 결과 47개 중 SNP 위치(192번)을 포함하는 17개만을 다시 추출하였다.
다음으로, 본 발명에 따른 특허 검색 방법은 d) 상기 특허 서열 데이터베이스(160)로부터 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 추출하는 단계(208)를 수행한다. 본 단계에서 사용되는 특허 서열 데이터베이스(160)는 상기에서 설명한 바와 같다.
상기 d) 단계는 특허 서열 데이터베이스(160)로부터 직접 특허 번호를 추출할 수도 있지만, d-1) 상기 검색된 DNA 단편 서열의 일련 번호를 추출하는 단계(206); d-2) 해당 일련 번호 서열에 대한 정보를 검색하는 단계(207); 및 d-3) 상기 정보로부터 특허 번호를 추출하는 단계(208)로 구성될 수도 있다. 상기 일련 번호란 각 서열 데이터베이스 기관에 접수되는 접수 번호일 수 있다. 예컨대, 상기 일련 번호로서 NCBI(National Center for Biotechnology Information)에 접수되 는 서열의 접수 번호인 gi 번호가 사용될 수 있다.
상기 d) 특허 번호 추출 단계(208)의 결과는 클라이언트(1)에게 전달될 수도 있고, 전달되지 않고 다음 단계로 진행될 수도 있다.
다음으로, 본 발명에 따른 특허 검색 방법은 e) 상기 추출된 특허 번호를 입력하여 특허 문서에 관한 정보를 저장하는 특허 데이터베이스(160)로부터 특허를 검색하는 단계(213)를 수행한다. 상기 특허 데이터베이스(160)는 미국, 유럽, 일본 또는 한국의 특허청이 제공하는 것일 수 있다.
상기 e) 단계는 상기 추출된 특허 번호만을 입력 받아 수행될 수도 있지만, 인터페이스(180)를 통해 필요한 경우(209, 211) 추가 검색어 정보(210) 또는 검색 범위 정보(212)를 추가로 받아 특허를 검색할 수 있다. 상기 추가 검색어는 상기에서 설명한 것일 수 있고, 질병명인 것이 바람직하다. 또한, 상기 검색 범위는 상기에서 설명한 것일 수 있고, 청구항으로 한정되는 것이 바람직하다.
상기 특허 검색 결과는 예컨대 특허 출원/등록 번호, 발명의 명칭, 요약서, 대표 청구항, DNA 단편 번호, DNA 단편 서열, 해당 서열 목록 또는 질병명 등을 포함할 수 있다. 또한, 상기 특허 검색 결과 페이지 중의 특허 출원/등록 번호 또는 DNA 단편 번호 등에 DNA 단편 서열 데이터베이스(110)의 해당 페이지, 특허 서열 데이터베이스(130)의 해당 페이지 및 특허 데이터베이스(160)의 해당 페이지를 하이퍼링크 시킬 수 있다.
도 7은 상기 도 5에 따른 실시예의 d) 특허 검색 단계(213)가 수행된 결과(214)를 나타내는 화면이다. 본 실시예에 있어서, 상기 특허 데이터베이스로서 유 럽 특허청이 제공하는 특허 데이터베이스를 사용하였고, 추가 검색어 또는 특허 검색 범위는 한정하지 않았다.
본 발명의 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크 및 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.
본 발명의 효과를 확인하기 위하여, 본 발명자는 심근경색증(myocardinal infarction)과 관련된 SNP로 알려져 있는 rs7877에 관한 특허를 검색하고자 기존의 특허 검색 엔진(WIPS; Worldwide Intellectual Property Search) 및 본 발명에 따른 시스템을 이용하여 각각 검색을 수행하였다. 기존의 특허 검색 엔진을 이용하여 검색어 [rs7877 and (SNP or polymorphism)]로 검색한 결과 총 0건의 특허가 검색되었고, 검색어 [(cardiovascular or coronary or myocardial or infarction) and (SNP or polymorphism)]로 검색한 결과 총 221건의 특허가 검색되었으나, 각 특허의 명세서를 확인한 결과 상기 SNP rs7877 및 심근경색증에 관한 특허는 검색되지 않았다. 한편, 본 발명에 따른 시스템을 이용하여 검색어 [rs7877]로 검색한 결과 총 6건의 특허가 검색되었으며, 검색어 [rs7877 and (cardiovascular or coronary or myocardial or infarction)]로 검색한 결과 상기 SNP rs7877 및 심근경색증에 관한 특허 WO2004067774호가 검색되었다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명에 따른 특허 검색 시스템 및 방법을 이용하면 DNA 단편, 특히 SNP의 서열을 알지 못하는 경우에도 상기 DNA 단편의 고유 번호 및 질병명을 검색어로 하여 상기 DNA 단편 및 그에 관련된 질병에 관한 특허 문서를 효과적으로 검색할 수 있다.

Claims (21)

  1. DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스;
    특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베이스;
    특허 문서에 관한 정보를 저장하는 특허 데이터베이스;
    클라이언트로부터 DNA 단편 번호 정보를 받아들이는 인터페이스;
    상기 DNA 단편 번호에 응답하여 상기 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 서열 추출부;
    상기 추출된 DNA 단편 서열과 매칭되는 서열을 상기 특허 서열 데이터베이스로부터 검색하는 매칭 서열 검색부;
    상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 상기 특허 서열 데이터베이스로부터 추출하는 특허 번호 추출부; 및
    상기 추출된 특허 번호를 입력하여 상기 특허 데이터베이스로부터 특허를 검색하고 그 결과를 상기 인터페이스를 통해 클라이언트에게 전달하는 특허 검색부;
    를 포함하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  2. 제 1항에 있어서,
    상기 DNA 단편은 SNP 또는 유전자인 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  3. 제 1항에 있어서,
    상기 DNA 단편 서열 데이터베이스 또는 특허 서열 데이터베이스는 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 것임을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  4. 제 1항에 있어서,
    상기 특허 데이터베이스는 미국, 유럽, 일본 또는 한국의 특허청이 제공하는 것임을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  5. 제 1항에 있어서,
    상기 인터페이스는 추가 검색어 정보 또는 검색 범위 정보를 추가로 받아들이는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  6. 제 5항에 있어서,
    상기 인터페이스는 네트워크를 통해 연결된 적어도 하나의 클라이언트로부터 상기 DNA 단편 번호 정보를 받아들여 서열 추출부로 전달하고 상기 검색어 정보 또는 검색 범위 정보를 받아들여 특허 검색부로 전달하고, 상기 특허 검색 결과를 상기 네트워크를 통해 상기 클라이언트에게 전달하는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  7. 제 5항에 있어서,
    상기 추가 검색어는 질병명인 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  8. 제 5항에 있어서,
    상기 검색 범위는 청구항으로 한정되는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  9. 제 1항에 있어서,
    상기 매칭 서열 검색부는 BLAST(Basic Local Alignment Search Tool), FASTA 또는 스미스-워터맨 알고리즘(Smith-Waterman algorithm)인 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 시스템.
  10. a) 클라이언트로부터 DNA 단편 번호 정보를 받아들이는 단계;
    b) 상기 DNA 단편 번호에 응답하여 DNA 단편 서열에 관한 정보를 저장하는 DNA 단편 서열 데이터베이스로부터 상기 DNA 단편 번호에 대응하는 DNA 단편 서열을 추출하는 단계;
    c) 특허 명세서에 기재된 서열에 관한 정보를 저장하는 특허 서열 데이터베 이스로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계;
    d) 상기 특허 서열 데이터베이스로부터 상기 검색된 DNA 단편 서열과 매칭되는 서열이 포함된 특허 번호를 추출하는 단계; 및
    e) 상기 추출된 특허 번호를 입력하여 특허 문서에 관한 정보를 저장하는 특허 데이터베이스로부터 특허를 검색하는 단계;
    를 포함하는 DNA 단편 번호를 이용한 특허 검색 방법.
  11. 제 10항에 있어서,
    상기 DNA 단편은 SNP 또는 유전자인 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  12. 제 10항에 있어서,
    상기 DNA 단편 서열 데이터베이스 또는 특허 서열 데이터베이스는 NCBI(National Center for Biotechnology Information), SIB(Swiss Institute of Bioinformatics) 또는 EBI(European Bioinformatics Institute)가 제공하는 것임을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  13. 제 10항에 있어서,
    상기 특허 데이터베이스는 미국, 유럽, 일본 또는 한국의 특허청이 제공하는 것임을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  14. 제 10항에 있어서,
    상기 c) 단계는 BLAST(Basic Local Alignment Search Tool), FASTA 또는 스미스-워터맨 알고리즘(Smith-Waterman algorithm)에 의해 수행되는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  15. 제 10항에 있어서,
    상기 c) 단계는
    c-1) 상기 특허 서열 데이터베이스로부터 상기 추출된 DNA 단편 서열과 매칭되는 서열을 검색하는 단계; 및
    c-2) 상기 검색된 매칭 서열 중 상기 추출된 DNA 단편 서열과 완전히 매칭되는 서열을 검색하는 단계를 포함하는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  16. 제 10항에 있어서,
    상기 DNA 단편은 SNP이고, 상기 c) 단계는 상기 특허 서열 데이터베이스로부터 추출된 SNP 서열과 매칭되고 동일한 SNP 부위를 갖는 서열을 검색하는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  17. 제 10항에 있어서,
    상기 d) 단계는
    d-1) 상기 검색된 DNA 단편 서열의 일련 번호를 추출하는 단계;
    d-2) 해당 일련 번호 서열에 대한 정보를 검색하는 단계; 및
    d-3) 상기 정보로부터 특허 번호를 추출하는 단계를 포함하는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  18. 제 10항에 있어서,
    상기 e) 단계는 상기 추출된 특허 번호 이외에 추가 검색어 정보 또는 검색 정보를 추가로 입력하여 특허를 검색하는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  19. 제 18항에 있어서,
    상기 추가 검색어는 질병명인 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  20. 제 18항에 있어서,
    상기 검색 범위는 청구항으로 한정되는 것을 특징으로 하는 DNA 단편 번호를 이용한 특허 검색 방법.
  21. 제 10항에 따른 DNA 단편 번호를 이용한 특허 검색 방법을 컴퓨터에서 실행 시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020050027026A 2005-03-31 2005-03-31 Dna 단편 번호를 이용한 특허 검색 시스템 및 방법 KR20060104681A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050027026A KR20060104681A (ko) 2005-03-31 2005-03-31 Dna 단편 번호를 이용한 특허 검색 시스템 및 방법
US11/264,730 US20060224328A1 (en) 2005-03-31 2005-11-01 System and method for searching patents using DNA fragment number

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050027026A KR20060104681A (ko) 2005-03-31 2005-03-31 Dna 단편 번호를 이용한 특허 검색 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20060104681A true KR20060104681A (ko) 2006-10-09

Family

ID=37071634

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050027026A KR20060104681A (ko) 2005-03-31 2005-03-31 Dna 단편 번호를 이용한 특허 검색 시스템 및 방법

Country Status (2)

Country Link
US (1) US20060224328A1 (ko)
KR (1) KR20060104681A (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200739369A (en) * 2006-04-04 2007-10-16 Sunonwealth Electr Mach Ind Co Searching method for patent database and brief form of searching results outputted therefrom
US20080250016A1 (en) * 2007-04-04 2008-10-09 Michael Steven Farrar Optimized smith-waterman search
US20090313221A1 (en) * 2008-06-17 2009-12-17 Chien-Hsun Chen Patent technology association classification method
US20130198182A1 (en) * 2011-08-12 2013-08-01 Sanofi Method, system and program for comparing claimed antibodies with a target antibody
US11232137B2 (en) 2012-12-18 2022-01-25 RELX Inc. Methods for evaluating term support in patent-related documents
WO2014100202A1 (en) * 2012-12-18 2014-06-26 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for patent-related document analysis and searching
CN111584007A (zh) * 2020-05-25 2020-08-25 北京理工大学 基因功能序列权利范围认定、检索及侵权判定方法与系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249784B1 (en) * 1999-05-19 2001-06-19 Nanogen, Inc. System and method for searching and processing databases comprising named annotated text strings
US20020042784A1 (en) * 2000-10-06 2002-04-11 Kerven David S. System and method for automatically searching and analyzing intellectual property-related materials
US20040015481A1 (en) * 2002-05-23 2004-01-22 Kenneth Zinda Patent data mining

Also Published As

Publication number Publication date
US20060224328A1 (en) 2006-10-05

Similar Documents

Publication Publication Date Title
Attwood et al. PRINTS prepares for the new millennium
Arndt et al. PHASTER: a better, faster version of the PHAST phage search tool
Attwood et al. The PRINTS protein fingerprint database in its fifth year
Madera et al. The SUPERFAMILY database in 2004: additions and improvements
Obenauer et al. Scansite 2.0: Proteome-wide prediction of cell signaling interactions using short sequence motifs
Farré et al. Identification of patterns in biological sequences at the ALGGEN server: PROMO and MALGEN
Waterhouse et al. OrthoDB: the hierarchical catalog of eukaryotic orthologs in 2011
Ginalski et al. ORFeus: detection of distant homology using sequence profiles and predicted secondary structure
Laskowski et al. ProFunc: a server for predicting protein function from 3D structure
Fischer et al. CAFASP‐1: Critical assessment of fully automated structure prediction methods
Finn et al. The Pfam protein families database
Kummerfeld et al. DBD: a transcription factor prediction database
Pearl et al. The CATH database: an extended protein family resource for structural and functional genomics
Strausberg et al. The cancer genome anatomy project: building an annotated gene index
Yeats et al. Gene3D: comprehensive structural and functional annotation of genomes
Shindyalov et al. A database and tools for 3-D protein structure comparison and alignment using the Combinatorial Extension (CE) algorithm
Goodman Biological data becomes computer literate: new advances in bioinformatics
KR20060104681A (ko) Dna 단편 번호를 이용한 특허 검색 시스템 및 방법
Monzon et al. Reciprocal best structure hits: using AlphaFold models to discover distant homologues
Loeffler et al. Improving the usability and comprehensiveness of microbial databases
Pandit et al. SUPFAM—a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes
Yi et al. SPTEdb: a database for transposable elements in salicaceous plants
Kriventseva et al. Improvements to CluSTr: the database of SWISS-PROT+ TrEMBL protein clusters
Bowler-Barnett et al. UniProt and Mass Spectrometry-Based Proteomics—A 2-Way Working Relationship
Lu et al. PA-GOSUB: a searchable database of model organism protein sequences with their predicted Gene Ontology molecular function and subcellular localization

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid