KR20040048548A - 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템 - Google Patents

지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템 Download PDF

Info

Publication number
KR20040048548A
KR20040048548A KR1020020076422A KR20020076422A KR20040048548A KR 20040048548 A KR20040048548 A KR 20040048548A KR 1020020076422 A KR1020020076422 A KR 1020020076422A KR 20020076422 A KR20020076422 A KR 20020076422A KR 20040048548 A KR20040048548 A KR 20040048548A
Authority
KR
South Korea
Prior art keywords
search
data
user
weight
field
Prior art date
Application number
KR1020020076422A
Other languages
English (en)
Inventor
김상수
Original Assignee
김상수
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김상수 filed Critical 김상수
Priority to KR1020020076422A priority Critical patent/KR20040048548A/ko
Publication of KR20040048548A publication Critical patent/KR20040048548A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

본 발명은 지능형 데이터베이스 및 검색 편집 프로그램을 이용한 사용자 맞춤 검색 방법과 시스템으로서, 각 전문분야별 디지털 데이터를 특유한 디티디(DTD; Document Type Definition) 형식의 데이터로 변환하고 엘리먼트마다 다른 가중치를 부여하여 저장하고, 사용자의 검색요청이 있는 경우 검색편집 프로그램을 실행하여 가중치를 변경할 수 있도록 하며, 가중치가 높은 엘리먼트의 데이터를 우선적으로 제공함으로써, 사용자 맞춤 검색을 가능하게 한다. 또한, 디티디 형식 데이터로 변환 및 저장하기 전에 페이퍼 문서를 자동으로 텍스트화하고 해당 분야에 맞는 소정의 다국어 번역 프로그램을 구동하여 자동 번역을 수행할 수도 있다.
본 발명을 이용하면, 각종 데이터의 데이터베이스화를 자동화할 수 있을 뿐 아니라, 엘리먼트별 가중치를 부여함으로써 전문가가 추천하는 중요항목별로 정리된 전문분야 데이터를 제공받을 수 있고, 사용자의 가중치 변경에 의하여 사용자 맞춤 검색이 가능해 진다.

Description

지능형 데이터베이스 및 검색 편집 프로그램을 통한 사용자 맞춤 검색 방법 및 시스템 {Method and System for Searching User-oriented Data by using Intelligent Database and Search Editing Program}
본 발명은 지능형 데이터베이스 및 검색 편집 프로그램을 이용한 사용자 맞춤 검색 방법과 시스템, 상세하게는 각 분야별 디지털 데이터를 특유한 디티디(DTD; Document Type Definition) 형식의 데이터로 변환하고 엘리먼트마다 다른 가중치를 부여하여 저장하고, 사용자의 검색요청이 있는 경우 검색편집 프로그램을 실행하여 전문가가 추천하거나 사용자가 원하는 엘리먼트의 데이터를 우선적으로 제공함으로써, 사용자 맞춤 검색을 가능하게 하는 방법 및 시스템에 관한 것이다. 또한, 각 문서를 디티디 변화 및 저장하기 전에 페이퍼 데이터를 자동으로 텍스트화하거나, 해당 분야에 맞는 소정의 다국어 번역 프로그램을 구동하여 자동 번역할 수도 있다.
현재의 인터넷 등을 이용한 정보검색 서비스는 사용자가 자신의 시스템(개인용컴퓨터, 이동통신 단말기 등)을 이용하여 검색 사이트 서버에 접속한 후, 검색어를 입력하거나 디렉토리를 일일이 검색하여 필요한 정보를 얻게 된다.
이러한 온라인 검색사이트는 인터넷 상에 아주 다양하게 존재하고 있으나, 그 검색방법은 기본적으로 검색어와 일치하는 단어를 포함하는 웹페이지를 인덱스 검색을 통하여 추출하여 제공하는 공통적인 방식을 이용한다.
사용자는 이렇게 제공된 검색결과를 일일이 방문하여 확인함으로써, 자신이 원하는 자료를 찾아야 하므로 번거롭다.
더욱이, PDA(Personal Digital Assistant), 셀룰러폰, PCS와 같은 이동통신 단말기의 무선인터넷을 이용하여 필요한 정보를 검색하는 경우, 이동통신 단말기의 디스플레이 용량에 한계가 있어 필요한 정보를 한꺼번에 디스플레이하는 데 어려움이 있다. 예를 들어, 특정 연예인의 프로파일 정보를 요청하는 경우 개인용 컴퓨터에 제공하기 위해 만들어진 문서는 용량이 크고 넓이가 넓어서 이동통신 단말기에 표시하기에 어려움이 있다는 것이다.
한편, 검색을 돕기 위하여 카테고리별로 묶어진 데이터 제공 서비스인 소위 "디렉토리 서비스"가 제공되고 있다. 이러한 디렉토리 서비스에서는 제공가능한 전체 데이터를 대분야별로 나누고, 각 대분야를 다시 세분류하여 저장함으로써, 사용자는 검색 트리를 따라 관심있는 디렉토리에 접근하여 필요한 정보를 찾을 수 있는 것이다.
한편, 특허, 법률, 의약/제약, 바이오 등의 전문분야 자료의 경우에는 여러 항목 중 일반 사용자가 보기에 어느 항목이 중요한지 알 수 없는 경우가 많고, 전문가가 추천하는 항목의 정보를 참조하는 것이 더 좋은 경우가 있다.
이러한 전문분야에 대한 검색의 경우, 전술한 디렉토리 서비스를 이용하는 경우에도 사용자가 원하는 자료에 접근하기가 용이하지 않을 뿐 아니라, 특히 이동통신 단말기를 이용하는 경우에는 모든 항목에 대한 정보를 한꺼번에 디스플레이할 수 없기 때문에, 어느 항목을 선택하여 제공하느냐가 상당히 중요하게 된다.
또한, 현재의 검색 서비스에 의하면 다른 언어로 된 문서를 검색하기 위하여 해당 언어의 검색 사이트에 접속하여 해당 언어로 검색을 하여야 하므로, 언어에 익숙치 않은 사용자는 다른 언어의 자료를 입수하기 거의 불가능하다.
본 발명은 이러한 점에 착안한 것으로 자동화 프로그램에 의하여 필요한 경우 자동번역, OCR에 의한 자동 텍스트변환 및/또는 자동번역을 거쳐 각 분야별 데이터를데이터베이스화할 때 해당 분야의 전문가가 정한 가중치를 각 엘리먼트마다 설정한 디티디(DTD) 형태로 데이터베이스화한다. 사용자가 데이터를 검색하고자 하는 경우 검색편집 프로그램을 실행함으로써 디폴트 가중치에 의한 데이터 검색 및/또는 사용자 변경 가중치에 의한 데이터 검색을 가능하게 한다.
전술한 문제점을 해결하기 위하여 본 발명은, 다양한 분야의 디지털 또는 아날로그 데이터를 각 엘리먼트마다 가중치가 부여된 형태로 자동으로 변환 및 저장하고 있는 검색 시스템을 제공하는 것이다.
본 발명의 다른 목적은 상기 지능형 데이터베이스에 저장된 데이터의 검색시 상기 가중치 변경에 의하여 사용자 맞춤 검색을 가능하게 하는 검색편집 프로그램을 이용하는 사용자 맞춤 검색방법을 제공하는 것이다.
본 발명의 또다른 목적은 아날로그 데이터에 대한 자동 텍스트화 및/또는 다국어로 이루어진 데이터에 대하여 각기 다른 사전을 참조하여 자동으로 번역한 후, 데이터를 각 엘리먼트마다 가중치가 부여된 형태로 자동으로 변환 및 저장하여 구성되는 검색 시스템을 제공하는 것이다.
본 발명의 다른 목적은 상기 검색 시스템에 접속하여 가중치를 변경할 수 있고, 검색 시스템으로부터의 맞춤 검색 데이터를 수신하여 출력할 수 있는 검색 편집 프로그램을 구비하는 사용자 단말기를 제공하는 것이다.
도 1은 본 발명에 의한 사용자 맞춤 검색 방법을 구현하기 위한 전체 시스템 구조를 개략적으로 도시한다.
도 2는 본 발명에 의한 검색 시스템의 개략적인 구성을 도시한다.
도 3은 본 발명에 의한 검색 시스템을 이용한 디티디 데이터 생성 및 저장과정의 흐름을 도시한다.
도 4는 본 발명에 의한 검색과정의 흐름을 도시하는 것이다.
도 5는 본 발명에 사용되는 디티디 형식을 구성하는 노드 트리 및 그에 기초한 문서의 예를 도시한다.
도 6은 본 발명에 의한 사용자 맞춤 검색 과정에서 사용자 단말기에 디스플레이되는 화면의 예를 도시한다.
전술한 목적을 달성하기 위하여 본 발명에 의한 지능형 검색 시스템은 검색요청 사용자 및 외부기기와의 통신을 위한 통신 인터페이스, 각종 검색대상 분야별 데이터를 필요한 엘리먼트로 구분하고 엘리먼트마다 소정의 가중치를 부여하는 가중치 부여 디티디 데이터 생성부, 상기 가중치 부여 디티디 데이터를 각 분야별로 나누어 저장하는 지능형 데이터베이스, 사용자의 검색 요청이 있는 경우 해당되는 디티디 데이터를 사용자 단말기에 맞는 포맷으로 변환하여 전송해주거나, 사용자 단말기에서 실행된 검색편집 프로그램으로부터 가중치 변경 요청이 있는 경우 변경된 가중치에 따라 디티디 데이터를 변환하여 전송해주는 검색 제어부로 이루어진다.
상기 검색 시스템은 페이퍼 데이터를 디지털 텍스트 데이터로 자동 변환하는 자동 텍스트 변환부를 내부에 구비하거나, 외부의 자동 텍스트 변환부와 통신할 수 있다.
또한, 분야별 전문사전 데이터베이스를 참조하여 디지털 텍스트 데이터를 국문으로 번역하는 자동 번역부를 내부에 구비하거나, 외부의 자동 변역부와 통신할 수 있다.
이를 위하여 사용되는 사용자 단말기는 검색편집 프로그램이 설치되어 있거나 검색 편집 프로그램을 다운로드 받아 실행할 수 있는 구조이고, 사용자가 상기 검색 시스템에 접속하여 검색을 하려 하는 경우 검색편집 프로그램이 실행되어 사용자 요청에 의하여 시스템으로부터 전송된 해당 분야의 디티디 데이터를 초기 가중치에 따라 순서대로 출력한다. 또한, 사용자로 하여금 가중치를 변경할 것인지 여부를 확인하고, 가중치를 변경한 경우 변경된 가중치 순서대로 데이터를 재출력한다.
이러한 검색편집 프로그램은 사용자 단말기에 자체 설치될 수도 있으나, 그 대신 검색시마다 검색 시스템에서 제공되는 자바 애플릿 등의 컴포넌트를 단말기의 버추얼 머신 등의 플랫폼이 번역하여 사용할 수도 있다.
또한, 상기 시스템에서는 각 사용자별로 분야별 엘리먼트 가중치값을 저장하는 사용자관리 데이터베이스가 추가로 구비되어 있어서, 한번 검색한 사용자에게는 차기 검색시마다 일일이 가중치를 변경하지 않고서도 사용자에게 맞는 포맷의 디티디 데이터를 제공할 수 있다.
상기 가중치 부여는 각 분야별 전문가에 의하여 정해진 규칙에 따라 이루어지는 것이 바람직하다.
상기 검색편집 프로그램은 사용자 클라이언트 단말기에서 운영되는 컴포넌트(Component) 형태로 임베디드되어 있어서, 유무선 인터넷, 양방향 디지털 텔레비전 송수신망을 통해 단말기가 상기 검색 시스템에 접속하는 경우 상기 검색편집 프로그램이 자동으로 실행되도록 하는 것이 바람직하다.
상기 검색제어부는 검색을 요청한 단말기를 식별하여 해당 단말기의 디스플레이 포맷에 맞도록 데이터를 디스플레이해주기 위하여, 단말기의 플랫폼별로 디티디 데이터를 별도로 생성하여 저장하거나, 검색요청시 실시간으로 단말기에 적합한 포맷으로 디티디 데이터를 변환하도록 하는 것이 바람직하다.
상기 외부 자동 텍스트 변환부와 외부 자동 번역부는 소정의 하드웨어에 설치되는 OCR 소프트웨어 및 번역소프트웨어로 구현될 수 있으며, 자신을 클라이언트로 하고 검색 시스템을 서버로 하는 클라이언트/서버 통신을 하게 함으로써 전체의 공정을 자동화하는 것이 바람직하다.
이하에서는 첨부되는 도면을 참고로 본 발명의 실시예에 대하여 상세하게 설명한다.
도 1은 본 발명에 의한 사용자 맞춤 검색 방법을 구현하기 위한 전체 시스템 구조를 개략적으로 도시한다.
전체 시스템은 사용자 단말기로부터의 요청에 따라 검색 디티디 데이터를 추출하여 사용자 단말기로 제공하는 검색 시스템(100)과, 본 발명에 의한 검색 편집 프로그램(210)을 실행하고 검색 시스템으로부터 검색 디티디 데이터를 수신하여 화면상에 출력하는 사용자 단말기(200), 및 사용자 단말기와 검색 시스템을 연결하는 통신망(300)으로 이루어진다.
또한, 인터넷 통신망을 통하여 검색 시스템에 연동되어 있고 OCR 소프트웨어(410)를 구비하는 외부 자동 텍스트 변환부(400)와 전문사전 데이터베이스(510)를 구비하는 자동 번역부(500)를 추가로 포함하고 있다. 각 구성요소의 세부적인 사항은 아래에서 후술한다.
도 2는 본 발명에 의한 검색 시스템(100)의 개략적인 구성을 도시한다.
본 발명에 의한 검색 시스템(100)은 크게 사용자 단말기 등의 외부 기기와의 통신을 위한 통신인터페이스부(110)와, 각종 검색대상 분야별 데이터를 필요한 엘리먼트로 구분하고 엘리먼트마다 소정의 가중치를 부여하는 가중치 부여 디티디 데이터 생성부(120), 가중치 부여 디티디 데이터를 각 분야별로 나누어 저장하는 지능형데이터베이스(130), 사용자의 검색 요청이 있는 경우 해당되는 디티디 데이터를 사용자 단말기에 맞는 포맷으로 변환하여 전송해주거나, 사용자 단말기에 설치된 검색편집 프로그램으로부터 가중치 변환이 있는 경우 변환된 가중치에 따라 디티디 데이터를 변환하여 전송해주는 검색 제어부(140)로 이루어진다.
또한, 도 1에서와 같이, 페이퍼 데이터를 디지털 텍스트 데이터로 자동 변환하여 검색 시스템으로 제공하는 자동 텍스트 변환부(400)와, 분야별 전문사전 데이터베이스를 참조하여 디지털 텍스트 데이터를 국문으로 번역하는 자동 번역부(500)가 인터넷을 통하여 검색 시스템과 연결되어 있다.
또한, 필요에 따라서 사용자 관리 데이터베이스(150)를 추가로 구비할 수 있으며, 사용자 관리 데이터베이스(150)는 사용자 ID, 비밀번호와 같은 인증정보와, 단말기에 대한 정보 및 해당 사용자가 선택 변경한 분야별 엘리먼트 가중치에 관한 정보 등을 저장한다.
이하에서는 각 구성요소의 세부적인 구성에 대하여 상세하게 설명한다.
우선 사용자 단말기(200)는 유무선 인터넷 또는 디지털 양방향 텔레비전 수신을 이용할 수 있는 한 그 형태에 제한이 없으며, 개인용 컴퓨터, 노트북과 같은 컴퓨터 시스템은 물론, 셀룰러폰, PDA(Personal Digital Assistant), PCS(Personal Communication System), 핸드헬드 PC 등 이동통신 단말기와, 디지털 양방향 텔레비전수신기 또는 셋톱박스 등을 모두 포함한다. 검색 데이터를 출력하는 형태도 전자메일, 웹페이지 출력, 각종 디지털 포맷의 파일 전송, 프린터에서의 출력, 방송화면출력 등 어떠한 방식도 이용가능하다.
각 사용자의 단말기(200)에 관한 정보, 특히 단말기의 디스플레이 모드를 관장하는 정보, 예를 들면, HTML, HDML, WML, XML 등과 같은 표시가능한 문서타입, 디스플레이 화면의 크기, 출력을 위한 플랫폼 등과 같은 정보는 사용자 관리 데이터베이스(150)에 저장되어 있는 것이 바람직하다.
통신망(300)은 유무선 인터넷을 이용할 수 있도록 하는 PSTN, PDSN 이동통신망 등으로 이루어진 인터넷망이거나, 디지털 TV 송수신을 가능하게 하는 케이블TV 망, 위성통신망일 수 있다.
검색 시스템(100)은 이러한 단말기 디스플레이 모드에 관한 정보를 이용하여 지능형 데이터베이스에 저장된 분야별 디티디 데이터를 사용자 단말기에 맞도록 변형하여 전송한다. 예를 들어, 사용자 단말기가 WML을 디스플레이할 수 있고 8라인 정도의 화면크기를 가지는 휴대폰인 경우 그에 맞도록 디티디 데이터의 크기, 종류 및 배치 등을 조절하여 전송해주는 것이다.
디티디(DTD)는 SGML이나 XML 등의 구조화된 문서의 규칙을 따르는 특수한 정의로서, 특정 문서의 문단을 구분하고, 주제의 제목을 식별하고, 또 각각이 어떻게 처리되어야할지를 나타내는 마크업을 식별할 수 있도록, 문서와 함께 동반되는 하나의 문서형식에 대한 규격이다. 문서와 함께 디티디를 보내면, 디티디 리더(또는 디티디 컴파일러)를 갖고 있는 어떠한 장치에서도 그 문서를 처리하여, 원래 의도한대로 화면에 표시하거나 프린트할 수 있게 된다. 이러한 디티디에 의한 데이터 구조화 및 출력은 HTML, HDML, WML, XML 등 유무선 인터넷에서 송수신되는 어떠한 문서에도 적용될 수 있다.
통신 인터페이스부(110)를 포함하는 검색 시스템(100)은 사용자 단말기(200) 및 기타 외부기기와의 통신을 위하여 사용되는 것으로, 포트를 열고 대기(listen)하고 있다가 사용자로부터의 접속요청이 있는 경우에 연결세션을 설정하고 하나의 독립적인 스레드(thread)를 작동시키는 기능을 하는 일반적인 웹서버 데몬 프로그램일 수 있다.
이러한 통신 인터페이스부(110)를 포함하는 검색 시스템(100)은 클라이언트(사용자 단말기)와 인터넷 세션접속을 허용하고, 클라이언트의 요청에 대한 처리결과를 TCP/IP에 의하여 클라이언트시스템으로 재전송하는 일반적인 인터넷 웹서버의 기능을 하는 것으로, 도스(DOS), 윈도우(WINDOWSTM), 리눅스(LinuxTM), 유닉스(UNIX), 매킨토시(Macintosh)등의 운영체제에 따라 다양하게 제공되고 있는 상용 웹서버 프로그램을 이용하여 구현될 수 있으며, 대표적인 것으로는 윈도우 환경에서 사용되는 웹사이트(Website), TTPS와 유닉스환경에서 사용되는 CERN, NCSA, APACHE등이 있다.
또한, 이러한 검색 시스템이 양방향 디지털 텔레비전 방송국(SO)내에 구축되어 있을 수도 있다.
본 발명에 의한 디티디 데이터(DTD Data)를 생성하는 디티디 데이터 생성부(120)는, 각 분야별 디지털 데이터를 특정한 디티디(Document Type Definition) 형식으로 변환하는 기능을 한다. 본 발명에 사용되는 특정 디티디는 전체 데이터를 각 엘리먼트로 분류하고 그를 트리 구조로 계층화한 데이터구조를 이용하되, 각 엘리먼트에 소정의 가중치가 부여되어 있는 것에 특징이 있다. 따라서, 이러한 DTD 형식은 각 분야마다 다르게 구성되며 디티디 구조는 크게 엘리먼트명, 노드 트리, 엘리먼트의 가중치 등으로 이루어진다.
이러한 디티디 데이터의 구조에 대해서는 도 5를 참조하여 아래에서 더 상세하게 설명한다.
예를 들어, 특허분야의 경우 특허 아래에 공개특허, 등록특허, 실용신안의 하위 디렉토리를 구성하고, 각 디렉토리 내부에 저장되는 각 엔터티(Entity)는 다시 발명의 명칭, 출원일, 출원인, 공개일, 요약, 대표도 등의 엘리먼트(또는 필드)로 구성되며, 각 엘리먼트에는 하나 이상의 속성(값)과 가중치가 부여되어 있도록 구성된다.
예를 들어, 발명의 명칭, 출원인, 출원일, 공개일, 요약, 대표도에 각각 6, 5, 4, 3, 2, 1의 가중치가 부여되어 있는 경우라면, 사용자에게 제공될 때 그 가중치에 따라서 우선순위가 결정되는 것이다. 우선순위라 함은 디스플레이되는 순서가 될 수도 있고, 디스플레이 용량에 제한이 있는 경우에는 디스플레이 유무를 결정하는 팩터가 될 수도 있다. 즉, 사용자 단말기가 대용량 디스플레이가 가능한 개인용 컴퓨터 등인 경우에는 해당 특허 데이터를 발명의 명칭, 출원인, 출원인, 공개일, 요약, 대표도의 순서로 디스플레이할 수 있고, 만일 작은 용량의 디스플레이만 가능한 단말기(예를 들면 휴대폰)의 경우에는 발명의 명칭, 출원인, 출원일만 디스플레이 할 수 있다는 것이다.
다른 분야의 디티디 데이터는 고유한 엘리먼트, 노드 트리, 가중치를 통하여 구조화된다.
이 때 엘리먼트에 부여되는 가중치는 해당 분야의 전문가의 의견을 반영하여 정해지는 것이 바람직하다. 예를 들어, 특허정보의 경우 변리사, 특허청 공무원 등이 판단했을 때 일반인들이 가장 중요하게 보아야 할 엘리먼트에 따라서 가중치를 부여하는 것과 같다.
본 발명에서 말하는 전문분야는 예를 들면, 특허분야, 의약/제약분야, 전기/전자분야, 바이오분야, 스포츠분야, 연예분야, 영화분야 등 필요한 모든 분야를 포함하는 것으로 이해되어야 할 것이다.
또한, 디티디 데이터의 작성언어 또는 문법에는 제한이 없으며, HTML, WML, SGML, XML 등의 여하한 언어 또는 문법이 사용될 수 있다.
지능형 데이터베이스(130)는 디티디 데이터 생성부에 의하여 생성된 디티디 데이터를 저장한다. 이러한 지능형 데이터베이스를 생성된 디티디 데이터를 각 분야별로 나뉘어 일종의 디렉토리 구조로 저장하는 것이 바람직하다.
지능형 데이터베이스(130)는 데이터베이스 관리 프로그램(DBMS)을 이용하여 컴퓨터 시스템의 저장공간(하드디스크 또는 메모리)에 구현된 일반적인 데이터구조를 의미하는 것으로, 데이터의 검색(추출), 삭제, 편집, 추가 등을 자유롭게 행할 수 있다.
이러한 데이터베이스는 오라클(Oracle), 인포믹스(Infomix), 사이베이스(Sybase), DB2와 같은 관계형 데이타베이스 관리 시스템(RDBMS)이나, 겜스톤(Gemston), 오리온(Orion), O2 등과 같은 객체 지향 데이타베이스 관리 시스템(OODBMS), 또는, Excelon, Tamino, Sekaiju등의 XML전용Database (XMLNative Database)등을 이용하여 본 발명의 목적에 맞게 구현될 수 있고, 자신의 기능을 달성하기 위하여 적당한 엘리먼트나, 필드(field)들을 가지고 있다.
본 발명에 필요한 전술한 엘리먼트, 트리구조 및 가중치를 포함하도록 각 분야별 지능형 데이터베이스(130)를 구축하고, 관리하는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에 의하여 충분하게 실시할 수 있기 때문에, 그에 대한 상세한 설명은 생략한다.
검색제어부(140)는 사용자의 검색 요청이 접수된 경우, 검색어에 대응되는 디티디 데이터를 지능형 데이터베이스(130)로부터 추출한 후, 해당되는 디티디 데이터를 사용자 단말기(200)에 맞는 포맷으로 변환하여 전송해주거나, 사용자 단말기에 설치된 검색편집 프로그램(210)으로부터 가중치 변환이 있는 경우 변환된 가중치에 따라 디티디 데이터를 변환하여 전송해주는 역할을 하는 일종의 데이터 처리부이다.
검색제어부(140)는 통신인터페이스부(110)를 통하여 검색요청이 수신된 경우, 해당 사용자의 ID 및 비밀번호 등을 이용하여 사용자 인증 또는 식별을 행한다. 그 다음으로 해당 사용자 단말기의 종류를 식별하게 되는데, 이러한 단말기 종류 식별은 미리 사용자 관리 데이터베이스에 저장된 정보를 이용하거나, 단말기로부터 전송되는 단말기 타입 데이터를 이용한다.
사용자 인증 및 단말기 식별이 되면, 지능형 데이터베이스(130)를 검색하여 사용자가 선택한 분야의 디렉토리 정보 또는 검색어에 해당되는 디티디 데이터를 추출한다. 추출된 디티디 데이터 엔터티는 하나 이상의 엘리먼트와 그 값(속성) 및그 엘리먼트에 부여되어 있는 가중치를 포함한다. 검색 제어부는 추출된 디티디 데이터 엔터티를 사용자 단말기에 맞도록 변환하여 통신인터페이스부를 경유하여 사용자 단말기로 전송해준다.
예컨데, 사용자 단말기가 WML 문서를 디스플레이할 수 있고, 화면의 크기가 2.2인치인 휴대폰인 경우, 추출된 디티디 WML 형식의 데이터를 화면 크기에 맞도록 변환하여 제공한다. 이 때, 사용자 단말기의 디스플레이 화면의 크기가 아주 작은 경우 일부 데이터를 생략하고 가중치가 높은 데이터만을 출력하게 할 수도 있다.
검색 제어부(140)는 또한 사용자 단말기에서 실행된 검색 편집 프로그램(210)으로부터 가중치 변경 요청이 있는 경우, 해당 엘리먼트의 가중치를 변경하고 그 변경된 가중치에 따라 검색된 데이터를 다시 재구성하여 출력하게 할 수 있다. 이 때, 특정 분야의 사용자 선택 가중치 정보는 사용자 관리 데이터베이스(150)에 저장·관리될 수 있다.
예를 들어, 검색분야가 특허분야이고 최초에 설정된 가중치가 발명의 명칭, 출원인, 출원일, 공개일, 요약, 대표도에 각각 6, 5, 4, 3, 2, 1이라 가정한다. 그러면, 사용자가 가중치 변경을 하지 않는 디폴트상태에서는 상기 가중치 순서대로 데이터가 출력되거나, 일부 항목을 생략해야하는 경우에는 가중치가 낮은 요약, 대표도 등이 제거된 상태로 출력된다. 그러나, 사용자가 각 엘리먼트에서 관심있는 항목에 가중치를 증가시키고 관심 없는 항목의 가중치를 낮추는 가중치 변경을 한 경우에는, 기검색된 해당 데이터를 다시 재구성하여 제공하거나, 차후 검색부터 변경된 가중치에 따라 데이터를 구성하여 출력하게 된다. 예를 들어, 출원인과 요약의 가중치를 6, 5로 상향하고, 발명의 명칭, 출원일, 공개일, 대표도의 가중치는 4, 3, 2, 1로 조정하였다면, 이후의 검색 결과는 출원인, 요약, 발명의 명칭, 출원일, 공개일, 대표도의 순서대로 출력하는 것이다.
또한, 검색 제어부(140)는 후술할 외부 자동텍스트 변환부(400)를 구동하여 일반 문서형태의 아날로그 데이터를 디지털 데이터로 변환한 후 지능형 데이터베이스(130)에 저장하는 기능과, 외부의 자동 번역부(500)를 구동하여 외국어로 된 디지털 데이터를 자국어로 번역한 후 지능형 데이터베이스(130)에 저장하는 기능을 추가로 구비한다. 이러한 외부 자동텍스트 변환부 및 자동번역부의 동작과 검색 시스템에서의 이용에 대해서는 아래에서 더 상세하게 설명한다.
또한, 검색 제어부(140)는 소정 기간마다 미리 지정된 장소로부터 디지털 데이터를 자동으로 입수하여, 자동 텍스트 변환 및 자동 번역을 통하여 새로운 디티디 데이터를 생성, 저장하도록 할 수 있다.
자동 텍스트 변환부(400)에 이용되는 OCR(Optical Character Reader) 소프트웨어(410)는 현재 일반적으로 이용되고 있는 것으로, 신문이나 잡지, 서류, 책 등의 문서를 스케너로 읽어들여 그 읽어들인 이미지를 문자로 변환시키는 소프트웨어를 말한다.
일반적으로 OCR 소프트웨어(410)는 7개의 단계를 거쳐 이루어지며, 그 단계는 스캔(Scan), 객체 구조화(Object Construction), 추출(Extraction), 세그멘테이션(Segmentation), 노말라이징(Normalizing), 분류(Classifying) 및 해석(Interpretation)이다. 이러한 OCR 소프트웨어는 현재 이용되고 있는 여하한것을 이용할 수 있으므로, 자동 텍스트 변환부에 대한 상세한 설명은 생략한다.
자동 번역부(500)를 구현하는 번역 소프트웨어는 미리 저장된 각 분야별 전문사전 데이터베이스(510)를 참조하여 영어, 일어 등의 데이터를 국문으로 번역한다. 즉, 자동 번역부(500)는 검색 시스템 또는 외부 시스템으로부터 수신한 각종 디지털 데이터를 포맷별로 분류한 후, 전문사전 데이터베이스(510)에 저장된 각각의 언어별 데이터베이스와 다수의 자동 번역 모듈(Module)을 이용하여 자국어 또는 원하는 언어로 번역한다.
여기서, 자동 번역 모듈은 번역의 대상이 되는 언어와 번역되어야 하는 언어별로 구비된다. 예컨대, 한글에서 영어로, 한글에서 일본어로 자동으로 번역하는 자동 번역 모듈은 별개이며, 영어에서 한글로, 일본어에서 한글로 자동으로 번역하는 자동 번역 모듈 역시 별개이다.
자동 번역은 컴퓨터를 이용하여 서로 다른 언어간의 번역 작업을 수행하는 것을 말하는데, 문장을 단어와 같은 작은 단위로 번역하여 변역된 결과를 결합해 완전한 문장을 생성하는 방법이 이용된다. 현재, 컴퓨터를 이용한 기계적인 번역은 완전 자동 번역, 인간 원조형 번역 및 기계 원조형 인간 번역 등으로 분류할 수 있다. 본 발명에 따른 자동 번역부는 인간의 손을 거치지 않는 완전 자동형 번역 방법을 사용한다.
일반적으로 대부분의 자동 번역은 문법 변환 방식과 단어 변환 방식을 이용하고 있다. 문법 변환 방식은 번역 대상 언어의 문장을 보고 문법 구조를 분석하여 분석된 문법 구조를 번역 목적 언어의 문법 구조로 변환한 후, 변환된 문법 구조에조사나 연결어구를 첨가하여 변환한다. 문법 변환 방식은 간단한 문장에서는 번역률이 70% 이상으로 매우 높으나 각각의 언어마다 문법 패턴이 매우 다양하다는 점을 고려하면 데이터베이스로 구축해야 하는 문법 패턴이 기하급수적으로 늘어나는 단점으로 복잡한 문장에서는 번역률이 급격히 감소하는 문제점이 있다.
이러한 문법 변환 방식의 단점을 극복하기 위하여 개발된 방법이 단어 변환 방식이다. 단어 변환 방식은 문장 내에서 사용될 수 있는 각각의 단어를 프로그램화하여 각각의 단어들이 문장의 연결 관계속에서 가질 수 있는 적합한 품사 및 의미를 찾아 번역을 수행하는 방법이다. 하지만, 일반적으로 하나의 단어가 여러 가지 의미를 갖는 경우가 많으므로 엉뚱한 의미로 변역되는 경우가 자주 발생하는 문제점이 있다.
현재, 개발된 자동 번역 기술은 한국어와 일본어의 관계처럼 문법 구조가 유사한 동종(同種) 언어에서는 대략 80% 이상의 높은 번역률을 갖는 반면, 한국어와 영어의 관계처럼 문법 구조가 상이한 이종(異種) 언어에서는 대략 30% 이하의 낮은 번역률을 갖는 것으로 나타나고 있다. 하지만, 이는 일반적으로 사용되는 언어까지 모두 고려한 수치이므로, 본 발명에서와 같이 전문분야의 경우에는 더 높은 번역율을 나타낼 수 있을 것이다.
본 발명에서 사용되는 자동 번역 기술에는 전술한 문법 변환 방식이나 단어 변환 방식뿐만 아니라 현재 동종업계에서 통용되고 있는 모든 자동 번역 기술과 새롭게 개발되는 자동 번역 기술도 포함될 수 있을 것이다.
본 발명에 의한 자동 번역 소프트웨어는 각 분야마다의 쓰이는 용어, 구문,문장등을 저장하는 전문사전 데이터베이스를 참조하여 디지털화된 외국어 데이터를 국문으로 자동 변환한다. 이러한 자동 번역 소프트웨어 또한 현재 이용되고 있는 것이므로 그 상세한 설명은 생략한다. 다만, 다량의 샘플로부터 추출된 인식평가 DB를 기초로 통계적 언어처리방법을 적용함으로써 인식 성능을 높이는 것이 바람직하며, 구문분석 기술과 전문용어사전을 기반으로 잘못 인식된 문자를 자동 교정할 수 있는 기능을 구비하는 것이 바람직하다. 이러한 자동 번역 기술에 대해서는 본 출원인이 출원한 한국특허출원 2002-30436호에 상세하게 기재되어 있다.
이러한 자동 텍스트 변환 및 자동번역 동작은 검색 시스템과 연계되어 실시간으로 이루어져야 하는 바, 검색 시스템(100) 및 지능형 데이터베이스(130)가 서버가 되고, 자동 텍스트 변환부(400)의 OCR 소프트웨어(410)가 클라이언트로 기능하며, 검색시스템(100)의 검색제어부(140)가 OCR 소프트웨어(410)의 API(Application Programming Interface)를 사용하여 일반 문서를 스캐닝하고, 문자 객체를 인식하여 디지털 데이터로 변환한 후 직접 지능형 데이터베이스(130)에 저장한다. API는 응용프로그램이 운영체계나 데이터베이스 관리시스템과 같은 시스템 프로그램과 통신할 때 사용되는 언어나 메시지 형식을 말하는 것으로, OCR 소프트웨어 내에서 실행을 위해 특정 서브루틴에 연결을 제공하는 함수를 호출함으로써 구현된다.
이 때, 검색 시스템(100)의 검색 제어부(140)는 해당 디지털 데이터의 언어를 인식하여 번역이 필요한 경우에는 자동 번역부(500)로 데이터를 전송한다. 이 때에도, 자동 번역부(500)와 검색 시스템(100)과는 서버/클라이언트 통신을 하게되는바, 즉 검색 시스템(100)이 서버로 기능하고 자동 번역부(500)의 번역 소프트웨어가 클라이언트로 기능하도록 하여 데이터 통신을 수행하게 된다.
실제 프로그램에서는 클라이언트측 소프트웨어, 즉 OCR 소프트웨어(410) 및 번역 소프트웨어에 검색 시스템(100)과의 통신모듈을 동적 링크 라이브러리(Dynamic Link Library; 이하 "dll"이라 칭함) 형태의 프로그램으로 연결시켜서 서버/클라이언트 통신을 수행하게 한다. 동적 링크 라이브러리는 주프로그램이 프린터, 스캐너, 기타 외부장치와 통신을 할 수 있게 하는 작은 프로그램을 의미하는 것으로 널리 이용되고 있는 것이므로 그 상세한 설명은 생략한다.
이렇게 클라이언트 소프트웨어쪽에 서버로서의 검색 시스템(100)과의 통신모듈을 프로그래밍하여 전체 공정, 즉 자동 텍스트 변환, 자동 번역, 디티디 데이터 생성 및 저장하는 과정을 자동화시킴으로써 생산성을 향상시킬 수 있다.
또한, 필요한 경우 외국어 텍스트로 변환된 디지털 데이터 및 번역된 데이터가 함께 저장됨으로써, 사용자로 하여금 원 언어에 의한 검색 및 자국어에 의한 검색 모두를 가능하도록 하는 것이 바람직하다.
도 3은 본 발명에 의한 검색 시스템을 이용한 디티디 데이터 생성 및 저장과정의 흐름을 도시한다.
우선, 특정 분야의 자료를 수집(S310)하여 해당 자료가 일반 종이 문서와 같은 아날로그 형태인지 판단하고(S311), 아날로그 형태인 경우에는 외부의 자동 텍스트 변환부를 구동하여 디지털 데이터로 변환시킨다(S312). 이렇게 변환된 디지털 데이터는 바로 지능형 데이터베이스에 저장될 수도 있고(S313), 다음 가공을 위하여 자동 번역부 또는 가중치 부여 디티디 데이터 생성부로 전달될 수도 있다. 물론, 해당 자료가 이미 컴퓨터 파일과 같은 디지털 형태인 경우에는 다음의 번역 단계 또는 디티디 데이터 생성 단계로 이동한다.
그 다음으로, 검색 시스템은 디지털 데이터의 언어를 판단한 후(S314), 외국어인 경우에는 외부의 자동 번역부를 구동하고, 자동 번역부는 해당 분야의 전문사전을 참조하여 디지털 데이터를 국문(자국어)으로 번역한다(S315).
그 다음으로 검색시스템의 가중치 부여 디티디 데이터 생성부는 디지털 데이터를 여러 개의 엘리먼트로 구분하고, 특정한 디티디(Document Type Definition)에 따르는 디티디 데이터로 변환한다. 물론, 이 때, 각 엘리먼트에는 해당 분야의 전문가가 부여한 중요도에 따라 디폴트 가중치가 부여되고, 이렇게 가중치가 부여된 디지털 데이터를 분야별로 지능형 데이터베이스에 저장한다(S316, S317).
디티디 데이터는 각 분야마다 특정되는 디티디 형식에 의하여 구성되는 것으로, 디티디 형식은 엘리먼트명, 노드 트리, 엘리먼트의 우선순위 등에 의하여 특정된다. 즉, 각 분야의 데이터를 특정할 수 있는 엘리먼트를 추출하고, 그 엘리먼트를 부모 엘리먼트(Parent Element)와 자식 엘리먼트(Child Element)로 구분하여 지정하고, 이러한 과정을 반복함으로써 엘리먼트의 계층구조, 즉 노드 트리를 형성하는 것이다.
3개의 계층으로 이루어진 연예(가수)분야의 디티디 형식을 예로 들면, 일단 "가수명부"라는 루트 엘리먼트(Root Element) 아래에 "가수"라는 자식 엘리먼트를 지정하고, 각각의 "가수"엘리먼트 아래에는 "부서", "주소" 및 "이름"이라는 자식엘리먼트를 지정하며, 마지막 계층의 "부서", "주소" 및 "이름" 엘리먼트는 자식 엘리먼트를 보유하지 않고 속성 또는 값으로서의 문자데이터를 사용하는 것으로 가정한다.
그러면 도 5a와 같은 노드 트리가 형성되고, 각각의 "가수" 엔터티는 부서, 주소, 이름이라는 엘리먼트의 속성과 그에 부여되는 가중치로 표현될 수 있는 것이다.
도 5b는 도 5a와 같은 디티디에 기초하여 형성된 특정 엔터티에 대한 디티디 데이터를 표현하는 문서의 예를 도시한다.
도면에서는 "부서"의 속성(Value)으로 "싸이더스", "주소"의 속성으로 "강남구 논현동 501", "이름"의 속성으로 "지오디"가 부여되며, 각각 1, 0, 2의 가중치가 부여되어 있다.
이처럼, 지능형 데이터베이스에 데이터를 입력·저장하기 전에 미리 각 분야별로 계층구조를 갖고 각 엘리먼트별 가중치를 가지는 디티디 형식을 설계해두고, 그에 따르는 디티디 데이터를 형성하여 지능형 데이터베이스에 저장하는 것이다.
도 4는 본 발명에 의한 검색과정의 흐름을 도시하는 것이다.
사용자는 사용자 단말기의 유무선 인터넷을 이용하여 본 발명에 의한 검색 시스템에 접속한 후, 자신의 ID 및 비밀번호를 입력하여 로그인 하고(S411), 디렉토리 서비스 등을 통하여 검색을 원하는 분야를 특정한다(S412). 특정 키워드를 입력하면 검색 시스템은 지능형 데이터베이스를 검색하여 해당 키워드에 해당되는 디티디 데이터를 추출한 후(S413), 사용자 단말기와 디폴트 또는 사용자 지정 가중치에 따라 적절한 형태로 변환하여 단말기로 전송하여 디스플레이한다(S417, S418). 이 때에는 디폴트 가중치 또는 후술할 바와 같은 사용자 변경 가중치 정보를 기초로 데이터의 포함 또는 순서를 결정하게 된다.
도 6a는 휴대폰과 같은 이동통신 단말기를 이용하여 특허분야 데이터를 검색한 결과를 예시한다. 도 6a는 사용자가 가중치 변경을 하지 않은 디폴트 상태에서의 출력화면을 예시한다. 이 때에는 초기 가중치에 따라 "발명의 명칭", "출원인", "출원일", "공개일", "요약"의 엘리먼트값이 포함되어 있으며, 디스플레이 제한에 의하여 가중치가 낮은 "대표도", "출원번호"는 출력되지 아니한 경우이다.
검색 과정 도중에 사용자가 검색 편집 프로그램을 실행하여 각 엘리먼트에 부여된 가중치를 변경할 수 있다. 즉, 검색 초기 또는 검색 도중에 검색 편집 프로그램이 실행(S415)되어 사용자로 하여금 해당 분야의 엘리먼트 가중치를 변경할 수 있도록 하고, 변경이 종료된 경우에 그 변경된 가중치 정보를 검색 시스템으로 전송하여 저장하게 한다(S416). 그 이후에 이루어지는 동일 분야에서의 검색은 변경된 가중치를 기초로 이루어지게 된다. 즉, 특정 분야에 대한 검색 요청이 있는 경우 검색 시스템은 사용자 관리 데이터베이스를 참조하여 해당 사용자가 이미 저장해 놓은 가중치 정보가 있는지 확인하고(S414), 있으면 그에 따라 데이터를 변환하여 제공한다(S417, S418). 사용자가 지정한 가중치 정보가 없는 경우에는 자동 또는 사용자 선택에 따라 검색 편집 프로그램을 구동하여 가중치 변경을 수행하도록 하는 것이다(S415, S416).
검색 시스템은 추출된 디티디 데이터를 디폴트 가중치 또는 변경된 가중치와사용자 단말기의 사양에 따라 적정한 형태로 변환하여 단말기로 전송하여 준다(S417). 사용자 단말기는 디티디 데이터를 수신하여 단말기 화면상에 출력한다(S418).
도 6b는 검색편집 프로그램의 실행시 사용자 인터페이스 화면을 도시하는 것으로, 해당 분야의 각 엘리먼트 이름과 디폴트 가중치를 디스플레이하고 있으며, 각 엘리먼트의 가중치를 변경할 수 있는 필드를 포함하고 있다. 도면에서는 각 엘리먼트 명칭 옆에 가중치를 선택할 수 있는 드롭다운(Dropdown) 메뉴를 제공하고, 드롭 다운창 내부에 있는 값 중에서 하나를 가중치로 선택할 수 있도록 하고 있으나, 이에 한정되는 것은 아니다.
도 6b의 아래에는 "기본값복구"라는 버튼이 있어서, 가중치 변경 도중에 디폴트 가중치 값으로 회귀할 수 있도록 하고 있으며, 가중치 조정이 종료된 후에 "확인"버튼을 누르면 변경된 가중치 정보가 검색 시스템으로 전송되고, 검색시스템은 그 사용자에 대한 해당 분야의 가중치 정보로서 사용자 관리 데이터베이스에 저장한다. 이렇게 변경, 저장된 가중치 정보는 이후에 사용자가 검색시스템에 접속하여 동일한 분야의 검색을 하는 경우에 적용하게 된다.
이러한 가중치 조정과정은 사용자가 특정 분야를 선택하여 검색을 수행하고자 하는 경우에 자동으로 검색 편집 프로그램을 실행하여 수행할 수도 있고, 일단 디폴트 가중치에 의하여 한 번 검색하게 한 후에 사용자의 실행명령이 있는 경우에 한하여 수행하도록 할 수도 있다.
만일, 사용자가 특허정보 중에서 "출원인"과 "출원일"에 관심이 있는 경우,도 6b와 같은 인터페이스 화면에서 "출원인"의 가중치를 6으로 조정하고, "출원일"의 가중치를 5로, 나머지 발명의 명칭, 공개일, 출원번호, 요약 및 대표도의 가중치를 각각 4,3,2,1,0으로 조정하였다고 가정한다.
그러면, 다음에 검색된 자료 또는 도 6a에서 기검색된 디티디 데이터는 도 6c와 같이 변경된 가중치를 기초로 디스플레이되는 바, 도 6c에서는 출원인, 출원일, 발명의 명칭, 요약, 공개일 순서로 디티디 데이터가 출력됨을 알 수 있다.
본 발명은 상기한 실시예에 한정되지 않고, 본 발명의 기술적 요지를 벗어나지 않는 범위 내에서 다양하게 수정 및 변경 실시할 수 있음은 이 기술 분야에서 통상의 지식을 가진 자라면 누구나 이해할 수 있을 것이다.
본 발명에 따르면 종래의 인터넷 검색과 달리, 전문가가 추천하는 중요항목별로 정리된 전문분야 데이터를 제공받을 수 있을 뿐 아니라, 사용자의 가중치 선택에 의하여 사용자 맞춤 검색이 가능해 진다.
또한, OCR 소프트웨어 및 자동 번역 소프트웨어를 사용함으로써, 일반 문서와 같은 아날로그 데이터의 수집을 자동화하고, 외국어로 된 데이터를 자동으로 자국어화할 수 있다. 따라서, 검색 대상을 획기적으로 향상시키고, 검색 시스템의 구축에 소요되는 비용과 시간을 절감할 수 있다.
또한, 본 발명에 의하면, 필요한 데이터의 각 엘리먼트마다 가중치를 부여하고 각 분야마다 특유한 디티디 형식으로 데이터베이스하고, 사용자 단말기에 적합하도록 데이터를 변형하고 제공할 뿐 아니라, 사용자가 선택한 가중치에 기초한 데이터 출력이 가능함으로써, 어려운 전문분야에 대한 적절한 정보 검색 및 단말기의 종류에 무관한 정보 검색이 가능해진다.

Claims (18)

  1. 검색요청 사용자 및 외부기기와의 통신을 위한 통신 인터페이스;
    각종 검색대상 분야별 데이터를 필요한 엘리먼트로 구분하고 엘리먼트마다 소정의 디폴트 가중치를 부여하는 가중치 부여 디티디 데이터 생성부;
    상기 가중치 부여 디티디 데이터를 각 분야별로 나누어 저장하는 지능형 데이터베이스; 및
    사용자의 검색 요청이 있는 경우 요청 키워드에 대항되는 디티디 데이터를 사용자 단말기 사양과 디폴트 가중치에 맞는 포맷으로 변환하여 전송해주거나, 사용자 단말기에서 실행된 검색편집 프로그램으로부터 각 엘리먼트에 대한 가중치 변경 요청이 있는 경우 변경된 가중치에 따라 디티디 데이터를 재변환하여 전송해주는 검색 제어부
    로 이루어지는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  2. 제 1 항에 있어서,
    상기 검색 시스템은 페이퍼 데이터를 디지털 텍스트 데이터로 자동 변환하는 자동 텍스트 변환부를 내부에 구비하거나, 외부의 자동 텍스트 변환부와 통신함으로써, 각 분야의 페이퍼 데이터를 디지털 데이터로 자동 변환하여 상기 가중치 부여 디티디 데이터 생성부로 제공할 수 있는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 검색 시스템은 분야별 전문사전 데이터베이스를 참조하여 디지털 텍스트 데이터를 국문으로 번역하는 자동 번역부를 내부에 구비하거나, 외부의 자동 변역부와 통신함으로써, 각 분야의 디지털 데이터를 자국어로 자동 변환하여 상기 가중치 부여 디티디 데이터 생성부로 제공할 수 있는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  4. 제 3 항에 있어서,
    상기 외부 자동 텍스트 변환부와 외부 자동 번역부는 소정의 하드웨어에 설치되는 OCR 소프트웨어 및 번역소프트웨어로 구현되며, API(Application Programming Interface) 또는 동적 링크 라이브러리(Dynamic Link Library)를 이용하여 자신을 클라이언트로 하고 검색 시스템을 서버로 하는 클라이언트/서버 통신을 함으로써 자동 텍스트 변환 및 자동 번역 공정을 자동화하는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  5. 제 1 항에 있어서,
    상기 검색제어부는 해당 단말기의 디스플레이 포맷에 맞도록 검색된 디티디 데이터를 디스플레이해주기 위하여, 검색을 요청한 사용자 단말기의 사양을 확인하고, 해당 단말기의 플랫폼별로 검색된 디티디 데이터를 별도로 생성하여 저장하거나, 검색요청시 실시간으로 단말기에 적합한 포맷으로 디티디 데이터를 변환하여 제공하는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  6. 제 1 항에 있어서,
    상기 검색 시스템은 각 사용자마다의 인증정보, 단말기 정보 및 특정 분야에 대한 변경 가중치 정보를 저장하는 사용자 관리 데이터베이스를 추가로 구비하는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  7. 제 1 항에 있어서,
    상기 디폴트 가중치는 각 분야별 전문가에 의하여 정해진 규칙에 따라 부여되는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  8. 제 6 항에 있어서,
    상기 검색 제어부는 사용자 관리 데이터베이스를 참조하여, 검색된 디티디 데이터를 해당 사용자 단말기의 사양 및 변경 가중치 정보에 맞도록 변환하여 사용자 단말기로 전송하며,
    변경 가중치 정보가 없는 경우에는 검색된 데이터를 해당 사용자의 단말기 및 해당 분야의 디폴트 가중치에 맞도록 변환하여 사용자 단말기로 전송하는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  9. 제 1 항에 있어서,
    상기 가중치 부여 디티디 데이터의 형식은 하나 이상의 엘리먼트 명칭, 엘리먼트 들의 노드 트리 구조 및 각 엘리먼트에 부여된 가중치로 구성되는 것을 특징으로 하는 사용자 맞춤 데이터 제공 시스템.
  10. 각종 검색대상 분야별 데이터를 필요한 엘리먼트로 구분하고 엘리먼트마다 소정의 가중치가 부여된 가중치 부여 디티디 데이터를 각 분야별로 나누어 저장하는 지능형 데이터베이스를 구비하는 검색 시스템과 통신하여 사용자 맞춤 검색을 가능하게 하는 사용자 단말기로서,
    상기 사용자 단말기는 검색편집 프로그램이 설치되어 있거나 검색 편집 프로그램을 상기 검색 시스템으로부터 다운로드 받아 실행할 수 있는 구조이고, 사용자가 상기 검색 시스템에 접속하여 특정 분야에 대한 검색을 하려 하는 경우 검색편집 프로그램이 실행되어 사용자로 하여금 가중치를 변경할 것인지 여부를 확인하고, 사용자가 가중치를 변경한 경우 변경 가중치 정보를 검색 시스템으로 전송하는 것을 특징으로 하는 사용자 맞춤 검색용 사용자 단말기.
  11. 제 10 항에 있어서,
    상기 사용자 단말기의 검색편집 프로그램은 검색 시스템으로부터 전송된 디티디 데이터를 가중치에 따라 순서대로 단말기 화면상에 출력하는 것을 특징으로 하는 사용자 맞춤 검색용 사용자 단말기.
  12. 제 10 항에 있어서,
    상기 검색 편집 프로그램은 사용자가 검색하고자 하는 분야의 디폴트 가중치 정보를 검색 시스템으로부터 전송 받아 디스플레이하고, 사용자로 하여금 각 엘리먼트의 가중치를 변경할 수 있도록 하는 것을 특징으로 하는 사용자 맞춤 검색용 사용자 단말기.
  13. 제 10 항에 있어서,
    상기 검색편집 프로그램은 사용자 단말기에서 운영되는 컴포넌트(Component) 형태로 임베디드되어 있어서, 유무선 인터넷을 통해 단말기가 상기 검색 시스템에 접속하는 경우 상기 검색편집 프로그램이 자동으로 실행되는 것을 특징으로 하는 사용자 맞춤 검색용 사용자 단말기.
  14. 제 10 항에 있어서,
    상기 사용자 단말기는 유무선 인터넷 또는 양방향 디지털 텔레비전 서비스를 이용할 수 있는 장치로서, 개인용 컴퓨터(PC)와 노트북을 포함하는 컴퓨터 시스템, 셀룰러폰, PDA(Personal Digital Assistant), PCS(Personal Communication System), 핸드헬드 PC를 포함하는 이동통신 단말기, 양방향 디지털 TV 수신기 중 하나 이상인 것을 특징으로 하는 사용자 맞춤 검색용 사용자 단말기.
  15. 각종 검색대상 분야별 데이터를 필요한 엘리먼트로 구분하고 엘리먼트마다 소정의 가중치가 부여된 가중치 부여 디티디 데이터를 각 분야별로 나누어 저장하는 지능형 데이터베이스를 구비하는 검색 시스템과, 검색편집 프로그램이 실행되어 사용자 맞춤 검색을 가능하게 하는 사용자 단말기를 이용한 사용자 맞춤 검색 방법으로서,
    상기 검색 시스템이 각 분야에 대한 디지털 데이터를 수집하고, 수집된 디지털 데이터를 각 분야의 정해진 디티디 형식에 맞도록 변환하여 상기 지능형 데이터베이스에 저장하는 제 1 단계;
    사용자 단말기를 이용하여 상기 검색 시스템에 접속하여 사용자 인증을 받는 제 2 단계;
    상기 검색 시스템이 사용자가 선택한 검색분야를 식별하고, 사용자가 입력한 검색어를 수신하는 제 3 단계;
    상기 검색 시스템이 지능형 데이터베이스를 검색하여 검색어에 해당되는 검색 디티디 데이터를 추출하는 제 4 단계;
    상기 검색 시스템이 해당되는 사용자 단말기 사양 및 디폴트 가중치 또는 사용자 변경 가중치 정보에 맞도록 상기 검색 디티디 데이터를 변환하여 사용자 단말기로 전송하는 제 5 단계; 및
    사용자 단말기가 수신한 검색 디티디 데이터를 단말기 화면상에 출력하는 제 6 단계;
    로 이루어지는 것을 특징으로 하는 사용자 맞춤 검색 방법.
  16. 제 15 항에 있어서,
    상기 제 1 단계는 검색 시스템 내외부의 자동 텍스트 변환부를 이용하여 페이퍼 데이터를 디지털 데이터로 변환하는 자동 텍스트 변환과정을 포함하는 것을 특징으로 하는 사용자 맞춤 검색 방법.
  17. 제 15 항 또는 제 16항에 있어서,
    상기 제 1 단계는 검색 시스템 내외부의 자동 번역부를 이용하여 외국어로 된 디지털 데이터를 자국어 디지털 데이터로 변환하는 자동 번역 과정을 포함하는 것을 특징으로 하는 사용자 맞춤 검색 방법.
  18. 제 15 항에 있어서,
    사용자는 상기 검색 편집 프로그램을 이용하여, 해당 분야의 엘리먼트 디폴트 가중치를 변경하여 변경 가중치 정보를 검색 시스템으로 전송하고, 상기 검색 시스템은 사용자 단말기로부터의 가중치 변경 정보를 수신하여 저장하며, 이후의 동일 분야 검색 시에는 변경된 가중치 정보에 기초하여 상기 검색 디티디 데이터를 변환하여 사용자 단말기로 전송하는 것을 특징으로 하는 사용자 맞춤 검색 방법.
KR1020020076422A 2002-12-03 2002-12-03 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템 KR20040048548A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020076422A KR20040048548A (ko) 2002-12-03 2002-12-03 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020076422A KR20040048548A (ko) 2002-12-03 2002-12-03 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20040048548A true KR20040048548A (ko) 2004-06-10

Family

ID=37343291

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020076422A KR20040048548A (ko) 2002-12-03 2002-12-03 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20040048548A (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
KR100724930B1 (ko) * 2003-09-05 2007-06-04 삼성전자주식회사 사전 행동적 사용자 인터페이스
KR100739348B1 (ko) * 2006-03-06 2007-07-16 엔에이치엔(주) 키워드 별로 사용자의 전문가 지수를 산정하는 방법 및상기 방법을 수행하는 시스템
KR100816912B1 (ko) * 2006-04-13 2008-03-26 엘지전자 주식회사 문서검색 시스템 및 그 방법
WO2010093171A2 (ko) * 2009-02-10 2010-08-19 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법
US8762372B2 (en) 2005-10-23 2014-06-24 Google Inc. Search over structured data
KR101668011B1 (ko) * 2015-11-04 2016-10-28 (주)윕스 맞춤형 검색영역설정 서비스 제공 방법 및 이를 위한 서버
WO2017057858A1 (ko) * 2015-10-01 2017-04-06 한국외국어대학교 연구산학협력단 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템
US9792333B2 (en) 2005-10-23 2017-10-17 Google Inc. Adding attributes and labels to structured data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010100463A (ko) * 2000-05-02 2001-11-14 나정수 인터넷 기반의 가중치 속성을 사용한 정보 검색 방법
KR20010107810A (ko) * 2001-10-12 2001-12-07 주식회사 케이랩 웹 검색시스템 및 그 방법
KR20020017076A (ko) * 2000-08-28 2002-03-07 인소란, 최정자 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법
KR20030092689A (ko) * 2002-05-30 2003-12-06 김상수 자동 번역 기술을 이용한 다국어 전자 카탈로그 제작 방법및 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010100463A (ko) * 2000-05-02 2001-11-14 나정수 인터넷 기반의 가중치 속성을 사용한 정보 검색 방법
KR20020017076A (ko) * 2000-08-28 2002-03-07 인소란, 최정자 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법
KR20010107810A (ko) * 2001-10-12 2001-12-07 주식회사 케이랩 웹 검색시스템 및 그 방법
KR20030092689A (ko) * 2002-05-30 2003-12-06 김상수 자동 번역 기술을 이용한 다국어 전자 카탈로그 제작 방법및 시스템

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100724930B1 (ko) * 2003-09-05 2007-06-04 삼성전자주식회사 사전 행동적 사용자 인터페이스
US8762372B2 (en) 2005-10-23 2014-06-24 Google Inc. Search over structured data
US9792333B2 (en) 2005-10-23 2017-10-17 Google Inc. Adding attributes and labels to structured data
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
KR100739348B1 (ko) * 2006-03-06 2007-07-16 엔에이치엔(주) 키워드 별로 사용자의 전문가 지수를 산정하는 방법 및상기 방법을 수행하는 시스템
KR100816912B1 (ko) * 2006-04-13 2008-03-26 엘지전자 주식회사 문서검색 시스템 및 그 방법
WO2010093171A2 (ko) * 2009-02-10 2010-08-19 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법
WO2010093171A3 (ko) * 2009-02-10 2010-12-09 Oh Eui Jin 다국어 웹페이지 번역 시스템 및 다국어 웹페이지를 번역하여 제공하는 방법
WO2017057858A1 (ko) * 2015-10-01 2017-04-06 한국외국어대학교 연구산학협력단 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템
KR101668011B1 (ko) * 2015-11-04 2016-10-28 (주)윕스 맞춤형 검색영역설정 서비스 제공 방법 및 이를 위한 서버
WO2017078215A1 (ko) * 2015-11-04 2017-05-11 (주)윕스 맞춤형 검색영역설정 서비스 제공 방법 및 이를 위한 서버

Similar Documents

Publication Publication Date Title
US7272595B2 (en) Information search support system, application server, information search method, and program product
US7243095B2 (en) Prose feedback in information access system
US6745181B1 (en) Information access method
US7136846B2 (en) Wireless information retrieval
US6092035A (en) Server device for multilingual transmission system
US7376641B2 (en) Information retrieval from a collection of data
JP4365074B2 (ja) ユーザ定義可能なパーソナリティを備えた文書拡充システム
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US7039625B2 (en) International information search and delivery system providing search results personalized to a particular natural language
EP1450267B1 (en) Methods and systems for language translation
CN101520786B (zh) 一种输入法词典的实现方法和输入法系统
US6604101B1 (en) Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US7092938B2 (en) Universal search management over one or more networks
US20030115552A1 (en) Method and system for automatic creation of multilingual immutable image files
US20080177528A1 (en) Method of enabling any-directional translation of selected languages
US10552467B2 (en) System and method for language sensitive contextual searching
KR101661198B1 (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
US20080114747A1 (en) Speech interface for search engines
WO2002054265A1 (en) Document storage, retrieval, and search systems and methods
US20030093427A1 (en) Personalized web page
KR20040048548A (ko) 지능형 데이터베이스 및 검색 편집 프로그램을 통한사용자 맞춤 검색 방법 및 시스템
KR102088619B1 (ko) 검색 결과별 가변적 사용자 인터페이스 제공 시스템 및 방법
US7127450B1 (en) Intelligent discard in information access system
JP7139157B2 (ja) 検索文生成システム、及び検索文生成方法
KR100519748B1 (ko) 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application