KR101042515B1 - 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 - Google Patents

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 Download PDF

Info

Publication number
KR101042515B1
KR101042515B1 KR1020080125767A KR20080125767A KR101042515B1 KR 101042515 B1 KR101042515 B1 KR 101042515B1 KR 1020080125767 A KR1020080125767 A KR 1020080125767A KR 20080125767 A KR20080125767 A KR 20080125767A KR 101042515 B1 KR101042515 B1 KR 101042515B1
Authority
KR
South Korea
Prior art keywords
information
search
metadata
intention
input
Prior art date
Application number
KR1020080125767A
Other languages
English (en)
Other versions
KR20100067285A (ko
Inventor
정희성
Original Assignee
주식회사 네오패드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 네오패드 filed Critical 주식회사 네오패드
Priority to KR1020080125767A priority Critical patent/KR101042515B1/ko
Priority to CN200980150114.1A priority patent/CN102246164B/zh
Priority to JP2011540611A priority patent/JP5481615B2/ja
Priority to PCT/KR2009/007443 priority patent/WO2010068068A2/ko
Priority to US13/139,118 priority patent/US9256679B2/en
Publication of KR20100067285A publication Critical patent/KR20100067285A/ko
Application granted granted Critical
Publication of KR101042515B1 publication Critical patent/KR101042515B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Abstract

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법이 제공된다. 본 정보 검색방법은, 검색어에 대한 해석결과를 이용하여 파악한 검색자의 의도에 맞는 편집기를 제공하고, 편집기를 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색한다. 이에 의해, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색을 수행할 수 있게 된다.
검색, 형태소 처리, 구문 해석, 의도

Description

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법{Method for searching information based on user's intention and method for providing information}
본 발명은 자연언어의 단어, 구, 문장을 검색어로 하여 정보를 제공하고 검색하되 사용자의 의도에 기반하여 보다 정확한 정보 제공과 검색을 가능하게 하는 다기능 정보 검색방법 및 시스템에 관한 것이다.
최근 정보 및 컨텐츠의 제공자, 소비자의 확대 그리고 다양한 정보 제공 매체의 융합 기술에 대한 개발 요구가 높다. 예를 들면, 유무선 방송 통신기술의 융합 기술, 통합 정보 웹서비스 기술 및 다양한 사용자 계층에 편리한 사용자 인터페이스 기술 개발이 대표적인 것들이다. 이러한 기술의 구체적 내용은 제공되는 또는 제공하는 컨텐츠, 정보의 질 및 의미의 해석을 컴퓨터로 자동 해석하여 정보 컨텐츠 이용자의 취향과 의도에 맞게 그리고 편리하고 다양한 방법으로 이들 정보 컨텐츠가 제시, 제공되는 정보시장기술이 기대되고 있다.
예를 들면, 한국특허 공개번호 제10-2006-0043333호 (데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법)은 데이터 핸들링을 용이 하게 하는 시스템으로서, 데이터를 수신하는 컴포넌트 및 상기 데이터의 의도를 판정하고, 상기 의도에 기초하여 적어도 상기 데이터의 부분집합을 재 체계화하며, 상기 재 체계화된 데이터를 사용자에게 자동적으로 제시하는 데이터 관리자를 포함하는 시스템을 목적으로, 상기 데이터 관리자는 상기 데이터를 분석하고, 상기 데이터를 관련 특징을 갖는 하나 이상의 집합으로 분류하며, 상기 데이터의 집합 중 적어도 하나의 집합으로부터 특징들을 추출하여 상기 데이터의 부분집합을 형성하는 시스템으로, 또, 상기 데이터 관리자는, 상기 데이터 분석을 용이하게 하기 위해, 상기 데이터의 메타데이터, 속성, 내용, 문맥, 키워드, 이력, 경험(heuristics), 추론, 규칙, 구분(demarcation), 시간, 요일, 관련된 핸들링 비용, 관련된 핸들링 이득, 소스 중 적어도 하나를 이용하며, 상기 특징은 구문론적 구조, 구문론적 속성, 언어적 구조 및 언어적 속성 중 하나에 적어도 부분적으로 기초하여 추출되는 시스템으로, 상기 언어적 특징은 문장에서 발생하는 단어, 문장에서 발생하는 이중음자 단어(Word bigram) 및 문장에서 발생하는 삼중음자 단어(Word trigram) 중 적어도 하나를 포함하는 시스템을 목적으로 하고 있다.
한국특허 공개번호 제2002-0028593호 (유해 단어 차단 방법)은 컴퓨터 이용자가 회원정보를 입력하고 관리서버에 접속하는 단계, 상기 컴퓨터 이용자는 상기 관리서버가 디스플레이 시킨 정보입력화면에 등록/전송을 위한 정보를 입력하는 단계, 상기 관리서버의 유해단어차단모듈은 상기 컴퓨터 이용자가 입력한 상기 정보에 유해 단어가 포함되어 있는지를 판단하는 단계, 상기 관리서버는 상기 유해단어차단모듈의 판단 결과에 따라서 컴퓨터 이용자와 연결을 차단하거나, 상기 정보를 등록/전송하는 단계로 이루어지는 것을 특징으로 하는 유해 단어 차단 방법을 특징으로 하고 있으나, 유해 단어에 대한 정의를 은어, 비속어, 성적 모독 또는 인격 모독에 관련한 것을 의미한다 하고 전송되는 메시지에 유해한 단어가 포함되어 있지 않을 경우, 채팅을 계속 진행하는 처리 모듈로 구성되어 있다. 상기 특허는 채팅 상의 메시지 속에 유해단어 포함 여부를 중심으로 한 것이다.
한국특허 공개번호 제10-2006-0062300호 (유해 사이트 차단을 위한 다단계 텍스트 필터링 방법)은 음란사이트를 차단하기 위한 자료로 사용할 텍스트를 그 음란성 정도로 구분하여 적어도 하나 이상의 집합으로 구분한 후 데이터베이스화하는 단계, 접속중인 웹 사이트로부터 텍스트를 수집하는 단계 및 상기 텍스트를 상기 집합내의 텍스트들과 비교하여 적어도 하나 이상의 다단계 필터링을 수행하여 상기 접속중인 웹사이트의 차단여부를 결정하는 단계를 포함하는 것을 특징으로 하는 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법으로 텍스트 내에 음란성 정도에 따라 유해사이트를 차단하는 것이다.
한국특허 공개번호 제10-2006-0087735호 (개선된 스팸성 메시지 필터링을 제공하는 시스템 및 방법)은 스팸성 메시지 필터링을 제공하는 시스템에 있어서, 발신자 단말기로부터 사용자 단말기로 전송되기 위한 메시지를 수신하는 무선 네트워크 서버와, 자연어 문장의 사용례들과 이들 사용례에 대한 부속 정보들이 저장되어 있으며, 이를 각각의 사용 용도에 따라 카테고리별로 분류 가능한 대규모 언어 DB(Database)인 코퍼스DB와, 상기 무선 네트워크 서버에서 상기 메시지의 수신을 감지하고, 상기 수신 메시지에 포함된 문장으로부터 적어도 하나의 명사형 키워드 를 추출하는 어휘 분석부와, 상기 추출된 명사형 키워드들 중 어느 하나를 선택하여, 사용자가 스팸 메시지로 설정한 적어도 하나의 상기 코퍼스 DB의 사용자 카테고리들 각각에 포함된 문장들에서 사용된 스팸 빈도수들과, 상기 사용자 카테고리가 아닌 카테고리에 포함된 문장들에서 사용된 일반 빈도수를 검색하는 코퍼스 검색부와, 상기 적어도 하나의 스팸 빈도수와 상기 일반 빈도수가 입력되면, 상기 선택된 명사형 키워드가 포함된 문장이 상기 사용자 카테고리에 포함될 확률을 산출하는 확률 계산부와, 상기 어휘 분석부와 상기 코퍼스 검색부를 제어하여 상기 확률 계산부로부터 각각의 명사형 키워드마다의 스팸 메시지 포함 확률이 산출되도록 하고, 산출된 확률들에 대한 통계치를 산출하여 상기 수신 메시지가 스팸 메시지인지 아닌지를 판단하며, 판단 결과를 상기 무선 네트워크 서버로 전송하는 필터링 제어부를 구비하는 것을 특징으로 하는 개선된 스팸성 메시지 필터링을 제공하는 시스템으로 메시지의 스팸성을 평가, 분석, 분류하는 방법론이다.
한국특허 공개번호 제10-2008-0000416호 (유해 메시지 여과 시스템과 그 여과 방법 및 이를 기록한 기록매체)은 네트워크를 통하여 연결된 클라이언트로부터 수신되는 메시지를 저장하는 데이터베이스를 구비하고 유해 메시지를 여과하는 시스템에 있어서, 상기 메시지를 수신하는 메시지 수신수단, 수신된 상기 메시지에서 다수의 단어를 추출하는 단어 추출수단, 추출된 상기 다수의 단어를 이용하여 상기 메시지의 유해 메시지 여부를 판단하고 상기 데이터베이스에 저장하는 평가수단을 포함하고, 상기 평가수단은 상기 데이터베이스에 저장된 단어 평가값을 이용하여 상기 메시지의 유해 메시지 여부를 판단하고 상기 메시지를 다수의 유해 메시지 분 류로 세분화하는 것을 특징으로 하는 인터넷 커뮤니티 상의 유해 메시지 여과 시스템으로 메시지의 유해 여부를 분류하는 기술 분야이다.
한국특허 등록번호 제10-0484944호 (국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치)는 원시문장 형태소 분석 결과로부터 기본 구문 구조 생성 규칙, 의존 구문 규칙, 형태소 의미 전자 사전, 의미 격틀 및 용언구 의미 공기사전을 이용하여 단문을 인식하는 단문 인식수단, 의미 격틀 및 용언구 의미 공기사전을 이용하여 보조사에 대한 격 복원을 수행하는 보조사 격 복원수단, 용언구 공기사전을 이용하여 용언의 논항 명사에 대한 의미를 결정하는 논항 명사 의미 결정수단, 및 명사/조사/명사, 명사/명사의 공기정보로 구성된 명사구 의미 공기사전을 이용하여 명사구내의 명사 및 복합 명사내의 명사들에 대한 의미를 결정하는 명사구 의미 결정수단, 을 포함하는 것을 특징으로 국소 구문관계 및 의미 공기사전에 기반한 형태소 의미 자동 태깅장치에 관한 것으로 언어학적 견지에서 구문 구조 정보를 이용하여 기존의 다른 의미 모호성 장치들보다 정확한 공기 정보인 구문 문맥 정보를 이용함으로써 명사의 의미 모호성을 해결하는 방법을 제시하고 있다.
한국특허 등록번호 제10-0757951호 (웹페이지의 형태소 분석을 통한 검색 방법)은 컴퓨터, 노트북, 핸드폰, PDA 등의 클라이언트와, 상기 클라이언트에게 정보를 제공하는 분석서버에 있어서, 상기 클라이언트 사용자가 탭브라우저를 통하여 웹사이트 등에 접속하면, 접속된 사이트의 내용이 탭브라우저에 표시되는 단계, 상기 분석서버는 상기 클라이언트의 탭브라우저에 표시되는 내용에 대한 문맥을 문맥 형태소 분석을 통하여 반복되는 문장, 단어의 빈도수를 식별하는 단계, 상기 식별 된 단어 중에서 기준치 이상의 빈도수를 갖는 문장, 단어를 중요단어인 키워드로 선정하는 단계, 상기 선정된 중요단어를 각 탭브라우저의 제목으로 출력하는 단계, 상기 각 탭브라우저의 제목을 포털사이트의 질의어로 사용하여 검색하고, 검색결과를 별도의 각 탭브라우저의 내용으로 출력시키는 단계를 포함하는 것을 특징으로 하는 웹페이지의 형태소 분석을 통한 검색 방법에 관한 것으로 상기 특허는 검색시스템의 일 방법론으로 텍스트 속에 출현하는 문장수, 단어수를 형태소 처리로 계산하여 그것을 키워드로 탭 웹브라우저 제목으로 출력하는 방법이다.
한국특허 등록번호 제10-0691400호 (부가 정보를 이용하여 형태소를 분석하는 방법 및 상기 방법을 수행하는 형태소 분석기)는 형태소 분석방법에 있어서, 검색 색인용 데이터로부터 형태소 분석 대상 및 상기 형태소 분석 대상과 연관된 부가 정보를 획득하는 단계, 상기 부가 정보에 기초하여 키(Key)를 생성하는 단계, 및 상기 키를 활용하여 상기 형태소 분석 대상에 대해 형태소 분석을 수행하는 단계를 포함하는 것을 특징으로 하는 형태소 분석 방법이다.
한국특허 공개번호 제10-2007-0029389호 (핵심 키워드를 이용한 광고서비스 제공방법, 시스템 및 이를 구현하기 위한 프로그램이 기록된 기록매체)는 핵심 키워드를 이용한 키워드 광고 서비스를 제공하기 위해 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며 디지털 처리 장치에 의해 판독될 수 있는 기록매체로서, 컨텐츠 텍스트의 형태소를 분석하여 키워드를 추출하는 단계, 광고 키워드 DB 서버와의 인터페이싱을 통해 핵심 키워드를 결정하는 단계, 광고 DB 서버와의 인터페이싱을 통해 상기 핵심 키워드에 매칭되는 광고 리스트를 수신하는 단계 및 상기 광고 리스트에 포함된 광고 중 적어도 하나를 상기 컨텐츠 텍스트에 삽입하는 단계를 수행하는 프로그램이 기록된 기록매체이다.
한국특허 공개번호 제10-2006-0011333호 (메시지 분석을 통한 지역정보 제공 시스템 및 그 방법)은 지역 및 업종 별로 광고 정보를 저장하고 있는 데이터베이스, 저장된 단문 메시지 또는 문자 메시지를 분석하기 위한 메시지 인식수단, 저장된 음성 메시지를 분석하기 위한 음성 인식수단, 가입자 단말기의 현재 위치를 확인하기 위한 위치정보 수집수단, 서비스 가입자와 관련된 메시지가 저장되어 있는지를 상기 메시지 인식수단과 음성 인식수단으로 요청하고, 상기 메시지 인식수단과 음성 인식수단으로부터 전달된 메시지 분석 결과를 확인하여, 선택적으로 상기 위치정보 수집수단으로 가입자 단말기의 현재 위치 정보를 요청하며, 원하는 정보를 가입자 단말기로 전달하기 위해 상기 메시지 분석 결과에 따른 원하는 업종과 지역 정보를 제공하는 서비스 제어수단 및 상기 서비스 제어수단으로부터 전달된 업종과 지역 정보를 이용해 상기 데이터베이스로부터 정보를 검색하여, 검색 결과를 단문 메시지에 포함시켜 가입자 단말기로 전송하는 SMS 생성수단을 포함하는 것을 특징으로 하는 메시지 분석을 통한 지역정보 제공 시스템이다.
한국특허 공개번호 제10-2007-0015752호 (광고 유발 메시징 서비스 시스템 및 그 방법)은 광고 유발 메시징 서비스 시스템에 있어서, 발신단말기로부터 전송된 메시지를 분석하여 광고 유발 식별자를 검출하면, 미리 지정된 광고메시지를 상기 발신단말기로 전송한 후, 상기 메시지의 내용을 수신단말기로 전송하는 메시지 서버를 포함하는 것을 특징으로 하는 광고 유발 메시징 서비스 시스템이다.
한국특허 등록번호 제10-0775680호 (이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법 및 그 시스템)은 무선 통신망을 통해 접속된 이동통신 단말기와 서버 사이에서 메신저를 통해 서로 메시지를 주고받는 방법에 있어서, 상기 서버와 접속된 상기 이동통신 단말기가 채팅 대상의 임의의 가상 대화 상대를 선택하는지 판단하는 단계와, 상기 서버에서는 상기 이동통신 단말기의 사용자 선호 정보에 따라 광고 컨텐츠 상품의 채팅 시나리오를 추출하여 상기 시나리오 규칙에 따른 메시지를 상기 이동통신 단말기로 전송하는 단계와, 상기 이동통신 단말기에서 상기 서버의 메시지에 대한 응답 메시지를 전송하는 단계와, 상기 서버에서 수신된 상기 이동통신 단말기의 메시지를 분석하여 사용자 의도와 상기 시나리오 규칙에 따라 광고 컨텐츠 정보 추천 허가를 요청하는 메시지를 상기 이동통신 단말기로 전송하는 단계와, 상기 서버에서는 상기 이동통신 단말기에서 상기 광고 컨텐츠 정보 추천을 허가하는 메시지를 전송할 경우 상기 광고 컨텐츠 정보를 상기 이동통신 단말기로 전송하는 단계를 포함하며, 상기 서버에서 상기 이동통신 단말기에 메시지를 전송하는 단계는 이전에, 상기 서버에서 상기 이동통신 단말기의 메시지를 분석하여 상기 사용자의 의도에 대응되게 상기 메신저의 캐릭터 상태를 조정하는 단계를 더 포함하는 것을 특징으로 하는 이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법이다.
한국특허 등록번호 제10-0597435호 (정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법)은 입력된 질문에 포함된 작품명을 인식하는 질문 작품명 처리부, 질문을 형태소분석, 개체명 인식, 어휘 의미태깅 과정을 통해 개개의 어휘를 의미 있는 코드로 변환하는 질문 언어분석부, 질문의 의미 있는 LSP 형태 코드와 미리 정의된 질문분류 규칙을 이용하여 질문이 요구하는 정답 유형을 분류하는 규칙기반 질문분류부, 질문의 정답유형이 태깅된 학습문서로부터 구축된 통계정보를 이용하여, 질문의 LSP 코드에 대한 분류를 수행하는 통계기반 질문분류부 및 규칙기반 질문분류와 통계기반 질문분류의 결과를 이용하여 최종적으로 사용자의 질문에 대한 정답의 유형을 판별하는 질문 정답유형 결정부를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템방법이다.
한국특허 등록번호 제10-0361166호 (정보 검색 시스템 및 그 방법)은 다수의 정보들이 분야별로 분류되고, 분류된 분야마다 코드가 부여되어 있으며, 각 분야의 코드와 연관하여 해당 분야에 포함되는 다수의 정보를 나타내는 단어들이 코드화 되어 있는 데이터 베이스와 데이터를 검색하고자 하는 이용자가 통신 장치를 이용하여 네트워크를 통해 접속한 후 검색하고자 하는 정보를 나타내거나 해당 정보가 속하는 분야를 나타내는 단어들을 입력하면, 입력된 단어들을 코드화하고 코드화된 단어들을 토대로 하여 상기 데이터 베이스를 검색하여 코드화된 단어들에 해당하는 정보를 찾는 처리 장치를 포함하며, 상기 데이터 베이스에 저장된 정보는 다수의 정보 영역으로 분류되고 상기 정보 영역에는 각각 정보 분류 코드가 할당되고 하나 이상의 세부 정보 영역으로 분류되며, 상기 세부 정보 영역들은 해당 정보 영역의 정보 분류 코드와 연관하여 코드화되며, 상기 정보를 나타내는 단어들 중 서로 동 일하거나 비슷한 의미를 가지는 단어들은 동일한 코드로 저장되어 있으며, 각 단어 코드들은 설정된 순서로 배열되어 있는 정보 검색 시스템 방법이다.
한국특허 공개번호 제10-2005-0092955호 (온라인 광고 시스템 및 광고 방법)은 광고될 정보가 저장되어 있는 제1저장장치, 원본 컨텐츠가 저장되어 있는 제2저장장치, 제2저장장치로부터 원본 컨텐츠를 가져와 자연어 처리 기법을 통해 분석하고, 이 분석 결과에 대응하는 광고될 정보를 제1저장장치로부터 가져와 상기 광고 정보 중 일부를 상기 원본 컨텐츠에 삽입하는 적어도 하나의 서버 그리고 상기 적어도 하나의 서버에 의해 상기 광고 정보가 삽입된 컨텐츠가 저장되어 있는 제3 저장장치를 포함하는 것을 특징으로 하는 온라인 광고 시스템 방법이다
한국특허 등록번호 제10-0669534호 (문장추상화와 개연규칙을 활용하는 문서요약 방법과 시스템, 그리고 문장 의미 분석 및 표현방법)은 요약하고자 하는 문서 내용에 대해 입력, 저장하는 문장입력 단계; 상기 단계에서 저장되는 데이터에 대해 구문 분석, 저장하는 구문분석 단계; 상기 단계에서의 구문 데이터들을 순차적으로 읽어 들여 각 문장에서 주요성분들을 추출하고, 이 온톨로지 데이터를 저장하는 문장 주요성분 추출 단계; 상기 단계에서의 온톨로지 데이터 값을, 선별된 주요 구성요소들 각각이 갖는 의미에 대한 소정의 분류기준인 인식상위범주 정보와 비교하여, 선별된 주요 구성요소 각각에 대한 추상적인 의미로 파악되는 데이터 값을 저장하는 문장추상화 단계; 상기 단계에서의 저장 값을 읽어 들여 개연규칙 프로그램 가동장치부로 입력시켜서 구문간 개연성을 갖는 다수 화제문을 선정하고, 선정된 다수 화제문에 대한 식별값들을 각각 저장하는 화제문 선정 단계; 상기 단계에 서 저장된, 선별된 주요 구성요소들에 대하여 파악된 추상적인 의미의 해당 값들을 읽어들여 문법적인 요약 문장으로 조합하고, 저장하는 요약문 작성 단계; 출력 제어신호가 있는지를 판단하여 그럴 경우 상기 단계에서 저장된 데이터 값이 출력수단의 가동을 통하여 출력, 표시되게 하는 요약문 출력 단계를 포함하는, 문장추상화와 개연규칙을 활용한 문서 요약 방법에 관한 것이다.
한국특허 등록번호 제10-0836878호 (정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그 방법)은 인터넷을 통해 사용자 단말, 웹 포털 사이트, 웹 사이트와 연결되어 정보를 검색하고 검색된 정보를 제공하는 정보 검색 시스템에서의 주제 또는 분야 할당 장치로서, 상기 정보 검색 서버는, 질의어 또는 문서에 대응하는 색인어를 기반으로 문서에 대하여 정보 검색을 수행하는 검색 엔진과; 상기 검색 엔진에서 검색된 정보를 저장하고 관리하는 데이터베이스와; 상기 데이터베이스에 저장된 원문으로부터 색인어를 추출하여 색인어에 의한 시소러스 매칭을 수행하여 원문에 대한 주제 또는 분야 할당을 수행하는 시소러스 매칭부와; 상기 데이터베이스에 저장된 정의문으로부터 용어를 추출하여 추출한 용어에 의해 주제를 할당하고 택소노미를 사용하여 분야를 할당하는 택소노미 처리부;를 포함하여 구성되는 것을 특징으로 하는 정보 검색 시스템에서의 주제 또는 분야 할당 장치에 관한 것이다.
또한, 현재 구글, 야후 등 대형 정보 검색 포탈이 사용하고 있는 정보 검색 시스템은 "단어" 단위의 검색키방식이 중심이며 비록 '구' 단위 입력을 가능하게 한다 해도 입력되는 '구'의 고도기술에 따른 언어처리 방법이라기보다는 N그램 기 반 색인키를 논리연산자(AND, OR, NOT)로 연결하여 검색 결과를 제시하는 정도임으로 현행기술로서는 정보 검색의 재현성, 정확성 향상에는 한계가 있다. 특히 차세대 정보검색분야로서 '모바일정보검색' 기술이 주목을 받고 있고 새로운 웹검색기술이 '시멘틱 웹' 기술이 제안되고 논의 중이나 특별히 성공적인 사례는 없다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 단어 단위를 검색어로 하는 정보 검색 시스템에서 구 단위, 문장 단위로 검색키를 확장하여 정보 검색 시스템의 사용자 인터페이스를 보다 편리하게 할 뿐 아니라 정보의 제공, 검색, 분류, 평가, 모니터링 등의 다기능이 통합 처리 가능한 다기능 통합 정보 검색방법 및 시스템을 제공하는데 있다.
또한, 본 발명은 정보 검색자나 정보 제공자의 의도를 파악하고, 파악된 의도에 기초한 정보 결과를 제공하는 다기능 통합형 정보 검색방법 및 시스템을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명에 따른, 정보 검색방법은, 검색어에 대한 해석결과를 이용하여, 검색자의 의도를 파악하는 단계; 상기 검색자의 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함한다.
그리고, 본 정보 검색방법은, 입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및 분리된 검색어들을 구문 해석하는 단계;를 더 포함하고, 상기 검색자의 의도 파악단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 검색자의 의도를 파악하는 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것이 바람직하다.
그리고, 상기 구문 표현식은, 논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며, 상기 구문문법 규칙사전은, 구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것이 바람직하다.
그리고, 상기 분리단계는, 상기 검색어를 품사 별로 분리하는 것이 바람직하다.
또한, 상기 분리단계는, 형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 검색어를 품사 별로 분리하는 것이 바람직하다.
그리고, 상기 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 추출된 메타데이터들이 입력 항목 으로 되어 있는 편집기를, 상기 검색자의 의도에 맞는 편집기로 제공하는 것이 바람직하다.
또한, 본 정보 검색방법은, 상기 정보 제공자의 의도를 참조하여 검색을 수행할 디렉토리를 결정하는 단계;를 더 포함하고, 상기 검색 단계는, 결정된 디렉토리와 동일 또는 유사한 디렉토리에서 상기 컨텐츠를 검색하는 것이 바람직하다.
그리고, 상기 검색어는, 단어 단위, 구 단위 및 문장 단위 중 어느 하나인 것이 바람직하다.
또한, 상기 검색단계는, 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동일한 메타데이터 또는 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동의의 메타데이터를 가지는 컨텐츠를 검색하는 것이 바람직하다.
그리고, 본 정보 검색방법은, 상기 검색단계에서의 검색결과에 부가서비스를 부가하는 단계;를 더 포함하는 것이 바람직하다.
또한, 상기 부가서비스는, 컨텐츠 문맥 지각형(Context awareness) 서비스이고, 상기 컨텐츠 문맥 지각형은, 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 경매서비스 및 행정서비스 중 적어도 하나를 포함하는 것이 바람직하다.
그리고, 상기 편집기의 입력 항목들 중 적어도 하나는, 상기 검색어를 이용하여 생성한 리얼데이터로 자동입력되는 것이 바람직하다.
또한, 본 정보 검색방법은, 상기 입력된 메타데이터들 및 검색된 컨텐츠를 구성하는 메타데이터들을 각각 비교하여 일치도가 높은 컨텐츠들을 선별하여 출력하는 단계;를 더 포함하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 정보에 포함된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계; 상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
그리고, 본 검색용 정보 제공방법은, 입력된 정보에 포함된 상기 텍스트를 의미 있는 단어들로 분리하는 단계; 및 분리된 단어들을 구문 해석하는 단계;를 더 포함하고, 상기 정보 제공자의 의도 파악단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것이 바람직하다.
그리고, 상기 구문 표현식은, 논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며, 상기 구문문법 규칙사전은, 구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것이 바람직하다.
그리고, 상기 분리단계는, 상기 텍스트를 품사 별로 분리하는 것이 바람직하다.
또한, 상기 분리단계는, 형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 텍스트를 품사 별로 분리하는 것이 바람직하다.
그리고, 본 검색용 정보 제공방법은, 상기 정보 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 정보 제공자의 의도에 맞는 편집기로 제공하는 것이 바람직하다.
또한, 본 검색용 정보 제공방법은, 상기 정보 제공자의 의도를 참조하여 상기 정보가 저장될 디렉토리를 결정하는 단계;를 더 포함하고, 상기 컨텐츠 저장단계는, 결정된 디렉토리에 상기 컨텐츠를 저장하는 것이 바람직하다.
그리고, 본 검색용 정보 제공방법은, 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;를 더 포함하고, 상기 파악 단계는, 수집된 텍스트에 대한 해석결과를 이용하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계; 수집된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계; 상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
한편, 본 발명에 따른, 정보 검색방법은, 검색어를 입력받는 단계; 상기 검색어를 입력한 검색자의 의도를 입력받는 단계; 상기 검색어에 대한 해석결과와 상기 검색자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함한다.
그리고, 본 정보 검색방법은, 입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및 분리된 검색어들을 구문 해석하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 정보를 입력받는 단계; 상기 정보를 입력한 정보 제공자의 의도를 입력받는 단계; 상기 정보에 대한 해석결과와 상기 정보 제공자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 정보 제공자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
그리고, 본 검색용 정보 제공방법은, 입력된 정보를 의미 있는 단어들로 분리하는 단계; 및 분리된 단어들을 구문 해석하는 단계;를 더 포함하고, 상기 편집기 제공 단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하는 것이 바람직하다.
이상 설명한 바와 같이, 본 발명에 따르면, "구", "문장" 수준의 검색이 가능해져, '검색 단어'를 키워드로 하고 그것의 확장으로서 또 다른 검색단어를 논리연산자(AND, OR, NOT)의 조합으로 하여 검색하는 기존의 검색 방식에 비해, 정보의 재현율과 정확도가 훨씬 우수하다.
또한, 본 발명에 따르면, 정보 제공자가 제공하는 정보를 제공자의 의도에 따라 디렉토리 별로 분류하여 저장하고, 정보 검색자의 검색 의도를 파악하여 해당하는 디렉토리에 저장되어 있는 정보에 대해 검색을 수행하는 것이 가능해져, 문맥 지각형 정보 제공/검색을 통한 합의형/맞춤형 검색서비스를 제공할 수 있게 된다.
그리고, 본 발명에 따르면, 컨텐츠 별로 각기 다른 메타데이터를 정의하고, 이 메타데이터를 기반으로 생성되는 편집기를 이용하여, 정보 제공 및 검색 내용을 보다 상세하게 발전시키는 방식을 채택하여, 기존의 검색 방식 보다 간편하고 정교한 검색을 가능하게 한다.
아울러, 본 발명은 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행할 수 있게 된다.
또한, 본 발명에서, 정보 제공자 또는 검색자는 메타데이터를 보다 편리하게 입력할 수 있게 되며, 어떠한 종류의 메타데이터를 입력하여야 하는지에 대한 가이드도 제공받을 수 있게 되는바, 입력의 편의성을 증대시킬 수 있게 된다.
그리고, 정보 제공자의 의도를 기초로 해당하는 정보를 디렉토리 별로 구분하되, 이에 해당하는 메타데이터들을 매칭시켜 저장할 수 있게 된다.
한편, 본 발명에 따르면 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하되 리얼 데이터 생성이 가능한 메타 데이터는 자동으로 입력가능해 진다.
또한, 본 발명에 따르면, 정보 제공자와 정보 검색자가 의도를 직접 입력하도록 할 수 있어, 정보 제공자와 정보 검색자의 의도를 보다 정확하게 파악할 수 있게 되어, 궁극적으로는 정확한 정보 제공과 검색을 가능하게 한다.
그리고, 입후보자에 대한 홍보물을 PC, 휴대폰 등을 이용하여 유권자에게 배포할 수 있게 되어, 현재 이용중인 종이포스터에 의한 입후보자 홍보물을 값싸고, 신속하게 제공할 수 있게 된다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 정보 제공자가 제공하는 정보를 제공자의 의도에 따라 디렉토리 별로 분류하여 저장하고, 정보 검색자의 검색 의도를 파악하여 해당하는 디렉토리에 저장되어 있는 정보에 대해 검색을 수행하는 문맥 지각형(Context awareness) 정보 제공/검색을 통해, 합의형/맞춤형 검색서비스를 제공하는 것이다.
또한, 본 실시예에서는 컨텐츠 별로 각기 다른 메타데이터(metadata)를 정의하고, 이 메타데이터를 기반으로 생성되는 편집기를 이용하여, 정보 제공 및 검색 내용을 보다 상세하게 발전시키는 방식을 채택하여, 기존의 검색 방식 보다 간편하고 정교한 검색을 가능하게 한다.
여기서, 메타데이터란 정보 제공/검색의 대상이 되는 컨텐츠의 특징을 보다 상세하고 체계적으로 정의할 수 있는 데이터이다. 예를 들어, '책'에 대한 메타데이터는 책이름, 저자, 출판사, 출판년도, 가격 및 주제 등과 같은, 책에 대한 세부정보가 이에 해당한다.
본 실시예에서, 메타데이터는 정해진 프레임(Frame)을 가지는 편집기를 통해 입력하고 확인하는 것이 가능하게 한다. 프레임의 형식은 테이블 형식 또는 문장 형식으로 구현할 수 있다.
도 2는 컨텐츠들에 대한 메타데이터를 예시한 도면이다. 도 2에 도시된 바에 따르면, 모든 영역의 컨텐츠들에 대해 필수적인 메타데이터가 정의되어 있는 것을 확인할 수 있다.
예를 들어, 부동산매매(202)는 메타데이터로, "매물", "소재지", "희망가", "특징", "지하철 정보" 및 "영상정보" 등이 표준화되어 있음을 확인할 수 있다.
도 2에 도시된 컨텐츠들에 대한 메타데이터는 도 1에 도시된 메타데이터 DB(119)에 저장되어 있다.
한편, 본 실시예에 따른 검색시스템은, 도 1에 도시된 바와 같이, 정보검색창(101), 검색어 입력기(102), 검색어 형태소 처리기(103), 검색어 구문 해석 기(104), 검색자 의도 파악기(105), 정보 모니터(106), 검색용 메타데이터 추출기(107), 검색용 편집기(108), 검색 디렉토리 결정기(109), 검색기(110), 메타데이터 비교기(111), 부가서비스 데이터베이스(112), 부가서비스 생성기(113), 검색 결과 생성기(114), 정보 저장기(115), 저장 디렉토리 결정기(116), 정보 제공용 편집기(117), 정보 제공용 메타데이터 추출기(118), 메타데이터 DB(119), 정보 제공자 의도 파악기(120), 정보 모니터(121), 정보 구문 해석기(122), 구문문법 규칙사전(123), 정보 형태소 처리기(124), 형태소 사전(125), 정보 입력기(126), 정보 제공창(127), 정보 DB(128) 및 검색결과 표시기(129)를 포함한다.
정보 입력기(126)는 정보 제공창(127)을 통해 사용자가 입력한 정보를 정보 형태소 처리기(124)로 전달한다.
형태소 사전(125)에는 각 단어의 품사 정보가 데이터 베이스화 되어 있다. 뿐만 아니라, 형태소 사전(125)에는 각 단어의 의미 정보, 동의어 정보, 대역 외국어 등의 확장 정보도 데이터 베이스화 되어 있다. 여기서, 형태소 사전(125)에 등록되는 단어에 대한 제한은 없으므로, 형태소 사전(125)에는 명사 이외의 다른 품사(대명사, 형용사, 조사, 어미 등)도 등록될 수 있음은 물론이다.
형태소 사전(125)에 수록되어 있는 품사 정보는 텍스트를 품사 별로 분리하는데 참조되고, 의미 정보는 컨텐츠 작성자 또는 검색자의 의도를 파악하는데 이용된다. 또한, 동의어 정보는 보다 넓은 범위의 확장 검색을 수행하는데 이용되고, 대역 외국어는 다국어 검색을 수행하는데 이용된다.
도 3에는 형태소 사전(125)에 수록되어 있는 정보가 예시되어 있으므로, 형 태소 사전(125)에 대해서는 후에 도 3을 참조하여 상세히 설명하기로 한다.
정보 형태소 처리기(124)는 정보 입력기(126)로부터 전달받은 텍스트를 '의미 있는 단어' 단위로 분리한다. 여기서, '의미 있는 단어'란 품사를 말하는데, 이에 따르면 정보 형태소 처리기(124)는 텍스트를 품사 별로 분리하는 것으로 이해할 수 있다.
이를 위해, 정보 형태소 처리기(124)는 형태소 사전(125)에 데이터 베이스화되어 있는 단어에 대한 품사 정보를 참조하여, 텍스트를 품사별로 분리하게 된다.
정보 구문 해석기(122)는 정보 형태소 처리기(124)의 형태소 처리 결과를 토대로, 사용자가 입력한 정보에 대해 구문 해석을 수행한다. 정보 구문 해석기(122)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(123)에 수록되어 있는 문법 규칙을 참조한다.
정보 제공자 의도 파악기(120)는 정보 구문 해석기(122)에서 출력되는 구문 해석 결과를 이용하여, 정보 제공자의 의도를 파악한다.
정보 모니터(121)는 정보 제공자 의도 파악기(120)에 의해 파악된 정보 제공자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(121)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(118)는 정보 제공자 의도 파악기(120)가 파악한 정보 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다.
정보 제공용 편집기(117)는 정보 제공용 메타데이터 추출기(118)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(116)는 컨텐츠가 저장되기에 적합한 정보 DB(128) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(116)는 정보 제공자 의도 파악기(120)가 파악한 정보 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(115)는 정보 제공용 편집기(117)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(128)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(116)에 의해 결정된 디렉토리에 저장된다.
지금까지 설명한 구성들은 정보제공을 위해 필요한 정보를 생성하여 저장하는데 이용되는 구성들이다. 이하에서는, 정보 검색자가 검색어를 입력하여 검색을 요청한 경우, 검색 의도를 파악하여 보다 상세한 검색어 입력을 유도하여 보다 정확한 검색이 가능하도록 하는 구성들에 대해 상세히 설명한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
정보검색창(101)은 사용자가 검색어를 단어, 구 또는 문장으로 입력할 수 있는 입력창을 제공한다. 그리고, 검색어 입력기(102)는 정보검색창(101)을 통해 사용자가 입력한 검색어를 검색어 형태소 처리기(103)로 전달한다.
검색어 형태소 처리기(103)는 검색어 입력기(102)로부터 전달받은 검색어를 '의미 있는 단어' 단위로 분리한다. 여기서, '의미 있는 단어'란 품사를 말하는데, 이에 따르면 검색어 형태소 처리기(103)는 정보 형태소 처리기(124)와 동일한 방법으로 검색어를 품사 별로 분리하는 것으로 이해할 수 있다.
이를 위해, 검색어 형태소 처리기(103)는 형태소 사전(125)에 데이터 베이스화되어 있는 단어에 대한 품사 정보를 참조하여, 텍스트를 품사별로 분리하게 된다.
검색어 구문 해석기(104)는 검색어 형태소 처리기(103)의 형태소 처리 결과를 토대로, 검색자가 입력한 검색어에 대해 구문 해석을 수행한다. 검색어 구문 해석기(104)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(123)을 참조한다.
검색자 의도 파악기(105)는 검색어 구문 해석기(104)에서 출력되는 구문 해석 결과를 이용하여, 검색자의 의도를 파악한다.
정보 모니터(106)는 검색자 의도 파악기(105)에 의해 파악된 검색자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(106)는 그래픽 툴을 이용할 수 있다.
검색용 메타데이터 추출기(107)는 검색자 의도 파악기(105)가 파악한 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다.
검색용 편집기(108)는 검색용 메타데이터 추출기(107)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(109)는 컨텐츠를 검색하기에 적합한 정보 DB(128) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(109)는 검색자 의도 파악기(105)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정할 수 있다. 그리고, 검색 디렉토리 결정기(109)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(128)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(109)에서 결정된 디렉토리에서 수행된다.
검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(110)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색하는 것도 가능하다. 즉, 검색기(110)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
메타데이터 비교기(111)는 검색용 편집기(108)를 통해 입력된 메타데이터들과 검색기(110)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(112)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(113)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(113)는 부가서비스 데이터베이스(112)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(112)와 부가서비스 생성기(113)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 행정서비스 등이 포함된다.
검색 결과 생성기(114)는 메타데이터 비교기(111)에서 출력되는 검색결과(컨텐츠들)와 일치정도에 부가서비스 생성기(113)에서 생성된 부가서비스를 부가한다.
검색결과 표시기(129)는 검색 결과 생성기(114)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(113)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(114)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
이하에서는, 전술한 형태소 사전(125)에 대해, 도 3을 참조하여 상세히 설명한다. 도 3에는 형태소 사전의 일 예로, 한국어 형태소 사전을 도시하였다.
도 3에 도시된 바와 같이, 형태소 사전(125)은, 1) 제1열에는 단어가, 2) 제2열에는 단어의 품사정보가, 3) 제3열에는 단어의 의미 정보가, 4) 제4열에는 동의어(또는 동의구), 유사어 및/또는 대표어의 집합이, 5) 제5열에는 대역 영어가, 6) 제6열에는 대역 일본어가, 7) 제7열에는 대역 중국어가, 각각 나열되어 구성된다.
도시된 형태소 사전(125)은, 정보 형태소 처리기(124)가 텍스트를 형태소 처리하는데 이용되고, 검색어 형태소 처리기(103)가 검색어를 형태소 처리하는데 이 용된다.
전술한 바 있듯이, 형태소 처리는 주어진 문장의 요소가 어떤 의미 있는 단어로 구성되어 있는가를 가리는 것이다. 예를 들어, "학교에 간다"를 형태소 처리하면 "학교+에+가+ㄴ다"와 같이 단어 경계를 나누는 것이, 형태소 처리이다.
이때, 사용하는 정보는 형태소 사전(125)에 저장되어 있는 품사 정보로 각 품사간의 인접가능 관계를 조사하여 처리 결과로써, "학교/명사+에/조사+가/동사+ㄴ다/어미"와 같이 출력한다.
이와 동시에 형태소 처리의 부차적 정보로써 "단어빈도", "문장수" 등 언어통계치를 구할 수 있고 의미 정보, 동의어 정보, 대역 외국어를 동시에 출력하는 것이 가능하다.
한편, 형태소 사전(125)에 수록되어 있는 의미 정보는,
1) 명사의 경우, 물건|자연|재료|요소|도구|수단|인간관계|사회|범죄|조직|문화|동물|인간|식물|수|추상|구성|구체|행위|상태|때|장소|위치|간격|회수|비율|정도|수량|강조|진위|감정|욕설|비하|정치|경제|회사명|지역명|사건|인명|음식|음란|의약품 등으로 분류되고,
2) 동사의 경우, 행위|순간|계속|이동|변화|감정|사고|지각|존재|판단|무의지|표현|서비스 등으로 분류되며,
3) 형용사의 경우, 상태|관계|성질|정도|강조|호감|비호감|선정|음란|양태 등으로 분류되고,
4) 조사의 경우, 구|수단/방법|원료/재로|원인/이유|원천/기점|착점/방 향|목적/목표|결과|주는쪽|받는쪽|장소|때|경우|내용|역할|대조|범위/회수|정도|수량|비율|강조|진위|양태 등으로 분류하며,
5) 부사의 경우, |강조|등으로 분류되고,
6) 양태를 나타내는 어미의 경우, 과거|현재|미래|부정|가능|자별|의무|필요|불가피|요청|요구|단정|확실한추정|불확실추정|예정|희망|시행|명령|의문|의리|허가|권유|사역|의뢰|수동|수익|겸손|존칭 등으로 분류된다.
하지만, 위에서 제시한 분류는 일 예에 불과하며 고정적인 것도 아니다. 단어의 의미는 시시각각 변화한다는 점에서, 의미 분류도 고정된 것이 아닌 시대의 변천에 따라 변화될 수 있음은 물론이다. 또한, 의미 정보 분류시에는 시소러스 분류에 의한 어휘 사전을 참조할 수 있음은 물론이다.
도 3에 예시된 바에 따르면,
1) "이승만(125-1)"은, 품사 정보가 "명사", 의미 정보는 "인명", 동의어 정보는 "한국 대통령"임을 알 수 있고,
2) "냉면(125-2)"은, 품사 정보가 "명사", 의미 정보는 "음식명", 동의어 정보는 "한국 대표적 면류 음식"임을 알 수 있으며,
3) "이산화탄소(125-3)"는, 품사 정보가 "명사", 의미 정보가 "유해물질", 동의어 정보가 "시오투, 지구 온난화"임을 알 수 있고,
4) "세요(125-4)"는, 품사 정보가 "어미", 의미 정보가 "요청,존대", 동의어 정보가 "명령"임을 알 수 있으며,
5) "놈(125-5)"은 품사 정보가 "명사", 의미 정보가 "비하", 동의어 정보가 "넘"임을 알 수 있다.
의미 정보와 동의어 정보는, 검색을 확대, 확장시키는데 이용될 수 있다. 예를 들어, "이승만"을 검색어로 한 경우, "이승만"에 대한 검색결과는 물론, "한국 대통령"에 관련하는 검색 결과도 더 제공하는 것이 가능하도록 한다.
또한, "이산화탄소 대책"을 검색어로 한 경우, "이산화탄소 대책"에 대한 검색결과는 물론, "유해 물질", "CO2 대책", "지구 온난화 대책"에 관련하는 검색결과도 더 제공하는 것이 가능하다.
마찬가지로, "소고기, 돼지고기, 김치" 등의 의미 정보는 "식품"이고, 동의어 정보는 "육류", "채소류"이므로, 의미 정보와 동의어 정보를 이용하여 확장 검색을 수행하는 것이 가능하다.
이와 같이, 형태소 사전(125)에는 품사 정보 외에도 의미 정보와 동의어 정보가 수록되어 있으므로, 풍부한 정보 검색을 가능하게 한다.
이하에서는, 구/문장을 형태소 처리하여 구문 해석하는 과정에 대해 도 3을 참조하여 부연설명한다.
구문해석이란, 문장을 구성하는 각각의 의미 있는 단어가 바른 문으로서 어떤 구조를 가지고 있는지를 해석하는 과정이다. 구문해석에는 자연언어를 기술하는 문법이론이 이용된다. 자연언어를 기술하는 문법이론에는 구구조문법, 격문법, 의존문법, 어휘문법 등이 있는데, 이들은 문법기술 방법에 차이점이 있다.
영어, 한국어, 중국어, 일본어 등 모든 언어에 상기 문법이론은 적용 가능하므로, 본 실시예에서 제시하는 한국어 구문 해석 방법론은 다른 언어들에도 적용할 수 있다.
도 4에 도시된 형태소 처리(401) 과정을 끝낸 입력문은 의미 있는 단어 단위로 분리되며 분리된 단어들에는 각각 품사 정보가 부가(402)되어 있다. 품사 정보는 {명사, 대명사, 수사, 형용사, 부사, 조사…} 등 10~12개 정도의 품사명으로 되어 있다.
각각의 단어들이 서로 어떻게 결합되어 바른 구, 절, 문을 이루는가를 해석하기 위해서는 각 언어에서의 바른 구, 절, 문에 대한 생성규칙(403)이 필요한데, 이 규칙은 전술한 구문문법 규칙사전(123)에 포함되어 있으므로, 구문문법 규칙사전(123)으로부터 추출한다.
예를 들면, "문장은 주부(명사구)와 술부(동사구)로 이루어진다" 라는 지식을 문법 규칙화하면 S(Sentence)←NP(Noun Phrase)·VP(Verb Phrase)로 표현된다. 이러한 규칙이 정의된 곳이 구, 절, 문에 대한 생성규칙(403)인 것이다.
이들 규칙을 간단히 설명하면, 1) 구구조문법 형식은 단어 단위에서 구, 절, 문 단위로 생성하는 규칙을 기반으로 정의되고, 2) 격문법 형식과 의존문법형식은 어절이라는 단위들의 수식과 피수식 관계를 규칙으로 정의되며, 3) 어휘문법형식은 VP=cat(동사, 종지, … Sub, SEM) 형식을 취하며 각 단어간의 바른 결합을 단일화(Unification)라는 연산으로 수행된다.
구체적인 예를 들면, 구구조문법 규칙과 처리방법은
(1) S ← PPV
(2) PP ← NP
과 같이 정의해 두고 "서울에서 왔다"를 구문 해석하면 형태소 처리 결과 (서울/N(명사), 에서/P(조사), 왔다/V(동사)과거)의 단어들이 생성되며, 구문 해석이 수행되면, "서울에서"는 "NP"이므로 "서울에서"는 문법규칙(2)에 따라 "PP(전치사구)"로 구문 해석되며 "왔다"는 'V(동사)'이므로 PP와 V는 문법규칙(1)에 따라 'S(문장)'으로 해석되어 그 결과를 한국어의 경우 ((서울에서)왔다)라는 목(tree)구조 또는 리스트(list)구조식으로 출력된다.
한편, 상기의 예문을 의존문법규칙으로 해석하면 어절, "서울에서"가 어절 "왔다"를 수식하는 구문 해석 관계를 "서울에서→왔다"라는 표현식으로 출력된다.
그리고, 어휘문법형식은 (왔다, [누가], [서울에서])라는 구문해석 결과를 의미표현식으로 출력한다. 본 발명에서는 문법 이론에 따라 각각의 구문해석 표현식을 출력(404)할 수 있다. 이에 따라, 품사정보에 의한 표현식(405), 의미정보에 의한 표현식(406), 동의어/구에 의한 표현식(407)이 출력가능하다.
도 5은 본 발명의 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도이다.
도 5에 도시된 바와 같이, 정보 제공창(127)을 통해 사용자가 "중고차 팝니다"를 입력하면, 정보 입력기(126)는 사용자가 입력한 정보를 정보 형태소 처리기(124)로 전달한다(501).
그러면, 정보 형태소 처리기(124)는 형태소 사전(125)를 참조하여, "중고차 팝니다"를 품사 별로 분리하여 "중고차/파/ㅂ니다"로 출력한다(502).
이때, 형태소 처리 결과로 품사 정보와 의미 정보(명사/중고차, 동사/판매, 어미/존대)가 함께 출력된다. 여기서, 품사 정보는 명사, 동사, 어미이고, 의미 정보는 중고차, 판매, 존대이다.
이후, 정보 구문 해석기(122)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (중고차→판매)를 출력한다(503).
정보 제공자 의도 파악기(120)는 정보 구문 해석기(122)에서 출력되는 구문 해석 결과를 이용하여, 정보 제공자의 의도를 '중고차 판매'로 파악한다(504).
그러면, 정보 제공용 메타데이터 추출기(118)는 정보 제공자의 의도인 '중고차 판매'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다(505).
정보 제공용 편집기(117)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다(506). 그러면, 정보제공자는 제공된 편집기를 통해 메타데이터들을 입력한다(507).
도 5에서는 세부 항목들에 대해, "중고차량 명: 소나타", "변속기: 오토", "년식: 2001년", "주행거리: 10만 킬로", "색깔: 은색", "희망가격: 120만원"와 사진 정보를 함께 입력한 경우를 예시하였다.
그러면, 저장 디렉토리 결정기(116)는 컨텐츠가 저장되기에 적합한 정보 DB(128) 상의 디렉토리를 결정하여, 디렉토리 색인키(중고차, 판매)을 부가한다. 이는, 컨텐츠가 해당 디렉토리에 저장되도록 하기 위함이다. 한편, 저장 디렉토리 결정기(116)는 디렉토리 색인키(중고차, 판매) 외에 사용자 ID를 부가할 수 있다(508).
그리고, 정보 저장기(115)는 정보 제공용 편집기(117)에 의해 입력된 메타데이터들을 통합한 컨텐츠를 정보 DB(128)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(116)에 의해 결정된 디렉토리에 저장된다.
지금까지, 정보 제공자가 입력한 정보로부터 사용자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하여 하나의 컨텐츠로 저장하는 과정에 대해 상세히 설명하였다.
이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검색자가 입력한 검색어를 기초로 검색을 수행하는 과정에 대해, 도 6을 참조하여 상세히 설명한다.
도 6은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어를 입력하면, 검색자의 검색 의도를 파악하고, 파악된 검색자의 의도를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 6에 도시된 바와 같이, 먼저 정보검색창(101)을 통해 사용자가 검색어 "중고차 삽니다"를 입력하면(601), 검색어 형태소 처리기(103)는 입력된 검색어를 품사 별로 분리하여 (중고차/사/ㅂ니다)로 출력함과 동시에 (명사/중고차, 사/구매, 어미/존대)의 품사정보와 의미정보를 부가하여 출력한다(602).
그러면, 검색어 구문 해석기(104)는 형태소 처리 결과를 토대로 구문 해석을 수행하여, 그 결과로 (중고차→구매)를 출력한다(603).
검색자 의도 파악기(105)는 구문 해석 결과를 이용하여, 검색자의 의도를 '중고차→구매'로 파악한다(604).
그러면, 검색용 메타데이터 추출기(107)는 검색자의 의도인 '중고차 구매'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출하고, 검색용 편집기(108)는 검색용 메타데이터 추출기(107)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(605).
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(606). 도 6에서는 세부 항목들에 대해, "중고차량 명: 소나타", "변속기: 오토", "년식: 2001년 이후", "주행거리: 10만 km 미만", "색깔: 은색", "희망가격: 120만원 이하" 및 "연료: LPG"를 입력한 경우를 예시하였다.
검색 디렉토리 결정기(109)는 컨텐츠를 검색하기에 적합한 정보 DB(128) 상의 디렉토리를 결정하고, 검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(128)에서 검색한다(607). 검색은 검색 디렉토리 결정기(109)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(109)는 검색자 의도 파악기(105)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(110)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(111)는 검색용 편집기(108)를 통해 입력된 메타데이터들과 검색기(110)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(608). 그리고, 메타데이터 비교기(111)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(609).
지금까지, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
본 실시예에서는 정형화 또는 표준화된 편집기를 이용하여 메타데이터를 입력하도록 구현하였다. 이에 따라, 정보 제공자 또는 검색자는 메타데이터를 보다 편리하게 입력할 수 있게 되며, 어떠한 종류의 메타데이터를 입력하여야 하는지에 대한 가이드도 제공받을 수 있게 되는바, 입력의 편의성을 증대시킬 수 있게 된다.
이와 같은 정형화된 편집기를 이용한 메타데이터 입력방식은 휴대폰 또는 IPTV와 같은 기기의 경우에도 적용할 수 있다.
한편, 본 실시예에서는 조건 검색도 가능하도록 하였는데, 이는 특정 메타데이터를 특정한 조건으로 한정하는 것이다. 예를 들면, "120만원이하 중고차"라는 검색어로 검색을 수행하는 것이 조건 검색에 해당한다.
도 7은 부가서비스 DB(112)에 저장되어 있으며 부가서비스 생성기(113)에 의 해 생성되는 부가서비스의 일 예로 문맥지각형 검색서비스의 일종인 지리안내 서비스의 설명에 제공되는 도면이다.
이를 위해, 도 7에서는 정보검색창(101)을 통해 "이근처 맛있는 이태리 레스토랑은"(701)이라는 문장이 입력된 것을 가정하였다.
입력된 문장(701)은 검색어 형태소 처리기(103)에 의해 형태소 처리되어, "이근처/맛있/는/이태리/레스토랑/은"으로 분리된 후(702), 의미 정보들이 부가된 "이근처/명사/현재위치, 맛있/형용사/음식평가, 는/조사/수식, 이태리/명사/국명, 레스토랑/명사/음식점, 은/조사/제시"(703)가 출력된다.
그러면, 검색어 구문 해석기(104)는 형태소 처리 결과를 구문해석하고, 검색자 의도 파악기(105)는 구문해석 결과를 통해, 검색자의 의도를 파악한다. 구체적으로, 검색자 의도 파악기(105)는 문맥지각형 단어 '은/는'의 의미 정보가 '제시'를 나타내므로 '검색요청'을 의미하는 것으로 파악하고, 문맥지각형 단어 "이근처"는 'GPS에 의해 확인가능한 현재 위치'를 획득하여야 하는 의미로 파악하고, '이태리 레스토랑'은 음식점 데이터베이스의 검색을 각각 요구한다는 의도로 파악한다.
이에 따라, 부가서비스 생성기(113)는 GPS를 이용하여 현재위치 파악하고(704), 검색기(110)는 맛있는 이태리 레스토랑에 대한 검색을 수행하고(705), 부가서비스 생성기(113)는 지도를 실행하여(706), 현재 위치가 나타난 지도에 검색된 맛있는 이태리 레스토랑이 표시된 지도를 출력한다(707).
도 8에는 다른 종류의 부가 서비스를 제공하는 방법의 설명에 제공되는 도면이다. 도시된 부가 서비스는, 검색결과로 출력되는 텍스트에 포함되어 있는 특정 단어, 주제와 관련하여 다양한 부가 정보를 제공하는 것이다. 이를 위해서는, 부가서비스 데이터베이스(112)에 저장되어 있는 기관정보(801), 광고(802), 인물정보(803), 토픽주제정보(804), 회사정보(805) 등의 각종 정보를 활용할 수 있음은 물론, 네트워크를 통해 연결된 다른 데이터 베이스로부터 획득할 수 있음은 물론이다.
도 9는 정보검색창과 정보제공창이 함께 구비된 정보 제공/검색창의 일 예를 도시한 도면이다. 도시된 정보 제공/검색창에서 입력창(901)은 검색어를 입력하는데 이용되는 창이고, 정보제공 버튼(902)은 입력창(901)에 입력된 정보를 제공/등록하고자 할 때 이용되는 버튼이며, 정보검색 버튼(903)은 입력창(901)에 입력된 검색어에 대한 정보검색을 명령하는데 이용되는 버튼이다.
그리고, 하부에 마련된 버튼들(904)은 검색 방법과 검색 결과 제공방법을 설정하는데 이용되는 버튼이다. 예를 들어, 도 9에 제시된 "완전검색" 버튼은 검색방식을 완전 검색으로 설정하는데 이용되는 버튼이고, "광고허용" 버튼은 검색결과와 관련된 광고물을 검색결과와 함께 표시할 것을 허용하는데 이용되는 버튼이고, "관련서비스 제공허용" 버튼은 검색결과에 포함되어 있는 단어, 문구들에 대한 부가정보를 함께 제공할 것을 허용하는데 이용되는 버튼이다.
도 7 내지 도 9에 제시된 구현 예들은, 이하에서 설명할 다른 실시예들에도 적용되므로, 이하에서 설명할 실시예들에서는 이 구현 예들에 대해 반복하여 설명하지 않을 것이다.
도 10는 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 도 10에 도시된 바와 같이, 정보검색창(1001), 검색어 입력기(1002), 검색어 형태소 처리기(1003), 검색어 구문 해석기(1004), 검색자 의도 파악기(1005), 정보 모니터(1006), 검색용 메타데이터 추출기(1007), 검색용 편집기(1008), 검색기(1009), 메타데이터 비교기(1010), 부가서비스 데이터베이스(1011), 부가서비스 생성기(1012), 검색결과 생성기(1013), 정보 저장기(1014), 정보 제공용 편집기(1015), 정보 제공용 메타데이터 추출기(1016), 메타데이터 DB(1017), 컨텐츠 제공자 의도 파악기(1018), 정보 모니터(1019), 구문 해석기(1020), 구문문법 규칙사전(1021), 형태소 처리기(1022), 형태소 사전(1023), 디렉토리 컨텐츠 크롤러(1024), 정보 DB(1025), 검색결과 표시기(1026), 검색 디렉토리 결정기(1027) 및 저장 디렉토리 결정기(1028)를 구비한다.
디렉토리 컨텐츠 크롤러(1024)는 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집한다. 디렉토리 컨텐츠 크롤러(1024)에 의해 수집된 텍스트는 후술할 형태소 처리기(1022)로 전달된다.
도 10에는 컨텐츠가 저장되어 있는 디렉토리로, 구인정보(21), 대학입시정보(13), 부동산(23), 금융(24), 자동차(25), 영화연극(26), 쇼핑(27), 교통 정보(28), 여행 정보(29), 추천(30) 등을 상정하였으나, 이외의 다른 디렉토리가 적용될 수 있음은 물론이다.
형태소 사전(1023)은 도 1에 도시된 형태소 사전(125)과 동일한 것으로 구현할 수 있다. 형태소 처리기(1022)는 형태소 사전(1023)를 참조하여, 디렉토리 컨텐츠 크롤러(1024)로부터 전달되는 텍스트를 품사 별로 분리하여 출력한다.
구문 해석기(1020)는 형태소 처리기(84)의 형태소 처리 결과를 토대로, 컨텐츠에 포함된 텍스트에 대해 구문 해석을 수행한다. 구문 해석을 수행함에 있어, 구문 해석기(1020)는 구문문법 규칙사전(1021)을 참조한다.
컨텐츠 제공자 의도 파악기(1018)는 구문 해석기(1020)에서 출력되는 구문 해석 결과를 이용하여, 컨텐츠 작성자의 의도를 파악한다.
정보 모니터(1019)는 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 컨텐츠 작성자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1019)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(1016)는 컨텐츠 제공자 의도 파악기(1018)가 파악한 컨텐츠 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
정보 제공용 편집기(1015)는 정보 제공용 메타데이터 추출기(1016)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(1028)는 컨텐츠가 저장되기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1028)는 컨텐츠 제공자 의도 파악기(1020)가 파악한 컨텐츠 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1014)는 정보 제공용 편집기(1015)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1025)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1028)에 의해 결정된 디렉토리에 저장된다.
지금까지 설명한 구성들은 컨텐츠를 수집하고 수집된 컨텐츠를 작성자의 의도를 기초로 구분하여 저장하는데 이용되는 구성들이다. 이하에서는, 정보 검색자가 검색어를 입력하여 검색을 요청한 경우, 검색 의도를 파악하여 보다 상세한 검색어 입력을 유도하여 보다 정확한 검색이 가능하도록 하는 구성들에 대해 상세히 설명한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
정보검색창(1001)은 사용자가 검색어를 단어, 구 또는 문장으로 입력할 수 있는 입력창을 제공한다. 그리고, 검색어 입력기(1002)는 정보검색창(1001)을 통해 사용자가 입력한 검색어를 검색어 형태소 처리기(1003)로 전달한다.
검색어 형태소 처리기(1003)는 형태소 사전(1023)를 참조하여, 검색어 입력기(1002)로부터 전달받은 검색어를 품사 별로 분리하여 출력한다.
검색어 구문 해석기(1004)는 검색어 형태소 처리기(1003)의 형태소 처리 결과를 토대로, 검색자가 입력한 검색어에 대해 구문 해석을 수행한다. 검색어 구문 해석기(1004)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(1021)을 참조한다.
검색자 의도 파악기(1005)는 검색어 구문 해석기(1004)에서 출력되는 구문 해석 결과를 이용하여, 검색자의 의도를 파악한다.
정보 모니터(1006)는 검색자 의도 파악기(1005)에 의해 파악된 검색자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1006)는 그래픽 툴을 이용할 수 있다.
검색용 메타데이터 추출기(1007)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
검색용 편집기(1008)는 검색용 메타데이터 추출기(1007)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(1027)는 컨텐츠를 검색하기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(1027)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정할 수 있다. 그리고, 검색 디렉토리 결정기(1027)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1025)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(1027)에서 결정된 디렉토리에서 수행된다.
검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(1009)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색 하는 것도 가능하다. 즉, 검색기(1009)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
메타데이터 비교기(1010)는 검색용 편집기(1008)를 통해 입력된 메타데이터들과 검색기(1010)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(1011)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(1012)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(1012)는 부가서비스 데이터베이스(1011)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(1011)와 부가서비스 생성기(1012)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스 등이 포함된다.
검색결과 생성기(1013)는 메타데이터 비교기(1010)에서 출력되는 검색결과와 일치정도를 부가서비스 생성기(1012)에서 생성된 부가서비스를 부가한다.
검색결과 표시기(1026)는 검색결과 생성기(1013)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(1012)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(1013)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
이하에서는, 추천 디렉토리(30)에 돌잔치 경험담을 곁들어 중국음식점을 추천하는 글이 계시된 경우를 상정하고, 이 글을 정보로 저장하는 과정에 대해, 도 11을 참조하여 상세히 설명한다. 도 11은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다.
먼저, 디렉토리 컨텐츠 크롤러(1024)는 도 11의 (a)에 도시된 바와 같이 추천 디렉토리(30)에 게시된 추천문을 수집하여 형태소 처리기(1022)로 전달한다.
그러면, 형태소 처리기(1022)는 형태소 사전(1023)를 참조하여, 형태소 처리를 수행한다. 형태소 처리기(1022)에 의한 형태소 처리결과는, 도 11의 (b)에 나타난 바와 같다.
이후, 구문 해석기(1020)는 도 11의 (b)에 대해 구문 해석을 수행한다. 구문 해석기(1020)에 의한 구문 해석결과는 도 11의 (c)에 나타난 바와 같다.
그리고, 컨텐츠 제공자 의도 파악기(1018)는 도 11의 (c)를 기초로 제공자의 의도를 파악한다. 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 제공자의 의도는 도 11의 (d)에 나타난 바와 같다.
이후, 정보 제공용 메타데이터 추출기(1016)는 제공자의 의도에 부합하는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
정보 제공용 편집기(1015)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 사용자에게 제공한다.
도 11의 (d)에서 "돌잔치→장소→추천"에 부합하는 컨텐츠는 "돌잔치 장소제공" 컨텐츠이다. 정보 제공용 편집기(1015)는 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 컨텐츠 제공자의 의도를 도 11의 (e)와 같이 정리한다. 그리고, 정보 제공용 편집기(1015)는 도 12의 (a)에 도시된 편집기의 각 항목에 해당 메타데이터를 자동으로 입력하며, 입력된 결과는 도 12의 (b)에 도시된 바와 같다.
저장 디렉토리 결정기(1028)는 컨텐츠가 저장되기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1028)는 정보 제공자 의도 파악기(1018)가 파악한 컨텐츠 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1014)는 정보 제공용 편집기(1015)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1025)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1028)에 의해 결정된 디렉토리에 저장된다.
본 실시예에 따르면, 컨텐츠 제공자의 의도를 기초로 해당하는 정보를 디렉토리 별로 구분하되, 이에 해당하는 메타데이터들을 매칭시켜 저장할 수 있게 된다.
이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검 색자가 입력한 검색어를 기초로 검색을 수행하는 과정에 대해, 도 13를 참조하여 상세히 설명한다.
도 13은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어를 입력하면, 검색자의 검색 의도를 파악하고, 파악된 검색자의 의도를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 13에 도시된 바와 같이, 먼저 정보검색창(1001)을 통해 사용자가 검색어 "이번 토요일 볼만한 뮤지컬 추천 바람"을 입력하면(1301), 검색어 형태소 처리기(1003)는 입력된 검색어를 품사 별로 분리하여 (이번/토요일/볼만한/뮤지컬/추천/바람)으로 출력함과 동시에(1302), (명사/현재, 명사/요일, 형용사/호감, 명사/뮤지컬, 명사/추천, 동사/요청)의 품사정보와 의미정보를 부가하여 출력한다(1303).
그러면, 검색어 구문 해석기(1004)는 형태소 처리 결과를 토대로 구문 해석을 수행하여, 그 결과로 (이번→토요일, 볼만한→뮤지컬, →추천, →바람)를 출력한다(1304).
구문 해석결과, 이 예문에서는 문맥지각형 정보가 2가지 있음을 알 수 있다. 하나는 "모든 토요일"이라는 실제 물리적 데이터로서 "날짜"이고, 다른 하나는 "추천, 요청"이라는 "의도"이다.
따라서, 검색어 구문 해석기(1004)는 전자에 대해 문맥지각 처리를 수행하는데, 이하에서 상세히 설명한다.
먼저, "이번 토요일"에 대해 문맥지각형 리얼 데이터를 생성하는 과정에 대해 상세히 설명한다. 도 14는 때를 나타내는 문맥지각형 단어들인데, 이들은 형태소 사전(1023)에 수록될 수 있다. 도 14에 도시된 바와 같이 각 언어의 의미정보는 "과거", "현재", "미래" 등으로 정의되어 있다.
도 15는 "현재시각"을 "년", "월", "일", "요일", "시", "분", "초" 단위로 지정하여 시스템에서 관리하는 것을 나타낸 도면이다.
도 16에서는 "이번 토요일" 이란 언어표현을 오늘 현재시각에서 정량적으로 계산해내는 방식을 나타내고 있다. 즉, 구하고자 하는 것은 때를 나타내는 언어표현에서 실제 정량적인 시각이므로 "이번 토요일"을 형태소 처리하면 "이번/현재, 토요일/토요일"의 의미정보에서 현재시각의 요일을 시스템 카렌더에서 구하며 "수요일"이고 현재의 시스템 "토요일"은 "수→목→금→토"의 3일 후이므로 현재의 날짜 2008년 11월 6일에 3일을 더하면 2008년 11월 9일이라는 리얼 데이터를 생성할 수 있다.
이와 같은 과정에 의해, 현재와 다른 때를 나타내는 언어표현도 리얼 데이터로 변형할 수 있게 된다. 도 14 내지 도 16를 참조하여 설명한 "이번 토요일"에 대해 문맥지각형 리얼 데이터를 생성은, 도 13의 1306, 1307 및 1308에 해당한다.
한편, 검색자 의도 파악기(1005)는 구문 해석 결과를 이용하여, 검색자의 의도를 '뮤지컬→추천→요청'으로 파악한다(1308).
그러면, 검색용 메타데이터 추출기(1007)는 검색자의 의도인 '뮤지컬 추천 요청'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출하 고, 검색용 편집기(1008)는 검색용 메타데이터 추출기(1007)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(1311). 이때, 생성된 리얼 데이터인 공연날짜 "2008.11.9"는 편집기에 자동으로 입력된다.
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(1312).
검색 디렉토리 결정기(1027)는 컨텐츠를 검색하기에 적합한 정보 DB(1025) 상의 디렉토리를 결정하고, 검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1025)에서 검색한다(1313). 검색은 검색 디렉토리 결정기(1027)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(1027)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(1009)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(1010)는 검색용 편집기(1008)를 통해 입력된 메타데이터들과 검색기(1009)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(1314). 그리고, 메타데이터 비교기(1010)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(1315).
지금까지, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하되 리얼 데이터 생성이 가능한 메타 데이터는 자동으로 입력되도록 하고, 이 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
지금까지 설명한 실시예들에서는, 정보 제공자 또는 정보 검색자의 의도를 입력된 언어 표현을 분석하여 자동으로 파악하였다.
예를 들어, "구하다, 사다, 구매하다, 주시다, 요청하다, 청하다, 찾다" 등의 언어 표현이 포함된 표현은 모두 "정보를 찾는다"라는 의미에서 정보 "검색"의 의미로 "정보검색"이라는 의도로 파악하여 처리하는 한편, "팔다, 판매하다, 제공하다, 드리다, 주다" 등의 언어 표현이 포함된 표현은 모두 "정보를 제공하다" 라는 의미에서 정보 "제공"의 의미로 "정보제공"이라는 의도로 파악하여 처리하였다.
이하에서 설명할 실시예는, 정보 제공자와 정보 검색자의 의도를 자동으로 파악하는 것이 아니라, 정보 제공자 또는 정보 검색자가 직접 입력하도록 한 방식이 채택된다. 이는, 정보 제공자와 정보 검색자의 의도를 보다 정확하게 파악하기 위함이다.
도 17은 이를 적용한 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 도 17에 도시된 바와 같이, 정보 제공/검색창(1701), 형태소 처리기(1702), 형태소 사전(1703), 구문 해석기(1704), 구문문법 규칙사전(1705), 의도 지정기(1706), 정보 모니터(1707), 정보 제공용 메타데이터 추출기(1708), 정보 제공용 편집기(1709), 저장 디렉토리 결정기(1710), 정보 저장기(1711), 정보 DB(1712), 메타데이터 DB(1713), 검색용 메타데이터 추출기(1714), 검색용 편집기(1715), 검색 디렉토리 결정기(1716), 검색기(1717), 메타데이터 비교기(1718), 검색 결과 생성기(1719), 검색결과 표시기(1720), 부가서비스 데이터베이스(1721) 및 부가서비스 생성기(1722)를 포함한다.
정보 제공/검색창(1701)은 정보 제공자가 등록시키고자 하는 정보를 입력하거나, 정보 검색자가 검색어를 입력하는데 이용되는 사용자 인터페이스이다.
정보 제공/검색창(1701)에는 입력창(1701-1), 정보제공 버튼(1701-2) 및 정보검색 버튼(1701-3)이 마련되어 있다. 입력창(1701-1)은 제공하고자 정보 또는 검색어를 입력하는데 이용되는 창이며, 이 입력창(1701-1)에는 정보와 검색어가 단어, 구 또는 문장으로 입력될 수 있다.
정보제공 버튼(1701-2)은 입력창(1701-1)에 입력된 정보를 제공/등록하고자 할 때 이용되는 버튼이며, 정보검색 버튼(1701-3)은 입력창(1701-1)에 입력된 검색어에 대한 정보검색을 명령하는데 이용되는 버튼이다.
정보 제공/검색창(1701)을 통해 입력된 정보 또는 검색어는 형태소 처리기(1702)로 전달된다.
형태소 사전(1703)은 도 1에 도시된 형태소 사전(125)과 동일한 것으로 구현할 수 있다. 형태소 처리기(1702)는 형태소 사전(1023)를 참조하여, 정보 제공/검색창(1701)을 통해 입력된 정보 또는 검색어를 품사 별로 분리하여 출력한다.
구문 해석기(1704)는 형태소 처리기(1702)의 형태소 처리 결과를 토대로, 사용자가 입력한 정보 또는 검색어에 대해 구문 해석을 수행한다. 구문 해석기(1704)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(1705)에 수록되어 있는 문법 규칙을 참조한다.
의도 지정기(1706)는 정보 제공자의 의도 또는 정보 검색자의 의도를 직접 지정받기 위한 사용자 인터페이스 수단을 제공하며, 구문 해석 결과에 지정된 의도를 통합하여 궁극적인 의도를 출력한다.
정보 모니터(1707)는 의도 지정기(1706)에서 출력되는 궁극적인 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1707)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(1708)는 의도 지정기(1706)에서 출력되는 정보 제공자의 궁극적인 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다.
정보 제공용 편집기(1709)는 정보 제공용 메타데이터 추출기(1708)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(1710)는 컨텐츠가 저장되기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1710)는 의도 지정기(1706)가 파악한 정보 제공자의 궁극적인 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1711)는 정보 제공용 편집기(1709)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1712)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1710)에 의해 결정된 디렉토리에 저장된다.
검색용 메타데이터 추출기(1714)는 의도 지정기(1706)에서 출력되는 정보 검색자의 궁극적인 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다.
검색용 편집기(1715)는 검색용 메타데이터 추출기(1714)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(1716)는 컨텐츠를 검색하기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(1716)는 의도 지정기(1706)에서 출력되는 검색자의 궁극적인 의도를 참조하여 디렉토리를 결정할 수 있다.
그리고, 검색 디렉토리 결정기(1716)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1712)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(1716)에서 결정된 디렉토리에서 수행된다.
검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(1717)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색하는 것도 가능하다. 즉, 검색기(1717)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
메타데이터 비교기(1718)는 검색용 편집기(1715)를 통해 입력된 메타데이터들과 검색기(1717)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(1721)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(1722)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(1722)는 부가서비스 데이터베이스(1721)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(1721)와 부가서비스 생성기(1722)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 행정서비스 등이 포함된다.
검색 결과 생성기(1719)는 메타데이터 비교기(1718)에서 출력되는 검색결과(컨텐츠들)와 일치정도를 부가서비스 생성기(1722)에서 생성된 부가서비스를 부가 한다.
검색결과 표시기(1720)는 검색 결과 생성기(1719)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(1722)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(1719)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
도 18은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도이다.
도 18에 도시된 바와 같이, 정보 제공/검색창(1701)의 입력창(1701-1)에 사용자가 "수업시간표"를 입력하고 정보제공 버튼(1701-2)을 누르면(1801), 형태소 처리기(1702)는 형태소 사전(1703)를 참조하여, "수업시간표"를 품사 별로 분리하여 "수업/시간표"로 출력한다(1802).
그러면, 구문 해석기(1704)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (수업→시간표)를 출력한다(1803).
이후, 의도 지정기(1706)를 통해 정보 제공자의 의도가 "제공"으로 지정되면(1804,1805), 의도 지정기(1706)는 구문 해석 결과에 지정된 의도를 통합한 궁극적인 의도 "수업→시간표→제공"를 출력한다(1806).
그러면, 정보 제공용 메타데이터 추출기(1708)는 정보 제공자의 궁극적인 의도인 "수업→시간표→제공"에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다(1807).
정보 제공용 편집기(1709)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다(1808). 그러면, 정보제공자는 제공된 편집기를 통해 메타데이터들을 입력한다(1809).
그러면, 저장 디렉토리 결정기(1710)는 컨텐츠가 저장되기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다(1810).
그리고, 정보 저장기(1711)는 정보 제공용 편집기(1709)에 의해 입력된 메타데이터들을 통합한 컨텐츠를 정보 DB(1712)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1710)에 의해 결정된 디렉토리에 저장된다.
지금까지, 정보 제공자가 입력한 정보와 의도를 통해 정보 제공자의 궁극적인 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하여 하나의 컨텐츠로 저장하는 과정에 대해 상세히 설명하였다.
이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검색자가 입력한 검색어와 의도를 기초로 검색을 수행하는 과정에 대해, 도 19를 참조하여 상세히 설명한다.
도 19는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어와 의도를 이를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 19에 도시된 바와 같이, 정보 제공/검색창(1701)의 입력창(1701-1)에 사 용자가 "일정표"를 입력하고 검색 버튼(1701-3)을 누르면(1901), 형태소 처리기(1702)는 형태소 사전(1703)를 참조하여, "일정표"를 품사 별로 분리하여 "일정/표"로 출력한다(1902).
그러면, 구문 해석기(1704)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (일정→표)를 출력한다(1903).
이후, 의도 지정기(1706)를 통해 정보 제공자의 의도가 "검색"으로 지정되면(1904,1905), 의도 지정기(1706)는 구문 해석 결과에 지정된 의도를 통합한 궁극적인 의도 "일정→표→검색"를 출력한다(1906).
그러면, 검색용 메타데이터 추출기(1714)는 검색자의 궁극적인 의도인 '일정→표→검색'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출하고, 검색용 편집기(1715)는 검색용 메타데이터 추출기(1714)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(1908).
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(1909).
검색 디렉토리 결정기(1716)는 컨텐츠를 검색하기에 적합한 정보 DB(1712) 상의 디렉토리를 결정하고(1910), 검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1712)에서 검색한다(1911). 검색은 검색 디렉토리 결정기(1716)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(1716)는 의도 지정기(1706)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(1717)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(1718)는 검색용 편집기(1715)를 통해 입력된 메타데이터들과 검색기(1717)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(1912). 그리고, 메타데이터 비교기(1718)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(1913).
지금까지, 검색자가 입력한 정보와 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
지금까지 설명한 실시예는, 전자투표용 입후보자의 홍보 제공용으로 이용될 수 있다.
정보 제공/검색창(1701)에 사용자가 "입후보자 홍보 제공"을 입력하여, 형태소 처리, 구문 해석, 의도 지정 및 메타데이터 추출을 거친 후에 생성되는 편집기와 정보제공자가 제공된 편집기에 메타데이터들을 입력한 결과를, 도 20에 도시하였다.
이후, 저장 디렉토리 결정을 거쳐 정보 DB(1712)에 정보를 저장하면, 입후보자에 대한 홍보물을 PC, 휴대폰 등을 이용하여 유권자에게 배포할 수 있게 된다. 이에 따르면, 현재 이용중인 종이포스터에 의한 입후보자 홍보물을 값싸고, 신속하게 제공할 수 있게 된다.
지금까지 설명한 실시예들은, 휴대폰과 같은 모바일 정보기기들은 물론 여타의 정보기기들에서 구현가능하다. 또한, 정보제공 버튼 및 정보검색 버튼은 휴대폰과 같은 모바일 정보기기들은 물론 여타의 정보기기들의 특정 버튼(키)에 대응/할당할 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
도 1은 본 발명의 일 실시예에 따른 검색시스템을 도시한 도면,
도 2는 컨텐츠들에 대한 메타데이터를 예시한 도면,
도 3은 한국어 형태소 사전을 도시한 도면,
도 4는 구/문장을 형태소 처리한 후 구문해석을 수행하는 과정의 부연설명에 제공되는 도면,
도 5는 본 발명의 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 6은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 7은 부가서비스 데이터베이스에 저장되어 있으며 부가서비스 생성기에 의해 생성되는 부가서비스의 일 예로 문맥지각형 검색서비스의 일종인 지리안내 서비스의 설명에 제공되는 도면,
도 8는 도 7과 다른 종류의 부가 서비스를 제공하는 방법의 설명에 제공되는 도면,
도 9는 정보검색창과 정보제공창이 함께 구비된 정보 제공/검색창의 일 예를 도시한 도면,
도 10는 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면,
도 11 및 도 12는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면,
도 13은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도 면,
도 14 내지 도 16은 도 13에 도시된 검색방법의 부연설명에 제공되는 도면,
도 17은 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면,
도 18은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 19는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면, 그리고,
도 20은 전자투표용 입후보자의 홍보 제공용에 적용한 예를 도시한 도면이다.
* 도면의 주요 부분에 대한 부호의 설명 *
101 : 정보검색창 102 : 검색어 입력기
103 : 검색어 형태소 처리기 104 : 검색어 구문 해석기
105 : 검색자 의도 파악기 106 : 정보 모니터
107 : 검색용 메타데이터 추출기 108 : 검색용 편집기
109 : 검색 디렉토리 결정기 110 : 검색기
111 : 메타데이터 비교기 112 : 부가서비스 데이터베이스
113 : 부가서비스 생성기 114 : 검색 결과 생성기
115 : 정보 저장기 116 : 저장 디렉토리 결정기
117 : 정보 제공용 편집기 118 : 정보 제공용 메타데이터 추출기
119 : 메타데이터 DB 120 : 정보 제공자 의도 파악기
121 : 정보 모니터 122 : 정보 구문 해석기
123 : 구문문법 규칙사전 124 : 정보 형태소 처리기
125 : 형태소 사전 126 : 정보 입력기
127 : 정보 제공창 128 : 정보 DB
129 : 검색결과 표시기 1001 : 정보검색창
1002 : 검색어 입력기 1003 : 검색어 형태소 처리기
1004 : 검색어 구문 해석기 1005 : 검색자 의도 파악기
1006 : 정보 모니터 1007 : 검색용 메타데이터 추출기
1008 : 검색용 편집기 1009 : 검색기
1010 : 메타데이터 비교기 1011 : 부가서비스 데이터베이스
1012 : 부가서비스 생성기 1013 : 검색결과 생성기
1014 : 정보 저장기 1015 : 정보 제공용 편집기
1016 : 정보 제공용 메타데이터 추출기
1017 : 메타데이터 DB 1018 : 컨텐츠 제공자 의도 파악기
1019 : 정보 모니터 1020 : 구문 해석기
1021 : 구문문법 규칙사전 1022 : 형태소 처리기
1023 : 형태소 사전 1024 : 디렉토리 컨텐츠 크롤러
1025 : 정보 DB 1026 : 검색결과 표시기
1027 : 검색 디렉토리 결정기 1028 : 저장 디렉토리 결정기
1701 : 정보 제공/검색창 1702 : 형태소 처리기
1703 : 형태소 사전 1704 : 구문 해석기
1705 : 구문문법 규칙사전 1706 : 의도 지정기
1707 : 정보 모니터 1708 : 정보 제공용 메타데이터 추출기
1709 : 정보 제공용 편집기 1710 : 저장 디렉토리 결정기
1711 : 정보 저장기 1712 : 정보 DB
1713 : 메타데이터 DB 1714 : 검색용 메타데이터 추출기
1715 : 검색용 편집기 1716 : 검색 디렉토리 결정기
1717 : 검색기 1718 : 메타데이터 비교기
1719 : 검색 결과 생성기 1720 : 검색결과 표시기
1721 : 부가서비스 데이터베이스 1722 : 부가서비스 생성기

Claims (30)

  1. 입력된 검색어를 의미 있는 단어들로 분리하는 단계;
    분리된 단어들을 구문 해석하는 단계;
    상기 구문 해석단계에서의 구문 해석결과를 검색자의 의도로 파악하는 단계;
    상기 검색자의 의도와 일치하는 컨텐츠에 대한 메타데이터들을 추출하는 단계;
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를 상기 검색자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함하고,
    상기 구문 해석결과는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식인 것을 특징으로 하는 정보 검색방법.
  2. 삭제
  3. 삭제
  4. 제 1항에 있어서,
    상기 구문 표현식은,
    논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것을 특징으로 하는 정보 검색방법.
  5. 제 1항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며,
    상기 구문문법 규칙사전은,
    구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것을 특징으로 하는 정보 검색방법.
  6. 제 1항에 있어서,
    상기 분리단계는,
    상기 검색어를 품사 별로 분리하는 것을 특징으로 하는 정보 검색방법.
  7. 제 6항에 있어서,
    상기 분리단계는,
    형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 검색어를 품사 별로 분리하는 것을 특징으로 하는 정보 검색방법.
  8. 삭제
  9. 제 1항에 있어서,
    상기 정보 제공자의 의도와 일치하는 디렉토리를 결정하는 단계;를 더 포함하고,
    상기 검색 단계는,
    결정된 디렉토리와 동일 또는 관련 있는 디렉토리에서 상기 컨텐츠를 검색하는 것을 특징으로 하는 정보 검색방법.
  10. 제 1항에 있어서,
    상기 검색어는,
    단어 단위, 구 단위 및 문장 단위 중 어느 하나인 것을 특징으로 하는 정보 검색방법.
  11. 제 1항에 있어서,
    상기 검색단계는,
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동일한 메타데이터 또는 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동의의 메타데이터를 가지는 컨텐츠를 검색하는 것을 특징으로 하는 정보 검색방법.
  12. 제 1항에 있어서,
    상기 검색단계에서의 검색결과에 부가서비스를 부가하는 단계;를 더 포함하는 것을 특징으로 하는 정보 검색방법.
  13. 제 12항에 있어서,
    상기 부가서비스는, 컨텐츠 문맥 지각형(Context awareness) 서비스이고,
    상기 컨텐츠 문맥 지각형은,
    안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 경매서비스 및 행정서비스 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 검색방법.
  14. 제 1항에 있어서,
    상기 편집기의 입력 항목들 중 적어도 하나는, 상기 검색어를 이용하여 생성한 리얼데이터로 자동입력되는 것을 특징으로 하는 정보 검색방법.
  15. 제 1항에 있어서,
    상기 입력된 메타데이터들 및 검색된 컨텐츠를 구성하는 메타데이터들을 각각 비교하여 일치도가 기준 이상인 컨텐츠들을 선별하여 출력하는 단계;를 더 포함하는 것을 특징으로 하는 정보 검색방법.
  16. 입력된 정보에 포함된 텍스트를 의미 있는 단어들로 분리하는 단계;
    분리된 단어들을 구문 해석하는 단계;
    상기 구문 해석단계에서의 구문 해석결과를 상기 정보를 제공한 정보 제공자의 의도로 파악하는 단계;
    상기 정보 제공자의 의도와 일치하는 컨텐츠에 대한 메타데이터들을 추출하는 단계;
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 정보 제공자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하고,
    상기 구문 해석결과는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식인 것을 특징으로 하는 검색용 정보 제공방법.
  17. 삭제
  18. 삭제
  19. 제 16항에 있어서,
    상기 구문 표현식은,
    논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것을 특징으로 하는 검색용 정보 제공방법.
  20. 제 16항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며,
    상기 구문문법 규칙사전은,
    구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것을 특징으로 하는 검색용 정보 제공방법.
  21. 제 16항에 있어서,
    상기 텍스트를 의미 있는 단어들로 분리하는 단계는,
    상기 텍스트를 품사 별로 분리하는 것을 특징으로 하는 검색용 정보 제공방법.
  22. 제 21항에 있어서,
    상기 분리단계는,
    형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 텍스트를 품사 별로 분리하는 것을 특징으로 하는 검색용 정보 제공방법.
  23. 삭제
  24. 제 16항에 있어서,
    상기 정보 제공자의 의도와 일치하는 디렉토리를 결정하는 단계;를 더 포함하고,
    상기 컨텐츠 저장단계는,
    결정된 디렉토리에 상기 컨텐츠를 저장하는 것을 특징으로 하는 검색용 정보 제공방법.
  25. 제 16항에 있어서,
    디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;를 더 포함하고,
    상기 파악 단계는,
    수집된 텍스트에 대한 해석결과를 이용하는 것을 특징으로 하는 검색용 정보 제공방법.
  26. 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;
    수집된 텍스트를 의미 있는 단어들로 분리하는 단계;
    분리된 단어들을 구문 해석하는 단계;
    상기 구문 해석단계에서의 구문 해석결과를 컨텐츠를 제공한 제공자의 의도로 파악하는 단계;
    상기 제공자의 의도와 일치하는 컨텐츠에 대한 메타데이터들을 추출하는 단계;
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 제공자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하고,
    상기 구문 해석결과는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식인 것을 특징으로 하는 검색용 정보 제공방법.
  27. 검색어를 입력받는 단계;
    상기 검색어를 입력한 검색자의 의도를 텍스트로 입력받는 단계;
    입력된 상기 검색자의 의도와 일치하는 컨텐츠에 대한 메타데이터들을 추출하는 단계;
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를 상기 검색자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함하는 것을 특징으로 하는 정보 검색방법.
  28. 삭제
  29. 정보를 입력받는 단계;
    상기 정보를 입력한 정보 제공자의 의도를 텍스트로 입력받는 단계;
    입력된 상기 정보 제공자의 의도와 일치하는 컨텐츠에 대한 메타데이터들을 추출하는 단계;
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를 상기 정보 제공자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하는 것을 특징으로 하는 검색용 정보 제공방법.
  30. 삭제
KR1020080125767A 2008-12-11 2008-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 KR101042515B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020080125767A KR101042515B1 (ko) 2008-12-11 2008-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
CN200980150114.1A CN102246164B (zh) 2008-12-11 2009-12-11 基于用户意图的信息搜索方法以及信息提供方法
JP2011540611A JP5481615B2 (ja) 2008-12-11 2009-12-11 使用者の意図に基づく情報検索方法及び情報提供方法
PCT/KR2009/007443 WO2010068068A2 (ko) 2008-12-11 2009-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
US13/139,118 US9256679B2 (en) 2008-12-11 2009-12-11 Information search method and system, information provision method and system based on user's intention

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080125767A KR101042515B1 (ko) 2008-12-11 2008-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법

Publications (2)

Publication Number Publication Date
KR20100067285A KR20100067285A (ko) 2010-06-21
KR101042515B1 true KR101042515B1 (ko) 2011-06-17

Family

ID=42243243

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080125767A KR101042515B1 (ko) 2008-12-11 2008-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법

Country Status (5)

Country Link
US (1) US9256679B2 (ko)
JP (1) JP5481615B2 (ko)
KR (1) KR101042515B1 (ko)
CN (1) CN102246164B (ko)
WO (1) WO2010068068A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230068092A (ko) 2021-11-10 2023-05-17 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101106772B1 (ko) * 2009-05-14 2012-01-18 주식회사 솔트룩스 사용자 선호 지식 베이스 기반의 컨텐츠 추천 방법 및 시스템
US20120239676A1 (en) * 2009-12-03 2012-09-20 Hitachi High-Technologies Corporation Automatic analyzing device
CN101883341A (zh) * 2010-06-29 2010-11-10 中国人民大学 一种基于短信终端的信息查询系统及查询方法
TWI480742B (zh) * 2011-03-18 2015-04-11 Ind Tech Res Inst 基於動態語言模型之推薦方法與推薦系統
KR101781673B1 (ko) 2011-04-28 2017-09-25 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 대안 시장 검색 결과 토글 기법
US9124590B2 (en) * 2011-07-19 2015-09-01 Sk Planet Co., Ltd. Intelligent information providing system and method
CN103164449B (zh) * 2011-12-15 2016-04-13 腾讯科技(深圳)有限公司 一种搜索结果的展现方法与装置
KR101347123B1 (ko) * 2012-04-17 2014-01-03 박석일 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체
US9747373B2 (en) 2012-05-11 2017-08-29 Zte Corporation Inquiry method and system, inquiry search server and inquiry terminal
GB2503223A (en) * 2012-06-19 2013-12-25 Ibm Redrafting text strings using a vocabulary
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
CN102866989B (zh) * 2012-08-30 2016-09-07 北京航空航天大学 基于词语依存关系的观点抽取方法
WO2014039106A1 (en) * 2012-09-10 2014-03-13 Google Inc. Answering questions using environmental context
CN102880723B (zh) * 2012-10-22 2015-08-05 深圳市宜搜科技发展有限公司 一种识别用户检索意图的搜索方法和系统
US9383216B2 (en) 2012-10-31 2016-07-05 International Business Machines Corporation Providing online mapping with user selected preferences
KR20140119217A (ko) * 2013-03-27 2014-10-10 (주)네오넷코리아 키워드 검색을 통해 사진 검색이 가능한 사진 공유 시스템 및 사진 공유 방법
CN104077320B (zh) * 2013-03-29 2019-12-17 北京百度网讯科技有限公司 一种用于生成待发布信息的方法和装置
DK2994908T3 (da) 2013-05-07 2019-09-23 Veveo Inc Grænseflade til inkrementel taleinput med realtidsfeedback
CN104142955A (zh) * 2013-05-08 2014-11-12 中国移动通信集团浙江有限公司 一种推荐学习课程的方法和终端
CN103400273A (zh) * 2013-07-18 2013-11-20 苏州悦驾信息科技有限公司 本地化汽车o2o服务系统
WO2015037814A1 (ko) * 2013-09-16 2015-03-19 고려대학교 산학협력단 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법
KR20150062832A (ko) * 2013-11-29 2015-06-08 현대엠엔소프트 주식회사 내비게이션의 검색 방법 및 그 장치
US10778618B2 (en) * 2014-01-09 2020-09-15 Oath Inc. Method and system for classifying man vs. machine generated e-mail
CN104462212B (zh) * 2014-11-04 2017-12-22 百度在线网络技术(北京)有限公司 信息展示方法和装置
KR102094934B1 (ko) * 2014-11-19 2020-03-31 한국전자통신연구원 자연어 질의 응답 시스템 및 방법
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US20160224524A1 (en) * 2015-02-03 2016-08-04 Nuance Communications, Inc. User generated short phrases for auto-filling, automatically collected during normal text use
US20160284011A1 (en) * 2015-03-25 2016-09-29 Facebook, Inc. Techniques for social messaging authorization and customization
US20160283845A1 (en) * 2015-03-25 2016-09-29 Google Inc. Inferred user intention notifications
KR101656741B1 (ko) * 2015-04-23 2016-09-12 고려대학교 산학협력단 프레임 기반 의견스팸 판단장치, 프레임 기반 의견스팸 판단방법, 프레임 기반으로 의견스팸을 판단하기 위한 컴퓨터 프로그램 및 컴퓨터 판독가능 기록매체
CN104899308A (zh) * 2015-06-12 2015-09-09 北京奇虎科技有限公司 用于浏览器页面出错时的信息推荐方法及装置
JP6753401B2 (ja) * 2015-07-24 2020-09-09 富士通株式会社 符号化プログラム、符号化装置、及び符号化方法
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105425978A (zh) * 2015-10-26 2016-03-23 百度在线网络技术(北京)有限公司 输入数据的处理方法及装置
US10613825B2 (en) * 2015-11-30 2020-04-07 Logmein, Inc. Providing electronic text recommendations to a user based on what is discussed during a meeting
CN108885617B (zh) * 2016-03-23 2022-05-31 株式会社野村综合研究所 语句解析系统以及程序
CN106407181B (zh) * 2016-09-07 2019-05-14 武汉众犇慧通科技有限公司 旅游目的地中的数据语义关联分析方法及系统
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
CN106599304B (zh) * 2016-12-29 2020-03-24 中南大学 一种针对中小型网站的模块化用户检索意图建模方法
US10009462B1 (en) * 2017-03-28 2018-06-26 International Business Machines Corporation Call filtering to a user equipment
CN107027065B (zh) * 2017-04-21 2020-03-13 海信集团有限公司 非标准频道名称的识别方法和装置
CN107832432A (zh) * 2017-11-15 2018-03-23 北京百度网讯科技有限公司 一种搜索结果排序方法、装置、服务器和存储介质
CN108228191B (zh) * 2018-02-06 2022-01-25 威盛电子股份有限公司 语法编译系统以及语法编译方法
TWI660341B (zh) * 2018-04-02 2019-05-21 和碩聯合科技股份有限公司 一種搜尋方法以及一種應用該方法的電子裝置
KR102072723B1 (ko) * 2018-05-25 2020-02-03 에스케이텔레콤 주식회사 콘텐츠 추천어 제공 방법 및 그 콘텐츠 제공 장치
US20210240930A1 (en) * 2018-06-13 2021-08-05 Sony Corporation Information processing apparatus and method for processing information
CN110347910A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站搜索结果过滤规则
CN110413882B (zh) * 2019-07-15 2023-10-31 创新先进技术有限公司 信息推送方法、装置及设备
JP2023518026A (ja) 2020-03-10 2023-04-27 ミートカイ・インコーポレイテッド マルチリンガル、マルチターン、マルチドメイン仮想アシスタントを強化するための並列仮説推論
CN111475722B (zh) * 2020-03-31 2023-04-18 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN111625706B (zh) * 2020-05-22 2023-05-30 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
WO2021262605A1 (en) * 2020-06-24 2021-12-30 MeetKai, Inc. A system and method for handling out of scope or out of domain user inquiries
WO2022076471A1 (en) 2020-10-05 2022-04-14 MeetKai, Inc. System and method for automatically generating question and query pairs
TWI804763B (zh) * 2020-10-22 2023-06-11 楊蕙如 適合於通訊或社群平台的交易方法及系統
CN112883165B (zh) * 2021-03-16 2022-12-02 山东亿云信息技术有限公司 一种基于语义理解的智能全文检索方法及系统
CN114169966B (zh) * 2021-12-08 2022-08-05 海南港航控股有限公司 一种用张量提取货物订单元数据的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030006201A (ko) * 2001-07-12 2003-01-23 서정연 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
KR100786342B1 (ko) * 2007-01-30 2007-12-17 (주) 프람트 사용자 동적 정보를 이용한 콘텐츠의 검색 방법

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962739A (ja) * 1995-08-22 1997-03-07 Hitachi Ltd 相談窓口割り当て方法および装置
KR100361166B1 (ko) 1999-11-13 2002-11-18 김시환 정보 검색 시스템 및 그 방법
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
KR20020028593A (ko) 2000-10-11 2002-04-17 김중문 유해 단어 차단 방법
KR100484944B1 (ko) 2002-12-24 2005-04-25 한국전자통신연구원 국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치
JP2004234421A (ja) * 2003-01-31 2004-08-19 Hitachi Kokusai Electric Inc 情報検索方法およびそれを用いた情報検索システム
JP2004302660A (ja) * 2003-03-28 2004-10-28 Toshiba Corp 質問応答システム、質問応答方法及びプログラム
US7660400B2 (en) * 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US7496500B2 (en) 2004-03-01 2009-02-24 Microsoft Corporation Systems and methods that determine intent of data and respond to the data based on the intent
JP2005258496A (ja) * 2004-03-09 2005-09-22 Hitachi Ltd 検索意図を表す文字列を利用した情報検索システム
KR20050092955A (ko) 2004-03-17 2005-09-23 (주)다음소프트 온라인 광고 시스템 및 광고 방법
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
KR100594500B1 (ko) 2004-07-30 2006-06-30 에스케이 텔레콤주식회사 메시지 분석을 통한 지역정보 제공 시스템 및 그 방법
US7565627B2 (en) * 2004-09-30 2009-07-21 Microsoft Corporation Query graphs indicating related queries
KR100670789B1 (ko) 2004-12-03 2007-01-17 한국전자통신연구원 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법
KR100597435B1 (ko) 2004-12-07 2006-07-10 한국전자통신연구원 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법
KR100669534B1 (ko) 2004-12-09 2007-01-16 학교법인 울산공업학원 문장추상화와 개연규칙을 활용하는 문서요약 방법과 시스템, 그리고 문장 의미 분석 및 표현방법
WO2006080149A1 (ja) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音復元装置および音復元方法
KR20060087735A (ko) 2005-01-31 2006-08-03 삼성전자주식회사 개선된 스팸성 메시지 필터링을 제공하는 시스템 및 방법
US20060212142A1 (en) * 2005-03-16 2006-09-21 Omid Madani System and method for providing interactive feature selection for training a document classification system
JP2006285847A (ja) * 2005-04-04 2006-10-19 Konica Minolta Holdings Inc 画像検索システム、およびプログラム
KR100726603B1 (ko) 2005-08-01 2007-06-11 에스케이 텔레콤주식회사 광고 유발 메시징 서비스 시스템 및 그 방법
KR20070029389A (ko) 2005-09-09 2007-03-14 주식회사 엠퓨처 핵심 키워드를 이용한 광고 서비스 제공 방법, 시스템 및이를 구현하기 위한 프로그램이 기록된 기록매체
KR100775680B1 (ko) 2005-10-25 2007-11-09 에스케이 텔레콤주식회사 이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법및 그 시스템
JP4468294B2 (ja) * 2005-12-08 2010-05-26 日本電信電話株式会社 体験情報評価装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR100691400B1 (ko) 2006-03-31 2007-03-12 엔에이치엔(주) 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기
KR100857124B1 (ko) 2006-06-27 2008-09-05 성균관대학교산학협력단 유해 메시지 여과 시스템과 그 여과 방법 및 이를 기록한기록매체
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
JP4722819B2 (ja) * 2006-11-29 2011-07-13 日本電信電話株式会社 情報公開システムおよび情報公開方法
KR100836878B1 (ko) 2006-11-29 2008-06-11 한국과학기술정보연구원 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그방법
KR20080052173A (ko) 2006-12-05 2008-06-11 한국전자통신연구원 자연어 분석을 통한 미디어 정보 검색 방법
KR100757951B1 (ko) 2007-01-02 2007-09-11 김수현 웹페이지의 형태소 분석을 통한 검색 방법
US20080172380A1 (en) * 2007-01-17 2008-07-17 Wojciech Czyz Information retrieval based on information location in the information space.
US7805450B2 (en) * 2007-03-28 2010-09-28 Yahoo, Inc. System for determining the geographic range of local intent in a search query
KR100892842B1 (ko) * 2007-08-08 2009-04-10 엔에이치엔(주) 사용자 중심 정보탐색 방법 및 시스템
US8301651B2 (en) * 2007-11-21 2012-10-30 Chacha Search, Inc. Method and system for improving utilization of human searchers
US20090313117A1 (en) * 2008-06-16 2009-12-17 Yahoo! Inc. Targeted advertising

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030006201A (ko) * 2001-07-12 2003-01-23 서정연 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
KR100786342B1 (ko) * 2007-01-30 2007-12-17 (주) 프람트 사용자 동적 정보를 이용한 콘텐츠의 검색 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230068092A (ko) 2021-11-10 2023-05-17 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템

Also Published As

Publication number Publication date
JP5481615B2 (ja) 2014-04-23
CN102246164B (zh) 2017-09-08
WO2010068068A2 (ko) 2010-06-17
US20110246496A1 (en) 2011-10-06
WO2010068068A3 (ko) 2010-09-16
CN102246164A (zh) 2011-11-16
US9256679B2 (en) 2016-02-09
JP2012511769A (ja) 2012-05-24
KR20100067285A (ko) 2010-06-21

Similar Documents

Publication Publication Date Title
KR101042515B1 (ko) 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
García-Díaz et al. Detecting misogyny in Spanish tweets. An approach based on linguistics features and word embeddings
US7937402B2 (en) Natural language based location query system, keyword based location query system and a natural language and keyword based location query system
KR101723862B1 (ko) 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치
US20100262599A1 (en) Content processing systems and methods
JP2008529179A (ja) 自然言語によってモバイル情報にアクセスするための方法及び装置
Lommatzsch et al. An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases.
KR102285232B1 (ko) 형태소 기반 ai 챗봇 및 그의 문장의도 결정 방법
Kisilevich et al. “Beautiful picture of an ugly place”. Exploring photo collections using opinion and sentiment analysis of user comments
JPWO2010150910A1 (ja) 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
Bednarek Keyword analysis and the indexing of Aboriginal and Torres Strait Islander identity: A corpus linguistic analysis of the Australian Indigenous TV drama Redfern Now
Sharma et al. A contemporary combined approach for query expansion
Chardonnens et al. Mining user queries with information extraction methods and linked data
Leveling et al. On metonymy recognition for geographic information retrieval
KR101026986B1 (ko) 언어 표현 해석에 기반한 정보 검색방법 및 정보 제공방법
Kasper et al. Monitoring and summarization of hotel reviews
Berendt et al. Finding Your Way through Blogspace: Using Semantics for Cross-Domain Blog Analysis.
Leal et al. WarMemoirSampo: A semantic portal for war veteran interview videos
KR20070008994A (ko) 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템및 그 방법
Chan et al. Social media harvesting
Garcıa-Pablos et al. OpeNER: Open tools to perform natural language processing on accommodation
Chaabene et al. Semantic annotation for the “on demand graphical representation” of variable data in Web documents
Bermingham et al. Crowdsourced real-world sensing: sentiment analysis and the real-time web
Nelli Textual Data Analysis with NLTK
Berger et al. Querying tourism information systems in natural language

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140613

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150601

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170607

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180319

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190320

Year of fee payment: 9