KR20140115849A - 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 - Google Patents

단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 Download PDF

Info

Publication number
KR20140115849A
KR20140115849A KR1020130031068A KR20130031068A KR20140115849A KR 20140115849 A KR20140115849 A KR 20140115849A KR 1020130031068 A KR1020130031068 A KR 1020130031068A KR 20130031068 A KR20130031068 A KR 20130031068A KR 20140115849 A KR20140115849 A KR 20140115849A
Authority
KR
South Korea
Prior art keywords
semantic
search
meaning
word
words
Prior art date
Application number
KR1020130031068A
Other languages
English (en)
Other versions
KR101505673B1 (ko
Inventor
권춘오
김동욱
김석
Original Assignee
(주)네오넷코리아
김동욱
김석
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)네오넷코리아, 김동욱, 김석 filed Critical (주)네오넷코리아
Priority to KR1020130031068A priority Critical patent/KR101505673B1/ko
Priority to PCT/KR2013/002473 priority patent/WO2014148664A1/ko
Publication of KR20140115849A publication Critical patent/KR20140115849A/ko
Application granted granted Critical
Publication of KR101505673B1 publication Critical patent/KR101505673B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English

Abstract

본 발명은 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템에 관한 것이다. 본 발명에 따른 다국어 검색 시스템은 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스와; 통신망을 통해 특정 언어의 검색어가 입력되는 경우, 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출하는 다국어 검색어 추출부와; 상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들에 기초한 검색 결과를 상기 통신망을 통해 제공하는 다국어 검색부를 포함하는 것을 특징으로 한다. 이에 따라, 특정 언어의 단어를 검색어로 입력하는 경우, 해당 검색어에 해당하는 단어와 같은 의미를 갖는 다른 언어에 대한 검색 결과만이 제공될 수 있다.

Description

단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템{MULTI-LANGUAGE SEARCHING SYSTEM, MULTI-LANGUAGE SEARCHING METHOD, AND IMAGE SEARCHING SYSTEM BASED ON MEANING OF WORD}
본 발명은 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템에 관한 것으로서, 보다 상세하게는 특정 언어의 단어를 검색어로 입력하는 경우, 해당 검색어와 동일한 의미를 갖는 다른 언어에 대한 검색 결과도 함께 제공되는 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템에 관한 것이다.
인터넷 사용이 보편화되면서 사용자들은 인터넷 검색을 통하여 다양한 정보를 획득할 수 있게 되었다. 즉 사용자들은 인터넷에 접속이 가능한 개인용 컴퓨터, 노트북 등의 단말 장치를 통해 인터넷 검색 사이트에 접속한 후, 뉴스, 지식, 게임, 커뮤니티 등과 관련된 각종 콘텐츠를 검색하게 되었다.
근래에는 스마트폰이니 태블릿 단말 장치와 같이, 통신망으로의 접속이 가능하면서도 휴대가 가능한 휴대용 단말 장치의 보급으로, 사용자들은 장소에 대한 제약 없이 언제든지 자신이 원하는 정보를 검색할 수 있게 되어, 검색 서비스의 발전은 더욱 가속화되어가고 있는 실정이다.
이와 같은 검색 사이트는 주로 텍스트 데이터에 기반하여 검색 인터페이스를 제공하는데, 사용자로부터 검색을 위한 검색어를 입력 받고, 입력된 검색어에 부합되는 검색 결과 목록을 사용자에게 제공하는 방식을 취하고 있다.
이를 위하여 검색 사이트들은 검색 엔진을 포함하는 것이 일반적인데, 검색 엔진은 일반적으로 다음과 같은 과정을 거쳐 검색 인터페이스를 제공하게 된다.
먼저, 검색 엔진은 네트워크 상에 존재하는 다수의 웹 문서들을 수집한다. 이와 같은 과정은 웹 크롤러(Web crawler)에 의해 수행되는데, 웹 크롤러는 네트워크 상에 존재하는 웹 문서들을 방문하고, 방문된 웹 문서를 저장하는 기능을 수행한다.
좀 더 구체적으로 설명하면, 웹 크롤러는 소정의 시드 리스트(Seed list)에 포함된 웹 문서들을 순차적으로 탐색하여 저장하고, 저장된 웹 문서의 HTML 링크 등을 분석하여 저장된 웹 문서와 연결된 다른 웹 문서들로 탐색 대상을 확장함으로써, 결과적으로 시드 리스트에 포함된 웹 문서로부터 접근할 수 있는 모든 웹 문서를 탐색하여 저장한다.
그런 다음, 검색 엔진은 웹 크롤러에 의해 저장된 웹 문서들을 일련의 기준에 따라 정리 및 분석하고, 색인 데이터의 생성을 위한 정보를 추출한다. 보다 구체적으로 설명하면, 크롤 데이터 중 중복된 데이터를 제거하고, 크롤 데이터들에 포함된 링크 정보를 이용하여 웹 문서의 중요도를 측정하는 페이지랭크(Pagerank) 작업 등을 수행하게 된다.
마지막으로, 검색 엔진은 크롤 데이터 및 페이지랭크를 수행한 결과물 등을 참조하여, 색인 데이터를 생성한다. 여기서, 색인 데이터는 사용자가 검색 엔진에 검색어를 입력하는 경우, 해당 검색어에 대응하는 웹 문서들을 용이하게 획득할 수 있도록, B Tree, 해쉬(hash) 등과 같은 소정의 자료 구조를 이용하여 생성하게 된다.
상기와 같은 방식으로 생성되는 색인 데이터는 다양한 언어로 작성된 다수의 웹 문서들을 포함할 수 있다. 즉, 검색 엔진의 웹 크롤러는 웹 문서에 포함된 링크 정보를 이용하여 웹 문서들을 수집하므로, 수집된 웹 문서의 작성 언어를 구별하지 않은 채 웹 문서를 수집하게 되고, 따라서, 사용자는 한국어, 영어, 일어, 중국어 등과 같이 다양한 언어로 검색어를 입력하여 원하는 결과를 얻을 수 있게 된다.
그러나, 종래의 색인 데이터를 이용하여 제공되는 검색 인터페이스는 사용자가 입력한 검색어와 일치되는 웹 문서를 제공하는 방식이므로, 사용자가 검색어로 '자동차'를 입력하는 경우, '자동차'를 포함하는 웹 문서만을 제공할 뿐, 'car', '自動車' 등과 같이 다른 언어로 '자동차'가 기재된 웹 문서는 제공하지 못하는 단점이 있었다.
상기와 같은 문제를 해소하기 위해, 한국공개특허공보 제2004-60858호에서는 사용자가 특정 언어로 입력한 검색어를 다른 언어로 번역하고, 번역된 검색어를 이용하여 검색을 수행함으로써 다양한 언어로 표현된 웹 문서들에 대한 검색 결과를 제공할 수 있는 기술을 제안하고 있다.
그러나, 상기 한국공개특허공보에 개시된 기술은 특정 국가의 언어를 외국어로 번역하여 다양한 언어의 검색 결과를 제공하는 점에서 유용할 수 있으나, 다의어, 즉 특정 언어의 하나의 단어가 여러 의미를 갖는 경우에는 사용자가 원하지 않는 검색 결과까지 제공하게 되는 문제점이 있다.
예를 들어, 한국어의 '배'가 검색어로 입력된 경우로 일반적인 타는 선박을 검색하는 경우라 가정하게 되면, '배'를 영어 번역인 'ship', 'boat', 'vessel'이 영어 번역으로 제공될 뿐만 아니라, 먹는 배의 의미인 'pear', 사람의 복부의 의미인 'abdomen' 등과 같이 사용자가 원하지 않는 의미의 검색 결과가 제공되는 문제점이 있다.
이는, 번역되는 언어의 범위를 영어 외에 일어, 중국어 등으로 넓히게 되면, 최종적인 전체 검색 결과에서 사용자가 원하는 정보의 비율은 줄어들게 되며, 결과적으로 검색 엔진의 성능 자체를 저하시키는 원인으로 작용하게 된다.
이에, 본 발명은 상기와 같은 문제점을 해소하기 위해 안출된 것으로서, 특정 언어의 단어를 검색어로 입력하는 경우, 해당 검색어에 해당하는 단어와 같은 의미를 갖는 다른 언어에 대한 검색 결과만이 제공될 수 있는 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템을 제공하는데 그 목적이 있다.
상기 목적은 본 발명에 따라, 단어의 의미를 기반으로 하는 다국어 검색 시스템에 있어서, 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스와; 통신망을 통해 특정 언어의 검색어가 입력되는 경우, 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출하는 다국어 검색어 추출부와; 상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들에 기초한 검색 결과를 상기 통신망을 통해 제공하는 다국어 검색부를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 시스템에 의해서 달성된다.
여기서, 상기 의미 기반 단어 데이터베이스에는 상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 저장되며; 상기 검색어 추출부는 상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는 경우 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나를 선택 가능하게 상기 통신망을 통해 제공하고, 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들을 추출할 수 있다.
그리고, 상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함할 수 있다.
한편, 상기 목적은 본 발명의 다른 실시 형태에 따라, 단어의 의미를 기반으로 하는 다국어 검색 방법에 있어서, (a) 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스를 구축하는 단계와; (b) 통신망을 통해 특정 언어의 검색어가 입력되는 단계와; (c) 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들이 추출되는 단계와; (d) 상기 추출된 각 언어의 단어들에 기초한 검색 결과가 상기 통신망을 통해 제공되는 단계를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 방법에 의해서도 달성된다.
여기서, 상기 (a) 단계는 상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 등록되는 단계를 더 포함하며; 상기 (c) 단계는 (c1) 상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는지 여부를 판단하는 단계와, (c2) 상기 (c1) 단계에서 2 이상의 의미 그룹에 속하는 것으로 판단되는 경우, 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나가 선택 가능하게 상기 통신망을 통해 제공되는 단계와; (c3) 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들이 추출되는 단계를 포함할 수 있다.
그리고, 상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함할 수 있다.
한편, 상기 목적은 본 발명의 또 다른 실시 형태에 따라, 이미지 검색 시스템에 있어서, 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스와; 복수의 이미지가 저장된 이미지 데이터베이스와; 통신망을 통해 특정 언어의 검색어가 입력되는 경우, 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출하는 다국어 검색어 추출부와; 상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들에 기초하여 상기 추출된 각 언어의 단어들에 대응하는 이미지를 상기 이미지 데이터베이스로부터 검색하여 상기 통신망을 통해 제공하는 다국어 검색부를 포함하는 것을 특징으로 하는 이미지 검색 시스템에 의해서도 달성될 수 있다.
여기서, 상기 의미 기반 단어 데이터베이스에는 상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 저장되며; 상기 검색어 추출부는 상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는 경우 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나를 선택 가능하게 상기 통신망을 통해 제공하고, 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들을 추출할 수 있다.
그리고, 상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함할 수 있다.
또한, 상기 이미지 데이터베이스에 저장되는 이미지들 중 적어도 하나는 상기 복수의 의미 그룹 중 적어도 어느 하나에 매칭되어 등록되며; 상기 다국어 검색부는 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹에 매칭된 이미지들이 포함된 검색 결과를 상기 통신망을 통해 제공할 수 있다.
또한, 상기 이미지 데이터베이스에 저장되는 이미지들은 적어도 하나의 키워드가 포함되어 등록되며; 상기 다국어 검색부는 상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들과 상기 키워드를 매칭시켜 상기 이미지 데이터베이스로부터 이미지를 검색할 수 있다.
상기와 같은 구성에 따라 본 발명에 따르면, 특정 언어의 단어를 검색어로 입력하는 경우, 해당 검색어에 해당하는 단어와 같은 의미를 갖는 다른 언어에 대한 검색 결과만이 제공될 수 있는 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템이 제공된다.
도 1은 본 발명에 따른 다국어 검색 시스템이 적용된 검색 구조의 예를 도시한 도면이고,
도 2는 본 발명에 따른 다국어 검색 시스템의 구성을 도시한 도면이고,
도 3은 본 발명에 따른 다국어 검색 시스템의 의미 기반 단어 데이터베이스에 저장된 의미 그룹의 예를 도시한 도면이고,
도 4는 본 발명에 따른 다국어 검색 시스템에서 제공되는 검색창의 예를 나타낸 도면이고,
도 5는 본 발명에 따른 다국어 검색 방법을 설명하기 위한 도면이고,
도 6은 본 발명에 따른 다국어 검색 시스템이 적용된 이미지 검색 시스템의 구성을 도시한 도면이다.
이하에서는 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명한다.
도 1은 본 발명에 따른 다국어 검색 시스템이 적용된 검색 구조의 예를 도시한 도면이다. 본 발명에 따른 다국어 검색 시스템은 검색 엔진을 보유한 다양한 형태의 검색 제공 서버(100)에 적용된 상태로, 사용자가 통신망(500)을 통해 연결된 여러 유형의 사용자 단말기(310,320,330), 예컨대, 노트북(310)이나 데스크탑 컴퓨터, 스마트폰(320), 태블릿(330) 등을 통해 접속하여 검색을 요청하는 경우 해당 검색을 제공하게 된다.
여기서, 검색 제공 서버(100)로는 검색 서비스를 제공하는 검색 사이트나, 사진 공유를 위해 사용자가 등록한 사진들을 검색어를 통해 검색하는 본 발명에 따른 이미지 검색 시스템 등을 포함할 수 있다. 이외에도, 텍스트 기반의 검색어를 이용하여 검색 서비스를 제공하는 다양한 사이트에 본 발명이 적용 가능함은 물론이다.
그리고, 검색 제공 서버(100)와 사용자 단말기(310,320,330)는 상호 통신망(500)을 통해 연결되는데, 인터넷, 3G나 4G 등과 같은 무선 인터넷 등과 같이 다양한 형태의 통신망(500)을 통해 상호 연결될 수 있다.
도 2는 본 발명에 따른 다국어 검색 시스템의 구성을 도시한 도면이다. 도 2를 참조하여 설명하면, 본 발명에 따른 다국어 검색 시스템은 의미 기반 데이터베이스, 다국어 검색어 추출부(120) 및 다국어 검색부(130)를 포함한다.
의미 기반 단어 데이터베이스(110)에는 서로 다른 복수의 언어의 단어들이 저장된다. 예를 들어, 한국어, 영어, 일어, 중국어, 독일어와 같은 서로 다른 언어들에 속하는 단어들이 저장된다.
여기서, 본 발명에 따른 의미 기반 단어 데이터베이스(110)에 저장되는 단어들은 복수의 의미 그룹에 그룹핑되어 저장되는데, 하나의 의미 그룹은 단어가 갖는 의미에 따라 구분된다. 즉, 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 각각의 의미 그룹으로 그룹핑된다.
도 3은 본 발명에 따른 다국어 검색 시스템의 의미 기반 단어 데이터베이스(110)에 저장된 의미 그룹의 예를 도시한 도면이다.
도 3을 참조하여 설명하면, 의미 그룹 1은 사람이나 화물을 실은 배를 의미하는 단어들이 그룹핑되는 예를 나타낸 것으로, 한국어로 배와 선박, 영어로 ship, boat, vessel이 그룹핑된 예를 나타내고 있다.
의미 그룹 2는 과일 중의 하나인 먹는 배를 의미하는 단어들이 그룹핑되는 예를 나타낸 것으로, 한국어로 배, 영어로 pear가 그룹핑된 예를 나타낸 것이고, 의미 그룹 3은 사람 등의 신체의 일부인 배를 의미하는 단어들이 그룹핑되는 예를 나타낸 것으로, 한국어로 배와 복부, 영어로 abdomen, belly가 그룹핑된 예를 나타내고 있다.
동일한 방법으로, 의미 그룹 N은 사람 등의 팔을 의미하는 단어들이 그룹핑되는 예를 나타낸 것으로, 한국어로 팔, 영어로 arm이 그룹핑된 예를 나타내고 있다.
이와 같이, 본 발명에 따른 다국어 검색 시스템에서는 특정 언어에 속하는 단어를 기준으로 각국 언어의 단어들이 연계되는 것이 아니라 단어가 갖는 의미, 즉, 도 3에서와 같이, '사람이나 화물을 실은 배', '과일 중의 하나인 먹는 배', '사람 등의 팔' 등과 같이 언어와 무관하게 단어가 갖는 의미를 기준으로 각국의 언어의 단어들이 그룹핑된 의미 그룹으로 의미 기반 단어 데이터베이스(110)에 등록된다.
다국어 검색어 추출부(120)는 통신망(500)을 통해 특정 언어의 검색어가 입력되면, 의미 기반 단어 데이터베이스(110)에 등록되어 있는 의미 그룹 중 해당 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출한다.
이 때, 다국어 검색부(130)는 다국어 검색어 추출부(120)에 의해 추출된 각 단어, 즉 검색어가 속한 의미 구룹 내의 각 언어의 단어들에 기초하여 검색을 수행하고, 검색 결과를 통신망(500)을 통해 검색을 요청한 사용자 단말기(310,320,330)로 제공하게 된다.
여기서, 본 발명에 따른 다국어 검색 시스템의 의미 기반 단어 데이터베이스(110)에는, 도 3에 도시된 바와 같이, 각 의미 그룹에 대응하는 의미 선택용 콘텐츠가 저장될 수 있다.
각 의미 그룹에 대응하는 의미 선택용 콘텐츠는 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식할 수 있는 콘텐츠를 포함하게 된다. 도 3에서는 의미 선택용 콘텐츠로 단어의 의미에 해당하는 이미지가 적용되는 예를 나타내고 있다. 즉, 의미 그룹 1의 의미 선택용 콘텐츠로는 '사람이나 화물을 실은 배'의 이미지가, 의미 그룹 2의 의미 선택용 콘텐츠로는 '과일 중의 하나인 먹는 배'의 이미지가, 의미 그룹 3의 의미 선택용 콘텐츠로는 '사람 등의 복부'의 이미지가, 의미 그룹 N의 의미 선택용 콘텐츠로는 '사람 등의 팔'의 이미지가 적용될 수 있다.
여기서, 다국어 검색어 추출부(120)는 사용자 단말기(310,320,330)로부터 입력되는 검색어가 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는 경우, 예컨대, 도 3에 도시된 바와 같이, 검색어로 다의어가 입력되는 경우, 해당 의미 그룹들에 대응하는 의미 선택용 콘텐츠 중 어느 하나를 선택 가능하게 통신망(500)을 통해 사용자 단말기(310,320,330)로 제공한다.
도 4는 본 발명에 따른 다국어 검색 시스템에서 제공되는 검색창(SW)의 예를 나타낸 도면이다. 도 4를 참조하여 구체적으로 설명하면, 사용자가 사용자 단말기(310,320,330)를 통해 검색어로 '배'를 입력하게 되면, 다국어 검색어 추출부(120)는 의미 그룹 중 검색어 '배'가 속한 의미 그룹으로, 도 3에 도시된 의미 그룹 1, 의미 그룹 2, 의미 그룹 3을 검색하게 된다.
그리고, 다국어 검색어 추출부(120)는 검색된 의미 그룹 1, 의미 그룹 2, 의미 그룹 3에 해당하는 의미 선택용 콘텐츠인 각 이미지를, 도 4에 도시된 바와 같이, 선택창(SNW)에 표시하여 사용자가 선택 가능하게 한다.
이 때, 사용자가 도 4에 도시된 선택창(SNW)에서 의미 선택용 콘텐츠 중 어느 하나를 선택하게 되면, 검색어 추출부는 선택된 의미 선택용 콘텐츠에 대응하는 의미 그룹 내의 각 언어의 단어들을 추출하게 되고, 다국어 검색부(130)는 해댕 언어들을 검색어로 검색을 진행하여 검색 결과를 사용자 단말기(310,320,330)로 제공하게 된다.
상기와 같은 구성에 따라, 특정 언어로 검색어를 작성하여 검색하여도 다른 국가의 언어에 대한 검색 결과를 함께 제공하면서도, 여러 의미 그룹 중 검색을 요하는 의미의 의미 그룹을 선택함으로써, 검색어의 번역 과정에서 발생하는 원하지 않은 검색 결과를 배제할 수 있어, 검색 결과의 정확도를 보다 향상시킬 수 있게 된다.
예를 들어, 도 3에 도시된 예에서, 검색어로 '배'를 입력하게 되면, 종래의 검색 방법에서와 같이 단어의 번역을 통해 검색하게 되면, 한국어 '배', 영어, 'ship', 'boat', 'vessel' 외에도 'pear', 'abdomen', 'belly'도 검색어에 추가되어 검색되는데, 본 발명에 따른 검색에서는 의미 선택용 콘텐츠의 선택에 따라 'pear', 'abdomen', 'belly'의 검색을 배제시킬 수 있게 된다.
이하에서는 도 5를 참조하여 본 발명에 따른 다국어 검색 방법에 대해 상세히 설명한다.
먼저, 다국어 검색 시스템에 상술한 바와 같이, 의미 기반 단어 데이터베이스(110)가 등록된 상태(S40)에서, 사용자가 사용자 단말기(310,320,330)를 통해 다국어 검색 시스템에 접속한 후, 도 4에 도시된 바와 같이, 검색어를 입력하면(S41), 다국어 검색어 추출부(120)가 입력된 검색어가 속한 의미 그룹을 의미 기반 단어 데이터베이스(110)로부터 검색한다(S42).
여기서, 다국어 검색어 추출부(120)는 입력된 검색어가 2 이상의 의미 그룸에 속하는지 여부를 판단하게 된다(S43). 즉, S42 단계에서 검색된 의미 그룹이 복수, 즉 2 이상인 경우, 해당 의미 그룹별로 의미 선택용 콘텐츠를 추출한다(S44).
그런 다음, 도 4에 도시된 바와 같이, 다국어 검색어 추출부(120)는 추출된 의미 선택용 콘텐츠를 선택창(SNW)에 표시하게 되면, 사용자는 선택창(SNW)에 표시된 의미 선택용 콘텐츠 중 어느 하나를 선택하게 된다(S45).
그리고, 다국어 검색어 추출부(120)는 사용자가 선택한 의미 선택용 콘텐츠에 해당하는 의미 그룹 내의 단어들을 추출한다(S46). 그런 다음, 다국어 검색부(130)는 다국어 검색어 추출부(120)에 의해 추출된 단어들을 이용하여 검색을 수행하고, 검색 결과를 사용자 단말기(310,320,330)로 제공하게 된다(S47).
이하에서는, 도 6은 본 발명에 따른 이미지 검색 시스템의 구성을 도시한 도면이다. 본 발명에 따른 이미지 검색 시스템에는 상술한 다국어 검색 시스템이 적용된다. 여기서, 본 발명에 따른 이미지 검색 시스템은 이미지를 공유하는 이미지 공유 센터에 적용되어 사용자들이 등록한 이미지를 검색하는데 적용되는 것을 예로 한다.
본 발명에 따른 이미지 검색 시스템은, 도 6에 도시된 바와 같이, 의미 기반 단어 데이터베이스(710), 다국어 검색어 추출부(720), 다국어 검색부(730) 및 이미지 데이터베이스(740)를 포함한다.
의미 기반 단어 데이터베이스(710)에는 상술한 바와 같이, 서로 다른 복수의 언어들의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된다. 여기서, 의미 기반 단어 데이터베이스(710)에 저장되는 복수의 의미 그룹과, 각 언어의 단어들은 상술한 다국어 검색 시스템의 구성에 대응하는 바, 그 상세한 설명은 생략한다.
이미지 데이터베이스(740)에는 복수의 이미지가 저장된다. 여기서, 이미지 데이터베이스(740)에 저장되는 이미지는 상술한 바와 같이, 사용자가 이미지의 공유를 위해 등록한 이미지들이 저장될 수 있다.
다국어 검색어 추출부(720)는 통신망(500)을 통해 특정 언어의 검색어가 입력되는 경우, 복수의 의미 그룹 중 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출한다. 여기서, 다국어 검색어 추출부(720)가 입력된 검색어를 추출하는 과정은 상술한 다국어 검색 시스템의 구성에 대응하는 바, 그 상세한 설명은 생략한다.
다국어 검색부(730)는 다국어 검색어 추출부(720)에 의해 추출된 각 단어의 단어들에 기초하여 추출된 각 언어의 단어들에 대응하는 이미지를 이미지 데이터베이스(740)로부터 검색하고, 검색된 이미지를 통신망(500)을 통해 사용자 단말기(310,320,330)로 제공하게 된다.
여기서, 이미지 데이터베이스(740)에 저장되는 이미지들 중 적어도 하나는 복수의 의미 그룹 중 적어도 어느 하나에 매칭되어 등록될 수 있다. 즉, 이미지 데이터베이스(740)에 이미지가 등록될 때, 해당 이미지에 설정되는 키워드 등에 따라 등록되는 이미지가 의미 그룹 중 어느 하나에 매칭되어 등록될 수 있다.
이 경우, 다국어 검색부(730)는 검색을 수행할 때 의미 그룹에 매칭된 이미지들이 포함된 검색 결과를 통신망(500)을 통해 제공하게 된다.
여기서, 상술한 바와 같이, 이미지 데이터베이스(740)에 저장되는 이미지들은 적어도 하나의 키워드가 포함되어 등록되며, 다국어 검색부(730)는 다국어 검색어 추출부(720)에 의해 추출된 각 언어의 단어들과 키워드를 매칭시켜 이미지 데이터베이스(740)로부터 이미지를 검색하여 제공할 수 있다.
비록 본 발명의 몇몇 실시예들이 도시되고 설명되었지만, 본 발명이 속하는 기술분야의 통상의 지식을 가진 당업자라면 본 발명의 원칙이나 정신에서 벗어나지 않으면서 본 실시예를 변형할 수 있음을 알 수 있을 것이다. 발명의 범위는 첨부된 청구항과 그 균등물에 의해 정해질 것이다.
100 : 검색 제공 서버 110 : 의미 기반 단어 데이터베이스
120 : 다국어 검색어 추출부 130 : 다국어 검색부
310,320,330 : 사용자 단말기 500 : 통신망

Claims (11)

  1. 단어의 의미를 기반으로 하는 다국어 검색 시스템에 있어서,
    서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스와;
    통신망을 통해 특정 언어의 검색어가 입력되는 경우, 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출하는 다국어 검색어 추출부와;
    상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들에 기초한 검색 결과를 상기 통신망을 통해 제공하는 다국어 검색부를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 시스템.
  2. 제1항에 있어서,
    상기 의미 기반 단어 데이터베이스에는 상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 저장되며;
    상기 검색어 추출부는
    상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는 경우 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나를 선택 가능하게 상기 통신망을 통해 제공하고,
    상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들을 추출하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 시스템.
  3. 제2항에 있어서,
    상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 시스템.
  4. 단어의 의미를 기반으로 하는 다국어 검색 방법에 있어서,
    (a) 서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스를 구축하는 단계와;
    (b) 통신망을 통해 특정 언어의 검색어가 입력되는 단계와;
    (c) 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들이 추출되는 단계와;
    (d) 상기 추출된 각 언어의 단어들에 기초한 검색 결과가 상기 통신망을 통해 제공되는 단계를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 방법.
  5. 제4항에 있어서,
    상기 (a) 단계는
    상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 등록되는 단계를 더 포함하며;
    상기 (c) 단계는
    (c1) 상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는지 여부를 판단하는 단계와,
    (c2) 상기 (c1) 단계에서 2 이상의 의미 그룹에 속하는 것으로 판단되는 경우, 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나가 선택 가능하게 상기 통신망을 통해 제공되는 단계와;
    (c3) 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들이 추출되는 단계를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 방법.
  6. 제5항에 있어서,
    상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함하는 것을 특징으로 하는 단어의 의미를 기반으로 하는 다국어 검색 방법.
  7. 이미지 검색 시스템에 있어서,
    서로 다른 복수의 언어의 단어들이 각 단어가 갖는 의미에 따라 그룹핑되어 등록된 복수의 의미 그룹이 저장된 의미 기반 단어 데이터베이스와;
    복수의 이미지가 저장된 이미지 데이터베이스와;
    통신망을 통해 특정 언어의 검색어가 입력되는 경우, 상기 복수의 의미 그룹 중 상기 입력된 검색어가 속한 의미 그룹 내의 각 언어의 단어들을 추출하는 다국어 검색어 추출부와;
    상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들에 기초하여 상기 추출된 각 언어의 단어들에 대응하는 이미지를 상기 이미지 데이터베이스로부터 검색하여 상기 통신망을 통해 제공하는 다국어 검색부를 포함하는 것을 특징으로 하는 이미지 검색 시스템.
  8. 제7항에 있어서,
    상기 의미 기반 단어 데이터베이스에는 상기 각 의미 그룹에 속한 단어들의 의미를 직관적으로 인식 가능하게 하는 의미 선택용 콘텐츠가 상기 각 의미 그룹에 대응하여 저장되며;
    상기 검색어 추출부는
    상기 입력된 검색어가 상기 복수의 의미 그룹 중 2 이상의 의미 그룹에 속하는 경우 해당 의미 그룹들에 대응하는 상기 의미 선택용 콘텐츠 중 어느 하나를 선택 가능하게 상기 통신망을 통해 제공하고,
    상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹 내의 각 언어의 단어들을 추출하는 것을 특징으로 하는 이미지 검색 시스템.
  9. 제8항에 있어서,
    상기 의미 선택용 콘텐츠는 단어의 의미에 해당하는 이미지를 포함하는 것을 특징으로 하는 이미지 검색 시스템.
  10. 제9항에 있어서,
    상기 이미지 데이터베이스에 저장되는 이미지들 중 적어도 하나는 상기 복수의 의미 그룹 중 적어도 어느 하나에 매칭되어 등록되며;
    상기 다국어 검색부는 상기 제공된 의미 선택용 콘텐츠 중 선택된 어느 하나에 대응하는 의미 그룹에 매칭된 이미지들이 포함된 검색 결과를 상기 통신망을 통해 제공하는 것을 특징으로 하는 이미지 검색 시스템.
  11. 제10항에 있어서,
    상기 이미지 데이터베이스에 저장되는 이미지들은 적어도 하나의 키워드가 포함되어 등록되며;
    상기 다국어 검색부는 상기 다국어 검색어 추출부에 의해 추출된 각 언어의 단어들과 상기 키워드를 매칭시켜 상기 이미지 데이터베이스로부터 이미지를 검색하는 것을 특징으로 하는 이미지 검색 시스템.
KR1020130031068A 2013-03-22 2013-03-22 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 KR101505673B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020130031068A KR101505673B1 (ko) 2013-03-22 2013-03-22 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
PCT/KR2013/002473 WO2014148664A1 (ko) 2013-03-22 2013-03-26 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130031068A KR101505673B1 (ko) 2013-03-22 2013-03-22 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템

Publications (2)

Publication Number Publication Date
KR20140115849A true KR20140115849A (ko) 2014-10-01
KR101505673B1 KR101505673B1 (ko) 2015-03-24

Family

ID=51580327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130031068A KR101505673B1 (ko) 2013-03-22 2013-03-22 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템

Country Status (2)

Country Link
KR (1) KR101505673B1 (ko)
WO (1) WO2014148664A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200011794A (ko) * 2018-07-25 2020-02-04 주식회사 아이포트폴리오 언어 학습을 위한 자료 처리 시스템 및 방법
KR20200011795A (ko) * 2018-07-25 2020-02-04 주식회사 아이포트폴리오 언어 학습을 위한 문제 생성 시스템 및 방법
WO2020158991A1 (ko) * 2019-01-30 2020-08-06 주식회사 이볼케이노 단어의 컨셉 메이커를 이용한 언어 학습 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347904A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个多语言电子商务网站处理语言搜索方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097802A (ko) * 2000-04-26 2001-11-08 신재균 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
JP4380142B2 (ja) * 2002-11-05 2009-12-09 株式会社日立製作所 検索システム及び検索方法
US7739102B2 (en) * 2003-10-08 2010-06-15 Bender Howard J Relationship analysis system and method for semantic disambiguation of natural language
KR100819846B1 (ko) * 2005-04-08 2008-04-07 김동암 인터넷 검색결과 정보를 언어고리로 구성하여 제공하는방법
US8255376B2 (en) * 2006-04-19 2012-08-28 Google Inc. Augmenting queries with synonyms from synonyms map
KR100782047B1 (ko) * 2006-04-27 2007-12-04 인하대학교 산학협력단 모바일 웹 기반의 이미지검색을 위한 초기질의 집합의자동생성방법
US8402046B2 (en) * 2008-02-28 2013-03-19 Raytheon Company Conceptual reverse query expander
KR100945495B1 (ko) * 2008-05-16 2010-03-09 한국과학기술정보연구원 다국어 전문용어 자원 제공 시스템 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200011794A (ko) * 2018-07-25 2020-02-04 주식회사 아이포트폴리오 언어 학습을 위한 자료 처리 시스템 및 방법
KR20200011795A (ko) * 2018-07-25 2020-02-04 주식회사 아이포트폴리오 언어 학습을 위한 문제 생성 시스템 및 방법
WO2020158991A1 (ko) * 2019-01-30 2020-08-06 주식회사 이볼케이노 단어의 컨셉 메이커를 이용한 언어 학습 시스템
KR20200094350A (ko) * 2019-01-30 2020-08-07 주식회사 이볼케이노 단어의 컨셉 메이커를 이용한 언어 학습 시스템

Also Published As

Publication number Publication date
WO2014148664A1 (ko) 2014-09-25
KR101505673B1 (ko) 2015-03-24

Similar Documents

Publication Publication Date Title
US9411827B1 (en) Providing images of named resources in response to a search query
US8280902B2 (en) High precision search system and method
US9305089B2 (en) Search engine device and methods thereof
US9489401B1 (en) Methods and systems for object recognition
US8880559B2 (en) Location activity search engine computer system
US20110106805A1 (en) Method and system for searching multilingual documents
US8874590B2 (en) Apparatus and method for supporting keyword input
US9805120B2 (en) Query selection and results merging
EP2570937A1 (en) Data search device, data search method and program
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
CN109710732B (zh) 信息查询方法、装置、存储介质和电子设备
KR101505673B1 (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
US20160154885A1 (en) Method for searching a database
KR101955920B1 (ko) 속성 언어를 이용한 검색 방법 및 장치
JP2014102827A (ja) 検索システム及びその検索方法
Leveling et al. On metonymy recognition for geographic information retrieval
CN104778232A (zh) 一种基于长查询的搜索结果的优化方法和装置
Tabarcea et al. Framework for location-aware search engine
KR20140119217A (ko) 키워드 검색을 통해 사진 검색이 가능한 사진 공유 시스템 및 사진 공유 방법
JP2017220179A (ja) コンテンツ処理装置、コンテンツ処理方法及びプログラム
KR20210071500A (ko) 인공지능 기반의 검색 서비스 제공 장치 및 방법
GENTILE Using Flickr geotags to find similar tourism destinations
US11120096B2 (en) Method and system for generating an object card
JP2002123541A (ja) 問題解決データベース検索システム及び問題解決データベース検索プログラムを記録したコンピュータ読み取り可能な記憶媒体
CN116975083A (zh) 信息搜索方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
LAPS Lapse due to unpaid annual fee