KR100957416B1 - 동의어를 이용한 검색 서비스 제공 방법 및 시스템 - Google Patents

동의어를 이용한 검색 서비스 제공 방법 및 시스템 Download PDF

Info

Publication number
KR100957416B1
KR100957416B1 KR1020080064476A KR20080064476A KR100957416B1 KR 100957416 B1 KR100957416 B1 KR 100957416B1 KR 1020080064476 A KR1020080064476 A KR 1020080064476A KR 20080064476 A KR20080064476 A KR 20080064476A KR 100957416 B1 KR100957416 B1 KR 100957416B1
Authority
KR
South Korea
Prior art keywords
query
synonym
phoneme
search
words
Prior art date
Application number
KR1020080064476A
Other languages
English (en)
Other versions
KR20100004355A (ko
Inventor
이승준
이지혜
정연아
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080064476A priority Critical patent/KR100957416B1/ko
Publication of KR20100004355A publication Critical patent/KR20100004355A/ko
Application granted granted Critical
Publication of KR100957416B1 publication Critical patent/KR100957416B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 방법은 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하는 단계; 상기 자소 편집 거리가 기준치 이하인 경우 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 단계; 및 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 제2질의어를 상기 제1질의어의 동의어로 결정하는 단계를 포함한다.
검색, 동의어, 오탈자

Description

동의어를 이용한 검색 서비스 제공 방법 및 시스템{Method and System for Providing Search Service Using Synonym}
본 발명은 인터넷 검색에 관한 것으로서 보다 상세하게는 동의어를 이용하여 검색 서비스를 제공하는 방법에 관한 것이다.
인터넷의 발달 및 보급의 증가로 인해 인터넷을 이용한 다양한 서비스가 제공되고 있는데, 그 중 대표적인 예가 검색 서비스라 할 수 있다. 이러한 검색 서비스는 사용자가 검색하고자 하는 단어 또는 단어의 조합을 질의어로 입력하면, 검색 엔진이 입력된 질의어에 상응하는 검색결과 문서(예컨대, 사용자로부터 입력된 검색 질의어를 포함하는 웹 사이트, 기사, 또는 해당 검색 질의어를 포함하는 파일명을 갖는 이미지 등)를 사용자에게 제공하는 서비스를 의미한다.
이러한, 검색 서비스를 이용함에 있어서, 자신이 원하는 검색 결과에 상응하는 적절한 질의어를 선택하는 것이 쉽지 않기 때문에, 사용자들은 자신이 획득하고자 했던 검색 결과에 상응하는 질의어가 아닌 다른 질의어를 입력하는 경우가 종종 발생한다. 이러한 경우, 검색 시스템은 실제로 입력된 질의어만을 기반으로 검색을 수행하기 때문에, 사용자들은 자신이 원했던 검색 결과를 얻지 못하게 된다는 문제 점이 있다.
예를 들어, 사용자가 "싸이월드"라는 질의어를 입력하여야 하는데 "ㅅ싸이월드"로 입력하거나, "다음"이라는 질의어를 입력하여야 하는데 "당ㅡㅁ"으로 입력하거나, 또는 "네이버"라는 질의어를 입력하여야 하는데 "ㄴㅔ이버"로 입력하는 경우와 같이 사용자들이 자주 틀리는 오탈자를 질의어로 입력하게 되는 경우 검색 시스템은 실제로 입력된 오탈자 질의어를 기반으로 검색을 수행하고, 그 결과를 사용자에게 제공하기 때문에, 사용자는 자신이 원했던 검색 결과를 획득하지 못하게 되는 것이다.
따라서, 이러한 경우 사용자는 원하는 검색 결과를 얻기 위해서 검색 질의어를 다시 입력할 수 밖에 없어 검색 서비스를 이용하는 사용자의 불편을 초래하게 되고, 이는 결국 검색 서비스의 만족도 및 신뢰도의 저하로 이어질 수 있다는 문제점이 있다.
또한, 사용자가 성인 질의어에 대한 검색 결과를 얻고자 할 때, 성인 질의어가 금칙어에 해당하여 성인 인증 절차를 거쳐야지만 검색 결과를 제공 받을 수 있기 때문에 성인 질의어에 대해 의도적으로 오탈자로 검색하는 경우에는 실질적으로 금칙어에 해당하는 질의어에 대한 검색 결과가 제공되는 문제점이 있다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 오탈자 질의어에 대한 정확한 표기의 질의어를 동의어로 결정할 수 있는 동의어를 이용한 검색 서비스 제공 방법 및 시스템을 제공하는 것을 기술적 과제로 한다.
또한, 본 발명은 사용자에 의해 입력된 오탈자 검색 질의어에 대한 정확한 표기의 질의어에 해당하는 동의어인지 여부를 반영하여 검색 서비스를 제공할 수 있는 동의어를 이용한 검색 서비스 제공 방법 및 시스템을 제공하는 것을 다른 기술적 과제로 한다.
또한, 본 발명은 의도적으로 오탈자로 검색하는 성인 질의어에 대한 금칙어 적용이 가능한 동의어를 이용한 검색 서비스 제공 방법 및 시스템을 제공하는 것을 또 다른 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면의 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 방법은 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하는 단계; 상기 자소 편집 거리가 기준치 이하인 경우 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 단계; 및 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 제2질의어를 상기 제1질의어의 동의어로 결정하는 단계를 포함한다.
일 실시예에 있어서, 상기 제1 및 제2 질의어는 발음 코드가 일치하는 질의 어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 하며, 다른 실시예에 있어서, 상기 제1 및 제2 질의어는 자소 단위별로 동일한 질의어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 한다.
이 때, 상기 자소 편집 거리가 기준치 이하인지 여부 판단 단계 이전에, 질의어들의 그룹 중에서 질의어 입력 횟수(Query Count)가 가장 높은 질의어를 상기 제2질의어로, 나머지 질의어를 상기 제1질의어로 결정하는 단계를 더 포함하는 것을 특징으로 한다.
이 때, 상기 동의어 결정 단계 이후에, 상기 제1 및 제2 질의어를 동의어로 매칭하여 동의어 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 한다.
한편, 상기 동의어를 이용한 검색 서비스 제공 방법은 사용자로부터 검색 질의어를 수신하는 단계; 상기 수신된 검색 질의어의 동의어가 존재하는지를 판단하는 단계; 및 상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 수신된 검색 질의어에 대한 검색 결과에 상기 동의어에 대한 검색 결과를 포함시켜 제공하는 단계를 더 포함하는 것을 특징으로 한다. 이때, 상기 동의어가 존재하는지를 판단하는 단계 이후, 상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 동의어가 금칙어에 해당하는지를 판단하여, 상기 금칙어에 해당하는 하는 경우 별도의 인증 단계를 더 포함하는 것을 특징으로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면의 다른 실시예에 따른 동의어를 이용한 검색 서비스 제공 방법은 제1질의어 및 제2질의어 중에서 어느 한 질 의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 단계; 상기 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 한 음절을 이룰 수 없는 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한지 여부를 판단하는 단계; 및 상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 단계를 포함한다.
이 때, 상기 제1 및 제2 질의어 동일 여부 판단 단계에서, 상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일하지 않은 경우, 상기 제1 및 제2 질의어가 자소 단위로 일치하는지 여부를 판단하는 단계를 더 포함하며, 상기 제1 및 제2 질의어가 자소 단위로 일치하는 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 것을 특징으로 한다.
일 실시예에 있어서, 상기 제1 및 제2 질의어는 연속하여 입력된 질의어인 것을 특징으로 한다.
이 때, 상기 동의어 결정 단계 이후에, 상기 제1 및 제2 질의어를 동의어로 매칭하여 동의어 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 한다.
한편, 상기 동의어를 이용한 검색 서비스 제공 방법은 사용자로부터 검색 질의어를 수신하는 단계; 상기 수신된 검색 질의어의 동의어가 존재하는지를 판단하는 단계; 및 상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 수신된 검색 질의어에 대한 검색 결과에 상기 동의어에 대한 검색 결과를 포함시켜 제공하는 단계를 더 포함하는 것을 특징으로 한다. 이때, 상기 동의어가 존재하는지를 판단 하는 단계 이후, 상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 동의어가 금칙어에 해당하는지를 판단하여, 상기 금칙어에 해당하는 하는 경우 별도의 인증 단계를 더 포함하는 것을 특징으로 한다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면의 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 시스템은 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하는 편집 거리 판단부; 및 상기 자소 편집 거리가 기준치 이하인 경우 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하여, 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 제2질의어를 상기 제1질의어의 동의어로 결정하는 제1자소 판단부를 포함한다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면의 다른 실시예에 따른 동의어를 이용한 검색 서비스 제공 시스템은 제1질의어 및 제2질의어 중에서 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 제2자소 판단부; 및 상기 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 한 음절을 이룰 수 없는 자소를 제거한 후 상기 제1및 제2질의어가 동일한지 여부를 판단하여, 상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 제1동일성 판단부를 포함한다.
상술한 바와 같이 본 발명에 따르면, 사용자들에 의해 입력되는 오탈자 질의어에 대한 정확한 표기의 질의어를 동의어로 보다 정확하고 용이하게 결정할 수 있 다는 효과가 있다.
또한, 본 발명에 따르면, 사용자로부터 오탈자인 검색 질의어가 입력되는 경우 입력된 검색 질의어에 대한 검색 결과에 입력된 검색 질의어의 정확한 표기의 동의어에 대한 검색 결과를 포함시켜 제공함으로써 사용자의 편의성을 증대시킴은 물론, 이로 인해 검색 서비스의 만족도 및 신뢰도를 향상시킬 수 있다는 효과가 있다.
또한, 본 발명에 따르면, 의도적으로 오탈자로 검색되는 성인 질의어에 대한 금칙어 적용이 가능하여, 무분별한 검색 결과 제공을 방지할 수 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 동의어 결정부의 구성을 보여주는 블럭도이다. 도 1에 도시된 제1동의어 결정부는 다수의 질의어들을 대상으로 각 질의어들의 동의어를 결정하여 동의어 데이터베이스를 구축하는 것으로서, 제1동의어 결정부는 후술할 동의어를 이용한 검색 서비스 제공 시스템에 직접 포함되거나, 동의어를 이용한 검색 서비스 제공 시스템과는 독립적으로 구성될 수 있다.
도시된 바와 같이, 이러한 제1동의어 결정부(100)는 질의어 결정부(120), 편집 거리 판단부(140) 및 제1자소 판단부(160)를 포함한다.
질의어 결정부(120)는 질의어들의 그룹 중에서 질의어 입력 횟수(Query Count)가 가장 높은 질의어를 제2질의어로, 나머지 질의어를 제1질의어로 결정한 다.
일 실시예에 있어서, 제1 및 제2 질의어는 발음 코드가 일치하는 질의어들의 그룹 중 각각 어느 하나의 질의어일 수 있다. 이 때, 질의어 결정부(120)는 발음 코드가 일치하는 질의어들의 그룹 중에서 질의어 입력 횟수가 가장 높고, 오탈자가 없는 질의어인 제2질의어를 대표 질의어로 결정할 수 있다. 여기서, 오탈자는 사전적 의미인 잘못되거나 빠뜨린 글자를 의미하는 것이 아니라, "ㅅ싸이월드"와 같이 원래의 정확한 표기의 단어인 "싸이월드"에 한 음절을 이룰 수 없는 자소가 포함된 경우 또는 "당ㅡㅁ"과 같이 자소 단위로 풀어 쓴 경우 원 표기인"다음"과 자소 단위로 일치하는 경우와 같이 사용자가 잘 못 입력하는 단어를 의미하며, 이하에서는 상기와 같은 경우의 단어를 오탈자로 가정하고 설명하기로 한다.
여기서, 발음 코드가 일치하는 질의어들의 그룹이란 한글 자소 집합에 코드값을 갖도록 구성된 코드 테이블을 이용하여 질의어 간에 코드값을 추출하고, 추출된 코드값을 비교함으로써 발음 코드가 일치하는 질의어들 즉, 발음이 유사한 질의어들의 그룹을 의미한다. 또한, 발음 코드는 영어와 영어에 대한 음차 표기인 한글 외래어 간에 동일한 코드값을 갖도록 구성된 코드 테이블을 이용하여 두 문자간에 코드값을 추출하고, 추출된 코드값을 비교함으로써 영어와 한글 외래어간의 매핑 여부를 확인하는데 이용될 수 있다.
질의어 결정부(120)에서 이용되는 발음 코드 테이블의 예가 도 2에 도시되어 있으며, 도시된 바와 같이, 한글 자소 집합에 각각의 코드값이 부여되어 있으며, 영어의 각 알파벳 집합에도 각각 동일한 코드값이 부여된 것을 알 수 있다. 여기 서, 자소 앞의 "*"는 자소가 어절에서 첫 번째 자소 또는 첫글자에 포함된 자소를 의미할 수 있으며, 자소 뒤의 "*"는 자소가 종성임을 의미할 수 있다. 또한, 코드 테이블에 존재하지 않는 자소는 무시될 수 있으며, 한글 모음은 모두 무시되고, 코드 테이블에 존재하지 않는 몇몇 한글 자음의 종성도 무시될 수 있다. 그리고, 자소 사이의 덧셈 기호(+)는 덧셈기호의 앞뒤의 자소가 연속적으로 존재함을 의미할 수 있다. 예를 들어, 질의어가"텔레비전"인 경우, "텔레비전"의 자소"ㅌ, ㅔ, ㄹ, ㄹ, ㅔ, ㅂ, ㅣ, ㅈ, ㅓ, ㄴ"에서 모든 모음은 무시되기 때문에 모음을 제외한 자소 "ㅌ, ㄹ, ㄹ, ㅂ, ㅈ, ㄴ"을 코드 테이블을 이용해 치환하면""34532"와 같은 코드값으로 부호화할 수 있다.
결국,"네이버", "ㄴㅔ이버",, "네ㅇㅣ버", "네이ㅂㅓ"와 같은 질의어 그룹은 자음인 자소가"ㄴ, ㅂ"로 이루어져 있어, 발음코드가 일치하는 질의어 그룹에 해당할 수 있다. 만일, 이 중에서 질의어 입력 횟수(Query Count)가 가장 높으며, 오탈자가 없는 질의어가 "네이버"라면, "네이버"가 제2질의어로 결정될 수 있으며, 나머지 질의어는 제1질의어로 결정될 수 있다. 한편, "ㅅ싸이월드", "싸이월드", "싸ㅇㅣ월드"와 같은 질의어 그룹은 "ㅅ싸이월드"의 자음인 자소가 "ㅅ, ㅆ, ㄹ, ㄷ"로 이루어져 있고, 나머지 질의어의 자음인 자소가 "ㅆ, ㄹ, ㄷ"로 이루어져 있어, 발음 코드가 일치하지 않을 수 있다. 하지만, 본 발명의 일 실시예에 따른 질의어 결정부는 "ㅅ싸이월드"와 같이 한 음절을 이룰 수 없는 자소의 경우 발음 코드값 추출시 "ㅅ"에 대한 코드값은 제외하고 판단할 수 있다. 이 경우, "ㅅ싸이월드", "싸이월드", "싸ㅇㅣ월드" 또한 발음코드가 일치하는 질의어 그룹에 해당할 수 있 다.
다시 말해, 본 발명의 일 실시예에 따른 질의어 결정부는 발음 코드를 이용하여 발음이 거의 유사한 질의어들을 그룹핑하여, 그 중에서 질의어 입력 횟수가 높고, 오탈자가 없는 기본 질의어를 제2질의어로, 나머지 질의어를 제1질의어로 결정하는 것이다.
다른 실시예에 있어서, 제1 및 제2 질의어는 자소 단위별로 동일한 질의어들의 그룹 중 각각 어느 하나의 질의어일 수 있다. 이 때, 질의어 결정부(120)는 자소 단위별로 동일한 질의어들의 그룹 중에서 질의어 입력 횟수가 가장 높고, 오탈자가 없는 질의어인 제2질의어를 대표 질의어로 결정할 수 있다. 여기서, 자소 단위별로 동일한 질의어들의 그룹이란 질의어들의 자소를 분리한 후 자소의 배치 순서대로 동일한 질의어들의 그룹을 의미한다.
예를 들어, "싸이월드"와 "ㅆㅏ이월드"와 같은 질의어 그룹은 각 질의어들의 자소를 분리하면 "ㅆㅏㅇㅣㅇㅝㄹㄷㅡ"처럼 자소 단위별로 동일하므로 자소 단위별로 동일한 질의어들의 그룹에 해당할 수 있다. 또한, "네이버", "ㄴㅔ이버",, "네ㅇㅣ버", "네이ㅂㅓ"와 같은 질의어 그룹도 마찬가지로 자소 단위별로 동일한 질의어들의 그룹에 해당할 수 있다.
다시 도 1을 참조하면, 편집 거리 판단부(140)는 질의어 결정부(120)에 의해 결정된 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단한다.
먼저, 자소 편집 거리를 구하기 위해서는 제1 및 제2 질의어를 자소 단위로 구분하고, 제1 및 제2 질의어를 자소별로 비교하여 그 차이를 분석하고, 분석 결과 차이가 나는 자소에 대한 자소별 점수를 부여한다. 예를 들어, 제1질의어가 "ㅅ싸이월드"이고, 제2질의어가 "싸이월드"인 경우 질의어들을 자소 단위로 구분하면, 제1질의어는 "ㅅ, ㅆ, ㅏ, ㅇ, ㅣ, ㅇ, ㅜ, ㅓ, ㄹ, ㄷ, ㅡ"로, 제2질의어는 "ㅆ, ㅏ, ㅇ, ㅣ, ㅇ, ㅜ, ㅓ, ㄹ, ㄷ, ㅡ"로 구분된다. 따라서, 제1 및 제2 질의어를 자소별로 비교하면 "ㅅ"에 해당하는 한 자소만 차이가 있으며, 이에 대해 차이 나는 각 자소 별로 1점을 부여하면 "1"이라는 자소 편집 거리가 산출될 수 있다.
편집 거리 판단부(140)가 자소 편집 거리를 산출하는 예가 도 3에 도시되어 있으며, 도 3의 (a)에 도시된 "칵테일"과 "칵테일바"의 경우 "ㅂ", "ㅏ"와 같이 두 자소가 차이가 있으므로 편집 거리(Edit distance)로 "2"가 산출되는 것을 알 수 있다. 또한, 도 3의 (b)에 도시된 "카셋트"와 "카세트"의 경우 "ㅅ"에 해당하는 한 자소 만 차이가 있고, 도 3의 (c)에 도시된 "모짜르트"와 "모차르트"의 경우 "ㅉ"와 "ㅊ"과 같이 한 자소 만 차이가 있으며, 도 3의 (d)에 도시된 "디지털"과 "디지털"의 경우 "ㅓ"와 "ㅏ"와 같이 한 자소만 차이가 있으므로 편집 거리로 "1"이 산출되는 것을 알 수 있다.
예를 들어, 기준치를 "1"이라고 한다면, 자소별로 차이가 없어 편집 거리가 "0"으로 산출되는 질의어인"네이버", "ㄴㅔ이버"기 자소 편집 거리가 기준치 이하에 해당하는 질의어에 속할 수 있다. 또한, "싸이월드", "ㅅ싸이월드"와 같이 자소 편집 거리가 "1"로 산출되는 질의어도 자소 편집 거리가 기준치 이하에 해당하는 질의어에 속할 수 있다.
다시 말해, 본 발명의 일 실시예에 따른 편집 거리 판단부는 제1질의어와 기본 질의어인 제2질의어와의 자소 편집 거리를 산출하여, 제1질의어가 제2질의어와 자소 단위로 차이가 없는지를 판단하는 것이다.
다시 도 1을 참조하면, 제1자소 판단부(160)는 편집 거리 판단부(140)에 의해 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인 것으로 판단된 경우, 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하여, 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 제2질의어를 제1질의어의 동의어로 결정한다.
예를 들어, 제2질의어가 "네이버", 제1질의어가 "ㄴㅔ이버"라면, 제1질의어 "ㄴㅔ이버"는 한 음절을 이룰 수 없는 자소인 "ㄴ", "ㅔ"를 포함하고 있으므로, 제2질의어 "네이버"는 제1질의어 "ㄴㅔ이버"의 동의어로 결정될 수 있다. 또한, 제2질의어가 "싸이월드", 제1질의어가 "ㅅ싸이월드"라면, 제1질의어 "ㅅ싸이월드" 또한 한 음절을 이룰 수 없는 자소인 "ㅅ"을 포함하고 있으므로, 마찬가지로 제2질의어 "싸이월드"는 제1질의어 "ㅅ싸이월드"의 동의어로 결정될 수 있다.
이하에서는, 본 발명의 다른 실시예에 따른 동의어 결정부의 구성을 도 4를 참조하여 설명하기로 한다. 도 4에 도시된 제2동의어 결정부는 연속으로 입력된 질의어들을 대상으로 각 질의어들의 동의어를 결정하여 동의어 데이터베이스를 구축하는 것으로서, 제2동의어 결정부는 후술할 동의어를 이용한 검색 서비스 제공 시스템에 직접 포함되거나, 동의어를 이용한 검색 서비스 제공 시스템과는 독립적으로 구성될 수 있다.
도시된 바와 같이, 이러한 제2동의어 결정부(200)는 제2자소 판단부(220), 제1동일성 판단부(240) 및 제2동일성 판단부(260)를 포함한다.
제2자소 판단부(220)는 제1질의어 및 제2질의어 중에서 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단한다. 일 실시예에 있어서, 제1 및 제2 질의어는 연속하여 입력된 질의어일 수 있다. 예를 들어, "ㅅ싸이월드", "싸이월드"와 같은 질의어가 연속으로 입력된 경우 또는, "당ㅡㅁ", "다음"과 같은 질의어가 연속으로 입력된 경우, 제2자소 판단부는 입력된 질의어 중에서 "ㅅ싸이월드" 또는 당ㅡㅁ"과 같이 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지를 판단하는 것이다.
제1동일성 판단부(240)는 제2자소 판단부(220)에 의해 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는 것으로 판단된 경우, 한 음절을 이룰 수 없는 자소를 제거한 후 제1 및 제2 질의어가 동일한지 여부를 판단하여, 자소를 제거한 후 제1 및 제2 질의어가 동일한 것으로 판단되면, 제1 및 제2 질의어를 동의어로 결정한다. 예를 들어, 제1동일성 판단부는"ㅅ싸이월드", "싸이월드"와 같이 한 질의에서만 한 음절을 이룰 수 없는 자소를 포함하고 있은 경우, "ㅅ싸이월드"에서 "ㅅ"을 제거한 후 다른 질의어와 동일한지를 판단하는 것이다. 이 경우, "ㅅ싸이월드"와 "싸이월드"는 "ㅅ싸이월드"에서 "ㅅ"을 제거한 후 다른 질의어인"싸이월드"와 동일하므로 동의어로 결정될 수 있다.
제2동일성 판단부(260)는 제1동일성 판단부(240)에 의해 자소를 제거한 후 제1 및 제2 질의어가 동일하지 않은 것으로 판단된 경우, 제1 및 제2 질의어가 자 소 단위로 일치하는지 여부를 판단하여, 제1 및 제2 질의어가 자소 단위로 일치하면, 제1 및 제2 질의어를 동의어로 결정한다. 예를 들어, 제1동일성 판단부에서 "당ㅡㅁ", "다음"과 같이 "당ㅡㅁ"에서 한 음절을 이룰 수 없는 자소를 제거한 "당" 과 다른 질의어인 "다음"이 동일하지 않은 것으로 판단된 경우, 제2동일성 판단부는 "당ㅡㅁ", "다음"을 자소 단위로 분석하여 자소 단위로 일치하는지를 판단하는 것이다. 이 경우, "당ㅡㅁ"과 "다음"은 "ㄷ, ㅏ, ㅇ, ㅡ, ㅁ"과 같이 동일한 자소로 이루어져 자소 단위로 일치하여 동의어로 결정될 수 있다.
상술한 바와 같이, 본 발명의 실시예에 따른 동의어 결정부는 질의어들의 분석을 통하여 각 질의어들의 동의어를 결정하고, 동의어로 결정된 각 질의어를 동의어로 매칭시켜 저장함으로써 동의어 데이터베이스를 구축한다.
이하에서는, 상술한 동의어 결정부에 의해 결정된 동의어를 이용하여 검색 서비스를 제공하는 본 발명의 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 시스템을 도 5를 참조하여 설명하기로 한다.
도시된 바와 같이, 동의어를 이용한 검색 서비스 제공 시스템(900)은 동의어 결정부(300), 동의어 데이터베이스(400), 질의어 수신부(500), 동의어 판단부(600), 인증부(700) 및 검색 결과 제공부(800)를 포함한다.
동의어 결정부(300)는 상술한 바와 같이 질의어들을 분석하여 오탈자 관계에 있는 질의어들을 동의어로 결정하는 것으로서 상술한 제1동의어 결정부(100) 및 제2동의어 결정부(200)를 포함할 수 있으며, 동의어 데이터베이스(200)는 동의어 결정부(300)에 의해 오탈자 관계에 있는 것으로 판단된 제1 및 제2 질의어가 동의어 로 매칭되어 저장된다.
검색 질의어 수신부(500)는 사용자로부터 검색 질의어를 수신하고, 동의어 판단부(600)는 검색 질의어 수신부(300)를 통해 수신된 검색 질의어의 동의어가 동의어 데이터베이스(200)에 존재하는지를 판단한다. 다시 말해, 검색 질의어 판단부는 사용자가 입력한 검색 질의어가 오탈자인 경우 정확한 표기의 질의어가 동의어로서 동의어 데이터베이스(200)에 저장되어 있는지를 판단하는 것이다.
인증부는(700)는 동의어 판단부(600)에 의해 수신된 검색 질의어의 동의어가 존재하는 것으로 판단된 경우, 동의어가 금칙어에 해당하는지를 판단하여, 금칙어에 해당하는 경우 별도의 인증 절차를 수행한다. 다시 말해, 수신된 검색 질의어가 의도적으로 오탈자로 검색하는 성인 질의어인 경우 인증부는 수신된 검색 질의어의 동의어로 저장된 질의어가 성인 인증을 필요로 하는 금칙어에 해당하는지를 판단하여 별도의 성인 인증 절차를 수행하는 것이다.
인증부(700)에 의해 성인 인증 절차가 수행되는 예가 도 6에 도시되어 있으며, 도시된 바와 같이, 검색 질의어의 동의어가 성인 인증을 필요로 하는 금칙어인 경우 성인 인증 절차를 거쳐야만 검색 결과가 제공될 수 있다. 따라서, 본 발명의 다른 실시예에 따른 동의어 결정부는 의도적으로 오탈자로 검색하는 성인 질의어에 대해 금칙어 적용이 가능하다.
다시 도 5를 참조하면, 검색 결과 제공부(800)는 수신된 검색 질의어의 동의어가 존재하는 경우, 수신된 검색 질의어에 대한 검색 결과에 수신된 검색 질의어의 동의어에 대한 검색 결과를 함께 포함시켜 제공하며, 수신된 검색 질의어의 동 의어가 금칙어에 해당하는 경우에는 인증부(700)에 의해 별도의 인증 절차를 거친 후 검색 결과를 제공한다. 따라서, 검색 결과 제공부(800)는 사용자가 입력한 검색 질의어에 대한 검색 결과뿐만 아니라 입력한 검색 질의어와 동의어 관계에 있는 검색 결과도 함께 제공할 수 있어 보다 정확한 검색 결과를 제공할 수 있다.
본 실시예에 있어서는 동의어 결정부(300)가 검색 서비스 제공 시스템(900)에 포함되는 것으로 기재하였지만, 위에서 언급한 바와 같이, 동의어 결정부(300)는 검색 서비스 제공 시스템(900)에 포함되지 않을 수도 있을 것이다. 이러한 경우, 검색 서비스 제공 시스템(900)은 동의어 결정부(300)에 의해 구축된 동의어 데이터베이스(400)를 이용하여 검색 서비스를 제공하게 된다.
이하에서는 도 7을 참조하여 본 발명의 일 실시예에 따른 동의어 결정 방법을 설명하기로 한다.
먼저, 제1질의어 및 제2질의어를 결정한다(S10). 일 실시예에 있어서, 발음 코드가 일치하는 질의어들의 그룹 중에서 질의어 입력 횟수(Query Count)가 가장 높은 질의어를 제2질의어로, 나머지 질의어를 제1질의어로 결정할 수 있다.
다음으로, 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하여(S12), 판단 결과, 자소 편집 거리가 기준치 이하인 경우 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단한다(S14). 다시 말해, 제1질의어와 기본 질의어인 제2질의어와의 자소 편집 거리를 산출하여, 제1질의어가 제2질의어와 자소 단위로 차이가 없는지를 판단하고, 제1질의어가 제2질의어와 자소 단위로 차이가 거의 없는 경우 제1질의어가 한 음절을 이룰 수 없는 자 소를 포함하고 있는지 판단하는 것이다.
판단 결과, 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 것으로 판단되면, 제2질의어를 제1질의어의 동의어로 결정한다(S16). 예를 들어, 제2질의어가 "싸이월드", 제1질의어가 "ㅅ싸이월드"라면, 제1질의어 "ㅅ싸이월드"가 한 음절을 이룰 수 없는 자소인 "ㅅ"을 포함하고 있으므로, 제2질의어 "싸이월드"는 제1질의어 "ㅅ싸이월드"의 동의어로 결정될 수 있다.
마지막으로, 제1 및 제2 질의어를 동의어로 매칭하여 동의어 데이터베이스에 저장함으로써 동의어 데이터베이스를 구축한다(S18). 즉, 사용자가 입력한 오탈자 질의어에 대한 정확한 표기의 질의어가 동의어로 결정되어 데이터베이스에 저장되는 것이다.
한편, 이하에서는 도 8을 참조하여 본 발명의 다른 실시예에 따른 동의어 결정 방법을 설명하기로 한다.
먼저, 제1질의어 및 제2질의어를 결정한다(S20). 이때, 제1 및 제2 질의어는 연속으로 입력된 질의어일 수 있다. 다음으로, 제1 및 제2 질의어 중에서 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하여(S22), 판단 결과, 한 음절을 이룰 수 없는 자소를 포함하고 있는 것으로 판단되면, 한 음절을 이룰 수 없는 자소를 제거한 후 제1 및 제2 질의어가 동일한지 여부를 판단한다(S24).
판단 결과, 한 음절을 이룰 수 없는 자소를 제거한 후 제1 및 제2 질의어가 동일한 것으로 판단되면, 제1 및 제2 질의어를 동의어로 결정한다(S26). 한편, S24 에서 한 음절을 이룰 수 없는 자소를 제거한 후 제1 및 제2 질의어가 동일하지 않은 것으로 판단되면, 제1 및 제2 질의어가 자소 단위로 일치하는지 여부를 판단하여(S28), 판단 결과, 제1 및 제2 질의어가 자소 단위로 일치하는 것으로 판단되면, 제1 및 제2 질의어를 동의어로 결정한다(S26).
마지막으로, 제1 및 제2 질의어를 동의어로 매칭하여 동의어 데이터베이스에 저장함으로써 동의어 데이터베이스를 구축한다(S30). 다시 말해, 사용자가 연속으로 입력한 질의어 중에서 오탈자 질의어가 존재하는 경우, 오탈자 질의어에 대한 정확한 표기의 질의어가 동의어로 결정되어 데이터베이스에 저장되는 것이다.
이하에서는 상술한 동의어 결정 방법을 이용하여 결정된 동의어를 이용하여 검색 서비스를 제공하는 방법을 도 9를 참조하여 설명한다.
먼저, 사용자로부터 검색 질의어를 수신하고(S31), 수신된 검색 질의어의 동의어가 동의어 데이터베이스에 존재하는지를 판단한다(S33). 다시 말해, 사용자가 입력한 질의어가 오탈자인 질의어인 경우 정확한 표기의 질의어가 동의어로서 동의어 데이터베이스에 저장되어 있는지를 판단하는 것이다.
판단 결과, 수신된 검색 질의어의 동의어가 존재하는 경우, 동의어가 금칙어에 해당하는지를 판단하여(S35), 동의어가 금칙어에 해당하지 않은 경우, 수신된 검색 질의어에 대한 검색 결과를 제공함에 있어서, 수신된 검색 질의어에 대한 검색 결과에 수신된 검색 질의어의 동의어에 대한 검색 결과를 포함시켜 제공한다(S37). 한편, S35에서 동의어가 금칙어에 해당하는 하는 경우 별도의 인증 절차를 수행한다(S39). 따라서, 의도적으로 오탈자로 검색하는 성인 질의어에 대해 금 칙어 적용이 가능하다.
상술한 동의어를 이용한 검색 서비스 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터로 판독 가능한 기록 매체에 기록될 수 있다. 이때, 컴퓨터로 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 한편, 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터로 판독 가능한 기록매체에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM, DVD와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 한편, 이러한 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다.
또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
한편, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 본 발명의 일 실시예에 따른 동의어 결정부의 구성을 보여주는 블럭도이다.
도 2는 발음 코드 테이블의 예를 보여주는 도면이다.
도 3은 자소 편집 거리 산출의 예를 보여주는 도면이다.
도 4는 본 발명의 다른 실시예에 따른 동의어 결정부의 구성을 보여주는 블럭도이다.
도 5는 도 1 및 도 4에 도시된 동의어 결정부를 포함하는 본 발명의 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 시스템의 개략적인 블록도이다.
도 6은 성인 인증 절차가 수행되는 예를 보여주는 도면이다.
도 7은 본 발명의 일 실시예에 따른 동의어 결정 방법을 보여주는 플로우차트이다.
도 8은 본 발명의 다른 실시예에 따른 동의어 결정 방법을 보여주는 플로우차트이다.
도 9는 본 발명에 의한 일 실시예에 따른 동의어를 이용한 검색 서비스 제공 방법을 보여주는 플로우차트이다.
<도면의 주요 부분에 대한 부분의 설명>
100 : 제1동의어 결정부 120 : 질의어 결정부
140 : 편집 거리 판단부 160 : 제1자소 판단부

Claims (21)

  1. 질의어들의 그룹 중에서 질의어 입력 횟수(Query Count)가 가장 높은 질의어를 제2질의어로, 나머지 질의어를 제1질의어로 결정하는 단계;
    상기 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하는 단계;
    상기 자소 편집 거리가 기준치 이하인 경우 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 단계; 및
    상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 제2질의어를 상기 제1질의어의 동의어로 결정하는 단계
    를 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  2. 제 1 항에 있어서,
    상기 제1 및 제2 질의어는 발음 코드가 일치하는 질의어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  3. 제 1 항에 있어서,
    상기 제1 및 제2 질의어는 자소 단위별로 동일한 질의어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  4. 삭제
  5. 제1질의어 및 제2질의어 중에서 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 단계;
    상기 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 한 음절을 이룰 수 없는 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한지 여부를 판단하는 단계; 및
    상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 단계
    를 포함하고,
    상기 제1 및 제2 질의어는, 연속하여 입력된 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  6. 제 5 항에 있어서, 상기 제1 및 제2 질의어 동일 여부 판단 단계에서,
    상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일하지 않은 경우, 상기 제1 및 제2 질의어가 자소 단위로 일치하는지 여부를 판단하는 단계를 더 포함하며,
    상기 제1 및 제2 질의어가 자소 단위로 일치하는 경우, 상기 제1 및 제2 질 의어를 동의어로 결정하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  7. 삭제
  8. 제 1 항 또는 제 5 항에 있어서, 상기 동의어 결정 단계 이후에,
    상기 제1 및 제2 질의어를 동의어로 매칭하여 동의어 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  9. 제 1 항 또는 제 5 항에 있어서,
    사용자로부터 검색 질의어를 수신하는 단계;
    상기 수신된 검색 질의어의 동의어가 존재하는지를 판단하는 단계; 및
    상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 수신된 검색 질의어에 대한 검색 결과에 상기 동의어에 대한 검색 결과를 포함시켜 제공하는 단계를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  10. 제 9 항에 있어서, 상기 동의어가 존재하는지를 판단하는 단계 이후,
    상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 동의어가 금칙어에 해당하는지를 판단하여, 상기 금칙어에 해당하는 하는 경우 별도의 인증 단계를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 방법.
  11. 제 1 항 내지 제3항, 제5항 내지 제 6 항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록된 기록매체.
  12. 질의어들의 그룹 중에서 질의어 입력 횟수(Query Count)가 가장 높은 질의어를 제2질의어로, 나머지 질의어를 제1질의어로 결정하는 질의어 결정부;
    상기 제1질의어와 제2질의어의 자소 편집 거리가 기준치 이하인지 여부를 판단하는 편집 거리 판단부; 및
    상기 자소 편집 거리가 기준치 이하인 경우 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하여, 상기 제1질의어가 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 제2질의어를 상기 제1질의어의 동의어로 결정하는 제1자소 판단부
    를 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  13. 제 12 항에 있어서,
    상기 제1 및 제2 질의어는 발음 코드가 일치하는 질의어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  14. 제 12 항에 있어서,
    상기 제1 및 제2 질의어는 자소 단위별로 동일한 질의어들의 그룹 중 각각 어느 하나의 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  15. 삭제
  16. 제1질의어 및 제2질의어 중에서 어느 한 질의어에서만 한 음절을 이룰 수 없는 자소를 포함하고 있는지 여부를 판단하는 제2자소 판단부; 및
    상기 한 음절을 이룰 수 없는 자소를 포함하고 있는 경우, 상기 한 음절을 이룰 수 없는 자소를 제거한 후 상기 제1및 제2질의어가 동일한지 여부를 판단하여, 상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일한 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 제1동일성 판단부
    를 포함하고,
    상기 제1 및 제2 질의어는 연속하여 입력된 질의어인 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  17. 제 16 항에 있어서,
    상기 자소를 제거한 후 상기 제1 및 제2 질의어가 동일하지 않은 경우, 상기 제1 및 제2 질의어가 자소 단위로 일치하는지 여부를 판단하여, 상기 제1 및 제2 질의어가 자소 단위로 일치하는 경우, 상기 제1 및 제2 질의어를 동의어로 결정하는 제2동일성 판단부를 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  18. 삭제
  19. 제 12 항 또는 제 16 항에 있어서,
    상기 제1 및 제2 질의어가 동의어로 매칭되어 동의어 데이터베이스에 저장되는 동의어 데이터베이스를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  20. 제 12 항 또는 제 16 항에 있어서,
    사용자로부터 검색 질의어를 수신하는 검색 질의어 수신부;
    상기 수신된 검색 질의어의 동의어가 존재하는지를 판단하는 동의어 판단부; 및
    상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 수신된 검색 질의어에 대한 검색 결과에 상기 동의어에 대한 검색 결과를 포함시켜 제공하는 검색 결과 제공부를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
  21. 제 20 항에 있어서,
    상기 수신된 검색 질의어의 동의어가 존재하는 경우, 상기 동의어가 금칙어에 해당하는지를 판단하여, 상기 금칙어에 해당하는 하는 경우 별도의 인증 절차를 수행하는 인증부를 더 포함하는 것을 특징으로 하는 동의어를 이용한 검색 서비스 제공 시스템.
KR1020080064476A 2008-07-03 2008-07-03 동의어를 이용한 검색 서비스 제공 방법 및 시스템 KR100957416B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080064476A KR100957416B1 (ko) 2008-07-03 2008-07-03 동의어를 이용한 검색 서비스 제공 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080064476A KR100957416B1 (ko) 2008-07-03 2008-07-03 동의어를 이용한 검색 서비스 제공 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20100004355A KR20100004355A (ko) 2010-01-13
KR100957416B1 true KR100957416B1 (ko) 2010-05-11

Family

ID=41813937

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080064476A KR100957416B1 (ko) 2008-07-03 2008-07-03 동의어를 이용한 검색 서비스 제공 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR100957416B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151273A (ja) * 1991-11-29 1993-06-18 Nec Corp シソーラス検索システム
KR20000045107A (ko) * 1998-12-30 2000-07-15 이계철 음소단위의 적합도함수를 이용한 한글 유사단어 검색방법
JP2006039866A (ja) 2004-07-26 2006-02-09 Patolis Corp 類似単語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置
KR100835172B1 (ko) 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151273A (ja) * 1991-11-29 1993-06-18 Nec Corp シソーラス検索システム
KR20000045107A (ko) * 1998-12-30 2000-07-15 이계철 음소단위의 적합도함수를 이용한 한글 유사단어 검색방법
JP2006039866A (ja) 2004-07-26 2006-02-09 Patolis Corp 類似単語検索装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報検索装置
KR100835172B1 (ko) 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법

Also Published As

Publication number Publication date
KR20100004355A (ko) 2010-01-13

Similar Documents

Publication Publication Date Title
US20100070261A1 (en) Method and apparatus for detecting errors in machine translation using parallel corpus
US7739111B2 (en) Pattern matching method and apparatus and speech information retrieval system
US8060494B2 (en) Indexing and searching audio using text indexers
KR101126406B1 (ko) 유사어 결정 방법 및 시스템
US20060241936A1 (en) Pronunciation specifying apparatus, pronunciation specifying method and recording medium
JP5722415B2 (ja) 自動完成質疑語提供システム、検索システム、自動完成質疑語提供方法並びに記録媒体
KR101541306B1 (ko) 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
KR100561227B1 (ko) 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법
JP2007334429A (ja) キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体
KR101086550B1 (ko) 로마자 변환을 이용한 일본어 자동 추천 시스템 및 방법
KR102166446B1 (ko) 음성을 이용한 키워드 추출 방법 및 서버
KR100911301B1 (ko) 오타 판단 방법 및 시스템
KR100957416B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
KR100617319B1 (ko) 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
Liang et al. An efficient error correction interface for speech recognition on mobile touchscreen devices
CN106709294B (zh) 一种用户认证方法和装置
Rofiq Indonesian news extractive text summarization using latent semantic analysis
JP2004046775A (ja) 固有表現抽出装置及び方法並びに固有表現抽出プログラム
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
KR100960490B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
Mehta et al. SPELL CORRECTION AND SUGGESTION USING LEVENSHTEIN DISTANCE
KR100955763B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
KR101501610B1 (ko) 인용문/화자 인식 시스템 및 방법
Angkawattanawit et al. Thai q-cor: Integrating word approximation and soundex for thai query correction
KR100953043B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 10