KR101446154B1 - 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법 - Google Patents

사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법 Download PDF

Info

Publication number
KR101446154B1
KR101446154B1 KR1020130003572A KR20130003572A KR101446154B1 KR 101446154 B1 KR101446154 B1 KR 101446154B1 KR 1020130003572 A KR1020130003572 A KR 1020130003572A KR 20130003572 A KR20130003572 A KR 20130003572A KR 101446154 B1 KR101446154 B1 KR 101446154B1
Authority
KR
South Korea
Prior art keywords
search
query
keyword
knowledge
user
Prior art date
Application number
KR1020130003572A
Other languages
English (en)
Other versions
KR20140091375A (ko
Inventor
최의인
이무훈
강용호
정훈
도하나
Original Assignee
한남대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한남대학교 산학협력단 filed Critical 한남대학교 산학협력단
Priority to KR1020130003572A priority Critical patent/KR101446154B1/ko
Publication of KR20140091375A publication Critical patent/KR20140091375A/ko
Application granted granted Critical
Publication of KR101446154B1 publication Critical patent/KR101446154B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법에 관한 것으로, 본 발명에 따른 시맨틱 콘텐츠 검색 시스템은 사용자 단말기로부터 입력되는 검색 키워드에 해당하는 지식 개체를 식별하고, 상기 지식 개체의 식별 결과가 존재하는지를 확인하며 상기 지식 개체의 식별 결과가 존재하지 않으면 포털 사이트에 연관 검색어를 요청하고, 상기 포털 사이트로부터 제공받은 연관 검색어 분석을 통해 검색 키워드를 확장하며, 상기 검색 키워드의 확장을 통해 확장된 키워드에 해당하는 지식 개체를 지식 베이스로부터 식별하고, 상기 지식 개체의 식별이 완료되면 식별된 지식 개체를 포함하는 질의 그래프를 생성하며, 상기 질의 그래프를 평가하여 생성된 질의 그래프 중 사용자 검색 의도와 가장 부합한 질의 그래프를 질의어로 변환하고, 상기 질의어를 이용하여 콘텐츠 검색을 수행하여 검색결과를 출력한다.

Description

사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법{SYSTEM AND METHOD FOR SEARCHING SEMANTIC CONTENTS USING USER QUERY EXPANSION}
본 발명은 시맨틱 콘텐츠 검색 시스템에 관한 것으로, 더욱 상세하게는 연관검색어 기반으로 확장하는 사용자 질의 확장 기법을 이용하여 실시간 이슈가 되는 키워드들을 지식 베이스에 업데이트하지 않고 사용자 검색문의 의미를 확장하여 검색의 정확도를 개선할 수 있는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법에 관한 것이다.
시맨틱 검색(Semantic Search)은 검색 결과의 정확도를 향상시키기 위해 기존의 키워드 기반 정보 검색(Information Retrieval) 알고리즘 방식을 탈피하여 능동적으로 사용자의 의도를 파악하고, 기존 정보를 가공 분석하여 정교한 검색 결과를 도출하는 일련의 활동 및 방법론을 통칭한다.
이러한 시맨틱 검색의 기술 성숙도가 높아짐에 따라 마이크로소프트 빙(Bing), 퀀투라(Quintura), 볼프럼 알파(Wolfram Alpha) 등의 국외 검색 서비스 및 네이버, 다음, 네이트와 같은 국내 포털 사이트의 검색 엔진들에 시맨틱 검색 기술을 도입하고 상용화하기 위한 노력을 기울이고 있다.
또한, 정보통신기술의 발전과 함께 스마트폰 및 스마트 TV 등과 같은 다양한 형태의 디바이스가 공개되고 있다. 이러한 디바이스들은 인터넷에 항상 연결되어 있으며, 다양한 형태로 정보 검색을 시도하고 있다. 이러한 디바이스는 휴대 편의성을 통해 언제 어디서나 검색이 가능한 반면에 입출력이 제한적이다. 종래 컴퓨터 환경에서의 정보 검색은 편리한 입출력 장치를 통해 다양한 키워드로 검색을 수행하고, 그 결과를 사용자가 직접 네비게이션하며 검색 결과를 획득하고 있다. 하지만, 스마트폰, 스마트 TV와 같은 환경에서는 기존 컴퓨터 환경과 같은 입출력 장치를 제공하는데 한계가 있기 때문에 정보 검색에 있어서도 부족한 정보를 잘 해석하여 사용자가 원하는 정확한 검색 결과를 제공하여야 한다. 즉, 재현율 위주의 기존 키워드 기반 정보 검색에서 정확도 위주의 시맨틱 검색 환경으로 변화하고 있다.
시맨틱 검색이 정확도 높은 검색을 제공하기 위해서는 잘 구축된 지식베이스가 필요하며, 이러한 지식 베이스 내에는 정확한 검색을 위한 모든 메타데이터가 포함되어 있어야 한다. 결국, 이런 풍부한 지식 베이스의 구축이 시맨틱 검색의 검색결과 만족도를 좌우하게 된다. 하지만 도메인이 한정된다 하더라도 풍부한 지식 베이스의 구축은 쉽지 않다. 특히, 실시간 이슈성 키워드와 같이 시간에 따라 변화하는 키워드들을 지식 베이스에 반영하는데 어려움이 있다.
[문헌 1] 이동균, 권준희, "최근 사용자 관심사를 고려한 소셜 검색 알고리즘", 한국정보기술학회 제9권 제4호, pp.187-194, 2011년 4월 [문헌 2] Q. Zhou, C. Wang, M. Xiong, H. Wang and Y. Yu, "SPARK: Adapting Keyword Query to Semantic Search", LNCS vol. 4825, 2007 [문헌 3] T. Tran, P. Cimiano, S. Rudolph and R. Studer, "Ontology-Based Interpretation of Keywords for Semantic Search", LNCS vol.4825, 2007
본 발명은 상기한 종래기술의 문제점을 해결하기 위한 것으로, 연관검색어 기반으로 확장하는 사용자 질의 확장 기법을 이용하여 실시간 이슈가 되는 키워드들을 지식 베이스에 업데이트하지 않고 사용자 검색문의 의미를 확장하여 검색의 정확도를 개선할 수 있는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명은 사용자 단말기로부터 수신한 검색 키워드를 지식 베이스 기반으로 지식 개체를 식별하고, 그 식별된 지식 개체로부터 하나 이상의 후보 질의 그래프를 구성하며 구성된 질의 그래프를 평가하여 사용자 검색 의도에 가장 부합하는 질의 그래프를 질의어로 변환하여 검색 결과를 상기 사용자 단말기에 제공하는 지식 베이스 처리기와, 상기 지식 베이스 처리기를 활용하여 상기 검색 키워드의 의미를 해석하며 포털사이트에서 제공하는 연관검색어를 분석을 통해 상기 검색 키워드를 확장하는 사용자 질의 해석기를 포함하는 것에 특징이 있다.
또한, 본 발명은 사용자 단말기로부터 입력되는 검색 키워드에 해당하는 지식 개체를 식별하는 단계와, 상기 지식 개체의 식별 결과가 존재하는지를 확인하는 단계와, 상기 지식 개체의 식별 결과가 존재하지 않으면 포털 사이트에 연관 검색어를 요청하는 단계와, 상기 포털 사이트로부터 제공받은 연관 검색어 분석을 통해 검색 키워드를 확장하는 단계와, 상기 검색 키워드의 확장을 통해 확장된 키워드에 해당하는 지식 개체를 지식 베이스로부터 식별하는 단계와, 상기 지식 개체의 식별이 완료되면 식별된 지식 개체를 포함하는 질의 그래프를 생성하는 단계와, 상기 질의 그래프를 평가하여 생성된 질의 그래프 중 사용자 검색 의도와 가장 부합한 질의 그래프를 질의어로 변환하는 단계와, 상기 질의어를 이용하여 콘텐츠 검색을 수행하여 검색결과를 출력하는 단계를 포함하는 것에 특징이 있다.
본 발명은 연관검색어 기반으로 확장하는 사용자 질의 확장 기법을 이용하여 실시간 이슈가 되는 키워드들을 지식 베이스에 업데이트하지 않고 사용자 검색문의 의미를 확장하여 검색의 정확도를 개선할 수 있다.
도 1은 본 발명에 따른 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템을 도시한 블록구성도.
도 2는 본 발명에 따른 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 방법을 도시한 흐름도.
도 3은 본 발명에 따른 개체 식별 및 질의 그래프 생성 과정을 도시한 예시도.
도 4는 본 발명에 따른 사용자 질의 해석 결과 조정을 도시한 일 예.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세하게 설명한다.
도 1은 본 발명에 따른 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템을 도시한 블록구성도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 시맨틱 콘텐츠 검색 시스템(200)은 사용자 질의 해석기(210) 및 지식 베이스 처리기(220)를 포함한다.
사용자 질의 해석기(210)는 지식 베이스 처리기(220)를 활용하여 사용자 단말기(100)로부터 입력되는 사용자 검색문(검색어, 검색 키워드)의 의미를 해석한다. 이러한 사용자 질의 해석기(210)는 형태소 분석기(Morpheme Analyzer)(211), 용어 매퍼(Term Mapper)(212), 연관 검색어 분석기(Correlated Term Analyzer)(213), 지식 베이스 검색기(Knowledge Base Searcher)(214)를 포함한다.
형태소 분석기(211)는 사용자 단말기(100)로부터 전송되는 검색어를 수신하고, 그 수신된 검색어를 형태소로 구분한다. 예를 들어, "류승환 영화"라고 검색 키워드가 입력되면 형태소 분석기(211)는 "류승환"과 "영화"로 구분한다.
용어 매퍼(212)는 형태소 분석기(211)에 의해 구분된 각 키워드에 해당하는 지식 개체를 지식 베이스 내에서 검색한다.
연관 검색어 분석기(213)는 용어 매퍼(212)를 통해 각 키워드에 대응되는 지식 개체가 지식 베이스 내에서 검색되지 않으면 연관 검색어를 포털 사이트에 요청하여 제공받으며, 그 제공된 연관 검색어를 분석하여 확장 키워드를 추출한다.
지식 베이스 검색기(214)는 검색 키워드 또는 확장 키워드를 이용하여 그와 관련된 콘텐츠를 검색한다. 그리고, 지식 베이스 검색기(214)는 검색된 콘텐츠를 사용자 단말기(100)에 제공한다. 사용자 단말기(100)는 검색된 콘텐츠들 중 어느 하나의 콘텐츠를 선택하여 해당 콘텐츠를 재생하여 출력할 수 있다.
지식 베이스 처리기(220)는 개체명 매퍼(Named Entity Mapper)(221), 색인기(Indexer)(222), 트리플 리포지토리(Triple Repository)(223), 질의 그래프 생성기(Query Graph Generator)(224), 질의 생성기(SPARQL Generator)(225), 질의 그래프 평가기(Query Graph Evaluator)(226), 개체 가중치 분석기(Entity Weight Analyzer)(227), 질의 처리기(SPARQL Processor)(228)를 포함한다.
개체명 매퍼(221)는 용어 매퍼(212) 및 색인기(222)와 연동하여 사용자 검색 키워드를 지식 베이스 기반으로 지식 개체를 식별한다.
트리플 리포지토리(223)는 시맨틱 데이터 즉, RDF, RDFS, OWL로 표현된 온토로지를 RDF(Resource Description Framework) 트리플(주어, 서술어, 목적어)로 변환하여 저장, 관리, 질의할 수 있게 한다. 즉, 트리플 리포지토리(223)는 RDF 트리플 데이터를 저장, 관리, 질의하기 위한 것이다. 트리플 리포지토리(223)는 질의를 위한 표준 언어로 W3C의 SPARQL(SPARQL Protocal and RDF Query Language)을 이용하며, SPARQL 질의를 보다 빠르고 정확하게 처리하기 위한 트리플 정보의 색인기(222)와 질의 처리기(228)를 구성한다.
질의 그래프 생성기(224)는 식별된 개체로부터 다수의 후보 질의 그래프를 구성하고, 질의 그래프 평가기(226)는 그 구성된 다수의 후보 질의 그래프 중 사용자 검색 의도에 가장 부합하는 질의 그래프를 추출한다. 질의 생성기(225)는 질의 그래프 평가기(226)에 의해 추출된 질의 그래프를 질의 언어인 SPARQL를 사용하여 질의를 생성한다.
질의 처리기(228)는 생성된 질의로 검색한 검색 결과를 지식 베이스 검색기(214)를 거쳐 사용자 단말기(100)로 제공한다.
이와 같이, 본 발명은 지식 베이스의 개체 식별 기술을 활용하여 포털 사이트에서 제공하는 연관 검색어를 분석함으로써 사용자 질의를 확장하고 지식 베이스로 구축되지 않은 메타데이터 및 이슈성 키워드에 대한 검색 결과를 제공할 수 있다.
도 2는 본 발명에 따른 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 방법을 도시한 흐름도이고, 도 3은 본 발명에 따른 개체 식별 및 질의 그래프 생성 과정을 도시한 예시도이며, 도 4는 본 발명에 따른 사용자 질의 해석 결과 조정을 도시한 일 예이다.
먼저, 본 발명에 따른 시맨틱 콘텐츠 검색 시스템(200)은 사용자 단말기(100)로부터 검색 키워드(검색어)를 입력받는다(S11).
사용자 단말기(100)로부터 전송되는 검색 키워드가 수신되면, 검색 시스템(200)은 상기 검색 키워드를 분석하여 개체 식별 및 매핑을 수행한다(S12). 질의 해석기(210)의 형태소 분석기(211)는 사용자 단말기(100)로부터 검색 키워드가 입력되면 형태소로 구분하고 그 형태소에 대응하는 지식 개체를 지식 베이스에서 검색한다. 예를 들어, 사용자가 "현빈 하지원 드라마"라는 검색 키워드를 입력하게 되면, 도 3에 도시된 바와 같이 "현빈", "하지원", "드라마"의 각 키워드에 해당하는 지식 개체를 지식 베이스로부터 식별한다.
개체 식별 및 매핑을 수행한 결과, 검색 시스템(200)은 지식 개체 식별 결과가 존재하는지를 확인한다(S13).
검색 시스템(200)은 개체 식별이 완료되면 지식 베이스로부터 식별된 개체를 모두 포함하는 부분 그래프를 찾는 질의 그래프를 생성하여 평가한다(S14). 여기서, 식별된 지식 개체를 포함하는 부분 그래프가 다양하게 존재할 수 있다. 이러한 부분 그래프는 사용자가 입력한 검색 키워드에 대한 해석 가능한 후보 해석 대안이 될 수 있으며, 후보 해석 대안을 지식 베이스 기반으로 평가한다. 그리고, 가장 적합한 해석 대안으로 평가된 부분 그래프를 도 3에 도시된 바와 같이 질의 언어로 질의를 생성한다. 여기서, 질의 언어는 스파클(SPARQL)을 이용한다.
상기 단계(S13)에서 검색 시스템(200)은 지식 개체 식별 결과가 존재하지 않으면, 질의 확장을 수행한다(S131 내지 S133). 검색 시스템(200)는 지식 베이스 내에 검색 키워드와 일치하는 개체가 없으면 포털 사이트에 연관 검색어를 요청한다(S131). 검색 시스템(200)은 포털 사이트로부터 연관 검색어를 획득하고 획득된 연관 검색어를 지식 베이스 기반으로 분석한다(S132). 연관 검색어 분석 방법은 획득된 연관 검색어를 토큰화하여 개체 식별을 수행한다. 지식 개체로 식별이 된 각 키워드에 대해 포털 사이트의 블로그, 카페, 웹문서, 뉴스 등의 관련 문서를 획득하고, 연관 검색어 분석기(213)는 사용자가 초기 입력한 키워드와 획득된 문서 간의 단어 빈도수/역 문서 빈도수(TF/IDF: term frequency-inverse document frequency) 가중치를 합산하여 연관도가 가장 높은 연관 검색어를 확장 키워드로 추출한다(S133). 상기 확장 키워드 추출은 다음 [수학식 1]을 이용한다.
Figure 112013003159264-pat00001
[수학식 1]은 포털 사이트로부터 획득된 키워드를 활용하여 수집된 문서에서 사용자로부터 주어진 키워드 k가 출현한 빈도수를 구하고 이들의 합을 계산한 식이다. tc(k,d)는 문서 d에서 키워드 k의 수이며, max{tc(w,d):w∈d}는 문서 전체에서 최대 단어(term)의 수이다. 즉, 주어진 키워드 k가 문서 내에서 얼마나 자주 등장하는지를 나타내며, |D|는 전체 문서의 개수를 표현한다.
사용자 질의가 확장되면, 검색 시스템(200)은 상기 단계(S12)로 이동하여 개체 식별 및 매핑을 재수행한다.
검색 시스템(200)은 질의 그래프 평가에 따라 사용자 검색 의도에 가장 부합하는 질의 그래프를 질의어로 변환하고 그 질의어를 통해 트리플 리포지토리(223) 에서 콘텐츠를 검색하여 그 검색결과를 제공한다(S15).
검색 시스템(200)은 제공된 검색된 결과 중 사용자가 원하는 검색결과가 존재하는지를 확인한다(S16).
검색 시스템(200)은 사용자가 제공되는 검색된 결과 중 어느 하나의 검색 결과를 선택하면 해당 검색 결과를 재생하여 출력한다(S17, S18).
상기 단계(S16)에서 사용자가 원하는 검색 결과가 존재하지 않으면 검색 시스템(200)은 후보 질의 해석 대안들 중에 사용자가 원하는 후보 질의 해석 대안을 선택받고(S161), 그 선택된 후보 질의 해석 대안을 검색 키워드로 하여 상기 선택된 후보 질의 해석 대안과 관련된 콘텐츠를 검색하여 검색결과를 사용자 단말기(100)로 제공한다.여기서, 후보 해석 대안은 가중치 기반 랭킹된 사용자 질의 해석 결과이다. 예를 들어, 검색 시스템(200)은 도 4에 도시된 바와 같이 "류승완 영화"라고 검색 키워드가 입력되면, 검색 시스템(200)은 지식 베이스 내의 류승완은 감독으로써 연출한 영화 인스턴스가 많기 때문에 "류승완 연출 영화"를 최적 질의 해석 결과로 제공한다. 그러나, 검색 시스템(200)의 최적 질의 해석 결과가 사용자의 검색 의도와 상이하면 사용자는 검색 시스템(200)에서 제공하는 후보 해석 대안을 통해 키워드의 재입력 없이 검색 결과를 정정하여 원하는 결과를 획득할 수 있다.
100: 사용자 단말기
200: 검색 시스템
210: 사용자 질의 해석기
220: 지식 베이스 처리기

Claims (5)

  1. 사용자 단말기로부터 검색문을 수신하여 상기 검색문에 대한 검색결과를 상기 사용자 단말기로 제공하는, 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템에 있어서,
    상기 검색문을 형태소로 구분하여 검색 키워드를 구분하고, 포털사이트에 요청하여 상기 검색 키워드에 대한 연관 검색어를 획득하여 상기 검색 키워드를 확장하는 사용자 질의 해석기; 및,
    상기 검색 키워드 및 확장된 검색 키워드를 이용하여 지식 베이스 내에서 지식 개체를 검색하여 상기 검색 키워드에 해당하는 지식 개체를 식별하고, 식별된 지식 개체로부터 하나 이상의 후보 질의 그래프를 구성하고, 구성된 질의 그래프를 평가하여 사용자 검색 의도에 가장 부합하는 질의 그래프를 추출하고, 추출된 질의 그래프를 질의어로 변환하고, 변환된 질의어로 검색된 검색 결과를 상기 사용자 단말기에 제공하는 지식 베이스 처리기를 포함하는 것을 특징으로 하는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템.
  2. 제1항에 있어서, 상기 사용자 질의 해석기는,
    상기 연관검색어를 토큰화하여 지식 개체 식별을 수행하고 지식 개체로 식별된 키워드에 대해 포털 사이트로부터 관련 문서를 획득하고,
    상기 검색 키워드와 상기 관련 문서 간의 단어 빈도수/역 문서 빈도수 점수를 합산하여 연관도가 가장 높은 연관검색어를 확장된 검색 키워드로 추출하는 것을 특징으로 하는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템.
  3. 삭제
  4. 사용자 단말기로부터 검색문을 수신하여 상기 검색문에 대한 검색결과를 상기 사용자 단말기로 제공하는 시맨틱 콘텐츠 검색 시스템에 의한 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 방법에 있어서,
    (a) 상기 시스템은 상기 검색문을 형태소로 구분하여 검색 키워드를 구분하는 단계;
    (b) 상기 시스템은 상기 검색 키워드를 이용하여 지식 베이스 내에서 지식 개체를 검색하여 상기 검색 키워드에 해당하는 지식 개체를 식별하는 단계;
    (c) 상기 시스템은 상기 지식 개체의 식별 결과가 존재하는지를 확인하는 단계와,
    (d) 상기 시스템은 상기 지식 개체의 식별 결과가 존재하지 않으면 포털 사이트에 상기 검색 키워드에 대한 연관 검색어를 요청하는 단계와,
    (e) 상기 시스템은 상기 포털 사이트로부터 제공받은 연관 검색어를 이용하여 상기 검색 키워드를 확장하는 단계와,
    (f) 상기 시스템은 상기 검색 키워드 또는 확장된 검색 키워드에 해당하는 지식 개체를 지식 베이스 내에서 검색하여 상기 검색 키워드에 해당하는 지식 개체를 식별하는 단계와,
    (g) 상기 시스템은 상기 지식 개체의 식별이 완료되면 식별된 지식 개체를 포함하는 질의 그래프를 생성하는 단계와,
    (h) 상기 시스템은 상기 질의 그래프를 평가하여 생성된 질의 그래프 중 사용자 검색 의도와 가장 부합한 질의 그래프를 추출하고, 추출된 질의 그래프를 질의어로 변환하는 단계와,
    (i) 상기 시스템은 상기 질의어를 이용하여 콘텐츠 검색을 수행하여 검색결과를 출력하는 단계를 포함하는 것을 특징으로 하는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 방법.
  5. 제4항에 있어서, 상기 (e) 단계는,
    (e1) 상기 포털사이트로부터 제공받은 연관 검색어를 토큰화하여 지식 개체로 식별하는 단계와,
    (e2) 상기 지식 개체로 식별된 연관 검색어에 대한 관련 문서를 포털 사이트로부터 획득하는 단계와,
    (e3) 상기 검색 키워드와 상기 관련 문서 간의 단어 빈도수/역 문서 빈도수 점수를 합산하여 연관도가 가장 높은 연관 검색어를 확장된 검색 키워드로 추출하는 단계를 포함하는 것을 특징으로 하는 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 방법.
KR1020130003572A 2013-01-11 2013-01-11 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법 KR101446154B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130003572A KR101446154B1 (ko) 2013-01-11 2013-01-11 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130003572A KR101446154B1 (ko) 2013-01-11 2013-01-11 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20140091375A KR20140091375A (ko) 2014-07-21
KR101446154B1 true KR101446154B1 (ko) 2014-10-01

Family

ID=51738580

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130003572A KR101446154B1 (ko) 2013-01-11 2013-01-11 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101446154B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9377999B2 (en) * 2014-06-02 2016-06-28 Micosoft Technology Licensing, LLC Semantic content accessing in a development system
KR102161784B1 (ko) * 2017-01-25 2020-10-05 한국전자통신연구원 영상 콘텐츠의 스토리 그래프 및 사용자 구조 질의를 이용한 콘텐츠 맵 서비스 장치 및 방법
CN111522910B (zh) * 2020-04-14 2022-05-31 浙江大学 一种基于文物知识图谱的智能语义检索方法
CN111859013A (zh) * 2020-07-17 2020-10-30 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法、装置、终端和存储介质
KR20240065171A (ko) * 2021-10-25 2024-05-14 엘지전자 주식회사 디스플레이 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010108845A (ko) * 2000-05-31 2001-12-08 기민호 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법
JP2006313499A (ja) 2005-05-09 2006-11-16 Nippon Telegr & Teleph Corp <Ntt> 拡張クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた拡張サブグラフ検索装置、検索方法、検索用プログラム
KR20110130852A (ko) * 2010-05-28 2011-12-06 최진근 확장 검색어 선정 시스템 및 확장 검색어 선정 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010108845A (ko) * 2000-05-31 2001-12-08 기민호 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법
JP2006313499A (ja) 2005-05-09 2006-11-16 Nippon Telegr & Teleph Corp <Ntt> 拡張クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた拡張サブグラフ検索装置、検索方法、検索用プログラム
KR20110130852A (ko) * 2010-05-28 2011-12-06 최진근 확장 검색어 선정 시스템 및 확장 검색어 선정 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SPARK: Adapting Keyword Query to Semantic Search, The Semantic Web. Springer BerlinHidelberg, 2007. *

Also Published As

Publication number Publication date
KR20140091375A (ko) 2014-07-21

Similar Documents

Publication Publication Date Title
KR101354755B1 (ko) 검색에 의한 주석달기를 위한 컴퓨터 판독가능 저장 매체, 컴퓨터 구현 방법, 및 컴퓨팅 장치
US9146999B2 (en) Search keyword improvement apparatus, server and method
JP5192475B2 (ja) オブジェクト分類方法およびオブジェクト分類システム
US8051080B2 (en) Contextual ranking of keywords using click data
KR101661198B1 (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
US8332426B2 (en) Indentifying referring expressions for concepts
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
US9646260B1 (en) Using existing relationships in a knowledge base to identify types of knowledge for addition to the knowledge base
US10445367B2 (en) Search engine for textual content and non-textual content
WO2004099901A2 (en) Concept network
KR101446154B1 (ko) 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법
KR20140075428A (ko) 시맨틱 검색 키워드 추천 방법 및 시스템
US20110208715A1 (en) Automatically mining intents of a group of queries
CN109643315B (zh) 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质
KR101700820B1 (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
EP2192503A1 (en) Optimised tag based searching
KR20140109729A (ko) 의미기반 검색 시스템 및 이의 검색방법
JP2007219722A (ja) 文書検索サーバおよび文書検索方法
KR101651780B1 (ko) 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
US8364672B2 (en) Concept disambiguation via search engine search results
US10235455B2 (en) Semantic search system interface and method
WO2012091541A1 (en) A semantic web constructor system and a method thereof
Lee et al. Ontology based user query interpretation for semantic multimedia contents retrieval
KR20120097840A (ko) 벡터 공간 모델을 이용한 rdf 트리플 선택 방법, 장치, 및 그 방법을 실행하기 위한 프로그램 기록매체
KR101103671B1 (ko) 사용자의 요청에 대응하여 동적으로 가장 적합한 이미지를 추출하고 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180814

Year of fee payment: 5