KR101873873B1 - 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법 - Google Patents

속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법 Download PDF

Info

Publication number
KR101873873B1
KR101873873B1 KR1020180028507A KR20180028507A KR101873873B1 KR 101873873 B1 KR101873873 B1 KR 101873873B1 KR 1020180028507 A KR1020180028507 A KR 1020180028507A KR 20180028507 A KR20180028507 A KR 20180028507A KR 101873873 B1 KR101873873 B1 KR 101873873B1
Authority
KR
South Korea
Prior art keywords
attribute
search
information
unit
similarity
Prior art date
Application number
KR1020180028507A
Other languages
English (en)
Inventor
송민규
Original Assignee
미디어젠(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미디어젠(주) filed Critical 미디어젠(주)
Priority to KR1020180028507A priority Critical patent/KR101873873B1/ko
Priority to PCT/KR2018/002911 priority patent/WO2019177182A1/ko
Application granted granted Critical
Publication of KR101873873B1 publication Critical patent/KR101873873B1/ko

Links

Images

Classifications

    • G06F17/30023
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법에 관한 것으로서, 더욱 상세하게는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하며, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력함으로써, 검색하고자 하는 멀티미디어 컨텐츠의 속성 정보와 유사도가 높은 멀티미디어 컨텐츠들을 제공할 수 있는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법에 관한 것이다.

Description

속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법{Multimedia content search device through attribute information analysis and Method}
본 발명은 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법에 관한 것으로서, 더욱 상세하게는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하며, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력함으로써, 검색하고자 하는 멀티미디어 컨텐츠의 속성 정보와 유사도가 높은 멀티미디어 컨텐츠들을 제공할 수 있는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법에 관한 것이다.
검색 서비스를 제공하는 네이버나 다음과 같은 포털 업체, 그리고 구글과 같은 검색 엔진의 경우, 사용자의 검색어의 키워드를 중심으로, 해당 키워드가 가지는 최근의 이슈화된 정보나, 이들 키워드들을 묶고 있는 특정 연산자를 통해, 사용자가 원하는 정보에 보다 가까운 정보를 제공하는 노력을 기울이고 있다.
검색 서비스를 제공하는 이들 업체들은 사용자가 입력하는 키워드에만 수동적으로 반응하지 않고, 다수의 사용자들이 입력하는 복수 개의 키워드 혹은 순차적으로 입력하는 키워드간의 연관성을 부여하여, 연관어로 채택한 후 특정 키워드만을 입력하여도, 연관된 키워드를 제공하는 시스템을 개발하여 서비스를 진행하고 있다.
이러한 연관 검색어 제공 서비스는 사용자의 검색을 용이하게 할 뿐만 아니라, 그 자체 역시 하나의 정보로서의 역할을 하게 된다.
검색어를 구성하는 키워드 간의 연관성을 부여하여, 연관어를 추출하는 기술적인 시도는 많이 존재한다.
관련 특허 문헌으로는, "키워드 시각화 장치 및 그 방법(공개 번호 제10-2011-0035001호, 이하 '선행기술1'이라 한다)"이 존재한다.
상기 선행기술1은 키워드 시각화 장치 및 그 방법에 관한 것으로, 인터넷을 통해 획득한 데이터로부터 키워드를 추출하는 키워드 추출부; 키워드가 추출될 때마다 해당 키워드의 발생빈도 값을 상향시키는 빈도 분석부; 단일 데이터 내에서 다수의 키워드가 추출되면 추출된 각 키워드들간의 연관도 값을 상향시키는 연관도 분석부; 추출된 키워드들을 저장하되, 각 키워드들에 대한 발생빈도 값 및 각 키워드들간 연관도 값을 저장하는 정보 저장부; 및 다수의 키워드, 키워드들의 발생빈도 값 및 키워드들간 연관도 값을 이용하여 다수의 노드 및 에지를 갖는 그래프가 화면상에 표시되도록 처리하되, 그래프의 각 노드에는 키워드가 표시되며, 키워드의 발생빈도 값이 높은 노드의 크기가 크게 표시되고, 키워드의 발생빈도 값이 낮은 노드의 크기가 작게 표시되되, 에지에 의해 연결된 두 노드의 키워드들간 연관도 값이 높으면 에지가 두껍게 표시되고, 연관도 값이 낮으면 에지가 얇게 표시되도록 처리하는 시각화 처리부를 구비하는 것을 특징으로 하여, 키워드의 발생빈도와 키워드들간 연관도의 변화 추이를 제시한다.
관련된 다른 특허 문헌으로는 "키워드의 연관 순위를 사용한 검색 방법 및 시스템(특허 등록 번호 제10-1072113호, 이하 '선행기술2'라 한다)"이 존재한다.
상기 선행기술2는 키워드의 연관 순위를 사용한 검색 방법 및 시스템으로서, 키워드의 자체 속성을 지표화하여 독립 지표를 생성하고, 키워드와 다른 키워드 간의 연관성을 지표화하여 연관 지표를 생성하는 지표 모듈; 연관 지표를 기초로 키워드와 다른 키워드 간의 연관도를 연관 점수로 수치화하는 연관 점수 산정 모듈; 연관 점수와 독립 지표를 기초로 사용 용도에 따른 순위 점수를 계산하는 순위 점수 계산 모듈; 및 순위 점수에 기초하여 검색어에 대한 연관 키워드를 제공하는 검색 모듈을 개시한다.
그러나, 선행기술 2는 키워드에 대한 연관 검색어를 추출하도록 하는 기술적 사상만을 개시하고 있을 뿐이며, 해당 연관 검색에 대한 전반적인 정보를 제공하지는 못하였다.
다만, 선행기술1은 키워드에 대한 연관 검색어들 간의 순위 등을 그래프화 하여, 검색어에 대한 어떤 연관 검색어가 가장 빈도수가 높은지 등을 제공하고 있으나, 이 역시, 연관 검색어에 중에서 빈도수가 가장 높은 것을 자동 연관 검색어 리스트 중에서 가장 상위에 랭크 시키는 공지 기술과 크게 다를 바 없다.
한편, 현재 인공 지능 기반을 탑재한 검색 시스템은 검색 방식 측면에서 크롤러 기반, 디렉토리 기반, 하이브리드 검색, 메타 검색 방식으로 구분할 수 있다.
상기 크롤러 기반 방식의 검색 시스템에서는 스파이더, 크롤러, 웹봇 등으로 불리는 자동화된 에이전트 프로그램을 이용하여 웹상의 문서를 자신의 데이터베이스에 다운로드하고 저장한다.
사용자의 검색 요청은 검색 키워드를 저장된 웹 문서의 인덱스에서 찾아 해당 문서의 링크를 제공함으로써 처리된다.
이 방식은 구글 검색 시스템이 대표적인 예이다.
또한, 상기 디렉토리 기반 방식의 검색 시스템에서는 사람에 의해 웹 사이트들이 사전에 정의된 특정 디렉터리에 분류 저장되고, 저장된 웹사이트들이 사전에 정의된 규칙에 의해 랭킹된다.
사용자의 검색 요청은 키워드 매칭에 의해 찾아진 웹 문서를 디렉터리 별로 그룹핑하여 제공함으로써 처리된다.
이 방식은 야후, 네이버 검색 시스템이 대표적 예이다. 또한,
상기 하이브리드 방식의 검색 시스템에서는 상기 크롤러 방식과 상기 디렉토리 방식을 병용하며 일반적으로 사용자에게 더 좋은 검색결과를 제공한다.
이 방식은 마이크로소프트의 MSN검색이 대표적 예이다.
또한, 상기 메타 검색 방식의 시스템에서는 다른 검색 시스템의 검색 알고리즘과 평가 기준을 활용한다.
즉, 다른 검색 시스템의 검색결과를 병합하여 사용자에게 제공한다.
Metacrawler 시스템이 대표적인 예이다.
한편, 웹 기반 한글 정보검색 시스템의 구현 방법이 존재하고 있는데, 이는 웹 기반의 한글 정보 검색 시스템을 구현하는데 있어서, 핵심 부분이 되는 한글 검색엔진이 갖추어야 할 기능 및 구현 방법, 특히 명사, 조사, 불용어 등 각종 한글 사전 등을 이용하여 한글의 특성에 맞는 형태소 분석을 이용하는 방법을 제시하고 있다.
하지만, 상기 웹 기반 한글 정보검색 시스템의 구현 방법과 크롤러 기반, 디렉토리기반, 하이브리드 검색, 및 메타 검색 방식의 검색 시스템은 검색 키워드만을 사용하여 정보를 검색함에 따라, 사용자가 원하는 속성을 반영하지 못하여 사용자가 진정 원하는 정확한 컨텐츠를 제공하지 못한다는 치명적인 단점이 존재한다.
따라서, 사용자가 원하는 속성과 가장 근접하거나 일치하는 유사 속성 검색을 수행할 수 있는 기술이 필요하게 되었으며, 해당 기술을 통해 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력할 수 있는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 기술이 필요하게 되었다.
(선행문헌1) 대한민국공개특허번호 제10-2011-0035001호 (선행문헌2) 대한민국등록특허번호 제10-1072113호
따라서 본 발명은 상기와 같은 종래 기술의 문제점을 감안하여 제안된 것으로서, 본 발명의 제 1 목적은 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하며, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력하는데 있다.
본 발명의 제 2 목적은 유사도매칭성분석부(530)를 제공함으로써, 유사 속성 검색을 수행시, 검색어속성수치정보DB(517)에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부(520)에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시함으로써, 검색어(질문)의 의도와 유사한 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 제공하고자 한다.
본 발명의 제 3 목적은 컨텐츠크롤링모듈(522)을 제공함으로써, 컨텐츠서버(560)로부터 다수의 멀티미디어 컨텐츠 정보들을 수집하여 컨텐츠저장DB로 저장시켜 속성 정보의 연산 범위를 확장시키며, 컨텐츠속성할당모델모듈(524)을 제공함으로써, 컨텐츠저장DB(523)에 저장된 각각의 멀티미디어 컨텐츠에 대하여 속성 정보를 할당하여 컨텐츠정보검색모듈로 제공하고자 한다.
본 발명이 해결하고자 하는 과제를 달성하기 위하여, 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치는,
음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작부(100)와,
상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단부(200)와,
상기 속성검색수행판단부로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색부(300)와,
상기 텍스트키워드검색부로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력부(400)와,
상기 속성검색수행판단부로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색수단(500)과,
상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력부(600)를 포함한다.
또한, 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법은,
검색시작부(100)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작단계(S100)와,
속성검색수행판단부(200)가 상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단단계(S200)와,
텍스트키워드검색부(300)가 상기 속성검색수행판단부(200)로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색단계(S300)와,
텍스트키워드결과출력부(400)가 상기 텍스트키워드검색부(300)로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력단계(S400)와,
속성유사도검색수단(500)가 상기 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색단계(S500)와,
속성유사도검색결과출력부(600)가 상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력단계(S600)를 포함한다.
이상의 구성 및 작용을 지니는 본 발명에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법을 통해, 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하며, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력함으로써, 일반적인 검색 키워드 방식을 이용한 멀티미디어 컨텐츠 검색 결과를 제공하는 효과와 유사 속성 검색을 통한 사용자가 검색하기를 원하는 검색어(질문)에 가장 유사한 멀티미디어 컨탠츠 검색 결과를 제공하는 효과를 발휘한다.
또한, 유사도매칭성분석부를 제공함으로써, 유사 속성 검색을 수행시, 검색어속성수치정보DB에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시함으로써, 검색어(질문)의 의도와 유사한 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 제공함으로써, 사용자가 원하는 속성(분위기, 감정 등)과 일치하는 멀티미디어 컨텐츠를 제공하게 되어 이에 따른 검색의 신뢰도를 높일 수 있는 효과를 발휘하게 된다.
또한, 시간의 흐름에 따라 멀티미디어 컨텐츠의 정보량이 변경되고 이에 따라 특정 대상의 속성도 시시각각 변화하는데, 이를 멀티미디어컨텐츠속성할당부에 의해 가변적으로 반영함으로써, 실시간으로 변화하는 다양한 멀티미디어 컨텐츠들을 검색에 반영할 수 있는 효과를 발휘하게 된다.
도 1은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치를 개략적으로 나타낸 전체 구성도.
도 2는 종래의 유사한 분위기의 영화가 검색되지 않는 예시도.
도 3은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치의 전체 블록도.
도 4는 텍스트 키워드 검색시 검색 결과 출력 예시도.
도 5는 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치를 통해 출력되는 유사 속성 검색 결과 예시도.
도 6은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치의 속성유사도검색수단의 블록도.
도 7은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치의 검색어속성분석부의 블록도.
도 8은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치의 멀티미디어컨텐츠속성할당부의 블록도.
도 9는 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법의 전체 흐름도.
도 10은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법의 속성유사도검색단계를 나타낸 흐름도.
이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만, 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다.
또한, 본 명세서에 열거된 모든 조건부 용어 및 실시 예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시 예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되지 않을 수 있다.
예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 연결되어 있다거나 접속되어 있다고 언급되는 경우는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해될 수 있다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니며, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다.
본 명세서에서, 포함하다 또는 구비하다 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것으로서, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해될 수 있다.
<제1 실시예>
본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치는,
음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작부(100)와,
상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단부(200)와,
상기 속성검색수행판단부로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색부(300)와,
상기 텍스트키워드검색부로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력부(400)와,
상기 속성검색수행판단부로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색수단(500)과,
상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력부(600)를 포함하여 구성되는 것을 특징으로 한다.
그리고, 상기 속성검색수행판단부(200)는,
텍스트 키워드 검색을 수행할 것인지, 아니면 유사 속성 검색을 수행할 것인지의 판단을 서비스 도메인에 따라 미리 설정하는 제1 모드, 검색어로 입력된 문장을 분석하는 제2 모드 중 적어도 어느 하나의 모드를 적용하는 것을 특징으로 한다.
그리고, 상기 속성유사도검색수단(500)은,
음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하기 위한 검색어속성분석부(510);
컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하기 위한 멀티미디어컨텐츠속성할당부(520);
검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하고, 멀티미디어컨텐츠속성할당부(520)로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하기 위한 유사도매칭성분석부(530);
사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하기 위한 유사도후보군추출부(540);
상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하기 위한 유사도기준멀티미디어컨텐츠정렬부(550);를 포함하는 것을 특징으로 한다.
그리고, 상기 검색어속성분석부(510)는,
머신러닝모델모듈(512)로 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 제공하며, 머신러닝모델모듈로부터 해석된 검색어에 포함된 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하기 위한 자연어처리모듈(511);
자연어처리모듈로부터 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 획득할 경우에 검색어에 포함된 언어적 속성을 해석하여 자연어처리모듈로 해석된 언어적 속성 정보를 제공하기 위한 머신러닝모델모듈(512);
멀티미디어 컨텐츠의 속성 정보와 매칭될 수 있는 속성의 유형으로 정제되어 있는 속성 유형 정보를 저장하고 있는 지식정보DB(514);
상기 자연어처리모듈에서 제공된 검색어에 포함된 언어적 속성 정보를 획득하고, 획득된 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보를 추출하여 검색어에 대한 속성을 할당하고, 할당된 검색어에 대한 속성 정보를 검색어속성수치변환모듈(515)로 제공하기 위한 검색어속성할당모듈(513);
상기 검색어속성할당모듈(513)로부터 제공된 검색어에 대한 속성 정보를 획득할 경우에 속성모델모듈(516)로 확률값 산출 요청 정보를 제공하며, 속성모델모듈(516)로부터 산출된 확률값을 획득하여 검색어에 대한 속성값으로 변환하여 검색어속성수치정보DB(517)로 제공하기 위한 검색어속성수치변환모듈(515);
검색어속성수치변환모듈(515)로부터 확률값 산출 요청 정보를 획득할 경우에 언어 모델링을 통해 확률값을 산출하며, 산출된 확률값을 검색어속성수치변환모듈(515)로 제공하기 위한 속성모델모듈(516);
검색어속성수치변환모듈(515)에 의해 제공된 검색어에 대한 속성값을 포함하여 저장하고 있는 검색어속성수치정보DB(517);를 포함하여 구성되는 것을 특징으로 한다.
그리고, 상기 멀티미디어컨텐츠속성할당부(520)는,
컨텐츠서버(560)와 연동시켜 컨텐츠크롤링모듈(522)로 멀티미디어 컨텐츠 정보를 제공하기 위한 컨텐츠연동모듈(521);
컨텐츠연동모듈(521)로부터 제공되는 다수의 멀티미디어 컨텐츠 정보들을 수집하여 컨텐츠저장DB로 저장시켜 속성 정보의 연산 범위를 확장시키기 위한 컨텐츠크롤링모듈(522);
상기 컨텐츠크롤링모듈(522)로부터 제공된 멀티미디어 컨텐츠 정보와 각각의 멀티미디어 컨텐츠마다 할당된 속성 정보를 저장하고 있는 컨텐츠저장DB(523);
상기 컨텐츠저장DB(523)에 저장된 각각의 멀티미디어 컨텐츠에 대하여 속성 정보를 할당하기 위한 컨텐츠속성할당모델모듈(524);
상기 컨텐츠속성할당모델모듈(524)에 의해 할당된 각각의 멀티미디어 컨텐츠의 속성 정보를 해석하여 컨텐츠정보검색모듈로 제공하기 위한 컨텐츠속성정보해석모듈(525);
컨텐츠속성정보해석모듈(525)에 의해 해석된 각각의 멀티미디어 컨텐츠의 속성 정보를 유사도매칭성분석부(530)로 제공하며, 유사도매칭성분석부(530)로부터 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 획득할 경우에 컨텐츠저장DB(523)로부터 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 리스트 정보를 유사도매칭성분석부(530)로 제공하기 위한 컨텐츠정보검색모듈(526);을 포함하여 구성되는 것을 특징으로 한다.
그리고, 상기 유사도매칭성분석부(530)는,
검색어속성수치정보DB(517)에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부(520)에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시하는 것을 특징으로 한다.
또한, 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법은,
검색시작부(100)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작단계(S100)와,
속성검색수행판단부(200)가 상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단단계(S200)와,
텍스트키워드검색부(300)가 상기 속성검색수행판단부(200)로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색단계(S300)와,
텍스트키워드결과출력부(400)가 상기 텍스트키워드검색부(300)로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력단계(S400)와,
속성유사도검색수단(500)가 상기 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색단계(S500)와,
속성유사도검색결과출력부(600)가 상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력단계(S600)를 포함한다.
이때, 상기 속성유사도검색단계(S500)는,
검색어속성분석부(510)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하기 위한 검색어속성분석단계(S510);
멀티미디어컨텐츠속성할당부(520)가 컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하기 위한 멀티미디어컨텐츠속성할당단계(S520);
유사도매칭성분석부(530)가 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하고, 멀티미디어컨텐츠속성할당부(520)로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하기 위한 유사도매칭성분석단계(S530);
유사도후보군추출부(540)가 사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하기 위한 유사도후보군추출단계(540);
유사도기준멀티미디어컨텐츠정렬부(550)가 상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하기 위한 유사도기준멀티미디어컨텐츠정렬단계(S550);를 포함하는 것을 특징으로 한다.
이하에서는, 본 발명에 의한 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법의 실시예를 통해 상세히 설명하도록 한다.
도 1은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치를 개략적으로 나타낸 전체 구성도이다.
도 1에 도시한 바와 같이, 본 발명인 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치(1000)는 컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고 있으며, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하여 관리하는 장치이다.
그리고, 본 발명인 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치(1000)는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하게 되고, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하게 된다.
이는 종래에 일반적으로 이용하고 있는 텍스트 키워드 기반의 검색 알고리즘을 이용하게 되지만, 사용자가 원하는 속성 정보와 유사한 멀티미디어 컨텐츠의 검색에는 한계가 발생한다.
구체적으로 설명하면, 멀티미디어 컨텐츠인 영화를 검색할 경우에, 종래 텍스트 키워드 기반의 검색은 같은 제목으로 다시 검색되는 문제점이 있으며, 검색어와 이름만 비슷하고 내용이 완전히 다른 영화가 추천되며, 유사한 내용의 영화들이 전혀 검색되지 않는 심각한 문제가 있었다.
즉, 사용자가 원하는 영화와 분위기 혹은 감정 등이 유사한 영화를 검색할 수가 없는 것이다.
예를 들어, 도 2에 도시한 바와 같이, '러브 액추얼리 같은 영화'라는 검색어를 입력할 경우에 해당 검색어로는 유사한 분위기의 영화가 검색되지 않게 된다.
이는 사용자가 러브 액추얼리라는 영화를 보고 나서 재미를 느꼈고, 이러한 비슷한 분위기를 가지고 있는 영화를 검색하고 싶어서 '러브 액추얼리' 라는 키워드로 검색을 하면, 이름만 비슷할 뿐, 전혀 내용이 비슷하지 않은 결과물을 출력해주게 되며, 특히 일부 추천 리스트는 관객 평점이 매우 낮은 영화도 추천하게 되어 추천 효과를 사용자가 느끼지 못하게 된다.
요약하면, 종래의 검색 키워드 방식에서는 유사 속성 검색에 대한 판단을 수행하지 못하는 문제점과 시간의 흐름에 따라 정보량이 변경되고, 이에 따라 특정 대상의 속성도 시시각각 변화하는데, 이를 가변적으로 반영할 수 없다.
따라서, 본 발명에서는 상기한 텍스트 키워드 기반의 검색 기능을 기본적으로 제공하면서 유사 속성 검색을 수행하기 위한 구성적 특징을 제공함으로써, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력함으로써, 검색하고자 하는 멀티미디어 컨텐츠의 속성 정보와 유사도가 높은 멀티미디어 컨텐츠들을 제공할 수 있는 효과를 발휘하게 된다.
또한, 본 발명은 상기와 같은 구성을 통해, 기존 키워트 검색을 진행할 지, 유사 속성 검색을 진행할 지를 판단하는 구성적 특징과 멀티미디어 컨텐츠 각각의 속성을 정의(따뜻함, 감동적임, 재미있음 등)하는 구성적 특징과 자연어 처리를 통한 검색 대상 멀티미디어의 속성값을 할당(데이터 크롤링, 통계 모델링 등)하는 구성적 특징과 속성 정보를 수치화하여 계산(언어 모델링)하는 구성적 특징과 속성 정보의 유사도가 가장 높은 멀티미디어 컨텐츠를 추천(확률값 비교)하는 구성적 특징을 제공하게 된다.
유사 속성 검색을 수행하기 위한 구체적인 구성수단들은 하기의 도면을 참조하여 구체적으로 설명하도록 하겠다.
도 3은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치의 전체 블록도이다.
도 3에 도시한 바와 같이, 본 발명인 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치(1000)는 검색시작부(100), 속성검색수행판단부(200), 텍스트키워드검색부(300), 텍스트키워드결과출력부(400), 속성유사도검색수단(500), 속성유사도검색결과출력부(600)를 포함하여 구성된다.
상기와 같은 구성을 통해 본 발명에서는 텍스트 키워드 방식의 검색과 속성 유사도 방식의 검색을 제공하게 된다.
상기한 검색 방식을 제공하기 위한 구체적인 구성적 특징을 하기와 같이 설명하도록 하겠다.
상기 검색시작부(100)는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 것이다.
음성 인식을 위하여 검색시작부는 자연어 처리모듈을 포함하여 구성되되, 상기 자연어 처리모듈에 의해 처리된 음성인식 결과 텍스트에서 사용자의 명령 대상값을 추출하게 된다.
상기한 언어 이해(Embedded Natural Language Understanding) 기술은 전자 기기 내부에 규칙 기반(Rule Based) 알고리즘 또는 통계 모델(Statistic Model)을 이용하는 자연어 처리 모듈을 내장하여, 음성인식 결과 텍스트에서 사용자의 최종 목표인 명령 의도(Intention, Goal)와 구체적인 명령 대상(Named Entity)을 자동으로 추출하는 방법을 의미하여, 상기 자연어 처리모듈에 의해 처리된 음성인식 결과 텍스트에서 사용자의 명령 대상값을 추출하게 되는 것이다.
상기 사용자의 명령 대상값을 추출하는 기술은 일반적인 기술이므로 상세한 설명은 생략하겠다.
또한, 상기 검색시작부는 음성인식엔진부를 구성할 수 있으며, 이를 통해 상기 추출된 사용자의 명령 대상값을 토대로 미리 입력된 단어나 문장에 근접한 결과를 명령어로 인식하여 인식 결과값을 추출하는 기능을 수행하게 된다.
즉, 보통 인식기가 이해할 수 있는 인식 문법(Grammar) 기반으로 음성인식이 수행되는데, 인식 대상 목록이 정해져 있고, 그 대상 목록만이 인식 결과로 출력될 수 있는 구조를 지닌다.
이때, 검색시작부(100)는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하게 된다.
예를 들어, 음성 혹은 텍스트로 '러브 액추얼리 같은 영화'를 입력하게 되면 러브 액추얼리, 영화 등을 참조하여 멀티미디어 컨텐츠를 요청하는 검색어임을 알 수 있으며, 검색시작부는 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하게 되는 것이다.
상기 속성검색수행판단부(200)는 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하게 된다.
구체적으로, 텍스트 키워드 검색을 수행할 것인지, 아니면 유사 속성 검색을 수행할 것인지의 판단은 서비스 도메인에 따라 판단하는 제1 모드, 검색어로 입력된 문장을 분석하여 판단하는 제2 모드 중 적어도 어느 하나의 모드를 적용하여 판단하는 것을 특징으로 한다.
상기 제1모드 또는 제2 모드는 관리자에 의해 사전에 설정되는 것을 특징으로 한다.
즉, 텍스트 키워드 검색을 수행할 것인지, 아니면 유사 속성 검색을 수행할 것인지의 판단에 대해 제1 모드로 설정되면 서비스 도메인 주소를 참조하여 텍스트 키워드 검색을 수행할 것인지, 아니면 유사 속성 검색을 수행할 것인지가 결정되는 것이다.
예를 들어, 'www.naver.com'의 도메인 주소일 경우에는 텍스트 키워드 검색을, 'www.google.com'의 도메인 주소일 경우에는 유사 속성 검색을 수행하는 것으로 설정하게 되는 것이다.
또는, 관리자에 의해 제2 모드로 설정되면 검색어로 입력된 문장을 분석하여 유사 속성 검색에 해당하는 키워드가 존재하는 지를 판단하게 되는 것이다.
예를 들어, '같은', '비슷한', '동일한' 등과 같이 유사 속성을 검색하려는 의도가 담긴 검색어를 획득한다면 이는 유사 속성 검색을 수행하고자 하는 것임을 알 수 있다.
상기 속성검색수행판단부(200)는 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하게 된다.
이때, 상기 텍스트키워드검색부(300)는 속성검색수행판단부로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에는 예를 들어, '러브 액추얼리'라는 텍스트 키워드를 참조하여 텍스트 키워드 검색을 수행하고, '러브 액추얼리'를 포함하고 있는 검색 결과 정보를 텍스트키워드결과출력부로 제공하게 된다.
이때, 상기 텍스트키워드결과출력부(400)는 텍스트키워드검색부로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키게 되는 것이다.
즉, 도 4와 같이, '러브 액추얼리'라는 키워드를 포함하고 있는 모든 검색 결과 정보를 출력시키기 때문에 사용자가 원하는 검색 결과를 제공할 확률은 감소하게 된다.
이는 사용자가 원하는 속성 정보를 반영하지 못하기 때문에 발생되는 문제점이며, 본 발명에서는 일반적인 텍스트 키워드 검색 방식을 제공하면서 동시에 유사 속성 검색 방식을 제공하는 것을 특징으로 하고 있다.
이를 위하여, 상기 속성검색수행판단부(200)는 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하게 된다.
즉, 서비스 도메인에 따라 미리 설정하는 제1 모드, 검색어로 입력된 문장을 분석하는 제2 모드 중 어느 하나에 의해 분석된 결과가 유사 속성 검색에 해당된다면 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 것이다.
이후, 상기 속성유사도검색수단(500)은 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하게 되며, 속성유사도검색결과출력부(600)는 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키게 되는 것이다.
예를 들어, '러브 액추얼리 같은 영화'를 검색어로 입력하게 되면, 속성유사도검색수단(500)을 통해 유사 속성 검색을 수행하고 검색된 결과를 속성유사도검색결과출력부(600)로 제공하여 이를 화면에 출력하게 되는 것이다.
도 5에 도시한 바와 같이, '이프 온리, 로맨틱 홀리데이, 노팅 힐, 워크 투 리멤버' 등의 유사 속성 검색 결과를 제공하게 되는 것이다.
다음은 도 6 내지 도 8을 참조하여 제1 실시예에 따른 본 발명의 핵심 구성적 특징을 제공하는 속성유사도검색수단(500)의 구성요소와 동작 과정에 대하여 구체적으로 설명하겠다.
도 6에 도시한 바와 같이, 속성유사도검색수단(500)은 검색어속성분석부(510), 멀티미디어컨텐츠속성할당부(520), 유사도매칭성분석부(530), 유사도후보군추출부(540), 유사도기준멀티미디어컨텐츠정렬부(550)를 포함하여 구성된다.
상기와 같은 속성유사도검색수단(500)의 구성에 의해 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 제공함으로써, 검색하고자 하는 멀티미디어 컨텐츠의 속성 정보와 유사도가 높은 멀티미디어 컨텐츠들을 제공하여 검색의 정확성 및 신뢰성을 제공하게 된다.
본 발명에서 속성이란, 개체가 가지고 있는 고유의 특성을 의미하며, 속성 자체만으로는 의미가 없지만, 관련있는 속성들을 모아 개체를 구성하면 하나의 중요한 의미를 표현할 수가 있게 되며, 속성은 일반적으로 의미있는 데이터의 가장 작은 논리적 단위로 인식되며, 이를 데이터베이스 가공에 활용하게 된다.
이에 따라 본 발명에서는 유사 속성을 이용하여 검색어(질문 혹은 질의어)와 가장 유사도가 높은 멀티미디어 컨텐츠 정보 검색에 활용하게 되는 것이다.
상기 검색어속성분석부(510)는 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하게 된다.
예를 들어, '러브 액추얼리 같은 영화'와 같은 검색어에 포함된 언어적 의미를 분석하게 되는데, 이는 언어적 속성 정보를 분석하는 것을 의미한다.
즉, '러브 액추얼리'라는 영화가 가지고 있는 속성과 유사한 속성을 가진 멀티미디어 컨텐츠를 검색하기 위한 속성 정보를 분석해야만 이를 참조하여 유사한 멀티미디어 컨텐츠를 검색할 수 있게 된다.
즉, '따뜻함, 감동적임, 재미있음' 등의 속성 정보를 러브 액추얼리에 할당하게 된다면 상기 속성 정보인 '따뜻함, 감동적임, 재미있음'을 가지고 있는 영화를 검색할 수가 있게 되는 것이다.
상기 멀티미디어컨텐츠속성할당부(520)는 컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하게 된다.
즉, 멀티미디어 컨텐츠들이 어떤 속성 정보를 지니고 있는지 컨텐츠 정보를 게더링하는 것이며, 컨텐츠 정보는 외부 네트워크 또는 통신을 이용하여 연결된 컨텐츠서버에서 크롤링된 것이며, 언어적 정제를 거쳐 속성 정보를 할당하게 된다.
구체적으로, 러브 액추얼리라는 멀티미디어 컨텐츠를 획득하여 저장하게 되며, 상기 저장된 러브 액추얼리 영화에 속성 정보를 할당하게 되는데, 예를 들어, 속성 정보인 '따뜻함, 감동적임, 재미있음' 등의 속성 정보를 할당하게 되는 것이다.
상기한 바와 같이, 게더링되는 모든 컨텐츠마다 속성 정보를 할당하여 관리하게 되면, 검색어의 속성 정보와 유사한 컨텐츠들을 추출해낼 수가 있게 되는 것이다.
상기 유사도매칭성분석부(530)는 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하게 된다.
예를 들어, 검색어의 언어적 속성 정보인 '영화', '러브액추얼리', '같은'이라는 언어적 속성 정보와 '따뜻함, 감동적임, 재미있음'이라는 멀티미디어 컨텐츠 속성 정보를 가지고, '따뜻함, 감동적임, 재미있음' 등과 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 생성하여 멀티미디어컨텐츠속성할당부(520)로 제공하게 되며, 멀티미디어컨텐츠속성할당부로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하게 되는 것이다.
상기한 유사도 매칭 분석이란, 정보검색론에서 유사도를 검색하기 위해서 많이 활용하는 유클리디안 거리(Euclidean distance) 공식, 벡터 공간 모델(Vector space model) 등 다양한 유사도 계산 공식을 이용하여 사용자에게 제공할 컨텐츠를 선정할 수 있다.
또한, 사용자가 제공한 검색 키워드를 바탕으로 컨텐츠의 키워드와의 가장 유사한 컨텐츠를 검색하여 유사도가 높은 순서대로 컨텐츠를 정렬할 수 있다.
여기서, 상기 유사도 검색 결과로 도출되는 컨텐츠의 수는 상위 일정 개수를 정하여 정렬시킬 수 있으며, 상기 일정 개수는 상황에 따라 사용자가 임의 설정 가능할 수 있다.
여기서, a는 사용자가 컨텐츠를 검색하기 위하여 입력한 키워드이고, a1, a2, a3 ...an 까지 총 n개의 키워드가 있고, 상기 총 n개의 키워드는 a(a1, a2, a3 ...an )으로 표현하고, b는 컨텐츠이고, b1, b2, b3 ...bn 까지 총 n개의 키워드가 있고, 상기 총 n개의 키워드는 b(b1, b2, b3 ...bn )라고 할 때, 상기 유클리디안 거리 공식은 다음과 같이 표현할 수 있다.
Figure 112018024414974-pat00001
(수식1)
여기서, 각 키워드 간의 유클리디안 거리가 가까울수록 즉, 수식 1을 통해 도출된 값이 작을수록 유사도는 높다고 판단할 수 있다.
또한, 상기 벡터 공간 모델은 다음과 같이 표현할 수 있다.
Figure 112018024414974-pat00002
(수식2)
여기서, 수식2를 통해 도출된 값이 1에 가까울수록 유사도가 높으며, 0에 가까울수록 유사도가 낮다고 판단할 수 있다.
따라서, 수식 1 및 수식 2를 통해 검색 키워드와 콘텐츠별로 생성된 키워드와의 유사도를 검사하여 유사도가 높은 순서대로 컨텐츠를 정렬시킬 수 있다.
이때, 상기 유사도후보군추출부(540)는 사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하게 된다.
예를 들어, 4개의 후보군 숫자로 설정하게 되면 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하게 되는데, '이프 온리, 로맨틱 홀리데이, 노팅 힐, 워크 투 리멤버' 라는 4개의 후보군을 추출하게 된다.
이때, 상기 유사도기준멀티미디어컨텐츠정렬부(550)는 상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하게 되는 것이다.
예를 들어, 이프 온리와의 유사도가 1.215, 상기 로맨틱 홀리데이과의 유사도가 0.75, 상기 노팅 힐과의 유사도가 1.787, 상기 워크 투 리멤버와의 유사도가 0.454로 각각 도출되면, 상기 유클리디언 거리 공식은 유사도 값이 작을수록 유사도가 높으므로, 상기 컨텐츠를 유사도가 높은 순서대로 재정렬할 경우 워크 투 리멤버, 로맨틱 홀리데이, 이프 온리, 노팅 힐 순서로 정렬하여 해당 정보를 속성유사도검색결과출력부(600)로 제공하여 화면에 출력시키게 되는 것이다.
다음은 도 7을 참조하여 검색어속성분석부(510)의 구성수단과 동작 과정을 구체적으로 설명하도록 하겠다.
상기 검색어속성분석부(510)는 자연어처리모듈(511), 머신러닝모델모듈(512), 검색어속성할당모듈(513), 지식정보DB(514), 검색어속성수치변환모듈(515), 속성모델모듈(516), 검색어속성수치정보DB(517)를 포함하여 구성된다.
상기 자연어처리모듈(511)은 머신러닝모델모듈(512)로 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 제공하며, 머신러닝모델모듈로부터 해석된 검색어에 포함된 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하게 된다.
이때, 상기 머신러닝모델모듈(512)은 자연어처리모듈로부터 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 획득할 경우에 검색어에 포함된 언어적 속성을 해석하여 자연어처리모듈로 해석된 언어적 속성 정보를 제공하는 기능을 수행하게 된다.
예를 들어, '러브 액추얼리 같은 영화를 알려줘'라는 검색어에 포함된 언어적 속성에 대한 해석을 요청하게 되면, 상기 검색어에 대한 언어적 속성을 해석하게 되는데, 이는 일반적인 머신 러닝 모델 기법을 활용하여 질문의 의미 정보를 해석하게 되며, 머신 러닝을 통해 생성된 모델을 기반으로 질문의 의도와 다양한 의미 정보를 추출하게 되며, 예를 들어, '러브 액추얼리, 같은, 영화'이라는 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하는 것이다.
상기 지식정보DB(514)에는 멀티미디어 컨텐츠의 속성 정보와 매칭될 수 있는 속성의 유형으로 정제되어 있는 속성 유형 정보를 저장하고 있게 된다.
예를 들어, 러브 액추얼리라는 영화의 속성 정보로 '따뜻함, 감동적임, 재미있음, 로맨스' 등의 속성 정보로 설정되고, 이에 매칭될 수 있는 속성의 유형으로 '영화'로 설정하여 저장하게 된다.
속성의 유형을 통해 정보를 찾는 것인지, 웹사이트를 찾는 것인지, 뉴스/지역/쇼핑 등 특정 분야의 컨텐츠를 원하는 지, 멀티미디어 컨텐츠를 찾는 것인지 등을 알 수 있을 것이다.
이때, 상기 검색어속성할당모듈(513)은 자연어처리모듈에서 제공된 검색어에 포함된 언어적 속성 정보를 획득하고, 획득된 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보를 추출하여 검색어에 대한 속성을 할당하고, 할당된 검색어에 대한 속성 정보를 검색어속성수치변환모듈(515)로 제공하게 된다.
예를 들어, '러브 액추얼리, 같은, 영화'이라는 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보인 '영화'를 추출하여 해당 검색어에 대한 속성 정보인 '따뜻함, 감동적임, 재미있음, 로맨스' 등을 검색어속성수치변환모듈(515)로 제공하게 된다.
이때, 상기 검색어속성수치변환모듈(515)은 검색어속성할당모듈(513)로부터 제공된 검색어에 대한 속성 정보를 획득할 경우에 속성모델모듈(516)로 확률값 산출 요청 정보를 제공하게 된다.
이후, 상기 속성모델모듈(516)은 검색어속성수치변환모듈(515)로부터 확률값 산출 요청 정보를 획득할 경우에 언어 모델링을 통해 확률값을 산출하며, 산출된 확률값을 검색어속성수치변환모듈(515)로 제공하게 되는 것이다.
상기한 언어 모델링이란, 자연어 안에서 문법, 구문, 단어 등에 대한 규칙성을 찾아내고, 그 규칙성을 이용하여 검색하고자 하는 대상의 정확도를 높이기 위한 알고리즘을 의미한다.
이때, 일반적으로 사용되는 방식이 확률값을 산출하는 통계적 모델링 기법이며, 이는 대량의 말뭉치에서 언어 규칙을 확률로 나타내고, 확률값을 통해서 탐색 영역을 제한하는 방법이다.
그리고, 음성 인식에서 정확성뿐만 아니라, 탐색 공간을 급격히 줄여주여 주는 장점이 있으며, 모든 가능한 문장의 확률적 분포로 문장의 확률 모델을 기반으로 하기 때문에 학습데이터로부터 확률 모델의 학습이 필요하다.
그리고, 대부분의 언어 모델링 응용분야에서 통계적 언어모델인 N-Gram이 가장 성공적인 언어 모델로 알려져 있으며, 본 발명에서도 바람직하게는 N-Gram을 사용하게 된다.
또한, 상기 검색어속성수치변환모듈(515)은 속성모델모듈(516)로부터 산출된 확률값을 획득하여 검색어에 대한 속성값으로 변환하여 검색어속성수치정보DB(517)로 제공하게 된다.
예를 들어, '따뜻함 - 8, 감동적임 - 9, 재미있음 - 7, 로맨스 -10'과 같이, 속성 정보마다 속성값으로 변환하여 검색어속성수치정보DB(517)에 저장하게 되는 것이다.
또한, 검색어에 대한 속성 정보도 저장하게 된다.
상기와 같이, 검색어에 대한 속성값이 할당되면, 유사도매칭성분석부(530)에서는 하기의 멀티미디어컨텐츠속성할당부(520)에서 제공하는 다양한 속성값을 가진 컨텐츠들과 검색어에 대한 속성값을 가지고 유사도를 분석하게 되는 것이다.
즉, 유사도매칭성분석부(530)는 검색어속성수치정보DB(517)에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부(520)에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시하는 것이다.
예를 들어, 검색어에 대한 속성 정보가 '감동적인 로맨스 영화'로 할당되었다면, '감동적인 로맨스 영화'로 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 있는 '이프 온리, 로맨틱 홀리데이, 노팅 힐, 워크 투 리멤버' 등의 멀티미디어 컨텐츠 리스트 정보를 유사도매칭성분석부(530)에서 획득하여 유사도 매칭 분석을 실시하게 되는 것이다.
다음은 도 8을 참조하여 멀티미디어컨텐츠속성할당부(520)의 구성수단과 동작 과정을 구체적으로 설명하도록 하겠다.
상기 멀티미디어컨텐츠속성할당부(520)는 컨텐츠연동모듈(521), 컨텐츠크롤링모듈(522), 컨텐츠저장DB(523), 컨텐츠속성할당모델모듈(524), 컨텐츠속성정보해석모듈(525), 컨텐츠정보검색모듈(526)을 포함하여 구성된다.
시간의 흐름에 따라 멀티미디어 컨텐츠의 정보량이 변경되고 이에 따라 특정 대상의 속성도 시시각각 변화하는데, 상기와 같은 멀티미디어컨텐츠속성할당부를 통해 가변적으로 멀티미디어 컨텐츠를 반영함으로써, 실시간으로 변화하는 다양한 멀티미디어 컨텐츠들을 검색에 반영할 수 있는 효과를 발휘하게 된다.
구체적으로 설명하면, 컨텐츠연동모듈(521)은 컨텐츠서버(560)와 연동시켜 컨텐츠크롤링모듈(522)로 멀티미디어 컨텐츠 정보를 제공하게 되고, 상기 컨텐츠크롤링모듈(522)은 컨텐츠연동모듈(521)로부터 제공되는 다수의 멀티미디어 컨텐츠 정보들을 수집하여 컨텐츠저장DB로 저장시켜 속성 정보의 연산 범위를 확장시키는 기능을 수행하게 된다.
즉, 상기 컨텐츠서버에서 전달되는 정보는 컨텐츠연동모듈을 통해 컨텐츠 속성 모델의 리소스가 되는 것이다.
이때, 상기 컨텐츠크롤링모듈(522)을 통해 다양한 멀티미디어 컨텐츠들을 수집하여 속성 정보의 연산 범위를 확장시키는 것이다.
예를 들어, 영화의 속성 정보인 '따뜻함, 감동적임, 재미있음, 로맨스' 등을 포함하고 있는 멀티미디어 컨텐츠들을 다양하게 수집할 수 있게 되는 것이다.
이때, 상기 컨텐츠속성할당모델모듈(524)은 상기 컨텐츠저장DB(523)에 저장된 각각의 멀티미디어 컨텐츠들을 획득하여 각각의 멀티미디어 컨텐츠마다 속성 정보를 할당하게 되는 것이다.
따라서, 상기 컨텐츠저장DB(523)에는 상기 컨텐츠크롤링모듈(522)로부터 제공된 멀티미디어 컨텐츠 정보와 각각의 멀티미디어 컨텐츠마다 할당된 속성 정보를 저장하고 있게 되는 것이다.
예를 들어, 각각의 멀티미디어 컨텐츠에 대하여 일일히 속성 정보를 부여하는 역할을 담당하는데, 예를 들어, A라는 음악에 '차분함, 감동적임'이라는 속성 정보를 할당하게 되는 것이다.
그리고, 상기 컨텐츠속성정보해석모듈(525)은 컨텐츠속성할당모델모듈(524)에 의해 할당된 각각의 멀티미디어 컨텐츠의 속성 정보를 해석하여 컨텐츠정보검색모듈로 제공하게 되는 것이다.
예를 들어, 컨텐츠정보검색모듈에서 검색어에 해당하는 '따뜻함, 감동적임, 재미있음, 로맨스'를 제공하는 '영화'를 요청하게 되면 이에 해당하는 컨텐츠들을 해석하게 되며, 해석된 각각의 멀티미디어 컨텐츠의 속성 정보를 컨텐츠정보검색모듈(526)로 제공하게 된다.
따라서, 컨텐츠정보검색모듈(526)은 컨텐츠속성정보해석모듈(525)에 의해 해석된 각각의 멀티미디어 컨텐츠의 속성 정보를 유사도매칭성분석부(530)로 제공하게 되는 것이다.
이후, 유사도매칭성분석부(530)로부터 검색어의 언어적 속성 정보와 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 획득할 경우에 컨텐츠저장DB(523)로부터 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 리스트 정보를 컨텐츠속성정보해석모듈(525)로 요청하고, 컨텐츠저장DB(523)로부터 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 리스트 정보를 획득하여 유사도매칭성분석부(530)로 제공하게 되는 것이다.
예를 들어, '러브 액추얼리, 같은, 영화'이라는 언어적 속성 정보를 참조하여 유사한 속성 정보를 포함하는 '이프 온리, 로맨틱 홀리데이, 노팅 힐, 워크 투 리멤버' 등의 멀티미디어 컨텐츠 리스트 정보를 컨텐츠저장DB(523)로부터 추출하게 되는 것이다.
다음은 본 발명인 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법에 대하여 도 9 내지 도 10을 참조하여 구체적으로 설명하도록 하겠다.
도 9는 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법의 전체 흐름도이다.
도 9에 도시한 바와 같이, 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법은, 검색시작단계(S100), 속성검색수행판단단계(S200), 텍스트키워드검색단계(S300), 텍스트키워드결과출력단계(S400), 속성유사도검색단계(S500), 속성유사도검색결과출력단계(S600)를 포함한다.
구체적으로 설명하자면, 상기 검색시작단계(S100)는 검색시작부(100)를 통해 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하게 된다.
텍스트로 입력시에는 텍스트 정보를 추출하여 검색 실시 요청 정보를 제공하지만, 음성 인식으로 입력될 경우에는 음성 인식을 위하여 검색시작부는 자연어 처리모듈을 포함하여 구성되되, 상기 자연어 처리모듈에 의해 처리된 음성인식 결과 텍스트에서 사용자의 명령 대상값을 추출하게 된다.
이후, 속성검색수행판단단계(S200)는 속성검색수행판단부(200)가 상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하게 된다.
즉, 텍스트 키워드 검색을 수행할 경우에는 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하게 된다.
따라서, 텍스트키워드검색단계(S300)는 텍스트키워드검색부(300)가 상기 속성검색수행판단부(200)로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하게 된다.
이후, 텍스트키워드결과출력단계(S400)는 텍스트키워드결과출력부(400)가 상기 텍스트키워드검색부(300)로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키게 되는 것이다.
예를 들어, '러브 액추얼리'라는 텍스트 키워드를 참조하여 텍스트 키워드 검색을 수행하고, '러브 액추얼리'를 포함하고 있는 검색 결과 정보를 텍스트키워드결과출력부로 제공하게 된다.
한편, 속성검색수행판단부(200)가 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하게 되는데, 이때, 상기 속성유사도검색단계(S500)는 속성유사도검색수단(500)가 상기 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하게 된다.
이후, 속성유사도검색결과출력단계(S600)는 속성유사도검색결과출력부(600)가 상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키게 된다.
예를 들어, '러브 액추얼리 같은 영화'를 검색어로 입력하게 되면, 속성유사도검색수단(500)을 통해 유사 속성 검색을 수행하고 검색된 결과를 속성유사도검색결과출력부(600)로 제공하여 이를 화면에 출력하게 되는 것이다.
도 10은 본 발명의 제1 실시예에 따른 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법의 속성유사도검색단계를 나타낸 흐름도이다.
도 10에 도시한 바와 같이, 속성유사도검색단계(S500)는, 검색어속성분석단계(S510), 멀티미디어컨텐츠속성할당단계(S520), 유사도매칭성분석단계(S530), 유사도후보군추출단계(540), 유사도기준멀티미디어컨텐츠정렬단계(S550)를 포함한다.
구체적으로 설명하자면, 상기 검색어속성분석단계(S510)는 검색어속성분석부(510)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하게 된다.
좀더 구체적으로는 상기 검색어속성분석단계(S510)는,
머신러닝모델모듈(512)로 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 제공하며, 머신러닝모델모듈로부터 해석된 검색어에 포함된 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하는 단계;
자연어처리모듈로부터 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 획득할 경우에 검색어에 포함된 언어적 속성을 해석하여 자연어처리모듈로 해석된 언어적 속성 정보를 제공하는 단계;
멀티미디어 컨텐츠의 속성 정보와 매칭될 수 있는 속성의 유형으로 정제되어 있는 속성 유형 정보를 저장하는 단계;
상기 자연어처리모듈에서 제공된 검색어에 포함된 언어적 속성 정보를 획득하고, 획득된 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보를 추출하여 검색어에 대한 속성을 할당하고, 할당된 검색어에 대한 속성 정보를 검색어속성수치변환모듈(515)로 제공하는 단계;
상기 검색어속성할당모듈(513)로부터 제공된 검색어에 대한 속성 정보를 획득할 경우에 속성모델모듈(516)로 확률값 산출 요청 정보를 제공하며, 속성모델모듈(516)로부터 산출된 확률값을 획득하여 검색어에 대한 속성값으로 변환하여 검색어속성수치정보DB(517)로 제공하는 단계;
검색어속성수치변환모듈(515)로부터 확률값 산출 요청 정보를 획득할 경우에 언어 모델링을 통해 확률값을 산출하며, 산출된 확률값을 검색어속성수치변환모듈(515)로 제공하는 단계;
검색어속성수치변환모듈(515)에 의해 제공된 검색어에 대한 속성값을 저장하는 단계를 포함하는 것을 특징으로 한다.
예를 들어, '러브 액추얼리'라는 영화가 가지고 있는 속성과 유사한 속성을 가진 멀티미디어 컨텐츠를 검색하기 위한 속성 정보를 분석해야만 이를 참조하여 유사한 멀티미디어 컨텐츠를 검색할 수 있게 된다.
즉, '따뜻함, 감동적임, 재미있음' 등의 속성 정보를 러브 액추얼리에 할당하게 된다면 상기 속성 정보인 '따뜻함, 감동적임, 재미있음'을 가지고 있는 영화를 검색할 수가 있게 되는 것이다.
이후, 멀티미디어컨텐츠속성할당단계(S520)는 멀티미디어컨텐츠속성할당부(520)가 컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하게 되는 것이다.
즉, 멀티미디어 컨텐츠들이 어떤 속성 정보를 지니고 있는지 컨텐츠 정보를 게더링하는 것이며, 컨텐츠 정보는 외부 네트워크 또는 통신을 이용하여 연결된 컨텐츠서버에서 크롤링된 것이며, 언어적 정제를 거쳐 속성 정보를 할당하게 된다.
구체적으로, 러브 액추얼리라는 멀티미디어 컨텐츠를 획득하여 저장하게 되며, 상기 저장된 러브 액추얼리 영화에 속성 정보를 할당하게 되는데, 예를 들어, 속성 정보인 '따뜻함, 감동적임, 재미있음' 등의 속성 정보를 할당하게 되는 것이다.
상기한 바와 같이, 게더링되는 모든 컨텐츠마다 속성 정보를 할당하여 관리하게 되면, 검색어의 속성 정보와 유사한 컨텐츠들을 추출해낼 수가 있게 되는 것이다.
이후, 유사도매칭성분석단계(S530)는 유사도매칭성분석부(530)가 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하고, 멀티미디어컨텐츠속성할당부(520)로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하게 된다.
예를 들어, 검색어의 언어적 속성 정보인 '영화', '러브액추얼리', '같은'이라는 언어적 속성 정보와 '따뜻함, 감동적임, 재미있음'이라는 멀티미디어 컨텐츠 속성 정보를 가지고, '따뜻함, 감동적임, 재미있음' 등과 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 생성하여 멀티미디어컨텐츠속성할당부(520)로 제공하게 되며, 멀티미디어컨텐츠속성할당부로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하게 되는 것이다.
이후, 유사도후보군추출단계(540)는 유사도후보군추출부(540)가 사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하게 된다.
예를 들어, 4개의 후보군 숫자로 설정하게 되면 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하게 되는데, '이프 온리, 로맨틱 홀리데이, 노팅 힐, 워크 투 리멤버' 라는 4개의 후보군을 추출하게 된다.
이후, 유사도기준멀티미디어컨텐츠정렬단계(S550)는 유사도기준멀티미디어컨텐츠정렬부(550)가 상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하게 되는 것이다.
예를 들어, 이프 온리와의 유사도가 1.215, 상기 로맨틱 홀리데이과의 유사도가 0.75, 상기 노팅 힐과의 유사도가 1.787, 상기 워크 투 리멤버와의 유사도가 0.454로 각각 도출되면, 상기 유클리디언 거리 공식은 유사도 값이 작을수록 유사도가 높으므로, 상기 컨텐츠를 유사도가 높은 순서대로 재정렬할 경우 워크 투 리멤버, 로맨틱 홀리데이, 이프 온리, 노팅 힐 순서로 정렬하여 해당 정보를 속성유사도검색결과출력부(600)로 제공하여 화면에 출력시키게 되는 것이다.
지금까지 설명한 본 발명에 의하면, 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하여 텍스트 키워드 검색을 수행할 경우에 멀티미디어 컨텐츠의 검색 결과 정보를 출력하며, 유사 속성 검색을 수행할 경우에 유사 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 출력함으로써, 일반적인 검색 키워드 방식을 이용한 멀티미디어 컨텐츠 검색 결과를 제공하는 효과와 유사 속성 검색을 통한 사용자가 검색하기를 원하는 검색어(질문)에 가장 유사한 멀티미디어 컨탠츠 검색 결과를 제공하는 효과를 발휘한다.
특히, 유사도매칭성분석부를 제공함으로써, 유사 속성 검색을 수행시, 검색어속성수치정보DB에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시함으로써, 검색어(질문)의 의도와 유사한 속성을 가지고 있는 멀티미디어 컨텐츠의 검색 결과 정보를 제공함으로써, 사용자가 원하는 속성(분위기, 감정 등)과 일치하는 멀티미디어 컨텐츠를 제공하게 되어 이에 따른 검색의 신뢰도를 높일 수 있는 효과를 발휘하게 된다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.
100 : 검색시작부
200 : 속성검색수행판단부
300 : 텍스트키워드검색부
400 : 텍스트키워드결과출력부
500 : 속성유사도검색수단
560 : 컨텐츠서버
600 : 속성유사도검색결과출력부

Claims (7)

  1. 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치에 있어서,
    음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작부(100)와,
    상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단부(200)와,
    상기 속성검색수행판단부로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색부(300)와,
    상기 텍스트키워드검색부로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력부(400)와,
    상기 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색수단(500)과,
    상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력부(600)를 포함하여 구성되고,

    상기 속성유사도검색수단(500)은 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하기 위한 검색어속성분석부(510)를 포함하고,
    상기 검색어속성분석부(510)는,
    머신러닝모델모듈(512)로 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 제공하며, 머신러닝모델모듈로부터 해석된 검색어에 포함된 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하기 위한 자연어처리모듈(511);
    자연어처리모듈로부터 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 획득할 경우에 검색어에 포함된 언어적 속성을 해석하여 자연어처리모듈로 해석된 언어적 속성 정보를 제공하기 위한 머신러닝모델모듈(512);
    멀티미디어 컨텐츠의 속성 정보와 매칭될 수 있는 속성의 유형으로 정제되어 있는 속성 유형 정보를 저장하고 있는 지식정보DB(514);
    상기 자연어처리모듈에서 제공된 검색어에 포함된 언어적 속성 정보를 획득하고, 획득된 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보를 추출하여 검색어에 대한 속성을 할당하고, 할당된 검색어에 대한 속성 정보를 검색어속성수치변환모듈(515)로 제공하기 위한 검색어속성할당모듈(513);
    상기 검색어속성할당모듈(513)로부터 제공된 검색어에 대한 속성 정보를 획득할 경우에 속성모델모듈(516)로 확률값 산출 요청 정보를 제공하며, 속성모델모듈(516)로부터 산출된 확률값을 획득하여 검색어에 대한 속성값으로 변환하여 검색어속성수치정보DB(517)로 제공하기 위한 검색어속성수치변환모듈(515);
    검색어속성수치변환모듈(515)로부터 확률값 산출 요청 정보를 획득할 경우에 언어 모델링을 통해 확률값을 산출하며, 산출된 확률값을 검색어속성수치변환모듈(515)로 제공하기 위한 속성모델모듈(516);
    검색어속성수치변환모듈(515)에 의해 제공된 검색어에 대한 속성값을 포함하여 저장하고 있는 검색어속성수치정보DB(517);를 포함하여 구성되는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치.
  2. 제 1항에 있어서,
    상기 속성유사도검색수단(500)은,
    컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하기 위한 멀티미디어컨텐츠속성할당부(520);
    검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하고, 멀티미디어컨텐츠속성할당부(520)로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하기 위한 유사도매칭성분석부(530);
    사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하기 위한 유사도후보군추출부(540);
    상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하기 위한 유사도기준멀티미디어컨텐츠정렬부(550);를 더 포함하여 구성되는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치.
  3. 삭제
  4. 제 2항에 있어서,
    상기 멀티미디어컨텐츠속성할당부(520)는,
    컨텐츠서버(560)와 연동시켜 컨텐츠크롤링모듈(522)로 멀티미디어 컨텐츠 정보를 제공하기 위한 컨텐츠연동모듈(521);
    컨텐츠연동모듈(521)로부터 제공되는 다수의 멀티미디어 컨텐츠 정보들을 수집하여 컨텐츠저장DB로 저장시켜 속성 정보의 연산 범위를 확장시키기 위한 컨텐츠크롤링모듈(522);
    상기 컨텐츠크롤링모듈(522)로부터 제공된 멀티미디어 컨텐츠 정보와 각각의 멀티미디어 컨텐츠마다 할당된 속성 정보를 저장하고 있는 컨텐츠저장DB(523);
    상기 컨텐츠저장DB(523)에 저장된 각각의 멀티미디어 컨텐츠에 대하여 속성 정보를 할당하기 위한 컨텐츠속성할당모델모듈(524);
    상기 컨텐츠속성할당모델모듈(524)에 의해 할당된 각각의 멀티미디어 컨텐츠의 속성 정보를 해석하여 컨텐츠정보검색모듈로 제공하기 위한 컨텐츠속성정보해석모듈(525);
    컨텐츠속성정보해석모듈(525)에 의해 해석된 각각의 멀티미디어 컨텐츠의 속성 정보를 유사도매칭성분석부(530)로 제공하며, 유사도매칭성분석부(530)로부터 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 획득할 경우에 컨텐츠저장DB(523)로부터 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 리스트 정보를 유사도매칭성분석부(530)로 제공하기 위한 컨텐츠정보검색모듈(526);을 포함하여 구성되는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치.
  5. 제 2항에 있어서,
    상기 유사도매칭성분석부(530)는,
    검색어속성수치정보DB(517)에 저장된 검색어에 대한 속성 정보와 멀티미디어컨텐츠속성할당부(520)에 의해 할당된 멀티미디어 컨텐츠 속성 정보를 가지고 유사도 매칭 분석을 실시하는 것을 특징으로 하는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치.
  6. 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법에 있어서,
    검색시작부(100)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어를 획득하여 검색 실시 요청 정보를 속성검색수행판단부(200)로 제공하는 검색시작단계(S100)와,
    속성검색수행판단부(200)가 상기 검색시작부(100)로부터 검색 실시 요청 정보를 획득할 경우, 텍스트 키워드 검색을 수행할 것인지, 유사 속성 검색을 수행할 것인지를 판단하고, 판단 결과, 텍스트 키워드 검색을 수행할 경우에 텍스트키워드검색부(300)로 텍스트 키워드 검색 요청 정보를 제공하며, 판단 결과, 유사 속성 검색을 수행할 경우에 속성유사도검색부(500)로 유사 속성 검색 요청 정보를 제공하는 속성검색수행판단단계(S200)와,
    텍스트키워드검색부(300)가 상기 속성검색수행판단부(200)로부터 제공된 텍스트 키워드 검색 요청 정보를 획득할 경우에 텍스트 키워드 검색을 수행하고, 검색 결과 정보를 텍스트키워드결과출력부로 제공하는 텍스트키워드검색단계(S300)와,
    텍스트키워드결과출력부(400)가 상기 텍스트키워드검색부(300)로부터 제공된 텍스트 키워드의 검색 결과 정보를 출력시키기 위한 텍스트키워드결과출력단계(S400)와,
    속성유사도검색수단(500)이 상기 속성검색수행판단부(200)로부터 제공된 유사 속성 검색 요청 정보를 획득할 경우에 유사 속성 검색을 수행하고, 검색 결과 정보를 속성유사도검색결과출력부로 제공하는 속성유사도검색단계(S500)와,
    속성유사도검색결과출력부(600)가 상기 속성유사도검색부(500)로부터 제공된 유사 속성의 검색 결과 정보를 출력시키기 위한 속성유사도검색결과출력단계(S600)를 포함하고,
    상기 속성유사도검색단계(S500)는,
    검색어속성분석부(510)가 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성 정보를 분석하기 위한 검색어속성분석단계(S510)를 포함하고,
    상기 검색어속성분석단계(S510)는,
    머신러닝모델모듈(512)로 음성 인식 또는 텍스트로 입력된 멀티미디어 컨텐츠의 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 제공하며, 머신러닝모델모듈로부터 해석된 검색어에 포함된 언어적 속성 정보를 검색어속성할당모듈(513)로 제공하는 단계;
    자연어처리모듈로부터 검색어에 포함된 언어적 속성에 대한 해석 요청 정보를 획득할 경우에 검색어에 포함된 언어적 속성을 해석하여 자연어처리모듈로 해석된 언어적 속성 정보를 제공하는 단계;
    멀티미디어 컨텐츠의 속성 정보와 매칭될 수 있는 속성의 유형으로 정제되어 있는 속성 유형 정보를 저장하는 단계;
    상기 자연어처리모듈에서 제공된 검색어에 포함된 언어적 속성 정보를 획득하고, 획득된 언어적 속성 정보를 토대로 지식정보DB로부터 속성 유형 정보를 추출하여 검색어에 대한 속성을 할당하고, 할당된 검색어에 대한 속성 정보를 검색어속성수치변환모듈(515)로 제공하는 단계;
    상기 검색어속성할당모듈(513)로부터 제공된 검색어에 대한 속성 정보를 획득할 경우에 속성모델모듈(516)로 확률값 산출 요청 정보를 제공하며, 속성모델모듈(516)로부터 산출된 확률값을 획득하여 검색어에 대한 속성값으로 변환하여 검색어속성수치정보DB(517)로 제공하는 단계;
    검색어속성수치변환모듈(515)로부터 확률값 산출 요청 정보를 획득할 경우에 언어 모델링을 통해 확률값을 산출하며, 산출된 확률값을 검색어속성수치변환모듈(515)로 제공하는 단계;
    검색어속성수치변환모듈(515)에 의해 제공된 검색어에 대한 속성값을 저장하는 단계를 포함하는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법.
  7. 제 6항에 있어서,
    상기 속성유사도검색단계(S500)는,
    멀티미디어컨텐츠속성할당부(520)가 컨텐츠서버(560)로부터 멀티미디어 컨텐츠를 획득하여 저장하고, 저장된 멀티미디어 컨텐츠에 속성 정보를 할당하기 위한 멀티미디어컨텐츠속성할당단계(S520);
    유사도매칭성분석부(530)가 검색어의 언어적 속성 정보에 유사한 속성 정보를 포함하고 있는 멀티미디어 컨텐츠 요청 정보를 멀티미디어컨텐츠속성할당부(520)로 제공하고, 멀티미디어컨텐츠속성할당부(520)로부터 멀티미디어 컨텐츠 리스트 정보를 획득하며, 획득된 멀티미디어 컨텐츠 리스트 정보에 포함된 멀티미디어 컨텐츠들의 유사도 매칭 분석을 수행하기 위한 유사도매칭성분석단계(S530);
    유사도후보군추출부(540)가 사전에 설정된 후보군 숫자를 참조하여 가장 높은 유사도를 가지고 있는 멀티미디어 컨텐츠부터 순차적으로 후보군 숫자에 맞게 멀티미디어 컨텐츠를 추출하기 위한 유사도후보군추출단계(540);
    유사도기준멀티미디어컨텐츠정렬부(550)가 상기 후보군 숫자에 맞게 추출된 멀티미디어 컨텐츠들을 유사도에 따라 정렬시키며, 정렬된 멀티미디어 컨텐츠들을 속성유사도검색결과출력부(600)로 제공하기 위한 유사도기준멀티미디어컨텐츠정렬단계(S550);를 더 포함하는 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색 방법.

KR1020180028507A 2018-03-12 2018-03-12 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법 KR101873873B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180028507A KR101873873B1 (ko) 2018-03-12 2018-03-12 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
PCT/KR2018/002911 WO2019177182A1 (ko) 2018-03-12 2018-03-13 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180028507A KR101873873B1 (ko) 2018-03-12 2018-03-12 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법

Publications (1)

Publication Number Publication Date
KR101873873B1 true KR101873873B1 (ko) 2018-07-03

Family

ID=62918154

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180028507A KR101873873B1 (ko) 2018-03-12 2018-03-12 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법

Country Status (2)

Country Link
KR (1) KR101873873B1 (ko)
WO (1) WO2019177182A1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020009297A1 (ko) * 2018-07-05 2020-01-09 미디어젠 주식회사 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
KR20210098135A (ko) 2020-01-31 2021-08-10 주식회사 케이티 질의 데이터를 분석하는 질의 분석 장치, 방법 및 컴퓨터 프로그램
KR20210137643A (ko) * 2020-05-11 2021-11-18 네이버 주식회사 쇼핑 검색을 위한 상품 속성 추출 방법
KR20210137802A (ko) * 2020-05-11 2021-11-18 네이버 주식회사 쇼핑 검색을 위한 상품 카테고리 추출 방법
WO2022097909A1 (ko) * 2020-11-09 2022-05-12 한국과학기술원 비지도 기반 질의 생성 모델의 학습 방법 및 장치
WO2023074918A1 (ko) * 2021-10-25 2023-05-04 엘지전자 주식회사 디스플레이 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428120B (zh) * 2020-03-17 2023-06-20 北京字节跳动网络技术有限公司 一种信息确定方法、装置、电子设备及存储介质
CN112000822B (zh) * 2020-08-21 2024-05-14 北京达佳互联信息技术有限公司 多媒体资源排序方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100968858B1 (ko) * 2002-04-26 2010-07-09 한국전자통신연구원 사용자 검색 선호도 정보를 이용한 멀티미디어 컨텐츠의 내용 기반 검색 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100350787B1 (ko) * 1999-09-22 2002-08-28 엘지전자 주식회사 멀티미디어 객체의 사용자 프로파일 생성방법과 사용자 프로파일을 이용한 멀티미디어 검색 및 브라우징 방법
KR20000030847A (ko) * 2000-03-21 2000-06-05 전대식 인터넷 통합서비스 시스템 및 이 시스템에 접근하는 것을용이하게 하기 위한 사용자 인터페이스장치
KR100909470B1 (ko) * 2007-12-20 2009-07-28 주식회사 다음커뮤니케이션 멀티미디어 컨텐츠 검색 방법 및 시스템
KR100994725B1 (ko) * 2009-01-07 2010-11-16 포항공과대학교 산학협력단 사용자의 문맥을 바탕으로 개인화된 순위화 검색 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100968858B1 (ko) * 2002-04-26 2010-07-09 한국전자통신연구원 사용자 검색 선호도 정보를 이용한 멀티미디어 컨텐츠의 내용 기반 검색 방법 및 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020009297A1 (ko) * 2018-07-05 2020-01-09 미디어젠 주식회사 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
KR20210098135A (ko) 2020-01-31 2021-08-10 주식회사 케이티 질의 데이터를 분석하는 질의 분석 장치, 방법 및 컴퓨터 프로그램
KR20210137643A (ko) * 2020-05-11 2021-11-18 네이버 주식회사 쇼핑 검색을 위한 상품 속성 추출 방법
KR20210137802A (ko) * 2020-05-11 2021-11-18 네이버 주식회사 쇼핑 검색을 위한 상품 카테고리 추출 방법
KR102399837B1 (ko) * 2020-05-11 2022-05-19 네이버 주식회사 쇼핑 검색을 위한 상품 카테고리 추출 방법
KR102400995B1 (ko) * 2020-05-11 2022-05-24 네이버 주식회사 쇼핑 검색을 위한 상품 속성 추출 방법
WO2022097909A1 (ko) * 2020-11-09 2022-05-12 한국과학기술원 비지도 기반 질의 생성 모델의 학습 방법 및 장치
WO2023074918A1 (ko) * 2021-10-25 2023-05-04 엘지전자 주식회사 디스플레이 장치

Also Published As

Publication number Publication date
WO2019177182A1 (ko) 2019-09-19

Similar Documents

Publication Publication Date Title
KR101873873B1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
Bharti et al. Sarcastic sentiment detection in tweets streamed in real time: a big data approach
KR101192439B1 (ko) 디지털 콘텐츠 검색 장치 및 방법
CN109829104B (zh) 基于语义相似度的伪相关反馈模型信息检索方法及系统
KR101913191B1 (ko) 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
JP5638031B2 (ja) 格付け方法、検索結果分類方法、格付けシステム及び検索結果分類システム
US8090724B1 (en) Document analysis and multi-word term detector
KR101723862B1 (ko) 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치
CN105069103B (zh) App搜索引擎利用用户评论的方法及系统
JP7252914B2 (ja) 検索提案を提供する方法、装置、機器及び媒体
JP2003114906A (ja) ユーザ定義可能なパーソナリティを備えたメタ文書管理システム
Dumani et al. A framework for argument retrieval: Ranking argument clusters by frequency and specificity
CN101639857A (zh) 构建知识问答分享平台的方法、装置及系统
EP2307951A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
KR100378240B1 (ko) 엔트로피와 사용자 프로파일을 적용한 문서순위 조정방법
JP2006318398A (ja) ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体
Song et al. Semi-automatic construction of a named entity dictionary for entity-based sentiment analysis in social media
KR100945495B1 (ko) 다국어 전문용어 자원 제공 시스템 및 방법
JP2001290840A (ja) キーワード検索装置
WO1999014690A1 (fr) Procede d&#39;addition d&#39;un mot cle au moyen d&#39;informations de liaison
KR100643979B1 (ko) 인터넷을 이용한 정보검색 결과 제공방법
JP2009288870A (ja) 文書重要度算出システム、文書重要度算出方法およびプログラム
KR100836878B1 (ko) 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그방법
JP4853915B2 (ja) 検索システム
WO2020079752A1 (ja) 文献検索方法および文献検索システム

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant