KR20200098381A - 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체 - Google Patents

콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체 Download PDF

Info

Publication number
KR20200098381A
KR20200098381A KR1020190161887A KR20190161887A KR20200098381A KR 20200098381 A KR20200098381 A KR 20200098381A KR 1020190161887 A KR1020190161887 A KR 1020190161887A KR 20190161887 A KR20190161887 A KR 20190161887A KR 20200098381 A KR20200098381 A KR 20200098381A
Authority
KR
South Korea
Prior art keywords
content
information
keyword
search library
target
Prior art date
Application number
KR1020190161887A
Other languages
English (en)
Other versions
KR102345401B1 (ko
Inventor
찬 왕
쯔지에 쾅
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20200098381A publication Critical patent/KR20200098381A/ko
Application granted granted Critical
Publication of KR102345401B1 publication Critical patent/KR102345401B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7328Query by example, e.g. a complete video frame or video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/487Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/787Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시의 예시적인 실시예에 따르면, 콘텐츠를 검색하는 방법, 장치, 기기 및 컴퓨터 판독가능 저장 매체가 제공된다. 콘텐츠 검색 라이브러리를 구축하는 방법은, 처리할 콘텐츠의 식별 정보를 획득하는 단계 - 식별 정보는 복수의 정보 사항을 포함하고 매 정보 사항마다 콘텐츠의 일부에 연관됨-를 포함한다. 당해 방법은 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하는 단계를 더 포함한다. 당해 방법은 키워드를 콘텐츠의 적어도 일부에 관한 지시 정보에 연관되게 콘텐츠 검색 라이브러리에 저장하는 단계를 나아가 더 포함한다. 이러한 방식에 따르면, 사용자에 의한 수차례의 검색이 필요 없이 관심 갖는 콘텐츠에 관한 정보를 사용자한테 제공 가능하고 사용자가 관심 갖는 콘텐츠에 관한 기타의 콘텐츠를 살펴보기에 편리하다.

Description

콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체{methods and apparatuses for content retrieval, devices and storage media}
본 개시의 실시예는 주로 컴퓨터 분야에 관한 것으로, 더 구체적으로, 콘텐츠를 검색하는 방법, 장치, 기기 및 컴퓨터 판독가능 저장 매체에 관한 것이다.
비디오 수량이 증대되고 품질이 향상됨에 따라, 비디오에 대한 사람들의 검색 수요도 날따라 증가하고 있다. 여기서, 중요한 일 측면으로 비디오 중 클래식한 클립 또는 아주 핫한 클립에 대한 검색이 있다. 비디오 클립에 대한 사람들의 인지는 '견환
Figure pat00001
이 궁으로 귀환'과 같은 주변 사람들의 설명 또는 '소첩, 그리할 수 없나이다'와 같은 클래식한 대사에서 온 것일 수 있는바, 본 명세서에서는 이러한 설명 또는 클래식한 대사에 대하여 핫 워드(hot word)라고 지칭한다. 사용자는 핫 워드를 사용하여 비디오에서 핫 워드에 대응되는 클립을 검색하고 비디오에서의 당해 클립의 위치 및 전후 내용 등을 획득하기를 희망한다. 그러나 전통적인 비디오 검색 방식은 사용자로 하여금 핫 워드에 따라 대응되는 비디오 또는 비디오 클립으로 직접 포지셔닝되도록 할 수 없다.
본 개시의 예시적인 실시예에 따르면, 콘텐츠를 검색하는 방안이 제공된다.
본 개시의 제1 측면으로, 콘텐츠 검색 라이브러리를 구축하는 방법이 제공된다. 당해 방법은 처리할 콘텐츠의 식별 정보를 획득하는 단계를 포함하는바, 식별 정보는 복수의 정보 사항을 포함하고 매 정보 사항마다 콘텐츠의 일부에 연관된다. 당해 방법은 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하는 단계를 더 포함한다. 당해 방법은 키워드를 콘텐츠의 적어도 일부에 관한 지시 정보에 연관되게 콘텐츠 검색 라이브러리에 저장하는 단계를 나아가 더 포함한다.
본 개시의 제2 측면으로, 콘텐츠 검색 방법이 제공된다. 당해 방법은 콘텐츠의 목표 부분에 대한 조회 요청에 따라 검색어를 결정하는 단계를 포함한다. 당해 방법은 콘텐츠 검색 라이브러리에서 검색어에 매칭되는 키워드를 결정하는 단계를 더 포함하는바, 콘텐츠 검색 라이브러리는 적어도 키워드 및 키워드에 연관되게 저장된 목표 부분에 관한 지시 정보을 포함하고, 키워드는 목표 부분에 연관되는 정보 사항에 따라 결정되고 정보 사항은 콘텐츠의 식별 정보에 포함된다. 당해 방법은 콘텐츠 검색 라이브러리로부터 키워드에 연관되게 저장된 지시 정보를 획득하는 단계를 나아가 더 포함한다. 당해 방법은 지시 정보를 제공하여 목표 부분을 지시하는 단계를 나아가 더 포함한다.
본 개시의 제3 측면으로, 콘텐츠 검색 라이브러리를 구축하는 장치가 제공된다. 당해 장치는 처리할 콘텐츠의 식별 정보를 획득하도록 구성되는 식별 정보 획득 모듈을 포함하는바, 식별 정보는 복수의 정보 사항을 포함하고 매 정보 사항마다 콘텐츠의 일부에 연관된다. 당해 장치는 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하도록 구성되는 키워드 결정 모듈을 더 포함한다. 당해 장치는 키워드를 콘텐츠의 적어도 일부에 관한 지시 정보에 연관되게 콘텐츠 검색 라이브러리에 저장하도록 구성되는 키워드 저장 모듈을 나아가 더 포함한다.
본 개시의 제4 측면으로, 콘텐츠를 검색하는 장치가 제공된다. 당해 장치는 콘텐츠의 목표 부분에 대한 조회 요청에 따라 검색어를 결정하도록 구성되는 검색어 결정 모듈을 포함한다. 당해 장치는 콘텐츠 검색 라이브러리에서 검색어에 매칭되는 키워드를 결정하도록 구성되는 키워드 검색 모듈을 더 포함하는바, 콘텐츠 검색 라이브러리는 적어도 키워드 및 키워드에 연관되게 저장된 목표 부분에 관한 지시 정보를 포함하고 키워드는 목표 부분에 연관되는 정보 사항에 따라 결정되고 정보 사항은 콘텐츠의 식별 정보에 포함된다. 당해 장치는 콘텐츠 검색 라이브러리로부터 키워드에 연관되게 저장된 지시 정보를 획득하도록 구성되는 지시 정보 획득 모듈을 나아가 더 포함한다. 당해 장치는 지시 정보를 제공하여 목표 부분을 지시하도록 구성되는 지시 정보 제공 모듈을 나아가 더 포함한다.
본 개시의 제5 측면으로, 기기가 제공되는바, 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 저장 장치; 를 포함하고, 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의하여 실행되는 경우, 하나 또는 복수의 프로세서가 본 개시의 제1 측면에 따른 방법을 구현한다.
본 개시의 제6 측면으로, 기기가 제공되는바, 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하기 위한 저장 장치; 를 포함하고, 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의하여 실행되는 경우, 하나 또는 복수의 프로세서가 본 개시의 제2 측면에 따른 방법을 구현한다.
본 개시의 제7 측면으로, 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 저장 매체가 제공되는바, 당해 프로그램이 프로세서에 의하여 실행되는 경우, 본 개시의 제1 측면에 따른 방법을 구현한다.
본 개시의 제8 측면으로, 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 저장 매체가 제공되는바, 당해 프로그램이 프로세서에 의하여 실행되는 경우, 본 개시의 제2 측면에 따른 방법을 구현한다.
발명의 내용 부분에서 설명되는 내용은 본 개시의 실시예의 핵심적인 또는 중요한 특징을 한정하기 위한 것이 아니고 본 개시의 범위를 한정하기 위한 것도 아님을 이해하여야 한다. 본 개시의 기타 특징은 하기 설명으로 이해하기 수월해질 것이다.
첨부 도면에 결부하고 하기 상세한 설명을 참조하면 본 개시의 각 실시예의 상술한 및 기타의 특징, 이점 및 측면이 더욱 뚜렷해질 것이다. 첨부 도면에서, 동일한 또는 유사한 도면 부호는 동일한 또는 유사한 요소를 표시한다.
도1은 본 개시의 복수의 실시예가 구현될 수 있는 예시 환경의 개략도를 나타낸다.
도2는 본 개시의 일부 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 과정의 흐름도를 나타낸다.
도3은 본 개시의 일부 실시예에 따른 키워드를 결정하는 과정의 흐름도를 나타낸다.
도4는 본 개시의 일부 실시예에 따른 콘텐츠를 결정하는 적어도 일부를 도시하는 개략도를 나타낸다.
도5는 본 개시의 일부 실시예에 따른 콘텐츠 검색 과정의 흐름도를 나타낸다.
도6은 본 개시의 일부 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 장치의 예시적인 블록도를 나타낸다.
도7은 본 개시의 일부 실시예에 따른 콘텐츠를 검색하는 장치의 예시적인 블록도를 나타낸다.
도8은 본 개시의 복수의 실시예를 실시할 수 있는 컴퓨팅 기기의 블록도를 나타낸다.
하기 첨부 도면을 참조하여 본 개시의 실시예에 대하여 더 상세히 설명하고자 한다. 비록 첨부 도면에서 본 개시의 일부 실시예를 도시하였지만, 본 개시는 여러 가지 형식으로 구현 가능한 것으로, 이를 여기에 기술되는 실시예에 한정되는 것으로 해석하여서는 안되며, 반대로, 이러한 실시예를 제공하는 것은 더욱 투철하고 완전하게 본 개시를 이해하기 위한 것임을 이해하여야 한다. 본 개시의 첨부 도면 및 실시예는 예시적인 작용을 위한 것일 뿐, 본 개시의 보호 범위를 한정하기 위한 것이 아님을 이해하여야 한다.
본 개시의 실시예의 설명에서, 용어 '포함' 및 그 유사 용어는 개방형의 포함, 즉 '포함하나 이에 한정되지 않음'으로 이해되어야 한다. 용어 '에 따라 '는 '적어도 부분적으로 …에 따라'로 이해되어야 한다. 용어 '일 실시예' 또는 '당해 실시예'는 '적어도 하나의 실시예'로 이해되어야 한다. 용어 '제1', '제2' 등은 서로 다른 또는 같은 대상을 지칭할 수 있다. 하기 기타의 명시적인 또는 묵시적인 정의가 더 포함될 수 있다.
위에서 언급한 바와 같이, 사용자는 핫 워드를 사용하여 대응되는 비디오 또는 비디오 클립을 획득하기를 희망한다. 전통적으로는 두 가지 검색 방식이 있다. 일 방식은, 사용자가 직접 핫 워드를 서치(search)하는 것이다. 현재, 텍스트에 따른 비디오 서치는 주로 비디오의 타이틀에 따르는 것으로, 사용자가 관련 비디오의 핫 워드를 서치하는 경우, 제공되는 결과는 통상적으로 타이틀에 이러한 핫 워드가 포함되는 수동으로 편집된 비디오 클립이다. 이러한 방식은 수동에 의한 비디오 편집에 의존하므로 결과에 노이즈가 많게 된다. 이러한 방식으로 획득되는 비디오 클립에는 하기, 품질에 있어서 보증이 없고 해상도 분류가 없고 서투른 편집에 의한 것; 사용자가 당해 비디오에 관련되는 전, 후 회차로 편리하게 스킵할 수 없는 것; 사용자가 원본 비디오의 탄막(danmu)(彈幕)(동영상 댓글 자막, 영상 내에 글을 남기는 소통 방식) 및 코멘트 등 정보를 관람할 수 없는 것; 수동 편집자가 사용자가 필요로 하는 비디오 클립의 길이를 인지할 수 없어서 편집한 비디오 클립이 지나치게 짧아지게 되고 따라서 사용자가 그 전후 내용을 인지할 수 없게 되어 당해 비디오 클립의 근사한 정도를 제대로 느끼지 못할 수 있는 것; 또는 비디오 클립이 지나치게 길고 또한 사용자가 필요로 하는 시점을 표기되지 않아서 사용자가 필요로 하는 클립을 빠르게 찾아낼 수 없는 것과 같은 문제점이 존재하게 된다.
다른 방식에서, 사용자는 연속되는 수차례의 서치를 진행하여야 한다. 예를 들어, 사용자는 '위영낙(魏瓔珞)이 원명원(圓明園)에 간 것은 연희공략(延禧攻略)에서 어느 회차인가'를 서치하고 나서, 서치 결과에 따라 비디오 사이트에서 대응되는 회차를 찾아내어 대응되는 클립을 찾거나, 또는 사용자는 '위영낙(魏瓔珞)이 원명원(圓明園)에 간 것은 연희공략(延禧攻略) 54회에서 어느 시점인가'를 계속하여 서치하여야 한다. 이러한 방식은 결과 제공이 직접적이지 않다. 핫 워드에 대응되는 드라마 시리즈 및 시간 구간을 연속적으로 서치하는 이러한 해결 방식에 있어서, 사용자는 수차례의 검색을 진행하여야 한다. 또한, 서로 다른 버전의 비디오 소스에서 같은 클립이 위치하는 회차 및 시점은 서로 다를 수도 있는바, 따라서 사용자는 정확한 답을 획득하지 못할 수 있다.
현재의 비디오 사이트는 대부분이 탄막 기능을 오픈하였고 비디오를 본 네티즌들은 자발적으로 좋아하는 비디오 클립에 대한 설명을 기여한다. 여기서 핫한 비디오 클립에 대응되는 탄막양은 어마어마하다. 일부 클래식한 대사는 네티즌에 의하여 탄막에서 반복되기도 하는데 그 예로 '소첩, 그리할 수 없나이다'가 있고, 일부 네티즌은 클래식한 클립에 대하여 귀납하고 설명하기도 하는데 그 예로 '견환
Figure pat00002
이 궁으로 귀환'이 있다. 직접 대사를 사용하는데 비해, 대응되는 클립의 대사에는 나타난 적이 없는, 비디오에 대한 일부 귀납, 예를 들면 '견환
Figure pat00003
이 궁으로 귀환'이 탄막에 나타날 수 있다. 따라서, 예를 들면 탄막의 식별 정보를 이용하여 콘텐츠 검색 라이브러리를 구축함으로써 관심 갖는 콘텐츠, 예를 들면 비디오 또는 비디오 클립을 사용자한테 제공할 수 있다.
본 개시의 실시예에 따르면, 콘텐츠 검색 방안이 제공된다. 당해 방안에서, 콘텐츠의 서로 다른 부분에 연관되는 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드 및 관련되는 지시 정보를 결정함으로써 콘텐츠 검색 라이브러리를 구축한다. 콘텐츠를 검색하는 경우, 콘텐츠 검색 라이브러리에서 검색어에 매칭되는 키워드를 결정하고 사용자한테 키워드에 연관되게 저장된 콘텐츠 또는 콘텐츠의 일부에 관한 지시 정보를 제공한다. 이러한 방식에 따르면, 사용자에 의한 수차례의 검색이 필요 없이 빠르고 정확하게 관심 갖는 콘텐츠(예를 들면, 비디오 클립)에 관한 정보를 사용자한테 제공 가능하고 당해 방안은 사용자가 관심 갖는 콘텐츠에 관한 기타의 콘텐츠를 살펴보기에 편리하다. 따라서, 본 개시의 방안은 고효율적이고 사용자 경험이 향상되는 콘텐츠 검색을 유리하게 구현할 수 있다.
하기 첨부 도면을 참조하여 본 개시의 실시예를 구체적으로 설명하고자 한다.
도1은 본 개시의 복수의 실시예가 구현될 수 있는 예시 환경(100)의 개략도를 나타낸다. 예시 환경(100)에서, 컴퓨팅 기기(102)에 의하여 콘텐츠(103)의 식별 정보(130)에 따라 콘텐츠 검색 라이브러리(101)를 구축한다. 식별 정보(130)는 복수의 정보 사항(131-133)을 포함하고 각 정보 사항은 콘텐츠(103)의 일부에 연관된다.
콘텐츠(103)는 여러 가지 유형일 수 있고, 식별 정보(130)에는 여러 가지 형식이 적용 가능한 바, 이러한 형식은 단지 식별 정보(130)가 콘텐츠(103)의 서로 다른 부분에 연관되거나 대응되는 정보 사항을 포함하도록 할 수만 있으면 된다. 이러한 식별 정보는 비디오 또는 오디오의 클립에 시간적으로 연관되는 탄막, 라이브 방송 비디오에 대한 실시간 코멘트 또는 파일이나 전자책에 대한 주석이나 주해 등일 수 있다.
예를 들어, 콘텐츠(103)는 비디오일 수 있는바, 예를 들어 한 편의 영화, 한 편의 드라마의 한 회차 또는 여러 회차, 예능 프로의 한 회차 또는 여러 회차일 수 있고; 식별 정보(130)는 비디오의 탄막일 수 있는바, 각 정보 사항은 하나의 탄막일 수 있다. 콘텐츠(103)는 오디오일 수도 있는바, 예를 들어 한편의 만담일 수 있고; 식별 정보(130)는 청중으로부터의, 예를 들어 탄막과 유사한 코멘트 또는 피드백 정보일 수 있다. 일부 실시예에서, 비디오의 자막은 식별 정보로 사용될 수도 있는바, 예를 들어 탄막과 함께 사용될 수 있다. 콘텐츠(103)는 예를 들어 전자책과 같은 전자 파일일 수도 있고; 식별 정보(130)는 독자가 전자 파일의 서로 다른 단락에 대한 주석일 수도 있는바, 각 정보 사항은 하나의 주석이다.
컴퓨팅 기기(102)는 식별 정보(130) 및 기타 콘텐츠의 식별 정보에 따라 콘텐츠 검색 라이브러리(101)를 구축할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 식별 정보(130)에 따라 콘텐츠(130)의 적어도 일부에 대응되는 키워드(111) 및 당해 적어도 일부 콘텐츠에 관한 지시 정보(112)를 생성할 수 있다. 예를 들어, 키워드(111)는 어느 한 드라마의 클래식한 클립에 대응될 수 있다. 컴퓨팅 기기(102)는 기타 콘텐츠의 식별 정보에 따라 기타 키워드(113) 및 그에 관련되는 지시 정보(114)를 생성할 수 있다. 키워드(111, 113) 및 그에 관련되는 지시 정보(112, 114)는 각각 연관되게 콘텐츠 검색 라이브러리(101)에 저장된다. 비록 도1에는 2개의 키워드(111, 113)만 도시하였지만 이는 단지 예시적인 것으로, 콘텐츠 검색 라이브러리(101)에는 임의의 수량의 콘텐츠에 따라 생성되는 임의의 수량의 키워드 및 관련 정보가 포함될 수 있음을 이해하여야 한다. 또한, 서로 다른 키워드는 서로 다른 컴퓨팅 기기에 의하여 생성된 것일 수도 있다.
예시 환경(100)에서, 컴퓨팅 기기(102)에 의하여 콘텐츠 검색이 진행된다. 컴퓨팅 기기(102)는 사용자(104)로부터의, 목표 콘텐츠(예를 들어, 비디오 클립 하나)에 대한 조회 요청을 수신하고, 콘텐츠 검색 라이브러리(101)를 조회하여 조회 결과(105)를 제공한다. 조회 결과(105)는 예를 들어 지시 정보(112)를 포함할 수 있는바, 이로써 사용자(104)는 지시 정보(112)에 따라 목표 콘텐츠를 획득할 수 있는바, 예를 들면 사용자가 관심 갖는 비디오 또는 비디오 클립을 획득할 수 있다.
도1의 예시 환경(100)에서, 컴퓨팅 기기(102)에 의하여 콘텐츠 검색 라이브러리(101)를 구축하고 콘텐츠 검색 라이브러리(101)를 조회한다. 이는 단지 예시적인 것으로, 콘텐츠 검색 라이브러리(102)의 구축과 조회는 서로 다른 컴퓨팅 기기에 의하여 수행될 수도 있음을 이해하여야 한다. 컴퓨팅 기기(102)는 고정식 컴퓨팅 기기, 예를 들면 서버일 수도 있고 휴대용 컴퓨팅 기기, 예를 들면 휴대전화, 태블릿 컴퓨터 등일 수도 있음을 또한 이해하여야 한다.
본 개시의 실시예에 의하여 제공되는 콘텐츠 검색 방안을 더 명확하게 이해하기 위하여, 우선 도2를 참조하여 본 개시의 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 방법에 대하여 설명하고자 한다. 도2는 본 개시의 일부 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 과정(200)의 흐름도를 나타낸다. 과정(200)은 도1의 컴퓨팅 기기(102)에 의하여 구현될 수 있다. 토론의 편의를 위하여, 도1에 결부하여 과정(200)를 설명하도록 한다.
단계210에서, 컴퓨팅 기기(102)는 처리할 콘텐츠(103)의 식별 정보(130)를 획득한다. 식별 정보(130)는 복수의 정보 사항(131-133)을 포함하고, 각 정보 사항은 콘텐츠(103)의 일부에 연관된다. 예를 들어, 컴퓨팅 기기(102)는 어느 한 편의 드라마의 한 회차의 비디오를 콘텐츠(103)로 획득할 수 있다. 이러한 경우, 식별 정보(130)는 당해 비디오의 탄막일 수 있고, 정보 사항(131-133)은 각각 당해 비디오의 서로 다른 시간 구간에 나타나는 개별 탄막일 수 있다. 비디오의 탄막은 비디오 사이트의 메타데이터로부터 직접 획득되는 것일 수도 있고 비디오 화면에 대한 인식을 통하여 획득되는 것일 수도 있는바, 본 개시의 범위는 이러한 측면에 있어서 한정받지 않는다. 식별 정보(130)는 비디오의 자막, 예를 들어 드라마의 대사 또는 다큐멘터리의 내레이션을 더 포함할 수 있다.
단계220에서, 컴퓨팅 기기(102)는 식별 정보(130)에 따라 콘텐츠(103)의 적어도 일부에 대응되는 키워드(111)를 결정한다. 예를 들면, 컴퓨팅 기기(102)는 비디오의 탄막에 따라 당해 비디오 중의 어느 한 클립에 대응되는 키워드(111)를 생성할 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 콘텐츠(103)의 각 부분에 대하여 당해 부분에 연관되는 각 정보 사항에 따라 당해 부분에 대응되는 키워드를 생성할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 비디오를 소정의 시간 길이(예를 들면 5분)에 따라 복수의 클립으로 분할하고 각 클립 기간에 나타나는 탄막에 따라 키워드를 생성할 수 있다. 예를 들면, 노이즈가 제거된(하기 설명 참조) 탄막을 키워드로 사용할 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 우선 식별 정보(130)에 따라 콘텐츠(103)의 일부 또는 복수의 부분를 결정한 후, 결정된 부분에 연관되는 정보 사항을 이용하여 키워드를 생성할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 우선 탄막의 수량에 따라 비디오의 클립을 결정한 후, 당해 비디오 클립에 나타나는 탄막을 이용하여 키워드를 생성할 수 있다. 탄막의 빈도는 탄막에 있어서 내추럴한 핫한 정도로 간주될 수 있다. 예를 들면 '소첩, 그리할 수 없나이다'는 대응되는 비디오 클립의 대사에서 한 회만 나타나지만 탄막에서는 나타나는 횟수가 매우 많다. 때문에, 이러한 예시에서는, 생성되는 키워드가 통상적으로 비디오의 아주 핫한 클립 또는 클래식한 클립에 대한 것으로, 사용자의 검색 수요를 더욱 쉽게 충족시킬 수 있다.
하기에서 도3과 도4를 참조하여 이러한 실시예를 설명하고자 한다. 도3은 본 개시의 일부 실시예에 따른 키워드를 결정하는 과정(300)의 흐름도를 나타낸다. 과정(300)은 도2의 단계220에 대한 구현으로 간주될 수 있다.
단계310에서, 컴퓨팅 기기(102)는 복수의 정보 사항(131-133) 중 콘텐츠(103)의 적어도 일부에 연관되는 목표 정보 사항의 제1 수량을 결정한다. 단계320에서, 컴퓨팅 기기(102)는 제1 수량이 소정 조건을 충족하는지 여부를 결정한다. 이러한 소정 조건은 제1 수량이 제1 역치 수량을 초과하는 것; 및 복수의 정보 사항의 전체 수량 대비 제1 수량의 비율 값이 역치 비율 값을 초과하는 것; 중 적어도 하나를 포함할 수 있다. 콘텐츠(103)에서 소정 조건을 충족하는 하나 또는 복수의 부분은 처리할 부분으로 간주될 수 있다.
하기, 비디오를 콘텐츠(103)로 하는 예시로서, 탄막을 식별 정보(130)로 하는 예시로써 상기 과정을 상세히 설명하도록 한다. 도4는 본 개시의 일부 실시예에 따른 콘텐츠를 결정하는 적어도 일부를 도시하는 개략도(400)를 나타낸다. 컴퓨팅 기기(102)는 탄막이 비디오 시간축에서의 분포(402)에 따라 탄막이 폭발하는 비디오 클립(401)을 처리할 부분으로 결정할 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 보다 큰 입도(예를 들면 5분)로 비디오를 복수의 클립으로 분할한 후 각 클립의 탄막 수량을 계산할 수 있다. 예를 들어, 비디오 클립(401)의 탄막 수량이 미리 결정되는 역치 수량을 초과하는 경우, 비디오 클립(401)을 처리할 부분으로 간주할 수 있다. 당해 예시에서, 비디오 클립(401)의 탄막 수량은 제1 수량으로 간주될 수 있고, 미리 결정되는 역치 수량은 제1 역치 수량으로 간주될 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 더 작은 입도로 비디오를 분할할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 비디오를 길이가 10초인 복수의 클립으로 분할하고, 길이가 10초인 각 클립의 탄막 수량을 계산하고 탄막 수량이 소정 조건을 충족하는 하나의 클립 또는 복수의 연속되는 클립을 처리할 부분(예를 들면 비디오 클립(401))으로 할 수 있다. 이러한 경우, 처리할 비디오 클립(401)은 길이가 10초인 복수의 연속되는 클립을 포함할 수 있다. 이러한 실시예에서는, 더 작은 입도로 비디오를 분할함으로써 비디오의 아주 핫한 클립 또는 클래식한 클립을 더욱 정확하게 찾아낼 수 있게 된다.
분할된 비디오 클립 중의 탄막의 절대 수량 및/또는 상대 수량에 따라 소정 조건을 한정할 수 있다. 예를 들어, 소정 조건은 분할된(예를 들어 길이가 10초인) 비디오 클립 중의 탄막 수량이 제1 역치 수량을 초과하는 것 또는 당해 비디오 중의 모든 탄막의 수량(또는 중위수) 대비 분할된 비디오 클립 중의 탄막 수량의 비율 값이 역치 비율 값을 초과하는 것을 포함할 수 있다. 제1 역치 수량 및 역치 비율 값은 분할된 비디오 클립의 길이에 따라 변화될 수 있다. 예를 들어, 분할된 비디오 클립의 길이가 5분인 경우의 제1 역치 수량은 분할된 비디오 클립의 길이가 10초인 경우의 제1 역치 수량보다 클 수 있다.
일 예시에서, 하기와 같이 i) 분할된 비디오 클립 중의 탄막 수량이 역치X를 초과하는 것; ii) 분할된 비디오 클립 중의 탄막 수량 및 모든 비디오 클립 중의 탄막 수량의 중위수가 Y를 초과하거나 같은 것; 두가지 조건에 대하여 정의할 수 있다. 조건i)는 선별되는 비디오 클립(처리할 부분)의 절대적으로 핫한 정도를 확보하고, 조건ii)는 선별되는 클립이 현재 비디오 중에서 상대적으로 아주 핫한 클립임을 확보한다. X와 Y의 구체적인 수치는 여러 가지 요소에 따라 선택될 수 있다. 예를 들어, 재현률을 향상시키고자 하는 것이면 X와 Y를 감소시킬 수 있고; 재현 품질을 향상시키고자 하는 것이면 X와 Y를 증대시킬 수 있다. 또한, X와 Y의 구체적인 수치는 콘텐츠(103)의 구체적인 유형에 의존될 수 있는바, 예를 들면 서로 다른 유형의 비디오, 예를 들어, 예술 영화, 상업 영화에 따라 변화된다.
비록 도4에서 하나의 비디오 클립(401)만을 도시하였지만 하나의 비디오으로부터 소정 조건을 충족하는 복수의 비디오 클립을 결정할 수 있다. 또한, 위에서 한정하는 소정 조건은 단지 예시적인 것으로, 정보 사항의 절대 수량 및/또는 상대 수량에 따른 기타 조건이 고려될 수도 있음을 이해하여야 한다.
계속하여 도3을 참조하면, 단계320에서 제1 수량이 소정 조건을 충족한다는 것이 결정되는 경우, 컴퓨팅 기기(102)는 이어서 목표 정보 사항에 따라 키워드를 결정할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 비디오 클립(401)의 탄막에 따라 키워드(본 명세서에서는 핫 워드로 지칭될 수도 있음)를 결정할 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 목표 정보 사항을 처리함으로써, 예를 들면, 노이즈를 제거할 수 있다. 그러면 과정(300)은 단계330으로 진행될 수 있다. 단계330에서, 컴퓨팅 기기(102)는 목표 정보 사항을 처리함으로써 적어도 하나의 후보 단어를 획득할 수 있다. 이러한 처리는 목표 정보 사항에 대하여, 목표 정보 사항에서 소정 문자에 매칭되는 단어를 제거하는 것, 목표 정보 사항에서 글자 수가 역치 글자 수보다 적은 목표 정보 사항을 제거하는 것, 상기 목표 정보 사항에서 문장 부호를 제거하는 것 및 목표 정보 사항에서 소정 카테고리의 단어(예를 들면 어조사)를 제거하는 것, 중 적어도 하나를 수행하는 것을 포함할 수 있다.
여전히 비디오과 탄막을 예로 들어 설명하면, 도4 중의 비디오 클립(401)의 탄막은 목표 정보 사항으로 간주될 수 있다. 컴퓨팅 기기(102)는 비디오 클립(401)의 탄막에 대해 노이즈 제거 처리를 수행할 수 있다. 예를 들면, 소정 문자에 매칭되는 단어, 예를 들어 '하이 에너지 사전 경고(高能預警)(네티즌 신조어로, 바야흐로 나타나게 될 자극적인 화면에 대한 경고어로 사용됨)', '666'을 제거할 수 있다. 이러한 단어는 단독적인 탄막일 수도 있고 탄막에 포함될 수도 있다. 이러한 단어는 서로 다른 비디오에 중복하여 나타날 수 있으나, 어느 한 비디오 클립을 차별적으로 식별링하는데 사용될 수 없다. 길이가 지나치게 짧은 탄막, 예를 들어 글자 수가 역치 글자 수보다 적은 탄막을 제거할 수도 있다. 이러한 탄막도 차별성을 구비하지 않는다. 소정 카테고리의 단어, 예를 들어 '…ㄹ 수가', '세상에'와 같은 어조사를 제거할 수도 있는바, 이로써 획득되는 후보 단어(즉, 노이즈가 제거된 탄막)가 평서문의 표현 방식에 더 부합되도록 하고, 검색어와 더 유사하게 할 수 있다. 또한, 탄막 중의 문장 부호를 제거할 수도 있다.
본 명세서에서, 정보 사항에 대하여 위의 처리 중 하나 또는 복수를 수행한 후 획득하게 되는 단어 또는 문구를 후보 단어, 예를 들어 '강희(康熙)가 오배(鰲拜)를 지혜롭게 잡다'로 지칭한다. 단계330에서 하나의 후보 단어만 획득되는 경우, 당해 후보 단어를 키워드로 사용할 수 있다.
탄막의 식별 정보 등은 통상적으로 보다 높은 중복성을 갖게 되므로 단계330에서 복수의 후보 단어가 획득되는 경우, 이러한 후보 단어에 대하여 나아가 더 처리를 수행할 수 있는바, 즉, 이러한 경우, 과정(300)은 단계340으로 진행될 수 있다.
단계340에서, 컴퓨팅 기기(102)는 복수의 후보 단어 중 동일하거나 의미가 관련되는 후보 단어의 제2 수량을 결정(하기에서 단어 빈도로 지칭될 수도 있음)할 수 있다. 여기서 복수의 후보 단어는 처리할 부분에 대응되는 정보 사항(예를 들면 비디오 클립(401)의 탄막)에 따라 결정되고, 따라서 제2 수량 또는 단어 빈도는 처리할 부분(비디오 클립(401))에 대한 통계 결과인 것이다.
일부 실시예에서, 컴퓨팅 기기(102)는 복수의 후보 단어 중 같은 후보 단어의 단어 빈도를 간단히 결정할 수 있다. 예를 들어, 이러한 후보 단어 중 합 10개의 후보 단어가 '강희(康熙)가 오배(鰲拜)를 지혜롭게 잡다'인 경우, 후보 단어 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'의 단어 빈도를 10으로 결정할 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 복수의 후보 단어 중 의미가 관련되는 후보 단어의 수량을 결정할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 노이즈가 제거된 탄막(즉, 후보 단어)를 의미적 유사성에 따라 클러스터링할 수 있다. 예를 들어, 후보 단어 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다', '강희(康熙)가 오배(鰲拜)를 잡다', '강희(康熙)가 오배(鰲拜)를 붙잡다' 등은 동일한 카테고리로 클러스터링될 수 있다. 이러한 경우, 하나의 시간 구간에서의 탄막의 단어 빈도는 당해 탄막이 소속되는 카테고리의 모든 탄막이 당해 시간 구간에서 나타나는 횟수의 합으로 정의된다.
단계350에서, 컴퓨팅 기기(102)는 단계340에서 결정되는 제2 수량(즉, 단어 빈도)이 제2 역치 수량을 초과하는지 여부, 예를 들면 단어 빈도 역치를 초과하는 여부를 결정한다. 여기서 제2 역치 수량 또는 단어 빈도 역치는 고정 값일 수도 있고, 컴퓨팅 기기(102)에 의하여 처리할 부분의 크기(예를 들면 비디오 클립(401)의 시간 길이)에 따라 결정될 수도 있다. 제2 수량이 제2 역치 수량을 초과하는 경우, 과정(300)은 단계360으로 진행된다. 단계360에서, 컴퓨팅 기기(102)는 동일하거나 의미가 관련되는 후보 단어에 따라 키워드를 결정할 수 있다. 예를 들어, 가령 단어 빈도 역치가 8이고 후보 단어 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'의 단어 빈도가 10이면 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다' 또는 그 유사한 문구를 키워드로 결정할 수 있다.
이러한 실시예에서는, 단어 빈도에 따라 탄막의 식별 정보 등을 선별하고 나아가 키워드를 결정하는바, 핫하지 않은 단어나 문구를 효과적으로 필터링할 수 있다. 이러한 방식으로 획득되는 키워드 및 그 관련 정보는 핫한 콘텐츠(예를 들면 핫한 비디오 클립)에 대한 사용자의 검색 수요를 더욱 잘 충족시킬 수 있다.
상술한 과정으로, 컴퓨팅 기기(102)는 키워드, 단어 빈도, 상기 콘텐츠 및 위치하는 부분 등 정보를 획득할 수 있다. 예를 들어, 상술한 비디오 및 탄막에 대한 예시에서, 컴퓨팅 기기(102)는 4-튜플인 (키워드, 단어 빈도, 소속 비디오, 소속 비디오에서의 시간 구간)을 획득할 수 있다. 콘텐츠(103)가 전자책이고 식별 정보(130)가 전자책에 대한 독자의 주석인 경우, 컴퓨팅 기기(102)가 획득할 수 있는 정보는 키워드, 단어 빈도, 소속 전자책, 전자책에서의 쪽 번호 또는 단락 등과 같은 정보이다. 또한, 콘텐츠(103)의 같은 부분(예를 들면 비디오 클립(401))에 대하여 복수의 키워드가 결정될 수 있고, 나아가 복수의 이러한 4-튜플이 획득될 수 있음을 이해하여야 한다.
도3에 도시한 과정(300)은 단계220의 일 예시의 구현이다. 일부 실시예에서는, 도3에 도시한 단계310 내지 360 중 일부가 생략될 수 있다.
계속하여 도2를 참조하도록 한다. 단계230에서, 컴퓨팅 기기(102)는 키워드(111)를 콘텐츠(103)의 적어도 일부에 관한 지시 정보(112)에 연관되게 콘텐츠 검색 라이브러리(101)에 저장한다. 예를 들어, 컴퓨팅 기기(102)는 콘텐츠 검색 라이브러리(101)에 상술한 4-튜플을 저장할 수 있다.
지시 정보(112)는 여러 가지 형식이 적용 가능하다. 예를 들어, 지시 정보(112)는 콘텐츠(103)를 획득하기 위한 적어도 일부의 링크를 포함할 수 있다. 상술한 비디오의 예시에 있어서, 지시 정보(112)는 당해 비디오의 URL 링크를 포함할 수 있다. 지시 정보(112)는 콘텐츠(103)에서의 적어도 일부의 상대적 위치를 지시하는 위치 정보를 더 포함할 수 있다. 예를 들어, 지시 정보(112)는 비디오 클립(401)이 비디오의 어느 시간 구간인지(예를 들면 8분부터 12분까지)를 포함할 수 있다. 콘텐츠(103)가 전자책인 예시에 있어서, 지시 정보(112)는 결정된 키워드에 대응되는 부분이 당해 전자책에서 위치하는 단락 등을 포함할 수 있다. 지시 정보(112)는 결정된 키워드에 대응되는 부분이 콘텐츠(103)에 포함됨을 지시하는 문자 정보를 더 포함할 수 있다. 예를 들어, 이러한 지시 정보(112)는 '검색한 콘텐츠는 드라마 「연희공략(延禧攻略)」 54회에서 8분부터 12분까지에 위치한다'와 같은 문자 정보를 포함할 수 있다. 지시 정보(112)는 상술한 한 형식으로, 또는 여러 형식의 조합으로 저장되어 후속되는 검색에 제공될 수 있다.
일부 실시예에서, 컴퓨팅 기기(102)는 콘텐츠(103)의 적어도 일부(예를 들면 비디오 클립(401))에 연관되는 추가 정보를 생성하고 추가 정보를 키워드(111)에 연관되게 콘텐츠 검색 라이브러리(101)에 저장할 수 있다. 컴퓨팅 기기(102)는 하기, 콘텐츠(103)의 관람, 클릭 또는 다운로드 횟수, 콘텐츠(103)의 코멘트 수량, 콘텐츠(103)의 평점, 키워드가 적어도 일부에 연관되는 정보 사항에 나타나는 횟수(즉, 단어 빈도) 중 하나 또는 복수를 획득하고, 획득된 정보에 따라 추가 정보를 생성할 수 있는바, 이러한 추가 정보는 핫한 정도의 종합 득점으로 지칭될 수도 있다. 일부 실시예에서, 컴퓨팅 기기(102)는 비디오 중의 인물 수량과 소리 볼륨 등을 나아가 더 인식함으로써 핫한 정도의 종합 득점을 결정할 수 있다.
예를 들어, 컴퓨팅 기기(102)는 비디오의 관람, 클릭 또는 다운로드 횟수, 비디오 사이트에서 당해 비디오의 코멘트 수량 및 당해 비디오에 대응되는 드라마 시리즈(예를 들면 드라마)의 떠우반(Douban) 평점, 바이두(Baidu) 평점 등을 획득할 수 있다. 그리고 컴퓨팅 기기(102)는 이러한 정보 중의 하나 또는 복수를 키워드의 빈도에 대하여 가중평균하여 핫한 정도의 종합 득점을 획득하고 이를 추가 정보로 하여 키워드(111)에 연관되게 콘텐츠 검색 라이브러리(101)에 저장할 수 있다. 예를 들어, 획득되는4-튜플인 (키워드, 소속 비디오, 소속 비디오에서의 시간 구간, 핫한 정도의 종합 득점)을 콘텐츠 검색 라이브러리(101)에 저장할 수 있다. (키워드, 단어 빈도, 소속 비디오, 소속 비디오에서의 시간 구간, 핫한 정도의 종합 득점)을 콘텐츠 검색 라이브러리(101)에 저장할 수도 있다.
위에서는 본 개시의 일부 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 과정(200)을 설명하였다. 이러한 방식에 따르면, 콘텐츠의 서로 다른 부분에 연관되는 식별 정보에 따라 콘텐츠 검색 라이브러리를 구축할 수 있는바, 예를 들면, 핫한 비디오 또는 비디오 클립에 대한 콘텐츠 검색 라이브러리를 구축할 수 있다. 이러한 콘텐츠 검색 라이브러리는 사용자로 하여금 수차례의 검색 없이 관심 갖는 콘텐츠에 직접 액세스 가능하도록 할 수 있다.
도5는 본 개시의 일부 실시예에 따른 콘텐츠 검색 과정(500)의 흐름도를 나타낸다. 과정(500)은 도1의 컴퓨팅 기기(102)에 의하여 구현될 수 있다. 토론의 편의를 위하여, 도1을 결부하여 과정(500)을 설명하도록 한다. 과정(500)은 컴퓨팅 기기(102)와 다른 컴퓨팅 기기에 의하여 구현될 수도 있음을 이해하여야 한다.
단계510에서, 컴퓨팅 기기(102)는 콘텐츠(103)의 목표 부분(예를 들면 비디오 클립)에 대한 조회 요청(예를 들면 사용자(104)로부터의)에 따라 검색어를 결정한다. 예를 들면, 사용자(104)로부터의 조회 요청은 '강희(康熙)가 오배(鰲拜)를 잡은 것은 「녹정기(鹿鼎記)」의 어느 회차인가', '녹정기(鹿鼎記), 강희(康熙)가 오배(鰲拜)를 잡다' 등일 수 있는바, 이때 컴퓨팅 기기(102)는 이러한 조회 요청에 따라 검색어를 예를 들어 '강희(康熙)가 오배(鰲拜)를 잡다'로 결정할 수 있다. 조회 요청은 예를 들어 '강희(康熙)가 오배(鰲拜)를 잡다'만 포함할 수도 있는바, 이러한 경우, 컴퓨팅 기기(102)는 직접 '강희(康熙)가 오배(鰲拜)를 잡다'를 검색어로 사용할 수 있다.
단계520에서, 컴퓨팅 기기(102)는 콘텐츠 검색 라이브러리(101)에서 검색어에 매칭되는 키워드를 결정한다. 콘텐츠 검색 라이브러리(101)는 위의 도2 내지 도4를 참조하여 설명되는 방안을 이용하여 구축되는 것일 수 있다. 검색어와 키워드가 매칭된다는 것은 양자가 동일하거나, 의미가 관련되거나 또는 유사한 것을 포함할 수 있다. 콘텐츠 검색 라이브러리(101)는 적어도 키워드(111) 및 키워드(111)에 연관되게 저장된 목표 부분에 관한 지시 정보(112)를 포함한다. 키워드(111)는 목표 부분에 연관되는 정보 사항(예를 들어, 비디오의 탄막)에 따라 결정되고 정보 사항은 콘텐츠(103)의 식별 정보(130)에 포함된다. 예를 들어, 컴퓨팅 기기(102)는 콘텐츠 검색 라이브러리(101)에서 키워드 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'가 검색어 '강희(康熙)가 오배(鰲拜)를 잡다'와 매칭된다는 것을 결정할 수 있다.
단계530에서, 컴퓨팅 기기(102)는 콘텐츠 검색 라이브러리(101)로부터 키워드(111)연관되게 저장된 지시 정보(112)를 획득한다. 예를 들면, 컴퓨팅 기기(102)는 콘텐츠 검색 라이브러리(101)로부터 키워드 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'에 연관되게 저장된 지시 정보, 예를 들어 소속 비디오의 URL 링크 및/또는 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'의 관련 줄거리가 비디오에서 어느 시간 구간인지를 획득할 수 있다.
단계540에서, 컴퓨팅 기기(102)는 지시 정보(112)(예를 들어, 사용자(104)한테)를 제공하여 목표 부분을 지시한다. 지시 정보를 제공하는 단계는 목표 부분의 링크를 제공; 위치 정보를 제공하여 콘텐츠(103)에서의 목표 부분의 상대적 위치를 지시하는 단계; 및 텍스트 정보를 제공하여 목표 부분이 콘텐츠(103)에 포함됨을 지시하는 단계, 중 적어도 하나를 포함할 수 있다.
컴퓨팅 기기(102)는 문자 정보, 예를 들어 '당신이 관심 갖는 콘텐츠는 드라마 「녹정기(鹿鼎記)」 18회의 20분에서 28까지에 위치한다'를 제공할 수 있다. 컴퓨팅 기기(102)는 드라마 「녹정기(鹿鼎記)」에서 줄거리 '강희(康熙)가 지혜롭게 오배(鰲拜)를 잡다'를 포함하는 드라마 회차(예를 들면 18회)의 링크를 더 제공할 수 있고, 동시에 당해 비디오에서 당해 줄거리가 위치하는 시간 구간, 예를 들면 20분에서 28분까지를 제공할 수 있다. 이러한 경우, 사용자(104)는 관심 갖는 비디오 클립에 대응되는 시간 노드와 비디오의 링크를 직접 획득할 수 있으므로, 링크를 클릭하고 대응되는 시점에 포지셔닝함으로써, 관심 갖는 클립을 편리하게 관람할 수 있다. 또한, 사용자(104)는 관심 갖는 클립에 연관되는 전, 후 줄거리를 편리하게 관람할 수도 있다.
이러한 지시 정보는 콘텐츠 검색 라이브러리(101)를 구축하는 과정에 생성되어, 대응되는 키워드에 연관되게 콘텐츠 검색 라이브러리(101)에 저장될 수 있음을 이해하여야 한다.
콘텐츠 검색 라이브러리(101)에는 키워드(111)에 연관되는 추가 정보, 예를 들어 핫한 정도의 종합 득점을 더 저장할 수 있다. 위에서 콘텐츠 검색 라이브러리(101)의 구축에 대하여 언급한 바를 참조하면, 이러한 추가 정보는 하기, 키워드(111)가 목표 부분에 연관되는 정보 사항에 나타나는 횟수(예를 들어, 키워드의 단어 빈도); 콘텐츠(103)의 관람, 클릭 또는 다운로드 횟수; 콘텐츠(103)의 코멘트 수량; 및 콘텐츠(103)의 평점, 중 적어도 하나에 따라 생성될 수 있다.
컴퓨팅 기기(102)는 결정된 키워드에 따라 콘텐츠 검색 라이브러리(101)로부터 키워드에 연관되게 저장된 추가 정보를 획득할 수 있는바, 예를 들면 핫한 정도의 종합 득점을 획득할 수 있다. 일부 실시예에서, 컴퓨팅 기기(102)는 예를 들어 사용자(104)한테 추가 정보를 제공할 수 있는바, 예를 들면 핫한 정도의 종합 득점을 제공함으로써 사용자(104)로 하여금 콘텐츠 검색 결과 중의 각 콘텐츠 사항(예를 들어, 각 비디오)의 핫한 정도 상황을 인지 가능하도록 하여 사용자(104)를 도와서 어느 콘텐츠 사항을 클릭할 가에 대한 결정을 내리도록 한다.
일부 실시예에서, 컴퓨팅 기기(102)는 추가 정보에 따라 조회 결과(105)에서 지시 정보(112)를 제공할 수 있다. 예를 들어, 컴퓨팅 기기(102)는 단계520에서, 검색어에 매칭되는 복수의 키워드 또는 콘텐츠 검색 라이브러리(101) 중의 복수의 항목을 결정할 수 있다. 이러한 경우, 컴퓨팅 기기(102)는 추가 정보에 따라 복수의 키워드에 연관되는 복수의 지시 정보가 조회 결과(105)에 나타나는 순서를 결정할 수 있다. 예를 들면, 컴퓨팅 기기(102)는 획득한 키워드에 대하여 핫한 정도의 종합 득점 랭킹에 따라 top N의 결과를 제공할 수 있는바, 예컨대 키워드, 시간 구간, 소속 비디오 등을 제공할 수 있다.
위에서는 본 개시의 일부 실시예에 따른 콘텐츠 검색 과정(500)을 제공한다. 이러한 방식에 따르면, 사용자는 관심 갖는 비디오의 링크(예를 들면 URL)를 클릭하여 관련 비디오 페이지로 진입하고, 시간 구간에 따라 관람하고자 하는 시간 클립으로 고정할 수 있다. 핫한 정도의 종합 득점에 따라 top N 결과를 제공하는 것은 비디오의 품질을 보장할 수 있고, 사용자가 탄막과 코멘트 및 전, 후 줄거리를 관람하기에 편리하다.
도6은 본 개시의 일부 실시예에 따른 콘텐츠 검색 라이브러리를 구축하는 장치(600)의 예시적인 블록도를 나타낸다. 장치(600)는 도1의 컴퓨팅 기기(102)에 포함되거나 또는 컴퓨팅 기기(102)로 구현될 수 있다. 도6에 도시한 바와 같이, 장치(600)는 처리할 콘텐츠의 식별 정보를 획득하도록 구성되는 식별 정보 획득 모듈(610)을 포함하는바, 식별 정보는 복수의 정보 사항을 포함하고 매 정보 사항마다 콘텐츠의 일부에 연관된다. 장치(600)는 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하도록 구성되는 키워드 결정 모듈(620)을 더 포함한다. 장치(600)는 키워드를 콘텐츠의 적어도 일부에 관한 지시 정보에 연관되게 콘텐츠 검색 라이브러리에 저장하도록 구성되는 키워드 저장 모듈(630)을 나아가 더 포함한다.
일부 실시예에서, 키워드 결정 모듈(620)은 복수의 정보 사항 중 콘텐츠의 적어도 일부에 연관되는 목표 정보 사항의 제1 수량을 결정하도록 구성되는 제1 수량 결정 모듈; 및 하기, 제1 수량이 제1 역치 수량을 초과하는 것; 및 복수의 정보 사항의 전체 수량 대비 제1 수량의 비율 값이 역치 비율 값을 초과하는 것; 중 적어도 하나에 응답하여 목표 정보 사항에 따라 키워드를 결정하도록 구성되는 정보 사항 이용 모듈; 을 포함한다.
일부 실시예에서, 정보 사항 이용 모듈은, 목표 정보 사항에 대하여 목표 정보 사항에서 소정 문자에 매칭되는 단어를 제거하는 것, 목표 정보 사항에서 글자 수가 역치 글자 수보다 적은 목표 정보 사항을 제거하는 것, 목표 정보 사항에서 문장 부호를 제거하는 것, 및 목표 정보 사항에서 소정 카테고리의 단어를 제거하는 것, 중 적어도 하나를 수행하여 적어도 하나의 후보 단어를 획득하도록 구성되는 후보 단어 획득 모듈; 및 적어도 하나의 후보 단어에 따라 키워드를 결정하도록 구성되는 후보 단어 이용 모듈; 을 포함한다.
일부 실시예에서, 적어도 하나의 후보 단어는 복수의 후보 단어를 포함하고, 후보 단어 이용 모듈은, 복수의 후보 단어 중 동일하거나 의미가 관련되는 후보 단어의 제2 수량을 결정하도록 구성되는 제2 수량 결정 모듈; 및 제2 수량이 제2 역치 수량을 초과하는 것에 응답하여 동일하거나 의미가 관련되는 후보 단어에 따라 키워드를 결정하도록 구성되는 키워드 추출 모듈; 을 포함한다.
일부 실시예에서, 장치(600)는 키워드가 적어도 일부에 연관되는 정보 사항에 나타나는 횟수, 콘텐츠의 관람, 클릭 또는 다운로드 횟수, 콘텐츠의 코멘트 수량 및 콘텐츠의 평점, 중 적어도 하나에 따라 콘텐츠의 적어도 일부에 연관되는 추가 정보를 생성하도록 구성되는 추가 정보 결정 모듈; 및 추가 정보를 키워드에 연관되게 콘텐츠 검색 라이브러리에 저장하도록 구성되는 추가 정보 저장 모듈; 을 더 포함한다.
일부 실시예에서, 지시 정보는 콘텐츠의 적어도 일부를 획득하기 위한 링크, 콘텐츠에서의 적어도 일부의 상대적 위치를 지시하는 위치 정보 및 적어도 일부가 콘텐츠에 포함됨을 지시하는 문자 정보, 중 적어도 하나를 포함한다.
도7은 본 개시의 일부 실시예에 따른 콘텐츠를 검색하는 장치(700)의 예시적인 블록도를 나타낸다. 장치(700)는 도1의 컴퓨팅 기기(102)에 포함되거나 또는 컴퓨팅 기기(102)로 구현될 수 있다. 도6에 도시한 바와 같이, 장치(700)는 콘텐츠의 목표 부분에 대한 조회 요청에 따라 검색어를 결정하도록 구성되는 검색어 결정 모듈(710)을 포함한다. 장치(700)는 콘텐츠 검색 라이브러리에서 검색어에 매칭되는 키워드를 결정하도록 구성되는 키워드 검색 모듈(720)을 더 포함하는바, 콘텐츠 검색 라이브러리는 적어도 키워드 및 키워드에 연관되게 저장된 목표 부분에 관한 지시 정보를 포함하고, 키워드는 목표 부분에 연관되는 정보 사항에 따라 결정되고 정보 사항은 콘텐츠의 식별 정보에 포함된다. 장치(700)는 콘텐츠 검색 라이브러리로부터 키워드에 연관되게 저장된 지시 정보를 획득하도록 구성되는 지시 정보 획득 모듈(730)을 나아가 더 포함한다. 장치(700)는 지시 정보를 제공하여 목표 부분을 지시하도록 구성되는 지시 정보 제공 모듈(740)을 나아가 더 포함한다.
일부 실시예에서, 지시 정보 제공 모듈(740)은, 목표 부분의 링크를 제공하도록 구성되는 링크 제공 모듈; 위치 정보를 제공하여 콘텐츠에서의 목표 부분의 상대적 위치를 지시하도록 구성되는 위치 정보 제공 모듈; 및 텍스트 정보를 제공하여 목표 부분이 콘텐츠에 포함됨을 지시하도록 구성되는 텍스트 정보 제공 모듈, 중 적어도 하나를 포함할 수 있다.
일부 실시예에서, 장치(700)는, 키워드에 따라 콘텐츠 검색 라이브러리로부터 키워드에 연관되게 저장된 추가 정보를 획득하도록 구성되는 추가 정보 획득 모듈; 및 추가 정보를 제공하도록 구성되는 추가 정보 제공 모듈; 을 더 포함하되, 추가 정보는, 키워드가 목표 부분에 연관되는 정보 사항에 나타나는 횟수, 콘텐츠의 관람, 클릭 또는 다운로드 횟수, 콘텐츠의 코멘트 수량 및 콘텐츠의 평점, 중 적어도 하나에 따라 생성된다.
일부 실시예에서, 장치(700)는, 콘텐츠의 식별 정보를 획득하도록 구성되는 식별 정보 획득 모듈 - 식별 정보는 복수의 정보 사항을 포함하고 매 정보 사항마다 콘텐츠의 일부에 연관됨 -; 식별 정보에 따라 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하도록 구성되는 키워드 결정 모듈; 및 결정된 키워드를 콘텐츠의 적어도 일부에 관한 지시 정보에 연관되게 콘텐츠 검색 라이브러리에 저장하도록 구성되는 키워드 저장 모듈 ;을 더 포함한다.
도8은 본 개시의 실시예를 구현할 수 있는 예시 기기(800)의 개략적 블록도를 나타낸다. 기기(800)는 도1의 컴퓨팅 기기(102)를 구현할 수 있다. 도시한 바와 같이, 기기(800)는 중앙 처리 유닛(CPU)(801)을 포함하는바, 이는 읽기 전용 메모리(ROM)(802)에 저장된 컴퓨터 프로그램 명령어 또는 저장 유닛(808)으로부터 랜덤 액세스 메모리(RAM)(803)에 로딩된 컴퓨터 프로그램 명령어에 따라 여러 가지 적당한 동작과 처리를 실행할 수 있다. RAM(803)에는 기기(800) 조작에 필요한 여러 가지 프로그램과 데이터가 더 저장될 수 있다. CPU(801), ROM(802) 및 RAM(803)은 버스(804)를 통하여 서로 연결된다. 입력/출력(I/O) 인터페이스((805))도 버스(804)에 연결된다.
기기(800) 중의 복수의 부품은 I/O 인터페이스(805)에 연결되는바, 예를 들어 키보드, 마우스 등 입력 유닛(806); 예를 들어 여러 가지 유형의 디스플레이, 스피커 등 출력 유닛(807); 예를 들어 자기 디스크, 광디스크 등 저장 유닛(808); 및 예를 들어 네트워크 카드, 모뎀, 무선 통신 송수신기 등 통신 유닛(809)을 포함한다. 통신 유닛(809)은 기기(800)가 인터넷과 같은 컴퓨터 네트워크 및/또는 여러 가지 전기 통신 네트워크를 통하여 기타 기기와 정보/데이터를 교환하도록 허용한다.
처리 유닛(801)은 전술에서 설명된 각각의 방법 및 처리를 실행하는바, 예를 들어 과정(200, 300 및 500 중의 어느 하나)일 수 있다. 예를 들어, 일부 실시예에서, 과정(200, 300 및 500 중의 어느 하나)은 컴퓨터 소프트웨어 프로그램으로 구현될 수 있는바, 이는 기계 판독 가능 매체, 예를 들어 저장 유닛(808)에 유형적으로 포함된다. 일부 실시예에서, 컴퓨터 프로그램의 일부 또는 전부가 ROM(802) 및/또는 통신 유닛(809)을 통하여 기기(800)에 로딩 및/또는 설치될 수 있다. 컴퓨터 프로그램이 RAM(803)에 로딩되어 CPU(801)에 의하여 실행될 시, 전술에서 설명된 과정(200, 300 및 500 중의 어느 하나)의 하나 또는 복수의 단계를 실행할 수 있다. 대안적으로, 기타 실시예에서, CPU(801)는 기타 임의의 적당한 방식을 통해(예를 들어, 펌웨어의 도움으로) 과정(200, 300 및 500 중의 어느 하나)을 실행하도록 구성될 수 있다.
본 개시에서, 이상에서 설명된 기능은 적어도 부분적으로 하나 또는 복수의 하드웨어 논리 부품에 의해 실행될 수 있다. 예를 들어, 무제한적으로, 사용 가능한 시범 유형의 하드웨어 논리 부품은 필드 프로그램 가능 게이트 어레이(FPGA), 주문형 반도체(ASIC), 특정 용도 표준 제품(ASSP), 시스템 온 칩(SOC), 복합 프로그래머블 논리 소자(CPLD) 등을 포함한다.
본 개시의 방법을 구현하기 위한 프로그램 코드는 하나 또는 복수의 프로그래밍 언어의 임의의 조합을 적용하여 작성할 수 있다. 이러한 프로그램 코드는 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그램 가능 데이터 처리 장치의 프로세서 또는 제어기에 제공되어 프로그램 코드가 프로세서 또는 제어기에 의해 실행될 시 흐름도 및/또는 블록도에 규정한 기능/조작이 구현되도록 할 수 있다. 프로그램 코드는 기계에서 전부 실행되거나, 기계에서 일부 실행되거나, 독립적인 소프트웨어 패키지로서 일부는 기계에서 실행되고 일부는 원격 기계에서 실행되거나, 혹은 원격 기계 또는 서버에서 전부 실행될 수 있다.
본 개시의 전반 서술에서, 기계 판독 가능 매체는 유형의 매체일 수 있는바, 명령어 실행 시스템, 장치 또는 기기에 사용하기 위한, 또는 명령어 실행 시스템, 장치 또는 기기와 결합하여 사용하기 위한 프로그램을 포함 또는 저장할 수 있다. 기계 판독 가능 매체는 기계 판독 가능 신호 매체 또는 기계 판독 가능 저장 매체일 수 있다. 기계 판독 가능 매체는 전자의, 자성의, 광학의, 전자기의, 적외선의 또는 반도체의 시스템, 장치 또는 기기, 또는 상술한 내용의 임의의 적합한 조합을 포함할 수 있으나, 이에 한정되지 않는다. 기계 판독 가능 저장 매체의 더 구체적인 예시는 하나 또는 복수의 선에 기반하는 전기 연결, 휴대형 컴퓨터 디스크, 하드 디스크, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 소거 및 프로그램 가능 읽기 전용 메모리(EPROM 또는 플래시 메모리), 광섬유, 휴대용 콤팩트 디스크 읽기 전용 메모리(CD-ROM), 광학 저장 기기, 자기 저장 기기, 또는 상술한 내용의 임의의 적합한 조합을 포함하게 된다.
이 외에, 비록 각 조작을 묘사함에 있어서 특정 순서를 적용하였지만, 이러한 조작이 도시된 특정 순서로 또는 순차적 순서로 실행되어야 하거나, 또는 모든 도시한 조작이 실행되어야 하는 것으로, 이로써 기대하는 결과를 취득하기 위한 것임을 이해하여야 한다. 일정한 환경에서는, 다중 태스크 및 병렬 처리가 유익할 수 있다. 마찬가지로, 비록 위의 서술에는 약간의 구체 구현 디테일이 포함되지만, 이러한 것은 본 개시의 범위에 대한 제한으로 해석되어서는 안된다. 단독의 실시예의 전반 서술에서 설명되는 어떤 특징 또한, 조합 가능하게 하나의 구현에 구현될 수 있다. 반대로, 하나의 구현의 전반 서술에서 설명되는 여러 가지 특징도 단독으로 또는 임의의 적합한 서브조합의 방식으로 복수 개 조합하여 구현될 수 있다.
비록 이미 구조적 특징 및/또는 방법론적 동작에 특정된 언어를 적용하여 본 주제에 대해 설명하였지만, 첨부된 특허청구범위가 한정하는 주제는 위에서 설명한 특정 특징 또는 동작에 한정되는 것이 아님을 이해하여야 한다. 반대로, 위에서 설명한 특정 특징 및 동작은 단지 특허청구범위의 예시 형식을 구현하는 것일 뿐이다.

Claims (24)

  1. 콘텐츠 검색 라이브러리를 구축하는 방법에 있어서,
    처리할 콘텐츠의 식별 정보를 획득하는 단계 - 상기 식별 정보는 복수의 정보 사항을 포함하고, 각 정보 사항은 상기 콘텐츠의 일부에 연관됨 - ;
    상기 식별 정보에 따라 상기 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하는 단계; 및
    상기 키워드를 상기 콘텐츠의 상기 적어도 일부에 관한 지시 정보에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하는 단계; 를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  2. 제1항에 있어서,
    상기 키워드를 결정하는 단계는,
    상기 복수의 정보 사항 중 상기 콘텐츠의 상기 적어도 일부에 연관되는 목표 정보 사항의 제1 수량을 결정하는 단계; 및
    상기 제1 수량이 제1 역치 수량을 초과하는 것, 및 상기 복수의 정보 사항의 전체 수량 대비 상기 제1 수량의 비율 값이 역치 비율 값을 초과하는 것, 중 적어도 하나에 응답하여, 상기 목표 정보 사항에 따라 상기 키워드를 결정하는 단계 - ; 를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  3. 제2항에 있어서,
    상기 목표 정보 사항에 따라 상기 키워드를 결정하는 단계는,
    상기 목표 정보 사항에 대하여, 하기중 적어도 하나를 수행하여 적어도 하나의 후보 단어를 획득하는 단계 - 상기 목표 정보 사항에서 소정 문자에 매칭되는 단어를 제거하는 것, 상기 목표 정보 사항에서 글자 수가 역치 글자 수보다 적은 목표 정보 사항을 제거하는 것, 상기 목표 정보 사항에서 문장 부호를 제거하는 것, 및 상기 목표 정보 사항에서 소정 카테고리의 단어를 제거하는 것 - 및
    상기 적어도 하나의 후보 단어에 따라 상기 키워드를 결정하는 단계; 를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  4. 제3항에 있어서,
    상기 적어도 하나의 후보 단어는 복수의 후보 단어를 포함하고,
    상기 적어도 하나의 후보 단어에 따라 상기 키워드를 결정하는 단계는,
    상기 복수의 후보 단어 중 동일하거나 의미가 관련되는 후보 단어의 제2 수량을 결정하는 단계; 및
    상기 제2 수량이 제2 역치 수량을 초과하는 것에 응답하여, 상기 동일하거나 의미가 관련되는 후보 단어에 따라 상기 키워드를 결정하는 단계; 를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  5. 제1항에 있어서,
    상기 키워드가 상기 적어도 일부에 연관되는 정보 사항에 나타나는 횟수, 상기 콘텐츠의 관람, 클릭 또는 다운로드 횟수, 상기 콘텐츠의 코멘트 수량, 및 상기 콘텐츠의 평점 중 적어도 하나에 따라,상기 콘텐츠의 상기 적어도 일부에 연관되는 추가 정보를 생성하는 단계 - ; 및
    상기 추가 정보를 상기 키워드에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하는 단계; 를 더 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  6. 제1항에 있어서,
    상기 지시 정보는,
    상기 콘텐츠의 상기 적어도 일부를 획득하기 위한 링크;
    상기 콘텐츠에서의 상기 적어도 일부의 상대적 위치를 지시하는 위치 정보; 및
    상기 적어도 일부가 상기 콘텐츠에 포함됨을 지시하는 문자 정보,
    중 적어도 하나를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 방법.
  7. 콘텐츠 검색 방법에 있어서,
    콘텐츠의 목표 부분에 대한 조회 요청에 따라 검색어를 결정하는 단계;
    콘텐츠 검색 라이브러리에서 상기 검색어에 매칭되는 키워드를 결정하는 단계 - 상기 콘텐츠 검색 라이브러리는 적어도 상기 키워드 및 상기 키워드에 연관되게 저장된 상기 목표 부분에 관한 지시 정보를 포함하고, 상기 키워드는 상기 목표 부분에 연관되는 정보 사항에 따라 결정되고, 상기 정보 사항은 상기 콘텐츠의 식별 정보에 포함됨 -;
    상기 콘텐츠 검색 라이브러리로부터 상기 키워드에 연관되게 저장된 상기 지시 정보를 획득하는 단계; 및
    상기 지시 정보를 제공하여 상기 목표 부분을 지시하는 단계; 를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 방법.
  8. 제7항에 있어서,
    상기 지시 정보를 제공하는 단계는,
    상기 목표 부분의 링크를 제공하는 단계;
    상기 콘텐츠에서의 상기 목표 부분의 상대적 위치를 지시하도록 위치 정보를 제공하는 단계; 및
    상기 목표 부분이 상기 콘텐츠에 포함됨을 지시하도록 텍스트 정보를 제공하는 단계;
    중 적어도 하나를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 방법.
  9. 제7항에 있어서,
    상기 키워드에 따라 상기 콘텐츠 검색 라이브러리로부터 상기 키워드에 연관되게 저장된 추가 정보를 획득하는 단계; 및
    상기 추가 정보를 제공하는 단계 - 상기 추가 정보는, 상기 키워드가 상기 목표 부분에 연관되는 정보 사항에 나타나는 횟수; 상기 콘텐츠의 관람, 클릭 또는 다운로드 횟수; 상기 콘텐츠의 코멘트 수량; 및 상기 콘텐츠의 평점; 중 적어도 하나에 따라 생성됨 -; 를 더 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 방법.
  10. 제7항에 있어서,
    상기 콘텐츠의 상기 식별 정보를 획득하는 단계 - 상기 식별 정보는 복수의 정보 사항을 포함하고, 각 정보 사항은 상기 콘텐츠의 일부에 연관됨 - ;
    상기 식별 정보에 따라 상기 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하는 단계; 및
    결정된 키워드를 상기 콘텐츠의 상기 적어도 일부에 관한 지시 정보에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하는 단계; 를 더 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 방법.
  11. 콘텐츠 검색 라이브러리를 구축하는 장치에 있어서,
    처리할 콘텐츠의 식별 정보를 획득하도록 구성되는 식별 정보 획득 모듈 - 상기 식별 정보는 복수의 정보 사항을 포함하고, 각 정보 사항은 상기 콘텐츠의 일부에 연관됨 - ;
    상기 식별 정보에 따라 상기 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하도록 구성되는 키워드 결정 모듈; 및
    상기 키워드를 상기 콘텐츠의 상기 적어도 일부에 관한 지시 정보에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하도록 구성되는 키워드 저장 모듈; 을 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  12. 제11항에 있어서,
    상기 키워드 결정 모듈은,
    상기 복수의 정보 사항 중 상기 콘텐츠의 상기 적어도 일부에 연관되는 목표 정보 사항의 제1 수량을 결정하도록 구성되는 제1 수량 결정 모듈; 및
    상기 제1 수량이 제1 역치 수량을 초과하는 것, 및 상기 복수의 정보 사항의 전체 수량 대비 상기 제1 수량의 비율 값이 역치 비율 값을 초과하는 것 중 적어도 하나에 응답하여, 상기 목표 정보 사항에 따라 상기 키워드를 결정하도록 구성되는 정보 사항 이용 모듈 - ; 을 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  13. 제12항에 있어서,
    상기 정보 사항 이용 모듈은,
    상기 목표 정보 사항에 대하여, 하기중 적어도 하나를 수행하여 적어도 하나의 후보 단어를 획득하도록 구성되는 후보 단어 획득 모듈 - 상기 목표 정보 사항에서 소정 문자에 매칭되는 단어를 제거하는 것, 상기 목표 정보 사항에서 글자 수가 역치 글자 수보다 적은 목표 정보 사항을 제거하는 것, 상기 목표 정보 사항에서 문장 부호를 제거하는 것, 및 상기 목표 정보 사항에서 소정 카테고리의 단어를 제거하는 것 - ; 및
    상기 적어도 하나의 후보 단어에 따라 상기 키워드를 결정하도록 구성되는 후보 단어 이용 모듈 ; 을 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  14. 제13항에 있어서,
    상기 적어도 하나의 후보 단어는 복수의 후보 단어를 포함하고,
    상기 후보 단어 이용 모듈은,
    상기 복수의 후보 단어 중 동일하거나 의미가 관련되는 후보 단어의 제2 수량을 결정하도록 구성되는 제2 수량 결정 모듈; 및
    상기 제2 수량이 제2 역치 수량을 초과하는 것에 응답하여, 상기 동일하거나 의미가 관련되는 후보 단어에 따라 상기 키워드를 결정하도록 구성되는 키워드 추출 모듈; 을 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  15. 제11항에 있어서,
    상기 키워드가 상기 적어도 일부에 연관되는 정보 사항에 나타나는 횟수, 상기 콘텐츠의 관람, 클릭 또는 다운로드 횟수, 상기 콘텐츠의 코멘트 수량, 및 상기 콘텐츠의 평점 중 적어도 하나에 따라, 상기 콘텐츠의 상기 적어도 일부에 연관되는 추가 정보를 생성하도록 구성되는 추가 정보 결정 모듈 - ; 및
    상기 추가 정보를 상기 키워드에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하도록 구성되는 추가 정보 저장 모듈; 을 더 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  16. 제11항에 있어서,
    상기 지시 정보는,
    상기 콘텐츠의 상기 적어도 일부를 획득하기 위한 링크;
    상기 콘텐츠에서의 상기 적어도 일부의 상대적 위치를 지시하는 위치 정보; 및
    상기 적어도 일부가 상기 콘텐츠에 포함됨을 지시하는 문자 정보;
    중 적어도 하나를 포함하는 것,
    을 특징으로 하는 콘텐츠 검색 라이브러리를 구축하는 장치.
  17. 콘텐츠를 검색하는 장치에 있어서,
    콘텐츠의 목표 부분에 대한 조회 요청에 따라 검색어를 결정하도록 구성되는 검색어 결정 모듈;
    콘텐츠 검색 라이브러리에서 상기 검색어에 매칭되는 키워드를 결정하도록 구성되는 키워드 검색 모듈 - 상기 콘텐츠 검색 라이브러리는 적어도 상기 키워드 및 상기 키워드에 연관되게 저장된 상기 목표 부분에 관한 지시 정보를 포함하고, 상기 키워드는 상기 목표 부분에 연관되는 정보 사항에 따라 결정되고, 상기 정보 사항은 상기 콘텐츠의 식별 정보에 포함됨 - ;
    상기 콘텐츠 검색 라이브러리로부터 상기 키워드에 연관되게 저장된 상기 지시 정보를 획득하도록 구성되는 지시 정보 획득 모듈; 및
    상기 지시 정보를 제공하여 상기 목표 부분을 지시하도록 구성되는 지시 정보 제공 모듈; 을 포함하는 것,
    을 특징으로 하는 콘텐츠를 검색하는 장치.
  18. 제17항에 있어서,
    상기 지시 정보 제공 모듈은,
    상기 목표 부분의 링크를 제공하도록 구성되는 링크 제공 모듈;
    위치 정보를 제공하여 상기 콘텐츠에서의 상기 목표 부분의 상대적 위치를 지시하도록 구성되는 위치 정보 제공 모듈; 및
    텍스트 정보를 제공하여 상기 목표 부분이 상기 콘텐츠에 포함됨을 지시하도록 구성되는 텍스트 정보 제공 모듈;
    중 적어도 하나를 포함하는 것,
    을 특징으로 하는 콘텐츠를 검색하는 장치.
  19. 제17항에 있어서,
    상기 키워드에 따라 상기 콘텐츠 검색 라이브러리로부터 상기 키워드에 연관되게 저장된 추가 정보를 획득하도록 구성되는 추가 정보 획득 모듈; 및
    상기 추가 정보를 제공하도록 구성되는 추가 정보 제공 모듈 - 상기 추가 정보는, 상기 키워드가 상기 목표 부분에 연관되는 정보 사항에 나타나는 횟수; 상기 콘텐츠의 관람, 클릭 또는 다운로드 횟수; 상기 콘텐츠의 코멘트 수량; 및 상기 콘텐츠의 평점; 중 적어도 하나에 따라 생성됨 - ; 을 더 포함하는 것,
    을 특징으로 하는 콘텐츠를 검색하는 장치.
  20. 제17항에 있어서,
    상기 콘텐츠의 상기 식별 정보를 획득하도록 구성되는 식별 정보 획득 모듈 - 상기 식별 정보는 복수의 정보 사항을 포함하고, 각 정보 사항은 상기 콘텐츠의 일부에 연관됨 - ;
    상기 식별 정보에 따라 상기 콘텐츠의 적어도 일부에 대응되는 키워드를 결정하도록 구성되는 키워드 결정 모듈; 및
    결정된 키워드를 상기 콘텐츠의 상기 적어도 일부에 관한 지시 정보에 연관되게 상기 콘텐츠 검색 라이브러리에 저장하도록 구성되는 키워드 저장 모듈; 을 더 포함하는 것,
    을 특징으로 하는 콘텐츠를 검색하는 장치.
  21. 기기에 있어서,
    하나 또는 복수의 프로세서; 및
    하나 또는 복수의 프로그램을 저장하기 위한 저장 장치 ; 를 포함하고,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의하여 실행되는 경우, 상기 하나 또는 복수의 프로세서가 제1항 내지 제6항 중 어느 한 항의 방법을 구현하는 것,
    을 특징으로 하는 기기.
  22. 기기에 있어서,
    하나 또는 복수의 프로세서; 및
    하나 또는 복수의 프로그램을 저장하기 위한 저장 장치 ; 를 포함하고,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의하여 실행되는 경우, 상기 하나 또는 복수의 프로세서가 제7항 내지 제10항 중 어느 한 항의 방법을 구현하는 것,
    을 특징으로 하는 기기.
  23. 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 프로그램이 프로세서에 의하여 실행되는 경우, 제1항 내지 제6항 중 어느 한 항의 방법을 구현하는 것,
    을 특징으로 하는 컴퓨터 판독 가능 저장 매체.
  24. 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 프로그램이 프로세서에 의하여 실행되는 경우, 제7항 내지 제10항 중 어느 한 항의 방법을 구현하는 것,
    을 특징으로 하는 컴퓨터 판독 가능 저장 매체.
KR1020190161887A 2019-02-11 2019-12-06 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체 KR102345401B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910110096.XA CN109933691B (zh) 2019-02-11 2019-02-11 用于内容检索的方法、装置、设备和存储介质
CN201910110096.X 2019-02-11

Publications (2)

Publication Number Publication Date
KR20200098381A true KR20200098381A (ko) 2020-08-20
KR102345401B1 KR102345401B1 (ko) 2021-12-30

Family

ID=66985504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190161887A KR102345401B1 (ko) 2019-02-11 2019-12-06 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체

Country Status (5)

Country Link
US (1) US20200257724A1 (ko)
EP (1) EP3706014A1 (ko)
JP (1) JP7395377B2 (ko)
KR (1) KR102345401B1 (ko)
CN (1) CN109933691B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111372116B (zh) * 2020-03-27 2023-01-03 咪咕文化科技有限公司 视频播放提示信息处理方法、装置、电子设备及存储介质
CN111859186A (zh) * 2020-06-30 2020-10-30 北京百度网讯科技有限公司 信息处理方法、装置、设备和计算机可读存储介质
CN113407775B (zh) * 2020-10-20 2024-03-22 腾讯科技(深圳)有限公司 视频搜索方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009113266A1 (ja) * 2008-03-10 2009-09-17 パナソニック株式会社 コンテンツ検索装置及びコンテンツ検索方法
EP3133820A1 (en) * 2015-08-21 2017-02-22 Accenture Global Services Limited Interactive video distribution system with content similarity matching

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475061B2 (en) * 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
JP4120597B2 (ja) * 2004-02-18 2008-07-16 日本電信電話株式会社 部分コンテンツ作成方法及び装置及びプログラム
JP2006108895A (ja) * 2004-10-01 2006-04-20 Nippon Telegr & Teleph Corp <Ntt> 映像操作内容の提示・映像再生操作の権利制御方法及びシステム及びプログラム及び映像再生・映像再生操作の同期方法及びシステム及びプログラム及び映像付加情報の集計・提示方法及びシステム及びプログラム及び映像操作内容の提示・映像再生操作の権利制御・映像再生・映像再生操作の同期・映像付加情報の集計・提示方法及びシステム及びプログラム
JP2010010736A (ja) * 2008-06-24 2010-01-14 Panasonic Corp 映像コンテンツ再生装置
US20100251291A1 (en) * 2009-03-24 2010-09-30 Pino Jr Angelo J System, Method and Computer Program Product for Processing Video Data
US20100274667A1 (en) * 2009-04-24 2010-10-28 Nexidia Inc. Multimedia access
CN102024009A (zh) * 2010-03-09 2011-04-20 李平辉 视频场景库生成方法及系统、搜索视频场景的方法及系统
CN102650993A (zh) * 2011-02-25 2012-08-29 北大方正集团有限公司 音视频文件的索引建立和检索方法、装置及系统
JP2012227760A (ja) * 2011-04-20 2012-11-15 Funai Electric Co Ltd 録画装置、再生装置およびサーバー装置
JP2013114393A (ja) * 2011-11-28 2013-06-10 Ricoh Co Ltd 情報検索装置およびプログラム
US8473293B1 (en) * 2012-04-17 2013-06-25 Google Inc. Dictionary filtering using market data
JP5399578B2 (ja) * 2012-05-16 2014-01-29 シャープ株式会社 画像処理装置、動画像処理装置、映像処理装置、画像処理方法、映像処理方法、テレビジョン受像機、プログラム、及び記録媒体
WO2014002462A1 (ja) 2012-06-28 2014-01-03 パナソニック株式会社 コンテンツ制御装置、端末装置、コンテンツ制御方法、及びコンテンツ制御プログラム
KR101910870B1 (ko) * 2012-06-29 2018-10-24 삼성전자 주식회사 잡음 제거 장치, 시스템 및 방법
CN103577414B (zh) * 2012-07-20 2017-04-12 富士通株式会社 数据处理方法和设备
US20140160085A1 (en) * 2012-12-07 2014-06-12 Qualcomm Incorporated Adaptive analog-front-end to optimize touch processing
JP6137960B2 (ja) * 2013-06-21 2017-05-31 日本放送協会 コンテンツ検索装置、方法及びプログラム
US9535990B2 (en) * 2014-05-20 2017-01-03 Google Inc. Systems and methods for generating video program extracts based on search queries
CN103984772B (zh) * 2014-06-04 2017-07-18 百度在线网络技术(北京)有限公司 文本检索字幕库生成方法和装置、视频检索方法和装置
CN104731938A (zh) * 2015-03-30 2015-06-24 北京奇艺世纪科技有限公司 一种视频搜索方法及装置
CN106569993A (zh) * 2015-10-10 2017-04-19 中国移动通信集团公司 一种挖掘领域术语间上下位关系的方法及装置
CN106095804B (zh) 2016-05-30 2019-08-20 维沃移动通信有限公司 一种视频片段的处理方法、定位方法及终端
CN106096050A (zh) * 2016-06-29 2016-11-09 乐视控股(北京)有限公司 一种视频内容搜索的方法和装置
WO2018081751A1 (en) * 2016-10-28 2018-05-03 Vilynx, Inc. Video tagging system and method
CN106776890B (zh) * 2016-11-29 2021-06-29 北京小米移动软件有限公司 视频播放进度的调整方法及装置
US9900632B1 (en) * 2016-12-30 2018-02-20 Echostar Technologies L.L.C. Viewing suggestions based on closed-captioned content from multiple tuners
CN107105318B (zh) * 2017-03-21 2021-01-29 华为技术有限公司 一种视频热点片段提取方法、用户设备和服务器
CN107786780B (zh) * 2017-11-03 2021-04-16 深圳Tcl新技术有限公司 视频图像降噪方法、装置及计算机可读存储介质
CN107948708B (zh) * 2017-11-14 2020-09-11 阿里巴巴(中国)有限公司 弹幕展示方法及装置
CN107958039A (zh) * 2017-11-21 2018-04-24 北京百度网讯科技有限公司 一种检索词纠错方法、装置及服务器
CN108305637B (zh) * 2018-01-23 2021-04-06 Oppo广东移动通信有限公司 耳机语音处理方法、终端设备及存储介质
CN108388583A (zh) * 2018-01-26 2018-08-10 北京览科技有限公司 一种基于视频内容的视频搜索方法和视频搜索装置
CN108471541A (zh) * 2018-02-01 2018-08-31 北京奇艺世纪科技有限公司 一种视频弹幕显示的方法及装置
CN108551520A (zh) * 2018-03-13 2018-09-18 努比亚技术有限公司 一种语音搜索响应方法、设备及计算机可读存储介质
CN108521500A (zh) * 2018-03-13 2018-09-11 努比亚技术有限公司 一种语音场景控制方法、设备及计算机可读存储介质
CN108401189A (zh) * 2018-03-16 2018-08-14 百度在线网络技术(北京)有限公司 一种搜索视频的方法、装置及服务器
CN108766453A (zh) * 2018-05-24 2018-11-06 江西午诺科技有限公司 语音降噪方法、装置、可读存储介质及移动终端
CN109101558B (zh) * 2018-07-12 2022-07-01 北京猫眼文化传媒有限公司 一种视频检索方法及装置
CN109145291A (zh) * 2018-07-25 2019-01-04 广州虎牙信息科技有限公司 一种弹幕关键词筛选的方法、装置、设备及存储介质
CN109271574A (zh) * 2018-08-28 2019-01-25 麒麟合盛网络技术股份有限公司 一种热词推荐方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009113266A1 (ja) * 2008-03-10 2009-09-17 パナソニック株式会社 コンテンツ検索装置及びコンテンツ検索方法
EP3133820A1 (en) * 2015-08-21 2017-02-22 Accenture Global Services Limited Interactive video distribution system with content similarity matching

Also Published As

Publication number Publication date
JP7395377B2 (ja) 2023-12-11
CN109933691B (zh) 2023-06-09
KR102345401B1 (ko) 2021-12-30
CN109933691A (zh) 2019-06-25
EP3706014A1 (en) 2020-09-09
US20200257724A1 (en) 2020-08-13
JP2020129377A (ja) 2020-08-27

Similar Documents

Publication Publication Date Title
US10559301B2 (en) Generating topic-specific language models
KR100684484B1 (ko) 비디오 세그먼트를 다른 비디오 세그먼트 또는 정보원에링크시키는 방법 및 장치
US20220114211A1 (en) Video matching service to offline counterpart
US20100274667A1 (en) Multimedia access
WO2020155750A1 (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
KR20200098381A (ko) 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체
JP2023516209A (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
JP2007012013A (ja) 映像データ管理装置及び方法及びプログラム
US11947635B2 (en) Illegal content search device, illegal content search method, and program
CN113407775A (zh) 视频搜索方法、装置及电子设备
US20230401389A1 (en) Enhanced Natural Language Processing Search Engine for Media Content
Stein et al. From raw data to semantically enriched hyperlinking: Recent advances in the LinkedTV analysis workflow
JP2015036892A (ja) 情報処理装置、情報処理方法、及び、プログラム
Khwileh et al. Utilisation of metadata fields and query expansion in cross-lingual search of user-generated internet video
CN114302227A (zh) 基于容器采集的网络视频采集与解析的方法和系统
Do et al. Movie indexing and summarization using social network techniques
JP6830917B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
JP6762678B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
JP6632564B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム
KR20190061668A (ko) 지식 네트워크 분석 방법
JP6625087B2 (ja) 違法コンテンツ探索装置及び違法コンテンツ探索方法
JP6621437B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム
Khollam et al. A survey on content based lecture video retrieval using speech and video text information
Kothawade et al. Retrieving instructional video content from speech and text information

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant