KR20070017997A - 대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템 - Google Patents

대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템 Download PDF

Info

Publication number
KR20070017997A
KR20070017997A KR1020067014579A KR20067014579A KR20070017997A KR 20070017997 A KR20070017997 A KR 20070017997A KR 1020067014579 A KR1020067014579 A KR 1020067014579A KR 20067014579 A KR20067014579 A KR 20067014579A KR 20070017997 A KR20070017997 A KR 20070017997A
Authority
KR
South Korea
Prior art keywords
keywords
conversation
parents
content
common
Prior art date
Application number
KR1020067014579A
Other languages
English (en)
Inventor
게릿 홀레만스
조세프스 휴버트 에그젠
바텔 마리너스 반 드 슬루이스
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority to KR1020067014579A priority Critical patent/KR20070017997A/ko
Publication of KR20070017997A publication Critical patent/KR20070017997A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

대화의 주제를 결정하고 관련된 콘텐트를 획득하고 제시하는 방법 및 시스템이 기재된다. 기재된 시스템은 진행 대화에서 "독창적인 영감을 받은 자(creative inspirator)"를 제공한다. 시스템은 대화로부터 키워드들을 추출하고 논의되는 주제(들)를 결정하는 데 키워드를 사용한다. 기재된 시스템은 서치를 행하여 대화의 주제(들)에 기초하는 보충 콘텐트를 획득한다. 콘텐트는 그들의 논의를 보충하기 위하여 대화의 참가자들에게 제시된다. 또한, 오디오 트랙들, 신문 기사, 및 저널 페이퍼들의 전사들을 포함하는 텍스트 문서의 주제를 결정하는 방법이 기재된다.
대화의 주제, 콘텐트, 텍스트 문서, 하이퍼님 트리, 오디오 트랙

Description

대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는 방법 및 시스템{Method and system for determining the topic of a conversation and obtaining and presenting related content}
본 발명은 콘텐트를 분석하고, 서치하고, 검색하는 것에 관한 것으로, 보다 구체적으로는 진행하는 대화에 관련된 콘텐트를 획득하고 제시하는 방법 및 시스템에 관한 것이다.
새롭고 독창적인 아이디어들을 찾는 전문가들은 새로운 통찰 및 아이디어들을 전개하기 위하여, 브레인스토밍하고, 새로운 것을 연상하고, 다른 방법으로 생각하는 고무적인 분위기를 항상 추구한다. 사람들은 여가 액티비티들에 소비되는 시간 동안조차도 자극적인 분위기에서 사회적으로 상호 작용하고 상호 철학적으로 사색하려고 한다. 모든 이러한 상황들에서, 대화에 참여하고, 대화에 새롭게 접근하는 방법을 이끌어 내는 기발한 연상들을 도입하는 힘과 주제를 깊이 인식하는 독창적인 영감을 받은 자를 배출하는 것이 도움이 된다. 오늘날의 네트워크 세계에서, 지능 네트워크를 구비하는 것은 독창적인 영감을 받은 자 역할을 하는 것과 동일하게 평가할 수 있다.
상기를 달성하기 위하여, 지능 시스템은 참가자들로부터의 명확한 입력을 요 구하지 않고도 주제(들)가 논의되는 대화를 모니터링하고 이해할 필요가 있다. 그 대화에 기초하여, 시스템은 논의의 새로운 접근 방법들을 제안할 수 있는, 관련 워드들 및 주제들을 포함한 콘텐트 및 정보를 서치하고 검색한다. 이러한 시스템은 리빙 룸, 열차들, 도서관들, 미팅 룸, 대기 룸을 포함한 다양한 분위기들에 사용하기에 적절하게 된다.
대화의 주제를 결정하고, 그 대화에 관련된 콘텐트를 획득하고 제시하는 방법 및 시스템이 기재된다. 기재된 시스템은 진행하는 대화에서 "독창적인 영감을 받은 자(creative inspirator)"를 제공한다. 시스템은 그 대화로부터 키워드들을 추출하여 논의되는 주제(들)를 결정하는데 그 키워드들을 이용한다. 논의되는 시스템은 대화의 주제(들)에 기초하여 콘텐트를 획득하기 위하여 지능형 네트워크 분위기 내에서 서치를 행한다. 그 콘텐트는 그들의 논의를 보충하기 위하여 그 대화의 참가자들에 제시된다.
또한, 오디오 트랙들, 신문 기사들, 저너럴 페이퍼들의 전사들을 포함한 텍스트의 주제를 결정하는 방법이 기재된다. 주제 결정 방법은 추출된 워드들 중 2개 이상의 워드들에 공통적인 하이퍼님(hypernym)의 부모를 식별하기 위하여 그 텍스트로부터 추출된 키워드들 및 말의 악센트들의 하이퍼님 트리들을 사용한다. 선택된 공통 부모의 하이포님(hyponym)은 키워드들의 최고 커버리지를 가지는 공동 부모를 결정하는데 사용된다. 이러한 공통 부모들을 선택하여 텍스트 문서의 주제를 제시한다.
본 발명의 다른 특징들 및 이점들뿐만 아니라, 본 발명의 보다 완벽한 이해 는 이하 상세한 설명 및 도면들을 참조하여 얻어지게 된다.
도 1은 진행 대화를 보충하기 위해 콘텐트를 획득하고 제시하는 전문가 시스템을 도시한 도면.
도 2는 도 1의 전문가 시스템의 개략적인 블록도.
도 3은 본 발명의 특징들을 통합한 도 2의 전문가 시스템 프로세스의 예시적인 실행을 기술한 흐름도.
도 4는 본 발명의 특징들을 통합한 주제 찾기 프로세스의 예시적인 실행을 기술한 흐름도.
도 5A는 대화의 전사를 기술한 도면.
도 5B는 도 5A의 전사의 키워드 세트를 도시한 도면.
도 5C는 도 5B의 키워드 세트의 단어 어간들을 도시한 도면.
도 5D는 도 5C의 단어 어간들의 하이퍼님 트리들의 부분들을 도시한 도면.
도 5E는 도 5D의 하이퍼님 트리들의 공통 부모들 및 레벨-5 부모들을 도시한 도면.
도 5F는 도 5D의 선택된 레벨-5 부모들의 하이퍼님 트리들의 평평한 부분을 도시한 도면.
도 1은 본 발명의 특징들을 통합한 도 2와 결합하여 이하에서 논의되는 전문가 시스템(200)이 동작할 수 있는 예시적인 네트워크 환경을 도시한다. 도 1에 도시된 바와 같이, 전화 장치들(105, 110)을 사용하는 2명의 사람은 네트워크, 예를 들면 공중 전화 교환 네트워크를 통해서 통신한다. 본 발명의 한 양상에 따르면, 전문가 시스템(200)은 참가자들(1005, 110) 간의 대화로부터 키워드들을 추출하고, 그 추출된 키워드들에 기초하여 대화의 주제를 결정한다. 참가자들이 예시적인 실시예에서 네트워크를 통해서 통신하고 있는 동안에, 참가자들은 당업자들이 알고 있는 동일 위치에 교호적으로 배치될 수 있다.
본 발명의 또다른 양상에 따르면, 전문가 시스템(200)은 추가 정보를 제공하고, 참가자들(105, 110)에게 영감을 주고, 논의에 관한 새로운 접근 방법을 장려하기 위하여 참가자들(105, 110) 중 하나 또는 그 이상에게 나타날 수 있는 보충 정보를 식별할 수 있다. 전문가 시스템(200)은 식별된 대화 주제(들)를 이용하는, 예를 들면 네트워크 환경(예컨대, 인터넷)(160) 또는 로컬 데이터베이스(155)에 저장된 보충 콘텐트를 서치할 수 있다. 보충 콘텐트는 그들의 논의를 보충하도록 참가자들(105, 110)에게 제시될 수 있다. 예시적인 실시에서, 전문가 시스템(200)은 대화가 말 형태로만 존재하기 때문에 음성, 음향들, 뮤직을 포함한 오디오 정보 형태로 콘텐트를 제시한다. 또한, 콘텐트는 당업자가 알 수 있는 디스플레이 장치를 사용하여 사용자에게 예를 들면, 텍스트, 비디오 또는 이미지들의 형태로 제시될 수도 있다.
도 2는 본 발명의 특징들을 통합한 전문가 시스템(200)의 개략적인 블록도이다. 종래에 공지된 바와 같이, 본 명세서에서 논의되는 방법들 및 장치들은, 그 위에 구체화되는 컴퓨터-판독 가능 코드 수단을 구비하는 컴퓨터 판독 가능 매체를 자체적으로 포함하는 제조 물품으로서 분산될 수 있다. 컴퓨터 판독 가능 프로그램 코드 수단은, 본 명세서에서 논의되는 장치들을 생성하고, 방법들을 실행하기 위한 단계들 중 모두 또는 일부를 실행하도록, 중앙 처리 유닛(201)과 같은 컴퓨터 시스템과 결합하여 동작할 수 있다. 컴퓨터 판독 가능 매체는 판독 가능 매체(예컨대, 플로피 디스크들, 하드 드라이브, 콤팩트 디스크들, 또는 메모리 카드들)일 수 있거나 또는 전송 매체(예컨대, 광섬유들을 포함하는 네트워크, 월드-와이드 웹(160), 케이블들, 또는 시분할 다중 액세스, 코드 분할 다중 액세스를 사용하는 무선 채널, 또는 다른 고주파 채널)일 수 있다. 컴퓨터에 사용하기에 적절한 정보를 저장할 수 있는 공지되거나 또는 개발된 임의 매체가 사용될 수 있다. 컴퓨터 판독 가능 코드 수단은 컴퓨터로 하여금 인스트럭션들 및 데이터를, 예를 들면 자기 매체의 자기 변동들 또는 콤팩트 디스크의 표면의 높이 변동들을 판독하게 하는 임의 메커니즘이다.
메모리(202)는 본 명세서에 기재된 방법들, 단계들 및 기능들을 실행하도록 프로세서(201)를 구성하게 된다. 메모리(202)는 분산적이거나 또는 국소적일 수 있고, 메모리(202)는 분산적이거나 또는 단독적일 수 있다. 메모리(202)는 전기, 자기 또는 광 메모리, 또는 상기 또는 다른 타입들의 기억 장치들의 임의 결합으로서 실행될 수 있다. 용어 "메모리(memory)"는 프로세서(201)에 의해 액세스되는 처리 가능 스페이스의 어드레스로부터 판독되거나 또는 그것에 기록될 수 있는 임의 정보를 포함할 정도로 충분히 광범위하게 해석되어야 한다.
도 2에 도시된 바와 같이, 전문가 시스템(200)은 도 3과 결합하여 후술되는 전문가 시스템 프로세스(300)와, 음성 인식 시스템(210), 키워드 추출기(220), 도4와 결합하여 후술되는 주제 찾기 프로세스(400), 콘텐트 파인더(240), 콘텐트 프리젠테이션 시스템(250), 키워드 및 트리 데이터베이스(260)를 포함한다. 통상적으로, 전문가 시스템 프로세스(300)는 대화로부터 키워드들을 추출하고, 논의되는 주제(들)를 결정하는 데 그 키워드들을 이용하고, 그 대화의 주제(들)에 기초하여 보충 콘텐트를 식별한다.
음성 인식 시스템(210)은 한 명 또는 그 이상의 참가자들(105, 110)의 대화를 포착하고, 공지된 방법으로 완전 또는 부분 전사의 형태로 그 오디오 정보를 텍스트로 변환시킨다. 그 대화의 참가자들(105, 110)이 동일한 지리적 영역에 위치하고, 그 참가자들(105, 110)의 음성이 때를 맞춰 오버랩핑하는 경우, 그들의 음성을 인식하는 것이 어렵게 된다. 한 실행에서, 마이크로폰 어레이들(도시되지 않음)을 이용한 빔-형성 기술은 각각의 사람(105, 110)으로부터의 개별 음성 신호를 픽업함으로써 음성 인식을 향상시키는데 사용될 수 있다. 대안으로, 각각의 참가자들(105, 110)은 각각의 화자들의 음성을 픽업하기 위하여 옷깃 마이크로폰을 입는다. 대화에 관한 참가자들(105, 110)이 개별 영역들에 있는 경우, 그들의 음성을 인식하는 것은 마이크로폰 어레이들 또는 옷깃 마이크로폰을 사용하지 않고도 달성될 수 있다. 전문가 시스템(200)은 하나 이상의 음성 인식 시스템(들)(210)을 사용한다.
키워드 추출기(220)는 공지된 방법으로 각각의 참가자들(105, 110)의 오디오 트랙의 전사로부터 키워드들을 추출하다. 각각의 키워드가 추출될 경우, 그것은 말하는 때에 동시에 선택적으로 타임-스탬핑될 수 있다. (대안으로, 키워드는 그것이 인식되는 때 또는 그것이 추출되는 때와 동시에 타임-스탬핑될 수 있다.) 타임스탬프들은 키워드가 포함된 대화의 일부에 복구되는 콘텐트를 연관시키는데 선택적으로 사용될 수 있다.
도 4와 결합하여 더 후술되는 바와 같이, 주제 파인더(400)는 언어 모델을 사용하여 대화로부터 추출된 키워드들 중 하나 또는 그 이상으로부터 주제를 도출한다. 콘텐트 파인더(240)는, 로컬 데이터베이스(155)를 포함한 콘텐트 저장소들, 월드와이드 웹(160), 전자 백과사전들, 사용자의 개인용 미디어 콜렉션 또는, 선택적으로 관련 정보 및 콘텐트용 라디오 및 텔레비전 채널들(도시되지 않음)을 서치하는 데 주제 파인더(400)에 의해 탐사되는 대화 주제들을 사용한다. 또다른 실시예에서, 콘텐트 파인더(240)는 서치를 행하는 데 키워들 및/또는 단어 어간들을 직접적으로 이용할 수 있다. 예를 들면, 월드와이드 웹 서치 엔진, 예를 들면 구글.컴(Google.com)은 대화에 관련될 수 있는 정보를 포함하는 웹사이트들의 광범위한 서치를 행하는데 사용될 수 있다. 동일한 방법으로, 관련된 키워드들 또는 관련된 주제들은 대화 참가자들에게 제시하기 위하여 콘텐트 프리젠테이션 시스템에 대하여 서치될 수 있고 그것에 전송될 수 있다. 키워드들의 히스토리, 관련 키워드들, 주제들, 및 관련 주제들은 또한 유지되어 제시될 수 있다.
콘텐트 프리젠테이션 시스템(250)은 다양한 포맷으로 콘텐트를 제시한다. 전화 대화에서, 예를 들면 콘텐트 프리젠테이션 시스템(250)은 오디오 트랙을 제시하게 된다. 다른 실시예들에서, 콘텐트 프리젠테이션 시스템(250)은 텍스트, 그래픽, 이미지, 및 비디오들을 포함하는 다른 타입들의 콘텐트를 제시한다. 이 일례에서, 콘텐트 프리젠테이션(250)은 새로운 콘텐트가 이용 가능한 대화 참가자들(105, 110)을 시그널링하는데 톤을 사용한다. 그런 다음, 참가자들(105, 110)은 입력 메커니즘, 예를 들면 전화로부터의 음성 명령어들 또는 이중 톤 다중-주파수(DTMF) 톤들을 사용함으로써 콘텐트를 제시(디스플레이)하기 위하여 전문가 시스템(200)을 시그널링한다.
도 3은 전문가 시스템 프로세스(300)의 예시적인 실행을 기술하는 흐름도이다. 도 3에 도시된 바와 같이, 전문가 시스템 프로세스(300)는 대화의 전사를 발생하도록 음성 인식을 실행하고(단계 310), 그 전사로부터 키워드들을 추출하고(단계 320), 도 4와 결합하여 이하에서 더 논의되는 방법으로 그 추출된 키워드들을 분석함으로써 대화의 주제(들)를 결정하고(단계 330), 대화 주제(들)에 기초하여 지능 네트워크 환경(160)에서 획득되는 보충 콘텐트를 서치하고(단계 340), 그 대화의 참가자들(105, 110)에게 탐사된 콘텐트를 제시한다(단계 350).
예를 들면, 참가자들(105, 110)이 날씨를 논의하는 경우에, 시스템(200)은 날씨 예상에 관한 정보를 제시함으로써 참가자들(105, 110)에게 영감을 주거나, 또는 계층적인 날씨 정보를 제시하게 되고; 그들이 오스트레일리아에서의 휴가에 관한 계획들을 논의하는 경우에, 시스템(200)은 오스트레일리아의 포토그라피 및 내추럴 사운드들을 제시하고, 시스템(200)은 그들의 비책에 따라 앙뜨레들의 픽쳐드들을 제시한다.
도 4는 주제 파인더 프로세스(400)의 예시적인 실행을 기술하는 흐름도이다. 통상적으로, 주제 파인더(400)는 말의 대화, 텍스트에 기초한 대화들(예컨대, 인스턴트 메시징), 강의들, 신문 기사들의 전사들을 포함하는 다양한 콘텐트의 주제를 결정한다. 도 4에 도시된 바와 같이, 주제 파인더(400)는 하나 이상의 키워드들 세트로부터 키워드를 초기에 판독하고(단계 410), 그 선택된 키워드들 각각에 대한 단어 어간을 결정한다(단계 420). 단계 422에서, 테스트를 실행하여 단어 어간이 그 선택된 키워드에 대하여 발견되는 지를 결정한다. 만일 단어 어간이 발견되지 않았다고 단계 422동안에 결정된 경우, 테스트를 실행하여 모든 워드 타입들이 선택된 키워드들에 대하여 점검되는 지를 결정한다. 만일 모든 워드 타입들이 소정의 키워드에 대하여 점검되었다고 단계 424동안에 결정되는 경우, 그 선택된 키워드의 워드 타입은 상이한 워드 타입으로 변경되고(단계 426), 단계 420은 새로운 워드 타입으로 반복된다.
단어 어간 테스트(단계 422)에서 단어 어간이 선택된 키워드에 대하여 발견된 것으로 결정되는 경우, 단어 어간은 단어 어간들의 리스트에 부가되고(단계 427), 테스트를 실행하여 모든 키워드들이 판독되었는 지를 결정한다(단계 428). 단계 428동안에 모든 키워드가 판독되지 않은 것으로 결정된 경우, 단계 410이 반복되고; 다르게는, 프로세스는 단계 430에서 계속된다.
단계 430동안에, 단어 어간 세트에서 모든 워드들의 모든 의미들(의미론상의 의미들)에 관한 하이퍼님 트리들이 결정된다. 하이퍼님은 전체 분류의 특정 실례를 지정하는데 사용되는 총칭적인 용어이며, 예를 들면, X가 Y의 타입인 경우에 Y는 X의 하이퍼님이다. 예를 들면, '차(car)'는 "탈것(vehicle)'의 종류이며, 따라서 '탈것'은 '차'의 하이퍼님이다. 하이퍼님 트리는 워드 자체를 포함하는 계층에서 최고 레벨까지 워드의 모든 하이퍼님들의 트리이다.
단계 440동안 계층에서 특정 레벨(또는 최저)의 공통 부모를 찾기 위하여 하이퍼님 트리들의 모든 쌍들 사이에서 비교가 행해진다. 공통 부모는 키워드 세트에서 2개 또는 그 이상의 워드들에 대하여 동일한 하이퍼님 트리에서 첫 번째 하이퍼님이다. 레벨-5, 예를 들면 공통 부모의 하이퍼님 또는 공통 부모 그 자체인 계층의 최고 레벨에서 4 단계 아래의 다섯 번째 레벨의 계층의 엔트리임을 주목한다. 그 특정 레벨이 되도록 선택된 레벨은, 주제가 너무 구체적이지 않아서 어떠한 관련 콘텐트도 발견되지 않고 너무 추상적이지 않아서 탐사된 콘텐트도 대화에 관련되지 않도록, 적정 레벨의 추상화를 가져야 한다. 본 발명의 실시예에서, 레벨-5는 계층에서 특정 레벨로서 선택된다.
모든 공통 부모(들)에 대응하는 레벨-5 부모(들)를 찾기 위하여 서치가 행해진다(단계 450). 하이퍼님 트리들은 레벨-5 부모(들)의 모든 의미들에 대하여 결정된다(단계 460). 하이퍼님은 클래스 X의 멤버를 지정하는데 사용되는 특정 용어이다. X가 Y의 타입인 경우 X는 Y의 하이퍼님이다. 즉, '차(car)'는 '탈것'의 타입이며, 따라서 '차'는 '탈것'의 하이퍼님이다. 하이퍼님 트리는 워드 그 자체를 포함하는, 계층에서 최저 레벨을 따라 워드의 모든 하이퍼님의 트리이다. 하이퍼님 트리들 각각에 대하여, 하이퍼님 트리와 키워드 세트에 공통되는 다수의 워드가 카운트된다(단계 470).
그것의 하이퍼님 트리가 단어 어간 세트에서 2개 워드 이상을 커버링(포함)하는 레벨-5 부모들의 리스트는 단계 480동안에 컴파일된다. 결국, 최고 커버리지를 가지는(단어 어간 세트로부터 대부분의 워드를 포함하는) 하나 또는 2개의 레벨-5 부모들이 선택되어(단계 490), 대화의 주제(들)를 제시하게 된다. 주제 파인더 프로세스(400)의 임의 다른 실시예에서, 공통 부모들이 이전의 주제들을 선택하는데 사용되는 키워드들의 의미들에 대하여 존재하는 경우, 단계 440 및/또는 단계 450은 키워드의 특정 의미에 기초하여 주제를 선택할 때 사용되지 않는 키워드의 의미들의 공통 부모들을 무시할 수 있다. 이것은 불필요한 프로세싱을 제거하게 되고 보다 많은 안정된 주제 선택을 초래하게 된다.
제2 다른 실시예에서, 단계 450 내지 480은 스킵되고, 단계 490은 단계 440에서 탐사되는 공통 부모들 및 이전 주제들의 공통 부모들에 기초하여 주제를 선택한다. 동일하게는, 제3 다른 실시예에서, 단계 450 내지 480은 스킵되고, 단계 490은 이전 주제들과 단계 440에서 탐사된 공통 부모들에 기초하여 주제를 선택한다. 제4 다른 실시예에서, 단계 460 내지 480은 스킵되고, 단계 490은 단계 450에서 결정된 모든 특정-레벨 부모들에 기초하여 주제들을 선택한다.
예를 들면, 대화의 전사에서부터 도 5A의 문장(510)을 고려해보자. 이러한 문장의 키워드 세트(520)는 도 5B에 도시되며(컴퓨터들/N, 기차들/N, 탈것들/N, 자동차들/N), 여기서 /N은 이전의 워드가 명사임을 나타낸다. 이러한 키워드 세트에 대하여, 단어 어간들(530){컴퓨터/N, 기차/N, 탈것/N, 자동차/N)은 결정되게 된다(단계 420; 도 5C). 하이퍼님 트리(540)가 결정되게 되며, 그것의 일부는 도 5D에 도시된다. 이러한 일례에 대하여, 도 5E는 제1의 2개 필드들에 기입된 트리 쌍들에 대한 공통 부모들(550) 및 레벨-5 부모들(555)을 도시하고, 도 5F는 레벨-5 부모들의 하이포님 트리들의 평탄 부분(560, 565), {장치} 및 {운송 수단, 수송 수단} 각각을 도시한다.
현재 일례에서, 단어 어간 세트에도 있는 {장치}의 하이포님 트리에서 워드들의 개수가 2개로 결정된다: '컴퓨터' 및 '기차'. 동일하게는, 그 단어 어간 세트에도 있는 {운송 수단, 수송 수단}의 하이포님 트리에서 워드들의 개수는 3개로 결정된다: '기차', '탈것', '자동차'. {장치}의 커버리지는 따라서 1/2이고; {운송 수단, 수송 수단}의 커버리지는 3/4이다. 단계 480에서, 레벨-5 부모들 양자는 기록되게 되고, 그 주제는 그것이 최고 관련 워드 카운트를 가지지 때문에 {운송 수단, 수송 수단}으로 세팅되게 된다(단계 490).
콘텐트 파인더(240)는 공지된 방법에서 대화의 상기 주제 {운송 수단, 수송 수단}에 기초하여 로컬 데이터베이스(155) 또는 지능 네트워크 환경(160)에서 콘텐트를 서치하게 된다. 예를 들면, 구글 인터넷 서치 엔진은 대화에서 탐사되는 주제 또는 그 주제(들)의 결합을 이용하여 월드와이드 서치를 실행하도록 요구될 수 있다. 발견된 콘텐트 및/또는 콘텐트 그 자체의 리스트는 참가자들(105, 110)에게 제시하기 위해 콘텐트 제시 시스템(250)에 전송된다.
콘텐트 제시 시스템(250)은 능동 또는 수동 방법으로 참가자들(105, 110)에게 그 콘텐트를 제시한다. 능동 모드에서, 콘텐트 프리젠테이션 시스템(250)은 그 콘텐트를 제시하도록 대화에 인터럽트한다. 수동 모드에서, 콘텐트 프리젠테이션 시스템(250)은 참가자들(105, 110)에게 콘텐트의 유효성을 경고한다. 참가자들(105, 110)은 온-디맨드 방법으로 콘텐트에 액세스한다. 현재 일례에서, 콘텐트 프리젠테이션 시스템(250)은 오디오 톤과의 전화 대화에서 참가자들(105, 110)에게 경고한다. 참가자들(105, 110)은 제시될 콘텐트를 선택하고, 전화 키패드에 의해 발생되는 DTMF 신호들을 이용하여 그 콘텐트가 제시되는 때를 명시한다. 콘텐트 프리젠테이션 시스템(250)은 명시된 때에 선택된 오디오 트랙을 플레이하게 된다.
본 명세서에서 도시되고 기술되는 실시예들 및 변경들은 단지 본 발명의 원리들의 예증이 되고, 다양한 수정들은 본 발명의 범위 및 사상으로부터 벗어나지 않고도 당업자에 의해 실행될 수 있음을 이해하게 된다.

Claims (26)

  1. 적어도 2명의 사람간의 대화에 콘텐트를 제공하는 방법에 있어서,
    상기 대화로부터 하나 이상의 키워드들을 추출하는 단계;
    상기 키워드들에 기초하여 콘텐트를 획득하는 단계; 및
    상기 대화에서 상기 사람들 중 한 명 이상에게 상기 콘텐트를 제시하는 단계를 포함하는, 콘텐트 제공 방법.
  2. 제1항에 있어서,
    상기 추출된 키워드들에 기초하여 상기 대화의 주제를 결정하는 단계를 더 포함하며, 상기 콘텐트 획득 단계는 상기 주제에 기초하는, 콘텐트 제공 방법.
  3. 제1항에 있어서,
    상기 대화로부터 상기 키워드들을 추출하기 위하여 음성 인식을 실행하는 단계를 더 포함하며, 상기 대화는 구두의 대화인, 콘텐트 제공 방법.
  4. 제1항에 있어서,
    상기 키워드들의 단어 어간(wordstem)들을 결정하는 단계를 더 포함하며, 상기 콘텐트 획득 단계는 상기 단어 어간들에 기초하는, 콘텐트 제공 방법.
  5. 제1항에 있어서,
    상기 제시된 콘텐트는 상기 하나 이상의 키워드들, 하나 이상의 관련 키워드들 또는 상기 키워드들의 히스토리를 포함하는, 콘텐트 제공 방법.
  6. 제2항에 있어서,
    상기 제시된 콘텐트는 상기 주제, 하나 이상의 관련 주제들 또는 주제들의 히스토리를 포함하는, 콘텐트 제공 방법.
  7. 제1항에 있어서,
    상기 콘텐트 획득 단계는 하나 이상의 콘텐트 저장소들의 서치를 실행하는 단계를 더 포함하는, 콘텐트 제공 방법.
  8. 제2항에 있어서,
    상기 콘텐트 획득 단계는 상기 주제에 기초하여 인터넷의 서치를 실행하는 단계를 더 포함하는, 콘텐트 제공 방법.
  9. 주제를 결정하는 방법에 있어서,
    의미들에 관한 하이퍼님 트리들(hypernym trees)을 사용하여 하나 이상의 키워드들의 상기 의미들의 하나 이상의 공통 부모들(commom parents)을 결정하는 단계;
    상기 키워드들에 공통인 다수의 워드 중 적어도 한 워드 카운트 및 상기 공통 부모들 중 하나의 의미들에 관한 하이포님 트리(hyponym tree)를 결정하는 단계; 및
    상기 적어도 하나의 워드 카운트에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하는 단계를 포함하는, 주제 결정 방법.
  10. 제9항에 있어서,
    상기 하나 이상의 공통 부모들을 결정하는 상기 단계는 상기 하이퍼님 트리의 계층에서 특정 레벨 또는 하위 레벨로 한정되는, 주제 결정 방법.
  11. 제10항에 있어서,
    상기 공통 부모들 중 적어도 하나에 대하여 상기 특정 레벨에서 하나 이상의 부모들을 결정하는 단계를 더 포함하며, 상기 적어도 하나의 워드 카운트 결정 단계의 상기 공통 부모들은 상기 특정 레벨 부모들인, 주제 결정 방법.
  12. 제9항에 있어서,
    상기 선택 단계는 이전의 주제 선택에 사용된 키워드의 의미에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하는, 주제 결정 방법.
  13. 제11항에 있어서,
    상기 선택 단계는 이전 주제 선택에서 사용된 키워드의 의미에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하는, 주제 결정 방법.
  14. 적어도 2명의 사람들 간의 대화에 콘텐트를 제공하는 시스템에 있어서,
    메모리; 및
    적어도 하나의 프로세서로서, 상기 메모리에 결합되어, 상기 대화로부터 하나 이상의 키워드들을 추출하고, 상기 키워드들에 기초하여 콘텐트를 획득하고, 상기 대화에서 상기 사람들 중 한 명 이상의 사람에게 상기 콘텐트를 제시하도록 동작하는, 상기 적어도 하나의 프로세서를 포함하는, 콘텐트 제공 시스템.
  15. 제14항에 있어서,
    상기 프로세서는 또한 상기 추출된 키워드들에 기초하여 상기 대화의 주제를 결정하고, 상기 주제에 기초하여 상기 콘텐트를 획득하도록 구성되는, 콘텐트 제공 시스템.
  16. 제14항에 있어서,
    상기 프로세서는 또한, 상기 대화로부터 상기 키워드들을 추출하기 위해 음성 인식을 실행하도록 구성되며, 상기 대화는 구두의 대화인, 콘텐트 제공 시스템.
  17. 제14항에 있어서,
    상기 프로세서는 또한 상기 키워드들의 단어 어간들을 결정하고, 상기 단어 어간들에 기초하여 상기 콘텐트를 획득하도록 구성되는, 콘텐트 제공 시스템.
  18. 제14항에 있어서,
    상기 제시된 콘텐트는 상기 하나 이상의 키워드들, 하나 이상의 관련 키워드들 또는 상기 키워드들의 히스토리를 포함하는, 콘텐트 제공 시스템.
  19. 제15항에 있어서,
    상기 제시된 콘텐트는 상기 주제, 하나 이상의 관련 주제들 또는 주제들의 히스토리를 포함하는, 콘텐트 제공 시스템.
  20. 주제를 결정하는 시스템에 있어서,
    메모리; 및
    적어도 하나의 프로세서로서, 상기 메모리에 결합되어, 의미들의 하이퍼님 트리들을 사용하여 하나 이상의 키워드들의 상기 의미들의 하나 이상의 공통 부모들을 결정하고, 상기 키워드들에 공통인 다수의 워드들 중 적어도 하나의 워드 카운트 및 상기 공통 부모들 중 하나의 의미들의 하이포님 트리를 결정하고, 상기 적어도 하나의 워드 카운트에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하도록 동작하는 적어도 하나의 프로세서를 포함하는, 주제 결정 시스템.
  21. 제20항에 있어서,
    상기 프로세서는 또한, 상기 하이퍼님 트리의 계층에서 특정 레벨 또는 하위 레벨에 한정되는 상기 하나 이상의 공통 부모들을 결정하도록 구성되는, 주제 결정 시스템.
  22. 제21항에 있어서,
    상기 프로세서는 또한, 상기 공통 부모들 중 적어도 하나에 대하여 상기 특정 레벨에서 하나 이상의 부모들을 결정하고, 상기 특정 레벨 부모들을 사용하여 상기 공통 부모들의 상기 적어도 하나의 워드 카운트를 결정하도록 구성되는, 주제 결정 시스템.
  23. 주제를 결정하는 방법에 있어서,
    의미들의 하이퍼님 트리들을 사용하여 하나 이상의 키워드들에 관한 상기 의미들의 하나 이상의 공통 부모들을 결정하는 단계; 및
    상기 공통 부모들 중 적어도 하나 및 하나 이상의 이전 공통 부모들에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하는 단계를 포함하는, 주제 결정 방법.
  24. 제23항에 있어서,
    상기 하나 이상의 이전 공통 부모들은 하나 이상의 이전 주제들인, 주제 결 정 방법.
  25. 제23항에 있어서,
    상기 선택 단계는 이전 주제 선택에서 사용된 키워드의 의미들에 기초하여 상기 공통 부모들 중 적어도 하나를 선택하는, 주제 결정 방법.
  26. 주제를 결정하는 방법에 있어서,
    의미들의 하이퍼님 트리들을 사용하여 하나 이상의 키워드들의 상기 의미들의 하나 이상의 공통 부모들을 결정하는 단계; 및
    상기 하나 이상의 공통 부모들 중 특정 레벨에서 하나 이상의 부모들을 선택하는 단계를 포함하는, 주제 결정 방법.
KR1020067014579A 2004-01-20 2005-01-17 대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템 KR20070017997A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020067014579A KR20070017997A (ko) 2004-01-20 2005-01-17 대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US60/537,808 2004-01-20
KR1020067014579A KR20070017997A (ko) 2004-01-20 2005-01-17 대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020127004386A Division KR20120038000A (ko) 2004-01-20 2005-01-17 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20070017997A true KR20070017997A (ko) 2007-02-13

Family

ID=43651580

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067014579A KR20070017997A (ko) 2004-01-20 2005-01-17 대화의 주제를 결정하여 관련 콘텐트를 획득하고 제시하는방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20070017997A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140047088A (ko) * 2011-06-24 2014-04-21 페이스북, 인크. 소셜 컨텍스트를 사용하는 소셜 네트워킹 시스템 통신에서의 토픽의 추론

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140047088A (ko) * 2011-06-24 2014-04-21 페이스북, 인크. 소셜 컨텍스트를 사용하는 소셜 네트워킹 시스템 통신에서의 토픽의 추론

Similar Documents

Publication Publication Date Title
KR20120038000A (ko) 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템
CN105120304B (zh) 信息显示方法、装置及系统
CN104700835B (zh) 提供话音接口的方法和系统
US7788095B2 (en) Method and apparatus for fast search in call-center monitoring
CN104778945B (zh) 响应自然语言语音口头表达的系统和方法
US6816858B1 (en) System, method and apparatus providing collateral information for a video/audio stream
CN101030368B (zh) 在保持情感的同时跨通道进行通信的方法和系统
US8478592B2 (en) Enhancing media playback with speech recognition
US20160163318A1 (en) Metadata extraction of non-transcribed video and audio streams
US8321203B2 (en) Apparatus and method of generating information on relationship between characters in content
CN105074697B (zh) 用于推断关于实体的元数据的实时众包数据的累积
CN108305632A (zh) 一种会议的语音摘要形成方法及系统
CN101309327A (zh) 语音聊天系统、信息处理装置、话语识别和关键字检测
WO2007043679A1 (ja) 情報処理装置およびプログラム
US20110004473A1 (en) Apparatus and method for enhanced speech recognition
US20170365258A1 (en) Utterance presentation device, utterance presentation method, and computer program product
KR101983635B1 (ko) 개인방송 컨텐츠 추천방법
JPWO2006085565A1 (ja) 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
JP5731998B2 (ja) 対話支援装置、対話支援方法および対話支援プログラム
WO2001016936A1 (en) Voice recognition for internet navigation
CN110517689A (zh) 一种语音数据处理方法、装置及存储介质
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
CN109710799B (zh) 语音交互方法、介质、装置和计算设备
CN109739354A (zh) 一种基于声音的多媒体交互方法及装置
JP2006279111A (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E902 Notification of reason for refusal
E601 Decision to refuse application