KR20020000563A - 키워드 감시를 위한 방송음성인식 시스템 - Google Patents

키워드 감시를 위한 방송음성인식 시스템 Download PDF

Info

Publication number
KR20020000563A
KR20020000563A KR1020017013288A KR20017013288A KR20020000563A KR 20020000563 A KR20020000563 A KR 20020000563A KR 1020017013288 A KR1020017013288 A KR 1020017013288A KR 20017013288 A KR20017013288 A KR 20017013288A KR 20020000563 A KR20020000563 A KR 20020000563A
Authority
KR
South Korea
Prior art keywords
audio
keyword
report
context
text
Prior art date
Application number
KR1020017013288A
Other languages
English (en)
Inventor
로버트엘.워렌
Original Assignee
추후제출
베란스 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 추후제출, 베란스 코포레이션 filed Critical 추후제출
Publication of KR20020000563A publication Critical patent/KR20020000563A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

방송오디오(10)는 흥미 있는 정보에 대해 자동적으로 감시된다. 컴퓨터 프로세서(12)는 흥미 있는 키워드의 어휘(24)를 저장하기 위해 그것과 관련되는 메모리를 갖추고 있다. 오디오 수신기는 오디오방송을 수신한다. 오디오 수신기와 컴퓨터 프로세서와 관련되는 음성인식 시스템(12, 22)은 키워드중 하나가 수신된 오디오 세그먼트에서 언제 나타나는지를 검출한다(26). 컴퓨터 프로세서와 관련되고 키워드의 검출에 응답하는 보고서 생성기는 검출된 키워드와 그 문맥을 상세화하는 보고서를 생성한다. 이 시스템은 광고방송 메시지의 검증과 홍보노력에서의 원조에 특히 적합하다.

Description

키워드 감시를 위한 방송음성인식 시스템 {BROADCAST SPEECH RECOGNITION SYSTEM FOR KEYWORD MONITORING}
오늘날의 미디어 환경은 소비자에게 도달하기 위해 거의 무한한 아우트렛 (outlet) 세트를 제공한다. 콘텐트, 즉 광고, 프로그램, 음악 및 뉴스는 지난 수십년간 있었던 것만큼 많다. 극적으로 변화되어 온 것은 지리적인 계층화(예컨대, 국가, 지역, 지방)가 흐려졌다는 것이다. 특히 이러한 흐려짐은 실재의 뉴스, 경보, 해설 등의 정보가 지금까지보다 더 빨리 퍼뜨려지는 것을 의미한다. 라디오, 텔레비전, 케이블, 인터넷을 포함하는 미디어 아우트렛의 빠른 확장은 정보를 소비자에게 도달시키는데 관하여 이익이 되도록 제공하고 있다. 이것은 항상 분할된 시장에 도달하기 위해 비용 경쟁을 포함하여 많은 유용한 함축을 갖는다.
이 모두는 현존하는 시스템과 다른 방송을 감시하기 위한 유효하고 비용효율적인 수단을 요구한다. 현존하는 시스템은 (i) 음악의 경우에는 특히 수동패턴 매칭이나, (ii) 끼워넣은 신호의 사용중 어느 하나에 의존한다. 후자 경우에 있어서, 유일한 신호는 신호가 플레이를 검증하기 위해 감시될 수 있도록 전송된 정보("콘텐트")로 부호화된다. 예컨대, 라디오 광고("광고방송")는 특정 수신기에 의해 감시되는 알아들을 수 없는 신호를 포함할 수 있다. 이 수신기는 광고방송이 적당한 때에 시행되었는지를 검증하기 위해 알아들을 수 없는 신호를 검출한다. 상술한 현존하는 시스템 각각은 관련 잇점과 문제점을 갖는다. 그러나, 양쪽 모두의 공통 문제점은 그것들이 자발적인 코멘트(예컨대, 뉴스해설자에 의해 만들어진 즉석 연설), 생방송 뉴스제공, 다른 이러한 콘텐트를 방해할 수 없다는 것이다.
예컨대, 방송전파(airwave)를 매개로, 또 인터넷 등을 매개로 케이블상의 수신자에게 방송되는 구두의 정보(spoken information)의 추적을 향상시키기 위한 방법 및 장치를 제공하는 것이 유리하다. 더욱이, 이들의 특정어, 구(phrase), 문맥(context)에 대한 방송채널을 추적하기 위한 비용효율적인 수단을 제공하는 것이 유리하다.
본 발명은 상술한 잇점 및 다른 잇점을 갖는 방법 및 장치를 제공한다. 특히, 본 발명은 정보가 다수의 취지를 제공할 수 있도록 특정어와 구가 자동적으로 검출되는 것을 가능하게 한다. 예컨대, 새로운 서비스는 광고, 뉴스방송, 프로그램의 자동화된 추적을 제공함으로써 제안될 수 있다. 이 방식에 있어서, 비용효율적인 시스템은, 예컨대 계약된 재료의 에어플레이의 간단한 검증을 가능하게 할 뿐만 아니라 홍보(PR)노력을 추적하고, 뉴스 스토리를 국부화하기 위해 제공된다. 본 발명은 이들 목적 및 다른 목적을 달성하기 위해 음성인식기술을 이용한다.
본 발명은 방송산업에서의 콘텐트(content) 검증기술에 관한 것으로, 특히 음성인식(speech recognition(SR); 여기에서는 "음성인식(voice recognition)" 또는 "VR"이라 칭함) 시스템을 이용하는 에어플레이(airplay(방송에서의 레코드 연주); 라디오 및 텔레비전 방송)를 감시하기 위한 방법 및 장치에 관한 것이다.
도 1은 본 발명의 방송음성인식(BVR) 감시시스템의 블록도이고,
도 2는 본 발명의 예시적인 구체화를 나타낸 플로우차트이다.
본 발명에 따르면, 흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법이 제공된다. 흥미 있는 키워드의 어휘가 제공된다. 키워드중 하나가 오디오에 언제 나타나는지를 검출하기 위해, 수신된 오디오는 음성인식 시스템을 이용하여 처리된다. 보고서는 키워드의 검출에 기초하여 생성된다.
예시된 실시예에 있어서, 오디오의 연속하는 부분은 처리단계동안 처리하기 위해 저장된다. 검출된 키워드에 인접한 저장된 오디오부분은 키워드가 사용되는 문맥을 확인하도록 분석된다. 키워드의 발생전과 후의 오디오부분은 문맥 분석을 위해 저장될 수 있다. 문맥은 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용될 수 있다. 예컨대, 이 동작은 문맥이 위기(예컨대, 비상사태 또는 빨리 해결될 필요가 있는 뜻밖의 문제)를 포함하고 있으면 경보(alert)를 포함할 수 있다.
검출된 키워드에 인접한 오디오부분은 오디오 클립(clip)으로서 보고서에 포함(inclusion)을 위해 저장될 수 있다. 이 방식에 있어서, 보고서를 받는 사람은 수신된 오디오의 세그먼트내의 문맥에서 검출된 키워드를 들을 수도 있다. 바람직하게, 검출된 키워드의 발생전과 후의 오디오부분은 오디오 클립에 포함을 위해 저장될 것이다.
본 발명에 따르면, 수신된 오디오 프로그램의 타입은 검출될 수 있다. 예컨대, 프로그램은 토크쇼, 뉴스방송, 사설, 광고방송 또는 다른 오디오 세그먼트이면 좋다. 이 때, 오디오 프로그램 타입을 확인하는 정보는 보고서에 제공될 수 있다.게다가, 문맥분석을 위해 저장된 오디오량은 수신되는 오디오 프로그램의 타입에 바탕을 둘 수 있다.
다른 실시예에 있어서, 방송오디오는 수신되어 음성인식 시스템에 입력된다. 음성인식 시스템은 수신된 오디오의 음성부분을 텍스트로 변환한다. 이 텍스트는 적어도 하나의 소정의 키워드에 위치하기 위해 컴퓨터를 이용하여 분석된다. 이 때, 보고서는 적어도 하나의 키워드의 발생시에 분석단계에 응답하여 생성된다.
이러한 실시예에 있어서, 텍스트의 연속하는 부분은 분석단계동안 처리하기 위해 저장될 수 있다. 적어도 하나의 키워드에 인접한 저장된 텍스트부분은 키워드가 이용된 문맥을 확인하기 위해 분석된다. 바람직하게, 키워드의 발생전과 후 양쪽의 텍스트부분은 문맥분석을 위해 저장된다.
본 발명에 따른 장치는 컴퓨터 프로세서를 포함한다. 컴퓨터 프로세서와 관련되는 메모리는 흥미 있는 키워드의 어휘를 저장한다. 오디오 수신기는 수신된 오디오를 컴퓨터 프로세서와 관련되는 음성인식 시스템에 제공한다. 음성인식 시스템은 키워드중 하나가 오디오 수신기에 의해 수신된 오디오에서 언제 나타나는지를 검출한다. 컴퓨터 프로세서와 관련되는 보고서 생성기는 보고서를 생성하기 위해 키워드의 검출에 응답한다. 보고서가 검출된 키워드를 나타내고, 실현되었을 때에 키워드가 이용된 문맥을 나타낸다.
보고서 생성기는 국부적으로 제공될 수 있거나, 또는 컴퓨터 프로세서, 오디오 수신기 및 음성인식 시스템으로부터 멀리 떨어진 중앙처리국에 제공될 수 있다. 보고서 생성기가 멀리 떨어진(예컨대, 중앙) 위치에 있는 경우에는, 컴퓨터 프로세서는 통신망을 매개로 보고서 생성기와 통신한다.
컴퓨터 프로세서는, 검출된 키워드가 사용되는 문맥을 분석할 능력을 가지고 있다. 이러한 경우에 있어서, 보고서 생성기는 보고서를 생성하기 위한 문맥분석에 응답할 수 있다.
다른 실시예에 있어서, 음성인식 시스템은 오디오를 텍스트로 변환한다. 이 때, 키워드 검출은 텍스트에서의 단어를 저장된 키워드 어휘에서의 단어와 비교함으로써 제공된다.
본 발명은, 예컨대 텔레비전, 라디오, 인터넷 오디오 방송으로부터의 자발적인 코멘트와 생방송 뉴스제공 및 다른 이러한 콘텐트를 방해하고 로그(log)할 능력을 제공한다. 특히, 본 발명은 말한 것을 추적하기 위한 수단을 제공하기 위해 특정의 구두어의 검출에 의존한다. 본 발명에 대한 응용례는 추적하는 특정 뉴스 스토리와 위기관리 응용례를 포함한다. 양쪽 모두는 홍보활동의 점에서 고려될 수 있다.
첫번째 경우에 있어서, 뉴스발표가 실행되었고, PR 회사는 스토리가 보고되는 방법을 잘 이해하는데 흥미가 있다. 두번째 경우에 있어서, 제품 제조업자는 부정적인 스토리와 관련되는 제품명의 어떤 발생에 대한 뉴스 보고서를 감시하길원할 것이다. 가장 초기의 가능한 기회에서 이것의 지식은 응답을 준비하거나 특정 동작을 취하기 위한 시간을 제공한다. 일례를 들면, 제조업자의 제품이 방해를 받으면(손댄 흔적이 보이는 유명한 타일레놀(상품명) 캡슐 등), 라디오/텔레비전 뉴스 스토리의 초기 경고는 제조업자와 그 PR 전문가가 홍보문제를 더 유효하게 어드레스하는 것을 가능하게 하면서, 본 발명을 이용하여 제공될 수 있다.
본 발명의 구체화는 기본 시스템부터 진보된 시스템까지 정렬시킬 수 있다. 기본 시스템 설명이 예시를 위해 여기에 제공될지라도, 많은 다른 구체화는 더 진보된 특징을 가질 수 있다.
본 발명의 방송음성인식 시스템에는 몇 개의 주요 요소가 있다. 이것들은 1. 방송오디오 세그먼트 또는 스트림(stream)의 수신, 2. 오디오 세그먼트 또는 스트림을 감시하기 위한 음성인식 시스템 및, 3. 흥미 있는 특정 단어의 발생을 확인하면서, 전자적으로나 프린트로 보고서를 생성하기 위한 보고시스템이다. 더욱이, BVR 시스템은 감시될 특정 단어나 구의 '어휘'를 포함할 수 있다. 이것은 음성의 연속적인 스트림에 대해 음성인식을 행할 수 없는 시스템에 대해서는 특히 중요하다.
도 1은 기본 시스템의 개략적인 도면이다. 방송소스(broadcast source; 10)는 음성인식(VR) 시스템(12)에 오디오 스트림을 제공한다. VR 시스템(12)은 당분야에서 잘 알려진 바와 같이 퍼스널 컴퓨터 등으로 실시될 수 있다. 바람직한 실시예에 있어서, 오디오 메모리는 오디오 스트림부를 저장하기 위해 음성인식 시스템(12)내에 제공된다. 또, 흥미 있는 키워드의 어휘는 음성인식 시스템(12)에서유지된다. 이 어휘는, 예컨대 잘 알려진 ROM(read only memory: 읽기전용 메모리), 불휘발성 RAM(random access memory: 임의접근 메모리) 또는 자기나 광학디스크 드라이브 등에 저장될 수 있다. VR 시스템은, 키워드중 하나가 검출되면 키워드전의 오디오 세그먼트와 키워드 후의 오디오 세그먼트가 보호되어 보고기능부(reporting function; 14)로 패스되도록 오디오의 스트림에 대해 동작한다. 저장된 오디오 세그먼트는 키워드에 "문맥"을 제공한다.
바람직한 실시예에 있어서, 어휘는 각 감시사이트에 국부적으로 제공된다. 이 어휘는 클라이언트 필요에 기초하여 단어의 선택세트에 맞춰지고, 단어심사의 첫번째 레벨로서 제공된다. 이 때, 키워드의 문맥은 키워드의 사용의 성질을 결정하도록 이용된다.
키워드의 문맥은 전체 BVR 시스템의 중요한 부분으로서 제공될 수 있다. 먼저, 문맥은 키워드의 일반적인 이용을 유효하게 하기 위한 수단을 제공한다. 예컨대, 문맥에서 단어를 이용하면 동일한 통칭(예컨대, "스미스의(Smith's)")을 갖는 국가적인 레스토랑 체인과 국부적인 급배수 위생회사를 구별하는 것을 도울 수 있다.
게다가, 문맥은 동작을 취할 것인지를 결정하기 위해 이용될 수 있다. 일례를 들면, 만약 키워드가 문맥에서 바람직하지 못한 단어(예컨대, 위기, 유행성)의 선택리스트에 링크(link)되면, 경보 보고서는 발행될 수 있다. 이 경보 보고서는 이메일, 전자메시지, 팩스 또는 다른 수단 등의 복수의 형태중 어떤 하나로 될 수 있다.
본 상세한 설명의 목적 때문에, 예시적인 구체화는 분포된 BVR 네트워크와 위기통지의 응용례에 기초하여 제공된다. 이 예시의 목적 때문에, 각종 미디어 마켓 도처에 위치한 감시국의 네트워크를 고려하라. 이들 감시국은, 오디오 트랙이 처리소자에 제공될 수 있도록 선택된 라디오, 텔레비전, 케이블 또는 www(world-wide-web; 월드 와이드 웹)채널에 동조시키기 위한 수단을 제공할 것이다. 처리소자는 음성인식 능력을 포함할 것이다.
처리소자부분과 같이, 그리고 도 2에 나타낸 바와 같이, FIFO(선입선출방식; first-in/first-out) 메모리(20)는, 예컨대 오디오의 60초를 유지한다. 이 오디오는, 저장된 오디오가 유효하도록, 예컨대 VR 포인트 전의 30초, 예컨대 후에 30초가 되도록, VR 처리가 스트림의 중간에서 동작하는 것을 가능하게 하는 방식으로 유지된다. VR 처리는 특정 키워드를 위치시키기 위해 국부적으로 한정된 어휘(24)에 의존한다. 이들 키워드는 어휘에서 명확한 엔트리(entry)이고, 유지되어 국부적 또는 원격수단에 의해 갱신된다. 예컨대, 키워드는 키보드, 마이크로폰 또는 다른 사용자 인터페이스를 통해 국부적으로 도입될 수 있다. 또한, 키워드는 인터넷, 전용 LAN 또는 WAN을 통해, 또는 다른 유선이나 무선 통신에 의해 음성응답 시스템에 전송될 수 있다. 다른 실시예에 있어서, 키워드는 당분야에서 잘 알려진 자기 디스크, 광학디스크, ROM 칩 등의 적당한 미디어에 공급된다.
방송오디오가 VR 처리부(22)를 통해 처리됨에 따라, 키워드가 검출되면(박스 26), 문맥은 보조 메모리소자로 보내진다(28). 게다가, 이후 이 문맥의 VR 처리는 박스 28에서 나타낸 바와 같이 전체 문맥의 텍스트 버전을 제공하도록 완료된다.이후, 이 문맥은, 예컨대 기록된 보고서를 생성하고 프린트하는 컴퓨터 소프트웨어와 프린터를 갖출 수 있는 보고기능부(14)로 전송된다.
본 예에서의 보고기능부는 소스(즉, 스테이션 번호)와 시간 및 데이터의 식별과 더불어 전체 문맥을 중앙데이터센터로 전송하는 단일 메시지로 포맷한다. 필요에 따라, 문맥은 키워드에 관심 있는 클라이언트에게 직접 전송될 수도 있다.
또한, 여러 가지 부가적인 특징이 본 발명의 일부로서 제공될 수 있다. 예컨대, 보조 리스트는 키워드의 문맥을 더욱 구체화하는데 이용되면 좋다. 이 리스트는 "위기", "유행성"과 같은 특정어와 키워드와 협력할 때 경보가 수립되게 할 수 있는 다른 것을 포함할 수 있다.
다른 구체화에 있어서, 음성스트림은 연속적으로 텍스트로 변환될 수 있다. 이 경우에 있어서, 문맥 결정이든 다른 분석이든지 간에 모든 처리는 오디오 도메인에서라기보다는 텍스트에 대해 행해질 수 있다.
'방송소스'는 라이브 전송 또는 라이브 전송의 보고일 수 있다. 이것은 세그먼트의 포스트 방송분석(post-broadcast analysis)을 허용할 것이다. 게다가, 보고는 분포된 네트워크로부터 중앙집중 기능을 통해, 또는 이들의 조합을 이용하여 일어날 수 있다.
각 시스템은 단일 VR 섹션이 다중 방송소스에 반하여 이용될 수 있도록 각종 소스의 버퍼이용 메모리를 포함하는 다른 구조를 갖출 수 있다.
더욱 다른 실시예에 있어서, 국부적인 감시사이트는 문맥의 다른 결정을 위해 중앙에 오디오 전부를 보낼 수 있다. 또한, 오디오 스트림은 VR 분석과 보고를위해 중앙에 보내질 수 있다. 다국어는 접속된 네트워크에서의 동일한 VR 서브시스템이나 다른 곳에서 지지될 수 있다.
오디오 자체는 보고의 일부로서 제공될 수 있다. 이것은 텍스트 보고 대신에 또는 텍스트 보고와 조합하여 제공될 수 있고, 표준형태나 압축된 형태로 오디오 클립을 갖출 수 있다.
또한, BVR 시스템으로부터의 정보는 특정 오디오 세그먼트의 발생을 결정하기 위해, 액티브 감시시스템으로부터든지 다른 데이터베이스 정보로부터든지 간에 다른 정보와 조합될 수 있다. 일례는 VR 식별 정보를 프로그램 데이터베이스(또는 다른 식별수단)와 관련시키는 것이다. 이 방식에 있어서, 하나는 흥미 있는 오디오 세그먼트가 뉴스방송, 사설, 토크쇼 또는 다른 프로그램중에 발생되는지의 여부를 판단할 수 있다.
문맥은 각 사이트, 키워드 또는 서비스의 레벨에 대해 변경될 수 있다. 즉, 몇몇 경우에 대해서 문맥은, 예컨대 +/-30초로 되면 좋은 반면에, 다른 것에 대해서는, 예컨대 +/-2분의 기간이 적당하다.
본 발명은 유일한 방식으로 흥미 있는 항목에 대한 오디오 방송을 감시하기 위한 시스템을 제공함은 물론이다. 특히, 음성인식 시스템은 실시간 오디오 프로그램내에서 흥미 있는 콘텐트를 식별하는데 이용된다. 키워드 검출은 흥미 있는 오디오를 인지하기 위해 유리하게 이용된다. 또한, 검출된 오디오가 이용되는 문맥이 판단된다. 보고서는 흥미 있는 검출된 오디오 콘텐트를 상세하게 하는 텍스트 및/또는 오디오에서 발생된다.
또한, 본 발명은 여러 가지의 특정한 실시예와 관련하여 설명했지만, 이에 한정되지 않고, 발명의 요지를 이탈하지 않는 범위내에서 여러 가지로 변형하여 실시할 수 있음은 물론이다.

Claims (19)

  1. 흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법에 있어서,
    흥미 있는 키워드의 어휘를 제공하는 단계와,
    상기 방송오디오를 수신하는 단계,
    상기 키워드가 상기 오디오에서 언제 나타나는지를 검출하기 위해 음성인식 시스템을 이용하여 상기 수신된 오디오를 처리하는 단계 및,
    상기 키워드중 하나의 검출에 기초하여 보고서를 생성하는 단계를 구비한 것을 특징으로 하는 감시방법.
  2. 제1항에 있어서, 상기 처리 단계동안 처리하기 위한 상기 오디오의 연속하는 부분을 저장하는 단계와,
    상기 키워드가 이용된 문맥을 확인하기 위해 검출된 키워드에 인접한 저장된 오디오부분을 분석하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  3. 제2항에 있어서, 상기 키워드의 발생전과 후의 오디오부분은 문맥분석을 위해 저장되는 것을 특징으로 하는 감시방법.
  4. 제2항에 있어서, 상기 문맥은 상기 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용되는 것을 특징으로 하는 감시방법.
  5. 제4항에 있어서, 상기 동작은 상기 문맥이 위기를 포함하면 경보를 포함하는 것을 특징으로 하는 감시방법.
  6. 제1항에 있어서, 포함을 위해 검출된 키워드에 인접한 상기 오디오부분에 오디오 클립으로서 상기 보고서를 저장하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  7. 제6항에 있어서, 상기 키워드의 발생전과 후의 오디오부분은 상기 오디오 클립에서의 포함을 위해 저장되는 것을 특징으로 하는 감시방법.
  8. 제1항에 있어서, 수신된 오디오 프로그램의 타입을 확인하는 단계와,
    상기 보고서에서의 오디오 프로그램 타입을 식별하는 정보를 포함하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  9. 제8항에 있어서, 상기 처리 단계동안 처리하기 위한 상기 오디오의 연속하는 부분을 저장하는 단계와,
    상기 키워드가 이용된 문맥을 확인하기 위해 검출된 키워드에 인접한 저장된 오디오부분을 분석하는 단계 및,
    수신된 오디오 프로그램의 타입에 기초하여 저장된 상기 오디오의 연속하는부분량을 조절하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  10. 흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법에 있어서,
    상기 방송오디오를 수신하는 단계와,
    상기 수신된 오디오의 음성 부분을 텍스트로 변환하는 음성인식 시스템에 상기 수신된 오디오를 입력하는 단계,
    상기 텍스트에서 적어도 하나의 소정의 키워드를 위치시키기 위해 상기 텍스트를 컴퓨터로 분석하는 단계 및,
    상기 적어도 하나의 키워드가 발생할 때 상기 분석하는 단계에 응답하여 보고서를 생성하는 단계를 구비한 것을 특징으로 하는 감시방법.
  11. 제10항에 있어서, 상기 분석하는 단계동안 처리하기 위해 상기 텍스트의 연속하는 부분을 저장하는 단계와,
    상기 키워드가 이용된 문맥을 확인하기 위해 상기 적어도 하나의 키워드에 인접한 저장된 텍스트부분을 분석하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  12. 제11항에 있어서, 상기 키워드의 발생전과 후의 텍스트부분은 상기 문맥 분석을 위해 저장되는 것을 특징으로 하는 감시방법.
  13. 제11항에 있어서, 상기 문맥은 상기 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용되는 것을 특징으로 하는 감시방법.
  14. 제13항에 있어서, 상기 동작은 상기 문맥이 위기를 포함하면 경보를 포함하는 것을 특징으로 하는 감시방법.
  15. 제10항에 있어서, 수신된 오디오 프로그램의 타입을 확인하는 단계와,
    상기 보고에서의 오디오 프로그램 타입을 식별하는 정보를 포함하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
  16. 흥미 있는 정보에 대한 방송오디오를 감시하기 위한 장치에 있어서,
    컴퓨터 프로세서와,
    흥미 있는 키워드의 어휘를 저장하기 위해 상기 컴퓨터 프로세서와 관련되는 메모리,
    오디오 수신기,
    상기 키워드중 하나가 상기 오디오 수신기에 의해 수신된 오디오에서 언제 나타나는지를 검출하기 위해, 상기 오디오 수신기와 상기 컴퓨터 프로세서와 관련되는 음성인식 시스템 및,
    상기 컴퓨터 프로세서와 관련되고, 상기 검출을 나타내는 보고서를 생성하기 위해, 상기 키워드중 하나의 검출에 응답하는 보고서 생성기를 구비한 것을 특징으로 하는 감시장치.
  17. 제16항에 있어서, 상기 보고서 생성기는 상기 컴퓨터 프로세서, 오디오 수신기 및 음성인식 시스템으로부터 멀리 떨어진 중앙처리국에 제공되고,
    상기 컴퓨터 프로세서는 통신망을 매개로 상기 보고서 생성기와 통신하는 것을 특징으로 하는 감시장치.
  18. 제16항에 있어서, 상기 컴퓨터 프로세서는 검출된 키워드가 사용되는 문맥을 분석하고,
    상기 보고서 생성기는 상기 보고를 발생시키기 위한 문맥분석에 응답하는 것을 특징으로 하는 감시장치.
  19. 제16항에 있어서, 상기 음성인식 시스템은 상기 오디오를 텍스트로 변환하고,
    상기 키워드 검출은 상기 텍스트에서의 단어를 저장된 키워드 어휘에서의 단어와 비교함으로써 제공되는 것을 특징으로 하는 감시장치.
KR1020017013288A 1999-04-20 2000-03-22 키워드 감시를 위한 방송음성인식 시스템 KR20020000563A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/294,865 1999-04-20
US09/294,865 US6332120B1 (en) 1999-04-20 1999-04-20 Broadcast speech recognition system for keyword monitoring
PCT/US2000/007632 WO2000063879A1 (en) 1999-04-20 2000-03-22 Broadcast speech recognition system for keyword monitoring

Publications (1)

Publication Number Publication Date
KR20020000563A true KR20020000563A (ko) 2002-01-05

Family

ID=23135280

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017013288A KR20020000563A (ko) 1999-04-20 2000-03-22 키워드 감시를 위한 방송음성인식 시스템

Country Status (10)

Country Link
US (1) US6332120B1 (ko)
EP (1) EP1185975A1 (ko)
JP (1) JP2003505712A (ko)
KR (1) KR20020000563A (ko)
AU (1) AU4020900A (ko)
BR (1) BR0009899A (ko)
CA (1) CA2369894A1 (ko)
IL (1) IL146013A0 (ko)
MX (1) MXPA01010594A (ko)
WO (1) WO2000063879A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101278995B1 (ko) * 2007-06-18 2013-07-02 퀄컴 인코포레이티드 라디오 데이터 시스템 정보 경보를 제공하는 디바이스 및 방법
US8670393B2 (en) 2006-04-20 2014-03-11 Qualcomm Incorporated Tagging language for broadcast radio
US8744337B2 (en) 2007-06-18 2014-06-03 Qualcomm Incorporated Apparatus and methods of enhancing radio programming
US9542604B2 (en) 2014-10-14 2017-01-10 Hanwha Techwin Co., Ltd. Method and apparatus for providing combined-summary in imaging apparatus
KR20180032632A (ko) * 2015-09-08 2018-03-30 애플 인크. 제로 레이턴시 디지털 어시스턴트

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7861275B1 (en) * 1999-04-23 2010-12-28 The Directv Group, Inc. Multicast data services and broadcast signal markup stream for interactive broadcast systems
JP4172886B2 (ja) * 1999-10-08 2008-10-29 富士通株式会社 疑似クライアント装置、疑似クライアントプログラムを格納したコンピュータ可読媒体、及び、チャットシステム
US6678684B1 (en) * 1999-12-30 2004-01-13 Makio Koga Worldwide early warning network and method of use
US6898631B1 (en) * 2000-10-12 2005-05-24 International Business Machines Corporation Platform for internet based real-time communication content selection
US7277852B2 (en) * 2000-10-23 2007-10-02 Ntt Communications Corporation Method, system and storage medium for commercial and musical composition recognition and storage
US6973256B1 (en) * 2000-10-30 2005-12-06 Koninklijke Philips Electronics N.V. System and method for detecting highlights in a video program using audio properties
US6604074B2 (en) * 2001-03-22 2003-08-05 Empirix Inc. Automatic validation of recognized dynamic audio data from data provider system using an independent data source
US20030046071A1 (en) * 2001-09-06 2003-03-06 International Business Machines Corporation Voice recognition apparatus and method
US7006968B2 (en) * 2001-10-11 2006-02-28 Hewlett-Packard Development Company L.P. Document creation through embedded speech recognition
US7921037B2 (en) * 2002-04-01 2011-04-05 Hewlett-Packard Development Company, L.P. Personalized messaging determined from detected content
US20040122846A1 (en) * 2002-12-19 2004-06-24 Ibm Corporation Fact verification system
US7518656B2 (en) * 2004-09-08 2009-04-14 Canon Kabushiki Kaisha Signal processing apparatus, signal processing method, signal processing program, program reproducing apparatus, image display apparatus and image display method
JP2007334968A (ja) * 2006-06-13 2007-12-27 Pioneer Electronic Corp 音声切換装置
US20080109222A1 (en) * 2006-11-04 2008-05-08 Edward Liu Advertising using extracted context sensitive information and data of interest from voice/audio transmissions and recordings
WO2008143557A1 (en) * 2007-05-24 2008-11-27 Autoliv Development Ab Fabric with woven markers
JP2009157050A (ja) * 2007-12-26 2009-07-16 Hitachi Omron Terminal Solutions Corp 発話検証装置及び発話検証方法
US8577685B2 (en) * 2008-10-24 2013-11-05 At&T Intellectual Property I, L.P. System and method for targeted advertising
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
EP2691870A4 (en) * 2011-03-31 2015-05-20 Microsoft Technology Licensing Llc USER INTENTIONS ORIENTED ON TASKS
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US9454962B2 (en) 2011-05-12 2016-09-27 Microsoft Technology Licensing, Llc Sentence simplification for spoken language understanding
ES2408906B1 (es) 2011-05-26 2014-02-28 Telefónica, S.A. Sistema y método para analizar el contenido de una conversación de voz
KR20220002750A (ko) 2011-12-07 2022-01-06 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
US9678993B2 (en) 2013-03-14 2017-06-13 Shutterstock, Inc. Context based systems and methods for presenting media file annotation recommendations
US9619980B2 (en) 2013-09-06 2017-04-11 Immersion Corporation Systems and methods for generating haptic effects associated with audio signals
US9576445B2 (en) 2013-09-06 2017-02-21 Immersion Corp. Systems and methods for generating haptic effects associated with an envelope in audio signals
US9959744B2 (en) * 2014-04-25 2018-05-01 Motorola Solutions, Inc. Method and system for providing alerts for radio communications
US9466290B2 (en) 2014-05-06 2016-10-11 Honeywell International Inc. Systems and methods for aviation communication monitoring using speech recognition
US9202469B1 (en) * 2014-09-16 2015-12-01 Citrix Systems, Inc. Capturing noteworthy portions of audio recordings
US10055767B2 (en) 2015-05-13 2018-08-21 Google Llc Speech recognition for keywords
CN107562828B (zh) * 2017-08-22 2020-10-30 武汉理工大学 多源海事信息搜索与冲突处理系统及方法
US10824670B2 (en) * 2018-03-23 2020-11-03 nedl.com, Inc. Real-time audio stream search and presentation system
CN109166574B (zh) * 2018-07-25 2022-09-30 重庆柚瓣家科技有限公司 用于养老机器人的资讯抓取及播报系统
CN113113028A (zh) * 2018-08-29 2021-07-13 胡开良 一种无人机的计算机可读存储介质
KR20200084413A (ko) * 2018-12-21 2020-07-13 삼성전자주식회사 컴퓨팅 장치 및 그 동작 방법
JP7163845B2 (ja) * 2019-03-28 2022-11-01 沖電気工業株式会社 情報処理装置、およびプログラム
CN111341295A (zh) * 2020-03-10 2020-06-26 成都华日通讯技术股份有限公司 一种离线实时多语种广播敏感词监听方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5231670A (en) * 1987-06-01 1993-07-27 Kurzweil Applied Intelligence, Inc. Voice controlled system and method for generating text from a voice controlled input
US5051924A (en) * 1988-03-31 1991-09-24 Bergeron Larry E Method and apparatus for the generation of reports
US5168548A (en) * 1990-05-17 1992-12-01 Kurzweil Applied Intelligence, Inc. Integrated voice controlled report generating and communicating system
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
US6125347A (en) * 1993-09-29 2000-09-26 L&H Applications Usa, Inc. System for controlling multiple user application programs by spoken input
US5664227A (en) * 1994-10-14 1997-09-02 Carnegie Mellon University System and method for skimming digital audio/video data
US6061056A (en) * 1996-03-04 2000-05-09 Telexis Corporation Television monitoring system with automatic selection of program material of interest and subsequent display under user control
JPH1028068A (ja) * 1996-07-11 1998-01-27 Suzuki Motor Corp ラジオ装置
US6011854A (en) * 1997-09-18 2000-01-04 Sony Corporation Automatic recognition of audio information in a broadcast program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8670393B2 (en) 2006-04-20 2014-03-11 Qualcomm Incorporated Tagging language for broadcast radio
KR101278995B1 (ko) * 2007-06-18 2013-07-02 퀄컴 인코포레이티드 라디오 데이터 시스템 정보 경보를 제공하는 디바이스 및 방법
US8638219B2 (en) 2007-06-18 2014-01-28 Qualcomm Incorporated Device and methods of providing radio data system information alerts
US8744337B2 (en) 2007-06-18 2014-06-03 Qualcomm Incorporated Apparatus and methods of enhancing radio programming
US9542604B2 (en) 2014-10-14 2017-01-10 Hanwha Techwin Co., Ltd. Method and apparatus for providing combined-summary in imaging apparatus
US9798934B2 (en) 2014-10-14 2017-10-24 Hanwha Techwin Co., Ltd. Method and apparatus for providing combined-summary in imaging apparatus
KR20180032632A (ko) * 2015-09-08 2018-03-30 애플 인크. 제로 레이턴시 디지털 어시스턴트
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant

Also Published As

Publication number Publication date
JP2003505712A (ja) 2003-02-12
IL146013A0 (en) 2002-07-25
BR0009899A (pt) 2002-10-22
US6332120B1 (en) 2001-12-18
WO2000063879A1 (en) 2000-10-26
EP1185975A1 (en) 2002-03-13
MXPA01010594A (es) 2004-03-19
CA2369894A1 (en) 2000-10-26
AU4020900A (en) 2000-11-02

Similar Documents

Publication Publication Date Title
KR20020000563A (ko) 키워드 감시를 위한 방송음성인식 시스템
JP4216190B2 (ja) 番組のコマーシャル部分を識別しかつ学習するために、トランスクリプト情報を用いる方法
US10025841B2 (en) Play list generation method and apparatus
US9071371B2 (en) Method and apparatus for identification of broadcast source
US6912517B2 (en) Intelligent information delivery system
EP1474760B1 (en) Fast hash-based multimedia object metadata retrieval
US7277852B2 (en) Method, system and storage medium for commercial and musical composition recognition and storage
US7788696B2 (en) Inferring information about media stream objects
US20030105794A1 (en) Systems for sensing similarity in monitored broadcast content streams and methods of operating the same
JPH11505682A (ja) 自動放送監視システム
JP7332112B2 (ja) ローカルコマーシャル挿入機会の識別のための方法、コンピュータ可読記憶媒体及び装置
JP2006527425A (ja) 改良されたデータ検索方法およびシステム
JP2002150102A (ja) 商取引方法
JP2009265909A (ja) デジタル放送用の受信装置及びプログラム
US20220415331A1 (en) Methods and apparatus for panelist-based logins using voice commands
TW200901745A (en) Communication system and information providing method
WO2020129465A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid