KR20020000563A

KR20020000563A - 키워드 감시를 위한 방송음성인식 시스템

Info

Publication number: KR20020000563A
Application number: KR1020017013288A
Authority: KR
Inventors: 로버트엘.워렌
Original assignee: 추후제출; 베란스 코포레이션
Priority date: 1999-04-20
Filing date: 2000-03-22
Publication date: 2002-01-05
Also published as: JP2003505712A; IL146013A0; BR0009899A; US6332120B1; WO2000063879A1; EP1185975A1; MXPA01010594A; CA2369894A1; AU4020900A

Abstract

방송오디오(10)는 흥미 있는 정보에 대해 자동적으로 감시된다. 컴퓨터 프로세서(12)는 흥미 있는 키워드의 어휘(24)를 저장하기 위해 그것과 관련되는 메모리를 갖추고 있다. 오디오 수신기는 오디오방송을 수신한다. 오디오 수신기와 컴퓨터 프로세서와 관련되는 음성인식 시스템(12, 22)은 키워드중 하나가 수신된 오디오 세그먼트에서 언제 나타나는지를 검출한다(26). 컴퓨터 프로세서와 관련되고 키워드의 검출에 응답하는 보고서 생성기는 검출된 키워드와 그 문맥을 상세화하는 보고서를 생성한다. 이 시스템은 광고방송 메시지의 검증과 홍보노력에서의 원조에 특히 적합하다.

Description

키워드 감시를 위한 방송음성인식 시스템 {BROADCAST SPEECH RECOGNITION SYSTEM FOR KEYWORD MONITORING}

오늘날의 미디어 환경은 소비자에게 도달하기 위해 거의 무한한 아우트렛 (outlet) 세트를 제공한다. 콘텐트, 즉 광고, 프로그램, 음악 및 뉴스는 지난 수십년간 있었던 것만큼 많다. 극적으로 변화되어 온 것은 지리적인 계층화(예컨대, 국가, 지역, 지방)가 흐려졌다는 것이다. 특히 이러한 흐려짐은 실재의 뉴스, 경보, 해설 등의 정보가 지금까지보다 더 빨리 퍼뜨려지는 것을 의미한다. 라디오, 텔레비전, 케이블, 인터넷을 포함하는 미디어 아우트렛의 빠른 확장은 정보를 소비자에게 도달시키는데 관하여 이익이 되도록 제공하고 있다. 이것은 항상 분할된 시장에 도달하기 위해 비용 경쟁을 포함하여 많은 유용한 함축을 갖는다.

이 모두는 현존하는 시스템과 다른 방송을 감시하기 위한 유효하고 비용효율적인 수단을 요구한다. 현존하는 시스템은 (i) 음악의 경우에는 특히 수동패턴 매칭이나, (ii) 끼워넣은 신호의 사용중 어느 하나에 의존한다. 후자 경우에 있어서, 유일한 신호는 신호가 플레이를 검증하기 위해 감시될 수 있도록 전송된 정보("콘텐트")로 부호화된다. 예컨대, 라디오 광고("광고방송")는 특정 수신기에 의해 감시되는 알아들을 수 없는 신호를 포함할 수 있다. 이 수신기는 광고방송이 적당한 때에 시행되었는지를 검증하기 위해 알아들을 수 없는 신호를 검출한다. 상술한 현존하는 시스템 각각은 관련 잇점과 문제점을 갖는다. 그러나, 양쪽 모두의 공통 문제점은 그것들이 자발적인 코멘트(예컨대, 뉴스해설자에 의해 만들어진 즉석 연설), 생방송 뉴스제공, 다른 이러한 콘텐트를 방해할 수 없다는 것이다.

예컨대, 방송전파(airwave)를 매개로, 또 인터넷 등을 매개로 케이블상의 수신자에게 방송되는 구두의 정보(spoken information)의 추적을 향상시키기 위한 방법 및 장치를 제공하는 것이 유리하다. 더욱이, 이들의 특정어, 구(phrase), 문맥(context)에 대한 방송채널을 추적하기 위한 비용효율적인 수단을 제공하는 것이 유리하다.

본 발명은 상술한 잇점 및 다른 잇점을 갖는 방법 및 장치를 제공한다. 특히, 본 발명은 정보가 다수의 취지를 제공할 수 있도록 특정어와 구가 자동적으로 검출되는 것을 가능하게 한다. 예컨대, 새로운 서비스는 광고, 뉴스방송, 프로그램의 자동화된 추적을 제공함으로써 제안될 수 있다. 이 방식에 있어서, 비용효율적인 시스템은, 예컨대 계약된 재료의 에어플레이의 간단한 검증을 가능하게 할 뿐만 아니라 홍보(PR)노력을 추적하고, 뉴스 스토리를 국부화하기 위해 제공된다. 본 발명은 이들 목적 및 다른 목적을 달성하기 위해 음성인식기술을 이용한다.

본 발명은 방송산업에서의 콘텐트(content) 검증기술에 관한 것으로, 특히 음성인식(speech recognition(SR); 여기에서는 "음성인식(voice recognition)" 또는 "VR"이라 칭함) 시스템을 이용하는 에어플레이(airplay(방송에서의 레코드 연주); 라디오 및 텔레비전 방송)를 감시하기 위한 방법 및 장치에 관한 것이다.

도 1은 본 발명의 방송음성인식(BVR) 감시시스템의 블록도이고,

도 2는 본 발명의 예시적인 구체화를 나타낸 플로우차트이다.

본 발명에 따르면, 흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법이 제공된다. 흥미 있는 키워드의 어휘가 제공된다. 키워드중 하나가 오디오에 언제 나타나는지를 검출하기 위해, 수신된 오디오는 음성인식 시스템을 이용하여 처리된다. 보고서는 키워드의 검출에 기초하여 생성된다.

예시된 실시예에 있어서, 오디오의 연속하는 부분은 처리단계동안 처리하기 위해 저장된다. 검출된 키워드에 인접한 저장된 오디오부분은 키워드가 사용되는 문맥을 확인하도록 분석된다. 키워드의 발생전과 후의 오디오부분은 문맥 분석을 위해 저장될 수 있다. 문맥은 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용될 수 있다. 예컨대, 이 동작은 문맥이 위기(예컨대, 비상사태 또는 빨리 해결될 필요가 있는 뜻밖의 문제)를 포함하고 있으면 경보(alert)를 포함할 수 있다.

검출된 키워드에 인접한 오디오부분은 오디오 클립(clip)으로서 보고서에 포함(inclusion)을 위해 저장될 수 있다. 이 방식에 있어서, 보고서를 받는 사람은 수신된 오디오의 세그먼트내의 문맥에서 검출된 키워드를 들을 수도 있다. 바람직하게, 검출된 키워드의 발생전과 후의 오디오부분은 오디오 클립에 포함을 위해 저장될 것이다.

본 발명에 따르면, 수신된 오디오 프로그램의 타입은 검출될 수 있다. 예컨대, 프로그램은 토크쇼, 뉴스방송, 사설, 광고방송 또는 다른 오디오 세그먼트이면 좋다. 이 때, 오디오 프로그램 타입을 확인하는 정보는 보고서에 제공될 수 있다.게다가, 문맥분석을 위해 저장된 오디오량은 수신되는 오디오 프로그램의 타입에 바탕을 둘 수 있다.

다른 실시예에 있어서, 방송오디오는 수신되어 음성인식 시스템에 입력된다. 음성인식 시스템은 수신된 오디오의 음성부분을 텍스트로 변환한다. 이 텍스트는 적어도 하나의 소정의 키워드에 위치하기 위해 컴퓨터를 이용하여 분석된다. 이 때, 보고서는 적어도 하나의 키워드의 발생시에 분석단계에 응답하여 생성된다.

이러한 실시예에 있어서, 텍스트의 연속하는 부분은 분석단계동안 처리하기 위해 저장될 수 있다. 적어도 하나의 키워드에 인접한 저장된 텍스트부분은 키워드가 이용된 문맥을 확인하기 위해 분석된다. 바람직하게, 키워드의 발생전과 후 양쪽의 텍스트부분은 문맥분석을 위해 저장된다.

본 발명에 따른 장치는 컴퓨터 프로세서를 포함한다. 컴퓨터 프로세서와 관련되는 메모리는 흥미 있는 키워드의 어휘를 저장한다. 오디오 수신기는 수신된 오디오를 컴퓨터 프로세서와 관련되는 음성인식 시스템에 제공한다. 음성인식 시스템은 키워드중 하나가 오디오 수신기에 의해 수신된 오디오에서 언제 나타나는지를 검출한다. 컴퓨터 프로세서와 관련되는 보고서 생성기는 보고서를 생성하기 위해 키워드의 검출에 응답한다. 보고서가 검출된 키워드를 나타내고, 실현되었을 때에 키워드가 이용된 문맥을 나타낸다.

보고서 생성기는 국부적으로 제공될 수 있거나, 또는 컴퓨터 프로세서, 오디오 수신기 및 음성인식 시스템으로부터 멀리 떨어진 중앙처리국에 제공될 수 있다. 보고서 생성기가 멀리 떨어진(예컨대, 중앙) 위치에 있는 경우에는, 컴퓨터 프로세서는 통신망을 매개로 보고서 생성기와 통신한다.

컴퓨터 프로세서는, 검출된 키워드가 사용되는 문맥을 분석할 능력을 가지고 있다. 이러한 경우에 있어서, 보고서 생성기는 보고서를 생성하기 위한 문맥분석에 응답할 수 있다.

다른 실시예에 있어서, 음성인식 시스템은 오디오를 텍스트로 변환한다. 이 때, 키워드 검출은 텍스트에서의 단어를 저장된 키워드 어휘에서의 단어와 비교함으로써 제공된다.

본 발명은, 예컨대 텔레비전, 라디오, 인터넷 오디오 방송으로부터의 자발적인 코멘트와 생방송 뉴스제공 및 다른 이러한 콘텐트를 방해하고 로그(log)할 능력을 제공한다. 특히, 본 발명은 말한 것을 추적하기 위한 수단을 제공하기 위해 특정의 구두어의 검출에 의존한다. 본 발명에 대한 응용례는 추적하는 특정 뉴스 스토리와 위기관리 응용례를 포함한다. 양쪽 모두는 홍보활동의 점에서 고려될 수 있다.

첫번째 경우에 있어서, 뉴스발표가 실행되었고, PR 회사는 스토리가 보고되는 방법을 잘 이해하는데 흥미가 있다. 두번째 경우에 있어서, 제품 제조업자는 부정적인 스토리와 관련되는 제품명의 어떤 발생에 대한 뉴스 보고서를 감시하길원할 것이다. 가장 초기의 가능한 기회에서 이것의 지식은 응답을 준비하거나 특정 동작을 취하기 위한 시간을 제공한다. 일례를 들면, 제조업자의 제품이 방해를 받으면(손댄 흔적이 보이는 유명한 타일레놀(상품명) 캡슐 등), 라디오/텔레비전 뉴스 스토리의 초기 경고는 제조업자와 그 PR 전문가가 홍보문제를 더 유효하게 어드레스하는 것을 가능하게 하면서, 본 발명을 이용하여 제공될 수 있다.

본 발명의 구체화는 기본 시스템부터 진보된 시스템까지 정렬시킬 수 있다. 기본 시스템 설명이 예시를 위해 여기에 제공될지라도, 많은 다른 구체화는 더 진보된 특징을 가질 수 있다.

본 발명의 방송음성인식 시스템에는 몇 개의 주요 요소가 있다. 이것들은 1. 방송오디오 세그먼트 또는 스트림(stream)의 수신, 2. 오디오 세그먼트 또는 스트림을 감시하기 위한 음성인식 시스템 및, 3. 흥미 있는 특정 단어의 발생을 확인하면서, 전자적으로나 프린트로 보고서를 생성하기 위한 보고시스템이다. 더욱이, BVR 시스템은 감시될 특정 단어나 구의 '어휘'를 포함할 수 있다. 이것은 음성의 연속적인 스트림에 대해 음성인식을 행할 수 없는 시스템에 대해서는 특히 중요하다.

도 1은 기본 시스템의 개략적인 도면이다. 방송소스(broadcast source; 10)는 음성인식(VR) 시스템(12)에 오디오 스트림을 제공한다. VR 시스템(12)은 당분야에서 잘 알려진 바와 같이 퍼스널 컴퓨터 등으로 실시될 수 있다. 바람직한 실시예에 있어서, 오디오 메모리는 오디오 스트림부를 저장하기 위해 음성인식 시스템(12)내에 제공된다. 또, 흥미 있는 키워드의 어휘는 음성인식 시스템(12)에서유지된다. 이 어휘는, 예컨대 잘 알려진 ROM(read only memory: 읽기전용 메모리), 불휘발성 RAM(random access memory: 임의접근 메모리) 또는 자기나 광학디스크 드라이브 등에 저장될 수 있다. VR 시스템은, 키워드중 하나가 검출되면 키워드전의 오디오 세그먼트와 키워드 후의 오디오 세그먼트가 보호되어 보고기능부(reporting function; 14)로 패스되도록 오디오의 스트림에 대해 동작한다. 저장된 오디오 세그먼트는 키워드에 "문맥"을 제공한다.

바람직한 실시예에 있어서, 어휘는 각 감시사이트에 국부적으로 제공된다. 이 어휘는 클라이언트 필요에 기초하여 단어의 선택세트에 맞춰지고, 단어심사의 첫번째 레벨로서 제공된다. 이 때, 키워드의 문맥은 키워드의 사용의 성질을 결정하도록 이용된다.

키워드의 문맥은 전체 BVR 시스템의 중요한 부분으로서 제공될 수 있다. 먼저, 문맥은 키워드의 일반적인 이용을 유효하게 하기 위한 수단을 제공한다. 예컨대, 문맥에서 단어를 이용하면 동일한 통칭(예컨대, "스미스의(Smith's)")을 갖는 국가적인 레스토랑 체인과 국부적인 급배수 위생회사를 구별하는 것을 도울 수 있다.

게다가, 문맥은 동작을 취할 것인지를 결정하기 위해 이용될 수 있다. 일례를 들면, 만약 키워드가 문맥에서 바람직하지 못한 단어(예컨대, 위기, 유행성)의 선택리스트에 링크(link)되면, 경보 보고서는 발행될 수 있다. 이 경보 보고서는 이메일, 전자메시지, 팩스 또는 다른 수단 등의 복수의 형태중 어떤 하나로 될 수 있다.

본 상세한 설명의 목적 때문에, 예시적인 구체화는 분포된 BVR 네트워크와 위기통지의 응용례에 기초하여 제공된다. 이 예시의 목적 때문에, 각종 미디어 마켓 도처에 위치한 감시국의 네트워크를 고려하라. 이들 감시국은, 오디오 트랙이 처리소자에 제공될 수 있도록 선택된 라디오, 텔레비전, 케이블 또는 www(world-wide-web; 월드 와이드 웹)채널에 동조시키기 위한 수단을 제공할 것이다. 처리소자는 음성인식 능력을 포함할 것이다.

처리소자부분과 같이, 그리고 도 2에 나타낸 바와 같이, FIFO(선입선출방식; first-in/first-out) 메모리(20)는, 예컨대 오디오의 60초를 유지한다. 이 오디오는, 저장된 오디오가 유효하도록, 예컨대 VR 포인트 전의 30초, 예컨대 후에 30초가 되도록, VR 처리가 스트림의 중간에서 동작하는 것을 가능하게 하는 방식으로 유지된다. VR 처리는 특정 키워드를 위치시키기 위해 국부적으로 한정된 어휘(24)에 의존한다. 이들 키워드는 어휘에서 명확한 엔트리(entry)이고, 유지되어 국부적 또는 원격수단에 의해 갱신된다. 예컨대, 키워드는 키보드, 마이크로폰 또는 다른 사용자 인터페이스를 통해 국부적으로 도입될 수 있다. 또한, 키워드는 인터넷, 전용 LAN 또는 WAN을 통해, 또는 다른 유선이나 무선 통신에 의해 음성응답 시스템에 전송될 수 있다. 다른 실시예에 있어서, 키워드는 당분야에서 잘 알려진 자기 디스크, 광학디스크, ROM 칩 등의 적당한 미디어에 공급된다.

방송오디오가 VR 처리부(22)를 통해 처리됨에 따라, 키워드가 검출되면(박스 26), 문맥은 보조 메모리소자로 보내진다(28). 게다가, 이후 이 문맥의 VR 처리는 박스 28에서 나타낸 바와 같이 전체 문맥의 텍스트 버전을 제공하도록 완료된다.이후, 이 문맥은, 예컨대 기록된 보고서를 생성하고 프린트하는 컴퓨터 소프트웨어와 프린터를 갖출 수 있는 보고기능부(14)로 전송된다.

본 예에서의 보고기능부는 소스(즉, 스테이션 번호)와 시간 및 데이터의 식별과 더불어 전체 문맥을 중앙데이터센터로 전송하는 단일 메시지로 포맷한다. 필요에 따라, 문맥은 키워드에 관심 있는 클라이언트에게 직접 전송될 수도 있다.

또한, 여러 가지 부가적인 특징이 본 발명의 일부로서 제공될 수 있다. 예컨대, 보조 리스트는 키워드의 문맥을 더욱 구체화하는데 이용되면 좋다. 이 리스트는 "위기", "유행성"과 같은 특정어와 키워드와 협력할 때 경보가 수립되게 할 수 있는 다른 것을 포함할 수 있다.

다른 구체화에 있어서, 음성스트림은 연속적으로 텍스트로 변환될 수 있다. 이 경우에 있어서, 문맥 결정이든 다른 분석이든지 간에 모든 처리는 오디오 도메인에서라기보다는 텍스트에 대해 행해질 수 있다.

'방송소스'는 라이브 전송 또는 라이브 전송의 보고일 수 있다. 이것은 세그먼트의 포스트 방송분석(post-broadcast analysis)을 허용할 것이다. 게다가, 보고는 분포된 네트워크로부터 중앙집중 기능을 통해, 또는 이들의 조합을 이용하여 일어날 수 있다.

각 시스템은 단일 VR 섹션이 다중 방송소스에 반하여 이용될 수 있도록 각종 소스의 버퍼이용 메모리를 포함하는 다른 구조를 갖출 수 있다.

더욱 다른 실시예에 있어서, 국부적인 감시사이트는 문맥의 다른 결정을 위해 중앙에 오디오 전부를 보낼 수 있다. 또한, 오디오 스트림은 VR 분석과 보고를위해 중앙에 보내질 수 있다. 다국어는 접속된 네트워크에서의 동일한 VR 서브시스템이나 다른 곳에서 지지될 수 있다.

오디오 자체는 보고의 일부로서 제공될 수 있다. 이것은 텍스트 보고 대신에 또는 텍스트 보고와 조합하여 제공될 수 있고, 표준형태나 압축된 형태로 오디오 클립을 갖출 수 있다.

또한, BVR 시스템으로부터의 정보는 특정 오디오 세그먼트의 발생을 결정하기 위해, 액티브 감시시스템으로부터든지 다른 데이터베이스 정보로부터든지 간에 다른 정보와 조합될 수 있다. 일례는 VR 식별 정보를 프로그램 데이터베이스(또는 다른 식별수단)와 관련시키는 것이다. 이 방식에 있어서, 하나는 흥미 있는 오디오 세그먼트가 뉴스방송, 사설, 토크쇼 또는 다른 프로그램중에 발생되는지의 여부를 판단할 수 있다.

문맥은 각 사이트, 키워드 또는 서비스의 레벨에 대해 변경될 수 있다. 즉, 몇몇 경우에 대해서 문맥은, 예컨대 +/-30초로 되면 좋은 반면에, 다른 것에 대해서는, 예컨대 +/-2분의 기간이 적당하다.

본 발명은 유일한 방식으로 흥미 있는 항목에 대한 오디오 방송을 감시하기 위한 시스템을 제공함은 물론이다. 특히, 음성인식 시스템은 실시간 오디오 프로그램내에서 흥미 있는 콘텐트를 식별하는데 이용된다. 키워드 검출은 흥미 있는 오디오를 인지하기 위해 유리하게 이용된다. 또한, 검출된 오디오가 이용되는 문맥이 판단된다. 보고서는 흥미 있는 검출된 오디오 콘텐트를 상세하게 하는 텍스트 및/또는 오디오에서 발생된다.

또한, 본 발명은 여러 가지의 특정한 실시예와 관련하여 설명했지만, 이에 한정되지 않고, 발명의 요지를 이탈하지 않는 범위내에서 여러 가지로 변형하여 실시할 수 있음은 물론이다.

Claims

흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법에 있어서,

흥미 있는 키워드의 어휘를 제공하는 단계와,

상기 방송오디오를 수신하는 단계,

상기 키워드가 상기 오디오에서 언제 나타나는지를 검출하기 위해 음성인식 시스템을 이용하여 상기 수신된 오디오를 처리하는 단계 및,

상기 키워드중 하나의 검출에 기초하여 보고서를 생성하는 단계를 구비한 것을 특징으로 하는 감시방법.
제1항에 있어서, 상기 처리 단계동안 처리하기 위한 상기 오디오의 연속하는 부분을 저장하는 단계와,

상기 키워드가 이용된 문맥을 확인하기 위해 검출된 키워드에 인접한 저장된 오디오부분을 분석하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
제2항에 있어서, 상기 키워드의 발생전과 후의 오디오부분은 문맥분석을 위해 저장되는 것을 특징으로 하는 감시방법.
제2항에 있어서, 상기 문맥은 상기 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용되는 것을 특징으로 하는 감시방법.
제4항에 있어서, 상기 동작은 상기 문맥이 위기를 포함하면 경보를 포함하는 것을 특징으로 하는 감시방법.
제1항에 있어서, 포함을 위해 검출된 키워드에 인접한 상기 오디오부분에 오디오 클립으로서 상기 보고서를 저장하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
제6항에 있어서, 상기 키워드의 발생전과 후의 오디오부분은 상기 오디오 클립에서의 포함을 위해 저장되는 것을 특징으로 하는 감시방법.
제1항에 있어서, 수신된 오디오 프로그램의 타입을 확인하는 단계와,

상기 보고서에서의 오디오 프로그램 타입을 식별하는 정보를 포함하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
제8항에 있어서, 상기 처리 단계동안 처리하기 위한 상기 오디오의 연속하는 부분을 저장하는 단계와,

상기 키워드가 이용된 문맥을 확인하기 위해 검출된 키워드에 인접한 저장된 오디오부분을 분석하는 단계 및,

수신된 오디오 프로그램의 타입에 기초하여 저장된 상기 오디오의 연속하는부분량을 조절하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
흥미 있는 정보에 대한 방송오디오를 감시하기 위한 방법에 있어서,

상기 방송오디오를 수신하는 단계와,

상기 수신된 오디오의 음성 부분을 텍스트로 변환하는 음성인식 시스템에 상기 수신된 오디오를 입력하는 단계,

상기 텍스트에서 적어도 하나의 소정의 키워드를 위치시키기 위해 상기 텍스트를 컴퓨터로 분석하는 단계 및,

상기 적어도 하나의 키워드가 발생할 때 상기 분석하는 단계에 응답하여 보고서를 생성하는 단계를 구비한 것을 특징으로 하는 감시방법.
제10항에 있어서, 상기 분석하는 단계동안 처리하기 위해 상기 텍스트의 연속하는 부분을 저장하는 단계와,

상기 키워드가 이용된 문맥을 확인하기 위해 상기 적어도 하나의 키워드에 인접한 저장된 텍스트부분을 분석하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
제11항에 있어서, 상기 키워드의 발생전과 후의 텍스트부분은 상기 문맥 분석을 위해 저장되는 것을 특징으로 하는 감시방법.
제11항에 있어서, 상기 문맥은 상기 키워드의 검출에 응답하여 취하는 동작을 결정하도록 이용되는 것을 특징으로 하는 감시방법.
제13항에 있어서, 상기 동작은 상기 문맥이 위기를 포함하면 경보를 포함하는 것을 특징으로 하는 감시방법.
제10항에 있어서, 수신된 오디오 프로그램의 타입을 확인하는 단계와,

상기 보고에서의 오디오 프로그램 타입을 식별하는 정보를 포함하는 단계를 더 구비한 것을 특징으로 하는 감시방법.
흥미 있는 정보에 대한 방송오디오를 감시하기 위한 장치에 있어서,

컴퓨터 프로세서와,

흥미 있는 키워드의 어휘를 저장하기 위해 상기 컴퓨터 프로세서와 관련되는 메모리,

오디오 수신기,

상기 키워드중 하나가 상기 오디오 수신기에 의해 수신된 오디오에서 언제 나타나는지를 검출하기 위해, 상기 오디오 수신기와 상기 컴퓨터 프로세서와 관련되는 음성인식 시스템 및,

상기 컴퓨터 프로세서와 관련되고, 상기 검출을 나타내는 보고서를 생성하기 위해, 상기 키워드중 하나의 검출에 응답하는 보고서 생성기를 구비한 것을 특징으로 하는 감시장치.
제16항에 있어서, 상기 보고서 생성기는 상기 컴퓨터 프로세서, 오디오 수신기 및 음성인식 시스템으로부터 멀리 떨어진 중앙처리국에 제공되고,

상기 컴퓨터 프로세서는 통신망을 매개로 상기 보고서 생성기와 통신하는 것을 특징으로 하는 감시장치.
제16항에 있어서, 상기 컴퓨터 프로세서는 검출된 키워드가 사용되는 문맥을 분석하고,

상기 보고서 생성기는 상기 보고를 발생시키기 위한 문맥분석에 응답하는 것을 특징으로 하는 감시장치.
제16항에 있어서, 상기 음성인식 시스템은 상기 오디오를 텍스트로 변환하고,

상기 키워드 검출은 상기 텍스트에서의 단어를 저장된 키워드 어휘에서의 단어와 비교함으로써 제공되는 것을 특징으로 하는 감시장치.