KR20050021554A - 음성 마스킹 시스템 및 그 방법 - Google Patents

음성 마스킹 시스템 및 그 방법 Download PDF

Info

Publication number
KR20050021554A
KR20050021554A KR10-2005-7001192A KR20057001192A KR20050021554A KR 20050021554 A KR20050021554 A KR 20050021554A KR 20057001192 A KR20057001192 A KR 20057001192A KR 20050021554 A KR20050021554 A KR 20050021554A
Authority
KR
South Korea
Prior art keywords
speech
speech signal
stream
ambiguous
module
Prior art date
Application number
KR10-2005-7001192A
Other languages
English (en)
Other versions
KR100695592B1 (ko
Inventor
더블유.다니엘 힐리스
브란 퍼렌
러셀 휴
브라이언 에노
Original Assignee
어플라이드 마인즈, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어플라이드 마인즈, 인크. filed Critical 어플라이드 마인즈, 인크.
Publication of KR20050021554A publication Critical patent/KR20050021554A/ko
Application granted granted Critical
Publication of KR100695592B1 publication Critical patent/KR100695592B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/02Secret communication by adding a second signal to make the desired signal unintelligible
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • G10K11/1754Speech masking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • H04K1/06Secret communication by transmitting the information or elements thereof at unnatural speeds or in jumbled order or backwards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K3/00Jamming of communication; Counter-measures
    • H04K3/80Jamming or countermeasure characterized by its function
    • H04K3/82Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
    • H04K3/825Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K2203/00Jamming of communication; Countermeasures
    • H04K2203/10Jamming or countermeasure used for a particular application
    • H04K2203/12Jamming or countermeasure used for a particular application for acoustic communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

음성 스트림을 마스킹하는데 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 공개한다. 마스킹될 음성 스트림을 나타내는 음성 신호가 획득된다. 상기 음성 신호는 다음으로 일시적으로 세그먼트로 분할되는데, 바람직하게는 음성 스트림 내 음소에 대응한다. 상기 세그먼트는 다음으로 메모리에 저장되고, 세그먼트의 일부 또는 전부는 이어서 선택, 검색, 및 음성 신호로 결합되거나 음성 스트림으로 재생성 및 결합될 때, 마스킹 효과를 제공하는 난해한 음성 스트림을 나타내는 모호한 음성 신호로 조합된다. 현재의 바람직한 실시예는 주로 개방형 사무실에서 쉽게 응용될 수 있으나, 식당, 교실, 및 텔레커뮤니케이션 시스템에서 사용하기 적절한 실시예가 또한 공개된다.

Description

음성 마스킹 시스템 및 그 방법{METHOD AND SYSTEM FOR MASKING SPEECH}
본 발명은 정보를 숨기는 시스템에 관한 것으로, 특히, 음성 스트림을 난해하게 하는 그러한 시스템에 관한 것이다.
인간의 청각 시스템은 배경 잡음에서 음성의 스트림을 구별하고 파악하는데 매우 숙련되어 있다. 이러한 능력은 음성이 잡음 환경에서 이해되도록 하기 때문에 대부분의 경우에 상당한 이점을 제공한다.
그러나, 대부분의 경우, 개방형 사무실 공간 등에서는, 화자에 대한 프라이버시를 제공하거나 가청 영역 내 사람들의 주의가 산만해 지는 것을 감소하기 위해 음성을 마스킹하는 것이 매우 바람직하다. 이러한 경우에, 배경 잡음의 존재시에 음성을 식별하는 인간의 능력은 특별한 도전이다. 예를 들어, 백색 잡음 또는 핑크 노이즈와 같은 확률성 잡음의 단순한 도입은, 기본적인 음성이 더이상 이해되지 않기 전에 도입된 잡음의 진폭이 불수용 레벨로 증가되어야 한다는 점에서, 전형적으로 성공할 수 없다.
따라서, 음성을 마스킹하고자 하는 많은 종래의 기술은, 음성의 스트림이 난해해지기 위해 요구되는 잡음의 세기를 낮추는 노력으로, 잡음을 마스킹하는 특수한 형태를 발생시키는데 촛점을 맞춰왔다. 예를 들어, 미국 특허 3,985,957(Torn)은 "개방형 사무실에서 대화를 마스킹" 하는 "사운드 마스킹 시스템"("sound masking system" for "masking conversation in an open plan office")을 공개한다. 여기서, "종래의 전기 랜덤 잡음 전류의 발생기는 그 출력을 상기 사무실 공간 위 플래넘(planum)에서 스피커 클러스터에 대한 조절가능한 전기 필터 수단을 통해 공급한다." 그러한 정교성(sophistication)에도 불구하고, 대부분의 경우 대화가 마스킹되기 위해 요구되는 배경 잡음의 레벨은 사실상 여전히 매우 불수용적이다.
더 복잡한 물리적 구성으로 마이크로폰 및 스피커를 배치하고 활성 잡음(active noise) 소거 알고리즘으로 이를 제어함으로써 더 이산적으로 마스킹하는 것을 제공하는 다른 접근법이 시도되었다. 예를 들어, 미국 특허 5,315,661(Gossman)은 "센서, 액츄에이터 및 활성 제어 시스템을 사용하여 패널을 통해(로부터) 사운드 전송을 제어하는" 시스템(system for "controlling sound transmission through (from) a panel using sensors, actuators and an active control system")을 기술한다. 상기 방법은 대형 패널을 형성하도록 차례로 결합되는 다수의 소형 패널 셀을 통해 사운드 전송을 제어하기 위해 활성 구조 음성 제어를 사용한다. 상기 발명은 "두껍고 무거운 패시브 방음 물질, 또는 사운드 무반향 물질(thick and heavy passive sound isolation material, or anechoic material)의 대체물"로서 역할을 하도록 한다. 그러한 시스템은 이론상 효과적이나, 실제로 구현하기가 어렵고, 과중한 비용이 종종 부과된다.
모호함(obfuscation)(종종 스크램블링(scrambling)이라고도 함)을 수행하는 몇가지 기술이 종래 기술에서 또한 발견되어진다. 미국 특허 4,068,094 (Schmid 등)은 "먼저 음성 주파수를 두개의 주파수 대역으로 분리하고 음성 정보를 변조하여 그 순서를 바꿈으로써 음성 전송을 스크램블링 또는 언스크램블링하는 방법"을 기술한다.
다소 다른 접근 방법으로, 미국 특허 4,099,027(Whitten)은 시간 영역에서 우선적으로 동작하는 시스템을 공개한다. 특히, "비보안 통신 채널로 전송하는 통신 신호를 난해하게 하는 음성 스크램블러는 시스템의 스크램블링부에 시간 지연 변조기와 코딩 신호 발생기 및 시스템의 언스크램블링부에 유사한 시간 지연 변조기와 역 신호를 발생시키는 코딩 발생기를 포함한다."
이러한 방법들은, 오리지널 음성 스트림 대신에 모호한 음성 스트림(obfuscated stream of speech)이 있을 때, 난해하고 모호한 음성 스트림을 생성하는데 효과적이다. 그러나, 이들은 모호한 음성 스트림의 중첩을 통해 음성 스트림을 난해하게 하는데는 덜 효과적이다. 이는 사무실 환경에서 대화를 마스킹하는 애플리케이션에 대해 중대한 결함을 나타내는데, 오리지날 음성 스트림에 대한 모호한 음성 스트림의 직접 대체는 불가능하지 않다면 비실용적이다. 게다가, 스크램블링의 특성(nature)으로 인해, 상기 모호한 음성 스트림은 수화자에게 음성처럼(speech-like) 들리지 않는다. 개방형 사무실과 같은 환경에서, 모호한 음성 스트림은 따라서 오리지날 음성 스트림보다 더 산만함을 입증할 수 있다.
미국 특허 4,195,202(McCalmont)는 사실상 이해가 조금 어려운 혼성 스트림(composit stream)을 생성할 수 있는 이러한 시스템에 대한 개선을 제안하고 있으나, 음성 같은 스크램블형 신호에 대한 필요를 다루고 있지 않다. 사실, 인간 음성의 키 특징(key features) 중의 하나를 경감하기 위한 특정 노력이 이루어졌다. "먼저 인코딩 장치가 전송될 보이스 신호를 둘 이상의 주파수 대역으로 분리한다. 하나 이상의 주파수 대역은 다른 주파수 대역과 시간 관련되어 전도, 지연되고 다음으로 원격 수신기에 전송을 위한 혼성 신호를 생성하는 다른 주파수 대역과 재결합되는 주파수이다. 보이스 신호가 대응하는 음성의, 마침꼴(cadence), 음절간(intersyllabic) 및 음소(phoneme) 발생율의 대략의 시간 상수에 대한 지연의 크기를 선택함으로써, 혼성 신호의 진폭 변동이 실질적으로 경감되고 신호의 마침꼴 컨텐츠가 효과적으로 위장된다."
개방형 사무실과 같은 환경에서 음성 스트림을 마스킹하는 간단하고 효과적인 시스템이 요구되는데, 여기서 모호한 음성 스트림이 오리지날 음성 스트림에 대체될 수 없고, 단지 추가된다. 상기 방법은 사실상 매우 난해한 음성 같은 모호한 음성 스트림을 제공하여야 한다. 또한, 오리지날 음성 스트림 및 모호한 음성 스트림의 조합은 또한 매우 난해한 음성 같은 결합된 음성 스트림을 생성하여야 한다.
도 1은 본 발명의 현재 바람직한 실시예에 따른 개방형 사무실에서 음성 스트림을 마스킹하는 장치를 도시한 도면이다.
도 2는 본 발명의 현재 바람직한 실시예에 따른 모호한 음성 신호를 생성하는 방법을 도시하는 흐름도이다.
도 3은 본 발명의 현재 바람직한 실시예에 따른 음성 신호를 세그먼트로 일시적으로 분할하고 세그먼트들을 저장하는 방법을 도시하는 상세한 흐름도이다.
도 4는 본 발명의 현재 바람직한 실시예에 따른 세그먼트들을 선택, 검색, 및 조합하는 방법을 도시하는 상세한 흐름도이다.
본 발명은 음성 스트림을 마스킹하는데 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 제공하는 것이다. 마스킹될 음성 스트림을 나타내는 음성 신호가 획득된다. 상기 음성 신호는 다음으로, 바람직하게는 음성 스트림내 음소에 대응하는 세그먼트로 일시적으로 분할된다. 상기 세그먼트들은 다음으로 메모리에 저장되고, 세그먼트의 일부 또는 모두는 이어서 선택(select), 검색(retrieve), 및 음성 신호와 결합되거나 음성 스트림으로 재생성되고 결합될 때, 마스킹 효과를 제공하는, 난해한 음성 스트림을 나타내는 모호한 음성 신호로 조합(assembly)된다.
상기 모호한 음성 신호는 음성 스트림의 직접적인 마스킹을 허여하는, 실질적으로 실시간으로 생성되거나, 기록된 음성 신호로부터 생성될 수 있다. 모호한 음성 신호 생성시, 음성 신호내 세그먼트는 일 대 일 형식으로 재정리(reorder)될 수 있고, 세그먼트는 음성 신호내 세그먼트의 최근 히스토리로부터 무작위로 선택되고 검색될 수 있고, 또는 세그먼트는 분류되거나 식별되고 다음으로 음성 신호내 발생 주파수와 같은 정도의 상대 주파수로 선택된다. 최종적으로, 하나 이상의 선택, 검색, 및 조합 과정이 하나 이상의 모호한 음성 신호를 생성하는 것과 동시에 수행될 수 있는 것이 가능하다.
본 발명의 현재의 바람직한 실시예가 개방형 사무실과 같은 경우에 아주 쉽게 발견되나, 대안의 실시예가 예를 들어, 식당, 교실, 및 통신 시스템에서 발견될 수 있다.
본 발명은 음성 스트림을 마스킹하기 위해 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 제공한다.
도 1은 본 발명의 현재 바람직한 실시예에 따른 개방형 사무실에서 음성 스트림을 마스킹하는 장치를 도시한 도면이다. 제1 큐비클(first cubicle)(21)내의 발화중인 회사원(speaking office worker)(11)이 개인적인 대화를 원한다. 인접한 큐비클(22)과 발화중인 회사원의 큐비클을 분리하는 파티션(partition)(30)은 인접한 큐비클내 청취하는 회사원(listening office worker)(12)이 대화를 엿듣는 것을 방지 할 수 있는 충분한 방음(acoustic isolation)을 제공하지 않는다. 이러한 상황은 발화중인 회사원의 프라이버시를 부정하고 청취하는 회사원을 산만하게 하고, 더 나쁘게는 비밀 대화를 엿들을 수 있기 때문에 바람직하지 않다.
도 1은 본 발명의 현재 바람직한 실시예가 이러한 상황을 개선할 수 있는 방법을 설명한다. 마이크로폰(40)은 발화중인 회사원(11)으로부터 나오는 음성 스트림을 습득할 수 있는 위치에 배치된다. 바람직하게는, 상기 마이크로폰은 원하는 음성 스트림 외의 최소 청각 정보가 포착될 수 있는 위치에 장착된다. 실질적으로 상기 발화중인 회사원(11) 위, 그러나 여전히 제1 큐비클(21) 내인 위치가 만족스러운 결과를 제공할 수 있다.
마이크로폰에 의해 획득된 음성 스트림을 나타내는 신호는 음성 스트림을 구성하는 음소들(phonemes)을 식별하는 프로세서(100)에 제공된다. 실시간으로 또는 실시간에 가까운 정도로, 모호한 음성 신호(obfuscated speech signal)가 식별된 음소들에 유사한 음소들의 시퀀스로부터 발생된다. 모호한 음성 스트림으로 재생될 때, 상기 모호한 음성 신호는 음성 같으나(speech-like), 난해(unintelligible)하다.
상기 모호한 음성 스트림은, 하나 이상의 스피커(50)를 사용하여, 인접한 큐비클(22) 내의 청취하는 회사원(12)을 포함하여, 발화중인 회사원의 대화 내용을 엿들을 가능성이 있는 회사원들에게 재생되어 표현된다. 오리지날 음성 스트림상에 중첩되어 들릴 때, 상기 모호한 음성 스트림은 난해한 혼성 음성 스트림을 산출하고, 따라서 오리지날 음성 스트림을 마스킹한다. 바람직하게는, 상기 모호한 음성 스트림은 오리지날 음성 스트림의 세기에 필적하는 세기로 표현된다. 생각컨대, 청취하는 회사원은 전형적인 인간 음성과 같은 정도의 세기로 제1 큐비클로부터 나오는 음성 같은 사운드를 듣는데 꽤 익숙해져 있다. 그러므로 청취하는 회사원이 본 발명에 의해 제공되는 혼성 음성 스트림에 의해 산만해지지 않을 것이다.
스피커(50)는 바람직하게는 청취하는 회사원에게는 들리나 발화중인 회사원에게는 들리지 않는 위치에 배치된다. 추가로, 청취하는 회사원이 지향성 큐(directional cue)를 사용하여 오리지날 음성 스트림을 모호한 음성 스트림과 분리할 수 없도록 주의를 기울여야 한다. 다중 스피커는, 서로 동일 평면상에 놓이지 않도록 배치되는 것이 바람직하고, 발화중인 회사원으로부터 나오는 오리지날 음성 스트림을 더 효과적으로 마스킹하는 복합 사운드 필드를 생성하기 위해 사용될 수 있다. 또한, 상기 시스템은, 스피커의 위치, 예를 들어 마이크로폰의 위치에 기초하여, 스피커의 위치에 대한 정보를 사용할 수 있고, 음성 마스킹의 최적의 분산을 달성하도록 다수의 스피커를 활성/비활성시킬 수 있다. 여기서, 개방형 사무실 환경은 스피커를 제어하고 다중 위치로부터 파생된 많은 모호한 대화를 믹싱하도록 모니터링됨으로써 몇몇 대화가 일어나고, 동시에, 마스킹된다. 예를 들어, 상기 시스템은 몇몇 마이크로폰으로부터 파생된 정보에 기초하여 다수의 스피커에 신호를 지시하고 가중할 수 있다.
도 2는 본 발명의 현재 바람직한 실시예에 따른 모호한 음성 신호를 생성하는 방법을 도시하는 흐름도이다. 바람직한 실시예에서, 이 방법은 도 1의 프로세서(100)에 의해 수행된다. 마스킹될 음성 스트림을 나타내는 음성 신호(200)는 도 1에서 도시된 바와 같이, 마이크로폰 또는 유사한 소스로부터 획득(단계 110)된다. 음성 신호(s(t))는 바람직하게는 일련의 이산 디지털 값(s(n))으로 획득되고 이어서 처리된다. 바람직한 실시예에서, 마이크로폰(40)이 아날로그 신호를 제공하고, 상기 신호는 아날로그/디지털 컨버터에 의해 디지털화될 것을 요구한다.
일단 획득된, 상기 음성 신호는 세그먼트(250)로 일시적으로 분할(단계 120)된다. 전술된 바와 같이, 상기 세그먼트는 음성 스트림 내 음소에 대응한다. 다음으로 상기 세그먼트는 메모리(135)에 저장(단계 130)되고, 따라서 선택된 세그먼트가 이어서 선택(단계 138), 검색(단계 140), 및 조합(단계 150) 될 수 있다. 조합 동작 결과는 모호한 음성 스트림을 나타내는 모호한 음성 신호(300)이다.
다음으로 상기 모호한 음성 신호는, 바람직하게는 도 1에 도시된 바와 같이 하나 이상의 스피커를 통해 재생될 수 있다. 바람직한 실시예에서, 하나 이상의 스피커는 아날로그 입력 신호를 요구하고, 디지털/아날로그 컨버터의 사용을 요구할 수 있다. 대안으로, 상기 음성 신호와 모호한 음성 신호가 결합되고, 결합된 신호가 재생성 될 수 있다.
상기 과정을 통한 데이터의 흐름이 도 2에서 보여지고 있으나, 상세한 동작은 실시간으로 실질적으로 데이터의 정상 상태 처리(steady state processing of data)를 제공함을 이해하는 것이 중요하다. 대안으로, 상기 과정은 사전-기록된 음성 신호에 적용되는 후-처리 동작으로 수행될 수 있다.
신호 세그먼트의 선택(단계 138), 검색(단계 140), 및 조합(단계 150)은 몇몇 방법 중의 하나로 성취될 수 있다. 특히, 음성 신호 내 세그먼트는 일 대 일 방법으로 재정리될 있고, 세그먼트는 음성 신호 내 세그먼트의 최근 히스토리로부터 무작위적으로 선택되고 검색될 수 있고, 세그먼트는 분류되거나 식별되고 다음으로 음성 신호 내 발생 주파수와 같은 크기의 상대 주파수로 선택될 수 있다. 또한, 몇몇 선택, 검색, 및 조합 과정은 몇몇 모호한 음성 신호를 생성하는데 동시에 수행될 수 있다.
도 3은 본 발명의 현재 바람직한 실시예에 따른 음성 신호를 세그먼트로 일시적으로 분할하고 세그먼트들을 저장하는 방법을 도시하는 상세한 흐름도이다. 여기서, 신호를 세그먼트로 일시적으로 분할하고 도 2에 도시된 메모리에 상기 세그먼트를 저장하는 것이 더 상세히 도시되어 있다. 분할 동작은 분할 결과 세그먼트가 음성 스트림 내 음소에 대응하는 방법으로 수행된다.
음성 신호(200)를 세그먼트로 분할하기 위해, 음성 신호는 제곱(단계 122)되고, 그 결과 신호(s2(n))는 세개의 시간 스케일, 즉, 단시간 스케일(Ts); 중간시간 스케일(Tm); 및 장시간 스케일(Tl)로 평균(단계 1231, 1232, 1233)된다. 상기 평균화는 바람직하게는 다음 표현식에 따라, 평균(Vi)의 어림 계산(calculation of running estimates of the averages)을 통해 수행된다.
Vi(n+1)=ais(n)=(1-ai)Vi(n), E[l,m,s]. (1)
이는, 다음을 갖는, Ni 샘플들의 슬라이딩 윈도우 평균(sliding window average of Ni samples)과 대략 동일하다.
(2)
여기서, f는 샘플링 레이트(sampling rate)이고 Ti는 시간 스케일이다.
바람직하게, 단시간 스케일(Ts)은 전형적인 음소의 듀레이션(duration of a typical phoneme) 특징으로 선택되고 중간시간 스케일(Tm)은 전형적인 단어(typical word)의 듀레이션 특징으로 선택된다. 장시간 스케일(Tl)은 전체적으로 음성 스트림의 앱 앤 플로우(ebb and flow) 특징의, 대화 시간 스케일이다. 본 발명의 현재 바람직한 실시예에서, 0.125, 0.250, 및 1.00 sec의 값이 각각 수용 가능한 시스템 수행에 제공되었으나, 본 발명의 이 실시예가 다른 시간 스케일 값으로 실시될 수 있음은 관련 분야 숙련자에게 이해될 것이다. 중간 시간 스케일 평균(단계 1232)의 결과는 가중(weighting)(125) 방법에 의해 곱해지고(단계 124), 다음으로 단시간 스케일 평균(단계 1231)의 결과로부터 빼진다(단계 126). 바람직하게는, 가중의 값은 0과 1 사이이고, 사실상, 1/2의 값이 수용가능함이 입증되었다.
그 결과 신호는 제로 크로싱(zero crossing)을 검출(단계 127)하도록 모니터링된다. 제로 크로싱이 검출되면, 참값이 복귀된다. 제로 크로싱은 중간시간 스케일 평균에 의해 탐지될 수 없는 음성 신호 에너지의 단시간 스케일 평균에서 급속한 증가 또는 감소를 반영한다. 따라서 제로 크로싱은 연속의 음소들 사이에서, 음소와 다음의 상대 정적(relative silence) 기간 사이에서, 또는 상대 정적 기간과 다음의 음소 사이에서 트랜지션(transition)이 발생하는 시간의 표시를 제공하는, 일반적으로 음소 경계에 대응하는 에너지 경계를 표시한다.
장시간 평균(단계 1233)의 결과는 임계 연산자(threshold operator)(128)로 전해진다. 상기 임계 연산자는 장시간 평균이 상한 임계값을 넘으면 "참"을 리턴하고 장시간 평균이 하한 임계값 아래이면 "거짓"을 리턴한다. 본 발명의 몇가지 실시예에서, 상기 상한 및 하한 임계값은 같을 수 있다. 바람직한 실시예에서, 임계 연산자는 상이한 상한 및 하한 임계값을 갖는, 사실상 히스터레틱(hysteretic)하다.
음성 신호(200)가 존재하고 그리고(1292) 임계 연산자(128)가 참값을 리턴하면, 음성 신호는 메모리(135)에 상주하는 버퍼들의 어레이 내에서 버퍼(136)에 저장된다. 신호가 저장되는 특정 버퍼는 저장 카운터(132)에 의해 결정된다.
제로 크로싱이 검출(단계 127)되고 그리고(1291) 임계 연산자(128)가 "참"값을 리턴하면, 저장 카운터(132)는 증분(단계 131)되고, 메모리(135) 내 버퍼들의 어레이 내에서 다음 버퍼(136)에 저장이 시작된다. 이러한 방법으로, 버퍼들의 어레이 내 각 버퍼는, 검출된 제로 크로싱에 의해 분할되고, 음성 신호의 음소 또는 인터스티셜 정적(interstitial silence)으로 채워진다. 버퍼들의 어레이 내 마지막 버퍼에 도달되면, 카운터는 리셋되고 제1 버퍼의 컨텐츠는 다음 음소 또는 인터스티셜 정적으로 대체된다. 따라서, 버퍼는 축적되고 다음으로 음성 신호내에 존재하는 세그먼트의 최근 히스토리를 유지한다.
본 방법은 음성 신호가 음소에 대응하는 세그먼트로 분할될 수 있는 다수의 방법 중 하나만을 나타낸 것이다. 연속 음성 인식 소프트웨어 패키지에 사용되는 것들을 포함하여 다른 알고리즘들이 또한 채용될 수 있다.
도 4는 본 발명의 현재 바람직한 실시예에 따른 세그먼트들을 선택, 검색, 및 조합하는 방법을 도시하는 상세한 흐름도이다. 여기서, 도 2에서 도시된 바와 같이 세그먼트를 선택(단계 138), 메모리로부터 세그먼트를 검색(단계 140) 및 세그먼트를 모호한 음성 신호로 조합(단계 150)하는 단계들이 상세히 도시되어 있다.
난수 발생기(random number generator)(144)는 검색 카운터(142)의 값을 결정하기 위해 사용된다. 카운터의 값에 의해 지시되는 버퍼(136)는 메모리(135)로부터 판독된다. 버퍼의 끝에 도달할 때, 난수 발생기는 검색 카운터에 또다른 값을 제공하고, 또다른 버퍼는 메모리로부터 판독된다. 버퍼의 컨텐츠는 연쇄 동작(catenation operation)(단계 152)을 통해 사전 판독된 버퍼의 컨텐츠에 추가되어 모호한 음성 신호(300)를 구성한다. 이러한 방법으로, 음성 신호(200) 내 세그먼트의 최근 히스토리를 반영하는 신호 세그먼트의 무작위 시퀀스가 결합되어 모호한 음성 신호(300)를 형성한다.
액티브한 대화의 순간 동안에만 마스킹을 제공하고자 하는 경우가 종종 있다. 따라서, 바람직한 실시예에서는, 버퍼가 가용이고 그리고(139) 도 3의 임계 연산자(128)가 "참"값을 리턴하면 버퍼들은 메모리로부터 판독만될 수 있다.
몇가지 다른 주목할 만한 특징들이 또한 본 발명의 현재 바람직한 실시예에 병합되었다. 먼저, 최소 세그먼트 길이가 시행된다. 제로 크로싱이 최소 세그먼트 길이 이하의 음소 또는 인터스티셜 정적을 지시한다면, 제로 크로싱이 무시되고 저장이 메모리(135) 내의 버퍼들의 어레이 내 현재 버퍼(136)에 계속된다. 또한, 버퍼 어레이 내 각 버퍼의 사이즈에 의해 결정되고, 최대 음소 길이가 시행된다. 저장하는 동안, 최대 음소 길이를 넘는다면, 제로 크로싱이 추론되고, 저장이 버퍼들의 어레이 내 다음 버퍼에 시작된다. 버퍼들의 어레이 내의 저장과 버퍼들의 어레이로부터의 검색 간 충돌을 피하기 위해, 특정 버퍼가 현재 판독되고 저장 카운터(132)에 의해 동시에 선택된다면, 저장 카운터는 다시 증분되고, 저장이 버퍼들의 어레이 내 다음 버퍼에 시작된다.
최종적으로, 연쇄 동작(152) 동안, 검색 카운터(142)에 의해 선택된 세그먼트의 헤드(head) 및 테일(tail)로 성형 함수(shaping function)를 적용하는 것이 바람직할 수 있다. 성형 함수는 모호한 음성 신호에서 연속의 세그먼트들 간의 더 부드러운 트랜지션(smooth transition)을 제공하고, 그럼으로써 재생(단계 160)시 더 자연스러운 소리를 내는 음성 스트림을 산출한다. 바람직한 실시예에서, 삼각 함수를 이용하여 각 세그먼트는 세그먼트의 헤드에서 부드럽게 위로 램핑되고 세그먼트의 테일에서 아래로 램핑된다. 상기 램핑은 최소 허용가능한 세그먼트보다 단축된 시간 스케일에 대해 수행된다. 이러한 마무리(smoothing)는 모호한 음성 신호 내 연속의 세그먼트들 간 트랜지션에서 가청 팝(pops), 클릭(clicks), 및 틱(ticks)을 경감시키는 역할을 한다.
여기서 기술되는 마스킹 방법은 사무실 공간 외 환경에서 사용될 수 있다. 일반적으로, 개인적인 대화를 엿들을 수 있는 경우에 채용될 수 있다. 그러한 공간으로는 예를 들어, 혼잡한 주거 공간, 공중 전화 부스, 및 식당 등이 포함된다. 상기 방법은 이해가능한 음성 스트림(intelligible stream of speech)이 흩어지는 상황에서 또한 사용될 수 있다. 예를 들어, 개방형 공간의 교실에서, 한 구획된 영역에 있는 학생들은 간섭성의 음성 스트림에 의해서 보다 인접 영역으로부터 나오는 난해한 보이스 같은 음성 스트림에 의해 덜 산만해질 수 있다.
본 발명은 또한 현실 에뮬레이션이나 난해한 보이스 같은 배경 잡음에 쉽게 확장될 수 있다. 이 애플리케이션에서, 상기 수정된 신호는 사전에 획득된 보이스 기록으로부터 발생될 수 있고, 그렇지 않으면 조용한 환경에서 나타내질 수 있다. 그 결과 사운드는 하나 이상의 대화가 가까이에서 수행되고 있다는 환상(illusion)을 나타낸다. 이러한 애플리케이션은 예를 들어, 식당에서, 식당주가 비교적 빈 식당이 다수의 고객들에 의해 차지되고 있다는 환상을 조성하고자 할 때, 또는 다수의 인파가 있다는 느낌을 주는 연기 제품(theatrical production)에 유용할 것이다.
채용된 특정 마스킹 방법이 두 통신측에 알려지면, 상술된 기술을 사용하여 오디오 신호를 비밀리 전송하는 것이 가능할 수 있다. 이 경우, 음성 신호는 모호한 음성 신호의 중첩에 의해 마스킹될 수 있고, 수신시 마스킹되지 않을 수 있다. 사용되는 특정 알고리즘이 통신측에만 알려진 키(key)에 의해 도입되어, 그럼으로써 전송을 차단하고 마스킹되지 않도록 하는 제 3자에 의한 시도를 방해할 수 있는 것이 또한 가능하다.
여기서 본 발명이 바람직한 실시예를 참조하여 기술되었으나, 본 발명의 기술 분야에 숙련된 자라면 본 발명의 사상과 범위를 벗어나지 않고 전술된 실시예를 대체할 수 있는 다른 애플리케이션이 가능함을 쉽게 이해할 것이다.

Claims (58)

  1. 이해가능한 음성으로부터 실질적으로 난해하고, 모호한 음성 신호를 생성하는 방법에 있어서,
    음성 스트림을 나타내는 음성 신호를 획득하는 단계;
    상기 음성 신호를 다수의 세그먼트로 일시적으로 분할하는 단계로서, 상기 세그먼트가 상기 음성 신호 내 초기 순서로 발생하는, 상기 분할 단계;
    상기 세그먼트 중에서 다수의 선택된 세그먼트를 선택하는 단계;
    상기 초기 순서와 상이한 순서로, 상기 모호한 음성 신호를 생성하기 위해, 상기 선택된 세그먼트를 조합하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 일시적으로 분할하는 단계에 바로 이어서, 상기 세그먼트를 메모리에 저장하는 단계를 더 포함하고;
    상기 선택 단계에 바로 이어서, 상기 메모리로부터 상기 선택된 세그먼트를 검색하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  3. 제1항에 있어서, 상기 모호한 음성 신호는 실질적으로 실시간으로 생성되는 것을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 음성 신호는 사전에 기록된 음성 스트림을 나타내는 것을 특징으로 하는 방법.
  5. 제1항에 있어서, 상기 모호한 음성 신호는 난해한 배경 대화를 시뮬레이트하는 것을 특징으로 하는 방법.
  6. 제1항에 있어서, 상기 모호한 음성 신호는 텔레커뮤니케이션 네트워크를 통해 전송되는 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 상기 조합 단계에 바로 이어서, 결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 단계를 더 포함하며;
    상기 결합된 신호가 실질적으로 난해한 음성 스트림을 포함하는 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 조합 단계에 바로 이어서, 모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 단계, 및
    결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 단계를 포함하며;
    상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 음성 신호는 마이크로폰으로부터 획득되는 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 모호한 음성 신호는 라우드스피커에 의해 재생되는 것을 특징으로 하는 방법.
  11. 제1항에 있어서, 상기 음성 신호는 사무실 환경으로부터 획득되는 것을 특징으로 하는 방법.
  12. 제1항에 있어서, 상기 선택된 세그먼트는 상기 음성 스트림 내 각 세그먼트를 포함하는 것을 특징으로 하는 방법.
  13. 제2항에 있어서, 상기 선택된 세그먼트는 상기 음성 신호 내에 존재하는 세그먼트의 최근 히스토리를 포함하는 상기 메모리 내 다수의 세그먼트로부터 선택되는 것을 특징으로 하는 방법.
  14. 제13항에 있어서, 상기 선택된 세그먼트는 상기 메모리 내에 포함된 상기 다수의 세그먼트로부터 무작위적으로 선택되는 것을 특징으로 하는 방법.
  15. 제13항에 있어서, 상기 선택된 세그먼트 각각은 상기 음성 신호 내 발생 상대 주파수와 같은 크기의 상대 주파수로 선택되는 것을 특징으로 하는 방법.
  16. 제1항에 있어서, 상기 음성 신호는 디지털 값의 시퀀스를 포함하는 것을 특징으로 하는 방법.
  17. 제1항에 있어서, 상기 세그먼트는 상기 음성 스트림 내 음소를 나타내는 것을 특징으로 하는 방법.
  18. 제17항에 있어서, 상기 음소는 연속 음성 인식 시스템을 사용하여 결정되는 것을 특징으로 하는 방법.
  19. 제17항에 있어서, 상기 일시적으로 분할하는 단계는,
    상기 음성 신호를 제곱하는 단계;
    단시간 스케일에 대한 상기 음성 신호의 단시간 평균을 계산하는 단계;
    중간시간 스케일에 대한 상기 음성 신호의 중간시간 평균을 계산하는 단계;
    상기 단시간 평균 및 상기 중간시간 평균 사이의 차이를 계산하는 단계; 및
    상기 차이에서 제로 크로싱을 검출하는 단계를 포함하며,
    상기 제로 크로싱이 상기 세그먼트를 묘사하는 것을 특징으로 하는 방법.
  20. 제19항에 있어서, 상기 단시간 스케일은 상기 음성 스트림에 전형적인 음소의 길이를 부여하는 것을 특징으로 하는 방법.
  21. 제19항에 있어서, 상기 중간시간 스케일은 상기 음성 스트림에 전형적인 단어의 길이를 부여하는 것을 특징으로 하는 방법.
  22. 제2항에 있어서, 상기 저장 단계는,
    상기 음성 신호를 제곱하는 단계;
    장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 단계;
    상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 단계;
    상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리에 상기 세그먼트의 상기 저장을 중지하는 단계; 및
    상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리에 상기 세그먼트의 상기 저장을 재개하는 단계를 포함하는 것을 특징으로 하는 방법.
  23. 제22항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 방법.
  24. 제2항에 있어서, 상기 검색 단계는,
    상기 음성 신호를 제곱하는 단계;
    장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 단계;
    상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 단계;
    상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 중지하는 단계; 및
    상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 재개하는 단계를 포함하는 것을 특징으로 하는 방법.
  25. 제24항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 방법.
  26. 제1항에 있어서, 상기 조합 단계는, 상기 선택된 세그먼트 각각에 성형 함수를 적용하는 단계를 포함하며;
    상기 성형 함수가 상기 모호한 음성 신호 내 연속의 세그먼트 간 부드러운 트랜지션을 제공하는 것을 특징으로 하는 방법.
  27. 제1항에 있어서, 상기 선택 및 조합 단계는 상기 음성 신호로부터 다수의 상기 모호한 음성 신호를 동시에 생성하는 것을 특징으로 하는 방법.
  28. 음성 스트림을 마스킹하는 방법에 있어서,
    상기 음성 스트림을 나타내는 음성 신호를 획득하는 단계;
    모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 단계; 및
    결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 단계를 포함하며,
    상기 결합된 음성 신호가 실질적으로 난해한 결합된 음성 스트림을 나타내는 것을 특징으로 하는 방법.
  29. 음성 스트림을 마스킹하는 방법에 있어서,
    상기 음성 스트림을 나타내는 음성 신호를 획득하는 단계;
    모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 단계;
    모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 단계; 및
    결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 단계를 포함하며,
    상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 방법.
  30. 이해가능한 음성으로부터 실질적으로 난해하고, 모호한 음성 신호를 생성하는 장치에 있어서,
    음성 스트림을 나타내는 음성 신호를 획득하는 모듈;
    상기 음성 신호를 다수의 세그먼트로 일시적으로 분할하는 모듈로서, 상기 세그먼트가 상기 음성 신호 내에서 초기 순서로 발생되는, 상기 분할 모듈;
    상기 세그먼트 중에서 다수의 선택된 세그먼트를 선택하는 모듈; 및
    상기 초기 순서와 상이한 순서로, 상기 모호한 음성 신호를 생성하기 위해, 상기 선택된 세그먼트를 조합하는 모듈을 포함하는 것을 특징으로 하는 장치.
  31. 제30항에 있어서,
    상기 세그먼트를 저장하는 메모리; 및
    상기 메모리로부터 상기 선택된 세그먼트를 검색하는 모듈을 포함하는 것을 특징으로 하는 장치.
  32. 제30항에 있어서, 상기 모호한 음성 신호는 실질적으로 실시간으로 생성되는 것을 특징으로 하는 장치.
  33. 제30항에 있어서, 상기 음성 신호는 사전에 기록된 음성 스트림을 나타내는 것을 특징으로 하는 장치.
  34. 제30항에 있어서, 상기 모호한 음성 신호는 난해한 배경 대화를 시뮬레이트하는 것을 특징으로 하는 장치.
  35. 제30항에 있어서, 상기 모호한 음성 신호를 텔레커뮤니케이션 네트워크를 통해 전송하는 모듈을 더 포함하는 것을 특징으로 하는 장치.
  36. 제30항에 있어서, 결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 모듈을 더 포함하며;
    상기 결합된 신호가 실질적으로 난해한 음성 스트림을 포함하는 것을 특징으로 하는 장치.
  37. 제30항에 있어서, 모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 모듈, 및
    결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 모듈을 포함하며;
    상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 장치.
  38. 제30항에 있어서, 상기 음성 신호를 획득하는 마이크로폰을 더 포함하는 것을 특징으로 하는 장치.
  39. 제30항에 있어서, 상기 모호한 음성 신호를 재생하는 라우드스피커를 더 포함하는 것을 특징으로 하는 장치.
  40. 제30항에 있어서, 상기 음성 신호는 사무실 환경으로부터 획득되는 것을 특징으로 하는 장치.
  41. 제31항에 있어서, 상기 선택된 세그먼트는 상기 음성 스트림 내 각 세그먼트를 포함하는 것을 특징으로 하는 장치.
  42. 제31항에 있어서, 상기 선택된 세그먼트는 상기 음성 신호 내에 존재하는 세그먼트의 최근 히스토리를 포함하는 상기 메모리 내 다수의 세그먼트로부터 선택되는 것을 특징으로 하는 장치.
  43. 제42항에 있어서, 상기 선택된 세그먼트는 상기 메모리 내에 포함된 상기 다수의 세그먼트로부터 무작위적으로 선택되는 것을 특징으로 하는 장치.
  44. 제42항에 있어서, 상기 선택된 세그먼트 각각은 상기 음성 신호 내 발생 상대 주파수와 같은 크기의 상대 주파수로 선택되는 것을 특징으로 하는 장치.
  45. 제30항에 있어서, 상기 음성 신호는 디지털 값의 시퀀스를 포함하는 것을 특징으로 하는 장치.
  46. 제30항에 있어서, 상기 세그먼트는 상기 음성 스트림 내 음소를 나타내는 것을 특징으로 하는 장치.
  47. 제46항에 있어서, 상기 음소는 연속 음성 인식 시스템을 사용하여 결정되는 것을 특징으로 하는 장치.
  48. 제30항에 있어서, 상기 일시적으로 분할하는 모듈은,
    상기 음성 신호를 제곱하는 모듈;
    단시간 스케일에 대한 상기 음성 신호의 단시간 평균을 계산하는 모듈;
    중간시간 스케일에 대한 상기 음성 신호의 중간시간 평균을 계산하는 모듈;
    상기 단시간 평균 및 상기 중간시간 평균 사이의 차이를 계산하는 모듈; 및
    상기 차이에서 제로 크로싱을 검출하는 모듈을 포함하며,
    상기 제로 크로싱이 상기 세그먼트를 묘사하는 것을 특징으로 하는 장치.
  49. 제48항에 있어서, 상기 단시간 스케일은 상기 음성 스트림에 전형적인 음소의 길이를 부여하는 것을 특징으로 하는 장치.
  50. 제48항에 있어서, 상기 중간시간 스케일은 상기 음성 스트림에 전형적인 단어의 길이를 부여하는 것을 특징으로 하는 장치.
  51. 제31항에 있어서, 상기 메모리는,
    상기 음성 신호를 제곱하는 모듈;
    장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 모듈;
    상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 모듈;
    상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리에 상기 세그먼트의 상기 저장을 중지하는 모듈; 및
    상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리에 상기 세그먼트의 상기 저장을 재개하는 모듈을 더 포함하는 것을 특징으로 하는 장치.
  52. 제51항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 장치.
  53. 제31항에 있어서, 상기 검색 모듈은,
    상기 음성 신호를 제곱하는 모듈;
    장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 모듈;
    상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 모듈;
    상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 중지하는 모듈; 및
    상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 재개하는 모듈을 포함하는 것을 특징으로 하는 장치.
  54. 제53항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 장치.
  55. 제30항에 있어서, 상기 조합 모듈은, 상기 선택된 세그먼트 각각에 성형 함수를 적용하는 모듈을 포함하며;
    상기 성형 함수가 상기 모호한 음성 신호 내 연속의 세그먼트 간 부드러운 트랜지션을 제공하는 것을 특징으로 하는 장치.
  56. 제30항에 있어서, 상기 선택 및 조합 모듈은 상기 음성 신호로부터 다수의 상기 모호한 음성 신호를 동시에 생성하는 것을 특징으로 하는 장치.
  57. 음성 스트림을 마스킹하는 장치에 있어서,
    상기 음성 스트림을 나타내는 음성 신호를 획득하는 모듈;
    모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 모듈; 및
    결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 모듈을 포함하며,
    상기 결합된 음성 신호가 실질적으로 난해한 결합된 음성 스트림을 나타내는 것을 특징으로 하는 장치.
  58. 음성 스트림을 마스킹하는 장치에 있어서,
    상기 음성 스트림을 나타내는 음성 신호를 획득하는 모듈;
    모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 모듈;
    모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 모듈; 및
    결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 모듈을 포함하며,
    상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 장치.
KR20057001192A 2002-07-24 2003-07-10 음성 마스킹 시스템 및 그 방법 KR100695592B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/205,328 2002-07-24
US10/205,328 US7143028B2 (en) 2002-07-24 2002-07-24 Method and system for masking speech
PCT/US2003/021578 WO2004010627A1 (en) 2002-07-24 2003-07-10 Method and system for masking speech

Publications (2)

Publication Number Publication Date
KR20050021554A true KR20050021554A (ko) 2005-03-07
KR100695592B1 KR100695592B1 (ko) 2007-03-14

Family

ID=30770047

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20057001192A KR100695592B1 (ko) 2002-07-24 2003-07-10 음성 마스킹 시스템 및 그 방법

Country Status (6)

Country Link
US (3) US7143028B2 (ko)
EP (1) EP1525697A4 (ko)
JP (1) JP4324104B2 (ko)
KR (1) KR100695592B1 (ko)
AU (1) AU2003248934A1 (ko)
WO (1) WO2004010627A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021107218A1 (ko) * 2019-11-29 2021-06-03 주식회사 공훈 음성 데이터의 프라이버시 보호를 위한 방법 및 디바이스

Families Citing this family (166)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050254663A1 (en) * 1999-11-16 2005-11-17 Andreas Raptopoulos Electronic sound screening system and method of accoustically impoving the environment
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7143028B2 (en) * 2002-07-24 2006-11-28 Applied Minds, Inc. Method and system for masking speech
US20040125922A1 (en) * 2002-09-12 2004-07-01 Specht Jeffrey L. Communications device with sound masking system
US20050065778A1 (en) * 2003-09-24 2005-03-24 Mastrianni Steven J. Secure speech
WO2006076217A2 (en) * 2005-01-10 2006-07-20 Herman Miller, Inc. Method and apparatus of overlapping and summing speech for an output that disrupts speech
US7363227B2 (en) * 2005-01-10 2008-04-22 Herman Miller, Inc. Disruption of speech understanding by adding a privacy sound thereto
JP4761506B2 (ja) 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP4785563B2 (ja) * 2006-03-03 2011-10-05 グローリー株式会社 音声処理装置および音声処理方法
US20080243492A1 (en) * 2006-09-07 2008-10-02 Yamaha Corporation Voice-scrambling-signal creation method and apparatus, and computer-readable storage medium therefor
JP4924309B2 (ja) * 2006-09-07 2012-04-25 ヤマハ株式会社 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR100858283B1 (ko) * 2007-01-09 2008-09-17 최현준 대화 도청 방지를 위한 사운드 마스킹 방법과 이를 위한장치
KR100731816B1 (ko) 2007-03-13 2007-06-22 주식회사 휴민트 음파를 사용한 도청방지방법 및 장치
JP5103974B2 (ja) * 2007-03-22 2012-12-19 ヤマハ株式会社 マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム
JP4245060B2 (ja) 2007-03-22 2009-03-25 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
JP5103973B2 (ja) * 2007-03-22 2012-12-19 ヤマハ株式会社 サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20090171670A1 (en) * 2007-12-31 2009-07-02 Apple Inc. Systems and methods for altering speech during cellular phone use
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
CN102057423B (zh) * 2008-06-10 2013-04-03 杜比实验室特许公司 用于隐藏音频伪迹的方法、系统、计算机系统用途
DE102008035181A1 (de) * 2008-06-26 2009-12-31 Zumtobel Lighting Gmbh Verfahren und System zur Reduzierung akustischer Störungen
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
JP5691191B2 (ja) * 2009-02-19 2015-04-01 ヤマハ株式会社 マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8200480B2 (en) * 2009-09-30 2012-06-12 International Business Machines Corporation Deriving geographic distribution of physiological or psychological conditions of human speakers while preserving personal privacy
WO2011066844A1 (en) * 2009-12-02 2011-06-09 Agnitio, S.L. Obfuscated speech synthesis
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
EP2367169A3 (en) * 2010-01-26 2014-11-26 Yamaha Corporation Masker sound generation apparatus and program
JP5691180B2 (ja) * 2010-01-26 2015-04-01 ヤマハ株式会社 マスカ音生成装置およびプログラム
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8532987B2 (en) * 2010-08-24 2013-09-10 Lawrence Livermore National Security, Llc Speech masking and cancelling and voice obscuration
JP5849411B2 (ja) * 2010-09-28 2016-01-27 ヤマハ株式会社 マスカ音出力装置
JP5590394B2 (ja) * 2010-11-19 2014-09-17 清水建設株式会社 ノイズマスキングシステム
JP6007481B2 (ja) 2010-11-25 2016-10-12 ヤマハ株式会社 マスカ音生成装置、マスカ音信号を記憶した記憶媒体、マスカ音再生装置、およびプログラム
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
CN102110441A (zh) * 2010-12-22 2011-06-29 中国科学院声学研究所 一种基于时间反转的声掩蔽信号产生方法
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8700406B2 (en) * 2011-05-23 2014-04-15 Qualcomm Incorporated Preserving audio data collection privacy in mobile devices
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
US8903726B2 (en) * 2012-05-03 2014-12-02 International Business Machines Corporation Voice entry of sensitive information
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9123349B2 (en) * 2012-09-28 2015-09-01 Intel Corporation Methods and apparatus to provide speech privacy
US8670986B2 (en) 2012-10-04 2014-03-11 Medical Privacy Solutions, Llc Method and apparatus for masking speech in a private environment
CN113470641B (zh) 2013-02-07 2023-12-15 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101772152B1 (ko) 2013-06-09 2017-08-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US9361903B2 (en) * 2013-08-22 2016-06-07 Microsoft Technology Licensing, Llc Preserving privacy of a conversation from surrounding environment using a counter signal
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US20160196832A1 (en) * 2015-01-06 2016-07-07 Gulfstream Aerospace Corporation System enabling a person to speak privately in a confined space
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10277581B2 (en) * 2015-09-08 2019-04-30 Oath, Inc. Audio verification
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
GB201517331D0 (en) * 2015-10-01 2015-11-18 Chase Information Technology Services Ltd And Cannings Nigel H System and method for preserving privacy of data in a cloud
US9564983B1 (en) 2015-10-16 2017-02-07 International Business Machines Corporation Enablement of a private phone conversation
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
BR112018072698A2 (pt) * 2016-05-05 2019-02-19 Securite Spytronic Inc método para impedir a gravação compreensível de uma voz, método para impedir a gravação de uma conversa compreensível entre pelo menos dois interlocutores, dispositivo para impedir a gravação compreensível da gravação compreensível de uma voz, dispositivo para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, dispositivo para impedir a gravação compreensível de uma voz, dispositivo para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, sistema para impedir a gravação compreensível de uma voz, sistema para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, kit para impedir a gravação compreensível de uma voz e kit para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
GB2553571B (en) * 2016-09-12 2020-03-04 Jaguar Land Rover Ltd Apparatus and method for privacy enhancement
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10276177B2 (en) * 2016-10-01 2019-04-30 Intel Corporation Technologies for privately processing voice data using a repositioned reordered fragmentation of the voice data
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10304473B2 (en) * 2017-03-15 2019-05-28 Guardian Glass, LLC Speech privacy system and/or associated method
US10726855B2 (en) * 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10819710B2 (en) 2017-09-29 2020-10-27 Jpmorgan Chase Bank, N.A. Systems and methods for privacy-protecting hybrid cloud and premise stream processing
US10885221B2 (en) 2018-10-16 2021-01-05 International Business Machines Corporation Obfuscating audible communications in a listening space
US10553194B1 (en) 2018-12-04 2020-02-04 Honeywell Federal Manufacturing & Technologies, Llc Sound-masking device for a roll-up door
US11350885B2 (en) * 2019-02-08 2022-06-07 Samsung Electronics Co., Ltd. System and method for continuous privacy-preserved audio collection
JP7287182B2 (ja) * 2019-08-21 2023-06-06 沖電気工業株式会社 音響処理装置、音響処理プログラム及び音響処理方法
JP7532791B2 (ja) 2020-02-07 2024-08-14 沖電気工業株式会社 音響処理装置、音響処理プログラム及び音響処理方法
JP2021135361A (ja) * 2020-02-26 2021-09-13 沖電気工業株式会社 音響処理装置、音響処理プログラム及び音響処理方法
CN113722502B (zh) * 2021-08-06 2023-08-01 深圳清华大学研究院 基于深度学习的知识图谱构建方法、系统及存储介质

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3651268A (en) * 1969-04-01 1972-03-21 Scrambler And Seismic Sciences Communication privacy system
US3718765A (en) 1970-02-18 1973-02-27 J Halaby Communication system with provision for concealing intelligence signals with noise signals
US4068094A (en) 1973-02-13 1978-01-10 Gretag Aktiengesellschaft Method and apparatus for the scrambled transmission of spoken information via a telephony channel
CH559483A5 (ko) * 1973-06-12 1975-02-28 Patelhold Patentverwertung
US3879578A (en) * 1973-06-18 1975-04-22 Theodore Wildi Sound masking method and system
US3979578A (en) 1975-06-23 1976-09-07 Mccullough Ira J Access controller and system
US4052564A (en) 1975-09-19 1977-10-04 Herman Miller, Inc. Masking sound generator
US3985957A (en) 1975-10-28 1976-10-12 Dukane Corporation Sound masking system for open plan office
US4099027A (en) 1976-01-02 1978-07-04 General Electric Company Speech scrambler
US4280019A (en) 1977-12-06 1981-07-21 Herman Miller, Inc. Combination acoustic conditioner and light fixture
US4195202A (en) 1978-01-03 1980-03-25 Technical Communications Corporation Voice privacy system with amplitude masking
US4232194A (en) 1979-03-16 1980-11-04 Ocean Technology, Inc. Voice encryption system
US4266243A (en) 1979-04-25 1981-05-05 Westinghouse Electric Corp. Scrambling system for television sound signals
US4319088A (en) 1979-11-01 1982-03-09 Commercial Interiors, Inc. Method and apparatus for masking sound
US4443660A (en) * 1980-02-04 1984-04-17 Rockwell International Corporation System and method for encrypting a voice signal
US4476572A (en) 1981-09-18 1984-10-09 Bolt Beranek And Newman Inc. Partition system for open plan office spaces
SE431385B (sv) 1982-06-11 1984-01-30 Ericsson Telefon Ab L M Sett att forvrenga en talsignal, sett att aterstella den forvrengda talsignalen, samt anordning for att forvrenga respektive aterstella talsignalen
US4756572A (en) * 1985-04-18 1988-07-12 Prince Corporation Beverage container holder for vehicles
US4706282A (en) * 1985-12-23 1987-11-10 Minnesota Mining And Manufacturing Company Decoder for a recorder-decoder system
US4852170A (en) 1986-12-18 1989-07-25 R & D Associates Real time computer speech recognition system
US4937867A (en) * 1987-03-27 1990-06-26 Teletec Corporation Variable time inversion algorithm controlled system for multi-level speech security
CA1288182C (en) * 1987-06-02 1991-08-27 Mitsuhiro Azuma Secret speech equipment
GB2207328A (en) 1987-07-20 1989-01-25 British Broadcasting Corp Scrambling of analogue electrical signals
FR2619479B1 (fr) * 1987-08-14 1989-12-01 Thomson Csf Procede pour la synchronisation rapide de vocodeurs couples entre eux au moyen de dispositifs de chiffrement et de dechiffrement
US5148478A (en) * 1989-05-19 1992-09-15 Syntellect Inc. System and method for communications security protection
US5105377A (en) 1990-02-09 1992-04-14 Noise Cancellation Technologies, Inc. Digital virtual earth active cancellation system
WO1993018505A1 (en) 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5315661A (en) 1992-08-12 1994-05-24 Noise Cancellation Technologies, Inc. Active high transmission loss panel
US5355418A (en) 1992-10-07 1994-10-11 Westinghouse Electric Corporation Frequency selective sound blocking system for hearing protection
JP3235287B2 (ja) 1993-08-09 2001-12-04 富士ゼロックス株式会社 画像編集装置
EP0648031B1 (en) * 1993-10-12 2007-08-01 Matsushita Electric Industrial Co., Ltd. Audio scrambling system for scrambling and descrambling audio signals
CA2179194A1 (en) * 1993-12-16 1995-06-29 Andrew Wilson Howitt System and method for performing voice compression
US5528693A (en) * 1994-01-21 1996-06-18 Motorola, Inc. Method and apparatus for voice encryption in a communications system
HU219667B (hu) * 1994-03-31 2001-06-28 The Arbitron Company Berendezés és eljárás kód-frekvenciaösszetevőkkel rendelkező kódnak audiojel-frekvenciaösszetevőkkel rendelkező audiojelbe való beillesztésére
US5920840A (en) 1995-02-28 1999-07-06 Motorola, Inc. Communication system and method using a speaker dependent time-scaling technique
JP3109978B2 (ja) 1995-04-28 2000-11-20 松下電器産業株式会社 音声区間検出装置
US6109923A (en) 1995-05-24 2000-08-29 Syracuase Language Systems Method and apparatus for teaching prosodic features of speech
US5742679A (en) * 1996-08-19 1998-04-21 Rockwell International Corporation Optimized simultaneous audio and data transmission using QADM with phase randomization
JPH10136321A (ja) 1996-10-25 1998-05-22 Matsushita Electric Ind Co Ltd 音声信号の信号処理装置および方法
US6256491B1 (en) * 1997-12-31 2001-07-03 Transcript International, Inc. Voice security between a composite channel telephone communications link and a telephone
US6834130B1 (en) 1998-02-18 2004-12-21 Minolta Co., Ltd. Image retrieval system for retrieving a plurality of images which are recorded in a recording medium, and a method thereof
US6266412B1 (en) * 1998-06-15 2001-07-24 Lucent Technologies Inc. Encrypting speech coder
CA2347011A1 (en) * 1998-10-28 2000-05-04 Ellwood Mcgrogan Apparatus and methods for cryptographic synchronization in packet based communications
US6272633B1 (en) * 1999-04-14 2001-08-07 General Dynamics Government Systems Corporation Methods and apparatus for transmitting, receiving, and processing secure voice over internet protocol
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
US6658112B1 (en) * 1999-08-06 2003-12-02 General Dynamics Decision Systems, Inc. Voice decoder and method for detecting channel errors using spectral energy evolution
KR20010057593A (ko) * 1999-12-17 2001-07-05 박종섭 이동통신 시스템에서의 음성 및 데이타 암호화/복호화장치및 그 방법
US7039189B1 (en) 2000-03-17 2006-05-02 International Business Machines Corporation Stream continuity enforcement
JP4221537B2 (ja) 2000-06-02 2009-02-12 日本電気株式会社 音声検出方法及び装置とその記録媒体
US6907123B1 (en) * 2000-12-21 2005-06-14 Cisco Technology, Inc. Secure voice communication system
US20020103636A1 (en) 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US7143028B2 (en) * 2002-07-24 2006-11-28 Applied Minds, Inc. Method and system for masking speech

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021107218A1 (ko) * 2019-11-29 2021-06-03 주식회사 공훈 음성 데이터의 프라이버시 보호를 위한 방법 및 디바이스

Also Published As

Publication number Publication date
US20040019479A1 (en) 2004-01-29
US7505898B2 (en) 2009-03-17
JP2005534061A (ja) 2005-11-10
WO2004010627A1 (en) 2004-01-29
US7143028B2 (en) 2006-11-28
US20060241939A1 (en) 2006-10-26
EP1525697A4 (en) 2009-01-07
US20060247924A1 (en) 2006-11-02
JP4324104B2 (ja) 2009-09-02
EP1525697A1 (en) 2005-04-27
AU2003248934A1 (en) 2004-02-09
KR100695592B1 (ko) 2007-03-14
US7184952B2 (en) 2007-02-27

Similar Documents

Publication Publication Date Title
KR100695592B1 (ko) 음성 마스킹 시스템 및 그 방법
AU2021200589B2 (en) Speech reproduction device configured for masking reproduced speech in a masked speech zone
US7363227B2 (en) Disruption of speech understanding by adding a privacy sound thereto
CN105493177B (zh) 用于音频处理的系统和计算机可读存储介质
US20030093270A1 (en) Comfort noise including recorded noise
JP2017538146A (ja) インテリジェントな音声認識および処理のためのシステム、方法、およびデバイス
EP3800900A1 (en) A wearable electronic device for emitting a masking signal
KR100858283B1 (ko) 대화 도청 방지를 위한 사운드 마스킹 방법과 이를 위한장치
JP4428280B2 (ja) 通話内容隠蔽システム、通話装置、通話内容隠蔽方法およびプログラム
JP5682115B2 (ja) サウンドマスキングを行うための装置およびプログラム
US11232809B2 (en) Method for preventing intelligible voice recordings
JP2000315042A (ja) 聴覚訓練方法
JP5662711B2 (ja) 音声変更装置、音声変更方法および音声情報秘話システム
JP5691180B2 (ja) マスカ音生成装置およびプログラム
WO2007051056A2 (en) Method and apparatus for speech disruption
WO2008062198A1 (en) A background noise generator
McCaul ◾ Principles of Audio
JP5662712B2 (ja) 音声変更装置、音声変更方法および音声情報秘話システム
JPH08223286A (ja) 話中着信音発生装置及び話中着信音発生方法
JP2012048120A (ja) 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130221

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140221

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150224

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160218

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee