KR20050021554A - 음성 마스킹 시스템 및 그 방법 - Google Patents
음성 마스킹 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR20050021554A KR20050021554A KR10-2005-7001192A KR20057001192A KR20050021554A KR 20050021554 A KR20050021554 A KR 20050021554A KR 20057001192 A KR20057001192 A KR 20057001192A KR 20050021554 A KR20050021554 A KR 20050021554A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- speech signal
- stream
- ambiguous
- module
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000000873 masking effect Effects 0.000 title claims abstract description 21
- 230000007774 longterm Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 7
- 238000007493 shaping process Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 5
- 230000001172 regenerating effect Effects 0.000 claims 4
- 239000000872 buffer Substances 0.000 description 29
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000238876 Acari Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- SEQDDYPDSLOBDC-UHFFFAOYSA-N Temazepam Chemical compound N=1C(O)C(=O)N(C)C2=CC=C(Cl)C=C2C=1C1=CC=CC=C1 SEQDDYPDSLOBDC-UHFFFAOYSA-N 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K1/00—Secret communication
- H04K1/02—Secret communication by adding a second signal to make the desired signal unintelligible
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/1752—Masking
- G10K11/1754—Speech masking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/02—Synthesis of acoustic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K1/00—Secret communication
- H04K1/06—Secret communication by transmitting the information or elements thereof at unnatural speeds or in jumbled order or backwards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/80—Jamming or countermeasure characterized by its function
- H04K3/82—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
- H04K3/825—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K2203/00—Jamming of communication; Countermeasures
- H04K2203/10—Jamming or countermeasure used for a particular application
- H04K2203/12—Jamming or countermeasure used for a particular application for acoustic communication
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
음성 스트림을 마스킹하는데 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 공개한다. 마스킹될 음성 스트림을 나타내는 음성 신호가 획득된다. 상기 음성 신호는 다음으로 일시적으로 세그먼트로 분할되는데, 바람직하게는 음성 스트림 내 음소에 대응한다. 상기 세그먼트는 다음으로 메모리에 저장되고, 세그먼트의 일부 또는 전부는 이어서 선택, 검색, 및 음성 신호로 결합되거나 음성 스트림으로 재생성 및 결합될 때, 마스킹 효과를 제공하는 난해한 음성 스트림을 나타내는 모호한 음성 신호로 조합된다. 현재의 바람직한 실시예는 주로 개방형 사무실에서 쉽게 응용될 수 있으나, 식당, 교실, 및 텔레커뮤니케이션 시스템에서 사용하기 적절한 실시예가 또한 공개된다.
Description
본 발명은 정보를 숨기는 시스템에 관한 것으로, 특히, 음성 스트림을 난해하게 하는 그러한 시스템에 관한 것이다.
인간의 청각 시스템은 배경 잡음에서 음성의 스트림을 구별하고 파악하는데 매우 숙련되어 있다. 이러한 능력은 음성이 잡음 환경에서 이해되도록 하기 때문에 대부분의 경우에 상당한 이점을 제공한다.
그러나, 대부분의 경우, 개방형 사무실 공간 등에서는, 화자에 대한 프라이버시를 제공하거나 가청 영역 내 사람들의 주의가 산만해 지는 것을 감소하기 위해 음성을 마스킹하는 것이 매우 바람직하다. 이러한 경우에, 배경 잡음의 존재시에 음성을 식별하는 인간의 능력은 특별한 도전이다. 예를 들어, 백색 잡음 또는 핑크 노이즈와 같은 확률성 잡음의 단순한 도입은, 기본적인 음성이 더이상 이해되지 않기 전에 도입된 잡음의 진폭이 불수용 레벨로 증가되어야 한다는 점에서, 전형적으로 성공할 수 없다.
따라서, 음성을 마스킹하고자 하는 많은 종래의 기술은, 음성의 스트림이 난해해지기 위해 요구되는 잡음의 세기를 낮추는 노력으로, 잡음을 마스킹하는 특수한 형태를 발생시키는데 촛점을 맞춰왔다. 예를 들어, 미국 특허 3,985,957(Torn)은 "개방형 사무실에서 대화를 마스킹" 하는 "사운드 마스킹 시스템"("sound masking system" for "masking conversation in an open plan office")을 공개한다. 여기서, "종래의 전기 랜덤 잡음 전류의 발생기는 그 출력을 상기 사무실 공간 위 플래넘(planum)에서 스피커 클러스터에 대한 조절가능한 전기 필터 수단을 통해 공급한다." 그러한 정교성(sophistication)에도 불구하고, 대부분의 경우 대화가 마스킹되기 위해 요구되는 배경 잡음의 레벨은 사실상 여전히 매우 불수용적이다.
더 복잡한 물리적 구성으로 마이크로폰 및 스피커를 배치하고 활성 잡음(active noise) 소거 알고리즘으로 이를 제어함으로써 더 이산적으로 마스킹하는 것을 제공하는 다른 접근법이 시도되었다. 예를 들어, 미국 특허 5,315,661(Gossman)은 "센서, 액츄에이터 및 활성 제어 시스템을 사용하여 패널을 통해(로부터) 사운드 전송을 제어하는" 시스템(system for "controlling sound transmission through (from) a panel using sensors, actuators and an active control system")을 기술한다. 상기 방법은 대형 패널을 형성하도록 차례로 결합되는 다수의 소형 패널 셀을 통해 사운드 전송을 제어하기 위해 활성 구조 음성 제어를 사용한다. 상기 발명은 "두껍고 무거운 패시브 방음 물질, 또는 사운드 무반향 물질(thick and heavy passive sound isolation material, or anechoic material)의 대체물"로서 역할을 하도록 한다. 그러한 시스템은 이론상 효과적이나, 실제로 구현하기가 어렵고, 과중한 비용이 종종 부과된다.
모호함(obfuscation)(종종 스크램블링(scrambling)이라고도 함)을 수행하는 몇가지 기술이 종래 기술에서 또한 발견되어진다. 미국 특허 4,068,094 (Schmid 등)은 "먼저 음성 주파수를 두개의 주파수 대역으로 분리하고 음성 정보를 변조하여 그 순서를 바꿈으로써 음성 전송을 스크램블링 또는 언스크램블링하는 방법"을 기술한다.
다소 다른 접근 방법으로, 미국 특허 4,099,027(Whitten)은 시간 영역에서 우선적으로 동작하는 시스템을 공개한다. 특히, "비보안 통신 채널로 전송하는 통신 신호를 난해하게 하는 음성 스크램블러는 시스템의 스크램블링부에 시간 지연 변조기와 코딩 신호 발생기 및 시스템의 언스크램블링부에 유사한 시간 지연 변조기와 역 신호를 발생시키는 코딩 발생기를 포함한다."
이러한 방법들은, 오리지널 음성 스트림 대신에 모호한 음성 스트림(obfuscated stream of speech)이 있을 때, 난해하고 모호한 음성 스트림을 생성하는데 효과적이다. 그러나, 이들은 모호한 음성 스트림의 중첩을 통해 음성 스트림을 난해하게 하는데는 덜 효과적이다. 이는 사무실 환경에서 대화를 마스킹하는 애플리케이션에 대해 중대한 결함을 나타내는데, 오리지날 음성 스트림에 대한 모호한 음성 스트림의 직접 대체는 불가능하지 않다면 비실용적이다. 게다가, 스크램블링의 특성(nature)으로 인해, 상기 모호한 음성 스트림은 수화자에게 음성처럼(speech-like) 들리지 않는다. 개방형 사무실과 같은 환경에서, 모호한 음성 스트림은 따라서 오리지날 음성 스트림보다 더 산만함을 입증할 수 있다.
미국 특허 4,195,202(McCalmont)는 사실상 이해가 조금 어려운 혼성 스트림(composit stream)을 생성할 수 있는 이러한 시스템에 대한 개선을 제안하고 있으나, 음성 같은 스크램블형 신호에 대한 필요를 다루고 있지 않다. 사실, 인간 음성의 키 특징(key features) 중의 하나를 경감하기 위한 특정 노력이 이루어졌다. "먼저 인코딩 장치가 전송될 보이스 신호를 둘 이상의 주파수 대역으로 분리한다. 하나 이상의 주파수 대역은 다른 주파수 대역과 시간 관련되어 전도, 지연되고 다음으로 원격 수신기에 전송을 위한 혼성 신호를 생성하는 다른 주파수 대역과 재결합되는 주파수이다. 보이스 신호가 대응하는 음성의, 마침꼴(cadence), 음절간(intersyllabic) 및 음소(phoneme) 발생율의 대략의 시간 상수에 대한 지연의 크기를 선택함으로써, 혼성 신호의 진폭 변동이 실질적으로 경감되고 신호의 마침꼴 컨텐츠가 효과적으로 위장된다."
개방형 사무실과 같은 환경에서 음성 스트림을 마스킹하는 간단하고 효과적인 시스템이 요구되는데, 여기서 모호한 음성 스트림이 오리지날 음성 스트림에 대체될 수 없고, 단지 추가된다. 상기 방법은 사실상 매우 난해한 음성 같은 모호한 음성 스트림을 제공하여야 한다. 또한, 오리지날 음성 스트림 및 모호한 음성 스트림의 조합은 또한 매우 난해한 음성 같은 결합된 음성 스트림을 생성하여야 한다.
도 1은 본 발명의 현재 바람직한 실시예에 따른 개방형 사무실에서 음성 스트림을 마스킹하는 장치를 도시한 도면이다.
도 2는 본 발명의 현재 바람직한 실시예에 따른 모호한 음성 신호를 생성하는 방법을 도시하는 흐름도이다.
도 3은 본 발명의 현재 바람직한 실시예에 따른 음성 신호를 세그먼트로 일시적으로 분할하고 세그먼트들을 저장하는 방법을 도시하는 상세한 흐름도이다.
도 4는 본 발명의 현재 바람직한 실시예에 따른 세그먼트들을 선택, 검색, 및 조합하는 방법을 도시하는 상세한 흐름도이다.
본 발명은 음성 스트림을 마스킹하는데 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 제공하는 것이다. 마스킹될 음성 스트림을 나타내는 음성 신호가 획득된다. 상기 음성 신호는 다음으로, 바람직하게는 음성 스트림내 음소에 대응하는 세그먼트로 일시적으로 분할된다. 상기 세그먼트들은 다음으로 메모리에 저장되고, 세그먼트의 일부 또는 모두는 이어서 선택(select), 검색(retrieve), 및 음성 신호와 결합되거나 음성 스트림으로 재생성되고 결합될 때, 마스킹 효과를 제공하는, 난해한 음성 스트림을 나타내는 모호한 음성 신호로 조합(assembly)된다.
상기 모호한 음성 신호는 음성 스트림의 직접적인 마스킹을 허여하는, 실질적으로 실시간으로 생성되거나, 기록된 음성 신호로부터 생성될 수 있다. 모호한 음성 신호 생성시, 음성 신호내 세그먼트는 일 대 일 형식으로 재정리(reorder)될 수 있고, 세그먼트는 음성 신호내 세그먼트의 최근 히스토리로부터 무작위로 선택되고 검색될 수 있고, 또는 세그먼트는 분류되거나 식별되고 다음으로 음성 신호내 발생 주파수와 같은 정도의 상대 주파수로 선택된다. 최종적으로, 하나 이상의 선택, 검색, 및 조합 과정이 하나 이상의 모호한 음성 신호를 생성하는 것과 동시에 수행될 수 있는 것이 가능하다.
본 발명의 현재의 바람직한 실시예가 개방형 사무실과 같은 경우에 아주 쉽게 발견되나, 대안의 실시예가 예를 들어, 식당, 교실, 및 통신 시스템에서 발견될 수 있다.
본 발명은 음성 스트림을 마스킹하기 위해 사용될 수 있는 모호한 음성 신호를 생성하는 간단하고 효과적인 방법을 제공한다.
도 1은 본 발명의 현재 바람직한 실시예에 따른 개방형 사무실에서 음성 스트림을 마스킹하는 장치를 도시한 도면이다. 제1 큐비클(first cubicle)(21)내의 발화중인 회사원(speaking office worker)(11)이 개인적인 대화를 원한다. 인접한 큐비클(22)과 발화중인 회사원의 큐비클을 분리하는 파티션(partition)(30)은 인접한 큐비클내 청취하는 회사원(listening office worker)(12)이 대화를 엿듣는 것을 방지 할 수 있는 충분한 방음(acoustic isolation)을 제공하지 않는다. 이러한 상황은 발화중인 회사원의 프라이버시를 부정하고 청취하는 회사원을 산만하게 하고, 더 나쁘게는 비밀 대화를 엿들을 수 있기 때문에 바람직하지 않다.
도 1은 본 발명의 현재 바람직한 실시예가 이러한 상황을 개선할 수 있는 방법을 설명한다. 마이크로폰(40)은 발화중인 회사원(11)으로부터 나오는 음성 스트림을 습득할 수 있는 위치에 배치된다. 바람직하게는, 상기 마이크로폰은 원하는 음성 스트림 외의 최소 청각 정보가 포착될 수 있는 위치에 장착된다. 실질적으로 상기 발화중인 회사원(11) 위, 그러나 여전히 제1 큐비클(21) 내인 위치가 만족스러운 결과를 제공할 수 있다.
마이크로폰에 의해 획득된 음성 스트림을 나타내는 신호는 음성 스트림을 구성하는 음소들(phonemes)을 식별하는 프로세서(100)에 제공된다. 실시간으로 또는 실시간에 가까운 정도로, 모호한 음성 신호(obfuscated speech signal)가 식별된 음소들에 유사한 음소들의 시퀀스로부터 발생된다. 모호한 음성 스트림으로 재생될 때, 상기 모호한 음성 신호는 음성 같으나(speech-like), 난해(unintelligible)하다.
상기 모호한 음성 스트림은, 하나 이상의 스피커(50)를 사용하여, 인접한 큐비클(22) 내의 청취하는 회사원(12)을 포함하여, 발화중인 회사원의 대화 내용을 엿들을 가능성이 있는 회사원들에게 재생되어 표현된다. 오리지날 음성 스트림상에 중첩되어 들릴 때, 상기 모호한 음성 스트림은 난해한 혼성 음성 스트림을 산출하고, 따라서 오리지날 음성 스트림을 마스킹한다. 바람직하게는, 상기 모호한 음성 스트림은 오리지날 음성 스트림의 세기에 필적하는 세기로 표현된다. 생각컨대, 청취하는 회사원은 전형적인 인간 음성과 같은 정도의 세기로 제1 큐비클로부터 나오는 음성 같은 사운드를 듣는데 꽤 익숙해져 있다. 그러므로 청취하는 회사원이 본 발명에 의해 제공되는 혼성 음성 스트림에 의해 산만해지지 않을 것이다.
스피커(50)는 바람직하게는 청취하는 회사원에게는 들리나 발화중인 회사원에게는 들리지 않는 위치에 배치된다. 추가로, 청취하는 회사원이 지향성 큐(directional cue)를 사용하여 오리지날 음성 스트림을 모호한 음성 스트림과 분리할 수 없도록 주의를 기울여야 한다. 다중 스피커는, 서로 동일 평면상에 놓이지 않도록 배치되는 것이 바람직하고, 발화중인 회사원으로부터 나오는 오리지날 음성 스트림을 더 효과적으로 마스킹하는 복합 사운드 필드를 생성하기 위해 사용될 수 있다. 또한, 상기 시스템은, 스피커의 위치, 예를 들어 마이크로폰의 위치에 기초하여, 스피커의 위치에 대한 정보를 사용할 수 있고, 음성 마스킹의 최적의 분산을 달성하도록 다수의 스피커를 활성/비활성시킬 수 있다. 여기서, 개방형 사무실 환경은 스피커를 제어하고 다중 위치로부터 파생된 많은 모호한 대화를 믹싱하도록 모니터링됨으로써 몇몇 대화가 일어나고, 동시에, 마스킹된다. 예를 들어, 상기 시스템은 몇몇 마이크로폰으로부터 파생된 정보에 기초하여 다수의 스피커에 신호를 지시하고 가중할 수 있다.
도 2는 본 발명의 현재 바람직한 실시예에 따른 모호한 음성 신호를 생성하는 방법을 도시하는 흐름도이다. 바람직한 실시예에서, 이 방법은 도 1의 프로세서(100)에 의해 수행된다. 마스킹될 음성 스트림을 나타내는 음성 신호(200)는 도 1에서 도시된 바와 같이, 마이크로폰 또는 유사한 소스로부터 획득(단계 110)된다. 음성 신호(s(t))는 바람직하게는 일련의 이산 디지털 값(s(n))으로 획득되고 이어서 처리된다. 바람직한 실시예에서, 마이크로폰(40)이 아날로그 신호를 제공하고, 상기 신호는 아날로그/디지털 컨버터에 의해 디지털화될 것을 요구한다.
일단 획득된, 상기 음성 신호는 세그먼트(250)로 일시적으로 분할(단계 120)된다. 전술된 바와 같이, 상기 세그먼트는 음성 스트림 내 음소에 대응한다. 다음으로 상기 세그먼트는 메모리(135)에 저장(단계 130)되고, 따라서 선택된 세그먼트가 이어서 선택(단계 138), 검색(단계 140), 및 조합(단계 150) 될 수 있다. 조합 동작 결과는 모호한 음성 스트림을 나타내는 모호한 음성 신호(300)이다.
다음으로 상기 모호한 음성 신호는, 바람직하게는 도 1에 도시된 바와 같이 하나 이상의 스피커를 통해 재생될 수 있다. 바람직한 실시예에서, 하나 이상의 스피커는 아날로그 입력 신호를 요구하고, 디지털/아날로그 컨버터의 사용을 요구할 수 있다. 대안으로, 상기 음성 신호와 모호한 음성 신호가 결합되고, 결합된 신호가 재생성 될 수 있다.
상기 과정을 통한 데이터의 흐름이 도 2에서 보여지고 있으나, 상세한 동작은 실시간으로 실질적으로 데이터의 정상 상태 처리(steady state processing of data)를 제공함을 이해하는 것이 중요하다. 대안으로, 상기 과정은 사전-기록된 음성 신호에 적용되는 후-처리 동작으로 수행될 수 있다.
신호 세그먼트의 선택(단계 138), 검색(단계 140), 및 조합(단계 150)은 몇몇 방법 중의 하나로 성취될 수 있다. 특히, 음성 신호 내 세그먼트는 일 대 일 방법으로 재정리될 있고, 세그먼트는 음성 신호 내 세그먼트의 최근 히스토리로부터 무작위적으로 선택되고 검색될 수 있고, 세그먼트는 분류되거나 식별되고 다음으로 음성 신호 내 발생 주파수와 같은 크기의 상대 주파수로 선택될 수 있다. 또한, 몇몇 선택, 검색, 및 조합 과정은 몇몇 모호한 음성 신호를 생성하는데 동시에 수행될 수 있다.
도 3은 본 발명의 현재 바람직한 실시예에 따른 음성 신호를 세그먼트로 일시적으로 분할하고 세그먼트들을 저장하는 방법을 도시하는 상세한 흐름도이다. 여기서, 신호를 세그먼트로 일시적으로 분할하고 도 2에 도시된 메모리에 상기 세그먼트를 저장하는 것이 더 상세히 도시되어 있다. 분할 동작은 분할 결과 세그먼트가 음성 스트림 내 음소에 대응하는 방법으로 수행된다.
음성 신호(200)를 세그먼트로 분할하기 위해, 음성 신호는 제곱(단계 122)되고, 그 결과 신호(s2(n))는 세개의 시간 스케일, 즉, 단시간 스케일(Ts); 중간시간 스케일(Tm); 및 장시간 스케일(Tl)로 평균(단계 1231, 1232, 1233)된다. 상기 평균화는 바람직하게는 다음 표현식에 따라, 평균(Vi)의 어림 계산(calculation of running estimates of the averages)을 통해 수행된다.
Vi(n+1)=ais(n)=(1-ai)Vi(n), E[l,m,s]. (1)
이는, 다음을 갖는, Ni 샘플들의 슬라이딩 윈도우 평균(sliding window average of Ni samples)과 대략 동일하다.
(2)
여기서, f는 샘플링 레이트(sampling rate)이고 Ti는 시간 스케일이다.
바람직하게, 단시간 스케일(Ts)은 전형적인 음소의 듀레이션(duration of a typical phoneme) 특징으로 선택되고 중간시간 스케일(Tm)은 전형적인 단어(typical word)의 듀레이션 특징으로 선택된다. 장시간 스케일(Tl)은 전체적으로 음성 스트림의 앱 앤 플로우(ebb and flow) 특징의, 대화 시간 스케일이다. 본 발명의 현재 바람직한 실시예에서, 0.125, 0.250, 및 1.00 sec의 값이 각각 수용 가능한 시스템 수행에 제공되었으나, 본 발명의 이 실시예가 다른 시간 스케일 값으로 실시될 수 있음은 관련 분야 숙련자에게 이해될 것이다. 중간 시간 스케일 평균(단계 1232)의 결과는 가중(weighting)(125) 방법에 의해 곱해지고(단계 124), 다음으로 단시간 스케일 평균(단계 1231)의 결과로부터 빼진다(단계 126). 바람직하게는, 가중의 값은 0과 1 사이이고, 사실상, 1/2의 값이 수용가능함이 입증되었다.
그 결과 신호는 제로 크로싱(zero crossing)을 검출(단계 127)하도록 모니터링된다. 제로 크로싱이 검출되면, 참값이 복귀된다. 제로 크로싱은 중간시간 스케일 평균에 의해 탐지될 수 없는 음성 신호 에너지의 단시간 스케일 평균에서 급속한 증가 또는 감소를 반영한다. 따라서 제로 크로싱은 연속의 음소들 사이에서, 음소와 다음의 상대 정적(relative silence) 기간 사이에서, 또는 상대 정적 기간과 다음의 음소 사이에서 트랜지션(transition)이 발생하는 시간의 표시를 제공하는, 일반적으로 음소 경계에 대응하는 에너지 경계를 표시한다.
장시간 평균(단계 1233)의 결과는 임계 연산자(threshold operator)(128)로 전해진다. 상기 임계 연산자는 장시간 평균이 상한 임계값을 넘으면 "참"을 리턴하고 장시간 평균이 하한 임계값 아래이면 "거짓"을 리턴한다. 본 발명의 몇가지 실시예에서, 상기 상한 및 하한 임계값은 같을 수 있다. 바람직한 실시예에서, 임계 연산자는 상이한 상한 및 하한 임계값을 갖는, 사실상 히스터레틱(hysteretic)하다.
음성 신호(200)가 존재하고 그리고(1292) 임계 연산자(128)가 참값을 리턴하면, 음성 신호는 메모리(135)에 상주하는 버퍼들의 어레이 내에서 버퍼(136)에 저장된다. 신호가 저장되는 특정 버퍼는 저장 카운터(132)에 의해 결정된다.
제로 크로싱이 검출(단계 127)되고 그리고(1291) 임계 연산자(128)가 "참"값을 리턴하면, 저장 카운터(132)는 증분(단계 131)되고, 메모리(135) 내 버퍼들의 어레이 내에서 다음 버퍼(136)에 저장이 시작된다. 이러한 방법으로, 버퍼들의 어레이 내 각 버퍼는, 검출된 제로 크로싱에 의해 분할되고, 음성 신호의 음소 또는 인터스티셜 정적(interstitial silence)으로 채워진다. 버퍼들의 어레이 내 마지막 버퍼에 도달되면, 카운터는 리셋되고 제1 버퍼의 컨텐츠는 다음 음소 또는 인터스티셜 정적으로 대체된다. 따라서, 버퍼는 축적되고 다음으로 음성 신호내에 존재하는 세그먼트의 최근 히스토리를 유지한다.
본 방법은 음성 신호가 음소에 대응하는 세그먼트로 분할될 수 있는 다수의 방법 중 하나만을 나타낸 것이다. 연속 음성 인식 소프트웨어 패키지에 사용되는 것들을 포함하여 다른 알고리즘들이 또한 채용될 수 있다.
도 4는 본 발명의 현재 바람직한 실시예에 따른 세그먼트들을 선택, 검색, 및 조합하는 방법을 도시하는 상세한 흐름도이다. 여기서, 도 2에서 도시된 바와 같이 세그먼트를 선택(단계 138), 메모리로부터 세그먼트를 검색(단계 140) 및 세그먼트를 모호한 음성 신호로 조합(단계 150)하는 단계들이 상세히 도시되어 있다.
난수 발생기(random number generator)(144)는 검색 카운터(142)의 값을 결정하기 위해 사용된다. 카운터의 값에 의해 지시되는 버퍼(136)는 메모리(135)로부터 판독된다. 버퍼의 끝에 도달할 때, 난수 발생기는 검색 카운터에 또다른 값을 제공하고, 또다른 버퍼는 메모리로부터 판독된다. 버퍼의 컨텐츠는 연쇄 동작(catenation operation)(단계 152)을 통해 사전 판독된 버퍼의 컨텐츠에 추가되어 모호한 음성 신호(300)를 구성한다. 이러한 방법으로, 음성 신호(200) 내 세그먼트의 최근 히스토리를 반영하는 신호 세그먼트의 무작위 시퀀스가 결합되어 모호한 음성 신호(300)를 형성한다.
액티브한 대화의 순간 동안에만 마스킹을 제공하고자 하는 경우가 종종 있다. 따라서, 바람직한 실시예에서는, 버퍼가 가용이고 그리고(139) 도 3의 임계 연산자(128)가 "참"값을 리턴하면 버퍼들은 메모리로부터 판독만될 수 있다.
몇가지 다른 주목할 만한 특징들이 또한 본 발명의 현재 바람직한 실시예에 병합되었다. 먼저, 최소 세그먼트 길이가 시행된다. 제로 크로싱이 최소 세그먼트 길이 이하의 음소 또는 인터스티셜 정적을 지시한다면, 제로 크로싱이 무시되고 저장이 메모리(135) 내의 버퍼들의 어레이 내 현재 버퍼(136)에 계속된다. 또한, 버퍼 어레이 내 각 버퍼의 사이즈에 의해 결정되고, 최대 음소 길이가 시행된다. 저장하는 동안, 최대 음소 길이를 넘는다면, 제로 크로싱이 추론되고, 저장이 버퍼들의 어레이 내 다음 버퍼에 시작된다. 버퍼들의 어레이 내의 저장과 버퍼들의 어레이로부터의 검색 간 충돌을 피하기 위해, 특정 버퍼가 현재 판독되고 저장 카운터(132)에 의해 동시에 선택된다면, 저장 카운터는 다시 증분되고, 저장이 버퍼들의 어레이 내 다음 버퍼에 시작된다.
최종적으로, 연쇄 동작(152) 동안, 검색 카운터(142)에 의해 선택된 세그먼트의 헤드(head) 및 테일(tail)로 성형 함수(shaping function)를 적용하는 것이 바람직할 수 있다. 성형 함수는 모호한 음성 신호에서 연속의 세그먼트들 간의 더 부드러운 트랜지션(smooth transition)을 제공하고, 그럼으로써 재생(단계 160)시 더 자연스러운 소리를 내는 음성 스트림을 산출한다. 바람직한 실시예에서, 삼각 함수를 이용하여 각 세그먼트는 세그먼트의 헤드에서 부드럽게 위로 램핑되고 세그먼트의 테일에서 아래로 램핑된다. 상기 램핑은 최소 허용가능한 세그먼트보다 단축된 시간 스케일에 대해 수행된다. 이러한 마무리(smoothing)는 모호한 음성 신호 내 연속의 세그먼트들 간 트랜지션에서 가청 팝(pops), 클릭(clicks), 및 틱(ticks)을 경감시키는 역할을 한다.
여기서 기술되는 마스킹 방법은 사무실 공간 외 환경에서 사용될 수 있다. 일반적으로, 개인적인 대화를 엿들을 수 있는 경우에 채용될 수 있다. 그러한 공간으로는 예를 들어, 혼잡한 주거 공간, 공중 전화 부스, 및 식당 등이 포함된다. 상기 방법은 이해가능한 음성 스트림(intelligible stream of speech)이 흩어지는 상황에서 또한 사용될 수 있다. 예를 들어, 개방형 공간의 교실에서, 한 구획된 영역에 있는 학생들은 간섭성의 음성 스트림에 의해서 보다 인접 영역으로부터 나오는 난해한 보이스 같은 음성 스트림에 의해 덜 산만해질 수 있다.
본 발명은 또한 현실 에뮬레이션이나 난해한 보이스 같은 배경 잡음에 쉽게 확장될 수 있다. 이 애플리케이션에서, 상기 수정된 신호는 사전에 획득된 보이스 기록으로부터 발생될 수 있고, 그렇지 않으면 조용한 환경에서 나타내질 수 있다. 그 결과 사운드는 하나 이상의 대화가 가까이에서 수행되고 있다는 환상(illusion)을 나타낸다. 이러한 애플리케이션은 예를 들어, 식당에서, 식당주가 비교적 빈 식당이 다수의 고객들에 의해 차지되고 있다는 환상을 조성하고자 할 때, 또는 다수의 인파가 있다는 느낌을 주는 연기 제품(theatrical production)에 유용할 것이다.
채용된 특정 마스킹 방법이 두 통신측에 알려지면, 상술된 기술을 사용하여 오디오 신호를 비밀리 전송하는 것이 가능할 수 있다. 이 경우, 음성 신호는 모호한 음성 신호의 중첩에 의해 마스킹될 수 있고, 수신시 마스킹되지 않을 수 있다. 사용되는 특정 알고리즘이 통신측에만 알려진 키(key)에 의해 도입되어, 그럼으로써 전송을 차단하고 마스킹되지 않도록 하는 제 3자에 의한 시도를 방해할 수 있는 것이 또한 가능하다.
여기서 본 발명이 바람직한 실시예를 참조하여 기술되었으나, 본 발명의 기술 분야에 숙련된 자라면 본 발명의 사상과 범위를 벗어나지 않고 전술된 실시예를 대체할 수 있는 다른 애플리케이션이 가능함을 쉽게 이해할 것이다.
Claims (58)
- 이해가능한 음성으로부터 실질적으로 난해하고, 모호한 음성 신호를 생성하는 방법에 있어서,음성 스트림을 나타내는 음성 신호를 획득하는 단계;상기 음성 신호를 다수의 세그먼트로 일시적으로 분할하는 단계로서, 상기 세그먼트가 상기 음성 신호 내 초기 순서로 발생하는, 상기 분할 단계;상기 세그먼트 중에서 다수의 선택된 세그먼트를 선택하는 단계;상기 초기 순서와 상이한 순서로, 상기 모호한 음성 신호를 생성하기 위해, 상기 선택된 세그먼트를 조합하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 일시적으로 분할하는 단계에 바로 이어서, 상기 세그먼트를 메모리에 저장하는 단계를 더 포함하고;상기 선택 단계에 바로 이어서, 상기 메모리로부터 상기 선택된 세그먼트를 검색하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 모호한 음성 신호는 실질적으로 실시간으로 생성되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 음성 신호는 사전에 기록된 음성 스트림을 나타내는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 모호한 음성 신호는 난해한 배경 대화를 시뮬레이트하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 모호한 음성 신호는 텔레커뮤니케이션 네트워크를 통해 전송되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 조합 단계에 바로 이어서, 결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 단계를 더 포함하며;상기 결합된 신호가 실질적으로 난해한 음성 스트림을 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 조합 단계에 바로 이어서, 모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 단계, 및결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 단계를 포함하며;상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 음성 신호는 마이크로폰으로부터 획득되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 모호한 음성 신호는 라우드스피커에 의해 재생되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 음성 신호는 사무실 환경으로부터 획득되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 선택된 세그먼트는 상기 음성 스트림 내 각 세그먼트를 포함하는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 선택된 세그먼트는 상기 음성 신호 내에 존재하는 세그먼트의 최근 히스토리를 포함하는 상기 메모리 내 다수의 세그먼트로부터 선택되는 것을 특징으로 하는 방법.
- 제13항에 있어서, 상기 선택된 세그먼트는 상기 메모리 내에 포함된 상기 다수의 세그먼트로부터 무작위적으로 선택되는 것을 특징으로 하는 방법.
- 제13항에 있어서, 상기 선택된 세그먼트 각각은 상기 음성 신호 내 발생 상대 주파수와 같은 크기의 상대 주파수로 선택되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 음성 신호는 디지털 값의 시퀀스를 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 세그먼트는 상기 음성 스트림 내 음소를 나타내는 것을 특징으로 하는 방법.
- 제17항에 있어서, 상기 음소는 연속 음성 인식 시스템을 사용하여 결정되는 것을 특징으로 하는 방법.
- 제17항에 있어서, 상기 일시적으로 분할하는 단계는,상기 음성 신호를 제곱하는 단계;단시간 스케일에 대한 상기 음성 신호의 단시간 평균을 계산하는 단계;중간시간 스케일에 대한 상기 음성 신호의 중간시간 평균을 계산하는 단계;상기 단시간 평균 및 상기 중간시간 평균 사이의 차이를 계산하는 단계; 및상기 차이에서 제로 크로싱을 검출하는 단계를 포함하며,상기 제로 크로싱이 상기 세그먼트를 묘사하는 것을 특징으로 하는 방법.
- 제19항에 있어서, 상기 단시간 스케일은 상기 음성 스트림에 전형적인 음소의 길이를 부여하는 것을 특징으로 하는 방법.
- 제19항에 있어서, 상기 중간시간 스케일은 상기 음성 스트림에 전형적인 단어의 길이를 부여하는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 저장 단계는,상기 음성 신호를 제곱하는 단계;장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 단계;상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 단계;상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리에 상기 세그먼트의 상기 저장을 중지하는 단계; 및상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리에 상기 세그먼트의 상기 저장을 재개하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제22항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 검색 단계는,상기 음성 신호를 제곱하는 단계;장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 단계;상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 단계;상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 중지하는 단계; 및상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 재개하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제24항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 조합 단계는, 상기 선택된 세그먼트 각각에 성형 함수를 적용하는 단계를 포함하며;상기 성형 함수가 상기 모호한 음성 신호 내 연속의 세그먼트 간 부드러운 트랜지션을 제공하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 선택 및 조합 단계는 상기 음성 신호로부터 다수의 상기 모호한 음성 신호를 동시에 생성하는 것을 특징으로 하는 방법.
- 음성 스트림을 마스킹하는 방법에 있어서,상기 음성 스트림을 나타내는 음성 신호를 획득하는 단계;모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 단계; 및결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 단계를 포함하며,상기 결합된 음성 신호가 실질적으로 난해한 결합된 음성 스트림을 나타내는 것을 특징으로 하는 방법.
- 음성 스트림을 마스킹하는 방법에 있어서,상기 음성 스트림을 나타내는 음성 신호를 획득하는 단계;모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 단계;모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 단계; 및결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 단계를 포함하며,상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 방법.
- 이해가능한 음성으로부터 실질적으로 난해하고, 모호한 음성 신호를 생성하는 장치에 있어서,음성 스트림을 나타내는 음성 신호를 획득하는 모듈;상기 음성 신호를 다수의 세그먼트로 일시적으로 분할하는 모듈로서, 상기 세그먼트가 상기 음성 신호 내에서 초기 순서로 발생되는, 상기 분할 모듈;상기 세그먼트 중에서 다수의 선택된 세그먼트를 선택하는 모듈; 및상기 초기 순서와 상이한 순서로, 상기 모호한 음성 신호를 생성하기 위해, 상기 선택된 세그먼트를 조합하는 모듈을 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서,상기 세그먼트를 저장하는 메모리; 및상기 메모리로부터 상기 선택된 세그먼트를 검색하는 모듈을 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 모호한 음성 신호는 실질적으로 실시간으로 생성되는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 음성 신호는 사전에 기록된 음성 스트림을 나타내는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 모호한 음성 신호는 난해한 배경 대화를 시뮬레이트하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 모호한 음성 신호를 텔레커뮤니케이션 네트워크를 통해 전송하는 모듈을 더 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 모듈을 더 포함하며;상기 결합된 신호가 실질적으로 난해한 음성 스트림을 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 모듈, 및결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 모듈을 포함하며;상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 음성 신호를 획득하는 마이크로폰을 더 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 모호한 음성 신호를 재생하는 라우드스피커를 더 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 음성 신호는 사무실 환경으로부터 획득되는 것을 특징으로 하는 장치.
- 제31항에 있어서, 상기 선택된 세그먼트는 상기 음성 스트림 내 각 세그먼트를 포함하는 것을 특징으로 하는 장치.
- 제31항에 있어서, 상기 선택된 세그먼트는 상기 음성 신호 내에 존재하는 세그먼트의 최근 히스토리를 포함하는 상기 메모리 내 다수의 세그먼트로부터 선택되는 것을 특징으로 하는 장치.
- 제42항에 있어서, 상기 선택된 세그먼트는 상기 메모리 내에 포함된 상기 다수의 세그먼트로부터 무작위적으로 선택되는 것을 특징으로 하는 장치.
- 제42항에 있어서, 상기 선택된 세그먼트 각각은 상기 음성 신호 내 발생 상대 주파수와 같은 크기의 상대 주파수로 선택되는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 음성 신호는 디지털 값의 시퀀스를 포함하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 세그먼트는 상기 음성 스트림 내 음소를 나타내는 것을 특징으로 하는 장치.
- 제46항에 있어서, 상기 음소는 연속 음성 인식 시스템을 사용하여 결정되는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 일시적으로 분할하는 모듈은,상기 음성 신호를 제곱하는 모듈;단시간 스케일에 대한 상기 음성 신호의 단시간 평균을 계산하는 모듈;중간시간 스케일에 대한 상기 음성 신호의 중간시간 평균을 계산하는 모듈;상기 단시간 평균 및 상기 중간시간 평균 사이의 차이를 계산하는 모듈; 및상기 차이에서 제로 크로싱을 검출하는 모듈을 포함하며,상기 제로 크로싱이 상기 세그먼트를 묘사하는 것을 특징으로 하는 장치.
- 제48항에 있어서, 상기 단시간 스케일은 상기 음성 스트림에 전형적인 음소의 길이를 부여하는 것을 특징으로 하는 장치.
- 제48항에 있어서, 상기 중간시간 스케일은 상기 음성 스트림에 전형적인 단어의 길이를 부여하는 것을 특징으로 하는 장치.
- 제31항에 있어서, 상기 메모리는,상기 음성 신호를 제곱하는 모듈;장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 모듈;상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 모듈;상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리에 상기 세그먼트의 상기 저장을 중지하는 모듈; 및상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리에 상기 세그먼트의 상기 저장을 재개하는 모듈을 더 포함하는 것을 특징으로 하는 장치.
- 제51항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 장치.
- 제31항에 있어서, 상기 검색 모듈은,상기 음성 신호를 제곱하는 모듈;장시간 스케일에 대한 상기 음성 신호의 장시간 평균을 계산하는 모듈;상기 장시간 평균이 제1 임계값을 초과하고 상기 장시간 평균이 제2 임계값의 미만일 때를 결정하는 모듈;상기 장시간 평균이 상기 제2 임계값의 미만일 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 중지하는 모듈; 및상기 장시간 평균이 상기 제1 임계값을 초과할 때 상기 메모리로부터 상기 세그먼트의 상기 검색을 재개하는 모듈을 포함하는 것을 특징으로 하는 장치.
- 제53항에 있어서, 상기 장시간 스케일은 상기 음성 스트림의 대화 시간 스케일을 부여하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 조합 모듈은, 상기 선택된 세그먼트 각각에 성형 함수를 적용하는 모듈을 포함하며;상기 성형 함수가 상기 모호한 음성 신호 내 연속의 세그먼트 간 부드러운 트랜지션을 제공하는 것을 특징으로 하는 장치.
- 제30항에 있어서, 상기 선택 및 조합 모듈은 상기 음성 신호로부터 다수의 상기 모호한 음성 신호를 동시에 생성하는 것을 특징으로 하는 장치.
- 음성 스트림을 마스킹하는 장치에 있어서,상기 음성 스트림을 나타내는 음성 신호를 획득하는 모듈;모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 모듈; 및결합된 음성 신호를 생성하기 위해 상기 음성 신호 및 상기 모호한 음성 신호를 결합하는 모듈을 포함하며,상기 결합된 음성 신호가 실질적으로 난해한 결합된 음성 스트림을 나타내는 것을 특징으로 하는 장치.
- 음성 스트림을 마스킹하는 장치에 있어서,상기 음성 스트림을 나타내는 음성 신호를 획득하는 모듈;모호한 음성 신호를 형성하기 위해 상기 음성 신호를 변경하는 모듈;모호한 음성 스트림을 제공하기 위해 상기 모호한 음성 신호를 재생성하는 모듈; 및결합된 음성 스트림을 생성하기 위해 상기 음성 스트림 및 상기 모호한 음성 스트림을 결합하는 모듈을 포함하며,상기 결합된 음성 스트림이 실질적으로 난해한 것을 특징으로 하는 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/205,328 | 2002-07-24 | ||
US10/205,328 US7143028B2 (en) | 2002-07-24 | 2002-07-24 | Method and system for masking speech |
PCT/US2003/021578 WO2004010627A1 (en) | 2002-07-24 | 2003-07-10 | Method and system for masking speech |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050021554A true KR20050021554A (ko) | 2005-03-07 |
KR100695592B1 KR100695592B1 (ko) | 2007-03-14 |
Family
ID=30770047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20057001192A KR100695592B1 (ko) | 2002-07-24 | 2003-07-10 | 음성 마스킹 시스템 및 그 방법 |
Country Status (6)
Country | Link |
---|---|
US (3) | US7143028B2 (ko) |
EP (1) | EP1525697A4 (ko) |
JP (1) | JP4324104B2 (ko) |
KR (1) | KR100695592B1 (ko) |
AU (1) | AU2003248934A1 (ko) |
WO (1) | WO2004010627A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107218A1 (ko) * | 2019-11-29 | 2021-06-03 | 주식회사 공훈 | 음성 데이터의 프라이버시 보호를 위한 방법 및 디바이스 |
Families Citing this family (166)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050254663A1 (en) * | 1999-11-16 | 2005-11-17 | Andreas Raptopoulos | Electronic sound screening system and method of accoustically impoving the environment |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7143028B2 (en) * | 2002-07-24 | 2006-11-28 | Applied Minds, Inc. | Method and system for masking speech |
US20040125922A1 (en) * | 2002-09-12 | 2004-07-01 | Specht Jeffrey L. | Communications device with sound masking system |
US20050065778A1 (en) * | 2003-09-24 | 2005-03-24 | Mastrianni Steven J. | Secure speech |
WO2006076217A2 (en) * | 2005-01-10 | 2006-07-20 | Herman Miller, Inc. | Method and apparatus of overlapping and summing speech for an output that disrupts speech |
US7363227B2 (en) * | 2005-01-10 | 2008-04-22 | Herman Miller, Inc. | Disruption of speech understanding by adding a privacy sound thereto |
JP4761506B2 (ja) | 2005-03-01 | 2011-08-31 | 国立大学法人北陸先端科学技術大学院大学 | 音声処理方法と装置及びプログラム並びに音声システム |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP4785563B2 (ja) * | 2006-03-03 | 2011-10-05 | グローリー株式会社 | 音声処理装置および音声処理方法 |
US20080243492A1 (en) * | 2006-09-07 | 2008-10-02 | Yamaha Corporation | Voice-scrambling-signal creation method and apparatus, and computer-readable storage medium therefor |
JP4924309B2 (ja) * | 2006-09-07 | 2012-04-25 | ヤマハ株式会社 | 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
KR100858283B1 (ko) * | 2007-01-09 | 2008-09-17 | 최현준 | 대화 도청 방지를 위한 사운드 마스킹 방법과 이를 위한장치 |
KR100731816B1 (ko) | 2007-03-13 | 2007-06-22 | 주식회사 휴민트 | 음파를 사용한 도청방지방법 및 장치 |
JP5103974B2 (ja) * | 2007-03-22 | 2012-12-19 | ヤマハ株式会社 | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム |
JP4245060B2 (ja) | 2007-03-22 | 2009-03-25 | ヤマハ株式会社 | サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム |
JP5103973B2 (ja) * | 2007-03-22 | 2012-12-19 | ヤマハ株式会社 | サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US20090171670A1 (en) * | 2007-12-31 | 2009-07-02 | Apple Inc. | Systems and methods for altering speech during cellular phone use |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
CN102057423B (zh) * | 2008-06-10 | 2013-04-03 | 杜比实验室特许公司 | 用于隐藏音频伪迹的方法、系统、计算机系统用途 |
DE102008035181A1 (de) * | 2008-06-26 | 2009-12-31 | Zumtobel Lighting Gmbh | Verfahren und System zur Reduzierung akustischer Störungen |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
JP5691191B2 (ja) * | 2009-02-19 | 2015-04-01 | ヤマハ株式会社 | マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8200480B2 (en) * | 2009-09-30 | 2012-06-12 | International Business Machines Corporation | Deriving geographic distribution of physiological or psychological conditions of human speakers while preserving personal privacy |
WO2011066844A1 (en) * | 2009-12-02 | 2011-06-09 | Agnitio, S.L. | Obfuscated speech synthesis |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
EP2367169A3 (en) * | 2010-01-26 | 2014-11-26 | Yamaha Corporation | Masker sound generation apparatus and program |
JP5691180B2 (ja) * | 2010-01-26 | 2015-04-01 | ヤマハ株式会社 | マスカ音生成装置およびプログラム |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8532987B2 (en) * | 2010-08-24 | 2013-09-10 | Lawrence Livermore National Security, Llc | Speech masking and cancelling and voice obscuration |
JP5849411B2 (ja) * | 2010-09-28 | 2016-01-27 | ヤマハ株式会社 | マスカ音出力装置 |
JP5590394B2 (ja) * | 2010-11-19 | 2014-09-17 | 清水建設株式会社 | ノイズマスキングシステム |
JP6007481B2 (ja) | 2010-11-25 | 2016-10-12 | ヤマハ株式会社 | マスカ音生成装置、マスカ音信号を記憶した記憶媒体、マスカ音再生装置、およびプログラム |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
CN102110441A (zh) * | 2010-12-22 | 2011-06-29 | 中国科学院声学研究所 | 一种基于时间反转的声掩蔽信号产生方法 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8700406B2 (en) * | 2011-05-23 | 2014-04-15 | Qualcomm Incorporated | Preserving audio data collection privacy in mobile devices |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
US8903726B2 (en) * | 2012-05-03 | 2014-12-02 | International Business Machines Corporation | Voice entry of sensitive information |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9123349B2 (en) * | 2012-09-28 | 2015-09-01 | Intel Corporation | Methods and apparatus to provide speech privacy |
US8670986B2 (en) | 2012-10-04 | 2014-03-11 | Medical Privacy Solutions, Llc | Method and apparatus for masking speech in a private environment |
CN113470641B (zh) | 2013-02-07 | 2023-12-15 | 苹果公司 | 数字助理的语音触发器 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US9361903B2 (en) * | 2013-08-22 | 2016-06-07 | Microsoft Technology Licensing, Llc | Preserving privacy of a conversation from surrounding environment using a counter signal |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US20160196832A1 (en) * | 2015-01-06 | 2016-07-07 | Gulfstream Aerospace Corporation | System enabling a person to speak privately in a confined space |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10277581B2 (en) * | 2015-09-08 | 2019-04-30 | Oath, Inc. | Audio verification |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
GB201517331D0 (en) * | 2015-10-01 | 2015-11-18 | Chase Information Technology Services Ltd And Cannings Nigel H | System and method for preserving privacy of data in a cloud |
US9564983B1 (en) | 2015-10-16 | 2017-02-07 | International Business Machines Corporation | Enablement of a private phone conversation |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
BR112018072698A2 (pt) * | 2016-05-05 | 2019-02-19 | Securite Spytronic Inc | método para impedir a gravação compreensível de uma voz, método para impedir a gravação de uma conversa compreensível entre pelo menos dois interlocutores, dispositivo para impedir a gravação compreensível da gravação compreensível de uma voz, dispositivo para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, dispositivo para impedir a gravação compreensível de uma voz, dispositivo para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, sistema para impedir a gravação compreensível de uma voz, sistema para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores, kit para impedir a gravação compreensível de uma voz e kit para impedir a gravação compreensível de uma conversa entre pelo menos dois interlocutores |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
GB2553571B (en) * | 2016-09-12 | 2020-03-04 | Jaguar Land Rover Ltd | Apparatus and method for privacy enhancement |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10276177B2 (en) * | 2016-10-01 | 2019-04-30 | Intel Corporation | Technologies for privately processing voice data using a repositioned reordered fragmentation of the voice data |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10304473B2 (en) * | 2017-03-15 | 2019-05-28 | Guardian Glass, LLC | Speech privacy system and/or associated method |
US10726855B2 (en) * | 2017-03-15 | 2020-07-28 | Guardian Glass, Llc. | Speech privacy system and/or associated method |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10819710B2 (en) | 2017-09-29 | 2020-10-27 | Jpmorgan Chase Bank, N.A. | Systems and methods for privacy-protecting hybrid cloud and premise stream processing |
US10885221B2 (en) | 2018-10-16 | 2021-01-05 | International Business Machines Corporation | Obfuscating audible communications in a listening space |
US10553194B1 (en) | 2018-12-04 | 2020-02-04 | Honeywell Federal Manufacturing & Technologies, Llc | Sound-masking device for a roll-up door |
US11350885B2 (en) * | 2019-02-08 | 2022-06-07 | Samsung Electronics Co., Ltd. | System and method for continuous privacy-preserved audio collection |
JP7287182B2 (ja) * | 2019-08-21 | 2023-06-06 | 沖電気工業株式会社 | 音響処理装置、音響処理プログラム及び音響処理方法 |
JP7532791B2 (ja) | 2020-02-07 | 2024-08-14 | 沖電気工業株式会社 | 音響処理装置、音響処理プログラム及び音響処理方法 |
JP2021135361A (ja) * | 2020-02-26 | 2021-09-13 | 沖電気工業株式会社 | 音響処理装置、音響処理プログラム及び音響処理方法 |
CN113722502B (zh) * | 2021-08-06 | 2023-08-01 | 深圳清华大学研究院 | 基于深度学习的知识图谱构建方法、系统及存储介质 |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3651268A (en) * | 1969-04-01 | 1972-03-21 | Scrambler And Seismic Sciences | Communication privacy system |
US3718765A (en) | 1970-02-18 | 1973-02-27 | J Halaby | Communication system with provision for concealing intelligence signals with noise signals |
US4068094A (en) | 1973-02-13 | 1978-01-10 | Gretag Aktiengesellschaft | Method and apparatus for the scrambled transmission of spoken information via a telephony channel |
CH559483A5 (ko) * | 1973-06-12 | 1975-02-28 | Patelhold Patentverwertung | |
US3879578A (en) * | 1973-06-18 | 1975-04-22 | Theodore Wildi | Sound masking method and system |
US3979578A (en) | 1975-06-23 | 1976-09-07 | Mccullough Ira J | Access controller and system |
US4052564A (en) | 1975-09-19 | 1977-10-04 | Herman Miller, Inc. | Masking sound generator |
US3985957A (en) | 1975-10-28 | 1976-10-12 | Dukane Corporation | Sound masking system for open plan office |
US4099027A (en) | 1976-01-02 | 1978-07-04 | General Electric Company | Speech scrambler |
US4280019A (en) | 1977-12-06 | 1981-07-21 | Herman Miller, Inc. | Combination acoustic conditioner and light fixture |
US4195202A (en) | 1978-01-03 | 1980-03-25 | Technical Communications Corporation | Voice privacy system with amplitude masking |
US4232194A (en) | 1979-03-16 | 1980-11-04 | Ocean Technology, Inc. | Voice encryption system |
US4266243A (en) | 1979-04-25 | 1981-05-05 | Westinghouse Electric Corp. | Scrambling system for television sound signals |
US4319088A (en) | 1979-11-01 | 1982-03-09 | Commercial Interiors, Inc. | Method and apparatus for masking sound |
US4443660A (en) * | 1980-02-04 | 1984-04-17 | Rockwell International Corporation | System and method for encrypting a voice signal |
US4476572A (en) | 1981-09-18 | 1984-10-09 | Bolt Beranek And Newman Inc. | Partition system for open plan office spaces |
SE431385B (sv) | 1982-06-11 | 1984-01-30 | Ericsson Telefon Ab L M | Sett att forvrenga en talsignal, sett att aterstella den forvrengda talsignalen, samt anordning for att forvrenga respektive aterstella talsignalen |
US4756572A (en) * | 1985-04-18 | 1988-07-12 | Prince Corporation | Beverage container holder for vehicles |
US4706282A (en) * | 1985-12-23 | 1987-11-10 | Minnesota Mining And Manufacturing Company | Decoder for a recorder-decoder system |
US4852170A (en) | 1986-12-18 | 1989-07-25 | R & D Associates | Real time computer speech recognition system |
US4937867A (en) * | 1987-03-27 | 1990-06-26 | Teletec Corporation | Variable time inversion algorithm controlled system for multi-level speech security |
CA1288182C (en) * | 1987-06-02 | 1991-08-27 | Mitsuhiro Azuma | Secret speech equipment |
GB2207328A (en) | 1987-07-20 | 1989-01-25 | British Broadcasting Corp | Scrambling of analogue electrical signals |
FR2619479B1 (fr) * | 1987-08-14 | 1989-12-01 | Thomson Csf | Procede pour la synchronisation rapide de vocodeurs couples entre eux au moyen de dispositifs de chiffrement et de dechiffrement |
US5148478A (en) * | 1989-05-19 | 1992-09-15 | Syntellect Inc. | System and method for communications security protection |
US5105377A (en) | 1990-02-09 | 1992-04-14 | Noise Cancellation Technologies, Inc. | Digital virtual earth active cancellation system |
WO1993018505A1 (en) | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5315661A (en) | 1992-08-12 | 1994-05-24 | Noise Cancellation Technologies, Inc. | Active high transmission loss panel |
US5355418A (en) | 1992-10-07 | 1994-10-11 | Westinghouse Electric Corporation | Frequency selective sound blocking system for hearing protection |
JP3235287B2 (ja) | 1993-08-09 | 2001-12-04 | 富士ゼロックス株式会社 | 画像編集装置 |
EP0648031B1 (en) * | 1993-10-12 | 2007-08-01 | Matsushita Electric Industrial Co., Ltd. | Audio scrambling system for scrambling and descrambling audio signals |
CA2179194A1 (en) * | 1993-12-16 | 1995-06-29 | Andrew Wilson Howitt | System and method for performing voice compression |
US5528693A (en) * | 1994-01-21 | 1996-06-18 | Motorola, Inc. | Method and apparatus for voice encryption in a communications system |
HU219667B (hu) * | 1994-03-31 | 2001-06-28 | The Arbitron Company | Berendezés és eljárás kód-frekvenciaösszetevőkkel rendelkező kódnak audiojel-frekvenciaösszetevőkkel rendelkező audiojelbe való beillesztésére |
US5920840A (en) | 1995-02-28 | 1999-07-06 | Motorola, Inc. | Communication system and method using a speaker dependent time-scaling technique |
JP3109978B2 (ja) | 1995-04-28 | 2000-11-20 | 松下電器産業株式会社 | 音声区間検出装置 |
US6109923A (en) | 1995-05-24 | 2000-08-29 | Syracuase Language Systems | Method and apparatus for teaching prosodic features of speech |
US5742679A (en) * | 1996-08-19 | 1998-04-21 | Rockwell International Corporation | Optimized simultaneous audio and data transmission using QADM with phase randomization |
JPH10136321A (ja) | 1996-10-25 | 1998-05-22 | Matsushita Electric Ind Co Ltd | 音声信号の信号処理装置および方法 |
US6256491B1 (en) * | 1997-12-31 | 2001-07-03 | Transcript International, Inc. | Voice security between a composite channel telephone communications link and a telephone |
US6834130B1 (en) | 1998-02-18 | 2004-12-21 | Minolta Co., Ltd. | Image retrieval system for retrieving a plurality of images which are recorded in a recording medium, and a method thereof |
US6266412B1 (en) * | 1998-06-15 | 2001-07-24 | Lucent Technologies Inc. | Encrypting speech coder |
CA2347011A1 (en) * | 1998-10-28 | 2000-05-04 | Ellwood Mcgrogan | Apparatus and methods for cryptographic synchronization in packet based communications |
US6272633B1 (en) * | 1999-04-14 | 2001-08-07 | General Dynamics Government Systems Corporation | Methods and apparatus for transmitting, receiving, and processing secure voice over internet protocol |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
US6658112B1 (en) * | 1999-08-06 | 2003-12-02 | General Dynamics Decision Systems, Inc. | Voice decoder and method for detecting channel errors using spectral energy evolution |
KR20010057593A (ko) * | 1999-12-17 | 2001-07-05 | 박종섭 | 이동통신 시스템에서의 음성 및 데이타 암호화/복호화장치및 그 방법 |
US7039189B1 (en) | 2000-03-17 | 2006-05-02 | International Business Machines Corporation | Stream continuity enforcement |
JP4221537B2 (ja) | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
US6907123B1 (en) * | 2000-12-21 | 2005-06-14 | Cisco Technology, Inc. | Secure voice communication system |
US20020103636A1 (en) | 2001-01-26 | 2002-08-01 | Tucker Luke A. | Frequency-domain post-filtering voice-activity detector |
US7143028B2 (en) * | 2002-07-24 | 2006-11-28 | Applied Minds, Inc. | Method and system for masking speech |
-
2002
- 2002-07-24 US US10/205,328 patent/US7143028B2/en not_active Expired - Fee Related
-
2003
- 2003-07-10 JP JP2004523098A patent/JP4324104B2/ja not_active Expired - Fee Related
- 2003-07-10 EP EP03765527A patent/EP1525697A4/en not_active Withdrawn
- 2003-07-10 AU AU2003248934A patent/AU2003248934A1/en not_active Abandoned
- 2003-07-10 WO PCT/US2003/021578 patent/WO2004010627A1/en active Application Filing
- 2003-07-10 KR KR20057001192A patent/KR100695592B1/ko not_active IP Right Cessation
-
2006
- 2006-07-11 US US11/456,806 patent/US7505898B2/en not_active Expired - Fee Related
- 2006-07-12 US US11/457,100 patent/US7184952B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107218A1 (ko) * | 2019-11-29 | 2021-06-03 | 주식회사 공훈 | 음성 데이터의 프라이버시 보호를 위한 방법 및 디바이스 |
Also Published As
Publication number | Publication date |
---|---|
US20040019479A1 (en) | 2004-01-29 |
US7505898B2 (en) | 2009-03-17 |
JP2005534061A (ja) | 2005-11-10 |
WO2004010627A1 (en) | 2004-01-29 |
US7143028B2 (en) | 2006-11-28 |
US20060241939A1 (en) | 2006-10-26 |
EP1525697A4 (en) | 2009-01-07 |
US20060247924A1 (en) | 2006-11-02 |
JP4324104B2 (ja) | 2009-09-02 |
EP1525697A1 (en) | 2005-04-27 |
AU2003248934A1 (en) | 2004-02-09 |
KR100695592B1 (ko) | 2007-03-14 |
US7184952B2 (en) | 2007-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100695592B1 (ko) | 음성 마스킹 시스템 및 그 방법 | |
AU2021200589B2 (en) | Speech reproduction device configured for masking reproduced speech in a masked speech zone | |
US7363227B2 (en) | Disruption of speech understanding by adding a privacy sound thereto | |
CN105493177B (zh) | 用于音频处理的系统和计算机可读存储介质 | |
US20030093270A1 (en) | Comfort noise including recorded noise | |
JP2017538146A (ja) | インテリジェントな音声認識および処理のためのシステム、方法、およびデバイス | |
EP3800900A1 (en) | A wearable electronic device for emitting a masking signal | |
KR100858283B1 (ko) | 대화 도청 방지를 위한 사운드 마스킹 방법과 이를 위한장치 | |
JP4428280B2 (ja) | 通話内容隠蔽システム、通話装置、通話内容隠蔽方法およびプログラム | |
JP5682115B2 (ja) | サウンドマスキングを行うための装置およびプログラム | |
US11232809B2 (en) | Method for preventing intelligible voice recordings | |
JP2000315042A (ja) | 聴覚訓練方法 | |
JP5662711B2 (ja) | 音声変更装置、音声変更方法および音声情報秘話システム | |
JP5691180B2 (ja) | マスカ音生成装置およびプログラム | |
WO2007051056A2 (en) | Method and apparatus for speech disruption | |
WO2008062198A1 (en) | A background noise generator | |
McCaul | ◾ Principles of Audio | |
JP5662712B2 (ja) | 音声変更装置、音声変更方法および音声情報秘話システム | |
JPH08223286A (ja) | 話中着信音発生装置及び話中着信音発生方法 | |
JP2012048120A (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130221 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140221 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150224 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160218 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170220 Year of fee payment: 11 |
|
LAPS | Lapse due to unpaid annual fee |