JP2019109503A - プライバシー保護音声対話のための装置及び方法 - Google Patents
プライバシー保護音声対話のための装置及び方法 Download PDFInfo
- Publication number
- JP2019109503A JP2019109503A JP2018226745A JP2018226745A JP2019109503A JP 2019109503 A JP2019109503 A JP 2019109503A JP 2018226745 A JP2018226745 A JP 2018226745A JP 2018226745 A JP2018226745 A JP 2018226745A JP 2019109503 A JP2019109503 A JP 2019109503A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- name
- ambiguous
- answer
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000003993 interaction Effects 0.000 title claims abstract description 8
- 230000001755 vocal effect Effects 0.000 title abstract 3
- 230000005236 sound signal Effects 0.000 claims abstract description 49
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 claims description 36
- 238000004891 communication Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000005352 clarification Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003716 rejuvenation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42008—Systems for anonymous communication between parties, e.g. by use of disposal contact identifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Respiratory Apparatuses And Protective Means (AREA)
Abstract
Description
本開示は、音声対話の領域に関し、特にマルチユーザホームアシスタント環境におけるユーザのプライバシーを保護する。
このセクションは、技術の様々な態様を読者に紹介するように意図され、技術の様々な態様は、以下で説明され且つ/又は特許請求される本開示の様々な態様に関係し得る。この説明は、本開示の様々な態様のよりよい理解を促進するために、読者に背景情報を提供する際に有用であると考えられる。従って、これらの所説は、この観点で読まれるべきであり、先行技術の承認として読まれるべきではないことを理解されたい。
本開示は、プライバシー保護音声対話のためのホームアシスタント装置及び方法を説明する。マイクロホンが、音声ユーザクエリーに対応するオーディオ信号を捕捉する。話者の識別が決定され、及び識別された話者に対応して曖昧な名前が生成される。オーディオ信号がユーザのインテントを決定するために解析され、及び個人化された答えが曖昧な名前と組み合わされて生成される。次に、この答えが、話者名を再導入することによって明瞭にされる。次に、明瞭な答えが話者に与えられる。
ここで、本開示の好ましい特徴が添付の図面に関連して非限定的な例として説明される。
図1Aは、先行技術による例示的なホームアシスタントエコシステムを示す。当業者は、明確にするために図示の装置が簡略化されていることを理解するであろう。ホームアシスタントエコシステムは、通信インターフェース120を通してサービスプロバイダと対話する少なくともホームアシスタント装置100を含む。サービスプロバイダは、サービスが音声対話と個人ユーザに向けられた個人化とに基づいているという特殊性を用いて、複数のサービスをユーザに提案する。サービスは、話者の要求に答えるために協力する専用ソフトウェアアプリケーションによって提供される。これらのソフトウェアアプリケーションは、典型的には、クラウドにおける家庭外装置上で従来的に実行され、図1Aに示されるような単一のサービスオペレータ140によって操作することができ、又は協力している複数のサービスプロバイダ間で分割することができる。
102 マイクロホン
104 話者識別子
106 プライバシーエンフォーサ
108 テキストトゥスピーチコンバータ
110 ラウドスピーカ
120 通信インターフェース
121、121’、125 オーディオ信号
122 話者名
123 インテント
124、124’ 答え
126 曖昧な名前
127 明瞭な答え
140 サービスプロバイダ
150 スピーチトゥインテント
160 会話論理
170 テキストトゥスピーチコンバータ
200 ステップ
202 ユーザ識別ステップ
204 曖昧化ステップ
206 オーディオクエリー曖昧化ステップ
208 ステップ
210 ステップ
212 明瞭化ステップ
214 提供ステップ
Claims (15)
- プライバシー保護音声対話を実行するための装置(100’)であって、
− 話者からのクエリーに関する発話音声を表すオーディオ信号(121)を捕捉するように構成されたマイクロホン(102)と、
− 前記捕捉されたオーディオ信号(121)から話者の識別を決定するように構成された話者識別子(104)と、
− 前記識別された話者に対応する曖昧な話者名(122)を生成し、且つ話者名と曖昧な話者名との間の対応関係のリストを格納するように構成されたプライバシーエンフォーサ(106)と、
− 通信インターフェース(120)であって、
− 前記捕捉されたオーディオ信号(121)及び前記曖昧な話者名(122)を外部装置に提供することと、
− 前記話者クエリーへの答え(124、125)を外部装置から受信することと
を行うように構成された通信インターフェース(120)と
を含み、前記プライバシーエンフォーサは、前記受信された答えが前記リストの曖昧な話者名を含むかどうかを決定し、且つこの場合、前記受信された答えにおいて、前記曖昧な話者名を前記対応する名前によって取り替えるように更に構成される、装置(100’)。 - 前記話者に前記答えを提供することを更に含む、請求項1に記載の装置。
- 前記受信された答え(124)は、テキスト形式である、請求項1に記載の装置。
- 明瞭な答え(124’)をテキスト形式からオーディオ信号(127)に変換するように構成されたテキストトゥスピーチコンバータ(108)を更に含む、請求項3に記載の装置。
- 前記受信された答え(124)は、オーディオフォーマットである、請求項1に記載の装置。
- 前記プライバシーエンフォーサは、前記リストの話者名を検出し、且つ前記話者名を、前記対応する曖昧な話者名を表すオーディオ信号によって取り替えることにより、前記捕捉されたオーディオ信号(121)を曖昧にするように更に構成される、請求項1に記載の装置。
- 前記プライバシーエンフォーサは、匿名モードをオン又はオフにするための設定であって、第1の場合、前記プライバシーエンフォーサは、前記話者名を提供する前に前記話者名を曖昧にし、且つ前記受信された答えが曖昧な話者名を含む場合、前記受信された答えを明瞭にし、及び第2の場合、前記プライバシーエンフォーサは、前記話者名をもはや曖昧にせず、且つ前記受信された答えが曖昧な話者名を含むかどうかをもはや決定しない、設定を更に含む、請求項1に記載の装置。
- プライバシー保護音声対話を実行するための方法であって、
− 話者からのクエリーに関する発話音声を表すオーディオ信号を捕捉すること(200)と、
− 前記捕捉されたオーディオ信号から話者を識別すること(202)と、
− 前記識別された話者に対応する曖昧な話者名を生成し、且つ話者名と曖昧な話者名との間の対応関係のリストを格納すること(204)と、
− 前記捕捉されたオーディオ信号及び前記曖昧な話者名を外部装置に提供することと、
− 前記クエリーへの答えを外部装置から取得することと、
− 前記受信された答えが前記リストの曖昧な話者名を含むかどうかを決定し、且つこの場合、前記受信された答えにおいて、前記曖昧な話者名を前記対応する名前によって取り替えること(212)と
を含む方法。 - 前記答えを前記話者に提供することを更に含む、請求項8に記載の方法。
- 前記受信された答え(124)は、テキスト形式又はオーディオ形式である、請求項8に記載の方法。
- 前記リストの話者名を検出し、且つ前記話者名を、前記対応する曖昧な話者名を表すオーディオ信号によって取り替えることにより、前記捕捉されたオーディオ信号(121)を曖昧にすることを更に含む、請求項8に記載の方法。
- 匿名モードをオン又はオフにするための設定であって、第1の場合、前記話者名を提供する前に前記話者名を曖昧にし、且つ前記受信された答えが曖昧な話者名を含む場合、前記受信された答えを明瞭にし、及び第2の場合、前記話者名をもはや曖昧にせず、且つ前記受信された答えが曖昧な話者名を含むかどうかをもはや決定しない、設定を更に含む、請求項8に記載の方法。
- 前記リストの前記曖昧な話者名を一新することを更に含む、請求項8に記載の方法。
- 請求項8〜13のいずれか一項に記載の方法のステップを実行するためにプロセッサによって実行可能なプログラムコード命令を含むコンピュータプログラム。
- 非一時的コンピュータ可読媒体上に格納され、且つ請求項8〜13のいずれか一項に記載の方法のステップを実行するためにプロセッサによって実行可能なプログラムコード命令を含むコンピュータプログラム製品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17306719.0A EP3496090A1 (en) | 2017-12-07 | 2017-12-07 | Device and method for privacy-preserving vocal interaction |
EP17306719.0 | 2017-12-07 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019109503A true JP2019109503A (ja) | 2019-07-04 |
JP2019109503A5 JP2019109503A5 (ja) | 2022-01-06 |
JP7166900B2 JP7166900B2 (ja) | 2022-11-08 |
Family
ID=60811978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018226745A Active JP7166900B2 (ja) | 2017-12-07 | 2018-12-03 | プライバシー保護音声対話のための装置及び方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11069362B2 (ja) |
EP (2) | EP3496090A1 (ja) |
JP (1) | JP7166900B2 (ja) |
KR (1) | KR20190067697A (ja) |
CN (1) | CN110033774B (ja) |
BR (1) | BR102018075377B1 (ja) |
CA (1) | CA3026205A1 (ja) |
MX (1) | MX2018015218A (ja) |
RU (1) | RU2768506C2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10909978B2 (en) * | 2017-06-28 | 2021-02-02 | Amazon Technologies, Inc. | Secure utterance storage |
EP3496090A1 (en) * | 2017-12-07 | 2019-06-12 | Thomson Licensing | Device and method for privacy-preserving vocal interaction |
DE102018202018B3 (de) | 2018-02-09 | 2019-05-09 | Siemens Schweiz Ag | Verfahren und System zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen in Gebäuden |
CN110992957B (zh) * | 2019-11-15 | 2023-09-08 | 东华大学 | 基于隐私保护的语音数据处理方法 |
US11769496B1 (en) * | 2019-12-12 | 2023-09-26 | Amazon Technologies, Inc. | Predictive deletion of user input |
AU2021254787A1 (en) * | 2020-04-15 | 2022-10-27 | Pindrop Security, Inc. | Passive and continuous multi-speaker voice biometrics |
US11449674B2 (en) | 2020-04-28 | 2022-09-20 | International Business Machines Corporation | Utility-preserving text de-identification with privacy guarantees |
US11217223B2 (en) * | 2020-04-28 | 2022-01-04 | International Business Machines Corporation | Speaker identity and content de-identification |
CN112673423A (zh) * | 2020-04-29 | 2021-04-16 | 华为技术有限公司 | 一种车内语音交互方法及设备 |
EP3905631B1 (en) * | 2020-05-01 | 2024-05-29 | Avago Technologies International Sales Pte. Limited | Systems and methods for speaker anonymization |
CN111597580B (zh) * | 2020-05-13 | 2023-04-14 | 贵州大学 | 机器人听觉隐私信息监听处理方法 |
CN113066485B (zh) * | 2021-03-25 | 2024-05-17 | 支付宝(杭州)信息技术有限公司 | 一种语音数据处理方法、装置及设备 |
US20220399009A1 (en) * | 2021-06-09 | 2022-12-15 | International Business Machines Corporation | Protecting sensitive information in conversational exchanges |
CN113782027B (zh) * | 2021-09-01 | 2024-06-21 | 维沃移动通信(杭州)有限公司 | 音频处理方法及音频处理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011052412A1 (ja) * | 2009-10-28 | 2011-05-05 | 日本電気株式会社 | 音声認識システム、音声認識要求装置、音声認識方法、音声認識用プログラムおよび記録媒体 |
US20140278409A1 (en) * | 2004-07-30 | 2014-09-18 | At&T Intellectual Property Ii, L.P. | Preserving privacy in natural langauge databases |
US20140372126A1 (en) * | 2013-06-17 | 2014-12-18 | Motorola Mobility Llc | Privacy mode for always-on voice-activated information assistant |
WO2017003579A1 (en) * | 2015-06-29 | 2017-01-05 | Google Inc. | Privacy-preserving training corpus selection |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0942575A3 (en) * | 1998-03-12 | 2001-11-14 | Novcom N.V. | Adaptive telephone answering system |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
JP2001125900A (ja) * | 1999-10-29 | 2001-05-11 | Yazaki Corp | 対話システム及び対話方法、双方向対話システム及び双方向対話方法並びに記録媒体 |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US7920682B2 (en) * | 2001-08-21 | 2011-04-05 | Byrne William J | Dynamic interactive voice interface |
US6839417B2 (en) * | 2002-09-10 | 2005-01-04 | Myriad Entertainment, Inc. | Method and apparatus for improved conference call management |
CA2618623C (en) * | 2005-08-09 | 2015-01-06 | Mobilevoicecontrol, Inc. | Control center for a voice controlled wireless communication device system |
US9330668B2 (en) * | 2005-12-20 | 2016-05-03 | International Business Machines Corporation | Sharing voice application processing via markup |
KR20080107376A (ko) * | 2006-02-14 | 2008-12-10 | 인텔렉츄얼 벤처스 펀드 21 엘엘씨 | 화자 독립 음성 인식을 구비한 통신 장치 |
RU2337020C1 (ru) * | 2007-09-26 | 2008-10-27 | Общество с ограниченной ответственностью "АЛЬТОНИКА" (ООО"АЛЬТОНИКА") | Система голосового распознавания пользователя транспортного средства |
US20110218798A1 (en) * | 2010-03-05 | 2011-09-08 | Nexdia Inc. | Obfuscating sensitive content in audio sources |
US9298878B2 (en) * | 2010-07-29 | 2016-03-29 | Oracle International Corporation | System and method for real-time transactional data obfuscation |
US9542956B1 (en) * | 2012-01-09 | 2017-01-10 | Interactive Voice, Inc. | Systems and methods for responding to human spoken audio |
US9131369B2 (en) * | 2013-01-24 | 2015-09-08 | Nuance Communications, Inc. | Protection of private information in a client/server automatic speech recognition system |
US9437207B2 (en) | 2013-03-12 | 2016-09-06 | Pullstring, Inc. | Feature extraction for anonymized speech recognition |
US9514741B2 (en) | 2013-03-13 | 2016-12-06 | Nuance Communications, Inc. | Data shredding for speech recognition acoustic model training under data retention restrictions |
CN103279499B (zh) * | 2013-05-09 | 2016-11-09 | 北京信息科技大学 | 个性化信息检索中用户隐私保护方法 |
US9666188B2 (en) * | 2013-10-29 | 2017-05-30 | Nuance Communications, Inc. | System and method of performing automatic speech recognition using local private data |
CN103596172A (zh) * | 2013-11-25 | 2014-02-19 | 中国联合网络通信集团有限公司 | 用户信息保护的方法、装置及系统 |
CN103730114A (zh) * | 2013-12-31 | 2014-04-16 | 上海交通大学无锡研究院 | 一种基于联合因子分析模型的移动设备声纹识别方法 |
US10410630B2 (en) * | 2014-06-19 | 2019-09-10 | Robert Bosch Gmbh | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
CN104168377A (zh) * | 2014-08-18 | 2014-11-26 | 小米科技有限责任公司 | 通话方法及装置 |
KR102536944B1 (ko) * | 2014-11-07 | 2023-05-26 | 삼성전자주식회사 | 음성 신호 처리 방법 및 장치 |
US10333904B2 (en) * | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
US20180053504A1 (en) * | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
CN110392913B (zh) * | 2017-05-16 | 2023-09-29 | 谷歌有限责任公司 | 在共用的启用语音的装置上处理呼叫 |
EP3496090A1 (en) * | 2017-12-07 | 2019-06-12 | Thomson Licensing | Device and method for privacy-preserving vocal interaction |
-
2017
- 2017-12-07 EP EP17306719.0A patent/EP3496090A1/en not_active Withdrawn
-
2018
- 2018-11-16 EP EP18206851.0A patent/EP3496091B1/en active Active
- 2018-12-03 CA CA3026205A patent/CA3026205A1/en active Pending
- 2018-12-03 JP JP2018226745A patent/JP7166900B2/ja active Active
- 2018-12-04 KR KR1020180154627A patent/KR20190067697A/ko active IP Right Grant
- 2018-12-05 RU RU2018142910A patent/RU2768506C2/ru active
- 2018-12-06 MX MX2018015218A patent/MX2018015218A/es unknown
- 2018-12-07 CN CN201811501711.1A patent/CN110033774B/zh active Active
- 2018-12-07 US US16/213,187 patent/US11069362B2/en active Active
- 2018-12-07 BR BR102018075377-0A patent/BR102018075377B1/pt active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140278409A1 (en) * | 2004-07-30 | 2014-09-18 | At&T Intellectual Property Ii, L.P. | Preserving privacy in natural langauge databases |
WO2011052412A1 (ja) * | 2009-10-28 | 2011-05-05 | 日本電気株式会社 | 音声認識システム、音声認識要求装置、音声認識方法、音声認識用プログラムおよび記録媒体 |
US20140372126A1 (en) * | 2013-06-17 | 2014-12-18 | Motorola Mobility Llc | Privacy mode for always-on voice-activated information assistant |
WO2017003579A1 (en) * | 2015-06-29 | 2017-01-05 | Google Inc. | Privacy-preserving training corpus selection |
Also Published As
Publication number | Publication date |
---|---|
CA3026205A1 (en) | 2019-06-07 |
EP3496091A1 (en) | 2019-06-12 |
BR102018075377A2 (pt) | 2019-06-25 |
CN110033774A (zh) | 2019-07-19 |
KR20190067697A (ko) | 2019-06-17 |
EP3496090A1 (en) | 2019-06-12 |
CN110033774B (zh) | 2024-07-12 |
US11069362B2 (en) | 2021-07-20 |
MX2018015218A (es) | 2019-07-04 |
RU2768506C2 (ru) | 2022-03-24 |
US20190180759A1 (en) | 2019-06-13 |
JP7166900B2 (ja) | 2022-11-08 |
BR102018075377B1 (pt) | 2022-08-02 |
RU2018142910A (ru) | 2020-06-05 |
RU2018142910A3 (ja) | 2021-08-17 |
EP3496091B1 (en) | 2020-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7166900B2 (ja) | プライバシー保護音声対話のための装置及び方法 | |
US10777203B1 (en) | Speech interface device with caching component | |
JP6588637B2 (ja) | 個別化されたエンティティ発音の学習 | |
US8655659B2 (en) | Personalized text-to-speech synthesis and personalized speech feature extraction | |
CN108391149B (zh) | 显示设备、控制显示设备的方法、服务器以及控制服务器的方法 | |
JP5598998B2 (ja) | 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置 | |
KR20190100334A (ko) | 문맥상의 핫워드들 | |
JP2017107078A (ja) | 音声対話方法、音声対話装置及び音声対話プログラム | |
US11776541B2 (en) | Communicating announcements | |
US11687526B1 (en) | Identifying user content | |
JP2017535809A (ja) | サウンド検出モデルを生成するためのサウンドサンプル検証 | |
JP2018054790A (ja) | 音声対話システムおよび音声対話方法 | |
CN111919249A (zh) | 词语的连续检测和相关的用户体验 | |
KR20150017662A (ko) | 텍스트-음성 변환 방법, 장치 및 저장 매체 | |
KR20200016547A (ko) | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 | |
EP3769303A1 (en) | Modifying spoken commands | |
US11948564B2 (en) | Information processing device and information processing method | |
WO2019155716A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
WO2012090196A1 (en) | Method and system for processing content | |
KR20210042520A (ko) | 전자 장치 및 이의 제어 방법 | |
EP3113175A1 (en) | Method for converting text to individual speech, and apparatus for converting text to individual speech | |
JP2005151553A (ja) | ボイス・ポータル | |
KR20140138011A (ko) | 음성 인식 장치 및 그 제어 방법 | |
WO2020110744A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN111968630A (zh) | 信息处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211126 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221026 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7166900 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |