JP2010079235A - 個人(オーディ)情報を含まないメディア・ストリームを保存する方法 - Google Patents
個人(オーディ)情報を含まないメディア・ストリームを保存する方法 Download PDFInfo
- Publication number
- JP2010079235A JP2010079235A JP2008319176A JP2008319176A JP2010079235A JP 2010079235 A JP2010079235 A JP 2010079235A JP 2008319176 A JP2008319176 A JP 2008319176A JP 2008319176 A JP2008319176 A JP 2008319176A JP 2010079235 A JP2010079235 A JP 2010079235A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- personal information
- audio
- processing system
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000012545 processing Methods 0.000 claims abstract description 64
- 239000000284 extract Substances 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 abstract 1
- 239000003795 chemical substances by application Substances 0.000 description 29
- 230000008569 process Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
- G10L21/045—Time compression or expansion by changing speed using thinning out or insertion of a waveform
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/20—Aspects of automatic or semi-automatic exchanges related to features of supplementary services
- H04M2203/2088—Call or conference reconnect, e.g. resulting from isdn terminal portability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/50—Aspects of automatic or semi-automatic exchanges related to audio conference
- H04M2203/5027—Dropping a party from a conference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/60—Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
- H04M2203/6009—Personal information, e.g. profiles or personal directories being only provided to authorised persons
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Storage Device Security (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
【課題】 個人情報を含む可能性のあるオーディオ情報から個人情報の消去(又はトーンを被せる、サイレンス(無音)にする)処理を行う。
【解決手段】 本発明のデータ処理システムは、オーディオ・ストリーム(更に画像のようなの他の種類の媒体を含むメディア・ストリーム)を受領する。本発明のデータ処理システムがデータを受領すると、データ処理システムは、受信したメディア・ストリームから個人情報を含むオーディオ・ストリームを抽出する。その後このデータ処理システムは、オーディオ・ストリームを解析して、個人オーディオ・コンテンツを抽出する。この為に、本発明のデータ処理システムは、取り除くべき個人情報を記述するモデルを用いる。その後このシステムは、個人オーディオ・コンテンツを、処理されたオーディオを含むストリームから省く。
【選択図】 図1
Description
この技術は、通話は予測可能な方法で処理ができるという洞察に基づく。エージェントは、発呼者のIDを、名前、住所、社会保障番号、パスワード、個人識別番号(PIN)を尋ねることにより、知る。この問い合わせに対する発呼者の応答は、個人情報と見なされ、自動的にオーディオ・ストリームから削除される。
個人情報におけるオーディオ・セグメントの時間位置は、絶対時間又は相対時間の観点で決まる。絶対時間は、応答速度に依存する。例えば、時間位置は、質問したエージェントの音声波形を含むセグメントの直後に起こると見なされる。他の実施例においては、個人情報が発声される時間間隔は、会話の所定部分(例、発呼者音声波形又は記録されたオーディオの最初のM秒である。)内で発生すると見なされる。これに対し、相対時間は、エージェントと発呼者の間で交わされる会話のセグメントの中での特定のオーディオ・セグメントの位置に基づく。例えば、個人情報を有するオーディオ・セグメントの時間位置は、発呼者がエージェントへの5番目、9番目又は10番目の応答と見なされるが、これはその応答が行われた速度には無関係である。
通話が、上記の技術(i)に対し見なされたよりもより構造的でない場合、又は個人情報が通話の本質部分の間で要求された場合には、個人情報は、エージェントにより話されたキーワードにより認識することができる。例えば、エージェントが「あなたの住所をもう一度おっしゃっていただけますか?」と言った場合には、このキー・フレーズが認識され、発呼者の応答は削除される。
発呼者の音声を認識した時には、個人情報を示す単語(例、「現在、服用している薬は…」)に続く部分の表現は、オーディオ・セグメントから削除される。
この技術において、データ処理システム101は、音声波形のセグメントがある種類の場合には、自動的に認識するようチューニングされる。例えば、データ処理システム101が話された一連の番号を検出した場合、データ処理システム101は、「6232418」は電話番号であり、韻律や番号の組み合わせではない(例えば、"6 too 3 to for won ate.")と決定する。データ処理システム101によるこの意味的な認識が与えられると、このモデリング又は他のカスタムメイドのモデリングを用いて、個人情報を有するセグメントを検出し削除することができる。
音声(韻律)の種類は、例えば、その長さ、音節の数、抑揚により認識できる。これらは、タスク201で議論した「韻律」の明示/表現である。この技術は、比較的長い明瞭なフレーズ、例えば、「社会保障番号」やそれを表す発声された数字列、「母親の旧姓」に対し最も上手く機能する。データ処理システム101は、様々なフレーズをその韻律に基づいて探し、それらを状況に応じて削除する。
この技術は、エージェント音声波形のセグメントを用いて、発呼者音声波形の後続のセグメントが個人情報を含むのを予測するのに類似する。これは、発呼者音声波形の第1セグメントを用いて、発呼者音声波形の第2セグメントが個人情報を含むのを予測することができる。
100 個人情報処理環境
101 データ処理システム
102 プライバシ・モデル・サーバ
103 通信ネットワーク
104 未処理のオーディオ・ファイル・サーバ
105 処理済のオーディオ・ファイル・サーバ
図2
開始
201 オーディオ・ストリーム内の個人情報の特徴を記述するモデルを生成する
202 オーディオ・ストリームを受領する
このオーディオ・ストリームは、(i)発呼者音声波形と(ii)エージェント 音声波形を搬送する
203 個人情報を削除するためにオーディオ・ストリームを解析する
204 個人情報の無いオーディオ・ストリームを出力又は記憶する
終了
図3
タスク202から
301 個人情報を処理中のオーディオ・セグメントから削除する
302 個人情報の無いオーディオ・セグメントの表現を記憶する
303 処理すべき更なるセグメントがあるか?
304 次のセグメントに進む
タスク204へ
図4
タスク202から
401 処理中のオーディオ・セグメントが個人情報を含むか否かを次の基準に基づいて決定する
(i)発呼者音声波形内の時間位置
(ii)エージェント音声波形内のキーワード又はキー・フレーズ
(iii)発呼者音声波形内のキーワード又はキー・フレーズ
(iv)ワードの種類
(v)韻律
(vi)発呼者音声波形の様々なセグメント
402 オーディオ・セグメントが個人情報を含む場合には、それにタグを付す
403 タグが付いている場合には、オーディオ・セグメントを変更する
タスク302へ
図5
タスク301から
501 非個人情報のみを含む表現を記憶する
502 音響特徴/痕跡を生成する
タスク303へ
図6
タスク301から
601 セグメントが非個人情報を含むか否かを決定する
602 セグメントが非個人情報のみを含む場合には、それを記憶する
タスク502へ
図7
タスク501から
701 音響セグメント用の音響特徴/痕跡を生成する
702 音響特徴/痕跡をオーディオ・ストリームの表現として記憶する
タスク303へ
Claims (10)
- (A)オーディオ・ストリームをデータ処理システムで受領するステップと、
前記オーディオ・ストリームは、(i)通話中第1当事者により生成された第1音声波形と、(ii)通話中第2当事者により生成された第2音声波形とを搬送し、
(B)前記第1音声波形の第1セグメントが個人情報を含むか否かを決定するステップと、
前記(B)ステップは、(i)第1音声波形の第1セグメントの前の第2セグメントのコンテンツ、又は(ii)第2音声波形の所定のセグメントのコンテンツに基づいて行われ、
(C)前記第1セグメントが個人情報を含むと決定された時には、前記第1セグメントにタグを付すステップと
を有する
ことを特徴とするオーディストリームから個人情報を削除する方法。 - 前記(B)ステップは、第1音声波形内の第1セグメントの時間位置に基づいて行われる
ことを特徴とする請求項1記載の方法。 - 前記第1セグメントが個人情報を含むと決定されるのは、第1セグメントの時間位置が第1音声波形の最初のM秒内にある時であり、
前記Mは、第1音声波形の時間長さの秒数未満の正数である
ことを特徴とする請求項2記載の方法。 - 前記(B)ステップは、第2音声波形の所定のセグメントの韻律に基づいて行われる
ことを特徴とする請求項1記載の方法。 - (D)前記第1音声波形の第3セグメント又は第4セグメントが、非個人情報を含むか否かを決定するステップと、
(E)前記第3セグメントのみが非個人情報を含むと決定された時には、第3セグメントのみを記憶するステップと
をさらに有する
ことを特徴とする請求項1記載の方法。 - 前記(D)ステップは、前記第3セグメントのコンテンツがキーワード又はキー・フレーズとマッチするか否かに基づいて行われる
ことを特徴とする請求項5記載の方法。 - 前記(D)ステップは、第1音声波形内の第3セグメントの時間位置に基づいて行われる
ことを特徴とする請求項5記載の方法。 - 前記第3セグメントが非個人情報を含むと決定されるのは、第3セグメントの時間位置が第1音声波形の最後のN秒内にある時であり、
前記Nは、第1音声波形の時間長さの秒数未満の正数である
ことを特徴とする請求項7記載の方法。 - (F)第1セグメントにタグが付された時に、前記第1セグメントを変更するステップ
をさらに有する
ことを特徴とする請求項1記載の方法。 - 前記(F)のステップは、第1セグメントの場所にトーンを入れる
ことを特徴とする請求項9記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/239,798 US8244531B2 (en) | 2008-09-28 | 2008-09-28 | Method of retaining a media stream without its private audio content |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010079235A true JP2010079235A (ja) | 2010-04-08 |
Family
ID=41213390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008319176A Pending JP2010079235A (ja) | 2008-09-28 | 2008-12-16 | 個人(オーディ)情報を含まないメディア・ストリームを保存する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8244531B2 (ja) |
EP (1) | EP2169669B1 (ja) |
JP (1) | JP2010079235A (ja) |
KR (1) | KR101344630B1 (ja) |
CA (1) | CA2646118C (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019220791A1 (ja) * | 2018-05-14 | 2019-11-21 | 株式会社Nttドコモ | 対話装置 |
WO2020255600A1 (ja) * | 2019-06-20 | 2020-12-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9111540B2 (en) * | 2009-06-09 | 2015-08-18 | Microsoft Technology Licensing, Llc | Local and remote aggregation of feedback data for speech recognition |
US20110218798A1 (en) * | 2010-03-05 | 2011-09-08 | Nexdia Inc. | Obfuscating sensitive content in audio sources |
US9253304B2 (en) * | 2010-12-07 | 2016-02-02 | International Business Machines Corporation | Voice communication management |
US8700406B2 (en) * | 2011-05-23 | 2014-04-15 | Qualcomm Incorporated | Preserving audio data collection privacy in mobile devices |
FR2979465B1 (fr) * | 2011-08-31 | 2013-08-23 | Alcatel Lucent | Procede et dispositif de ralentissement d'un signal audionumerique |
CN103295575B (zh) * | 2012-02-27 | 2019-01-25 | 北京三星通信技术研究有限公司 | 一种语音识别方法和客户端 |
US9576114B2 (en) * | 2012-03-05 | 2017-02-21 | Marvin Marshall | System and method for securely retrieving and playing digital media |
US9183849B2 (en) | 2012-12-21 | 2015-11-10 | The Nielsen Company (Us), Llc | Audio matching with semantic audio recognition and report generation |
US9195649B2 (en) | 2012-12-21 | 2015-11-24 | The Nielsen Company (Us), Llc | Audio processing techniques for semantic audio recognition and report generation |
US9158760B2 (en) * | 2012-12-21 | 2015-10-13 | The Nielsen Company (Us), Llc | Audio decoding with supplemental semantic audio recognition and report generation |
US9779760B1 (en) | 2013-11-15 | 2017-10-03 | Noble Systems Corporation | Architecture for processing real time event notifications from a speech analytics system |
US9307084B1 (en) | 2013-04-11 | 2016-04-05 | Noble Systems Corporation | Protecting sensitive information provided by a party to a contact center |
US9225833B1 (en) | 2013-07-24 | 2015-12-29 | Noble Systems Corporation | Management system for using speech analytics to enhance contact center agent conformance |
US9456083B1 (en) | 2013-11-06 | 2016-09-27 | Noble Systems Corporation | Configuring contact center components for real time speech analytics |
US9407758B1 (en) | 2013-04-11 | 2016-08-02 | Noble Systems Corporation | Using a speech analytics system to control a secure audio bridge during a payment transaction |
US9602665B1 (en) | 2013-07-24 | 2017-03-21 | Noble Systems Corporation | Functions and associated communication capabilities for a speech analytics component to support agent compliance in a call center |
US9674357B1 (en) | 2013-07-24 | 2017-06-06 | Noble Systems Corporation | Using a speech analytics system to control whisper audio |
US9191508B1 (en) | 2013-11-06 | 2015-11-17 | Noble Systems Corporation | Using a speech analytics system to offer callbacks |
US9154623B1 (en) | 2013-11-25 | 2015-10-06 | Noble Systems Corporation | Using a speech analytics system to control recording contact center calls in various contexts |
US9959863B2 (en) * | 2014-09-08 | 2018-05-01 | Qualcomm Incorporated | Keyword detection using speaker-independent keyword models for user-designated keywords |
US9602666B2 (en) | 2015-04-09 | 2017-03-21 | Avaya Inc. | Silence density models |
US9544438B1 (en) * | 2015-06-18 | 2017-01-10 | Noble Systems Corporation | Compliance management of recorded audio using speech analytics |
KR102177786B1 (ko) * | 2016-05-13 | 2020-11-12 | 구글 엘엘씨 | 미디어 출력 디바이스들 사이의 미디어 전달 |
US10423797B2 (en) * | 2017-03-21 | 2019-09-24 | International Business Machines Corporation | Skull conduction-based telephonic conversation management |
US10021245B1 (en) | 2017-05-01 | 2018-07-10 | Noble Systems Corportion | Aural communication status indications provided to an agent in a contact center |
US10909978B2 (en) * | 2017-06-28 | 2021-02-02 | Amazon Technologies, Inc. | Secure utterance storage |
US11210461B2 (en) * | 2017-07-05 | 2021-12-28 | Interactions Llc | Real-time privacy filter |
US10540521B2 (en) | 2017-08-24 | 2020-01-21 | International Business Machines Corporation | Selective enforcement of privacy and confidentiality for optimization of voice applications |
CN108091332A (zh) * | 2017-12-27 | 2018-05-29 | 盯盯拍(深圳)技术股份有限公司 | 基于行车记录仪的语音处理方法以及基于行车记录仪的语音处理装置 |
EP3598444B1 (en) * | 2018-07-16 | 2023-12-27 | Tata Consultancy Services Limited | Method and system for muting classified information from an audio |
US10468026B1 (en) * | 2018-08-17 | 2019-11-05 | Century Interactive Company, LLC | Dynamic protection of personal information in audio recordings |
US11030337B2 (en) * | 2018-08-24 | 2021-06-08 | International Business Machines Corporation | Confidential audio content loss mitigation |
US10304442B1 (en) | 2018-09-06 | 2019-05-28 | International Business Machines Corporation | Identifying digital private information and preventing privacy violations |
US11310209B2 (en) * | 2019-09-10 | 2022-04-19 | Motorola Solutions, Inc. | Method and device for protecting confidentiality of audio messages |
US11900927B2 (en) | 2020-12-23 | 2024-02-13 | Optum Technology, Inc. | Cybersecurity for sensitive-information utterances in interactive voice sessions using risk profiles |
US11854553B2 (en) | 2020-12-23 | 2023-12-26 | Optum Technology, Inc. | Cybersecurity for sensitive-information utterances in interactive voice sessions |
US11368585B1 (en) | 2021-03-23 | 2022-06-21 | International Business Machines Corporation | Secured switch for three-way communications |
US12003575B2 (en) | 2022-02-22 | 2024-06-04 | Optum, Inc. | Routing of sensitive-information utterances through secure channels in interactive voice sessions |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63165900A (ja) * | 1986-12-27 | 1988-07-09 | 沖電気工業株式会社 | 会話音声認識方式 |
JPH06175677A (ja) * | 1992-12-07 | 1994-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JP2006178203A (ja) * | 2004-12-22 | 2006-07-06 | Nec Corp | 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム |
WO2007009028A2 (en) * | 2005-07-13 | 2007-01-18 | Hyperquality, Inc. | Selective security masking within recorded speech utilizing speech recognition techniques |
JP2007041443A (ja) * | 2005-08-05 | 2007-02-15 | Advanced Telecommunication Research Institute International | 音声変換装置、音声変換プログラムおよび音声変換方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5420866A (en) * | 1994-03-29 | 1995-05-30 | Scientific-Atlanta, Inc. | Methods for providing conditional access information to decoders in a packet-based multiplexed communications system |
JP3180655B2 (ja) * | 1995-06-19 | 2001-06-25 | 日本電信電話株式会社 | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 |
US6014427A (en) * | 1996-12-26 | 2000-01-11 | At&T Corp | Voice mail with embedded executable responses |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US6850893B2 (en) | 2000-01-14 | 2005-02-01 | Saba Software, Inc. | Method and apparatus for an improved security system mechanism in a business applications management system platform |
US6922411B1 (en) | 2000-09-29 | 2005-07-26 | Voxeo Corporation | Networked computer telephony system driven by web-based applications |
US8266451B2 (en) * | 2001-08-31 | 2012-09-11 | Gemalto Sa | Voice activated smart card |
US7664056B2 (en) * | 2003-03-10 | 2010-02-16 | Meetrix Corporation | Media based collaboration using mixed-mode PSTN and internet networks |
US7418600B2 (en) * | 2003-03-13 | 2008-08-26 | International Business Machines Corporation | Secure database access through partial encryption |
US7450566B2 (en) | 2003-06-05 | 2008-11-11 | Oracle International Corporation | Apparatus and method for providing a unified telephony solution |
US8645420B2 (en) | 2003-08-05 | 2014-02-04 | Accenture Global Services Limited | Methodology framework and delivery vehicle |
US7158026B2 (en) * | 2004-02-06 | 2007-01-02 | @Security Broadband Corp. | Security system configured to provide video and/or audio information to public or private safety personnel at a call center or other fixed or mobile emergency assistance unit |
US7484107B2 (en) | 2004-04-15 | 2009-01-27 | International Business Machines Corporation | Method for selective encryption within documents |
US7502741B2 (en) * | 2005-02-23 | 2009-03-10 | Multimodal Technologies, Inc. | Audio signal de-identification |
US7847813B2 (en) * | 2005-03-10 | 2010-12-07 | Avaya Inc. | Dynamic multimedia content stream delivery based on quality of service |
US7778397B2 (en) * | 2005-03-10 | 2010-08-17 | Avaya Inc. | Dynamic video generation in interactive voice response systems |
US7940897B2 (en) | 2005-06-24 | 2011-05-10 | American Express Travel Related Services Company, Inc. | Word recognition system and method for customer and employee assessment |
US8433915B2 (en) | 2006-06-28 | 2013-04-30 | Intellisist, Inc. | Selective security masking within recorded speech |
US8019078B2 (en) * | 2007-07-17 | 2011-09-13 | International Business Machines Corporation | Phone call mute notification |
-
2008
- 2008-09-28 US US12/239,798 patent/US8244531B2/en active Active
- 2008-12-10 CA CA2646118A patent/CA2646118C/en active Active
- 2008-12-16 JP JP2008319176A patent/JP2010079235A/ja active Pending
- 2008-12-23 EP EP08172702.6A patent/EP2169669B1/en active Active
- 2008-12-26 KR KR1020080134006A patent/KR101344630B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63165900A (ja) * | 1986-12-27 | 1988-07-09 | 沖電気工業株式会社 | 会話音声認識方式 |
JPH06175677A (ja) * | 1992-12-07 | 1994-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JP2006178203A (ja) * | 2004-12-22 | 2006-07-06 | Nec Corp | 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム |
WO2007009028A2 (en) * | 2005-07-13 | 2007-01-18 | Hyperquality, Inc. | Selective security masking within recorded speech utilizing speech recognition techniques |
JP2009501942A (ja) * | 2005-07-13 | 2009-01-22 | ハイパークオリティー,インク. | 音声認識技術を利用した録音した音声内の選択的セキュリティマスキング |
JP2007041443A (ja) * | 2005-08-05 | 2007-02-15 | Advanced Telecommunication Research Institute International | 音声変換装置、音声変換プログラムおよび音声変換方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019220791A1 (ja) * | 2018-05-14 | 2019-11-21 | 株式会社Nttドコモ | 対話装置 |
JPWO2019220791A1 (ja) * | 2018-05-14 | 2021-02-12 | 株式会社Nttドコモ | 対話装置 |
JP7033195B2 (ja) | 2018-05-14 | 2022-03-09 | 株式会社Nttドコモ | 対話装置 |
WO2020255600A1 (ja) * | 2019-06-20 | 2020-12-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CA2646118A1 (en) | 2010-03-28 |
US20100082342A1 (en) | 2010-04-01 |
EP2169669B1 (en) | 2013-06-19 |
US8244531B2 (en) | 2012-08-14 |
EP2169669A1 (en) | 2010-03-31 |
KR101344630B1 (ko) | 2013-12-26 |
CA2646118C (en) | 2013-10-22 |
KR20100036153A (ko) | 2010-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010079235A (ja) | 個人(オーディ)情報を含まないメディア・ストリームを保存する方法 | |
US10446134B2 (en) | Computer-implemented system and method for identifying special information within a voice recording | |
US10685657B2 (en) | Biometrics platform | |
JP6714607B2 (ja) | 音声を要約するための方法、コンピュータ・プログラムおよびコンピュータ・システム | |
WO2019210557A1 (zh) | 语音质检方法、装置、计算机设备及存储介质 | |
US10592611B2 (en) | System for automatic extraction of structure from spoken conversation using lexical and acoustic features | |
US7991613B2 (en) | Analyzing audio components and generating text with integrated additional session information | |
US11693988B2 (en) | Use of ASR confidence to improve reliability of automatic audio redaction | |
KR102097710B1 (ko) | 대화 분리 장치 및 이에서의 대화 분리 방법 | |
EP3262634B1 (en) | Obfuscating training data | |
CN110807093A (zh) | 语音处理方法、装置及终端设备 | |
Płaza et al. | Call transcription methodology for contact center systems | |
JP5164922B2 (ja) | 個人情報削除装置とその方法、そのプログラムと記録媒体 | |
CN112565242B (zh) | 基于声纹识别的远程授权方法、系统、设备及存储介质 | |
JP2005308950A (ja) | 音声処理装置および音声処理システム | |
JP2022553338A (ja) | 音声認識モデルのためのトレーニングセット生成 | |
WO2023081962A1 (en) | User authentication and login methods | |
JP2002258889A (ja) | 辞書編集可能な音声認識装置 | |
JP2014186062A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130627 |