JP2009501942A - 音声認識技術を利用した録音した音声内の選択的セキュリティマスキング - Google Patents
音声認識技術を利用した録音した音声内の選択的セキュリティマスキング Download PDFInfo
- Publication number
- JP2009501942A JP2009501942A JP2008521597A JP2008521597A JP2009501942A JP 2009501942 A JP2009501942 A JP 2009501942A JP 2008521597 A JP2008521597 A JP 2008521597A JP 2008521597 A JP2008521597 A JP 2008521597A JP 2009501942 A JP2009501942 A JP 2009501942A
- Authority
- JP
- Japan
- Prior art keywords
- person
- voice recording
- information
- text
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
- H04L9/3226—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
- H04L9/3231—Biological data, e.g. fingerprint, voice or retina
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/04—Masking or blinding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/56—Financial cryptography, e.g. electronic payment or e-cash
Abstract
音声録音内に含まれる情報を保護するための装置と方法が記載されている。音声録音はデータ処理システムにロードされる。ここでは、音声録音は、人と企業エンティティのインタフェース間での取り引きを行う間に、人が発話することにより生じる。音声録音を処理し、音声録音内の少なくとも1つのテキスト要素を認識する。データ処理システムは少なくとも一つのテキスト要素がその人に関する特有な情報を表しているかどうかを検出する。少なくとも一つのテキスト要素がその人に関する特有な情報を表していれば、音声録音中のセグメントを不明瞭な状態にする。
【選択図】図1A
【選択図】図1A
Description
本発明の背景
本発明の分野
本発明の実施例は、一般的には情報へのアクセスの制限、特に、音声録音に存在する情報へのアクセスの制御に使用される装置と方法に関する。
本発明の分野
本発明の実施例は、一般的には情報へのアクセスの制限、特に、音声録音に存在する情報へのアクセスの制御に使用される装置と方法に関する。
技術背景
個人情報は現在社会における商取引の中で、日常的に収集されている。会話の録音はコールセンタのコンテキスト内での連絡時の顧客と取次者との対話、緊急医療サービスの対話(911コール等)、及び個人情報をある個人から別の個人に流すことが求められる無数の商取り引きといった様々なシチュエーションでひっきりなしに行われている。
個人情報は現在社会における商取引の中で、日常的に収集されている。会話の録音はコールセンタのコンテキスト内での連絡時の顧客と取次者との対話、緊急医療サービスの対話(911コール等)、及び個人情報をある個人から別の個人に流すことが求められる無数の商取り引きといった様々なシチュエーションでひっきりなしに行われている。
これらの商取引の間、社会保険番号、クレジットカード番号、銀行口座番号、個人識別番号(PIN)、氏名、住所、クラブ番号、フリークエント・フライヤー番号等の個人情報は機密に扱うべきであり、情報が乱用された場合はその情報に関する個人に被害を与える可能性がある。このことは問題である。
そのような機密に扱うべき情報が、あらゆる場所に保管されており、様々な理由で他の関係者に送られており、それらの全てにより、この情報は他人による情報漏洩のリスクにさらされている。ハッカーはそのような機密に扱うべき情報を保管するデータベースに近づくことに堪能である。アカウントが盗まれ、個人のアイデンティティを盗まれ、そして、個人が悪意のあるアクタにより物理的な被害にさらされる。このことは問題である。
上述した企業取引中に収集された情報は分析のために企業に送られることがある。企業取引中に、顧客とビジネスの取次者との電話を録音することは、広く普及している商習慣である。このような録音した情報は、多くの場合、分析業者に送られる。一例は、個人情報を含む録音の品質審査である。分析業者にデータを送ることが、データ所有者の意図であるとは言え、その業者が取引に含まれている個人情報にはアクセスすべきではない場合が多い。このことは問題である。
録音した会話中、又は録音した音声中の機密情報についての現在の取り組みは、手動で音声をモニタし、次いで機密情報を削除というものである。現在生じているこのようなデータの量を考慮すると、このような手法は高価である。このように録音した会話や音声を手動で検閲することは、市場の現在のニーズの全てに合致する経済的な手法ではない。このことは問題である。
機密の、個人的な、極秘の、又は識別されないようにすべきデータは、企業によって様々である。例えば、病名を患者の名前及び住所と別に保持するべき医療コンテキストでは、患者の名前と住所は、データ所有者以外の者が容易に入手できるべきではない機密情報として考えるべきである。フィナンシャルサービスのような環境においては、顧客の名前や住所は必ずしも機密データとは限らないが、むしろ、機密であると考え、保護すべきものは通常は顧客の口座番号、個人識別番号(PIN)等である。機密情報の統一された定義はないので、何が機密情報であるかは環境によって様々であり、機密情報の取扱を複雑なものにしている。このことは問題である。
発明の詳細な説明
以下の本発明の実施例の詳細な説明において、添付の図別に符号がつけられており、同じ符号が同様の要素を示しており、本発明を実施する図面、特定の実施例によって示されている。これらの実施例は、当該技術分野の当業者が本発明を実施できるように詳細に記載されている。他方、良く知られている回路、構造、及び技術は、本発明の理解を妨げることがないように、詳細には示していない。従って、下記の詳細な説明は、限定的な意味に取るべきではなく、本発明の範囲は添付した特許請求の範囲によってのみ決まる。
以下の本発明の実施例の詳細な説明において、添付の図別に符号がつけられており、同じ符号が同様の要素を示しており、本発明を実施する図面、特定の実施例によって示されている。これらの実施例は、当該技術分野の当業者が本発明を実施できるように詳細に記載されている。他方、良く知られている回路、構造、及び技術は、本発明の理解を妨げることがないように、詳細には示していない。従って、下記の詳細な説明は、限定的な意味に取るべきではなく、本発明の範囲は添付した特許請求の範囲によってのみ決まる。
音声録音の中に含まれている情報を保護する装置及び方法について記載する。
図1A、符号100において、音声認識を使用した、本発明の実施例による音声録音の処理を示す。図1Aを参照すると、発話できる人が企業エンティティと取り引きをしている。このような取り引きの結果、人と企業エンティティとの会話中に一又はそれ以上の発話が生じる。録音装置を用いて、人と企業エンティティの間の取り引きでなされる発話が音声録音102を作成する。音声録音の作成に使用できる装置の一例は、図1Bと併せて以下により完全に説明する。ここに使用されているように、「企業エンティティ」という用語は、広義の意味を持ち、多様な形態を呈しており、企業エンティティにより様々な商品やサービスが人に提供される。「企業エンティティ」という用語については、以下により詳しく述べる。
一般的に、人は特有な情報の倉庫であると考えられており;この特有な情報のいくつかは、人と企業エンティティとの取り引きの間に、企業エンティティが所有するようになる。この特有な情報は、個人情報、私的情報、極秘情報、機密情報、秘密情報などと呼ばれる。この特有な情報をラベリングするのに使用される的確な用語は、ここに記載する本発明の実施例を制限しない。
「個人的」、「私的」、「極秘」、「機密」等といったラベルは、様々な設定の中で用いられて、アクセスを制限すべき特有な情報を記載する。あるケースでの特有な情報が他のケースの特有な情報とは同じでないかもしれないということを、更に以下で説明する。従って、どの情報を「特有」と考えるべきなのかは、ユーザによる使用(使用事例)のコンテキストにより定義され、これは本発明の実施例でカバーされている。
上述したように、個人と企業エンティティとの取り引きは、多様な状態で起こり、その中で情報が流れている。個人と企業エンティティとの間の多くのコンタクトは、電話、携帯電話、マイク、コンピュータ、VoIP技術等のような電子的手段を利用した通信コンテキスト内で起こっている。そのような通信システムにより支援されているので、二人、又は一人と自動システムが会話をすることができ、そのような場面では、一方の人又は自動システムが質問を提出し、他方の人又は自動システムが質問に答える。この会話の間に、特有な情報が人から発話され、それは一般的には企業エンティティを代表する別の人又は自動システムからの質問又は入力要求に応じて行われる。企業エンティティを代表する生きている人は、企業エンティティのインタフェースと考えることができる。別の例では、企業エンティティが人間の顧客と取り引きする自動インタフェースを提供する設定で、取り引きが生じている。この設定では、ある人が企業エンティティとコンタクトをとり、その人からの答えを導く一連の質問を提出する自動インタフェース又はシステムインタフェースと対面する。その答えは、その人に関連する特有の情報も含んでいてもよい。
上述した取り引きに続き、結果的に得た音声録音102が音声認識プロセス104に入力される。音声認識プロセス104は、音声録音を処理し、音声録音102の音声認識を実行し、テキストとして音声録音の表現を特定言語で生成する。テキストを表示するために使用される言語は、英語、スペイン語、フランス語、オランダ語、ドイツ語等である。ソフトウェアアプリケーションとして販売されている、及び/又は、ソフトウェア/ハードウェア・ソリューションとして販売されている商業的に入手可能な音声認識アルゴリズムを用いて、音声認識処理を実行することができる。このような商業的に入手可能なアプリケーション及びソリューションの例は、DragonNaturallySpeakingTM8であり、そしてスピーチワークス、ローカス、ニュアンスの製品等も同じである。
認識した音声(テキスト表現)は、符号106の同定プロセスに入力され、音声録音102で発話されて捕捉された特有な情報の実現値を同定する。特有な情報に対する要求を意味していると考えられる単語のリストは、本発明の様々な実施例における特定の使用事例用にユーザが設定できる。このような単語リストはここではプロンプトリストと呼ばれる。ブロック106において、所定の使用事例用に、人がプロンプトリストに応じて発話した特有な情報が、認識済み音声の中で同定されている。
代替的に、入力要求に続く(所定の持続時間の)音声録音の一部を、特有な情報の推定発生位置であると認識することができる。様々な特有な情報の発話が特定時間続くと推測される。このように、発話の持続時間に対する事前の知識を使用して、特有な情報の発話に対応する音声録音の部分を同定することができる。
音声録音の処理は、ブロック108で分岐しており、プロンプトリストに応答して発話された個人の特有な情報に対応する音声録音セグメントは、パス110の次にあるブロック112で不明瞭な状態にされる。人間の特有な情報に対応しない他の音声録音セグメントは、パス114に沿ってブロック112を迂回する。特有な情報のセグメントは、アナログ又はデジタル形式の音声録音内で、又はテキスト(英数)表現の音声録音内で不明瞭な状況にされる。この変調した音声録音は、116で利用可能であり、人間の特有な情報にアクセスできないようにすべき人やエンティティが使用することができる。
音声録音セグメントのブロック112での不明瞭な状態は(アナログ又はデジタル形式の音声録音内であろうと、テキスト表現の音声録音内であろうと)、様々な状況で生じ、可逆性の音声録音セグメントもあれば、不可逆性の音声録音セグメントもある。不明瞭な状態になることについては、以下に図と併用してより詳細に説明する。
代替的に、又は、ブロック108及び112を併用して上述したプロセスに加えて、音声録音はブロック109で識別子(メタデータ)と関連づけることができる。この識別子は、特有な情報が音声録音に含まれているか否かのいずれかを示すことができる。識別子は、特有な情報がどのように処理されたのかを示すデータなど、メタデータの様々な要素を含んでいる。例えば、識別子は特有な情報が暗号化されていることや、削除されていること、マスキングされていること等を示すことができる。識別子は音声録音を取得した使用事例、データ所有者、データ管理者等に関連する情報を提供することが可能である。識別子は、音声録音が「クリーン」、すなわち特定の使用事例に関する特有な情報がないことを示すことも可能である。
上述したように、企業エンティティは多様な形態を取ることができる。本発明の実施例は、企業エンティティの形により限定されず、ここで提供した企業エンティティの例は、本発明の実施例を限定するものではない。企業エンティティの例は説明目的でのみ記載されたものであり、本発明の実施例はまだ知られていない企業エンティティにも適用できると考えられる。
例えば、企業エンティティの一形態は顧客に商品及び/又はサービスを提供する小売又は卸売業である。例には、娯楽サービス(ギャンブル、スポーツ等)、フィナンシャルサービス(銀行業、投資等)、電車、飛行機、船等のような運輸プロバイダ業、保険業、ハード商品、ソフト商品、及び、クリーニング、保全等のようなサービス等を含んでいる。もう一つの領域は専門的サービスであり、例えば、患者、クライアント、来訪者等に対し、医療上の、又は法的なサービスを施す組織である。更に別の領域は公的サービスのプロバイダであり、例えば911コールで招集される緊急医療サービス、官庁サービス、社会サービスである。社会サービスには、例として保険社会福祉省(DHHS)、保険家族支援省(DHFS)、地域、州、連邦政府のありとあらゆるオフィスや代理店等があるが、これに限定はされない。
上述した各企業エンティティが、使用事例を示し(同じ使用事例を示す企業エンティティもあれば、異なる使用事例を示す企業エンティティもある)、一連の特有な情報を確立している。適用法令と共に、使用事例を論理的に設定することにより、システムのユーザが特有なものであると特定する情報と本発明の適切な実施例のシステムによってアクセスが制限される情報に影響を与える。本発明の実施例は、現在公知の使用事例と公知でない使用事例の両方に適用可能である。ここで使用されているように「使用事例」は広くは、ユーザに関連する特有な情報が取得されている一つのシナリオを意味する。
図1B、符号150において、音声録音102(図1A)のように音声録音を生成可能な本発明の実施例による録音システムを示す。図1Bを参照すると、第1の個人は音波152(音)に表示されるように発話する。音波152は、トランスデューサ154で受信され、そこで音波152はトランスデューサ154によって電気信号を発する。一又はそれ以上の実施例では、トランスデューサ154はマイクロホンである。トランスデューサ154はアナログ信号を発し、これはADコンバータ156で受信され、そこで、アナログ信号はデジタル信号に変換される。
音声信号はインタフェース160で受信される。インタフェース160は電気経路166経由でストレージデバイス162とコントローラ164と電気的に通信する。一又はそれ以上の実施例では、コントローラ164は中央処理装置(CPU)であり、電気経路166はバスであり、そこに接続している構成部品間をデータが流れる。ストレージデバイス162はメモリ及び/又はマスストレージ等の一又はそれ以上のストレージデバイスを表す。コントローラ158、ストレージデバイス162、インタフェース160、電気経路166はデータ処理システム158の部品であってもよい。一又はそれ以上の実施例では、この技術分野では公知であるように、データ処理システム158はポータブルコンピュータ、デスクトップコンピュータ、サーバ、パーソナルコンピュータ、専用デジタルレコーダ等といったコンピュータであってもよい。限定されるものではないが、ゲインブロックやフィルタ等の様々なその他の構造をシステム150内に含めることが可能であることは当業者には自明である。
符号150で示すシステムへの選択的入力を符号168で示す。第2の人が音波(音)170を発話し、トランスデューサ172がこれを捕捉する。トランスデューサ172はそこに入射する音波に応じてアナログ電気信号を発する。アナログ電気信号はADコンバータ174に入力される。ADコンバータ174はデジタル信号を出力し、これはインタフェース160に入力される。
記録システム150独自の設計に応じて、2つのデジタル音声入力157と175を、単一の音声録音にまとめることができ、又は記録システム150内で互いを分離しておくことも可能である。数多くの代替があり、例えば、いくつかのシステムでは、両方の話者からのアナログ信号が捕捉され、共通のADコンバータに入力される単一のアナログ信号として存在する。単一のデジタル信号は各話者からの寄与を含むアーキテクチャの結果生じる。
更に他の構成では、システム150は企業エンティティとの取り引きの一部である個人に対して質問を提起する自動音声信号を作るように設定することが可能である。この場合、自動音声信号のテキスト形式の表現が予め存在し、それ自体としては、音声認識処理を使って、入手する必要はない。
ADコンバータは図1Bに示す信号路内の様々な場所に設置できることは当業者には自明である。例えば、ADコンバータをトランスデューサ154及び/又は172などのトランスデューサの近位側に設置することができる。代替的に、一又はそれ以上のADコンバータをデータ処理システム158内に設置するようにしてもよい。
図2、符号200には、本発明の実施例による音声録音の処理ステップを示す。図2を参照すると、音声録音は符号202でデータ処理システムに入力される。一又はそれ以上の実施例では、データ処理システムは図1Bに符号158で示されているように構成することができるが、データ処理システムは音声録音の生成に必要な機能を有する必要はない。
2人の話者の音声ストリームを結合して音声録音を生成し、2人の話者の内の1人が正規の話者で、他方の話者は、ほとんどの部分が各音声録音について異なっている(任意の発信者におけるような)状況においては、ブロック204でトレーニングを行って、正規の話者を認識させて、音声認識アルゴリズムにより高度な解釈精度にする。上述したように、取り引きは企業エンティティのインタフェースと、この取り引き間にビジネスと相互作用がある人との間に生ずる。このような取り引きによりプロンプトリストを構築する特有な情報の集まりが特定される。一実施例においては、プロンプトリストは「口座番号」、及び「個人識別番号」又は「PIN」を含むものであってもよい。
ブロック204に併せて述べたトレーニングに続いて、音声録音202を処理して、ブロック208で正規の話者に関連する音声録音の部分を同定することができる。同様に、企業エンティティと相互作用している人によって発せられた音声録音部分が、ブロック208において同定されている。一又はそれ以上の実施例では、話者の同定を選択的に行って、企業エンティティ(正規の話者)に対応する音声録音部分を同定している。この人に特有な情報を発するように入力要求するのは、通常企業エンティティなので、これは、プロンプトリストの要素に対応する音声録音部分を正確に同定する見込みを増やすために行われる。これらの音声録音の同定部分を使用して、音声録音が二人の話者に対応するストランドに分ける。プロンプトリスト候補(企業エンティティに対応するストランド内にある)を次いでブロック210で処理して、特に重要な使用事例に関するプロンプトリストの要素に対応する候補を検索する。
プロセスの間に様々な定量分析を適用し、どのプロンプトリスト候補が実際のプロンプトリストの員であるかを設定することができる。例えば、もし、「社会保障番号」が特有な使用事例用のプロンプトリストの要素であれば、その場合は、プロンプトリスト候補を「社会保障番号」と比較して、数値スコアをプロンプトリスト候補に割り当てることができる。数値スコアはプロンプトリスト候補とプロンプトリストの要素との間で正しくマッチングさせるためのしきい値と比較する。しきい値を上回るスコア結果は、正しいマッチングを示し、しきい値を下回るスコアはマッチングしていないことを示す。代替的に、音声録音全体を(話者の同定プロセスなしに)テキスト形式に翻訳してもよく、結果としてのテキストは上述したようにプロンプトリストと比較される。ここで、スコアが会話部分に割り当てられ、しきい値がプロンプトリスト候補とプロンプトリストの要素との間にマッチングを構築する。
ブロック212において、プロンプトリスト上にある項目に従った特有な情報が同定される。同定は期待値と翻訳した値を比較することによって処理できる。例えば、「社会保障番号」の入力要求は、入力要求の後に続く音声録音部分にある9桁又は最小桁数を有する発話をもたらす。「社会保障番号」の入力要求の後に続く音声録音が処理される。その処理の結果、数字の発話の同定があれば、特有な情報の見込みのある発話がある可能性が高い。逆に処理の結果、文字の同定があれば、その時は可能性が低い。プロンプトリスト要素に対するスコアと、結果としての特有な情報の見込みのある発話が組み合わされて、一定のしきい値より上の結果が特有な情報の発話を同定したということになる。
代替的に、同定は、同定された入力要求に続く音声録音部分に対応する。例えば、クレジットカード番号入力の入力要求に続く、次の10秒間の音声録音は入力要求に応答する特有な情報の発話であると推定できる。別の例では、社会保障番号の入力要求に続く、次の15秒間の音声録音は特有な情報の発話位置であると推定できる。従って、様々な実施例において、特有な情報は音声認識アルゴリズムを使用して翻訳することにより、又は、特有な情報項目の入力要求に続く、特有な情報の発話に必要となる妥当な時間を見積もることにより同定される。
ブロック214では、テキストに同定された要素又は前記人により発話された特有な情報に対応する数値が不明瞭な状態になる。このように同定された特有な情報の発話位置にある元の音声録音セグメントの上からマスキング信号を録音することにより、不明瞭な状態にすることができる。一つの例では、ノイズ信号(ホワイトノイズ、ピンクノイズ、信号音、振幅ゼロの信号(消去)、等)を音声録音セグメントの上から録音し、特有な情報を不明瞭な状態にする。別の例では、特有な情報の発話に対応する音声録音セグメントを暗号化し、特有な情報を不明瞭な状態にする。暗号化は必要があれば、キーを用いて反転(復号)することが可能である。暗号化と復号化については、以降の図において以下にさらに詳述する。
音声録音のアナログ表現又はデジタル表現のいずれかを処理し、そこに含まれる特有な情報を不明瞭な状態にすることができることに留意されたい。さらには上述したように、音声録音のテキスト表現を処理し、そこに具わる特有な情報のセグメントに対応するテキスト要素を不明瞭な状態にすることができる。
代替として、又はブロック214と併せて説明したプロセスに加えて、ブロック213で音声録音に識別子を付けることも可能である。識別子は、音声録音中に特有な情報があるか否かのいずれかを表すことができる。様々な実施例では、識別子を設けて、図1Aのブロック109に併せて上述した機能を提供することができる。
一方、又は上述した方法と併せて、音声録音が捕捉されている時に音声録音内に「マーカ」を置くことによって、話者の同定を行うことができる。企業エンティティに関連する音声により、「マーカ」の挿入をトリガすることができる。「マーカ」をシステムで使用して、プロンプトリスト候補を同定し、又、特有な情報の発話に対する検索に焦点を合わせることもできる。例えば、このような「マーカ」は、可聴範囲上にあるが、音声録音を捕捉するのに使用するシステムの帯域内にあるような音声録音に添加される音であってもよい。「マーカ」を、選択された話者に対応する音声録音部分の全体に、あるいはそれに関連する部分の始点及び/又は終点に配置することができる。
図3、符号300において、終点を用いて本発明の実施例による音声録音を処理している。図3を参照すると、ブロック302で音声録音(音声信号)が入力される。ブロック304では、音声録音内部で終点が同定されている。終点は音声録音内のポーズを探すというような、当該技術分野における当業者に公知である様々な方法で同定できる。ポーズは単語の間又は文の間に生ずるような、ある時間内に存在する低レベル信号として同定できる。終点を利用することにより、ブロック306で音声信号をセクションに分割することができる。音声信号はブロック308で処理され、ここで音声認識を用いて、音声信号のセクションをテキスト要素に翻訳する。
ブロック308から得られるテキスト要素は、ブロック310で処理され、プロンプトリスト候補を同定する。そのプロンプトリストの候補がプロンプトリストの要素であるかを同定するように、対象の使用事例に対応するプロンプトリストと、プロンプトリスト候補は比較される。プロンプトリストの同定された要素は、音声録音部分を設定し、ここでは特有な情報の発話の入力要求は企業エンティティのインタフェースによって生成される。入力要求に続く音声録音部分は先の図と併せて上述したように、特定の入力要求に適用可能なロジックに従って分析される。
ブロック312では、特有な情報の発話に対応する音声録音部分が、音声録音部分に関する同定信頼度が設定したしきい値に合致する決定に続いて、不明瞭な状態になされる。入力要求に対応する音声録音部分及び特有な情報の発話に対応する音声録音部分に関連するスコアのような評価基準を用いて、同定信頼度(スコア)が設定される。特有な情報の所定の瞬間に関する同定信頼度(スコア)をしきい値と比較する。スコアがしきい値を越えていれば、特有な情報の発話に対応する音声録音部分を処理し、その音声録音部分を不明瞭な状態にする。
ブロック314では、音声録音を処理して、特有な情報を不明瞭に状態にし、ここで、音声録音内部に以前から含まれていた特有な情報を受信することが許可されないエンティティ(個人、企業等)へ送信するのに適した状態になる。
代替として、又はブロック312及び314と併せて説明したプロセスに加えて、ブロック311で音声録音を識別子に関連させることができる。この識別子は、特有な情報が音声録音内に含まれているか否かを表すことができる。様々な実施例では、図1Aのブロック109に併せて上述した機能を提供するように識別子を構成することができる。
図4Aは、符号400で、本発明の一実施例による音声信号414のアナログ表現を表示する。図4Aを参照すると、音声信号のアナログ表現は複数部分、すなわち第1の部分406、第2の部分408、第3の部分410、第nの部分412まで(これを含む)の部分で表される。軸402は音声信号414の振幅を表し、軸404は時間を表す。
音声信号414は特有な情報の入力要求と特有な情報の発話との両方を含んでいてもよく、あるいは、音声信号414は特有な情報の入力要求又は特有な情報の発話のいずれかを含んでいても良い。音声信号414に含まれる情報は、音声信号が得られた及び/又は処理された方法に依存する。先の図において上述したとおり、音声信号414はADコンバータによりデジタル信号に変換され、次いで音声信号(音声録音)のデジタル表現がデータ処理システムに入力される。部分406、408、410、412は特有な情報の入力要求、特有な情報の発話、又は対象の使用事例に関連する音声録音のその他の部分を表している。
先の図において上述したように、音声録音はデータ処理システムによって処理され、不明瞭な状態にされたセグメントを含む音声録音を得ることができる。その他の実施例では、上述の方法及び装置を用いて音声録音を処理することができ、次いで、結果が表示され、セグメントを不明瞭な状態にするかどうか、及び/又は、音声録音に識別子を付けるかどうかの最終的な決定をオペレータが行うことができる。このような決定は、データ処理システムとこのシステムと併用するように構成されたユーザインタフェースを用いて行うことができる。
図4Bの、符号425は、音声録音を処理するユーザインタフェースの一実施例を示す。図4Bを参照すると、データ処理システムの情報ディスプレイ上で見ることができ、アクセスすることが可能なユーザインタフェース426が示されている。当該技術分野の当業者に認識されているように、情報ディスプレイは陰極線管(CRT)フラットパネルディスプレイ、タッチスクリーン等であってもよい。本発明の実施例はオペレータにユーザインタフェースを提供する情報ディスプレイによって制限されない。
音声録音中に含まれている特有な情報の発話428を処理して、翻訳をユーザインタフェース426のフィールド430に表示する。フィールド430に示されるテキスト形式の表示は「VISA」である。処理コントロール432,434,436を処理することにより、オペレータがテキスト表示「VISA」を含む位置に対応する音声録音部分を処理することができる。コントロール432は「消去」機能を実行し、コントロール436は「暗号化」機能を実行し、そしてコントロールボタン434はテキスト「VISA」が事前に暗号化されていれば、「復号化」機能を実行する。
同様に、音声録音中に含まれるもう一つの特有な情報の発話438を処理して、翻訳をユーザインタフェース426のフィールド440に表示する。フィールド440に示すテキスト表示は「47912356」である。プロセスコントロール442、444、446によって、オペレータはテキスト表示「47912356」を含む位置に対応する音声録音部分を処理することができる。コントロール442は「消去」機能を実行し、コントロール446は「暗号化」機能を実行し、コントロール444はテキスト「47912356」が事前に暗号化されていれば、「復号化」機能を実行する。
音声録音中に含まれる更に別の特有な情報の発話448を処理して、翻訳をユーザインタフェース426のフィールド450に表示する。フィールド450に示すテキスト形式の表示は「June 2008」である。プロセスコントロール452、454、446を処理することにより、オペレータはテキスト表示「June 2008」を含む位置に対応する音声録音部分を処理することができる。コントロール452は「消去」機能を実行し、コントロールボタン454は「暗号化」機能を実行し、コントロールボタン456はテキスト「June 2008」が事前に暗号化されていれば、「復号化」機能を実行する。
使用事例に応じた特有な情報の発話を表示するユーザインタフェースを利用して、オペレータはこの使用事例に関連する論理的状況に基づき決定を行い、それに応じて特有な情報を処理することができる。例えば、フィールド430、440、450に示される特有な情報はクレジットカードの特有な情報と論理的に関連する。従ってこのグループを観察することにより、オペレータは特有な情報がシステムにより適切に取り出されていると判断を下すことができ、前述のようにオペレータは特有な情報を処理することができる。
代替的に、又は図4Bと併せて上述したプロセスに加えて、オペレータはコントロール458を利用して、音声録音に識別子を付することができる。前記識別子は、特有の音声録音が特有の情報を具えている、具えていない、又は処理済みの特有の情報を具えているという情報を提供するよう機能する。様々な実施例で、識別子は、図1Aにおけるブロック109に併せて上述した機能を提供するように構築できる。
特有な情報の発話が生じた際に、人によって発せられた正確な単語又は正確な番号を不明瞭な状態にする必要性が常にあるとは限らないことに留意されたい。例えば、フィールド440に示された番号がクレジットカードの口座番号を構成する全ての番号を含んでいないかもしれない。現在はクレジットカードの口座番号は16桁であるが、フィールド440には8桁が表示されており、特有な情報の部分的な取得を表している。しかし、いくつかの使用事例においては、部分的な取得によって、十分な情報を提供でき、不明瞭な状態にする際に、この例の場合はクレジットカード(VISA)の口座番号である特有な情報の項目を構造的に不明瞭な状態にする。
その他の使用事例では異なる状況にある。例えば、特有な情報の項目が個人名である医療サービスでの利用においては、音声録音内の特有な情報をより大きく局在化することが求められることがある。このような場合、他の図とともに上述した、スコア評価に別のしきい値を用いることができる。音声録音を捕捉する方法、各話者に対する別々の音声チャンネル、話者の同定、終点配置の変形等といった、その他の技術も使用される。
図5の、符号500は、本発明の実施例による音声録音の再処理を説明する。上述したように、音声録音を処理し、特有な情報の発話に対応する音声録音中の位置を不明瞭な状態にする。可逆処理を用いて、音声録音部分を不明瞭ににするときに、音声録音のこれらの部分を再処理して、この部分を明瞭にする。可逆処理はキーを用いて実行される暗号化などのプロセスであり、復号化を実行し、既に暗号化されている元の情報を復元することができる。キーを利用した暗号化/復号化のプロセスは当該技術分野の当業者に公知であり、ここに述べた様々な実施例の中で用いられている。
図5を参照すると、音声録音の再処理は符号500で2つのエンティティ、エンティティ1とエンティティ2に関連して記載されている。エンティティ1とエンティティ2は音声録音内部に含まれる情報に対して異なる関係を有している。上述したように、音声録音502は人と企業エンティティのインタフェース間の取り引きにより得られる。音声録音502はエンティティ1がアクセス権を有する特有な情報を含むが、この説明の目的で、エンティティ2は特有な情報に異なる関係を有している。一又はそれ以上の実施例では、特有な情報に対するエンティティ2の関係は、エンティティ1が有するアクセス権よりも少ないアクセス権を有するエンティティである。本例においては、特有な情報はブロック504で不明瞭な状態になる。ブロック506は、特有な情報が音声録音中で明瞭であり、かつ、音声録音中の特有な情報がエンティティ1の制御又は作用下にある一般的な領域を同定する。音声録音がブロック506の外部に流れるときに、特有な情報はブロック508でエンティティ2に届く前に不明瞭な状態になる。
ブロック508で、エンティティ2は処理済みの音声録音を受信する。エンティティ2は様々な方法に処理済みの音声録音を用いることができる。例えば、限定はされないが、この方法の中には処理済みの音声録音の分析、商品又はサービスの注文の履行等がある。処理済みの音声録音を分析することには様々な目的があり、具体的には提供されたサービスの質を確立する目的、特有な情報を発する個人との取り引きに使用する企業エンティティのインタフェース能力を評価する目的等が挙げられる。
エンティティ2は処理済みの音声録音を、再処理する必要があると判断するかもしれない。例えば、処理済みの音声録音の不明瞭な部分の問題が、符号509にみられる。初期処理中にあまりにも多くの音声録音を不明瞭な状態にした、又は初期処理中にあまりにも少なく音声録音を不明瞭にしたという、このような場合、処理済みの音声録音はブロック514でエンティティ1に戻され、ブロック504での再処理を求める。可逆処理を使用して、問題を有する音声録音部分を処理する場合は、エンティティ1は処理を逆にして適切な処置を行い、不明瞭にした音声録音部分に伴う問題を補正する。適切な処置には様々な処理パラメータを伴う問題において音声録音部分を再処理することが含まれる。例えば、様々な処理パラメータは入力要求と特有な情報の発話を検出する様々なしきい値、特有な情報を同定するための推定信頼度を作るための調整済みパラメータ、話者同定のアプリケーション、又は音声録音への終点分析などである。
再処理済みの音声録音はブロック508でエンティティ2へ送り戻される。更に再処理する必要がなければ、音声録音はパス510を通って、ブロック512へ送られ、ここでエンティティ2は処理済み又は再処理済みの音声録音を操作することができる。操作は上述したように対象の使用事例によって変更できる。
エンティティ2は音声録音に対して多様な役割を果たしている。具体的にはエンティティ1の代理人又は請負業者があるが、これに限定はされない。エンティティ2は、エンティティ1とエンティティ2の間の関係に依存して、音声録音内に含まれる特有な情報へのアクセスの度合が様々である。
上述した構成において、エンティティ1は処理(暗号化/復号化)に用いるキーの管理を維持する。エンティティ2の特有な情報に対する様々な又は限定された関係のために、エンティティ2はキーへのアクセスを有しておらず、音声録音を再処理することができない。このような構成により、セキュリティと音声録音に含まれる特有な情報へのアクセス制限を提供する。エンティティ1は、エンティティ3(図示せず)のような他のエンティティに音声録音を再処理する権限を与えることが可能であることに留意されたい。この場合には、第三者に音声録音を処理(暗号化/復号化)するのに必要なキーを預けることができる。
図6は、符号600で、本発明の実施例による情報と価値の流れを示す。図6を参照すると、602に示すエンティティAは、エンティティAの制御下で特有な情報を含む音声録音601を有している。上述したように、特有な情報は、極秘情報、秘密情報、個人情報等であり、一般的には全てのエンティティがアクセス又は所有するのは適切又は合法的でないと考えられる情報である。この特有な情報はブロック608で不明瞭な状態にされる。
代替的に、符号604で示すエンティティBは音声録音612を処理し、そこに含まれる特有な音声を不明瞭な状態にすることができる。いくつかの実施例では、(先の図と併せて上述したように)エンティティBが特有な情報を含む音声録音と識別子を関連づけることもある。場合によっては、識別子が音声録音にマーキング又はフラグを付けて、それによって、音声録音に含まれる特有な情報を不明瞭にすることなく、特有な情報を通知することもある。前記マーキングは、音声録音が「クリーン」であり、特有な情報を含んでいない旨を通知することもできる。情報はエンティティA602からエンティティB604へパス610を経て流れる。値616はエンティティA602からエンティティB604へ流れて、エンティティB604により音声録音上で実行される処理を補償することができる。一又はそれ以上の実施例では、値616はデビット又はクレジットの形式をとっており、エンティティB604によって提供されるサービスと引き替えに送信される。デビットの一例は、何を借りているかを示すインボイス又は請求書であり、クレジットの一例は、有価約因形式の支払いである。
処理済みの音声録音はエンティティB604から様々なパスを経由してエンティティC606及び/又はエンティティA602のような一又はそれ以上のエンティティへと流れる。処理済みの音声録音は情報614として符号606のエンティティCへ流れる。エンティティC606は前述したように処理済みの音声録音上で操作を実行することができる。操作は上述したように対象の使用事例によって変化する。このような操作は顧客−代理人間の取り引き中に代理人によって提供されるサービスの質の分析を実行すること等を含むがそれに限定されない。音声録音上で、エンティティC606により実行される操作からの出力は、サービス626としてエンティティA602に流れる。エンティティC606はデータ管理者として機能し、それによって処理済みの音声録音のストレージを提供している。処理済みの音声録音612は情報615としてエンティティA602に流れる。
処理済みの音声録音は情報624として、エンティティA602からエンティティC606へ流れる。前述したようにエンティティCは処理された音声録音上で操作を実行することができる。値620はエンティティA602からエンティティC606へ流れて、エンティティC606により提供されるサービス626の出力はサービス626としてエンティティA602に流れる。エンティティC606によって与えられるサービスと引換に、値620は、エンティティA602からエンティティC606へ流れる。
本発明の実施例について論じ、これを理解する目的で、当該技術分野の当業者は様々な用語を用いて、技術やアプローチを説明することを理解すべきである。更に、本明細書において、説明のために多数の詳細事項を説明し、本発明の完全な理解を提供している。しかし、当該技術分野の当業者は、本発明をこれらの詳細情報なしに実行できることは明白である。いくつかの場合、公知の構造やデバイスは、詳細にではなく、ブロック図形式で示されており、本発明を曖昧にするのを避けている。これらの実施例は、当該技術分野における当業者が本発明を実行できるよう詳しく記載されており、その他の実施例が利用可能であることや、論理的変更、機械的変更、電気的変更、その他の変更は本発明の範囲を逸脱することなく行うことが可能であると理解すべきである。
本明細書のいくつかの部分では、例えばコンピュータメモリ内のデータビット操作のアルゴリズム及び象徴的表象の用語で表現している。前記アルゴリズム的な説明や表現は、データ処理技術分野の当業者によって使われる手段であり、当該技術分野の当業者以外の者へ、彼らの仕事の実体を最も効果的に伝える手段である。ここではアルゴリズムは一般的には、つじつまの合う、所望の結果を導く行為のシーケンスであると考えられている。この行為は、物理量の物理的操作を必要とするものである。必ずしも必要ではないかもしれないが、通常は、上記物理量は電気又は磁気信号の形をとり、保管、転送、結合、比較、その他の操作が可能である。上記信号をビット、値、要素、記号、文字、用語、数字等で呼ぶことは、原理的に共用する理由がある場合には、時に便利であることが分かっている。
しかし、これらの用語、又は同じような用語は全て、適宜の物理量に関連づけるべきであること、及びこれらの物理量に適応する便利なラベルにすぎないことに留意すべきである。そうしないとこの記載から特に明白に述べられていない限りは、本明細書の中で、「処理」、「演算」、「計算」、「決定」、「表示」等の用語を用いた考察が、コンピュータシステム又は同様の電子演算システムの動作や処理を意味し、このコンピュータシステム又は同様の電気演算システムは、コンピュータシステムのレジスタ内の物理(電子)量として表現されるデータを操作及び変換し、そして同様に、コンピュータシステムのメモリ又はレジスタ又はその他の情報ストレージ、伝達デバイス、ディスプレイデバイス内の物理量として表される他のデータに記憶することは明らかである。
ここに示す操作を実行する装置は本発明を実装することができる。この装置は、要求される目的に応じて特別に作ることができ、又、一般用途のコンピュータを具えてもよく、コンピュータに保存されているコンピュータプログラムによって選択的に起動、再設定できる。このようなコンピュータプログラムは、コンピュータで読取可能な記憶媒体に保管できる。具体的には、この媒体はフロッピーディスク、ハードディスク、光ディスク、コンパクトディスク読み出し専用記憶(CD−ROMs)、光磁気(MO)ディスクを含む任意のタイプのディスク、読み取り専用メモリ(ROMs)、ランダムアクセスメモリ(RAMs)、電気的プログラマブル読取り専用メモリ(EPROMs)、電気的消去書込み可能読出し専用メモリ(EEPROMs)、フラッシュメモリ、磁気及び光学カード等、あるいはコンピュータのローカル又はリモート電子マニュアルを保管するのに適した任意のタイプの媒体などであるが、これらに限定はされない。
ここに呈示したアルゴリズム及びディスプレイは、特殊コンピュータ又はその他の装置とは本質的に関係がない。様々な汎用システムではここに教示したことに従ってプログラムを使用でき、又、より特化された装置を構築して要求された方法を実行するのに便利である。例えば、本発明に従った方法はいずれも、汎用プロセッサをプログラミングすることによって、又は、ハードウェアとソフトウェアの組合せによって、ハードワイヤ回路内で実行できる。当業者には、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの又はプログラム可能な大衆消費電子製品、デジタル信号処理装置(DSP)、セットトップボックス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ等を含む、ここに記載された以外のコンピュータシステム構成で本発明を実行できることは自明である。本発明は通信ネットワークでつながれた遠隔処理デバイスによってタスクを実行する分散計算処理環境においても実行可能である。
本発明の方法はコンピュータソフトウェアを使用して実行することができる。公認標準規格に合致したプログラミング言語で書かれているならば、この方法を実行するように設計された指示シーケンスは様々なハードウェアプラットフォームで実行できるように、そして様々なオペレーティングシステムのインタフェースで接続できるようにコンパイルできる。加えて、本発明は特別なプログラミング言語を参照した記載をしていない。様々なプログラミング言語を使用して、ここに記載された本発明の教示を実行できることは明らかである。さらに、一の形式又は別の形式(例えば、プログラム、手順、アプリケーション、ドライバ…)において、処理を実施して結果が生ずるようなソフトウェアの話は当該技術分野においては通常のことである。上述した表現は、コンピュータによってソフトウェアを実行することによりコンピュータのプロセッサが処理を実施又は結果を生成することを述べる簡単明瞭な手段にすぎない。
様々な用語及び技術が、通信、プロトコル、アプリケーション、実施、メカニズム等を記載するのに当該技術分野の当業者によって使われていることを理解すべきである。これらの技術の一つは、アルゴリズムや数学的表現の観点から技術の実装を記述することである。換言すれば、例えば、技術をコンピュータ上の実行コードとして実装できる一方で、この技術の表現を公式、アルゴリズム、又は数学的表現としてより適切かつ簡単に伝達、又は連絡することができる。従って、当該技術分野の当業者は、A+B=Cを示すブロックが、加法関数であると認識でき、ハードウェア及び/又はソフトウェアにおける加法関数の実装は、2つの入力(A及びB)を受け取って、合計出力(C)を生成することを認識できる。このように記述として、公式、アルゴリズム又は数学的表現を使用することを、少なくともハードウェア及び/又はソフトウェア(例えば、本発明の技術が一実施例として実行でき、実装できるコンピュータシステム)内の物理的実施例を有することとして理解すべきである。
ある機械的に読取可能な媒体は、機械(例えば、コンピュータ)によって読取可能な形式で情報を保管又は送信する何らかのメカニズムを具えると理解される。例えば、機械的に読取可能な媒体は、読み取り専用メモリ(ROM);ランダムアクセスメモリ(RAM);磁気ディスク記憶媒体;光記憶媒体;フラッシュメモリデバイス;電気的、光学的、音響的、又はその他の伝送信号(例えば、搬送波、赤外線信号、デジタル信号等)等を含む。
本明細書で使用したように、「一実施例」又は「ある実施例」又は同様のフレーズは、記載した特徴が少なくとの本発明の一実施例に含まれていることを示している。本明細書の「一実施例」の参照は、必ずしも同じ実施例の参照であるとは限らない。しかし、これらの実施例が互いに排他的であることはないし、「一実施例」が本発明の実施例が一つだけであることを示しているわけでもない。例えば、「一実施例」に記述された特徴、構造、動作等が他の実施例に含まれることもある。従って、本発明はここに記載された実施例の様々な結合及び/又は統合を具えていてもよい。
本発明はいくつかの実施例に関して記載されているが、当該技術分野の当業者は本発明が記載された実施例に限定されることなく、特許請求の範囲の精神及び領域内で改良及び変更の実施が可能であることを認識できる。従って、本記載は限定ではなく実例であるとみなすべきである。
本発明は以下の詳細な説明と本発明の実施例を説明するための添付図面を参照することにより最も良く理解することができる。本発明は実施例中の例により説明されているが、添付図面の図に限定されない。ここでは同じ要素には同じ符号を付している。
図1Aは、本発明の実施例による音声認識を使用した音声録音の処理を示す。
図1Bは、本発明の実施例による録音システムを示す。
図2は、本発明の実施例による音声録音の処理を示す。
図3は、本発明の実施例による終点を使用した音声録音の処理を示す。
図4Aは、本発明の一実施例による音声信号のアナログ表現を示す。
図4Bは、音声録音の処理のユーザインタフェースの一実施例を示す。
図5は、本発明の実施例による音声録音の再処理を示す。
図6は、本発明の実施例による情報の流れを示す。
Claims (50)
- データ処理システム内へ音声録音をロードするステップであって、前記音声録音は人と企業エンティティのインタフェースとの間の取引中の人の発話から生じるものであるステップと;
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理するステップと;
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すものかどうかを検出するステップと;
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合に、前記音声録音のセグメントを不明瞭な状態にするステップと;
を具えることを特徴とする方法。 - 請求項1に記載の方法において、前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする方法。
- 請求項1に記載の方法において、前記特有な情報が社会保険番号、個人識別番号(PIN)、金融口座番号、名前、住所からなる群から選択されることを特徴とする方法。
- 請求項1に記載の方法において、前記特有な情報がユーザによって定義されることを特徴とする方法。
- 請求項1に記載の方法において、前記不明瞭な状態にするステップが前記セグメントの暗号化であることを特徴とする方法。
- 請求項1に記載の方法において、前記不明瞭な状態にするステップが前記セグメントのマスキングであることを特徴とする方法。
- 請求項1に記載の方法において、前記不明瞭な状態にするステップが前記セグメントの消去であることを特徴とする方法。
- 請求項1に記載の方法において、前記企業エンティティの前記インタフェースが生きている人であることを特徴とする方法。
- 請求項1に記載の方法において、前記企業エンティティの前記インタフェースが自動工程であることを特徴とする方法。
- 請求項1に記載の方法において、前記処理するステップがさらに:
音声録音を第1のストランドに分けるステップであって、前記第1のストランドが前記人に対応するステップと;
音声録音を第2のストランドに分けるステップであって、前記第2のストランドが前記企業エンティティの前記インタフェースに対応するステップ;
を具えることを特徴とする方法。 - 請求項1に記載の方法が、さらに:
契約関係の下で実行されるステップであり、前記契約関係が、前記ロード、前記処理、前記検出、又は前記不明瞭な状態にするステップのうちの少なくとも1つと引換に、データ管理者が前記企業エンティティから値を受け取る条件を有するステップ;
を具えることを特徴とする方法。 - 請求項1に記載の方法において、前記音声録音をアナログ形式で保管することを特徴とする方法。
- 請求項1に記載の方法において、前記音声録音をデジタル形式で保管することを特徴とする方法。
- 請求項1に記載の方法において、前記不明瞭な状態にするステップをテキスト表示した前記音声録音で実行することを特徴とする方法。
- 請求項1に記載の方法が、さらに:
前記音声録音に識別子を関連付けるステップであって、当該識別子が前記検出に基づくものであり、当該識別子が前記人に関連する特有な情報に関連する情報を伝達するステップを具えることを特徴とする方法。 - データ処理システム内へ音声録音をロードするステップであって、前記音声録音が人に関する特有な情報を含む少なくとも一のセグメントを不明瞭な状態にするように処理済みであり、前記音声録音が前記人と企業エンティティとの間の取引中の前記人の発話から生じたものであるステップと;
前記音声録音を再処理し、不明瞭な状態にされた少なくとも一のセグメント部分を調整するステップ;
を具えることを特徴とする方法。 - 請求項16に記載の方法において、復号化を実行する前記再処理中にキーを使用することを特徴とする方法。
- 請求項16に記載の方法において、暗号化を実行する前記再処理中にキーを使用することを特徴とする方法。
- 請求項16に記載の方法において、前記企業エンティティの前記インタフェースが生きている人であることを特徴とする方法。
- 請求項16に記載の方法において、前記企業エンティティの前記インタフェースが自動工程であることを特徴とする方法。
- 情報ディスプレイと;
ストレージデバイスと;及び
前記ストレージデバイスから音声録音を読み取り、前記音声録音が人と企業エンティティとの間の取引中の前記人の発話から生じるものであり;
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理し;
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すかどうかを検出し;
前記テキストの少なくとも一要素を、前記情報ディスプレイ上に表示し;
ユーザから命令を受け取り、当該命令は前記テキストの少なくとも一要素上の処理を起動するものである;
ようにプログラムされたプロセッサと;
を具えることを特徴とする装置。 - 請求項21に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを消去することを特徴とする装置。
- 請求項21に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントをマスキングすることを特徴とする装置。
- 請求項21に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを暗号化することを特徴とする装置。
- 請求項24に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを復号化することを特徴とする装置。
- 請求項21に記載の装置が、さらに;
データ管理者を具え、当該データ管理者が前記企業エンティティとの第1の契約関係を有し、当該第1の契約関係が、前記企業エンティティが請求項21に記載のようにプログラムされた前記プロセッサの操作に応じて、前記データ管理者に値を送信するという条件を有する;
ことを特徴とする装置。 - 人から音声信号を受信するステップと;
企業エンティティのインタフェースから音声信号を受信するステップと;
前記人からの前記音声信号及び前記企業エンティティの前記インタフェースからの前記音声信号のうちの1つにマーカをオーバレイするステップと;
前記マーカを利用して、前記人についての機密情報に対応する少なくともテキストの一要素を同定するように前記音声信号を処理するステップと;
を具えることを特徴とする方法。 - 請求項27に記載の方法において、音を前記マーカとして用いることを特徴とする方法。
- 請求項27に記載の方法において、前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする方法。
- 請求項27に記載の方法において、前記特有な情報が社会保険番号、個人識別番号(PIN)、金融口座番号、名前、住所からなる群から選択されることを特徴とする方法。
- 請求項27に記載の方法において、前記特有な情報がユーザによって定義されることを特徴とする方法。
- 請求項27に記載の方法が、さらに:
契約関係の下で実行するステップを具え、当該契約関係が、前記人からの音声信号の前記受信、前記企業エンティティからの前記音声信号の前記受信、前記オーバレイ、又は前記利用のうちの少なくとも1つと引換に、データ管理者が前記企業エンティティから値を受け取る条件を有することを特徴とする方法。 - データ処理システムで実行されるときに、前記データ処理システムに:
データ処理システム内へ音声録音をロードするステップであって、前記音声録音は前記人と企業エンティティとの間の取引中の人の発話から生じるものであるステップと;
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理するステップと;
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すかどうかを検出するステップと;
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合、前記音声録音内のセグメントを不明瞭な状態にするステップと;
を具える方法を実行させる実行可能なコンピュータプログラムインストラクションを含む、コンピュータで読取可能な媒体。 - 前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記特有な情報が社会保険番号、個人識別番号(PIN)、金融口座番号、名前、住所からなる群から選択されることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記特有な情報がユーザによって定義されることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記不明瞭な状態にするステップが前記セグメントの暗号化であることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記不明瞭な状態にするステップが前記セグメントのマスキングであることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記企業エンティティの前記インタフェースが生きている人であることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 前記企業エンティティの前記インタフェースが自動工程であることを特徴とする請求項33に記載のコンピュータで読取可能な媒体。
- 請求項33に記載のコンピュータで読取可能な媒体において、前記方法がさらに:
音声録音を第1のストランドに分けるステップであって、前記第1のストランドが前記人に対応するものであるステップと;
音声録音を第2のストランドに分けるステップであって、前記第2のストランドが前記企業エンティティの前記インタフェースに対応するものであるステップと;
を具えることを特徴とする媒体。 - 請求項33に記載の前記のコンピュータで読取可能な媒体において、前記不明瞭な状態にするステップに続いて、前記音声録音をアナログ、デジタル、及びテキスト形式からなる群から選択された形式で保存することを特徴とする媒体。
- 音声録音を保存する手段であって、前記音声録音は人と企業エンティティとの間の取引中の人の発話から生じるものである手段と;
テキストの少なくとも一要素を認識するように音声録音を処理する手段と;
前記テキストの少なくとも一要素が、前記人に関連する特有な情報を表すかどうかを検出する手段と;及び
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合に、前記テキストの少なくとも一要素に対応する前記音声録音中のセグメントを不明瞭な状態にする手段と;
を具えることを特徴とする装置。 - 請求項43に記載の前記装置が、さらに:
前記音声録音を少なくとも2つのストランドに分ける手段;
を具えることを特徴とする装置。 - 請求項43に記載の前記装置が、さらに:
前記音声録音に識別子を関連付ける手段を具えることを特徴とする装置。 - データ処理システム内へ音声録音をロードするステップであって、前記音声録音が前記人と企業エンティティとの間の取引中の人の発話から生じるものであるステップと;
前記音声録音を処理して、前記音声録音内のテキストの要素を認識するステップと;
前記テキストの要素が前記人に関する特有な情報を表すかどうかを検出するステップと;
前記音声録音に識別子を関連付けるステップであって、当該識別子が前記検出に基づくものであるステップと;
を具えることを特徴とする方法。 - 請求項46に記載の方法において、前記識別子が、音声録音が前記人に関する特有な情報を含むことを表示することを特徴とする方法。
- 請求項46に記載の方法において、前記音声録音が、アナログ、デジタル、及びテキスト形式からなる群から選択された形式であることを特徴とする方法。
- 請求項48に記載の方法において、前記識別子が特有な情報の存在、特有な情報の不存在、暗号化、マスキング、データ所有者、データ管理者及びデータ分析者からなる群から選択されるパラメータの情報を伝送することを特徴とする方法。
- 請求項46の方法において、前記識別子を関連付けるステップが、前記識別子を音声録音に関連付け、当該音声録音がアナログ、デジタル、テキストからなる群から選択される形式であることを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/181,572 US8577684B2 (en) | 2005-07-13 | 2005-07-13 | Selective security masking within recorded speech utilizing speech recognition techniques |
PCT/US2006/027173 WO2007009028A2 (en) | 2005-07-13 | 2006-07-12 | Selective security masking within recorded speech utilizing speech recognition techniques |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009501942A true JP2009501942A (ja) | 2009-01-22 |
JP2009501942A5 JP2009501942A5 (ja) | 2009-08-20 |
Family
ID=37637959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521597A Pending JP2009501942A (ja) | 2005-07-13 | 2006-07-12 | 音声認識技術を利用した録音した音声内の選択的セキュリティマスキング |
Country Status (5)
Country | Link |
---|---|
US (4) | US8577684B2 (ja) |
EP (1) | EP1902442B1 (ja) |
JP (1) | JP2009501942A (ja) |
IL (1) | IL188699A0 (ja) |
WO (1) | WO2007009028A2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079235A (ja) * | 2008-09-28 | 2010-04-08 | Avaya Inc | 個人(オーディ)情報を含まないメディア・ストリームを保存する方法 |
JP2010176199A (ja) * | 2009-01-27 | 2010-08-12 | Sanyo Electric Co Ltd | 情報処理装置 |
CN111226274A (zh) * | 2017-11-28 | 2020-06-02 | 国际商业机器公司 | 自动阻止音频流中包含的敏感数据 |
WO2023153677A1 (ko) * | 2022-02-08 | 2023-08-17 | 한양대학교 에리카산학협력단 | 음성 처리 장치, 음성 복원 장치, 음성 처리 시스템 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8577684B2 (en) | 2005-07-13 | 2013-11-05 | Intellisist, Inc. | Selective security masking within recorded speech utilizing speech recognition techniques |
US8433915B2 (en) | 2006-06-28 | 2013-04-30 | Intellisist, Inc. | Selective security masking within recorded speech |
US20080221882A1 (en) * | 2007-03-06 | 2008-09-11 | Bundock Donald S | System for excluding unwanted data from a voice recording |
WO2009026271A1 (en) * | 2007-08-20 | 2009-02-26 | Nexidia, Inc. | Consistent user experience in information retrieval systems |
CA2665055C (en) * | 2008-05-23 | 2018-03-06 | Accenture Global Services Gmbh | Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto |
US8401155B1 (en) * | 2008-05-23 | 2013-03-19 | Verint Americas, Inc. | Systems and methods for secure recording in a customer center environment |
US9111540B2 (en) * | 2009-06-09 | 2015-08-18 | Microsoft Technology Licensing, Llc | Local and remote aggregation of feedback data for speech recognition |
US20110218798A1 (en) * | 2010-03-05 | 2011-09-08 | Nexdia Inc. | Obfuscating sensitive content in audio sources |
US20120027195A1 (en) * | 2010-07-29 | 2012-02-02 | Cisco Technology, Inc. | Automatic Editing out of Sensitive Information in Multimedia Prior to Monitoring and/or Storage |
US10424011B2 (en) | 2011-11-02 | 2019-09-24 | Gain Credit Holdings, Inc | Systems and methods for shared lending risk |
US9514329B2 (en) | 2012-03-30 | 2016-12-06 | Intellisist, Inc. | Computer-implemented system and method for individual message encryption using a unique key |
US9819798B2 (en) | 2013-03-14 | 2017-11-14 | Intellisist, Inc. | Computer-implemented system and method for efficiently facilitating appointments within a call center via an automatic call distributor |
KR102060661B1 (ko) * | 2013-07-19 | 2020-02-11 | 삼성전자주식회사 | 통신 방법 및 이를 위한 디바이스 |
US20150142446A1 (en) * | 2013-11-21 | 2015-05-21 | Global Analytics, Inc. | Credit Risk Decision Management System And Method Using Voice Analytics |
US9646607B2 (en) * | 2014-03-10 | 2017-05-09 | Dell Products, L.P. | Managing wake-on-voice buffer quality based on system boot profiling |
CN107305541B (zh) * | 2016-04-20 | 2021-05-04 | 科大讯飞股份有限公司 | 语音识别文本分段方法及装置 |
US10754978B2 (en) | 2016-07-29 | 2020-08-25 | Intellisist Inc. | Computer-implemented system and method for storing and retrieving sensitive information |
KR102643501B1 (ko) * | 2016-12-26 | 2024-03-06 | 현대자동차주식회사 | 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법 |
GB2559130B (en) | 2017-01-25 | 2020-05-27 | Syntec Holdings Ltd | Secure data exchange by voice in telephone calls |
WO2019010250A1 (en) * | 2017-07-05 | 2019-01-10 | Interactions Llc | REAL-TIME CONFIDENTIALITY FILTER |
US10529336B1 (en) * | 2017-09-13 | 2020-01-07 | Amazon Technologies, Inc. | Filtering sensitive information |
US10819710B2 (en) * | 2017-09-29 | 2020-10-27 | Jpmorgan Chase Bank, N.A. | Systems and methods for privacy-protecting hybrid cloud and premise stream processing |
CN108363765B (zh) * | 2018-02-06 | 2020-12-08 | 深圳市鹰硕技术有限公司 | 音频段落识别方法以及装置 |
US10423688B1 (en) | 2018-04-13 | 2019-09-24 | Banjo, Inc. | Notifying entities of relevant events |
US10846151B2 (en) | 2018-04-13 | 2020-11-24 | safeXai, Inc. | Notifying entities of relevant events removing private information |
US10313865B1 (en) * | 2018-04-27 | 2019-06-04 | Banjo, Inc. | Validating and supplementing emergency call information |
US10585724B2 (en) | 2018-04-13 | 2020-03-10 | Banjo, Inc. | Notifying entities of relevant events |
CN108922450B (zh) * | 2018-05-30 | 2022-07-01 | 如你所视(北京)科技有限公司 | 在房屋虚拟三维空间中讲房内容自动播放控制方法及装置 |
EP3598444B1 (en) * | 2018-07-16 | 2023-12-27 | Tata Consultancy Services Limited | Method and system for muting classified information from an audio |
US10468026B1 (en) | 2018-08-17 | 2019-11-05 | Century Interactive Company, LLC | Dynamic protection of personal information in audio recordings |
US11210337B2 (en) | 2018-10-16 | 2021-12-28 | International Business Machines Corporation | System and method for searching audio data |
US11138334B1 (en) * | 2018-10-17 | 2021-10-05 | Medallia, Inc. | Use of ASR confidence to improve reliability of automatic audio redaction |
US10582343B1 (en) * | 2019-07-29 | 2020-03-03 | Banjo, Inc. | Validating and supplementing emergency call information |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005020034A2 (en) * | 2003-08-26 | 2005-03-03 | Clearplay, Inc. | Method and apparatus for controlling play of an audio signal |
Family Cites Families (112)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03292524A (ja) | 1990-04-11 | 1991-12-24 | Oki Electric Ind Co Ltd | カーソル移動方式 |
US5388252A (en) | 1990-09-07 | 1995-02-07 | Eastman Kodak Company | System for transparent monitoring of processors in a network with display of screen images at a remote station for diagnosis by technical support personnel |
US5436653A (en) * | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
JP3597543B2 (ja) | 1992-10-16 | 2004-12-08 | 富士写真フイルム株式会社 | カーソル制御方法および装置 |
JPH0772999A (ja) | 1992-10-20 | 1995-03-17 | Hewlett Packard Co <Hp> | 画面対応ソフトウェアアプリケーションツールにおける表示画面事象をモニターする方法と装置 |
US5479411A (en) * | 1993-03-10 | 1995-12-26 | At&T Corp. | Multi-media integrated message arrangement |
US6122403A (en) * | 1995-07-27 | 2000-09-19 | Digimarc Corporation | Computer system linked by using information in data objects |
US5583933A (en) | 1994-08-05 | 1996-12-10 | Mark; Andrew R. | Method and apparatus for the secure communication of data |
WO1996013132A1 (en) * | 1994-10-24 | 1996-05-02 | Ameritech Corporation | Wireless digital personal communications system having voice/data/image two-way calling and intercell hand-off |
GB2296349A (en) * | 1994-12-19 | 1996-06-26 | Secr Defence | Maintaining order of input data events |
US6760463B2 (en) | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
US5900877A (en) | 1995-05-15 | 1999-05-04 | Sybase, Inc. | Method and apparatus for multilevel software controls |
JP3180655B2 (ja) * | 1995-06-19 | 2001-06-25 | 日本電信電話株式会社 | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 |
US5884262A (en) * | 1996-03-28 | 1999-03-16 | Bell Atlantic Network Services, Inc. | Computer network audio access and conversion system |
US6370574B1 (en) | 1996-05-31 | 2002-04-09 | Witness Systems, Inc. | Method and apparatus for simultaneously monitoring computer user screen and telephone activity from a remote location |
US5790798A (en) | 1996-05-31 | 1998-08-04 | Witness Systems, Inc. | Method and apparatus for simultaneously monitoring computer user screen and telephone activity from a remote location |
JPH1070613A (ja) | 1996-08-28 | 1998-03-10 | Bell Syst Nijiyuuyon:Kk | 住所・氏名のオフライン認識サポートシステム、通信販売等の電話注文受けシステム、および聞き起し画面 |
US6263049B1 (en) | 1996-10-10 | 2001-07-17 | Envision Telephony, Inc. | Non-random call center supervisory method and apparatus |
US5870079A (en) | 1996-11-12 | 1999-02-09 | Legaltech, Inc. | Computer input device and controller therefor |
EP0938793A4 (en) * | 1996-11-22 | 2003-03-19 | T Netix Inc | VOICE RECOGNITION FOR ACCESS TO INFORMATION SYSTEMS AND PROCESSING OF TRANSACTIONS |
US6029124A (en) * | 1997-02-21 | 2000-02-22 | Dragon Systems, Inc. | Sequential, nonparametric speech recognition and speaker identification |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
WO1999017279A1 (en) * | 1997-09-30 | 1999-04-08 | Siemens Aktiengesellschaft | A method of encoding a speech signal |
US6119084A (en) * | 1997-12-29 | 2000-09-12 | Nortel Networks Corporation | Adaptive speaker verification apparatus and method including alternative access control |
US6385596B1 (en) * | 1998-02-06 | 2002-05-07 | Liquid Audio, Inc. | Secure online music distribution system |
US6901241B2 (en) * | 1998-02-11 | 2005-05-31 | Telefonaktiebolaget L M Ericsson (Publ) | System, method and apparatus for secure transmission of confidential information |
US7096494B1 (en) * | 1998-05-05 | 2006-08-22 | Chen Jay C | Cryptographic system and method for electronic transactions |
US6270011B1 (en) | 1998-05-28 | 2001-08-07 | Benenson Tal | Remote credit card authentication system |
US6661904B1 (en) | 1998-07-15 | 2003-12-09 | Personalogo | Method and system for automated electronic conveyance of hidden data |
US6519699B2 (en) * | 1998-08-07 | 2003-02-11 | International Business Machines Corporation | Method and system for voice guided secure entry of private data in a public setting |
US6128380A (en) | 1998-08-24 | 2000-10-03 | Siemens Information And Communication, Networks, Inc. | Automatic call distribution and training system |
US6564261B1 (en) * | 1999-05-10 | 2003-05-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Distributed system to intelligently establish sessions between anonymous users over various networks |
US6477492B1 (en) * | 1999-06-15 | 2002-11-05 | Cisco Technology, Inc. | System for automated testing of perceptual distortion of prompts from voice response systems |
US6938163B1 (en) * | 1999-06-17 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Technique for securely storing data within a memory |
US6856687B2 (en) * | 1999-06-21 | 2005-02-15 | Copytele, Inc. | Portable telecommunication security device |
JP4003352B2 (ja) * | 1999-08-04 | 2007-11-07 | ソニー株式会社 | 情報記録媒体および情報処理装置 |
US6785810B1 (en) * | 1999-08-31 | 2004-08-31 | Espoc, Inc. | System and method for providing secure transmission, search, and storage of data |
US7391865B2 (en) * | 1999-09-20 | 2008-06-24 | Security First Corporation | Secure data parser method and system |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6671818B1 (en) | 1999-11-22 | 2003-12-30 | Accenture Llp | Problem isolation through translating and filtering events into a standard object format in a network based supply chain |
US6782413B1 (en) * | 2000-02-11 | 2004-08-24 | Microsoft Corporation | Distributed conference bridge |
TW550477B (en) * | 2000-03-01 | 2003-09-01 | Passgate Corp | Method, system and computer readable medium for Web site account and e-commerce management from a central location |
WO2001072015A1 (en) * | 2000-03-21 | 2001-09-27 | Leedom Charles M Jr | A tiered wireless, multi-modal access system and method |
US6934684B2 (en) * | 2000-03-24 | 2005-08-23 | Dialsurf, Inc. | Voice-interactive marketplace providing promotion and promotion tracking, loyalty reward and redemption, and other features |
US20030125958A1 (en) * | 2001-06-19 | 2003-07-03 | Ahmet Alpdemir | Voice-interactive marketplace providing time and money saving benefits and real-time promotion publishing and feedback |
US7599847B2 (en) * | 2000-06-09 | 2009-10-06 | Airport America | Automated internet based interactive travel planning and management system |
US20030023435A1 (en) * | 2000-07-13 | 2003-01-30 | Josephson Daryl Craig | Interfacing apparatus and methods |
US6668044B1 (en) * | 2000-07-19 | 2003-12-23 | Xtend Communications Corp. | System and method for recording telephonic communications |
US6583781B1 (en) | 2000-10-17 | 2003-06-24 | International Business Machines Corporation | Methods, systems and computer program products for controlling events associated with user interface elements by capturing user intent based on pointer movements |
ATE552562T1 (de) * | 2000-11-10 | 2012-04-15 | Aol Musicnow Llc | Verteilungs und -abonnementsystem für digitalen inhalt |
US7669051B2 (en) * | 2000-11-13 | 2010-02-23 | DigitalDoors, Inc. | Data security system and method with multiple independent levels of security |
US20020065668A1 (en) | 2000-11-29 | 2002-05-30 | Ncr Corporation | Personal information protection method for a network kiosk |
US6865162B1 (en) * | 2000-12-06 | 2005-03-08 | Cisco Technology, Inc. | Elimination of clipping associated with VAD-directed silence suppression |
CA2432141C (en) * | 2000-12-18 | 2010-02-09 | Cora Alisuag | Computer oriented record administration system |
JP3859450B2 (ja) * | 2001-02-07 | 2006-12-20 | 富士通株式会社 | 秘密情報管理システムおよび情報端末 |
FR2821188B1 (fr) * | 2001-02-20 | 2004-01-23 | Gemplus Card Int | Procede de stockage securise de donnees personnelles et de consultation, carte a puce, terminal et serveur pour la mise en oeuvre du procede |
US20020120554A1 (en) * | 2001-02-28 | 2002-08-29 | Vega Lilly Mae | Auction, imagery and retaining engine systems for services and service providers |
US7174297B2 (en) * | 2001-03-09 | 2007-02-06 | Bevocal, Inc. | System, method and computer program product for a dynamically configurable voice portal |
US7024364B2 (en) * | 2001-03-09 | 2006-04-04 | Bevocal, Inc. | System, method and computer program product for looking up business addresses and directions based on a voice dial-up session |
US20020193997A1 (en) * | 2001-03-09 | 2002-12-19 | Fitzpatrick John E. | System, method and computer program product for dynamic billing using tags in a speech recognition framework |
US7298844B2 (en) * | 2001-04-11 | 2007-11-20 | Matsushita Electric Industrial Co., Ltd. | Recording/reproducing apparatus, data moving method, and data deletion method |
US20020152262A1 (en) * | 2001-04-17 | 2002-10-17 | Jed Arkin | Method and system for preventing the infringement of intellectual property rights |
US20020188467A1 (en) * | 2001-05-02 | 2002-12-12 | Louis Eke | Medical virtual resource network |
US20030002671A1 (en) * | 2001-06-11 | 2003-01-02 | Eastman Kodak Company | Delivery of electronic content over a network using a hybrid optical disk for authentication |
US20030120936A1 (en) | 2001-08-01 | 2003-06-26 | Eft Datalink | Encryption of financial information |
US8266451B2 (en) * | 2001-08-31 | 2012-09-11 | Gemalto Sa | Voice activated smart card |
US20030079224A1 (en) | 2001-10-22 | 2003-04-24 | Anton Komar | System and method to provide additional information associated with selectable display areas |
US20030112978A1 (en) * | 2001-12-17 | 2003-06-19 | Jeffrey Rodman | System and method for secured data transmission within a wireless communication system |
US7260722B2 (en) * | 2001-12-28 | 2007-08-21 | Itt Manufacturing Enterprises, Inc. | Digital multimedia watermarking for source identification |
GB2385157B (en) * | 2002-02-07 | 2005-07-06 | Hewlett Packard Co | Improvements relating to secure data management techniques |
GB0222113D0 (en) | 2002-09-24 | 2002-10-30 | Koninkl Philips Electronics Nv | Image recognition |
US7016844B2 (en) * | 2002-09-26 | 2006-03-21 | Core Mobility, Inc. | System and method for online transcription services |
US7698441B2 (en) * | 2002-10-03 | 2010-04-13 | International Business Machines Corporation | Intelligent use of user data to pre-emptively prevent execution of a query violating access controls |
US7464268B2 (en) * | 2002-10-17 | 2008-12-09 | At&T Intellectual Property I, L.P. | Customizable instant messaging private tags |
US20040079687A1 (en) | 2002-10-24 | 2004-04-29 | Baxter International Inc. | Multifunctional optical sensing assembly |
DE60314176T2 (de) * | 2002-11-22 | 2008-01-24 | Intellisist, Inc., Bellevue | Verfahren und vorrichtung zur bereitstellung von nachrichtenorientierten sprachkommunikationen zwischen mehreren partnern |
US7418600B2 (en) * | 2003-03-13 | 2008-08-26 | International Business Machines Corporation | Secure database access through partial encryption |
US20040193871A1 (en) * | 2003-03-28 | 2004-09-30 | Broadcom Corporation | System and method for transmitting data using selective partial encryption |
US7539725B2 (en) * | 2003-04-03 | 2009-05-26 | Zix Corporation | Auditor system |
GB2400478B (en) * | 2003-04-07 | 2006-03-29 | Research In Motion Ltd | Method and system of supporting smart cards on electronic devices |
US7484213B2 (en) * | 2003-07-11 | 2009-01-27 | Boban Mathew | Agent architecture employed within an integrated message, document and communication system |
US7499531B2 (en) * | 2003-09-05 | 2009-03-03 | Emc Corporation | Method and system for information lifecycle management |
EP1668448A2 (en) * | 2003-09-12 | 2006-06-14 | RSA Security Inc. | System and method providing disconnected authentication |
US7533259B2 (en) * | 2003-09-15 | 2009-05-12 | Telecommunication Systems, Inc. | Encapsulation of secure encrypted data in a deployable, secure communication system allowing benign, secure commercial transport |
US20050114379A1 (en) | 2003-11-25 | 2005-05-26 | Lee Howard M. | Audio/video service quality analysis of customer/agent interaction |
JP4290036B2 (ja) | 2004-02-27 | 2009-07-01 | キヤノン株式会社 | 情報処理装置及び印刷制御装置 |
DE602004020969D1 (de) | 2004-03-12 | 2009-06-18 | Dassault Systemes | Verfahren zur Selektierung und Handhabung von Objekten in einem CAD-System |
JP2005301988A (ja) * | 2004-03-15 | 2005-10-27 | Sanyo Electric Co Ltd | 生体情報処理装置、個人認証装置、個人認証システム、生体情報処理方法および個人認証方法 |
US20050238174A1 (en) * | 2004-04-22 | 2005-10-27 | Motorola, Inc. | Method and system for secure communications over a public network |
EP1751908B1 (en) * | 2004-05-10 | 2016-07-13 | Koninklijke Philips N.V. | Personal communication apparatus capable of recording transactions secured with biometric data |
US20050256956A1 (en) | 2004-05-14 | 2005-11-17 | Battelle Memorial Institute | Analyzing user-activity data using a heuristic-based approach |
CN1965358A (zh) | 2004-06-07 | 2007-05-16 | 日本先锋公司 | 信息记录介质 |
US8532282B2 (en) | 2004-06-14 | 2013-09-10 | At&T Intellectual Property I, L.P. | Tracking user operations |
EP1759550B1 (en) * | 2004-06-25 | 2008-10-29 | Telecom Italia S.p.A. | Method and system for protecting information exchanged during communication between users |
US7577845B2 (en) * | 2004-08-17 | 2009-08-18 | Hengli Ma | Information matrix cryptogram |
US7584103B2 (en) | 2004-08-20 | 2009-09-01 | Multimodal Technologies, Inc. | Automated extraction of semantic content and generation of a structured document from speech |
US20060059363A1 (en) * | 2004-09-16 | 2006-03-16 | Mese John C | Method for controlling access to a computerized device |
US20060056626A1 (en) | 2004-09-16 | 2006-03-16 | International Business Machines Corporation | Method and system for selectively masking the display of data field values |
US7493487B2 (en) * | 2004-10-15 | 2009-02-17 | Microsoft Corporation | Portable computing environment |
US7650628B2 (en) * | 2004-10-21 | 2010-01-19 | Escription, Inc. | Transcription data security |
US7437290B2 (en) * | 2004-10-28 | 2008-10-14 | Microsoft Corporation | Automatic censorship of audio data for broadcast |
US7097108B2 (en) | 2004-10-28 | 2006-08-29 | Bellsouth Intellectual Property Corporation | Multiple function electronic cards |
US8078463B2 (en) | 2004-11-23 | 2011-12-13 | Nice Systems, Ltd. | Method and apparatus for speaker spotting |
JP2006163570A (ja) | 2004-12-03 | 2006-06-22 | Sanden Corp | 電子マネー変換装置 |
US20060129948A1 (en) | 2004-12-14 | 2006-06-15 | Hamzy Mark J | Method, system and program product for a window level security screen-saver |
US20110154455A1 (en) * | 2005-02-22 | 2011-06-23 | Nanjangudu Shiva R | Security management framework |
US7502741B2 (en) * | 2005-02-23 | 2009-03-10 | Multimodal Technologies, Inc. | Audio signal de-identification |
US7543145B2 (en) * | 2005-03-03 | 2009-06-02 | Microsoft Corporation | System and method for protecting configuration settings in distributed text-based configuration files |
US20060210071A1 (en) * | 2005-03-16 | 2006-09-21 | Chandran Gayathiri R | Encryption of security-sensitive data |
US8806218B2 (en) * | 2005-03-18 | 2014-08-12 | Microsoft Corporation | Management and security of personal information |
US20060236088A1 (en) * | 2005-04-13 | 2006-10-19 | Sbc Knowledge Ventures, L.P. | Technique for encrypting communications |
US8577684B2 (en) | 2005-07-13 | 2013-11-05 | Intellisist, Inc. | Selective security masking within recorded speech utilizing speech recognition techniques |
-
2005
- 2005-07-13 US US11/181,572 patent/US8577684B2/en active Active
-
2006
- 2006-07-12 WO PCT/US2006/027173 patent/WO2007009028A2/en active Application Filing
- 2006-07-12 JP JP2008521597A patent/JP2009501942A/ja active Pending
- 2006-07-12 EP EP06787122.8A patent/EP1902442B1/en active Active
-
2008
- 2008-01-10 IL IL188699A patent/IL188699A0/en unknown
-
2013
- 2013-11-04 US US14/071,639 patent/US8954332B2/en active Active
-
2015
- 2015-02-09 US US14/617,823 patent/US9881604B2/en active Active
-
2018
- 2018-01-29 US US15/882,958 patent/US10446134B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005020034A2 (en) * | 2003-08-26 | 2005-03-03 | Clearplay, Inc. | Method and apparatus for controlling play of an audio signal |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079235A (ja) * | 2008-09-28 | 2010-04-08 | Avaya Inc | 個人(オーディ)情報を含まないメディア・ストリームを保存する方法 |
JP2010176199A (ja) * | 2009-01-27 | 2010-08-12 | Sanyo Electric Co Ltd | 情報処理装置 |
CN111226274A (zh) * | 2017-11-28 | 2020-06-02 | 国际商业机器公司 | 自动阻止音频流中包含的敏感数据 |
JP2021505032A (ja) * | 2017-11-28 | 2021-02-15 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | オーディオ・ストリームに含まれるセンシティブ・データの自動ブロッキング |
JP7255811B2 (ja) | 2017-11-28 | 2023-04-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | オーディオ・ストリームに含まれるセンシティブ・データの自動ブロッキング |
CN111226274B (zh) * | 2017-11-28 | 2023-09-22 | 国际商业机器公司 | 自动阻止音频流中包含的敏感数据 |
WO2023153677A1 (ko) * | 2022-02-08 | 2023-08-17 | 한양대학교 에리카산학협력단 | 음성 처리 장치, 음성 복원 장치, 음성 처리 시스템 |
Also Published As
Publication number | Publication date |
---|---|
US9881604B2 (en) | 2018-01-30 |
US20140129219A1 (en) | 2014-05-08 |
US8954332B2 (en) | 2015-02-10 |
US8577684B2 (en) | 2013-11-05 |
EP1902442A2 (en) | 2008-03-26 |
US20150302849A1 (en) | 2015-10-22 |
WO2007009028A3 (en) | 2008-02-14 |
US20070016419A1 (en) | 2007-01-18 |
US10446134B2 (en) | 2019-10-15 |
US20180151174A1 (en) | 2018-05-31 |
EP1902442A4 (en) | 2009-07-01 |
WO2007009028A2 (en) | 2007-01-18 |
IL188699A0 (en) | 2008-08-07 |
EP1902442B1 (en) | 2015-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10446134B2 (en) | Computer-implemented system and method for identifying special information within a voice recording | |
US10372891B2 (en) | System and method for identifying special information verbalization timing with the aid of a digital computer | |
US10210870B2 (en) | Method for verification and blacklist detection using a biometrics platform | |
US7974411B2 (en) | Method for protecting audio content | |
US9336778B2 (en) | Method and system for using conversational biometrics and speaker identification/verification to filter voice streams | |
US8145562B2 (en) | Apparatus and method for fraud prevention | |
US9728191B2 (en) | Speaker verification methods and apparatus | |
US8990091B2 (en) | Parsimonious protection of sensitive data in enterprise dialog systems | |
CN113064983B (zh) | 语义检测方法、装置、计算机设备及存储介质 | |
US20210110819A1 (en) | Security Tool | |
US7978853B2 (en) | System and computer program product for protecting audio content | |
US20190026494A1 (en) | Automated obscuring system and method | |
US11947872B1 (en) | Natural language processing platform for automated event analysis, translation, and transcription verification | |
AU2020369562A1 (en) | Training set generation for speech recognition model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090703 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111101 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120410 |