JP2009501942A

JP2009501942A - 音声認識技術を利用した録音した音声内の選択的セキュリティマスキング

Info

Publication number: JP2009501942A
Application number: JP2008521597A
Authority: JP
Inventors: リー，ハワード，エム．; ルッツ，スティーブン; オディナック，ギラド
Original assignee: ハイパークオリティー，インク．
Priority date: 2005-07-13
Filing date: 2006-07-12
Publication date: 2009-01-22
Also published as: US9881604B2; US20140129219A1; US8954332B2; US8577684B2; EP1902442A2; US20150302849A1; WO2007009028A3; US20070016419A1; US10446134B2; US20180151174A1; EP1902442A4; WO2007009028A2; IL188699A0; EP1902442B1

Abstract

音声録音内に含まれる情報を保護するための装置と方法が記載されている。音声録音はデータ処理システムにロードされる。ここでは、音声録音は、人と企業エンティティのインタフェース間での取り引きを行う間に、人が発話することにより生じる。音声録音を処理し、音声録音内の少なくとも１つのテキスト要素を認識する。データ処理システムは少なくとも一つのテキスト要素がその人に関する特有な情報を表しているかどうかを検出する。少なくとも一つのテキスト要素がその人に関する特有な情報を表していれば、音声録音中のセグメントを不明瞭な状態にする。
【選択図】図１Ａ

Description

本発明の背景
本発明の分野
本発明の実施例は、一般的には情報へのアクセスの制限、特に、音声録音に存在する情報へのアクセスの制御に使用される装置と方法に関する。

技術背景
個人情報は現在社会における商取引の中で、日常的に収集されている。会話の録音はコールセンタのコンテキスト内での連絡時の顧客と取次者との対話、緊急医療サービスの対話（９１１コール等）、及び個人情報をある個人から別の個人に流すことが求められる無数の商取り引きといった様々なシチュエーションでひっきりなしに行われている。

これらの商取引の間、社会保険番号、クレジットカード番号、銀行口座番号、個人識別番号（ＰＩＮ）、氏名、住所、クラブ番号、フリークエント・フライヤー番号等の個人情報は機密に扱うべきであり、情報が乱用された場合はその情報に関する個人に被害を与える可能性がある。このことは問題である。

そのような機密に扱うべき情報が、あらゆる場所に保管されており、様々な理由で他の関係者に送られており、それらの全てにより、この情報は他人による情報漏洩のリスクにさらされている。ハッカーはそのような機密に扱うべき情報を保管するデータベースに近づくことに堪能である。アカウントが盗まれ、個人のアイデンティティを盗まれ、そして、個人が悪意のあるアクタにより物理的な被害にさらされる。このことは問題である。

上述した企業取引中に収集された情報は分析のために企業に送られることがある。企業取引中に、顧客とビジネスの取次者との電話を録音することは、広く普及している商習慣である。このような録音した情報は、多くの場合、分析業者に送られる。一例は、個人情報を含む録音の品質審査である。分析業者にデータを送ることが、データ所有者の意図であるとは言え、その業者が取引に含まれている個人情報にはアクセスすべきではない場合が多い。このことは問題である。

録音した会話中、又は録音した音声中の機密情報についての現在の取り組みは、手動で音声をモニタし、次いで機密情報を削除というものである。現在生じているこのようなデータの量を考慮すると、このような手法は高価である。このように録音した会話や音声を手動で検閲することは、市場の現在のニーズの全てに合致する経済的な手法ではない。このことは問題である。

機密の、個人的な、極秘の、又は識別されないようにすべきデータは、企業によって様々である。例えば、病名を患者の名前及び住所と別に保持するべき医療コンテキストでは、患者の名前と住所は、データ所有者以外の者が容易に入手できるべきではない機密情報として考えるべきである。フィナンシャルサービスのような環境においては、顧客の名前や住所は必ずしも機密データとは限らないが、むしろ、機密であると考え、保護すべきものは通常は顧客の口座番号、個人識別番号（ＰＩＮ）等である。機密情報の統一された定義はないので、何が機密情報であるかは環境によって様々であり、機密情報の取扱を複雑なものにしている。このことは問題である。

発明の詳細な説明
以下の本発明の実施例の詳細な説明において、添付の図別に符号がつけられており、同じ符号が同様の要素を示しており、本発明を実施する図面、特定の実施例によって示されている。これらの実施例は、当該技術分野の当業者が本発明を実施できるように詳細に記載されている。他方、良く知られている回路、構造、及び技術は、本発明の理解を妨げることがないように、詳細には示していない。従って、下記の詳細な説明は、限定的な意味に取るべきではなく、本発明の範囲は添付した特許請求の範囲によってのみ決まる。

音声録音の中に含まれている情報を保護する装置及び方法について記載する。

図１Ａ、符号１００において、音声認識を使用した、本発明の実施例による音声録音の処理を示す。図１Ａを参照すると、発話できる人が企業エンティティと取り引きをしている。このような取り引きの結果、人と企業エンティティとの会話中に一又はそれ以上の発話が生じる。録音装置を用いて、人と企業エンティティの間の取り引きでなされる発話が音声録音１０２を作成する。音声録音の作成に使用できる装置の一例は、図１Ｂと併せて以下により完全に説明する。ここに使用されているように、「企業エンティティ」という用語は、広義の意味を持ち、多様な形態を呈しており、企業エンティティにより様々な商品やサービスが人に提供される。「企業エンティティ」という用語については、以下により詳しく述べる。

一般的に、人は特有な情報の倉庫であると考えられており；この特有な情報のいくつかは、人と企業エンティティとの取り引きの間に、企業エンティティが所有するようになる。この特有な情報は、個人情報、私的情報、極秘情報、機密情報、秘密情報などと呼ばれる。この特有な情報をラベリングするのに使用される的確な用語は、ここに記載する本発明の実施例を制限しない。

「個人的」、「私的」、「極秘」、「機密」等といったラベルは、様々な設定の中で用いられて、アクセスを制限すべき特有な情報を記載する。あるケースでの特有な情報が他のケースの特有な情報とは同じでないかもしれないということを、更に以下で説明する。従って、どの情報を「特有」と考えるべきなのかは、ユーザによる使用（使用事例）のコンテキストにより定義され、これは本発明の実施例でカバーされている。

上述したように、個人と企業エンティティとの取り引きは、多様な状態で起こり、その中で情報が流れている。個人と企業エンティティとの間の多くのコンタクトは、電話、携帯電話、マイク、コンピュータ、ＶｏＩＰ技術等のような電子的手段を利用した通信コンテキスト内で起こっている。そのような通信システムにより支援されているので、二人、又は一人と自動システムが会話をすることができ、そのような場面では、一方の人又は自動システムが質問を提出し、他方の人又は自動システムが質問に答える。この会話の間に、特有な情報が人から発話され、それは一般的には企業エンティティを代表する別の人又は自動システムからの質問又は入力要求に応じて行われる。企業エンティティを代表する生きている人は、企業エンティティのインタフェースと考えることができる。別の例では、企業エンティティが人間の顧客と取り引きする自動インタフェースを提供する設定で、取り引きが生じている。この設定では、ある人が企業エンティティとコンタクトをとり、その人からの答えを導く一連の質問を提出する自動インタフェース又はシステムインタフェースと対面する。その答えは、その人に関連する特有の情報も含んでいてもよい。

上述した取り引きに続き、結果的に得た音声録音１０２が音声認識プロセス１０４に入力される。音声認識プロセス１０４は、音声録音を処理し、音声録音１０２の音声認識を実行し、テキストとして音声録音の表現を特定言語で生成する。テキストを表示するために使用される言語は、英語、スペイン語、フランス語、オランダ語、ドイツ語等である。ソフトウェアアプリケーションとして販売されている、及び／又は、ソフトウェア／ハードウェア・ソリューションとして販売されている商業的に入手可能な音声認識アルゴリズムを用いて、音声認識処理を実行することができる。このような商業的に入手可能なアプリケーション及びソリューションの例は、ＤｒａｇｏｎＮａｔｕｒａｌｌｙＳｐｅａｋｉｎｇ^ＴＭ８であり、そしてスピーチワークス、ローカス、ニュアンスの製品等も同じである。

認識した音声（テキスト表現）は、符号１０６の同定プロセスに入力され、音声録音１０２で発話されて捕捉された特有な情報の実現値を同定する。特有な情報に対する要求を意味していると考えられる単語のリストは、本発明の様々な実施例における特定の使用事例用にユーザが設定できる。このような単語リストはここではプロンプトリストと呼ばれる。ブロック１０６において、所定の使用事例用に、人がプロンプトリストに応じて発話した特有な情報が、認識済み音声の中で同定されている。

代替的に、入力要求に続く（所定の持続時間の）音声録音の一部を、特有な情報の推定発生位置であると認識することができる。様々な特有な情報の発話が特定時間続くと推測される。このように、発話の持続時間に対する事前の知識を使用して、特有な情報の発話に対応する音声録音の部分を同定することができる。

音声録音の処理は、ブロック１０８で分岐しており、プロンプトリストに応答して発話された個人の特有な情報に対応する音声録音セグメントは、パス１１０の次にあるブロック１１２で不明瞭な状態にされる。人間の特有な情報に対応しない他の音声録音セグメントは、パス１１４に沿ってブロック１１２を迂回する。特有な情報のセグメントは、アナログ又はデジタル形式の音声録音内で、又はテキスト（英数）表現の音声録音内で不明瞭な状況にされる。この変調した音声録音は、１１６で利用可能であり、人間の特有な情報にアクセスできないようにすべき人やエンティティが使用することができる。

音声録音セグメントのブロック１１２での不明瞭な状態は（アナログ又はデジタル形式の音声録音内であろうと、テキスト表現の音声録音内であろうと）、様々な状況で生じ、可逆性の音声録音セグメントもあれば、不可逆性の音声録音セグメントもある。不明瞭な状態になることについては、以下に図と併用してより詳細に説明する。

代替的に、又は、ブロック１０８及び１１２を併用して上述したプロセスに加えて、音声録音はブロック１０９で識別子（メタデータ）と関連づけることができる。この識別子は、特有な情報が音声録音に含まれているか否かのいずれかを示すことができる。識別子は、特有な情報がどのように処理されたのかを示すデータなど、メタデータの様々な要素を含んでいる。例えば、識別子は特有な情報が暗号化されていることや、削除されていること、マスキングされていること等を示すことができる。識別子は音声録音を取得した使用事例、データ所有者、データ管理者等に関連する情報を提供することが可能である。識別子は、音声録音が「クリーン」、すなわち特定の使用事例に関する特有な情報がないことを示すことも可能である。

上述したように、企業エンティティは多様な形態を取ることができる。本発明の実施例は、企業エンティティの形により限定されず、ここで提供した企業エンティティの例は、本発明の実施例を限定するものではない。企業エンティティの例は説明目的でのみ記載されたものであり、本発明の実施例はまだ知られていない企業エンティティにも適用できると考えられる。

例えば、企業エンティティの一形態は顧客に商品及び／又はサービスを提供する小売又は卸売業である。例には、娯楽サービス（ギャンブル、スポーツ等）、フィナンシャルサービス（銀行業、投資等）、電車、飛行機、船等のような運輸プロバイダ業、保険業、ハード商品、ソフト商品、及び、クリーニング、保全等のようなサービス等を含んでいる。もう一つの領域は専門的サービスであり、例えば、患者、クライアント、来訪者等に対し、医療上の、又は法的なサービスを施す組織である。更に別の領域は公的サービスのプロバイダであり、例えば９１１コールで招集される緊急医療サービス、官庁サービス、社会サービスである。社会サービスには、例として保険社会福祉省（ＤＨＨＳ）、保険家族支援省（ＤＨＦＳ）、地域、州、連邦政府のありとあらゆるオフィスや代理店等があるが、これに限定はされない。

上述した各企業エンティティが、使用事例を示し（同じ使用事例を示す企業エンティティもあれば、異なる使用事例を示す企業エンティティもある）、一連の特有な情報を確立している。適用法令と共に、使用事例を論理的に設定することにより、システムのユーザが特有なものであると特定する情報と本発明の適切な実施例のシステムによってアクセスが制限される情報に影響を与える。本発明の実施例は、現在公知の使用事例と公知でない使用事例の両方に適用可能である。ここで使用されているように「使用事例」は広くは、ユーザに関連する特有な情報が取得されている一つのシナリオを意味する。

図１Ｂ、符号１５０において、音声録音１０２（図１Ａ）のように音声録音を生成可能な本発明の実施例による録音システムを示す。図１Ｂを参照すると、第１の個人は音波１５２（音）に表示されるように発話する。音波１５２は、トランスデューサ１５４で受信され、そこで音波１５２はトランスデューサ１５４によって電気信号を発する。一又はそれ以上の実施例では、トランスデューサ１５４はマイクロホンである。トランスデューサ１５４はアナログ信号を発し、これはＡＤコンバータ１５６で受信され、そこで、アナログ信号はデジタル信号に変換される。

音声信号はインタフェース１６０で受信される。インタフェース１６０は電気経路１６６経由でストレージデバイス１６２とコントローラ１６４と電気的に通信する。一又はそれ以上の実施例では、コントローラ１６４は中央処理装置（ＣＰＵ）であり、電気経路１６６はバスであり、そこに接続している構成部品間をデータが流れる。ストレージデバイス１６２はメモリ及び／又はマスストレージ等の一又はそれ以上のストレージデバイスを表す。コントローラ１５８、ストレージデバイス１６２、インタフェース１６０、電気経路１６６はデータ処理システム１５８の部品であってもよい。一又はそれ以上の実施例では、この技術分野では公知であるように、データ処理システム１５８はポータブルコンピュータ、デスクトップコンピュータ、サーバ、パーソナルコンピュータ、専用デジタルレコーダ等といったコンピュータであってもよい。限定されるものではないが、ゲインブロックやフィルタ等の様々なその他の構造をシステム１５０内に含めることが可能であることは当業者には自明である。

符号１５０で示すシステムへの選択的入力を符号１６８で示す。第２の人が音波（音）１７０を発話し、トランスデューサ１７２がこれを捕捉する。トランスデューサ１７２はそこに入射する音波に応じてアナログ電気信号を発する。アナログ電気信号はＡＤコンバータ１７４に入力される。ＡＤコンバータ１７４はデジタル信号を出力し、これはインタフェース１６０に入力される。

記録システム１５０独自の設計に応じて、２つのデジタル音声入力１５７と１７５を、単一の音声録音にまとめることができ、又は記録システム１５０内で互いを分離しておくことも可能である。数多くの代替があり、例えば、いくつかのシステムでは、両方の話者からのアナログ信号が捕捉され、共通のＡＤコンバータに入力される単一のアナログ信号として存在する。単一のデジタル信号は各話者からの寄与を含むアーキテクチャの結果生じる。

更に他の構成では、システム１５０は企業エンティティとの取り引きの一部である個人に対して質問を提起する自動音声信号を作るように設定することが可能である。この場合、自動音声信号のテキスト形式の表現が予め存在し、それ自体としては、音声認識処理を使って、入手する必要はない。

ＡＤコンバータは図１Ｂに示す信号路内の様々な場所に設置できることは当業者には自明である。例えば、ＡＤコンバータをトランスデューサ１５４及び／又は１７２などのトランスデューサの近位側に設置することができる。代替的に、一又はそれ以上のＡＤコンバータをデータ処理システム１５８内に設置するようにしてもよい。

図２、符号２００には、本発明の実施例による音声録音の処理ステップを示す。図２を参照すると、音声録音は符号２０２でデータ処理システムに入力される。一又はそれ以上の実施例では、データ処理システムは図１Ｂに符号１５８で示されているように構成することができるが、データ処理システムは音声録音の生成に必要な機能を有する必要はない。

２人の話者の音声ストリームを結合して音声録音を生成し、２人の話者の内の１人が正規の話者で、他方の話者は、ほとんどの部分が各音声録音について異なっている（任意の発信者におけるような）状況においては、ブロック２０４でトレーニングを行って、正規の話者を認識させて、音声認識アルゴリズムにより高度な解釈精度にする。上述したように、取り引きは企業エンティティのインタフェースと、この取り引き間にビジネスと相互作用がある人との間に生ずる。このような取り引きによりプロンプトリストを構築する特有な情報の集まりが特定される。一実施例においては、プロンプトリストは「口座番号」、及び「個人識別番号」又は「ＰＩＮ」を含むものであってもよい。

ブロック２０４に併せて述べたトレーニングに続いて、音声録音２０２を処理して、ブロック２０８で正規の話者に関連する音声録音の部分を同定することができる。同様に、企業エンティティと相互作用している人によって発せられた音声録音部分が、ブロック２０８において同定されている。一又はそれ以上の実施例では、話者の同定を選択的に行って、企業エンティティ（正規の話者）に対応する音声録音部分を同定している。この人に特有な情報を発するように入力要求するのは、通常企業エンティティなので、これは、プロンプトリストの要素に対応する音声録音部分を正確に同定する見込みを増やすために行われる。これらの音声録音の同定部分を使用して、音声録音が二人の話者に対応するストランドに分ける。プロンプトリスト候補（企業エンティティに対応するストランド内にある）を次いでブロック２１０で処理して、特に重要な使用事例に関するプロンプトリストの要素に対応する候補を検索する。

プロセスの間に様々な定量分析を適用し、どのプロンプトリスト候補が実際のプロンプトリストの員であるかを設定することができる。例えば、もし、「社会保障番号」が特有な使用事例用のプロンプトリストの要素であれば、その場合は、プロンプトリスト候補を「社会保障番号」と比較して、数値スコアをプロンプトリスト候補に割り当てることができる。数値スコアはプロンプトリスト候補とプロンプトリストの要素との間で正しくマッチングさせるためのしきい値と比較する。しきい値を上回るスコア結果は、正しいマッチングを示し、しきい値を下回るスコアはマッチングしていないことを示す。代替的に、音声録音全体を（話者の同定プロセスなしに）テキスト形式に翻訳してもよく、結果としてのテキストは上述したようにプロンプトリストと比較される。ここで、スコアが会話部分に割り当てられ、しきい値がプロンプトリスト候補とプロンプトリストの要素との間にマッチングを構築する。

ブロック２１２において、プロンプトリスト上にある項目に従った特有な情報が同定される。同定は期待値と翻訳した値を比較することによって処理できる。例えば、「社会保障番号」の入力要求は、入力要求の後に続く音声録音部分にある９桁又は最小桁数を有する発話をもたらす。「社会保障番号」の入力要求の後に続く音声録音が処理される。その処理の結果、数字の発話の同定があれば、特有な情報の見込みのある発話がある可能性が高い。逆に処理の結果、文字の同定があれば、その時は可能性が低い。プロンプトリスト要素に対するスコアと、結果としての特有な情報の見込みのある発話が組み合わされて、一定のしきい値より上の結果が特有な情報の発話を同定したということになる。

代替的に、同定は、同定された入力要求に続く音声録音部分に対応する。例えば、クレジットカード番号入力の入力要求に続く、次の１０秒間の音声録音は入力要求に応答する特有な情報の発話であると推定できる。別の例では、社会保障番号の入力要求に続く、次の１５秒間の音声録音は特有な情報の発話位置であると推定できる。従って、様々な実施例において、特有な情報は音声認識アルゴリズムを使用して翻訳することにより、又は、特有な情報項目の入力要求に続く、特有な情報の発話に必要となる妥当な時間を見積もることにより同定される。

ブロック２１４では、テキストに同定された要素又は前記人により発話された特有な情報に対応する数値が不明瞭な状態になる。このように同定された特有な情報の発話位置にある元の音声録音セグメントの上からマスキング信号を録音することにより、不明瞭な状態にすることができる。一つの例では、ノイズ信号（ホワイトノイズ、ピンクノイズ、信号音、振幅ゼロの信号（消去）、等）を音声録音セグメントの上から録音し、特有な情報を不明瞭な状態にする。別の例では、特有な情報の発話に対応する音声録音セグメントを暗号化し、特有な情報を不明瞭な状態にする。暗号化は必要があれば、キーを用いて反転（復号）することが可能である。暗号化と復号化については、以降の図において以下にさらに詳述する。

音声録音のアナログ表現又はデジタル表現のいずれかを処理し、そこに含まれる特有な情報を不明瞭な状態にすることができることに留意されたい。さらには上述したように、音声録音のテキスト表現を処理し、そこに具わる特有な情報のセグメントに対応するテキスト要素を不明瞭な状態にすることができる。

代替として、又はブロック２１４と併せて説明したプロセスに加えて、ブロック２１３で音声録音に識別子を付けることも可能である。識別子は、音声録音中に特有な情報があるか否かのいずれかを表すことができる。様々な実施例では、識別子を設けて、図１Ａのブロック１０９に併せて上述した機能を提供することができる。

一方、又は上述した方法と併せて、音声録音が捕捉されている時に音声録音内に「マーカ」を置くことによって、話者の同定を行うことができる。企業エンティティに関連する音声により、「マーカ」の挿入をトリガすることができる。「マーカ」をシステムで使用して、プロンプトリスト候補を同定し、又、特有な情報の発話に対する検索に焦点を合わせることもできる。例えば、このような「マーカ」は、可聴範囲上にあるが、音声録音を捕捉するのに使用するシステムの帯域内にあるような音声録音に添加される音であってもよい。「マーカ」を、選択された話者に対応する音声録音部分の全体に、あるいはそれに関連する部分の始点及び／又は終点に配置することができる。

図３、符号３００において、終点を用いて本発明の実施例による音声録音を処理している。図３を参照すると、ブロック３０２で音声録音（音声信号）が入力される。ブロック３０４では、音声録音内部で終点が同定されている。終点は音声録音内のポーズを探すというような、当該技術分野における当業者に公知である様々な方法で同定できる。ポーズは単語の間又は文の間に生ずるような、ある時間内に存在する低レベル信号として同定できる。終点を利用することにより、ブロック３０６で音声信号をセクションに分割することができる。音声信号はブロック３０８で処理され、ここで音声認識を用いて、音声信号のセクションをテキスト要素に翻訳する。

ブロック３０８から得られるテキスト要素は、ブロック３１０で処理され、プロンプトリスト候補を同定する。そのプロンプトリストの候補がプロンプトリストの要素であるかを同定するように、対象の使用事例に対応するプロンプトリストと、プロンプトリスト候補は比較される。プロンプトリストの同定された要素は、音声録音部分を設定し、ここでは特有な情報の発話の入力要求は企業エンティティのインタフェースによって生成される。入力要求に続く音声録音部分は先の図と併せて上述したように、特定の入力要求に適用可能なロジックに従って分析される。

ブロック３１２では、特有な情報の発話に対応する音声録音部分が、音声録音部分に関する同定信頼度が設定したしきい値に合致する決定に続いて、不明瞭な状態になされる。入力要求に対応する音声録音部分及び特有な情報の発話に対応する音声録音部分に関連するスコアのような評価基準を用いて、同定信頼度（スコア）が設定される。特有な情報の所定の瞬間に関する同定信頼度（スコア）をしきい値と比較する。スコアがしきい値を越えていれば、特有な情報の発話に対応する音声録音部分を処理し、その音声録音部分を不明瞭な状態にする。

ブロック３１４では、音声録音を処理して、特有な情報を不明瞭に状態にし、ここで、音声録音内部に以前から含まれていた特有な情報を受信することが許可されないエンティティ（個人、企業等）へ送信するのに適した状態になる。

代替として、又はブロック３１２及び３１４と併せて説明したプロセスに加えて、ブロック３１１で音声録音を識別子に関連させることができる。この識別子は、特有な情報が音声録音内に含まれているか否かを表すことができる。様々な実施例では、図１Ａのブロック１０９に併せて上述した機能を提供するように識別子を構成することができる。

図４Ａは、符号４００で、本発明の一実施例による音声信号４１４のアナログ表現を表示する。図４Ａを参照すると、音声信号のアナログ表現は複数部分、すなわち第１の部分４０６、第２の部分４０８、第３の部分４１０、第ｎの部分４１２まで（これを含む）の部分で表される。軸４０２は音声信号４１４の振幅を表し、軸４０４は時間を表す。

音声信号４１４は特有な情報の入力要求と特有な情報の発話との両方を含んでいてもよく、あるいは、音声信号４１４は特有な情報の入力要求又は特有な情報の発話のいずれかを含んでいても良い。音声信号４１４に含まれる情報は、音声信号が得られた及び／又は処理された方法に依存する。先の図において上述したとおり、音声信号４１４はＡＤコンバータによりデジタル信号に変換され、次いで音声信号（音声録音）のデジタル表現がデータ処理システムに入力される。部分４０６、４０８、４１０、４１２は特有な情報の入力要求、特有な情報の発話、又は対象の使用事例に関連する音声録音のその他の部分を表している。

先の図において上述したように、音声録音はデータ処理システムによって処理され、不明瞭な状態にされたセグメントを含む音声録音を得ることができる。その他の実施例では、上述の方法及び装置を用いて音声録音を処理することができ、次いで、結果が表示され、セグメントを不明瞭な状態にするかどうか、及び／又は、音声録音に識別子を付けるかどうかの最終的な決定をオペレータが行うことができる。このような決定は、データ処理システムとこのシステムと併用するように構成されたユーザインタフェースを用いて行うことができる。

図４Ｂの、符号４２５は、音声録音を処理するユーザインタフェースの一実施例を示す。図４Ｂを参照すると、データ処理システムの情報ディスプレイ上で見ることができ、アクセスすることが可能なユーザインタフェース４２６が示されている。当該技術分野の当業者に認識されているように、情報ディスプレイは陰極線管（ＣＲＴ）フラットパネルディスプレイ、タッチスクリーン等であってもよい。本発明の実施例はオペレータにユーザインタフェースを提供する情報ディスプレイによって制限されない。

音声録音中に含まれている特有な情報の発話４２８を処理して、翻訳をユーザインタフェース４２６のフィールド４３０に表示する。フィールド４３０に示されるテキスト形式の表示は「ＶＩＳＡ」である。処理コントロール４３２，４３４，４３６を処理することにより、オペレータがテキスト表示「ＶＩＳＡ」を含む位置に対応する音声録音部分を処理することができる。コントロール４３２は「消去」機能を実行し、コントロール４３６は「暗号化」機能を実行し、そしてコントロールボタン４３４はテキスト「ＶＩＳＡ」が事前に暗号化されていれば、「復号化」機能を実行する。

同様に、音声録音中に含まれるもう一つの特有な情報の発話４３８を処理して、翻訳をユーザインタフェース４２６のフィールド４４０に表示する。フィールド４４０に示すテキスト表示は「４７９１２３５６」である。プロセスコントロール４４２、４４４、４４６によって、オペレータはテキスト表示「４７９１２３５６」を含む位置に対応する音声録音部分を処理することができる。コントロール４４２は「消去」機能を実行し、コントロール４４６は「暗号化」機能を実行し、コントロール４４４はテキスト「４７９１２３５６」が事前に暗号化されていれば、「復号化」機能を実行する。

音声録音中に含まれる更に別の特有な情報の発話４４８を処理して、翻訳をユーザインタフェース４２６のフィールド４５０に表示する。フィールド４５０に示すテキスト形式の表示は「Ｊｕｎｅ２００８」である。プロセスコントロール４５２、４５４、４４６を処理することにより、オペレータはテキスト表示「Ｊｕｎｅ２００８」を含む位置に対応する音声録音部分を処理することができる。コントロール４５２は「消去」機能を実行し、コントロールボタン４５４は「暗号化」機能を実行し、コントロールボタン４５６はテキスト「Ｊｕｎｅ２００８」が事前に暗号化されていれば、「復号化」機能を実行する。

使用事例に応じた特有な情報の発話を表示するユーザインタフェースを利用して、オペレータはこの使用事例に関連する論理的状況に基づき決定を行い、それに応じて特有な情報を処理することができる。例えば、フィールド４３０、４４０、４５０に示される特有な情報はクレジットカードの特有な情報と論理的に関連する。従ってこのグループを観察することにより、オペレータは特有な情報がシステムにより適切に取り出されていると判断を下すことができ、前述のようにオペレータは特有な情報を処理することができる。

代替的に、又は図４Ｂと併せて上述したプロセスに加えて、オペレータはコントロール４５８を利用して、音声録音に識別子を付することができる。前記識別子は、特有の音声録音が特有の情報を具えている、具えていない、又は処理済みの特有の情報を具えているという情報を提供するよう機能する。様々な実施例で、識別子は、図１Ａにおけるブロック１０９に併せて上述した機能を提供するように構築できる。

特有な情報の発話が生じた際に、人によって発せられた正確な単語又は正確な番号を不明瞭な状態にする必要性が常にあるとは限らないことに留意されたい。例えば、フィールド４４０に示された番号がクレジットカードの口座番号を構成する全ての番号を含んでいないかもしれない。現在はクレジットカードの口座番号は１６桁であるが、フィールド４４０には８桁が表示されており、特有な情報の部分的な取得を表している。しかし、いくつかの使用事例においては、部分的な取得によって、十分な情報を提供でき、不明瞭な状態にする際に、この例の場合はクレジットカード（ＶＩＳＡ）の口座番号である特有な情報の項目を構造的に不明瞭な状態にする。

その他の使用事例では異なる状況にある。例えば、特有な情報の項目が個人名である医療サービスでの利用においては、音声録音内の特有な情報をより大きく局在化することが求められることがある。このような場合、他の図とともに上述した、スコア評価に別のしきい値を用いることができる。音声録音を捕捉する方法、各話者に対する別々の音声チャンネル、話者の同定、終点配置の変形等といった、その他の技術も使用される。

図５の、符号５００は、本発明の実施例による音声録音の再処理を説明する。上述したように、音声録音を処理し、特有な情報の発話に対応する音声録音中の位置を不明瞭な状態にする。可逆処理を用いて、音声録音部分を不明瞭ににするときに、音声録音のこれらの部分を再処理して、この部分を明瞭にする。可逆処理はキーを用いて実行される暗号化などのプロセスであり、復号化を実行し、既に暗号化されている元の情報を復元することができる。キーを利用した暗号化／復号化のプロセスは当該技術分野の当業者に公知であり、ここに述べた様々な実施例の中で用いられている。

図５を参照すると、音声録音の再処理は符号５００で２つのエンティティ、エンティティ１とエンティティ２に関連して記載されている。エンティティ１とエンティティ２は音声録音内部に含まれる情報に対して異なる関係を有している。上述したように、音声録音５０２は人と企業エンティティのインタフェース間の取り引きにより得られる。音声録音５０２はエンティティ１がアクセス権を有する特有な情報を含むが、この説明の目的で、エンティティ２は特有な情報に異なる関係を有している。一又はそれ以上の実施例では、特有な情報に対するエンティティ２の関係は、エンティティ１が有するアクセス権よりも少ないアクセス権を有するエンティティである。本例においては、特有な情報はブロック５０４で不明瞭な状態になる。ブロック５０６は、特有な情報が音声録音中で明瞭であり、かつ、音声録音中の特有な情報がエンティティ１の制御又は作用下にある一般的な領域を同定する。音声録音がブロック５０６の外部に流れるときに、特有な情報はブロック５０８でエンティティ２に届く前に不明瞭な状態になる。

ブロック５０８で、エンティティ２は処理済みの音声録音を受信する。エンティティ２は様々な方法に処理済みの音声録音を用いることができる。例えば、限定はされないが、この方法の中には処理済みの音声録音の分析、商品又はサービスの注文の履行等がある。処理済みの音声録音を分析することには様々な目的があり、具体的には提供されたサービスの質を確立する目的、特有な情報を発する個人との取り引きに使用する企業エンティティのインタフェース能力を評価する目的等が挙げられる。

エンティティ２は処理済みの音声録音を、再処理する必要があると判断するかもしれない。例えば、処理済みの音声録音の不明瞭な部分の問題が、符号５０９にみられる。初期処理中にあまりにも多くの音声録音を不明瞭な状態にした、又は初期処理中にあまりにも少なく音声録音を不明瞭にしたという、このような場合、処理済みの音声録音はブロック５１４でエンティティ１に戻され、ブロック５０４での再処理を求める。可逆処理を使用して、問題を有する音声録音部分を処理する場合は、エンティティ１は処理を逆にして適切な処置を行い、不明瞭にした音声録音部分に伴う問題を補正する。適切な処置には様々な処理パラメータを伴う問題において音声録音部分を再処理することが含まれる。例えば、様々な処理パラメータは入力要求と特有な情報の発話を検出する様々なしきい値、特有な情報を同定するための推定信頼度を作るための調整済みパラメータ、話者同定のアプリケーション、又は音声録音への終点分析などである。

再処理済みの音声録音はブロック５０８でエンティティ２へ送り戻される。更に再処理する必要がなければ、音声録音はパス５１０を通って、ブロック５１２へ送られ、ここでエンティティ２は処理済み又は再処理済みの音声録音を操作することができる。操作は上述したように対象の使用事例によって変更できる。

エンティティ２は音声録音に対して多様な役割を果たしている。具体的にはエンティティ１の代理人又は請負業者があるが、これに限定はされない。エンティティ２は、エンティティ１とエンティティ２の間の関係に依存して、音声録音内に含まれる特有な情報へのアクセスの度合が様々である。

上述した構成において、エンティティ１は処理（暗号化／復号化）に用いるキーの管理を維持する。エンティティ２の特有な情報に対する様々な又は限定された関係のために、エンティティ２はキーへのアクセスを有しておらず、音声録音を再処理することができない。このような構成により、セキュリティと音声録音に含まれる特有な情報へのアクセス制限を提供する。エンティティ１は、エンティティ３（図示せず）のような他のエンティティに音声録音を再処理する権限を与えることが可能であることに留意されたい。この場合には、第三者に音声録音を処理（暗号化／復号化）するのに必要なキーを預けることができる。

図６は、符号６００で、本発明の実施例による情報と価値の流れを示す。図６を参照すると、６０２に示すエンティティＡは、エンティティＡの制御下で特有な情報を含む音声録音６０１を有している。上述したように、特有な情報は、極秘情報、秘密情報、個人情報等であり、一般的には全てのエンティティがアクセス又は所有するのは適切又は合法的でないと考えられる情報である。この特有な情報はブロック６０８で不明瞭な状態にされる。

代替的に、符号６０４で示すエンティティＢは音声録音６１２を処理し、そこに含まれる特有な音声を不明瞭な状態にすることができる。いくつかの実施例では、（先の図と併せて上述したように）エンティティＢが特有な情報を含む音声録音と識別子を関連づけることもある。場合によっては、識別子が音声録音にマーキング又はフラグを付けて、それによって、音声録音に含まれる特有な情報を不明瞭にすることなく、特有な情報を通知することもある。前記マーキングは、音声録音が「クリーン」であり、特有な情報を含んでいない旨を通知することもできる。情報はエンティティＡ６０２からエンティティＢ６０４へパス６１０を経て流れる。値６１６はエンティティＡ６０２からエンティティＢ６０４へ流れて、エンティティＢ６０４により音声録音上で実行される処理を補償することができる。一又はそれ以上の実施例では、値６１６はデビット又はクレジットの形式をとっており、エンティティＢ６０４によって提供されるサービスと引き替えに送信される。デビットの一例は、何を借りているかを示すインボイス又は請求書であり、クレジットの一例は、有価約因形式の支払いである。

処理済みの音声録音はエンティティＢ６０４から様々なパスを経由してエンティティＣ６０６及び／又はエンティティＡ６０２のような一又はそれ以上のエンティティへと流れる。処理済みの音声録音は情報６１４として符号６０６のエンティティＣへ流れる。エンティティＣ６０６は前述したように処理済みの音声録音上で操作を実行することができる。操作は上述したように対象の使用事例によって変化する。このような操作は顧客−代理人間の取り引き中に代理人によって提供されるサービスの質の分析を実行すること等を含むがそれに限定されない。音声録音上で、エンティティＣ６０６により実行される操作からの出力は、サービス６２６としてエンティティＡ６０２に流れる。エンティティＣ６０６はデータ管理者として機能し、それによって処理済みの音声録音のストレージを提供している。処理済みの音声録音６１２は情報６１５としてエンティティＡ６０２に流れる。

処理済みの音声録音は情報６２４として、エンティティＡ６０２からエンティティＣ６０６へ流れる。前述したようにエンティティＣは処理された音声録音上で操作を実行することができる。値６２０はエンティティＡ６０２からエンティティＣ６０６へ流れて、エンティティＣ６０６により提供されるサービス６２６の出力はサービス６２６としてエンティティＡ６０２に流れる。エンティティＣ６０６によって与えられるサービスと引換に、値６２０は、エンティティＡ６０２からエンティティＣ６０６へ流れる。

本発明の実施例について論じ、これを理解する目的で、当該技術分野の当業者は様々な用語を用いて、技術やアプローチを説明することを理解すべきである。更に、本明細書において、説明のために多数の詳細事項を説明し、本発明の完全な理解を提供している。しかし、当該技術分野の当業者は、本発明をこれらの詳細情報なしに実行できることは明白である。いくつかの場合、公知の構造やデバイスは、詳細にではなく、ブロック図形式で示されており、本発明を曖昧にするのを避けている。これらの実施例は、当該技術分野における当業者が本発明を実行できるよう詳しく記載されており、その他の実施例が利用可能であることや、論理的変更、機械的変更、電気的変更、その他の変更は本発明の範囲を逸脱することなく行うことが可能であると理解すべきである。

本明細書のいくつかの部分では、例えばコンピュータメモリ内のデータビット操作のアルゴリズム及び象徴的表象の用語で表現している。前記アルゴリズム的な説明や表現は、データ処理技術分野の当業者によって使われる手段であり、当該技術分野の当業者以外の者へ、彼らの仕事の実体を最も効果的に伝える手段である。ここではアルゴリズムは一般的には、つじつまの合う、所望の結果を導く行為のシーケンスであると考えられている。この行為は、物理量の物理的操作を必要とするものである。必ずしも必要ではないかもしれないが、通常は、上記物理量は電気又は磁気信号の形をとり、保管、転送、結合、比較、その他の操作が可能である。上記信号をビット、値、要素、記号、文字、用語、数字等で呼ぶことは、原理的に共用する理由がある場合には、時に便利であることが分かっている。

しかし、これらの用語、又は同じような用語は全て、適宜の物理量に関連づけるべきであること、及びこれらの物理量に適応する便利なラベルにすぎないことに留意すべきである。そうしないとこの記載から特に明白に述べられていない限りは、本明細書の中で、「処理」、「演算」、「計算」、「決定」、「表示」等の用語を用いた考察が、コンピュータシステム又は同様の電子演算システムの動作や処理を意味し、このコンピュータシステム又は同様の電気演算システムは、コンピュータシステムのレジスタ内の物理（電子）量として表現されるデータを操作及び変換し、そして同様に、コンピュータシステムのメモリ又はレジスタ又はその他の情報ストレージ、伝達デバイス、ディスプレイデバイス内の物理量として表される他のデータに記憶することは明らかである。

ここに示す操作を実行する装置は本発明を実装することができる。この装置は、要求される目的に応じて特別に作ることができ、又、一般用途のコンピュータを具えてもよく、コンピュータに保存されているコンピュータプログラムによって選択的に起動、再設定できる。このようなコンピュータプログラムは、コンピュータで読取可能な記憶媒体に保管できる。具体的には、この媒体はフロッピーディスク、ハードディスク、光ディスク、コンパクトディスク読み出し専用記憶（ＣＤ−ＲＯＭｓ）、光磁気（ＭＯ）ディスクを含む任意のタイプのディスク、読み取り専用メモリ（ＲＯＭｓ）、ランダムアクセスメモリ（ＲＡＭｓ）、電気的プログラマブル読取り専用メモリ（ＥＰＲＯＭｓ）、電気的消去書込み可能読出し専用メモリ（ＥＥＰＲＯＭｓ）、フラッシュメモリ、磁気及び光学カード等、あるいはコンピュータのローカル又はリモート電子マニュアルを保管するのに適した任意のタイプの媒体などであるが、これらに限定はされない。

ここに呈示したアルゴリズム及びディスプレイは、特殊コンピュータ又はその他の装置とは本質的に関係がない。様々な汎用システムではここに教示したことに従ってプログラムを使用でき、又、より特化された装置を構築して要求された方法を実行するのに便利である。例えば、本発明に従った方法はいずれも、汎用プロセッサをプログラミングすることによって、又は、ハードウェアとソフトウェアの組合せによって、ハードワイヤ回路内で実行できる。当業者には、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースの又はプログラム可能な大衆消費電子製品、デジタル信号処理装置（ＤＳＰ）、セットトップボックス、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ等を含む、ここに記載された以外のコンピュータシステム構成で本発明を実行できることは自明である。本発明は通信ネットワークでつながれた遠隔処理デバイスによってタスクを実行する分散計算処理環境においても実行可能である。

本発明の方法はコンピュータソフトウェアを使用して実行することができる。公認標準規格に合致したプログラミング言語で書かれているならば、この方法を実行するように設計された指示シーケンスは様々なハードウェアプラットフォームで実行できるように、そして様々なオペレーティングシステムのインタフェースで接続できるようにコンパイルできる。加えて、本発明は特別なプログラミング言語を参照した記載をしていない。様々なプログラミング言語を使用して、ここに記載された本発明の教示を実行できることは明らかである。さらに、一の形式又は別の形式（例えば、プログラム、手順、アプリケーション、ドライバ…）において、処理を実施して結果が生ずるようなソフトウェアの話は当該技術分野においては通常のことである。上述した表現は、コンピュータによってソフトウェアを実行することによりコンピュータのプロセッサが処理を実施又は結果を生成することを述べる簡単明瞭な手段にすぎない。

様々な用語及び技術が、通信、プロトコル、アプリケーション、実施、メカニズム等を記載するのに当該技術分野の当業者によって使われていることを理解すべきである。これらの技術の一つは、アルゴリズムや数学的表現の観点から技術の実装を記述することである。換言すれば、例えば、技術をコンピュータ上の実行コードとして実装できる一方で、この技術の表現を公式、アルゴリズム、又は数学的表現としてより適切かつ簡単に伝達、又は連絡することができる。従って、当該技術分野の当業者は、Ａ＋Ｂ＝Ｃを示すブロックが、加法関数であると認識でき、ハードウェア及び／又はソフトウェアにおける加法関数の実装は、２つの入力（Ａ及びＢ）を受け取って、合計出力（Ｃ）を生成することを認識できる。このように記述として、公式、アルゴリズム又は数学的表現を使用することを、少なくともハードウェア及び／又はソフトウェア（例えば、本発明の技術が一実施例として実行でき、実装できるコンピュータシステム）内の物理的実施例を有することとして理解すべきである。

ある機械的に読取可能な媒体は、機械（例えば、コンピュータ）によって読取可能な形式で情報を保管又は送信する何らかのメカニズムを具えると理解される。例えば、機械的に読取可能な媒体は、読み取り専用メモリ（ＲＯＭ）；ランダムアクセスメモリ（ＲＡＭ）；磁気ディスク記憶媒体；光記憶媒体；フラッシュメモリデバイス；電気的、光学的、音響的、又はその他の伝送信号（例えば、搬送波、赤外線信号、デジタル信号等）等を含む。

本明細書で使用したように、「一実施例」又は「ある実施例」又は同様のフレーズは、記載した特徴が少なくとの本発明の一実施例に含まれていることを示している。本明細書の「一実施例」の参照は、必ずしも同じ実施例の参照であるとは限らない。しかし、これらの実施例が互いに排他的であることはないし、「一実施例」が本発明の実施例が一つだけであることを示しているわけでもない。例えば、「一実施例」に記述された特徴、構造、動作等が他の実施例に含まれることもある。従って、本発明はここに記載された実施例の様々な結合及び／又は統合を具えていてもよい。

本発明はいくつかの実施例に関して記載されているが、当該技術分野の当業者は本発明が記載された実施例に限定されることなく、特許請求の範囲の精神及び領域内で改良及び変更の実施が可能であることを認識できる。従って、本記載は限定ではなく実例であるとみなすべきである。

本発明は以下の詳細な説明と本発明の実施例を説明するための添付図面を参照することにより最も良く理解することができる。本発明は実施例中の例により説明されているが、添付図面の図に限定されない。ここでは同じ要素には同じ符号を付している。
図１Ａは、本発明の実施例による音声認識を使用した音声録音の処理を示す。図１Ｂは、本発明の実施例による録音システムを示す。図２は、本発明の実施例による音声録音の処理を示す。図３は、本発明の実施例による終点を使用した音声録音の処理を示す。図４Ａは、本発明の一実施例による音声信号のアナログ表現を示す。図４Ｂは、音声録音の処理のユーザインタフェースの一実施例を示す。図５は、本発明の実施例による音声録音の再処理を示す。図６は、本発明の実施例による情報の流れを示す。

Claims

データ処理システム内へ音声録音をロードするステップであって、前記音声録音は人と企業エンティティのインタフェースとの間の取引中の人の発話から生じるものであるステップと；
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理するステップと；
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すものかどうかを検出するステップと；
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合に、前記音声録音のセグメントを不明瞭な状態にするステップと；
を具えることを特徴とする方法。
請求項１に記載の方法において、前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする方法。
請求項１に記載の方法において、前記特有な情報が社会保険番号、個人識別番号（ＰＩＮ）、金融口座番号、名前、住所からなる群から選択されることを特徴とする方法。
請求項１に記載の方法において、前記特有な情報がユーザによって定義されることを特徴とする方法。
請求項１に記載の方法において、前記不明瞭な状態にするステップが前記セグメントの暗号化であることを特徴とする方法。
請求項１に記載の方法において、前記不明瞭な状態にするステップが前記セグメントのマスキングであることを特徴とする方法。
請求項１に記載の方法において、前記不明瞭な状態にするステップが前記セグメントの消去であることを特徴とする方法。
請求項１に記載の方法において、前記企業エンティティの前記インタフェースが生きている人であることを特徴とする方法。
請求項１に記載の方法において、前記企業エンティティの前記インタフェースが自動工程であることを特徴とする方法。
請求項１に記載の方法において、前記処理するステップがさらに：
音声録音を第１のストランドに分けるステップであって、前記第１のストランドが前記人に対応するステップと；
音声録音を第２のストランドに分けるステップであって、前記第２のストランドが前記企業エンティティの前記インタフェースに対応するステップ；
を具えることを特徴とする方法。
請求項１に記載の方法が、さらに：
契約関係の下で実行されるステップであり、前記契約関係が、前記ロード、前記処理、前記検出、又は前記不明瞭な状態にするステップのうちの少なくとも１つと引換に、データ管理者が前記企業エンティティから値を受け取る条件を有するステップ；
を具えることを特徴とする方法。
請求項１に記載の方法において、前記音声録音をアナログ形式で保管することを特徴とする方法。
請求項１に記載の方法において、前記音声録音をデジタル形式で保管することを特徴とする方法。
請求項１に記載の方法において、前記不明瞭な状態にするステップをテキスト表示した前記音声録音で実行することを特徴とする方法。
請求項１に記載の方法が、さらに：
前記音声録音に識別子を関連付けるステップであって、当該識別子が前記検出に基づくものであり、当該識別子が前記人に関連する特有な情報に関連する情報を伝達するステップを具えることを特徴とする方法。
データ処理システム内へ音声録音をロードするステップであって、前記音声録音が人に関する特有な情報を含む少なくとも一のセグメントを不明瞭な状態にするように処理済みであり、前記音声録音が前記人と企業エンティティとの間の取引中の前記人の発話から生じたものであるステップと；
前記音声録音を再処理し、不明瞭な状態にされた少なくとも一のセグメント部分を調整するステップ；
を具えることを特徴とする方法。
請求項１６に記載の方法において、復号化を実行する前記再処理中にキーを使用することを特徴とする方法。
請求項１６に記載の方法において、暗号化を実行する前記再処理中にキーを使用することを特徴とする方法。
請求項１６に記載の方法において、前記企業エンティティの前記インタフェースが生きている人であることを特徴とする方法。
請求項１６に記載の方法において、前記企業エンティティの前記インタフェースが自動工程であることを特徴とする方法。
情報ディスプレイと；
ストレージデバイスと；及び
前記ストレージデバイスから音声録音を読み取り、前記音声録音が人と企業エンティティとの間の取引中の前記人の発話から生じるものであり；
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理し；
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すかどうかを検出し；
前記テキストの少なくとも一要素を、前記情報ディスプレイ上に表示し；
ユーザから命令を受け取り、当該命令は前記テキストの少なくとも一要素上の処理を起動するものである；
ようにプログラムされたプロセッサと；
を具えることを特徴とする装置。
請求項２１に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを消去することを特徴とする装置。
請求項２１に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントをマスキングすることを特徴とする装置。
請求項２１に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを暗号化することを特徴とする装置。
請求項２４に記載の装置において、前記命令が前記テキストの少なくとも一要素に対応する前記音声録音内の前記セグメントを復号化することを特徴とする装置。
請求項２１に記載の装置が、さらに；
データ管理者を具え、当該データ管理者が前記企業エンティティとの第１の契約関係を有し、当該第１の契約関係が、前記企業エンティティが請求項２１に記載のようにプログラムされた前記プロセッサの操作に応じて、前記データ管理者に値を送信するという条件を有する；
ことを特徴とする装置。
人から音声信号を受信するステップと；
企業エンティティのインタフェースから音声信号を受信するステップと；
前記人からの前記音声信号及び前記企業エンティティの前記インタフェースからの前記音声信号のうちの１つにマーカをオーバレイするステップと；
前記マーカを利用して、前記人についての機密情報に対応する少なくともテキストの一要素を同定するように前記音声信号を処理するステップと；
を具えることを特徴とする方法。
請求項２７に記載の方法において、音を前記マーカとして用いることを特徴とする方法。
請求項２７に記載の方法において、前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする方法。
請求項２７に記載の方法において、前記特有な情報が社会保険番号、個人識別番号（ＰＩＮ）、金融口座番号、名前、住所からなる群から選択されることを特徴とする方法。
請求項２７に記載の方法において、前記特有な情報がユーザによって定義されることを特徴とする方法。
請求項２７に記載の方法が、さらに：
契約関係の下で実行するステップを具え、当該契約関係が、前記人からの音声信号の前記受信、前記企業エンティティからの前記音声信号の前記受信、前記オーバレイ、又は前記利用のうちの少なくとも１つと引換に、データ管理者が前記企業エンティティから値を受け取る条件を有することを特徴とする方法。
データ処理システムで実行されるときに、前記データ処理システムに：
データ処理システム内へ音声録音をロードするステップであって、前記音声録音は前記人と企業エンティティとの間の取引中の人の発話から生じるものであるステップと；
前記音声録音内のテキストの少なくとも一要素を認識するように前記音声録音を処理するステップと；
前記テキストの少なくとも一要素が、前記人に関する特有な情報を表すかどうかを検出するステップと；
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合、前記音声録音内のセグメントを不明瞭な状態にするステップと；
を具える方法を実行させる実行可能なコンピュータプログラムインストラクションを含む、コンピュータで読取可能な媒体。
前記特有な情報が極秘情報、機密情報、私的情報からなる群から選択されることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記特有な情報が社会保険番号、個人識別番号（ＰＩＮ）、金融口座番号、名前、住所からなる群から選択されることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記特有な情報がユーザによって定義されることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記不明瞭な状態にするステップが前記セグメントの暗号化であることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記不明瞭な状態にするステップが前記セグメントのマスキングであることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記企業エンティティの前記インタフェースが生きている人であることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
前記企業エンティティの前記インタフェースが自動工程であることを特徴とする請求項３３に記載のコンピュータで読取可能な媒体。
請求項３３に記載のコンピュータで読取可能な媒体において、前記方法がさらに：
音声録音を第１のストランドに分けるステップであって、前記第１のストランドが前記人に対応するものであるステップと；
音声録音を第２のストランドに分けるステップであって、前記第２のストランドが前記企業エンティティの前記インタフェースに対応するものであるステップと；
を具えることを特徴とする媒体。
請求項３３に記載の前記のコンピュータで読取可能な媒体において、前記不明瞭な状態にするステップに続いて、前記音声録音をアナログ、デジタル、及びテキスト形式からなる群から選択された形式で保存することを特徴とする媒体。
音声録音を保存する手段であって、前記音声録音は人と企業エンティティとの間の取引中の人の発話から生じるものである手段と；
テキストの少なくとも一要素を認識するように音声録音を処理する手段と；
前記テキストの少なくとも一要素が、前記人に関連する特有な情報を表すかどうかを検出する手段と；及び
前記テキストの少なくとも一要素が前記人に関する特有な情報である場合に、前記テキストの少なくとも一要素に対応する前記音声録音中のセグメントを不明瞭な状態にする手段と；
を具えることを特徴とする装置。
請求項４３に記載の前記装置が、さらに：
前記音声録音を少なくとも２つのストランドに分ける手段；
を具えることを特徴とする装置。
請求項４３に記載の前記装置が、さらに：
前記音声録音に識別子を関連付ける手段を具えることを特徴とする装置。
データ処理システム内へ音声録音をロードするステップであって、前記音声録音が前記人と企業エンティティとの間の取引中の人の発話から生じるものであるステップと；
前記音声録音を処理して、前記音声録音内のテキストの要素を認識するステップと；
前記テキストの要素が前記人に関する特有な情報を表すかどうかを検出するステップと；
前記音声録音に識別子を関連付けるステップであって、当該識別子が前記検出に基づくものであるステップと；
を具えることを特徴とする方法。
請求項４６に記載の方法において、前記識別子が、音声録音が前記人に関する特有な情報を含むことを表示することを特徴とする方法。
請求項４６に記載の方法において、前記音声録音が、アナログ、デジタル、及びテキスト形式からなる群から選択された形式であることを特徴とする方法。
請求項４８に記載の方法において、前記識別子が特有な情報の存在、特有な情報の不存在、暗号化、マスキング、データ所有者、データ管理者及びデータ分析者からなる群から選択されるパラメータの情報を伝送することを特徴とする方法。
請求項４６の方法において、前記識別子を関連付けるステップが、前記識別子を音声録音に関連付け、当該音声録音がアナログ、デジタル、テキストからなる群から選択される形式であることを特徴とする方法。