JP2010079235A

JP2010079235A - 個人（オーディ）情報を含まないメディア・ストリームを保存する方法

Info

Publication number: JP2010079235A
Application number: JP2008319176A
Authority: JP
Inventors: George William Erhart; ウイリアムエルハートジョージ; Valentine C Matula; シー．ムトゥラバレンタイン; David Joseph Skiba; ジョセフスキバディビィット; Lawrence O'gorman; オー’ゴーマンローレンス
Original assignee: Avaya Inc
Current assignee: Avaya Inc
Priority date: 2008-09-28
Filing date: 2008-12-16
Publication date: 2010-04-08
Also published as: CA2646118A1; US20100082342A1; EP2169669B1; US8244531B2; EP2169669A1; KR101344630B1; CA2646118C; KR20100036153A

Abstract

【課題】個人情報を含む可能性のあるオーディオ情報から個人情報の消去（又はトーンを被せる、サイレンス（無音）にする）処理を行う。
【解決手段】本発明のデータ処理システムは、オーディオ・ストリーム（更に画像のようなの他の種類の媒体を含むメディア・ストリーム）を受領する。本発明のデータ処理システムがデータを受領すると、データ処理システムは、受信したメディア・ストリームから個人情報を含むオーディオ・ストリームを抽出する。その後このデータ処理システムは、オーディオ・ストリームを解析して、個人オーディオ・コンテンツを抽出する。この為に、本発明のデータ処理システムは、取り除くべき個人情報を記述するモデルを用いる。その後このシステムは、個人オーディオ・コンテンツを、処理されたオーディオを含むストリームから省く。
【選択図】図１

Description

本発明は、通信に関し、特に個人（オーディオ）情報をメディア・ストリームから削除する方法に関する。

企業のコンタクト・センタ（例、消費者センタ）は、様々な目的で通話データを記録する。例えば、エージェントの成績の評価、システムの解析、売上げ分析を行うためである。通常コンタクト・センタは、通話を記録する際、通話の音声全体を記録する。通話の性質上又はコンタクト・センタでの仕事によっては、これらは、通話中に交換された個人情報を含むことがある。このような個人情報は、発呼者より話された個人情報、例えば、社会保障番号、銀行口座番号、電話番号等である。さらに、エージェントにより話された情報は、例えば、取引情報、勘定残高、誕生日等である。

通話記録が非揮発性メモリに記録されると問題が生じる。記録が残されると、企業には、記録されたデータの守秘義務が発生する。さらに、正統な第３者によりこのような通話記録（例えば、コンタクト・センタの成績解析、解析的なモデル開発、トレーニング等の目的で）にアクセスすることが要求される。それ故に、通話記録を共有し、企業の責任を減らすために、通話の秘密的な財産セグメントの特別な取り扱いが必要となる。

現在最も一般的なアプローチは、通話の個人情報セグメントを手作業で削除することである。手作業では、作業者がその通話記録を聞き、個人情報を含むと判断したセグメントを削除する。検出されたメディア・ファイルの個人情報は、単一のトーン又はサイレンス（無音）で置換する。その後、この新たなメディア記録（サイレンス又はトーンで置換された個人情報部分を含む通話記録）全部を保存する。

別のアプローチは、ファイル全体を暗号化することである。暗号化されると、プライバシのセーフガードが行われるが、オーディオ・ファイルが再生されると、プライバシは守られない。

他のアプローチは、通話を全く記録しないことである。このアプローチは、データを記録することに伴う複雑さと責任の全てを回避できる。しかし、トレーニングと良好な解析的システムの利点は失われる。

それ故に、現在必要とされていることは、私的なオーディオ・コンテンツ（個人情報）を含むメディア・ストリームを従来の欠点を有さずに処理する技術である。

本発明により、個人情報を含む可能性のあるオーディオ情報の中のオーディオ・ストリームの処理を従来よりもより簡便な方法で実行できる。本発明の実施例のデータ処理システムは、オーディオ・ストリーム（更には画像のようなの他の種類の媒体を含むメディア・ストリーム）を受領する。データ処理システムが、データを受領すると、受信したメディア・ストリームから個人情報を含むオーディオ・ストリームを抽出する。その後このデータ処理システムは、オーディオ・ストリームを解析して、個人オーディオ・コンテンツを抽出する。この為に、本発明のデータ処理システムは、削除すべき個人情報を記述するモデルを用いる。その後このシステムは、個人オーディオ・コンテンツを、処理されたオーディオを含むストリームから省く。

本発明の解析方法は、本発明の実施例の１つ又は複数の技術からなる。第１技術では、データ処理システムは、個人情報を含むセグメントを探し出し変更する。第２技術では、データ処理システムは、個人情報が無いセグメントを探し出し記憶する。個人情報が無いセグメントを探し出す第２技術は、個人情報のセグメントを探し出す第１技術とは対照的である。第２技術の変形例は、（ｉ）非個人情報のみを含む表現（会話、通話）を保存すること、又は（ｉｉ）理解可能な表現を含まない音響シグネチャ（特徴、痕跡：acoustic signature）を生成すること、又はその両方である。当業者は、他の変形例も容易に想到できる。

本発明の一実施例によれば、解析すべきオーディオ・ストリームは、（ｉ）通話（電話）中エージェントと話す発呼者の発する発呼者音声波形と、（ｉｉ）通話中発呼者と話すエージェントの発するエージェント音声波形を含む。しかし当業者は、本明細書を参照することにより、他の種類の音声波形を解析できる他の実施例も想到できる。他の種類の音声波形とは、例えば、「発呼者」と「エージェント」以外の関係者、又は全く無関係な人の音声波形である。さらに他の実施例においては、人間ではない音声源により生成された（例、双方向音声応答システムにより生成された）音声波形も解析できる。最後に、本発明の他の実施例においては、処理すべきオーディオ・ストリームは、通話以外の会話から生成してもよい。

本発明のオーディストリームから個人情報を削除する方法は、（Ａ）オーディオ・ストリームをデータ処理システムで受領するステップと、前記オーディオ・ストリームは、（ｉ）通話中第１当事者により生成された第１音声波形と、（ｉｉ）通話中第２当事者により生成された第２音声波形とを搬送し、（Ｂ）前記第１音声波形の第１セグメントが個人情報を含むか否かを決定するステップと、前記（Ｂ）ステップは、（ｉ）第１音声波形の第１セグメントの前の第２セグメントのコンテンツ、又は（ｉｉ）第２音声波形の所定のセグメントのコンテンツに基づいて行われ、（Ｃ）前記第１セグメントが個人情報を含むと決定された時には、前記第１セグメントにタグを付すステップとを有する。

図１は、本発明の一実施例による個人情報処理環境１００のブロック図である。個人情報処理環境１００は、データ処理システム１０１と、プライバシ・モデル・サーバ１０２と、通信ネットワーク１０３と、未処理のオーディオ・ファイル・サーバ１０４と、処理済のオーディオ・ファイル・サーバ１０５とを、図に示したように相互接続した状態で有する。

データ処理システム１０１は、コンピュータベースのシステムで、信号を受信し、この信号を処理し、この処理された信号を出力する。データ処理システム１０１がデータを処理する際に実行するタスクを図２−７を参照して以下説明する。

本発明の一実施例によれば、データ処理システム１０１は、オーディオ・ストリーム（更に画像のような他の媒体を含むメディア・ストリーム）を受領する。このオーディオ・ストリームは、オーディオ・コンテンツを含む。その一部は、性質上個人情報である。データ処理システム１０１は、メディア・ストリームを生ストリーム又は予め記録したストリームのいずれかで受領する。例えば、データ処理システム１０１には、ライブ・フィードが通信ネットワーク１０３を介して与えられる。この通信ネットワーク１０３は、ボイス・オーバ・コンタクト・センタ又はライブメディア・ストリームの他のソースに繋がれている。他の例として、データ処理システム１０１は、未処理のオーディオ・ファイル・サーバ１０４又は他の種類のデータ記憶装置のような音源から、予め記録されたストリームにアクセスできる。この実施例においては、受領したメディア・ストリームのフォーマットは、リアルタイム・プロトコル・フォーマット（Real-Time Protocol format）である。データ処理システム１０１は、他の種類のソースからのデータ又は他のフォーマットで表されたデータも処理できる。

本発明の実施例のデータ処理システム１０１は、データを受領すると、受信したメディア・ストリームからオーディオ・ストリームを抽出する。その後このシステムは、オーディオ・ストリームを解析して、個人情報を得る。本発明の一実施例では、本発明のデータ処理システム１０１は、取り除くべき個人情報を記述するモデル（サーバ１０２に記録されたプライバシ・モデル）を用いる。その後このシステム１０１は、個人情報を、得られたストリームから省く。その結果得られた処理済みのストリームを記憶するか、別のシステム例えば処理済のオーディオ・ファイル・サーバ１０５に転送する。

図２−７は、本発明の一実施例の動作に関連するタスクのフロー・チャートを示す。本発明の他の実施例においては、図示されたタスクの一部のみが実行される。さらに別の実施例においては、タスクの少なくとも一部は、同時に又は図示したのとは異なる順に実行される。

図２を参照すると、タスク２０１において、データ処理システム１０１は、オーディオ・ストリーム内に存在する個人情報の特徴を記述するモデルを生成又は獲得する。このモデルは、データ処理システム１０１又は他の手段により予め生成され、削除すべき個人情報を規定する。このモデルは、データの一般的な話しの単語に基づく。例えば、パスワード、メールアドレス、服用した医薬品、社会保障番号、電話番号、口座番号、銀行の預金残高、ドル残高等である。

各プライバシ・モデルの特定の表現は、キーワード、キー・フレーズ、音響シグネチャに基づいてもよい。この表現がキーワード又はキー・フレーズに基づいた場合には、個人情報に関連する実際のワードは、例えば、「アドレス」、「治療記録」、「パスワード」である。この表現が音響的特徴／痕跡（シグネチャ）に基づく場合（実際の表現（通話、会話）は記憶されず、音声の表現には関連しない特徴が記録される）には、プライバシ・モデルは、一般的に生成できる。例えば、「母親の旧姓」の音節の数は、誰が実際に名前を発音しようとも、一定である。

音響的特徴／痕跡（シグネチャ）を用いる他の技術は、これらのフレーズを発音する特定のエージェントを記録し、発音の韻律に基づいたプライバシ・モデルを生成することである。「韻律」とは、音声の音律（リズム）、強勢（ストレス）、抑揚（イントネーション）である。従って、生成されたモデルは、解析すべき特定のオーディオ・ストリームに関係する特定のエージェントに用いることができる。韻律も、発呼者により発音されるフレーズを識別するのに用いることができる。このようなフレーズは、例えば、発呼者の社会保障番号と電話番号である。個人識別は、ある一連の番号の規則的なパターンにより可能である。この場合、発呼者の発声が、識別可能なパターンを生成する。これは話された数字（又は文字）は、各発呼者又はエージェント毎に異なっている場合でも当てはまる。

本発明の他の実施例においては、プライバシ・モデルは、上記以外の技術によっても形成できる。

データ処理システム１０１が、他のソースからプライバシ・モデルを得る代わりに、プライバシ・モデルを初期化（最初に作成）すると、データ処理システム１０１は、この初期化されたモデルをプライバシ・モデル・サーバ１０２に書き込み、後で使用できるようにする。

タスク２０２において、データ処理システム１０１は、メディア・ストリームを受領する。このメディア・ストリームから個人オーディオ情報が取り除かれる。解析すべきメディア・ストリームは、１つ又は複数の波形を搬送するオーディオ・ストリームを含む。その内の第１波形は、発呼者音声波形（即ち「第１」音声波形）で、エージェントと話す発呼者（即ち通話の「第１当事者」）により生成される。第２波形はエージェント音声波形（即ち「第２」音声波形）で、発呼者と話すエージェント（即ち通話の「第２当事者」）により生成される。このオーディオ・ストリームは、生のメディア・ストリーム（例えばＶｏＩＰのコンタクト・センタからの）又は予め記録されたメディア・ファイルの一部である。

この実施例によれば、複数の波形（例、発呼者音声波形、エージェント音声波形等）は、同一の予め記録されたメディア・ファイル内にある様々な音源からの音声信号である。本明細書を参照することにより、発声者の波形を記録する他の実施例又は別のメディア・ファイルで表現され処理される他の実施例も当業者には明らかである。

タスク２０３において、データ処理システム１０１は、オーディオ・ストリームを解析して、その中の個人情報を削除する。タスク２０３は図３を参照して説明する。

タスク２０４において、データ処理システム１０１は、その結果得られた個人情報を含まないオーディオ・ストリームであるストリームを出力又は記憶する。

図２によれば、データ処理システム１０１は、一時に１個のオーディオ・ストリームを処理しその後停止する。少なくとも、データ処理システム１０１の処理が別のオーディオ・ストリームを操作するため、再度起動されるまで、停止している。データ処理システム１０１が、連続するオーディオ・ストリームを得る為、又は同一のオーディオ・ストリームの連続する部分を得る為に、図示されたタスクを連続して実行する他の実施例も当業者には明らかである。

図３は、本発明の一実施例のタスク２０３の実行に伴うタスクのフロー・チャートを示す。図示されたタスクは、発呼者音声波形の１つ又は複数のセグメントに対し実行されるか、又はタスク２０２で受領したオーディオ・ストリームにより搬送されたエージェント音声波形に対し実行される。

タスク３０１において、データ処理システム１０１は、処理中のセグメントから個人情報を取り除く。タスク３０１は図４を参照して説明する。

タスク３０２において、データ処理システム１０１は、処理中のオーディオ・セグメントの表示を記憶する。このセグメントは、（ｉ）個人情報の無い実際のセグメント。又は（ｉｉ）全体のオーディオ・システムの音響特徴／痕跡又はセグメントである。この音響特徴／痕跡は、認識可能な表現では存在しない。タスク３０２は図５を参照して説明する。

本発明の一実施例によれば、データ処理システム１０１は、タスク３０１とタスク３０２の両方を実行して、解析中のオーディオ・セグメントから、個人情報を削除し、非個人情報のみを記憶する。タスク３０１又はタスク３０２のいずれかを実行する他の実施例、又はタスク３０１とタスク３０２の異なる組み合わせを処理すべき異なるオーディオ・セグメントに対して実行する他の実施例は、本明細書を参照することにより、当業者には明らかである。

タスク３０３において、データ処理システム１０１は、処理すべき更なるオーディオ・セグメントが存在するか否かを決定する。存在する場合には、タスクの実行は、タスク３０４に進み、それ以外は、タスク２０４に進む。

タスク３０４において、データ処理システム１０１は、次のオーディオ・セグメントを処理するために準備する。これは、カウンターを更新し、次のセグメントを処理用メモリ内に読み込むことにより行う。タスクの実行は、その後タスク３０１に戻る。

図４は、本発明の一実施例によるタスク３０１の実行に関連するタスクのフロー・チャートを示す。

タスク４０１において、データ処理システム１０１は、処理中のオーディオ・セグメントが個人情報を含むか否かを決定する。この実施例によれば、この決定は、次に述べるいくつかの方法で行われる。ただしこれに限定されない。

ｉ．発呼者音声波形内の時間位置により行う。
この技術は、通話は予測可能な方法で処理ができるという洞察に基づく。エージェントは、発呼者のＩＤを、名前、住所、社会保障番号、パスワード、個人識別番号（ＰＩＮ）を尋ねることにより、知る。この問い合わせに対する発呼者の応答は、個人情報と見なされ、自動的にオーディオ・ストリームから削除される。
個人情報におけるオーディオ・セグメントの時間位置は、絶対時間又は相対時間の観点で決まる。絶対時間は、応答速度に依存する。例えば、時間位置は、質問したエージェントの音声波形を含むセグメントの直後に起こると見なされる。他の実施例においては、個人情報が発声される時間間隔は、会話の所定部分（例、発呼者音声波形又は記録されたオーディオの最初のＭ秒である。）内で発生すると見なされる。これに対し、相対時間は、エージェントと発呼者の間で交わされる会話のセグメントの中での特定のオーディオ・セグメントの位置に基づく。例えば、個人情報を有するオーディオ・セグメントの時間位置は、発呼者がエージェントへの５番目、９番目又は１０番目の応答と見なされるが、これはその応答が行われた速度には無関係である。

ｉｉ．エージェント音声波形内のキーワード又はフレーズによる。
通話が、上記の技術（ｉ）に対し見なされたよりもより構造的でない場合、又は個人情報が通話の本質部分の間で要求された場合には、個人情報は、エージェントにより話されたキーワードにより認識することができる。例えば、エージェントが「あなたの住所をもう一度おっしゃっていただけますか？」と言った場合には、このキー・フレーズが認識され、発呼者の応答は削除される。

ｉｉｉ．発呼者音声波形内のキーワード又はフレーズによる。
発呼者の音声を認識した時には、個人情報を示す単語（例、「現在、服用している薬は…」）に続く部分の表現は、オーディオ・セグメントから削除される。

ｉｖ．ワードの種類による。
この技術において、データ処理システム１０１は、音声波形のセグメントがある種類の場合には、自動的に認識するようチューニングされる。例えば、データ処理システム１０１が話された一連の番号を検出した場合、データ処理システム１０１は、「６２３２４１８」は電話番号であり、韻律や番号の組み合わせではない（例えば、"6 too 3 to for won ate."）と決定する。データ処理システム１０１によるこの意味的な認識が与えられると、このモデリング又は他のカスタムメイドのモデリングを用いて、個人情報を有するセグメントを検出し削除することができる。

ｖ．韻律による。
音声（韻律）の種類は、例えば、その長さ、音節の数、抑揚により認識できる。これらは、タスク２０１で議論した「韻律」の明示／表現である。この技術は、比較的長い明瞭なフレーズ、例えば、「社会保障番号」やそれを表す発声された数字列、「母親の旧姓」に対し最も上手く機能する。データ処理システム１０１は、様々なフレーズをその韻律に基づいて探し、それらを状況に応じて削除する。

ｖｉ．第２セグメントの個人情報コンテンツを予測するために第１のオーディオ・セグメントを解析する。
この技術は、エージェント音声波形のセグメントを用いて、発呼者音声波形の後続のセグメントが個人情報を含むのを予測するのに類似する。これは、発呼者音声波形の第１セグメントを用いて、発呼者音声波形の第２セグメントが個人情報を含むのを予測することができる。

これらの方法は、より信頼性を高めるために、１つ又は複数の方法と共に用いることもできる。さらに当業者は、発呼者又はエージェントのみならず、あらゆる音源から発声された波形に対し、これらの１つ又は複数の方法を一般化して用いることができる。

タスク４０２において、データ処理システム１０１は、処理中のオーディオ・セグメントが個人情報を含む場合には、それにタグを付す。本発明の一実施例によれば、このタグを付することは、メモリ中で、どのセグメントが、個人情報故に、変更すべきか、又は削除すべきかを特定するためにのみ、行われる。本発明の他の実施例においては、タグの付されたオーディオ・セグメントは、そのタグと共に記憶される。これにより、これらのセグメントが個人情報を含むことを示す。本発明のさらに他の実施例においては、このタグを付することは、省略し、タスク４０３に進むこともできる。

この実施例のタスク４０３において、データ処理システム１０１は、オーディオ・セグメントがタスク４０２でタグを付された場合、或いは別の方法で特定された場合、オーディオ・セグメントを変更する。本発明の他の実施例においては、この変更プロセスは、タグの付されたオーディオ・セグメントを可聴トーンで置換する。他の実施例では、この変更ステップは、タグの付されたオーディオ・セグメントをサイレンス（無音）で置換する。このトーン又はサイレンスは、生成された処理済みのオーディオ・ストリームにおいては、未処理のストリーム内の個人情報を含むオーディオ・セグメントに置き換わる。当業者は、トーン又はサイレンスを置換する以外の他の方法を用いて、個人情報を含むオーディオ・セグメントを置換することもできる。

図５は、本発明の一実施例によるタスク３０２を実行するタスクのフロー・チャートを示す。このタスクにおいては、強調が記憶されている非個人情報に対し行われる。これは、タスク３０１で行われた個人情報を削除するのとは、対照的（逆）である。

タスク５０１において、ある実施例では、データ処理システム１０１は、解析中のオーディオ・セグメントで、の非個人情報のみを含む表現（発声）を記憶する。タスク５０１を図６を参照して説明する。

タスク５０２において、ある実施例では、データ処理システム１０１は、音響特徴／痕跡を生成する。これは、通話の非個人情報の完全なオーディオを生成するのとは対照的である。タスク５０２を図７を参照して説明する。

ある実施例においては、タスク５０１又はタスク５０２のいずれかが実行され両方は実行されない。他の実施例においては、タスク５０１とタスク５０２の両方が実行される。タスク５０１とタスク５０２の両方は、ある状況下で実行される。この状況においては、発声された時に選択されたキーワード又はキー・フレーズを記憶することが重要な場合であり、かつ処理中のオーディオ・ストリームの一部又は全ての音響特徴／痕跡を記憶することが重要な場合である。

図６は、本発明の一実施例によるタスク５０１を実行するタスクのフロー・チャートを示す。

タスク６０１において、データ処理システム１０１は、処理中のオーディオ・セグメントが非個人情報を含むか否かを決定する。ここでは、個人情報を削除する代わりに、データ処理システム１０１は、逆のことを行う。これは、（非個人情報の表現をいじらずに）非個人情報のみを記憶することにより行う。これは、問題の情報量が比較的小さい場合、例えば、「ありがとう」と言われたて通話を終わることを記録する場合、通話が顧客の満足度に対し評価する場合である。この場合、例えば、データ処理システム１０１は、発呼者音声波形又はオーディオ記録の最後のＮ秒の間に起きたオーディオ・セグメントを記憶する。

タスク６０２において、データ処理システム１０１は、セグメントが非個人情報のみを有する場合には、このセグメントをメモリ内に記憶する。

図７は、本発明の一実施例によるタスク５０２を実行するタスクのフロー・チャートを示す。

タスク７０１において、データ処理システム１０１は、１つ又は複数のセグメントを得るために音響特徴／痕跡を生成する。ここで音響特徴／痕跡は、通話の長さ、サイレンス、抑揚等を記憶する。しかし、未処理の波形内で発音された単語は削除する。その結果、識別可能な韻律が削除される。データ処理システム１０１は、このプロセスを、例えば通話中にピッチ、エネルギー等の特徴を計算し記憶することにより、行う。ある実施例において、データ処理システム１０１は、保存された特徴が表示された各セグメントを介していかに変化するかに関する情報（例、相対的な抑揚）を計算し記憶する。別な構成として、データ処理システム１０１は、音響周波数に対する通話を、ローパス・フィルターで処理する。これにより、識別可能なワードを取り除き、波形中の少なくともある非韻律特徴を記憶する。

タスク７０２において、データ処理システム１０１は、音響特徴／痕跡を、解析中のオーディオ・ストリームの表現として、メモリ内に記憶する。

以上の説明は、本発明の一実施例に関するもので、この技術分野の当業者であれば、本発明の種々の変形例を考え得るが、それらはいずれも本発明の技術的範囲に包含される。特許請求の範囲の構成要素の後に記載した括弧内の番号は、図面の部品番号に対応し、発明の容易なる理解の為に付したものであり、発明を限定的に解釈するために用いてはならない。また、同一番号でも明細書と特許請求の範囲の部品名は必ずしも同一ではない。これは上記した理由による。

本発明の一実施例による個人情報処理環境１００のブック図。本発明の一実施例の動作のタスクを表すフロー・チャート。本発明の一実施例によるタスク２０３の動作に関連するタスクのフロー・チャート。本発明の一実施例によるタスク３０１の動作に関連するタスクのフロー・チャート。本発明の一実施例によるタスク３０２の動作に関連するタスクのフロー・チャート。本発明の一実施例によるタスク５０１の動作に関連するタスクのフロー・チャート。本発明の一実施例によるタスク５０２の動作に関連するタスクのフロー・チャート。

符号の説明

図１
１００個人情報処理環境
１０１データ処理システム
１０２プライバシ・モデル・サーバ
１０３通信ネットワーク
１０４未処理のオーディオ・ファイル・サーバ
１０５処理済のオーディオ・ファイル・サーバ
図２
開始
２０１オーディオ・ストリーム内の個人情報の特徴を記述するモデルを生成する
２０２オーディオ・ストリームを受領する
このオーディオ・ストリームは、（ｉ）発呼者音声波形と（ｉｉ）エージェント音声波形を搬送する
２０３個人情報を削除するためにオーディオ・ストリームを解析する
２０４個人情報の無いオーディオ・ストリームを出力又は記憶する
終了
図３
タスク２０２から
３０１個人情報を処理中のオーディオ・セグメントから削除する
３０２個人情報の無いオーディオ・セグメントの表現を記憶する
３０３処理すべき更なるセグメントがあるか？
３０４次のセグメントに進む
タスク２０４へ
図４
タスク２０２から
４０１処理中のオーディオ・セグメントが個人情報を含むか否かを次の基準に基づいて決定する
（ｉ）発呼者音声波形内の時間位置
（ｉｉ）エージェント音声波形内のキーワード又はキー・フレーズ
（ｉｉｉ）発呼者音声波形内のキーワード又はキー・フレーズ
（ｉｖ）ワードの種類
（ｖ）韻律
（ｖｉ）発呼者音声波形の様々なセグメント
４０２オーディオ・セグメントが個人情報を含む場合には、それにタグを付す
４０３タグが付いている場合には、オーディオ・セグメントを変更する
タスク３０２へ
図５
タスク３０１から
５０１非個人情報のみを含む表現を記憶する
５０２音響特徴／痕跡を生成する
タスク３０３へ
図６
タスク３０１から
６０１セグメントが非個人情報を含むか否かを決定する
６０２セグメントが非個人情報のみを含む場合には、それを記憶する
タスク５０２へ
図７
タスク５０１から
７０１音響セグメント用の音響特徴／痕跡を生成する
７０２音響特徴／痕跡をオーディオ・ストリームの表現として記憶する
タスク３０３へ

Claims

（Ａ）オーディオ・ストリームをデータ処理システムで受領するステップと、
前記オーディオ・ストリームは、（ｉ）通話中第１当事者により生成された第１音声波形と、（ｉｉ）通話中第２当事者により生成された第２音声波形とを搬送し、
（Ｂ）前記第１音声波形の第１セグメントが個人情報を含むか否かを決定するステップと、
前記（Ｂ）ステップは、（ｉ）第１音声波形の第１セグメントの前の第２セグメントのコンテンツ、又は（ｉｉ）第２音声波形の所定のセグメントのコンテンツに基づいて行われ、
（Ｃ）前記第１セグメントが個人情報を含むと決定された時には、前記第１セグメントにタグを付すステップと
を有する
ことを特徴とするオーディストリームから個人情報を削除する方法。
前記（Ｂ）ステップは、第１音声波形内の第１セグメントの時間位置に基づいて行われる
ことを特徴とする請求項１記載の方法。
前記第１セグメントが個人情報を含むと決定されるのは、第１セグメントの時間位置が第１音声波形の最初のＭ秒内にある時であり、
前記Ｍは、第１音声波形の時間長さの秒数未満の正数である
ことを特徴とする請求項２記載の方法。
前記（Ｂ）ステップは、第２音声波形の所定のセグメントの韻律に基づいて行われる
ことを特徴とする請求項１記載の方法。
（Ｄ）前記第１音声波形の第３セグメント又は第４セグメントが、非個人情報を含むか否かを決定するステップと、
（Ｅ）前記第３セグメントのみが非個人情報を含むと決定された時には、第３セグメントのみを記憶するステップと
をさらに有する
ことを特徴とする請求項１記載の方法。
前記（Ｄ）ステップは、前記第３セグメントのコンテンツがキーワード又はキー・フレーズとマッチするか否かに基づいて行われる
ことを特徴とする請求項５記載の方法。
前記（Ｄ）ステップは、第１音声波形内の第３セグメントの時間位置に基づいて行われる
ことを特徴とする請求項５記載の方法。
前記第３セグメントが非個人情報を含むと決定されるのは、第３セグメントの時間位置が第１音声波形の最後のＮ秒内にある時であり、
前記Ｎは、第１音声波形の時間長さの秒数未満の正数である
ことを特徴とする請求項７記載の方法。
（Ｆ）第１セグメントにタグが付された時に、前記第１セグメントを変更するステップ
をさらに有する
ことを特徴とする請求項１記載の方法。
前記（Ｆ）のステップは、第１セグメントの場所にトーンを入れる
ことを特徴とする請求項９記載の方法。