WO2022209144A1

WO2022209144A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2022209144A1
Application number: PCT/JP2022/001145
Authority: WO
Inventors: 健一町田; 一比良松井; 麻斗田中
Original assignee: Ｎｔｔテクノクロス株式会社
Priority date: 2021-03-31
Filing date: 2022-01-14
Publication date: 2022-10-06
Also published as: GB202316355D0; US20240012994A1; GB2620348A; JPWO2022209144A1

Abstract

一実施形態に係る情報処理装置は、複数人の会話の内容に応じて、前記会話を表す会話データの一部又は全部を、時刻認証の設定範囲として特定する特定部と、特定された前記設定範囲に対して時刻認証を設定する設定部と、を有する。

Description

情報処理装置、情報処理方法及びプログラム

　本発明は、情報処理装置、情報処理方法及びプログラムに関する。

　時刻認証と呼ばれる仕組みが従来から知られている（例えば、非特許文献１）。電子データに対して時刻認証を行うことで、或る時刻にその電子データが存在し、その時刻以降にその電子データが改ざんされていないことを証明することが可能となる。

　ところで、近年では音声データの加工が容易になってきているため、コンタクトセンタ（又は、コールセンタとも呼ばれる。）で発生する通話の音声データに対して時刻認証を行いたいというニーズがある。

タイムビジネス認定センター，インターネット＜ＵＲＬ：https://www.dekyo.or.jp/tb/index.html＞

　しかしながら、コンタクトセンタで発生する通話は一般に膨大であることが多く、全ての音声データに対して時刻認証を行うと時刻認証局（ＴＳＡ：Time Stamping Authority）へのアクセスが多くなり、コストが増加する。また、近年では音声データだけでなく、その音声を音声認識により変換したテキストデータに対しても時刻認証を行いたいというニーズもあり、尚更コストが増加する。

　これに対して、音声データやテキストデータを含む通話データの必要な範囲のみを時刻認証の対象とすることで、時刻認証に要するコストを低減させることが可能である。

　本発明の一実施形態は、上記の点に鑑みてなされたもので、時刻認証に要するコストを低減させることを目的とする。

　上記目的を達成するため、一実施形態に係る情報処理装置は、複数人の会話の内容に応じて、前記会話を表す会話データの一部又は全部を、時刻認証の設定範囲として特定する特定部と、特定された前記設定範囲に対して時刻認証を設定する設定部と、を有する。

　時刻認証に要するコストを低減させることができる。

本実施形態に係るコンタクトセンタシステムの全体構成の一例を示す図である。時刻認証の設定の一例を模式的に説明するための図である。本実施形態に係る認証管理装置の機能構成の一例を示す図である。コールリーズンＤＢの一例を示す図である。設定条件ＤＢの一例を示す図である。時刻認証処理の流れの一例を示すフローチャートである。時刻認証管理ＤＢの一例を示す図である。

　以下、本発明の一実施形態について説明する。本実施形態では、コンタクトセンタを対象として、コンタクトセンタにおける通話データの必要な範囲のみを時刻認証の対象とすることで、時刻認証に要するコストを低減させることができるコンタクトセンタシステム１について説明する。ここで、通話データには、コンタクトセンタのオペレータと顧客との間の通話における音声データだけでなく、この音声データを音声認識により変換したテキストデータも含み得るものとする。

　ただし、コンタクトセンタは一例であって、コンタクトセンタ以外にも、例えば、商品やサービス等の営業担当者や店舗の窓口担当者等を対象として、営業業務や窓口業務の中で発生した会話の音声データやテキストデータを含む会話データに対して時刻認証を行う場合等にも同様に適用することが可能である。また、以下では、コンタクトセンタのオペレータは顧客との間で音声通話により問い合わせ対応等の業務を行うものとして説明するが、これに限られず、例えば、テキストチャット（テキスト以外にスタンプや添付ファイル等を送受信可能なものも含む。）、ビデオ通話（電子データの表示を共有可能なものも含む。）等により業務を行う場合（つまり、通話データには音声データが含まれず、テキストデータのみが含まれる場合）であっても同様に適用することが可能である。より一般には、複数人の会話に関する会話データに対して時刻認証を行う場合にも同様に適用することが可能である。

　なお、時刻認証とは、電子データのハッシュ値（又は、メッセージダイジェストともいう。）に対して、信頼された事業者（時刻認証業務の認定事業者）の時刻認証局が時刻情報を付与することをいう。時刻情報が付与されたハッシュ値はタイムスタンプトークン（又は、単に、タイムスタンプともいう。）と呼ばれ、このタイムスタンプトークンによって当該時刻情報が表す時刻にその電子データが存在し、かつ、その時刻以降にその電子データが改ざんされていないことが証明される。以下では、或る電子データに対して時刻認証を行うことを「電子データに時刻認証を設定する」等ともいう。

　＜全体構成＞
　まず、本実施形態に係るコンタクトセンタシステム１の全体構成について、図１を参照しながら説明する。図１は、本実施形態に係るコンタクトセンタシステム１の全体構成の一例を示す図である。

　図１に示すように、本実施形態に係るコンタクトセンタシステム１には、認証管理装置１０と、オペレータ端末２０と、管理者端末３０と、ＰＢＸ４０と、顧客端末５０と、時刻認証局６０とが含まれる。ここで、認証管理装置１０、オペレータ端末２０、管理者端末３０及びＰＢＸ４０は、コンタクトセンタのシステム環境であるコンタクトセンタ環境Ｅ内に設置されている。なお、コンタクトセンタ環境Ｅは同一の建物内のシステム環境に限られず、例えば、地理的に離れた複数の建物内のシステム環境であってもよい。

　認証管理装置１０は、顧客とオペレータとの間の通話における音声データとその音声を音声認識により変換したテキストデータの少なくとも一方から必要な範囲（以下、設定範囲ともいう。）を抽出した上で、この設定範囲に対して時刻認証を設定する。すなわち、認証管理装置１０は、当該設定範囲のデータのハッシュ値を計算した上で、インターネット等を含む通信ネットワーク８０を介して、当該ハッシュ値のタイムスタンプトークンを時刻認証局６０に要求する。そして、認証管理装置１０は、時刻認証局６０から返信されたタイムスタンプトークンを通話データと共に保存する。これにより、必要なデータ（音声データ、テキストデータ、又はその両方）の必要な範囲にのみ時刻認証が行われた通話データが得られる。

　ここで、音声データ、テキストデータ又はその両方のいずれを時刻認証の対象とするか、またどの範囲を設定範囲とするかは、通話データが表す通話の内容に応じて決定される。より具体的には、通話データが表す通話のコールリーズンや通話中に発話された用語に応じて決定される。コールリーズンとは顧客がコールセンタに電話した理由（入電理由）のことであり、顧客の問い合わせ内容等のことである。以下では、簡単のため、１つの通話には１つのコールリーズンのみが存在するものとして説明する。

　オペレータ端末２０は、顧客からの問い合わせ対応を行うオペレータが利用するＰＣ等の各種端末であり、ＩＰ（Internet Protocol）電話機として機能する。

　管理者端末３０は、オペレータを管理する管理者（このような管理者はスーパバイザとも呼ばれる。）が利用するＰＣ（パーソナルコンピュータ）等の各種端末である。

　ＰＢＸ４０は、電話交換機（ＩＰ－ＰＢＸ）であり、ＶｏＩＰ（Voice over Internet Protocol）網やＰＳＴＮ（Public Switched Telephone Network）を含む通信ネットワーク７０に接続されている。

　顧客端末５０は、顧客が利用するスマートフォンや携帯電話、固定電話等の各種端末である。

　時刻認証局６０は、時刻認証業務の認定事業者が運営又は管理する時刻認証局である。時刻認証局６０は、認証管理装置１０からの要求に応じて、この要求に含まれるハッシュ値に対して時刻情報を付与したタイムスタンプトークンを返信する。

　なお、図１に示すコンタクトセンタシステム１の全体構成は一例であって、他の構成であってもよい。例えば、図１に示す例では、認証管理装置１０がコンタクトセンタ環境Ｅに含まれているが（つまり、認証管理装置１０はオンプレミス型である）、認証管理装置１０の全部又は一部の機能がクラウドサービス等により実現されていてもよい。同様に、図１に示す例では、ＰＢＸ４０はオンプレミス型の電話交換機であるが、クラウドサービスにより実現されていてもよい。また、オペレータ端末２０はＩＰ電話機としても機能するとしたが、例えば、オペレータ端末２０とは別に電話機がコンタクトセンタシステム１に含まれていてもよい。また、例えば、コンタクトセンタ環境Ｅと外部ネットワークとを接続する装置（例えば、ゲートウェイ装置等）が認証管理装置１０として機能してもよい。

　＜時刻認証の設定＞
　本実施形態では、必要なデータ（以下、対象データともいう。）の必要な範囲（設定範囲）に対して時刻認証が設定される。ここで、対象データは、通話データに含まれる音声データ及びテキストデータのうち、時刻認証の設定対象となるデータのことである。また、設定範囲は、対象データの時間的な範囲の中で、時刻認証の設定対象となる範囲のことである。

　そこで、本実施形態における時刻認証の設定の一例について、図２を参照しながら説明する。図２は、時刻認証の設定の一例を模式的に説明するための図である。

　図２の左図に示す例は、コールリーズン「商品案内」に関する通話において、時刻Ｔ_１に或る重要な用語Ｗ_１が発話されたと共に、時刻Ｔ_２に或る重要な用語Ｗ_２が発話された場合である。この場合、例えば、音声データとテキストデータを対象データ、時刻Ｔ_１－ΔＴ_１から時刻Ｔ_１＋ΔＴ_１までの時間的範囲（つまり、単語Ｗ_１の発話時刻の前後ΔＴ_１の範囲）を設定範囲として時刻認証が設定される。また、例えば、テキストデータを対象データ、時刻Ｔ_２－ΔＴ_２から時刻Ｔ_２＋ΔＴ_２までの時間的範囲（つまり、単語Ｗ_２の発話時刻の前後ΔＴ_２の範囲）を設定範囲として時刻認証が設定される。これは、重要な用語が発話された前後の発話内容が重要な事項になり得るため、その発話内容に対して時刻認証を行うことが適切なためである。

　なお、重要な用語とは当該コールリーズンに関して重要な単語や句等のことである。例えば、コールリーズン「商品案内」に関する問い合わせ対応を行う際には、オペレータはその商品の料金や保証内容に関して顧客に対して十分に説明する必要がある。このため、この場合、「料金」や「保障」といった単語が重要な用語に該当する。以下、「重要な用語」を単に「重要用語」ともいう。

　図２の右図に示す例は、コールリーズン「契約締結」に関する通話が行われた場合である。この場合、例えば、音声データとテキストデータを対象データ、当該通話の開始から終了までの全時間的範囲を設定範囲として時刻認証が設定される。これは、例えば、「契約締結」に関する通話は全ての発話内容が重要な事項になり得るため、テキストデータと音声データを対象データとして開始から終了までの全てに時刻認証を行うことが適切なためである。

　このように、本実施形態では、コールリーズンや通話中に発話された重要用語に応じて、音声データとテキストデータの一方又は両方を対象データとして、或る時間的範囲（全てを含む）に対して時刻認証を設定する。これにより、コールリーズンや通話中に発話された重要用語の重要性に応じて適切なデータの適切な範囲に対して時刻認証を設定することが可能となり、例えば、全ての通話データに対して無条件に時刻認証を設定する場合と比べて、時刻認証に要するコストを低減させることができる。

　なお、後述するように、どのデータを対象データとしてどのような時間的範囲に対して時刻認証を設定するかは、コールリーズンや重要用語を条件（ルール）として予め設定される。

　＜機能構成＞
　次に、本実施形態に係る認証管理装置１０の機能構成について、図３を参照しながら説明する。図３は、本実施形態に係る認証管理装置１０の機能構成の一例を示す図である。

　図３に示すように、本実施形態に係る認証管理装置１０は、音声認識テキスト変換部１０１と、コールリーズン検出部１０２と、設定区分特定部１０３と、用語判定部１０４と、時刻認証設定部１０５とを有する。これら各部は、例えば、認証管理装置１０にインストールされた１以上のプログラムが、ＣＰＵ（Central Processing Unit）等のプロセッサに実行させる処理により実現される。

　また、本実施形態に係る認証管理装置１０は、通話データＤＢ１０６と、コールリーズンＤＢ１０７と、設定条件ＤＢ１０８と、時刻認証管理ＤＢ１０９とを有する。これら各ＤＢ（データベース）は、例えば、補助記憶装置等の記憶装置により実現される。なお、これら各ＤＢのうちの少なくとも１つのＤＢが、例えば、認証管理装置１０と通信ネットワークを介して接続されるデータベースサーバ等により実現されていてもよい。

　音声認識テキスト変換部１０１は、オペレータ端末２０と顧客端末５０との間の音声通話を音声認識によりテキストに変換する。また、このとき、音声認識テキスト変換部１０１は、話者毎に音声認識を行ってテキストに変換する。これにより、オペレータの音声と顧客の音声とがそれぞれテキストに変換される。

　なお、この音声認識は、オペレータ端末２０と顧客端末５０との間で音声通話が行われている間、繰り返し実行される（例えば、数秒毎に実行されてもよいし、顧客又はオペレータが発話した単語やフレーズ毎に実行されてもよい。）。

　ここで、オペレータ端末２０と顧客端末５０との間の音声通話を表す音声データと、この音声通話を音声認識テキスト変換部１０１により変換したテキストを表すテキストデータは、例えば、当該音声通話の終了後に、通話データとして通話データＤＢ１０６に格納される。すなわち、通話データＤＢ１０６には、通話毎に、音声データとテキストデータとが含まれる通話データが格納されている。また、音声データには、オペレータの音声データ（以下、オペレータ音声データともいう。）と、顧客の音声データ（以下、顧客音声データともいう。）とが含まれている。同様に、テキストデータには、オペレータのテキストデータ（以下、オペレータテキストデータともいう。）と、顧客のテキストデータ（以下、顧客テキストデータともいう。）とが含まれている。なお、通話データには、例えば、当該通話を識別する通話ＩＤ等の情報も含まれている。

　コールリーズン検出部１０２は、コールリーズンＤＢ１０７を参照して、音声認識テキスト変換部１０１によって変換されたテキストからコールリーズンを検出する。ここで、コールリーズンＤＢ１０７は、顧客やオペレータの発話内容からコールリーズンを検出するための情報が格納されたデータベースである。コールリーズンＤＢ１０７の詳細については後述する。

　設定区分特定部１０３は、設定条件ＤＢ１０８を参照して、コールリーズン検出部１０２により検出されたコールリーズンから設定区分を特定する。設定区分とは、通話の開始から終了までの全時間的範囲を設定範囲とするか又は一部の時間的範囲を設定範囲とするかを示す区分である。以下、設定区分は、通話の開始から終了までの全時間的範囲を設定範囲とすることを示す「全部」と、全時間的範囲の一部の時間的範囲を設定範囲とすることを示す「一部」とのいずれかを取るものとする。ここで、設定条件ＤＢ１０８は、コールリーズンや重要用語に応じて対象データと設定範囲を決めるための情報が格納されたデータベースである。設定条件ＤＢ１０８の詳細については後述する。

　用語判定部１０４は、設定区分特定部１０３により設定区分が「一部」であると特定された場合、設定条件ＤＢ１０８を参照して、音声認識テキスト変換部１０１により変換されたテキストの中に重要用語が出現するか否かを判定する。

　時刻認証設定部１０５は、設定条件ＤＢ１０８を参照して、対象データの全部又は一部に対して時刻認証を設定する。すなわち、時刻認証設定部１０５は、設定区分特定部１０３により設定区分が「全部」であると特定された場合、設定条件ＤＢ１０８を参照して、コールリーズン検出部１０２により検出されたコールリーズンに対応する対象データの全部を設定範囲として時刻認証を設定する。一方で、時刻認証設定部１０５は、設定区分特定部１０３により設定区分が「一部」であると特定された場合、設定条件ＤＢ１０８を参照して、コールリーズン検出部１０２により検出されたコールリーズンと音声認識テキスト変換部１０１により変換されたテキスト中に出現する重要用語とに対応する対象データ及び設定範囲に対して時刻認証を設定する。

　時刻認証の設定は具体的には次のようにして行われる。すなわち、時刻認証設定部１０５は、対象データの設定範囲のハッシュ値を計算した上で、このハッシュ値のタイムスタンプトークンを時刻認証局６０に要求する。そして、時刻認証設定部１０５は、タイムスタンプトークンが時刻認証局６０から返信されると、時刻認証ＩＤや通話ＩＤ、コールリーズンＩＤ、当該タイムスタンプトークン等が含まれる時刻認証情報を作成し、この時刻認証情報を時刻認証管理ＤＢ１０９に保存する。これにより、通話ＩＤにより通話データと対応付けられた時刻認証情報が時刻認証管理ＤＢ１０９に保存され、当該通話データの少なくとも一部である対象データの設定範囲に対して時刻認証が設定されたことになる。なお、時刻認証ＩＤとは、時刻認証情報を識別するＩＤである。時刻認証管理ＤＢ１０９の詳細については後述する。

　　≪コールリーズンＤＢ１０７≫
　次に、コールリーズンＤＢ１０７の詳細について、図４を参照しながら説明する。図４は、コールリーズンＤＢ１０７の一例を示す図である。

　図４に示すように、コールリーズンＤＢ１０７には、コールリーズンＩＤとコールリーズン名称と検出条件とを対応付けた情報（データ又はレコード）が格納されている。

　コールリーズンＩＤは、コールリーズンを識別するＩＤである。コールリーズン名称は、コールリーズンの名称である。検出条件は、コールリーズン検出部１０２がコールリーズンを検出するための条件である。

　例えば、図４に示すコールリーズンＤＢ１０７の１行目の情報は、コールリーズンＩＤ「ａ－１」、コールリーズン名称「商品案内」、検出条件「両方：保険」である。同様に、例えば、図４に示すコールリーズンＤＢ１０７の２行目の情報は、コールリーズンＩＤ「ａ－２」、コールリーズン名称「契約手続」、検出条件「両方：契約」である。

　ここで、本実施形態では、一例として、検出条件は「発話者：単語」の形式で表されている。これは、当該発話者が当該単語を発話した場合に検出条件を満たすことを意味する。例えば、検出条件「両方：保険」は、オペレータと顧客の両方が「保険」という単語を発話した場合に検出条件を満たすことを意味する。同様に、例えば、検出条件「顧客：住所変更」は、顧客が「住所変更」という単語を発話した場合に検出条件を満たすことを意味する。同様に、図４には例示されていないが、例えば、検出条件「オペレータ：Ａ」は、オペレータが「Ａ」という単語を発話した場合に検出条件を満たすことを意味する。

　ただし、上記の検出条件の形式は一例であって、様々な形式（例えば、論理式等といった形式）で検出条件が表されていてもよい。

　　≪設定条件ＤＢ１０８≫
　次に、設定条件ＤＢ１０８の詳細について、図５を参照しながら説明する。図５は、設定条件ＤＢ１０８の一例を示す図である。

　図５に示すように、設定条件ＤＢ１０８には、コールリーズンＩＤと設定区分と重要用語と対象データと設定範囲とを対応付けた情報（データ又はレコード）が格納されている。

　コールリーズンＩＤは、コールリーズンを識別するＩＤである。設定区分は、通話の開始から終了までの全時間的範囲を設定範囲とするか又は一部の時間的範囲を設定範囲とするかを示す区分である。重要用語は、当該コールリーズンに関して重要な単語や句等のことである。対象データは、時刻認証の設定対象となるデータのことである。設定範囲は、当該対象データにおいて時刻認証の設定範囲となる時間的な範囲のことである。なお、設定区分が「全部」である情報には重要用語は含まれない（又は、重要用語としてＮＵＬＬや空値等が含まれる。）。

　例えば、図５に示す設定条件ＤＢ１０８の１行目の情報は、コールリーズンＩＤ「ａ－１」、設定区分「一部」、（（重要用語「料金」、対象データ「テキスト、音声」、設定範囲「重要用語の前後３分」）、（重要用語「保証」、対象データ「テキスト」、設定範囲「重要用語の前後５分」）、・・・）である。これは、コールリーズンＩＤ「ａ－１」の通話データの設定区分は「一部」であり、重要用語「料金」が発話された場合はテキストデータと音声データを対象データとしてその発話前後３分間が時刻認証の設定範囲となり、重要用語「保証」が発話された場合はテキストデータを対象データとしてその発話前後５分間が時刻認証の設定範囲となること等を意味している。

　同様に、例えば、図５に示す設定条件ＤＢ１０８の２行目の情報は、コールリーズンＩＤ「ａ－２」、設定区分「全部」、対象データ「テキスト、音声」、設定範囲「全期間」である。これは、コールリーズンＩＤ「ａ－２」の通話データの設定区分は「全部」であり、テキストデータと音声データを対象データとして全期間（つまり、全時間的範囲）が時刻認証の設定範囲となることを意味している。

　ただし、上記の設定範囲は一例であって、様々な時間的範囲を定義することが可能である。例えば、「重要用語の発話前３分」や「重要用語の発話後５分」等といったように、重要用語の発話前の時間幅や発話後の時間幅を定義することも可能である。また、例えば、「重要用語の発話後１分経過した後の５分間」等といった定義も可能である。また、時間的範囲以外にも、例えば、重要用語を含む文節や文の区切りを設定範囲と定義してもよいし、会話の転換点となる接続詞を始点・終点とする範囲又は当該接続詞を基準点とした所定の範囲を設定範囲と定義してもよいし、契約者確認や住所確認等のオペレータと顧客との間の会話の一連のやりとりの範囲を自然言語解析により抽出した上で、抽出した範囲のうち、特定のシーンを表す範囲を設定範囲と定義してもよい。

　また、本実施形態では、「テキストデータ」、「音声データ」、「テキストデータ、音声データ」のいずれかを対象データとする場合について説明するが、これに限られず、例えば、顧客とオペレータのいずれが発話したものであるかを考慮してもよい。すなわち、「顧客テキストデータ」、「オペレータテキストデータ」、「顧客音声データ」、「オペレータ音声データ」、「顧客テキストデータ、オペレータテキストデータ」、「顧客テキストデータ、顧客音声データ」、「顧客テキストデータ、オペレータ音声データ」、「オペレータテキストデータ、顧客音声データ」、「オペレータテキストデータ、オペレータ音声データ」、「顧客音声データ、オペレータ音声データ」、「顧客テキストデータ、オペレータテキストデータ、顧客音声データ」、「顧客テキストデータ、オペレータテキストデータ、オペレータ音声データ」、「顧客テキストデータ、顧客音声データ、オペレータ音声データ」、「オペレータテキストデータ、顧客音声データ、オペレータ音声データ」、「顧客テキストデータ、オペレータテキストデータ、顧客音声データ、オペレータ音声データ」のいずれかを対象データとしてもよい。

　＜時刻認証処理の流れ＞
　以下では、オペレータ端末２０と顧客端末５０との間の音声通話を表す音声データと、この音声通話を音声認識テキスト変換部１０１により変換したテキストを表すテキストデータと、当該音声通話の通話ＩＤとが含まれる通話データが通話データＤＢ１０６に格納されているものとして、或る通話データに関して時刻認証を設定する場合について、図６を参照しながら説明する。図６は、時刻認証処理の流れの一例を示すフローチャートである。

　コールリーズン検出部１０２は、コールリーズンＤＢ１０７を参照して、当該通話データに含まれるテキストデータが表すテキストからコールリーズンを検出する（ステップＳ１０１）。すなわち、コールリーズン検出部１０２は、コールリーズンＤＢ１０７に格納されている各レコードを参照して、当該テキストが検出条件を満たすレコードが存在するか否かを判定する。そして、コールリーズン検出部１０２は、検出条件を満たすと判定されたレコードのコールリーズンＩＤ及びコールリーズン名称を特定する。これにより、このコールリーズンＩＤ及びコールリーズン名称のコールリーズンが検出されたことになる。

　次に、設定区分特定部１０３は、設定条件ＤＢ１０８を参照して、上記のステップＳ１０１で検出されたコールリーズンから設定区分を特定する（ステップＳ１０２）。すなわち、設定区分特定部１０３は、設定条件ＤＢ１０８に格納されているレコードのうち、上記のステップＳ１０１で検出されたコールリーズンＩＤのレコードを参照して、このレコードに含まれる設定区分が「全部」又は「一部」のいずれであるかを特定する。

　上記のステップＳ１０２で設定区分が「一部」と特定された場合、用語判定部１０４は、設定条件ＤＢ１０８を参照して、当該テキストの中に重要用語が出現するか否かを判定する（ステップＳ１０３）。すなわち、用語判定部１０４は、設定条件ＤＢ１０８に格納されているレコードのうち、上記のステップＳ１０１で検出されたコールリーズンＩＤのレコードを参照して、このレコードに含まれる重要用語が、当該テキスト中に出現するか否かを判定する（ステップＳ１０３）。

　上記のステップＳ１０３で重要用語が出現すると判定された場合、時刻認証設定部１０５は、設定条件ＤＢ１０８を参照して、当該テキスト中に出現する重要用語毎に、当該重要用語に対応する対象データ及び設定範囲を特定する（ステップＳ１０４）。すなわち、時刻認証設定部１０５は、設定条件ＤＢ１０８に格納されているレコードのうち、上記のステップＳ１０１で検出されたコールリーズンＩＤのレコードを参照して、当該テキスト中に出現する重要用語毎に、当該重要用語に対応する対象データ及び設定範囲を特定する。

　例えば、上記のステップＳ１０１で検出されたコールリーズンＩＤが「ａ－１」、上記のステップＳ１０３でテキスト中に出現すると判定された重要用語が「料金」と「保証」である場合、時刻認証設定部１０５は、対象データ「テキスト、音声」及び設定範囲「重要用語の前後３分」と、対象データ「テキスト」及び設定範囲「重要用語の前後５分」とを特定する。

　なお、上記のステップＳ１０３で重要用語が出現すると判定されなかった場合、認証管理装置１０は、時刻認証処理を終了する。この場合は、時刻認証が設定されないことになる。

　次に、時刻認証設定部１０５は、当該テキスト中に出現する重要用語毎に、当該重要用語に対応する対象データ及び設定範囲に対して時刻認証を設定する（ステップＳ１０５）。すなわち、時刻認証設定部１０５は、当該テキスト中に出現する重要用語毎に、当該重要用語に対応する対象データから設定範囲を抽出してそのハッシュ値を計算した上で、このハッシュ値のタイムスタンプトークンを時刻認証局６０に要求する。そして、時刻認証設定部１０５は、当該重要用語に関するタイムスタンプトークンが時刻認証局６０から返信されると、時刻認証ＩＤを作成した上で、この時刻認証ＩＤと、当該通話データの通話ＩＤと、当該コールリーズンＩＤと、当該重要用語と、この重要用語に対応する対象データ及び設定範囲と、当該タイムスタンプトークンとが含まれる時刻認証情報を作成する。

　これにより、当該テキスト中に出現する重要用語毎に時刻認証情報が作成される。例えば、当該テキスト中に重要用語「料金」と「保証」が出現する場合、「料金」に対応する時刻認証情報と、「保証」に対応する時刻認証情報とが作成される。

　なお、同一の重要用語がテキスト中に複数回出現する場合、これらは区別して扱われる。例えば、当該テキスト中に重要用語「料金」が２回出現する場合、１回目に出現した「料金」に対応する時刻認証情報と、２回目に出現した「料金」に対応する時刻認証情報とが作成される。ただし、例えば、短期間に同一の重要用語が複数回出現する場合は、これらを区別しなくてもよい。例えば、３分間に重要用語「料金」が複数回出現するような場合である。これは、設定範囲の一部が重複することによる重複した時刻認証の設定を回避するためである。又は、例えば、複数の設定範囲の少なくとも一部が重複する場合や、重複しなくても複数の設定範囲間の時間間隔が所定の閾値以下である場合（つまり、設定範囲間が近接している場合）には、これら複数の設定範囲の各々に対応する重要用語を区別しないようにしてもよいし、若しくはこれら複数の設定範囲を１つにまとめてもよい。

　上記のステップＳ１０２で設定区分が「全部」と特定された場合、時刻認証設定部１０５は、設定条件ＤＢ１０８を参照して、上記のステップＳ１０１で検出されたコールリーズンに対応する対象データ及び設定範囲を特定する（ステップＳ１０６）。すなわち、時刻認証設定部１０５は、設定条件ＤＢ１０８に格納されているレコードのうち、上記のステップＳ１０１で検出されたコールリーズンＩＤのレコードを参照して、このレコードに含まれる対象データ及び設定範囲を特定する。

　例えば、上記のステップＳ１０１で検出されたコールリーズンＩＤが「ａ－２」である場合、時刻認証設定部１０５は、対象データ「テキスト、音声」及び設定範囲「全期間」と特定する。

　ただし、上記のステップＳ１０２で設定区分が「全部」と特定されているため、設定範囲は必ずしも特定されなくてもよい。これは、設定区分「全部」は、対象データの全期間を設定範囲として時刻認証が設定されることを意味するためである。

　次に、時刻認証設定部１０５は、対象データ全体に対して時刻認証を設定する（ステップＳ１０７）。すなわち、時刻認証設定部１０５は、上記のステップＳ１０６で特定された対象データの設定範囲（つまり、当該対象データの全期間）のハッシュ値を計算した上で、このハッシュ値のタイムスタンプトークンを時刻認証局６０に要求する。そして、時刻認証設定部１０５は、当該タイムスタンプトークンが時刻認証局６０から返信されると、時刻認証ＩＤを作成した上で、この時刻認証ＩＤと、当該通話データの通話ＩＤと、当該コールリーズンＩＤと、当該コールリーズンＩＤに対応する対象データ及び設定範囲と、当該タイムスタンプトークンとが含まれる時刻認証情報を作成する。これにより、対象データ全体に対する時刻認証情報が作成される。

　上記のステップＳ１０５又はステップＳ１０７に続いて、時刻認証設定部１０５は、作成した時刻認証情報を時刻認証管理ＤＢ１０９に保存する（ステップＳ１０８）。これにより、通話データの少なくとも一部である対象データの設定範囲（設定範囲が全期間である場合も含む）に対して時刻認証が設定されたことになる。

　ここで、時刻認証管理ＤＢ１０９に保存されている時刻認証情報の一例を図７に示す。図７に示す時刻認証管理ＤＢ１０９の１行目の時刻認証情報は、時刻認証ＩＤ「Ｔ００１」、通話ＩＤ「Ｃ００１」、コールリーズンＩＤ「ａ－１」、重要用語「料金」、対象データ「テキスト、音声」、設定範囲「重要用語の前後３分」、タイムスタンプトークン「・・・」である。これは、通話ＩＤ「Ｃ００１」の通話データに含まれるテキストデータと音声データを対象データとして、重要用語「料金」が発話された前後３分間の設定範囲のタイムスタンプトークンが時刻認証として設定されていることを意味している。

　同様に、図７に示す時刻認証管理ＤＢ１０９の３行目の時刻認証情報は、時刻認証ＩＤ「Ｔ００３」、通話ＩＤ「Ｃ００２」、コールリーズンＩＤ「ａ－２」、重要用語「－」、対象データ「テキスト、音声」、設定範囲「全期間」、タイムスタンプトークン「・・・」である。これは、通話ＩＤ「Ｃ００２」の通話データに含まれるテキストデータと音声データを対象データとして、その全期間のタイムスタンプトークンが時刻認証として設定されていることを意味している。

　以上のように、本実施形態に係る認証管理装置１０は、オペレータと顧客との間の音声通話のコールリーズンや通話中に発話された重要用語に応じて、当該音声通話の通話データに含まれる一部又は全部のデータを対象データとして、その対象データの時間的な範囲の全部又は一部に対して時刻認証を設定する。これにより、通話のコールリーズンの重要性や通話中に発話された用語の重要性に応じて、適切なデータの適切な範囲に対して時刻認証を設定することが可能となる。このため、例えば、全ての通話データに対して無条件に時刻認証を設定する場合と比べて、時刻認証に要するコストを低減させることができる。

　なお、本実施形態では、一例として、通話データＤＢ１０６に格納されている或る通話データに対して時刻認証を行う場合について説明したが、これに限られず、オペレータと顧客との間で通話が行われているときに、リアルタイムで時刻認証を行ってもよい。この場合、例えば、オペレータと顧客とのやり取りから設定範囲の開始時点を特定し、設定範囲の終了時点又は通話終了時点若しくは自然言語処理により終了条件を満たした時点で、上記のステップＳ１０５又はステップＳ１０７の時刻認証情報の作成を行ってもよい。また、このとき、時刻認証情報を作成する際に、設定範囲のデータだけでなく、現在時刻も含めてハッシュ値を計算してもよい。ここで、上記の自然言語処理による終了条件とは、例えば、文や文節の区切りが出現したこと、会話の転換点となる接続詞が出現したこと、等が挙げられる。

　＜変形例＞
　以下、本実施形態の変形例をいくつか説明する。

　　≪変形例１≫
　本実施形態では、重要用語が発話を起点としてその前、後、前後といった時間的範囲を設定範囲としたが、例えば、オペレータの何等かの動作の実行を起点としてもよい。例えば、コールリーズンが「契約手続」である場合には、オペレータは約款の電子ファイル等を開いて、その約款内容の読み上げ等を行うことがある。そこで、例えば、「約款の電子ファイルを開く」といった動作を起点としてその前、後、前後といった時間的範囲を設定範囲としてもよい。

　なお、上記の「約款の電子ファイルを開く」といった動作は、例えば、約款の電子ファイルが格納されているフォルダを監視することで検知することが可能である。したがって、例えば、当該電子ファイルのアクセス日時を示す情報を通話データに含めることで、本変形例を実現することが可能である。また、このような動作の他の例として、約款ファイルを最後までスクロールしたことでもよいし、テキストチャットを対象とした場合にはオペレータが顧客に約款ファイルを添付して送信したことや顧客が約款ファイルを開いたこと等でもよい。また、ビデオ通話を対象とした場合にはオペレータが約款ファイルを顧客画面に対して共有・表示したことや一定の時間表示したこと等でもよい。

　なお、重要事項に関する発話や動作をまとめて「行動」と称してもよい。

　　≪変形例２≫
　図６のステップＳ１０１ではテキストデータが表すテキストからコールリーズンを検出したが、例えば、ＩＶＲ（Interactive Voice Response）システムからの案内に応じて顧客が顧客端末５０に入力した番号からコールリーズンを特定及び検出してもよい。この場合、ＩＶＲシステムからの案内を示す情報と、この案内に応じて顧客が顧客端末５０に入力した番号を示す情報とを通話データに含めることで、本変形例を実現することが可能である。

　　≪変形例３≫
　本実施形態では、簡単のため、１つの通話には１つのコールリーズンのみが存在するものとしたが、一般には、１つの通話に複数のコールリーズンが存在することもある。例えば、顧客が住所変更手続きと契約プラン変更の２つの理由でコールセンタに電話した場合等である。

　このような場合（つまり、図６のステップＳ１０１で複数のコールリーズンが検出された場合）、コールリーズン毎に通話データを分割し、分割後の各通話データに対してステップＳ１０２以降を実行すればよい。なお、通話データの分割方法は様々に考えられるが、例えば、時刻Ｔ_１にコールリーズンＡ、時刻Ｔ_２にコールリーズンＢが検出された場合、時刻Ｔ_２－ΔＴ（ただし、ΔＴは予め決められた時間幅）で通話データを分割する、といった方法が考えられる。これは、或るコールリーズンが検出された時よりも少し前の時刻においても同一コールリーズンに関する会話がなされていると考えられるためである。

　　≪変形例４≫
　本実施形態では、通話データに含まれるテキストデータ若しくは音声データ又はその両方の設定範囲を時刻認証の対象としたが、当該設定範囲に関連するデータも時刻認証の対象としてもよい。例えば、当該設定範囲内の音声データをテキストデータに変換するために使用した音声認識機能に関するデータ（例えば、音声認識モデル等）や、認証管理装置１０が備えるソフトウェア又はプログラムのうち、当該設定範囲内のデータに対して何等かの処理を行ったソフトウェア又はプログラム、それらのソフトウェア又はプログラムが利用するライブラリ等も時刻認証の対象としてもよい。これにより、例えば、時刻認証が設定されたデータに対して適切な処理が行われていたのか、不具合や不都合が生じた場合の瑕疵に関する責任（不適合責任）の所在、等を検証することが可能となる。

　本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。

　本願は、日本国に２０２１年３月３１日に出願された基礎出願２０２１－０５９６７８号に基づくものであり、その全内容はここに参照をもって援用される。

　１　　　　コンタクトセンタシステム
　１０　　　認証管理装置
　２０　　　オペレータ端末
　３０　　　管理者端末
　４０　　　ＰＢＸ
　５０　　　顧客端末
　６０　　　時刻認証局
　７０、８０　　　通信ネットワーク
　１０１　　音声認識テキスト変換部
　１０２　　コールリーズン検出部
　１０３　　設定区分特定部
　１０４　　用語判定部
　１０５　　時刻認証設定部
　１０６　　通話データＤＢ
　１０７　　コールリーズンＤＢ
　１０８　　設定条件ＤＢ
　１０９　　時刻認証管理ＤＢ

Claims

　複数人の会話の内容に応じて、前記会話を表す会話データの一部又は全部を、時刻認証の設定範囲として特定する特定部と、
　特定された前記設定範囲に対して時刻認証を設定する設定部と、
　を有する情報処理装置。
　前記特定部は、
　第１の話者から第２の話者への問い合わせ内容に応じて、前記会話データの一部又は全部を前記設定範囲として特定する、請求項１に記載の情報処理装置。
　前記会話の内容から前記問い合わせ内容を検出する検出部を有し、
　前記特定部は、
　検出された前記問い合わせ内容に応じて、前記会話データの一部又は全部を前記設定範囲として特定する、請求項２に記載の情報処理装置。
　前記会話の内容を音声認識によりテキストに変換するテキスト変換部を有し、
　前記検出部は、
　前記会話の内容を変換したテキストから、前記問い合わせ内容を検出する、請求項３に記載の情報処理装置。
　前記特定部は、
　前記会話データに含まれる一部又は全部のデータのみを対象として、前記対象の時間的な範囲の全部又は一部を前記設定範囲として特定し、
　前記設定部は、
　前記対象の前記設定範囲に対して前記時刻認証を設定する、請求項２乃至４の何れか一項に記載の情報処理装置。
　前記特定部は、
　前記問い合わせ内容と前記会話の内容における重要事項とに応じて、前記対象と前記設定範囲とを特定する、請求項５に記載の情報処理装置。
　前記特定部は、
　前記問い合わせ内容に応じて、又は、前記問い合わせ内容と前記会話の内容における重要事項とに応じて、前記対象と前記設定範囲とを特定する、請求項６に記載の情報処理装置。
　前記特定部は、
　前記重要事項が発生した時刻を起点する所定の範囲を前記設定範囲として特定する、請求項６又は７に記載の情報処理装置。
　前記重要事項には、予め決められた重要な用語の発話と、予め決められた重要な動作の実行との少なくとも一方が含まれる、請求項８に記載の情報処理装置。
　前記特定部は、
　前記会話の内容を変換したテキスト中で所定の用語を含む文節又は文の区切りで表される範囲、所定の接続詞を始点及び終点とする範囲、前記接続詞を基準点と所定の範囲、前記テキストから自然言語解析により抽出した範囲のうち、特定のシーンを表す範囲、の少なくとも１つを前記設定範囲として特定する、請求項４に記載の情報処理装置。
　複数人の会話の内容に応じて、前記会話を表す会話データの一部又は全部を、時刻認証の設定範囲として特定する特定手順と、
　特定された前記設定範囲に対して時刻認証を設定する設定手順と、
　をコンピュータが実行する情報処理方法。
　複数人の会話の内容に応じて、前記会話を表す会話データの一部又は全部を、時刻認証の設定範囲として特定する特定手順と、
　特定された前記設定範囲に対して時刻認証を設定する設定手順と、
　をコンピュータに実行させるプログラム。