JP2023076003A

JP2023076003A - プログラム、情報処理システム及び情報処理方法

Info

Publication number: JP2023076003A
Application number: JP2021189134A
Authority: JP
Inventors: 真生小川; Masanari Ogawa
Original assignee: Revcomm; Revcomm Inc
Current assignee: Revcomm; Revcomm Inc
Priority date: 2021-11-22
Filing date: 2021-11-22
Publication date: 2023-06-01
Anticipated expiration: 2041-11-22
Also published as: JP7237381B1; JP2023076430A; WO2023090380A1

Abstract

【課題】ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができるプログラム、情報処理システム及び情報処理方法を提供する。
【解決手段】要約処理プログラムは、複数のテキスト情報を発話時刻の順番に並べた場合に、話者情報が変化する前後のテキスト情報をテキスト情報群としてバインディングするバインディングステップＳ１０５と、複数のテキスト情報および１または複数のテキスト情報群に対して重要度を算定する重要度算定ステップＳ１０６と、重要度に基づき、テキスト情報またはテキスト情報群を抽出して表示する要約文書表示ステップＳ１０７と、を含む。
【選択図】図１４

Description

特許法第３０条第２項適用申請有り（ア）サービスのリリースによる発明の公開１．サービスのリリース日２０２０年１１月２６日２０２１年６月１日２．ウェブサイトのアドレスｈｔｔｐｓ：／／ｍｉｉｔｅｌ．ｒｅｖｃｏｍｍ．ｃｏ．ｊｐ／３．公開者株式会社ＲｅｖＣｏｍｍ（イ）ウェブサイトによる発表１．ウェブサイトにおける公開日ａ．２０２０年１１月２６日ｂ．２０２１年６月１日ｃ．２０２１年１０月４日２．ウェブサイトのアドレスａ．ｈｔｔｐｓ：／／ｓｕｐｐｏｒｔ．ｍｉｉｔｅｌ．ｊｐｂ．ｈｔｔｐｓ：／／ｓｕｐｐｏｒｔ．ｍｉｉｔｅｌ．ｊｐｃ．ｈｔｔｐｓ：／／ｗｗｗ．ｒｅｖｃｏｍｍ．ｃｏ．ｊｐ３．公開者株式会社ＲｅｖＣｏｍｍ

本開示は、プログラム、情報処理システム及び情報処理方法に関する。

従来、通話サービスを提供するコンピュータシステムにおいて、通話内容を特徴づける要約文書を作成する技術が知られている。
特許文献１には、対話の内容から重要な文を抽出して要約を生成する技術が開示されている。特許文献２には、対話構造を利用して単語単位で対話テキストを読み易く訂正する要約技術が開示されている。特許文献３には、コールセンタにおいて、スーパバイザの監視業務の効率化と、オペレータの顧客への応対品質を向上させる技術が開示されている。

特開２０１３―１２０５１４号特開２０１７―１１１１９０号特開２０２０―１５０４０８号

しかしながら、ユーザと顧客との間で行われる通話において、発話、応対のいずれか一方が省略された要約情報が生成されることがあり、要約情報を確認したユーザにとっては何に対して発話、応対がなされているのか確認することが難しい場合があった。

そこで、本開示は、上記課題を解決すべくなされたものであって、その目的は、ユーザと顧客との発話、応対からなる要約情報を生成する技術を提供することである。

プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータをコンピュータに管理させるためのプログラムであって、プログラムは、プロセッサに、通話に関する音声データを受け付ける受付ステップと、音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップと、複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップと、テキスト抽出ステップにおいて抽出された複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数のテキスト情報を要約情報として抽出する要約抽出ステップと、を実行するプログラム。

ユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

情報処理システム１の全体の構成を示す図である。サーバ１０の機能構成を示すブロック図である。ユーザ端末２０の機能構成を示すブロック図である。ＣＲＭシステム３０の機能構成を示すブロック図である。顧客端末５０の機能構成を示すブロック図である。ユーザテーブル１０１２のデータ構造を示す図である。組織テーブル１０１３のデータ構造を示す図である。通話テーブル１０１４のデータ構造を示す図である。音声認識テーブル１０１５のデータ構造を示す図である。要約テーブル１０１６のデータ構造を示す図である。応対メモテーブル１０１７のデータ構造を示す図である。顧客テーブル３０１２のデータ構造を示す図である。応対履歴テーブル３０１３のデータ構造を示す図である。要約処理（第一実施例）の動作を示すフローチャートである。要約処理（第二実施例）の動作を示すフローチャートである。応対メモ付与処理の動作を示すフローチャートである。応対メモ提案処理の動作を示すフローチャートである。スコア算定処理の動作を示すフローチャートである。ＣＲＭ記憶処理の動作を示すフローチャートである。通話表示処理の動作を示すフローチャートである。要約処理（第一実施例）におけるバインディング処理の概要を示した図である。要約処理（第二実施例）における追加抽出処理の概要を示した図である。要約表示処理の概要を示した図である。通話表示処理におけるＣＲＭサービスの画面例を示した図である。コンピュータ９０の基本的なハードウェア構成を示すブロック図である。

以下、本開示の実施形態について図面を参照して説明する。実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。なお、以下の実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。また、各図は模式図であり、必ずしも厳密に図示されたものではない。

＜情報処理システム１の概要＞
図１は、情報処理システム１の全体の構成を示す図である。本開示における情報処理システム１は、本開示にかかる通話サービスを提供する情報処理システムである。情報処理システム１は、ユーザと顧客との間で行われる通話に関するサービスを提供するとともに、通話に関連するデータを記憶、管理するための情報処理システムである。

＜情報処理システム１の基本構成＞
本開示における情報処理システム１を図１に示す。情報処理システム１は、ネットワークＮを介して接続された、サーバ１０、複数のユーザ端末２０Ａ、２０Ｂ、２０Ｃ、ＣＲＭシステム３０、音声サーバ（ＰＢＸ）４０、および、音声サーバ（ＰＢＸ）４０に対して電話網Ｔを介して接続された顧客端末５０Ａ、５０Ｂ、５０Ｃを備えて構成されている。
図２は、サーバ１０の機能構成を示すブロック図である。図３は、ユーザ端末２０の機能構成を示すブロック図である。図４は、ＣＲＭシステム３０の機能構成を示すブロック図である。図５は、顧客端末５０の機能構成を示すブロック図である。

サーバ１０は、ユーザと顧客との間で行われる通話に関連するデータ（通話データ）を記憶、管理するサービスを提供する情報処理装置である。

ユーザ端末２０は、サービスを利用するユーザが操作する情報処理装置である。ユーザ端末２０は、例えば、据え置き型のＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、ラップトップＰＣでもよいし、スマートフォン、タブレット等の携帯端末であってもよい。また、ＨＭＤ（ＨｅａｄＭｏｕｎｔＤｉｓｐｌａｙ）、腕時計型端末等のウェアラブル端末であってもよい。

ＣＲＭシステム３０は、ＣＲＭ（ＣｕｓｔｏｍｅｒＲｅｌａｔｉｏｎｓｈｉｐＭａｎａｇｅｍｅｎｔ、顧客関係管理）サービスを提供する事業者（ＣＲＭ事業者）が管理、運営する情報処理装置である。ＣＲＭサービスとしては、ＳａｌｅｓＦｏｒｃｅ、ＨｕｂＳｐｏｔ、ＺｏｈｏＣＲＭ、ｋｉｎｔｏｎｅなどがある。

音声サーバ（ＰＢＸ）４０は、ネットワークＮと電話網Ｔとを互いに接続することでユーザ端末２０と顧客端末５０との間における通話を可能とする交換機として機能する情報処理装置である。

顧客端末５０は、顧客がユーザと通話する際に操作する情報処理装置である。顧客端末５０は、例えば、スマートフォン、タブレット等の携帯端末でもよいし、据え置き型のＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、ラップトップＰＣであってもよい。また、ＨＭＤ（ＨｅａｄＭｏｕｎｔＤｉｓｐｌａｙ）、腕時計型端末等のウェアラブル端末であってもよい。

各情報処理装置は演算装置と記憶装置とを備えたコンピュータにより構成されている。コンピュータの基本ハードウェア構成および、当該ハードウェア構成により実現されるコンピュータの基本機能構成は後述する。サーバ１０、ユーザ端末２０、ＣＲＭシステム３０、音声サーバ（ＰＢＸ）４０、顧客端末５０のそれぞれについて、後述するコンピュータの基本ハードウェア構成およびコンピュータの基本機能構成と重複する説明は省略する。

以下、各装置の構成およびその動作を説明する。

＜サーバ１０の機能構成＞
サーバ１０のハードウェア構成が実現する機能構成を図２に示す。サーバ１０は、記憶部１０１、制御部１０４を備える。

＜サーバ１０の記憶部の構成＞
サーバ１０の記憶部１０１は、アプリケーションプログラム１０１１、ユーザテーブル１０１２、組織テーブル１０１３、通話テーブル１０１４、音声認識テーブル１０１５、要約テーブル１０１６、応対メモテーブル１０１７を備える。
図６は、ユーザテーブル１０１２のデータ構造を示す図である。図７は、組織テーブル１０１３のデータ構造を示す図である。図８は、通話テーブル１０１４のデータ構造を示す図である。図９は、音声認識テーブル１０１５のデータ構造を示す図である。図１０は、要約テーブル１０１６のデータ構造を示す図である。図１１は、応対メモテーブル１０１７のデータ構造を示す図である。

ユーザテーブル１０１２は、サービスを利用する会員ユーザ（以下、ユーザ）の情報を記憶し管理するテーブルである。ユーザは、サービスの利用登録を行うことで、当該ユーザの情報がユーザテーブル１０１２の新しいレコードに記憶される。これにより、ユーザは本開示にかかるサービスを利用できるようになる。ユーザテーブル１０１２は、ユーザＩＤを主キーとし、ユーザＩＤ、ＣＲＭＩＤ、組織ＩＤ、ユーザ名、連携モード、ユーザ属性、評価指標のカラムを有するテーブルである。

ユーザＩＤは、ユーザを識別するためのユーザ識別情報を記憶する項目である。
ＣＲＭＩＤは、ＣＲＭシステム３０において、ユーザを識別するための識別情報を記憶する項目である。ユーザはＣＲＭＩＤによりＣＲＭシステム３０にログインすることにより、ＣＲＭサービスの提供を受けることができる。つまり、サーバ１０におけるユーザＩＤと、ＣＲＭシステム３０におけるＣＲＭＩＤが紐付けられる。
組織ＩＤは、ユーザが所属する組織の組織ＩＤを記憶する項目である。
ユーザ名は、ユーザの氏名を記憶する項目である。
連携モードは、ユーザと顧客との間で行われる通話に関連するデータを外部のＣＲＭシステムに記憶する際の設定項目（連携設定）を記憶する項目である。
本開示において、連携モードはユーザごとに記憶されるものとしたが、組織テーブルにおいて、組織、部署ごとに記憶しても良い。その場合、各ユーザに適用される連携モードは、組織テーブルに記憶された、組織、部署ごとの連携モードを参照して各ユーザに対して適用される。このとき、組織、部署に所属するユーザに対して一律の連携モードを適用することができる。
ユーザ属性は、ユーザの年齢、性別、出身地、方言、職種（営業、カスタマーサポートなど）などのユーザの属性に関する情報を記憶する項目である。
評価指標は、ユーザの通話応対スキルに対する定量的な評価指標を記憶する項目である。具体的に、評価指標は、ユーザの過去の音声データを解析することにより得られる後述する解析データの各指標（Ｔａｌｋ：Ｌｉｓｔｅｎ比率、沈黙回数、被り回数、ラリー回数、基本周波数、抑揚の強弱、話速、フィラー数、トークスクリプト一致度など）に対して所定のアルゴリズムを適用することにより算定される数値である。
評価指標は、例えば、インサイドセールスなどの分野においては、ユーザごとの顧客応対スキルを定量的に表したものに相当し、評価指標が高いユーザほど高い営業成績が期待される。

組織テーブル１０１３は、ユーザが所属する組織に関する情報を定義するテーブルである。組織は、会社、法人、企業グループ、サークル、各種団体など任意の組織、グループなどが含まれる。組織は、会社の部署（営業部、総務部、カスタマーサポート部）などのより詳細なサブグループごとに定義しても良い。組織テーブル１０１３は、組織ＩＤを主キーとして、組織ＩＤ、組織名、組織属性のカラムを有するテーブルである。

組織ＩＤは、組織を識別するための組織識別情報を記憶する項目である。
組織名は、組織の名称を記憶する項目である。組織の名称は、会社名、法人名、企業グループ名、サークル名、各種団体名など任意の組織名、グループ名を含む。
組織属性は、組織種別（会社、企業グループ、その他団体など）、業種（不動産、金融など）などの組織の属性に関する情報を記憶する項目である。

通話テーブル１０１４は、ユーザと顧客との間で行われる通話に関連する通話データを記憶し管理するテーブルである。通話テーブル１０１４は、通話ＩＤを主キーとし、通話ＩＤ、ユーザＩＤ、顧客ＩＤ、通話カテゴリ、受発信種別、音声データ、音声認識有無、要約有無、解析データのカラムを有するテーブルである。

通話ＩＤは、通話データを識別するための通話データ識別情報を記憶する項目である。
ユーザＩＤは、ユーザと顧客との間で行われる通話において、ユーザのユーザＩＤ（ユーザ識別情報）を記憶する項目である。
顧客ＩＤは、ユーザと顧客との間で行われる通話において、顧客の顧客ＩＤ（顧客識別情報）を記憶する項目である。
通話カテゴリは、ユーザと顧客との間で行われた通話の種類（カテゴリ）を記憶する項目である。通話データは、通話カテゴリにより分類される。通話カテゴリには、ユーザと顧客との間で行われる通話の目的などに応じて、テレフォンオペレーター、テレマーケティング、カスタマーサポート、テクニカルサポートなどの値が記憶される。
受発信種別は、ユーザと顧客との間で行われた通話が、ユーザが発信した（アウトバウンド）ものか、ユーザが受信した（インバウンド）もののいずれかを区別するための情報を記憶する項目である。
音声データは、ユーザと顧客との間で行われた通話の音声データを記憶する項目である。音声データの形式としては、ｍｐ４、ｗａｖなど各種音声データ形式を用いることができる。また、他の場所に配置された音声データファイルに対する参照情報（パス）を記憶するものとしても良い。
音声データは、ユーザの音声と顧客の音声とが、それぞれ独立して識別可能な識別子が設定された形式のデータであっても良い。この場合、サーバ１０の制御部１０４は、ユーザの音声、顧客の音声に対してそれぞれ独立した解析処理を実行することができる。
本開示において、音声データに替えて、音声情報を含む動画データを用いても構わない。また、本開示における音声データは、動画データに含まれる音声データも含む概念である。
音声認識有無は、ユーザと顧客との間で行われた通話の音声データに対して音声認識処理が行われたか否かを判定するための情報を記憶する項目である。音声データに対し音声認識処理が行われている場合は、音声認識処理が行われていることを示す情報などが記憶される。音声データに対し音声認識処理が行われていない場合は、ブランク、ヌル、その他、音声認識処理が行われていないことを示す情報などが記憶される。
要約有無は、ユーザと顧客との間で行われた通話の音声データに対して要約処理が行われたか否かを判定するための情報を記憶する項目である。要約処理が行われている場合は、要約処理が行われていることを示す情報などが記憶される。要約処理が行われていない場合は、ブランク、ヌル、その他、要約処理が行われていないことを示す情報などが記憶される。
解析データは、ユーザと顧客との間で行われた通話の音声データの音声を解析して得られた解析データを記憶する項目である。解析データには、Ｔａｌｋ：Ｌｉｓｔｅｎ比率、沈黙回数、被り回数、ラリー回数、基本周波数、抑揚の強弱、話速、フィラー数、トークスクリプト一致度などが含まれる。

音声認識テーブル１０１５は、ユーザと顧客との間で行われた通話の音声データに対して音声認識処理を行い得られた発話時刻、話者、テキストからなる音声認識情報を記憶するテーブルである。音声認識テーブル１０１５は、通話ＩＤ、テキスト、発話時刻、話者のカラムを有するテーブルである。

通話ＩＤは、音声認識情報の生成元となる通話データの通話ＩＤ（通話データ識別情報）を記憶する項目である。
テキストは、ユーザと顧客との間で行われた通話の音声データの音声が存在する区間（発話区間）ごとのテキスト認識結果のテキスト情報を記憶する項目である。具体的には、音声データの発話区間ごとの話者により発話された文章内容がテキストデータとして記憶される。
発話時刻は、発話区間の音声データ（区間音声データ）中の開始時刻を記憶する項目である。なお、発話時刻は、各発話区間の開始時刻、各発話区間の終了時刻、各発話区間の任意の間の時刻など各発話区間に関連した任意の時刻としても良い。
話者は、区間音声データの話者を識別するための情報が記憶される。具体的には、ユーザまたは顧客を識別するための情報である。なお、ユーザＩＤ、顧客ＩＤなどの話者を識別するためのユーザ識別情報、顧客識別情報などが記憶されても良い。

要約テーブル１０１６は、ユーザと顧客との間で行われた通話の音声認識情報に対して要約処理を行い得られた発話時刻、話者、テキストからなる要約情報を記憶するテーブルである。要約情報は、ユーザと顧客との間で行われた通話に関連し、当該通話を特徴づけるテキストからなる情報である。ユーザは、要約情報を確認することにより、ユーザと顧客との間で行われた通話の内容を短時間で把握することができる。要約テーブル１０１６は、通話ＩＤ、テキスト、発話時刻、話者のカラムを有するテーブルである。

通話ＩＤは、要約情報の生成元となる通話データの通話ＩＤ（通話データ識別情報）を記憶する項目である。
テキストは、要約情報として抽出された音声認識情報のテキストを記憶する項目である。
発話時刻は、要約情報として抽出された音声認識情報の発話時刻を記憶する項目である。
話者は、要約情報として抽出された音声認識情報の話者を記憶する項目である。

応対メモテーブル１０１７は、ユーザと顧客との間で行われる通話に関連する通話データに対して紐付けられ記憶される応対メモに関する情報を記憶し管理するテーブルである。ユーザは、通話データに対して応対メモを設定（付与）することにより多数の通話データを整理し管理することができる。また、サーバ１０は、各種制御処理を行う際に通話データに付与された応対メモを用いて処理条件を変化させることができる。応対メモテーブル１０１７は、メモＩＤを主キーとし、メモＩＤ、通話ＩＤ、付与者ＩＤ、メモ内容、メモ日時のカラムを有するテーブルである。

メモＩＤは、応対メモを識別するための応対メモ識別情報を記憶する項目である。
通話ＩＤは、応対メモが付与された通話データの通話ＩＤ（通話データ識別情報）を記憶する項目である。
付与者ＩＤは、通話データに対して応対メモを付与したユーザのユーザＩＤを記憶する項目である。
メモ内容は、通話データに対して付与される応対メモの内容を記憶する項目である。メモ内容は、通常は文字列（テキスト）情報である。
メモ日時は、ユーザが通話データに対して応対メモを付与した日時を記憶する項目である。

＜サーバ１０の制御部の構成＞
サーバ１０の制御部１０４は、ユーザ登録制御部１０４１、設定部１０４２、認識部１０４３、解析部１０４４、重要度算定部１０４５、要約部１０４６、学習部１０４７、応対メモ提案部１０４８、応対メモ付与部１０４９、スコア算定部１０５０、ＣＲＭ記憶制御部１０５１、表示制御部１０５２を備える。制御部１０４は、記憶部１０１に記憶されたアプリケーションプログラム１０１１を実行することにより、各機能ユニットが実現される。

ユーザ登録制御部１０４１は、本開示に係るサービスの利用を希望するユーザの情報をユーザテーブル１０１２に記憶する処理を行う。
ユーザテーブル１０１２に記憶される、ユーザＩＤ、ユーザ名、ユーザ属性などの情報は、ユーザが任意の情報処理端末からサービス提供者が運営するウェブページなどを開き、所定の入力フォームにユーザＩＤ、ユーザ名、ユーザ属性を入力しサーバ１０へ送信する。サーバ１０のユーザ登録制御部１０４１は、受信したユーザＩＤ、ユーザ名、ユーザ属性をユーザテーブル１０１２の新しいレコードに記憶し、ユーザ登録が完了する。これにより、ユーザテーブル１０１２に記憶されたユーザはサービスを利用することができるようになる。
ユーザ登録制御部１０４１によるユーザ情報のユーザテーブル１０１２への登録に先立ち、サービス提供者は所定の審査を行いユーザによるサービス利用可否を制限しても良い。
ユーザＩＤは、ユーザを識別できる任意の文字列または数字で良く、ユーザが希望する任意の文字列または数字、もしくはサーバ１０のユーザ登録制御部１０４１が自動的に任意の文字列または数字を設定しても良い。
ユーザ登録制御部１０４１は、ユーザ登録の際に、ユーザと紐付けて、ユーザが所属する組織の組織ＩＤ、組織名、組織属性などの情報を組織テーブル１０１３に記憶しても良い。ユーザが所属する組織の情報は、ユーザ自身が入力しても良いし、ユーザが所属する組織の管理者、本開示にかかるサービスの運営者などが登録するものとしても良い。

設定部１０４２は、連携モード設定処理を実行する。詳細は後述する。
認識部１０４３は、音声認識処理を実行する。詳細は後述する。
解析部１０４４は、音声解析処理を実行する。詳細は後述する。
重要度算定部１０４５は、重要度算定処理を実行する。詳細は後述する。
要約部１０４６は、要約処理を実行する。詳細は後述する。
学習部１０４７は、学習処理を実行する。詳細は後述する。
応対メモ提案部１０４８は、応対メモ提案処理を実行する。詳細は後述する。
応対メモ付与部１０４９は、応対メモ付与処理を実行する。詳細は後述する。
スコア算定部１０５０は、スコア算定処理を実行する。詳細は後述する。
ＣＲＭ記憶制御部１０５１は、ＣＲＭ記憶処理を実行する。詳細は後述する。
表示制御部１０５２は、通話表示処理を実行する。詳細は後述する。

＜ユーザ端末２０の機能構成＞
ユーザ端末２０のハードウェア構成が実現する機能構成を図３に示す。ユーザ端末２０は、記憶部２０１、制御部２０４、ユーザ端末２０に接続された入力装置２０６、出力装置２０８を備える。入力装置２０６は、カメラ２０６１、マイク２０６２、位置情報センサ２０６３、モーションセンサ２０６４、キーボード２０６５、マウス２０６６を含む。出力装置２０８は、ディスプレイ２０８１、スピーカ２０８２を含む。

＜ユーザ端末２０の記憶部の構成＞
ユーザ端末２０の記憶部２０１は、ユーザ端末２０を利用するユーザを識別するためのユーザＩＤ２０１１、アプリケーションプログラム２０１２、ＣＲＭＩＤ２０１３を記憶する。
ユーザＩＤは、サーバ１０に対するユーザのアカウントＩＤである。ユーザは、ユーザ端末２０からユーザＩＤ２０１１を、サーバ１０へ送信する。サーバ１０は、ユーザＩＤ２０１１に基づきユーザを識別し、本開示にかかるサービスをユーザに対して提供する。なお、ユーザＩＤには、ユーザ端末２０を利用しているユーザを識別するにあたりサーバ１０から一時的に付与されるセッションＩＤなどの情報を含む。
ＣＲＭＩＤは、ＣＲＭシステム３０に対するユーザのアカウントＩＤである。ユーザは、ユーザ端末２０からＣＲＭＩＤ２０１３を、ＣＲＭシステム３０へ送信する。ＣＲＭシステム３０は、ＣＲＭＩＤ２０１３に基づきユーザを識別し、ＣＲＭサービスをユーザに対して提供する。なお、ＣＲＭＩＤ２０１３には、ユーザ端末２０を利用しているユーザを識別するにあたりＣＲＭシステム３０から一時的に付与されるセッションＩＤなどの情報を含む。
アプリケーションプログラム２０１２は、記憶部２０１に予め記憶されていても良いし、通信ＩＦを介してサービス提供者が運営するウェブサーバ等からダウンロードする構成としても良い。アプリケーションプログラム２０１２は、ユーザ端末２０に記憶されているウェブブラウザアプリケーション上で実行されるＪａｖａＳｃｒｉｐｔ（登録商標）などのインタープリター型プログラミング言語を含む。

＜ユーザ端末２０の制御部の構成＞
ユーザ端末２０の制御部２０４は、入力制御部２０４１および出力制御部２０４２を備える。制御部２０４は、記憶部２０１に記憶されたアプリケーションプログラム２０１２を実行することにより、入力制御部２０４１、出力制御部２０４２の機能ユニットが実現される。
ユーザ端末２０の入力制御部２０４１は、ユーザ端末２０に接続されたカメラ２０６１、マイク２０６２、位置情報センサ２０６３、モーションセンサ２０６４、キーボード２０６５、マウス２０６６などの入力装置から出力される情報を取得し各種処理を実行する。ユーザ端末２０の入力制御部２０４１は、入力装置２０６から取得した情報をユーザＩＤ２０１１とともにサーバ１０へ送信する処理を実行する。同様に、ユーザ端末２０の入力制御部２０４１は、入力装置２０６から取得した情報をＣＲＭＩＤ２０１３とともにＣＲＭシステム３０へ送信する処理を実行する。
ユーザ端末２０の出力制御部２０４２は、入力装置２０６に対するユーザによる操作およびサーバ１０、ＣＲＭシステム３０から情報を受信し、ユーザ端末２０に接続されたディスプレイ２０８１の表示内容、スピーカ２０８２の音声出力内容の制御処理を実行する。

＜ＣＲＭシステム３０の機能構成＞
ＣＲＭシステム３０のハードウェア構成が実現する機能構成を図４に示す。ＣＲＭシステム３０は、記憶部３０１、制御部３０４を備える。
ユーザは、別途ＣＲＭ事業者とも契約を締結しており、ユーザごとに設定されたＣＲＭＩＤ２０１３を用いてＣＲＭ事業者が運営するウェブサイトへウェブブラウザなどを介してアクセス（ログイン）することにより、ＣＲＭサービスの提供を受ける事ができる。

＜ＣＲＭシステム３０の記憶部の構成＞
ＣＲＭシステム３０の記憶部３０１は、顧客テーブル３０１２、応対履歴テーブル３０１３を備える。
図１２は、顧客テーブル３０１２のデータ構造を示す図である。図１３は、応対履歴テーブル３０１３のデータ構造を示す図である。

顧客テーブル３０１２は、顧客情報を記憶し管理するためのテーブルである。顧客テーブル３０１２は、顧客ＩＤを主キーとし、顧客ＩＤ、ユーザＩＤ、氏名、電話番号、顧客属性、顧客組織名、顧客組織属性のカラムを有するテーブルである。

顧客ＩＤは、顧客を識別するための顧客識別情報を記憶する項目である。
ユーザＩＤは、顧客に紐付けられたユーザのユーザＩＤ（ユーザ識別情報）を記憶する項目である。ユーザは、自身のユーザＩＤに紐付けられた顧客を一覧表示したり、顧客に対して発信（架電）することができる。
本開示において、顧客はユーザに対して紐付けられるものとしたが、組織（組織テーブル１０１３の組織ＩＤ）に対して紐付けても良い。その場合、組織に所属するユーザは、自身の組織ＩＤに紐付けられた顧客を一覧表示したり、顧客に対して発信することができる。
氏名は、顧客の氏名を記憶する項目である。
電話番号は、顧客の電話番号を記憶する項目である。
ユーザは、ＣＲＭシステムが提供するウェブサイトにアクセスし、電話を発信したい顧客を選択し「発信」などの所定の操作を行なうことにより、ユーザ端末２０から顧客の電話番号に対して電話を発信することができる。
顧客属性は、顧客の年齢、性別、出身地、方言、職種（営業、カスタマーサポートなど）などの顧客の属性に関する情報を記憶する項目である。
顧客組織名は、顧客の所属する組織の名称を記憶する項目である。組織の名称は、会社名、法人名、企業グループ名、サークル名、各種団体名など任意の組織名、グループ名を含む。
顧客組織属性は、顧客の組織種別（会社、企業グループ、その他団体など）、業種（不動産、金融など）などの組織の属性に関する情報を記憶する項目である。
顧客属性、顧客組織名、顧客組織属性は、ユーザが入力することにより記憶する構成としても良いし、所定のウェブサイトへ顧客がアクセスすることにより、顧客に入力させても良い。

応対履歴テーブル３０１３は、顧客対応（応対履歴）の記録（応対履歴情報）を記憶し管理するためのテーブルである。顧客対応が営業活動の場合には、過去の営業活動の記録（日時、営業活動の内容など）が記憶される。応対履歴テーブル３０１３は、応対履歴ＩＤを主キーとし、応対履歴ＩＤ、通話ＩＤ、ＵＲＬ、顧客ＩＤ、ユーザＩＤ（発信者）、ダイアル日時、通話開始日時、通話終了日時、コメントのカラムを有するテーブルである。

本開示においては、ユーザと顧客との間で通話が行われるごとに、新たにレコードが作成され応対履歴情報が記憶される。
応対履歴ＩＤは、応対履歴を識別するための応対履歴識別情報を記憶する項目である。
通話ＩＤは、応対履歴に関する通話データの通話ＩＤ（通話データ識別情報）を記憶する項目である。これにより、ＣＲＭシステムにおける応対履歴は、サーバ１０の通話データと紐付けられる。
ＵＲＬは、通話ＩＤを一意に特定する文字列を含むＵＲＬ（ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ）情報である。ＵＲＬには通話ＩＤが直接含まれていても良いし、通話ＩＤを復号可能な文字列、その他、不図示のテーブルを参照して通話ＩＤを取得できる特定の文字列が含まれていても良い。ユーザは、ユーザ端末２０のブラウザを操作し、ＵＲＬを開くことにより、サーバ１０にアクセスし応対履歴に関する通話データの解析データを可視化した解析結果画面を確認することができる。
顧客ＩＤは、応対履歴に関する顧客の顧客ＩＤ（顧客識別情報）を記憶する項目である。
ユーザＩＤは、応対履歴に関するユーザのユーザＩＤ（ユーザ識別情報）を記憶する項目である。
ダイアル日時は、応対履歴に関して、ユーザが顧客に対して発信を行った日時を記憶する項目である。
通話開始日時は、応対履歴に関して、ユーザと顧客との間で行われた通話の開始日時を記憶する項目である。
通話終了日時は、応対履歴に関して、ユーザと顧客との間で行われた通話の終了日時を記憶する項目である。
コメントは、応対履歴に関して、メモ、コメントなどのテキスト情報を記憶する項目である。ユーザは、応対履歴に関して気づいた事項、申し送り事項などをコメントに事由に編集することができる。また、サーバ１０の制御部１０４は、ＣＲＭシステム３０のＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ）へ所定のリクエストを送信することにより、コメントを自由に編集することができる。

＜ＣＲＭシステム３０の制御部の構成＞
ＣＲＭシステム３０の制御部３０４は、ユーザ登録制御部３０４１を備える。制御部３０４は、記憶部３０１に記憶されたアプリケーションプログラム３０１１を実行することにより、各機能ユニットが実現される。

ＣＲＭシステム３０は、ＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ）、ＳＤＫ（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ）、コードスニペッド（以下、「ビーコン」と呼ぶ）と呼ばれる機能を提供しており、ユーザは予め本開示にかかるサーバ１０およびＣＲＭシステム３０についてアカウント情報などの紐付け設定を行うことにより、サーバ１０の制御部１０４とＣＲＭシステム３０の制御部３０４は相互に通信し、任意の情報処理を実現することができる。

＜音声サーバ（ＰＢＸ）４０の概要＞
音声サーバ（ＰＢＸ）４０は、ユーザから顧客に対する発信があった場合に、顧客端末５０に対し発信（呼出し）を行う。
音声サーバ（ＰＢＸ）４０は、顧客からユーザに対する発信があった場合に、ユーザ端末２０に対し、その旨を示すメッセージ（以下、「着信通知メッセージ」と呼ぶ）を送る。また、音声サーバ（ＰＢＸ）４０は、サーバ１０が提供するビーコン、ＳＤＫ、ＡＰＩなどに着信通知メッセージを送ることができる。

＜顧客端末５０の機能構成＞
顧客端末５０のハードウェア構成が実現する機能構成を図５に示す。顧客端末５０は、記憶部５０１、制御部５０４、タッチパネル５０６、タッチセンシティブデバイス５０６１、ディスプレイ５０６２、マイク５０８１、スピーカ５０８２、位置情報センサ５０８３、カメラ５０８４、モーションセンサ５０８５を備える。

＜顧客端末５０の記憶部の構成＞
顧客端末５０の記憶部５０１は、顧客端末５０を利用する顧客の電話番号５０１１、アプリケーションプログラム５０１２を記憶する。
アプリケーションプログラム５０１２は、記憶部５０１に予め記憶されていても良いし、通信ＩＦを介してサービス提供者が運営するウェブサーバ等からダウンロードする構成としても良い。アプリケーションプログラム５０１２は、顧客端末５０に記憶されているウェブブラウザアプリケーション上で実行されるＪａｖａＳｃｒｉｐｔ（登録商標）などのインタープリター型プログラミング言語を含む。

＜顧客端末５０の制御部の構成＞
顧客端末５０の制御部５０４は、入力制御部５０４１および出力制御部５０４２を備える。制御部５０４は、記憶部５０１に記憶されたアプリケーションプログラム５０１２を実行することにより、入力制御部５０４１、出力制御部５０４２の機能ユニットが実現される。
顧客端末５０の入力制御部５０４１は、ユーザによるタッチパネル５０６のタッチセンシティブデバイス５０６１への操作内容、マイク５０８１への音声入力、位置情報センサ５０８３、カメラ５０８４、モーションセンサ５０８５などの入力装置から出力される情報を取得し各種処理を実行する。
顧客端末５０の出力制御部５０４２は、入力装置に対するユーザによる操作およびサーバ１０から情報を受信し、ディスプレイ５０６２の表示内容、スピーカ５０８２の音声出力内容などの制御処理を実行する。

＜情報処理システム１の動作＞
以下、情報処理システム１の各処理について説明する。
図１４は、要約処理（第一実施例）の動作を示すフローチャートである。
図１５は、要約処理（第二実施例）の動作を示すフローチャートである。
図１６は、応対メモ付与処理の動作を示すフローチャートである。
図１７は、応対メモ提案処理の動作を示すフローチャートである。
図１８は、スコア算定処理の動作を示すフローチャートである。
図１９は、ＣＲＭ記憶処理の動作を示すフローチャートである。
図２０は、通話表示処理の動作を示すフローチャートである。
図２１は、要約処理（第一実施例）におけるバインディング処理の概要を示した図である。
図２２は、要約処理（第二実施例）における追加抽出処理の概要を示した図である。
図２３は、要約表示処理の概要を示した図である。
図２４は、通話表示処理におけるＣＲＭサービスの画面例を示した図である。

＜用語定義＞
情報処理システム１の各処理について説明するにあたり、用語を以下の通り定義する。
通話データは、ユーザと顧客との間で行われる通話に関するデータであり、通話テーブル１０１４の各項目に記憶されたデータ、通話ＩＤにより紐づけられた音声認識テーブル１０１５の各項目に記憶されたデータ、通話ＩＤにより紐づけられた要約テーブル１０１６の各項目に記憶されたデータなどを含むデータである。通話ＩＤにより紐づけられた応対メモテーブル１０１７、応対履歴テーブル３０１３の各項目に記憶されたデータなどを含むデータである。
通話属性は、ユーザと顧客との間で行われる通話の属性に関するデータであり、ユーザ属性、ユーザの所属する組織の組織名または組織属性、顧客属性、顧客の所属する組織の組織名または組織属性、通話カテゴリ、受発信者種別などを含む。つまり、通話データは、通話を行なうユーザのユーザ属性、通話を行なう顧客の顧客属性、通話の通話カテゴリ、受発信者種別などの属性値により特徴づけられることになる。

＜発信処理＞
発信処理は、ユーザから顧客に対し発信（架電）する処理である。

＜発信処理の概要＞
発信処理は、ユーザはユーザ端末２０の画面に表示された複数の顧客のうち発信を希望する顧客を選択し、発信操作を行うことにより、顧客に対して発信を行なう一連の処理である。

＜発信処理の詳細＞
ユーザから顧客に発信する場合における情報処理システム１の発信処理について説明する。

ユーザが顧客に発信する場合、情報処理システム１において以下の処理が実行される。

ユーザはユーザ端末２０を操作することにより、ウェブブラウザを起動し、ＣＲＭシステム３０が提供するＣＲＭサービスのウェブサイトへアクセスする。ユーザは、CRMサービスが提供する顧客管理画面を開くことにより自身の顧客をユーザ端末２０のディスプレイ２０８１へ一覧表示することができる。
具体的に、ユーザ端末２０は、ＣＲＭＩＤ２０１３および顧客を一覧表示する旨のリクエストをＣＲＭシステム３０へ送信する。ＣＲＭシステム３０は、リクエストを受信すると、顧客テーブル３０１２を検索し、顧客ＩＤ、氏名、電話番号、顧客属性、顧客組織名、顧客組織属性などのユーザの顧客に関する情報をユーザ端末２０に送信する。ユーザ端末２０は、受信した顧客に関する情報をユーザ端末２０のディスプレイ２０８１に表示する。

ユーザは、ユーザ端末２０のディスプレイ２０８１に一覧表示された顧客から発信を希望する顧客を押下し選択する。顧客が選択された状態で、ユーザ端末２０のディスプレイ２０８１に表示された「発信」ボタンまたは、電話番号ボタンを押下することにより、ＣＲＭシステム３０に対し電話番号を含むリクエストを送信する。リクエストを受信したＣＲＭシステム３０は、電話番号を含むリクエストをサーバ１０へ送信する。リクエストを受信したサーバ１０は、音声サーバ（ＰＢＸ）４０に対し、発信リクエストを送信する。音声サーバ（ＰＢＸ）４０は、発信リクエストを受信すると、受信した電話番号に基づき顧客端末５０に対し発信（呼出し）を行う。

これに伴い、ユーザ端末２０は、スピーカ２０８２などを制御し音声サーバ（ＰＢＸ）４０により発信（呼出し）が行われている旨を示す鳴動を行う。また、ユーザ端末２０のディスプレイ２０８１は、音声サーバ（ＰＢＸ）４０により顧客に対して発信（呼出し）が行われている旨を示す情報を表示する。例えば、ユーザ端末２０のディスプレイ２０８１は、「呼出中」という文字を表示してもよい。

顧客は、顧客端末５０において不図示の受話器を持ち上げたり、顧客端末５０のタッチパネル５０６に着信時に表示される「受信」ボタンなどを押下することにより、顧客端末５０は通話可能状態となる。これに伴い、音声サーバ（ＰＢＸ）４０は、顧客端末５０による応答がなされたことを示す情報（以下、「応答イベント」と呼ぶ）を、サーバ１０、ＣＲＭシステム３０などを介してユーザ端末２０に送信する。
これにより、ユーザと顧客は、それぞれユーザ端末２０、顧客端末５０を用いて通話可能状態となり、ユーザと顧客との間で通話することができるようになる。具体的には、ユーザ端末２０のマイク２０６２により集音されたユーザの音声は、顧客端末５０のスピーカ５０８２から出力される。同様に、顧客端末５０のマイク５０８１から集音された顧客の音声は、ユーザ端末２０のスピーカ２０８２から出力される。

ユーザ端末２０のディスプレイ２０８１は、通話可能状態になると、応答イベントを受信し、通話が行われていることを示す情報を表示する。例えば、ユーザ端末２０のディスプレイ２０８１は、「応答中」という文字を表示してもよい。

通話可能状態になると、後述する通話記憶処理、ＣＲＭ記憶処理が実行される。

＜着信処理＞
着信処理は、ユーザが顧客から着信（受電）する処理である。

＜着信処理の概要＞
着信処理は、ユーザがユーザ端末２０においてアプリケーションを立ち上げている場合に、顧客がユーザに対して発信した場合に、ユーザが着信する一連の処理である。

＜着信処理の詳細＞
ユーザが顧客から着信（受電）する場合における情報処理システム１の着信処理について説明する。

ユーザが顧客から着信する場合、情報処理システム１において以下の処理が実行される。

ユーザはユーザ端末２０を操作することにより、ウェブブラウザを起動し、ＣＲＭシステム３０が提供するＣＲＭサービスのウェブサイトへアクセスする。このとき、ユーザはウェブブラウザにおいて、自身のアカウントにてＣＲＭシステム３０にログインし待機しているものとする。なお、ユーザはＣＲＭシステム３０にログインしていれば良く、ＣＲＭサービスにかかる他の作業などを行っていても良い。

顧客は、顧客端末５０を操作し、音声サーバ（ＰＢＸ）４０に割り当てられた所定の電話番号を入力し、音声サーバ（ＰＢＸ）４０に対して発信する。音声サーバ（ＰＢＸ）４０は、顧客端末５０の発信を着信イベントとして受信する。

音声サーバ（ＰＢＸ）４０は、サーバ１０に対し、着信イベントを送信する。具体的には、音声サーバ（ＰＢＸ）４０は、サーバ１０に対して顧客の電話番号５０１１を含む着信リクエストを送信する。サーバ１０は、ＣＲＭシステム３０を介してユーザ端末２０に対して着信リクエストを送信する。
これに伴い、ユーザ端末２０は、スピーカ２０８２などを制御し音声サーバ（ＰＢＸ）４０により着信が行われている旨を示す鳴動を行う。ユーザ端末２０のディスプレイ２０８１は、音声サーバ（ＰＢＸ）４０により顧客から着信があること旨を示す情報を表示する。例えば、ユーザ端末２０のディスプレイ２０８１は、「着信中」という文字を表示してもよい。

ユーザ端末２０は、ユーザによる応答操作を受付ける。応答操作は、例えば、ユーザ端末２０において不図示の受話器を持ち上げたり、ユーザ端末２０のディスプレイ２０８１に「電話に出る」と表示されたボタンを、ユーザがマウス２０６６を操作して押下する操作などにより実現される。
ユーザ端末２０は、応答操作を受付けると、音声サーバ（ＰＢＸ）４０に対し、ＣＲＭシステム３０、サーバ１０を介して応答リクエストを送信する。音声サーバ（ＰＢＸ）４０は、送信されてきた応答リクエストを受信し、音声通信を確立する。これにより、ユーザ端末２０は、顧客端末５０と通話可能状態となる。
ユーザ端末２０のディスプレイ２０８１は、通話が行われていることを示す情報を表示する。例えば、ユーザ端末２０のディスプレイ２０８１は、「通話中」という文字を表示してもよい。

＜通話記憶処理＞
通話記憶処理は、ユーザと顧客との間で行われる通話に関するデータを記憶する処理である。

＜通話記憶処理の概要＞
通話記憶処理は、ユーザと顧客との間で通話が開始された場合に、通話に関するデータを通話テーブル１０１４に記憶する一連の処理である。

＜通話記憶処理の詳細＞
ユーザと顧客との間で通話が開始されると、音声サーバ（ＰＢＸ）４０は、ユーザと顧客との間で行われる通話に関する音声データを録音し、サーバ１０へ送信する。サーバ１０の制御部１０４は、音声データを受信すると、通話テーブル１０１４に新たなレコードを作成し、ユーザと顧客との間で行われる通話に関するデータを記憶する。具体的に、サーバ１０の制御部１０４は、ユーザＩＤ、顧客ＩＤ、通話カテゴリ、受発信種別、音声データの内容を通話テーブル１０１４に記憶する。

サーバ１０の制御部１０４は、発信処理または着信処理においてユーザ端末２０から、ユーザのユーザＩＤ２０１１を取得し、新たなレコードのユーザＩＤの項目に記憶する。
サーバ１０の制御部１０４は、発信処理または着信処理において電話番号に基づきＣＲＭシステム３０へ問い合わせを行なう。ＣＲＭシステム３０は、顧客テーブル３０１２を電話番号により検索することにより、顧客ＩＤを取得し、サーバ１０へ送信する。サーバ１０の制御部１０４は、取得した顧客ＩＤを新たなレコードの顧客ＩＤの項目に記憶する。
サーバ１０の制御部１０４は、予めユーザまたは顧客ごとに設定された通話カテゴリの値を、新たなレコードの通話カテゴリの項目に記憶する。なお、通話カテゴリは、通話ごとにユーザが値を選択したり入力することにより記憶しても良い。
サーバ１０の制御部１０４は、行われている通話がユーザにより発信したものか、顧客から発信されたものかを識別し、新たなレコードの受発信種別の項目にアウトバウンド（ユーザから発信）、インバウンド（顧客から発信）のいずれかの値を記憶する。
サーバ１０の制御部１０４は、音声サーバ（ＰＢＸ）４０から受信する音声データを、新たなレコードの音声データの項目に記憶する。なお、音声データは他の場所に音声データファイルとして記憶し、通話終了後に、音声データファイルに対する参照情報（パス）を記憶するものとしても良い。また、サーバ１０の制御部１０４は、通話終了後にデータを記憶する構成としても良い。

＜音声認識処理＞
音声認識処理は、ユーザと顧客との間で行われた通話の音声データに対してテキスト認識を行うことによりテキスト情報に変換し記憶する処理である。

＜音声認識処理の概要＞
音声認識処理は、通話テーブル１０１４に記憶された音声データを音声が存在する区間（発話区間）ごとに分割し区間音声データを抽出する。それぞれの区間音声データに対してテキスト認識を行なうことにより音声認識情報を生成し、音声認識テーブル１０１５に記憶する一連の処理である。

＜音声認識処理の詳細＞
サーバ１０の認識部１０４３は、通話テーブル１０１４において通話記憶処理が行われたものの、音声認識処理が行われていないレコードを検索する。具体的には、サーバ１０の認識部１０４３は、通話テーブル１０１４から、音声認識有無の項目にブランク、ヌル、その他、音声認識処理が行われていないことを示す情報などが記憶されているレコードを検索する。なお、サーバ１０の認識部１０４３は、通話テーブル１０１４に音声データが記憶されているものの、音声認識テーブル１０１５に通話ＩＤが存在しないレコードを音声認識処理が行われていないレコードと判定しても良い。

サーバ１０の認識部１０４３は、音声認識処理が行われていないレコードの通話ＩＤおよび音声データを取得する（受け付ける）。サーバ１０の認識部１０４３は、取得（受付）した音声データから、音声が存在する区間（発話区間）を検出し、発話区間のそれぞれに対して音声データを区間音声データとして抽出する。区間音声データは、発話区間ごとに話者および発話時刻と紐付けられている。
サーバ１０の認識部１０４３は、抽出された区間音声データに対してテキスト認識を行うことにより、区間音声データを文字（テキスト）に変換する（文字に起こす）。なお、テキスト認識の具体的手法は特に限定されない。例えば信号処理技術、ＡＩ（人工知能）を利用した機械学習や深層学習によって変換してもよい。

サーバ１０の認識部１０４３は、発話区間ごとのテキストを、各発話区間の開始時刻、話者（ユーザまたは顧客）と紐付けた一連のデータを、処理対象の通話ＩＤと紐づけて音声認識テーブル１０１５に記憶する。サーバ１０の認識部１０４３は、通話テーブル１０１４の音声認識有無の項目に、音声認識処理が完了したことを示す情報を記憶する。

音声認識テーブル１０１５には、音声データの発話区間ごとのテキストが、発話時刻、話者と紐付けられ連続的な時系列データとして記憶される。ユーザは、音声認識テーブル１０１５に記憶されたデータを確認することで、音声データの内容を聞かずにテキスト情報として通話内容を確認することができる。

なお、発話時刻は、各発話区間の開始時刻、各発話区間の終了時刻、各発話区間の任意の間の時刻など各発話区間に関連した任意の時刻としても良い。

＜音声認識処理の変形例＞
なお、音声認識処理の際に、予めテキストに含まれるフィラーなどのユーザと顧客との間で行われた通話を把握する上で無意味な情報をテキストから除外して、音声認識情報を音声認識テーブル１０１５に記憶する構成としても良い。

＜音声解析処理＞
音声解析処理は、ユーザと顧客との間で行われた通話の音声データを解析し解析データを生成し、記憶する処理である。

＜音声解析処理の概要＞
音声解析処理は、通話テーブル１０１４に記憶された音声データに対して、音声解析処理を実行することにより、解析データを生成し、通話テーブル１０１４に記憶する一連の処理である。

＜音声解析処理の詳細＞
サーバ１０の解析部１０４４は、通話テーブル１０１４において通話記憶処理が行われたものの、音声解析処理が行われていないレコードを検索する。具体的には、サーバ１０の解析部１０４４は、通話テーブル１０１４から、音声データが記憶されているものの、解析データが記憶されていないレコードを検索する。解析データが記憶されていないとは、解析データの項目がブランク、ヌル、その他、記憶されていないことを示す情報などが記憶されていることを示す。
その他、不図示のカラムに音声解析処理の対象である旨を示す情報を記憶し、当該情報が記憶されているレコードを音声解析処理の対象としても良い。

サーバ１０は、音声解析処理が行われていないレコードの通話ＩＤおよび音声データを取得する。サーバ１０の解析部１０４４は、取得した音声データを解析し、Ｔａｌｋ：Ｌｉｓｔｅｎ比率、沈黙回数、被り回数、ラリー回数、基本周波数、抑揚の強弱、話速、話速比、フィラー数、トークスクリプト一致度などを算出する。なお、解析の具体的手法は特に限定されない。例えば信号処理技術、ＡＩ（人工知能）を利用した機械学習や深層学習によって解析してもよい。

Ｔａｌｋ：Ｌｉｓｔｅｎ比率とは、ユーザの発話時間と通話先の発話時間との比率である。
沈黙回数は、通話において沈黙が生じた回数である。被り回数は、通話において被りが生じた回数である。
ラリー回数は、通話においてユーザと顧客との間で応対が行われた回数（会話が切り替わった回数）である。
基本周波数は、ユーザ、顧客ごとに定義され、ユーザまたは顧客の音声の基本周波数、つまり声の高さに相当する情報である。
抑揚の強弱は、ユーザ、顧客ごとに定義され、ユーザまたは顧客の抑揚の大きさを定量的に評価した情報である。
話速は、ユーザ、顧客ごとに定義され、ユーザまたは顧客の話すスピードである。話速は、例えば、１秒間のうちに発せられた文字数（または単語数）で示される。
話速比は、ユーザおよび顧客の話速の比に関する情報である。具体的には、ユーザの話速から顧客の話速を割った数値として示される。例えば、値が大きいほどユーザは顧客に比べて話速が速いことになる。
フィラー数は、音声認識データの文中のフィラー（例えばえー、あのー、などの言い淀み）の検出数である。フィラー数は、ユーザ、顧客ごとに定義されても良い。
トークスクリプト一致度は、ユーザまたはユーザの所属する組織ごとに設定されたトークスクリプトと、音声認識データから検出されたユーザの発話内容との一致度に関する情報である。

サーバ１０の解析部１０４４は、解析データを通話テーブル１０１４の処理対象のレコードの解析データの項目に記憶する。

＜要約処理（第一実施例）＞
要約処理（第一実施例）は、音声認識情報から要約情報を生成し記憶する処理である。以下、要約処理（第一実施例）の詳細を図１４のフローチャートを用いて説明する。

＜要約処理（第一実施例）の概要＞
要約処理（第一実施例）は、音声認識テーブル１０１５に記憶された音声認識情報を取得し、音声認識情報に含まれるテキストを発話時刻の順番に並べた場合に、話者が変化する前後のテキストをテキスト群としてバインディングするバインディング処理を実行し、バインディング処理後のテキスト及びテキスト群に対して重要度を算定し、当該重要度に基づき要約文書に用いるテキストを抽出し、要約文書を生成しサーバ１０およびＣＲＭシステム３０に記憶する一連の処理である。

＜要約処理（第一実施例）の詳細＞
サーバ１０の要約部１０４６は、定期的に要約処理（第一実施例）を自動的に実行する。
ステップＳ１０１において、サーバ１０の要約部１０４６は、定期的に要約処理（第一実施例）を開始する。なお、サーバ１０の要約部１０４６は、ユーザと顧客との間の通話の終了を検知して、要約処理（第一実施例）を開始するものとしても良い。

ステップS１０２において、サーバ１０の要約部１０４６は、通話テーブル１０１４を参照し、音声認識有無の項目に、音声認識処理が完了したことを示す情報が記憶されているレコードを検索する。サーバ１０の要約部１０４６は、音声認識処理が完了したことを示す情報が記憶されているレコードが見つかると、当該レコードを取得しステップＳ１０３に進む（ステップＳ１０２のＹｅｓ）。
ユーザと顧客との間の通話が終了した後、音声認識処理が完了するまでの間は、通話テーブル１０１４の該当レコードの音声認識有無の項目には、音声認識処理が完了したことを示す情報が記憶されていないため、サーバ１０の要約部は、ステップＳ１０２にて待機する（ステップＳ１０２のＮｏ）。

ステップＳ１０３において、サーバ１０の要約部１０４６は、ステップＳ１０２において取得したレコードの要約有無の項目にブランク、ヌル、その他、要約処理（第一実施例）が行われていないことを示す情報などが記憶されているレコードを検索する。なお、サーバ１０の要約部１０４６は、通話テーブル１０１４に音声データが記憶されているものの、要約テーブル１０１６に通話ＩＤが存在しないレコードを要約処理（第一実施例）が行われていないレコードと判定しても良い。
サーバ１０の要約部１０４６は、要約処理（第一実施例）が行われていないレコードが見つかると、当該レコードを取得しステップＳ１０４に進む（ステップＳ１０２のＹｅｓ）。

ステップＳ１０４において、サーバ１０の要約部１０４６は、要約処理（第一実施例）が行われていないレコードの通話ＩＤに基づき音声認識テーブル１０１５を検索し、テキスト、発話時刻、話者のレコードからなる音声認識情報を取得する。

ステップＳ１０５において、サーバ１０の要約部１０４６は、取得した音声認識情報に対してバインディング処理を実行する。具体的には、取得した音声認識情報を発話時刻の順番に並べた場合に、話者情報が変化する前後の複数のテキストをまとめたテキスト群を生成する。テキスト群は、配列などのデータ構造であり、話者が異なる複数のテキストを含む情報である。テキスト群には、発話時刻、話者などの他の音声認識情報が含まれていても良い。

図２１は、要約処理（第一実施例）におけるバインディング処理の概要を示した図であり、話者ごとのテキストを発話時刻の順番に下方向に並べたものである。ユーザ、顧客ごとの発話区間ごとに認識されたテキストに対し、それぞれＵ１、Ｕ２・・・、Ｃ１、Ｃ２・・・と識別番号を採番してある。サーバ１０の要約部１０４６は、例えば話者情報が顧客からユーザに変化するＣ４、Ｕ５のテキストをまとめてテキスト群を生成する。

なお、本開示においては、ユーザおよび顧客のそれぞれ１つずつのテキストをまとめてテキスト群を生成したが、話者情報が変化する前後の２以上のテキストをまとめてテキスト群を生成しても良い。話者情報が変化する前後のテキスト（例えば、Ｃ４、Ｕ５など）に対して予め重要度を算定し、重要度の値に応じた数のテキストをまとめてテキスト群を生成しても良い。例えば、重要度が大きいほどより多くのテキストをまとめてテキスト群を生成しても良い。
３者以上の会話においても、話者情報が変化する前後の複数のテキストをまとめたテキスト群を生成するものとしても良い。

ステップＳ１０６において、サーバ１０の重要度算定部１０４５は、テキストおよびテキスト群に対して重要度算定処理を行う。重要度の算定方法は、任意の重要文抽出アルゴリズムを適用してもよい。
本開示においては、ＬｅｘＲａｎｋとよばれるアルゴリズムによる重要度の算定手法を一例として説明する。ＬｅｘＲａｎｋにおいては、複数の入力文章を対象として、それぞれの入力文章を形態素解析により単語ごとに分割し、各文章ごとの類似度（例えば、コサイン類似度）を算定し、文章間の類似度に基づくグラフ構造を算定し、グラフ構造に基づき各文章ごとの重要度を算定するアルゴリズムである。
具体的には、サーバ１０の重要度算定部１０４５は、テキストおよびテキスト群のそれぞれを１つの入力文章として、ＬｅｘＲａｎｋを適用することにより、テキストおよびテキスト群ごとに重要度を算定する。

＜重要度算定処理（第一実施例）＞
重要度算定処理（第一実施例）において、サーバ１０の重要度算定部１０４５は、テキスト群に含まれる複数のテキストを結合したテキストを１つの文章として扱いＬｅｘＲａｎｋを適用する。例えば、Ｃ４「田口様いらっしゃいますでしょうか。」と、Ｕ５「田口ですね。」を結合した、「田口様いらっしゃいますでしょうか。田口ですね。」を１つの文章としてＬｅｘＲａｎｋを適用し重要度を算定する。

＜重要度算定処理（第二実施例）＞
重要度算定処理（第二実施例）において、サーバ１０の重要度算定部１０４５は、テキスト群に含まれる複数のテキストのそれぞれを独立した文章としてＬｅｘＲａｎｋを適用する。サーバ１０の重要度算定部１０４５は、独立した文章に対して算定された重要度の和をテキスト群の重要度とする処理を実行する。
例えば、サーバ１０の重要度算定部１０４５は、テキスト群に含まれるＣ４、Ｕ５のそれぞれの文章に対してＬｅｘＲａｎｋを適用し、Ｃ４、Ｕ５のそれぞれに対して重要度を算定する。その後、サーバ１０の重要度算定部１０４５は、Ｃ４の重要度と、Ｕ５の重要度の和をテキスト群の重要度とする処理を実行する。
なお、独立した文章に対して算定された重要度に対して統計処理を行なった統計値（平均値、中央値、最頻値、最大値、最小値など）をテキスト群の重要度としても良い。具体的には、独立した文章に対して算定された重要度の平均、最大値などがテキスト群の重要度として好適である。

ステップＳ１０７において、サーバ１０の要約部１０４６は、所定値以上の重要度が算定されたテキストまたはテキスト群を抽出する。サーバ１０の要約部１０４６は、抽出されたテキストおよびテキスト群に含まれるテキストを、音声認識テーブル１０１５における各テキストの発話時刻、話者とともに要約テーブル１０１６に記憶する。これにより、要約テーブル１０１６に要約情報が記憶される。サーバ１０の要約部１０４６は、通話テーブル１０１４の要約有無の項目に、要約処理（第一実施例）が完了したことを示す情報を記憶する。

サーバ１０の要約部１０４６は、抽出されたテキストおよびテキスト群に含まれるテキストを、音声認識テーブル１０１５における各テキストの発話時刻、話者とともに１つの文章（要約テキスト）に結合し、通話ＩＤおよび要約テキストを含むリクエストを生成し、ＣＲＭシステム３０に送信する。
ＣＲＭシステム３０は、リクエストを受信すると、リクエストに含まれる通話ＩＤから応対履歴テーブル３０１３を検索し、当該通話ＩＤを有するレコードのコメントの項目に、受信した要約テキストを記憶する。

＜要約処理（第二実施例）＞
要約処理（第二実施例）は、音声認識情報から要約情報を生成し記憶する処理の第二の実施形態である。以下、要約処理（第二実施例）の詳細を図１５のフローチャートを用いて説明する。

＜要約処理（第二実施例）の概要＞
要約処理（第二実施例）は、音声認識テーブル１０１５に記憶された音声認識情報を取得し、音声認識情報に含まれるテキストに対して重要度を算定し、当該重要度に基づき要約文書に用いるテキストを抽出する。音声認識情報に含まれるテキストを発話時刻の順番に並べた場合に、抽出したテキストに対して話者が変化する前後のテキストを要約文書に用いるテキストとして抽出し、要約文書を生成しサーバ１０およびＣＲＭシステム３０に記憶する一連の処理である。

＜要約処理（第二実施例）の詳細＞
ステップＳ２０１からステップＳ２０４までの処理は、要約処理（第一実施例）のステップＳ１０１からステップＳ１０４までの処理と同様であるため説明を省略する。

ステップＳ２０５において、サーバ１０の重要度算定部１０４５は、取得した音声認識情報に対して重要度算定処理を行う。重要度の算定方法は、任意の重要文抽出アルゴリズムを適用しても構わないが、本開示においては要約処理（第二実施例）と同様にＬｅｘＲａｎｋとよばれるアルゴリズムによる重要度の算定手法を一例として説明する。

＜重要度算定処理（第三実施例）＞
サーバ１０の重要度算定部１０４５は、取得した音声認識情報に含まれるテキストを１つの文章として扱いＬｅｘＲａｎｋを適用する。図２２は、要約処理（第二実施例）における追加抽出処理の概要を示した図であり、話者ごとのテキストを発話時刻の順番に下方向に並べたものである。図２２の事例では、Ｕ１からＵ８、Ｃ１からＣ６のテキストすべてに対してそれぞれ重要度が算定される。

ステップＳ２０６において、サーバ１０の要約部１０４６は、所定値以上の重要度が算定されたテキストを抽出する。サーバ１０の要約部１０４６は、抽出されたテキストと話者が異なり、発話時刻において前後するテキストを追加抽出する。
例えば、テキストＵ５が抽出された場合に、話者が異なり発話時刻において前後するテキストＣ４を追加抽出する。

なお、本開示においては、話者が異なり発話時刻において前後する１のテキストを追加抽出するとしたが、２以上のテキストを追加抽出しても良い。抽出されたテキストの重要度の値に応じた数のテキストを追加抽出しても良い。例えば、重要度が大きいほどより多くの話者が異なり発話時刻において前後するテキストを追加抽出しても良い。
３者以上の会話においても、話者情報が変化する前後の複数のテキストを追加抽出しても良い。

ステップＳ２０７の処理は、要約処理（第一実施例）のステップＳ１０７の処理と同様であるため説明を省略する。

＜要約処理の変形例＞
要約処理（第一実施例）、要約処理（第二実施例）において、サーバ１０の重要度算定部１０４５は、テキストの重要度算定にあたり、テキストに含まれるフィラーなどのユーザと顧客との間で行われた通話を把握する上で無意味な情報を除外して、重要度の算定を行っても良い。
同様に、要約処理（第一実施例）、要約処理（第二実施例）の際に、予めテキストに含まれるフィラーなどのユーザと顧客との間で行われた通話を把握する上で無意味な情報をテキストから除外して、要約情報を要約テーブル１０１６に記憶する構成としても良い。

＜要約表示処理＞
要約表示処理は、要約情報を要約文書としてユーザに対して表示する処理である。以下、要約表示処理の詳細を図２３の画面例を用いて説明する。

＜要約表示処理の概要＞
要約表示処理は、要約テーブル１０１６に記憶された要約情報を取得し、要約情報に含まれるテキストを話者ごとに異なる色の吹き出しに格納し、発話時刻の順番に並べ、要約文書としてユーザ端末２０のディスプレイ２０８１に表示する一連の処理である。

＜要約表示処理の詳細＞
ユーザは、サーバ１０へログインし所定の操作を行なうことにより、自身または自身が所属する組織の同僚などが過去に顧客と行なった通話履歴を一覧表示するためのリクエストをサーバ１０へ送信する。サーバ１０は、リクエストを受信すると、通話テーブル１０１４を照会し過去の通話履歴のレコードをユーザ端末２０へ送信する。ユーザ端末２０は、受信した過去の通話履歴のレコードをユーザ端末２０のディスプレイ２０８１に一覧表示する。

ユーザは、ユーザ端末２０を操作し要約情報を確認したい通話履歴のレコードを選択し、要約表示ボタン等を押下することにより、選択した通話履歴に関し、通話ＩＤを含む要約表示に関するリクエストをサーバ１０へ送信する。
サーバ１０は、リクエストを受信すると、通話ＩＤに基づき要約テーブル１０１６を検索し、当該通話ＩＤに関する要約情報をユーザ端末２０へ送信する。

ユーザ端末２０は、受信した要約情報を要約文書としてディスプレイ２０８１に表示する。ユーザ端末２０に表示される要約文書を、図２３に基づき説明する。ユーザ端末２０のディスプレイ２０８１は、要約表示画面７０を表示する。要約表示画面は、ユーザの発話内容（テキスト）が発話時刻７０１とともに吹き出し７０２で表示され、顧客の発話内容（テキスト）が発話時刻７１１とともに吹き出し７１２で表示される。ユーザの発話内容を表示する吹き出し７０２は、吹き出しの方向が左側を向いており、吹き出しの方向が右側を向いている顧客の発話内容を表示する吹き出し７１２とは識別可能なように表示される。
ユーザ端末２０の表示制御部１０５２は、取得した要約情報に含まれる、テキスト、発話時刻、話者の情報に基づき、要約表示画面７０の上部から、発話時刻順に、話者がユーザであるテキストをユーザの発話内容を表示する吹き出し７０２に、話者が顧客であるテキストを顧客の発話内容を表示する吹き出し７１２に区別できる態様で一覧表示させる。

ユーザの発話内容を表示する吹き出し７０２の色は、顧客の発話内容を表示する吹き出し７１２の色と異なっている。これにより、ユーザが要約文書を確認するときに、発話内容の話者を視覚的に確認することができる。また、発話内容を表示する吹き出し７０２、７１２の色は、要約処理（第一実施例）、要約処理（第二実施例）において算定された発話内容が含むテキストの重要度に基づき、色の明度、色相、彩度、濃さの少なくともいずれか１つを変化させて表示させても良い。例えば、重要度が高いテキストを含む吹き出し７０２、７１２ほど色を濃くしても良い。これにより、ユーザが要約文書を確認するときに、発話内容ごとの重要度を視覚的に確認することができ、短時間で文章内容を理解することができる。

＜音声認識表示処理＞
音声認識表示処理は、音声認識情報を音声認識文書としてユーザに対して表示する処理である。

＜音声認識表示処理の概要＞
音声認識表示処理は、音声認識テーブル１０１５に記憶された音声認識情報を取得し、音声認識情報に含まれるテキストを話者ごとに異なる色の吹き出しに格納し、発話時刻の順番に並べ、音声認識文書としてユーザ端末２０のディスプレイ２０８１に表示する一連の処理である。

＜音声認識表示処理の詳細＞
音声認識表示処理は、要約表示処理において、要約情報に替えて音声認識情報を用いる、即ち、要約テーブル１０１６に替えて音声認識テーブル１０１５を用いるのみで処理内容は同一であるため説明を省略する。音声認識表示処理においては、図２３と略同一な音声認識表示画面に、音声認識情報が話者ごとに区別可能な態様で吹き出し形式で一覧表示される。
音声認識表示処理において、ユーザの発話内容を表示する吹き出しの色は、顧客の発話内容を表示する吹き出しの色と異なっている。これにより、ユーザが音声認識文書を確認するときに、発話内容の話者を視覚的に確認することができる。また、発話内容を表示する吹き出しの色は、要約処理（第一実施例）、要約処理（第二実施例）において算定された発話内容が含むテキストの重要度に基づき、色の明度、色相、彩度、濃さの少なくともいずれか１つを変化させて表示させても良い。例えば、重要度が高いテキストを含む吹き出しほど色を濃くしても良い。これにより、ユーザが音声認識文書を確認するときに、発話内容ごとの重要度を視覚的に確認することができ、短時間で文章内容を理解することができる。つまり、ユーザが、ユーザと顧客との間で行われた通話の音声認識情報をすべて確認する場合においても、重要な発話内容のみを視覚的に直感的に把握することができる。

＜応対メモ付与処理＞
応対メモ付与処理は、ユーザと顧客との間で行われる通話に対して応対メモを自動的に付与する処理である。以下、応対メモ付与処理の詳細を図１６のフローチャートを用いて説明する。

＜応対メモ付与処理の概要＞
応対メモ付与処理は、ユーザと顧客との間で行われる通話に関する音声データを取得し、音声データに対して学習モデルを適用することにより応対メモ候補を推論し、推論された応対メモ候補を当該通話に関連する通話データに紐づけて記憶する一連の処理である。

＜応対メモ付与処理の詳細＞
ステップＳ３０１において、サーバ１０の応対メモ付与部１０４９は、ユーザと顧客との間の通話の終了を検知して、応対メモ付与処理を開始する。

ステップＳ３０２において、サーバ１０の応対メモ付与部１０４９は、処理対象となる通話の通話属性を取得する。
具体的には、サーバ１０の応対メモ付与部１０４９は、処理対象となる通話の通話ＩＤに基づき、通話テーブル１０１４を検索し、通話カテゴリ、受発信種別を取得する。
サーバ１０の応対メモ付与部１０４９は、処理対象となる通話のユーザＩＤに基づき、ユーザテーブル１０１２を検索し、ユーザ属性を取得する。サーバ１０の応対メモ付与部１０４９は、通話のユーザＩＤに基づき、ユーザテーブル１０１２に記憶された組織ＩＤから、組織テーブル１０１３を検索し、ユーザが所属する組織の組織名、組織属性を取得する。
サーバ１０の応対メモ付与部１０４９は、処理対象となる通話の顧客ＩＤに基づき、ＣＲＭシステム３０へ問い合わせを行い、ＣＲＭシステム３０の顧客テーブル３０１２から顧客属性、顧客組織名、顧客組織属性を取得する。
サーバ１０の応対メモ付与部１０４９は、すべての通話属性を取得する必要はなく、必要に応じて複数の通話属性のうち少なくとも１つの通話属性を取得すれば良い。

ステップＳ３０３において、サーバ１０の応対メモ付与部１０４９は、取得した通話属性に基づき、学習モデルを選択する。学習モデルは、通話属性ごとに用意されていてもよいし、複数の通話属性の組み合わせ、例えば、ユーザ属性および顧客属性の組み合わせごとに用意されていても良い。
学習モデルは、任意の機械学習、深層学習モデルなどを含み、通話属性に応じて作成されたデータセットにより学習されている。学習処理の詳細は後述する。
本開示においては、深層学習モデルを学習モデルの一例として説明する。深層学習モデルは、ＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）、ＬＳＴＭ（ＬｏｎｇＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ）、ＧＲＵ（ＧａｔｅｄＲｅｃｕｒｒｅｎｔＵｎｉｔ）など、任意の時系列データを入力データとする深層学習モデルであればどのような学習モデルであっても構わない。学習モデルは、例えば、Ａｔｔｅｎｔｉｏｎ、Ｔｒａｎｓｆｏｒｍｅｒなどを含む任意の深層学習モデルを含む。

ステップＳ３０４において、サーバ１０の応対メモ付与部１０４９は、処理対象となる通話の音声データを取得し、当該音声データを選択した学習モデルの入力データとして適用することにより、出力データとして複数の応対メモ候補（応対メモ群）が確率分布とともに出力（推論）される。
具体的には、応対メモ「ＡＡＡ」、「ＢＢＢ」、「ＣＣＣ」などに対して、それぞれ「０．６」、「０．３」、「０．１」などの確率分布が出力される。確率分布はソフトマックス関数などで正規化されていても良いし、正規化されていなくても構わない。

ステップＳ３０５において、サーバ１０の応対メモ付与部１０４９は、出力された応対メモ候補のうち最も確率が高い応対メモ候補を、処理対象となる通話の通話ＩＤと紐付けて応対メモテーブル１０１７のメモ内容の項目に記憶する。付与日時の項目には、現在日時を記憶しても良い。付与者ＩＤの項目には、サーバ１０などのユーザ以外のシステムが自動的に付与したことを示す情報を記憶しても良い。
なお、サーバ１０の応対メモ付与部１０４９は、出力された応対メモ候補のうち、確率が所定値以上の複数の応対メモ候補を、応対メモテーブル１０１７のメモ内容の項目に記憶しても良い。

＜応対メモ付与処理（変形例）＞
ステップＳ３０３において、サーバ１０の応対メモ付与部１０４９は、複数の異なる通話属性に基づき、複数の学習モデルを選択しても良い。例えば、サーバ１０の応対メモ付与部１０４９は、ユーザ属性ごとに用意された第１の学習モデル、顧客属性ごとに用意された第２の学習モデルを選択しても良い。このとき、サーバ１０の応対メモ付与部１０４９は、任意の複数個の通話属性に基づき、複数の学習モデルを選択するものとしても良い。

ステップＳ３０４において、サーバ１０の応対メモ付与部１０４９は、処理対象となる通話の音声データを取得し、当該音声データを選択した複数の学習モデルの入力データとして適用することにより、適用した学習モデルごとに、出力データとして複数の応対メモ候補が確率分布とともに出力（推論）される。
サーバ１０の応対メモ付与部１０４９は、複数の応対メモ候補の確率分布に対して任意の演算を適用することにより、応対メモ候補ごとの確率分布を算定しても良い。例えば、複数の応対メモ候補の確率分布に対して和や積をとったものを、出力する応対メモ候補ごとの確率分布としても良い。
具体的には、応対メモ「ＡＡＡ」、「ＢＢＢ」、「ＣＣＣ」などに対して、第１の学習モデルに対する確率分布の推論結果が「０．６」、「０．３」、「０．１」、第２の学習モデルに対する確率分布の推論結果が「０．３」、「０．４」、「０．１」である場合において、それらの積である「０．１８」、「０．１２」、「０．０１」を、応対メモ「ＡＡＡ」、「ＢＢＢ」、「ＣＣＣ」の確率分布としても良い。確率分布はソフトマックス関数などで正規化されていても良いし、正規化されていなくても構わない。

＜応対メモ提案処理＞
応対メモ提案処理は、ユーザと顧客との間で行われる通話において、ユーザに対して応対メモ候補を提案する処理である。以下、応対メモ付与処理の詳細を図１７のフローチャートを用いて説明する。

＜応対メモ提案処理の概要＞
応対メモ提案処理は、ユーザと顧客との間で行われる通話に関する音声データを取得し、音声データに対して学習モデルを適用することにより応対メモ候補を推論し、推論された応対メモ候補をユーザに対して提案し、ユーザが選択した応対メモ候補を当該通話に関連する通話データに紐づけて記憶する一連の処理である。

＜応対メモ提案処理の詳細＞
ステップＳ４０１からステップＳ４０４までの処理は、応対メモ付与処理のステップＳ３０１からステップＳ３０４までの処理と同様であるため説明を省略する。

ステップＳ４０５において、サーバ１０の応対メモ提案部１０４８は、出力された応対メモ候補および確率分布をユーザ端末２０に送信する。ユーザ端末２０のディスプレイ２０８１は、受信した応対メモ候補をユーザが選択可能なように一覧表示する。
このとき、ユーザ端末２０は、応対メモ候補ごとの確率を応対メモ候補の優先順位として、優先順位が高い応対メモ候補ほど、ユーザ端末２０のディスプレイ２０８１のユーザが選択しやすい位置に表示しても良い。例えば、優先順位が高い応対メモ候補をリストの上位に表示させたり、複数の応対メモ候補をカルーセルまたはページ送りにより表示する場合にはより先頭のページに表示させることが考えられる。
つまり、ユーザ端末２０は、確率が高い応対メモ候補を、ユーザ端末２０のディスプレイ２０８１のユーザが選択しやすい位置に表示する。これにより、ユーザは、複数の応対メモからより確からしい応対メモを、より正確に簡単に選択することができる。

ステップＳ４０６において、ユーザは、ユーザ端末２０のディスプレイ２０８１に表示された応対メモ候補から１または複数の応対メモ候補を選択する。ユーザは、ユーザ端末２０のディスプレイ２０８１に表示された送信ボタンを押下することにより、選択した応対メモ候補およびユーザＩＤ２０１１をサーバ１０へ送信する。

ステップＳ４０７において、サーバ１０の応対メモ付与部１０４９は、受信した応対メモ候補、ユーザＩＤ２０１１を処理対象となる通話の通話ＩＤと紐付けて応対メモテーブル１０１７のメモ内容、付与者ＩＤの項目に記憶する。付与日時の項目には、現在日時を記憶しても良い。

＜学習処理＞
学習処理は、応対メモ付与処理、応対メモ提案処理などで利用する学習モデルを構築する処理である。

＜学習処理の概要＞
学習処理は、通話に関する通話属性ごとに、ユーザと顧客との間で行われた通話に関する音声データを入力データ、当該音声データに紐付けられたメモ内容を出力データ（出力ベクトル）として学習モデルのパラメータを学習させるための処理である。

＜学習処理の詳細＞
サーバ１０の学習部１０４７は、通話テーブル１０１４を検索し、音声データおよび、通話ＩＤを介して応対メモテーブル１０１７を参照することで音声データに紐付けられたメモ内容を取得する。サーバ１０の学習部１０４７は、音声データを通話属性ごとに分割し、通話属性ごとに訓練データ、テストデータ、検証データなどのデータセットを作成する。
サーバ１０の学習部１０４７は、通話属性ごとに用意した学習モデルに対し、それぞれの通話属性に応じたデータセットを用いることで、学習モデルのパラメータを学習させる。

サーバ１０の学習部１０４７は、所定の応対メモと紐付けられた音声データを除外しても良い。具体的には、サーバ１０の学習部１０４７は、データセットを作成する際に、メモ内容が「留守番電話」、「顧客（担当者）不在」、「顧客受付ブロック」など、顧客との通話が実質的に成立していない通話であることを示すメモ内容が付与された通話に関する音声データを除外する。これにより、メモ内容を推論する学習モデルの作成に望ましくないデータをデータセットから除外することにより、より精度の高い学習モデルを作成することができる。

一例として、サーバ１０の学習部１０４７は、通話を行うユーザに関する職種、所属組織の業種、所属組織の名称の何れか１つのユーザ属性に関する情報ごとにデータセットを作成しても良い。
一例として、サーバ１０の学習部１０４７は、通話を行う顧客に関する職種、顧客の所属組織の業種、顧客の所属組織の名称の何れか１つの顧客属性に関する情報ごとにデータセットを作成しても良い、
一例として、サーバ１０の学習部１０４７は、テレフォンオペレータ、テレマーケティング、カスタマーサポート、テクニカルサポートなどの行われた通話の通話カテゴリに関する情報ごとにデータセットを作成しても良い。
一例として、サーバ１０の学習部１０４７は、ユーザから顧客に対して発信されたアウトバウンド、顧客からユーザが受信したインバウンドのいずれかに関する情報ごとにデータセットを作成しても良い。

サーバ１０の学習部１０４７は、通話を行うユーザのユーザ属性ごとに学習モデルを学習させる際に、ユーザの音声のみを抽出（顧客の音声を除外）する処理を行ったものを入力データとして学習処理を行わせても良い。この場合、応対メモ付与処理、応対メモ提案処理のステップＳ３０４、Ｓ４０４における推論処理における、学習モデルへ適用する音声データに対しても同様に、ユーザの音声のみを抽出（顧客の音声を除外）する処理を行ったものを入力データとする処理を行う。
ユーザ属性に応じた学習モデルは、ユーザの発話内容のみに基づき学習させることにより、より正確に応対メモを推論することができる学習モデルを得ることができる。

サーバ１０の学習部１０４７は、通話を行う顧客の顧客属性ごとに学習モデルを学習させる際に、顧客の音声のみを抽出（ユーザの音声を除外）する処理を行ったものを入力データとして学習処理を行わせても良い。この場合、応対メモ付与処理、応対メモ提案処理のステップＳ３０４、Ｓ４０４における推論処理における、学習モデルへ適用する音声データに対しても同様に、顧客の音声のみを抽出（ユーザの音声を除外）する処理を行ったものを入力データとする処理を行う。
顧客属性に応じた学習モデルは、顧客の発話内容のみに基づき学習させることにより、より正確に応対メモを推論することができる学習モデルを得ることができる。

＜学習処理の変形例＞
本開示においては、学習モデルの入力データを音声データとしたが、音声データに対して任意の情報処理を行うことにより変換されたデータを入力データとしても良い。例えば、音声データに替えて当該音声データに対してテキスト認識を行うこと（テキスト起こし）により得られたテキストデータを入力データとしても良い。また、テキストデータに対して、任意の情報処理を行うことにより変換されたデータを入力データとしても良い。本開示における、学習モデルに音声データを適用することとは、そのように、ある音声データに対して任意の情報処理を行うことにより変換されたデータに対して学習モデルを適用することも含む。
この場合、応対メモ付与処理、応対メモ提案処理などの学習モデルにおける応対メモ候補を推論する際に、入力データである音声データに対して同様の情報処理を行い学習モデルを適用すれば良い。例えば、応対メモ付与処理、応対メモ提案処理などの学習モデルにおける応対メモ候補を推論する際に、音声データに替えて当該音声データに対してテキスト認識を行うこと（テキスト起こし）により得られたテキストデータを入力データとすれば良い。

＜スコア算定処理＞
スコア算定処理は、ユーザごとの通話スコアを算定する処理である。以下、スコア算定処理の詳細を図１８のフローチャートを用いて説明する。

＜スコア算定処理の概要＞
スコア算定処理は、ユーザごとの通話データに対して解析処理および統計処理を行うことにより、それぞれのユーザに対する通話スコアの算定を行う処理である。これにより、例えば、ユーザごとの顧客応対のスキルを定量的な指標で評価することができる。

＜スコア算定処理の詳細＞
ステップＳ５０１において、ユーザはユーザ端末２０を操作することにより、サーバ１０へユーザ一覧のリクエストを送信する。サーバ１０のスコア算定部１０５０は、受信したリクエストに基づき、リクエストを送信したユーザと同じ組織に所属する（同じ組織ＩＤを有する）ユーザの一覧をユーザテーブル１０１２から取得し、ユーザ端末２０へ送信する。
ユーザ端末２０のディスプレイ２０８１は、取得したユーザの一覧をユーザが選択可能なように一覧表示する。ユーザは、ユーザ端末２０のディスプレイ２０８１に表示されたユーザの一覧から、スコアを算定したいユーザを選択する。ユーザは、ユーザ端末２０のディスプレイ２０８１に表示された送信ボタンを押下することにより、選択されたユーザのユーザＩＤをサーバ１０へ送信する。

ステップＳ５０２において、サーバ１０のスコア算定部１０５０は、受信したユーザＩＤに基づき通話テーブルを検索し、対象ユーザの通話ごとの解析データを取得する。

このとき、サーバ１０のスコア算定部１０５０は、所定の応対メモと紐付けられた解析データを除外しても良い。具体的には、サーバ１０のスコア算定部１０５０は、対象ユーザの通話ごとの解析データを取得する際に、当該通話の通話ＩＤにより紐付けられた応対メモテーブル１０１７のメモ内容を取得する。サーバ１０のスコア算定部１０５０は、メモ内容が「留守番電話」、「顧客（担当者）不在」、「顧客受付ブロック」など、顧客との通話が実質的に成立していない通話であることを示すメモ内容が付与された通話に関する解析データを除外する。これにより、対象ユーザの通話スコアを算定する際に、通話が実質的に成立していない通話を除外することにより、より精度の高い通話スコアを算定することができる。

サーバ１０のスコア算定部１０５０は、通話ごとの解析データに対して、所定のアルゴリズムを適用することにより通話スコアを算定する。具体的には、サーバ１０のスコア算定部１０５０は、解析データに含まれる、各種指標値（沈黙回数、被り回数、ラリー回数など）の基準指標値などに対する乖離度に基づき、所定の重み付け和をとることにより通話スコアを算定する。このとき、指標値に対して正規化などの任意の処理を適用しても構わない。

ステップＳ５０４において、サーバ１０のスコア算定部１０５０は、対象ユーザの通話ごとの解析データに基づき算定された通話スコアに対して統計処理を行った統計値（平均値、中央値、最頻値、最大値、最小値など）を対象ユーザのユーザ評価指標として算定する。具体的には、対象ユーザの通話ごとの解析データに基づき算定された通話スコアの平均がユーザ評価指標として好適である。

サーバ１０のスコア算定部１０５０は、算定したユーザ評価指標をユーザテーブル１０１２の、対象ユーザのレコードの評価指標の項目に記憶する。サーバ１０のスコア算定部１０５０は、算定したユーザ評価指標を、スコア算定処理を実行したユーザのユーザ端末２０へ送信する。ユーザ端末２０のディスプレイ２０８１は、受信した対象ユーザのユーザ評価指標をユーザに対して表示する。

＜連携モード設定処理＞
連携モード設定処理は、通話記憶処理にあたり、ＣＲＭシステム３０への通話情報の記憶処理を設定するための処理である。

＜連携モード設定処理の概要＞
ユーザまたは、ユーザが所属する組織、部署の管理者などはサーバ１０が提供する所定のウェブサイトを開き、連携モード設定の編集画面を表示する。ユーザは、連携モード設定画面において、希望する連携モードを選択し、保存操作などを実行することによりサーバ１０における、ＣＲＭシステム３０への通話情報の記憶処理を設定することができる。
なお、ユーザが設定することなしに、連携モード設定は所定の規定値を予め有するものとしても良い。ユーザが、本開示にかかる音声通話サービスを初めて利用する際に設定するものとしても良い。

＜連携モード設定処理の詳細＞
ユーザまたは、ユーザが所属する組織、部署の管理者など（ユーザ等）は自身のユーザ端末２０を操作し、ウェブブラウザなどによりサーバ１０が提供する連携モード設定の編集画面に関するウェブサイトを開く。ユーザ等は、ユーザ端末２０を操作し、連携モード設定画面において、希望する連携モードとして第１モードまたは第２モードのいずれかを選択する。ユーザ等は、ユーザ端末２０を操作し、自身のユーザＩＤ２０１１、選択した連携モードをサーバ１０へ送信する。サーバ１０の設定部１０４２は、受信したユーザＩＤ２０１１によりユーザテーブル１０１２を検索し、当該ユーザのレコードの連携モードの項目に、受信した連携モードを記憶する。
なお、連携モードは、ユーザごとではなく、ユーザが所属する組織ごとに記憶しても良い。つまり、組織テーブル１０１３に設けられた連携モードの項目に記憶し、各ユーザの連携モードは、組織ＩＤにより紐づけられた組織テーブル１０１３の連携モードの項目を参照しても良い。

＜ＣＲＭ記憶処理＞
ＣＲＭ記憶処理は、本開示にかかる音声通話サービスを利用してユーザと顧客との間で行われる通話に関する情報をＣＲＭシステム３０に記憶するための処理である。以下、ＣＲＭ記憶処理の詳細を図１９のフローチャートを用いて説明する。

＜ＣＲＭ記憶処理の概要＞
ＣＲＭ記憶処理は、ユーザと顧客との間で通話が開始された場合に、ユーザまたは組織ごとに設定された連携モードを取得し、連携モードの設定値に応じて通話に関するデータをＣＲＭシステム３０に記憶する一連の処理である。これにより、通話に関するデータは、ＣＲＭシステム３０において、通話対象の顧客情報と紐付けて記憶される。

＜ＣＲＭ記憶処理の詳細＞
ステップＳ６０１において、発信処理または受信処理（受発信処理）が行われた後に、ユーザと顧客との間で通話が開始される。これにより、サーバ１０はユーザと顧客との間で通話が開始されたことを検知する。

ステップＳ６０２において、サーバ１０のＣＲＭ記憶制御部１０５１は、ユーザ端末２０から受信したユーザＩＤ２０１１に基づきユーザテーブル１０１２を検索し、通話しているユーザの連携モードを取得する。なお、連携モードが組織ごとに組織テーブル１０１３等に記憶されている場合には、該当ユーザの組織ＩＤに基づき組織テーブル１０１３等を検索し、該当ユーザに紐づけられている連携モードを、ユーザの連携モードとする。

ステップＳ６０３において、サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第１モードか第２モードか判定する。サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第１モードである場合にはステップＳ６０４に進む。サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第２モードである場合にはステップＳ６０４をスキップし、ステップＳ６０５に進む。

ステップＳ６０４において、サーバ１０のＣＲＭ記憶制御部１０５１は、第１通話データおよび、当該通話の通話テーブル１０１４における通話ＩＤを含む通話データを顧客ＩＤと関連付けて記憶させるリクエストをＣＲＭシステム３０へ送信する。第１通話データとは、当該通話の開始後、通話が終了するまでに取得可能な通話に関するデータである。
具体的には、ＣＲＭシステム３０は、通話ＩＤと紐づけて、第１通話データとして通話をしているユーザのユーザＩＤ、顧客の顧客ＩＤ、発信日時（発信の場合のみ）、通話の開始日時を、それぞれ応対履歴テーブル３０１３のユーザＩＤ、顧客ＩＤ、ダイアル日時、通話開始日時の項目に記憶する。なお、第１通話データは、ユーザＩＤ、顧客の顧客ＩＤ、ダイアル日時、通話開始日時の少なくとも１つを含む構成としても構わない。

ステップＳ６０５において、サーバ１０のＣＲＭ記憶制御部１０５１は、ユーザと顧客との間の通話終了を検知する。

ステップＳ６０６において、サーバ１０のＣＲＭ記憶制御部１０５１は、当該通話に関する音声解析処理が完了しているか否かを判定する。具体的に、サーバ１０のＣＲＭ記憶制御部１０５１は、通話テーブル１０１４を参照し、当該通話のレコードにおける解析データの項目にブランク、ヌル、その他、音声解析処理が完了していないことを示す情報が記憶されているか否かを判定する。
音声解析処理が完了していない場合には、サーバ１０のＣＲＭ記憶制御部１０５１は、ステップＳ６０６で待機する。音声解析処理が完了している場合は、サーバ１０のＣＲＭ記憶制御部１０５１は、ステップＳ６０７に進む。

ステップＳ６０７において、サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第１モードか第２モードか判定する。サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第１モードである場合にはステップＳ６０９に進む。サーバ１０のＣＲＭ記憶制御部１０５１は、取得した連携モードが、第２モードである場合にはステップＳ６０８に進む。

ステップＳ６０８において、サーバ１０のＣＲＭ記憶制御部１０５１は、第２通話データおよび、当該通話の通話テーブル１０１４における通話ＩＤを含む通話データを顧客ＩＤと関連付けて記憶させるリクエストをＣＲＭシステム３０へ送信する。第２通話データとは、当該通話の終了後に取得可能な通話に関するデータである。
ＣＲＭシステム３０は、通話ＩＤと紐づけて、第２通話データとして通話をしているユーザのユーザＩＤ、顧客の顧客ＩＤ、発信日時（発信の場合のみ）、通話の開始日時、通話の終了日時をそれぞれ応対履歴テーブル３０１３のユーザＩＤ、顧客ＩＤ、ダイアル日時、通話開始日時、通話終了日時の項目に記憶する。ＣＲＭシステム３０は、通話ＩＤと紐づけて、通話に関する音声認識情報、通話に関する要約情報を応対履歴テーブル３０１３のコメントの項目に記憶する。具体的には、図２４のコメント８０７の音声認識結果、要約結果のように、発話時刻、話者、テキストを結合したテキスト形式の情報に変換し応対履歴テーブル３０１３のコメントの項目に記憶する。ＣＲＭシステム３０は、通話ＩＤと紐づけて、通話ＩＤに基づき生成したＵＲＬを応対履歴テーブル３０１３のＵＲＬの項目に記憶する。なお、応対履歴テーブル３０１３には、第２通話データの一部の情報のみを記憶する構成としても構わない。

ステップS６０９において、サーバ１０のＣＲＭ記憶制御部１０５１は、第３通話データおよび、当該通話の通話テーブル１０１４における通話ＩＤを含む通話データを顧客ＩＤと関連付けて記憶させるリクエストをＣＲＭシステム３０へ送信する。第３通話データとは、当該通話の終了後に取得可能な通話に関するデータのうち、第１通話データに含まれるデータを除いたものである。
ＣＲＭシステム３０は、通話ＩＤと紐づけて、第２通話データとして通話の終了日時を応対履歴テーブル３０１３の通話終了日時の項目に記憶する。ＣＲＭシステム３０は、通話ＩＤと紐づけて、通話に関する音声認識情報、通話に関する要約情報を応対履歴テーブル３０１３のコメントの項目に追記する。具体的には、図２４のコメント８０７の音声認識結果、要約結果のように、発話時刻、話者、テキストを結合したテキスト形式の情報に変換し応対履歴テーブル３０１３のコメントの項目に追記する。
このとき、サーバ１０のＣＲＭ記憶制御部１０５１は、連携モードが第１モードである場合は、ステップS６０４において既に応対履歴テーブル３０１３にレコードが生成されているため、当該レコードのコメントに既に記載された内容を上書きしないように追記する。具体的には、連携モードが第１モードである場合は、応対履歴テーブル３０１３には当該通話のレコードが新たに作成され、他のユーザなどによりコメントへの追記が行われる場合がある。そのような場合にも、サーバ１０のＣＲＭ記憶制御部１０５１は、当該レコードのコメントを上書きしないように追記する。
ＣＲＭシステム３０は、通話ＩＤと紐づけて、通話ＩＤに基づき生成したＵＲＬを応対履歴テーブル３０１３のＵＲＬの項目に記憶する。なお、応対履歴テーブル３０１３には、第３通話データの一部の情報のみを記憶する構成としても構わない。

＜変形例＞
サーバ１０は、ＣＲＭシステム３０の顧客テーブル３０１２などから顧客情報を取得し不図示のデータベース等に記憶することにより自身でも顧客情報を記憶する構成とできる。この場合、サーバ１０のＣＲＭ記憶制御部１０５１は、通話ＩＤに替えて、顧客ＩＤまたは顧客の氏名、顧客組織名などを含むリクエストをＣＲＭシステム３０へ送信することにより、通話データを通話対象の顧客と関連付けて記憶しても良い。この場合も、通話に関するデータは、ＣＲＭシステム３０において、通話対象の顧客情報と紐付けて記憶される。

本開示においては、サーバ１０がユーザと顧客との間の通話に関するサービスも提供するが、通話サービスは不図示の外部サービスが提供しても良い。このとき、サーバ１０のＣＲＭ記憶制御部１０５１は、当該外部サービスから提供されるユーザと顧客との間の通話開始に関するリクエストの受信をもって、ユーザと顧客との間の通話が開始したことを検知してＣＲＭ記憶処理を開始しても良い。同様に、当該外部サービスから提供されるユーザと顧客との間の通話終了に関するリクエストの受信をもって、ユーザと顧客との間の通話が終了したことを検知しても良い。その他、ユーザと顧客との間で行われる音声データに基づき、例えば、音声データがなくなったことをもって、ユーザと顧客との間の通話が終了したことを検知しても良い。

＜通話表示処理＞
通話表示処理は、ＣＲＭシステム３０に記憶された通話データを、ユーザに表示するための処理である。以下、通話表示処理の詳細を図２０のフローチャートを用いて説明する。図２４は、通話表示処理におけるＣＲＭシステム３０が出力する画面例を示した図である。

＜通話表示処理の概要＞
ユーザは、顧客との間の通話が終了した後に、ユーザ端末２０を操作し、ＣＲＭシステム３０に記憶された顧客との応対履歴を表示させる。ユーザは、ユーザ端末２０を操作し、顧客との応対履歴から、解析データを表示させたい応対履歴を選択し、解析データの表示をリクエストすると、ＣＲＭシステム３０はサーバ１０から解析データを取得し、ユーザ端末２０のディスプレイ２０８１に顧客情報と解析データとを表示させる。

＜通話表示処理の詳細＞
ステップＳ７０１において、ユーザはユーザ端末２０を操作してＣＲＭシステム３０が提供する所定のウェブサイトを開き、応対履歴表示画面を表示させる。
具体的には、ユーザ端末２０は、顧客情報の一覧表示に関するリクエストをＣＲＭシステム３０に送信する。ＣＲＭシステム３０は、顧客テーブル３０１２を検索し、レコードをユーザ端末２０へ送信する。ユーザ端末２０のディスプレイ２０８１は、受信した顧客情報をユーザが選択可能なように一覧表示する。
ユーザは、ユーザ端末２０のディスプレイ２０８１に一覧表示された顧客情報から、応対履歴を表示させたい顧客を選択し、「送信」ボタンを押下することにより、ＣＲＭシステム３０に選択された顧客の顧客ＩＤを送信する。ＣＲＭシステム３０は、顧客ＩＤを受信すると、応対履歴テーブル３０１３を検索し、選択された顧客に関する応対履歴のレコードをユーザ端末２０へ送信する。ユーザ端末２０のディスプレイ２０８１は、受信した応対履歴をユーザが選択可能なように一覧表示する。

ステップＳ７０２において、ユーザは、ユーザ端末２０のディスプレイ２０８１に一覧表示された応対履歴から、応対履歴を表示させたいレコードを選択し、「送信」ボタンを押下することにより、ＣＲＭシステム３０に選択された応対履歴の応対履歴ＩＤを送信する。ＣＲＭシステム３０は、選択された応対履歴情報の表示画面を生成しユーザ端末２０に送信する。ユーザ端末２０のディスプレイ２０８１は、受信した応対履歴情報の表示画面を表示する。応対履歴情報の表示画面には、応対履歴テーブル３０１３に記憶された、ＵＲＬ、顧客情報、ユーザ情報、ダイアル日時、通話開始日時、通話終了日時、ＣＲＭ記憶処理によりコメントに記憶された音声認識情報および要約情報などが表示される。
なお、ステップＳ７０１、Ｓ７０２の処理を行わずに、例えば、ユーザと顧客との間の通話が終了した後に、ユーザ端末２０は、当該通話に関する応対履歴を選択された応対履歴とし、応対履歴ＩＤをＣＲＭシステム３０へ送信しても良い。

ステップＳ７０３において、ユーザは、ユーザ端末２０を操作し、応対履歴情報の表示画面に表示された「解析結果」のボタン８０１を押下する。ユーザ端末２０は、ＣＲＭシステム３０に対して、当該通話に関連する応対履歴ＩＤを含む解析結果を表示するリクエストを送信する。ＣＲＭシステム３０は、受信した応対履歴ＩＤに基づき、応対履歴テーブル３０１３を検索し通話ＩＤを特定する。ＣＲＭシステム３０は、特定した通話ＩＤを含む、解析データを要求するリクエストをサーバ１０へ送信する。サーバ１０は、受信した通話ＩＤに基づき通話テーブル１０１４を検索し、解析データの存在有無を確認する。解析データが存在しない場合には、ステップＳ７０３にて待機する。
解析データが存在する場合はステップＳ７０４に進む。

ステップＳ７０４において、サーバ１０は、受信した通話ＩＤに基づき、通話テーブル１０１４を検索し、解析データをＣＲＭシステム３０に送信する。ＣＲＭシステム３０は、受信した解析データに基づき、解析データを可視化した解析結果画面８０８を生成しユーザ端末２０へ送信する。解析結果画面８０８は、図２４に示す音声解析結果８０２、応対評価８０４、音声評価８０５、話速８０６を含む。解析結果画面８０８は、応対履歴テーブル３０１３のコメントの項目に記憶された、テキスト形式の音声認識結果、要約結果であるコメント８０７を含んでも良い。ユーザは、再生、停止ボタン８０３を押下することにより、通話音声を再生することができる。
ＣＲＭシステム３０には、顧客テーブル３０１２などの顧客に関する情報が蓄積されており、ユーザはＣＲＭシステム３０に記憶された顧客に関する情報と、解析データを可視化した解析結果画面とを選択的に切り替えて表示したり、並べて表示することで、顧客との応対履歴を短時間でより詳細に把握することができる。つまり、ユーザは、ＣＲＭシステム３０に対する操作により、顧客情報の管理に加え、解析データの可視化結果も確認することができる。

＜変形例＞
本開示において、音声サーバ（ＰＢＸ）４０と顧客端末５０は、電話網Ｔにより接続されているものとして説明を行ったが、特にこれに限定されない。つまり、音声サーバ（ＰＢＸ）４０と顧客端末５０は、例えば、インターネット等を含むあらゆる通信手段により接続されていても良い。

この場合、発信処理において、顧客の電話番号ではなく、顧客を識別するための任意の顧客識別情報、ＵＲＬなどの情報に基づき顧客端末５０に対して発信（架電）を行う構成としても良い。同様に、着信処理においても、着信リクエストは顧客を識別するための任意の顧客識別情報、ＵＲＬなどの情報を含んでもよく、当該顧客識別情報、ＵＲＬなどの情報に基づき着信するユーザ端末２０を特定し、着信（受電）を行う構成としても良い。

＜コンピュータの基本ハードウェア構成＞
図２５は、コンピュータ９０の基本的なハードウェア構成を示すブロック図である。コンピュータ９０は、プロセッサ９０１、主記憶装置９０２、補助記憶装置９０３、通信ＩＦ９９１（インタフェース、Interface）を少なくとも備える。これらは通信バス９２１により相互に電気的に接続される。

プロセッサ９０１とは、プログラムに記述された命令セットを実行するためのハードウェアである。プロセッサ９０１は、演算装置、レジスタ、周辺回路等から構成される。

主記憶装置９０２とは、プログラム、及びプログラム等で処理されるデータ等を一時的に記憶するためのものである。例えば、ＤＲＡＭ（Dynamic Random Access Memory）等の揮発性のメモリである。

補助記憶装置９０３とは、データ及びプログラムを保存するための記憶装置である。例えば、フラッシュメモリ、ＨＤＤ（Hard Disc Drive）、光磁気ディスク、ＣＤ―ＲＯＭ、ＤＶＤ―ＲＯＭ、半導体メモリ等である。

通信ＩＦ９９１とは、有線又は無線の通信規格を用いて、他のコンピュータとネットワークを介して通信するための信号を入出力するためのインタフェースである。
ネットワークは、インターネット、ＬＡＮ、無線基地局等によって構築される各種移動通信システム等で構成される。例えば、ネットワークには、３Ｇ、４Ｇ、５Ｇ移動通信システム、ＬＴＥ（Long Term Evolution）、所定のアクセスポイントによってインターネットに接続可能な無線ネットワーク（例えばWi-Fi（登録商標））等が含まれる。無線で接続する場合、通信プロトコルとして例えば、Ｚ―Ｗａｖｅ（登録商標）、ＺｉｇＢｅｅ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）等が含まれる。有線で接続する場合は、ネットワークには、ＵＳＢ（Universal Serial Bus）ケーブル等により直接接続するものも含む。

なお、各ハードウェア構成の全部または一部を複数のコンピュータ９０に分散して設け、ネットワークを介して相互に接続することによりコンピュータ９０を仮想的に実現することができる。このように、コンピュータ９０は、単一の筐体、ケースに収納されたコンピュータ９０だけでなく、仮想化されたコンピュータシステムも含む概念である。

＜コンピュータ９０の基本機能構成＞
コンピュータ９０の基本ハードウェア構成（図２５）により実現されるコンピュータの機能構成を説明する。コンピュータは、制御部、記憶部、通信部の機能ユニットを少なくとも備える。

なお、コンピュータ９０が備える機能ユニットは、それぞれの機能ユニットの全部または一部を、ネットワークで相互に接続された複数のコンピュータ９０に分散して設けても実現することができる。コンピュータ９０は、単一のコンピュータ９０だけでなく、仮想化されたコンピュータシステムも含む概念である。

制御部は、プロセッサ９０１が補助記憶装置９０３に記憶された各種プログラムを読み出して主記憶装置９０２に展開し、当該プログラムに従って処理を実行することにより実現される。制御部は、プログラムの種類に応じて様々な情報処理を行う機能ユニットを実現することができる。これにより、コンピュータは情報処理を行う情報処理装置として実現される。

記憶部は、主記憶装置９０２、補助記憶装置９０３により実現される。記憶部は、データ、各種プログラム、各種データベースを記憶する。また、プロセッサ９０１は、プログラムに従って記憶部に対応する記憶領域を主記憶装置９０２または補助記憶装置９０３に確保することができる。また、制御部は、各種プログラムに従ってプロセッサ９０１に、記憶部に記憶されたデータの追加、更新、削除処理を実行させることができる。

データベースは、リレーショナルデータベースを指し、行と列によって構造的に規定された表形式のテーブル、マスタと呼ばれるデータ集合を、互いに関連づけて管理するためのものである。データベースでは、表をテーブル、マスタ、表の列をカラム、表の行をレコードと呼ぶ。リレーショナルデータベースでは、テーブル、マスタ同士の関係を設定し、関連づけることができる。
通常、各テーブル、各マスタにはレコードを一意に特定するための主キーとなるカラムが設定されるが、カラムへの主キーの設定は必須ではない。制御部は、各種プログラムに従ってプロセッサ９０１に、記憶部に記憶された特定のテーブル、マスタにレコードを追加、削除、更新を実行させることができる。

通信部は、通信ＩＦ９９１により実現される。通信部は、ネットワークを介して他のコンピュータ９０と通信を行う機能を実現する。通信部は、他のコンピュータ９０から送信された情報を受信し、制御部へ入力することができる。制御部は、各種プログラムに従ってプロセッサ９０１に、受信した情報に対する情報処理を実行させることができる。また、通信部は、制御部から出力された情報を他のコンピュータ９０へ送信することができる。

＜付記＞
以上の各実施形態で説明した事項を以下に付記する。

（付記１）
プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータをコンピュータに管理させるためのプログラムであって、プログラムは、プロセッサに、通話に関する音声データを受け付ける受付ステップと、音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップ（Ｓ１０４、Ｓ２０４）と、複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップ（Ｓ１０４、Ｓ２０４）と、テキスト抽出ステップにおいて抽出された複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数のテキスト情報を要約情報として抽出する要約抽出ステップ（Ｓ１０７、Ｓ２０７）と、を実行するプログラム。
これにより、ユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記２）
プログラムは、プロセッサに、テキスト抽出ステップにおいて抽出された複数のテキスト情報に対して、複数のテキスト情報を発話時刻の順番に並べた場合に、話者情報が変化する前後のテキスト情報をテキスト情報群としてバインディングするバインディングステップ（Ｓ１０５）と、複数のテキスト情報、および、バインディングステップにおいてバインディングされた１または複数のテキスト情報群に対して重要度を算定する算定ステップ（Ｓ１０６）と、を実行させ、要約抽出ステップは、重要度に基づき、テキスト情報またはテキスト情報群を要約情報として抽出するステップである、付記１記載のプログラム。
これにより、ユーザと顧客との間で行われる通話に関連するデータを管理するコンピュータにおいて、ユーザと顧客との間で行われる通話に基づき、バインディングが行われた発話と応対のテキスト情報群というユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記３）
算定ステップは、バインディングステップにおいてバインディングされた１または複数のテキスト情報群のそれぞれに対し、当該テキスト情報群に含まれるテキスト情報を結合してなる一の文章として重要度を算定するステップ（Ｓ１０６）である、付記２記載のプログラム。
これにより、バインディングが行われた発話と応対のテキスト情報群ごとの重要度を算定することができる。ユーザと顧客との通話応対に注目した要約情報が生成される。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記４）
算定ステップは、バインディングステップにおいてバインディングされたテキスト情報群に含まれる複数のテキスト情報のそれぞれに対して重要度を算定し、算定された複数の重要度に対して統計処理を行った値を、テキスト情報群の重要度として算定するステップ（Ｓ１０６）である、付記２記載のプログラム。
これにより、バインディングが行われた発話と応対のテキスト情報群ごとの重要度を算定することができる。ユーザと顧客との通話応対に注目した要約情報が生成される。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記５）
算定ステップは、算定された複数の重要度のうち最も大きな重要度をテキスト情報群の重要度とするステップ（Ｓ１０６）である、付記４記載のプログラム。
これにより、バインディングが行われた発話と応対のテキスト情報群に含まれるテキスト情報のうち最も重要度の高いテキスト情報の重要度に基づき、テキスト情報群の重要度が算定される。重要度が大きいテキスト情報を含む要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対のうち、重要度が大きいテキスト情報を見落とさずに確認することができる。

（付記６）
算定ステップは、算定された複数の重要度の和または平均をテキスト情報群の重要度とするステップ（Ｓ１０６）である、付記４記載のプログラム。
これにより、バインディングが行われた発話と応対のテキスト情報群に含まれるテキスト情報の重要度の和または平均に基づき、テキスト情報群の重要度が算定される。重要度が大きいテキスト情報をより多く含む要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対のうち、重要度が大きいテキスト情報をより多く含むテキスト情報を見落とさずに確認することができる。

（付記７）
プログラムは、プロセッサに、テキスト抽出ステップにおいて抽出された複数のテキスト情報に対して、重要度を算定する算定ステップ（Ｓ２０５）と、を実行させ、要約抽出ステップは、重要度に基づき、テキスト抽出ステップにおいて抽出された複数のテキスト情報から１または複数のテキスト情報を抽出するステップと、抽出された１または複数のテキスト情報と話者情報が異なり、発話時刻において前後するテキスト情報を要約情報として抽出するステップ（Ｓ２０６）と、を含む、付記１記載のプログラム。
これにより、通話に関連するデータを管理するコンピュータにおいて、ユーザと顧客との間で行われる通話に基づき、バインディングが行われた発話と応対のテキスト情報群というユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記８）
プログラムは、プロセッサに、要約抽出ステップにおいて抽出された、要約情報に含まれるテキスト情報を発話時刻の順番に並べた要約文書を表示する表示ステップ（Ｓ２０７）と、を実行する付記１から７のいずれか記載のプログラム。
これにより、ユーザは、要約文書を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記９）
要約文書は、テキスト情報ごとに吹き出しで表示された要約文書であり、吹き出しは、テキスト情報の話者ごとに異なる色で表示され、吹き出しの色は、テキスト情報またはテキスト情報の重要度に基づき、色の明度、色相、彩度、濃さの少なくともいずれか１つを変化させて表示される、付記８記載のプログラム。
これにより、ユーザは、テキスト情報が含まれる吹き出しの色の明度、色相、彩度、濃さを確認することにより、視覚的に吹き出しに含まれるテキスト情報の重要度を把握することができる。

（付記１０）
プログラムは、プロセッサに、外部のＣＲＭシステムに要約文書を記憶させる記憶ステップ（Ｓ１０７、Ｓ２０７）と、を実行させる、付記８または９記載のプログラム。
これにより、ユーザは、ユーザと顧客との間で行われる通話の要約文書を、顧客情報とともに、ＣＲＭシステムで体系的に管理することができる。

（付記１１）
プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータを管理するための情報処理システムであって、プロセッサに、通話に関する音声データを受け付ける受付ステップと、音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップ（Ｓ１０４、Ｓ２０４）と、複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップ（Ｓ１０４、Ｓ２０４）と、テキスト抽出ステップにおいて抽出された複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数のテキスト情報を要約情報として抽出する要約抽出ステップ（Ｓ１０７、Ｓ２０７）と、を実行する情報処理システム。
これにより、ユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

（付記１２）
プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータをコンピュータに管理させるための情報処理方法であって、プロセッサに、通話に関する音声データを受け付ける受付ステップと、音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップ（Ｓ１０４、Ｓ２０４）と、複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップ（Ｓ１０４、Ｓ２０４）と、テキスト抽出ステップにおいて抽出された複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数のテキスト情報を要約情報として抽出する要約抽出ステップ（Ｓ１０７、Ｓ２０７）と、を実行する情報処理方法。
これにより、ユーザと顧客との通話応対に注目した要約情報を生成することができる。
ユーザは、要約情報を確認することで、ユーザと顧客との間で行われた通話応対を短時間で正確に把握することができる。

１情報処理システム、１０サーバ、１０１記憶部、１０３制御部、２０Ａ，２０Ｂ，２０Ｃユーザ端末、２０１記憶部、２０４制御部、３０ＣＲＭシステム、３０１記憶部、３０４制御部、５０Ａ，５０Ｂ，５０Ｃ顧客端末、５０１記憶部、５０４制御部

Claims

プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータをコンピュータに管理させるためのプログラムであって、
前記プログラムは、前記プロセッサに、
前記通話に関する音声データを受け付ける受付ステップと、
前記音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップと、
前記複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップと、
前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数の前記テキスト情報を要約情報として抽出する要約抽出ステップと、
を実行するプログラム。
前記プログラムは、前記プロセッサに、
前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報に対して、前記複数のテキスト情報を発話時刻の順番に並べた場合に、話者情報が変化する前後のテキスト情報をテキスト情報群としてバインディングするバインディングステップと、
前記複数のテキスト情報、および、バインディングステップにおいてバインディングされた前記１または複数のテキスト情報群に対して重要度を算定する算定ステップと、
を実行させ、
前記要約抽出ステップは、前記重要度に基づき、前記テキスト情報または前記テキスト情報群を前記要約情報として抽出するステップである、
請求項１記載のプログラム。
前記算定ステップは、前記バインディングステップにおいてバインディングされた前記１または複数のテキスト情報群のそれぞれに対し、当該テキスト情報群に含まれるテキスト情報を結合してなる一の文章として重要度を算定するステップである、
請求項２記載のプログラム。
前記算定ステップは、前記バインディングステップにおいてバインディングされた前記テキスト情報群に含まれる複数のテキスト情報のそれぞれに対して重要度を算定し、算定された複数の重要度に対して統計処理を行った値を、前記テキスト情報群の重要度として算定するステップである、
請求項２記載のプログラム。
前記算定ステップは、算定された前記複数の重要度のうち最も大きな重要度を前記テキスト情報群の重要度とするステップである、
請求項４記載のプログラム。
前記算定ステップは、算定された前記複数の重要度の和または平均を前記テキスト情報群の重要度とするステップである、
請求項４記載のプログラム。
前記プログラムは、前記プロセッサに、
前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報に対して、重要度を算定する算定ステップと、
を実行させ、
前記要約抽出ステップは、
前記重要度に基づき、前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報から１または複数のテキスト情報を抽出するステップと、
抽出された１または前記複数のテキスト情報と話者情報が異なり、発話時刻において前後する前記テキスト情報を前記要約情報として抽出するステップと、
を含む、
請求項１記載のプログラム。
前記プログラムは、前記プロセッサに、
前記要約抽出ステップにおいて抽出された、前記要約情報に含まれる前記テキスト情報を発話時刻の順番に並べた要約文書を表示する表示ステップと、
を実行する請求項１から７のいずれか記載のプログラム。
前記要約文書は、前記テキスト情報ごとに吹き出しで表示された要約文書であり、
前記吹き出しは、前記テキスト情報の話者ごとに異なる色で表示され、
前記吹き出しの色は、前記テキスト情報または前記テキスト情報の重要度に基づき、色の明度、色相、彩度、濃さの少なくともいずれか１つを変化させて表示される、
請求項８記載のプログラム。
前記プログラムは、前記プロセッサに、
外部のＣＲＭシステムに前記要約文書を記憶させる記憶ステップと、
を実行させる、
請求項８または９記載のプログラム。
プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータを管理するための情報処理システムであって、
前記プロセッサに、
前記通話に関する音声データを受け付ける受付ステップと、
前記音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップと、
前記複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップと、
前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数の前記テキスト情報を要約情報として抽出する要約抽出ステップと、
を実行する情報処理システム。
プロセッサと、記憶部とを備え、ユーザと顧客との間で行われる通話に関連するデータをコンピュータに管理させるための情報処理方法であって、
前記プロセッサに、
前記通話に関する音声データを受け付ける受付ステップと、
前記音声データから、発話区間ごとに複数の区間音声データを抽出する音声抽出ステップと、
前記複数の区間音声データのそれぞれに対してテキスト認識を行い複数のテキスト情報を抽出するテキスト抽出ステップと、
前記テキスト抽出ステップにおいて抽出された前記複数のテキスト情報から、話者情報が異なり、発話時刻において前後する１または複数の前記テキスト情報を要約情報として抽出する要約抽出ステップと、
を実行する情報処理方法。