JP2016189510A - 音声情報記憶装置、音声情報記憶方法及びそのプログラム - Google Patents

音声情報記憶装置、音声情報記憶方法及びそのプログラム Download PDF

Info

Publication number
JP2016189510A
JP2016189510A JP2015067996A JP2015067996A JP2016189510A JP 2016189510 A JP2016189510 A JP 2016189510A JP 2015067996 A JP2015067996 A JP 2015067996A JP 2015067996 A JP2015067996 A JP 2015067996A JP 2016189510 A JP2016189510 A JP 2016189510A
Authority
JP
Japan
Prior art keywords
audio
voice
sample data
identification information
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015067996A
Other languages
English (en)
Inventor
信之 山浦
Nobuyuki Yamaura
信之 山浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015067996A priority Critical patent/JP2016189510A/ja
Publication of JP2016189510A publication Critical patent/JP2016189510A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】テキス卜変換を用いずに、保存された音声ファイルに識別情報を追加することにより、保存した音声ファイルを容易にデータベース化できる音声情報記憶装置を提供する。
【解決手段】音声情報記憶装置100は、音声データからなる音声ファイル145を蓄積する通話ファイル記憶部140から音声ファイルを取り込み、これに第1識別情報(テキスト)を追加する。音声情報記憶部160は、第1識別情報を記憶し、第1識別情報に一対一対応する1つ以上の音声サンプルデータ170を記憶する。情報追加処理部130は、音声ファイル内の音声データの一部と音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、音声ファイルに音声サンプルデータに対応する第1識別情報を追加する。音声情報記憶装置は、音声ファイルの識別情報と第1識別情報とを同時に表示する表示部113とを有する。
【選択図】図1

Description

本発明は、通話録音装置等の音声情報記憶装置、音声情報記憶方法及びそのプログラムに関する。
コールセンタ業務において、通話録音装置は、顧客と事業者との間でなされた通話を事業者側において録音して管理、分析する目的で、広く使用されている。例えば、通話に関連した文字データを録音音声データに付加する通話録音装置が知られている(特許文献1、参照)。また、CRM(Customer Relationship Management)システムとして、音声認識技術により、顧客とオペレータとの通話をリアルタイムでテキスト変換して保存する音声情報記憶装置を利用したCTI(Computer Telephony Integration)システムが開発されている(特許文献2、参照)。さらに、通話内容録音装置で録音した音声ファイルをWebサーバで管理することが知られている(特許文献3、参照)。
特開2010−219969号公報 特開2014−174938号公報 WO2008/126304号公報
コールセンタ業務において、顧客とオペレータとの通話録音を再生してその内容の確認を行う必要がある場合がある。この場合、膨大な通話録音全体を再生することは、長時間と多大な労力を伴う。
そこで、上記従来技術のように、録音音声データに識別情報を付加してデータベース化している事業者がいる。
しかしながら、従来技術では、通話ファイルのテキス卜変換する音声認識ソフトのCPUへの処理負荷が高いためハードウエア設備が高額化する課題がある。また、市販されている音声ファイルのテキス卜変換ソフ卜が比較的高価である故に、ソフ卜の購入ができない事業者がいる。
本発明は、上記課題に鑑みてされたものであり、その目的は、テキス卜変換を用いずに、保存された音声ファイルに識別情報を追加できる音声情報記憶装置と、その音声情報記憶方法及びプログラムを提供することにある。
本発明の音声情報記憶装置は、音声データからなる音声ファイルを蓄積する通話ファイル記憶部と、
第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声情報記憶部と、
前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理部と、
前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示部と、
を有することを特徴とする。
本発明のプログラムは、音声情報記憶処理をコンピュータに実行させるプログラムであって、該プログラムは、前記コンピュータに、
音声データからなる音声ファイルを蓄積する通話ファイル記憶部と、
第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声情報記憶部と、
前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理部と、
前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示部と、
して機能させる、ことを特徴とする。
本発明の音声情報記憶方法は、音声データからなる音声ファイルを蓄積する通話ファイル記憶処理ステップと、
第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声データ記憶処理ステップと、
前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理ステップと、
前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示処理ステップと、を含む、ことを特徴とする。
本発明によれば、通話録音装置において、さまざまな人の声を標本抽出した音声サンプルデータからなるキーワードやキーフレーズを用いて、音声ファイルに、顧客とオペレータとの通話に関わるキーワードを対応付けて保存することが可能となる。すなわち、本発明による音声情報記憶装置によれば、所定の識別情報に対応付けられた音声ファイルが保存される構成が与えられる。これにより、録音データを容易に検索することが可能となり、録音データの運用を効率的に行うことができる。
本発明の実施例1に係る音声情報記憶装置の構成を示すブロック図である。 本発明の実施例1に係る音声情報記憶装置に格納される音声サンプルデータを示す概念図である。 本発明の実施例1に係る音声情報記憶装置に格納される音声サンプルデータを示す概念図である。 本発明の実施例1に係る音声情報記憶装置の付箋紙作成部を示すブロック図である。 本発明の実施例1に係る音声情報記憶装置のディスプレイ装置のグラフィカルユーザインタフェースにて作成された管理画面の正面図である。 本発明の実施例1に係る音声情報記憶装置の付箋紙作成におけるテキスト生成処理を示すフローチャートである。 本発明の実施例2に係る音声情報記憶装置をコールセンタに応用した構成を示すブロック図である。 本発明の実施例2に係る音声情報記憶装置に格納される音声サンプルデータを示す概念図である。 本発明の実施例2に係る音声情報記憶装置の付箋紙作成におけるテキスト生成処理を示すフローチャートである。 本発明の実施例3に係る音声情報記憶装置に格納される音声サンプルデータを示す概念図である。 本発明の実施例3に係る音声情報記憶装置の付箋紙作成におけるテキスト生成処理を示すフローチャートである。 本発明の実施例4に係る音声情報記憶装置のハードウエア構成の一例を示すコンピュータ装置のブロック図である。
以下、図面を参照しつつ本発明の実施例について詳細に説明する。なお、本発明は以下の実施例に限定されるものではない。なお、本明細書及び図面において、実質的に同一の機能及び構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
図1は、本実施例に係る音声情報記憶装置100の構成を示している。音声情報記憶装置100は、音声録音した音声データからなる音声ファイルを記憶して、該音声ファイルに、人の通話に関わるキーワード、キーフレーズ等の識別情報を対応付けて保存する処理を行う装置である。
音声情報記憶装置100の録音ファイル管理部110は、キーワード管理部120及び付箋紙作成部130からの指令に応じて、通話ファイル記憶部140を管理している。通話ファイル記憶部140は、録音した音声データからなる音声ファイル145を記憶、蓄積し、音声ファイル145の送受信を管理している。
音声情報記憶装置100のキーワード管理部120は、キーワード情報155を記憶する管理データベース(以下、管理DBという)150と付箋紙作成部130との間にあり、これら間のキーワード情報の送受信を管理している。キーワード管理部120は管理DB150を用いて、使用されているキーワードや、該キーワードの重みを管理している。
音声情報記憶装置100は、キーワード情報を記憶する管理DB150と、音声サンプルデータ170を記憶する音声ファイルデータベース(以下、単に、音声DBという)160(音声情報記憶部)とを有している。また、音声情報記憶装置100は、マウスやキーボード等の入力装置112とディスプレイ装置113を有している。
付箋紙作成部130は、音声DB160の音声サンプルデータ170を用いて通話ファイル記憶部140の音声ファイル145に対してキーワード情報等の識別情報を対応付ける処理すなわち付箋紙作成を実行し、さらに該付箋紙のキーワード情報を管理DB150に登録する。付箋紙作成部130は、付箋紙自動作成時に音声ファイル145の音声内容から自動で付箋紙を作成する際、付箋紙に記載するテキストを生成する機能をも有している。
付箋紙作成部130は、音声サンプルデータ170と音声ファイル145内の音声データの一部とを比較して、比較結果が所定の類似度以上である場合に照合と判断して、音声ファイル145に、音声サンプルデータに一対一対応する第1識別情報(テキスト)を追加する。
<音声DBの音声サンプルデータ>
次に、音声サンプルデータの具体的な構成を説明する。図1に示す音声DB160に記憶されている音声サンプルデータ170は、1又は複数の単語に対して1又は複数の人の声を標本抽出した音声データの音声サンプルデータすなわち、サンプリング情報である。この抽出した音声サンプルに、予めテキスト(キーワード)を一対一に関連付けて音声サンプルデータ170として格納されている。これによって、付箋紙作成部130は、音声サンプルデータ170を再生した音声データと対象の音声ファイル145の音声データとで比較処理をして、照合したときに、該当するテキスト(キーワード)を当該対象の音声ファイル145に追加できる。このように、本実施例では、音声DB160において、該当する文字(キーワード)は、音声サンプルデータと関連付けされて記憶され、該当する文字(キーワード)と音声サンプルデータは、予め、音声DB160に登録されていることを前提とする。
ここで、音声サンプルデータ170の一例が、キーワード「日付け」に関わる音声サンプルデータ170である場合を説明する。この場合、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のように生成される。
第1の音声サンプルデータは、例えば、キーワード「日付け」における「月」に関する「1月」、「2月」、・・・「12月」を日本人が発声した音声波形パターン(以下、単に、波形パターンという)である。
第2の音声サンプルデータは、例えば、キーワード「日付け」における「日」に関する「1日」、「2日」、・・・「31日」の波形パターンである。
第3の音声サンプルデータは、例えば、キーワード「日付け」における「曜日」に関する「月」、「火」、・・・「日」の波形パターンである。
なお、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のように、個々の単語を1つの音声サンプルデータとしても良い。
第1−(1)音声サンプルデータは、「1月」の波形パターンである。
第1−(2)音声サンプルデータは、「2月」の波形パターンである。
・・・
第1−(12)音声サンプルデータは、「12月」の波形パターンである。
第2−(1)音声サンプルデータは、「1日」の波形パターンである。
第2−(2)音声サンプルデータは、「2日」の波形パターンである。
・・・
第2−(31)音声サンプルデータは、「31日」の波形パターンである。
第3−(1)音声サンプルデータは、「月」の波形パターンである。
第3−(2)音声サンプルデータは、「火」の波形パターンである。
・・・
第3−(7)音声サンプルデータは、「日」の波形パターンである。
ここで、これらの音声サンプルデータは、1つの単語に対して複数の人の声(例えば、aさん、bさん、cさんの3人の声)を標本抽出した音声を音声サンプルデータとしている。
図2は、キーワード「日付け」に紐付けられた音声サンプルデータの群を示す。図2の各行が音声サンプルデータのそれぞれを表す。ただし、音声サンプルデータにおける波形パターン部分は理解しやすさのために波形パターンで意味されるカタカナで表記している。
また、図3は、図2の「日付け」クラスの下位概念レベルで分類されている第1キーワード「月」、第2キーワード「日」、第3キーワード「曜日」にそれぞれ紐付けられた音声サンプルデータの群を示す。
このように、分類分けされたキーワード毎に、対応する音声データを収集して、該キーワードと音声データを関連付け音声サンプルデータ170を生成して、図1に示す音声DB160に記憶されている。
<付箋紙作成部の比較処理動作>
次に、付箋紙作成部130の具体的な構成について、図4を参照しつつ説明する。図4は本発明の実施例1に係る音声情報記憶装置の付箋紙作成部を示すブロック図である。
図4は、付箋紙作成部130に含まれる音声認識部131は、付箋紙自動生成機能において、音声サンプルデータ170と音声ファイル145の音声データとを照合処理の結果の該当する文字を出力する。すなわち、音声認識部131は、録音された通話の音声ファイル145の音声データにおける音声(以下、音声ファイル145の音声又は音声ファイルの音声とも記載する)の中に、音声サンプルデータ170における音声(以下、音声サンプルデータ170の音声又は音声サンプルデータの音声とも記載する)と照合したときにこれを検出する部分である。ここで、照合処理において用いられる音声ファイル145の音声は、ディジタル信号により構成される音声であり、音声サンプルデータ170の音声は、ディジタル信号により構成される音声である。
音声認識部131は、通話ファイル記憶部140における録音された通話の音声ファイル145の音声の短時間スペクトラムの時系列と音声DB160における音声サンプルデータの短時間スペクトラムの時系列との照合により両者の類似度を計算する処理部である。
音声認識部131は、主に音響分析部132及び単語認識部133から構成されている。また、図示していないが、音響分析部132と通話ファイル記憶部140(図1)が接続され、単語認識部133と音声DB160(図1)が接続される。
音響分析部132は、音声入力信号に対して、例えば、高域強調等のプリエンファシス処理を施した後、当該音声の短時間スペクトラムを10〜20ミリ秒毎に求める。かかるスペクトラム分析には、通常15乃至20個の帯域フィルタ群、或いは8乃至12次程度の線形予測モデルを用いるようにしても良い。また、分析用のスペクトラム距離の尺度としては、例えば、帯域フィルタによる分析の場合には、フィルタ出力の特徴ベクトル間のユークリッド距離を用いても良いし、線形予測モデルによる分析の場合には、各種のLPC(linear Predictive Coding)スペクトラム距離尺度を用いるようにしても良い。
単語認識部133は、通話ファイル記憶部140における録音された通話の音声ファイル145の音声との音声認識処理を行う。単語認識部133は、通話ファイル記憶部140における録音された通話の音声ファイル145の音声と、音声DB160における音声サンプルデータの音声との両者の照合を図り、対応する短時間スペクトラム間の距離を単語全体に亘って累積して、累積距離が最小となる音声DB160における音声サンプルデータを選択し、選択した音声サンプルデータに該当するキーワードを出力する。単語認識部133における単語音声の認識処理では、さらに通話ファイル記憶部140における録音された通話の音声ファイル145の音声の発声速度の変動に対処すべく、通話ファイル記憶部140における録音された通話の音声ファイル145の音声と音声DB160における音声サンプルデータの音声の時間軸を非線形に伸縮させて両者の照合を図り、対応する短時間スペクトラム間の距離を単語全体に亘って累積して、累積距離が最小となる音声サンプルデータを選択するようにしても良い。
なお、以上に説明した音声認識部131の構成例は、あくまでも一つの実施例に過ぎず、本発明による音声認識部131の構成が、かかる事例に限定されるものでないことは言うまでもない。
<ディスプレイ装置の管理画面説明>
図5は、音声情報記憶装置100のディスプレイ装置113のWebの管理画面220の正面図である。グラフィカルユーザインタフェースにて作成された管理画面220には、上から順に、URL入力フィールド221、付箋紙のキーワード検索フィールド222及び使用されている付箋紙のキーワード一覧フィールド223が配置されている。
次に、管理画面220には、録音通話ファイルのイメージ画像224a,224b、付箋紙225a,225b、音声ファイルボタン226が順に配置されている。音声ファイルボタン226で呼び出される録音通話ファイル(通話ファイル記憶部140の音声ファイル)を識別するための情報である録音通話ファイルのイメージ画像224a,224bは、通話ファイル記憶部140に記録されている音声ファイルを概念的に示されている。録音通話ファイルのイメージ画像224a,224bの上に重ねてそれぞれ付箋紙225a,225bが貼られている。音声ファイルと第1識別情報を担う付箋紙とを同時に表示する故に、視認性が向上している。また、付箋紙225a,225bによれば、そこに記載のキーワードや付箋紙の色からランク付けや緊急の度の度合等音声ファイルに関わる顧客のランク付けが可能となる。
管理画面220には、付箋紙作成ボタン227、付箋紙自動作成ボタン228、キーワードボタン229及び削除ボタン230が、画面下に横に並べられている。
図5の付箋紙作成ボタン227のボタンを用いて、使用者がテキスト入力によって付箋紙を作成できる。この際、図1の付箋紙作成部130は、付箋紙225の作成とともに管理DB150へキーワードを登録する。また、キーワードと付箋紙225a,225bが張り付いた録音された通話の音声ファイル224a,224bを登録する。すなわち、付箋紙作成部130はオペレータ通信装置から受信した第2識別情報を追加することができる。
図5の付箋紙自動作成ボタン228を用いて、保存されている録音通話ファイルから、自動的に付箋紙を作成することもできる。不要になったら削除ボタン230によって付箋紙を削除する。この際、図1の付箋紙作成部130は、付箋紙自動作成ボタン228のクリック際に、指定された録音通話の音声ファイル145の音声内容から自動で付箋紙を作成する時、図1の付箋紙作成部130が、付箋紙に記載するテキストを自動で生成する。図1の付箋紙作成部130は、録音された通話の音声ファイル145からテキストへの生成は音声DB160から該当する音声を特定の文字に変換する機能を提供する。
<キーワード検索の動作説明>
図5の付箋紙のキーワード検索フィールド222を用いて、音声情報記憶装置100の付箋紙225a,225bに記入したキーワードから、テキストデータ変換を用いた音声ファイルを検索しなくても、ファイル検索が可能となる。
使用者がキーボードから付箋紙のキーワード検索フィールド222にてキーワードを入力する。すなわち、図1のキーワード管理部120は、使用者(オペレータ通信装置)から第3識別情報を受信して、当該第3識別情報に対応する音声ファイルを検索する。
この際、図1のキーワード管理部120は、管理DB150へ該当するキーワードにヒットする付箋紙を問い合わせる。そして、管理DB150からの問い合わせの回答を元に、キーワード管理部120は、付箋紙作成部130に指令して、使用者にて入力されたキーワードに該当する付箋紙が張り付いている録音通話ファイルを管理DB150からキーワード検索する。そして、キーワード管理部120は、管理DB150から付箋紙が張り付いている録音通話ファイル名を元に録音ファイル管理部110経由で通話ファイル記憶部140にある録音通話ファイルのチェック並びに取得をする。取得後、キーワード管理部120は付箋紙のキーワード検索フィールド222に対して検索したキーワードに該当する付箋紙と付箋紙が張り付いている録音通話ファイル名の一覧の検索結果をキーワード検索フィールド222に回答する。
<キーワード一覧フィールドの動作説明>
図5のキーワード一覧フィールド223でのキーワード一覧の出力動作を説明する。
使用者は付箋紙のキーワード検索フィールド222にて文字をキーボードから入力する。この際、図1のキーワード管理部120は付箋紙作成ボタン227で作成した付箋紙のキーワードを管理DB150に登録する。そして、キーワード管理部120は、登録された文字すなわちキーワードについてキーワード管理部120が使用されている回数や使用するキーワードのランクを定義する。また、使用者が管理画面220の付箋紙のキーワード検索フィールド222を使うことよって、入力された文字について、キーワード管理部120経由で使用されているキーワード・ランクを取得することができる。キーワード一覧フィールド223により、自動的に一番使用されているキーワードを定義することも容易となる。
<付箋紙作成の動作説明>
使用者が図5の付箋紙作成ボタン227をクリックすると、図1の付箋紙作成部130は付箋紙作成部130に付箋紙作成を指示する。そして、付箋紙作成部130は管理DB150に付箋紙のコンテンツを登録する。次に、録音ファイル管理部110に通話ファイル記憶部140にある録音された通話の音声ファイル145の検索を指示する。録音ファイル管理部110は通話ファイル記憶部140にある録音された通話の音声ファイル145を確認する。そして、付箋紙作成部130は、録音ファイル管理部110の結果から、キーワード一覧の中から1つのキーワードで選択された、該当する音声ファイル145に付箋紙を貼り付ける。
<キーワードボタンの動作説明>
使用者が図5のキーワードボタン229をクリックすると、図1のキーワード管理部120はキーワードのランクを定義、使用回数、重要度、時系列等の追加情報を一対として定義し、定義を管理DB150に登録する。表示される付箋紙へ色の定義も可能であり、使用する色によって重要度等のランクを付けることができる。定義、使用回数、重要度、時系列に対して重要度をシステムとして決め一定値に達したら、管理者に通知することを促す警告を管理画面220に表示させることが可能である。
<付箋紙自動作成の動作説明>
図5の付箋紙自動作成ボタン228をクリックすると付箋紙自動作成が実行される。録音された通話の音声ファイル145の音声内容から付箋紙が作成される際、付箋紙に記載するテキストの候補が自動で生成される。
先ず、図5の管理画面の付箋紙自動作成ボタン228のクリックで図1の付箋紙作成部130に付箋紙の作成を指示する。付箋紙作成部130は録音ファイル管理部110に通話ファイル記憶部140から付箋紙を貼り付ける対象の音声ファイル145の取得を指示する。録音ファイル管理部110は通話ファイル記憶部140から録音された通話の音声ファイル145の1つの音声ファイル、又は次の音声ファイルを取得する。ここで、録音された通話の音声ファイル145は、1つの通話に対して1つの録音ファイルが生成されるものとする。また、録音された通話の音声ファイル145は、1つ又は複数からなるものとする。
付箋紙作成部130は取得した録音された通話の音声ファイル145を再生し、ファイルの先頭の再生内容から音声DB160によって該当するキーワード検索する。付箋紙作成部130は音声サンプルデータ検索処理によって検索されたキーワードを付箋紙に記載する。これにより、付箋紙は作成される。
付箋紙作成部130は、付箋紙の生成後、管理DB150に付箋紙を登録する。付箋紙作成部130は生成されたキーワードを管理画面220の例えば付箋紙225aに貼りつける。付箋紙は、管理画面220の音声ファイル145に張り付けられる。
次に、付箋紙作成におけるテキスト生成処理を図6に示すフローチャートを用いて説明する。ここでは、音声DB160に図2に示した音声サンプルデータがあり、音声ファイル145から音声サンプルデータについて検索処理する場合を説明する。
図6に示すように、まず、付箋紙作成部130は1つ目の録音通話の音声ファイル145(又は2つ目以降の録音通話に該当する次の音声ファイル)の音声データを再生する(ステップS1)。次に、付箋紙作成部130は、上記の付箋紙作成部の比較処理動作に従って、音声ファイル145の音声を照合対象の音声サンプルデータ170の音声と比較(ステップS2)し、さらに、音声ファイル145の音声の一部に照合対象である音声サンプルデータの音声と照合する部位があるか否か判断する(ステップS3)。次に、付箋紙作成部130は、音声サンプルデータの音声と照合する部位がある場合、音声ファイル145の最後の音声まで照合対象である音声サンプルデータの音声と比較したか否か判断する(ステップS4)。次に、付箋紙作成部130は、最後の音声まで比較した場合、照合したテキスト(文字)を返すことにより、照合したテキスト(文字)を付箋紙作成におけるテキスト生成処理の処理結果を出力する(ステップS5)。処理結果として出力されるテキスト(文字)は、照合対象の音声サンプルデータ170の音声に対応するキーワードとなる。次に、付箋紙作成部130は、音声ファイル145はこれ以上ないか否か判断する(ステップS6)。次に、付箋紙作成部130は、音声ファイル145がこれ以上ないと判断した場合、付箋紙作成におけるテキスト生成処理を終了する。また、付箋紙作成部130は、音声ファイル145がまだある場合、ステップS1に戻り、次の録音通話の音声ファイル145について処理実行する。
一方、図6のステップS3にて音声サンプルデータの音声と照合する部位がない場合、付箋紙作成部130は、音声ファイル145の最後の音声まで照合対象である音声サンプルデータの音声と比較したか否か判断する(ステップS7)。次に、付箋紙作成部130は、最後の音声まで比較した場合、照合なしの時のテキスト(文字)を返すことにより、付箋紙作成におけるテキスト生成処理の処理結果を出力する(ステップS8)、上述のステップS6へ進む。
一方、付箋紙作成部130は、図6のステップS4にて音声ファイル145の最後の音声まで比較していない場合、ステップS2へ戻る。また、付箋紙作成部130は、図6のステップS7にて音声ファイル145の最後の音声まで比較していない場合、ステップS2へ戻る。
図6のフローチャートの処理は、図2に示した音声サンプルデータの複数の人の声の個々に対応して処理される。3人(aさん、bさん、cさん)である場合の検索処理は、図6のフローチャートの処理について3つ並行して処理し、1つめの図6のフローチャートの処理では、aさんの声を標本抽出した音声を音声サンプルデータの音声として使用し、2つめの図6のフローチャートの処理では、bさんの声を標本抽出した音声を音声サンプルデータの音声として使用し、3つめの図6のフローチャートの処理では、cさんの声を標本抽出した音声を音声サンプルデータの音声として使用する。
図6のフローチャートの処理は、第1の音声サンプルデータの音声について行う場合、「1月」の波形パターンについて処理し、「1月」の波形パターンの処理が終わると「2月」の波形パターンについて処理し、・・・、「11月」の波形パターンの処理が終わると「12月」の波形パターンについて処理する。ここで、図6のフローチャートの処理は、第1の音声サンプルデータについて行う場合、「1月」の波形パターンについての処理、「2月」の波形パターンについての処理、・・・、「12月」の波形パターンについての処理を、それぞれ並列に処理しても良い。
また、図6のフローチャートの処理検索処理は、第1の音声サンプルデータの音声についての処理が終わり、第2の音声サンプルデータの音声について行う場合、「1日」の波形パターンについて処理し、「1日」の波形パターンの処理が終わると「2日」の波形パターンについて処理し、・・・、「30日」の波形パターンの処理が終わると「31日」の波形パターンについて処理する。
図6のフローチャートの処理は、第2の音声サンプルデータの音声についての処理が終わり、第3の音声サンプルデータの音声について行う場合、「月」の波形パターンについて処理し、「月」の波形パターンの処理が終わると「火」の波形パターンについて処理し、・・・、「土」の波形パターンの処理が終わると「日」の波形パターンについて処理する。
さらにまた、図6のフローチャートの処理検索処理は、第1の音声サンプルデータの音声に関わる「1月」の波形パターンについての処理、「2月」の波形パターンについての処理、・・・、「12月」の波形パターンについての処理をそれぞれ並列に処理するとともに、第2の音声サンプルデータの音声に関わる「1日」の波形パターンについての処理、「2日」の波形パターンについての処理、・・・、「31日」の波形パターンについての処理をそれぞれ並列に処理し、第3の音声サンプルデータの音声に関わる「月」の波形パターンについての処理、「火」の波形パターンについての処理、・・・、「日」の波形パターンについての処理をそれぞれ並列に処理しても良い。
図6のフローチャートの処理(ステップS3〜4)で音声サンプルデータの音声に照合する音声ファイルの音声データ部分があり、1つのキーワード「日付け」が、第1の音声サンプルデータ〜第3の音声サンプルデータと関連付けて管理されているならば、図6の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、キーワード「日付け」となる(ステップS5)。
図7は、本発明による音声情報記憶装置100をコールセンタに応用した実施例2を示す。図7においてコールセンタ装置300は、例えば、顧客からの電話を受け付けるコールセンタ装置である。
CTI(Computer Telephony Integration)サーバ310は、コールセンタ300内に設けられたローカルエリアネットワーク(LAN)330に接続された通信装置の一つであり、ゲートウェイ(GW)332と公衆網340を介して顧客電話機350からの着信呼を受けて当該呼の接続処理を担う部分である。コールセンタ300は、LAN330に接続されたオペレータ端末320と実施例1の音声情報記憶装置100を有する。CTIサーバ310内の自動音声応答処理部(IVR:Interactive Voice Response)311は、例えば、電話(顧客通信装置)をかけてきた顧客に対して、顧客の識別番号や問い合わせ種別等を表すPB信号入力を要求したり所定のアナウンスを自動的に送出する部分である。
ここで、ゲートウェイ332は、ローカルエリアネットワーク330において伝送される信号と、公衆網340において伝送される信号を変換する装置である。なお、LAN330において伝送される信号におけるプロトコル一例は、IP(Internet Protocol)、SIP(Session Initiation Protocol)である。公衆網340における網の種類の一例は、PSTN(Public Switched Telephone Network)、ISDN(Integrated Services Digital Network)である。
オペレータ端末320は、オペレータが顧客からの電話について受け付け通話を行う端末装置である。オペレータ端末320に備えられたソフトフォン321は、オペレータが顧客との通話を行う際に用いられるツールである。また、ソフトフォン321は、かかる通話の開始や終了、或いは当該通話の転送等の指令信号を生成する機能を有する。
コールセンタ装置300は、顧客からコールセンタに電話を掛けてオペレータに接続処理を行う際、IVR処理により、顧客が要望するサービスに適したオペレータに接続できるようにしている。
そこで、IVR処理において、例えば、「#1:障害等情報について」、「#2:新製品情報について」及び「#3:その他情報について」のサービスが予め決められている場合、IVR311と音声情報記憶装置100の構成/処理(付箋紙自動作成の動作)は、以下のように構成される。ここで、IVR311は、顧客が要望するサービスについて、顧客にPB信号入力「#1」、「#2」及び「#3」のいずれかを要求する。
まず、図7のIVR311は以下のように設定される。
IVR311は、例えば、顧客から「#1」のPB信号入力があるとき、顧客が要望するサービスは、「#1:障害等情報について」と認識し、この通話に関わる録音された通話の音声ファイル145を通話ファイル記憶部140に記憶する際に、録音された通話の音声ファイル145のPB信号入力情報として「#1」が関連付けされて記憶される。
IVR311は、例えば、顧客から「#2」のPB信号入力があるとき、顧客が要望するサービスは、「#2:新製品情報について」と認識し、この通話に関わる録音された通話の音声ファイル145を通話ファイル記憶部140に記憶する際に、録音された通話の音声ファイル145のPB信号入力情報として「#2」が関連付けされて記憶される。
IVR311は、例えば、顧客から「#3」のPB信号入力があるとき、顧客が要望するサービスは、「#3:その他情報について」と認識し、この通話に関わる録音された通話の音声ファイル145を通話ファイル記憶部140に記憶する際に、録音された通話の音声ファイル145のPB信号入力情報として「#3」が関連付けされて記憶される。
次に、前提となる、図7の音声情報記憶装置100内の音声DBに所定の音声サンプルデータ(図示せず)が登録される。
そこで、キーワード「#1:障害等情報について」、「#2:新製品情報について」及び「#3:その他情報について」に関わる音声サンプルデータ170である場合、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のように生成される。
第1の音声サンプルデータは、例えば、キーワード「#1:障害等情報」に関する「壊れた」、「電源が入らない」、・・・、「ネットワークに接続できない」の波形パターンである。第2の音声サンプルデータは、例えば、キーワード「#2:新製品情報」に関する「新製品の商品名、その1」、「新製品の商品名、その2」、・・・、「新製品の商品名、そのN」の波形パターンである。第3の音声サンプルデータは、例えば、キーワード「#3:その他情報」に関するものとして「旧製品の商品名、その1」、「旧製品の商品名、その2」、・・・、「旧製品の商品名、そのN」の波形パターンである。
なお、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のように、個々の単語を1つの音声サンプルデータとしても良い。
第1−(1)音声サンプルデータは、「壊れた」の波形パターンである。
第1−(2)音声サンプルデータは、「電源が入らない」の波形パターンである。
・・・
第1−(12)音声サンプルデータは、「ネットワークに接続できない」の波形パターンである。
第2−(1)音声サンプルデータは、「新製品の商品名、その1」の波形パターンである。
第2−(2)音声サンプルデータは、「新製品の商品名、その2」の波形パターンである。
・・・
第2−(31)音声サンプルデータは、「新製品の商品名、そのN」の波形パターンである。
第3−(1)音声サンプルデータは、「旧製品の商品名、その1」の波形パターンである。
第3−(2)音声サンプルデータは、「旧製品の商品名、その2」の波形パターンである。
・・・
第3−(7)音声サンプルデータは、「旧製品の商品名、そのN」の波形パターンである。
ここで、これらの音声サンプルデータは、1つの単語に対して複数の人の声(例えば、aさん、bさん、cさんの3人の声)を標本抽出した音声を音声サンプルデータとしている。
図8は、キーワード「障害等情報について」、「新製品情報について」及び「その他情報について」に紐付けられた音声サンプルデータの群を示す。図8の各行が音声サンプルデータのそれぞれを表す。ただし、音声サンプルデータにおける波形パターン部分は理解しやすさのために波形パターンで意味されるカタカナで表記している。
このように、IVR311の選択モードで分類分けされたキーワード毎に、対応する音声データを収集して、該キーワードと音声データを関連付け音声サンプルデータ170を生成して、図7に示す音声情報記憶装置100の音声DB(図示せず)に記憶される。
なお、実施例2においても、図1に示すキーワード管理部120は管理DB150を用いて、使用されているキーワードや、該キーワードの重みを管理している。この場合、例えば、実施例2の音声サンプルデータ170(例えば、キーワード:「#1:障害等情報」)を一例とすると、「キーワードの重み」が「高いもの」から「低いもの」の順番に記載すると、例えば障害の度合いが大きい順に「壊れた」、「電源が入らない」、「ネットワークに接続できない」となるように管理できる。また、実施例2の音声サンプルデータ170(例えば、キーワード:「#2:新製品情報」)を一例とすると、「キーワードの重み」が「高いもの」から「低いもの」の順番に記載すると、例えば販売台数が多い順に「新製品の商品名、その1」、「新製品の商品名、その2」、「新製品の商品名、そのN」となるように管理できる。
また、「付箋紙の色」は、例えば、実施例2の場合、音声サンプルデータ170(例えば、キーワード:「#1:障害等情報」)を一例とすると、「キーワードの重み」に合わせて、例えば障害の度合いが大きい順に「壊れた」が「赤色の付箋紙」、「電源が入らない」が「橙色の付箋紙」、「ネットワークに接続できない」が「黄色の付箋紙」となるように管理できる。また、実施例2の音声サンプルデータ170(例えば、キーワード:「#2:新製品情報」)を一例とすると、「キーワードの重み」が「高いもの」から「低いもの」に合わせて、例えば販売台数が多い順に「新製品の商品名、その1」が「赤色の付箋紙」、「新製品の商品名、その2」が「橙色の付箋紙」、「新製品の商品名、そのN」が「黄色の付箋紙」となるように管理できる。
次に、実施例2の付箋紙作成におけるテキスト生成処理を図9に示すフローチャートを用いて説明する。ここでは、音声DB160に図8に示した音声サンプルデータがあり、音声ファイル145から音声サンプルデータについて検索処理する場合を説明する。なお、図9に示すフローチャートの処理は、ステップS1、S2間に音声ファイルに関連付けて記憶されるPB信号入力情報(「#1」、「#2」、「#3」)を確認するステップS1aがある以外、図6に示すフローチャートの処理と同一である。故に、実施例2の独特の事項を主に説明する。
ここで、この音声サンプルデータ170(図1)において、1つの単語に対して複数の人の声を標本抽出した音声を音声サンプルデータとしている場合、図9のフローチャートの処理は、複数の人の声の個々に対応して、処理される。例えば、複数の人が3人(aさん、bさん、cさん)である場合の処理は、図9のフローチャートの処理について3つ並行して処理し、1つめの図9のフローチャートの処理では、aさんの声を標本抽出した音声を音声サンプルデータの音声として使用し、2つめの図9のフローチャートの処理では、bさんの声を標本抽出した音声を音声サンプルデータの音声として使用し、3つめの図9のフローチャートの処理では、cさんの声を標本抽出した音声を音声サンプルデータの音声として使用する。
図9のフローチャートの処理は、まず、1つ目の音声ファイル、又は2つ目以降の録音通話に該当する次の音声ファイルの音声を再生する(ステップS1)。
図9のフローチャートの処理は、再生される音声ファイルに関連付けて記憶されるPB信号入力情報(「#1」、「#2」、「#3」)を確認する(ステップS1a)。
図9のフローチャートの処理は、確認したPB信号入力情報が「#1」であるならば、第1の音声サンプルデータの音声(キーワード「#1:障害等情報」)について処理する。図9のフローチャートの処理では、「壊れた」について処理し、「壊れた」の処理が終わると「電源が入らない」について処理し、・・・、最後に「ネットワークに接続できない」について処理する。ここで、図9のフローチャートの処理は、第1の音声サンプルデータについて行う場合、「壊れた」についての処理、「電源が入らない」についての処理、・・・、「ネットワークに接続できない」についての処理を、それぞれ並列に処理しても良い。
図9のフローチャートの処理は、確認したPB信号入力情報が「#2」であるならば、第2の音声サンプルデータの音声(キーワード「#2:新製品情報」)について処理する。図9のフローチャートの処理では、「新製品の商品名、その1」について処理し、「新製品の商品名、その1」の処理が終わると「新製品の商品名、その2」について処理し、・・・、最後に「新製品の商品名、そのN」について処理する。ここで、図9のフローチャートの処理は、第2の音声サンプルデータについて行う場合、「新製品の商品名、その1」についての処理、「新製品の商品名、その2」についての処理、・・・、「新製品の商品名、そのN」についての処理を、それぞれ並列に処理しても良い。
図9のフローチャートの処理は、確認したPB信号入力情報が「#3」であるならば、第3の音声サンプルデータの音声(キーワード「#3:その他情報」)について処理する。図9のフローチャートの処理では、「旧製品の商品名、その1」について処理し、「商品名、その1」の処理が終わると「旧製品の商品名、その2」について処理し、・・・、最後に「旧製品の商品名、そのN」について処理する。ここで、図9のフローチャートの処理は、第3の音声サンプルデータについて行う場合、「旧製品の商品名、その1」についての処理、「旧製品の商品名、その2」についての処理、・・・、「旧製品の商品名、そのN」についての処理を、それぞれ並列に処理しても良い。
図9のフローチャートの処理において、第1キーワードが第1の音声サンプルデータと関連付けて管理され、第2キーワードが第2の音声サンプルデータと関連付けて管理され、第3キーワードが第3の音声サンプルデータと関連付けて管理されているならば、図8−1の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第1キーワード「障害等情報」、第2キーワード「新製品情報」、第3キーワード「その他情報」のいずれかのキーワードとなる。
ここで、第4キーワードが第1の音声サンプルデータの「壊れた」と関連付けて管理され、第5キーワードが第1の音声サンプルデータの「電源が入らない」と関連付けて管理され、第6キーワードが第1の音声サンプルデータの「ネットワークに接続できない」と関連付けて管理されているならば、図8−1の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第4キーワード「壊れた」、第5キーワード「電源が入らない」、第6キーワード「ネットワークに接続できない」のいずれかのキーワードとなる。
同様に、第7キーワードが第2の音声サンプルデータの「新製品の商品名、その1」と関連付けて管理され、第8キーワードが第2の音声サンプルデータの「新製品の商品名、その2」と関連付けて管理され、第9キーワードが第2の音声サンプルデータの「新製品の商品名、そのN」と関連付けて管理されているならば、図8−1の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第7キーワード「新製品の商品名、その1」、第8キーワード「新製品の商品名、その2」、第9キーワード「新製品の商品名、そのN」のいずれかのキーワードとなる。
また同様に、第10キーワードが第3の音声サンプルデータの「旧製品の商品名、その1」と関連付けて管理され、第11キーワードが第3の音声サンプルデータの「旧製品の商品名、その2」と関連付けて管理され、第12キーワードが第3の音声サンプルデータの「旧製品の商品名、そのN」と関連付けて管理されているならば、図8−1の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第10キーワード「旧製品の商品名、その1」がとなり、第11キーワード「旧製品の商品名、その2」、第12キーワード「旧製品の商品名、そのN」のいずれかのキーワードとなる。
ここで、顧客がIVR処理で、次のいずれかを選択したかを確認して、音声サンプルデータ170のうち、上記で確認したPB信号入力情報に基づいて「#1〜#3の音声サンプルデータ」のいずれかを用いて、音声ファイルの音声と音声サンプルデータの音声と比較する。
本実施例は実施例2のコールセンタ装置300(図7)において、商品の障害等についてオペレータが顧客に対応する際、オペレータが顧客に接客する際の手順(シナリオ)が予め決まっている場合に、適応させたものである。故に、実施例3の独特の事項を主に説明する。
そこで、例えば、オペレータが顧客に接客する際の手順(シナリオ)が下記のような順番で進む場合、顧客との通話の進み具合に応じて処理できるように、音声情報記憶装置100の構成/処理(付箋紙自動作成の動作)を以下のように構成できる。
<オペレータが顧客に接客する際の手順(シナリオ)の一例>
・はじめに、「障害状況確認(電源が入らない/ソフトウェアが起動しない/ネットワークに繋がらない/その他)」を、顧客に確認する[*]。
・次に、「障害対応方法(修理/交換/その他)」を、顧客に確認する[*]。
・最後に、「障害対応日時(年/月/日/曜日/時間)」を、顧客に確認する[*]。
[*]なお、「顧客との通話の進み具合」は、「手順(シナリオ)」の開始タイミング毎にオペレータが予め決められた言葉を発することとし、これらのいずれかの音声の検出に基づいて、判断する。
オペレータに予め決められた発声の言葉は、『「障害状況」を確認します』、『「障害対応方法」を確認します』及び『「障害対応日時」を確認します』である。
次に、前提となる、図7の音声情報記憶装置100内の音声DBに所定の音声サンプルデータ(図示せず)が登録される。
そこで、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のような音声サンプルデータである。
第1の音声サンプルデータは、例えば、キーワード「(1)障害状況」に関する「壊れた」、「電源が入らない」、・・・、「ネットワークに接続できない」の波形パターンである。
第2の音声サンプルデータは、例えば、キーワード「(2)障害対応方法」に関する「店舗にて修理」、「顧客宅にて修理」、・・・、「製品交換」の波形パターンである。
第3の音声サンプルデータは、例えば、キーワード「(3)障害対応日時」に関するものとして「月」、「日」、・・・、「時間」の波形パターンである。
なお、第1の音声サンプルデータ〜第3の音声サンプルデータは、例えば次のように、個々の単語を1つの音声サンプルデータとしても良い。
第1−(1)音声サンプルデータは、「壊れた」の波形パターンである。
第1−(2)音声サンプルデータは、「電源が入らない」の波形パターンである。
・・・
第1−(12)音声サンプルデータは、「ネットワークに接続できない」の波形パターンである。
第2−(1)音声サンプルデータは、「店舗にて修理」の波形パターンである。
第2−(2)音声サンプルデータは、「顧客宅にて修理」の波形パターンである。
・・・
第2−(31)音声サンプルデータは、「製品交換」の波形パターンである。
第3−(1)音声サンプルデータは、「月」の波形パターンである。
第3−(2)音声サンプルデータは、「日」の波形パターンである。
・・・
第3−(7)音声サンプルデータは、「時間」の波形パターンである。
図10は、キーワード「障害状況」、「障害対応方法」及び「障害対応日時」に紐付けられた音声サンプルデータの群を示す。図10の各行が音声サンプルデータのそれぞれを表す。ただし、音声サンプルデータにおける波形パターン部分は理解しやすさのために波形パターンで意味されるカタカナで表記している。
このように、IVR311の選択モードで分類分けされたキーワード毎に、対応する音声データを収集して、該キーワードと音声データを関連付け音声サンプルデータ170を生成して、図7に示す音声情報記憶装置100の音声DB(図示せず)に記憶される。
次に、実施例3の付箋紙作成におけるテキスト生成処理を図11に示すフローチャートを用いて説明する。ここでは、音声DB160に図10に示した音声サンプルデータがあり、音声ファイル145から音声サンプルデータの検索処理する場合を説明する。なお、図11に示すフローチャートの処理は、ステップS1、S2間に顧客との通話進み具合を確認するステップS1bがある以外、図6に示すフローチャートの処理と同一である。故に、実施例3の独特の事項を主に説明する。
図11のフローチャートの処理は、まず、1つ目の音声ファイル、又は2つ目以降の録音通話に該当する次の音声ファイルの音声を再生する(ステップS1)。
図11のフローチャートの処理は、顧客との通話進み具合により、「(1)〜(3)の音声サンプルデータ」のいずれかを用いて、音声ファイルの音声と音声サンプルデータの音声と比較する(ステップS1b、S2)。
それ故に、図11のフローチャートの処理は、再生される音声ファイルにおける最初から最後までの音声と、『「顧客との通話の進み具合」に対応する音声サンプルデータ』の音声とを比較し、照合対象である音声サンプルデータの音声と照合したならば、『照合したときの「再生時間情報」と、選択すべき音声サンプルデータ』を、次の処理ステップに送信する。
またここで、上記『「顧客との通話の進み具合」に対応する音声サンプルデータ』は、第1の音声サンプルデータに関わる『「障害状況」を確認します』、第2の音声サンプルデータに関わる『「障害対応方法」を確認します』と、第3の音声サンプルデータに関わる『「障害対応日時」を確認します』とする。
さらにここで、次の処理ステップに送信される、『照合したときの「再生時間情報」と、選択すべき音声サンプルデータ』は、例えば次のような情報とする。
第1の音声サンプルデータに関わる『「障害状況」を確認します』と照合した場合:「再生開始から2分経過」と第1の音声サンプルデータ。
第2の音声サンプルデータに関わる『「障害対応方法」を確認します』と照合した場合:「再生開始から4分経過」と第2の音声サンプルデータ。
第3の音声サンプルデータに関わる『「障害対応日時」を確認します』と照合した場合:「再生開始から6分経過」と第3の音声サンプルデータ。
図11のフローチャートの処理は、音声ファイルの再生時間が「再生開始から2分経過〜4分経過」であるならば、第1の音声サンプルデータの音声(キーワード「(1)障害状況」)について処理する。図11のフローチャートの処理では、「壊れた」について処理し、「壊れた」の処理が終わると「電源が入らない」について処理し、・・・、最後に「ネットワークに接続できない」について処理する。ここで、図11のフローチャートの処理は、第1の音声サンプルデータについて行う場合、「壊れた」についての処理、「電源が入らない」についての処理、・・・、「ネットワークに接続できない」についての処理を、それぞれ並列に処理しても良い。
図11のフローチャートの処理は、音声ファイルの再生時間が「再生開始から4分経過〜6分経過」であるならば、第2の音声サンプルデータの音声(キーワード「(2)障害対応方法」)について処理する。図11のフローチャートの処理では、「店舗にて修理」について処理し、「店舗にて修理」の処理が終わると「顧客宅にて修理」について処理し、・・・、最後に「製品交換」について処理する。ここで、図11のフローチャートの処理は、第2の音声サンプルデータについて行う場合、「店舗にて修理」についての処理、「顧客宅にて修理」についての処理、・・・、「製品交換」についての処理を、それぞれ並列に処理しても良い。
図11のフローチャートの処理は、音声ファイルの再生時間が「再生開始から6分経過〜」であるならば、第3の音声サンプルデータの音声(キーワード「(3)障害対応日時」)について処理する。図11のフローチャートの処理では、「曜日」について処理し、「月」の処理が終わると「日」について処理し、・・・、最後に「時間」について処理する。ここで、図11のフローチャートの処理は、第3の音声サンプルデータについて行う場合、「月」についての処理、「日」についての処理、・・・、「時間」についての処理を、それぞれ並列に処理しても良い。
図11のフローチャートの処理において、第1キーワードが第1の音声サンプルデータと関連付けて管理され、第2キーワードが第2の音声サンプルデータと関連付けて管理され、第3キーワードが第3の音声サンプルデータと関連付けて管理されているならば、図11の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第1キーワード「障害状況」、第2キーワード「障害対応方法」、第3キーワード「障害対応日時」のいずれかのキーワードとなる(ステップS5)。
ここで、第4キーワードが第1の音声サンプルデータの「壊れた」と関連付けて管理され、第5キーワードが第1の音声サンプルデータの「電源が入らない」と関連付けて管理され、第6キーワードが第1の音声サンプルデータの「ネットワークに接続できない」と関連付けて管理されているならば、図11の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第4キーワード「壊れた」、第5キーワード「電源が入らない」、第6キーワード「ネットワークに接続できない」のいずれかのキーワードとなる。
同様に、第7キーワードが第2の音声サンプルデータの「店舗にて修理」と関連付けて管理され、第8キーワードが第2の音声サンプルデータの「顧客宅にて修理」と関連付けて管理され、第9キーワードが第2の音声サンプルデータの「製品交換」と関連付けて管理されているならば、図11の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第7キーワード「店舗にて修理」、第8キーワード「顧客宅にて修理」、第9キーワード「製品交換」のいずれかのキーワードとなる。
また同様に、第10キーワードが第3の音声サンプルデータの「月」と関連付けて管理され、第11キーワードが第3の音声サンプルデータの「日」と関連付けて管理され、第12キーワードが第3の音声サンプルデータの「時間」と関連付けて管理されているならば、図11の『照合したテキスト(文字)を返す』におけるテキスト(文字)は、第10キーワード「月」がとなり、第11キーワード「日」、第12キーワード「時間」のいずれかのキーワードとなる。
(応用例)
CTIの分野では通話録音は存在するが、通話録音を検索するには電話番号・時刻・IPアドレスが検索キーとして存在するだけであった。付箋紙を貼ることによってさらに付箋紙の内容を検索キーに応用ができるようになる。CRMの分野では、付箋紙を貼ることによって、テキストと音声をリンクさせることによって、過去の通話録音の内容をDBとして利用することも可能である。PBXのボイスメールや留守電といった機能にも応用可能である。ボイスメールや留守電は聞かないと内容が分からないため検索が迷うと困難であったが、付箋紙をメモやタグとして使用することにより検索が容易になることと、データ整理が可能となる。
音声情報記憶装置100は、例えばコンピュータ装置109で実現することができる。
図12は、実施例4に係る音声情報記憶装置100のハードウエア構成の一例を示すコンピュータ装置109のブロック図である。図に示されるコンピュータ装置109において、CPU111は、ROM114及び/又はハードディスクドライブ116に格納されたプログラムに従い、RAM115を一次記憶用ワークメモリとして利用して、システム全体を制御する。さらに、CPU111は、マウス112a又はキーボード112を介して入力される利用者の指示に従い、ハードディスクドライブ116に格納されたプログラムに基づき、第1の実施例に係る付箋紙自動作成等を実行する。以上の構成要素はバスbusを介して互いに接続されている。コンピュータ装置109に接続されたLCD等のディスプレイ装置113は、CPU111が実行する音声サンプルデータ検索処理のための入力待ち受け画面、処理経過や処理結果、検索結果等が表示される。
コンピュータ装置109のハードディスクドライブ116には、音声情報記憶装置100として機能させる音声データ付箋プログラム117が記憶されている。CPU111は、音声データ付箋プログラム117をハードディスクドライブ116から読み出してRAM115(必要があればハードディスクドライブ116)に展開し、音声データ付箋プログラム117が有するプロセスを順次実行する。なお、音声データ付箋プログラム117は、コンピュータ装置109に、上記の録音ファイル管理部110、キーワード管理部120、付箋紙作成部130、通話ファイル記憶部140、管理DB150、及び音声DB160として機能させるプログラムである。管理DB150及び音声DB160は汎用品であるハードディスク・DBシステムを採用してもよい。
以上のように、本発明によれば、通話録音装置において、さまざまな人の声を標本抽出した音声サンプルデータからなるキーワードやキーフレーズを用いて、音声ファイルに、顧客とオペレータとの通話に関わるキーワードを対応付けて保存することが可能となる。
さらに、本発明によれば、通話録音装置において、IVR処理で定まる顧客対応の内容に応じて、又は顧客との通話の進み具合に応じて、音声サンプルデータからなるキーワードを変更することが可能となる。従来無かった録音通話ファイルに付箋紙を貼ることによって、録音通話ファイルをテキスト変換しなくても検索が可能になる。また、録音通話ファイルの内容から自動的に付箋紙を貼る機能によって、付箋紙を自動的に作成し、さらに通話録音の内容を検索することが可能になる。音声だけでは保存した情報を扱うのが難しかったが、テキストと音声ファイルを結合することによって、保存した音声ファイルをDBとして活用することが可能となる。
100 音声情報記憶装置
110 録音ファイル管理部
120 キーワード管理部
130 付箋紙作成部
140 通話ファイル記憶部
150 管理データベース
160 音声ファイルデータベース
170 音声サンプルデータ

Claims (9)

  1. 音声データからなる音声ファイルを蓄積する通話ファイル記憶部と、
    第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声情報記憶部と、
    前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理部と、
    前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示部と、
    を有することを特徴とする音声情報記憶装置。
  2. 前記音声サンプルデータは、自動音声応答処理において、顧客通信装置より送信された選択情報に対応する音声データであることを特徴とする請求項1に記載された音声情報記憶装置。
  3. 前記音声サンプルデータは、所定のシナリオに対応する音声データであることを特徴とする請求項1又は請求項2に記載された音声情報記憶装置。
  4. 前記情報追加処理部は、
    前記音声ファイルに、オペレータ通信装置から受信した第2識別情報を追加することを特徴とする請求項1乃至請求項3のいずれか1項に記載された音声情報記憶装置。
  5. 前記オペレータ通信装置から第3識別情報を受信して、当該第3識別情報に対応する音声ファイルを検索する検索処理部を有することを特徴とする請求項4に記載された音声情報記憶装置。
  6. 前記第2識別情報又は前記第3識別情報は、前記オペレータ通信装置のグラフィカルユーザインタフェースにて作成された情報入力処理部より入力された情報であることを特徴とする請求項4又は請求項5に記載された音声情報記憶装置。
  7. 前記第1識別情報又は前記第2識別情報である識別情報と、当該識別情報のランク情報、当該識別情報の使用回数情報、当該識別情報の重要度情報、又は当該識別情報の時系列情報からなる追加情報とを一対として、識別情報記憶部に登録処理する登録処理部を有することを特徴とする請求項1乃至請求項4のいずれか1項に記載された音声情報記憶装置。
  8. 音声情報記憶処理をコンピュータに実行させるプログラムであって、該プログラムは、前記コンピュータに、
    音声データからなる音声ファイルを蓄積する通話ファイル記憶部と、
    第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声情報記憶部と、
    前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理部と、
    前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示部と、
    して機能させる、ことを特徴とするプログラム。
  9. 音声情報記憶方法であって、
    音声データからなる音声ファイルを蓄積する通話ファイル記憶処理ステップと、
    第1識別情報を記憶し、当該第1識別情報に一対一対応する1つ以上の音声サンプルデータを記憶する音声データ記憶処理ステップと、
    前記音声ファイル内の前記音声データの一部と前記音声サンプルデータとを比較して、比較結果が所定の類似度以上である場合、前記音声ファイルに前記音声サンプルデータに対応する前記第1識別情報を追加する情報追加処理ステップと、
    前記音声ファイルの識別情報と前記第1識別情報とを同時に表示する表示処理ステップと、を含む、ことを特徴とする音声情報記憶方法。
JP2015067996A 2015-03-30 2015-03-30 音声情報記憶装置、音声情報記憶方法及びそのプログラム Pending JP2016189510A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015067996A JP2016189510A (ja) 2015-03-30 2015-03-30 音声情報記憶装置、音声情報記憶方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015067996A JP2016189510A (ja) 2015-03-30 2015-03-30 音声情報記憶装置、音声情報記憶方法及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2016189510A true JP2016189510A (ja) 2016-11-04

Family

ID=57240529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015067996A Pending JP2016189510A (ja) 2015-03-30 2015-03-30 音声情報記憶装置、音声情報記憶方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2016189510A (ja)

Similar Documents

Publication Publication Date Title
US20210027247A1 (en) Device, system and method for summarizing agreements
US9692894B2 (en) Customer satisfaction system and method based on behavioral assessment data
US9063935B2 (en) System and method for synchronously generating an index to a media stream
US8086454B2 (en) Message transcription, voice query and query delivery system
US8774372B2 (en) Telephone call inbox
JP4690999B2 (ja) オペレータ業務支援システム
JP2011087005A (ja) 通話音声要約生成システム、その方法及び通話音声要約生成プログラム
US8687776B1 (en) System and method to analyze human voice conversations
US20080187109A1 (en) Audio archive generation and presentation
JP6517419B1 (ja) 対話要約生成装置、対話要約生成方法およびプログラム
US8811593B1 (en) Call center agent centric speech decoding system and method with quality assurance function
US20010053977A1 (en) System and method for responding to email and self help requests
US11955113B1 (en) Electronic signatures via voice for virtual assistants' interactions
JP6513869B1 (ja) 対話要約生成装置、対話要約生成方法およびプログラム
JP2002278977A (ja) 質問回答装置、質問回答方法及び質問回答プログラム
JP2009175943A (ja) コールセンターのデータベースシステム、データベースの情報管理方法及びデータベースの情報管理プログラム
JP2007323558A (ja) キーワード生成装置、文書検索装置、その方法、およびそのプログラム
JPWO2006090881A1 (ja) 応対支援システム、応対支援装置、応対支援方法及び応対支援プログラム
US11743384B2 (en) Real-time agent assistance using real-time automatic speech recognition and behavioral metrics
WO2023090380A1 (ja) プログラム、情報処理システム及び情報処理方法
JP2005252845A (ja) Ctiシステムおよびcsレベル判断方法ならびに音声分析サーバおよびプログラム
JP2016189510A (ja) 音声情報記憶装置、音声情報記憶方法及びそのプログラム
JP3450250B2 (ja) 通話音声認識による電話対応情報の自動登録/検索/集計装置
WO2023144897A1 (ja) 検出装置、検出方法及びプログラム
JP7169030B1 (ja) プログラム、情報処理装置、情報処理システム、情報処理方法、情報処理端末