WO2021002136A1

WO2021002136A1 - 発話解析装置、発話解析方法及びプログラム

Info

Publication number: WO2021002136A1
Application number: PCT/JP2020/021809
Authority: WO
Inventors: 夏樹佐伯
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2019-07-04
Filing date: 2020-06-02
Publication date: 2021-01-07
Also published as: CN114026557A; US20220108697A1; US20220114348A1; JP7407190B2; JPWO2021002136A1; WO2021002137A1; CN114072786A; JPWO2021002137A1

Abstract

発話者の発話の話題を可視化する。発話解析装置（１）は、第１期間における発話者の発話の変化を可視化する発話解析装置であって、発話者の発話データを時系列の順番で取得する取得部（１１１）と、取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析する演算部（１１２）と、演算部で得られた発話の変化を可視化した可視化データを表示させる表示処理部（１１４）とを備え、演算部は、第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、表示処理部により表示される可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す。

Description

発話解析装置、発話解析方法及びプログラム

　本開示は、発話者の発話における話題の変化を可視化する発話解析装置、発話解析方法及びプログラムに関する。

　音声認識技術の進歩により、発話者の音声データを取得し、音声認識された内容を処理することが可能になっている。

　特許文献１では、コールセンターの等のオペレータによるトークスクリプトを参照した談話の内容が音声認識処理によりテキスト化され、トークスクリプトの利用頻度の情報を出力するシステムが記載される。この特許文献１に記載の技術では、オペレータのスキルに応じて応対記録の品質にばらつきがある問題等を解決し、統一生、簡潔性を確保した応対記録を自動作成することができる。

特許第５４６８４７４号

　本開示は、発話者の発話における話題の推移を可視化することのできる発話解析装置、発話解析方法及びプログラムを提供する。

　本開示の発話解析装置は、第１期間における発話者の発話の変化を可視化する発話解析装置であって、発話者の発話データを時系列の順番で取得する取得部と、取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析する演算部と、演算部で得られた発話の変化を可視化した可視化データを表示させる表示処理部とを備え、演算部は、第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、表示処理部により表示される可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す。

　これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。

　本開示の発話解析装置、発話解析方法及びプログラムによれば、発話者の発話における話題の推移を可視化することができる。

本開示の発話解析装置の概要について説明する概略図である。本開示の発話解析装置の構成を示すブロック図である。図２の発話解析装置で利用する発話データを説明するデータ構成図である。図２の発話解析装置で利用するカテゴリ尤度を表すグラフである。図２の発話解析装置で積算尤度の演算に利用する鮮度重み値を説明する図である。図２の発話解析装置で積算尤度の演算に利用する頻度重み値を説明する図である。図２の発話解析装置で得られる話題である確率を表すグラフである。図２の発話解析装置で積算尤度を求める際に利用する対象範囲を説明する図である。図２の発話解析装置により可視化データとして表示される画面の一例である。図２の発話解析装置で実行される発話解析処理を説明するフローチャートである。図１０の解析処理を説明するフローチャートである。図１０の解析処理の他の例を説明するフローチャートである。図２の発話解析装置で可視化データとして表示される画面の他の例である。図２の発話解析装置で可視化データとして表示される画面の他の例である。図２の発話解析装置で可視化データとして表示される画面の他の例である。図２の発話解析装置で可視化データとして表示される画面の他の例である。

［本開示の基礎となった知見］
　従来の技術では、発話者の発話を解析する際、文単位を処理対象とし、各文に含まれる単語を用いて解析している。一方、ある期間の複数文からなる発話を解析する場合、複数の文を対象に解析することが好ましい場合もある。

　本開示に係る発話解析装置は、ある期間における発話者の発話における話題の推移の変化を可視化するものである。具体的には、発話解析装置は、ある期間の発話における話題が、どのように変化するかを特定し、可視化する。例えば、発話者が発話する場合、その話題は時間の経過と共に変化するのが一般的である。本開示の発話解析装置は、発話者の発話を取得し、発話の話題を特定し、また、その話題の変化を可視化することができる。

［実施形態］
［１－１．構成］
　以下に、図面を用いて本開示における実施形態を、図面を適宜参照しながら説明する。ただし、詳細な説明において、従来技術および実質的に同一の構成に関する説明のうち不必要な部分は省略されることもある。これは、説明を簡単にするためである。また、以下の説明および添付の図面は、当業者が本開示を充分に理解できるよう開示されるのであって、特許請求の範囲の主題を限定することを意図されていない。

　本開示に係る発話解析装置は、ある期間における発話者の発話に関し、話題の推移の変化を可視化するものである。例えば、図１に示すように、発話解析装置１は、入力装置としてマイクロフォンを有し、発話者２０が、顧客２１に対して発する発話データを取得し、話題の推移の変化を可視化し、出力装置であるディスプレイ等に表示する。これにより、例えば、発話者２０の発話の際には同席していない利用者２２であっても、可視化された情報を見ることにより、発話者２０の発話を評価することが可能となる。以下の説明では、発話者２０は、注文住宅を販売する住宅メーカー（以下の説明で、必要に応じて「ＸＹＺホーム社」または「ＸＹＺホーム」とする）の一員であるものとする。また、発話者２０の発話は、顧客２１に自社の注文住宅に関する説明、注文住宅の販売及び購入等に関して必要な説明を含むものとする。なお、図１に示す例は一例であって、具体的には、後述するが、必ずしも発話者２０と顧客２１が会話する場面で発話解析装置１が設置されていなくてもよい。また、利用者２２も、ネットワークを介して外部から発話解析装置１にアクセス可能とされてもよい。

　本説明において、「発話」は、発話者２０が話す行為及び話すことで生じた音声であるものとする。「発話データ」は、発話者２０が話すことで生じた音声データであるものとする。また、「発話データ」は、発話者２０が話すことで生じた音声データを音声認識によってテキスト化されたテキストデータであってもよい。さらに、「発話データ」は、これら「音声データ」と「テキストデータ」を含むデータであってもよい。

　「話題」は、発話者２０の発話の内容であるとして説明する。また、「話題のカテゴリ」または「カテゴリ」は、発話者２０の話題を特定する分類であるとして説明する。具体例については後述するが、発話解析装置１では、発話者２０の発話の話題が、予め設定される複数の話題のカテゴリのうち、どのカテゴリであるかを特定する。

　「尤度」とは、尤度関数で利用される、尤もらしさを表す数値として利用される尤度である。この尤度は、対象の発話が、各話題のカテゴリに該当する尤もらしさを表す数値として利用される。

　以下の説明において、図１に示すように、発話する者を「発話者２０」とし、発話者２０と対話する者を「顧客２１」とする。また、発話解析装置１で発話者２０の発話に関して話題の推移が可視化されたデータを利用する者を「利用者２２」とする。なお、利用者２２は、発話者２０であってもよいし、発話者２０以外の者であってもよい。例えば、自身の過去の発話を確認するために、発話者２０自身が利用者２２となることができる。また、発話者２０の仕事を評価するために、発話者２０の上司が利用者２２となることもできる。その他、発話者２０の発話方法を参考にするために、発話者２０の同僚や部下が利用者２２となることもできる。

　図２に示すように、発話解析装置１は、例えば、制御部１１と、記憶部１２と、入力部１３と、出力部１４と、通信部１５とを備え、これらがバス１６で接続される情報処理装置である。

　制御部１１は、発話解析装置１全体の制御を司るコントローラである。例えば、制御部１１は、記憶部１２に記憶されるプログラムＰを読み出して実行することにより、取得部１１１、演算部１１２、生成部１１３及び表示処理部１１４としての処理を実現する。また、制御部１１は、ハードウェアとソフトウェアの協働により所定の機能を実現するものに限定されず、所定の機能を実現する専用に設計されたハードウェア回路でもよい。すなわち、制御部１１は、ＣＰＵ、ＭＰＵ、ＧＰＵ、ＦＰＧＡ、ＤＳＰ、ＡＳＩＣ等、種々のプロセッサで実現することができる。

　記憶部１２は種々の情報を記憶する記憶媒体である。記憶部１２は、例えば、ＲＡＭ、ＲＯＭ、フラッシュメモリ、ＳＳＤ（Solid State Device）、ハードディスク、その他の記憶デバイス又はそれらを適宜組み合わせて実現される。記憶部１２には、制御部１１が実行するプログラムＰの他、識別情報で使用する情報や識別情報付与のために取得された種々の情報等が格納される。例えば、記憶部１２は、発話データ１２１、変化データ１２２及びプログラムＰを記憶する。

　入力部１３は、操作やデータの入力に利用される操作ボタン、キーボード、マウス、タッチパネル、マイクロフォン等の入力手段である。出力部１４は、処理結果やデータの出力に利用されるディスプレイ、スピーカ等の出力手段である。発話解析装置１は、入力部１３であるマイクロフォンで発話データを取得し、制御部１１で取得された発話データから可視化データを生成し、得られた可視化データを出力部１４であるディスプレイ等に出力する。

　通信部１５は、外部の装置（図示せず）とのデータ通信を可能とするためのインタフェース回路（モジュール）である。

　ここで、発話解析装置１は、１台のコンピュータにより実現されてもよいし、ネットワークを介して接続される複数台のコンピュータの組み合わせにより実現されてもよい。また例えば、記憶部１２に記憶されるデータの全部又は一部が、ネットワーク４０を介して接続される外部の記憶媒体に記憶され、発話解析装置１は、外部の記憶媒体に記憶されるデータを使用するように構成されていてもよい。具体的には、発話データ１２１や、変化データ１２２を外部の記憶媒体に記憶してもよい。

　取得部１１１は、例えば、発話者２０が発話をする際、入力部１３であるマイクロフォンを介して発話者２０の発話データを取得する。また、取得部１１１は、取得した発話者２０の発話データを、取得した時系列の順序で番号を付し、記憶部１２に発話データ１２１として記憶させる。

　発話解析装置１は、発話者２０の発話を可視化するものであるから、少なくとも発話者２０の発話データを取得することができればよく、ここでは、顧客２１の発話データの取得及び可視化については言及しないものとする。

　演算部１１２は、各発話データ１２１の話題が所定のカテゴリに該当する可能性を特定する値である尤度を求める。また、演算部１１２は、各カテゴリの尤度を、発話データ１２１と関連付けて記憶させる。以下では、各カテゴリに関する「尤度」を、必要に応じて「カテゴリ尤度」として説明する。

　このとき、発話データ１２１は、音声データとともに、または、音声データに代えて、各発話データ１２１の音声データを音声認識処理によってテキスト化したテキストデータを含むことができる。この場合、音声認識処理は、発話解析装置１内で実行されてもよいし、外部の装置において実行されてもよい。

　図３に示す一例のように、発話データ１２１は、発話データ１２１毎に時系列の順番で付与された識別情報である「番号」と、この期間の音声データから生成された「テキストデータ」と、この期間の発話データについて得られた各カテゴリの「カテゴリ尤度」とを関連付けるデータである。

　図３に示す例では、発話データ１２１は、「ＸＹＺホーム」、「間取り」、「ファイナンス」及び「その他」の各カテゴリについて得られたカテゴリ尤度を含む。「間取り」は、話題が家の間取りに関するカテゴリである。「ＸＹＺホーム」は、話題がＸＹＺホーム社に関する場合のカテゴリである。「ファイナンス」は、話題が資金に関するカテゴリである。「その他」は、話題が「ＸＹＺホーム」、「間取り」又は「ファイナンス」のいずれにも含まれない場合のカテゴリである。

　なお、ここでは、説明の容易化のため、「ＸＹＺホーム」、「間取り」、「ファイナンス」及び「その他」の４つのカテゴリを用いて説明するが、発話解析装置１で処理の対象とするカテゴリの数は限定されない。また、説明で使用されるカテゴリも単なる例示であって限定されず、発話の話題に応じて自由に設定することが可能である。

　図４は、演算部１１２において、複数の発話データ１２１に関し、予め設定される複数の話題のカテゴリについて求められたカテゴリ尤度を表すグラフの一例である。演算部１１２は、各尤度を、事前に学習されたクラス分類モデルを用いて求めることができる。具体的には、クラス分類のクラスが、ここで説明する話題のカテゴリに相当する。図４において、横軸は、発話データ１２１に付された「番号」であり、発話データの１２２の時系列を示すものである。また、縦軸は、演算部１１２で得られた「カテゴリ尤度」である。

　図４に示すような、発話データ１２１毎のカテゴリの遷移では、その変化が細かく全体としての話題の流れを特定しにくい。そのため、演算部１１２は、発話データ１２１毎よりも広い範囲で、カテゴリを特定し、話題の移り変わりを把握しやすくすることができる。

　演算部１１２は、求めたカテゴリ尤度を用いて話題のカテゴリを特定する。ここで、演算部１１２は、所定時ｔの話題のカテゴリを特定する際、所定時ｔの直前で、かつ、発話解析装置１における発話者２０の発話の変化の可視化の対象である第１期間Ｔ１より短い第２期間Ｔ２の複数の発話データ１２１の尤度を用いて、第２期間Ｔ２の発話について所定のカテゴリに該当する可能性を特定する第２の尤度を求め、変化データ１２２として記憶部１２で記憶させ、第２期間Ｔ２の話題のカテゴリを特定する。なお、以下では、必要に応じて「第１期間」を「発話期間」とし、「第２期間」を「時間窓」とし、「第２の尤度」を「積算尤度」として説明する。「時間窓」は、発話データ１２１の数や、経過時間で設定することができる。

　図４では、発話期間Ｔ１は、発話データ１２１の総数、２７７個に相当する期間であり、時間窓Ｔ２は、発話データ１２１の数、５０個に相当する期間の一例である。例えば、番号「８９」の時点での話題のカテゴリを特定するためには、時間窓Ｔ２に相当する、番号「４０」～「８９」の期間の発話データ１２１のカテゴリ尤度を用いる。

　具体的には、演算部１１２は、各カテゴリについて、時間窓Ｔ２を対象範囲として設定し、この対象範囲に含まれる各発話データ１２１に対して得られたそれぞれのカテゴリについて積算尤度を求める。また、演算部１１２は、各カテゴリについて得られた積算尤度のうち、値が最も大きいカテゴリをある発話番号時点の話題のカテゴリとして特定することができる。

　また、演算部１１２は、話題の鮮度に応じて設定された「鮮度重み値ｗ１」を用いて、積算尤度を求めることができる。具体的には、図５Ａに示すように、鮮度重み値ｗ１は、所定時ｔを基準として新しい発話データ１２１のカテゴリ尤度の重み（図５Ａ中の「ｗ１１」）を、古い発話データ１２１のカテゴリ尤度の重み（図５Ａ中の「ｗ１２」）よりも大きくする値である。例えば、ある期間である対象範囲において、より新しい発話については、その期間の話題のカテゴリである、或いは話題が推移している可能性が高く、古い発話については、その期間の話題のカテゴリである可能性は低い。したがって、演算部１１２において、鮮度重み値ｗ１をその対象期間の話題の特定に利用することで、話題の特定の精度を向上させることができる。具体的には、仮に、時間窓Ｔ２として４０番目から８９番目の発話データ１２１の５０個が設定されている場合、８０番目の発話データから８９番目の発話データから特定されるカテゴリ尤度は、４０番目の発話データから４９番目の発話データ１２１から特定されるカテゴリ尤度よりも、重みが大きく設定される。または、時間窓Ｔ２として「５分間」が設定される場合、所定時ｔの１分前から所定時ｔまでの発話データ１２１から特定されるカテゴリ尤度は、所定時ｔの５分前から所定時の４分前までの発話データ１２１から特定されるカテゴリ尤度よりも、重みが大きく設定される。

　さらに、演算部１１２は、話題の頻度に応じて設定された「頻度重み値ｗ２」を用いて、積算尤度を求めることができる。具体的には、頻度重み値ｗ２は、対象範囲に含まれる発話データ１２１のカテゴリ尤度が最も高いカテゴリの出現頻度について、図５Ｂに示すように、出現頻度が高いカテゴリのカテゴリ尤度の重み（図５Ｂ中の「ｗ２１」）を、出現頻度が低いカテゴリの尤度の重み（図５Ｂ中の「ｗ２２」）よりも大きくする値である。例えば、時間窓Ｔ２の範囲において、何度も出現するカテゴリについては、その期間の話題のカテゴリである可能性が高く、一方、あまり出現しないカテゴリについては、その期間の話題のカテゴリである可能性は低い。したがって、演算部１１２において、頻度重み値ｗ２をその対象期間の話題の特定に利用することで、話題の特定の精度を向上させることができる。具体的には、仮に、時間窓Ｔ２に５０の発話データ１２１が含まれるとき、２０回出現する話題の尤度は、２回しか出現しない話題の尤度よりも、重みが高く設定されカテゴリ尤度が大きくなる。演算部１１２は、時間窓Ｔ２の範囲における、各カテゴリの出現頻度（図５Ｂ中の「ｗ２１」、「ｗ２２」）を上述のように算出する。

　例えば、演算部１１２は、以下の式（１）によりカテゴリ毎に、積算尤度Ｌｃ２を求めることができる。

　Ｌｃ２（ｉ）＝Σ（Ｌｃ（ｊ）×ｗ１）×ｗ２　・・・　（１）
　ここで、式（１）に使用する各値はそれぞれ以下のように規定する。
　ｃ：カテゴリを特定する番号
　ｉ：対象範囲を特定する番号
　Ｌｃ２（ｉ）：ｉ番目の対象範囲の積算尤度
　ｊ：対象範囲の中で各発話データ１２１に付された番号
　Ｌｃ（ｊ）：対象範囲の中でｊ番目の発話データ１２１のカテゴリ尤度
　ｗ１：鮮度重み値
　ｗ２：頻度重み値
　なお、式（１）は、ｊ＝１からｊ＝ｑまでの総和である。

　演算部１１２は、得られた各カテゴリの積算尤度Ｌｃ２に対し、正規化を施すことができる。また、演算部１１２は、正規化されたデータも記憶部１２の変化データ１２２に追加することができる。これにより、ある発話の番号における各カテゴリが話題である確率として、図６に示すようにも表わすことができる。演算部１１２は、例えば、正規化に、ｓｏｆｔｍａｘで確率を求める方法を利用することができる。こうして得られた確率Ｐｃ（ｉ）を用い各発話の番号において、各カテゴリにその確率値をプロットすることで、図６に示すように、話題の移り変わりを表すグラフを得ることができる。これにより、実際の会話における話題の移り変わりのように、滑らかな移り変わりとして話題の遷移状態を視覚化することができる。

　演算部１１２は、仮に、発話期間Ｔ１の開始から所定時ｔまでの期間ｔ１が、時間窓Ｔ２に満たない場合（ｔ１＜Ｔ２の場合）、発話期間Ｔ１の開始から所定時ｔまでの発話データ１２１を含む範囲を対象範囲として設定し、この対象範囲の発話データ１２１のカテゴリ尤度で、同様に積算尤度を演算する。図７に示す例を用いて、発話データ１２１の数「５０」に相当する期間を時間窓Ｔ２とし、番号が「３９」の時点を所定時とした場合の一例を説明する。この場合、発話期間Ｔ１の開始から所定時ｔまでの期間ｔ１は、時間窓Ｔ２よりも短い、発話データ１２１の数「４０」に相当する期間である。このような場合、例えば、発話期間Ｔ１の開始から所定時ｔまでの尤度を用いて積算尤度を求める。期間ｔ１が、時間窓Ｔ２に満たない場合（ｔ１＜Ｔ２の場合）、尤度の積算値が小さくなるように重み付けをしてもよい。

　生成部１１３は、演算部１１２による特定結果を用いて、発話データ１２１に関する話題の変化を可視化した可視化データを生成する。ここで、生成部１１３は、複数の時間窓Ｔ２の話題の変化を可視化した可視化データを生成することができる。また、生成部１１３は、各分類の積算尤度が時系列表示されたグラフを含む可視化データを生成してもよい。具体的には、図８に一例を示すような表示画面Ｗ１を表示させる可視化データを生成する。図８に示す一例の表示画面Ｗ１は、積算尤度の変化を表すグラフを表示する表示部Ｂ１１と、表示部Ｂ１１で表示するグラフから得られた時系列変化を表示する表示部Ｂ１２とを含む。図８に示す表示画面Ｗ１により、利用者２２は、発話者２０の話が、「間取り」、「ファイナンス」、「その他」、「ＸＹＺホーム」、「ファイナンス」の順で変化したことが一見にして分かる。

［１－２．動作］
　図９及び図１０に示すフローチャートを用いて、発話解析装置１における発話データの発話解析処理について説明する。図９に示すように、発話解析装置１では、例えば、発話者２０が発話をするタイミングで、取得部１１１は、入力部１３であるマイクロフォンを介して、発話データを取得し、時系列に付与される番号とともに発話データ１２１として記憶部１２に記憶させる（Ｓ１）。

　また、演算部１１２は、ステップＳ１で記憶された各発話データ１２１について、カテゴリ毎にカテゴリ尤度を演算し、発話データ１２１に関連付けて記憶部１２に記憶させる（Ｓ２）。

　その後、演算部１１２は、ステップＳ２で演算された各尤度を用いて、各発話データ１２１に含まれるカテゴリ尤度を用いて、話題のカテゴリを解析する解析処理を実行する（Ｓ３）。

　ステップＳ３の解析処理における具体的な処理の流れを図１０に示すフローチャートを用いて説明する。図１０に示すように、解析処理では、演算部１１２は、処理対象のカテゴリを選択する（Ｓ１１）。例えば、「ＸＹＺホーム」、「間取り」、「ファイナンス」及び「その他」のそれぞれのカテゴリについて順に選択し、各カテゴリについて以降の処理を繰り返す。

　まず、演算部１１２は、ステップＳ１１で選択されたカテゴリについて、積算尤度を算出対象である対象範囲を特定するため、ｉの値を０に初期化する（Ｓ１２）。ｉは、発話データ１２１に付された番号を特定する値であり、ｉを初期化することで、選択されたカテゴリについて、発話データ１２１の０番目から順に対象範囲が設定される。また、以下では、対象範囲に含まれる発話データ１２１の数を「ｑ」とする。

　また、演算部１１２は、Ｌｃ（－１）の値を０に設定する（Ｓ１３）。Ｌｃ（ｉ）は、Ｓ１１で選択されたカテゴリについて、ｉ番の発話データ１２１から求められた尤度であり、「－１」番の発話データ１２１は存在しないため、Ｌｃ（－１）も存在しないが、ステップＳ１７の処理で使用する可能性があるため、ここで「０」に設定する。

　次に、演算部１１２は、ｉの値に応じて、積算尤度を演算するための対象範囲を設定する（Ｓ１４）。このとき、演算部１１２は、番号「ｉ」の発話データ１２１から順に、対象範囲内で新たな「１」からの番号「ｊ」を設定する。図４で上述したように、５０の発話データ１２１を時間窓Ｔ２とする例では、「ｊ」は、１～５０までの番号を利用することになる。この場合、対象範囲の数ｑは、「５０」である。

　具体的には、図４で上述した例で、ｉが「０」であるとき、０番の発話データ１２１を所定時ｔとし積算尤度を演算するため、演算部１１２は、０番の発話データ１２１を対象範囲とする。この場合、ｊについては、ｉが「０」の発話データ１２１についてｊは「１」となる。また、対象範囲の数ｑは、「１」である。

　また、図４で上述したように、ｉが「８９」であるとき、演算部１１２は、４０～８９番の発話データ１２１を対象範囲とする。この場合、ｊについては、ｉの「４０」がｊの「１」となり、ｉの「８９」がｊの「５０」となるように、それぞれ設定される。

　さらに、図７で上述したように期間ｔ１が、時間窓Ｔ２に満たない場合（ｔ１＜Ｔ２の場合）、仮に、ｉが「３９」であるとき、３９番の発話データ１２１を所定時ｔとして積算尤度を演算するため、演算部１１２は、０～３９番の発話データ１２１を対象範囲とする。この場合も、ｊについては、ｉの「０」がｊの「１」となる。また、対象範囲の数ｑは、「４０」である。

　その後、演算部１１２は、ステップＳ１４で設定された対象範囲について、積算尤度を算出するため、ｊの値を１に初期化し、一時積算尤度Ｓｃの値を０に初期化する（Ｓ１５）。ｊは、上述したように、対象範囲の中で発話データ１２１を特定する値である。ｊを初期化することで、対象範囲に含まれる各発話データ１２１の尤度Ｌｃ（ｊ）を加算して、積算尤度Ｌｃ２（ｉ）を求めることができる。また、一時積算尤度Ｓｃは、対象範囲で積算尤度Ｌｃ２（ｉ）を求める計算経過において利用する値である。

　続いて、演算部１１２は、ステップＳ１４で設定された対象範囲の各発話データ１２１のカテゴリ尤度Ｌｃから、最尤推定で決定されるカテゴリは「その他」であるか否かを判定する（Ｓ１６）。具体的には、演算部１１２は、この対象範囲の各カテゴリのカテゴリ尤度のうち、値の最も高いカテゴリは「その他」であるか否かを判定する。

　最尤推定で決定されるカテゴリが「その他」であるとき（Ｓ１６でＹＥＳ）、演算部１１２は、選択されたカテゴリに関し、番号「ｉ－１」の発話データ１２１で管理される対象範囲の積算尤度Ｌｃ２（ｉ－１）を、番号「ｉ」の発話データ１２１で管理される対象範囲の積算尤度Ｌｃ２（ｉ）に採用する（Ｓ１７）。なお、仮に、ｉが「０」であるとき、ステップＳ１３でＬ（－１）に設定した「０」を用いる。

　一方、最尤推定で決定されるカテゴリが「その他」でないとき（Ｓ１６でＮＯ）、演算部１１２は、一時積算尤度Ｓｃに、番号「ｊ」の発話データ１２１のカテゴリ尤度Ｌｃ（ｊ）を鮮度重み値ｗ１で重みづけした値（Ｌｃ（ｊ）×ｗ１）を加算し、得られた値を、新たな一時積算尤度Ｓｃとする（Ｓ１８）。例えば、鮮度重み値ｗ１は、ｊ／ｑで計算してもよい。

　新たな一時積算尤度Ｓｃを求めると、演算部１１２は、ｊの値をインクリメントする（Ｓ１９）。その後、演算部１１２は、ｊ≦ｑであるか否か判定する（Ｓ２０）。

　ｊ≦ｑであるとき（Ｓ２０でＹＥＳ）、対象範囲に含まれる全ての発話データ１２１について処理が終了していないため、演算部１１２は、ステップＳ１８の処理に戻り、ステップＳ１８～Ｓ２０の処理を繰り返す。

　一方、ｊ≦ｑでないとき（Ｓ２０でＮＯ）、対象範囲に含まれる全ての発話データ１２１について処理が終了したため、演算部１１２は、対象範囲において対象のカテゴリの最尤話題カテゴリ頻度Ｎｃを求める（Ｓ２１）。ここで、最尤話題カテゴリ頻度Ｎｃとは、対象範囲の各発話データ１２１において、ステップＳ１１で処理の対象として選択されたカテゴリの尤度が最も高い値となった回数である。例えば、「間取り」に関し処理がされているとき、対象範囲の中で、カテゴリ尤度Ｌｃ（ｊ）が最も高くなった発話データ１２１の数が「２０」であるとき、最尤話題カテゴリ頻度Ｎｃは「２０」となる。

　その後、演算部１１２は、一時積算尤度Ｓｃを、頻度重み値ｗ２で重みづけした値（Ｓｃ×ｗ２）を、対象範囲の積算尤度Ｌｃ２（ｉ）とする（Ｓ２２）。例えば、頻度重み値ｗ２は、Ｎｃ／ｑで計算してもよい。

　演算部１１２は、積算尤度Ｌ２ｃ（ｉ）を求めると、正規化により、対象範囲に関する選択されたカテゴリの確率Ｐｃ（ｉ）を求める（Ｓ２３）。

　確率Ｐｃ（ｉ）が得られると、演算部１１２は、ｉの値をインクリメントする（Ｓ２４）。これにより、ｉの値が、次の対象範囲を特定するための値に設定される。

　続いて、演算部１１２は、終了タイミングであるか否かを判定する（Ｓ２５）。終了するタイミングとは、全ての範囲について処理がされた場合であって、例えば、図４に示すカテゴリ尤度の例では、一連の発話データ１２１について、時系列で最後の番号「２７６」の発話データ１２１についてまで、処理が終了した場合である。

　終了タイミングでないとき（Ｓ２５でＮＯ）、発話期間Ｔ１の全ての発話データ１２１について処理が終了していないため、演算部１１２は、ステップＳ１４の処理に戻り、ステップＳ１４～Ｓ２５の処理を繰り返す。

　一方、終了タイミングであるとき（Ｓ２５でＮＯ）、発話期間Ｔ１の全ての発話データ１２１について処理が終了したため、全てのカテゴリについて、ステップＳ１２～Ｓ２５の処理が終了したか否かを判定する（Ｓ２６）。

　全てのカテゴリについて処理が終了していない場合（Ｓ２６でＮＯ）、演算部１１２は、ステップＳ１１に戻り、他のカテゴリを選択し、全てのカテゴリについて終了するまで、ステップＳ１１～Ｓ２５の処理を繰り返す。例えば、「ＸＹＺホーム」のカテゴリが終了すると、「間取り」を選択し、その後「ファイナンス」を選択し、最後に「その他」を選択して同様の処理を繰り返す。

　また、全てのカテゴリについてステップＳ１１～Ｓ２５の処理が終了した場合（Ｓ２６でＹＥＳ）、演算部１１２は、ステップＳ１４で設定された全ての対象範囲について、積算尤度Ｌｃ２（ｉ）を用いて最尤推定によって話題のカテゴリを特定する（Ｓ２７）。また、カテゴリが特定されると（Ｓ２７）、演算部１１２は、各カテゴリの積算尤度Ｌｃ２や確率Ｐｃ（ｉ）が算出できたため、解析処理（図９のステップＳ３）を終了する。

　図９に示すように、生成部１１３は、ステップＳ３の処理において各カテゴリについて、可視化データを生成する（Ｓ４）。

　また、表示処理部１１４は、ステップＳ４で生成された可視化データを、ディスプレイ等の出力部１４に出力する（Ｓ５）。

［１－３．効果等］
　発話解析装置１では、このように、発話者２０の発話を可視化させることができる。これにより、発話者２０の発話についての評価を容易に実現することができる。また、別の発話者は、容易に、他人である発話者２０の発話を参考にすることが可能となる。

　以上のように、本出願において開示する技術の例示として、上記実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。

（他の実施形態）
　上述の実施形態では、取得部１１１は、発話者２０が発話をするタイミングで、発話データを取得する一例で説明したが、これに限定されない。例えば、取得部１１１は、ＩＣレコーダー等の外部の音声データを録音装置から、発話者２０の発話のタイミングで録音済みの発話データを、その後のタイミングで取得し、使用してもよい。また、取得部１１１は、チャットのようにテキスト文章で入力された発話文を取得し、使用してもよい。

　上述の実施形態では、発話解析装置１内の演算部１１２において、「カテゴリ尤度」を演算する一例で説明したが、これに限定されない。具体的には、発話解析装置１は、外部の演算装置で演算されたカテゴリ尤度を取得し、利用してもよい。

　発話解析装置１は、利用者２２によって指定された期間を受け付ける受付部を備えてもよい。この場合、例えば、演算部１１２は、受付部として入力部１３又は通信部１５を介して期間を受け付け、利用者２２によって指定された期間を時間窓Ｔ２として積算尤度を演算することができる。具体的には、発話者２０又は発話者２０の発話を解析等する第三者である利用者２２が、対象とする発話に応じて自由に時間窓Ｔ２を設定可能にしてもよい。発話において、あるカテゴリの話題が長く続く場合、時間窓Ｔ２として設定する期間の長さによっては、話題の変化が検出しにくくなる。したがって、このように、適切な時間窓Ｔ２を設定することで、話題の変化の検出精度を向上させることができる。

　上述の実施形態では、図１０に示すように、先にステップＳ１１で対象のカテゴリを選択し、選択されたカテゴリ毎にステップＳ１４で対象範囲を設定し、順に設定される各対象範囲の積算尤度を求める方法を説明したがこれに限定されない。具体的には、結果的に各範囲について全てのカテゴリの積算尤度を求めることができればよい。例えば、図１１に示すように、先にステップＳ１４で対象範囲を設定し、この対象範囲の中で、ステップＳ１１１で順にカテゴリを選択し、各カテゴリの積算尤度を求める方法でもよい。この場合、図１１に示すように、演算部１１２は、ステップＳ２３でＰｃ（ｉ）が求められると、全てのカテゴリについてステップＳ１５～Ｓ２３の処理が終了したか否かを判定する（Ｓ１２７）。

　生成部１１３は、記憶部１２に記憶される複数の発話者２０の発話データ１２１を用いて、第１の発話者２０の発話データ１２１から生成された可視化データと、第１の発話者２０とは別の第２の発話者の発話データ１２１から生成された可視化データとを比較した比較データを生成してもよい。図１２は、第１の発話者２０の発話データ１２１の可視化データを表示する表示部Ｂ２１と、第２の発話者の発話データ１２１の可視化データを表示する表示部Ｂ２２とを含む表示画面Ｗ２の一例である。図１２に示すように、二人分の可視化データが比較可能に表示画面Ｗ２で表示されるため、二人分の長時間の発話データを音声で確認したり、スクリプト化されたデータで確認したりすることなく、利用者２２は、各発話者の話題を一見にして比較できる。例えば、二人分の可視化データを並列表示することにより、利用者２２は、どのような説明の方法、具体的には、話の流れが効果的であるかを比較しやすくすることができる。このとき、図１３に示すように、生成部１１３は、分析結果を表示する表示部Ｂ２３を含む表示画面Ｗ３を表示させる可視化データを生成してもよい。

　生成部１１３は、発話データのうち、所定の言い回し等のテキストを含む可視化データを生成してもよい。図１４は、発話者の発話データ１２１から得られた積算尤度の変化を表すグラフを表示する表示部Ｂ４１と、「間取り」のカテゴリの話題から抽出された言い回しが表示される表示部Ｂ４２と、「ファイナンス」のカテゴリの話題から抽出された言い回しが表示される表示部Ｂ４３とを含む表示画面Ｗ５の一例である。例えば、表示部Ｂ４２や表示部Ｂ４３に含まれる言い回しのテキストデータは、音声データや音声データがテキスト化されたデータから、当該カテゴリの中で他の発話データと比較して尤度の高い発話データ又は所定値よりも尤度の高い発話データや、特定の単語が含まれる文章を抽出することで生成される。図１４に示すように、表示画面では、複数の言い回しが表示されるため、例えば、利用者２２は、他者である発話者２０の可視化データを参考にし、その発話者２０が使用する言い回しを、自身が今後使用する言い回しを検討することができる。例えば、説明の仕方が分からない事柄について、他者である発話者２０の言い回しを真似することで、顧客２１に分かり易く説明することができるようになる。

　生成部１１３は、発話データ１２１がテキスト化されたデータを、当該発話データ１２１から得られた尤度の降順で並べ、尤度の高いもののうち所定数（例えば、１０）を含む可視化データを生成してもよい。図１５は、発話者２０の発話データ１２１から得られた積算尤度の変化を表すグラフを表示する表示部Ｂ５１と、あるカテゴリに関する尤度の高い順で発話データ１２１のテキストを表示する表示部Ｂ６２と、各テキストの尤度を表示する表示部Ｂ５３とを含む表示画面Ｗ５の一例である。表示部Ｂ５２で表示するテキスト及び表示部Ｂ５３で表示する尤度は、利用者が表示を希望するカテゴリの選択を切り替えることで、変更される。したがって、利用者は、希望のカテゴリについて、尤度の高い発話データ１２１を確認することができる。ここで、生成部１１３は、予めキーワードとして設定される単語について、他の文字とフォント、文字サイズ、色等を変えることで、強調して表示されるような可視化データを生成してもよい。これにより、利用者２２は、他者である発話者２０の言い回しを真似することで、顧客に分かり易く説明することができるようになる。

《実施形態の概要》
（１）本開示の発話解析装置は、第１期間における発話者の発話の変化を可視化する発話解析装置であって、発話者の発話データを時系列の順番で取得する取得部と、取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析する演算部と、演算部で得られた発話の変化を可視化した可視化データを表示させる表示処理部とを備え、演算部は、第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、表示処理部により表示される可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す。

　これにより、発話者の発話の話題の推移が可視化させることができる。したがって、利用者は、可視化された情報を用いて、発話者の発話を評価したり、発話者の発話を自身の今後の発話の参考にすることができる。

（２）（１）の演算部は、所定時の直前の第２期間に取得された複数の発話データの第１の尤度を積算して求めた各カテゴリの第２の尤度により、当該所定時のカテゴリを特定し、時系列において連続的に得られる複数の所定時のカテゴリをそれぞれ特定し、表示処理部に表示させる可視化データは、時系列における複数の所定時のカテゴリ間の変化を、話題の変化として可視化したデータであってもよい。

　これにより、短期の発話データではなく、その前の所定期間の発話データを考慮することが可能となり、話題の推移を緩やかな変化として表すことができる。

（３）（２）又は（２）の演算部は、カテゴリ毎に、第２期間に含まれる発話データから得られた第１の尤度を積算して第２の尤度を求め、得られた各カテゴリの第２の尤度のうち、値が最も大きいカテゴリを第２期間の話題のカテゴリとして特定してもよい。

（４）（３）の演算部は、第２期間に出現する頻度が高い程、大きな値に設定される第１の重み値を用いて、第２の尤度を求めてもよい。

　これにより、所定期間内での頻度を考慮してカテゴリを特定することが可能となり、一連の発話データのカテゴリ尤度の変化を考慮することが可能となり、適切な変化を表すことができる。

（５）（３）又は（４）の演算部は、所定時に近い程、大きな値に設定される第２の重み値を用いて、前記第２の尤度を求めてもよい。

　これにより、所定期間内での鮮度を考慮してカテゴリを特定することが可能となり、一連の発話データのカテゴリ尤度の変化を考慮することが可能となり、適切な変化を表すことができる。

（６）（２）～（５）の発話解析装置は、第１期間の開始から所定時までの期間が、第２期間に満たない場合、演算部は、第１期間の開始から当該所定時までの期間の発話データを用いて前記第２の尤度を演算してもよい。

　これにより、発話の開始から所定の間の話題の特定については、発話データが不足する場合であっても、ある程度長い期間の発話データを使用することが可能となり、適切な変化を表すことができる。

（７）（１）～（６）の発話解析装置は、ユーザから指定された期間を受け付ける受付部を備え、演算部は、受付部が受け付けた期間を第２期間として第２の尤度を求めてもよい。

　これにより、ユーザが第２期間を設定可能となるため、ユーザにとって最適な情報を提供することができる。

（８）（１）～（７）の表示処理部が表示させる可視化データは、各カテゴリの第２の尤度が時系列で表わされたグラフを含んでもよい。

　これにより、話題の遷移が把握しやすく表示され、利用者に話題の遷移を容易に把握させることができる。

（９）（１）～（７）の表示処理部が表示させる可視化データは、発話データに含まれる発話のテキストデータを含んでもよい。

　これにより、利用者に、話題の遷移とともに、発話の話題を把握させることができる。

（１０）（１）～（７）の表示処理部が表示させる前記可視化データは、第１の発話者の発話データから生成された可視化データと、第２の発話者の発話データから生成された可視化データとを比較した比較データでもよい。

　これにより、利用者に、複数の発話者の発話の話題を比較しやすくさせることができる。

（１１）（１）～（１０）の演算部は、前記発話データ毎に、各カテゴリに関する第１の尤度を演算してもよい。

　これにより、発話解析装置内で第１の尤度を算出することができるため、ネットワークの負荷に依存せずに処理することができる。

（１２）本開示の可視化方法は、第１期間における発話者の発話の変化を可視化する発話解析方法であって、取得部が、発話者の発話データを時系列の順番で取得するステップと、演算部が　取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析するステップと、表示処理部が、得られた発話の変化を可視化した可視化データを表示させるステップとを含み、演算部は、第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、表示処理部により表示される前記可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す発話解析方法。

　これにより、発話者の発話の話題の推移が可視化させることができる。したがって、利用者は、可視化された情報を用いて、発話者の発話を評価したり、発話者の発話を自身の今後の発話の参考にすることができる。
（１３）本開示のプログラムは、コンピュータに、（１２）の方法を実現させる。

　本開示の全請求項に記載の発話解析装置、発話解析方法及びプログラムは、ハードウェア資源、例えば、プロセッサ、メモリ、及びプログラムとの協働などによって、実現される。

　本開示の発話解析装置、可視化方法及びプログラムは、例えば、会話することにより営業に従事する者、何らかの講義を行う講師、コールセンター等で質問に対して回答する回答者等の発話者によって、ある期間、発話がされた場合に、その発話を評価したり、他者がその発話の話題を参考にしたりする場合に有用である。

１　発話解析装置
１１　制御部
１１１　取得部
１１２　演算部
１１３　生成部
１１４　表示処理部
１２　記憶部
１２１　発話データ
１２２　変化データ

Claims

　第１期間における発話者の発話の変化を可視化する発話解析装置であって、
　前記発話者の発話データを時系列の順番で取得する取得部と、
　前記取得部で取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析する演算部と、
　前記演算部で得られた発話の変化を可視化した可視化データを表示させる表示処理部とを備え、
　前記演算部は、前記第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、
　前記表示処理部により表示される前記可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す
　発話解析装置。
　前記演算部は、
　所定時の直前の第２期間に取得された複数の発話データの第１の尤度を積算して求めた各カテゴリの第２の尤度により、当該所定時のカテゴリを特定し、
　前記時系列において連続的に得られる複数の所定時のカテゴリをそれぞれ特定し、
　前記表示処理部に表示させる可視化データは、前記時系列における複数の所定時のカテゴリ間の変化を、話題の変化として可視化したデータである
　請求項１に記載の発話解析装置。
　前記演算部は、
　カテゴリ毎に、前記第２期間に含まれる発話データから得られた第１の尤度を積算して第２の尤度を求め、
　得られた各カテゴリの第２の尤度のうち、値が最も大きいカテゴリを当該第２期間の話題のカテゴリとして特定する
　請求項２に記載の発話解析装置。
　前記演算部は、前記第２期間に出現する頻度が高い程、大きな値に設定される第１の重み値を用いて、前記第２の尤度を求める
　請求項３に記載の発話解析装置。
　前記演算部は、前記所定時に近い程、大きな値に設定される第２の重み値を用いて、前記第２の尤度を求める
　請求項３又は４に記載の発話解析装置。
　前記第１期間の開始から前記所定時までの期間が、前記第２期間に満たない場合、
　前記演算部は、前記第１期間の開始から当該所定時までの期間の発話データを用いて前記第２の尤度を演算する
　請求項２に記載の発話解析装置。
　ユーザから指定された期間を受け付ける受付部を備え、
　前記演算部は、前記受付部が受け付けた期間を第２期間として第２の尤度を求める
　請求項１乃至６のいずれか１に記載の発話解析装置。
　前記表示処理部が表示させる前記可視化データは、各カテゴリの第２の尤度が時系列で表わされたグラフを含む
　請求項１乃至７のいずれか１に記載の発話解析装置。
　前記表示処理部が表示させる前記可視化データは、前記発話データに含まれる発話のテキストデータを含む
　請求項１乃至７のいずれか１に記載の発話解析装置。
　前記表示処理部が表示させる前記可視化データは、第１の発話者の発話データから生成された可視化データと、第２の発話者の発話データから生成された可視化データとを比較した比較データである
　請求項１乃至７のいずれか１に記載の発話解析装置。
　前記演算部は、前記発話データ毎に、各カテゴリに関する第１の尤度を演算する
　請求項１乃至１０のいずれか１に記載の発話解析装置。
　第１期間における発話者の発話の変化を可視化する発話解析方法であって、
　取得部が、発話者の発話データを時系列の順番で取得するステップと、
　演算部が、取得した発話データが各カテゴリに該当する可能性を特定する値である複数の第１の尤度を用いて、発話の変化を解析するステップと、
　表示処理部が、得られた発話の変化を可視化した可視化データを表示させるステップとを含み、
　前記演算部は、前記第１期間より短い第２期間における複数の発話データの第１の尤度を積算して第２の尤度をカテゴリ毎に求め、
　前記表示処理部により表示される前記可視化データは、異なる複数の第２期間における各カテゴリの第２の尤度の変化により発話の変化を表す
　発話解析方法。
　コンピュータに、請求項１２の方法を実現させるプログラム。