WO2019130817A1

WO2019130817A1 - 情報処理装置及び発話解析方法

Info

Publication number: WO2019130817A1
Application number: PCT/JP2018/040837
Authority: WO
Inventors: 祐毅小林; 菜美西村; 知子真野
Original assignee: 京セラドキュメントソリューションズ株式会社
Priority date: 2017-12-25
Filing date: 2018-11-02
Publication date: 2019-07-04
Also published as: US20200321004A1; JP6904435B2; US11404064B2; JPWO2019130817A1; CN111149153B; CN111149153A

Abstract

情報処理装置（１）は、第１検出部（１０１）と、テキスト化部（１０２）と、第２検出部（１０３）と、表示部（１１５）と、表示制御部（１０４）とを備える。第１検出部（１０１）は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する。テキスト化部（１０２）は、第１検出部（１０１）によって検出された各発言の内容をテキスト化する。第２検出部（１０３）は、テキスト化部（１０２）によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する。表示制御部（１０４）は、第２検出部（１０３）によって検出された予め定められたキーワードを表示部（１１５）に表示させる。

Description

情報処理装置及び発話解析方法

　本発明は、情報処理装置及び発話解析方法に関し、特に、人により発話された内容を解析する技術に関する。

　今日では、グループ毎に討論の活性化を推定してその状況を明示する技術が提案されている（下記特許文献１参照）。この技術は、グループの各メンバーが発話した発話時刻及び発話時間長を記憶しておき、グループ毎に、各メンバーの発話時刻及び発話時間長を時系列に区分し、グループ全メンバーの発話時間長に対する各メンバーの発話時間長の比を算出して、グループ毎に、各メンバーの発話密度寄与率を描画したグラフを生成するというものである。

特開２０１６－１６２３３９号公報

　しかしながら、上記技術は、グループ内における各メンバーの発話時間に基づいて当該各メンバーの貢献度を示すものに過ぎず、当該グループによる討論においてされた発言の内容を表示することを実現するものではない。

　本発明は、上記の事情に鑑みなされたものであり、グループでの会議等においてされた発言の内容を表示することを目的とする。

　本発明の一局面に係る情報処理装置は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第１検出部と、第１検出部によって検出された各発言の内容をテキスト化するテキスト化部と、テキスト化部によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する第２検出部と、表示部と、第２検出部によって検出された予め定められたキーワードを表示部に表示させる表示制御部と、を備えるものである。

　また、本発明の他の一局面に係る発話解析方法は、複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する発言検出ステップと、発言検出ステップで検出された各発言の内容をテキスト化するテキスト化ステップと、テキスト化ステップでテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出するキーワード検出ステップと、キーワード検出ステップで検出された予め定められたキーワードを表示部に表示させる表示制御ステップと、を備えるものである。

　また、本発明の他の一局面に係る情報処理装置は、表示部と、音声を示す電気信号が入力される音声入力部と、音声入力部に電気信号が入力される度に、入力された電気信号に基づく音声データを、音声を発した人ごとに記憶する記憶部と、プロセッサーを含み、当該プロセッサーが評価プログラムを実行することにより、音声データから発言に対応する部分を抽出し、抽出された部分を発言として検出する第１検出部と、第１検出部によって検出された発言の内容をテキスト化するテキスト化部と、テキスト化部によってテキスト化されたテキストデータに基づいて、発言に含まれる予め定められたキーワードを検出する第２検出部と、第２検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、して機能する制御ユニットと、を備える。

　本発明によれば、グループでの会議等においてされた発言の内容を表示することが可能になる。

本発明の第１実施形態に係る情報処理装置、及び当該情報処理装置により発話解析が行われる対象者を示す図である。情報処理装置の内部構成の概略を示すブロック図である。音声データの一例を示す図である。第１実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。表示部の表示画面の一例を示す図である。表示部の表示画面の一例を示す図である。表示部の表示画面の一例を示す図である。第２実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。表示部の表示画面の一例を示す図である。第３実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。ポイント例を示す図である。表示部の表示画面の一例を示す図である。第４実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。種別、種別に属するキーワード、及び検出数の例を示す図である。表示部の表示画面の一例を示す図である。第５実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。表示部の表示画面の一例を示す図である。表示部の表示画面の一例を示す図である。第６実施形態に係る情報処理装置による発話解析処理を示すフローチャートである。表示部の表示画面の一例を示す図である。表示部に表示されている各キーワードについての付加情報を表示させる処理を示すフローチャートである。表示部の表示画面の一例を示す図である。

　以下、本発明の一実施形態に係る情報処理装置、発話解析方法、及び発話解析プログラムについて図面を参照して説明する。図１は、本発明の第１実施形態に係る情報処理装置、及び当該情報処理装置により発話解析が行われる対象者を示す図である。

　情報処理装置１は、予め定められた複数人からなる複数の会話グループＧ１～Ｇ３に属する各人が発した音声を音声データとして取得する。例えば、グループＧ１に属する人Ｐ１１，Ｐ１２，Ｐ１３、グループＧ２に属する人Ｐ２１，Ｐ２２，Ｐ２３、グループＧ３に属する人Ｐ３１，Ｐ３２，Ｐ３３からなる複数人（本実施形態では３つのグループに属する各人からなる合計９人として説明するが、これに限定されるものではない。）が、グループ単位でミーティング、討論、授業、又は会議など（以下、総称して単に「会議」という。）を行っているものとする。

　当該会話グループの各人は、マイクロフォン機能を備えたヘッドセット２を使用した状態で発声する。すなわち、当該各人が用いるそれぞれのヘッドセット２は、ヘッドセット２を装着した人の会話の音声を取得し、当該音声を示す電気信号に変換して、情報処理装置１に出力する。情報処理装置１と、各ヘッドセット２とは、例えば、ケーブル接続による有線通信、又は、Bluetooth（登録商標）若しくは無線ＬＡＮ等の無線通信により接続されている。情報処理装置１は、各ヘッドセット２から出力されてくる上記音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換し、ヘッドセット２毎、すなわち、上記人Ｐ１１～Ｐ３３の９人についての音声データをそれぞれに蓄積する。

　次に、第１実施形態に係る情報処理装置１の構成について説明する。図２は、情報処理装置１の内部構成の概略を示すブロック図である。

　情報処理装置１は、例えばコンピューターである。情報処理装置１は、制御ユニット１０と、ＲＯＭ（Read Only Memory）１１２と、ＲＡＭ（Random Access Memory）１１３と、ＨＤＤ（Hard Disk Drive）１１４と、表示部１１５と、通信インターフェイス１１８と、指示入力部１１９とを備える。これら各部は、互いにＣＰＵ（Central Processing Unit）バスによりデータ又は信号の送受信が可能とされている。

　制御ユニット１０は、情報処理装置１全体の動作制御を司る。ＲＯＭ１１２は、情報処理装置１の基本動作についての動作プログラムを記憶する。ＲＡＭ１１３は、制御ユニット１０の動作領域等として使用される。

　ＨＤＤ１１４は、その記憶領域の一部に、本発明の第１実施形態に係る発話解析プログラムを記憶している。また、ＨＤＤ１１４は、上記人Ｐ１１～Ｐ３３の９人についてのそれぞれの上記音声データを記憶する。なお、ＨＤＤ１１４は、特許請求の範囲における記憶部の一例でもある。但し、情報処理装置１が備える不揮発性ＲＯＭ（例えば、制御ユニット１０が内蔵）が当該記憶部として機能してもよい。

　情報処理装置１と接続されているヘッドセット２には、当該ヘッドセット２を特定するための識別情報が予め付されている。識別情報としては、ヘッドセット２を特定可能な情報であれば特に限定されないが、例えば、識別番号がある。ＨＤＤ１１４は、ヘッドセット２ごとに当該識別情報を予め記憶している。ＨＤＤ１１４はまた、指示入力部１１９を介してユーザーによって入力される指示に応じて、識別情報のそれぞれを、グループを特定するためのグループ情報と対応付けて記憶している。

　本実施の形態では、ＨＤＤ１１４は、人Ｐ２１，Ｐ２２，Ｐ２３がそれぞれ使用しているヘッドセット２の識別情報を、グループＧ１を特定するグループ情報と対応付けて記憶している。ＨＤＤ１１４はまた、人Ｐ２１，Ｐ２２，Ｐ２３がそれぞれ使用しているヘッドセット２の識別情報を、グループＧ２を特定するグループ情報と対応付けて記憶している。ＨＤＤ１１４はさらに、人Ｐ３１，Ｐ３２，Ｐ３３がそれぞれ使用しているヘッドセット２の識別情報を、グループＧ３を特定するグループ情報と対応付けて記憶している。

　表示部１１５は、ＬＣＤ（Liquid Crystal Display）等からなり、情報処理装置１を操作する操作者に対する操作案内等が表示される。

　通信インターフェイス１１８は、ＵＳＢインターフェイス又は無線ＬＡＮインターフェイス等を有する。通信インターフェイス１１８は、上記各ヘッドセット２とのデータ通信を行うためのインターフェイスとして機能する。通信インターフェイス１１８は、特許請求の範囲における音声入力部の一例である。

　指示入力部１１９は、キーボード又はマウス等から構成され、操作指示が操作者によって入力される。

　制御ユニット１０は、プロセッサー、ＲＡＭ、及びＲＯＭなどから構成される。プロセッサーは、ＣＰＵ、ＭＰＵ（Micro Processing Unit）、又はＡＳＩＣ（Application Specific Integrated Circuit）等である。この制御ユニット１０は、ＨＤＤ１１４に記憶されている発話解析プログラムが上記のプロセッサーで実行されることにより、制御部１００、第１検出部１０１、テキスト化部１０２、第２検出部１０３、表示制御部１０４、仕分部１０５、及び抽出部１０６として機能する。なお、制御部１００、第１検出部１０１、テキスト化部１０２、第２検出部１０３，表示制御部１０４、仕分部１０５、及び抽出部１０６は、ハード回路により構成されてもよい。

　制御部１００は、情報処理装置１全体の動作制御を司る機能を有する。

　第１検出部（発言検出部）１０１は、ＨＤＤ１１４に記憶されている人Ｐ１１～Ｐ３３の９人についての音声データのそれぞれから、音声データに記録されている発話の中でされている発言を検出する。図３は、音声データの一例を示す図である。図３の縦軸は音の振幅（単位dB）、横軸は時刻を示す。第１検出部１０１は、音声データを解析し、音声データが示す振幅のうち、予め定められた規定時間（例えば、0.25秒）以上連続して、予め定められた大きさ以上の振幅（例えば、20dB）が続く部分を発言として検出する。図３に示す音声データでは、第１検出部１０１は、ａ部分、ｂ部分、及びｃ部分を発言として検出する。

　テキスト化部１０２は、既知の音声認識機能を備え、これにより、上記音声データに含まれる上記各人の発言の内容をキャラクター変換してテキスト化する。

　第２検出部（キーワード検出部）１０３は、テキスト化部１０２によってテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する。

　表示制御部１０４は、第２検出部１０３によって検出された上記予め定められたキーワードを表示部１１５に表示させる。また、表示制御部１０４は、第２検出部１０３によって検出された上記予め定められたキーワードのうち、検出数が予め定められた第１の値以上であるキーワードを、表示部１１５に表示させる。

　仕分部（種別仕分部）１０５は、第２検出部１０３によって検出された上記予め定められたキーワードを、予め定められたそれぞれの種別に仕分ける。表示制御部１０４は、属する各キーワードの検出数の合計が予め定められた第２の値以上である種別及び当該種別に属するキーワードを、表示部１１５に表示させる。

　抽出部（単語抽出部）１０６は、テキスト化部１０２によってテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する。表示制御部１０４は、抽出部１０６によって抽出された単語のうち、検出数が予め定められた第３の値以上である単語を表示部１１５に表示させる。

　次に、第１実施形態に係る情報処理装置１による発話解析処理について説明する。図４は、第１実施形態に係る情報処理装置１による発話解析処理を示すフローチャートである。

　当該発話解析が行われる場面は、会話グループＧ１～Ｇ３に属する各人が、それぞれのグループ毎に会議を行っている場面である。人Ｐ１１～Ｐ３３は、各自がヘッドセット２を装着し、各ヘッドセット２は上述したように情報処理装置１に対して通信可能に接続されている。この状態で、人Ｐ１１～Ｐ３３は、各自が属するそれぞれのグループにおいて会議中に発話を行う。人Ｐ１１～Ｐ３３によって発話された音声は、人Ｐ１１～Ｐ３３のそれぞれのヘッドセット２により集音され、情報処理装置１に出力される。

　情報処理装置１は、通信インターフェイス１１８を介して、各ヘッドセット２から音声データを取得する（ステップＳ１）。すなわち、通信インターフェイス１１８が、各ヘッドセット２から出力されてくる上記音声を示す電気信号を受信すると、第１検出部１０１が、当該取得された音声を示す電気信号を、ディジタルの音声信号からなる音声データに変換してＨＤＤ１１４に記憶させる。第１検出部１０１は、人Ｐ１１～Ｐ３３毎に、すなわち、ＨＤＤ１１４に記憶されている識別情報に対応付けて、当該音声データをＨＤＤ１１４に記憶させる。

　続いて、第１検出部１０１は、人Ｐ１１～Ｐ３３毎にＨＤＤ１１４に記憶されている音声データのそれぞれから、当該音声データが示す発話の中でされている各発言を、上述したようにして検出する（ステップＳ２）。

　そして、テキスト化部１０２は、上記音声データに含まれる上記各人の発言の内容を、音声認識機能によりキャラクター変換してテキスト化する（ステップＳ３）。第１検出部１０１は、上記音声データにおける、人Ｐ１１～Ｐ３３の各発言にあたる時間帯をＨＤＤ１１４に記憶させており、テキスト化部１０２は、上記音声データにおける当該時間帯部分を発言と認識して、当該発言の内容をキャラクター変換してテキスト化する。

　続いて、第２検出部１０３は、テキスト化部１０２によって上記のようにテキスト化されたテキストデータに基づいて、各発言に含まれる予め定められたキーワードを検出する（ステップＳ４）。例えば、ＨＤＤ１１４に、予め定められたキーワードとして、「水蒸気」、「気圧」、「変化」及び「融解」が記憶されている場合、第２検出部１０３は、上記発言がテキスト化されてなるテキストデータに、当該キーワードが含まれているか否かを判断する。第２検出部１０３は、当該キーワードが含まれている場合には、キーワードを検出して、当該キーワードの出現数をカウントアップする。第２検出部１０３は、各キーワードの出現数を識別情報に対応付けて、ＨＤＤ１１４に記憶させておく。

　そして、表示制御部１０４は、第２検出部１０３によって検出された上記各キーワードを表示部１１５に表示させる（ステップＳ５）。予め定められたキーワードが上記の例に示すものである場合、図５に示すように、表示制御部１０４は、ＨＤＤ１１４に記憶されている識別情報及びグループ情報に基づいて、各キーワードの出現数をグループ毎に集計し、人Ｐ１１～Ｐ３３のグループ毎に、各キーワードと各キーワードの出現数とを示す画像を表示部１１５に表示させる。なお、図５に示すように、表示制御部１０４は、第２検出部１０３によって検出されなかったキーワード（検出数「０」のキーワード）を、検出数「０」として表示部１１５に表示させてもよい。

　また、表示制御部１０４は、指示入力部１１９の操作で操作者から入力される画面切換指示に従って、図６に示すように、全グループを通じた、各キーワードと各キーワードの出現数とを示す画像を表示部１１５に表示させる。或いは、表示制御部１０４は、指示入力部１１９の操作で操作者から入力される画面切換指示に従って、図７に示すように、全グループを通じて、出現数が上位の３つのキーワードを、出現数が多い順に並べた画像を表示部１１５に表示させる。

　図８は、第２実施形態に係る情報処理装置１による発話解析処理を示す図である。図８に示すように、第２実施形態では、第１実施形態におけるステップＳ１～ステップＳ４と同様にしてキーワード検出までの処理を終えた後（ステップＳ１１～ステップＳ１４）、表示制御部１０４は、第２検出部１０３によって検出されたキーワードのうち、検出数が予め定められた第１の値以上であるキーワードを検出して（ステップＳ１５）、当該検出した各キーワードをそれぞれの検出数と共に、表示部１１５に表示させる（ステップＳ１６）。

　例えば、表示制御部１０４は、図９に示すように、第１の値が「１２」である場合、検出数が第１の値以上であるキーワードを検出して、当該検出したキーワード及びその検出数のみをグループ毎に表示部１１５に表示させる。

　これら第１及び第２実施形態によれば、グループでの会議等においてされた発言の内容を、ユーザーが視認可能となるように表示することができる。これにより、ユーザーは、当該表示を視認して、会議出席者による発言の内容を正確に把握することが可能になる。

　図１０は、第３実施形態に係る情報処理装置１による発話解析処理を示す図である。第３の実施形態では、図１０に示すように、第１実施形態におけるステップＳ１～ステップＳ４と同様にしてキーワード検出までの処理を終えた後（ステップＳ２１～ステップＳ２４）、表示制御部１０４は、各キーワードの検出回数に応じて、各キーワードに予め付されているポイントをキーワード毎に集計し（ステップＳ２５）、集計したポイントと共に、各キーワードを表示部１１５に表示させる（ステップＳ２６）。更には、表示制御部１０４は、グループＧ１～Ｇ３毎に、全キーワードのポイントの合計を算出して表示してもよい。なお、第３実施形態では、予め定められたキーワードは複数とされる。

　ＨＤＤ１１４は、各キーワードについて、検出回数１回毎に加算される予め定められたポイントを記憶している。当該ポイントは、会議における重要度等に応じて主催者等が予め設定し、例えば指示入力部１１９の操作によりＨＤＤ１１４に記憶させる。表示制御部１０４は、キーワードを１回検出する度にそのキーワードに付されたポイントを加算する。このため、多く検出されたキーワードは、集計されるポイントが高くなる。

　例えば、図１１Ａに示すように、ＨＤＤ１１４が、キーワードごとに設定されているポイントとして、「水蒸気」に対して２ポイント、「気圧」に対して３ポイント、「変化」に対して１ポイント、「融解」に対して５ポイントを記憶しているとき、表示制御部１０４は、各キーワードの検出回数に応じてポイントをキーワード毎に集計する。表示制御部１０４は更に、グループＧ１～Ｇ３毎に、全キーワードのポイント合計を算出し、図１１Ｂに示す「集計結果」のような表示画面を表示部１１５に表示させることにより、集計したポイント及び各キーワードと、全キーワードのポイントの合計とをグループＧ１～Ｇ３毎に、表示部１１５に表示させる。

　この第３実施形態によれば、ユーザーは、表示されたキーワード及び集計ポイントを視認することで、その会議において、重要なキーワードがどの程度用いられているかを把握でき、更には、全キーワードのポイント合計を視認することで、どのグループが最も有意義な会議を行ったかを判断するための指標を得ることができる。

　次に、第４実施形態に係る情報処理装置１による発話解析処理について説明する。図１２は、第４実施形態に係る情報処理装置１による発話解析処理を示すフローチャートである。

　第４実施形態では、第１実施形態におけるステップＳ１～ステップＳ４と同様にしてキーワード検出までの処理を終えた後（ステップＳ３１～ステップＳ３４）、仕分部１０５が、第２検出部１０３によって検出されたキーワードを、予め定められた種別に仕分ける（ステップＳ３５）。例えば、ＨＤＤ１１４は、予め定められた種別として、「天気」、「スポーツ」、及び「社会」を記憶している。ＨＤＤ１１４は、更に、種別「天気」に属するキーワードとして、「晴れ」「曇り」「雨」「雲」「白い」「煙」というキーワードを予め記憶している。また、ＨＤＤ１１４は、更に、種別「スポーツ」に属するキーワードとして、「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」というキーワードを予め記憶している。また、ＨＤＤ１１４は、更に、種別「社会」に属するキーワードとして、「経済」「企業」「株価」「景気」「売上」「損益」というキーワードを予め記憶している。

　この場合、第２検出部１０３は、各人による各発言から、まず、「晴れ」「曇り」「雨」「雲」「白い」「煙」「テニス」「野球」「サッカー」「中止」「決勝」「勝敗」「企業」「株価」「景気」「売上」「損益」を検出する。そして、仕分部１０５は、検出された各キーワードを、種別「天気」「スポーツ」「社会」のいずれの種別に属するかを判断し、検出された各キーワードを種別毎に仕分ける。図１３に、種別、種別に属するキーワード、及び検出数の例を示す。仕分部１０５は、出現したキーワードを各種別に仕分け、各種別に属する各キーワードの検出数をカウントしておき、当該検出数をキーワードと共にＨＤＤ１１４に記憶させる。

　続いて、表示制御部１０４は、検出数が予め定められた第２の値以上である種別を検出する（ステップＳ３６）。すなわち、表示制御部１０４は、種別に属する各キーワードの検出数の合計が上記第２の値以上である種別を検出する。例えば、第２の値が「１５０」であり、図１３に示した種別、種別に属するキーワード、及び検出数の場合、表示制御部１０４は、例えば、グループＧ１については、種別「社会」を検出する。

　そして、表示制御部１０４は、当該検出した種別を、当該種別に属する各キーワードのそれぞれの検出数と共に、表示部１１５に表示させる（ステップＳ３７）。表示制御部１０４は、上記のように、グループＧ１については種別「社会」を検出し、グループＧ２については種別「天気」を検出し、グループＧ３についても種別「天気」を検出した場合、図１４に例を示すように、検出した種別と、当該種別に属する各キーワード及びそれぞれの検出数を表示部１１５に表示させる。

　この第４実施形態によれば、検出したキーワードを各種別に仕分けし、更に、属する各キーワードの検出数の合計が第２の値以上である種別が表示されるので、ユーザーは、予め定められた各キーワードが多く出現する種別を的確に把握することが可能になる。

　次に、第５実施形態に係る情報処理装置１による発話解析処理について説明する。図１５は、第５実施形態に係る情報処理装置１による発話解析処理を示すフローチャートである。

　第５実施形態では、第１実施形態におけるステップＳ１～ステップＳ４と同様にしてキーワード検出までの処理を終えた後（ステップＳ４１～ステップＳ４４）、抽出部１０６が、ステップＳ３３でテキスト化されたテキストデータから、上記予め定められたキーワード以外の単語を抽出する（ステップＳ４５）。すなわち、第３実施形態では、表示制御部１０４が、上記予め定められたキーワードを検出すると共に、抽出部１０６が、上記予め定められたキーワード以外の単語を抽出する。

　表示制御部１０４は、抽出部１０６によって抽出された上記単語のうち、検出数が予め定められた第３の値以上である単語を検出して（ステップＳ４６）、当該検出した各単語をそれぞれの検出数と共に、表示部１１５に表示させる（ステップＳ４７）。

　例えば、表示制御部１０４は、第３の値が例えば「１５」である場合、図１６に示すように、上記予め定められたキーワード以外の単語であって、検出数が第３の値以上である単語と、その検出数とを表示部１１５に表示させる。

　この第５実施形態によれば、グループでの会議等において、予め定められたキーワードではなくても、出現数の多い単語があれば検出して表示するため、ユーザーは、当初はユーザーが注目していなかったが、実際に会議をしてみると会議出席者が注目して発言した単語を把握することが可能になる。

　なお、表示制御部１０４は、ステップＳ３６で検出した各単語を、例えば図１７に例を示すように、ステップＳ３４で検出された各キーワードとは異なる表示形態で表示部１１５に表示させてもよい（図１５のステップＳ４７における括弧書）。

　次に、第６実施形態に係る情報処理装置１による発話解析処理の第６実施形態について説明する。図１８は、第６実施形態に係る情報処理装置１による発話解析処理を示すフローチャートである。

　第６実施形態では、第１実施形態におけるステップＳ１～ステップＳ４と同様にしてキーワード検出までの処理を終えた後（ステップＳ５１～ステップＳ５４）、表示制御部１０４は、第２検出部１０３によって検出された各キーワードについて、各キーワードの検出数をカウントする。そして、表示制御部１０４は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部１１５に表示する際の画像の大きさを決定する（ステップＳ５５）。表示制御部１０４は、検出数が多いキーワードほど、画像の大きさを大きくする。更に、表示制御部１０４は、カウントした各キーワードの検出数に応じて、当該キーワードを表示部１１５に表示する際の画像の表示位置を決定する（ステップＳ５５）。例えば、表示制御部１０４は、検出数が多いキーワードほど、画像の表示位置を、表示部１１５の表示画面の縦方向中央部に近い位置とする。このとき、表示制御部１０４は、キーワードのそれぞれについて、表示部１１５の表示画面における異なる表示位置を設定する。

　また、表示制御部１０４は、このように画像大きさ及び表示位置を決定したキーワードを、表示部１１５に表示するとき、図１９に例を示すようにして、タグクラウド形式で表示させる（ステップＳ５６）。

　この第６実施形態によれば、ユーザーは、視覚的及び直感的に、いずれのキーワードが最も出現数が多いかを把握することが可能になる。

　次に、表示部１１５に表示されている各キーワードについての付加情報を表示させる処理を説明する。図２０は、表示部１１５に表示されている各キーワードについての付加情報を表示させる処理を示すフローチャートである。

　第６実施形態において、表示制御部１０４が、表示部１１５にタグクラウド形式で各キーワード又は上記単語を表示させているときに、操作者によるマウス等からなる入力部１１９の操作で、表示部１１５の表示画面における位置が指定されたとき（Ｓ６１でＹＥＳ）、表示制御部１０４は、入力部１１９により指定された当該位置に表示されているキーワードを検出し（ステップＳ６２）、当該検出したキーワードに対応付けてＨＤＤ１１４に記憶されている付加情報を特定する（ステップＳ６３）。表示制御部１０４は、当該特定した付加情報を、図２１に例を示すようにして、更に表示部１１５の表示画面に表示させる（ステップＳ６４）。ここで、付加情報とは、例えば、キーワードの出現数、会議での発言時刻、誰による発言か、等の情報である。付加情報は、ＨＤＤ１１４が記憶している。

　この第６実施形態によれば、ユーザーは、簡単な操作で、表示されているキーワードについての付加情報を視認することが可能である。

　また、上記実施形態において、図１乃至図２１を用いて示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

Claims

　複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する第１検出部と、
　前記第１検出部によって検出された前記各発言の内容をテキスト化するテキスト化部と、
　前記テキスト化部によってテキスト化されたテキストデータに基づいて、前記各発言に含まれる予め定められたキーワードを検出する第２検出部と、
　表示部と、
　前記第２検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、を備える情報処理装置。
　前記表示制御部は、前記第２検出部によって検出された前記予め定められたキーワードのうち、検出数が予め定められた第１の値以上であるキーワードを、前記表示部に表示させる請求項１に記載の情報処理装置。
　前記第２検出部によって検出された前記予め定められたキーワードを、予め定められた各種別に仕分ける仕分部を更に備え、
　前記表示制御部は、属する各キーワードの検出数合計が予め定められた第２の値以上である種別及び当該種別に属するキーワードを、前記表示部に表示させる請求項１に記載の情報処理装置。
　前記テキストデータから、前記予め定められたキーワード以外の単語を抽出する抽出部を更に備え、
　前記表示制御部は、前記抽出部によって抽出された単語のうち、検出数が予め定められた第３の値以上である単語を、前記表示部に表示させる請求項１に記載の情報処理装置。
　前記表示制御部は、前記抽出部によって抽出された単語であって、検出数が予め定められた第３の値以上である単語を、他のキーワードとは表示形態を異ならせて前記表示部に表示させる請求項４に記載の情報処理装置。
　前記予め定められたキーワードが複数とされ、当該各キーワードには、検出回数１回毎に予め定められたポイントが設定されており、前記表示制御部は、前記キーワード毎に検出回数に応じて当該ポイントを集計して、各キーワードを当該ポイントと共に前記表示部に表示させる請求項１に記載の情報処理装置。
　前記表示制御部は、前記検出されたキーワードを、タグクラウドによる視覚的記述により前記表示部に表示させ、当該キーワードの大きさを、検出数が多くなるにつれて大きくし、検出数が最多のキーワードを最も大きく表示させる請求項１に記載の情報処理装置。
　前記表示制御部は、前記予め定められたキーワードのそれぞれについて、前記表示部の表示画面における異なる表示位置を設定して、前記予め定められたキーワードのそれぞれを前記表示部に表示させる請求項７に記載の情報処理装置。
　前記表示部の表示画面における位置を指定するポインター部を更に備え、
　前記表示制御部は、前記ポインター部により指定された位置に表示されているキーワードに対応付けられている付加情報を、更に前記表示部に表示させる請求項７に記載の情報処理装置。
　複数人数からなるグループにおける各人の発話が記録された音声データから、当該発話の中でされている各発言を検出する発言検出ステップと、
　前記発言検出ステップで検出された前記各発言の内容をテキスト化するテキスト化ステップと、
　前記テキスト化ステップでテキスト化されたテキストデータに基づいて、前記各発言に含まれる予め定められたキーワードを検出するキーワード検出ステップと、
　前記キーワード検出ステップで検出された前記予め定められたキーワードを表示部に表示させる表示制御ステップと、を備える発話解析方法。
　表示部と、
　音声を示す電気信号が入力される音声入力部と、
　前記音声入力部に前記電気信号が入力される度に、入力された前記電気信号に基づく音声データを、前記音声を発した人ごとに記憶する記憶部と、
　プロセッサーを含み、当該プロセッサーが発話解析プログラムを実行することにより、
　　前記音声データから発言に対応する部分を抽出し、抽出された前記部分を発言として検出する第１検出部と、
　　前記第１検出部によって検出された前記発言の内容をテキスト化するテキスト化部と、
　　前記テキスト化部によってテキスト化されたテキストデータに基づいて、前記発言に含まれる予め定められたキーワードを検出する第２検出部と、
　　前記第２検出部によって検出された前記予め定められたキーワードを前記表示部に表示させる表示制御部と、して機能する制御ユニットと、を備える情報処理装置。
　前記記憶部はさらに、前記人を特定するための識別情報と、前記グループを特定するためのグループ情報とを対応付けて予め記憶し、
　前記制御ユニットはさらに、前記音声入力部に前記電気信号が入力されると、前記音声データを、前記識別情報に対応付けて記憶する制御部として機能し、
　前記表示制御部は、前記第２検出部によって検出された前記予め定められたキーワードを、前記グループ情報毎に前記表示部に表示させる、請求項１１に記載の情報処理装置。