WO2021255795A1

WO2021255795A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2021255795A1
Application number: PCT/JP2020/023454
Authority: WO
Inventors: 俊一瀬古
Original assignee: 日本電信電話株式会社
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2021-12-23
Also published as: JP7355244B2; JPWO2021255795A1

Abstract

発話者の発話内容を表すグラフィカルな記録を自動的に生成可能な技術を提供する。情報処理装置が、発話者の発話活動に関わる活動情報を取得する第１取得部と、上記活動情報から上記発話者の発話内容を表すテキスト情報を抽出する抽出部と、上記テキスト情報をもとに上記発話内容の論理構成を解析する解析部と、上記論理構成に基づいて上記テキスト情報から可視化対象区間を選択する選択部と、上記可視化対象区間ごとに上記テキスト情報を視覚的情報に変換する変換部と、上記視覚的情報を含む出力データを生成し出力する出力データ生成部とを備えるようにした。

Description

情報処理装置、情報処理方法およびプログラム

　本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。

　会議などで話されている内容を、絵やイラスト、記号、文字などを含むグラフィック表現により記録する、グラフィックレコーディングが知られている。記録者は、グラフィックレコーダとも呼ばれ、議論の進行中にその場で、または録音や録画されたデータをもとに、議論の内容を可視化する。議論の内容を可視化することにより、参加者は、議論の目的や経過等を確認しながら議論を進めることができる。また、会議に参加していない第三者も議論の内容を効率的に把握することができる。

　ここで、人の手作業によるグラフィックレコーディングは、グラフィックレコーダによって、まとめ方や表現の仕方が十人十色であり、また会議の目的によっても、まとめる内容の選び方やわかりやすい表現の仕方が異なってくる。例えば、会議の種類（情報連絡、説明会、ブレインストーミング）によってまとめたい内容が異なることがある。また、同じプレゼンテーションであっても、グラフィックレコーダによってまとめ方や表現は大きく異なる。

　会議中に発生した音声データをテキスト化し、ユーザが選択したテキストに合致するイラストの候補を検索して挿入できるようにする技術が提案されている（例えば、特許文献１参照）。特許文献１に記載の技術では、ユーザが手動で任意のイラストを挿入・変更し、位置変更を行うことも可能であり、また、ポーズや表情も設定可能としている。

日本国特許第６３３９５２９号公報

　しかし従来技術では、適切なイラストを選択し、目的に合わせた表現を実現するには、ユーザが手動で操作を行う必要があり、効率面で課題が残る。

　この発明は上記事情に着目してなされたもので、その目的とするところは、発話者の発話内容を表すグラフィカルな記録を自動的に生成できるようにする技術を提供することにある。

　上記課題を解決するためにこの発明の第１の態様は、情報処理装置にあって、発話者の発話活動に関わる活動情報を取得する第１取得部と、上記活動情報から上記発話者の発話内容を表すテキスト情報を抽出する抽出部と、上記テキスト情報をもとに上記発話内容の論理構成を解析する解析部と、上記論理構成に基づいて上記テキスト情報から可視化対象区間を選択する選択部と、上記可視化対象区間ごとに上記テキスト情報を視覚的情報に変換する変換部と、上記視覚的情報を含む出力データを生成し出力する出力データ生成部とを備えるようにしたものである。

　この発明の第１の態様によれば、発話者の発話活動に関わる活動情報を受け付けると、活動情報から発話内容を表すテキスト情報が抽出され、テキスト情報をもとに発話内容の論理構成が解析され、論理構成に基づいてテキスト情報から可視化対象区間が選択され、選択された可視化対象区間が視覚的情報に変換され、出力データとして出力される。これにより、発話者の発話活動に関わる活動情報をもとに、発話内容を表すテキスト情報が視覚的情報に変換され、その視覚的情報を含む出力データを自動的に出力することが可能となる。

　したがって、この発明の第１の態様によれば、発話者の発話活動に関わる活動情報をもとに、その発話内容を表すグラフィカルな記録を自動的に生成することのできる情報処理装置を提供することができる。

図１は、この発明の一実施形態に係る情報処理装置による処理全体の概要を示す図である。図２Ａは、感情重視の場合の区間選択の一例を示す図である。図２Ｂは、論理重視の場合の区間選択の一例を示す図である。図３は、指定された方向づけに応じたグラフィック表現の一例を示す図である。図４は、指定された方向づけに応じた全体的なレイアウトの一例を示す図である。図５は、この発明の一実施形態に係る情報処理装置の機能構成を示す図である。図６は、図５に示した装置による処理全体の流れを示すフローチャートである。図７は、図６に示した処理のうち発話グルーピング処理の詳細を示すフローチャートである。図８は、図６に示した処理のうちトピックセットデータ取捨選択処理の詳細を示すフローチャートである。図９は、図６に示した処理のうちグラフィック化処理全体の流れを示すフローチャートである。図１０は、図９に示した処理のうち論理系テンプレート選択処理の詳細を示すフローチャートである。図１１は、図９に示した処理のうち感情系テンプレート選択処理の詳細を示すフローチャートである。図１２は、図９に示した処理のうち論理重視の場合の語句抽出・当て込み処理の詳細を示すフローチャートである。図１３は、図９に示した処理のうち感情重視の場合の語句抽出・当て込み処理の詳細を示すフローチャートである。図１４は、図９に示した処理のうち論理寄りの場合の語句抽出・当て込み処理の詳細を示すフローチャートである。図１５は、図９に示した処理のうち感情寄りの場合の語句抽出・当て込み処理の詳細を示すフローチャートである。図１６は、図９に示した処理のうちニュートラルの場合の当て込み処理の詳細を示すフローチャートである。図１７は、図６に示した処理のうち全体レイアウト処理全体の流れを示すフローチャートである。図１８は、図１７に示した処理のうちトピックセットデータ配置処理の詳細を示すフローチャートである。図１９は、感情の変化度合いの算出イメージを示す略図である。図２０は、発話グルーピング処理イメージを示す略図である。図２１は、トピックセットデータ取捨選択処理イメージを示す略図である。図２２は、テンプレート選択処理イメージを示す略図である。図２３は、論理系テンプレートの一例を示す図である。図２４は、感情系テンプレートの一例を示す図である。図２５は、論理系テンプレートデータの一例を示す図である。図２６は、感情系テンプレートデータの一例を示す図である。図２７は、マッチングアルゴリズムを示す略図である。図２８は、語句抽出・当て込み処理イメージを示す略図である。図２９は、論理重視の場合の語句抽出処理イメージを示す略図である。図３０は、テンプレート埋め込みデータの一例を示す図である。図３１は、関連語句と埋め込み項目との対応を決定する処理イメージを示す略図である。図３２は、グラフィック化済みトピックセットの一例を示す図である。図３３は、感情重視の場合のグラフィック化処理イメージを示す略図である。図３４は、論理寄りの場合の語句抽出処理イメージを示す略図である。図３５は、図３４の処理の結果として得られる出力結果の一例を示す図である。図３６は、感情寄りの場合の語句抽出処理イメージを示す略図である。図３７は、図３６の処理の結果として得られる出力結果の一例を示す略図である。図３８は、ニュートラルの場合の語句抽出・当て込み処理イメージを示す略図である。図３９は、親子関係に基づく配置の一例を示す図である。図４０は、兄弟関係に基づく配置と関係性を表す矢印の配置の一例を示す図である。図４１Ａは、強調表現を含む配置の第１の例を示す図である。図４１Ｂは、強調表現を含む配置の第２の例を示す図である。図４２Ａは、全体レイアウトの変化の第１の例を示す図である。図４２Ｂは、全体レイアウトの変化の第２の例を示す図である。図４２Ｃは、全体レイアウトの変化の第３の例を示す図である。図４２Ｄは、全体レイアウトの変化の第４の例を示す図である。図４２Ｅは、全体レイアウトの変化の第５の例を示す図である。図４２Ｆは、全体レイアウトの変化の第６の例を示す図である。図４２Ｇは、全体レイアウトの変化の第７の例を示す図である。図４２Ｈは、全体レイアウトの変化の第８の例を示す図である。図４３は、図５に示した装置のハードウェア構成の一例を示すブロック図である。

　以下、図面を参照してこの発明に係わる実施形態を説明する。なお、以降、説明済みの要素と同一または類似の要素には同一または類似の符号を付し、重複する説明については基本的に省略する。例えば、複数の同一または類似の要素が存在する場合に、各要素を区別せずに説明するために共通の符号を用いることがあるし、各要素を区別して説明するために当該共通の符号に加えて枝番号を用いることもある。

　［一実施形態］
　（１）概要
　はじめに、この発明の一実施形態に係る情報処理装置および情報処理方法の概要を説明する。　
　一実施形態に係る情報処理装置は、発話者の発話活動に関わる活動情報の入力を受け付けると、発話内容を表すグラフィック表現を含む視覚的情報に変換して出力する。以下では、このような処理全体を、自動グラフィックレコーディングと呼ぶ。またその出力データを「グラフィックレコーディングの結果」とも呼ぶ。視覚的情報は、絵またはイラスト、文字、記号、図形などを含み得る。自動グラフィックレコーディングに用いられる活動情報は、少なくともテキスト情報を抽出可能な発話音声を含む。活動情報は、発話音声のほかにも、発話者または参加者（聴衆）の画像または映像、発話者または参加者（聴衆）の動きや生体活動に関わる情報など、発話活動に関わるあらゆる情報を含み得る。自動グラフィックレコーディングの対象には、会議、対話、対談、講演など、発話を伴うあらゆるイベントが含まれる。音声情報に含まれる発話者は、ひとりであっても複数であってもよい。

　ここで、自動グラフィックレコーディングの結果として出力される情報は、入力された活動情報に応じた強調表現を伴い得る。強調の手法の一例として、発話者の感情の変化に係る感情情報や、発話者の発話内容の論理構成に係る論理情報に基づいて算出される重要度に応じた表現が用いられる。

　例えば、感情情報を用いることにより、発話者の感情の変化を考慮したまとめ方や表現方法の方向づけができるようになる。また、感情情報を重視すべきか論理情報を重視すべきかの対立項目を設定することによって、入力データが同じであっても、出力されるグラフィックレコーディングの結果を変化させることができる。例えば、ブレインストーミングであれば、発話内容が整理されていないため、論理的にまとめるよりも、盛り上がったなどの感情変化をトリガとしてまとめるほうがよい振り返りができる。反対に、説明会のように内容が整理された会議は、論理重視のほうが情報が整理されやすい。そこで、一実施形態によれば、感情情報を用いることによって、または感情：論理比がα：（１－α）となるようなαを設定できるようにすることによって、出力の方向づけを可能とする。

　ただし、一実施形態に係る情報処理装置は、感情情報や論理情報の使用を必須とするものではない。例えば、情報処理装置は、発話者の発話の音圧や特定のキーワードの有無など、音声情報から得られる情報に基づいて重要度を決定し、重要度に応じた強調表現を適用することが可能である。またさらに、感情や論理のほかに、文書優位または画像優位など、他の対立項目が設定できるようにしてもよい。例えば、文書優位または画像優位の比重を任意に設定することによって、出力データ内で使用される文書と画像の比率を変化させることができる。

　図１は、一実施形態に係る情報処理装置による処理全体の概要を示す。以下では、一例として、情報処理装置が、感情重視か論理重視かを指定する方向づけ設定情報に基づいて、感情情報または論理情報を用いて処理を行うものとして説明する。情報処理装置は、発話に関わる活動情報の一例として音声（ＩＮ１）および映像（ＩＮ２）を受け取り、グラフィックレコーディングの結果（ＧＲ）を出力する。

　まずステップＳ１において、情報処理装置は、音声ＩＮ１を取得し、音声ＩＮ１から発話テキストを抽出し、文書構造の解析を行い、文書構造解析済みの発話テキスト情報Ｐ１を出力する。ステップＳ１の処理は従来技術を用いることができる。

　ステップＳ２において、情報処理装置は、音声ＩＮ１および映像ＩＮ２を取得し、音声ＩＮ１または映像ＩＮ２から発話者の感情を推測し、感情情報Ｐ２を出力する。感情情報とは、例えば感情の盛り上がりや共感の程度を表す情報であり、詳細は後述する。なお、映像の入力は必須ではない。上述したように、感情の推測には音声のみを用いてもよいし、発話者の他の活動情報（呼気、脈拍、体温、発汗、動作、表情など）を追加的に用いてもよい。ステップＳ２の処理もまた従来技術を用いることができる。

　ステップＳ３（発話グルーピング処理）において、情報処理装置は、文書構造解析済みの発話テキスト情報Ｐ１および感情情報Ｐ２を受け取り、発話テキストをもとに発話区間を決定し、感情情報をもとに発話区間をグルーピングし、トピックセットデータＰ３を出力する。ここでは、「トピックセット」は、感情情報をもとに発話区間をグルーピングした単位を指す。トピックセットはグラフィック化する際の単位である。トピックセットデータは、トピックセットの情報であり、グループ化された文書構造化済み発話テキスト＋感情情報のセットを含む。

　ステップＳ４（トピックセットデータ取捨選択処理）において、情報処理装置は、トピックセットデータＰ３の中から、あらかじめユーザ等により入力された出力方向づけ設定情報ＩＮ３に基づいて、可視化対象とすべきトピックセットデータＰ４を抽出する。出力方向づけ設定情報は、上述したように対立項目（例えば感情重視か論理重視か）の度合いを表す情報である。情報処理装置は、出力方向づけ設定情報をもとに重要度を算出することによってトピックセットデータの取捨選択処理を行うことができる。

　ステップＳ５（グラフィック化処理）において、情報処理装置は、可視化対象のトピックセットデータＰ４を受け取り、出力方向づけ設定情報ＩＮ３に基づいて適したテンプレートまたはイラストＩＮ４を読み込むことにより、トピックセットデータＰ４をグラフィック化し、グラフィック化済みトピックセットデータＰ５を出力する。情報処理装置は、やはり出力方向づけ設定情報をもとに重要度を算出することによって、トピックセットデータ内の重要度に応じた強調表示を伴うグラフィック化処理を行うことができる。

　ステップＳ６（全体レイアウト処理）において、情報処理装置は、出力方向づけ設定情報ＩＮ３に基づいて、グラフィック化済みトピックセットデータＰ５の配置を決定し、最終的な結果としてグラフィックレコーディングデータＧＲを出力する。情報処理装置は、やはり出力方向づけ設定情報をもとに重要度を算出することによって、グラフィック化済みトピックセットデータ間の重要度に応じた配置を決定することができる。

　出力方向づけ設定情報ＩＮ３は、自動グラフィックレコーディングを行うたびにユーザ等により任意に設定され得る。ここでは、出力方向づけ設定情報ＩＮ３によって指定される方向づけによって以下の３つが影響を受けると考えられる。

　［影響を受ける処理１．可視化対象とする内容の取捨選択］
　例えば、感情重視の場合、盛り上がりや共感度が上がったなど、参加者の感情が動かされた区間を重視して可視化対象が選択される。論理重視の場合、文書構成的に重要とされた区間を重視して可視化対象が選択される。

　図２Ａおよび図２Ｂは、指定された方向づけに応じた可視化対象区間の選択イメージを示す。ここでは、方向づけにかかわらず、会議開始時の区間は重要なものとして取り扱われるものとする。

　図２Ａは、感情重視の場合の区間選択イメージを示す。縦軸は感情変化度合いを示し、横軸は時間を表す。時間軸に直交する縦方向の線は、文書構造に基づく発話的な区切りを表す。横方向の破線は、可視化対象を抽出するために設けられたしきい値を表す。この例では、しきい値よりも大きい感情変化の度合いを示す区間が可視化対象として選択される。

　図２Ｂは、論理重視の場合の区間選択イメージを示す。横方向の破線は、やはり可視化対象を抽出するために設けられたしきい値であるが、図２Ａのしきい値よりも高い値が設定されている。この例では、論理構成的な重要度が高い区間に加え、感情変化がしきい値を超える区間も可視化対象として選択される。

　［影響を受ける処理２．可視化対象となった内容のグラフィック表現］
　例えば、感情重視の場合、人物の表情や動作による喜怒哀楽に沿って、絵の配置や強調表現がなされる。論理重視の場合、文書構造や内容の関係性に沿って、絵の配置や強調表現がなされる。

　図３は、指定された方向づけに応じたグラフィック表現の例を示す。ＵＣ１１は、可視化対象となった発話内容を示し、この例では「ＩＣカードは“ＩＣ”と“カード”という既存のものの組み合わせですが、手軽に本人認証ができるという効果と、その組み合わせの発明が当時はなかったため、組み合わせは容易ではないとして進歩性が認められました。」というテキスト情報を含む。Ｒ１１は、ＵＣ１１に基づく感情重視の場合のグラフィック表現の一例を示し、発話者の感情の変化に応じた強調表現（例えば、人のイラストや吹き出し）がなされている。またＲ１１では、感情情報と対応していた部分の文言（この例では、語尾を強めて発話されたことに対応して「進歩性が認められました！」という文言）がテキスト情報から抽出され、吹出しの中に示されている。一方、Ｒ１２は、ＵＣ１１に基づく論理重視の場合のグラフィック表現の一例を示し、発話内容の論理構成を反映した強調表現（例えば、吹き出し）がなされている。Ｒ１２ではさらに、文章の論理構造に基づいて「手軽に本人認証できる効果」という文言がテキスト情報から抽出され、吹き出しの中に示されている。

　［影響を受ける処理３．全体的なレイアウト］
　例えば、感情重視の場合、感情の盛り上がりが大きかったところが他と比べて表示的な差異が現れるように配置される。表示的な差異の例として、占める面積の大きさ、太字、下線、マーカー、ハイライト、色、漫画的な強調表現などが挙げられる。論理重視の場合、文書構造に基づいて整理されて配置される。

　図４は、指定された方向づけに応じた全体的なレイアウトの一例を示す。ＬＳ１は、可視化対象であるトピックセットデータ間の論理構成を表す。この例では、論理構成は、大項目Ａ，Ｂ，Ｃを含み、項目Ａは中項目Ａ１，Ａ２を含み、項目Ｂは中項目Ｂ１を含む。中項目Ａ１はさらに小項目Ａ１１，Ａ１２を含む。またここでは項目Ａ１１およびＡ２において発話者の感情変化が相対的に大きいと判定されている。Ｌ１１は、ＬＳ１に基づく感情重視の場合のレイアウトの一例を示す。Ｌ１２は、ＬＳ１に基づく論理重視の場合のレイアウトの一例を示す。Ｌ１１は、感情変化が大きい項目（Ａ１１，Ａ２）を強調する配置を有するのに対し、Ｌ１２は、論理構成に基づいた配置を有する。

　このように、一実施形態に係る情報処理装置では、方向づけを設定することによって、会議や記録の目的に合わせてまとめ方や表現を調整したグラフィックレコーディングを自動的に作成することができる。

　（２）構成
　図５は、この発明の一実施形態に係る情報処理装置の一例としての自動グラフィックレコーディング装置１０の機能構成を示すブロック図である。自動グラフィックレコーディング装置１０は、発話者の発話活動に関わる活動情報の入力に対し、グラフィック表現を含む視覚的情報を出力するもので、専用のコンピュータとして、またはパーソナルコンピュータなどの汎用のコンピュータに専用のアプリケーションソフトウェアをインストールしたものとして構成され得る。

　自動グラフィックレコーディング装置１０は、マイクロフォン（マイク）１０１、カメラ１０２、音声認識部１０３、感情推定部１０４、文書構造解析部１０５、発話グルーピング処理部１０６、トピックセットデータ取捨選択処理部１０７、グラフィック化処理部１０８、全体レイアウト処理部１０９、出力方向づけ設定情報記憶部１１０、データベース１１１、およびディスプレイ１１２を備える。

　マイク１０１は、発話者の発話音声を含む音を収集し、音声データに変換して出力する機能を有する。

　カメラ１０２は、発話者を撮像した映像データを出力する機能を有する。映像データは音声データを含み得る。

　音声認識部１０３は、音声データに基づき、音声認識技術により発話テキストを抽出し、テキストデータを生成する機能を有する。

　感情推定部１０４は、音声データおよび／または映像データに基づき、盛り上がり度や共感度を表す感情情報を算出し出力する機能を有する。

　文書構造解析部１０５は、音声データから抽出された発話テキストに基づき、文書構造の解析を行い、文書構造解析済みの発話テキスト情報を出力する機能を有する。

　発話グルーピング処理部１０６は、文書構造解析済みの発話テキスト情報に基づき、発話区間を特定し、発話区間をグルーピングし、トピックセットデータを出力する機能を有する。発話グルーピング処理部１０６は、文書構造的関連性のみに基づいて発話区間をグルーピングすることができる。発話グルーピング処理部１０６はさらに、出力方向づけ設定情報に応じて、感情情報に基づいて発話区間をグルーピングすることもできる。

　トピックセットデータ取捨選択処理部１０７は、トピックセットデータの中から可視化すべきトピックセットデータを抽出する機能を有する。トピックセットデータ取捨選択処理部１０７は、文書構造的関連性のみに基づいて重要度の高い発話区間を特定し、可視化対象のトピックセットデータとして抽出することができる。トピックセットデータ取捨選択処理部１０７は、感情情報に基づいて感情的重要度の高い発話区間を特定し、可視化対象のトピックセットデータとして抽出することもできる。トピックセットデータ取捨選択処理部１０７はさらに、出力方向づけ設定情報に応じて、感情的重要度または論理構成的重要度の高い発話区間を選択的に特定することによって可視化対象のトピックセットデータを抽出することもできる。

　グラフィック化処理部１０８は、可視化対象のトピックセットデータをグラフィック化する機能を有する。グラフィック化処理部１０８は、トピックセットデータに含まれるテキスト情報に基づき、テンプレートを選択し、テンプレートに語句を当て込む処理を行う。ここで、グラフィック化処理部１０８は、テキスト情報に含まれる語、句、節または文に対し、出力方向づけ設置情報に基づく重要度に応じた強調表現を適用することができる。グラフィック化処理部１０８は、テンプレート選択部１０８１と、語句抽出・当て込み部１０８２とを含み得る。

　テンプレート選択部１０８１は、可視化対象のトピックセットデータのテキスト情報に基づき、テンプレートの選択を行う機能を有する。テンプレート選択部１０８１は出力方向づけ設定情報に基づいてテンプレートを選択することができる。

　語句抽出・当て込み部１０８２は、発話テキストから語句を抽出し、選択されたテンプレートに当て込む処理を行う。語句抽出・当て込み部１０８２は出力方向づけ設定情報に基づいて語句抽出および当て込み処理を行うことができる。

　全体レイアウト処理部１０９は、グラフィック化されたトピックセットデータを配置し、グラフィックレコーディングデータを最終的な結果として出力する機能を有する。全体レイアウト処理部１０９は、出力方向づけ設定情報に基づいて全体レイアウトを決定することができる。

　出力方向づけ設定情報記憶部１１０は、ユーザ等によりあらかじめ入力された出力方向づけ設定情報を記憶する機能を有する。

　データベース１１１は、上述したしきい値、画像、およびテンプレートを含む、処理に必要な種々のデータを記憶する。

　ディスプレイ１１２は、最終的なグラフィックレコーディング結果を表示する機能を有する。ディスプレイ１１２は、例えば、液晶ディスプレイまたは有機ＥＬ（Electro-Luminescence）ディスプレイであり得る。

　マイク１０１、カメラ１０２およびディスプレイ１１２は、必ずしも自動グラフィックレコーディング装置１０と一体的に構成される必要はなく、別体のデバイスが利用されてもよい。カメラ１０２がマイクとカメラの両方の機能を兼ねるようにしてもよい。また、音声認識部１０３、感情推定部１０４、および文書構造解析部１０５の各機能は、必ずしも自動グラフィックレコーディング装置１０内で実現される必要はなく、ネットワークを介して提供されるクラウドサービス等を利用してもよい。例えば、自動グラフィックレコーディング装置１０は、マイク１０１により収集された音声データを、インターネット等を介して外部の音声認識サーバに送信し、当該音声認識サーバからテキストに変換されたデータを受信することによって、後続の処理に用いるようにしてもよい。

　（３）動作
　次に、以上のように構成された一実施形態に係る自動グラフィックレコーディング装置１０の動作について説明する。　
　図６～図１８は、処理手順の一例を示すフローチャートである。以下では、主に自動グラフィックレコーディング装置１０が会議において会議参加者の発話の内容を記録するために用いられる状況を想定して説明する。

　（３－１）概要
　図６は、自動グラフィックレコーディング装置１０による処理全体の流れを示す。　
　ステップＳ１０１において、自動グラフィックレコーディング装置１０は、マイク１０１により発話者の音声データを収集し、音声認識部１０３により音声データから音声認識を行ってテキスト情報を抽出する。自動グラフィックレコーディング装置１０はまた、カメラ１０２により映像データを収集する。自動グラフィックレコーディング装置１０は、カメラ１０２に加えて、またはカメラ１０２の代わりに、動きセンサ、温度センサ、生体センサ等の種々のセンサの入力を受け付けることもできる。収集された音声データ、映像データおよび他のセンシングデータは、発話者の発話活動に関わる活動情報として後続の処理に用いられる。

　ステップＳ１０２において、文書構造解析部１０５が、テキスト情報に基づいて文書構造の解析処理を行い、文書構造解析済みの発話テキスト情報を出力する。音声データからの文書構造解析済み発話テキストの生成は、任意の従来技術（例えば、SpeechToText、または他の自然文解析技術）を用いて行われてよい。なお、ここでは文書構造解析結果は、一般的な自然文解析技術から出力される文書構造および各語への品詞情報を扱うものとする。

　ステップＳ１０３において、感情推定部１０４が、活動情報から感情情報を抽出する（処理の詳細は後述する）。映像を用いる場合、表情やしぐさの検出により、喜怒哀楽等の感情を細かく推定することができる。音声データまたは専用の呼気マイクで収集した呼気の情報から（例えばパワースペクトルを求めることにより）、興奮度を推定してもよい。ほかにも、脈拍変化、発汗変化、体温変化等の生体情報を用いてもよい。これにより、音声や映像だけでは捉えづらい感情の細やかな動きを推測することができる。一方で、感情推定に音声だけを用いる場合、安価に実現することができる。

　ステップＳ１０４において、発話グルーピング処理部１０６が、文書構造解析済みの発話テキストに基づいて、発話区間を特定し、発話区間をグルーピングして、トピックセットデータを出力する（処理の詳細は後述する）。トピックセットデータは、グループ化された文書構造解析済みの発話テキストと感情情報とを含む。

　ステップＳ１０５において、トピックセットデータ取捨選択処理部１０７が、トピックセットデータの中から、出力方向づけ設定情報をもとに、可視化対象とすべきトピックセットデータを抽出する（処理の詳細は後述する）。

　ここで、一定の時間に収集された活動情報から、常に可視化項目が抽出されるわけではない。そこでステップＳ１０６において、自動グラフィックレコーディング装置１０は、処理の対象とした活動情報から可視化項目が抽出されたか否かを判定し、抽出された場合（ＹＥＳ）、ステップＳ１０７に進み、抽出されない場合（ＮＯ）、ステップＳ１０９に進む。

　ステップＳ１０７において、グラフィック化処理部１０８が、可視化対象のトピックセットデータをグラフィック化する（処理の詳細は後述する）。

　ステップＳ１０８において、全体レイアウト処理部１０９が、グラフィック化されたトピックセットデータの全体レイアウト処理を行う（処理の詳細は後述する）。

　ステップＳ１０９において、自動グラフィックレコーディング装置１０は、会議が終了したか否かを判定し、会議が終了した場合（ＹＥＳ）、処理を終了する。一方、ステップＳ１０９で、会議が終了していない場合（ＮＯ）、処理は再びステップＳ１０１に戻り、引き続き音声認識および各種センシングを実行する。

　以上の処理は、会議進行中に音声等を収集することにより、リアルタイムで実行されてもよいし、または例えば一定時間ごとの処理として準リアルタイムで実行されてもよいし、あるいは会議中に収集され蓄積された音声データ等を、例えば会議後に任意の時間長またはデータ量に分割することによって実行されてもよい。

　（３－２）感情情報の出力
　図６のステップＳ１０３に関して説明した感情情報の出力についてさらに説明する。　
　感情推定部１０４は、映像や音声から感情情報を定量化し、出力する。感情推定部１０４は、従来技術を利用してこの処理を行うことができる。上述したように、音声データのみから、例えば音圧情報に基づいて感情の盛り上がりを検出してもよいし、映像データから、例えば表情の変化や体の動きの変化に基づいて盛り上がりを検出してもよい。また映像以外に、例えば入力情報に視線情報も加えて、共感情報を定量化することも考えられる（例えば、日本国特許第５４３７２９７号参照）。またさらに呼吸運動に係る情報に基づいて盛り上がりを定量化することも可能である（例えば、日本国特開２０１９－２８４８５号参照）。ここではこのような盛り上がり度および共感度をそれぞれ感情情報と呼ぶ。

　感情の変化度合い（Ｍ）は、感情情報に基づいて算出される値であり、例えば以下の式によって算出される。

ここで、ＨＵＰは、（正規化した）盛り上がり度［０≦ＨＵＰ≦１］を表し、ＥＭＴは、（正規化した）共感度［０≦ＥＭＴ≦１］を表す。

　図１９は、以上のように算出される感情の変化度合い（Ｍ）、ＨＵＰ、ＥＭＴの関係を示す略図である。なお、これらは一例にすぎず、他の算出方法が用いられてもよい。

　（３－３）発話グルーピング処理
　次いで図６のステップＳ１０４において説明した発話グルーピング処理部１０６による発話グルーピング処理についてさらに説明する。

　図２０は、発話グルーピング処理のイメージを示す。横軸は時刻、縦軸は感情変化の度合いを表す。まず、発話グルーピング処理部１０６は、文書構造解析済み発話テキストに沿って、句点を区切りとして、発話テキストを発話区間として分ける。縦の破線は発話的な区切りを表す。

　次に発話グルーピング処理部１０６は、以下の２つの条件のどちらかに当てはまれば、分けた発話区間を同一内容の発話とみなし、発話区間を連結する。
　　（条件１Ａ）感情変化が大きく、文書構造的にも関連しあっている区間
　　（条件１Ｂ）開始タイミングや文書構造的に主張ポイントなど会議上重要と思われる区間

　図２０において、Ｇ１１は、会議の開始区間にあたり、重要と判定された区間である。Ｇ１２は、感情変化が大きく、しかも文書構造的に関連しあっていると判定された区間である。Ｇ１３は、感情変化は大きくないが、文書構造的に主張ポイントであると判定された区間である。

　発話グルーピング処理部１０６は、以上のようにグルーピングした区間に対し、対応する発話内容を含む感情情報を付加し、トピックセットデータとしてメモリ上に記憶する。

　図７は、発話グルーピング処理部１０６による発話グルーピング処理の詳細なフローの一例を示す。　
　まずステップＳ４０１において、発話グルーピング処理部１０６は、発話テキストを発話区切りごとに分ける。

　ステップＳ４０２において、発話グルーピング処理部１０６は、グルーピング判定していない発話区切りが存在するか否かを判定する。グルーピング判定していない発話区切りが存在しない場合（ＮＯ）、処理は終了し、存在する場合（ＹＥＳ）、ステップＳ４０３に進む。

　ステップＳ４０３において、発話グルーピング処理部１０６は、発話区切りと同一時間区間の感情情報を付与してトピックデータを生成する。

　ステップＳ４０４において、発話グルーピング処理部１０６は、ある特定の発話区切りが１つ前の発話区切りと論理構成的に繋がりがあるか否かを判定する。論理的繋がりがない場合（ＮＯ）、ステップＳ４０５に進み、論理的繋がりがある場合（ＹＥＳ）、ステップＳ４０６に進む。

　ステップＳ４０５において、発話グルーピング処理部１０６は、上記特定の発話区切りが上記１つ前の発話区切りと同一の感情情報で、かつ感情変化度合いがしきい値を超えているか否かを判定する。しきい値を超えている場合（ＹＥＳ）、ステップＳ４０６に進み、しきい値を超えていない場合（ＮＯ）ステップＳ４０７に進む。

　ステップＳ４０６では、発話グルーピング処理部１０６は、上記特定の発話区切りを１つ前の発話グループのトピックデータにマージする。その後、処理は再びステップＳ４０２に戻り、まだグルーピング判定していない発話区切りが存在するか否かの判定を行う。

　一方、ステップＳ４０７では、発話グルーピング処理部１０６は、上記特定の発話区切りを新たな発話グループと決定し、やはりステップＳ４０２に戻る。

　このように、発話グルーピング処理は、発話的な区切りだけでなく、盛り上がった、共感があがったなどの感情変化と、文書構造的な繋がりをもとにして発話区間をグループにまとめ、そこに感情情報を付加し、トピックセットデータとして出力する。

　（３－４）トピックセットデータ取捨選択処理
　図６のステップＳ１０５に関して説明したトピックセットデータ取捨選択処理部１０７によるトピックセットデータ取捨選択処理についてさらに説明する。トピックセットデータ取捨選択処理部１０７は、トピックセットデータの中から可視化すべきトピックセットデータを抽出する。抽出されるトピックセットデータは出力方向づけ設定情報によって変化する。

　トピックセットデータ取捨選択処理部１０７は、以下の３つの条件のいずれかに当てはまったトピックセットを抽出する。
　　（条件２Ａ）最初のトピックセットデータであること：会議開始時の区間には議題等重要な情報が含まれている可能性が高いため、最初のトピックセットデータを可視化対象として抽出するものである。

　　（条件２Ｂ）感情変化度合いがしきい値を超えるものが含まれていること：感情変化が起きた発話には主張や聴衆の心を動かす情報が含まれている可能性が高いため、感情変化度合いがしきい値を超える感情情報が含まれているトピックセットデータを可視化対象として抽出するものである。ここで、抽出するしきい値は出力方向づけ設定情報によって補正される。感情重視であればしきい値は小さく（判定が緩く）なり、論理重視であればしきい値は大きく（判定が厳しく）なる。例えば、感情変化の基準しきい値が０．５であり、出力方向づけ設定情報が感情寄り（α＝０．７５）であった場合、感情変化しきい値は、感情変化の基準しきい値／出力方向づけ設定情報＝０．５／０．７５≒０．６７となる。なお、感情変化度合いは０から１の範囲の値になるよう正規化されている。

　　（条件２Ｃ）論理構成的な重要度がしきい値を超えるものが含まれていること：論理構成的に重要な発話には主張や説明などの情報が含まれている可能性が高いため、論理構成的な重要度がしきい値を超える感情情報が含まれているトピックセットデータを可視化対象として抽出するものである。抽出するしきい値は出力方向づけ設定情報によって補正される。感情重視であればしきい値は大きく（判定が厳しく）なり、論理重視であれば小さく（判定が緩く）なる。例えば、論理構成的な重要度の基準しきい値が０．１であり、出力方向づけ設定情報が感情寄り（α＝０．７５）であった場合、論理構成的な重要度のしきい値は、論理構成的な重要度の基準しきい値／（１－出力方向づけ設定情報）＝０．４となる。なお、論理構成的な重要度は既存技術を使って算出することができる。また論理構成的な重要度は、その範囲が０から１になるよう正規化を行っているものとする。

　図２１は、トピックセットデータ取捨選択処理のイメージを示す図である。横軸は時刻、縦軸は感情変化度合いを表す。横方向の破線は感情変化しきい値を表す。上述したように、感情変化しきい値は、出力方向づけ設定情報によって上下する。

　図２１において、網掛けの区間は、可視化対象区間と判定された区間である。ＴＩ１１は、最初のトピックデータであることから可視化対象と判定された。ＴＩ１２およびＴＩ１３は、しきい値以上の感情変化を含むことから可視化対象と判定された。ＴＩ１４は、論理構成的な重要度がしきい値以上であることから可視化対象と判定された。

　ここで、可視化対象とするか否かの判定に、感情情報だけでなく論理構成の重視という判定要素を加えることによって、感情情報だけを用いる場合にくらべて、内容的に重要なポイントが適切に抽出されるという効果がある。また、感情情報を重視するか論理構成を重視するかをその比率も含めて選択できるようにすることによって、記録対象が情報共有したい場面（論理重視）であるか、ブレインストーミングの場面（感情重視）であるかなど、目的に合わせて出力形態を変えることができるというメリットもある。

　なお、ここでは感情情報および論理情報に基づく処理の例を説明するが、入力された活動情報から得られる情報を用いるものであればこれに限定されるものではなく、例えば感情だけに基づいてもよいし、論理だけに基づいてもよい。追加的にまたは代替的に、入力音声の大きさなどに基づいて可視化対象が決定されてもよい。取捨選択処理に限らず、他の処理についても同様である。

　図８は、トピックセットデータ取捨選択処理部１０７によるトピックセットデータ取捨選択処理の詳細なフローの一例を示す。　
　まずステップＳ５０１において、トピックセットデータ取捨選択処理部１０７は、方向づけ設定情報に基づいて感情変化しきい値および論理構成的な重要度を算出する。

　ステップＳ５０２において、トピックセットデータ取捨選択処理部１０７は、取捨選択していないトピックセットデータが存在するか否かの判定を行う。存在する場合（ＹＥＳ）、ステップＳ５０３に進み、存在しない場合（ＮＯ）、処理を終了する。

　ステップＳ５０３において、トピックセットデータ取捨選択処理部１０７は、タイムスタンプが会議の開始であるか否かを判定する。タイムスタンプが会議の開始である場合（ＹＥＳ）、ステップＳ５０６に進み、当該トピックセットデータを可視化対象と判定する。タイムスタンプが会議の開始でない場合（ＮＯ）、ステップＳ５０４に進む。

　ステップＳ５０４において、トピックセットデータ取捨選択処理部１０７は、感情変化度合いがしきい値を超えている感情情報があるか否かを判定する。感情変化度合いがしきい値を超えている感情情報がある場合（ＹＥＳ）、ステップＳ５０６に進み、当該トピックセットデータを可視化対象と判定する。感情変化度合いがしきい値を超えている感情情報がない場合（ＮＯ）、ステップＳ５０５に進む。

　ステップＳ５０５において、トピックセットデータ取捨選択処理部１０７は、論理的構造的な重要度がしきい値を超えている発話データがあるか否かを判定する。論理的構造的な重要度がしきい値を超えている発話データがある場合（ＹＥＳ）、ステップＳ５０６に進み、当該トピックセットデータを可視化対象と判定する。その後、処理は再びステップＳ５０２に戻り、まだ取捨選択していないトピックセットデータがあるか否かを判定する。

　一方、ステップＳ５０５において、論理的構造的な重要度がしきい値を超えている発話データがない場合（ＮＯ）、ステップＳ５０７に進み、当該トピックセットデータは可視化対象ではないと判定する。その後、処理は再びステップＳ５０２に戻る。

　（３－５）グラフィック化処理
　図６のステップＳ１０７に関して説明したグラフィック化処理部１０８によるグラフィック化処理についてさらに説明する。グラフィック化処理部１０８は、可視化対象として抽出されたトピックセットデータを、発話テキストの内容、文書構造、または感情情報をもとに画像に変換する処理を行う。変換により生成される画像は、やはり出力方向づけ設定情報によって変化する。画像変換は、テンプレート選択と、語句抽出・当て込みの２工程に分かれる。以下、便宜上、グラフィック化処理部１０８のテンプレート選択部１０８１がテンプレート選択処理を、グラフィック化処理部１０８の語句抽出・当て込み処理部１０８２が語句抽出・当て込み処理をそれぞれ実施するものとして説明するが、これに限られるものではない。

　図９は、グラフィック化処理部１０８によるグラフィック化処理全体のフローの一例を示す。　
　まずステップＳ７０１において、グラフィック化処理部１０８は、グラフィック化処理をしていない可視化対象トピックセットデータが存在するか否かの判定を行う。存在する場合（ＹＥＳ）、ステップＳ７０２に進み、存在しない場合（ＮＯ）、処理は終了する。

　ステップＳ７０２において、テンプレート選択部１０８１は、出力方向づけ設定情報の値αが０．５より小さいか否かを判定する。αが０．５以上の場合（ＮＯ）、ステップＳ７０３に進み、αが０．５より小さい場合（ＹＥＳ）、ステップＳ７１１に進む。

　ステップＳ７０３において、テンプレート選択部１０８１は、出力方向づけ設定情報の値αが０．５より大きいか否かを判定する。αが０．５より大きい場合（ＹＥＳ）、ステップＳ７０７に進み、αが０．５に等しい場合（ＮＯ）、ステップＳ７０４に進む。αが０．５より大きい場合、出力方向づけ設定情報が感情重視または感情寄りであることを意味する。αが０．５に等しい場合、出力方向づけ設定情報がニュートラルであることを意味する。

　αが０．５に等しい場合、まずステップＳ７０４において、テンプレート選択部１０８１が論理系テンプレート選択処理を行う。次いでステップＳ７０５において、テンプレート選択部１０８１が感情系テンプレート選択処理を行う。そしてステップＳ７０６において、語句抽出・当て込み処理部１０８２がニュートラルの当て込み処理を行う。その後、処理は再びステップＳ７０１に戻る。

　一方、αが０．５より大きい場合、まずステップＳ７０７において、テンプレート選択部１０８１が感情系テンプレート選択処理を行う。次いで、ステップＳ７０８において、語句抽出・当て込み処理部１０８２が出力方向づけ設定情報の値αが１であるか否かを判定する。αが１でない場合（ＮＯ）、ステップＳ７０９に進み、語句抽出・当て込み処理部１０８２が、感情寄りの語句抽出・当て込み処理を行う。αが１である場合（ＹＥＳ）、ステップＳ７１０に進み、語句抽出・当て込み処理部１０８２が、感情重視の語句抽出・当て込み処理を行う。その後、処理は再びステップＳ７０１に戻る。

　また一方、ステップＳ７０２において出力方向づけ設定情報の値αが０．５より小さいと判定された場合、出力方向づけ設定情報が論理重視または論理寄りであることを意味する。この場合、まずステップＳ７１１においてテンプレート選択部１０８１が論理系テンプレート選択処理を行う。次いでステップＳ７１２において、語句抽出・当て込み処理部１０８２が出力方向づけ設定情報の値αが０であるか否かを判定する。αが０でない場合（ＮＯ）、ステップＳ７１３に進み、語句抽出・当て込み処理部１０８２が、論理寄りの語句抽出・当て込み処理を行う。αが０である場合（ＹＥＳ）、ステップＳ７１４に進み、語句抽出・当て込み処理部１０８２が、論理重視の語句抽出・当て込み処理を行う。その後、処理は再びステップＳ７０１に戻る。

　上記のように、グラフィック化処理部１０８は、出力方向づけ設定情報に基づいて、可視化対象となったトピックセットデータをグラフィック化する。グラフィック化処理は、「強調して出力」または「強調表現を伴って出力」と言い換えることもできる。すなわち、一実施形態に係る自動グラフィックレコーディング装置１０は、人間（発話者または参加者）の活動情報の入力を受け付けると、感情の表出や変化をもとに発話内容を分析し、その感情の変化の程度によって強調出力するという一面を有する。また一方、自動グラフィックレコーディング装置１０は、出力にあたってどこまで感情（または論理）を反映させるかを設定できるという一面も有する。

　（３－５－１）テンプレート選択処理
　次に図９で言及したテンプレート選択処理についてさらに詳細に説明する。　
　感情と論理の対立項目に対する方向づけをあらかじめ設定する場合、テンプレート選択処理には、感情系テンプレート選択処理（図９のステップＳ７０５およびＳ７０７）と、論理系テンプレート選択処理（図９のステップＳ７０４およびＳ７１１）が含まれる。いずれの場合にも、テンプレート選択部１０８１は、抽出された可視化対象区間の音声内容をもとに、適切なグラフィックレコーディング的な絵のテンプレートを選択する。

　ここで、論理重視または論理寄り（出力方向づけ設定情報０≦α＜０．５）の場合、テンプレート選択部１０８１は、文書構造解析済み発話テキストをもとに、あらかじめ蓄積されたテンプレートのメタデータとマッチングをかけて適するテンプレートを選択する。感情重視または感情寄り（出力方向づけ設定情報０．５＜α≦１）の場合、テンプレート選択部１０８１は、感情情報をもとにあらかじめ蓄積されたテンプレートのメタデータとマッチングをかけて適するテンプレートを選択する（マッチングアルゴリズムの例については後述する）。なお、トピックセットデータ内に感情情報がない場合、テンプレート選択部１０８１は、論理寄りの方法でテンプレートを選択することができる。出力方向づけ設定情報の値α＝０．５（ニュートラル）の場合、論理寄りの方法と感情寄りの方法でそれぞれテンプレートを選択する。

　図２２は、テンプレート選択処理のイメージを示す。この例では、発話内容ＵＣ１２は、ある発話者の発話に係るテキスト情報「特許案についての説明です。」「発話内容可視化と自動グラレコ（グラフィックレコーディング）について相談させてください。」を含む。このＵＣ１２に対し、テンプレート選択部１０８１は、あらかじめデータベース１１１に記憶されたテンプレート群ＴＰの中から、最も合致するテンプレートを探す。

　図２３は、論理系テンプレートの一例を示す。図２３では、「説明開始」、「目的へ推進」、「二者対立」、「三者対立」、「フロー（横）」、「フロー（縦）」、「サイクル」、「組み合わせ（縦）」の８種類のテンプレートが例示されている。言うまでもなく、より多くの数の、多種多様なテンプレートが用いられてよい。

　図２４は、感情系テンプレートの一例を示す。図２４では、「喜び（右向き）」、「強調（右向き）」、「怒り（右向き）」、「驚き（右向き）」、「悲しみ（右向き）」、「感謝（右向き）」、「安らぎ（右向き）」、「困惑（右向き）」の８種類のテンプレートが例示される。やはり、より多くの数の、多種多様なテンプレートが用いられてよい。

　（３－５－１－１）マッチングアルゴリズム例
　続いて、テンプレート選択部１０８１によって用いられるマッチングアルゴリズムについて説明する。各テンプレートにはキーワードが紐付けられている。テンプレート選択部１０８１は、トピックセットデータに含まれる発言の内容または感情情報とキーワードとの類似度を計算し、一番近いテンプレートを選択する。

　出力方向づけ設定情報が論理寄りの場合、テンプレート選択部１０８１は、例えばｔｆ－ｉｄｆ（Term Frequency-Inverse Document Frequency）によってベクトル化した文書同士のコサイン類似度を用いて、類似度を算出する。

　図２５は、論理系テンプレートデータの一例を示す。上述したように、各テンプレートは、あらかじめ設定されたキーワードを含む。例えば、Ｎｏ．１の論理系テンプレート（名称：説明開始）には、「説明、開始、始める、紹介・・・」というキーワードが紐づけられる。

　出力方向づけ設定情報が感情寄りの場合、テンプレート選択部１０８１は、トピックセットデータ内に含まれるすべての感情情報を平均した感情ベクトルを導出し、そのベクトルとテンプレートの名前をもとに作成した感情ベクトルとのコサイン類似度で算出する。ここで、感情ベクトルは、扱う感情の値をベクトル要素にとった、ｎ次元のベクトルをいう。

　図２６は、感情系テンプレートデータの一例を示す。各テンプレートは、感情の値を要素とする感情ベクトルを含む。例えば、Ｎｏ．１の感情系テンプレート（名称：喜び（右向き））の感情ベクトルは、（喜：怒：哀：安：強：驚：感：困：盛：共・・・）＝（１：０：０：０：０：０：０：０：０：０・・・）と表される。

　類似度が同値の場合、レイアウトルール（後述）にしたがって、より適切な方（例えば、兄弟関係が縦方向に並列していたら、横方向の絵を選ぶなど）が選択される。

　図２７は、論理重視または論理よりの場合のマッチングアルゴリズムの概要を示す。この例では、発話内容ＵＣ１３は、「ＩＣカードは“ＩＣ”と“カード”という既存のものの組み合わせですが、手軽に本人認証ができるという効果と、その組み合わせの発明が当時はなかったため、組み合わせは容易ではないとして進歩性が認められました。」というテキスト情報を含む。ここで、論理系テンプレートデータＴＤとのマッチングにより、Ｎｏ．８の「組み合わせ（縦）」のテンプレートに最も類似すると判定された。これにより、Ｎｏ．８のテンプレートに対応するテンプレート画像ＴＰ１１がその後の処理に用いられる。

　（３－５－１－２）論理系テンプレート選択処理
　図１０は、図９のステップＳ７０４およびＳ７１１に示したテンプレート選択部１０８１による論理系テンプレート選択処理の詳細なフローの一例を示す。　
　まずステップＳ７００１において、テンプレート選択部１０８１は、発話テキストと論理系テンプレートのキーワードの文書ベクトルを作成する。

　次いでステップＳ７００２において、テンプレート選択部１０８１は、類似度を計算していない論理系テンプレートの存在の有無を判定する。存在する場合（ＹＥＳ）、ステップＳ７００３に進み、存在しない場合（ＮＯ）、ステップＳ７００４に進む。

　ステップＳ７００３において、テンプレート選択部１０８１は、論理系テンプレートから１つ選び、発話テキストとの文書ベクトル類似度を算出し、再びステップＳ７００２に戻る。

　ステップＳ７００４において、テンプレート選択部１０８１は、最も類似度が高いテンプレートをグラフィック化対象のテンプレートに決定し、処理を終了する。

　（３－５－１－３）感情系テンプレート選択処理
　図１１は、図９のステップＳ７０５およびＳ７０７に示したテンプレート選択部１０８１による感情系テンプレート選択処理の詳細なフローの一例を示す。　
　まずステップＳ７１０１において、テンプレート選択部１０８１は、感情情報と感情系テンプレートの感情語のベクトルを作成する。

　次いでステップＳ７１０２において、テンプレート選択部１０８１は、類似度を計算していない感情系テンプレートの存在の有無を判定する。存在する場合（ＹＥＳ）、ステップＳ７１０３に進み、存在しない場合（ＮＯ）、ステップＳ７１０４に進む。

　ステップＳ７１０３において、テンプレート選択部１０８１は、感情系テンプレートから１つ選び、感情情報とのベクトル類似度を算出し、再びステップＳ７１０２に戻る。

　ステップＳ７１０４において、テンプレート選択部１０８１は、最も類似度が高いテンプレートをグラフィック化対象のテンプレートに決定し、処理を終了する。

　（３－５－２）語句抽出・当て込み処理
　次に図９で言及した語句抽出・当て込み処理についてさらに詳細に説明する。　
　感情と論理の対立項目に対する方向づけをあらかじめ設定する場合、語句抽出・当て込み処理には、論理重視の語句抽出・当て込み処理（図９のステップＳ７１４）と、感情重視の語句抽出・当て込み処理（図９のステップＳ７１０）と、論理寄りの語句抽出・当て込み処理（図９のステップＳ７１３）と、感情寄りの語句抽出・当て込み処理（図９のステップＳ７０９）と、ニュートラルの当て込み処理（図９のステップＳ７０６）とが含まれる。

　いずれの場合にも、語句抽出・当て込み部１０８２は、発話内容や感情情報をもとに適切な文言や絵を選択し、選択した文言や絵をテンプレートに当て込む処理を行う。まず、語句抽出・当て込み部１０８２は、対象区間の発話内容から、テンプレートのキーワードに関連する語句を抽出する。そして、語句抽出・当て込み部１０８２は、抽出した語句と、テンプレート上の埋め込み項目とが最も合致する組み合わせを導出する。埋め込みが行われる項目が決まった後、語句抽出・当て込み部１０８２は、「画像ｏｒ文言」となっている埋め込み項目に関しては、抽出した語句や感情と一致度が高い画像を検索する。画像検索自体は従来技術を利用することができ、インターネット上で検索してもよいし、あらかじめ登録してあるストレージやシステムから検索してもよい。語句抽出・当て込み部１０８２は、抽出した語句や画像をテンプレート上の合致する位置に埋め込み、グラフィック化済トピックセットデータとして出力する。

　図２８は、語句抽出・当て込み処理のイメージを示す。図２８では、図２７の例で使用されたのと同じ発話内容ＵＣ１３と、図２７の例で選択されたのと同じテンプレートＴＰ１１が用いられている。語句抽出・当て込み部１０８２は、これらのＵＣ１３とＴＰ１１とをもとに、適する語句を抽出し（Ｓ５１１）、語句とテンプレート上の項目との組み合わせを導出し（Ｓ５１２）（このとき画像検索も併せて実施する）、当て込み処理を行ったトピックセットＴＳ１１を出力する（Ｓ５１３）。この例では、テンプレートＴＰ１１に紐づけられた「組み合わせ」というキーワードに基づき、ＵＣ１３から「ＩＣカード」「ＩＣ」「カード」「手軽に本人認証できる効果」という語句が抽出され、ＴＳ１１に当て込まれている。

　（３－５－２－１）論理重視の語句抽出・当て込み処理
　論理重視（α＝０）の場合、語句抽出・当て込み部１０８２は、テンプレート上のキーワードと関連する語句を抽出する。ここで、語句抽出・当て込み部１０８２は、テンプレートデータのキーワードをもとに、発話内容から合致する語句を抽出する。次いで、語句抽出・当て込み部１０８２は、発話内容の文書構造解析結果から合致する語句と係る語句を関連語句として抽出する。補語の情報は補足情報（テンプレート上のセリフや補足用の情報）として抽出される。

　図２９は、論理重視（α＝０）の場合の語句抽出処理のイメージを示す。図２７、図２８と同様に、ＴＤ１１は選択されたテンプレートデータを示し、ＵＣ１３は発話内容を示す。ＤＳ１１は、ＵＣ１３に対応する論理構成における語句抽出のイメージを示し、太字は合致する語句（兼関連語句）を、斜体は関連語句を、線ＳＰＩで囲まれた部分は補足情報を表す。ＤＳ１１において、テンプレート上のキーワードと合致する語句として「組み合わせ」（太字部分）が抽出され、当該語句と関連する語句として「ＩＣカード」「進歩性」「は容易でない」「ＩＣ」「カード」「既存のもの」「発明が当時はなかった」「その」（斜体部分）が抽出され、補語の情報が補足情報（ＳＰＩ部分）として抽出されている。

　図３０は、テンプレート埋め込みデータの一例を示す。図３０の例を用いて、抽出した関連語句とテンプレート上の埋め込み項目との対応の決定処理についてさらに説明する。ここでは、テンプレートの埋め込み情報が持つ情報と、抽出した関連語句との合致度合いを算出する。

　まず、Ｎｏ．１の埋め込み項目は、適する内容が「組み合わせ元」である。そこで、語句抽出・当て込み部１０８２は、関連語句の中から組み合わせに係るものをピックアップする。組み合わせ「元」が含まれるのは２つ目のもの（組み合わせ，ＩＣ，カード，既存のもの）であるので、この関連語句の合致度合いが一番高くなる。したがって、目的語の１つ目「ＩＣ」を適する語句とする。

　Ｎｏ．２の埋め込み項目は、内容が「組み合わせ元」であるため、Ｎｏ．１と同様の合致度合いとなる。目的語の１つ目は既に選択済みであるため、２つ目「カード」を適する語句とする。

　Ｎｏ．３の埋め込み項目は、内容が「組み合わせ後」である。合致度合いはＮｏ．１とＮｏ．２と同じものとなる。抽出される語は、組み合わせ後の対象となる語句「ＩＣカード」が適する語句となる。ここでＮｏ．３には補足項目が１つあり、対象とした語句「ＩＣカード」の補語の中から１つ目（手軽に本人認証できる効果）を適する語句として選択する。

　図３１は、抽出した関連語句とテンプレート上の埋め込み項目との対応を決定する処理のイメージを示す。テンプレート上の埋め込み項目データＩＭに基づき、ＤＳ１１から語句が抽出される。

　このように語句抽出・当て込み部１０８２は、上記のように選択された語句をテンプレートに埋め込み、グラフィック化済みトピックセットを作成する。語句抽出・当て込み部１０８２は、選択した関連語句をテンプレートに埋め込む。埋め込む際に、埋め込み項目が「ヒトｏｒモノ」であれば、文言から画像に置き換える。画像検索自体は従来技術を利用することができ、インターネット上で検索してもよいし、あらかじめ登録してあるストレージやシステムから検索してもよい。

　図３２は、得られるグラフィック化済みトピックセットのイメージを示す。選択されたテンプレートＴＰ１１と、文書構造ＤＳ１２から抽出された語句に基づき、グラフィック化済みトピックセットＧＳ１１が得られる。

　図１２は、図９のステップＳ７１４に示した語句抽出・当て込み部１０８２による論理重視（α＝０）の場合の語句抽出・当て込み処理の詳細なフローの一例を示す。　
　まずステップＳ７２０１において、語句抽出・当て込み部１０８２は、テンプレートデータのキーワードと合致する語句を発話テキストから抽出する。

　ステップＳ７２０２において、語句抽出・当て込み部１０８２は、発話内容の文書構造解析結果から合致した語句と係る語句を関連語句として抽出する。補語の情報は、補足情報（テンプレート上のセリフや補足用の情報）として抽出される。

　ステップＳ７２０３において、語句抽出・当て込み部１０８２は、内容が確定していない埋め込み項目があるか否かを判定する。内容が確定していない埋め込み項目があれば（ＹＥＳ）、ステップＳ７２０４に進み、なければ（ＮＯ）、処理を終了する。

　ステップＳ７２０４において、語句抽出・当て込み部１０８２は、テンプレートの埋め込み項目データから内容が確定していない項目を選択する。

　ステップＳ７２０５において、語句抽出・当て込み部１０８２は、選択した項目との合致度をまだ算出していない、合致した語句が存在するか否かを判定する。存在する場合（ＹＥＳ）、ステップＳ７２０６に進み、存在しない場合（ＮＯ）、ステップＳ７２０８に進む。

　ステップＳ７２０６において、語句抽出・当て込み部１０８２は、まだ合致度を算出していない合致した語句を１つ選ぶ。

　ステップＳ７２０７において、語句抽出・当て込み部１０８２は、選択した項目の適する内容に合致し、かつまだ埋め込み内容として使われていない語句が、合致した語句と係る語句の中にいくつ含まれているかをカウントし、その数を合致度とする。その後、処理は再びステップＳ７２０５に戻る。

　ステップＳ７２０８において、語句抽出・当て込み部１０８２は、最も合致度が高く、まだ埋め込み項目として使われていない語句を埋め込み内容とする。

　ステップＳ７２０９において、語句抽出・当て込み部１０８２は、埋め込み項目先が「ヒトｏｒモノ」であり、合致する画像があれば画像に置き換える。その後、処理は再びステップＳ７２０３に戻る。

　（３－５－２－２）感情重視の語句抽出・当て込み処理
　感情重視（α＝１）の場合、語句抽出・当て込み部１０８２は、発話テキスト上で感情情報がある語句と関連する語句を抽出する。ここで、語句抽出・当て込み部１０８２は、感情情報をもとに、発話内容から合致する語句を抽出する。次いで、語句抽出・当て込み部１０８２は、発話内容の文書構造解析結果から合致する語句と係る語句のうち、人名や固有名詞となる語句を関連語句として抽出する。語句抽出・当て込み部１０８２はまた補足情報として、発話内容の文書構造解析結果から合致する語句を抽出する。語句抽出・当て込み部１０８２は、論理重視の場合と同様に選択された語句をテンプレートに埋め込み、グラフィック化済みトピックセットデータを作成するテンプレート上のキーワードと関連する語句を抽出する。

　図３３は、感情重視（α＝１）の場合のグラフィック化処理のイメージを示す。語句抽出・当て込み部１０８２は、発話内容ＵＣ１３と文書構造ＤＳ２１とを含むトピックセットデータに基づき、グラフィック化済みトピックセットデータＧＳ１２を作成する。ＵＣ１３およびＤＳ２１において、太字「認められた」は合致する語句（兼関連語句）を表し、斜体「ＩＣカード」は関連語句を表し、「進歩性」と「組み合わせは容易でない」は補足情報を表す。また、「ＩＣカード」は固有名詞として識別されている。

　図１３は、図９のステップＳ７１０に示した語句抽出・当て込み部１０８２による感情重視（α＝１）の場合の語句抽出・当て込み処理の詳細なフローの一例を示す。　
　まずステップＳ７３０１において、語句抽出・当て込み部１０８２は、感情情報をもとに感情情報と合致する語句を発話テキストから抽出する。

　ステップＳ７３０２において、語句抽出・当て込み部１０８２は、発話内容の文書構造解析結果から合致する語句と係る語句のうち、人名や固有名詞となる語句を関連語句として抽出する。

　ステップＳ７３０３において、語句抽出・当て込み部１０８２は、残りの係る語句を補足情報として抽出する。

　ステップＳ７３０４において、語句抽出・当て込み部１０８２は、内容が確定していない埋め込み項目があるか否かを判定する。ある場合（ＹＥＳ）、ステップＳ７３０５に進み、ない場合（ＮＯ）、処理を終了する。

　ステップＳ７３０５において、語句抽出・当て込み部１０８２は、テンプレートの埋め込み項目データから内容が確定していない項目を選択する。

　ステップＳ７３０６において、語句抽出・当て込み部１０８２は、選択した項目との合致度をまだ算出していない、合致した語句が存在するか否かを判定する。存在する場合（ＹＥＳ）、ステップＳ７３０７に進み、存在しない場合（ＮＯ）、ステップＳ７３０９に進む。

　ステップＳ７３０７において、語句抽出・当て込み部１０８２は、まだ合致度を算出していない合致した語句を１つ選ぶ。

　ステップＳ７３０８において、語句抽出・当て込み部１０８２は、選択した項目の適する内容に合致し、かつまだ埋め込み内容として使われていない語句が、合致した語句と係る語句の中にいくつ含まれているかをカウントし、その数を合致度とする。処理後、再びステップＳ７３０６に戻る。

　ステップＳ７３０９において、語句抽出・当て込み部１０８２は、最も合致度が高く、まだ埋め込み項目として使われていない語句を埋め込み内容とする。

　ステップＳ７３１０において、語句抽出・当て込み部１０８２は、埋め込み項目先が「ヒトｏｒモノ」であり、合致する画像があれば画像に置き換える。

　語句抽出・当て込み部１０８２は、論理重視の場合と同様に、選択された語句をテンプレートに埋め込み、グラフィック化済みトピックセットデータを作成する。

　（３－５－２－３）論理寄りの語句抽出・当て込み処理
　論理寄り（０＜α＜０．５）の場合、語句抽出・当て込み部１０８２は、論理重視の場合と同様に、テンプレート上のキーワードと関連する語句を抽出する。ただし、抽出する際に論理構成の感情部分に感情の割合分の重みをかける。例えばα=０．２５の場合、感情情報として語尾強調となっている「認められました」の部分と、それに係る語句に階層に応じて減衰させながら重みをつける。

　図３４は、論理寄りの場合の語句抽出処理のイメージを示す。発話内容ＵＣ１３および文書構造ＤＳ３１において、太字は合致する語句（兼関連語句）を、斜体は関連語句を、線ＳＰＩで囲まれた部分は補足情報を表す。ＤＳ３２は、感情の割合分の重みづけが行われる様子を示す。この例では、階層に応じて、語尾強調の「認められました」の部分に１．２５、それに係る語句としての「ＩＣカード」には１．１２５、「進歩性」には１．１２５、「組み合わせは容易でない」には１．０６８の重み付けがされる。

　次いで、語句抽出・当て込み部１０８２は、補足情報として選択する語句を、最も重みがかかっている語句を中心にして抽出する。この例では、最も重みがかかっている語句は「認められた」であるので、補足情報として選択する語句として「進歩性」および「組み合わせは容易でない」が抽出される。抽出した関連語句とテンプレート上の埋め込み項目との対応は、論理重視の場合と同様に実施する。

　図３５は、以上のような重みづけによって得られる出力結果ＧＳ１３を示す。重みづけに応じた語句を用いた出力結果が得られる。

　図１４は、図９のステップＳ７１３に示した語句抽出・当て込み部１０８２による論理寄り（０＜α＜０．５）の場合の語句抽出・当て込み処理の詳細なフローの一例を示す。　
　まずステップＳ７４０１において、語句抽出・当て込み部１０８２は、テンプレートのキーワードと合致する語句を発話テキストから抽出する。

　ステップＳ７４０２において、語句抽出・当て込み部１０８２は、文書構造解析結果から合致した語句と係る語句を抽出する。

　ステップＳ７４０３において、語句抽出・当て込み部１０８２は、内容が確定していない埋め込み項目があるか否かを判定し、ある場合（ＹＥＳ）、ステップＳ７４０４に進み、ない場合（ＮＯ）、処理を終了する。

　ステップＳ７４０４において、語句抽出・当て込み部１０８２は、テンプレートの埋め込み項目データから内容が確定していない項目を選択する。

　ステップＳ７４０５において、語句抽出・当て込み部１０８２は、選択した埋め込み項目の適する内容が補足情報であるか否かを判定する。補足情報でない場合（ＮＯ）、ステップＳ７４０６に進み、補足情報である場合（ＹＥＳ）、ステップＳ７４１１に進む。

　ステップＳ７４０６において、語句抽出・当て込み部１０８２は、選択した項目との合致度をまだ算出していない、合致した語句が存在するか否かを判定する。存在する場合（ＹＥＳ）、ステップＳ７４０７に進み、存在しない場合（ＮＯ）、ステップＳ７４０９に進む。

　ステップＳ７４０７において、語句抽出・当て込み部１０８２は、まだ合致度を算出していない合致した語句を１つ選ぶ。

　ステップＳ７４０８において、語句抽出・当て込み部１０８２は、選択した項目の適する内容に合致し、かつまだ埋め込み内容として使われていない語句が、合致した語句と係る語句の中にいくつ含まれているかをカウントし、その数を合致度とする。その後処理は再びステップＳ７４０６に戻る。

　ステップＳ７４０９において、語句抽出・当て込み部１０８２は、最も合致度が高く、まだ埋め込み項目として使われていない語句を埋め込み内容とする。

　ステップＳ７４１０において、語句抽出・当て込み部１０８２は、埋め込み項目先が「ヒトｏｒモノ」であり、合致する画像があれば画像に置き換える。その後処理は再びステップＳ７４０３に戻る。

　一方、ステップＳ７４０５において選択した埋め込みの適する内容が補足情報である（ＹＥＳ）場合、ステップＳ７４１１において、語句抽出・当て込み部１０８２は、さらに重みを計算していない感情情報と合致する語句があるか否かを判定する。ある場合（ＹＥＳ）、ステップＳ７４１２に進み、ない場合（ＮＯ）、ステップＳ７４１６に進む。

　ステップＳ７４１２において、語句抽出・当て込み部１０８２は、感情情報と合致する語句を発話テキストから抽出する。

　ステップＳ７４１３において、語句抽出・当て込み部１０８２は、文書構造解析結果から合致した語句と係る語句のうち人名や固有名詞を抽出する。

　ステップＳ７４１４において、語句抽出・当て込み部１０８２は、残りの係る語句を補足情報として抽出する。

　ステップＳ７４１５において、語句抽出・当て込み部１０８２は、抽出した各語句に重みをかける。その後処理は再びステップＳ７４１１に戻る。

　ステップＳ７４１６において、語句抽出・当て込み部１０８２は、最も重みがかかった語句とその係る語句を埋め込み内容とする。その後処理は再びステップＳ７４０３に戻る。

　（３－５－２－４）感情寄りの語句抽出・当て込み処理
　感情寄り（０．５＜α＜１）の場合、語句抽出・当て込み部１０８２は、感情重視の場合と同様に、発話テキスト上で感情情報がある語句と関連する語句を抽出する。ただし、抽出する際に論理構成の感情に係る語に論理の割合分の重みをかける。例えばα＝０．７５の場合、感情情報として語尾強調となっている「認められました」の部分に係る語句に階層に応じて減衰させながら重みをつける。

　図３６は、感情寄りの場合の語句抽出処理のイメージを示す。発話内容ＵＣ１３および文書構造ＤＳ４１において、太字は合致する語句（兼関連語句）を、斜体は関連語句を、線ＳＰＩで囲まれた部分は補足情報を表す。ＤＳ４２は、論理の割合分の重みづけが行われる様子を示す。この例では、階層に応じて、語尾強調の「認められました」の部分に係る語句としての「ＩＣカード」には１．２５、「進歩性」には１．２５、「組み合わせは容易でない」には１．０６８の重み付けがされる。

　次いで、語句抽出・当て込み部１０８２は、補足情報として選択する語句を、感情表現がある語句と最も重みがかかっている語句を中心にして抽出する。この例では、感情情報（この例では語尾強調）が入っているため、補足情報として選択する第１の語句として「認められた」が抽出される。また、最も重みがかかっている語句は「ＩＣカード」と「進歩性」であり、そのうち「ＩＣカード」はすでに項目の内容として選択されているので、補足情報として選択する第２の語句として「進歩性」が抽出される。抽出した関連語句とテンプレート上の埋め込み項目との対応は、感情重視の場合と同様に実施する。

　図３７は、以上のような重みづけによって得られる出力結果ＧＳ４１を示す。重みづけに応じた語句を用いた出力結果が得られる。

　図１５は、図９のステップＳ７０９に示した語句抽出・当て込み部１０８２による感情寄り（０．５＜α＜１）の場合の語句抽出・当て込み処理の詳細なフローの一例を示す。　
　まずステップＳ７５０１において、語句抽出・当て込み部１０８２は、感情情報と合致する語句を発話テキストから抽出する。

　ステップＳ７５０２において、語句抽出・当て込み部１０８２は、文書構造解析結果から合致した語句と係る語句のうち人名や固有名詞を抽出する。

　ステップＳ７５０３において、語句抽出・当て込み部１０８２は、残りの係る語句を補足情報として抽出する。

　ステップＳ７５０４において、語句抽出・当て込み部１０８２は、内容が確定していない埋め込み項目があるか否かを判定し、ある場合（ＹＥＳ）、ステップＳ７５０５に進み、ない場合（ＮＯ）、処理を終了する。

　ステップＳ７５０５において、語句抽出・当て込み部１０８２は、テンプレートの埋め込み項目データから内容が確定していない項目を選択する。

　ステップＳ７５０６において、語句抽出・当て込み部１０８２は、選択した埋め込み項目の適する内容が固有名詞であるか否かを判定する。固有名詞でない場合（ＮＯ）、ステップＳ７５０７に進み、固有名詞である場合（ＹＥＳ）、ステップＳ７５１２に進む。

　ステップＳ７５０７において、語句抽出・当て込み部１０８２は、選択した項目との合致度をまだ算出していない、合致した語句が存在するか否かを判定する。存在する場合（ＹＥＳ）、ステップＳ７５０８に進み、存在しない場合（ＮＯ）、ステップＳ７５１０に進む。

　ステップＳ７５０８において、語句抽出・当て込み部１０８２は、まだ合致度を算出していない合致した語句を１つ選ぶ。

　ステップＳ７５０９において、語句抽出・当て込み部１０８２は、選択した項目の適する内容に合致し、かつまだ埋め込み内容として使われていない語句が、合致した語句と係る語句の中にいくつ含まれているかをカウントし、その数を合致度とする。その後処理は再びステップＳ７５０７に戻る。

　ステップＳ７５１０において、語句抽出・当て込み部１０８２は、最も合致度が高く、まだ埋め込み項目として使われていない語句を埋め込み内容とする。

　ステップＳ７４１０において、語句抽出・当て込み部１０８２は、埋め込み項目先が「ヒトｏｒモノ」であり、合致する画像があれば画像に置き換える。その後処理は再びステップＳ７５０４に戻る。

　一方、ステップＳ７５０６において選択した埋め込みの適する内容が固有名詞である（ＹＥＳ）場合、ステップＳ７５１２において、語句抽出・当て込み部１０８２は、さらに重みを計算していない感情情報と合致する語句があるか否かを判定する。ある場合（ＹＥＳ）、ステップＳ７５１３に進み、ない場合（ＮＯ）、ステップＳ７５１６に進む。

　ステップＳ７５１３において、語句抽出・当て込み部１０８２は、感情情報と合致する語句を発話テキストから抽出する。

　ステップＳ７５１４において、語句抽出・当て込み部１０８２は、文書構造解析結果から合致した語句と係る語句のうち人名や固有名詞を抽出する。

　ステップＳ７５１５において、語句抽出・当て込み部１０８２は、抽出した各語句に重みをかける。その後処理は再びステップＳ７５１２に戻る。

　ステップＳ７５１６において、語句抽出・当て込み部１０８２は、最も重みがかかった語句を埋め込み内容とする。

　ステップＳ７５１７において、語句抽出・当て込み部１０８２は、対象となっている埋め込み項目が補足情報を持つ場合、最も重みがかかった語句の補語を補足情報の埋め込み内容とする。その後、処理は再びステップＳ７５１２に戻る。

　（３－５－２－５）ニュートラルの当て込み処理
　ニュートラル（α＝０．５）の場合、語句抽出・当て込み部１０８２は、論理重視および感情重視の処理内容に沿って、それぞれのグラフィック化済みトピックセットデータを出力する。そして、語句抽出・当て込み部１０８２は、出力した感情重視のグラフィック化済みトピックセットデータの「ヒトｏｒモノ」のテンプレート部分に、論理重視で出力したグラフィック化済みトピックセットデータを当てはめて、感情重視の結果と論理重視の結果を合成する。

　図３８は、ニュートラルの場合の語句抽出・当て込み処理のイメージを示す。感情重視のグラフィック化済みトピックセットデータＧＳ５１と、論理重視のグラフィック化済みトピックセットデータＧＳ５２とに基づき、ニュートラルのグラフィック化が行われる（ＧＳ５３）。

　図１６は、図９のステップＳ７０６に示した語句抽出・当て込み部１０８２によるニュートラル（α＝０．５）の場合の当て込み処理の詳細なフローの一例を示す。　
　まずステップＳ７６０１において、語句抽出・当て込み部１０８２は、論理重視の語句抽出・当て込み処理（上述）を行う。

　ステップＳ７６０２において、語句抽出・当て込み部１０８２は、感情重視の語句抽出・当て込み処理（上述）を行う。

　ステップＳ７６０３において、語句抽出・当て込み部１０８２は、感情重視の結果の埋め込み項目のうち、適する内容が固有名詞である埋め込み項目部分を論理重視の結果で置き換える。

　ステップＳ７６０４において、語句抽出・当て込み部１０８２は、置き換えた結果をグラフィック化済みトピックセットデータとする。

　（３－６）全体レイアウト処理
　図６のステップＳ１０８に関して説明した全体レイアウト処理部１０９による全体レイアウト処理についてさらに説明する。全体レイアウト処理部１０９は、出力方向づけ設定情報に基づいて、グラフィック化されたトピックセットデータを配置し、グラフィックレコーディングデータを最終的な結果として出力する。トピックセットデータの配置は、出力方向づけ設定情報によって変化する。

　まず、基準の方針となる論理重視（出力方向づけ設定情報α＝０）の場合のレイアウトルールについて説明する。　
　図３９は、親子関係に基づく配置例を示す。ここでは、リアルタイムで反映可能なことを考慮し、（ｉ）親子関係が親→子の順にわかった場合と、（ｉｉ）子→親の順にわかった場合とで配置の仕方を変えるものとする。図３９の左側に示されるように、（ｉ）親（Ａ）→子（Ｂ）の順でわかった場合、親（Ａ）に内包される形で子（Ｂ）が配置される。一方、図３９の右側に示されるように、（ｉｉ）子（Ａ）→親（Ｂ）の順でわかった場合、子（Ａ）から親（Ｂ）へ矢印を描く配置とする。

　図４０は、親子階層に合わせた兄弟関係の配置と関係性の矢印について説明する図である。兄弟関係は、親子階層の深さに合わせて縦→横→縦→横→縦・・・の順に配置される。トピックセットデータ間で関係を有することがわかったら、その間を矢印で結ぶ。

　出力方向づけ設定情報に感情要素が入る（０＜α≦１）場合、感情変化度合いによって強調表現を行う。例えば、感情変化度合いに合わせて、該当するトピックセットデータが占める領域が大きくなるような強調表現を行う。すべてのトピックセットデータに対して強調度合い（（１＋感情変化度合い）×出力方向づけ設定情報）を算出し、その相対値によって占める領域を決定する。例えば図４０のトピックセットデータの階層構造において、感情変化度合いがＡ１１は１、Ａ２が０．５、そのほかは０であったとし、出力方向づけ設定情報の値が論理よりのα＝０．２５であるとする。この場合、Ａ１１が（１＋１）×０．２５＝０．５、Ａ２が（１＋０．５）×０．２５＝０．３７５、そのほかが０．２５となるため、Ａ１１：Ａ２：その他の比は、４：３：２となる。

　図４１Ａは、上記事例に基づく縦方向または横方向への適用例を示す。比率に従い、同一兄弟の大きさを基準に、縦または横方向への比率で配置が実施される。兄弟が横方向に並んでいる場合は横（幅）方向へ、縦方向に並んでいる場合は縦（高さ）方向へ比率が適用される。

　図４１Ｂは、上記事例に基づく面積への適用例を示す。比率に従い、同一兄弟の大きさを基準に、面積の比率で配置が実施される。

　全体レイアウト処理部１０９は、強調表現に基づいて大きさを変更した際に隙間ができた場合、そこを埋める形で兄弟のトピックセットデータの配置を変更することができる（上記ではＡ１２がＡ２の下の隙間を埋める形で位置変更されている）。上記例では、同一兄弟間で比率を適用させて強調表現を行ったが、全体に対して比率を適用させる強調表現を用いてもよい。また、上記の例では、占める領域の割合を強調表現としたが、他にも線を太くする、強調表現のアイコンを追加するなどを用いてもよい。

　図１７は、全体レイアウト処理部１０９による全体レイアウト処理全体のフローの一例を示す。　
　まずステップＳ８０１において、全体レイアウト処理部１０９は、出力方向づけ設定情報の値αが０より大きいか否かを判定する。αが０の場合（α＝０）（ＮＯ）、ステップＳ８０２に進み、αが０より大きい場合（０＜α）（ＹＥＳ）、ステップＳ８０３に進む。

　ステップＳ８０２において、全体レイアウト処理部１０９は、すべてのトピックセットデータの大きさ比を１：１に設定する。

　一方、ステップＳ８０３において、全体レイアウト処理部１０９は、すべてのトピックセットデータに対して感情情報をもとに強調度合いを算出する。

　ステップＳ８０４において、全体レイアウト処理部１０９は、算出した強調度合いをもとにトピックセットデータ間の大きさ比を設定する。

　ステップＳ８０５において、全体レイアウト処理部１０９は、配置していないトピックセットデータがあるか否かを判定する。配置していないトピックセットデータがある場合（ＹＥＳ）、ステップＳ８０６に進み、配置していないトピックセットデータがない場合（ＮＯ）、処理を終了する。

　ステップＳ８０６において、全体レイアウト処理部１０９は、配置していないグラフィック化済みトピックセットデータを１つ選択する。

　ステップＳ８０７において、全体レイアウト処理部１０９は、トピックセットデータ配置処理を行う。

　ステップＳ８０８において、全体レイアウト処理部１０９は、関連する項目があるか否かを判定する。ある場合（ＹＥＳ）、ステップＳ８０９に進み、ない場合（ＮＯ）、ステップＳ８０５に戻る。

　ステップＳ８０９において、全体レイアウト処理部１０９は、関連する項目との間に矢印を描く。その後、処理は再びステップＳ８０５に戻る。

　（３－６－１）トピックセットデータ配置処理
　図１８は、図１７のステップＳ８０７に示したトピックセットデータ配置処理の詳細なフローの一例を示す。　
　まずステップＳ８００１において、全体レイアウト処理部１０９は、対象のデータが初めての配置であるか否かを判定する。初めての配置である場合（ＹＥＳ）、ステップＳ８００２に進み、初めての配置でない場合（ＮＯ）、ステップＳ８００３に進む。

　ステップＳ８００２において、全体レイアウト処理部１０９は、対象のデータを初期位置に配置する。

　ステップＳ８００３において、全体レイアウト処理部１０９は、対象のデータの子に初めて親ができたか否かを判定する。初めて親ができた場合（ＹＥＳ）、ステップＳ８００４に進み、それ以外の場合（ＮＯ）、ステップＳ８０１１に進む。

　ステップＳ８００４において、全体レイアウト処理部１０９は、子は縦で並列しているか否かを判定する。縦で並列している場合（ＹＥＳ）、ステップＳ８００５に進み、縦で並列していない場合（ＮＯ）、ステップＳ８００８に進む。

　ステップＳ８００５において、全体レイアウト処理部１０９は、すべての子の高さに合わせて横に配置し、各子から矢印を描く。

　ステップＳ８００６において、全体レイアウト処理部１０９は、大きさ比が１より大きい場合、幅を大きさ比率分大きくする。

　ステップＳ８００７において、全体レイアウト処理部１０９は、大きさ比が１より大きく親が存在する場合、親と親の兄弟の幅を、大きさ比率に合わせて拡大する。

　ステップＳ８００８において、全体レイアウト処理部１０９は、すべての子の幅に合わせて縦に配置し、各子から矢印を描く。

　ステップＳ８００９において、全体レイアウト処理部１０９は、大きさ比が１より大きい場合、高さを大きさ比率分大きくする。

　ステップＳ８０１０において、全体レイアウト処理部１０９は、大きさ比が１より大きく親が存在する場合、親と親の兄弟の高さを、大きさ比率に合わせて拡大する。

　ステップＳ８０１１において、全体レイアウト処理部１０９は、対象のデータに親がいるか否かを判定する。親がいる場合（ＹＥＳ）、ステップＳ８０１２に進み、親がいない場合（ＮＯ）、ステップＳ８０１２をスキップしてステップＳ８０１３に進む。

　ステップＳ８０１２において、全体レイアウト処理部１０９は、対象のデータに兄弟がいるか否かを判定する。兄弟がいる場合（ＹＥＳ）、ステップＳ８０１３に進み、兄弟がいない場合（ＮＯ）、ステップＳ８０１６に進む。

　ステップＳ８０１３において、全体レイアウト処理部１０９は、兄に合わせて横または縦に並列になるように配置する。

　ステップＳ８０１４において、全体レイアウト処理部１０９は、大きさ比が１より大きい場合、横並びなら幅を、縦並びなら高さを大きさ比率分大きくする。

　ステップＳ８０１５において、全体レイアウト処理部１０９は、大きさ比が１より大きく親が存在する場合、親と親の兄弟の幅または高さを、大きさ比率に合わせて拡大する。

　ステップＳ８０１６において、全体レイアウト処理部１０９は、親は横並列であるか否かを判定する。横並列である場合（ＹＥＳ）、ステップＳ８０１７に進み、横並列でない場合（ＮＯ）、ステップＳ８０２０に進む。

　ステップＳ８０１７において、全体レイアウト処理部１０９は、親に内包し、兄弟が縦並列で並ぶように配置する。

　ステップＳ８０１８において、全体レイアウト処理部１０９は、大きさ比が１より大きい場合、高さを大きさ比率分大きくする。

　ステップＳ８０１９において、全体レイアウト処理部１０９は、大きさ比が１より大きく親が存在する場合、親と親の兄弟の高さを、大きさ比率に合わせて拡大する。

　ステップＳ８０２０において、全体レイアウト処理部１０９は、親に内包し、兄弟が横並列で並ぶように配置する。

　ステップＳ８０２１において、全体レイアウト処理部１０９は、大きさ比が１より大きい場合、幅を大きさ比率分大きくする。

　ステップＳ８０２２において、全体レイアウト処理部１０９は、大きさ比が１より大きく親が存在する場合、親と親の兄弟の幅を、大きさ比率に合わせて拡大する。

　図４２Ａ～４２Ｈは、会議の進行に伴う、論理重視（α＝０）の場合の全体レイアウトの変化例を示す。

　図４２Ａは、第１の時点における発話内容「本日のトピックはＡ，Ｂ，Ｃの３つとなっています」に対するレイアウト例を示す。文書構造の解析結果、Ａ，Ｂ，Ｃが並列と解析され、並列に配置されている。

　図４２Ｂは、第２の時点における発話内容「まずトピックＡの話です。ここではＤというものが重要になってきます。Ｄとは・・・」に対するレイアウト例を示す。文書構造の解析結果、ＤがＡの子と解析され、Ａに内包して配置される。

　図４２Ｃは、第３の時点における発話内容「トピックＡにはもう一つ、Ｅというものが重要になってきます。」に対するレイアウト例を示す。文書構造の解析結果、ＥがＡの２つ目の子と解析され、Ａに内包してＤと並列に配置される。

　図４２Ｄは、第４の時点における発話内容「このＥはＥ１とＥ２という２つの要素から成り立っています。それによって・・・」に対するレイアウト例を示す。文書構造の解析結果、Ｅは子Ｅ１とＥ２を有すると解析され、配置される。

　図４２Ｅは、第５の時点における発話内容「ここからはトピックＢの話になります。トピックＢではＦが独占的状態であり・・・」に対するレイアウト例を示す。文書構造の解析結果、ＦがＢの子と解析され、Ｂに内包されて配置される。

　図４２Ｆは、第６の時点における発話内容「実はこのＦはトピックＡで出てきたＥ１と相互に関係しております。・・・」に対するレイアウト例を示す。文書構造の解析結果、Ｅ１とＦが関係していると解析され、矢印が付加される。

　図４２Ｇは、第７の時点における発話内容「最後にトピックＣですが、Ｇ，Ｈ，Ｉの３つが相互に密接な関係を持つことで成り立っております。どういうことかといいますと・・・」に対するレイアウト例を示す。文書構造の解析結果、ＣがＧ，Ｈ，Ｉの３つの子を持ち、さらに相互に関連を持つと解析され、矢印が付加される。

　図４２Ｈは、第８の時点における発話内容「Ａ，Ｂ，Ｃと話してきましたが、実はこの３つはＫにつながっていきます。・・・ご清聴ありがとうございました。」に対するレイアウト例を示す。文書構造の解析結果、Ａ，Ｂ，Ｃと並列な新たなＫが解析され、再配置される。

　（４）ハードウェア構成
　図４３は、一実施形態に係る自動グラフィックレコーディング装置１０のハードウェア構成の一例を示す。自動グラフィックレコーディング装置１０は、ＣＰＵ（Central Processing Unit）１００１、ＲＡＭ（Random Access Memory）１００２、ＲＯＭ（Read Only Memory）１００３、補助記憶装置１００４、入力装置１００５、出力装置１００６、および通信装置１００７を備える。

　ＣＰＵ１００１は、自動グラフィックレコーディング装置１０の全体的な動作を制御するプロセッサである。ＣＰＵ１００１は、ＲＯＭ１００３または補助記憶装置１００４に記憶されたプログラムをＲＡＭ１００２に展開し、このプログラムを実行することによって、音声認識部１０３、感情推定部１０４、文書構造解析部１０５、発話グルーピング処理部１０６、トピックセットデータ取捨選択処理部１０７、グラフィック化処理部１０８、および全体レイアウト処理部１０９として動作する。ＣＰＵ１００１は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（field-programmable gate array）などの集積回路を含む、他の多様な形式で実現されてもよい。またＣＰＵ１００１は、複数のプロセッサを含んでもよい。

　補助記憶装置１００４は、例えば、ＨＤＤ（Hard Disk Drive）又はＳＤＤ（Solid State Drive）であり得る。補助記憶装置１００４は、ＣＰＵ１００１により実行されるプログラムや、プログラムを実行するために必要な設定データなどを非一時的に記憶する。補助記憶装置１００４は、上述したデータベース１１１および出力方向づけ設定情報記憶部１１０を含む記憶部としても機能し得る。

　入力装置１００５は、例えば、タッチスクリーン、キーボード、マウスなど、ユーザからの入力を受け付ける。入力装置１００５は、上記のマイク１０１、カメラ１０２または図示しない各種センサを含み得る。出力装置１００６は、例えば、ディスプレイやスピーカなどであり、上記のディスプレイ１１２を含み得る。

　通信装置１００７は、外部の装置と通信するための装置であり、例えば無線または有線ＬＡＮ（Local Area Network）通信のためのインタフェースを備える。通信装置１００７は、インターネットなどのネットワークを介して外部の装置と通信可能である。

　（５）効果
　以上詳述したように、この発明の一実施形態に係る自動グラフィックレコーディング装置１０は、発話者の発話活動に関わる活動情報を取得し、活動情報から発話者の発話内容を表すテキスト情報を抽出し、テキスト情報をもとに発話内容の論理構成を解析し、論理構成に基づいてテキスト情報から可視化対象区間を選択し、可視化対象区間ごとにテキスト情報を視覚的情報に変換し、視覚的情報を含む出力データを生成し出力する。出力データは、発話内容を反映したグラフィック表現を含む。また出力データは、活動情報に基づいて判定される重要度に応じた強調表現を伴い得る。重要度は、会話内の話題の単位であるトピックまたは話題のかたまりであるトピックセットごとに算出される。重要度は、活動情報から推定される発話者の感情変化を表す感情情報に基づいて、あるいはあらかじめ設定された方向づけ情報に応じて感情情報または発話内容の論理構成のうちの少なくとも一方に基づいて算出される。方向づけ情報には、感情情報を重視するか、または論理構成を重視するか、の対立項目における比重を指定する情報が含まれる。

　これにより、少なくとも発話者の発話音声を含む情報の入力を受け付けて、自動グラフィックレコーディングを実行する、自動グラフィックレコーディング装置が提供される。一実施形態に係る自動グラフィックレコーディング装置１０によれば、感情情報を用いることによって、まとめ方や表現方法の方向づけを行うことができる。特に、感情を重視するか論理を重視するかの方向づけを行うことにより、可視化対象とする内容の取捨選択、可視化対象となった内容のグラフィック表現、および全体的なレイアウトのうちの少なくとも１つに影響を及ぼすことができる。

　従来のグラフィックレコーディングは、人の手作業によるものであり、レコーダによってその結果が大きく異なるものであった。また、会議中の音声データをテキスト化して議事録を作成する従来の技術では、システムが良いと思った通りに纏められてしまったり、会議に合わせた表現をしようとすると人が手動で操作を行う必要があり、非効率であった。

　上記のように、一実施形態に係る自動グラフィックレコーディング装置１０によれば、会議や記録の目的に応じて、わかりやすいまとめ方や表現の方向づけを調整して、自動的にグラフィックレコーディングを作成することが可能となる。

　［他の実施形態］
　なお、この発明は上記実施形態に限定されるものではない。例えば、自動グラフィックレコーディング装置１０が備える各機能部１０１～１１２を、複数の装置に分散配置し、これらの装置が互いに連携することにより処理を行うようにしてもよい。また、自動グラフィックレコーディング装置１０が備える機能の一部は、外部の装置により実行されてもよい。例えば、音声認識部１０３の機能をクラウドサービスを利用して代替させてもよい。また各機能部は、回路を用いることで実現されてもよい。回路は、特定の機能を実現する専用回路であってもよいし、プロセッサのような汎用回路であってもよい。

　さらに、以上で説明した各処理の流れは、説明した手順に限定されるものではなく、いくつかのステップの順序が入れ替えられてもよいし、いくつかのステップが同時並行で実施されてもよい。例えば、音声認識、文書構造の解析、および感情情報の抽出は、図６に示した順序で行われる必要はなく、任意のタイミングで実行されてよい。

　以上で記載した手法は、計算機（コンピュータ）に実行させることができるプログラム（ソフトウェア手段）として、例えば磁気ディスク（フロッピー（登録商標）ディスク、ハードディスク等）、光ディスク（ＣＤ－ＲＯＭ、ＤＶＤ、ＭＯ等）、半導体メモリ（ＲＯＭ、ＲＡＭ、フラッシュメモリ等）等の記録媒体（記憶媒体）に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウェア手段（実行プログラムのみならずテーブル、データ構造も含む）を計算機内に構成させる設定プログラムをも含む。上記装置を実現する計算機は、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウェア手段を構築し、このソフトウェア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、計算機内部あるいはネットワークを介して接続される機器に設けられた磁気ディスク、半導体メモリ等の記憶媒体を含むものである。

　その他、テンプレートの種類、全体レイアウトのルール等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。

　なお、この発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。

　１０…自動グラフィックレコーディング装置
　１０１…マイク
　１０２…カメラ
　１０３…音声認識部
　１０４…感情推定部
　１０５…文書構造解析部
　１０６…発話グルーピング処理部
　１０７…トピックセットデータ取捨選択処理部
　１０８…グラフィック化処理部
　１０８１…テンプレート選択部
　１０８２…語句抽出・当て込み部
　１０９…全体レイアウト処理部
　１１０…出力方向づけ設定情報記憶部
　１１１…データベース
　１１２…ディスプレイ

Claims

　発話者の発話活動に関わる活動情報を取得する、第１取得部と、
　前記活動情報から前記発話者の発話内容を表すテキスト情報を抽出する、抽出部と、
　前記テキスト情報をもとに前記発話内容の論理構成を解析する、解析部と、
　前記論理構成に基づいて前記テキスト情報から可視化対象区間を選択する、選択部と、
　前記可視化対象区間ごとに前記テキスト情報を視覚的情報に変換する、変換部と、
　前記視覚的情報を含む出力データを生成し出力する、出力データ生成部と
　を備える、情報処理装置。
　前記選択部はさらに、前記活動情報をもとに推定される前記発話者の感情の変化に基づいて、前記発話内容のうち感情的重要度の高い区間を決定することによって、前記可視化対象区間を選択する、
　請求項１に記載の情報処理装置。
　前記発話者の感情を重視するか前記論理構成を重視するかを指定する方向づけ情報を取得する、第２取得部をさらに備え、
　前記選択部はさらに前記方向づけ情報に基づいて、感情的重要度または論理構成的重要度の高い区間を判定することにより、前記可視化対象区間を選択する、
　請求項１に記載の情報処理装置。
　前記変換部は、前記可視化対象区間内の前記テキスト情報に含まれる語、句、節または文に対し、前記方向づけ情報に基づく重要度に応じた強調表現を適用することによって、前記テキスト情報を前記視覚的情報に変換する、
　請求項３に記載の情報処理装置。
　前記出力データ生成部は、前記可視化対象区間ごとに前記方向づけ情報に基づく重要度を算出し、前記重要度をもとに前記出力データにおける前記視覚的情報の大きさの相対的な比率を決定することによって、前記出力データを生成する、
　請求項３または４に記載の情報処理装置。
　前記出力データ生成部はさらに、前記発話内容の論理構成に基づいて複数の可視化対象区間に係る前記視覚的情報のあいだの関係を推定し、前記関係に応じて前記視覚的情報の相対的な配置位置を決定することによって、前記出力データを生成する、
　請求項５に記載の情報処理装置。
　発話者の発話活動に関わる活動情報を取得することと、
　前記活動情報から前記発話者の発話内容を表すテキスト情報を抽出することと、
　前記テキスト情報をもとに前記発話内容の論理構成を解析することと、
　前記論理構成に基づいて前記テキスト情報から可視化対象区間を選択することと、
　前記可視化対象区間ごとに前記テキスト情報を視覚的情報に変換することと、
　前記視覚的情報を含む出力データを生成し出力することと
　を備える、情報処理方法。
　請求項１乃至６のいずれか一項に記載の情報処理装置の各部による処理をコンピュータに実行させるプログラム。