WO2022130541A1

WO2022130541A1 - 意見集約装置、意見集約方法、およびプログラム

Info

Publication number: WO2022130541A1
Application number: PCT/JP2020/047000
Authority: WO
Inventors: 司吉田; 淳史大塚; 済央野本; 哲小橋川
Original assignee: 日本電信電話株式会社
Priority date: 2020-12-16
Filing date: 2020-12-16
Publication date: 2022-06-23
Also published as: JPWO2022130541A1; US20240046038A1; JP7492166B2

Abstract

意見集約装置１００は、入力文が平叙文であるか疑問文であるかを判定する第１判定部１０と、入力文が平叙文である場合、入力文を疑問文化した第１テキストデータを生成する第１生成部２０と、入力文が疑問文である場合、入力文に簡易回答した第２テキストデータを生成する第２生成部３０と、複数のチャットテキストデータを含むチャットテキストデータベースを記憶する記憶部１２０と、第１テキストデータとチャットテキストデータとの文章連続性を示す第１スコア、又は、チャットテキストデータと第２テキストデータとの文章連続性を示す第２スコアを算出する算出部４０と、第１スコア又は第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有するチャットテキストデータを出力する第２判定部５０と、を備える。

Description

意見集約装置、意見集約方法、およびプログラム

　本開示は、意見集約装置、意見集約方法、およびプログラムに関する。

　近年、インターネット通信の発展によりライブ配信が盛んであり、オンライン形式のプレゼンもしばしば行われている。このような場では、チャット機能を用いて配信に関してコメントが集められる。寄せられた意見又は疑問などに対して、配信者がその場で返答することができれば、視聴者の理解又は満足度の向上が見込める。さらに、活発な意見交換にも繋がり、特にプレゼンでは、合意形成に役立つことが期待できる。しかし、コメントが大量に集まる場合、配信者が配信中にそれら全てを確認することは現実的に不可能であり、チャット文の中から類似した意見又は疑問をまとめ、整理する技術が必要となる。

　例えば、特許文献１には、指定テキスト集合の傾向変化に高速に適応しながら、長期的な傾向に基づいた高い分類精度も実現するマイクロブログテキスト分類技術が開示されている。

特開２０１２－２２１４３０号公報

　しかしながら、従来の技術では、関連するテキストの検索によりトピック分類は達成される一方で、同意見又は同意味という意味的情報を捉えた分類を行うことができず、類似した意見又は疑問を整理することが困難であるという問題があった。また、テキストを一度、特徴量ベクトルに変換するため、分類結果を解釈しづらく、さらに、途中結果を見てエラー解析などを行うことが困難であるという問題もあった。

　かかる事情に鑑みてなされた本開示の目的は、意味的情報を捉えた分類を行うことが可能な意見集約装置、意見集約方法、およびプログラムを提供することにある。

　一実施形態に係る意見集約装置は、入力文が平叙文であるか疑問文であるかを判定する第１判定部と、前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成する第１生成部と、前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成する第２生成部と、複数のチャットテキストデータを含むチャットテキストデータベースを記憶する記憶部と、前記第１テキストデータと前記チャットテキストデータとの文章連続性を示す第１スコア、又は、前記チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出する算出部と、前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記チャットテキストデータを出力する第２判定部と、を備えることを特徴とする。

　一実施形態に係る意見集約方法は、入力文が平叙文であるか疑問文であるかを判定するステップと、前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成するステップと、前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成するステップと、複数のチャットテキストデータを含むチャットテキストデータベースを記憶するステップと、前記第１テキストデータと前記チャットテキストデータとの文章連続性を示す第１スコア、又は、前記チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出するステップと、前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記チャットテキストデータを出力するステップと、を含むことを特徴とする。

　一実施形態に係るプログラムは、コンピュータを、上記意見集約装置として機能させることを特徴とする。

　本開示によれば、意味的情報を捉えた分類を行うことが可能な意見集約装置、意見集約方法、およびプログラムを提供することが可能となる。

第１実施形態に係る意見集約装置の構成の一例を示す図である。第１実施形態に係る各データの一例を示す図である。第１実施形態に係る各データの一例を示す図である。第１実施形態に係る意見集約方法の一例を示すフローチャートである。第２実施形態に係る意見集約装置の構成の一例を示す図である。第２実施形態に係る各データの一例を示す図である。第２実施形態に係る意見集約方法の一例を示すフローチャートである。

　以下、本発明を実施するための形態について、図面を参照しながら詳細に説明する。

〔第１実施形態〕
＜意見集約装置の構成＞
　図１乃至図３を参照して、第１実施形態に係る意見集約装置の構成の一例について説明する。

　意見集約装置１００は、制御部１１０と、記憶部１２０と、入力部１３０と、出力部１４０と、を備える。

　制御部１１０は、専用のハードウェアによって構成されてもよいし、汎用のプロセッサ又は特定の処理に特化したプロセッサによって構成されてもよい。制御部１１０は、平叙文／疑問文判定部（第１判定部）１０と、疑問文生成部（第１生成部）２０と、回答文生成部（第２生成部）３０と、文章連続性スコア算出部（算出部）４０と、閾値判定部（第２判定部）５０と、を備える。

　記憶部１２０は、１つ以上のメモリを含み、例えば、半導体メモリ、磁気メモリ、光メモリなどを含んでよい。記憶部１２０に含まれる各メモリは、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してよい。各メモリは、必ずしも意見集約装置１００がその内部に備える必要はなく、意見集約装置１００の外部に備える構成としてもよい。記憶部１２０は、意見集約装置１００の動作に用いられる任意の情報を記憶する。記憶部１２０は、例えば、複数のチャットテキストデータを含むチャットテキストデータベース１２１を記憶する。チャットテキストデータとしては、例えば、図２に示すように、「赤色のモデルいいね」、「赤は微妙」、「赤はいいですね」、「色が豊富なのがいいと思いました」、「もう少し小さいといいと思いました」などが挙げられる。チャットテキストデータとしては、例えば、図３に示すように、「インジェクションとは何ですか」、「インジェクションがわからない」、「安定供給が必要そうですね」、「もう少し小さいといいと思いました」などが挙げられる。この他にも、記憶部１２０は、例えば、各種のプログラム又はデータなどを記憶する。

　入力部１３０は、各種情報の入力を受け付ける。入力部１３０は、ユーザによる所定の操作が可能であればどのようなデバイスでもよく、例えば、マイク、タッチパネル、キーボード、マウスなどである。例えば、ユーザが、入力部１３０を用いて所定の操作を行うことで、入力文が制御部１１０に入力される。入力文としては、例えば、図２に示すように、「赤色のモデルが好みです（平叙文）」などが挙げられる。入力文としては、例えば、図３に示すように、「インジェクションって何？（疑問文）」などが挙げられる。入力部１３０は、意見集約装置１００の外部に設けられていてもよいし、意見集約装置１００と一体化されていてもよい。

　出力部１４０は、各種情報を出力する。出力部１４０は、例えば、スピーカー、液晶ディスプレイ、有機ＥＬ（Electro－Luminescence）ディスプレイなどである。出力部１４０は、例えば、入力文に類似する類似文を出力する。入力文に類似する類似文としては、例えば、図２に示すように、「赤色のモデルが好みです」という入力文に対して、「赤色のモデルいいね」、「赤はいいですね」などが挙げられる。入力文に類似する類似文としては、例えば、図３に示すように、「インジェクションって何？」という入力文に対して、「インジェクションとは何ですか」、「インジェクションがわからない」などが挙げられる。出力部１４０は、意見集約装置１００の外部に設けられていてもよいし、意見集約装置１００と一体化されていてもよい。

　平叙文／疑問文判定部１０は、入力文が、平叙文であるか疑問文であるかを判定する。平叙文／疑問文判定部１０は、入力文が平叙文である場合、入力文が平叙文であるという判定結果を、疑問文生成部２０へ出力する。平叙文／疑問文判定部１０は、入力文が疑問文である場合、入力文が疑問文であるという判定結果を、回答文生成部３０へ出力する。

　疑問文生成部２０は、平叙文／疑問文判定部１０から入力された判定結果に基づいて、入力文を疑問文化し、入力文を疑問文化したテキストデータである第１テキストデータを生成する。疑問文生成部２０は、第１テキストデータを、文章連続性スコア算出部４０へ出力する。第１テキストデータとしては、例えば、図２に示すように、「赤色のモデルは好きですか？」、「何色のモデルが好きですか？」などが挙げられる。疑問文生成部２０は、１つの入力文に対して、単数の第１テキストデータを生成してもよいし、複数の第１テキストデータを生成してもよい。

　疑問文生成部２０が第１テキストデータを生成する技術は、特に限定されるものではないが、例えば、質問自動生成技術を用いてよい。質問自動生成技術の詳細については、例えば、下記の文献を参照することができる。
　佐藤紗都、伍井啓恭、奥村学、「製品マニュアル文からの質問自動生成」、人工知能学会全国大会論文集、第32回全国大会(2018)、一般社団法人、人工知能学会、2018

　回答文生成部３０は、平叙文／疑問文判定部１０から入力された判定結果に基づいて、入力文に簡易回答し、入力文に簡易回答したテキストデータである第２テキストデータを生成する。回答文生成部３０は、第２テキストデータを、文章連続性スコア算出部４０へ出力する。第２テキストデータとしては、例えば、図３に示すように、「インジェクションは燃料供給装置のことです」などが挙げられる。回答文生成部３０は、１つの入力文に対して、単数の第２テキストデータを生成してもよいし、複数の第２テキストデータを生成してもよい。

　回答文生成部３０が第２テキストデータを生成する技術は、特に限定されるものではないが、例えば、ＦＡＱ検索システムを用いて、入力文に対する適当な回答を検索し、適当な回答を要約して簡易回答文として使用してよい。この技術の詳細については、例えば、特開２０１８－１８０９３８号公報、特開２０１８－１４７１０２号公報などを参照することができる。

　文章連続性スコア算出部４０は、疑問文生成部２０から入力された第１テキストデータと、チャットテキストデータベース１２１から抽出されたチャットテキストデータ（例えば、「赤色のモデルいいね」、「赤は微妙」、「赤はいいですね」、「色が豊富なのがいいと思いました」、「もう少し小さいといいと思いました」など）と、の文章連続性を示す第１スコアを算出する。文章連続性スコア算出部４０は、算出した第１スコアを、閾値判定部５０へ出力する。

　同様に、文章連続性スコア算出部４０は、チャットテキストデータベース１２１から抽出されたチャットテキストデータ（例えば、「インジェクションとは何ですか」、「インジェクションがわからない」、「安定供給が必要そうですね」、「もう少し小さいといいと思いました」など）と、回答文生成部３０から入力された第２テキストデータと、の文章連続性を示す第２スコアを算出する。文章連続性スコア算出部４０は、算出した第２スコアを、閾値判定部５０へ出力する。

　文章連続性スコア算出部４０が第１スコア又は第２スコアを算出する技術は、特に限定されるものではないが、例えば、自然言語処理の学習モデルの一つであるNext Sentence Predictionの出力値を、文章連続性を示すスコアとして用いてよい。この技術の詳細については、例えば、下記の文献を参照することができる。
　Devlin, Jacob, et al. "Bert: Pre-training of deep bidirectional transformers for language understanding." arXiv preprint arXiv:1810.04805 (2018).

　例えば、文章連続性スコア算出部４０は、１つ目のテキストデータ：「今日の天気は晴れでしょう」と２つ目のテキストデータ：「明日の天気は曇りでしょう」との文章連続性を示すスコアを、「８．５（Ｔｒｕｅ）」と算出する。該スコアは、「今日の天気は晴れでしょう」、「明日の天気は曇りでしょう」という２つの文章の連続性が高いことを示す。

　例えば、文章連続性スコア算出部４０は、１つ目のテキストデータ：「今日の天気は晴れでしょう」と２つ目のテキストデータ：「確率統計は重要な科目です」との文章連続性を示すスコアを、「－５．４（Ｆａｌｓｅ）」と算出する。該スコアは、「今日の天気は晴れでしょう」、「確率統計は重要な科目です」という２つの文章の連続性が低いことを示す。

　なお、文章連続性を示すスコアは、－∞から＋∞までの範囲で設定可能である。文章連続性スコア算出部４０は、例えば、文章連続性を示すスコアの値が正である場合、真（Ｔｒｕｅ）を出力する。文章連続性スコア算出部４０は、例えば、文章連続性を示すスコアの値が負である場合、偽（Ｆａｌｓｅ）を出力する。

　閾値判定部５０は、文章連続性スコア算出部４０から入力された第１スコア又は第２スコアに基づいて、スコア順に、複数のチャットテキストデータをランク付けする。例えば、閾値判定部５０は、図２に示すように、第１テキストデータ：「赤色のモデルは好きですか？」に対する複数のチャットテキストデータを、「９．２：赤色のモデルいいね」、「８．８：赤は微妙」、「８．５：赤はいいですね」、「１．９：色が豊富なのがいいと思いました」、「－５．１：もう少し小さいといいと思いました」・・・のようにランク付けする。例えば、閾値判定部５０は、図２に示すように、第１テキストデータ：「何色のモデルが好きですか？」に対する複数のチャットテキストデータを、「８．７：赤色のモデルいいね」、「６．５：赤はいいですね」、「０．３：赤は微妙」、「－２．０：色が豊富なのがいいと思いました」、「－６．７：もう少し小さいといいと思いました」・・・のようにランク付けする。例えば、閾値判定部５０は、図３に示すように、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対する複数のチャットテキストデータを、「８．８：インジェクションとは何ですか」、「８．５：インジェクションがわからない」、「０．１：安定供給が必要そうですね」、「－５．１：もう少し小さいといいと思いました」・・・のようにランク付けする。

　そして、閾値判定部５０は、第１スコアが閾値以上であるか否かを判定する。閾値判定部５０は、第１スコアが閾値以上である場合、該第１スコアを有するチャットテキストデータを出力部１４０へ出力し、第１スコアが閾値より小さい場合、該第１スコアを有するチャットテキストデータを出力部１４０へ出力しない。

　同様に、閾値判定部５０は、第２スコアが閾値以上であるか否かを判定する。閾値判定部５０は、第２スコアが閾値以上である場合、該第２スコアを有するチャットテキストデータを出力部１４０へ出力し、第２スコアが閾値より小さい場合、該第２スコアを有するチャットテキストデータを出力部１４０へ出力しない。

　なお、閾値は、その値が特に限定されるものではなく、意見集約装置１００により任意の値に設定されてよい。

　例えば、第１テキストデータが単数である場合、閾値判定部５０は、該第１テキストデータに対して、単数又は複数のチャットテキストデータにおける第１スコアが閾値以上であるか否かを判定する。そして、閾値判定部５０は、第１スコアが閾値以上である場合、該第１スコアを有するチャットテキストデータを出力部１４０へ出力し、第１スコアが閾値より小さい場合、該第１スコアを有するチャットテキストデータを出力部１４０へ出力しない。

　同様に、例えば、図３に示すように、第２テキストデータが単数である場合、閾値判定部５０は、該第２テキストデータ（例えば、「インジェクションは燃料供給装置のことです」）に対して、単数又は複数のチャットテキストデータ（例えば、「インジェクションとは何ですか」、「インジェクションがわからない」、「安定供給が必要そうですね」、「もう少し小さいといいと思いました」）における第２スコアが閾値（例えば、５．０）以上であるか否かを判定する。そして、閾値判定部５０は、第２スコアが閾値以上である場合、該第２スコアを有するチャットテキストデータ（例えば、「インジェクションとは何ですか」、「インジェクションがわからない」）を出力部１４０へ出力し、第２スコアが閾値より小さい場合、該第２スコアを有するチャットテキストデータ（例えば、「安定供給が必要そうですね」、「もう少し小さいといいと思いました」）を出力部１４０へ出力しない。

　例えば、図２に示すように、第１テキストデータが複数である場合、閾値判定部５０は、全ての第１テキストデータ（例えば、「赤色のモデルは好きですか？」、「何色のモデルが好きですか？」）に対して、単数又は複数のチャットテキストデータ（例えば、「赤色のモデルいいね」、「赤は微妙」、「赤はいいですね」、「色が豊富なのがいいと思いました」、「もう少し小さいといいと思いました」）における第１スコアが閾値（例えば、５．０）以上であるか否かを判定する。そして、閾値判定部５０は、全ての第１テキストデータに対して、第１スコアが閾値以上となるチャットテキストデータ（例えば、「赤色のモデルいいね」、「赤はいいですね」）を出力部１４０へ出力し、全ての第１テキストデータに対して、第１スコアが閾値以上とならないチャットテキストデータ（例えば、「赤は微妙」、「色が豊富なのがいいと思いました」、「もう少し小さいといいと思いました」）を出力部１４０へ出力しない。

　同様に、例えば、第２テキストデータが複数である場合、閾値判定部５０は、全ての第２テキストデータに対して、第２スコアが閾値以上であるか否かを判定する。そして、閾値判定部５０は、全ての第２テキストデータに対して、第２スコアが閾値以上となるチャットテキストデータを出力部１４０へ出力し、全ての第２テキストデータに対して、第２スコアが閾値以上とならないチャットテキストデータを出力部１４０へ出力しない。

　第１実施形態に係る意見集約装置１００は、入力文が平叙文である場合には、平叙文を疑問化した文に対して文章連続性スコアの高い回答文を抽出し、入力文が疑問文である場合には、疑問文に簡易回答した文に対して文章連続性スコアの高い疑問文を抽出する。これにより、入力文に類似する類似文を出力することができるため、同意見又は同意味という意味的情報を捉えた分類を行うことが可能な意見集約装置１００を実現できる。

＜意見集約方法＞
　図４を参照して、第１実施形態に係る意見集約方法の一例について説明する。

　ステップ１０１において、入力文が、意見集約装置１００に入力される。入力文としては、例えば、「赤色のモデルが好みです」、「インジェクションって何？」などが挙げられる。

　ステップ１０２において、意見集約装置１００は、入力文が、平叙文であるか疑問文であるかを判定する。入力文が、例えば、「赤色のモデルが好みです」というような平叙文である場合（ステップ１０２→平叙文）、意見集約装置１００は、ステップ１０３の処理を行う。入力文が、例えば、「インジェクションって何？」というような疑問文である場合（ステップ１０２→疑問文）、意見集約装置１００は、ステップ１０４の処理を行う。

　ステップ１０３において、意見集約装置１００は、入力文を疑問文化し、入力文を疑問文化したテキストデータである第１テキストデータを生成する。例えば、意見集約装置１００は、「赤色のモデルが好みです」という入力文を疑問文化し、「赤色のモデルは好きですか？」、「何色のモデルが好きですか？」という第１テキストデータを生成する。

　ステップ１０４において、意見集約装置１００は、入力文に簡易回答し、入力文に簡易回答したテキストデータである第２テキストデータを生成する。例えば、意見集約装置１００は、「インジェクションって何？」という入力文に簡易回答し、「インジェクションは燃料供給装置のことです」という第２テキストデータを生成する。

　ステップ１０５において、意見集約装置１００は、文章連続性スコアを算出する。例えば、意見集約装置１００は、第１テキストデータと、チャットテキストデータベース１２１に含まれるチャットテキストデータと、の文章連続性を示す第１スコアを算出する。例えば、意見集約装置１００は、チャットテキストデータベース１２１に含まれるチャットテキストデータと、第２テキストデータと、の文章連続性を示す第２スコアを算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤色のモデルいいね」を用いて、２つの文章の連続性を示す第１スコアを、「９．２」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤は微妙」を用いて、２つの文章の連続性を示す第１スコアを、「８．８」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤はいいですね」を用いて、２つの文章の連続性を示す第１スコアを、「８．５」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「色が豊富なのがいいと思いました」を用いて、２つの文章の連続性を示す第１スコアを、「１．９」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「もう少し小さいといいと思いました」を用いて、２つの文章の連続性を示す第１スコアを、「－５．１」と算出する。

　同様に、例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤色のモデルいいね」を用いて、２つの文章の連続性を示す第１スコアを、「８．７」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤はいいですね」を用いて、２つの文章の連続性を示す第１スコアを、「６．５」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「赤は微妙」を用いて、２つの文章の連続性を示す第１スコアを、「０．３」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「色が豊富なのがいいと思いました」を用いて、２つの文章の連続性を示す第１スコアを、「－２．０」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、チャットテキストデータ：「もう少し小さいといいと思いました」を用いて、２つの文章の連続性を示す第１スコアを、「－６．７」と算出する。

　同様に、例えば、意見集約装置１００は、１つ目のテキストデータとして、チャットテキストデータ：「インジェクションとは何ですか」を用いて、２つ目のテキストデータとして、第２テキストデータ：「インジェクションは燃料供給装置のことです」を用いて、２つの文章の連続性を示す第２スコアを、「８．８」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、チャットテキストデータ：「インジェクションがわからない」を用いて、２つ目のテキストデータとして、第２テキストデータ：「インジェクションは燃料供給装置のことです」を用いて、２つの文章の連続性を示す第２スコアを、「８．５」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、チャットテキストデータ：「安定供給が必要そうですね」を用いて、２つ目のテキストデータとして、第２テキストデータ：「インジェクションは燃料供給装置のことです」を用いて、２つの文章の連続性を示す第２スコアを、「０．１」と算出する。

　例えば、意見集約装置１００は、１つ目のテキストデータとして、チャットテキストデータ：「もう少し小さいといいと思いました」を用いて、２つ目のテキストデータとして、第２テキストデータ：「インジェクションは燃料供給装置のことです」を用いて、２つの文章の連続性を示す第２スコアを、「－５．１」と算出する。

　ステップ１０６において、意見集約装置１００は、第１スコア又は第２スコアに基づいて、スコア順に、複数のチャットテキストデータをランク付けする。

　例えば、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対する複数のチャットテキストデータを、「９．２：赤色のモデルいいね」、「８．８：赤は微妙」、「８．５：赤はいいですね」、「１．９：色が豊富なのがいいと思いました」、「－５．１：もう少し小さいといいと思いました」・・・のようにランク付けする。

　例えば、意見集約装置１００は、第１テキストデータ：「何色のモデルが好きですか？」に対する複数のチャットテキストデータを、「８．７：赤色のモデルいいね」、「６．５：赤はいいですね」、「０．３：赤は微妙」、「－２．０：色が豊富なのがいいと思いました」、「－６．７：もう少し小さいといいと思いました」・・・のようにランク付けする。

　例えば、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対する複数のチャットテキストデータを、「８．８：インジェクションとは何ですか」、「８．５：インジェクションがわからない」、「０．１：安定供給が必要そうですね」、「－５．１：もう少し小さいといいと思いました」・・・のようにランク付けする。

　そして、意見集約装置１００は、第１スコア又は第２スコアが閾値以上であるか否かを判定する。意見集約装置１００は、第１スコア又は第２スコアが閾値以上である場合（ステップ１０６→ＹＥＳ）、ステップ１０７の処理を行う。意見集約装置１００は、第１スコア又は第２スコアが閾値より小さい場合（ステップ１０６→ＮＯ）、処理を終了する。

　例えば、第１テキストデータが単数である場合、意見集約装置１００は、該第１テキストデータに対するチャットテキストデータの第１スコアが閾値以上であるか否かを判定する。例えば、第１テキストデータが複数である場合、意見集約装置１００は、全ての第１テキストデータに対するチャットテキストデータの第１スコアが閾値以上であるか否かを判定する。

　具体的には、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対するチャットテキストデータ：「赤色のモデルいいね」の第１スコア「９．２」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対するチャットテキストデータ：「赤色のモデルいいね」の第１スコア「８．７」も閾値以上であると判定する。

　また、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対するチャットテキストデータ：「赤はいいですね」の第１スコア「８．５」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対するチャットテキストデータ：「赤はいいですね」の第１スコア「６．５」も閾値以上であると判定する。

　また、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対するチャットテキストデータ：「赤は微妙」の第１スコア「８．５」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対するチャットテキストデータ：「赤は微妙」の第１スコア「０．３」が閾値より小さいと判定する。

　また、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対するチャットテキストデータ：「色が豊富なのがいいと思いました」の第１スコア「１．９」が閾値より小さく、第１テキストデータ：「何色のモデルが好きですか？」に対するチャットテキストデータ：「色が豊富なのがいいと思いました」の第１スコア「－２．０」も閾値より小さいと判定する。

　また、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対するチャットテキストデータ：「もう少し小さいといいと思いました」の第１スコア「－５．１」が閾値より小さく、第１テキストデータ：「何色のモデルが好きですか？」に対するチャットテキストデータ：「もう少し小さいといいと思いました」の第１スコア「－６．７」も閾値より小さいと判定する。

　例えば、第２テキストデータが単数である場合、意見集約装置１００は、該第２テキストデータに対するチャットテキストデータの第２スコアが閾値以上であるか否かを判定する。例えば、第２テキストデータが複数である場合、意見集約装置１００は、全ての第２テキストデータに対するチャットテキストデータの第２スコアが閾値以上であるか否かを判定する。

　具体的には、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対するチャットテキストデータ：「インジェクションとは何ですか」の第２スコア「８．８」が閾値以上であると判定する。

　また、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対するチャットテキストデータ：「インジェクションがわからない」の第２スコア「８．５」が閾値以上であると判定する。

　また、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対するチャットテキストデータ：「安定供給が必要そうですね」の第２スコア「０．１」が閾値より小さいと判定する。

　また、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対するチャットテキストデータ：「もう少し小さいといいと思いました」の第２スコア「－５．１」が閾値より小さいと判定する。

　ステップ１０７において、意見集約装置１００は、判定結果に基づいて、入力文に類似する類似文を出力する。

　例えば、第１テキストデータが複数である場合、意見集約装置１００は、全ての第１テキストデータに対するチャットテキストデータの第１スコアが閾値以上となるという判定結果に基づいて、「赤色のモデルいいね」、「赤はいいですね」を、入力文に類似する類似文として出力する。具体的には、意見集約装置１００は、第１テキストデータ：「赤色のモデルは好きですか？」に対して、第１スコアが閾値以上となるチャットテキストデータとして、「赤色のモデルいいね」、「赤は微妙」、「赤はいいですね」を上位テキスト群に分類する。また、意見集約装置１００は、第１テキストデータ：「何色のモデルが好きですか？」に対して、第１スコアが閾値以上となるチャットテキストデータとして、「赤色のモデルいいね」、「赤はいいですね」を上位テキスト群に分類する。そして、意見集約装置１００は、両方の上位テキスト群に共通して含まれるチャットテキストデータ、すなわち、「赤色のモデルいいね」、「赤はいいですね」を出力する。

　例えば、第２テキストデータが単数である場合、意見集約装置１００は、該第２テキストデータに対するチャットテキストデータの第２スコアが閾値以上であるという判定結果に基づいて、「インジェクションとは何ですか」、「インジェクションがわからない」を、入力文に類似する類似文として出力する。具体的には、意見集約装置１００は、第２テキストデータ：「インジェクションは燃料供給装置のことです」に対して、第２スコアが閾値以上となるチャットテキストデータとして、「インジェクションとは何ですか」、「インジェクションがわからない」を上位テキスト群に分類する。そして、意見集約装置１００は、該上位テキスト群に含まれる全てのチャットテキストデータ、すなわち、「インジェクションとは何ですか」、「インジェクションがわからない」を出力する。

　第１実施形態に係る意見集約方法は、文章連続性スコアに基づいて、類似テキストを分類する。つまり、入力文を変換し、所定の文が、変換された入力文に対して会話文として成立するか否かを文章連続性スコアとして算出し、このスコアにより、入力文と所定の文との同調性又は同様性を測る。平叙文に対しては、その疑問文をとり、その疑問文と所定の文との文章連続性スコアを算出することで、元の平叙文との同調性をスコア化する。疑問文に対しては、その回答文をとり、所定の文とその回答文との文章連続性スコアを算出することで、元の疑問文との同様性をスコア化する。これにより、短い文に対してもテキスト情報のみで意味的情報を捉えた分類を行うことが可能な意見集約方法を実現できる。
また、会話文として成立するか否かを分類基準とするため、分類結果の解釈が容易な意見集約方法を実現できる。

〔第２実施形態〕
＜意見集約装置の構成＞
　図５又は図６を参照して、第２実施形態に係る意見集約装置１００Ａの構成の一例について説明する。

　第２実施形態に係る意見集約装置１００Ａが、第１実施形態に係る意見集約装置１００と異なる点は、第１実施形態に係る意見集約装置１００が類似文法テキスト検索部を備えないのに対して、第２実施形態に係る意見集約装置１００Ａは、類似文法テキスト検索部を備える点である。その他の構成は、同様であるため、重複した説明を省略する場合がある。

　意見集約装置１００Ａは、制御部１１０Ａと、記憶部１２０と、入力部１３０と、出力部１４０と、を備える。制御部１１０Ａは、平叙文／疑問文判定部（第１判定部）１０と、疑問文生成部（第１生成部）２０と、回答文生成部（第２生成部）３０と、文章連続性スコア算出部（算出部）４０と、閾値判定部（第２判定部）５０と、類似文法テキスト検索部（検索部）６０と、を備える。

　類似文法テキスト検索部６０は、チャットテキストデータベース１２１から、入力文と文法的に類似するチャットテキストデータを検索する。そして、類似文法テキスト検索部６０は、入力文と該チャットテキストデータとの類似度（例えば、距離計算により算出された値）に基づいて、類似度順に、複数のチャットテキストデータをランク付けする。

　例えば、類似文法テキスト検索部６０は、図６に示すように、入力文：「赤色のモデルが好みです」と文法的に類似する複数のチャットテキストデータを、「０．９：赤色のモデルいいね」、「１．４：赤は微妙」、「１．５：赤はいいですね」、「１１．７：色が豊富なのがいいと思いました」、「２１．０：もう少し小さいといいと思いました」・・・のようにランク付けする。

　そして、類似文法テキスト検索部６０は、類似度が閾値以下であるか否かを判定する。類似文法テキスト検索部６０は、類似度が閾値以下である場合、該類似度を有するチャットテキストデータを、類似チャットテキストデータとして文章連続性スコア算出部４０へ出力し、類似度が閾値より大きい場合、該類似度を有するチャットテキストデータを、類似チャットテキストデータとして文章連続性スコア算出部４０へ出力しない。なお、閾値は、その値が特に限定されるものではなく、意見集約装置１００Ａにより任意の値に設定されてよい。

　例えば、類似文法テキスト検索部６０は、図６に示すように、類似度が閾値（例えば、５．０）以下である場合、「０．９：赤色のモデルいいね」、「１．４：赤は微妙」、「１．５：赤はいいですね」を、類似チャットテキストデータとして文章連続性スコア算出部４０へ出力し、類似度が閾値（例えば、５．０）より大きい場合、「１１．７：色が豊富なのがいいと思いました」、「２１．０：もう少し小さいといいと思いました」を、類似チャットテキストデータとして文章連続性スコア算出部４０へ出力しない。

　類似文法テキスト検索部６０が、チャットテキストデータベース１２１から、入力文と文法的に類似するチャットテキストデータを検索する技術は、特に限定されるものではないが、例えば、テキストを自然言語処理のモデルの一つであるBERTにより特徴量ベクトルに変換し、その特徴量ベクトルの差を示すノルム値が所定の閾値より小さいテキストを、類似文法テキストとしての検索結果としてよい。この技術の詳細については、例えば、下記の文献を参照することができる。
　Devlin, Jacob, et al. "Bert: Pre-training of deep bidirectional transformers for language understanding." arXiv preprint arXiv:1810.04805 (2018).

　文章連続性スコア算出部４０は、疑問文生成部２０から入力された第１テキストデータと、類似文法テキスト検索部６０から入力された類似チャットテキストデータと、の文章連続性を示す第１スコアを算出する。文章連続性スコア算出部４０は、算出した第１スコアを、閾値判定部５０へ出力する。

　同様に、文章連続性スコア算出部４０は、類似文法テキスト検索部６０から入力された類似チャットテキストデータと、回答文生成部３０から入力された第２テキストデータと、の文章連続性を示す第２スコアを算出する。文章連続性スコア算出部４０は、算出した第２スコアを、閾値判定部５０へ出力する。

　閾値判定部５０は、文章連続性スコア算出部４０から入力された第１スコアに基づいて、スコア順に、複数の類似チャットテキストデータをランク付けする。例えば、閾値判定部５０は、図６に示すように、第１テキストデータ：「赤色のモデルは好きですか？」に対する複数の類似チャットテキストデータを、「９．２：赤色のモデルいいね」、「８．８：赤は微妙」、「８．５：赤はいいですね」のようにランク付けする。例えば、閾値判定部５０は、図６に示すように、第１テキストデータ：「何色のモデルが好きですか？」に対する複数の類似チャットテキストデータを、「８．７：赤色のモデルいいね」、「６．５：赤はいいですね」、「０．３：赤は微妙」のようにランク付けする。

　そして、閾値判定部５０は、第１スコアが閾値以上であるか否かを判定する。閾値判定部５０は、第１スコアが閾値以上である場合、該第１スコアを有する類似チャットテキストデータを出力部１４０へ出力し、第１スコアが閾値より小さい場合、該第１スコアを有する類似チャットテキストデータを出力部１４０へ出力しない。

　同様に、閾値判定部５０は、第２スコアが閾値以上であるか否かを判定する。閾値判定部５０は、第２スコアが閾値以上である場合、該第２スコアを有する類似チャットテキストデータを出力部１４０へ出力し、第２スコアが閾値より小さい場合、該第２スコアを有する類似チャットテキストデータを出力部１４０へ出力しない。

　例えば、図６に示すように、第１テキストデータが複数である場合、閾値判定部５０は、全ての第１テキストデータ（例えば、「赤色のモデルは好きですか？」、「何色のモデルが好きですか？」）に対して、単数又は複数の類似チャットテキストデータ（例えば、「赤色のモデルいいね」、「赤はいいですね」、「赤は微妙」）における第１スコアが閾値（例えば、５．０）以上であるか否かを判定する。そして、閾値判定部５０は、全ての第１テキストデータに対して、第１スコアが閾値以上となる類似チャットテキストデータ（例えば、「赤色のモデルいいね」、「赤はいいですね」）を出力部１４０へ出力し、全ての第１テキストデータに対して、第１スコアが閾値以上とならない類似チャットテキストデータ（例えば、「赤は微妙」）を出力部１４０へ出力しない。

　第２実施形態に係る意見集約装置１００Ａは、入力文が平叙文である場合には、平叙文を疑問化した文に対して文章連続性スコアの高い回答文を抽出し、入力文が疑問文である場合には、疑問文に簡易回答した文に対して文章連続性スコアの高い疑問文を抽出する。これにより、入力文に類似する類似文を出力することができるため、同意見又は同意味という意味的情報を捉えた分類を行うことが可能な意見集約装置１００Ａを実現できる。また、文章連続性スコア算出部４０が、あらかじめ厳選された類似チャットテキストデータのみを、スコア算出に用いることで、計算コストを抑えつつ、意味的情報を捉えた分類を効率的に行うことが可能な意見集約装置１００Ａを実現できる。

＜意見集約方法＞
　図７を参照して、第２実施形態に係る意見集約方法の一例について説明する。なお、第１実施形態に係る意見集約方法と同様の処理については、重複した説明を省略する場合がある。

　ステップＳ２０１において、入力文が、意見集約装置１００Ａに入力される。入力文としては、例えば、「赤色のモデルが好みです」などが挙げられる。

　ステップ２０２において、意見集約装置１００Ａは、入力文が、平叙文であるか疑問文であるかを判定する。入力文が、平叙文である場合（ステップ２０２→平叙文）、意見集約装置１００Ａは、ステップ２０４の処理を行う。入力文が、疑問文である場合（ステップ２０２→疑問文）、意見集約装置１００Ａは、ステップ２０５の処理を行う。

　ステップ２０３において、意見集約装置１００Ａは、チャットテキストデータベース１２１から、入力文と文法的に類似するチャットテキストデータを検索する。そして、意見集約装置１００Ａは、入力文と該チャットテキストデータとの類似度が閾値以下であるか否かを判定し、類似度が閾値以下である場合、該類似度を有するチャットテキストデータを、類似チャットテキストデータとする。

　例えば、意見集約装置１００Ａは、検索したチャットテキストデータ：「赤色のモデルいいね」の類似度：「０．９」が閾値以下であると判定し、検索したチャットテキストデータ：「赤色のモデルいいね」を類似チャットテキストデータとする。例えば、意見集約装置１００Ａは、検索したチャットテキストデータ：「赤は微妙」の類似度：「１．４」が閾値以下であると判定し、検索したチャットテキストデータ：「赤は微妙」を類似チャットテキストデータとする。例えば、意見集約装置１００Ａは、検索したチャットテキストデータ：「赤はいいですね」の類似度：「１．５」が閾値以下であると判定し、検索したチャットテキストデータ：「赤はいいですね」を類似チャットテキストデータとする。例えば、意見集約装置１００Ａは、検索したチャットテキストデータ：「色が豊富なのがいいと思いました」の類似度：「１１．７」が閾値より大きいと判定し、検索したチャットテキストデータ：「色が豊富なのがいいと思いました」を類似チャットテキストデータとしない。例えば、意見集約装置１００Ａは、検索したチャットテキストデータ：「もう少し小さいといいと思いました」の類似度：「２１．０」が閾値より大きいと判定し、検索したチャットテキストデータ：「もう少し小さいといいと思いました」を類似チャットテキストデータとしない。

　ステップ２０４において、意見集約装置１００Ａは、入力文を疑問文化し、入力文を疑問文化したテキストデータである第１テキストデータを生成する。

　ステップ２０５において、意見集約装置１００Ａは、入力文に簡易回答し、入力文に簡易回答したテキストデータである第２テキストデータを生成する。

　ステップ２０６において、意見集約装置１００Ａは、文章連続性スコアを算出する。例えば、意見集約装置１００Ａは、第１テキストデータと、類似チャットテキストデータと、の文章連続性を示す第１スコアを算出する。例えば、意見集約装置１００Ａは、類似チャットテキストデータと、第２テキストデータと、の文章連続性を示す第２スコアを算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤色のモデルいいね」を用いて、２つの文章の連続性を示す第１スコアを、「９．２」と算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤は微妙」を用いて、２つの文章の連続性を示す第１スコアを、「８．８」と算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「赤色のモデルは好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤はいいですね」を用いて、２つの文章の連続性を示す第１スコアを、「８．５」と算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤色のモデルいいね」を用いて、２つの文章の連続性を示す第１スコアを、「８．７」と算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤はいいですね」を用いて、２つの文章の連続性を示す第１スコアを、「６．５」と算出する。

　例えば、意見集約装置１００Ａは、１つ目のテキストデータとして、第１テキストデータ：「何色のモデルが好きですか？」を用いて、２つ目のテキストデータとして、類似チャットテキストデータ：「赤は微妙」を用いて、２つの文章の連続性を示す第１スコアを、「０．３」と算出する。

　ステップ２０７において、意見集約装置１００Ａは、第１スコア又は第２スコアに基づいて、スコア順に、複数の類似チャットテキストデータをランク付けする。

　例えば、意見集約装置１００Ａは、第１テキストデータ：「赤色のモデルは好きですか？」に対する複数の類似チャットテキストデータを、「９．２：赤色のモデルいいね」、「８．８：赤は微妙」、「８．５：赤はいいですね」のようにランク付けする。

　例えば、意見集約装置１００Ａは、第１テキストデータ：「何色のモデルが好きですか？」に対する複数の類似チャットテキストデータを、「８．７：赤色のモデルいいね」、「６．５：赤はいいですね」、「０．３：赤は微妙」のようにランク付けする。

　そして、意見集約装置１００Ａは、第１スコア又は第２スコアが閾値以上であるか否かを判定する。意見集約装置１００Ａは、第１スコア又は第２スコアが閾値以上である場合（ステップ２０７→ＹＥＳ）、ステップ２０８の処理を行う。意見集約装置１００Ａは、第１スコア又は第２スコアが閾値より小さい場合（ステップ２０７→ＮＯ）、処理を終了する。

　例えば、第１テキストデータが単数である場合、意見集約装置１００Ａは、該第１テキストデータに対する類似チャットテキストデータの第１スコアが閾値以上であるか否かを判定する。例えば、第１テキストデータが複数である場合、意見集約装置１００Ａは、全ての第１テキストデータに対する類似チャットテキストデータの第１スコアが閾値以上であるか否かを判定する。

　例えば、第２テキストデータが単数である場合、意見集約装置１００Ａは、該第２テキストデータに対する類似チャットテキストデータの第２スコアが閾値以上であるか否かを判定する。例えば、第２テキストデータが複数である場合、意見集約装置１００Ａは、全ての第２テキストデータに対する類似チャットテキストデータの第２スコアが閾値以上であるか否かを判定する。

　具体的には、意見集約装置１００Ａは、第１テキストデータ：「赤色のモデルは好きですか？」に対する類似チャットテキストデータ：「赤色のモデルいいね」の第１スコア「９．２」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対する類似チャットテキストデータ：「赤色のモデルいいね」の第１スコア「８．７」も閾値以上であると判定する。

　また、意見集約装置１００Ａは、第１テキストデータ：「赤色のモデルは好きですか？」に対する類似チャットテキストデータ：「赤はいいですね」の第１スコア「８．５」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対する類似チャットテキストデータ：「赤はいいですね」の第１スコア「６．５」も閾値以上であると判定する。

　また、意見集約装置１００Ａは、第１テキストデータ：「赤色のモデルは好きですか？」に対する類似チャットテキストデータ：「赤は微妙」の第１スコア「８．５」が閾値以上であり、第１テキストデータ：「何色のモデルが好きですか？」に対する類似チャットテキストデータ：「赤は微妙」の第１スコア「０．３」が閾値より小さいと判定する。

　ステップ２０８において、意見集約装置１００Ａは、判定結果に基づいて、入力文に類似する類似文を出力する。

　例えば、第１テキストデータが複数である場合、意見集約装置１００Ａは、全ての第１テキストデータに対するチャットテキストデータの第１スコアが閾値以上となるという判定結果に基づいて、「赤色のモデルいいね」、「赤はいいですね」を、入力文に類似する類似文として出力する。具体的には、意見集約装置１００Ａは、第１テキストデータ「赤色のモデルは好きですか？」に対して、第１スコアが閾値以上となる類似チャットテキストデータとして、「赤色のモデルいいね」、「赤は微妙」、「赤はいいですね」を上位テキスト群に分類する。また、意見集約装置１００Ａは、第１テキストデータ「何色のモデルが好きですか？」に対して、第１スコアが閾値以上となる類似チャットテキストデータとして、「赤色のモデルいいね」、「赤はいいですね」を上位テキスト群に分類する。そして、意見集約装置１００Ａは、両方の上位テキスト群に共通して含まれる類似チャットテキストデータ、すなわち、「赤色のモデルいいね」、「赤はいいですね」を出力する。

　第２実施形態に係る意見集約方法は、文章連続性スコアに基づいて、類似テキストを分類する。つまり、入力文を変換し、所定の類似文が、変換された入力文に対して会話文として成立するか否かを文章連続性スコアとして算出し、このスコアにより、入力文と所定の類似文との同調性又は同様性を測る。平叙文に対しては、その疑問文をとり、その疑問文と所定の類似文との文章連続性スコアを算出することで、元の平叙文との同調性をスコア化する。疑問文に対しては、その回答文をとり、所定の類似文とその回答文との文章連続性スコアを算出することで、元の疑問文との同様性をスコア化する。これにより、短い文に対してもテキスト情報のみで意味的情報を捉えた分類を効率的に行うことが可能な意見集約方法を実現できる。また、計算コストを抑えた意見集約方法を実現できる。また、会話文として成立するか否かを分類基準とするため、分類結果の解釈が容易な意見集約方法を実現できる。

＜変形例＞
　本発明は上記の実施形態および変形例に限定されるものではない。例えば、上述の各種の処理は、記載にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

＜プログラム及び記録媒体＞
　上記の実施形態及び変形例として機能させるためにプログラム命令を実行可能なコンピュータを用いることも可能である。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、ＰＣ（Personal Computer）、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。制御部１１０，１１０Ａとして機能するプロセッサは、ＣＰＵ(Central Processing Unit)、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＳｏＣ（System on a Chip）などであり、同種又は異種の複数のプロセッサにより構成されてもよい。制御部１１０，１１０Ａは、記憶部１２０からプログラムを読み出し、プログラムを実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。

　例えば、上述した意見集約方法をコンピュータに実行させるためのプログラムは、図４を参照すると、入力文が平叙文であるか疑問文であるかを判定するステップ（Ｓ１０１，Ｓ１０２）と、入力文が平叙文である場合、入力文を疑問文化した第１テキストデータを生成するステップ（Ｓ１０３）と、入力文が疑問文である場合、入力文に簡易回答した第２テキストデータを生成するステップ（Ｓ１０４）と、第１テキストデータとチャットテキストデータとの文章連続性を示す第１スコア、又は、チャットテキストデータと第２テキストデータとの文章連続性を示す第２スコアを算出するステップ（Ｓ１０５）と、第１スコア又は第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有するチャットテキストデータを出力するステップ（Ｓ１０６，Ｓ１０７）と、を少なくとも含む。

　また、このプログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、ＣＤ（Compact Disk）－ＲＯＭ（Read-Only Memory）、ＤＶＤ（Digital Versatile Disc）－ＲＯＭ、ＢＤ（Blu-ray（登録商標） Disc）－ＲＯＭなどであってもよい。また、このプログラムは、ネットワークを介したダウンロードによって提供することもできる。

　上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更および置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形および変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを１つに組み合わせたり、あるいは１つの構成ブロックを分割したりすることが可能である。また、実施形態のフローチャートに記載の複数の工程を１つに組み合わせたり、あるいは１つの工程を分割したりすることが可能である。

　１０　　　　　　　　平叙文／疑問文判定部（第１判定部）
　２０　　　　　　　　疑問文生成部（第１生成部）
　３０　　　　　　　　回答文生成部（第２生成部）
　４０　　　　　　　　文章連続性スコア算出部（算出部）
　５０　　　　　　　　閾値判定部（第２判定部）
　６０　　　　　　　　類似文法テキスト検索部（検索部）
　１００，１００Ａ　　意見集約装置
　１１０，１１０Ａ　　制御部
　１２０　　　　　　　記憶部
　１３０　　　　　　　入力部
　１４０　　　　　　　出力部

Claims

　入力文が平叙文であるか疑問文であるかを判定する第１判定部と、
　前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成する第１生成部と、
　前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成する第２生成部と、
　複数のチャットテキストデータを含むチャットテキストデータベースを記憶する記憶部と、
　前記第１テキストデータと前記チャットテキストデータとの文章連続性を示す第１スコア、又は、前記チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出する算出部と、
　前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記チャットテキストデータを出力する第２判定部と、
　を備える、意見集約装置。
　前記第２判定部は、
　前記第１テキストデータ又は前記第２テキストデータが複数である場合、
　全ての前記第１テキストデータ又は全ての前記第２テキストデータに対して、前記第１スコア又は前記第２スコアが前記閾値以上となる前記チャットテキストデータを出力する、
　請求項１に記載の意見集約装置。
　入力文が平叙文であるか疑問文であるかを判定する第１判定部と、
　前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成する第１生成部と、
　前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成する第２生成部と、
　複数のチャットテキストデータを含むチャットテキストデータベースを記憶する記憶部と、
　前記チャットテキストデータベースから、前記入力文と文法的に類似するチャットテキストデータを検索し、検索したチャットテキストデータと前記入力文との類似度に基づいて、類似チャットテキストデータを出力する検索部と、
　前記第１テキストデータと前記類似チャットテキストデータとの文章連続性を示す第１スコア、又は、前記類似チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出する算出部と、
　前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記類似チャットテキストデータを出力する第２判定部と、
　を備える、意見集約装置。
　前記第２判定部は、
　前記第１テキストデータ又は前記第２テキストデータが複数である場合、
　全ての前記第１テキストデータ又は全ての前記第２テキストデータに対して、前記第１スコア又は前記第２スコアが前記閾値以上となる前記類似チャットテキストデータを出力する、
　請求項３に記載の意見集約装置。
　入力文が平叙文であるか疑問文であるかを判定するステップと、
　前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成するステップと、
　前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成するステップと、
　複数のチャットテキストデータを含むチャットテキストデータベースを記憶するステップと、
　前記第１テキストデータと前記チャットテキストデータとの文章連続性を示す第１スコア、又は、前記チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出するステップと、
　前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記チャットテキストデータを出力するステップと、
　を含む、意見集約方法。
　入力文が平叙文であるか疑問文であるかを判定するステップと、
　前記入力文が前記平叙文である場合、前記入力文を疑問文化した第１テキストデータを生成するステップと、
　前記入力文が前記疑問文である場合、前記入力文に簡易回答した第２テキストデータを生成するステップと、
　複数のチャットテキストデータを含むチャットテキストデータベースを記憶するステップと、
　前記チャットテキストデータベースから、前記入力文と文法的に類似するチャットテキストデータを検索し、検索したチャットテキストデータと前記入力文との類似度に基づいて、類似チャットテキストデータを出力するステップと、
　前記第１テキストデータと前記類似チャットテキストデータとの文章連続性を示す第１スコア、又は、前記類似チャットテキストデータと前記第２テキストデータとの文章連続性を示す第２スコアを算出するステップと、
　前記第１スコア又は前記第２スコアが閾値以上である場合、該第１スコア又は該第２スコアを有する前記類似チャットテキストデータを出力するステップと、
　を含む、意見集約方法。
　コンピュータを、請求項１から４のいずれか一項に記載の意見集約装置として機能させるためのプログラム。