WO2015118683A1

WO2015118683A1 - 意見収集装置及びシステム及び意見収集方法

Info

Publication number: WO2015118683A1
Application number: PCT/JP2014/053018
Authority: WO
Inventors: 芳樹丹羽; 直之神田
Original assignee: 株式会社日立製作所
Priority date: 2014-02-10
Filing date: 2014-02-10
Publication date: 2015-08-13
Also published as: JPWO2015118683A1

Abstract

　論題に関する意見を収集する際に、論題に関係する複数の価値観を設定し、意見の発言主体が価値観に関する考え方のバックグラウンドを把握できるようにすること。論題と論題に関わる価値観を入力し、論題に関する意見を検索し、意見の発言主体の過去の意見を検索し、過去発言の価値観に関する重視度を計算し、検索された意見を表示する。複数の価値観の重視度に基づいて発言主体を表示部にマップし、論題に関する個々の意見を発言主体に結びつけて表示することにより、意見の発言主体が価値観をどの程度重視しているか把握しながら各意見を参照できる。価値観の重視度は、価値観と意味相似性を有する表現が発言主体の過去発言に出現する箇所を求め、各出現箇所における表現の意味相似度と文脈ファクターとの相乗値を過去発言に渡って累積することで計算する。

Description

意見収集装置及びシステム及び意見収集方法

本発明は、意見収集装置及びシステム及び意見収集方法に関する。

ある論題について分析したり、判断を下したりする場合、その論題に関する賛否それぞれの立場からのさまざまな意見を収集し、それぞれの長短を比較検討することによって最適の判断を下そうとする努力が一般に行われる。その努力を支援するための技術がこれまでにも開発されてきた。
特許文献１には賛否意見の特徴的な語句を賛否特異度と論題固有度に応じてマップ化する技術が記載されている。

特開２００７－２４１９０１号公報

ある論題について分析したり、判断を下したりする場合、その論題に関する賛否それぞれの立場からのさまざまな意見を収集し、それぞれの長短を比較検討することによって最適の判断を下そうとする努力が一般に行われる。その際に各意見の発言主体が、その論題に関わる一般に複数の価値観についてどの程度重視しているか、というバックグラウンド知ることができれば、より的確な分析をすることができると考えられる。
例えば、新しい医薬品の開発のための動物実験の是非を問う論題の場合、医学の進歩を重視する立場からは、動物実験は必要という考えになることが多く、また動物愛護や動物の生命倫理を重視する立場からは、禁止すべきという考えになることが多い。従ってこの場合には、医学の進歩という価値観と動物の生命倫理という二つの価値観が両立できない所に論題の発生源があると考えられる。
しかしながら動物実験の是非という論題を離れれば、通常は医学の進歩も、動物の生命を守ることもどちらも大事、というのが常識的な考え方である。このように、そのことを他の価値観とは切り離して独立に善悪を問われた時に、常識的に大事であると多くの人が考えるものを、ここでは価値観（もしくは価値観点）と呼ぶ。

今仮に、ＡさんとＢさんＣさんＤさんが動物実験は必要という意見を述べていたとする。この場合にもしＡさんＢさんＣさんＤさんが、動物実験の論題とは独立に、「医学の進歩」という価値観と「動物の生命倫理」という価値観をそれぞれ独立の価値観としてどの程度重視しているかということを過去の発言などから定量的に推定することができれば、同じ「動物実験は必要」という意見でも見え方が違ってくるという効果がある。
例えばＡさんは医学の進歩の重視度が高いが、動物の生命倫理への関心は薄いということであれば、「バックグラウンド通り」の意見という見方になるし、Ｂさんは逆に動物の生命倫理に関心の高い人であったとすると、今回の意見は「バックグラウンドとは違う意外性のある」意見という見方ができる。またＣさんは医学の進歩についても動物倫理についてもどちらも過去の発言からは重視度が低いということであれば、「ちょっと思いつきで」発言しただけかもしれない、という見方も可能である。またＤさんは逆にどちらの価値観についても重視度が高いということであれば、今回の意見は「彼我の軽重を測った熟慮の上の意見」かもしれないと考えることができる。
このように価値観に関する重視度を定量的に推定できることは意見分析の上で大きな価値を持つのであるが、これまで実現されてこなかった。本発明の解決すべき課題の一つはこれを実現する手段を与えることである。
ここではＡ～Ｄは個人であるとしたが、実際にはウェブサイトの場合や、雑誌などの媒体であるなど、組織である場合もあるので、本発明ではそれらを一括して発言主体と呼ぶ。

本発明は、以上の点に鑑み、所与の論題に関する複数の意見を、論題に関わる複数の価値観に関する各発言主体の考え方の重視度（バックグラウンド等）を計算し、表示又は出力することを目的とする。

　本発明の第１の解決手段によると、
　意見収集装置であって、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を備え、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集装置が提供される。

　本発明の第２の解決手段によると、
　意見収集システムであって、
　端末と、
　前記端末と通信ネットワークを介して接続された意見収集装置と
を備え、

　前記意見収集装置は、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を有し、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集システムが提供される。

　本発明の第３の解決手段によると、
　意見収集装置における意見収集方法であって、
　前記意見収集装置は、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を備え、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集方法が提供される。

本発明によると、所与の論題に関する複数の意見を、論題に関わる複数の価値観に関する各発言主体の考え方の重視度（バックグラウンド等）を計算し、表示又は出力することができる。

本発明の一実施例に係る意見収集システムの構成図である。図１の表示部上に表示される意見閲覧分析支援画面２５１の画面例の詳細と、意見閲覧分析支援ワークエリア２２１２の詳細を示す図である。図２の価値観格納エリアに格納されている価値観データの構成を示す図である。図２の意見データ格納エリアに格納されている意見データの構成を示す図である。図２の発言主体データ格納エリアに格納されている発言主体データの構成を示す図である。図２の発言主体×価値観別重視度格納エリアに格納されている発言主体×価値観別重視度データの構成を示す図である。意見収集装置の意見収集ワークエリア１２１５の構成図である。意見収集装置の意見収集用規則・データ集１２１６の構成図である。図１の意見閲覧分析支援管理部と意見収集管理部とが、通信ネットワークを介して動作するシーケンスを示す図である。図５のステップＦ４にて、意見収集手段１２１１が所与の論題から論題に関する意見を収集する手順について説明する図である。意見収集の際に用いる、賛成・反対表現データの一例を示す図である。意見収集の際に用いる、理由・証拠表現データの一例を示す図である。意見収集の際に用いる、否定表現データの一例を示す図である。意見収集の際に用いる、発言表現データの一例を示す図である。価値観の重視度算出手段１２１３が、所与の発言主体と所与の価値観について、発言主体の過去の発言を収集し、収集された発言から価値観に関する重視度を計算する手順について説明する図である。重視度計算時に用いる意味相似語句対データの一例を示す図である。重視度計算時に用いる、促進・抑制語句データの一例を示す図である。重視度計算時における、文格納エリアに格納された例文と、その構文構造を解析した結果として得られる、文構造格納エリアの内容を示した図である。図１０と同じ例文に関して重視度計算をしている時の文脈ファクター計算ワークエリアの内容を示した図である。文脈ファクター計算時に用いる、主部ファクターデータの一例を示す図である。文脈ファクター計算時に用いる、補助部ファクターデータの一例を示す図である。文脈ファクター計算時に用いる、修飾部ファクターデータの一例を示す図である。年代区分設定部を備えた意見閲覧分析支援画面２５１の画面例である。製品やサービスに関する意見を価格と性能を価値観として収集した場合の画面例である。外交上対立のある主張に関して、当事国以外の意見を当事国（Ａ・Ｂ）との関係を価値観として収集した場合の画面例である。図１の文書データ１３１の一例を示す図である。図１の検索用索引データ１３２の一例を示す図である。図１の発言主体データ１３３の一例を示す図である。図１の価値観データ１３４の一例を示す図である。価値観の重視度算出手段１２１３の動作（図８）に伴って、価値観の文構造格納エリア（図４Ａ）に作成されるデータの一例を示す図である。図１の文構造解析用辞書１３５の一例を示す図である。

Ａ．概要

以下では、本実施例に係る意見収集システム、および意見収集方法の具体的な構成例を説明する。

ある発言主体の過去の発言は文書検索手段により得ることができる。従ってある与えられたテキスト集合から、ある与えられた価値観の重視度を計算する手段があれば、前記発言主体の前記価値観への重視度が計算できることになる。本実施例ではテキスト集合と価値観を引数として、テキスト集合の価値観に対する重視度を計算する手段を「重視度計算手段」と呼ぶ。
テキスト集合の価値観に対する重視度を推定する場合、価値観として与えられた文言がそのまま出現する場合もあるが、別表現でも意味的な相似性が高い表現も考慮する必要がある。例えば医学の進歩の場合、「医療技術の革新」や「新薬の開発」なども意味的な相似性が高い表現である。価値観と別表現との意味的な相似性を意味相似度と呼ぶ。
さらには同じ表現でもそれが出現する文脈によって、それが価値観を支持する度合いも変化する。「○○は重要だ」という文脈で○○に「医学の進歩」が現れれば、医学の進歩への支持度は高いが「○○は必ずしも良いことばかりではない」のような文脈であれば、支持度は低いと考えられる。このように文脈が支持度に与える影響を「文脈ファクター」と呼ぶ。
本実施例の代表的なものの一例を示すと、次のとおりである。意見収集システムは、論題と論題に関わる価値観を入力する入力部と、論題に関する意見を検索する意見収集手段と、意見の発言主体に関する過去の意見を検索する過去発言検索手段と、過去発言の価値観に関する重視度を計算する計算手段と検索された意見を表示する表示部を有することを特徴とする。
また、本実施例では、複数の価値観に基づいて発言主体を表示部にマップし、論題に関する個々の発言を発言主体に結びつけて、論題に関する賛否が分かる形で表示することを特徴とすることができる。
また、前記重視度計算手段は、過去発言から価値観と意味相似性を有する表現を検出し、検出された表現と価値観との意味相似性を検索し、また出現文脈の文脈ファクターを計算し、両者を融合した値（積など）を加算することによって重視度を計算することを特徴とすることができる。

Ｂ．実施の形態

１．システム及び装置

本発明の第一の実施例に係る、意見収集システムを説明する。まず図１により、本実施例の基本的な構成を説明する。

図１は、本発明の一実施例に係る意見収集システム１０００の構成図である。意見収集システム１０００は、意見収集装置１００と、意見閲覧分析支援端末２００を有し、これらは通信ネットワーク３００によって接続されている。意見収集装置１００と意見閲覧分析支援端末２００を一体化することもできる。通信ネットワーク３００上または意見閲覧分析支援端末２００上には、プリンタなどの印刷手段４００が接続される。なお、意見収集システム１０００は、通信ネットワーク３００を介して、関係部署の他の端末やサーバ等、あるいは外部機関の関係部署の端末やサーバ等にも適宜接続される。
意見収集装置１００は、演算部（ＣＰＵ）１１０、主記憶部１２０、補助記憶部（データベース類）１３０、入力部１４０、表示部１５０、通信部１６０を備えたコンピュータによって構成することができ、演算部１１０が主記憶部１２０に記憶された各種プログラムを実行することによって以下に述べる各手段が実現される。すなわち、演算部１１０は、主記憶部１２０が格納しているプログラムを実行することにより、意見収集装置１００の動作を制御する。

主記憶部１２０は、意見収集装置１００が提供する意見収集機能を実装したプログラムである意見収集管理部１２１を格納している。意見収集管理部１２１は、構成要素として、論題に関する意見収集手段１２１１、発言主体の過去発言収集手段１２１２、価値観の重視度算出手段１２１３、文脈ファクター計算手段１２１４を含む。また、主記憶部１２０は、これらの手段を実行する際のデータを一時的に保持する意見収集ワークエリア１２１５を持ち、また実行時に参照する各種規則やデータの集合体である意見収集用規則・データ集１２１６も有する。意見収集管理部の動作の詳細については後に詳細に示す。
主記憶部１２０には、意見収集管理部１２１の実行に際して呼び出される、以下の手段も格納されている。すなわち文書検索手段１２２、文書実体取得手段１２３、文分割手段１２４、文構造解析手段１２５、単語分割・品詞付与手段１２６、名寄せ手段１２７、固有表現抽出手段１２８などである。
これら各手段１２１～１２８は既知の技術であるため、詳述は省略する。文書検索手段１２２、単語分割・品詞付与手段１２６、については公知の手法を用いればよい。名寄せ手段１２７は同一の対象（人物、地名、書籍名など）の名称が表記の微妙な違いなどで複数存在するものを、単一の名称に帰着させる技術である。固有表現抽出手段１２８についても公知の手法を用いることができる。例えば、文分割手段１２４については、前記単語分割・品詞付与手段をテキストに適用後、文末と認定される箇所（句点など）を切れ目として認定して分割するなどの方法がある。非特許文献１にも方法が記載されている。文構造解析手段１２５についても公知の手法を用いることができる。

補助記憶部（データベース）１３０は、ハードディスク等によって構成され、意見収集管理部１２１の各手段を実行するのに必要な、データ、辞書等の知識データベース等が格納されている。すなわち文書データ１３１と検索用索引データ１３２、発言主体データ１３３、価値観データ１３４、および文構造解析用辞書１３５などである。文書データ１３１は、過去の意見を記載した文書群を発言者や日時・時刻・場所などの書誌的データと共に電子化したデータである。図１５Ａに文書データ１３１の一例が示されている。文書検索用索引データ１３２は、文書データ１３１を高速に検索するために用いられるインデックスデータである。なお、これらのデータの一部は、意見収集装置１００に通信ネットワーク３００を介して接続される外部の情報処理装置のデータベースに格納されていても良い。検索用索引データ１３２の一例は図１５Ｂに示されている。また発言主体データ１３３の一例が図１５Ｃに、価値観データ１３４の一例が１５Ｄに示されている。文構造解析用辞書１３５の一例は図１７に示されている。これらの図の説明は後述する。
入力部１４０は、マウスやキーボードなどのような、ユーザから操作入力を受け取るデバイスである。表示部１５０は、システム管理者やユーザが意見収集装置１００を操作する際に用いる画面を表示する。通信部１６０は、通信ネットワーク３００を介して意見閲覧分析支援端末２００と通信し、後述する意見データ、発言主体データ及び発言主体×価値観別重視度データを意見閲覧分析支援端末２００へ送信する。

意見閲覧分析支援端末２００は、演算部２１０、主記憶部２２０、補助記憶部２３０、入力部２４０、表示部２５０、通信部２６０を備えている。演算部２１０は、主記憶部２２０が格納しているプログラムを実行することにより、意見閲覧分析支援端末２００の動作を制御する。主記憶部２２０は、意見閲覧分析支援端末２００が提供する意見閲覧分析支援機能を実行する意見閲覧分析支援管理部２２１を格納している。同管理部は、意見閲覧分析支援機能を実装するプログラムである意見閲覧分析支援手段２２１１と実行時に発生するデータ類を格納するワークエリア２２１２を含む。
　意見閲覧分析支援管理部２２１は、意見収集装置１００から受け取る後述の意見データ、発言主体データ及び発言主体×価値観別重視度データを用いて、表示部２５０上に意見閲覧分析支援画面２５１を表示させる。ユーザは意見閲覧分析支援画面２５１を用いて、意見の閲覧・分析等の作業を実施する。
入力部２４０は、マウスやキーボードなどのようなユーザから操作入力を受け取るデバイスである。通信部２６０は、通信ネットワーク３００を介して意見収集装置１００と通信する。

図２は、図１の意見閲覧分析支援端末２００の表示部２５０上に表示される意見閲覧分析支援画面２５１の画面例を示す図である。同端末の演算部２１０は、意見閲覧分析支援手段２２１１を実行することにより、表示部２５０上で意見閲覧分析支援画面２５１を提供する。
意見閲覧分析支援画面２５１は、論題設定部２５１１、価値観設定部２５１２、オプション設定部２５１３、意見収集指示部２５１４、意見一覧表示部２５１５、および個々の意見にマウスのカーソルを当てるなどした時に表示される個々の意見の詳細表示部２５１６を含む。論題設定部の右にある肯定と否定の選択欄は、否定が選択された場合には、意見の賛否を逆転させるスイッチをオンにするという設定をするためのものである。例えば「動物実験を禁止する」という論題にしたい場合には否定を選択する。

意見閲覧分析支援手段２２１１は、論題設定部２５１１に入力された論題を主記憶部２２０内の論題格納エリア２２１２００１に格納し、また価値観設定部２５１２で設定された価値観は価値観格納エリア２２１２００２に格納される。
意見収集指示部２５１４から意見収集実行の指示が与えられると、ワークエリア２２１２に格納された論題と価値観の両者は意見収集装置１００へ送信される。意見収集装置１００からは、最初に意見収集結果（後に図３Ｂを用いて詳述）と意見の発言主体の一覧に関するデータを受け取り、それをワークエリア２２１２の意見データ格納エリア２２１２００３と発言主体データ格納エリア２２１２００４に格納する。さらに、意見収集装置１００から発言主体×価値観別重視度データ（後に図３Ｄを用いて詳述）を受け取り、それを発言主体×価値観別重視度データ格納エリア２２１２００５に格納する。意見閲覧分析支援手段２２１１は、ワークエリア２２１２の意見データ、発言主体データおよび発言主体×価値観別重視度データの内容に基づいて、意見一覧表示部２５１５に表示する。

本図では論題として「動物実験の是非」、関連する価値観として「医学の進歩」と「動物の命」が選ばれ、意見一覧表示部２５１５は横軸に医学の進歩の重視度、縦軸に動物の命の重視度を取り、発言者（ここではＡ，Ｂ，Ｃ，Ｄ）を各重視度に従って縦座標、横座標を決めて配置し、各発言者別に賛否（本例では賛成意見が○、反対意見が×）と共に論題に関する意見が表示されている。
本図では省略しているが、価値観を３つ以上設定した場合には、その内のどれとどれを縦軸、横軸にするかを指示する設定部も表示する。価値観選択の指示が無い場合には、できるだけ独立性の高い２つの価値観を選ぶことが好ましいと考えられるので、発言主体別重視度の分布間のχ２乗検定など、独立性指標を用いて最大となるペアを選択することは好ましい方法の一つである。

価値観設定部２５１２の右に候補提示ボタンが描かれているので、この価値観推薦機能について説明する。本実施例では価値観は意見収集者の見識に基づいて設定されることを想定しているが、場合によってはシステム側からの推薦が欲しい場合もあると考えられ、そのような場合に必要となる機能である。実現方法の一例を以下に示す。
論題に関する文書を検索し、価値観データ１３４に登録されているすべての価値観について、それと意味的相似性を有すると判断されるすべて語（後述する図９Ａの説明部分参照）の前記検索された文書中に現れる頻度をカウントして合計する。この頻度合計カウントが大きい順に価値観をソートし、上位から予め設定された個数を選択する（例えば５個）。それら選択された価値観が設定されているものとして、発言主体×価値観別重視度データを作成する。前記価値観が３個以上設定された場合の価値観対自動選択方法に準じて、独立性が高い順に価値観のペアをリストする。この上位を候補として推薦する、という方法が考えられる。

図３Ａは、図２の価値観格納エリア２２１２００２に格納されている価値観データの構成を示す図である。価値観データは、異なる価値観を区別するためのローカルな番号（図２の例では１と２のみ）と価値観の識別子、およびその内容を含む。価値観の識別子は、価値観データ１３４に既登録のものについて、その識別子を記入したものである。
図１５Ｄは価値観データ１３４のデータ構成を示す図である。価値観データは価値観識別子と対応する価値観の内容を含む。本例では、「医療の進歩」は０８６番の価値観として既登録である。

図３Ｂは、図２の意見データ格納エリア２２１２００３に格納されている意見データの構成を示す図である。同データは、意見の内容の他、内容が論題に対して賛成・支持（＋１）であるか反対・否定的（－１）であるかを示す項目、論題との関連性の強さを示す関連性スコア、意見の理由や証拠が示されているかどうかを示す理由証拠スコア、その意見等の内容、意見等が表明されている文書のＩＤ、またそのタイトル、発言主体識別子を含む。

図３Ｃは、図２の発言主体データ格納エリアに格納されている発言主体に関するデータの構成を示す図である。同データは、発言主体を番号づけるたけのローカルな番号の他、発言主体データ１３３に登録されている発言主体識別子と、名称、所属組織（もしくは上位組織）識別子などから構成される。
図１５Ｃは発言主体データ１３３のデータ構成を示す図である。発言主体データは発言主体識別子と対応する発言主体名称、および別称、所属組織（もしくは上位組織）識別子などで構成されている。名称は必須であるがその他は任意である。

図３Ｄは、図２の発言主体×価値観別重視度データ格納エリア２２１２００５に格納されている発言主体×価値観別重視度データの構成を示す図である。なお、「×」は、
マトリクスを表す。同データは、収集された意見の発言主体の各ローカル番号（図３Ｃに記載）と、価値観格納エリアに格納された価値観の各ローカル番号（図３Ａに記載）の対に対して、該発言主体の該価値観に対する重視度が記載されている表形式のデータである。

図４Ａは、意見収集装置１００の意見収集ワークエリア１２１５の構成図である。本ワークエリアは論題格納エリア１２１５００１、価値観格納エリア１２１５００２、意見データ格納エリア１２１５００３、発言主体データ格納エリア１２１５００４、発言主体×価値観別重視度格納エリア１２１５００５（以上は端末側ワークエリアのデータ格納エリア２２１２００１～２２１２００５と対応する）と、検索条件格納エリア１２１５０１０、検索結果格納エリア１２１５０１１、文書実体格納エリア１２１５０１２、書誌情報格納エリア１２１５０１３、文格納エリア１２１５０２０、価値観の文構造格納エリア１２１５０２１、価値観の反転フラグ格納エリア１２１５０２２、文構造格納エリア１２１５０２３、文脈ファクター計算ワークエリア１２１５０２４、などから構成される。

図４Ｂは、意見収集装置１００の意見収集用規則・データ集１２１６の構成図である。同規則・データ集は、賛成・反対表現データ１２１６００１、理由・証拠表現データ１２１６００２、否定表現データ１２１６００３、発言表現データ１２１６００４、意味相似語句対データ１２１６０１１、促進・抑制語句データ１２１６０１２、主部ファクターデータ１２１６０２１、補助部ファクターデータ１２１６０２２、修飾部ファクターデータ１２１６０２３、などから構成される。

２．処理

図５は、図１の意見閲覧分析支援管理部２２１と意見収集管理部１２１とが、通信ネットワーク３００を介して動作するシーケンスを示す図である。以下、図５の各ステップ（ステップＦ１～Ｆ１０Ｂ）について説明する。

（ステップＦ１～Ｆ３）：
意見閲覧分析支援端末２００は、意見閲覧分析支援画面２５１を起動し、ユーザの入力操作により、論題と価値観（複数）が設定され、オプションが指定された後、意見収集の指示を受けて、論題と価値観にオプションを添えて意見収集実行要求を、意見収集装置１００の意見収集管理部１２１へ送信する。

（ステップＦ４～Ｆ６）：
意見収集装置１００の意見収集手段１２１１は、意見閲覧分析支援端末２００で設定され、送信されてきた論題に関する意見を、文書データ１３１から収集し、図３Ｂで構成例を示した意見データ（Ｄ１）を得る（詳細は後述する。）。意見収集装置１００は、同意見データを、ステップＦ４にて意見収集装置１００側の意見データ格納エリア１２１５００３に格納する。また、意見収集装置１００は、同意見データをステップＦ５にて端末側に送信し、意見閲覧分析支援端末２００は、端末側の意見データ格納エリア２２１２００３に同意見データを格納する。

（ステップＦ７～Ｆ１０）：
意見収集装置１００は、さらに意見データ（Ｄ１）に含まれる各発言主体を集めて、発言主体データ（Ｄ２）を作成し、意見データ（Ｄ１）を構成する発言主体と、設定された各価値観に対して、発言主体の過去発言収集手段１２１２と価値観の重視度算出手段１２１３を用いて、発言主体の価値観に関する重視度を計算し、得られた重視度を表にまとめて発言主体×価値観別重視度データ（Ｄ３）を作成する。意見収集装置１００は、得られたデータＤ２とＤ３を意見収集装置１００側の発言主体データ格納エリア１２１５００４と発言主体×価値観別重視度データ格納エリア１２１５００５にそれぞれ格納する。また、意見収集装置１００は、得られたデータＤ２とＤ３をステップＦ９にて端末側に送り、意見閲覧分析支援端末２００は、Ｄ２を端末側の発言主体データ格納エリア２２１２００４、Ｄ３を端末側の発言主体×価値観別重視度データ格納エリア２２１２００５に格納する。

（ステップＦ１１Ａ・Ｂ）：
結果表示オプションが通常表示の場合には、意見閲覧分析支援端末２００は、意見データ（Ｄ１）に基づいて結果表示を行う。結果表示オプションが発言主体の価値観重視度反映表示の場合には、意見閲覧分析支援端末２００は、発言主体×価値観別重視度データ（Ｄ２）に基づいて、各発言主体を、価値観重視度に対応する座標位置に表示し、各発言主体の意見を、その位置に表示する。
意見閲覧分析支援端末２００は、価値観が「医学の進歩」と「動物の命」である場合、横軸に医学の進歩の重視度、縦軸に動物の命の重視度を取り、各発言者の各価値観の重視度に従って縦座標、横座標を決めて配置し、各発言者の賛否意見をその位置に、賛成意見は○反対意見は×で表示する。

図６は図５のステップＦ４にて、意見収集手段１２１１が所与の論題から論題に関する意見を収集する手順について説明する図である。
処理１２１１００１では、意見収集手段１２１１は、所与の論題Ｐに関する検索条件Ｑを作成する。例えば、検索条件Ｑは、単語分割・品詞付与手段１２６を論題Ｐに適用し、助詞や助動詞などの機能語を除去して得られる内容語のリストのＯＲ結合を取ることによって得られる。なお単純なＯＲ結合では、複数の内容語が大きく離れた位置に出現される場合も含まれてしまうので、それを防ぐために、出現位置の距離を制限する条件を加えることも良い方法である。
処理１２１１００２では、意見収集手段１２１１は、前記検索条件Ｑを文書検索手段１２２に与える。同検索手段は、検索用索引データ１３２を用いて検索を実行することにより、前記検索条件Ｑを満たす文書ＩＤのリストを得て、検索結果格納エリア１２１５０１１に格納する。

図１５Ｂは検索用索引データ１３２のデータ構成を示す図である。検索用索引データ１３２は、文書ＩＤと索引語のリスト（索引データ）を含み、索引語にはその文書中での出現回数と、出現位置のリストなどが記載されている。検索用索引データ１３２は、文書データ１３１に基づき、索引語を抽出することにより予め作成されたものである。また、本文中に出現する索引語の他、後に図８の処理　１２１３００２　において、発言主体を指定した検索を行う時のために、発言主体に関する索引もデータには含まれている（「発言主体＝Ｗ０２４」など）。
本文中に出現する索引語については、検索式が検索語の論理結合（ＡＮＤやＯＲやＮＯＴ等の組み合わせ）のみの場合には、索引語だけでも良い。出現回数によって優先順位を上下させる場合には回数も記入する。また複数の検索語が何語以内に現れるかも制約を付ける場合には出現位置も記載しておく必要がある。本実施例は索引語のみでも実施可能であるが、より論題と関連性の高い文書データを高い順位で検索するためには、出現回数や出現位置の情報もあった方が良い。ＯＲ結合の検索要求に対して文書検索手段１２２は、本データにアクセスし、条件式中のいずれかの語を索引語として含む文書の文書ＩＤをリストとして出力する。
ループ１２１１００３　では、意見収集手段１２１１は、前記検索された各文書ＩＤ（Ｉ）に、以下の処理１２１１０１０～１２１１０１３を行う。
処理１２１１０１０では、意見収集手段１２１１は、文書実体取得手段１２３により、所与の文書ＩＤ（Ｉ）に対して、文書データ１３１　を参照して、文書ＩＤ（Ｉ）に対応する文書内容のテキスト（本文）やタイトルを取得する。意見収集手段１２１１は、文書ＩＤ、文書内容のテキスト（本文）、タイトル等を意見データ格納エリア１２１５００３に格納する。

図１５Ａは文書データ１３１のデータ構成を示す図である。文書データ１３１は、文書ＩＤに対応する形で、文書のタイトルや本文の他、後述する発言主体データ１３３との対応を取るための発言主体識別子や、日時に関する情報を含む場合もある。これらの内必須となる構成要素は本文である。タイトルが無い場合には、本文の先頭部分で代用することもできる。
処理１２１１０１１では、意見収集手段１２１１は、前記テキストを文分割手段１２４により文単位に分割する。
文分割手段については、単語分割・品詞付与手段１２６をテキストに適用後、文末と認定される箇所（句点など）を切れ目として認定して分割するなどの方法がある。
ループ１２１１０１２では、意見収集手段１２１１は、前記分割された各文（Ｓ）毎に、以下の処理　１２１１０２０～１２１１０２３　を行う。
処理１２１１０２０では、意見収集手段１２１１は、文Ｓと論題Ｐとの関連性Ｒを算出する。意見収集手段１２１１は、関連性Ｒを意見データ格納エリア１２１５００３に格納する。関連性Ｒは、論題を構成するより多くの種類の内容語が、より狭い範囲に出現するほど高い値を示す値である。

計算方法の一例を以下に示す。
論題を構成するＮ種類の内容語が文Ｓに含まれている場合、Ｊを１からＮまでの整数として、各Ｊについて、Ｊ種類の内容語が文Ｓに含まれる最小区間の単語数（最初の出現位置から最後の出現位置までの単語数）をＤ（Ｊ）としてｒ（Ｊ）＝Ｊ×Ｊ÷Ｄ（Ｊ）を計算する。Ｊを１からＮまで動かした時のｒ（Ｊ）の最大値を関連性Ｒとするのは良い方法の一つである。仮にＮ種類の内容語が連続して出現していれば、Ｄ（Ｎ）＝Ｎであり、ｒ（Ｎ）＝Ｎ×Ｎ÷Ｎ＝Ｎ、すなわち内容語の種類数となる。離れて出現していればいるほど、低い値となる。
なおＮ個の内、Ｋ個（ただしＫ＞Ｎ／２）は連続して現れていて、残りは非常に離れた位置に出現する場合、ｒ（Ｋ）＝Ｋであるが、Ｊ＞ＫではＤ（Ｊ）が大きくなるためｒ（Ｊ）＜Ｋとなると考えられるので、その場合には関連性ＲはＫとなると考えられる。

上記関連性の計算方法を具体例により説明する。ここでＡ～Ｚは何らかの単語を表わすものとし、文Ｓは「Ａ　Ｂ　Ｃ　Ｄ　Ｅ　Ｆ　Ｇ　Ａ　Ｂ　Ｃ　Ｄ」であるとする。また論題Ｐの内容語はＡとＢとＦとＫであるとする。この場合文Ｓに含まれるのはＡとＢとＦなのでＮ＝３種類の内容語が含まれていることになる。そのため、文Ｓの論題Ｐに対する関連性Ｒを計算するには、Ｊ＝１，２，３に対してｒ（Ｊ）を計算してその最大値を求めることになる。Ｊ＝１の場合は１種類の単語が現れる最短区間であり、それは常にそれ自身の１なので、Ｄ（１）＝１であり、ｒ（１）＝１×１÷１＝１と計算される。Ｊ＝２の場合にはＤ（２）はＡとＢの最短区間が２、ＡとＦの最短区間は（順番を問わないので）ＦＧＡの３、ＢとＦの最短区間はＦＧＡＢの４である。従って２種類の内容語の最短区間はＡとＢの場合の２ということで、Ｄ（２）＝２となり、ｒ（２）は２×２÷Ｄ（２）＝２となる。Ｊ＝３の場合、３種類の単語はＡとＢとＦの組み合わせのみである。ＡとＢとＦが全部出現する最短区間はＦＧＡＢの４なので、Ｄ（３）＝４で、ｒ（３）＝３×３÷Ｄ（３）＝２．２５となる。結局ｒ（Ｊ）の最大値はＪ＝３の場合の２．２５ということになる。仮に文ＳのＧと次のＡの間にＸＹＺが挿入されて「Ａ　Ｂ　Ｃ　Ｄ　Ｅ　Ｆ　Ｇ　Ｘ　Ｙ　Ｚ　Ａ　Ｂ　Ｃ　Ｄ」であったと仮定すると、ｒ（１）ｒ（２）は同じであるが、Ｄ（３）はＡとＢとＦが全部出現する最短区間が最初のＡＢＣＤＥＦの６となるので、ｒ（３）＝３×３÷６＝１．５となり、この場合にはｒ（２）が最大で関連性Ｒ＝２と計算される。すなわち種類数が多くても、それらが離れて出現する場合には、より少ない種類数の単語がコンパクトに出現している箇所の方が勝つ場合がある、ということである。
なおここでは簡単のため、ｒ（Ｊ）＝Ｊ×（Ｊ÷Ｄ（Ｊ））としたが、（Ｊ÷Ｄ（Ｊ））をそのままＪと掛け算すると、Ｊ種類の最短出現区間長（Ｄ（Ｊ））の影響が強く効き過ぎる懸念があり、それを防ぐためには（Ｊ÷Ｄ（Ｊ））のルート（０．５乗）を取ってからＪと掛け算するのも良い方法である。また区間長に関する閾値Ｄ０を設け、この区間長内に出現している場合には、区間長による差を考慮しない、とする場合には、Ｊ１＝ＭＡＸ（Ｄ０，Ｊ），Ｄ１＝ＭＡＸ（Ｄ０，Ｄ（Ｊ））と定義して、ｒ（Ｊ）＝Ｊ×（Ｊ１÷Ｄ１）とするのも良い方法である。

処理１２１１０２１では、意見収集手段１２１１は、論題Ｐと関連性がある文Ｓについて、賛成・反対表現データ１２１６００１（図７Ａ）と否定表現データ１２１６００３（図７Ｃ）を参照して、論題に対する賛成・反対を判定する。関連性があるかどうかは、例えば、関連性Ｒが予め定めた閾値と比較することで判定することができる。意見収集手段１２１１は、賛成・反対についての項目（＋１、－１）を意見データ格納エリア１２１５００３に格納する。賛成表現があり反対表現がなければ賛成、逆に賛成表現が無く、反対表現があれば反対とし、否定表現が複数ある文については、個数が奇数の場合に賛成か反対かを逆転させる。
処理１２１１０２２では、意見収集手段１２１１は、論題Ｐとの関連性があり、賛成か反対と判定された文Ｓについて、理由・証拠表現データ１２１６００２（図７Ｂ）を参照して理由・証拠の有無を判定する。意見収集手段１２１１は、理由・証拠の有無により、理由証拠スコアを意見データ格納エリア１２１５００３に格納する。
処理１２１１０２３では、これら文Ｓについて、意見収集手段１２１１は、発言表現データ１２１６００４（図７Ｄ）との照合により発言主体を特定する。意見収集手段１２１１は、発言主体識別子を意見データ格納エリア１２１５００３に格納する。例えば、発言表現の主語に相当する構文要素が発言主体に相当するとして発言主体を特定できる。名寄せ手段１２７　により発言主体データ１３３のエントリーに帰着できる場合には、そのエントリーを発言主体として取る。また固有表現抽出手段１２８により発言の日時が特定できる場合には、その日時を発言の日時として取る。

図１５Ｃには発言主体データ１３３の一例が示されている。発言主体データは前出のように名称、および別称、所属組織（もしくは上位組織）識別子などで構成されている。文Ｓの中や前後に図７Ｄに示した発言表現の述語が出現している場合には、意見収集手段１２１１は、その主語を取り、発言主体データの名称か別称とのマッチングを取ることにより発言主体を特定する。特定できない場合には、後述するように、意見収集手段１２１１は、文書データ（図１５Ａ）中に当該文書の発言主体が登録されていれば、それを発言主体として推定する。
日時の特定については、意見収集手段１２１１は、「＜数字＞年＜数字＞月＜数字＞日」のようなパターンと前後の文脈とマッチングを取り、成功した場合には、その値を発言の日時として取る。マッチングが取れない場合には、意見収集手段１２１１は、やはり文書データ（図１５Ａ）中に当該文書の日時が登録されていれば、それを発言の日時として推定する。

意見収集手段１２１１は、以上１２１１０２０から１２１１０２３までの処理の繰り返しによりループ１２１１０１２を抜けた後、文の発言主体や発言日時が特定できてないものについては、デフォールトの値を用いる。すなわち、処理１２１１０１３では、論題Ｐと関連性があり、賛成・反対の判定ができる文が一つでもあれば、本文書（Ｉ）に関するデフォールトの発言主体、デフォールトの発言日時、およびタイトルを、文書データ１３１（図１５Ａ）から取得する。
意見収集手段１２１１は、以上１２１１０１０から１２１１０１３までの処理の繰り返しによりループ１２１１００３を抜けた後、処理１２１１００４では、得られた意見データ（図３Ｂ）を、論題Ｐとの関連性Ｒ（関連性スコア）を第１の整列キーとして降順にソートし、続いて理由・証拠の有無（理由・証拠スコア）を第２のキーとして降順にソートする。収集された意見の個数がオプション指定された上限値を超える場合は、ソート後の順位がその個数を超える部分は捨てる。

図７Ａは、意見収集の際に用いる、賛成・反対表現データ１２１６００１の一例を示す図である。語句と賛否の情報が書かれている。賛否についてはここでは賛成を１、反対を－１としている。
図７Ｂは、意見収集の際に用いる、理由・証拠表現データ１２１６００２の一例を示す図である。理由や証拠を示す際に使われる語句とその文法情報を含む。
図７Ｃは、意見収集の際に用いる、否定表現データ１２１６００３の一例を示す図である。否定を表わす際に使われる語句とその文法情報とを含む。
図７Ｄは、意見収集の際に用いる、発言表現データ１２１６００４の一例を示す図である。発言を表わす際に使われる語句とその文法情報とを含む。
なお図７Ａ～図７Ｄの左図は日本語バージョン、右図は英語バージョンを示す。

図８は、価値観の重視度算出手段１２１３が、所与の発言主体と所与の価値観について、発言主体の過去の発言を収集し、収集された発言から価値観に関する重視度を計算する手順について説明する図である。
初めに処理１２１３０００では、重視度算出手段１２１３は、求めるべき重視度の値（Ｖ）をゼロクリアする。
処理１２１３００１では、重視度算出手段１２１３は、所与の価値観に文構造解析手段１２５を適用し、得られる文構造（ＶＳ）を、価値観の文構造格納エリア１２１５０２１　に格納する。その構文構造の最上位構文要素の主部が促進・抑制語句データ１２１６０１２（図９Ｂ）との照合により、促進・抑制語に該当する場合には、促進・抑制の対象となる構文要素を最上位構文要素とし、抑制の場合には、価値観の反転フラグ（Ｒｅｖ）をオンにする。Ｒｅｖの初期値はオフである。

図１６に、価値観が「医学の進歩」である場合に、価値観の文構造格納エリア１２１５０２１　に格納されるデータの例が示されている。文構造解析手段の出力結果である初期の構造では、最上位（１番の構文要素）は主部が述語「進歩」の単文であり、その動作主体となる２番の構文要素は主部が名詞「医学」の項である。促進・抑制語句データ１２１６０１２（図９Ｂ）を参照すると「進歩」は動作主体に対して促進性を持つことが分かるので、その促進・抑制の対象である２番の構文要素（主部が「医学」の項）が最上位の構文要素として取られる。また「進歩」は促進方向なので、反転フラグはオフとなる。
文構造解析手段１２５は文構造解析用辞書１３５を参照しながら、文構造を構成する。

図１７に、同辞書の一例が示されている。文構造解析用辞書１３５は単語名称とその品詞情報に加えて、動作を表わす語の場合には、動作主や動作対象などの意味役割と、その意味役割を担う項の探索ルールを含む。例えば進歩の場合、意味役割として主体があるが、その探索ルールは動作主となっている。辞書付属の探索ルールリストには、動作主を探索する際の助詞の優先順位が示されているので、その順に該当する項を探す。「医学の進歩」の場合、４番目の「の」が該当するので、医学が動作主として取られることになる。ただし、「進歩させる」のように使役の助動詞が付く場合には、動作対象のルールに従って項の探索が行われる。
処理１２１３００２では、重視度算出手段１２１３は、所与の発言主体の発言であることを検索条件として文書検索手段１２２に与え、検索用索引データ１３２に基づく検索を実行させることにより、前記発言主体の発言である文書ＩＤのリストを得る。
処理１２１３００３では、重視度算出手段１２１３は、前記文書ＩＤのリストが予め定められた規定数に達しない場合の措置として、発言主体データ１３３（図１５Ｃ）の所属（上位）組織識別子を参照し、それが登録されていた場合には、発言主体がその上位組織であることを条件として検索を実行し、文書ＩＤのリストを得て不足分を補うものとする。本処理は必ずしも必須では無いが、検索される文書数が少ない場合の救済措置として有効である。なお本処理は副作用がある場合もあるので、それを行うか行わないかはオプションとして設定できることが望ましい。
続いてループ１２１３００４では、重視度算出手段１２１３は、前記検索された各文書ＩＤ（Ｉ）毎に処理１２１３０１１以下処理１２１３０１３までの処理を実行する。
処理１２１３０１１では、重視度算出手段１２１３は、文書実体取得手段１２３に文書ＩＤ（Ｉ）を与えて、文書データ１３１（図１５Ａ）から文書内容のテキスト（本文）を取得する。
処理１２１３０１２では、重視度算出手段１２１３は、前記テキストを文分割手段１２４により文単位に分割する。

続いてループ１２１３０１３に入り、重視度算出手段１２１３は、前記分割された各文Ｓに、処理１２１３０２１とループ１２１３０２２を実施する。
処理１２１３０２１では、重視度算出手段１２１３は、文構造解析手段１２５に文Ｓを適用し、構文構造データを得て文構造格納エリア１２１５０２３に格納する。後に図１０の説明部分において、例文を用いて構文構造作成方法について具体的に説明する。文構造の解析は文法と構文解析用辞書１３５（図１７）に基づく処理である。次にループ１２１３０２２に入り、重視度算出手段１２１３は、前記構文構造を構成する構文要素Ｐで価値観と意味相似性を有するものについて、処理１２１３０３１～１２１３０３３を行う。
処理１２１３０３１では、重視度算出手段１２１３は、前記価値観の文構造（ＶＳ）と構文要素Ｐの意味相似度Ｓｉｍを計算する。ここでＶＳは前記処理１２１３００１において、所与の価値観に文構造解析手段１２５を適用して得られ、価値観の文構造格納エリア１２１５０２１に格納されたものである。

以下意味相似度Ｓｉｍの計算方法の詳細について示す。
文構造ＶＳのトップの構文要素の主部と構文要素Ｐの主部と一致するか、もしくは意味相似語句対データ１２１６０１１に登録されている相似語句対に相当するかを調べ、一致している場合にはＳｉｍ＝１、相似対である場合にはデータに記されている相似度の値をＳｉｍとする。価値観がトップの構文だけの場合にはこれで終わりである。価値観が項を伴う場合には、構文要素Ｐの側にも同じ役割子の項が無ければＳｉｍ＝０となり、有れば項どうしの相似性を計算し、前記のＳｉｍに掛け算する。価値観側に項が複数ある場合には、すべてについて構文要素Ｐの側にも同じ役割子の項があることが条件となり、文構造ＶＳと構文要素Ｐの対応する項どうしの相似性をすべて計算して掛け算する。価値観側に連体修飾が付いている場合には、構文要素Ｐの側にも対応する連体修飾がついていることが条件となり、それらの間の相似性を計算して掛け算する。

後に示す図１０の例文の構文構造の場合、価値観が「医学の進歩」であるとすると、価値観の構文構造ＶＳは主部が医学の項であることになるので、Ｓｉｍの値がプラスとなるのは、構文要素が１０番の項ということになり、この場合には主部の単語が一致するので、Ｓｉｍ＝１．０となる。もし構文要素１０番の主部が医療であれば、意味相似語句対データ１２１６０１１で「医学」との類似度係数が１．０なのでやはりＳｉｍ＝１．０となり、主部が「薬剤」であれば、類似度係数が０．２なのでＳｉｍ＝０．２となる。
処理１２１３０３２では、重視度算出手段１２１３は、構文要素Ｐの文Ｓ中における文脈ファクターＣｔｘＦａｃｔｏｒを文脈ファクター計算手段１２１４により計算する。計算方法の詳細については後に図１０、図１１を用いて説明する。
処理１２１３０３３では、重視度算出手段１２１３は、前記意味相似度Ｓｉｍと前記文脈ファクターＣｔｘＦａｃｔｏｒから、構文要素Ｐの価値観支持度（ｓ）を算出し、求めるべき重視度の値（Ｖ）に加算する。価値観の反転フラグ（Ｒｅｖ）がオンの場合には減算する。価値観の支持度（ｓ）の計算方法としては、類義度Ｓｉｍと文脈ファクターＣｔｘＦａｃｔｏｒの積によって求めるのは一つの好ましい方法である。　
以上で、３重のループ１２１３０２２、１２１３０１３、１２１３００４　を抜け、重視度算出手段１２１３は、処理１２１３００５において、得られた重視度Ｖの値を出力する。

図９Ａは、重視度計算時に用いる、意味相似語句対データ１２１６０１１の一例を示す図である。データは意味相似性を有する語句の対とその相似度係数を含む。相似度係数は０より大きく１．０以下の実数である。大きいほど相似していることを示す。
図９Ｂは、重視度計算時に用いる、促進・抑制語句データ１２１６０１２の一例を示す図である。促進性や抑制性を有する語句と、それが何を促進したり抑制したりするのかを示す対象役割子と、促進・抑制の度合いを示す係数を含む。対象役割子は、一般に複数であり、優先順位順にリストされている。例えば「促進」の場合、対象に相当する「○○を」という構文要素を伴っている場合にはそれが促進対象として取られ、それが無くて、「○○が」という動作主体を表わす構文要素がある場合には、それが促進対象であることを示す。促進・抑制係数は正の場合が促進であり、負の場合が抑制である。

図１０は、図８に示した方法を用いて重視度を計算した時に、文格納エリア１２１５０２０に格納された文の例と、その構文構造を解析した結果として得られる、文構造格納エリア１２１５０２３の内容を示した図である。例文は「医学の発展を阻害する要因を一つ一つ取り除いていくために、我々は何をすべきか、じっくりと考えてみる必要があるのではなかろうか。」である。　参考のため、英語の例文の場合も示した。例文の構造は、最上位の構文要素（要素番号１）は、主部となる述語が「考える」の単文であり、動作の対象が番号２番の構文要素であることなどが記録されている。その他、文末に当たる補助部が「・・・てみる必要があるのではなかろうか」、また修飾部（連用修飾）が「じっくりと」であることも記されている。
文末補助部は、図１２Ｂに示されるような補助部ファクターデータ１２１６０２２　に登録されている表現や、助動詞、助詞、接続詞などの機能語の連接を文末から取れるだけ取ることによって得られる。本例の場合「てみる／必要がある／の／で／は／なかろうか」の中、「てみる」「必要がある」「なかろうか」の３部分は補助部ファクターデータに登録されており、残りの「の」「で」「は」はそれぞれ形式名詞、助動詞および助詞で、機能語として取られたものである。次いで「考える」が構文解析用辞書（図１７）から、対象（考える内容）と主体（誰が考えたか）を意味役割として取る主部として取られる。対象としては、節の探索ルールに従って先頭から「何をすべきか」までの節が取られ、主体は該当なしとなる。また「じっくりと」のように主部を修飾する副詞は修飾部に追加される。

次に考える内容に相当する部分、すなわち文頭から「何をすべきか」までの部分の解析に移る。この部分は、「ＡするためにＢする」という目的（Ａ）－手段（Ｂ）のパターンに合致するので、２番の構文要素は主部が「目的－手段」の複文となり、役割１には目的、役割２には手段が登録される。本例では、それぞれ６番と３番の構文要素となっている。
手段に相当する部分は「我々は何をするべきか」であり、文末から機能語「べき」と「か」が取られ文末補助部となる。次に構文解析用辞書から動詞「する」が主体と対象を意味役割として取ることが分かり、それぞれの対応項の探索ルールに従って、それぞれ「我々」と「何」であることが分かる。以上から３番の構文要素は、主部の述語が「する」の単文であり、主体に相当する「我々」が４番の構文要素となり、対象に相当する「何」が５番の構文要素となる。
目的に相当する構文要素６番は、述語「取り除く」が主部の単文であり、取り除く対象が７番の構文要素であり、それは名詞「要因」が主部の項である。この７番の項には連体修飾が付いており、それが述語「阻害する」を主部に持つ８番の構文要素である。８番の動作主が７番の要因であり、阻害される対象が９番の構文要素である。９番の構文要素は述語「発展」を主部に持つ単文であり、発展する主体が１０番の医学を主部に持つ項である。英文の解析方法も同様にして行われるので説明は省略する。

図１１は、図１０と同じ例文に関して重視度計算をしている時の文脈ファクター計算ワークエリア１２１５０２４の内容を示した図である。構文要素番号は図１０の構文要素番号と対応している。各構文要素に対して主部ファクター、補助部ファクター、修飾部ファクターのコラムと、文脈ファクター計算のためのコラムが容易されている。
主部ファクター欄には、構文要素の主部に対応する計算式を、主部ファクターデータ１２１６０２１を参照して、該当するものを格納する。補助部ファクター欄には、補助部ファクターデータ１２１６０２２を参照して計算した値を格納する。補助部ファクターの計算では、補助部について先頭から最長一致でデータに登録されている表現とのマッチングを行い、マッチングが取れたもののファクターの掛け算で値を得るのが簡便で好ましい方法である。マッチングが取れない場合にはデフォールト値を１．０とする。図ではデフォールト値は（）内に表示している。
修飾部ファクター欄には、修飾部ファクターデータ１２１６０２３を参照して該当するものがあれば対応する値を格納する。無ければデフォールト値は１．０とする。
主部ファクターに記載の計算式は、項（下位の構文要素）の文脈ファクターからその構文要素の文脈ファクターを計算する計算式である。補助部ファクターは構文構造の補助部に関するファクターであり、修飾部ファクターは、構文構造の修飾部に関するファクターである。文脈ファクターは構文要素を指定して、そこから構文構造の上位に向かって計算する。

例文の場合、価値観が「医学の進歩」であるとすると、価値観と意味相似性がプラスになるのは、図８の処理１２１３０３１の説明時に示したように、構文要素が１０番の項（「医学」に相当する項）ということになる。従って、ここでは１０番の構文要素の文脈ファクターを計算する方法について説明する。
まず１０番の構文要素に対して文脈ファクター１．０が与えられる。次いで、１０番の構文要素だけから決まる構文要素を探索し、９番の構文要素がそれであることが分かる。主部ファクターは１０番の文脈ファクター×１．０で１．０と計算される。以下同様の作業を繰り返すと、順番に（１）８番の文脈ファクターが‐１．０、（２）７番が‐１．０、（３）６番が１．０、（４）２番が１．０、（５）１番が０．６というように順に計算されていくことになる。（１）～（５）について以下に詳しく説明する。
（１）８番は「○○を阻害する」という構文要素であり、主部ファクターは（－１）×（阻害対象となる９番のファクター＝１．０）である。これから‐１．０と計算される。（２）７番は８番が連体修飾していることから、８番のファクターを引き継いで－１となる。（３）６番は「７番を取り除く」であり、主部ファクターは‐１．０×（取り除く対象である７番のファクター＝－１．０）＝１．０と計算される。
（４）２番は（６番の目的）のために（３番を行う）で、主部ファクターは６番と３番のＭａｘで計算される。この場合６番は１．０で３番は０．０なので、主部ファクターは１．０と計算される。（５）１番は、主部は「２番を考える」で２番のファクター×０．８で０．８と計算される。また補助部ファクターは図１２Ａの補助部ファクターデータ１２１６０２２を参照して、「なかろうか」を含むことから０．７と計算され、修飾部ファクターデータ１２１６０２３を参照して「じっくりと」のファクターが１．２と計算される。これらを掛け算して０．８×０．７×１．２＝０．６７で文脈ファクターが計算される。

図１２Ａは、文脈ファクター計算時に用いる、主部ファクターデータの一例を示す図である。主部ファクターデータは、構文要素の種類（複文・単文）、主部、項の役割子のリスト、と主部ファクターを含む。構文要素種類が複文の場合は、原因‐結果と目的―手段、など数は限定的である。構文要素が単文の場合には、動詞が主部となり、動作主や動作対象などが項の役割子となる。主部ファクターは項に対応する値から計算する計算式として与えられる。
図１２Ｂは、文脈ファクター計算時に用いる、補助部ファクターデータの一例を示す図である。補助部ファクターデータは、補助部の表現と対応するファクターの値を含む。自信をもって言い切っているほど絶対値が大きく、ぼやかした表現の場合には絶対値が小さい。また否定の場合には負の値となる。３番の「ない」は１番や２番に含まれるが、長い方が優先であり、１番や２番がマッチした部分には３番は適用されない。
図１２Ｃは、文脈ファクター計算時に用いる、修飾部ファクターデータの一例を示す図である。副詞などの修飾表現とそのファクター値を含む。強める働きの語には大きな値、ぼやかす働きの語には小さな値が与えられる。

以上のように、本実施例に関わる意見収集システムは、関心を持っている論題と共に、論題に関わる複数の価値観を設定することにより、論題に関する意見の発言主体が前記価値観をどの程度重視しているかを計算し、その値に基づいて前記発言主体の表示位置を決め、その発言主体の意見をその位置に基づいて提示する。これにより、収集された意見を、その発言者が前記価値観に関してどの程度重視しているかという考え方のバックグラウンドを把握しながら読み、また分析することが可能となる。

また、図１３に示したように、同じ発言主体であっても、年代と共に価値観の重視度が変化することが考えられるが、年代区分の設定手段部２５１７を設けることにより、発言主体と年代を組にして扱うことにより、発言主体の価値観に関するバックグラウンドが変化する様子も捉えることが可能である。

実施例１は、具体的な適用例として、賛否の分かれる社会問題に関する意見の収集を対象としているが、その他、製品やサービスに関する意見や、政治・外交・安全保障上の論題であっても良い。

図１４Ａは、製品やサービスに関する意見収集に適用した場合の図である。
製品やサービスの場合には、価値観としては、価格と性能が代表的である。意見を述べている人によって価格重視派や性能重視派、バランス派がいることが想定される。意見一覧表示部２５１５は、価格を横軸に性能を縦軸に取って結果表示した図である。性能が良いが価格は高い製品は性能重視派の人には好評価、価格重視派の人には不評となりがちである。そのような中で、価格重視派の人で項評価をしている人がいれば、その意見は参照してみたくなるであろう。
なお、性能については、製品によって観点が変わってくるので、意味相似語句対データ１２１６０１１には、性能と意味相似性を有すると考えられる語句を登録しておく必要がある（例えば速度、強度、容量、安全性など）。

一方、図１４Ｂは、政治・外交・安全保障上の論題での意見分析の場合に、国家間で意見の対立があるような論題が取り上げた場合である。
Ａ国とＢ国が対立しているような場合にＡ国側の主張ＰにＢ国が反対しているとして、当事国以外からはどのような意見が出ているか分析するような場面である。この場合、価値観としては、横軸にＡ国との関係をより重視する度合い、縦軸にＢ国との関係を重視する度合いを取ることが考えられる。国や人によって、このバランスは違ってくるだろう。通常はＢ国重視派の人が意見Ｐには賛成だったり、通常はＡ国重視派の国から意見Ｐに反対する意見が出ていたりすれば、意外性から興味を感じるであろう。

Ｃ．実施例の効果

本実施例によれば、発言内容が記載された文書群を対象として、所与の論題に関する複数の意見を、論題に関わる複数の価値観に関する各発言者の考え方の重視度（バックグラウンド等）を把握しながら読むことができるようになる。また、本実施例によれば、意外性や信頼性を念頭に置きながら各意見を読むことができ、意見分析の質と効率を向上させることができる。

Ｄ．付記

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれている。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記録装置、または、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。
　また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

　本発明の意見収集装置及びシステム及び意見収集方法は、その各手順をコンピュータに実行させるための意見収集プログラム、意見収集プログラムを記録したコンピュータ読み取り可能な記録媒体、意見収集プログラムを含みコンピュータの内部メモリにロード可能なプログラム製品、そのプログラムを含むサーバ等のコンピュータ、等により提供されることができる。

１００：意見収集装置、１１０：演算部、１２０：主記憶部、１２１：意見収集管理部、１２１１：意見収集手段、１２１２：発言主体の過去発言収集手段、１２１３：価値観の重視度算出手段、１２１４：文脈ファクター計算手段、１２１５：意見収集ワークエリア、１２１６：意見収集用規則・データ集、１２２：文書検索手段、１２３：文書実体取得手段、１２４：文分割手段、１２５：文構造解析手段、１２６：単語分割・品詞付与手段、１２７：名寄せ手段、１２８：固有表現抽出手段、１３０：補助記憶部、１３１：文書データ、１３２：検索用索引データ、１３３：発言主体データ、１３４：価値観データ、１３５：文構造解析用辞書、１４０：入力部、１５０：表示部、１６０：通信部。
１２１５００１：論題格納エリア、１２１５００２：価値観格納エリア、１２１５００３：意見データ格納エリア、１２１５００４：発言主体データ格納エリア、１２１５００５：発言主体×価値観別重視度格納エリア、１２１５０１０：検索条件格納エリア、１２１５０１１：検索結果格納エリア、１２１５０１２：文書実体格納エリア、１２１５０１３：書誌情報格納エリア、１２１５０２０：文格納エリア、１２１５０２１：価値観の文構造格納エリア、１２１５０２２：価値観の反転フラグ格納エリア、１２１５０２３：文構造格納エリア、１２１５０２４：文脈ファクター計算ワークエリア。
１２１６００１：賛成・反対表現データ、１２１６００２：理由・証拠表現データ、１２１６００３：否定表現データ、１２１６００４：発言表現データ、１２１６０１１：意味相似語句対データ、１２１６０１２：促進・抑制語句データ、１２１６０２１：主部ファクターデータ、１２１６０２２：補助部ファクターデータ、１２１６０２３：修飾部ファクターデータ。
２００：意見閲覧分析支援端末、２１０：演算部、２２０：主記憶部、２２１：　意見閲覧分析支援管理部、２２１：意見閲覧分析支援管理部、２２１１：意見閲覧分析支援手段、２２１１：意見閲覧分析手段、２２１２：ワークエリア、２３０：補助記憶部、２４０：入力部、２５０：表示部、２５１：意見閲覧分析支援画面、２５１１：論題設定部、２５１２：価値観設定部、２５１３：オプション設定部、２５１４：意見一覧表示部、２５１５：意見一覧表示部、２５１６：個々の意見の詳細表示部、２５１７：年代区分設定部、２６０：通信部。
２２１２００１：論題格納エリア、２２１２００２：価値観格納エリア、２２１２００３：意見データ格納エリア、２２１２００４：発言主体データ格納エリア、２２１２００５：発言主体×価値観別重視度データ格納エリア。
３００：通信ネットワーク、４００：印刷手段、１０００：意見収集システム、

Claims

　意見収集装置であって、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を備え、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記意見データは、さらに論題との関連性を含み、
　前記演算部は、
　前記検索された文書内容の発言主体の集合と、前記論題との関連の強さを示す関連性とを求め、
　関連性の高い順に選択した複数の前記意見データを予め定められた数だけ作成する
ことを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記文書データは、さらに、文書ＩＤに対応して文書内容を含み
　前記意見データは、さらに、文書ＩＤ、論題との関連性を含み、

　前記演算部は、
　前記論題を、単語分割し、助詞及び助動詞及び他の機能語を除去して得られる内容語のリストによって、前記論題に関する検索条件を作成し、前記文書データを検索して、前記検索条件を満たす文書ＩＤのリストを得て、
　前記検索された各文書ＩＤに対して、前記文書データを参照して、文書ＩＤに対応する文書内容を取得し、
　文書内容を分割した各文毎に、文と前記論題とについての、前記論題を構成するより多くの種類の内容語が、より狭い範囲に出現するほど高い値を示すように関連性を算出し、前記論題と関連性がある文について、予め定められた発言を表現したデータとの照合により発言主体を特定し、
　文書ＩＤ、関連性及び発言主体を、前記発言データに含めて前記記憶部に記憶する
ことを特徴とする意見収集装置。
　請求項３に記載された意見収集装置において、
　前記演算部は、
　文の発言主体や発言日時が特定できてない文章内容については、前記文書データを参照し、各文について、該文を含む文書に関するデフォールトの発言主体を取得することを特徴とする意見収集装置。
　請求項４に記載された意見収集装置において、
　前記演算部は、
　得られた前記意見データを、前記論題との関連性を第１の整列キーとして降順にソートし、及び／又は、収集された文書内容の個数がオプション指定された上限値を超える場合は、ソート後の順位がその個数を超える部分は捨てることを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記演算部は、
　前記重視度を計算する計算する処理において、
　前記文書データを参照して、前記発言主体の過去の前記文書データを検索し、
　検索された過去の前記文書データを文単位に分割し、
　分割された各文について、その文を構文解析して構文構造を構成する構造要素を得て、
　構文解析結果の各構文要素について、前記価値観との意味相似性（Ｓｉｍ）を計算し、
　前記構文要素の文中において、価値観に対する支持度に文脈が与える影響を表す文脈ファクターを計算し、
　前記意味相似性（Ｓｉｍ）と文脈ファクターから文の価値観に対する重視度（Ｖ）を計算し、
　各文の価値観に対する重視度（Ｖ）の累積により、発言主体の前記価値観に対する重視度を計算する
ことを特徴とする意見収集装置。
　請求項６に記載された意見収集装置において、
　前記演算部は、
　前記価値観の文構造のトップの構文要素の主部と、各構文要素の主部とが一致するか、及び、語句間の意味相似性を示す予め定められた意味相似語句対データに登録されている相似語句対に相当するかを調べることにより、意味相似性（Ｓｉｍ）を求めることを特徴とする意見収集装置。
　請求項６に記載された意見収集装置において、
　前記記憶部は、
　構文要素の主部に対して、下位の構文要素の文脈ファクターから自身の文脈ファクターを計算する計算式を定める主部ファクターのデータと、
　構文要素の文末表現に当たる補助部の文脈ファクターに与える影響をデータ化した補助部ファクターのデータと、
　構文要素の修飾表現が文脈ファクターに与える影響をデータ化した修飾部ファクターのデータ
を含み、

　前記演算部は、
　前記文脈ファクターを計算する処理において、
　主部ファクターと補助部ファクターと修飾部ファクターをデータに基づいて各構文要素に割り当て、
　指定された構文要素から上位の構文要素に向かって、前記主部ファクターの与える計算式に従って各構文要素の主部ファクターを計算し、
　計算された主部ファクターの値に、補助部ファクターと修飾部ファクターを相乗して文脈ファクターを計算する
ことを特徴とする意見収集装置。
　請求項６に記載された意見収集装置において、
　前記演算部は、
　価値観から得られる構文構造を求め、
　前記構文構造の最上位構文要素の主部が、予め定められた、事象の促進・抑制に関与する促進・抑制語に該当する場合には、促進・抑制の対象となる構文要素を最上位構文要素とし、抑制の場合には、価値観の反転フラグを設定し、
　前記意味相似性（Ｓｉｍ）と前記文脈ファクターから、各構文要素の価値観支持度（ｓ）を算出し、重視度（Ｖ）に、加算又は価値観の反転フラグが設定されている場合には減算する
ことを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記表示部には、
　発言主体別及び価値観別重視度データを参照して、各発言主体に対して、横軸用の第１価値観に対する重視度を横座標に、縦軸用の第２の価値観に関する重視度を縦座標として、各発言主体が表示されることを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記表示部には、
　意見データを参照して、各文書内容を、その文書内容の発言主体の表示位置に対応づけて表示されることを特徴とする意見収集装置。
　請求項１に記載された意見収集装置において、
　前記発言データは、さらに年代区分を含み、
　前記演算部は、
　年代区分毎の発言主体別及び価値観別重視度データを作成して記憶部に記憶し、発言主体の価値観に関する重視度が変化する様子を表示部に表示又は出力部に出力させることを特徴とする意見収集装置。
　意見収集システムであって、
　端末と、
　前記端末と通信ネットワークを介して接続された意見収集装置と
を備え、

　前記意見収集装置は、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を有し、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集システム。
　請求項１３に記載された意見収集システムにおいて、
　前記意見収集装置は、前記端末に、前記意見データ及び前記発言主体別及び価値観別重視度データを送信し、
　前記端末は、
　前記論題及び前記ひとつ又は複数の価値観を入力するための入力部と、
　前記意見収集装置から受信した前記意見データ及び前記発言主体別及び価値観別重視度データを記憶する端末記憶部と、
　前記意見データ及び前記発言主体別及び価値観別重視度データを、表示する表示部又は出力する出力部と
　通信、記憶、表示処理を行うための端末演算部と
を備えたことを特徴とする意見収集システム。
　意見収集装置における意見収集方法であって、
　前記意見収集装置は、
　文書内容を含む文書データを予め複数保持し、文書内容及び発言主体を含む意見データを複数保持し、発言主体別及び価値観別重視度データを保持する記憶部と、
　演算部と、
を備え、

　前記演算部は、
　端末により入力された、何に関する文書を収集するかを定める論題と、前記論題の是非を判断する際に影響を及ぼすと考えられるひとつ又は複数の価値観と、を受信し、
　受信した前記論題に関する文書内容を前記文書データから検索し、
　前記検索された文書内容の発言主体の集合を求め、文書内容及び発言主体を含む複数の意見データを前記記憶部に記憶し、
　前記意見データに含まれる発言主体毎に、各前記価値観に対する重視度を計算し、
　計算された重視度から発言主体別及び価値観別重視度データを作成し、前記記憶部に記憶し、
　前記発言主体別及び価値観別重視度データを、表示部に表示又は出力部に出力させる
ことを特徴とする意見収集方法。