JP6250833B2 - 文書検索システム、ディベートシステム、文書検索プログラム - Google Patents
文書検索システム、ディベートシステム、文書検索プログラム Download PDFInfo
- Publication number
- JP6250833B2 JP6250833B2 JP2016556058A JP2016556058A JP6250833B2 JP 6250833 B2 JP6250833 B2 JP 6250833B2 JP 2016556058 A JP2016556058 A JP 2016556058A JP 2016556058 A JP2016556058 A JP 2016556058A JP 6250833 B2 JP6250833 B2 JP 6250833B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- article
- phrase
- score
- promotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Description
図1は、本発明の実施形態1に係る文書検索装置100の機能ブロック図である。文書検索装置100は、与えられた議題に対して肯定または否定の立場に立って人を説得するために用いる材料(情報)を記事から検索する装置である。文書検索装置100は、入力装置110、出力装置120、CPU(Central Processing Unit)130、メモリ140、記憶装置150を備える。
文書検索装置100は、例えばディベートにおいて与えられた議題に関して、参加者が肯定または否定の立場に立って論述する際に、自身の立場を補強するため用いることができる材料(情報)を複数の記事から検索する。議題の例としては、(a)「施策Aを導入するべき」「日本企業は新卒採用を通年にするべき」「日本は消費税を上げるべき」など、ある制度、政策、施策を導入または実施するか否かを対象とした政策議題、(b)「AはBよりも優れている」などのように比較目的の価値議題、などがある。ディベートの場合には、議論の対象を明らかにするために、議題を詳しく説明した議題説明文が与えられる場合もある。
類義語辞書152は、単語またはフレーズ同士の同義関係や類義関係を格納する辞書である。例えば、「食物」と「食品」は類義関係にある。上位下位関係辞書153は、単語またはフレーズ同士の概念的な上位下位関係を記述したものである。例えば、「犬」は「動物」の下位概念であり、「動物」は「犬」の上位概念である。
図3は、文書検索装置100の動作を示すフローチャートである。文書検索装置100は図3のフローチャートにしたがって、与えられた議題に関する有用な論点について述べている記事を検索する。参加者はその記事を参考資料として、自身の立場を補強する議論を展開することができる。以下図3の各ステップについて、後述する図面を参照しながら説明する。
ユーザは、入力装置110を用いて、文書検索装置100に対して議題を入力する。議題に加えて、議題を詳しく説明するための議題説明文も同時に入力してもよい。さらにユーザは、当該議題について肯定側に立った場合に有用な情報を収集するか、否定側に立った場合に有用な情報を収集するかについても、併せて文書検索装置100に対して指示する。以下の説明では議題説明文が与えられているものとして説明するが、与えられていない場合は議題説明文を用いた処理を省略する。ユーザは、抽出すべき論点(後述)の個数を併せて指定することもできるし、論点の個数については文書検索装置100へ一任することもできる。
検索部131は、与えられた議題と議題説明文、および価値促進抑制テーブル151に基づいて、議題に対して肯定側または否定側の立場に立った場合に有用な情報を含むと考えられる文書を、記事DB160から検索する。記事DB160は、例えばニュース記事、Web上の文書、論文、などのような、何らかの事項について論述する記事を収集したデータベースである。
検索部131は、記事DB160が格納している各記事のTF−IDF(Term Frequency−Inverse Document Frequency)をあらかじめ計算し、記事DB160に格納しておく。検索部131は、議題をひとつの記事とみなし、記事DB160が格納している各記事に対する当該議題のTF−IDFを計算する。検索部131は、議題のTF−IDFと記事DB160が格納している各記事のTF−IDFとの間のコサイン類似度を計算し、例えば類似度の上位から順に所定件数の記事を抽出する。議題説明文が与えられている場合は、議題説明文のTF−IDFと記事DB160が格納している各文書のTF−IDFとの間の類似度も計算し、類似度の上位から順に所定件数の記事を抽出する。
TF−IDFを計算する際に、各記事、議題、議題説明文に含まれる語句として、文章内に記載されている語句だけでなく、類義語辞書152や上位下位関係辞書153を用いて、それらの類義語や上位下位語のTF−IDFを計算してもよい。これにより、類義語を含む議題、議題説明文、記事間の類似度が大きくなるため、語句の類義関係や上位下位関係も考慮して記事を検索することができる。
検索部131は、議題と議題説明文からキーワードを抽出し、そのキーワードを検索キーとして記事DB160から記事を検索する。キーワードは、議題と議題説明文から重要語を抽出することによって生成する。以下に例示する3議題は、Debatabase(http://idebate.org/)から取得した議題の例である。
(議題例2)This House believes that children should be allowed to own and use mobile phones.
(議題例3)This house would censor the internet.
(議題例2)children allowed own use mobile phones
(議題例3)censor internet
文書検索装置100は、議題を肯定または否定するために有用な材料となる情報を検索することを目的としている。これを効果的に実現するためには、少なくとも何らかの価値について言及している記事を検索することが必要である。すなわち、議題に含まれるキーワードを含んでいる記事であっても、そのキーワードを単に文字列として含んでいるに過ぎない(例:キーワードについて辞典のように解説している)記事は検索対象から除外し、価値について言及している記事を検索することが望ましい。そこで検索部131は、検索対象とする記事をフィルタリングしてもよい。例えば、価値促進抑制テーブル151が記載している価値語句(価値1514)、およびその類似語または上位下位語をいずれも含まない記事は、検索対象から除外してもよい。価値1514(またはその類義語や上位下位語)を含まない記事を除外することにより、価値について言及する記事を優先的に検索することができる。
単位化部132は、検索部131が検索した記事内の文を、情報単位として整理する。文章における情報の1つの単位は文であるが、文には代名詞、指示詞などが存在し、その文のみでは意味が分からない場合がある。そこで単位化部132は、意味が通じる1つのまとまりとして1以上の文をまとめ、情報単位とする。例えば、照応解析により、指示詞や代名詞のように前後を参照する語句があった場合に、それが示す対象が含まれるように、文の集合をまとめる。
記事集計部133は、検索部131が検索した記事を価値促進抑制テーブル151にマッピングする。以下では、価値促進抑制テーブル151が記載している、価値1514とその促進者1515の組み合わせ、または価値1514とその抑制者1516の組み合わせを、論点と呼ぶことにする。例えば、価値”health”とその促進者”doctor,medicine,exercise,metabolism” の組み合わせは、論点である。記事集計部133は、記事がどの論点について言及しているかを判定することにより、記事と論点をマッピングする。例えば、ある記事が”health”とその促進者についての論点を含んでいる場合、その記事は、その促進者によって健康が増進されるという流れで論述をしていると推定できる。
情報マッピング部134は、価値促進抑制テーブル151が記載している価値1514、促進者1515、抑制者1516の間の関係を、グラフ化する。情報マッピング部134は、単位化部132によって整理された情報単位を、そのグラフのノードまたはエッジ(ノード間を接続する枝)にマッピングする。
情報分類部135は、情報マッピング部134がグラフ上のノードやエッジに対してマッピングした情報単位の役割を分類する。ここでいう役割とは、その情報単位が何らかの主張を述べている主張文であるのか、それともその主張の理由について述べている理由文であるのか、についてのものである。図7A〜図7Bに示す例を用いて、これら役割について説明する。
親ノード(矢印の接続元)に対してマッピングされた情報単位は、子ノード(矢印の接続先)に対してマッピングされた情報単位を説明する理由、根拠、例示などについて述べていると考えられる。また子ノードは価値について言及しており、正または負の価値が生じることを主張していると考えられる。つまり、同一記事内において親子ノードそれぞれに対してマッピングされている情報単位がある場合、子ノードに対してマッピングされている情報単位は、主張に分類される候補となる。主張候補の子ノードに対して別の情報単位がマッピングされていない場合、その主張候補は当該記事内の情報単位が述べている論理フローのなかで最も結論に近い位置に配置されていることになる。情報分類部135は、このような情報単位の役割を主張として分類する。
あるノードに対してマッピングされた情報単位(A)について、その子ノードに対してマッピングされた情報単位(B)が同一記事内にある場合、情報単位(A)は情報単位(B)を導出する理由について述べていると考えられる。情報分類部135は、このような情報単位を理由の候補とする。ただし、以下に説明する手法によって情報単位ABの極性を判定し、論理フローの整合性を確認する。整合性が確認された情報単位ABについては、そのペアを結び付けた上で、情報単位Aは情報単位Bの理由として分類し、情報単位Bは主張として分類する。
図7Aに示すノードhypertensionからノードdiseaseへ向かうエッジを例として説明する。ノードhypertensionに対してマッピングされている文(1)は、hypertensionを下げる(抑制する)ことについて言及しているため、ノードhypertensionに対して負の極性をもっている。ノードdiseaseに対してマッピングされている文(3)は、diseaseになるリスクを下げる(抑制する)ことについて言及しているため、ノードdiseaseに対して負の極性をもっている。グラフの論理関係は、hypertensionがdiseaseを促進することを示している。すなわち価値促進抑制テーブル151上においては、hypertensionを抑制すればdiseaseが抑制されることが示されている。文(1)はhypertensionを抑制することを示しており、文(3)はdiseaseを抑制することを示しているため、これらの情報単位はグラフの論理関係と整合していると考えられる。
情報マッピング部134は、グラフに対してマッピングした情報単位を、記事内における相関関係(例えば記事内における出現順)に応じて結び付けることにより、グラフ上のパスを拡張する。この拡張したパスは、後述するスコア計算において、論点間の距離を算出する際に用いる。
スコア計算部136は、以下に説明する手順にしたがって、論点のインパクトスコア、頑健性スコア、独立性スコアを計算する。独立性スコアは、文書検索装置100の出力として複数の論点を抽出する場合のみ計算する。
スコア計算部136は、価値促進抑制テーブル151が記述しているインパクトスコアに基づいて、価値1514のインパクト、価値1514と促進者1515との間の結びつきの強さを表すスコア、および抑制者1516との間の結びつきの強さを表すスコアを、当該論点(価値1514と促進者1515のペア、または価値1514と抑制者1516のペア)のインパクトスコアとして算出する。具体的には、スコア計算部136は、ステップS306で説明した原因と主張のペアに対してマッピングされているノードのスコアとエッジのスコアに基づいて、そのペアのインパクトスコアを計算する。例えば単調増加関数として、各スコアを加算する。理由付き主張に分類されている情報単位については、エッジ両端ノードのスコアとエッジのスコアを同様に計算する。スコア計算部136はさらに、これら各ペアのスコアと理由付き主張のスコアの単調増加関数として、論点全体のスコアを計算する。以上の処理により、価値に対する結び付きが強い情報単位が多く、かつインパクトが高い価値に対して、高いインパクトスコアを付与することができる。
論点に対してマッピングされている情報単位のうち、ステップS306において整合性がとれなかったものは、当該論点のロジックと矛盾している可能性がある。スコア計算部136は、そのような整合性がとれなかった情報単位の個数の単調減少関数として、当該論点の頑健性スコアを算出する。整合性がとれない情報単位が多いほど、その論点は矛盾した情報や無関係な情報が多く、頑健性が低い(頑健性スコアが低い)と判断することができる。
複数の論点を抽出する場合、各論点が言及している事象が互いに重なり合っていると、その論点の有用性が損なわれると考えられる。そこでスコア算出部136は、各論点が互いにどの程度独立しているかを示す独立性スコアを算出する。すなわち、複数の論点を抽出する場合は論点間の距離が大きいほど望ましいと考え、そのような論点に対して高い独立性スコアを付与する。論点間の距離は、価値促進抑制テーブル151のグラフ上における価値間の距離とみなすことができるので、以下に説明する手法によって価値間の距離を算出する。
ノード間の結びつきが強い場合、そのノード間の距離は短いと考えることができる。そこでスコア計算部136は、まず各エッジ両端のノードに対してマッピングされている情報単位の個数に基づいて、各エッジ間の距離を算出する。例えば、エッジ両端の整合性ある情報単位の個数の逆数を、当該エッジ間の距離とする。情報単位がマッピングされていないノード間の距離は、例えば1とする。エッジに対して情報単位がマッピングされている場合は、その両端ノードに対して同じ情報単位がマッピングされているものとする。スコア算出部136は、グラフのエッジを辿って2つの価値を結び付けたとき通ったエッジの距離を全て合算したものを、その2つの価値間の距離とする。価値間の経路が複数存在する場合は、最も小さい距離を用いる。スコア算出部136は、各論点が言及している価値間の距離が大きいほど、その論点間の独立性スコアを高くする。
ステップS307において記事内パスを生成した場合、スコア算出部136は記事内パスもエッジとみなして上記と同様の手順を実施する。図8に示す例においては、deliciousノードからeasyノードへ向かうエッジ、easyノードからtireノードへ向かうエッジ、tireノードからcalorieノードとdietノードへ向かうエッジをそれぞれ追加する。これにより、価値促進抑制テーブル151上(すなわちグラフ上)においては距離が離れている論点であっても、記事の記載内容に鑑みると距離が近い論点について、互いに結び付けることができる。すなわち、記事の記載内容に鑑みると互いに重複している論点の独立性スコアを下げることができる。
文書検索装置100の出力として複数(N個)の論点を抽出する場合、スコア計算部136は、N個の論点に含まれる2つ論点の全組み合わせについて独立性スコアを求め、そのなかで最も小さいもの(すなわち独立性が最も低いもの)を、当該N個の論点の独立性スコアとする。
出力部137は、ステップS308の結果に基づき、例えばユーザが指定した個数の論点を選択する。論点のインパクトや頑健性は、高いほうが望ましい。また、議題を肯定・否定する場合には、ひとつの観点だけでなく、複数の観点からその主張と理由を述べられると、より説得力が増す。すなわち、重複する観点を根拠として主張を述べるのではなく、独立性の高い複数の観点から主張と理由を述べることが望ましい。そこで出力部137は、1つの論点を選択する場合はインパクトスコアと頑健性スコアが高い論点を選択し、複数の論点を選択する場合はこれらスコアに加えて独立性スコアが高い論点を選択する。
出力部137は、インパクトスコアと頑健性スコアの単調増加関数として、論点の総合スコアを計算する。材料が多いほうが良い場合もあるため、インパクトスコアと頑健性スコアだけでなく、当該論点に対してマッピングされた情報単位の個数も加味し、3つのスコアの単調増加関数として論点の総合スコアを計算してもよい。論点をひとつだけ選択する場合には、最もスコアの高い論点を選択する。複数(N個)の論点を選択する場合は、N個の論点の独立性スコアとそのN個の論点の総合スコアの両方のスコアに基づいて、それらの単調増加関数の値が最も大きいN個の論点を選択する。総当たり探索により最もスコアが高いN個の論点の組み合わせを選択してもよいし、例えば探索回数に上限を設けてもよい。
出力部137は、ステップS309において選択した論点に対してマッピングされた情報単位を、当該論点とともに出力する。さらに論点ごとに、その主張と理由のペアを出力してもよい。当該論点のインパクトスコア、頑健性スコア、独立性スコアを併せて出力してもよい。出力先は、ディスプレイやプリンタなどによって構成された出力装置120でもよいし、出力結果を記述したデータを記憶装置150に格納するようにしてもよい。その他適当な出力手段を用いてもよい。
以上のように、本実施形態1に係る文書検索装置100は、価値とその価値を促進または抑制する事象との間の対応関係を記述した価値促進抑制テーブル151を備え、記事が記載しているこれら語句と価値促進抑制テーブル151が記述している対応関係との間の整合性に基づき、整合性のとれた論点を記事から抽出する。これにより、論理フローが整合した論述をしている記事を効率的に自動抽出することができる。
図9は、本発明の実施形態2に係るディベートシステム1000の構成図である。ディベートシステム1000は、与えられた議題について意見を述べる論述文を自動生成するシステムである。ディベートシステム1000は、文章生成システム1100とデータ管理システム1200を有する。文章生成システム1100は、議題が入力されると、その議題に対する意見を述べた論述文を出力するシステムである。データ管理システム1200は、あらかじめ処理されたデータを格納するシステムである。
本発明は上記した実施形態の形態に限定されるものではなく、様々な変形例が含まれる。上記実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることもできる。また、ある実施形態の構成に他の実施形態の構成を加えることもできる。また、各実施形態の構成の一部について、他の構成を追加・削除・置換することもできる。
Claims (15)
- 与えられた議題に関連する文書を検索する文書検索システムであって、
価値を表す価値語句、前記価値を促進する促進事象を表す促進語句、および前記価値を抑制する抑制事象を表す抑制語句を記述した価値促進抑制テーブルを格納する記憶部、
前記議題を記述した議題テキスト内に含まれる議題語と、前記価値促進抑制テーブルが記述している前記価値語句とをキーワードとして記事を検索する検索部、
前記検索部が検索した前記記事内に含まれる前記価値語句、前記促進語句、および前記抑制語句を集計することにより、前記記事が言及している前記価値語句と前記促進語句の組み合わせまたは前記記事が言及している前記価値語句と前記抑制語句の組み合わせを、前記記事が論じている論点として特定する、記事集計部、
前記記事集計部が特定した前記組み合わせ内に含まれる前記価値語句、前記促進語句、または前記抑制語句に対して、前記記事が肯定的語句または否定的語句のいずれを記述しているかをカウントすることにより、前記論点と前記記事との間の論理関係がどの程度整合しているかを表す頑健性スコアを算出する、スコア計算部、
前記スコア計算部による算出結果に基づき、前記論点と前記記事との間の論理関係の整合性が高い順に前記論点とその論点に対応する前記記事とを選択し、その選択した前記論点と前記記事を出力する、出力部、
を備えることを特徴とする文書検索システム。 - 前記文書検索システムは、
前記価値促進抑制テーブルが記述している前記価値語句、前記促進語句、または前記抑制語句と、前記記事とを対応付ける情報マッピング部を備え、
前記情報マッピング部は、
前記価値促進抑制テーブルが記述している前記価値語句、前記促進語句、および前記抑制語句を、前記価値、前記促進事象、および前記促進事象の間の相互作用に基づきグラフ化し、
前記グラフ上におけるノードまたはエッジに割り当てられた前記価値語句、前記促進語句、および前記抑制語句と、前記記事が記述している語句とを対応付けることにより、前記価値促進抑制テーブルが記述している前記価値語句、前記促進語句、または前記抑制語句と、前記記事とを対応付け、
前記スコア計算部は、
前記情報マッピング部が前記グラフ上で対応付けた前記記事と前記論点との間の論理関係に基づき、前記頑健性スコアを算出する
ことを特徴とする請求項1記載の文書検索システム。 - 前記文書検索システムは、
前記ノードまたは前記エッジに対応付けられた前記記事の前記グラフ上における親子関係に基づき、前記記事の種別を、前記論点に関する主張を記述している主張記事または前記主張の理由を記述している理由記事へ分類する、情報分類部を備え、
前記出力部は、
前記情報分類部による分類結果を、前記論点とその論点に対応する前記記事とともに出力する
ことを特徴とする請求項2記載の文書検索システム。 - 前記スコア計算部は、
前記主張記事または前記理由記事と、前記主張記事または前記理由記事に対応付けられた前記ノードとの間の論理関係が肯定的関係である場合は、その論理関係を第1正値によって表し、否定的関係である場合はその論理関係を第1負値によって表し、
前記主張記事に対応付けられた前記ノードと、前記理由記事に対応付けられた前記ノードとの間の論理関係が肯定的関係である場合は、その論理関係を第2正値によって表し、否定的関係である場合はその論理関係を第2負値によって表し、
前記主張記事に対応する前記第1正値または前記第1負値、前記主張記事と前記理由記事との間の論理関係に対応する前記第2正値または前記第2負値、および前記理由記事に対応する前記第1正値または前記第1負値を乗算し、
その乗算結果が正であれば前記主張記事と前記理由記事との間の論理関係は整合していると判定し、負であれば整合していないと判定し、その判定結果に基づき前記頑健性スコアを算出する
ことを特徴とする請求項3記載の文書検索システム。 - 前記スコア計算部は、
前記主張記事と前記理由記事との間の論理関係が整合していない前記主張記事と前記理由記事の組み合わせの個数をカウントし、そのカウントした個数が多いほど前記頑健性スコアを低くする
ことを特徴とする請求項4記載の文書検索システム。 - 前記価値促進抑制テーブルは、
前記論点に対して前記価値語句が与える影響度を示す第1インパクトスコア、前記価値語句と前記促進語句との間の結びつきの強さを示す第2インパクトスコア、および前記価値語句と前記抑制語句との間の結びつきの強さを示す第3インパクトスコアを記述しており、
前記スコア計算部は、
前記第1インパクトスコア、前記第2インパクトスコア、および前記第3インパクトスコアを用いて前記論点の総合インパクトスコアを算出し、
前記出力部は、
前記総合インパクトスコアが高い順に前記論点を選択する
ことを特徴とする請求項1記載の文書検索システム。 - 前記文書検索システムは、
前記検索部が検索した前記記事が記述している文章の接続関係に基づき前記記事を1以上の情報単位に分割する単位化部を備え、
前記情報マッピング部は、
前記情報単位を前記グラフ上のノードまたはエッジと対応付けることにより、前記価値促進抑制テーブルが記述している前記価値語句、前記促進語句、または前記抑制語句と、前記記事とを対応付ける
ことを特徴とする請求項2記載の文書検索システム。 - 前記価値促進抑制テーブルは、
前記論点に対して前記価値語句が与える影響度を示す第1インパクトスコア、前記価値語句と前記促進語句との間の結びつきの強さを示す第2インパクトスコア、および前記価値語句と前記抑制語句との間の結びつきの強さを示す第3インパクトスコアを記述しており、
前記スコア計算部は、
前記グラフ上で前記論点に対応付けられた前記情報単位の個数をカウントし、
前記論点に対応付けられた前記情報単位の個数、前記第1インパクトスコア、前記第2インパクトスコア、および前記第3インパクトスコアを用いて、前記論点の総合インパクトスコアを算出し、
前記出力部は、
前記総合インパクトスコアが高い順に前記論点を選択する
ことを特徴とする請求項7記載の文書検索システム。 - 前記スコア計算部は、
前記グラフ上において各前記論点に対応付けられている前記ノード間の前記グラフ上における距離を算出することにより、複数の前記論点がそれぞれ言及している事象間の重複度を示す独立性スコアを算出し、
前記出力部は、
前記独立性スコアが高い順に前記複数の論点の組み合わせを選択する
ことを特徴とする請求項7記載の文書検索システム。 - 前記スコア計算部は、
前記グラフ上で前記ノードに対応付けられた前記情報単位の個数をカウントし、
前記エッジの両端に割り当てられている第1および第2の前記ノードを特定し、
前記第1のノードに対応付けられている前記情報単位の個数と前記第2のノードに対応付けられている前記情報単位の個数が多いほど、前記第1のノードと前記第2のノードとの間の前記グラフ上における距離が短いものとして取り扱う
ことを特徴とする請求項9記載の文書検索システム。 - 前記情報マッピング部は、
前記グラフ上のノードまたはエッジと対応付けられた前記情報単位を、前記記事上において前記情報単位が出現する順序にしたがって結び付けることにより、前記グラフ上のパスを拡張し、
前記スコア計算部は、
前記グラフ上のノードとエッジに加えて前記拡張されたパスを用いて、前記ノード間の前記グラフ上における距離を算出する
ことを特徴とする請求項9記載の文書検索システム。 - 前記出力部は、
複数の前記論点のなかからいずれか1以上を選択し、
前記スコア計算部は、
前記出力部が選択した複数の前記論点からなる論点グループ内に含まれる2つの前記論点の全組み合わせについて、前記論点間の前記独立性スコアを算出し、
各前記組み合わせについて算出した前記独立性スコアのなかで最も小さいものを、前記論点グループの前記独立性スコアとして取り扱う
ことを特徴とする請求項9記載の文書検索システム。 - 前記出力部は、
1つの前記論点を選択する場合は、前記頑健性スコアが最も高い前記論点を出力し、
複数の前記論点を選択する場合は、前記頑健性スコアと前記独立性スコアに基づき算出した総合スコアが最も高い前記論点グループを出力する
ことを特徴とする請求項12記載の文書検索システム。 - 請求項1記載の文書検索システム、
前記文書検索システムが出力する論点を用いて前記議題に対する論述文を生成する文章生成システム、
を備えることを特徴とするディベートシステム。 - 与えられた議題に関連する文書を検索する文書検索方法をコンピュータに実行させる文書検索プログラムであって、前記コンピュータに、
価値を表す価値語句、前記価値を促進する促進事象を表す促進語句、および前記価値を抑制する抑制事象を表す抑制語句を記述した価値促進抑制テーブルを格納する記憶装置から前記価値促進抑制テーブルを読み出すステップ、
前記議題を記述した議題テキスト内に含まれる議題語と、前記価値促進抑制テーブルが記述している前記価値語句とをキーワードとして記事を検索する検索ステップ、
前記検索ステップにおいて検索した前記記事内に含まれる前記価値語句、前記促進語句、および前記抑制語句を集計することにより、前記記事が言及している前記価値語句と前記促進語句の組み合わせまたは前記記事が言及している前記価値語句と前記抑制語句の組み合わせを、前記記事が論じている論点として特定する、記事集計ステップ、
前記記事集計ステップにおいて特定した前記組み合わせ内に含まれる前記価値語句、前記促進語句、または前記抑制語句に対して、前記記事が肯定的語句または否定的語句のいずれを記述しているかをカウントすることにより、前記論点と前記記事との間の論理関係がどの程度整合しているかを表す頑健性スコアを算出する、スコア計算ステップ、
前記スコア計算ステップにおける算出結果に基づき、前記論点と前記記事との間の論理関係が整合している前記論点とその論点に対応する前記記事とを選択し、その選択した前記論点と前記記事を出力する、出力ステップ、
を実行させることを特徴とする文書検索プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/078468 WO2016067334A1 (ja) | 2014-10-27 | 2014-10-27 | 文書検索システム、ディベートシステム、文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016067334A1 JPWO2016067334A1 (ja) | 2017-04-27 |
JP6250833B2 true JP6250833B2 (ja) | 2017-12-20 |
Family
ID=55856729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016556058A Active JP6250833B2 (ja) | 2014-10-27 | 2014-10-27 | 文書検索システム、ディベートシステム、文書検索プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6250833B2 (ja) |
WO (1) | WO2016067334A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6663826B2 (ja) | 2016-09-08 | 2020-03-13 | 株式会社日立製作所 | 計算機及び応答の生成方法 |
CN110209663B (zh) * | 2018-02-14 | 2023-06-20 | 阿里巴巴集团控股有限公司 | 搜索范围确定的方法、装置和存储介质 |
CN114902206A (zh) * | 2020-01-10 | 2022-08-12 | 株式会社半导体能源研究所 | 文档检索系统、文档检索方法 |
CN111783441A (zh) * | 2020-08-08 | 2020-10-16 | 中国人民解放军国防科技大学 | 一种基于支持向量机的对话语句正确性评价方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4772378B2 (ja) * | 2005-05-26 | 2011-09-14 | 株式会社東芝 | Webページから時系列データを生成する方法及び装置 |
JP2007233947A (ja) * | 2006-03-03 | 2007-09-13 | Yasuhide Yamauchi | 一貫した文脈を持つ広範な文章等の評価方法及び評価システム |
JP5369813B2 (ja) * | 2009-03-25 | 2013-12-18 | 富士通株式会社 | 説得支援装置、説得支援プログラム及び説得支援方法 |
JP2011113400A (ja) * | 2009-11-27 | 2011-06-09 | Fujitsu Ltd | 説得支援装置、説得支援プログラム及び説得支援方法 |
-
2014
- 2014-10-27 WO PCT/JP2014/078468 patent/WO2016067334A1/ja active Application Filing
- 2014-10-27 JP JP2016556058A patent/JP6250833B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016067334A1 (ja) | 2016-05-06 |
JPWO2016067334A1 (ja) | 2017-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bafna et al. | Feature based summarization of customers’ reviews of online products | |
Huang et al. | Detecting suicidal ideation in Chinese microblogs with psychological lexicons | |
US9406020B2 (en) | System and method for natural language querying | |
Korenek et al. | Sentiment analysis on microblog utilizing appraisal theory | |
Moussa et al. | A survey on opinion summarization techniques for social media | |
US20140067370A1 (en) | Learning opinion-related patterns for contextual and domain-dependent opinion detection | |
CN111104518A (zh) | 用于从用户生成的内容建立演化本体的系统和方法 | |
Ahmed | Detecting opinion spam and fake news using n-gram analysis and semantic similarity | |
Bellot et al. | INEX Tweet Contextualization task: Evaluation, results and lesson learned | |
Agarwal et al. | Frame semantic tree kernels for social network extraction from text | |
JP6250833B2 (ja) | 文書検索システム、ディベートシステム、文書検索プログラム | |
US11574287B2 (en) | Automatic document classification | |
Campos et al. | Gte: A distributional second-order co-occurrence approach to improve the identification of top relevant dates in web snippets | |
Liu et al. | Sentence-level sentiment analysis in the presence of modalities | |
Mehdad et al. | Towards topic labeling with phrase entailment and aggregation | |
Tahmasebi et al. | Visions and open challenges for a knowledge-based culturomics | |
KR101543680B1 (ko) | 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법 | |
Yanase et al. | Learning sentence ordering for opinion generation of debate | |
KR101375221B1 (ko) | 의료 프로세스 모델링 및 검증 방법 | |
JP2016218512A (ja) | 情報処理装置及び情報処理プログラム | |
Mejova | Sentiment analysis within and across social media streams | |
Pasarate et al. | Comparative study of feature extraction techniques used in sentiment analysis | |
Žitnik et al. | SkipCor: Skip-mention coreference resolution using linear-chain conditional random fields | |
Diamantini et al. | Semantic disambiguation in a social information discovery system | |
Miratrix et al. | Conducting sparse feature selection on arbitrarily long phrases in text corpora with a focus on interpretability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170926 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171122 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6250833 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |