JP2018147238A - 発想支援装置及び発想支援方法 - Google Patents

発想支援装置及び発想支援方法 Download PDF

Info

Publication number
JP2018147238A
JP2018147238A JP2017041822A JP2017041822A JP2018147238A JP 2018147238 A JP2018147238 A JP 2018147238A JP 2017041822 A JP2017041822 A JP 2017041822A JP 2017041822 A JP2017041822 A JP 2017041822A JP 2018147238 A JP2018147238 A JP 2018147238A
Authority
JP
Japan
Prior art keywords
relation
proposition
knowledge
graph
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017041822A
Other languages
English (en)
Other versions
JP6622236B2 (ja
Inventor
利昇 三好
Toshinori Miyoshi
利昇 三好
ミャオメイ レイ
Miaomei Lei
ミャオメイ レイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017041822A priority Critical patent/JP6622236B2/ja
Priority to KR1020170147764A priority patent/KR102039393B1/ko
Priority to CN201711235125.2A priority patent/CN108536720B/zh
Publication of JP2018147238A publication Critical patent/JP2018147238A/ja
Application granted granted Critical
Publication of JP6622236B2 publication Critical patent/JP6622236B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】ユーザが作文や発話を行っている最中に、ユーザによる作文や発話のコンテキストに沿って、ユーザの発想を支援する。【解決手段】発想支援装置は、知識を定義する文書に含まれる命題を構成する要素を示すノードと、該命題が示す該要素間のリレーションを示すエッジと、を含む第1グラフ、の構造を示す情報と、該文書におけるリレーションの出現順序を示す情報と、を保持し、命題の入力を受け付け、該命題に含まれる要素と、該命題が示す該要素間のリレーションと、を抽出し、抽出した要素を示すノードを含み、かつ抽出した要素間のリレーションをエッジとして含む第2グラフを生成し、第2グラフが示すリレーションが第1グラフに含まれると判定した場合、該文書において当該リレーションの後に出現したリレーションを特定する。【選択図】図1

Description

本発明は、発想支援装置及び発想支援方法に関する。
本技術分野の背景技術として、特開2007−241901号公報(特許文献1)がある。この公報には、「入力されたテーマに関連する意見テキスト群の中から前記テーマに関連する複数の論点を抽出する論点抽出手段と、前記複数の論点毎に、当該論点を含んでいる前記意見テキストの中から当該論点に一の立場を有する意見の割合を表す固有度を算出する固有度算出手段と、前記複数の論点毎に前記一の立場を含んでいる意見の重要度を算出する重要度算出手段と、前記複数の論点に関連する関連語を抽出する関連語抽出手段と、前記複数の論点毎に対する肯定又は否定の意見における複数の代表意見を選択する代表意見選択手段と、前記各手段から出力された前記複数の論点毎の前記固有度及び前記重要度を出力するインタフェース手段と、を備える。」と記載されている(要約参照)。
特開2007−241901号公報
例えば、ユーザが、所与のテーマに関する作文や発話を行うことを想定する。特許文献1に記載の技術は、所与のテーマに関する論点を予め抽出することにより、ユーザによる作文や発話を支援する。
しかし、ユーザが作文や発話を進めた場合、特許文献1に記載の技術が抽出した各論点は、当該作文や当該会話のコンテキストに適合する論点であるとは限らない。そこで、本発明の一態様は、ユーザが作文や発話を行っている最中に、ユーザによる作文や発話のコンテキストに沿って、ユーザの発想を支援することを目的とする。
上記課題を解決するために、本発明の一態様は以下の構成を採用する。ユーザの発想を支援する発想支援装置であって、プロセッサとメモリとを含み、前記メモリは、知識を定義する文書に含まれる命題を構成する要素を示すノードと、前記命題が示す前記要素間のリレーションを示す第1種エッジと、を含む第1グラフ、の構造を示すグラフ情報と、前記文書におけるリレーションの出現順序を示すコンテキスト情報と、を保持し、前記プロセッサは、命題の入力を受け付け、前記入力を受け付けた命題に含まれる要素と、前記入力を受け付けた命題が示す当該要素間のリレーションと、を抽出し、前記抽出した要素を示すノードを含み、かつ前記抽出した要素間のリレーションを前記第1種エッジとして含む第2グラフを生成し、前記グラフ情報を参照して、前記第2グラフが示すリレーションが前記第1グラフに含まれると判定した場合、前記コンテキスト情報を参照して、前記文書において当該リレーションの後に出現したリレーションを特定し、前記特定したリレーションを示す情報を出力する、発想支援装置。
本発明の一態様は、ユーザが作文や発話を行っている最中に、ユーザによる作文や発話のコンテキストに沿って、ユーザの発想を支援することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
実施例1における発想支援装置の構成例を示すブロック図である。 本実施例における発想支援装置が実施する処理の一例を示すフローチャートである。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1におけるノードテーブルの一例である。 実施例1におけるエッジテーブルの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1におけるノードテーブルの一例である。 実施例1におけるエッジテーブルの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1におけるノードテーブルの一例である。 実施例1におけるエッジテーブルの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における後続知識テーブルの一例である。 実施例1における文書内の知識を示す知識グラフの一例である。 実施例1における後続知識テーブルの一例である。 実施例1における発話理解処理で生成される知識グラフの一例である。 実施例1における発話理解処理で生成される知識グラフの一例である。 実施例1における表示装置に表示される画面の変遷の一例である。
以下、添付図面を参照して本発明の実施形態を説明する。本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。
表現力及び思考力等を養うために、学校等で(例えば、論述文の)作文の訓練が実施される。作文は、問題集などで修得できる知識と異なり、自主学習が難しく、生徒の作文技術の向上のために、先生による個別の指導が必要であるケースが多い。また、生徒は、作文に慣れない段階では、まず、何を書いてよいのか分からないという問題もあり、当該問題を解決するために先生による丁寧な指導が必要であるケースが多い。また、外国語での会話の訓練を実施する場合にも、同様にまず何を話してよいのか分からない、という状況が生じるケースが多い。
そこで、本実施形態は、ユーザの作文に対してヒントやコメントを提示することにより、作文を書くための発想を支援する。また、同様に、本実施形態は、外国語会話において、次の発言のためのヒントを与えるなど、会話の補助をする。これにより、ユーザは、外国語会話に慣れることができ、ひいては人との会話を実践しやすくなる。本実施形態の発想支援装置は、作文や会話において、ユーザに次の発言のヒントを与える、コメントを与える、などによりユーザの発想を支援し、ひいてはユーザの作文作成や会話を支援する。
図1は、本実施例の発想支援装置の構成例を示すブロック図である。本実施例の発想支援装置は、例えば、入力装置202、表示装置203、通信装置204、演算装置(CPU)205、メモリ206、及び補助記憶装置207を備える計算機によって構成される。
入力装置202は、ユーザからのコマンド等の入力を受け付け、例えば、キーボード及びマウス等である。入力装置202は、演算装置(CPU)205が実行するプログラムの制御、及び発想支援装置201に接続された機器の制御のために実行されるコマンド等の入力を受け付ける。通信装置204は、例えば、所定のプロトコルに従って、発想支援装置201による処理内容を外部機器に送信したり、外部機器から情報を受信したりする。
演算装置(CPU)205は、プロセッサを含み、メモリ206に格納されたプログラムを実行する。メモリ206は、不揮発性の記憶素子であるROM及び揮発性の記憶素子であるRAMを含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ101が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。
補助記憶装置207は、例えば、磁気記憶装置(HDD)、フラッシュメモリ(SSD)等の大容量かつ不揮発性の記憶装置であり、演算装置(CPU)205が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置207から読み出されて、メモリ206にロードされて、演算装置(CPU)205によって実行される。
演算装置(CPU)205が実行するプログラムは、リムーバブルメディア(CD−ROM、フラッシュメモリなど)又はネットワークを介して発想支援装置201に提供され、非一時的記憶媒体である不揮発性の補助記憶装置207に格納される。このため、発想支援装置201は、リムーバブルメディアからデータを読み込むインタフェースを有するとよい。
発想支援装置201は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。
演算装置(CPU)205は、知識グラフ生成部211、コンテキスト計算部212、発話理解部213、コンテキスト認識部214、及びフェーズ認識部215を含む。例えば、演算装置(CPU)205は、メモリ206にロードされた知識グラフ生成プログラムに従って動作することで、知識グラフ生成部211として機能し、メモリ206にロードされたコンテキスト計算プログラムに従って動作することで、コンテキスト計算部212として機能する。演算装置(CPU)205に含まれる他の部についても同様である。
知識グラフ生成部211は、後述する文書DB103の文書が示す知識を表現するグラフ(知識グラフ)を生成する。コンテキスト計算部212は、後述する知識グラフDB105が保持する知識グラフが示す知識の、文書DB103の文書内における出現順序を計算する。発話理解部213は、ユーザから作文や会話の入力を受け付け、当該作文や会話のテキストデータを作成する。
コンテキスト認識部214は、発話理解部213によって作成されたテキストデータにおける知識の出現順序を計算し、当該出現順序と、コンテキスト計算部212が計算した知識の出現順序とを比較する。フェーズ認識部215は、作文や会話に求められる予め定められた内容が、ユーザが入力したテキストに不足しているか否かを判定することにより、ユーザの作文や会話のフェーズを認識する。
補助記憶装置207は、文書DB103、知識グラフDB105、及びコンテキストDB107を保持する。文書DB103は、自然言語で書かれた文書、特に論述文等を保持する。文書DB103が保持する文書は、発想支援装置201における知識を定義するための文書、即ち知識源となる文書であるため、文書DB103は、議論の対象となる事柄や、議論に関連する内容が記載された文書、を保持していることが望ましい。
Web文書、ニュース記事、組織内レポート、学術論文、官公庁及び国際機関の公報、並びにシンクタンク等の調査文書などは、文書DB103が保持する文書の例である。また、ユーザによる過去の発話履歴なども、文書DB103が保持する文書の一例である。また、文書DB103は、各文書の書誌情報等をさらに保持してもよい。
知識グラフDB105は、知識グラフ生成部211が生成した知識グラフの構造を示す情報を格納する。コンテキストDB107は、コンテキスト計算部212が計算した知識の出現順序を示す情報を格納する。
なお、本実施形態において、発想支援装置201が使用する情報は、データ構造に依存せずどのようなデータ構造で表現されていてもよい。例えば、テーブル、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。なお、本実施例では、補助記憶装置207が保持する各データがテーブル構造で表現されている例を示す。
なお、発想支援装置201は、入力装置202、表示装置203及び通信装置204の少なくとも1つを備えていればよい。発想支援装置201が入力装置202を備えていない場合、例えば、通信装置204が外部機器からコマンド等の入力を受け付ける。発想支援装置201が表示装置203を備えていない場合、例えば、通信装置204が、発想支援装置201が生成した処理結果を外部機器に送信する。
各処理部は、メモリ206又は補助記憶装置207を介して、他の処理部への入出力を実行してもよい。例えば、知識グラフ生成部211は、処理結果をコンテキスト計算部212に出力する場合、実際には、知識グラフ生成部211が処理結果をメモリ206又は補助記憶装置207に格納し、コンテキスト計算部212は、メモリ206又は補助記憶装置207に格納されている当該出力結果を入力として取得してもよい。
図2は、本実施例における発想支援装置201が実施する処理の一例を示すフローチャートである。発想支援装置201が実行する処理は、大きく分けて、学習処理(S110)、及び運用処理(S120)の2つの部分に分けられる。学習処理は、ステップS111〜S112の処理を含み、運用フェーズはステップS121〜S125の処理を含む。 まず、学習処理(S110)の処理について説明する。まず、知識グラフ生成部211は、文書DB103に格納された文書の情報をグラフ型知識に変換することにより、知識グラフDB105に格納する知識グラフを生成する(S111)。以下、ステップS111の詳細を説明する。
図3A〜図3Cは、文書内の知識を示す知識グラフの一例である。なお、本実施例では、日本語で記載された文書の例を用いているが、英語など他の言語であっても同様の処理が実施される。以下、図中のグラフにおける、一重線の楕円型で示されるノードは、人、物、組織などの実体、又は抽象的な概念などを表すエンティティ、を示すノードである。また、エンティティ間の矢印に沿って記載されている文字は、エンティティ間のリレーションを表す。
知識グラフ301は、知識グラフ生成部211が、文書DB103の文書内の「専門家は、学校での制服の採用は、規律を高める。」という文から生成した知識グラフである。
知識グラフ生成部211は、知識グラフの生成において、まず、文からエンティティを抽出する。知識グラフ生成部211は、例えば、機械学習を用いて、エンティティを抽出する。つまり、抽出したいエンティティにラベルを付けた学習用の文書セットが予め準備されており、知識グラフ生成部211は、エンティティを抽出するための識別器を作成し、作成した識別器を用いて文内のエンティティを抽出する。なお、図3Aの文中におけるエンティティは、「専門家」、「制服」、及び「規律」であるものとする。
また、知識グラフ生成部211は、予め用意された単語辞書や単語のオントロジーを参照して、エンティティを抽出してもよい。また、エンティティの多くは、名詞や形容詞に相当するフレーズにより表されるため、知識グラフ生成部211は、構文解析を行い、名詞や形容詞をエンティティとして抽出してもよい。
次に、知識グラフ生成部211は、エンティティ間のリレーションを計算する。「専門家は、学校での制服の採用は、規律を高める。」という文において、「制服」と「規律」は、述語である「高める」の引数(「制服」が主語、「規律」が目的語)である。知識グラフ生成部211は、例えば、このように、構文解析によって、2つのエンティティを引数とする述語をエンティティ間のリレーションとして抽出する。
知識グラフ生成部211は、この2つのエンティティとその間のリレーションを、エッジで結ぶことにより、知識グラフ301を生成する。知識グラフ生成部211は、知識グラフの生成において、主語であるエンティティを示すノードを起点、述語であるエンティティを示すノードを終点としたエッジを生成する。なお、知識グラフは無向グラフであってもよい。
また、ここでは、知識グラフ生成部211が、エンティティ(主語と目的語)を引数とする述語をリレーションとして抽出する例を示したが、エンティティ間の他のリレーションを抽出してもよい。例えば、知識グラフ生成部211は、エンティティ間の係り受けをリレーションとして抽出してもよいし、エンティティ間の文中での距離をリレーションとして抽出してもよい。また、知識グラフ生成部211は、例えば、Semantic Role Labellingなどの手法を用いて、リレーションを抽出してもよい。
知識グラフ302は、知識グラフ生成部211が、文書DB103の文書内の「学校での制服は、自由を阻害する。」という文から生成した知識グラフである。知識グラフ生成部211は、図3Aの例と同様の方法で、当該文から、2つのエンティティ「制服」及び「自由」、並びにエンティティ間のリレーション「阻害する」を抽出し、知識グラフ302を生成する。
知識グラフ生成部211は、このように、与えられた文書中の各文から、エンティティを抽出し、エンティティ間の当該文中におけるリレーションを、知識グラフを用いて記述する。
図3Cは、2つの知識グラフが統合された知識グラフの一例である。例えば、複数の知識グラフに同一のノードが存在する場合、知識グラフ生成部211は、当該ノードを同一視することにより、当該複数の知識グラフを統合してもよい。知識グラフ303は、知識グラフ生成部211が、知識グラフ301における「制服」ノードと、知識グラフ302における「制服」ノードと、を同一視することによって生成された知識グラフである。
知識グラフ生成部211は、例えば、表層表現が同じノードを同一視する。また、単語辞書やオントロジーなどを用いてノードが生成された場合、知識グラフ生成部211は、例えば、単語辞書又はオントロジー上で同一の表現を同一のノードとして扱ってもよい。具体的には、例えば、知識グラフ生成部211は、同義語のノードを同一視してもよい。また、知識グラフ生成部211は、グラフ上の2つのノードを結ぶエッジのうち、同じリレーションを表すエッジを、同一視してもよい。
知識グラフ生成部211は、生成した知識グラフの情報を、例えば、図3D及び図3Eに示すテーブルで表し、当該テーブルを知識グラフDB105に格納する。図3Dは、知識グラフDB105に格納されるノードテーブルの一例である。ノードテーブル304は、知識グラフのノードの情報を保持するテーブルである。図3Dのノードテーブル304は、知識グラフ303のノードの情報を保持している。
知識グラフ生成部211は、生成した知識グラフのノードに、当該知識グラフ上でのノードを識別するためのIDを付与し、付与したIDをノードテーブル304に格納する。また、知識グラフ生成部211は、ノードに関する他の情報をノードテーブル304に含めてもよい。図3Dの例において、ノードテーブル304は、各ノードの表層表現の情報を含む。また、例えば、ノードテーブル304は、各ノードに対応する表層表現が抽出された文書の書誌情報等を含んでもよい。
図3Eは、知識グラフDB105に格納されるエッジテーブルの一例である。エッジテーブル305は、知識グラフのエッジの情報を含んだテーブルである。図3Eの例では、エッジテーブル305は、知識グラフ303のエッジの情報を保持している。
知識グラフ生成部211は、生成した知識グラフのエッジに、当該知識グラフ上でのエッジを識別するためのIDを付与し、各エッジのID、起点ノードのID、及び終点ノードのIDを対応づけてエッジテーブル305に格納するまた、知識グラフ生成部211は、エッジに関する他の情報をエッジテーブル305に含めてもよい。図3Eの例において、エッジテーブル305は、各エッジの表層表現の情報を含む。また、例えば、エッジテーブル305は、各エッジに対応する表層表現が抽出された文書の書誌情報等を含んでもよい。ノードテーブル304とエッジテーブル305とによって、知識グラフの構造が定義される。
以下、知識グラフ生成処理の別の例を説明する。図4A〜図4Cは、知識グラフの例である。図4Aの文は、図3Aの文と同一である。知識グラフ301は、当該文が示す「制服は規律を高める」ことを示す情報を表現している。しかし、知識グラフ301は、当該文が示す、「制服は規律を高めること」を、「専門家が述べた」ことを示す情報(つまり、「述べた」というリレーションに関する情報)を表現していない。
知識グラフ生成部211は、例えば、「制服は規律を高める」というステートメントをエンティティとみなせば、知識グラフ301に加えて、知識グラフ402を生成することができる。ステートメントは、文を構成する複数の要素と、当該複数の要素間のリレーションと、を示す命題である。なお、各要素は、例えば、エンティティであってもよいし、節又は文であってもよい。また、各要素は、ステートメントであってもよい。
知識グラフ301と知識グラフ402は独立した知識グラフであるため、図4Aの文が示す2つの知識グラフの間の関係を表現できていない。また、関連のある複数の知識それぞれが、このように独立した知識グラフで表現されている場合、エンティティの数が膨大となる。
そこで、知識グラフ生成部211は、このような情報を表現するために、図4Bに示す知識グラフ403を生成する。知識グラフ403の生成処理の一例を説明する。上述したように、知識グラフ生成部211は、文書の文中においてリレーションで結ばれる対象の少なくとも一方がステートメントである場合、知識グラフ402のように、当該ステートメントを仮にエンティティとみなして知識グラフを生成する。
知識グラフ生成部211は、知識グラフのノードであって、同一の文書から生成した他の知識グラフが示すステートメントの情報が全て含まれるノード、があると判定した場合(即ち入れ子構造になっているノードがある場合)、当該他の知識グラフから、当該ステートメントを代表するノード(以下、代表ノードとも呼ぶ)を生成する。
図4Aの例では、知識グラフ402の「制服は規律を高める」ノードは、知識グラフ402と同一の文書から生成された知識グラフ301が示すステートメントの情報を全て含むため、知識グラフ生成部211は代表ノードを生成する。知識グラフ生成部211は、例えば、知識グラフ301のリレーションを示す「高める」エッジを「高める」ノードに変更して、代表ノードに決定する。そして、知識グラフ生成部211は、「高める」エッジの起点であった「制服」ノードを起点として、代表ノードを終点とするエッジ、及び代表ノードを起点として、「高める」エッジの終点であった「規律」ノードを終点とするエッジを生成する。これにより、知識グラフ403の矩形の点線で囲まれた部分が生成される。
前述したように、知識グラフ403の二重線で示された「高める」ノードは、3つのノード(「制服」、「高める」、「規律」)を含む1つのステートメントを代表する代表ノードである。N個(Nは1以上の整数)のステートメントを代表する代表ノードを、N+1次のノードと呼ぶ。つまり、知識グラフ403の二重線で示された「高める」ノードは、2次のノードである。また、エンティティそのものを示すノードを1次のノードと呼ぶ。つまり、N次のノード間のリレーションが代表ノードに変換された場合、当該代表ノードはN+1次のノードである。
また、知識グラフ403における、二重線で示されたエッジは、ノード間のリレーションを表すのではなく、知識グラフ403の矩形の点線で囲まれた部分に含まれる3つのノードからなるステートメントを、代表ノードが代表すること、を表すためのエッジである。以下、このようなエッジをステートメントエッジと呼ぶ。
また、前述した通り、知識グラフ402において、起点である「専門家」ノードと、終点である「制服は規律を高める」ノードが、「述べた」というリレーションを示すエッジによって接続されている。従って、知識グラフ生成部211は、「制服は規律を高める」というステートメントを代表する「高める」ノードを終点とし、「専門家」ノードを起点として、2つのノードを「述べた」というリレーションを示すエッジで接続することにより、知識グラフ403を生成する。
これにより、知識グラフ生成部211は、「制服が規律を高める」こと、及び「専門家」が「制服は規律を高める」と述べたことを1つの知識グラフ403で表現することができる。なお、上述したようなグラフの統合処理が行われた後でも、ステートメントそのものをエンティティとして含む知識グラフが残った場合には、知識グラフ生成部211は、当該知識グラフを削除してもよい。
図4Cは、ノードテーブル304の一例である。ノードテーブル304は、ノードの次数をさらに保持してもよい。つまり、知識グラフ生成部211は、ノードIDとノードの次数とを対応づけて、ノードテーブル304に格納する。
図4Dは、エッジテーブル305の一例である。エッジテーブル305は、エッジがステートメントエッジであるか否かを示すフラグを保持してもよい。つまり、知識グラフ生成部211は、エッジIDと、エッジがステートメントエッジであるか否かを示すフラグと、を対応づけて、エッジテーブル305に格納する。なお、ステートメントエッジは表層表現を示していないため、エッジテーブル305において、ステートメントエッジに対応する表層表現にはnull値が格納されている。
知識グラフ生成部211は、このようにして、ステートメントを示す2次のノードを含むグラフ構造を有する知識グラフを作成することによって、単純なエンティティ間のリレーションだけでなく、より複雑な情報を知識グラフで表現できる。
図5A〜図5Cは、知識グラフの一例である。知識グラフ501は、「制服は規律を高めるが、自由を阻害する。」という文から作成された知識グラフである。知識グラフ生成部211は、図3Cを用いて説明したように、まず、当該文から、「制服は規律を高める」ことと、「制服が自由を阻害する」ことと、を示す知識グラフ303を作成する。
知識グラフ生成部211は、例えば予め用意された辞書等を参照して、当該文に逆説を示す表層表現があると判定した場合、主節である「制服は規律を高める」というステートメント、及び従属節である「制服が自由を阻害する」というステートメントそれぞれから、代表ノードを生成する。例えば、知識グラフ生成部211は、前述した方法と同様に、主節から代表ノード「高める」を、従属節から代表ノード「阻害する」を生成する。これらの代表ノードは、いずれも2次のノードである。
そして、知識グラフ生成部211は、「高める」エッジの起点であった「制服」ノードを起点として代表ノードを終点とするエッジと、代表ノードを起点として「高める」エッジの終点であった「規律」ノードを終点とするエッジと、を生成する。同様に、知識グラフ生成部211は、「阻害」エッジの起点であった「制服」ノードを起点として、代表ノードを終点とするエッジ、及び代表ノードを起点として、「阻害する」エッジの終点であった「自由」ノードを終点とするエッジを生成する。これらの生成されたエッジは、いずれもステートメントエッジである。
さらに、知識グラフ生成部211は、主節の代表ノード「高める」を起点とし、従属節の代表ノード「阻害する」を終点とする、逆説のリレーションを示す「逆説」エッジを生成する。この処理により、知識グラフ生成部211は、知識グラフ501を生成することができる。
以下、図5Bに示す「調査によると、制服は規律を高める」という文から、知識グラフ生成部211が、図5Cに示す知識グラフ503を生成する例を説明する。知識グラフ生成部211は、まず、図4Aの例と同様に、知識グラフ301を生成する。また、知識グラフ生成部211は、知識グラフ502を生成する。知識グラフ502の生成方法の一例を説明する。
知識グラフ生成部211は、例えば、予め用意された辞書を参照して、文中に情報源を示す単語(図5Bにおける「調査」)が存在すると判定した場合、構文解析等を実行して、当該情報源が示す情報(図5Bにおける「制服は規律を高める」)を抽出する。
知識グラフ生成部211は、「制服は規律を高める」というステートメントをエンティティとみなす。知識グラフ生成部211は、「調査」ノードを起点とし、「制服は規律を高める」ノードを終点とする、「情報源」エッジを、この2つのエンティティ間のリレーションとして生成する。これによって、知識グラフ生成部211は、図5Cに示す知識グラフ502を生成することができる。
さらに知識グラフ生成部211は、図4A及び図4Bを用いて説明した方法と同様の方法によって、知識グラフ301と知識グラフ502とを統合して、知識グラフ503を生成することができる。
以下、図5Dに示す「専門家は、制服は規律を高めるが、自由を阻害する、と述べた。」という文から、知識グラフ生成部211が、図5Eに示す知識グラフ505を生成する例を説明する。知識グラフ生成部211は、当該文の「制服は規律を高めるが、自由を阻害する」という部分から、図5Aを用いて説明した方法によって、知識グラフ501を生成する。また、知識グラフ生成部211は、「制服は規律を高めるが、自由を阻害する」というステートメントをエンティティとみなして、知識グラフ504を生成する。
知識グラフ504の「制服は規律を高めるが、自由を阻害する」ノードは、同一の文から生成された知識グラフ501が示すステートメントの情報を全て含むため、知識グラフ501のリレーションを示す「逆説」エッジを「逆説」ノードに変換して、代表ノードに決定する。代表ノード「逆説」の次数は3である。
そして、知識グラフ生成部211は、「逆説」エッジの起点であった「高める」ノードを起点として、「逆説」ノードを終点とするステートメントエッジ、及び「逆説」ノードを起点として、「逆説」エッジの終点であった「阻害する」ノードを終点とするステートメントエッジを生成する。
さらに知識グラフ生成部211は、「制服は規律を高めるが、自由を阻害する」というステートメントを代表する「逆説」ノードを終点とし、「専門家」ノードを起点として、2つのノードを「述べた」というリレーションを示すエッジで接続することにより、知識グラフ505を生成する。
このように、本実施例の知識グラフ生成部211は、高次のノードとそれを結ぶ特殊なエッジ(ステートメントエッジ)を用いることにより、入れ子になった情報をグラフ型知識で表現する。これにより、知識グラフ生成部211は、単純な情報だけでなく、複雑なコンテキストを少ない知識グラフにより表現することができる。つまり、本実施例の発想支援装置201は、複雑なコンテキストを扱うことができるにも関わらず、知識グラフDB105のデータ量を抑え、さらに後述する発話理解処理における知識グラフの照合処理を高速に行うことができる。
図2の説明に戻る。続いて、コンテキスト計算部212は、知識グラフDB105が保持する知識グラフを用いて、文章内において情報が出現する順序を計算するコンテキスト計算処理を実行する(S112)。
前述したように、知識グラフ生成部211は、文章から抽出した個別の情報をグラフ化した上で、例えば、予め定めた基準(表層表現、単語辞書、オントロジーでの位置づけなど)に従ってノードを同一視することにより、図3C、図4B、図5A、図5C、及び図5D等に示す知識グラフを生成する。
図6Aは、知識グラフの一例である。文章601は、学校での制服の導入に反対する論述文の例である。文章601において、制服の導入に反対だという意見が表明され、その後、規律が高まるというメリットが述べられつつ、やはり、生徒の自由を阻害するというデメリットが述べられている。さらに、文章601において、特定の制服の採用により市場の公平性を阻害する、という観点の意見が述べられている。
このように、作文、会話、及び論述文等には、情報提示の流れ(コンテキスト)がある。本実施例のコンテキスト計算部212は、文書DB103にある文章のコンテキストを計算して、計算結果をコンテキストDB107に格納する。コンテキスト計算部212は、文章に出現する知識の順序を計算することにより、コンテキスト計算を行う。
本実施例の発想支援装置201は、知識グラフDB105とコンテキストDB107とを用いて、ユーザによる作文や会話のコンテキストを認識し、コンテキストを考慮した適切なヒント、コメント、及び質問等をユーザに提示する。これにより、発想支援装置201は、ユーザの思考を深め、発想を支援することができる。
以下、コンテキスト計算処理(S112)の詳細について説明する。なお、コンテキスト計算処理における知識とは、ステートメントに含まれるリレーションが示す知識、即ち2次以上のノード又はステートメントエッジではないエッジが示す知識である。図6Aの知識グラフ602は、文章601から生成された知識グラフの一例である。図6Bは、知識グラフ602に対応するノードテーブル304の一例である。図6Cは、知識グラフ602に対応するエッジテーブル305の一例である。
コンテキスト計算部212は、例えば、文書DB103に含まれる各文書について、文書中に現れる知識の順序を、知識グラフ上で計算する。コンテキスト計算部212は、例えば、知識グラフ602中の知識「制服は規律を高める」に対して、当該知識に関係するノード及びエッジのIDを、文中の出現順に並べたベクトル(N1,E1,N2,E2,N3)として、当該知識を表現してもよい。この方法によれば、例えば、「制服は規律を高めるが、自由を阻害する」という知識は、例えば、(N1、E1、N2,E2,N3,E3,N4,E5,N1,E6,N6,E7,N7)と表現される。
なお、コンテキスト計算部212は、下記に説明する方法を用いて、より簡潔に知識を表現することが好ましい。具体的には、コンテキスト計算部212は、ステートメントエッジではないエッジと、2次以上のノードと、を指定することにより、知識を表現する。これにより、コンテキスト計算部212は、知識グラフ中の「制服は規律を高めるが、自由を阻害する」のような、複文、重文、及び接続詞等を含む複雑な知識を、簡潔に扱うことができる。以下、具体例を用いて説明する。
まず、知識グラフ602は、2次以上のノードとして、2次のノードN2及びN6、並びに3次のノードN4を含む。2次のノードN2「高める」は、ノードN1「制服」及びノードN3「規律」とステートメントエッジで結ばれており、「制服は規律を高める」という知識を表す。同様に、2次のノードN6「阻害する」は、「制服は自由を阻害する」という知識を表す。3次のノードN4「逆説」は、「制服は規律を高める」を代表するN2と「制服は自由を阻害する」を代表するN6にステートメントエッジで結ばれているため、「制服は規律を高めるが、自由を阻害する」という知識を表す。
次に、知識グラフ602は、ステートメントエッジではないエッジとして、E4とE8とを含む。エッジE4は、ノードN5「専門家」とノードN4「逆説」とを結んでおり、「専門家は、制服は規律を高めるが、自由を阻害する、と述べた」という知識を表す。また、同様に、エッジE8は、「制服は市場公平性を損なう」という知識を表す。
コンテキスト計算部212は、以上の方法を用いることにより、例えば「制服は規律を高めるが、自由を阻害する」のような複雑な知識をN4と表すように、ステートメントエッジではないエッジのID、又は2次以上のノードのIDを用いて、知識を簡潔に表すことができる。
コンテキスト計算部212は、コンテキスト計算処理において、文書内に知識が現れる順序を計算する。図7A及び図7Bを用いて、その計算方法の一例を説明する。図7Aは、知識グラフの一例である。知識グラフ703は、文書DB103に含まれる文701及び文702から、生成された知識グラフである前述したようにステートメントエッジではないエッジと2次以上のノードとを用いて知識が表現された場合、文701には、N6、E8、N2、E9の順番で知識が出現している。また、同様に文702には、N6、E9の順番で知識が出現している。
コンテキスト計算部212は、知識グラフ703に出現する知識それぞれについて、文書DB103内の文書において、当該知識より後に出現した知識(以下、後続知識とも呼ぶ)の出現回数と、を算出し、コンテキストDB107が保持する後続知識テーブルに格納する。
つまり、コンテキスト計算部212は、知識グラフ703に出現する2次以上のノード及びステートメントエッジではないエッジに対応する知識を特定する。コンテキスト計算部212は、特定した知識それぞれについて、文書DB103内の文書において、当該知識より後に出現した知識であって、知識グラフ703に出現する2次以上のノード及びステートメントエッジではないエッジが示す知識、の出現回数を算出する。
図7Bは後続知識テーブルの一例である。後続知識テーブル704は、知識に対応するノードID又はエッジIDと、当該知識の後続知識と、当該知識の後に当該後続知識が出現した回数と、を対応づけて保持する。例えば、図7Bの後続知識テーブル704の2行目は、知識N6の後に、知識E8が1回、知識N2が1回、知識E9が2回、出現したことを示す。知識E9は、文701と文702において、それぞれ1回ずつ、N6よりも後に出現しているため、図7Bの後続知識テーブル704において、N6の後続知識としてのE9の出現回数は2回となっている。
コンテキスト計算部212は、このように、知識ごとに、後続知識と後続知識の出現回数とを対応づけて後続知識テーブル704に格納することにより、コンテキストDB107は、文書内における知識の順序及び前後関係などを示す情報を保持することができる。
なお、コンテキスト計算部212は、各知識について、後続知識との文書上での距離を計算し、後続知識テーブル704に格納してもよい。出現回数が2回以上の後続知識については、コンテキスト計算部212は、当該知識と当該後続知識の文書上での距離の平均値又は最小値等を後続知識テーブル704に格納する。以上、学習処理について説明した。
次に、運用処理(S120)について説明する。運用処理において、発想支援装置201は、学習フ処理で作成した知識グラフと後続知識とを用いて、ユーザによる作文や会話におけるコンテキストを理解し、作文や会話の途中で、適切なヒントを提示することにより、ユーザの発想を促す。
まず、発話理解部213は、ステートメントを含む作文や会話の入力をユーザから受け付け、テキストに変換する(S121)。具体的には、発話理解部213は、例えば、キーボードなどの入力インタフェースからテキスト入力を受け付けてもよいし、マイク等から入力された発話音声を音声認識技術によりテキスト変換してもよい。また、例えば、発話理解部213は、紙に書かれた文章をOCRなどによりテキスト変換してもよい。また、発話理解部213は、手話認識などの手法を用いて、ユーザの動きをテキスト変換してもよい。
続いて、発話理解部213は、ステップS121で取得したテキストを、知識グラフ105を用いて理解する、発話理解処理を実施する(S122)。ここでは、発話理解部213は入力されたテキストを知識グラフ105にマッチングすることにより、ユーザの発話を理解する。以下、図8A、図8B、図9A、図9B、及び図9Cを用いて発話理解処理の詳細を説明する。
図8Aの知識グラフ801は、知識グラフDB105に格納されたノードテーブル304及びエッジテーブル305が示す知識グラフの一部である。また、図8Bの後続知識テーブルは、コンテキストDB107に格納された後続知識テーブル704の一部である。
例えば、「制服を学校に導入するべきか」というテーマに対して、ユーザが「制服を学校に導入することに賛成」という立場で、論述文を作成しているとする。そして、発話理解部213が、図9Cに示す表示画面903における「学校で制服を導入するべきです。」という文の入力を受け付けたとする。発話理解部213は、ステップS111の知識グラフ生成処理と同様の方法を用いて、当該文から図9Aの知識グラフ901を生成する。
続いて、発話理解部213は、知識グラフ901と知識グラフ801とを照合して、知識グラフ901が示す知識に含まれる知識を知識グラフ801から検索する。コンテキスト計算処理において説明した知識の表現方法を用いると、知識グラフ801が示す知識E10(即ち、「学校」ノードと「制服」ノードとを「導入する」リレーションで結んだ知識)は、知識グラフ901が示す知識に含まれるため、発話理解部213は、E10を抽出する。このように、発話理解部213は、ユーザの入力に含まれる知識を抽出し、抽出した知識と予め学習した知識グラフとを照合することにより、ユーザの入力を理解する。
また、発話理解部213は、例えば、コンテキスト計算処理と同じ表現方法を用いて、ユーザによって入力されたテキストが示す知識の知識グラフ801上のノードID及びエッジIDと、当該テキストにおける知識出現順序と、を示す情報をコンテキスト認識部214に出力する。表示画面903が示す文が入力された場合、発話理解部213は、例えば、E10をコンテキスト認識部214に出力する。図7Aの文702が入力された場合、発話理解部213は、例えば、N6、E9の順で、エッジIDをコンテキスト認識部214に出力する。
ところで、知識グラフ901は、知識グラフ801の一部(N10、E10、及びN1らなる部分)と完全に一致している。発話理解部213は、知識グラフの照合において、一方のリレーション又はやエンティティが、他方のリレーション又はエンティティと完全一致でなくても、例えば、類似度が所定値以上である場合には、当該一方と当該他方を同一のものとして扱ってもよい。
例えば、発話理解部213がユーザから入力されたテキストから図9Bの知識グラフ902を生成したとする。知識グラフ902のエッジは「取り入れる」であるが、発話理解部213は、「取り入れる」と知識グラフ801のE10「導入する」が同義だとみなして、知識グラフ902が示す知識がE10と一致すると判定してもよい。
発話理解部213は、エンティティやリレーション間の類似度を、例えば、単語辞書やオントロジーなどにおける類義関係により算出する。発話理解部213は、類似度が所定以上であるリレーションやエンティティを同義のものとして扱うことにより、ユーザ入力から抽出した知識に一致する、知識グラフDB105内の知識を増やすことができ、ひいてはユーザに適切なヒントを与えることができる可能性が高くなる。
図2の説明に戻る。続いて、コンテキスト認識部214は、発話理解処理で取得したユーザ入力のテキストが示す知識の出現順序を、後続知識テーブル704と照合する、コンテキスト認識処理を実行する(S123)。例えば、知識グラフ901に相当するテキストがユーザから入力された場合、前述の通りステップS122においてE10が出力される。このとき、コンテキスト認識部214は、図8Bの後続知識テーブル704の2行目(知識の値がE10の行)が示す情報を、フェーズ認識部215に出力する。
次に、フェーズ認識部215では、ユーザの作文や会話のフェーズを認識する、フェーズ認識処理を実行する(S124)。例えば、あるテーマ(図9A〜図9Cの例では、「学校に制服を導入するべきか」)に対して、賛成又は反対の立場にて、ユーザが論述する場合に、論述文に求められる内容がある。
賛否の表明、賛成又は反対の論点を挙げること、並びに賛否の理由及び根拠の提示等は、当該論述文に求められる内容の例である。フェーズ認識部215は、作文や会話に求められる予め定められた内容が、ユーザが入力したテキストに不足しているか否かを判定することにより、ユーザの作文や会話のフェーズを認識する。
図9Cは、表示装置203に表示される画面の変遷の一例を示す。例えば、表示画面903に表示された文のフェーズは、制服の導入に賛成の立場は表明されているが、論点が挙げられていない、理由や根拠が提示されていない、というフェーズである。フェーズ認識部215は、予め定めておいた内容のうち、ユーザによって入力されたテキストにおいて述べられていない内容を特定する。
なお、作文や会話に求められる内容は予め定義されており、例えば、発想支援装置201は学習用の文書を予め保持している。例えば、発想支援装置201は、運用処理の開始前に、当該内容に該当する箇所のラベルを作成し、当該ラベルを用いた機械学習により、当該内容を認識できる識別器を作成しておく。フェーズ認識部215は、この識別器を用いて、ユーザが入力したテキスト中に、当該内容が含まれているか否かを判別する。図9Cの例では、作文において、学校への制服の導入に対する賛否の表明、及び表明した賛否のための論点、が必要であるものとする。
なお、発想支援装置201は、例えば、文書DB103の当該内容に該当する箇所(例えば、上記内容を含む文書又は上記内容を含むテキスト)に、当該内容に該当する箇所であることを示すアノテーションを付与してもよい。
そして、知識グラフ生成部211は、知識グラフ生成処理において、アノテーション部分を用いた知識を含む知識グラフを生成した場合、当該アノテーション部分が示す内容を当該知識が示すことを、知識グラフ上に付加情報として与えてもよい。つまり、例えば、知識グラフ生成部211は、ノードテーブル304、及びエッジテーブル305に、さらに列を追加し、追加した列に当該付加情報を格納する。
図2の説明に戻る。続いて、フェーズ認識部215は、コンテキスト認識処理及びフェーズ認識処理の結果に基づいて、ユーザにヒントを提示するヒント提示処理を実施する(S125)。フェーズ認識部215は、後続知識テーブル704が示す後続知識から提示するヒントを生成する。
前述の通り、表示画面903に表示されている文が入力された場合、コンテキスト認識処理において、後続知識テーブル704の知識がE10であるレコードの情報が出力される。つまり、フェーズ認識部215は、知識E10の後続知識がN2及びE9であることを示す情報を既に取得している。
従って、フェーズ認識部215は、後続知識N2及び後続知識E9のリレーションが示すステートメントを、ユーザに提示するヒントの候補に決定する。フェーズ認識部215は、当該候補全てをヒントとして、表示装置203に出力してもよい。
また、例えば、フェーズ認識部215は、フェーズ認識処理において、表示画面903に表示されている文に不足していると判定された内容を示す知識に相当する候補がある場合、当該候補を優先して表示装置203にヒントとして表示してもよい。
なお、「ある候補が優先して表示される」とは、例えば、当該候補のみが表示装置203に表示されること、及び全ての候補が表示装置203に表示される場合に当該候補が強調表示されること等を意味する。
また、フェーズ認識部215は、後続知識テーブル704の知識がE10であるレコードにおける出現回数が多い(図8Bの例では、N2は10回、E9は5回)知識を優先して、表示装置203にヒントとして提示してもよい(例えば、出現回数が大きい順に所定数の候補を提示したり、出現回数が所定数以上の候補を全て提示したりする)。これにより、フェーズ認識部215は、ユーザが入力した内容と関連性の強い知識をヒントとして出力することができる。
また、後続知識テーブル704に知識と後続知識との間の文書上の距離が格納されている場合には、フェーズ認識部215は、後続知識テーブル704の知識がE10であるレコードにおける距離が小さい知識を優先して、表示装置203にヒントとして提示してもよい(例えば、距離が小さい順に所定数の候補を提示したり、距離が所定値以下の候補を全て提示したりする)。これにより、フェーズ認識部215は、ユーザが入力した内容と関連性の強い知識をヒントとして出力することができる。
例えば、知識N2及び知識E9の賛成または反対の論点であるとする。このとき、フェーズ認識部215は、例えば、出現回数を優先して、図9Cの表示画面904中に表示されているように、「制服は規律を高める」という内容をヒントとして提示する。なお、フェーズ認識部215は、例えば、ユーザがヒントを必要としていると推定した場合、又はユーザからのヒント提示要求を受け付けた場合に、ヒントを表示装置203に表示する。具体的には、例えば、フェーズ認識部215は、ユーザの入力から一定時間が経っても、次の入力がない場合にヒントを提示してもよいし、ユーザによるボタン押圧等のユーザからの要求があった場合にヒントを提示してもよい。
なお、ここでは、フェーズ認識部215は、表示画面904において、1つのヒントのみを提示したが、複数のヒントを提示してもよい。なお、フェーズ認識処理は、提示するヒントを絞るための処理であるため、実行されなくてもよい。
ユーザは、表示画面904中に提示されたヒントを参考にして、表示画面905に表示されているようにユーザはテキストの入力を続け、発話理解処理に戻る。なお、ユーザは、提示されたヒントとは関係のないテキストを入力してもよい。そして、入力されたテキストに対して、発話理解処理、及びコンテキスト認識処理が再度実行される。表示画面905に表示されている文が入力された場合のコンテキスト認識処理における出力は、E10及びN2である。
このとき、図8Bの後続知識テーブル704において、E10及びN2に共通する後続知識は、E9であるため、フェーズ認識部215は、ヒント提示処理において、例えば、表示画面906のように、「制服は学習意欲を高める」をヒントとして提示する。
本実施例の発想支援装置201は、上述した処理により、ユーザがテキスト入力に詰まったときや、ユーザがヒントを要求したときに、ユーザに適切なヒントを与えることができ、ひいてはユーザの発想を支援し、ユーザによる次の発話を支援することができる。
なお、フェーズ認識部215は、ヒント提示処理において、知識グラフを用いた以下に示す処理を行ってもよい。前述したように、ユーザが表示画面905に表示されている文を入力した場合、コンテキスト認識処理において知識E10及び知識N2が出力される。
知識グラフ801において、コンテキスト認識処理において出力された知識N2の逆接の知識N6がある。フェーズ認識部215は、このように、コンテキスト認識部214から入力された知識の逆説の知識が知識グラフ上に含まれ、かつ当該逆説の知識がコンテキスト認識部214から入力されていない場合、当該逆説の知識に相当するヒントを提示してもよい。具体的には、例えば、フェーズ認識部215は、表示画面907に示す、「制服は規律を高めるが、制服は自由を阻害する、という意見もありますが、どう思いますか?」等の問いかけやコメントを、ヒントして提示してもよい。
当該処理により、ユーザは自身の逆の立場からの意見を知ることができ、ひいては論述や作文、会話におけるユーザの発想を深めるための支援することができる。なお、上述の例では、フェーズ認識部215がコンテキスト認識部214から入力された知識の逆説の知識をヒントとして提示する例を説明したが、フェーズ認識部215は、コンテキスト認識部214から入力された知識の逆説以外のリレーションにある知識であって、かつコンテキスト認識部214から入力されていない知識、をヒントとして提示してもよい。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることも可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
103 文書DB、105 知識グラフDB、107 コンテキストDB、201 発想支援装置、202 入力装置、203 表示装置、204 通信装置、205 演算装置(CPU)、206 メモリ、207 補助記憶装置、211 知識グラフ生成部、212 コンテキスト計算部、213 発話理解部、214 コンテキスト認識部、215 フェーズ認識部

Claims (10)

  1. ユーザの発想を支援する発想支援装置であって、
    プロセッサとメモリとを含み、
    前記メモリは、
    知識を定義する文書に含まれる命題を構成する要素を示すノードと、前記命題が示す前記要素間のリレーションを示す第1種エッジと、を含む第1グラフ、の構造を示すグラフ情報と、
    前記文書におけるリレーションの出現順序を示すコンテキスト情報と、を保持し、
    前記プロセッサは、
    命題の入力を受け付け、
    前記入力を受け付けた命題に含まれる要素と、前記入力を受け付けた命題が示す当該要素間のリレーションと、を抽出し、
    前記抽出した要素を示すノードを含み、かつ前記抽出した要素間のリレーションを前記第1種エッジとして含む第2グラフを生成し、
    前記グラフ情報を参照して、前記第2グラフが示すリレーションが前記第1グラフに含まれると判定した場合、前記コンテキスト情報を参照して、前記文書において当該リレーションの後に出現したリレーションを特定し、
    前記特定したリレーションを示す情報を出力する、発想支援装置。
  2. 請求項1に記載の発想支援装置であって、
    前記文書は、複数の命題を含み、
    前記第1グラフのノードは、
    前記複数の命題に含まれるエンティティを示す第1種ノードと、
    前記複数の命題に含まれる命題であって、全ての要素とリレーションが前記複数の命題における他の命題の1つの要素に含まれる命題、である第1種命題のリレーションを示す第2種ノードと、を含み、
    前記第1グラフは、前記第1種命題を構成する要素を示すノードと、前記第2種ノードと、を接続する第2種エッジを含み、
    前記プロセッサは、
    複数の命題の入力を受け付け、
    前記第2グラフの生成において、
    前記抽出した要素のうちエンティティを前記第1種ノードに決定し、
    前記入力を受け付けた複数の命題が、前記第1種命題を含むと判定した場合、当該第1種命題のリレーションを前記第2種ノードに決定し、
    当該第1種命題を構成する要素を示すノードと、前記決定した第2種ノードと、を前記第2種エッジで接続する、発想支援装置。
  3. 請求項1に記載の発想支援装置であって、
    前記コンテキスト情報は、前記文書の命題が示すリレーションそれぞれについて、前記文書において当該リレーションより後に出現したリレーションの出現回数を示し、
    前記プロセッサは、
    前記コンテキスト情報が示す、前記特定したリレーションの出現回数に基づいて、前記特定したリレーションからリレーションを選択し、
    前記選択したリレーションを示す情報を出力する、発想支援装置。
  4. 請求項1に記載の発想支援装置であって、
    前記コンテキスト情報は、前記文書の命題が示すリレーションそれぞれについて、前記文書において当該リレーションより後に出現したリレーションとの前記文書上での距離を示し、
    前記プロセッサは、
    前記コンテキスト情報が示す、前記第1グラフに含まれる前記第2グラフが示すリレーションと、前記特定したリレーションと、の距離に基づいて、前記特定したリレーションからリレーションを選択し、
    前記選択したリレーションを示す情報を出力する、発想支援装置。
  5. 請求項1に記載の発想支援装置であって、
    前記プロセッサは、前記特定したリレーションに予め定められたリレーションが含まれる場合、前記予め定められたリレーションを示す情報を出力する、発想支援装置。
  6. 発想支援装置が、ユーザの発想を支援する方法であって、
    前記発想支援装置は、
    知識を定義する文書に含まれる命題を構成する要素を示すノードと、前記命題が示す前記要素間のリレーションを示す第1種エッジと、を含む第1グラフ、の構造を示すグラフ情報と、
    前記文書におけるリレーションの出現順序を示すコンテキスト情報と、を保持し、
    前記方法は、
    前記発想支援装置が、
    命題の入力を受け付け、
    前記入力を受け付けた命題に含まれる要素と、前記入力を受け付けた命題が示す当該要素間のリレーションと、を抽出し、
    前記抽出した要素を示すノードを含み、かつ前記抽出した要素間のリレーションを前記第1種エッジとして含む第2グラフを生成し、
    前記グラフ情報を参照して、前記第2グラフが示すリレーションが前記第1グラフに含まれると判定した場合、前記コンテキスト情報を参照して、前記文書において当該リレーションの後に出現したリレーションを特定し、
    前記特定したリレーションを示す情報を出力する、方法。
  7. 請求項6に記載の方法であって、
    前記文書は、複数の命題を含み、
    前記第1グラフのノードは、
    前記複数の命題に含まれるエンティティを示す第1種ノードと、
    前記複数の命題に含まれる命題であって、全ての要素とリレーションが前記複数の命題における他の命題の1つの要素に含まれる命題、である第1種命題のリレーションを示す第2種ノードと、を含み、
    前記第1グラフは、前記第1種命題を構成する要素を示すノードと、前記第2種ノードと、を接続する第2種エッジを含み、
    前記方法は、
    前記発想支援装置が、
    複数の命題の入力を受け付け、
    前記第2グラフの生成において、
    前記抽出した要素のうちエンティティを前記第1種ノードに決定し、
    前記入力を受け付けた複数の命題が、前記第1種命題を含むと判定した場合、当該第1種命題のリレーションを前記第2種ノードに決定し、
    当該第1種命題を構成する要素を示すノードと、前記決定した第2種ノードと、を前記第2種エッジで接続する、方法。
  8. 請求項6に記載の方法であって、
    前記コンテキスト情報は、前記文書の命題が示すリレーションそれぞれについて、前記文書において当該リレーションより後に出現したリレーションの出現回数を示し、
    前記方法は、
    前記発想支援装置が、
    前記コンテキスト情報が示す、前記特定したリレーションの出現回数に基づいて、前記特定したリレーションからリレーションを選択し、
    前記選択したリレーションを示す情報を出力する、方法。
  9. 請求項6に記載の方法であって、
    前記コンテキスト情報は、前記文書の命題が示すリレーションそれぞれについて、前記文書において当該リレーションより後に出現したリレーションとの前記文書上での距離を示し、
    前記方法は、
    前記発想支援装置が、
    前記コンテキスト情報が示す、前記第1グラフに含まれる前記第2グラフが示すリレーションと、前記特定したリレーションと、の距離に基づいて、前記特定したリレーションからリレーションを選択し、
    前記選択したリレーションを示す情報を出力する、方法。
  10. 請求項6に記載の方法であって、
    前記発想支援装置が、前記特定したリレーションに予め定められたリレーションが含まれる場合、前記予め定められたリレーションを示す情報を出力する、方法。
JP2017041822A 2017-03-06 2017-03-06 発想支援装置及び発想支援方法 Expired - Fee Related JP6622236B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017041822A JP6622236B2 (ja) 2017-03-06 2017-03-06 発想支援装置及び発想支援方法
KR1020170147764A KR102039393B1 (ko) 2017-03-06 2017-11-08 발상 지원 장치 및 발상 지원 방법
CN201711235125.2A CN108536720B (zh) 2017-03-06 2017-11-30 构思支援装置及构思支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017041822A JP6622236B2 (ja) 2017-03-06 2017-03-06 発想支援装置及び発想支援方法

Publications (2)

Publication Number Publication Date
JP2018147238A true JP2018147238A (ja) 2018-09-20
JP6622236B2 JP6622236B2 (ja) 2019-12-18

Family

ID=63489748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017041822A Expired - Fee Related JP6622236B2 (ja) 2017-03-06 2017-03-06 発想支援装置及び発想支援方法

Country Status (3)

Country Link
JP (1) JP6622236B2 (ja)
KR (1) KR102039393B1 (ja)
CN (1) CN108536720B (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021205639A1 (ja) * 2020-04-10 2021-10-14 日本電信電話株式会社 オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム
JP2022051666A (ja) * 2020-09-21 2022-04-01 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体
WO2022091536A1 (ja) * 2020-10-27 2022-05-05 株式会社日立製作所 意味表現解析システム及び意味表現解析方法
JP7444280B2 (ja) 2020-11-02 2024-03-06 富士通株式会社 機械学習プログラム、推定プログラム、装置、及び方法
JP7474536B1 (ja) 2023-08-07 2024-04-25 Linked Ideal合同会社 情報処理システム、情報処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006191A (ja) * 2001-06-27 2003-01-10 Ricoh Co Ltd 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
JP2006301967A (ja) * 2005-04-20 2006-11-02 Sony Computer Entertainment Inc 会話支援装置
WO2007049800A1 (ja) * 2005-10-27 2007-05-03 Raytec Co., Ltd. 文書作成支援装置
WO2007060780A1 (ja) * 2005-11-22 2007-05-31 Nec Corporation 発想支援装置、発想支援方法および発想支援用プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5841900A (en) * 1996-01-11 1998-11-24 Xerox Corporation Method for graph-based table recognition
AUPR295501A0 (en) * 2001-02-08 2001-03-08 Wong, Kwok Kay Proximity for computer represented graphs
JP2004342064A (ja) * 2003-05-16 2004-12-02 Seki Tama Yonezawa ヒューマン推論エンジン
US20070156720A1 (en) * 2005-08-31 2007-07-05 Eagleforce Associates System for hypothesis generation
JP4677563B2 (ja) 2006-03-10 2011-04-27 国立大学法人 筑波大学 意思決定支援システム及び意思決定支援方法
US8375061B2 (en) * 2010-06-08 2013-02-12 International Business Machines Corporation Graphical models for representing text documents for computer analysis
US9002773B2 (en) * 2010-09-24 2015-04-07 International Business Machines Corporation Decision-support application and system for problem solving using a question-answering system
JP5426710B2 (ja) * 2012-03-19 2014-02-26 株式会社東芝 検索支援装置、検索支援方法およびプログラム
KR101353521B1 (ko) * 2012-05-10 2014-01-23 경북대학교 산학협력단 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치
CN104699758B (zh) * 2015-02-04 2017-10-27 中国人民解放军装甲兵工程学院 一种图文库关联的指挥文书智能生成系统与方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006191A (ja) * 2001-06-27 2003-01-10 Ricoh Co Ltd 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
JP2006301967A (ja) * 2005-04-20 2006-11-02 Sony Computer Entertainment Inc 会話支援装置
WO2007049800A1 (ja) * 2005-10-27 2007-05-03 Raytec Co., Ltd. 文書作成支援装置
WO2007060780A1 (ja) * 2005-11-22 2007-05-31 Nec Corporation 発想支援装置、発想支援方法および発想支援用プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021205639A1 (ja) * 2020-04-10 2021-10-14 日本電信電話株式会社 オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム
JPWO2021205639A1 (ja) * 2020-04-10 2021-10-14
JP7343820B2 (ja) 2020-04-10 2023-09-13 日本電信電話株式会社 オントロジを用いた文章データ解析情報生成装置、文章データ解析情報生成方法、および文章データ解析情報生成プログラム
JP2022051666A (ja) * 2020-09-21 2022-04-01 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体
JP7178441B2 (ja) 2020-09-21 2022-11-25 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 要約生成方法、装置、プログラム、電子デバイス及び記憶媒体
WO2022091536A1 (ja) * 2020-10-27 2022-05-05 株式会社日立製作所 意味表現解析システム及び意味表現解析方法
JP7444280B2 (ja) 2020-11-02 2024-03-06 富士通株式会社 機械学習プログラム、推定プログラム、装置、及び方法
JP7474536B1 (ja) 2023-08-07 2024-04-25 Linked Ideal合同会社 情報処理システム、情報処理方法

Also Published As

Publication number Publication date
JP6622236B2 (ja) 2019-12-18
CN108536720A (zh) 2018-09-14
KR20180101991A (ko) 2018-09-14
CN108536720B (zh) 2021-09-21
KR102039393B1 (ko) 2019-11-04

Similar Documents

Publication Publication Date Title
JP6622236B2 (ja) 発想支援装置及び発想支援方法
Khan et al. A novel natural language processing (NLP)–based machine translation model for English to Pakistan sign language translation
Azmi et al. A survey of automatic Arabic diacritization techniques
WO2017130434A1 (ja) 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム
RU2592395C2 (ru) Разрешение семантической неоднозначности при помощи статистического анализа
De Silva Survey on publicly available sinhala natural language processing tools and research
Dickinson et al. Language and computers
Bashir et al. Arabic natural language processing for Qur’anic research: a systematic review
RU2579873C2 (ru) Разрешение семантической неоднозначности при помощи семантического классификатора
Vlachos et al. A new corpus and imitation learning framework for context-dependent semantic parsing
Hasegawa-Johnson et al. Grapheme-to-phoneme transduction for cross-language ASR
Yen et al. WriteAhead: Mining grammar patterns in corpora for assisted writing
JP6077727B1 (ja) 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム
van Esch et al. Future directions in technological support for language documentation
JP2013190985A (ja) 知識応答システム、方法およびコンピュータプログラム
Zakharov Corpora of the Russian language
Guellil et al. The role of transliteration in the process of arabizi translation/sentiment analysis
Saoudi et al. Trends and challenges of Arabic Chatbots: Literature review
Chang et al. WriteAhead2: Mining lexical grammar patterns for assisted writing
WO2020012813A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
Sibeko et al. An overview of Sesotho BLARK content
Guo et al. Research on verb reduplication based on the corpus of international Chinese textbooks
Mahi et al. PURAN: word prediction system for Punjabi language news
Shetty et al. English transliteration of Kannada words with Anusvara and Visarga
Yuan et al. COMPILING: A benchmark dataset for Chinese complexity controllable definition generation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191121

R150 Certificate of patent or registration of utility model

Ref document number: 6622236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees