WO2022090849A1

WO2022090849A1 - 読解支援システム及び読解支援方法

Info

Publication number: WO2022090849A1
Application number: PCT/IB2021/059488
Authority: WO
Inventors: 桃純平; 高瀬奈津子
Original assignee: 株式会社半導体エネルギー研究所
Priority date: 2020-10-30
Filing date: 2021-10-15
Publication date: 2022-05-05
Also published as: CN116457773A; US20240012979A1; JPWO2022090849A1; KR20230091995A

Abstract

ユーザにとって必要な情報を精度よく提示する文書の読解支援システムを提供する。指定文書を受け付け、指定文書に含まれる語句を用いて指定文書の構造を表す第１のグラフを作成し、第１のグラフに含まれる語句を二つ以上出力し、出力した語句の中から複数の指定語句を受け付け、複数の指定語句を用いて第１のグラフを探索し、探索結果を出力する、読解支援システムを提供する。探索結果として、少なくとも、第１のグラフにおける複数の指定語句のいずれか二つの間の最短経路を示す第２のグラフを出力することができる。最短経路は、複数の指定語句のいずれか二つを、少なくとも一つの補完語句を介して結ぶ経路である。補完語句は、複数の指定語句とは異なる語句である

Description

読解支援システム及び読解支援方法

本発明の一態様は、文書の読解支援システム及び読解支援方法に関する。

なお、本発明の一態様は、上記の技術分野に限定されない。本発明の一態様の技術分野としては、半導体装置、表示装置、発光装置、蓄電装置、記憶装置、電子機器、照明装置、入力装置（例えば、タッチセンサなど）、入出力装置（例えば、タッチパネルなど）、それらの駆動方法、又はそれらの製造方法を一例として挙げることができる。

文書を読解する際、文書の読み方は、読み手の目的、または、文書の種類により異なる。文書全体を通して読む場合もあれば、読み手にとって必要な情報を探すことが目的で、文書から必要な情報が記載されている箇所を探して、該当箇所のみに目を通せば十分な場合もある。文書の中から必要な情報を探す方法としては、目次またはインデックスを用いる方法がある。電子化された文書であれば、キーワードとなる単語で検索して所望の情報を見つける方法もある。また、設定された規則に従って文書の構造解析を行う方法が提案されている（特許文献１）。

特開２０１４−２１９８３３号公報

目次またはインデックスを利用する場合、直接探したい言葉が目次またはインデックスで使われていないと、効率が悪い。キーワードでテキスト検索することで、文書全体からキーワードを含む文または段落を探すことが可能だが、効率よく所望の情報を見つけられない場合もある。効率よく見つけられない原因としては、キーワードでヒットする箇所が多すぎて欲しい情報に辿りつくまでに時間がかかる、単一のキーワードでは欲しい情報を絞り切れない、適当なキーワードが見つけられない、などが挙げられる。また、規則に従って文書の構造解析を行う場合は、読み取り対象の構造が制限されるため、様々な構造を持った文書に対応することが難しい。本発明の一態様は、これらの問題の少なくとも一つを解決するものである。

本発明の一態様は、ユーザにとって必要な情報を精度よく提示する文書の読解支援システムまたは文書の読解支援方法を提供することを課題の一つとする。本発明の一態様は、ユーザに対して文書の理解を支援する読解支援システムまたは読解支援方法を提供することを課題の一つとする。本発明の一態様は、ユーザにとって操作が容易な文書の読解支援システムまたは文書の読解支援方法を提供することを課題の一つとする。

なお、これらの課題の記載は、他の課題の存在を妨げるものではない。本発明の一態様は、必ずしも、これらの課題の全てを解決する必要はないものとする。明細書、図面、請求項の記載から、これら以外の課題を抽出することが可能である。

本発明の一態様は、受付部、処理部、及び、出力部を有する読解支援システムである。受付部は、指定文書を受け付ける機能と、複数の指定語句を受け付ける機能と、を有する。処理部は、指定文書に含まれる語句を用いて指定文書の構造を表す第１のグラフを作成する機能と、複数の指定語句を用いて第１のグラフを探索する機能と、を有する。出力部は、第１のグラフに含まれる複数の語句を出力する機能と、第１のグラフの探索結果を出力する機能と、を有する。複数の指定語句は、第１のグラフに含まれる複数の語句の少なくとも一部である。

出力部は、探索結果として、少なくとも、第１のグラフにおける複数の指定語句のいずれか二つの間の最短経路を示す第２のグラフを出力することが好ましい。出力部は、指定文書中の、複数の指定語句を二つ以上含む段落における、指定語句を含む文を出力する機能を有することが好ましい。最短経路は、複数の指定語句のいずれか二つを、少なくとも一つの補完語句を介して結ぶ経路であり、補完語句は、複数の指定語句とは異なる語句であることが好ましい。出力部は、指定文書中の、複数の指定語句の少なくとも一つと、補完語句の少なくとも一つと、を含む段落における、指定語句及び補完語句の少なくとも一方を含む文を出力する機能を有することが好ましい。

または、出力部は、探索結果として、少なくとも、第１のグラフにおける複数の指定語句のそれぞれの間の最短経路を示す第２のグラフを出力することが好ましい。出力部は、指定文書中の、複数の指定語句を二つ以上含む段落における、指定語句を含む文を出力する機能を有することが好ましい。複数の指定語句のいずれか二つを結ぶ最短経路は、二つの指定語句を、少なくとも一つの補完語句を介して結ぶ経路であり、補完語句は、複数の指定語句とは異なる語句であることが好ましい。出力部は、指定文書中の、複数の指定語句の少なくとも一つと、補完語句の少なくとも一つと、を含む段落における、指定語句及び補完語句の少なくとも一方を含む文を出力する機能を有することが好ましい。

本発明の一態様の読解支援システムは、さらに、探索結果を記憶する記憶部を有することが好ましい。

本発明の一態様は、指定文書を受け付け、指定文書に含まれる語句を用いて指定文書の構造を表す第１のグラフを作成し、第１のグラフに含まれる語句を二つ以上出力し、出力した語句の中から複数の指定語句を受け付け、複数の指定語句を用いて第１のグラフを探索し、探索結果を出力する、読解支援方法である。

探索結果として、少なくとも、第１のグラフにおける複数の指定語句のいずれか二つの間の最短経路を示す第２のグラフを出力することが好ましい。探索結果とともに、指定文書中の、複数の指定語句を二つ以上含む段落における、指定語句を含む文を出力することが好ましい。最短経路は、複数の指定語句のいずれか二つを、少なくとも一つの補完語句を介して結ぶ経路であり、補完語句は、複数の指定語句とは異なる語句であることが好ましい。探索結果とともに、指定文書中の、複数の指定語句の少なくとも一つと、補完語句の少なくとも一つと、を含む段落における、指定語句及び補完語句の少なくとも一方を含む文を出力することが好ましい。

または、探索結果として、少なくとも、第１のグラフにおける複数の指定語句のそれぞれの間の最短経路を示す第２のグラフを出力することが好ましい。探索結果とともに、指定文書中の、複数の指定語句を二つ以上含む段落における、指定語句を含む文を出力することが好ましい。複数の指定語句のいずれか二つを結ぶ最短経路は、二つの指定語句を、少なくとも一つの補完語句を介して結ぶ経路であり、補完語句は、複数の指定語句とは異なる語句であることが好ましい。探索結果とともに、指定文書中の、複数の指定語句の少なくとも一つと、補完語句の少なくとも一つと、を含む段落における、指定語句及び補完語句の少なくとも一方を含む文を出力することが好ましい。

本発明の一態様により、ユーザにとって必要な情報を精度よく提示する文書の読解支援システムまたは文書の読解支援方法を提供できる。本発明の一態様により、ユーザに対して文書の理解を支援する読解支援システムまたは読解支援方法を提供できる。本発明の一態様により、ユーザにとって操作が容易な文書の読解支援システムまたは文書の読解支援方法を提供できる。

なお、これらの効果の記載は、他の効果の存在を妨げるものではない。本発明の一態様は、必ずしも、これらの効果の全てを有する必要はない。明細書、図面、請求項の記載から、これら以外の効果を抽出することが可能である。

図１は、読解支援システムの一例を示す図である。
図２は、読解支援方法の一例を示す図である。
図３Ａ乃至図３Ｄは、読解支援方法の一例を示す図である。
図４Ａ乃至図４Ｅは、読解支援方法の一例を示す図である。
図５Ａ乃至図５Ｃは、グラフの一例を示す図である。
図６は、出力内容の一例を示す図である。
図７は、グラフの一例を示す図である。
図８は、読解支援システムの一例を示す図である。
図９は、読解支援システムの一例を示す図である。

実施の形態について、図面を用いて詳細に説明する。但し、本発明は以下の説明に限定されず、本発明の趣旨及びその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは当業者であれば容易に理解される。従って、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。

なお、以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。また、同様の機能を指す場合には、ハッチパターンを同じくし、特に符号を付さない場合がある。

また、図面において示す各構成の、位置、大きさ、範囲などは、理解の簡単のため、実際の位置、大きさ、範囲などを表していない場合がある。このため、開示する発明は、必ずしも、図面に開示された位置、大きさ、範囲などに限定されない。

なお、「膜」という言葉と、「層」という言葉とは、場合によっては、又は、状況に応じて、互いに入れ替えることが可能である。例えば、「導電層」という用語を、「導電膜」という用語に変更することが可能である。または、例えば、「絶縁膜」という用語を、「絶縁層」という用語に変更することが可能である。

（実施の形態１）
本実施の形態では、本発明の一態様の読解支援システム及び読解支援方法について図１乃至図７を用いて説明する。

本発明の一態様の読解支援システムでは、指定文書を受け付け、指定文書に含まれる語句を用いて指定文書の構造を表す第１のグラフを作成し、第１のグラフに含まれる語句を二つ以上出力する。そして、出力した語句の中から複数の指定語句を受け付け、当該複数の指定語句を用いて第１のグラフを探索し、探索結果を出力する。なお、本明細書等において、グラフは、グラフ構造ということもできる。

第１のグラフの作成において、文書内で近い位置に存在する語句同士を直接つなぐことができる。例えば、二つの語句が同じ文に存在する場合、当該二つの語句を直接つなぐことができる。また、例えば、二つの語句が同じ段落に存在する場合、当該二つの語句を直接つなぐことができる。また、例えば、二つの語句について、一方の語句を含む文が他方の語句を含む文の近傍に存在する（例えば、前後ｎ文以内に存在する（ｎは１以上の整数））場合、当該二つの語句を直接つなぐことができる。このように、文書中の位置が近い語句同士をつなぐことで、文書の構造を示すグラフを作成することができる。このようなグラフを作成することで、文書における各語句の関連性を示すことができる。

読解支援システムのユーザは、指定文書として、読解したい文書を指定する。ユーザは、さらに、指定語句として、入手したい情報に関係するキーワードを複数指定する。

ここで、文書に対して単純にキーワード検索を行う場合、読み手は、キーワードの同義語、類義語、及び、表記の揺らぎなども考慮して、検索に用いるキーワードを選定することが求められる。そのため、キーワード選定は読み手に取って負担となり、技量による差が生じやすい。一方、本発明の一態様の読解支援システムは、指定文書を受け付け、第１のグラフを作成した後、第１のグラフに含まれる語句を出力する。読解支援システムのユーザは、出力された語句の中から、キーワードを選択することができる。したがって、キーワードの選定が容易であり、ユーザの技量の差が生じにくく、文書から必要な情報を迅速に探し出すことができる。

また、読み手が複数のキーワードを選定しても、各キーワードが文書内で散在しており、選定した複数のキーワードの関係を理解しにくいことがある。例えば、書籍の索引を用いて複数のキーワードについて記載箇所を参照したものの、内容が繋がらない場合がある。そのため、さらにキーワードを増やす、または、参照した複数のページの間を読む、など、検索及び読解に時間がかかってしまうことがある。

本発明の一態様の読解支援システムは、受け付けた複数の指定語句を用いて第１のグラフを探索することで、複数の指定語句の関連性を示す第２のグラフを出力することができる。これにより、ユーザは、指定語句の関連性を容易に把握することができる。また、本発明の一態様の読解支援システムは、ユーザが指定した複数の指定語句が含まれる文を抽出し、出力することができる。ユーザは、抽出された文を読むことで、必要な情報を効率よく得ることができる。

本発明の一態様の読解支援システムは、第１のグラフにおける複数の指定語句のそれぞれの間の最短経路を提示することができる。例えば、当該最短経路を示す第２のグラフを出力することで、ユーザに、複数の指定語句の関連性を提示することができる。

例えば、第１の指定語句と第２の指定語句との間の最短経路には、他の指定語句が含まれる場合がある。ユーザは、複数の指定語句の関連性を把握し、文書の理解を深めることができる。

また、当該最短経路に、複数の指定語句とは異なる語句である補完語句が含まれる場合がある。このように、ユーザが指定していない補完語句を提示することで、文書の内容の把握及び理解を促進することができる。ユーザは、補完語句自体、さらには、補完語句と指定語句との関連性を把握することで、文書の理解をより深めることができる。補完語句は、指定文書に含まれる語句（つまり、第１のグラフに含まれる語句）であり、かつ、指定語句とは異なる語句である。

本発明の一態様の読解支援システムは、第２のグラフとともに、指定文書中の指定語句を含む文を出力することができる。このとき、例えば、いずれかの指定語句を含む文を全て出力することができる。しかし、指定語句によっては、出力される文が多すぎて、ユーザが欲しい情報にたどり着くまでに時間がかかる場合がある。

そこで、本発明の一態様の読解支援システムは、各最短経路に基づいて、文書から文を抽出し、出力することが好ましい。

例えば、指定文書中の複数の指定語句を二つ以上含む段落における、指定語句を含む文を出力することができる。また、例えば、指定文書中の、複数の指定語句の少なくとも一つと、補完語句の少なくとも一つと、を含む段落における、指定語句及び補完語句の少なくとも一方を含む文を出力することができる。

これにより、ユーザは、複数の指定語句の関連性を把握するために必要な文を効率よく確認することができる。そして、必要な情報を迅速に得ることができる。

なお、本発明の一態様の読解支援システムは、少なくとも、複数の指定語句のいずれか二つの間の最短経路を提示する。つまり、本発明の一態様の読解支援システムは、一部の指定語句の間の最短経路を提示してもよく、本発明の一態様の読解支援システムは、全ての指定語句の間の最短経路を提示してもよい。

例えば、ある二つの指定語句が他の語句を介しても結びつかず、経路を示せない場合がある。また、例えば、二つの指定語句の関連性の高さの判断基準を設け、システムが二つの指定語句の関連性が高いと判断した場合に、当該二つの指定語句の最短経路を提示してもよい。具体的には、ある二つの指定語句の最短経路が、所定の数以下の語句を介して結ばれる場合に、当該二つの指定語句の関連性が高いと判断することができる。逆に、ある二つの指定語句の最短経路が、所定の数より多くの語句を介して結ばれる場合は、当該二つの指定語句の関連性が低いと判断することができる。

本発明の一態様の読解支援システムは、文書の校閲に用いることもできる。例えば、指定語句のうち、他の指定語句と結びつかない孤立した語句が見つかる場合がある。このとき、本発明の一態様の読解支援システムは、他の指定語句と結びつかない語句を孤立語句として出力してもよい。また、関連のある指定語句どうしが結びついていないなど、出力されたグラフの内容が想定と異なる場合がある。このとき、文書中に誤記または記載漏れなどが生じている可能性がある。このように、本発明の一態様の読解支援システムを用いることで、効率よく文書を見直すことができる。

また、本発明の一態様の読解支援システムは、複数の文書の関連性及び相違点の一方または双方を把握するために用いることもできる。例えば、本発明の一態様の読解支援システムは、複数の指定文書について、各指定文書に含まれる語句を用いてそれぞれの構造を表す第１のグラフを作成し、それぞれの第１のグラフを探索し、探索結果を出力することができる。ユーザは、出力結果を比較することで、複数の文書の関連性及び相違点を容易に確認することもできる。

また、本発明の一態様の読解支援システムは、複数の文書について、探索結果を比較し、関連性及び相違点の少なくとも一方を提示する機能を有していてもよい。例えば、本発明の一態様の読解支援システムは、探索結果として、各文書において、指定語句間の最短経路を示すグラフを作成することができる。そして、当該グラフをベクトル化し、各ベクトルの類似度を算出することで、複数の文書の類似度を評価することができる。

このとき、各第１のグラフに含まれる語句を、それぞれ二つ以上出力し、指定文書ごとに指定語句を受け付けてもよい。また、全ての指定文書に共通の指定語句を受け付けてもよい。なお、ある指定文書に含まれる語句について、他の指定文書に類義語または同義語が存在する場合は、これらの語句を紐づけることが好ましい。例えば、『絶縁膜』と『絶縁層』を結びつけ、指定語句に『絶縁膜』が選ばれた場合、ある指定文書では、『絶縁膜』を用いてグラフを探索し、別の指定文書では、『絶縁層』を用いてグラフを探索してもよい。

＜読解支援システム１＞
図１に、読解支援システム１００のブロック図を示す。読解支援システム１００は、受付部１１０、記憶部１２０、処理部１３０、出力部１４０、及び、伝送路１５０を有する。

読解支援システム１００は、ユーザが利用するパーソナルコンピュータなどの情報処理装置に設けられていてもよい。または、サーバに読解支援システム１００の処理部を設け、クライアントＰＣからネットワーク経由でアクセスして利用する構成としてもよい。

［受付部１１０］
受付部１１０は、指定文書を受け付ける。また、受付部は、指定語句を受け付ける。受付部１１０に供給されたデータは、伝送路１５０を介して、記憶部１２０及び処理部１３０の一方または双方に供給される。

本明細書等において特に記載が無い場合、文書とは自然言語による事象の記述であり、電子化されて機械可読である。文書は、例えば、特許出願書類、判例、契約書、約款、製品マニュアル、小説、刊行物、白書、技術文書などであるが、これらに限定されない。

［記憶部１２０］
記憶部１２０は、処理部１３０が実行するプログラムを記憶する機能を有する。また、記憶部１２０は、処理部１３０が生成したグラフを記憶する機能を有することが好ましい。グラフは、どの文書から作成されたかがわかるよう、文書と紐付けされていることが望ましい。また、記憶部１２０は、処理部１３０が生成した演算結果及び推論結果、並びに、受付部１１０に入力されたデータなどを記憶する機能を有していてもよい。

記憶部１２０は、揮発性メモリ及び不揮発性メモリのうち少なくとも一方を有する。揮発性メモリとしては、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、及び、ＳＲＡＭ（Ｓｔａｔｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等が挙げられる。不揮発性メモリとしては、ＲｅＲＡＭ（Ｒｅｓｉｓｔｉｖｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ、抵抗変化型メモリともいう）、ＰＲＡＭ（Ｐｈａｓｅ−ｃｈａｎｇｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＦｅＲＡＭ（Ｆｅｒｒｏｅｌｅｃｔｒｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＭＲＡＭ（Ｍａｇｎｅｔｏｒｅｓｉｓｔｉｖｅ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ、磁気抵抗型メモリともいう）、及び、フラッシュメモリ等が挙げられる。また、記憶部１２０は、記録メディアドライブを有していてもよい。記録メディアドライブとしては、ハードディスクドライブ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ：ＨＤＤ）、及び、ソリッドステートドライブ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ：ＳＳＤ）等が挙げられる。

記憶部１２０は、文書データを有するデータベースを有していてもよい。

また、読解支援システム１００は、システムの外部に存在するデータベースから、文書データを取り出す機能を有していてもよい。例えば、読解支援システムは、システムの外部に存在するデータベースからデータを取り出す機能を有していてもよい。

また、読解支援システム１００は、自身が持つデータベースと、外部に存在するデータベースと、の双方からデータを取り出す機能を有していてもよい。

データベースは、例えば、テキストデータ及び画像データの一方または双方を有する構成とすることができる。

また、データベースの代わりに、ストレージ、及び、ファイルサーバの一方または双方を用いてもよい。例えば、ファイルサーバが有するファイルを利用する場合、データベースは、ファイルサーバに保存されたファイルのパスを有すると好ましい。

例えば、データベースとして、出願データベースが挙げられる。出願としては、特許出願、実用新案登録出願、及び、意匠登録出願等の知的財産に係る出願が挙げられる。各出願のステータスに限定は無く、公開の有無、特許庁における係属の有無、及び登録の有無はそれぞれ問わない。例えば、出願データベースは、審査前の出願、審査中の出願、及び、登録済みの出願のうち少なくとも一つを有することができ、全てを有していてもよい。

例えば、出願データベースは、複数の特許出願における明細書及び特許請求の範囲の一方または双方を有することが好ましい。明細書及び特許請求の範囲は、例えば、テキストデータで保存される。

出願データベースは、出願を識別するための出願管理番号（社内独自の番号を含む）、出願ファミリーを識別するための出願ファミリー管理番号、出願番号、公開番号、登録番号、図面、要約、出願日、優先日、公開日、ステータス、分類（特許分類、実用新案分類など）、カテゴリ、及び、キーワード等の少なくとも一つを有していてもよい。これらの情報は、それぞれ、指定文書を受け付ける際に、文書を特定するために用いてもよい。または、これらの情報は、それぞれ、処理部１３０の処理結果とともに、出力されてもよい。

そのほか、書籍、雑誌、新聞、及び論文など、様々な種類の文書の管理を、データベースで行うことができる。データベースは、文書の文章データを少なくとも有する。データベースは、さらに、各文書を識別する番号、タイトル、発行日などの日付、著者、及び、出版社等の少なくとも一つを有していてもよい。これらの情報は、それぞれ、指定文書を受け付ける際に、文書を特定するために用いてもよい。または、これらの情報は、それぞれ、処理部１３０の処理結果とともに、出力されてもよい。

［処理部１３０］
処理部１３０は、受付部１１０及び記憶部１２０の一方または双方から供給されたデータを用いて、演算及び推論などの処理を行う機能を有する。また、処理部１３０は、データベースに含まれる各種データを用いて処理を行う機能を有する。処理部１３０は、演算結果及び推論結果などの処理結果を、記憶部１２０及び出力部１４０の一方または双方に供給することができる。

処理部１３０は、形態素解析を行う機能を有する。言い換えると、処理部１３０は、文書に含まれる各文を、言語で意味を持つ最小単位（トークン、形態素、単語などともいう）に分割し、各トークンの品詞を判別する機能を有する。なお、各文を最小単位に分割する処理を、字句解析ということもできる。

処理部１３０は、複合語解析を行う機能を有することが好ましい。言い換えると、複合語（複合名詞など）を考慮して、形態素解析を行う機能を有することが好ましい。例えば、処理部１３０は、一文において連続する名詞をひとまとめにするためにいくつかのトークンを結合することで、品詞が複合名詞である新たなトークンを生成する（トークンを再定義する）機能を有することが好ましい。なお、トークンの品詞が複合名詞であっても、当該トークンの品詞を、単に、名詞であると記すことがある。

また、処理部１３０は、各トークンの間の距離を算出する機能を有することが好ましい。例えば、処理部１３０は、二つのトークンが同じ文にあること、または、同じ段落にあることなどを情報として取得できると好ましい。また、処理部１３０は、二つのトークンが、いくつの段落、文、単語、または文字列分、離れているか、を算出できることが好ましい。

また、処理部１３０は、各トークンの関連語を取得する機能を有することが好ましい。関連語としては、類義語、同義語、上位語、及び下位語などが挙げられる。また、処理部１３０は、各トークンの間の類似度を算出する機能を有することが好ましい。

関連語は、例えば、概念辞書等の辞書によって取得することができる。当該辞書は、読解支援システムが有していてもよく、システムの外部に備えられていてもよい。概念辞書は、単語の分類、他の単語との関係などが付与されたリストである。概念辞書は、既存の概念辞書であってもよい。または、文書の分野に特化した概念辞書などを作成してもよい。または、汎用的な概念辞書に、文書の分野に用いられやすい単語を追加してもよい。

また、語句をベクトル化（数値化）し、複数の語句の間の類似度及び距離の一方または双方を算出し、複数の語句の間の類似度の高さまたは距離の近さに基づいて、ノードの関連語を取得してもよい。

二つのベクトルの類似度を求める方法としては、コサイン類似度、共分散、不偏共分散、及び、ピアソンの積率相関係数などが挙げられる。このうち、特に、コサイン類似度を用いることが好ましい。

二つのベクトルの距離を求める方法としては、ユークリッド距離、標準（標準化、平均）ユークリッド距離、マハラノビス距離、マンハッタン距離、チェビシェフ距離、及び、ミンコフスキー距離などが挙げられる。

例えば、機械学習を用いて、語句の分散表現ベクトルを生成することが好ましい。また、ニューラルネットワークを用いて、語句の分散表現ベクトルを生成することがより好ましい。具体的には、関連語は、指定文書に含まれる語句の分散表現を機械学習することで得られる分散表現ベクトルを用いて抽出することが好ましい。または、関連語は、データベースなどに含まれる文書群に含まれる語句の分散表現を機械学習することで得られる分散表現ベクトルを用いて抽出することが好ましい。

また、処理部１３０は、各トークンの出現頻度を算出する機能を有していてもよい。例えば、各トークンのＴＦ（Ｔｅｒｍ　Ｆｒｅｑｕｅｎｃｙ）値を算出することが好ましい。ＴＦ値は、指定文書内での各トークンの出現頻度を表すことができる。

また、処理部１３０は、各トークンの重要度を算出する機能を有していてもよい。例えば、各トークンのＴＦ−ＩＤＦ（Ｔｅｒｍ　Ｆｒｅｑｕｅｎｃｙ−Ｉｎｖｅｒｓｅ　Ｄｏｃｕｍｅｎｔ　Ｆｒｅｑｕｅｎｃｙ）値を算出することが好ましい。ＩＤＦ値は、トークンが一部の文書に集中して出現する度合いを表す。多くの文書に出現するトークンのＩＤＦ値は小さく、一部の文書にのみ出現するトークンのＩＤＦ値は大きくなる。例えば、データベースに含まれる文書を用いてトークンのＩＤＦ値を算出することが好ましい。各トークンのＴＦ値とＩＤＦ値の積を求めることで、当該トークンが指定文書を特徴づけるトークンであるかどうかのスコアを算出することができる。

処理部１３０は、文書に含まれる語句を用いて文書の構造を表すグラフを作成する機能を有する。

グラフは、ノード（頂点）と、エッジ（辺）と、を有する。ノード及びエッジは、それぞれ、ラベルを有することができる。ノードのラベルとして、上記のトークンを用いることができる。例えば、品詞が名詞（複合名詞を含む）であるトークンをノードのラベルとして用いることができる。エッジのラベルとして、上記の各トークンの間の距離、及び、各トークンの関連語の一方または双方を用いることができる。

グラフとして、向きを有するエッジを用いた有向グラフと、向きを有さないエッジを用いた無向グラフと、のいずれを作成してもよい。

複数のノードは、エッジにより接続される。二つのノードの間のエッジは、単一であってもよく、複数であってもよい。グラフを表示する際、エッジの表現には直線及び曲線の一方または双方を用いることができる。

また、一つの文書の構造を複数のグラフで表してもよい。例えば、有向グラフと無向グラフの両方を用いて一つの文書の構造を表してもよい。

向きを有さないエッジは、文書における二つのノードの関連が理解できるように、二つのノードを接続することが好ましい。ノードを接続する条件としては、同じ文にあるノード同士をエッジで接続する、同じ段落にあるノード同士をエッジで接続する、所定の距離（例えば、一定単語数、または、一定文字数）内にあるノード同士をエッジで接続する、などが挙げられる。

有向グラフを作成する場合、処理部１３０は、構文解析を行う機能を有することが好ましい。言い換えると、処理部１３０は、文書に含まれる各文を、トークンに分割し、各トークンの品詞を判別し、各トークンの係り受けを判別する機能を有することが好ましい。なお、構文解析に含まれる一部の処理は、上述の字句解析、または形態素解析ということもできる。構文解析を行うことにより、有向グラフでは、係り受けの向きを矢印で示すことができる。

有向グラフの作成において、例えば、先に出現したノードから後に出現したノードにエッジを向けてもよい。また、構文解析によって取得した係り受けの関係、上位語と下位語の関係、出現頻度の高さ、または、単語の重要度の高さに基づいて、エッジの向きを決めてもよい。

グラフは、トークン同士の係り受けの関係から、ルールに基づいて作成してもよい。また、グラフは、機械学習を用いた学習済みモデルを用いて作成してもよい。例えば、条件付き確率場（Ｃｏｎｄｉｔｉｏｎａｌ　ｒａｎｄｏｍ　ｆｉｅｌｄ：ＣＲＦ）を用いて、トークンのリストを元に、ノード及びエッジにラベルを付与する機械学習を行ってもよい。これにより、トークンのリストを元に、ノード及びエッジにラベルを付与することができる。また、再帰型ニューラルネットワーク（Ｒｅｃｕｒｒｅｎｔ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ：ＲＮＮ）、長期短期記憶（Ｌｏｎｇ　ｓｈｏｒｔ−ｔｅｒｍ　ｍｅｍｏｒｙ：ＬＳＴＭ）などを用いて、トークンのリストを入力して、ノードとエッジの向きを出力させるＳｅｑ２Ｓｅｑモデルの学習を行ってもよい。これにより、トークンのリストから、ノードとエッジの向きを出力することができる。

また、処理部１３０は、作成したグラフを探索する機能を有する。例えば、処理部１３０は、複数の語句のそれぞれの間の最短経路を求めることができる。最短経路を求める手法としては、ダイクストラ法、ベルマン−フォード法、及び、ワーシャル−フロイド法などが挙げられる。例えば、含まれるノード（語句）の数が最も少ない経路を最短経路とすることができる。

また、処理部１３０は、複数の指定語句のそれぞれの間の最短経路を示すグラフを作成する機能を有する。処理部１３０が作成したグラフは、出力部１４０によって出力される。

また、処理部１３０は、探索結果であるグラフ（例えば、複数の指定語句のそれぞれの間の最短経路を示すグラフ）をベクトル化する機能を有することが好ましい。グラフをベクトル化する手法としては、Ｗｅｉｓｆｅｉｌｅｒ−Ｌｅｈｍａｎカーネルなどが挙げられる。

また、処理部１３０は、ベクトルの類似度を算出する機能を有することが好ましい。これにより、複数の文書の探索結果であるグラフをベクトル化し、複数の文書の類似度を算出することができる。

なお、複数の文書の類似度を求める場合には、トークンの抽象化を行って作成したグラフを用いることで、複数の文書の類似度を高精度で求められる場合がある。トークンを抽象化することで、文書を概念的に把握することができる。したがって、文書の構成及び表現の影響を受けにくく、文書の概念に基づいて、類似度を算出することができる。

一方で、ユーザが文書を正確に読解するためには、文書で用いられている語句そのものを提示することが好ましい。そのため、処理部１３０では、読解支援のための、トークンを抽象化せずに作成したグラフと、類似度算出のための、トークンを抽象化して作成したグラフと、の双方を作成してもよい。

なお、トークンの抽象化とは、トークンを代表語または上位語に置き換えることを指す。代表語及び上位語の取得は、概念辞書を利用してもよく、機械学習による分類を行ってもよい。トークンの抽象化は、例えば、トークンを、当該トークンに含まれる形態素でベクトル化して、分類器によって分類することで実施される。なお、当該分類器として、決定木、サポートベクターマシン、ランダムフォレスト、多層パーセプトロンなどのアルゴリズムを用いてもよい。具体的には、「酸化物半導体」、「アモルファス半導体」、「シリコン半導体」、および「ＧａＡｓ半導体」を「半導体」に分類するとよい。また、「酸化物半導体層」、および「酸化物半導体膜」、「アモルファス半導体層」、「アモルファス半導体膜」、「シリコン半導体層」、「シリコン半導体膜」、「ＧａＡｓ半導体層」および「ＧａＡｓ半導体膜」も「半導体」に分類するとよい。

処理部１３０は、例えば、演算回路を有することができる。処理部１３０は、例えば、中央演算装置（ＣＰＵ：Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）を有することができる。

処理部１３０は、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等のマイクロプロセッサを有していてもよい。マイクロプロセッサは、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、ＦＰＡＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ａｎａｌｏｇ　Ａｒｒａｙ）等のＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）によって実現された構成であってもよい。処理部１３０は、プロセッサにより種々のプログラムからの命令を解釈し実行することで、各種のデータ処理及びプログラム制御を行うことができる。プロセッサにより実行しうるプログラムは、プロセッサが有するメモリ領域及び記憶部１２０のうち少なくとも一方に格納される。

処理部１３０はメインメモリを有していてもよい。メインメモリは、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等の揮発性メモリ、及びＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等の不揮発性メモリのうち少なくとも一方を有する。

ＲＡＭとしては、例えばＤＲＡＭ、ＳＲＡＭ等が用いられ、処理部１３０の作業空間として仮想的にメモリ空間が割り当てられ利用される。記憶部１２０に格納されたオペレーティングシステム、アプリケーションプログラム、プログラムモジュール、プログラムデータ、及びルックアップテーブル等は、実行のためにＲＡＭにロードされる。ＲＡＭにロードされたこれらのデータ、プログラム、及びプログラムモジュールは、それぞれ、処理部１３０に直接アクセスされ、操作される。

ＲＯＭには、書き換えを必要としない、ＢＩＯＳ（Ｂａｓｉｃ　Ｉｎｐｕｔ／Ｏｕｔｐｕｔ　Ｓｙｓｔｅｍ）及びファームウェア等を格納することができる。ＲＯＭとしては、マスクＲＯＭ、ＯＴＰＲＯＭ（Ｏｎｅ　Ｔｉｍｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等が挙げられる。ＥＰＲＯＭとしては、紫外線照射により記憶データの消去を可能とするＵＶ−ＥＰＲＯＭ（Ｕｌｔｒａ−Ｖｉｏｌｅｔ　Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＥＰＲＯＭ（Ｅｌｅｃｔｒｉｃａｌｌｙ　Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ等が挙げられる。

読解支援システムは、少なくとも一部の処理に人工知能（ＡＩ：Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）を用いることが好ましい。

読解支援システムは、特に、人工ニューラルネットワーク（ＡＮＮ：Ａｒｔｉｆｉｃｉａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ、以下、単にニューラルネットワークとも記す）を用いることが好ましい。ニューラルネットワークは、回路（ハードウェア）またはプログラム（ソフトウェア）により実現される。

本明細書等において、ニューラルネットワークとは、生物の神経回路網を模し、学習によってニューロンどうしの結合強度を決定し、問題解決能力を持たせるモデル全般を指す。ニューラルネットワークは、入力層、中間層（隠れ層）、及び出力層を有する。

本明細書等において、ニューラルネットワークについて述べる際に、既にある情報からニューロンとニューロンの結合強度（重み係数ともいう）を決定することを「学習」と呼ぶ場合がある。

本明細書等において、学習によって得られた結合強度を用いてニューラルネットワークを構成し、そこから新たな結論を導くことを「推論」と呼ぶ場合がある。

［出力部１４０］
出力部１４０は、処理部１３０の処理結果に基づいて情報を出力する。例えば、処理部１３０における演算結果及び推論結果の一方または双方を、読解支援システム１００の外部に供給することができる。また、出力部１４０は、処理部１３０の処理結果に基づいて、データベースに含まれる各種データを出力することができる。出力部１４０は、ユーザが用いるディスプレイ、スピーカ等に情報を出力することができる。

［伝送路１５０］
伝送路１５０は、データを伝達する機能を有する。受付部１１０、記憶部１２０、処理部１３０、及び、出力部１４０の間のデータの送受信は、伝送路１５０を介して行うことができる。

図２乃至図７を用いて、本発明の一態様の読解支援システムにおける読解支援方法について説明する。

＜読解支援方法＞
本発明の一態様の読解支援方法は、図２に示すステップＳ１からステップＳ６までの処理を有する。

［ステップＳ１］
ステップＳ１では、指定文書を受け付ける。指定文書は、例えば、ユーザが読解したい文書である。指定文書は、単数であっても複数であってもよい。

ユーザは、指定文書の文章データを直接入力することができる。また、指定文書に含まれる図面及び表の一方または双方の画像データを、文章データと合わせて入力してもよい。

なお、指定文書のデータが、テキストデータ以外のデータ（音声データまたは画像データ）である場合、ステップＳ２へ進む前に、音声データまたは画像データをテキストデータに変換する。

また、指定文書がデータベース等に含まれる文書である場合、ユーザは、文書を特定する情報を入力する（データベースを検索する）ことで、読解したい文書を指定することができる。読解支援システムは、ユーザが入力した情報をもとに、データベース等から、指定文書に関するデータ（具体的には以降の処理に必要なデータ）を取り出す。文書を特定する情報としては、文書を識別する番号、及び、タイトルなどが挙げられる。

また、ユーザは、指定文書の一部（例えば、特定の章）を読解したい場合などは、文書の一部を指定してもよい。

［ステップＳ２］
ステップＳ２では、指定文書に含まれる語句を用いて指定文書の構造を表すグラフを作成する。複数の指定文書が指定された場合、指定文書ごとに、グラフを作成する。また、一つの指定文書に対して、一つ以上のグラフを作成することができる。

無向グラフを作成する場合、まず、指定文書に含まれる文に対して形態素解析を行う。これにより、各文はトークンに分割され、各トークンの品詞が判別される。

有向グラフを作成する場合、まず、指定文書に含まれる文に対して構文解析を行う。これにより、各文はトークンに分割され、各トークンの品詞が判別され、さらに、各トークンの係り受けが判別される。

ステップＳ２では、複合語解析を行うことが好ましい。つまり、トークンの品詞が判別された後、いくつかのトークンを結合することで、新たなトークンを生成することが好ましい。例えば、一文において連続する名詞を一つにまとめて、品詞が複合名詞である新たなトークンを生成することができる。

グラフの作成において、例えば、文書内で近い位置に存在する語句を直接つなぐことができる。各トークンは、ノードのラベルに用いられ、各ノードはエッジで接続される。ノード同士をエッジで接続する条件は適宜決定することができる。

例えば、ノードのラベルに用いられるトークン同士の文書内の距離に基づいて、エッジで接続するノードを決定することができる。

例えば、二つの語句が同じ文に存在する場合、当該二つの語句を直接つなぐことができる。また、例えば、二つの語句が同じ段落に存在する場合、当該二つの語句を直接つなぐことができる。また、例えば、二つの語句について、一方の語句を含む文が他方の語句を含む文の近傍に存在する（例えば、前後ｎ文以内に存在する（ｎは１以上の整数、好ましくは、１以上５以下の整数、より好ましくは３以上５以下の整数））場合、当該二つの語句を直接つなぐことができる。

また、有向グラフの作成において、エッジの向きを決定するために、各トークンの出現頻度及び重要度の一方または双方を算出してもよい。

ステップＳ２では、トークンの距離の情報、及び、トークンの関連性に係る情報の一方または双方を取得することが好ましい。

取得したトークンの距離の情報、及び、トークンの関連性に係る情報は、グラフを可視化する際、エッジのラベルとして、文字で表示することができる。または、距離の近さに応じて、エッジの色または太さを決定してもよい。または、関連性の強さに応じて、エッジの色または太さを決定してもよい。

例えば、二つのトークンの距離の情報として、二つのトークンが、同じ文にあったか、同じ段落にあったか、いくつの段落、文、単語、または文字列分離れていたか、などをエッジの情報として登録することができる。

例えば、二つの語句の関連性に係る情報として、一方の語句が、他方の語句の関連語であること、及び、二つの語句の関連度などをエッジのラベルに記すことができる。関連語としては、類義語、同義語、上位語、及び下位語などが挙げられる。また、二つの語句の関連性を示す文中の他のトークン（名詞句、動詞句、副詞句などの語句）を、エッジの情報として登録することができる。

図３Ａ乃至図３Ｄを用いて、日本語の文をグラフ化する例を説明する。なお、図３Ａ乃至図３Ｄには、日本語と、それに対応するローマ字表記のアルファベットを示す。

図３Ａに、「酸化物半導体層は絶縁体層の上方にある（ＳＡＮＫＡＢＵＴＳＵＨＡＮＤＯＵＴＡＩＳＯＵＨＡＺＥＴＳＵＥＮＴＡＩＳＯＵＮＯＪＯＵＨＯＵＮＩＡＲＵ）」という文３００を示す。

ステップＳ２では、文３００を形態素解析することで、文３００を複数のトークンに分割し、各トークンの品詞を判別する。

図３Ｂに示すように、文３００は、トークン３０１からトークン３１２までの１２個のトークンに分割される。なお、図３Ｂでは、各トークンの下に品詞を記している。

そして、複合語解析を行い、連続する名詞を一つにまとめる。これにより、図３Ｃに示すように、文３００は、７個のトークンで構成される。

具体的には、図３Ｂに示すトークン３０１の文字列は、“酸化（ＳＡＮＫＡ）”であり、トークン３０２の文字列は、“物（ＢＵＴＳＵ）”であり、トークン３０３の文字列は、“半導体（ＨＡＮＤＯＵＴＡＩ）”であり、トークン３０４の文字列は、“層（ＳＯＵ）”である。これらトークン３０１乃至トークン３０４の品詞は、いずれも名詞である。そのため、図３Ｃに示すように、一つのトークン３２１にまとめられる。トークン３２１の文字列は、“酸化物半導体層（ＳＡＮＫＡＢＵＴＳＵＨＡＮＤＯＵＴＡＩＳＯＵ）”であり、品詞は、名詞（複合名詞）である。

また、図３Ｂ、図３Ｃに示すトークン３０５の文字列は、“は（ＨＡ）”であり、品詞は、助詞である。

また、図３Ｂに示すトークン３０６の文字列は、“絶縁（ＺＥＴＳＵＥＮ）”であり、トークン３０７の文字列は、“体（ＴＡＩ）”であり、トークン３０８の文字列は、“層（ＳＯＵ）”である。これらトークン３０６乃至トークン３０８の品詞は、いずれも名詞である。そのため、図３Ｃに示すように、一つのトークン３２２にまとめられる。トークン３２２の文字列は、“絶縁体層（ＺＥＴＳＵＥＮＴＡＩＳＯＵ）”であり、品詞は、名詞（複合名詞）である。

また、図３Ｂ、図３Ｃに示すトークン３０９の文字列は、“の（ＮＯ）”であり、品詞は、助詞である。また、トークン３１０の文字列は、“上方（ＪＯＵＨＯＵ）”であり、品詞は、名詞である。また、トークン３１１の文字列は、“に（ＮＩ）”であり、品詞は、助詞である。また、トークン３１２の文字列は、“ある（ＡＲＵ）”であり、品詞は、動詞である。

次に、ステップＳ２では、文３００をグラフ化する。図３Ｄに文３００をグラフ化した例を示す。ここでは、品詞が名詞であるトークン３２１及びトークン３２２を、ノード３２３及びノード３２４のラベルに用い、品詞が名詞であるトークン３１０を、エッジのラベル３２５に用いた例を示す。なお、エッジのラベル３２５では、トークンの代わりに、または、トークンに加えて、ノード間の距離の情報、及び、ノードの関連性に係る情報等の少なくとも一つを表してもよい。

図３Ｄに示す矢印は、ノード３２３からノード３２４に向かうように図示されている。つまり、矢印の始点を、文３００中に先に出現するトークンとし、矢印の終点を、後に出現するトークンとしている。なお、矢印の向きの決定方法はこれに限られず、上述した例を参照できる。そのため、場合によっては、矢印の始点をノード３２４とし、矢印の終点を、ノード３２３としてもよい。ただし、矢印の向きの決定方法は、グラフ内で統一することが望ましい。

文書に含まれる各文について上記の処理を行うことにより、文書全体の構造を一つのグラフで表すことができる。その結果、ノード３２３及びノード３２４の一方または双方は、さらに、他の文に存在する語句と、エッジを介して接続されていてもよい。なお、文書の一部を一つのグラフで表してもよい。また、文書の章ごとに、グラフを作成してもよい。つまり、一つの文書から複数のグラフを作成してもよい。

図４Ａ乃至図４Ｅを用いて、英語の文をグラフ化する例を説明する。

図４Ａに、「Ａ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ　ｄｅｖｉｃｅ　ｃｏｍｐｒｉｓｉｎｇ：ａｎ　ｏｘｉｄｅ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ　ｌａｙｅｒ　ｏｖｅｒ　ａｎ　ｉｎｓｕｌａｔｏｒ　ｌａｙｅｒ．」という文３３０を示す。

ステップＳ２では、文書のクリーニング処理を行うことが好ましい。クリーニング処理では、文書内に含まれるノイズを除去する。例えば、当該クリーニング処理とは、セミコロンを削除する、コロンをカンマに置き換える、などである。文書に対してクリーニング処理を行うことで、形態素解析の精度を高めることができる。文３３０にクリーニング処理を行うことで、セミコロンを削除し、図４Ｂに示すように、文３３０ａを得ることができる。

次に、文３３０ａを形態素解析することで、文３３０ａを複数のトークンに分割する。なお、図４Ｃではトークンの品詞を記載していないが、形態素解析により、各トークンの品詞を判別することができる。

図４Ｃに示すように、文３３０ａは、トークン３３１からトークン３４２までの１２個のトークンに分割される。

そして、複合語解析を行い、連続する名詞を一つにまとめる。これにより、図４Ｄに示すように、文３３０ａは、５個のトークンで構成される。

具体的には、図４Ｃに示すトークン３３１の文字列は、“Ａ”であり、トークン３３２の文字列は、“ｓｅｍｉｃｏｎｄｕｃｔｏｒ”であり、トークン３３３の文字列は、“ｄｅｖｉｃｅ”である。トークン３３１の品詞は不定冠詞、トークン３３２及びトークン３３３の品詞は、いずれも名詞である。そのため、図４Ｄに示すように、一つのトークン３５１にまとめられる。トークン３５１の文字列は、“Ａ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ　ｄｅｖｉｃｅ”であり、品詞は、名詞（複合名詞）である。

また、図４Ｃ、図４Ｄに示すトークン３３４の文字列は、“ｃｏｍｐｒｉｓｉｎｇ”である。

また、図４Ｃに示すトークン３３５の文字列は、“ａｎ”であり、トークン３３６の文字列は、“ｏｘｉｄｅ”であり、トークン３３７の文字列は、“ｓｅｍｉｃｏｎｄｕｃｔｏｒ”であり、トークン３３８の文字列は、“ｌａｙｅｒ”である。トークン３３５の品詞は不定冠詞、トークン３３６乃至トークン３３８の品詞は、いずれも名詞である。そのため、図４Ｄに示すように、一つのトークン３５２にまとめられる。トークン３５２の文字列は、“ａｎ　ｏｘｉｄｅ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ　ｌａｙｅｒ”であり、品詞は、名詞（複合名詞）である。

また、図４Ｃ、図４Ｄに示すトークン３３９の文字列は、“ｏｖｅｒ”である。

また、図４Ｃに示すトークン３４０の文字列は、“ａｎ”であり、トークン３４１の文字列は、“ｉｎｓｕｌａｔｏｒ”であり、トークン３４２の文字列は、　“ｌａｙｅｒ”である。トークン３４０の品詞は不定冠詞、トークン３４１及び３４２の品詞は、いずれも名詞である。そのため、図４Ｄに示すように、一つのトークン３５３にまとめられる。トークン３５３の文字列は、“ａｎｉｎｓｕｌａｔｏｒ　ｌａｙｅｒ”であり、品詞は、名詞（複合名詞）である。

次に、ステップＳ２では、文３３０をグラフ化する。図４Ｅに文３３０をグラフ化した例を示す。ここでは、品詞が名詞であるトークン３５１乃至トークン３５３を、ノード３５４乃至ノード３５６のラベルに用い、トークン３３４をノード３５４とノード３５５の間のエッジのラベル３５７に用い、トークン３３９をノード３５５とノード３５６の間のエッジのラベル３５８に用いた例を示す。

図４Ｅに示す矢印の一つは、ノード３５４からノード３５５に向かうように図示され、矢印のもう一つは、ノード３５５からノード３５６に向かうように図示されている。つまり、矢印の始点を、文３３０中に先に出現するトークンとし、矢印の終点を、後に出現するトークンとしている。

なお、本実施の形態では、文書からグラフを作成するまでの工程を、日本語が使用された文、及び、英語が使用された文を例に挙げて説明したが、文書の言語に特に限定は無い。例えば、中国語、韓国語、ドイツ語、フランス語、ロシア語、ヒンディー語などの言語が使用された文書においても、同様の工程を経ることで、文書からグラフを作成することができる。

［ステップＳ３］
ステップＳ３では、グラフに含まれる複数の語句を出力する。

出力の方法に特に限定は無く、例えば、語句の一覧をリストとして表示することができる。また、ステップＳ２で作成したグラフ自体を表示してもよい。また、グラフとリストの双方を表示してもよい。

［ステップＳ４］
ステップＳ４では、複数の指定語句を受け付ける。

ユーザは、ステップＳ３にて出力された複数の語句の中から、複数の指定語句を選択する。

表１に、ステップＳ３で複数の語句がリストとして表示され、ステップＳ４でユーザが語句を指定した例を示す。表１に示すように、以下では、複数の指定語句として、“ｌａｙｅｒ　Ａ”と“ｌａｙｅｒ　Ｂ”の二つが選択された場合を例に挙げて説明する。

［ステップＳ５］
ステップＳ５では、ステップＳ４で受け付けた複数の指定語句を用いて、グラフを探索する。

具体的には、ステップＳ５では、グラフにおける複数の指定語句のそれぞれの間の最短経路を算出することができる。

図５Ａに、ステップＳ２で作成したグラフのうち、“ｌａｙｅｒ　Ａ”と“ｌａｙｅｒ　Ｂ”に関連する部分のみを抜粋した例を示す。

図５Ａに示すグラフは、ノード１５１乃至ノード１５６を有する。“ｌａｙｅｒ　Ａ”はノード１５１のラベルであり、“ｌａｙｅｒ　Ｂ”はノード１５２のラベルである。そのほか、“ｌａｙｅｒ　Ｃ”をラベルとして有するノード１５３、“ｗｏｒｄ　Ｄ”をラベルとして有するノード１５４、“ｗｏｒｄ　Ｅ”をラベルとして有するノード１５５、及び、“ｗｏｒｄ　Ｆ”をラベルとして有するノード１５６が、ノード１５１とノード１５２を結ぶ経路に含まれている。

なお、図５乃至図７では、指定語句がラベルとして付与されたノードを斜線のハッチングで示す。

各エッジを通るために必要なコストが同じである（エッジの重みが全て同じである）場合、含まれるノードの数が最も少ない経路が最短経路といえる。つまり、図５Ａに示すグラフのうち、ノード１５１とノード１５２を結ぶ最短経路は、“ｌａｙｅｒ　Ｃ”をラベルとして有するノード１５３を介する経路（図５Ａにて太線で示す経路）である。このように、複数の指定語句のそれぞれの間の最短経路を算出する。

［ステップＳ６］
ステップＳ６では、ステップＳ５にてグラフを探索した結果を出力する。

図５Ａにおけるノード１５１とノード１５２を結ぶ最短経路を、図５Ｂに示す。図５Ｂに示すグラフを出力することで、“ｌａｙｅｒ　Ａ”と“ｌａｙｅｒ　Ｂ”の関連性を提示することができる。図５Ｂでは、指定語句とは異なる語句である補完語句“ｌａｙｅｒ　Ｃ”を介して、“ｌａｙｅｒ　Ａ”と“ｌａｙｅｒ　Ｂ”が結ばれていることから、ユーザが把握したい情報に“ｌａｙｅｒ　Ｃ”が強く関連している可能性があることを、ユーザに示すことができる。

また、エッジのラベル、向き、色、及び、太さの少なくとも一つを用いて、複数の指定語句に関する情報をさらに提示することができる。

図５Ｃでは、図５Ｂに示す無向グラフを有向グラフで示している。また、ノード１５１とノード１５３の間のエッジにはラベル１５９が付与され、ノード１５３とノード１５２の間のエッジにはラベル１６０が付与されている。

図５Ｃに示すラベル１５９から、“ｌａｙｅｒ　Ａ”は“ｌａｙｅｒ　Ｃ”の上位語であることがわかる。“ｌａｙｅｒ　Ａ”の具体例としては“半導体層”であり、“ｌａｙｅｒ　Ｃ”の具体例としては“酸化物半導体層”である。

また、ラベル１６０に“ｏｖｅｒ”とあることから、“ｌａｙｅｒ　Ｃ”は“ｌａｙｅｒ　Ｂ”の上方に位置することがわかる。このように、エッジの情報を用いて、ノードに示す指定語句に関する情報をユーザに提示することができる。

なお、ステップＳ５におけるグラフの探索結果が同じであっても、ステップＳ６にて表示されるグラフは一通りとは限られない。例えば、エッジの長さ、及び、それに伴うノードの位置などは、いくつかの異なる表示が可能であり、特に限定されない。

また、各最短経路に基づいて文書から文を抽出し、出力することが好ましい。

図６に、出力内容の一例を示す。図６では、指定語句として、“ｌａｙｅｒ　Ａ”、“ｌａｙｅｒ　Ｂ”、及び、“ｄｅｖｉｃｅ　Ｇ”の三つが選択された例を示す。

図６に示すグラフ５１０は、ノード１５１乃至ノード１５３、ノード１５７、及び、ノード１５８を有する。“ｌａｙｅｒ　Ａ”はノード１５１のラベルであり、“ｌａｙｅｒ　Ｂ”はノード１５２のラベルであり、“ｄｅｖｉｃｅ　Ｇ”はノード１５７のラベルである。そのほか、“ｌａｙｅｒ　Ｃ”をラベルとして有するノード１５３、及び、“ｗｏｒｄ　Ｈ”をラベルとして有するノード１５８が、グラフ５１０に含まれている。

グラフ５１０には、複数の指定語句のそれぞれの間の最短経路が示されている。“ｌａｙｅｒ　Ａ”と、“ｌａｙｅｒ　Ｂ”は、補完語句である“ｌａｙｅｒ　Ｃ”を介して結ばれた経路が最短経路であることがわかる。“ｌａｙｅｒ　Ａ”と“ｄｅｖｉｃｅ　Ｇ”は直接結ばれた経路が最短経路であることがわかる。“ｄｅｖｉｃｅ　Ｇ”と、“ｌａｙｅｒ　Ｂ”は、補完語句である“ｗｏｒｄ　Ｈ”を介して結ばれた経路が最短経路であることがわかる。

図６に示す抽出文章５２０は、各最短経路に基づいて、文書から文を抽出した結果である。ここでは、グラフ５１０が、同じ文または同じ段落に含まれるトークンを直接つなぐことで作成された場合を例に挙げて説明する。

抽出文章５２０から、“ｌａｙｅｒ　Ａ”と、“ｌａｙｅｒ　Ｃ”は１０段落目の同じ文に含まれており、“ｌａｙｅｒ　Ｃ”と、“ｌａｙｅｒ　Ｂ”は、１５段落目の同じ文に含まれていることがわかる。このように、指定語句に関する記載を抽出することで、各文が離れた位置にある場合でも、ユーザは効率よく文書を読解することができる。なお、抽出文章５２０において、各段落の指定語句を含む文のみを表示してもよく、指定語句を含む段落の全文を表示してもよい。

抽出文章５２０から、“ｌａｙｅｒ　Ａ”と、“ｄｅｖｉｃｅ　Ｇ”は３０段落目の同じ文に含まれていることがわかる。なお、文における指定語句の出現順は問わずに抽出することができる。

抽出文章５２０から、“ｌａｙｅｒ　Ｂ”と、“ｗｏｒｄ　Ｈ”は１６段落目の同じ文に含まれていることがわかる。また、“ｗｏｒｄ　Ｈ”と、“ｄｅｖｉｃｅ　Ｇ”は、３８段落目の互いに異なる文に含まれていることがわかる。このように、二つの語句が異なる文に含まれている場合であっても、同じ段落に含まれる際には両方の文を抽出することで、指定語句に関してより詳細な情報を提示できることがある。指定語句に関する記載を抽出することで、各文が離れた位置にある場合でも、ユーザは効率よく文書を読解することができる。

また、抽出文章５２０として抽出した文に、図、表、数式、または化学式等の情報が含まれている場合、当該図、表、数式、または化学式等の画像を合わせて表示することが好ましい。これにより、ユーザに対して文書の理解をより支援することができる。例えば、図６に示す“Ｆｉｇ．　Ｘ”及び“Ｔａｂｌｅ　Ｚ”、またはこれら図表へのリンクを、グラフ５１０及び抽出文章５２０と合わせて表示することが好ましい。

図７に、図６とは異なるグラフの出力例を示す。

図７では、指定語句として、“ｌａｙｅｒ　Ａ”、“ｌａｙｅｒ　Ｂ”、“ｌａｙｅｒ　Ｃ”、“ｌａｙｅｒ　Ｄ”、及び、“ｌａｙｅｒ　Ｅ”の五つが選択された例を示す。

図７に示すグラフは、ノード１６１乃至ノード１６７を有する。“ｌａｙｅｒ　Ａ”はノード１６１のラベルであり、“ｌａｙｅｒ　Ｂ”はノード１６２のラベルであり、“ｌａｙｅｒ　Ｃ”はノード１６３のラベルであり、“ｌａｙｅｒ　Ｄ”はノード１６４のラベルであり、“ｌａｙｅｒ　Ｅ”はノード１６５である。そのほか、“ｗｏｒｄ　Ｘ”をラベルとして有するノード１６６、及び、“ｗｏｒｄ　Ｙ”をラベルとして有するノード１６７が、グラフに含まれている。

図７には、各指定語句の間の最短経路が示されており、例えば、“ｌａｙｅｒ　Ａ”と、“ｌａｙｅｒ　Ｂ”は、直接結ばれた経路が最短経路であることがわかる。同様に、“ｌａｙｅｒ　Ａ”と、“ｌａｙｅｒ　Ｃ”は、直接結ばれた経路が最短経路であることがわかる。“ｌａｙｅｒ　Ａ”と、“ｌａｙｅｒ　Ｅ”は、補完語句である“ｗｏｒｄ　Ｙ”を介して結ばれた経路が最短経路であることがわかる。

図７では、ノード１６４が、他のノードとつながっていないことがわかる。このことから、指定文書では、“ｌａｙｅｒ　Ｄ”に関する記載が不足しているか、誤記が生じている可能性がある。

このように、グラフの探索結果を用いて、文書の校閲を行うこともできる。

また、“ｌａｙｅｒ　Ｂ”と、“ｌａｙｅｒ　Ｅ”は、指定語句“ｌａｙｅｒ　Ｃ”と補完語句である“ｗｏｒｄ　Ｙ”を介して結ばれた経路と、それぞれ補完語句である“ｗｏｒｄ　Ｘ”と“ｗｏｒｄ　Ｙ”を介して結ばれた経路と、の二通りの最短経路が存在することがわかる。この場合は、二通りの最短経路を示し、それぞれに基づいて文を抽出することができる。

また、複数の文書が指定された場合においても、上記と同様にグラフの作成及び探索を行い、探索結果を出力することができる。ユーザは、出力結果を比較することで、複数の文書の関連性及び相違点を容易に確認することができる。

さらに、探索結果である指定語句間の最短経路を示すグラフをベクトル化し、各ベクトルの類似度を算出することで、複数の文書の類似度を評価し、ユーザに提示してもよい。

以上のように、本実施の形態の読解支援システムでは、ユーザが指定した文書の複数の指定語句について関連性を示すグラフを提示し、ユーザに対して文書の読解支援を行うことができる。システムを用いて複数の指定語句が含まれる文を抽出して出力することで、ユーザは効率よく文書を読み進めることができる。これにより、ユーザは、文書から必要な情報を迅速に探し出すことができる。

本実施の形態は、他の実施の形態と適宜組み合わせることができる。また、本明細書において、一つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わせることが可能である。

（実施の形態２）
本実施の形態では、本発明の一態様の読解支援システムについて図８及び図９を用いて説明する。

＜読解支援システム２＞
図８に、読解支援システム２１０のブロック図を示す。読解支援システム２１０は、サーバ２２０と、端末２３０（パーソナルコンピュータなど）と、を有する。なお、図１に示す読解支援システム１００と同じ構成要素については、実施の形態１の＜読解支援システム１＞の説明も参照できる。

サーバ２２０は、通信部１７１ａ、伝送路１７２、記憶部１２０、及び、処理部１３０を有する。図８では図示しないが、さらに、サーバ２２０は、受付部、データベース、出力部、入力部などの少なくとも一つを有していてもよい。

端末２３０は、通信部１７１ｂ、伝送路１７４、入力部１１５、記憶部１２５、処理部１３５、及び、表示部１４５を有する。端末２３０としては、タブレット型パーソナルコンピュータ、ノート型パーソナルコンピュータ、及び、各種携帯情報端末が挙げられる。また、端末２３０が表示部１４５を有さないデスクトップ型パーソナルコンピュータであり、端末２３０が、表示部１４５として機能するモニタ等と接続されていてもよい。

読解支援システム２１０のユーザは、端末２３０の入力部１１５から、指定文書に関する情報をサーバ２２０に入力する。当該情報は、通信部１７１ｂから通信部１７１ａに送信される。

例えば、通信部１７１ｂから通信部１７１ａに、指定文書のテキストデータが送信される。さらに、図面、化学式、数式、及び表のうち、少なくとも一種のイメージデータが送信されてもよい。また、例えば、通信部１７１ｂから通信部１７１ａに、文書を特定する情報が送信される。

通信部１７１ａが受信した情報は、伝送路１７２を介して、処理部１３０が有するメモリまたは記憶部１２０に保存される。また、通信部１７１ａから受付部（図１に示す受付部１１０参照）を介して処理部１３０に情報が供給されてもよい。

実施の形態１の＜読解支援方法＞で説明した各種処理は、処理部１３０にて行われる。これらの処理は、高い処理能力が求められるため、サーバ２２０が有する処理部１３０で行うことが好ましい。処理部１３０は、処理部１３５よりも処理能力が高いことが好ましい。

処理部１３０の処理結果は、伝送路１７２を介して、処理部１３０が有するメモリまたは記憶部１２０に保存される。その後、サーバ２２０から、処理結果が、端末２３０の表示部１４５へと出力される。処理結果は、通信部１７１ａから通信部１７１ｂに送信される。また、処理部１３０の処理結果に基づいて、データベースに含まれる各種データが、通信部１７１ａから通信部１７１ｂに送信されてもよい。また、出力部（図１に示す出力部１４０）を介して、処理部１３０から通信部１７１ａに処理結果が供給されてもよい。

［通信部１７１ａ及び通信部１７１ｂ］
通信部１７１ａ及び通信部１７１ｂを用いて、サーバ２２０と端末２３０との間で、データの送受信を行うことができる。通信部１７１ａ及び通信部１７１ｂとしては、ハブ、ルータ、モデムなどを用いることができる。データの送受信には、有線を用いても無線（例えば、電波、赤外線など）を用いてもよい。

［伝送路１７２及び伝送路１７４］
伝送路１７２及び伝送路１７４は、データを伝達する機能を有する。通信部１７１ａ、記憶部１２０、及び、処理部１３０の間のデータの送受信は、伝送路１７２を介して行うことができる。通信部１７１ｂ、入力部１１５、記憶部１２５、処理部１３５、及び、出力部１４０の間のデータの送受信は、伝送路１７４を介して行うことができる。

［入力部１１５］
入力部１１５は、ユーザが文書及び語句を指定する際に用いることができる。例えば、入力部１１５は端末２３０を操作する機能を有することができ、具体的には、マウス、キーボード、タッチパネル、マイク、スキャナ、カメラ等が挙げられる。

読解支援システム２１０は、音声データをテキストデータに変換する機能を有していてもよい。例えば、処理部１３０及び処理部１３５の少なくとも一方が当該機能を有していてもよい。

読解支援システム２１０は、光学文字認識（ＯＣＲ）機能を有していてもよい。これにより、画像データに含まれる文字を認識し、テキストデータを作成することができる。例えば、処理部１３０及び処理部１３５の少なくとも一方が当該機能を有していてもよい。

［記憶部１２５］
記憶部１２５は、指定文書に関するデータ、及び、サーバ２２０から供給されたデータの一方または双方を記憶してもよい。また、記憶部１２０が有することができるデータの少なくとも一部を、記憶部１２５が有していてもよい。

［処理部１３０及び処理部１３５］
処理部１３５は、通信部１７１ｂ、記憶部１２５、及び入力部１１５などから供給されたデータを用いて、演算などを行う機能を有する。処理部１３５は、処理部１３０で行うことができる処理の少なくとも一部を実行する機能を有していてもよい。

処理部１３０及び処理部１３５は、それぞれ、チャネル形成領域に金属酸化物を有するトランジスタ（ＯＳトランジスタ）、及び、チャネル形成領域にシリコンを有するトランジスタ（Ｓｉトランジスタ）の一方または双方を有することができる。

なお、本明細書等において、チャネル形成領域に酸化物半導体または金属酸化物を用いたトランジスタをＯｘｉｄｅ　Ｓｅｍｉｃｏｎｄｕｃｔｏｒトランジスタ、あるいはＯＳトランジスタと呼ぶ。ＯＳトランジスタのチャネル形成領域は、金属酸化物を有することが好ましい。

本明細書等において、金属酸化物（ｍｅｔａｌ　ｏｘｉｄｅ）とは、広い意味での金属の酸化物である。金属酸化物は、酸化物絶縁体、酸化物導電体（透明酸化物導電体を含む）、酸化物半導体（Ｏｘｉｄｅ　Ｓｅｍｉｃｏｎｄｕｃｔｏｒまたは単にＯＳともいう）などに分類される。例えば、トランジスタの半導体層に金属酸化物を用いた場合、当該金属酸化物を酸化物半導体と呼称する場合がある。つまり、金属酸化物が増幅作用、整流作用、及びスイッチング作用の少なくとも一つを有する場合、当該金属酸化物を、金属酸化物半導体（ｍｅｔａｌ　ｏｘｉｄｅ　ｓｅｍｉｃｏｎｄｕｃｔｏｒ）、略してＯＳと呼ぶことができる。

チャネル形成領域が有する金属酸化物はインジウム（Ｉｎ）を含むことが好ましい。チャネル形成領域が有する金属酸化物がインジウムを含む金属酸化物の場合、ＯＳトランジスタのキャリア移動度（電子移動度）が高くなる。また、チャネル形成領域が有する金属酸化物は、元素Ｍを含む酸化物半導体であると好ましい。元素Ｍは、アルミニウム（Ａｌ）、ガリウム（Ｇａ）及びスズ（Ｓｎ）の少なくとも一つであることが好ましい。そのほかの元素Ｍに適用可能な元素としては、ホウ素（Ｂ）、シリコン（Ｓｉ）、チタン（Ｔｉ）、鉄（Ｆｅ）、ニッケル（Ｎｉ）、ゲルマニウム（Ｇｅ）、イットリウム（Ｙ）、ジルコニウム（Ｚｒ）、モリブデン（Ｍｏ）、ランタン（Ｌａ）、セリウム（Ｃｅ）、ネオジム（Ｎｄ）、ハフニウム（Ｈｆ）、タンタル（Ｔａ）、及び、タングステン（Ｗ）などが挙げられる。ただし、元素Ｍとして、前述の元素を複数組み合わせても構わない場合がある。元素Ｍは、例えば、酸素との結合エネルギーが高い元素である。例えば、酸素との結合エネルギーがインジウムよりも高い元素である。また、チャネル形成領域が有する金属酸化物は、亜鉛（Ｚｎ）を含む金属酸化物であると好ましい。亜鉛を含む金属酸化物は結晶化しやすくなる場合がある。

チャネル形成領域が有する金属酸化物は、インジウムを含む金属酸化物に限定されない。半導体層は、例えば、亜鉛スズ酸化物、ガリウムスズ酸化物などの、インジウムを含まず、亜鉛を含む金属酸化物、ガリウムを含む金属酸化物、スズを含む金属酸化物などであっても構わない。

処理部１３０は、ＯＳトランジスタを有することが好ましい。ＯＳトランジスタはオフ電流が極めて小さいため、ＯＳトランジスタを記憶素子として機能する容量素子に流入した電荷（データ）を保持するためのスイッチとして用いることで、データの保持期間を長期にわたり確保することができる。この特性を、処理部１３０が有するレジスタ及びキャッシュメモリのうち少なくとも一方に用いることで、必要なときだけ処理部１３０を動作させ、他の場合には直前の処理の情報を当該記憶素子に待避させることにより処理部１３０をオフにすることができる。すなわち、ノーマリーオフコンピューティングが可能となり、読解支援システムの低消費電力化を図ることができる。

［表示部１４５］
表示部１４５は、出力結果を表示する機能を有する。表示部１４５としては、液晶表示装置、発光表示装置などが挙げられる。発光表示装置に用いることができる発光素子としては、ＬＥＤ（Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）、ＯＬＥＤ（Ｏｒｇａｎｉｃ　ＬＥＤ）、ＱＬＥＤ（Ｑｕａｎｔｕｍ−ｄｏｔ　ＬＥＤ）、及び、半導体レーザなどが挙げられる。また、表示部１４５には、シャッター方式または光干渉方式のＭＥＭＳ（Ｍｉｃｒｏ　Ｅｌｅｃｔｒｏ　Ｍｅｃｈａｎｉｃａｌ　Ｓｙｓｔｅｍｓ）素子を用いた表示装置、マイクロカプセル方式、電気泳動方式、エレクトロウェッティング方式、または電子粉流体（登録商標）方式等を適用した表示素子を用いた表示装置などを用いることもできる。

図９に、本実施の形態の読解支援システムのイメージ図を示す。

図９に示す読解支援システムは、サーバ５１００と、端末（電子機器ともいえる）と、を有する。サーバ５１００と各端末との間の通信は、インターネット回線５１１０を介して行うことができる。

サーバ５１００は、端末からインターネット回線５１１０を介して入力されたデータを用いて、演算を行うことができる。サーバ５１００は、演算の結果を、インターネット回線５１１０を介して端末に送信することができる。これにより、端末における演算の負担を低減することができる。

図９では、端末として、情報端末５３００、情報端末５４００、及び、情報端末５５００を示している。情報端末５３００は、スマートフォンなどの携帯情報端末の一例である。情報端末５４００は、タブレット端末の一例である。また、情報端末５４００は、キーボードを有する筐体５４５０と接続することで、ノート型情報端末として用いることもできる。情報端末５５００は、デスクトップ型情報端末の一例である。

このような形態を構成することにより、ユーザは、情報端末５３００、情報端末５４００、及び、情報端末５５００などからサーバ５１００にアクセスすることができる。そして、ユーザは、インターネット回線５１１０を介した通信によって、サーバ５１００の管理者が提供するサービスを受けることができる。当該サービスとしては、例えば、本発明の一態様の読解支援方法を用いたサービスが挙げられる。当該サービスにおいて、サーバ５１００で人工知能を利用してもよい。

本実施の形態は、他の実施の形態と適宜組み合わせることができる。

１００：読解支援システム、１１０：受付部、１１５：入力部、１２０：記憶部、１２５：記憶部、１３０：処理部、１３５：処理部、１４０：出力部、１４５：表示部、１５０：伝送路、１５１：ノード、１５２：ノード、１５３：ノード、１５４：ノード、１５５：ノード、１５６：ノード、１５７：ノード、１５８：ノード、１５９：ラベル、１６０：ラベル、１６１：ノード、１６２：ノード、１６３：ノード、１６４：ノード、１６５：ノード、１６６：ノード、１６７：ノード、１７１ａ：通信部、１７１ｂ：通信部、１７２：伝送路、１７４：伝送路、２１０：読解支援システム、２２０：サーバ、２３０：端末、３００：文、３０１：トークン、３０２：トークン、３０３：トークン、３０４：トークン、３０５：トークン、３０６：トークン、３０７：トークン、３０８：トークン、３０９：トークン、３１０：トークン、３１１：トークン、３１２：トークン、３２１：トークン、３２２：トークン、３２３：ノード、３２４：ノード、３２５：ラベル、３３０ａ：文、３３０：文、３３１：トークン、３３２：トークン、３３３：トークン、３３４：トークン、３３５：トークン、３３６：トークン、３３７：トークン、３３８：トークン、３３９：トークン、３４０：トークン、３４１：トークン、３４２：トークン、３５１：トークン、３５２：トークン、３５３：トークン、３５４：ノード、３５５：ノード、３５６：ノード、３５７：ラベル、３５８：ラベル、５１０：グラフ、５２０：抽出文章、５１００：サーバ、５１１０：インターネット回線、５３００：情報端末、５４００：情報端末、５４５０：筐体、５５００：情報端末

Claims

　受付部、処理部、及び、出力部を有し、
　前記受付部は、指定文書を受け付ける機能と、複数の指定語句を受け付ける機能と、を有し、
　前記処理部は、前記指定文書に含まれる語句を用いて前記指定文書の構造を表す第１のグラフを作成する機能と、前記複数の指定語句を用いて前記第１のグラフを探索する機能と、を有し、
　前記出力部は、前記第１のグラフに含まれる複数の語句を出力する機能と、前記第１のグラフの探索結果を出力する機能と、を有し、
　前記複数の指定語句は、前記第１のグラフに含まれる前記複数の語句の少なくとも一部である、読解支援システム。
　請求項１において、
　前記出力部は、前記探索結果として、少なくとも、前記第１のグラフにおける前記複数の指定語句のいずれか二つの間の最短経路を示す第２のグラフを出力する、読解支援システム。
　請求項２において、
　前記出力部は、前記指定文書中の、前記複数の指定語句を二つ以上含む段落における、前記指定語句を含む文を出力する機能を有する、読解支援システム。
　請求項２または３において、
　前記最短経路は、前記複数の指定語句のいずれか二つを、少なくとも一つの補完語句を介して結ぶ経路であり、
　前記補完語句は、前記複数の指定語句とは異なる語句である、読解支援システム。
　請求項４において、
　前記出力部は、前記指定文書中の、前記複数の指定語句の少なくとも一つと、前記補完語句の少なくとも一つと、を含む段落における、前記指定語句及び前記補完語句の少なくとも一方を含む文を出力する機能を有する、読解支援システム。
　請求項１において、
　前記出力部は、前記探索結果として、少なくとも、前記第１のグラフにおける前記複数の指定語句のそれぞれの間の最短経路を示す第２のグラフを出力する、読解支援システム。
　請求項６において、
　前記出力部は、前記指定文書中の、前記複数の指定語句を二つ以上含む段落における、前記指定語句を含む文を出力する機能を有する、読解支援システム。
　請求項６または７において、
　前記複数の指定語句のいずれか二つを結ぶ前記最短経路は、二つの前記指定語句を、少なくとも一つの補完語句を介して結ぶ経路であり、
　前記補完語句は、前記複数の指定語句とは異なる語句である、読解支援システム。
　請求項８において、
　前記出力部は、前記指定文書中の、前記複数の指定語句の少なくとも一つと、前記補完語句の少なくとも一つと、を含む段落における、前記指定語句及び前記補完語句の少なくとも一方を含む文を出力する機能を有する、読解支援システム。
　請求項１乃至９のいずれか一において、
　前記探索結果を記憶する記憶部を有する、読解支援システム。
　指定文書を受け付け、
　前記指定文書に含まれる語句を用いて前記指定文書の構造を表す第１のグラフを作成し、
　前記第１のグラフに含まれる語句を二つ以上出力し、
　前記出力した語句の中から複数の指定語句を受け付け、
　前記複数の指定語句を用いて前記第１のグラフを探索し、探索結果を出力する、読解支援方法。
　請求項１１において、
　前記探索結果として、少なくとも、前記第１のグラフにおける前記複数の指定語句のいずれか二つの間の最短経路を示す第２のグラフを出力する、読解支援方法。
　請求項１２において、
　前記探索結果とともに、前記指定文書中の、前記複数の指定語句を二つ以上含む段落における、前記指定語句を含む文を出力する、読解支援方法。
　請求項１２または１３において、
　前記最短経路は、前記複数の指定語句のいずれか二つを、少なくとも一つの補完語句を介して結ぶ経路であり、
　前記補完語句は、前記複数の指定語句とは異なる語句である、読解支援方法。
　請求項１４において、
　前記探索結果とともに、前記指定文書中の、前記複数の指定語句の少なくとも一つと、前記補完語句の少なくとも一つと、を含む段落における、前記指定語句及び前記補完語句の少なくとも一方を含む文を出力する、読解支援方法。
　請求項１１において、
　前記探索結果として、少なくとも、前記第１のグラフにおける前記複数の指定語句のそれぞれの間の最短経路を示す第２のグラフを出力する、読解支援方法。
　請求項１６において、
　前記探索結果とともに、前記指定文書中の、前記複数の指定語句を二つ以上含む段落における、前記指定語句を含む文を出力する、読解支援方法。
　請求項１６または１７において、
　前記複数の指定語句のいずれか二つを結ぶ前記最短経路は、二つの前記指定語句を、少なくとも一つの補完語句を介して結ぶ経路であり、
　前記補完語句は、前記複数の指定語句とは異なる語句である、読解支援方法。
　請求項１８において、
　前記探索結果とともに、前記指定文書中の、前記複数の指定語句の少なくとも一つと、前記補完語句の少なくとも一つと、を含む段落における、前記指定語句及び前記補完語句の少なくとも一方を含む文を出力する、読解支援方法。