WO2014147767A1

WO2014147767A1 - 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Info

Publication number: WO2014147767A1
Application number: PCT/JP2013/057908
Authority: WO
Inventors: 千善早瀬
Original assignee: 楽天株式会社
Priority date: 2013-03-19
Filing date: 2013-03-19
Publication date: 2014-09-25
Also published as: US10275445B2; US20160055146A1; JPWO2014147767A1; JP5877272B2

Abstract

　文書の構成要素に対する付加情報を、読者が文書を読む能力の変化に応じて表示する。　文書処理装置は、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語の出現頻度を示す情報に基づいて当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する。前記判定の際には、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する。

Description

文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

　本発明は文書処理装置、文書処理方法、プログラムおよび情報記憶媒体に関する。

　電子書籍やＨＴＭＬ文書などのデジタルコンテンツが盛んに利用されるようになっている。これらのデジタルコンテンツの文書を読むには、漢字を含む単語などの読み方や意味の知識といった、あるレベルの知識を読者に要求する場合がある。この要求されるレベルに達しない人でも読みやすいように、文章に漢字の読み方を示す文字（ルビ）などの付加情報をつけて表示することが行われている。

　特許文献１には、利用者のランクと、ふりがな対象文字列の難易度とに基づいて、ルビ付きテキストを生成する技術が開示されている。

特開平１１－３９２９８号公報

　文書を読む読者の実際のレベルは変化するものである一方、そのレベルに合っていない文書は読みにくい。例えば、最初は読めない漢字であっても、ルビを付けられた漢字を何度か読んでいれば、ルビがなくても読めるようになる。すると、読めるようになった漢字につけられたルビは読者にとっては不要なものになる。読めるようになりかつルビが付けられている漢字が多くなると、読者にとっては読みづらくなる。このような問題は、ルビだけでなく、単語の近くに他の種類の付加情報を表示する場合にも生じる。したがって、表示される文書には読者のレベルの変化に応じた付加情報が表示されることが望ましい。

　本発明は上記課題を鑑みてなされたものであって、その目的は、読者が文書を読む能力の変化に応じて、付加情報を表示することができる技術を提供することにある。

　上記課題を解決するために、本発明にかかる文書処理装置は、複数の単語を含む文書の情報を取得する文書取得手段と、前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、前記複数の単語と、表示すると判断された前記付加情報とを画面に表示させるよう制御する表示制御手段と、を含み、前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。

　また、本発明にかかる文書処理方法では、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。

　また、本発明にかかるプログラムは、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、処理をコンピュータに実行させることを特徴とする。

　また、本発明にかかるコンピュータ読取り可能な記憶媒体は、上記プログラムを格納する。

　本発明によれば、読者が文書を読む能力の変化に応じて、付加情報を表示することができる。

　本発明の一態様では、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ１または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。

　本発明の一態様では、前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。

　本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含んでもよい。

　この態様によれば、ユーザの学習能力に応じて不要な付加情報を表示することを抑制することができる。

　本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記文書処理装置は、前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含んでもよい。

　この態様によれば、学習のしやすさに応じて不要な付加情報を表示することを抑制することができる。

　本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含んでもよい。

　本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ１または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算してもよい。

本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。文書処理装置が実現する機能の一例を示すブロック図である。文書の一例を示す図である。付加情報を含む辞書データの一例を示す図である。付加情報出力判定部等の処理フローの一例を示す図である。学習データの一例を示す図である。学習データの他の例を示す図である。ルビ付きで表示される文書の一例を示す図である。ルビを表示させる操作の一例を示す図である。ルビの表示を抑制させる操作の一例を示す図である。

　以下では、本発明の実施形態について図面に基づいて説明する。同じ符号を付された構成については、重複する説明を省略する。

　図１は、本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。文書処理装置は、プロセッサ１１、記憶部１２、通信部１３、表示部１４、入力部１５を含む。文書処理装置は、例えばタブレット端末や電子書籍端末である。また文書処理装置は、パーソナルコンピュータなどであってもよいし、これらの端末とネットワークを介して接続されるサーバコンピュータであってもよい。

　プロセッサ１１は、記憶部１２に格納されているプログラムに従って動作する。またプロセッサ１１は通信部１３、表示部１４、入力部１５を制御する。なお、上記プログラムは、インターネット等を介して提供されるものであってもよいし、フラッシュメモリ等のコンピュータで読み取り可能な記憶媒体に格納されて提供されるものであってもよい。

　記憶部１２は、ＲＡＭやフラッシュメモリ等のメモリ素子やメモリカード等によって構成されている。記憶部１２は、上記プログラムを格納する。また、記憶部１２は、各部から入力される情報や演算結果を格納する。

　通信部１３は、他の装置と通信する機能を実現するものであり、例えば無線ＬＡＮの集積回路やアンテナなどにより構成されている。通信部１３は、プロセッサ１１の制御に基づいて、他の装置から受信した情報をプロセッサ１１や記憶部１２に入力し、他の装置に情報を送信する。

　表示部１４は、液晶パネルなどの表示出力デバイスやそれを制御する回路であり、液晶表示パネルやグラフィックチップなどにより構成される。表示部１４は、プロセッサ１１の制御に基づいて、画像を表示出力デバイスに対して出力する。なお、文書処理装置は必ずしも表示出力デバイスを内蔵していなくてもよく、表示部１４は外部にある表示出力デバイスに画像を表示させてもよい。

　入力部１５は、タッチパネルなどの入力デバイスや、キーボードやマウスなどの入力デバイスからのデータを取得するコントローラなどにより構成される。入力部１５は、プロセッサ１１の制御に基づいて、タッチパネルや入力デバイスをユーザが操作することにより入力されるデータを取得する。

　図２は、文書処理装置が実現する機能を示すブロック図である。文書処理装置は、機能的に、文書情報取得部５１と、付加情報取得部５２と、付加情報出力判定部５３と、表示制御部５４と、閲覧者指示取得部５５と、パラメータ設定部５６と、を含む。これらの機能は、プロセッサ１１が記憶部１２に格納されたプログラムを実行し、表示部１４や入力部１５等を制御することで実現される。ここで、文書情報取得部５１、付加情報取得部５２、付加情報出力判定部５３、表示制御部５４、閲覧者指示取得部５５、パラメータ設定部５６は、それぞれ本願請求項の文書取得手段、付加情報取得手段、判定手段、表示制御手段、指示取得手段、設定手段に対応する。

　以下では、文書処理装置が実現する各機能について、処理フローやその他の図面を用いて説明する。

　文書情報取得部５１は、プロセッサ１１、記憶部１２を中心として実現される。文書情報取得部５１は、複数の単語を含む文書の情報（文書データ）を取得し、その文書の情報を付加情報出力判定部５３などに引き渡す。文書情報取得部５１は、予め記憶部１２に記憶された文書データを取得してもよいし、通信部１３を介してネットワーク経由で文書データを取得してもよい。

　図３は、文書データが示す文書の一例を示す図である。この例では文書データは日本語の文章のデータであり、文章は漢字とかな（表音文字）とが混じって表現される。文章を構成する要素である単語等は、漢字とかなとのうち少なくとも一方により作られている。本実施形態では、「単語」は複合語のようなものも含むとして表記する。図３では文書中に出現する単語の一部に符号を付けているが、これらはその単語のＩＤに相当する。このＩＤについては後述する。

　特に子どもなどは、単語に含まれる漢字を読めないことが多いが、その読み方がわかれば問題なく意味を理解することが多い。そのため、この文書処理装置では、単語の漢字表記の上にその発音を示す小さいかなの文字列（以下では「ルビ」という）を付けることで文書を読む際の手助けをする。以下では付加情報として、この単語につけるルビを用いる場合について主に説明する。

　付加情報取得部５２は、プロセッサ１１、記憶部１２を中心として実現される。付加情報取得部５２は、複数の単語のそれぞれに紐付けられた付加情報やそれに付随する情報を取得する。付加情報取得部５２は、予め記憶部１２に記憶された付加情報等を取得してもよいし、通信部１３を介してネットワーク経由で付加情報等を取得してもよい。

　図４は、付加情報を含む辞書データの一例を示す図である。辞書データは、単語とその単語の付加情報とを紐づけるデータである。ここでは、付加情報はその単語の読みの情報である。また辞書データには単語の読みの難しさを示すレベルや、その単語のジャンルの情報も、その単語に紐付けられている。レベルは、例えば単語を構成する漢字を習う学年や、画数などに基づいて定められる。図４の例では、各単語にはＩＤが振られており、このＩＤは図３の符号に対応している。

　付加情報出力判定部５３は、プロセッサ１１、記憶部１２を中心として実現される。付加情報出力判定部５３は、複数の単語のそれぞれについて、その単語の出現頻度を示す情報に基づいてその単語に紐付けられた付加情報を表示するか否かを判定する。本実施形態では、単語が出現するごとに増え、また出現してから時間が経つにつれて減るスコアを単語の出現頻度を示す情報として用いることで、付加情報を表示するか否かを判定する。

　図５は、付加情報出力判定部５３等の処理フローの一例を示す図である。図５に示す処理フローを用いて付加情報出力判定部５３の処理や、それに付随する他の機能の処理について説明する。

　はじめに、付加情報出力判定部５３は、文書データの読込位置を取得する（ステップＳ１０１）。この読込位置は、文書データが示す文書のうち表示されるページの先頭に相当する文書データ内の位置であり、文書データの先頭からの文字数などである。付加情報出力判定部５３は、文書を閲覧する読者であるユーザが表示するページを指定する操作や、次のページへ進む操作や前のページに戻る操作や、前回読んだ位置などに基づいて文書データの読込位置を取得する。

　次に、付加情報出力判定部５３は、読込位置にある単語を取得する（ステップＳ１０２）。この単語は、予め文書データに特定する情報が埋め込まれていてもよいし、付加情報出力判定部５３が文書データのテキストから形態素解析を行うことにより取り出されてもよい。前者の場合には、例えば文書データに予め単語の位置や、その単語に紐付けられる付加情報そのもの、または付加情報の識別コードを示すＨＴＭＬタグのような情報を埋め込んでおくとよい。前者の場合には付加情報出力判定部５３がその埋め込まれた情報を用いて単語を取得する。次に、付加情報出力判定部５３は、辞書データからその単語に紐付けられた付加情報やその単語の難しさを示すレベルを取得し、また学習データから、付加情報をユーザが学習済で表示不要であるか否かを示す学習済フラグを取得する（ステップＳ１０３）。

　図６は学習データの一例を示す図である。学習データのレコードは単語ごとに設けられており、単語と、これまでに計算された学習スコア、カウント、および学習済フラグとが紐付けられている。ここで、カウントは直近にその単語が出現した位置や時間により計算されるものである。学習済フラグはこの単語の付加情報をユーザが学習済であるか否かを示すものであり、付加情報の表示を必要とするか否かを示すものでもある。

　付加情報出力判定部５３は、付加情報等を取得した後に、付加情報の表示が必要か否かを判定する。より具体的には、単語の難しさを示すレベルがユーザの大まかな知識を示すユーザレベル以下である場合や（ステップＳ１０４のＮ）、学習済フラグが学習済であることを示す場合には（ステップＳ１０６のＹ）、付加情報は表示しないと判定して表示データにその単語のみを付加する（ステップＳ１０５）。ここで表示データは、後述する表示制御部５４が画面に表示させる文字列を示すデータである。後述するが、表示制御部５４は表示データに付加情報が含まれていればその付加情報を表示し、含まれていなければその付加情報を表示しないように制御する。なお、図５には示していないが、単語に紐付けられる付加情報がない場合にも付加情報出力判定部５３は付加情報を表示しないと判定し、ステップＳ１０５で表示データにその単語を付加し、付加情報は付加しない。

　一方、単語の難しさを示すレベルがユーザレベルより高く（ステップＳ１０４のＹ）かつ表示不要フラグが表示可能を示す場合には（ステップＳ１０６のＮ）、付加情報出力判定部５３はその付加情報を表示すると判定し、付加情報出力判定部５３は、表示データに単語と付加情報とを追加する（ステップＳ１０７）。なお、付加情報の追加の方法としては、ＨＴＭＬにおいて＜ＲＵＢＹ＞タグを用いてルビを表示させる情報を追加してもよいし、他の表示用言語を用いて単語と付加情報とを表現してもよい。

　次に、付加情報出力判定部５３は、その単語についての学習状況を示す情報を更新する。はじめに、付加情報出力判定部５３は、その単語についての学習スコアを計算し学習データの学習スコア欄を更新する（ステップＳ１０８）。

　学習スコアの計算方法についてさらに説明する。付加情報出力判定部５３は、文書データに含まれる複数の単語のそれぞれについて、これまでの単語が出現した位置および時間の少なくとも一方に基づいて学習スコアを計算する。この単語が出現した位置や時間を考慮するために、学習データには、前回の単語の出現時に計算された学習スコアと、その単語が出現した位置や時間に基づくカウントとが単語と関連づけられて記憶されている。図６は、図３に示す文書のうち先頭からＩＤが「ｗｂ５０」の単語が出現するまでの処理により格納される学習データの例である。カウントは、ページの中における位置や、閲覧開始からの時間が進むにつれて大きくなる値である。付加情報出力判定部５３は記憶部１２にシステムとしてのカウントを有し、この機能が最初に起動されてから、一定の周期が経過するごとにそのカウントの値を増やし、また処理対象となる文字が進むごとにそのカウントの値を増やす。また付加情報出力判定部５３は、この処理時点でのシステムのカウントを学習データのカウント欄に記憶させる。このカウントは、前回この単語をみてからの時間経過に伴う忘却を考慮するために用いられる。次にスコアの計算式を示す。

　数式（１）において、Ｓ_ｋ＋１はこの処理で計算されるスコアを示し、Ｃｃは現在のシステムのカウントを示し、Ｓ_ｋとＣ_ｋはそれぞれ、単語が前回出現した際に計算されたスコアとカウントを示す。Ａはユーザの忘れやすさを示す忘却パラメータであり、Ｂは単語の付加情報を表示することによる新たな学習量を示すパラメータである。Ｂは単語が一度出現するごとに増加する学習スコアの量に相当する。（Ｃｃ－Ｃｋ）×Ａは前回の単語の出現時の学習スコアのうち、忘れることにより減少する量の割合を示す。Ａは０より大きく１より小さい値である。この式により、学習スコアが単語のユーザにとっての出現頻度を示すものになる。

　ここで、付加情報が表示される単語の頻度やその単語の種類の数の多さに応じてスコアが増える量を決めてもよい。付加情報が表示される頻度が多かったり、付加情報が表示される単語の種類の数が多い場合は、ユーザの負担が大きく、記憶することが難しくなると考えられる。このような場合に学習が進まない扱いにするよう、スコアの計算に関わるパラメータであるＡやＢの値を調整させることで、よりユーザの学習の現実に沿った対応が可能となる。

　学習スコアが計算されると、付加情報出力判定部５３はその学習スコアがユーザ閾値を超えたか否かを判定する（ステップＳ１０９）。学習スコアがユーザ閾値を超えた場合には（ステップＳ１０９のＹ）、ユーザはその単語について学習ができ、例えばルビ無しで単語が読めるようになったとして、学習データの学習済フラグを学習済に設定する（ステップＳ１１０）。

　ここで、パラメータ設定部５６は、プロセッサ１１および記憶部１２を中心として実現される。パラメータ設定部５６は、ユーザの学習能力に応じたパラメータを設定する。

　ステップＳ１０８で用いられるユーザ閾値はパラメータ設定部５６が設定するパラメータの１つである。図示していないが、パラメータ設定部５６は、ステップＳ１０９の処理を行う際またはその前に、ユーザ閾値を設定する。例えば、パラメータ設定部５６はユーザのレベルＬｕと単語のレベルＬｗとの差が大きいほどユーザ閾値を大きく設定し、ユーザがよく読む文書のジャンル（得意ジャンル）と単語のジャンルとが重なる場合にはユーザ閾値を小さく設定する。これにより、単語の種類に応じたユーザの学習のしやすさを付加情報の表示の判定に反映させることが可能になる。

　そして、ステップＳ１１０またはステップＳ１０５で表示用データに単語等が追加されたら、付加情報出力判定部５３は表示の単位であるページの終わりまで文書データを読込んだかを確認する（ステップＳ１１１）。読込位置がまだページの終わりで無い場合は（ステップＳ１１１のＮ）、次に読込対象となる単語が次の単語になるように読込位置を進め（ステップＳ１１２）、ステップＳ１０２から繰り返す。また、読込位置がページの終わりである場合は（ステップＳ１１１のＹ）、このページについての処理を終了する。なお、システムのカウント、ユーザのレベルの情報、学習データ等は処理が終わっても記憶部１２に保持され、例えばこの文書の他のページや、他の文書について次に付加情報出力判定部５３の処理をする際にも用いられる。

　次に学習データについて説明する。前述の図６は図３に示す文書の文書データにおいて、ｗｂ５０のＩＤをもつ単語が出現するまでの処理が行われた際の学習データの内容である。本図は、文書の先頭から処理を開始する際にはシステムのカウントＣｃや各単語の学習スコアは０である場合の例である。また、ユーザのレベルは１であり、学習スコアの計算方法におけるパラメータＢは１０であり、パラメータＡは２００分の１とする。すると、図６に示す時点ではスコアに忘却の影響がでないため、学習スコアは単語の出現回数に比例する。

　図７は、学習データの他の例を示す図である。図７は、文書データでＩＤがｗｂ９０が４回出現した際の学習データの状態を示す図である。ここではＩＤがｗｎ１４である単語が１回目に出現してから２回目に出現するまでに間があいたため、単純に出現回数に比例する値より、学習スコアが小さくなっている。このように忘却を示すパラメータを用いることで、出現間隔が広いか否かを考慮して学習済か否か判断することが可能になる。

　一方、ＩＤがｗａ１０である単語とＩＤがｗｂ９０である単語とでは、学習スコアが低い単語の方が学習済となり、それより学習スコアが高い単語が学習済になっていない。これは、図４にあるようにＩＤがｗａ１０である単語はレベルが２でありユーザレベルとの差が１のみであるのに対し、ＩＤがｗｂ９０である単語はレベルが７でありその差が６であるため、ユーザ閾値が異なっているからである。このようにして、難しい単語ほど学習までに時間がかかるという学習の法則を考慮した対応をすることが可能となる。

　ここで、パラメータ設定部５６は、ユーザ閾値を変化させる代わりに、数式（１）における計算方法のパラメータＡやＢを変化させてもよい。例えば、パラメータＢを、ユーザのレベルＬｕと単語のレベルＬｗとの差や、ジャンルの相違に応じて計算される値にしてもよい。例えばＬｗとＬｕとの差が大きいほど値を小さくし、予めユーザが指定したユーザの得意ジャンルと単語のジャンルが重なれば値を大きくするといった計算をすることで、これらの要素を考慮することが可能になる。

　表示制御部５４は、プロセッサ１１、記憶部１２，および表示部１４を中心として実現される。表示制御部５４は、文書データに含まれる複数の単語と、表示すると判断された付加情報とを画面に表示させるよう制御する。より具体的には、表示データに格納されている文書の単語と、付加情報との表示形式を整えて表示部１４などを介して画面に出力するように制御する。

　図８は、ルビ付きで表示される文書の一例を示す図である。図８では、ＩＤがｗａ１０である単語については、３回目から付加情報であるルビの表示がされなくなっている。このように、付加情報出力判定部５３と表示制御部５４とがユーザの学習状況を予想して付加情報の表示を制御することができる。これにより、学習状況に応じた付加情報の表示の制御が可能になる。

　閲覧者指示取得部５５は、プロセッサ１１、記憶部１２、表示部１４および入力部１５を中心として実現される。閲覧者指示取得部５５は画面に表示された文書に対する閲覧者の行動に基づいて、文書中の単語に対する付加情報を必要としているか否かに関連する情報を取得する。より具体的には、閲覧者指示取得部５５は画面に表示された文書に対する操作に基づいて、単語に対する付加情報の表示または非表示の操作を取得し、その単語について付加情報を表示し、または表示されている付加情報を削除する。図９は、ルビを表示させる操作の一例を示す図である。例えば、ユーザが単語を一定時間選択すると、閲覧者指示取得部５５は付加情報を表示するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザがルビを表示する旨の操作をすると、その付加情報の表示の指示を取得する。そして、表示制御部５４にその指示を渡し、表示制御部５４はその単語に付加情報を表示させる処理を行う。

　一方、図１０はルビの表示を抑制させる操作の一例を示す図である。例えば、ユーザが付加情報が表示されている単語を一定時間選択したりすると、閲覧者指示取得部５５は付加情報の表示を抑制するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザが付加情報の表示を抑制させる旨の操作をすると、その指示を取得する。そして、表示制御部５４にその指示を渡し、表示制御部５４はその単語およびそのページの他の同じ単語について付加情報の表示を抑制し、その付加情報を画面から消すとともに、学習データでその単語を学習済にする処理を行う。

　なお、閲覧者指示取得部５５は、ユーザの視線を用いてルビの表示要求を検知してもよい。例えば周知の視線検出技術によりユーザの視線を検出し、検出されたユーザの視線から見ている単語を予測し、その単語を見ている時間が予め定められた時間より長い場合には、ユーザが単語を読むのが難しいとしてその単語に対する表示要求を取得してもよい。

　また、閲覧者指示取得部５５は、ユーザが音読している音声を用いて正しく読めなかった漢字を特定してもよい。この場合には、閲覧者指示取得部５５は、ユーザが音読をしている音声をマイクで取得し、周知の音声認識技術によりその音声を認識し、認識された音声と予め記憶された文章のよみ（かな）とを照合する。これらの処理により、閲覧者指示取得部５５は正しく読めなかった単語（付加情報を必要とする単語）を特定する。この正しく読めなかったと特定された単語は、以降の処理では上述の表示要求がされた単語と同様に扱われる。

　一方、パラメータ設定部５６は、これらの付加情報を表示させる指示や非表示にする指示に基づいて、ユーザの学習能力を示すパラメータを変更する処理を行う。例えば、学習データにおいて学習済とされている単語について付加情報を表示する旨の操作がされた場合には、ユーザの学習能力が低いとして、ユーザ閾値を大きく設定する。なお、この代わりに、学習スコアの計算方法を変えてもよい。例えばパラメータ設定部５６は、代わりに数式（１）におけるパラメータＢを小さくしたりパラメータＡを大きくしてもよい。また、パラメータ設定部５６は付加情報の表示を抑制する操作の頻度が予め定められた値より多い場合には、ユーザ閾値を小さくするか、パラメータＢを大きくしたりパラメータＡを小さくしてもよい。なお、文書を読む時点で単語を既に知っているために付加情報を非表示にする操作をする場合には学習能力との関係が薄いと考えられるので、それまでに初めて付加情報を表示した単語である場合には、パラメータ設定部５６は非表示の指示があってもパラメータを変更しなくてもよい。

　なお、本発明は漢字とかなとの組合せに限らず適用できる。例えば、中国語における漢字の単語と、その読みを示すピンインとの組合せに適用することも可能であるし、英単語とその発音を示す文字列との組合せに適用することも可能である。また、ある言語の文書を構成する単語と、その意味を示す他の言語の単語との組合せに適用することも可能である。どれも、文書の本体である単語と、それに対する付加情報との関係があるからである。

　１１　プロセッサ、１２　記憶部、１３　通信部、１４　表示部、１５　入力部、５１　文書情報取得部、５２　付加情報取得部、５３　付加情報出力判定部、５４　表示制御部、５５　閲覧者指示取得部、５６　パラメータ設定部。

Claims

　複数の単語を含む文書の情報を取得する文書取得手段と、
　前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、
　前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、
　前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する表示制御手段と、
　を含み、
　前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
　ことを特徴とする文書処理装置。
　前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ１または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
　ことを特徴とする請求項１に記載の文書処理装置。
　前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
　ことを特徴とする請求項２に記載の文書処理装置。
　閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、
　前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含む、
　ことを特徴とする請求項３に記載の文書処理装置。
　前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
　前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含む、
　ことを特徴とする請求項３または４に記載の文書処理装置。
　閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、
　前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含む、
　ことを特徴とする請求項２に記載の文書処理装置。
　前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
　前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ１または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算する、
　ことを特徴とする請求項２または６に記載の文書処理装置。
　複数の単語を含む文書の情報を取得し、
　前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
　前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
　前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
　前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
　ことを特徴とする文書処理方法。
　複数の単語を含む文書の情報を取得し、
　前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
　前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
　前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
　前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
　処理をコンピュータに実行させるプログラム。
　複数の単語を含む文書の情報を取得し、
　前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
　前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
　前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
　前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
　処理をコンピュータに実行させるプログラムを記憶したコンピュータ読取り可能な情報記憶媒体。