JPWO2014147767A1 - 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 - Google Patents

文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 Download PDF

Info

Publication number
JPWO2014147767A1
JPWO2014147767A1 JP2015506462A JP2015506462A JPWO2014147767A1 JP WO2014147767 A1 JPWO2014147767 A1 JP WO2014147767A1 JP 2015506462 A JP2015506462 A JP 2015506462A JP 2015506462 A JP2015506462 A JP 2015506462A JP WO2014147767 A1 JPWO2014147767 A1 JP WO2014147767A1
Authority
JP
Japan
Prior art keywords
additional information
word
words
display
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015506462A
Other languages
English (en)
Other versions
JP5877272B2 (ja
Inventor
千善 早瀬
千善 早瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP5877272B2 publication Critical patent/JP5877272B2/ja
Publication of JPWO2014147767A1 publication Critical patent/JPWO2014147767A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

文書の構成要素に対する付加情報を、読者が文書を読む能力の変化に応じて表示する。文書処理装置は、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語の出現頻度を示す情報に基づいて当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する。前記判定の際には、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する。

Description

本発明は文書処理装置、文書処理方法、プログラムおよび情報記憶媒体に関する。
電子書籍やHTML文書などのデジタルコンテンツが盛んに利用されるようになっている。これらのデジタルコンテンツの文書を読むには、漢字を含む単語などの読み方や意味の知識といった、あるレベルの知識を読者に要求する場合がある。この要求されるレベルに達しない人でも読みやすいように、文章に漢字の読み方を示す文字(ルビ)などの付加情報をつけて表示することが行われている。
特許文献1には、利用者のランクと、ふりがな対象文字列の難易度とに基づいて、ルビ付きテキストを生成する技術が開示されている。
特開平11−39298号公報
文書を読む読者の実際のレベルは変化するものである一方、そのレベルに合っていない文書は読みにくい。例えば、最初は読めない漢字であっても、ルビを付けられた漢字を何度か読んでいれば、ルビがなくても読めるようになる。すると、読めるようになった漢字につけられたルビは読者にとっては不要なものになる。読めるようになりかつルビが付けられている漢字が多くなると、読者にとっては読みづらくなる。このような問題は、ルビだけでなく、単語の近くに他の種類の付加情報を表示する場合にも生じる。したがって、表示される文書には読者のレベルの変化に応じた付加情報が表示されることが望ましい。
本発明は上記課題を鑑みてなされたものであって、その目的は、読者が文書を読む能力の変化に応じて、付加情報を表示することができる技術を提供することにある。
上記課題を解決するために、本発明にかかる文書処理装置は、複数の単語を含む文書の情報を取得する文書取得手段と、前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、前記複数の単語と、表示すると判断された前記付加情報とを画面に表示させるよう制御する表示制御手段と、を含み、前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。
また、本発明にかかる文書処理方法では、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。
また、本発明にかかるプログラムは、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、処理をコンピュータに実行させることを特徴とする。
また、本発明にかかるコンピュータ読取り可能な記憶媒体は、上記プログラムを格納する。
本発明によれば、読者が文書を読む能力の変化に応じて、付加情報を表示することができる。
本発明の一態様では、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。
本発明の一態様では、前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。
本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含んでもよい。
この態様によれば、ユーザの学習能力に応じて不要な付加情報を表示することを抑制することができる。
本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記文書処理装置は、前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含んでもよい。
この態様によれば、学習のしやすさに応じて不要な付加情報を表示することを抑制することができる。
本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含んでもよい。
この態様によれば、ユーザの学習能力に応じて不要な付加情報を表示することを抑制することができる。
本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算してもよい。
この態様によれば、学習のしやすさに応じて不要な付加情報を表示することを抑制することができる。
本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。 文書処理装置が実現する機能の一例を示すブロック図である。 文書の一例を示す図である。 付加情報を含む辞書データの一例を示す図である。 付加情報出力判定部等の処理フローの一例を示す図である。 学習データの一例を示す図である。 学習データの他の例を示す図である。 ルビ付きで表示される文書の一例を示す図である。 ルビを表示させる操作の一例を示す図である。 ルビの表示を抑制させる操作の一例を示す図である。
以下では、本発明の実施形態について図面に基づいて説明する。同じ符号を付された構成については、重複する説明を省略する。
図1は、本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。文書処理装置は、プロセッサ11、記憶部12、通信部13、表示部14、入力部15を含む。文書処理装置は、例えばタブレット端末や電子書籍端末である。また文書処理装置は、パーソナルコンピュータなどであってもよいし、これらの端末とネットワークを介して接続されるサーバコンピュータであってもよい。
プロセッサ11は、記憶部12に格納されているプログラムに従って動作する。またプロセッサ11は通信部13、表示部14、入力部15を制御する。なお、上記プログラムは、インターネット等を介して提供されるものであってもよいし、フラッシュメモリ等のコンピュータで読み取り可能な記憶媒体に格納されて提供されるものであってもよい。
記憶部12は、RAMやフラッシュメモリ等のメモリ素子やメモリカード等によって構成されている。記憶部12は、上記プログラムを格納する。また、記憶部12は、各部から入力される情報や演算結果を格納する。
通信部13は、他の装置と通信する機能を実現するものであり、例えば無線LANの集積回路やアンテナなどにより構成されている。通信部13は、プロセッサ11の制御に基づいて、他の装置から受信した情報をプロセッサ11や記憶部12に入力し、他の装置に情報を送信する。
表示部14は、液晶パネルなどの表示出力デバイスやそれを制御する回路であり、液晶表示パネルやグラフィックチップなどにより構成される。表示部14は、プロセッサ11の制御に基づいて、画像を表示出力デバイスに対して出力する。なお、文書処理装置は必ずしも表示出力デバイスを内蔵していなくてもよく、表示部14は外部にある表示出力デバイスに画像を表示させてもよい。
入力部15は、タッチパネルなどの入力デバイスや、キーボードやマウスなどの入力デバイスからのデータを取得するコントローラなどにより構成される。入力部15は、プロセッサ11の制御に基づいて、タッチパネルや入力デバイスをユーザが操作することにより入力されるデータを取得する。
図2は、文書処理装置が実現する機能を示すブロック図である。文書処理装置は、機能的に、文書情報取得部51と、付加情報取得部52と、付加情報出力判定部53と、表示制御部54と、閲覧者指示取得部55と、パラメータ設定部56と、を含む。これらの機能は、プロセッサ11が記憶部12に格納されたプログラムを実行し、表示部14や入力部15等を制御することで実現される。ここで、文書情報取得部51、付加情報取得部52、付加情報出力判定部53、表示制御部54、閲覧者指示取得部55、パラメータ設定部56は、それぞれ本願請求項の文書取得手段、付加情報取得手段、判定手段、表示制御手段、指示取得手段、設定手段に対応する。
以下では、文書処理装置が実現する各機能について、処理フローやその他の図面を用いて説明する。
文書情報取得部51は、プロセッサ11、記憶部12を中心として実現される。文書情報取得部51は、複数の単語を含む文書の情報(文書データ)を取得し、その文書の情報を付加情報出力判定部53などに引き渡す。文書情報取得部51は、予め記憶部12に記憶された文書データを取得してもよいし、通信部13を介してネットワーク経由で文書データを取得してもよい。
図3は、文書データが示す文書の一例を示す図である。この例では文書データは日本語の文章のデータであり、文章は漢字とかな(表音文字)とが混じって表現される。文章を構成する要素である単語等は、漢字とかなとのうち少なくとも一方により作られている。本実施形態では、「単語」は複合語のようなものも含むとして表記する。図3では文書中に出現する単語の一部に符号を付けているが、これらはその単語のIDに相当する。このIDについては後述する。
特に子どもなどは、単語に含まれる漢字を読めないことが多いが、その読み方がわかれば問題なく意味を理解することが多い。そのため、この文書処理装置では、単語の漢字表記の上にその発音を示す小さいかなの文字列(以下では「ルビ」という)を付けることで文書を読む際の手助けをする。以下では付加情報として、この単語につけるルビを用いる場合について主に説明する。
付加情報取得部52は、プロセッサ11、記憶部12を中心として実現される。付加情報取得部52は、複数の単語のそれぞれに紐付けられた付加情報やそれに付随する情報を取得する。付加情報取得部52は、予め記憶部12に記憶された付加情報等を取得してもよいし、通信部13を介してネットワーク経由で付加情報等を取得してもよい。
図4は、付加情報を含む辞書データの一例を示す図である。辞書データは、単語とその単語の付加情報とを紐づけるデータである。ここでは、付加情報はその単語の読みの情報である。また辞書データには単語の読みの難しさを示すレベルや、その単語のジャンルの情報も、その単語に紐付けられている。レベルは、例えば単語を構成する漢字を習う学年や、画数などに基づいて定められる。図4の例では、各単語にはIDが振られており、このIDは図3の符号に対応している。
付加情報出力判定部53は、プロセッサ11、記憶部12を中心として実現される。付加情報出力判定部53は、複数の単語のそれぞれについて、その単語の出現頻度を示す情報に基づいてその単語に紐付けられた付加情報を表示するか否かを判定する。本実施形態では、単語が出現するごとに増え、また出現してから時間が経つにつれて減るスコアを単語の出現頻度を示す情報として用いることで、付加情報を表示するか否かを判定する。
図5は、付加情報出力判定部53等の処理フローの一例を示す図である。図5に示す処理フローを用いて付加情報出力判定部53の処理や、それに付随する他の機能の処理について説明する。
はじめに、付加情報出力判定部53は、文書データの読込位置を取得する(ステップS101)。この読込位置は、文書データが示す文書のうち表示されるページの先頭に相当する文書データ内の位置であり、文書データの先頭からの文字数などである。付加情報出力判定部53は、文書を閲覧する読者であるユーザが表示するページを指定する操作や、次のページへ進む操作や前のページに戻る操作や、前回読んだ位置などに基づいて文書データの読込位置を取得する。
次に、付加情報出力判定部53は、読込位置にある単語を取得する(ステップS102)。この単語は、予め文書データに特定する情報が埋め込まれていてもよいし、付加情報出力判定部53が文書データのテキストから形態素解析を行うことにより取り出されてもよい。前者の場合には、例えば文書データに予め単語の位置や、その単語に紐付けられる付加情報そのもの、または付加情報の識別コードを示すHTMLタグのような情報を埋め込んでおくとよい。前者の場合には付加情報出力判定部53がその埋め込まれた情報を用いて単語を取得する。次に、付加情報出力判定部53は、辞書データからその単語に紐付けられた付加情報やその単語の難しさを示すレベルを取得し、また学習データから、付加情報をユーザが学習済で表示不要であるか否かを示す学習済フラグを取得する(ステップS103)。
図6は学習データの一例を示す図である。学習データのレコードは単語ごとに設けられており、単語と、これまでに計算された学習スコア、カウント、および学習済フラグとが紐付けられている。ここで、カウントは直近にその単語が出現した位置や時間により計算されるものである。学習済フラグはこの単語の付加情報をユーザが学習済であるか否かを示すものであり、付加情報の表示を必要とするか否かを示すものでもある。
付加情報出力判定部53は、付加情報等を取得した後に、付加情報の表示が必要か否かを判定する。より具体的には、単語の難しさを示すレベルがユーザの大まかな知識を示すユーザレベル以下である場合や(ステップS104のN)、学習済フラグが学習済であることを示す場合には(ステップS106のY)、付加情報は表示しないと判定して表示データにその単語のみを付加する(ステップS105)。ここで表示データは、後述する表示制御部54が画面に表示させる文字列を示すデータである。後述するが、表示制御部54は表示データに付加情報が含まれていればその付加情報を表示し、含まれていなければその付加情報を表示しないように制御する。なお、図5には示していないが、単語に紐付けられる付加情報がない場合にも付加情報出力判定部53は付加情報を表示しないと判定し、ステップS105で表示データにその単語を付加し、付加情報は付加しない。
一方、単語の難しさを示すレベルがユーザレベルより高く(ステップS104のY)かつ表示不要フラグが表示可能を示す場合には(ステップS106のN)、付加情報出力判定部53はその付加情報を表示すると判定し、付加情報出力判定部53は、表示データに単語と付加情報とを追加する(ステップS107)。なお、付加情報の追加の方法としては、HTMLにおいて<RUBY>タグを用いてルビを表示させる情報を追加してもよいし、他の表示用言語を用いて単語と付加情報とを表現してもよい。
次に、付加情報出力判定部53は、その単語についての学習状況を示す情報を更新する。はじめに、付加情報出力判定部53は、その単語についての学習スコアを計算し学習データの学習スコア欄を更新する(ステップS108)。
学習スコアの計算方法についてさらに説明する。付加情報出力判定部53は、文書データに含まれる複数の単語のそれぞれについて、これまでの単語が出現した位置および時間の少なくとも一方に基づいて学習スコアを計算する。この単語が出現した位置や時間を考慮するために、学習データには、前回の単語の出現時に計算された学習スコアと、その単語が出現した位置や時間に基づくカウントとが単語と関連づけられて記憶されている。図6は、図3に示す文書のうち先頭からIDが「wb50」の単語が出現するまでの処理により格納される学習データの例である。カウントは、ページの中における位置や、閲覧開始からの時間が進むにつれて大きくなる値である。付加情報出力判定部53は記憶部12にシステムとしてのカウントを有し、この機能が最初に起動されてから、一定の周期が経過するごとにそのカウントの値を増やし、また処理対象となる文字が進むごとにそのカウントの値を増やす。また付加情報出力判定部53は、この処理時点でのシステムのカウントを学習データのカウント欄に記憶させる。このカウントは、前回この単語をみてからの時間経過に伴う忘却を考慮するために用いられる。次にスコアの計算式を示す。
Figure 2014147767
数式(1)において、Sk+1はこの処理で計算されるスコアを示し、Ccは現在のシステムのカウントを示し、SとCはそれぞれ、単語が前回出現した際に計算されたスコアとカウントを示す。Aはユーザの忘れやすさを示す忘却パラメータであり、Bは単語の付加情報を表示することによる新たな学習量を示すパラメータである。Bは単語が一度出現するごとに増加する学習スコアの量に相当する。(Cc−Ck)×Aは前回の単語の出現時の学習スコアのうち、忘れることにより減少する量の割合を示す。Aは0より大きく1より小さい値である。この式により、学習スコアが単語のユーザにとっての出現頻度を示すものになる。
ここで、付加情報が表示される単語の頻度やその単語の種類の数の多さに応じてスコアが増える量を決めてもよい。付加情報が表示される頻度が多かったり、付加情報が表示される単語の種類の数が多い場合は、ユーザの負担が大きく、記憶することが難しくなると考えられる。このような場合に学習が進まない扱いにするよう、スコアの計算に関わるパラメータであるAやBの値を調整させることで、よりユーザの学習の現実に沿った対応が可能となる。
学習スコアが計算されると、付加情報出力判定部53はその学習スコアがユーザ閾値を超えたか否かを判定する(ステップS109)。学習スコアがユーザ閾値を超えた場合には(ステップS109のY)、ユーザはその単語について学習ができ、例えばルビ無しで単語が読めるようになったとして、学習データの学習済フラグを学習済に設定する(ステップS110)。
ここで、パラメータ設定部56は、プロセッサ11および記憶部12を中心として実現される。パラメータ設定部56は、ユーザの学習能力に応じたパラメータを設定する。
ステップS108で用いられるユーザ閾値はパラメータ設定部56が設定するパラメータの1つである。図示していないが、パラメータ設定部56は、ステップS109の処理を行う際またはその前に、ユーザ閾値を設定する。例えば、パラメータ設定部56はユーザのレベルLuと単語のレベルLwとの差が大きいほどユーザ閾値を大きく設定し、ユーザがよく読む文書のジャンル(得意ジャンル)と単語のジャンルとが重なる場合にはユーザ閾値を小さく設定する。これにより、単語の種類に応じたユーザの学習のしやすさを付加情報の表示の判定に反映させることが可能になる。
そして、ステップS110またはステップS105で表示用データに単語等が追加されたら、付加情報出力判定部53は表示の単位であるページの終わりまで文書データを読込んだかを確認する(ステップS111)。読込位置がまだページの終わりで無い場合は(ステップS111のN)、次に読込対象となる単語が次の単語になるように読込位置を進め(ステップS112)、ステップS102から繰り返す。また、読込位置がページの終わりである場合は(ステップS111のY)、このページについての処理を終了する。なお、システムのカウント、ユーザのレベルの情報、学習データ等は処理が終わっても記憶部12に保持され、例えばこの文書の他のページや、他の文書について次に付加情報出力判定部53の処理をする際にも用いられる。
次に学習データについて説明する。前述の図6は図3に示す文書の文書データにおいて、wb50のIDをもつ単語が出現するまでの処理が行われた際の学習データの内容である。本図は、文書の先頭から処理を開始する際にはシステムのカウントCcや各単語の学習スコアは0である場合の例である。また、ユーザのレベルは1であり、学習スコアの計算方法におけるパラメータBは10であり、パラメータAは200分の1とする。すると、図6に示す時点ではスコアに忘却の影響がでないため、学習スコアは単語の出現回数に比例する。
図7は、学習データの他の例を示す図である。図7は、文書データでIDがwb90が4回出現した際の学習データの状態を示す図である。ここではIDがwn14である単語が1回目に出現してから2回目に出現するまでに間があいたため、単純に出現回数に比例する値より、学習スコアが小さくなっている。このように忘却を示すパラメータを用いることで、出現間隔が広いか否かを考慮して学習済か否か判断することが可能になる。
一方、IDがwa10である単語とIDがwb90である単語とでは、学習スコアが低い単語の方が学習済となり、それより学習スコアが高い単語が学習済になっていない。これは、図4にあるようにIDがwa10である単語はレベルが2でありユーザレベルとの差が1のみであるのに対し、IDがwb90である単語はレベルが7でありその差が6であるため、ユーザ閾値が異なっているからである。このようにして、難しい単語ほど学習までに時間がかかるという学習の法則を考慮した対応をすることが可能となる。
ここで、パラメータ設定部56は、ユーザ閾値を変化させる代わりに、数式(1)における計算方法のパラメータAやBを変化させてもよい。例えば、パラメータBを、ユーザのレベルLuと単語のレベルLwとの差や、ジャンルの相違に応じて計算される値にしてもよい。例えばLwとLuとの差が大きいほど値を小さくし、予めユーザが指定したユーザの得意ジャンルと単語のジャンルが重なれば値を大きくするといった計算をすることで、これらの要素を考慮することが可能になる。
表示制御部54は、プロセッサ11、記憶部12,および表示部14を中心として実現される。表示制御部54は、文書データに含まれる複数の単語と、表示すると判断された付加情報とを画面に表示させるよう制御する。より具体的には、表示データに格納されている文書の単語と、付加情報との表示形式を整えて表示部14などを介して画面に出力するように制御する。
図8は、ルビ付きで表示される文書の一例を示す図である。図8では、IDがwa10である単語については、3回目から付加情報であるルビの表示がされなくなっている。このように、付加情報出力判定部53と表示制御部54とがユーザの学習状況を予想して付加情報の表示を制御することができる。これにより、学習状況に応じた付加情報の表示の制御が可能になる。
閲覧者指示取得部55は、プロセッサ11、記憶部12、表示部14および入力部15を中心として実現される。閲覧者指示取得部55は画面に表示された文書に対する閲覧者の行動に基づいて、文書中の単語に対する付加情報を必要としているか否かに関連する情報を取得する。より具体的には、閲覧者指示取得部55は画面に表示された文書に対する操作に基づいて、単語に対する付加情報の表示または非表示の操作を取得し、その単語について付加情報を表示し、または表示されている付加情報を削除する。図9は、ルビを表示させる操作の一例を示す図である。例えば、ユーザが単語を一定時間選択すると、閲覧者指示取得部55は付加情報を表示するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザがルビを表示する旨の操作をすると、その付加情報の表示の指示を取得する。そして、表示制御部54にその指示を渡し、表示制御部54はその単語に付加情報を表示させる処理を行う。
一方、図10はルビの表示を抑制させる操作の一例を示す図である。例えば、ユーザが付加情報が表示されている単語を一定時間選択したりすると、閲覧者指示取得部55は付加情報の表示を抑制するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザが付加情報の表示を抑制させる旨の操作をすると、その指示を取得する。そして、表示制御部54にその指示を渡し、表示制御部54はその単語およびそのページの他の同じ単語について付加情報の表示を抑制し、その付加情報を画面から消すとともに、学習データでその単語を学習済にする処理を行う。
なお、閲覧者指示取得部55は、ユーザの視線を用いてルビの表示要求を検知してもよい。例えば周知の視線検出技術によりユーザの視線を検出し、検出されたユーザの視線から見ている単語を予測し、その単語を見ている時間が予め定められた時間より長い場合には、ユーザが単語を読むのが難しいとしてその単語に対する表示要求を取得してもよい。
また、閲覧者指示取得部55は、ユーザが音読している音声を用いて正しく読めなかった漢字を特定してもよい。この場合には、閲覧者指示取得部55は、ユーザが音読をしている音声をマイクで取得し、周知の音声認識技術によりその音声を認識し、認識された音声と予め記憶された文章のよみ(かな)とを照合する。これらの処理により、閲覧者指示取得部55は正しく読めなかった単語(付加情報を必要とする単語)を特定する。この正しく読めなかったと特定された単語は、以降の処理では上述の表示要求がされた単語と同様に扱われる。
一方、パラメータ設定部56は、これらの付加情報を表示させる指示や非表示にする指示に基づいて、ユーザの学習能力を示すパラメータを変更する処理を行う。例えば、学習データにおいて学習済とされている単語について付加情報を表示する旨の操作がされた場合には、ユーザの学習能力が低いとして、ユーザ閾値を大きく設定する。なお、この代わりに、学習スコアの計算方法を変えてもよい。例えばパラメータ設定部56は、代わりに数式(1)におけるパラメータBを小さくしたりパラメータAを大きくしてもよい。また、パラメータ設定部56は付加情報の表示を抑制する操作の頻度が予め定められた値より多い場合には、ユーザ閾値を小さくするか、パラメータBを大きくしたりパラメータAを小さくしてもよい。なお、文書を読む時点で単語を既に知っているために付加情報を非表示にする操作をする場合には学習能力との関係が薄いと考えられるので、それまでに初めて付加情報を表示した単語である場合には、パラメータ設定部56は非表示の指示があってもパラメータを変更しなくてもよい。
なお、本発明は漢字とかなとの組合せに限らず適用できる。例えば、中国語における漢字の単語と、その読みを示すピンインとの組合せに適用することも可能であるし、英単語とその発音を示す文字列との組合せに適用することも可能である。また、ある言語の文書を構成する単語と、その意味を示す他の言語の単語との組合せに適用することも可能である。どれも、文書の本体である単語と、それに対する付加情報との関係があるからである。
11 プロセッサ、12 記憶部、13 通信部、14 表示部、15 入力部、51 文書情報取得部、52 付加情報取得部、53 付加情報出力判定部、54 表示制御部、55 閲覧者指示取得部、56 パラメータ設定部。

Claims (10)

  1. 複数の単語を含む文書の情報を取得する文書取得手段と、
    前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、
    前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、
    前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する表示制御手段と、
    を含み、
    前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
    ことを特徴とする文書処理装置。
  2. 前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
    ことを特徴とする請求項1に記載の文書処理装置。
  3. 前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
    ことを特徴とする請求項2に記載の文書処理装置。
  4. 閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、
    前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含む、
    ことを特徴とする請求項3に記載の文書処理装置。
  5. 前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
    前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含む、
    ことを特徴とする請求項3または4に記載の文書処理装置。
  6. 閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、
    前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含む、
    ことを特徴とする請求項2に記載の文書処理装置。
  7. 前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
    前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算する、
    ことを特徴とする請求項2または6に記載の文書処理装置。
  8. 複数の単語を含む文書の情報を取得し、
    前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
    前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
    前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
    前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
    ことを特徴とする文書処理方法。
  9. 複数の単語を含む文書の情報を取得し、
    前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
    前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
    前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
    前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
    処理をコンピュータに実行させるプログラム。
  10. 複数の単語を含む文書の情報を取得し、
    前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
    前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
    前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
    前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
    処理をコンピュータに実行させるプログラムを記憶したコンピュータ読取り可能な情報記憶媒体。
JP2015506462A 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 Active JP5877272B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/057908 WO2014147767A1 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Publications (2)

Publication Number Publication Date
JP5877272B2 JP5877272B2 (ja) 2016-03-02
JPWO2014147767A1 true JPWO2014147767A1 (ja) 2017-02-16

Family

ID=51579499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015506462A Active JP5877272B2 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Country Status (3)

Country Link
US (1) US10275445B2 (ja)
JP (1) JP5877272B2 (ja)
WO (1) WO2014147767A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6056938B2 (ja) * 2014-10-29 2017-01-11 キヤノンマーケティングジャパン株式会社 プログラム、処理方法、および情報処理装置
JP6096829B2 (ja) * 2015-04-30 2017-03-15 シナノケンシ株式会社 学習用デジタルコンテンツ再生表示装置
JP6746886B2 (ja) * 2015-09-10 2020-08-26 カシオ計算機株式会社 学習支援装置及びその学習支援装置用のプログラム
WO2017139834A1 (en) * 2016-02-18 2017-08-24 Lawence Sean A language learning interface
US9990564B2 (en) * 2016-03-29 2018-06-05 Wipro Limited System and method for optical character recognition
JP7069766B2 (ja) * 2018-02-02 2022-05-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US11194956B2 (en) * 2018-04-30 2021-12-07 Patent Bots LLC Offline interactive natural language processing results
US11645561B2 (en) * 2019-03-18 2023-05-09 International Business Machines Corporation Question answering system influenced by user behavior and text metadata generation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784587A (ja) * 1993-09-13 1995-03-31 Pioneer Electron Corp 表示制御装置
US6128632A (en) * 1997-03-06 2000-10-03 Apple Computer, Inc. Methods for applying rubi annotation characters over base text characters
JPH1139298A (ja) * 1997-07-18 1999-02-12 Nippon Telegr & Teleph Corp <Ntt> ふりがな制御装置
JP2001125892A (ja) * 1999-10-26 2001-05-11 Sharp Corp ルビ表示装置、ルビ表示方法およびルビ表示プログラムを記録した媒体
JP2002108853A (ja) 2000-09-29 2002-04-12 Wac.Com:Kk 文章情報編集方法及びコンピュータ読取り可能な記録媒体
US20060010378A1 (en) * 2004-07-09 2006-01-12 Nobuyoshi Mori Reader-specific display of text
US8103445B2 (en) * 2005-04-21 2012-01-24 Microsoft Corporation Dynamic map rendering as a function of a user parameter
US9275019B2 (en) * 2007-12-21 2016-03-01 Sap Se System and method for performing Unicode matching
US8490011B2 (en) * 2008-05-14 2013-07-16 At&T Intellectual Property I, L.P. Display of supplementary information on a graphical user interface
JP4623169B2 (ja) * 2008-08-28 2011-02-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4999938B2 (ja) * 2010-01-07 2012-08-15 シャープ株式会社 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
JP5193263B2 (ja) * 2010-10-21 2013-05-08 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
JP5144736B2 (ja) * 2010-11-10 2013-02-13 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US8816966B2 (en) * 2011-05-23 2014-08-26 Microsoft Corporation Touchscreen japanese character selection through sliding input
US9087048B2 (en) * 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US8943404B1 (en) * 2012-01-06 2015-01-27 Amazon Technologies, Inc. Selective display of pronunciation guides in electronic books
US9460089B1 (en) * 2012-11-07 2016-10-04 Amazon Technologies, Inc. Flow rendering of annotation characters

Also Published As

Publication number Publication date
US10275445B2 (en) 2019-04-30
JP5877272B2 (ja) 2016-03-02
US20160055146A1 (en) 2016-02-25
WO2014147767A1 (ja) 2014-09-25

Similar Documents

Publication Publication Date Title
JP5877272B2 (ja) 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
JP6596511B2 (ja) デジタルグラフィックノベルの自動翻訳
KR101892723B1 (ko) 실시간 필기 인식 관리
US10416877B2 (en) System and method of guiding handwriting input
KR20180048774A (ko) 디지털 노트 필기의 시스템 및 방법
US20190244542A1 (en) Systems and methods for accessible widget selection
CN110109590B (zh) 一种自动阅读的方法及设备
US20200285324A1 (en) Character inputting device, and non-transitory computer readable recording medium storing character inputting program
JP7481999B2 (ja) 辞書編集装置、辞書編集方法及び辞書編集プログラム
US11899904B2 (en) Text input system with correction facility
JP6485495B2 (ja) 文書表示装置、文書表示方法、文書表示システムおよびプログラム
KR20170132643A (ko) 문자 디스플레이 방법 및 그 장치
US20160078013A1 (en) Fault-tolerant input method editor
JP2014194637A (ja) 情報処理装置、情報処理方法およびプログラム
KR102329496B1 (ko) 전자 장치 및 전자 장치에서 문자 입력을 처리하는 방법
JP6286897B2 (ja) 文書表示装置、文書表示方法及び文書表示プログラム
JP2019215936A (ja) 自動翻訳装置及び自動翻訳プログラム
CN110989894B (zh) 电子设备、电子设备的控制方法和记录有程序的记录介质
JP2013130916A (ja) 文書速読支援装置
KR20240094415A (ko) 보험 설계를 위한 사용자 맞춤형 인터페이스 화면 제공 방법 및 장치
JP2023116952A (ja) 文書評価装置、文書評価方法、及び、プログラム
US20090244002A1 (en) Method, Device and Program for Controlling Display, and Printing Device
JP2022124871A (ja) 情報処理装置及び情報処理プログラム
JP2014182703A (ja) 表示制御装置、表示制御方法およびそのプログラムならびに情報機器
JP2019046217A (ja) 表示制御装置、表示制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160125

R150 Certificate of patent or registration of utility model

Ref document number: 5877272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250