WO2014147767A1 - 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 - Google Patents

文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 Download PDF

Info

Publication number
WO2014147767A1
WO2014147767A1 PCT/JP2013/057908 JP2013057908W WO2014147767A1 WO 2014147767 A1 WO2014147767 A1 WO 2014147767A1 JP 2013057908 W JP2013057908 W JP 2013057908W WO 2014147767 A1 WO2014147767 A1 WO 2014147767A1
Authority
WO
WIPO (PCT)
Prior art keywords
additional information
word
words
display
document
Prior art date
Application number
PCT/JP2013/057908
Other languages
English (en)
French (fr)
Inventor
千善 早瀬
Original Assignee
楽天株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 楽天株式会社 filed Critical 楽天株式会社
Priority to PCT/JP2013/057908 priority Critical patent/WO2014147767A1/ja
Priority to US14/778,081 priority patent/US10275445B2/en
Priority to JP2015506462A priority patent/JP5877272B2/ja
Publication of WO2014147767A1 publication Critical patent/WO2014147767A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Definitions

  • the present invention relates to a document processing apparatus, a document processing method, a program, and an information storage medium.
  • Digital contents such as electronic books and HTML documents are actively used.
  • readers may be required to have a certain level of knowledge, such as how to read words including kanji and knowledge of their meaning.
  • the text is displayed with additional information such as characters (ruby) indicating how to read kanji.
  • Patent Document 1 discloses a technology for generating ruby-added text based on the rank of a user and the difficulty level of a target character string.
  • the present invention has been made in view of the above problems, and an object of the present invention is to provide a technique capable of displaying additional information according to a change in a reader's ability to read a document.
  • a document processing apparatus includes a document acquisition unit that acquires information of a document including a plurality of words, and an addition that acquires additional information associated with each of the plurality of words.
  • information acquisition means For each of the plurality of words, information acquisition means, determination means for determining whether or not to display additional information associated with the word, the plurality of words, and the additional information determined to be displayed
  • Display control means for controlling to display on the screen, the determination means, for each of the plurality of words, information indicating the frequency at which the word is displayed together with additional information associated with the word Based on this, it is determined whether or not to display the additional information.
  • information on a document including a plurality of words is acquired, additional information associated with each of the plurality of words is acquired, and each of the plurality of words includes the word.
  • Whether or not to display additional information associated with the display controls to display the plurality of words and the additional information determined to be displayed on the screen, and whether or not to display the additional information
  • For each of the plurality of words it is determined whether or not to display the additional information based on information indicating the frequency with which the word is displayed together with the additional information associated with the word. It is characterized by that.
  • the program according to the present invention acquires information on a document including a plurality of words, acquires additional information associated with each of the plurality of words, and associates each of the plurality of words with the word. It is determined whether or not to display the attached additional information, and controls to display the plurality of words and the additional information determined to be displayed on the screen, and determines whether or not to display the additional information. And determining whether or not to display the additional information based on information indicating the frequency with which the word is displayed together with the additional information associated with the word for each of the plurality of words.
  • the computer is executed.
  • the computer-readable storage medium according to the present invention stores the above program.
  • additional information can be displayed in accordance with changes in the reader's ability to read documents.
  • the determination means includes at least one of a position and a time at which one or more words that are the same as the word are displayed together with the additional information before the word appears.
  • a score indicating the frequency with which the word is displayed may be calculated on the basis of whether or not additional information associated with the plurality of words is to be displayed based on the score.
  • the determination unit may determine whether or not to display additional information associated with the plurality of words based on a parameter corresponding to a user's learning ability.
  • the document processing device includes an instruction acquisition unit that acquires an instruction to display or hide additional information for a displayed word based on a viewer's operation on the screen, and the display of the additional information.
  • it may further include setting means for setting parameters according to the learning ability of the user based on a non-display operation.
  • the additional information acquisition unit acquires information indicating a difficulty level associated with the word, and the document processing device responds to a user's learning ability based on the acquired difficulty level. It may further include setting means for setting the parameters.
  • the document processing device is configured to acquire a display information non-display operation for the displayed word based on a viewer's operation on the screen, and display or non-display of the additional information. And setting means for setting the score calculation method based on a display operation.
  • the additional information acquisition unit acquires information indicating a difficulty level associated with the word, and the determination unit determines, for each of the plurality of words, before the word appears.
  • the score may be calculated based on at least one of the position and time at which one or more words that are the same as the word are displayed together with the additional information, and the difficulty level of the word.
  • FIG. 1 is a diagram illustrating an example of a hardware configuration of a document processing apparatus according to an embodiment of the present invention.
  • the document processing apparatus includes a processor 11, a storage unit 12, a communication unit 13, a display unit 14, and an input unit 15.
  • the document processing device is, for example, a tablet terminal or an electronic book terminal.
  • the document processing apparatus may be a personal computer or a server computer connected to these terminals via a network.
  • the processor 11 operates according to a program stored in the storage unit 12.
  • the processor 11 controls the communication unit 13, the display unit 14, and the input unit 15.
  • the program may be provided via the Internet or the like, or may be provided by being stored in a computer-readable storage medium such as a flash memory.
  • the storage unit 12 includes a memory element such as a RAM or a flash memory, a memory card, or the like.
  • the storage unit 12 stores the program.
  • the storage unit 12 stores information input from each unit and calculation results.
  • the communication unit 13 realizes a function of communicating with other devices, and includes, for example, a wireless LAN integrated circuit or an antenna. Based on the control of the processor 11, the communication unit 13 inputs information received from another device to the processor 11 or the storage unit 12 and transmits the information to the other device.
  • the display unit 14 is a display output device such as a liquid crystal panel or a circuit that controls the display output device, and includes a liquid crystal display panel or a graphic chip.
  • the display unit 14 outputs an image to the display output device based on the control of the processor 11. Note that the document processing apparatus does not necessarily have a built-in display output device, and the display unit 14 may display an image on an external display output device.
  • the input unit 15 includes an input device such as a touch panel and a controller that acquires data from an input device such as a keyboard and a mouse.
  • the input unit 15 acquires data input by a user operating a touch panel or an input device based on the control of the processor 11.
  • FIG. 2 is a block diagram showing functions realized by the document processing apparatus.
  • the document processing apparatus functionally includes a document information acquisition unit 51, an additional information acquisition unit 52, an additional information output determination unit 53, a display control unit 54, a viewer instruction acquisition unit 55, and a parameter setting unit 56. ,including. These functions are realized by the processor 11 executing a program stored in the storage unit 12 and controlling the display unit 14, the input unit 15, and the like.
  • the document information acquisition unit 51, the additional information acquisition unit 52, the additional information output determination unit 53, the display control unit 54, the viewer instruction acquisition unit 55, and the parameter setting unit 56 respectively, It corresponds to information acquisition means, determination means, display control means, instruction acquisition means, and setting means.
  • the document information acquisition unit 51 is realized centering on the processor 11 and the storage unit 12.
  • the document information acquisition unit 51 acquires document information (document data) including a plurality of words, and passes the document information to the additional information output determination unit 53 and the like.
  • the document information acquisition unit 51 may acquire document data stored in the storage unit 12 in advance, or may acquire document data via a network via the communication unit 13.
  • FIG. 3 is a diagram illustrating an example of a document indicated by document data.
  • the document data is Japanese text data, and the text is expressed by mixing kanji and kana (phonetic characters).
  • a word or the like that is an element constituting a sentence is made up of at least one of kanji and kana.
  • “word” is expressed as including a compound word.
  • a part of the word appearing in the document is assigned a code, which corresponds to the ID of the word. This ID will be described later.
  • the additional information acquisition unit 52 is realized centering on the processor 11 and the storage unit 12.
  • the additional information acquisition unit 52 acquires additional information associated with each of a plurality of words and information associated therewith.
  • the additional information acquisition unit 52 may acquire additional information or the like stored in the storage unit 12 in advance, or may acquire additional information or the like via the network via the communication unit 13.
  • FIG. 4 is a diagram showing an example of dictionary data including additional information.
  • the dictionary data is data that associates a word with additional information of the word.
  • the additional information is information on reading of the word.
  • a level indicating difficulty in reading a word and information on the genre of the word are also associated with the word. The level is determined based on, for example, the grade in which the kanji constituting the word is learned, the number of strokes, and the like.
  • an ID is assigned to each word, and this ID corresponds to the code in FIG.
  • the additional information output determination unit 53 is realized centering on the processor 11 and the storage unit 12. For each of the plurality of words, the additional information output determination unit 53 determines whether or not to display additional information associated with the word based on information indicating the appearance frequency of the word. In the present embodiment, whether or not to display additional information is determined by using, as information indicating the frequency of appearance of words, a score that increases each time a word appears and decreases as time passes.
  • FIG. 5 is a diagram illustrating an example of a processing flow of the additional information output determination unit 53 and the like. The processing of the additional information output determination unit 53 and other functions associated therewith will be described using the processing flow shown in FIG.
  • the additional information output determination unit 53 acquires the reading position of the document data (step S101).
  • This reading position is a position in the document data corresponding to the top of the displayed page in the document indicated by the document data, and is the number of characters from the top of the document data.
  • the additional information output determination unit 53 selects the document to be displayed based on an operation for designating a page to be displayed by a user who is a reader viewing the document, an operation for proceeding to the next page, an operation for returning to the previous page, a position read last time, Get the data reading position.
  • the additional information output determination unit 53 acquires the word at the reading position (step S102).
  • This word may be preliminarily embedded with information specified in the document data, or may be extracted by the additional information output determination unit 53 performing morphological analysis from the text of the document data.
  • information such as an HTML tag indicating the position of a word, additional information itself associated with the word, or an identification code of the additional information may be embedded in the document data in advance.
  • the additional information output determination unit 53 acquires a word using the embedded information.
  • the additional information output determination unit 53 acquires the additional information associated with the word from the dictionary data and a level indicating the difficulty of the word, and displays the additional information from the learning data after the user has learned it.
  • a learned flag indicating whether or not it is unnecessary is acquired (step S103).
  • FIG. 6 is a diagram showing an example of learning data.
  • a record of learning data is provided for each word, and the word is associated with the learning score, count, and learned flag calculated so far.
  • the count is calculated based on the position and time at which the word appears most recently.
  • the learned flag indicates whether or not the user has learned the additional information of this word, and also indicates whether or not display of the additional information is required.
  • the additional information output determination unit 53 determines whether it is necessary to display the additional information after acquiring the additional information or the like. More specifically, when the level indicating the difficulty of the word is less than or equal to the user level indicating the general knowledge of the user (N in step S104), or when the learned flag indicates that learning has been completed (In step S106, it is determined that the additional information is not displayed, and only the word is added to the display data (step S105).
  • the display data is data indicating a character string displayed on the screen by the display control unit 54 described later. As will be described later, if the display data includes additional information, the display control unit 54 displays the additional information, and if not, the display control unit 54 performs control so that the additional information is not displayed. Although not shown in FIG. 5, even when there is no additional information associated with the word, the additional information output determination unit 53 determines that the additional information is not displayed, and adds the word to the display data in step S105. No additional information is added.
  • the additional information output determination unit 53 displays the additional information. It determines with displaying, and the additional information output determination part 53 adds a word and additional information to display data (step S107).
  • information for displaying ruby may be added using a ⁇ RUBY> tag in HTML, or words and additional information may be expressed using other display languages. Also good.
  • the additional information output determination unit 53 updates the information indicating the learning status for the word.
  • the additional information output determination unit 53 calculates a learning score for the word and updates the learning score column of the learning data (step S108).
  • the additional information output determination unit 53 calculates a learning score for each of a plurality of words included in the document data based on at least one of the position and time at which the previous word has appeared. To take into account the position and time at which this word appears, the learning data includes a learning score calculated at the time of the previous word appearance and a count based on the position and time at which the word appears. It is remembered.
  • FIG. 6 is an example of learning data stored by the processing from the beginning of the document shown in FIG. 3 until the word with the ID “wb50” appears. The count is a value that increases as the position in the page and the time from the start of browsing progress.
  • the additional information output determination unit 53 has a count as a system in the storage unit 12 and increases the count value every time a certain period elapses after this function is first activated, and the character to be processed As the progress proceeds, the count value is increased. Further, the additional information output determination unit 53 stores the count of the system at the time of this processing in the count column of learning data. This count is used to take into account forgetting over time since the last time this word was viewed.
  • the score calculation formula is shown below.
  • Equation (1) S k + 1 represents the score calculated in this process, Cc represents the current system count, and S k and C k are the score and count calculated when the word appeared last time, respectively.
  • A is a forgetting parameter indicating ease of user's forgetting
  • B is a parameter indicating a new learning amount by displaying additional information of words.
  • B corresponds to the amount of learning score that increases each time a word appears.
  • (Cc ⁇ Ck) ⁇ A indicates the ratio of the learning score at the time of appearance of the previous word that decreases when the word is forgotten.
  • A is a value greater than 0 and less than 1. With this formula, the learning score indicates the appearance frequency for the word user.
  • the amount of increase in the score may be determined according to the frequency of the word for which the additional information is displayed and the number of types of the word. If the additional information is frequently displayed or the number of types of words on which the additional information is displayed is large, it is considered that the burden on the user is large and it is difficult to store the additional information. In such a case, by adjusting the values of A and B, which are parameters related to score calculation, so as to prevent the learning from proceeding, it becomes possible to cope with the user's learning reality.
  • the additional information output determination unit 53 determines whether or not the learning score exceeds the user threshold (step S109). If the learning score exceeds the user threshold (Y in step S109), the user can learn about the word, for example, the word can be read without ruby, and the learned flag of the learning data is set to learned. Set (step S110).
  • the parameter setting unit 56 is realized centering on the processor 11 and the storage unit 12.
  • the parameter setting unit 56 sets parameters according to the user's learning ability.
  • the user threshold value used in step S108 is one of the parameters set by the parameter setting unit 56.
  • the parameter setting unit 56 sets a user threshold value when or before the process of step S109.
  • the parameter setting unit 56 sets the user threshold to be larger as the difference between the user level Lu and the word level Lw is larger, and the document genre (good genre) that the user often reads overlaps with the word genre. Set the user threshold value small. Thereby, it becomes possible to reflect the ease of learning of the user according to the type of word in the determination of the display of additional information.
  • step S111 the additional information output determination unit 53 confirms whether the document data has been read to the end of the page, which is a display unit (step S111). If the reading position is not yet the end of the page (N in step S111), the reading position is advanced so that the next word to be read becomes the next word (step S112), and the process is repeated from step S102. If the reading position is the end of the page (Y in step S111), the process for this page is terminated. Note that the system count, user level information, learning data, and the like are retained in the storage unit 12 even after the processing is completed. It is also used when processing.
  • FIG. 6 described above shows the contents of the learning data when the processing until the word having the ID of wb50 appears in the document data of the document shown in FIG.
  • This figure shows an example in which the system count Cc and the learning score of each word are 0 when processing is started from the top of the document.
  • the user level is 1
  • the parameter B in the learning score calculation method is 10
  • the parameter A is 1/200.
  • the learning score is proportional to the number of appearances of words because the score is not affected by forgetting at the time shown in FIG.
  • FIG. 7 is a diagram showing another example of learning data.
  • FIG. 7 is a diagram showing the state of the learning data when the document data ID wb90 appears four times.
  • the learning score is smaller than a value that is simply proportional to the number of appearances.
  • the word with ID wa10 and the word with ID wb90 the word with the lower learning score is learned, and the word with the higher learning score is not learned.
  • the word with ID wa10 has a level of 2 and the difference from the user level is only 1, whereas the word with ID wb90 has a level of 7 and the difference is This is because the user threshold value is different. In this way, it is possible to take into account the learning law that the more difficult the word, the longer it takes to learn.
  • the parameter setting unit 56 may change the parameters A and B of the calculation method in Equation (1) instead of changing the user threshold.
  • the parameter B may be a value calculated according to the difference between the user level Lu and the word level Lw, or the difference in genre. For example, these factors are taken into account by calculating such that the larger the difference between Lw and Lu, the smaller the value, and the larger the value if the user's special genre specified by the user overlaps with the word genre. Is possible.
  • the display control unit 54 is realized centering on the processor 11, the storage unit 12, and the display unit 14.
  • the display control unit 54 controls to display a plurality of words included in the document data and additional information determined to be displayed on the screen. More specifically, control is performed so that the display format of the word of the document stored in the display data and the additional information is arranged and output to the screen via the display unit 14 or the like.
  • FIG. 8 is a diagram showing an example of a document displayed with ruby.
  • ruby as additional information is not displayed from the third time.
  • the additional information output determination unit 53 and the display control unit 54 can control the display of the additional information in anticipation of the user's learning situation. This makes it possible to control the display of additional information according to the learning status.
  • the viewer instruction acquisition unit 55 is realized centering on the processor 11, the storage unit 12, the display unit 14, and the input unit 15.
  • the browser instruction acquisition unit 55 acquires information related to whether or not additional information for a word in the document is required based on the viewer's action on the document displayed on the screen. More specifically, the browser instruction acquisition unit 55 acquires an operation for displaying or hiding additional information on a word based on an operation on a document displayed on the screen, and displays additional information for the word, or Delete the displayed additional information.
  • FIG. 9 is a diagram illustrating an example of an operation for displaying ruby. For example, when the user selects a word for a certain period of time, the browser instruction acquisition unit 55 displays a popup for confirming whether or not to display additional information on the screen.
  • FIG. 10 is a diagram illustrating an example of an operation for suppressing the display of ruby.
  • the browser instruction acquisition unit 55 displays a pop-up for confirming whether to suppress the display of the additional information on the screen.
  • the instruction is acquired.
  • the instruction is given to the display control unit 54, and the display control unit 54 suppresses the display of the additional information for the word and other same words on the page, erases the additional information from the screen, and uses the learning data for the word. The process of learning is completed.
  • the browser instruction acquisition unit 55 may detect a ruby display request using the user's line of sight. For example, when a user's line of sight is detected by a known line-of-sight detection technique, a word viewed from the detected user's line of sight is predicted, and the time when the word is viewed is longer than a predetermined time, A display request for the word may be acquired because it is difficult to read the word.
  • the browser instruction acquisition unit 55 may specify a kanji that could not be read correctly using the voice that the user is reading aloud.
  • the viewer instruction acquisition unit 55 acquires the voice that the user is reading aloud with a microphone, recognizes the voice by a known voice recognition technique, and recognizes the recognized voice and the previously stored sentence. Check with kana. Through these processes, the browser instruction acquisition unit 55 identifies words that cannot be read correctly (words that require additional information). The word specified as not correctly read is handled in the subsequent processing in the same manner as the word for which the display request has been made.
  • the parameter setting unit 56 performs a process of changing a parameter indicating the user's learning ability based on an instruction to display or hide these additional information. For example, when an operation for displaying additional information is performed for a word that has been learned in the learning data, the user threshold is set to be large because the learning ability of the user is low. Alternatively, the learning score calculation method may be changed. For example, the parameter setting unit 56 may instead decrease the parameter B or increase the parameter A in Equation (1). Further, the parameter setting unit 56 may decrease the user threshold, increase the parameter B, or decrease the parameter A when the frequency of operations for suppressing the display of the additional information is greater than a predetermined value. .
  • the parameter setting unit 56 does not need to change the parameter even if there is a non-display instruction.
  • the present invention is not limited to the combination of kanji and kana.
  • it can be applied to a combination of a Chinese character in Chinese and Pinyin indicating its reading, or can be applied to a combination of an English word and a character string indicating its pronunciation.
  • the present invention can be applied to a combination of a word constituting a document in a certain language and a word in another language indicating its meaning. This is because there is a relationship between a word that is the main body of a document and additional information for the word.

Abstract

 文書の構成要素に対する付加情報を、読者が文書を読む能力の変化に応じて表示する。 文書処理装置は、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語の出現頻度を示す情報に基づいて当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する。前記判定の際には、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する。

Description

文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
 本発明は文書処理装置、文書処理方法、プログラムおよび情報記憶媒体に関する。
 電子書籍やHTML文書などのデジタルコンテンツが盛んに利用されるようになっている。これらのデジタルコンテンツの文書を読むには、漢字を含む単語などの読み方や意味の知識といった、あるレベルの知識を読者に要求する場合がある。この要求されるレベルに達しない人でも読みやすいように、文章に漢字の読み方を示す文字(ルビ)などの付加情報をつけて表示することが行われている。
 特許文献1には、利用者のランクと、ふりがな対象文字列の難易度とに基づいて、ルビ付きテキストを生成する技術が開示されている。
特開平11-39298号公報
 文書を読む読者の実際のレベルは変化するものである一方、そのレベルに合っていない文書は読みにくい。例えば、最初は読めない漢字であっても、ルビを付けられた漢字を何度か読んでいれば、ルビがなくても読めるようになる。すると、読めるようになった漢字につけられたルビは読者にとっては不要なものになる。読めるようになりかつルビが付けられている漢字が多くなると、読者にとっては読みづらくなる。このような問題は、ルビだけでなく、単語の近くに他の種類の付加情報を表示する場合にも生じる。したがって、表示される文書には読者のレベルの変化に応じた付加情報が表示されることが望ましい。
 本発明は上記課題を鑑みてなされたものであって、その目的は、読者が文書を読む能力の変化に応じて、付加情報を表示することができる技術を提供することにある。
 上記課題を解決するために、本発明にかかる文書処理装置は、複数の単語を含む文書の情報を取得する文書取得手段と、前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、前記複数の単語と、表示すると判断された前記付加情報とを画面に表示させるよう制御する表示制御手段と、を含み、前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。
 また、本発明にかかる文書処理方法では、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、ことを特徴とする。
 また、本発明にかかるプログラムは、複数の単語を含む文書の情報を取得し、前記複数の単語のそれぞれに紐付けられた付加情報を取得し、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、処理をコンピュータに実行させることを特徴とする。
 また、本発明にかかるコンピュータ読取り可能な記憶媒体は、上記プログラムを格納する。
 本発明によれば、読者が文書を読む能力の変化に応じて、付加情報を表示することができる。
 本発明の一態様では、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。
 本発明の一態様では、前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定してもよい。
 本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含んでもよい。
 この態様によれば、ユーザの学習能力に応じて不要な付加情報を表示することを抑制することができる。
 本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記文書処理装置は、前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含んでもよい。
 この態様によれば、学習のしやすさに応じて不要な付加情報を表示することを抑制することができる。
 本発明の一態様では、前記文書処理装置は、閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含んでもよい。
 この態様によれば、ユーザの学習能力に応じて不要な付加情報を表示することを抑制することができる。
 本発明の一態様では、前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算してもよい。
 この態様によれば、学習のしやすさに応じて不要な付加情報を表示することを抑制することができる。
本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。 文書処理装置が実現する機能の一例を示すブロック図である。 文書の一例を示す図である。 付加情報を含む辞書データの一例を示す図である。 付加情報出力判定部等の処理フローの一例を示す図である。 学習データの一例を示す図である。 学習データの他の例を示す図である。 ルビ付きで表示される文書の一例を示す図である。 ルビを表示させる操作の一例を示す図である。 ルビの表示を抑制させる操作の一例を示す図である。
 以下では、本発明の実施形態について図面に基づいて説明する。同じ符号を付された構成については、重複する説明を省略する。
 図1は、本発明の実施形態にかかる文書処理装置のハードウェア構成の一例を示す図である。文書処理装置は、プロセッサ11、記憶部12、通信部13、表示部14、入力部15を含む。文書処理装置は、例えばタブレット端末や電子書籍端末である。また文書処理装置は、パーソナルコンピュータなどであってもよいし、これらの端末とネットワークを介して接続されるサーバコンピュータであってもよい。
 プロセッサ11は、記憶部12に格納されているプログラムに従って動作する。またプロセッサ11は通信部13、表示部14、入力部15を制御する。なお、上記プログラムは、インターネット等を介して提供されるものであってもよいし、フラッシュメモリ等のコンピュータで読み取り可能な記憶媒体に格納されて提供されるものであってもよい。
 記憶部12は、RAMやフラッシュメモリ等のメモリ素子やメモリカード等によって構成されている。記憶部12は、上記プログラムを格納する。また、記憶部12は、各部から入力される情報や演算結果を格納する。
 通信部13は、他の装置と通信する機能を実現するものであり、例えば無線LANの集積回路やアンテナなどにより構成されている。通信部13は、プロセッサ11の制御に基づいて、他の装置から受信した情報をプロセッサ11や記憶部12に入力し、他の装置に情報を送信する。
 表示部14は、液晶パネルなどの表示出力デバイスやそれを制御する回路であり、液晶表示パネルやグラフィックチップなどにより構成される。表示部14は、プロセッサ11の制御に基づいて、画像を表示出力デバイスに対して出力する。なお、文書処理装置は必ずしも表示出力デバイスを内蔵していなくてもよく、表示部14は外部にある表示出力デバイスに画像を表示させてもよい。
 入力部15は、タッチパネルなどの入力デバイスや、キーボードやマウスなどの入力デバイスからのデータを取得するコントローラなどにより構成される。入力部15は、プロセッサ11の制御に基づいて、タッチパネルや入力デバイスをユーザが操作することにより入力されるデータを取得する。
 図2は、文書処理装置が実現する機能を示すブロック図である。文書処理装置は、機能的に、文書情報取得部51と、付加情報取得部52と、付加情報出力判定部53と、表示制御部54と、閲覧者指示取得部55と、パラメータ設定部56と、を含む。これらの機能は、プロセッサ11が記憶部12に格納されたプログラムを実行し、表示部14や入力部15等を制御することで実現される。ここで、文書情報取得部51、付加情報取得部52、付加情報出力判定部53、表示制御部54、閲覧者指示取得部55、パラメータ設定部56は、それぞれ本願請求項の文書取得手段、付加情報取得手段、判定手段、表示制御手段、指示取得手段、設定手段に対応する。
 以下では、文書処理装置が実現する各機能について、処理フローやその他の図面を用いて説明する。
 文書情報取得部51は、プロセッサ11、記憶部12を中心として実現される。文書情報取得部51は、複数の単語を含む文書の情報(文書データ)を取得し、その文書の情報を付加情報出力判定部53などに引き渡す。文書情報取得部51は、予め記憶部12に記憶された文書データを取得してもよいし、通信部13を介してネットワーク経由で文書データを取得してもよい。
 図3は、文書データが示す文書の一例を示す図である。この例では文書データは日本語の文章のデータであり、文章は漢字とかな(表音文字)とが混じって表現される。文章を構成する要素である単語等は、漢字とかなとのうち少なくとも一方により作られている。本実施形態では、「単語」は複合語のようなものも含むとして表記する。図3では文書中に出現する単語の一部に符号を付けているが、これらはその単語のIDに相当する。このIDについては後述する。
 特に子どもなどは、単語に含まれる漢字を読めないことが多いが、その読み方がわかれば問題なく意味を理解することが多い。そのため、この文書処理装置では、単語の漢字表記の上にその発音を示す小さいかなの文字列(以下では「ルビ」という)を付けることで文書を読む際の手助けをする。以下では付加情報として、この単語につけるルビを用いる場合について主に説明する。
 付加情報取得部52は、プロセッサ11、記憶部12を中心として実現される。付加情報取得部52は、複数の単語のそれぞれに紐付けられた付加情報やそれに付随する情報を取得する。付加情報取得部52は、予め記憶部12に記憶された付加情報等を取得してもよいし、通信部13を介してネットワーク経由で付加情報等を取得してもよい。
 図4は、付加情報を含む辞書データの一例を示す図である。辞書データは、単語とその単語の付加情報とを紐づけるデータである。ここでは、付加情報はその単語の読みの情報である。また辞書データには単語の読みの難しさを示すレベルや、その単語のジャンルの情報も、その単語に紐付けられている。レベルは、例えば単語を構成する漢字を習う学年や、画数などに基づいて定められる。図4の例では、各単語にはIDが振られており、このIDは図3の符号に対応している。
 付加情報出力判定部53は、プロセッサ11、記憶部12を中心として実現される。付加情報出力判定部53は、複数の単語のそれぞれについて、その単語の出現頻度を示す情報に基づいてその単語に紐付けられた付加情報を表示するか否かを判定する。本実施形態では、単語が出現するごとに増え、また出現してから時間が経つにつれて減るスコアを単語の出現頻度を示す情報として用いることで、付加情報を表示するか否かを判定する。
 図5は、付加情報出力判定部53等の処理フローの一例を示す図である。図5に示す処理フローを用いて付加情報出力判定部53の処理や、それに付随する他の機能の処理について説明する。
 はじめに、付加情報出力判定部53は、文書データの読込位置を取得する(ステップS101)。この読込位置は、文書データが示す文書のうち表示されるページの先頭に相当する文書データ内の位置であり、文書データの先頭からの文字数などである。付加情報出力判定部53は、文書を閲覧する読者であるユーザが表示するページを指定する操作や、次のページへ進む操作や前のページに戻る操作や、前回読んだ位置などに基づいて文書データの読込位置を取得する。
 次に、付加情報出力判定部53は、読込位置にある単語を取得する(ステップS102)。この単語は、予め文書データに特定する情報が埋め込まれていてもよいし、付加情報出力判定部53が文書データのテキストから形態素解析を行うことにより取り出されてもよい。前者の場合には、例えば文書データに予め単語の位置や、その単語に紐付けられる付加情報そのもの、または付加情報の識別コードを示すHTMLタグのような情報を埋め込んでおくとよい。前者の場合には付加情報出力判定部53がその埋め込まれた情報を用いて単語を取得する。次に、付加情報出力判定部53は、辞書データからその単語に紐付けられた付加情報やその単語の難しさを示すレベルを取得し、また学習データから、付加情報をユーザが学習済で表示不要であるか否かを示す学習済フラグを取得する(ステップS103)。
 図6は学習データの一例を示す図である。学習データのレコードは単語ごとに設けられており、単語と、これまでに計算された学習スコア、カウント、および学習済フラグとが紐付けられている。ここで、カウントは直近にその単語が出現した位置や時間により計算されるものである。学習済フラグはこの単語の付加情報をユーザが学習済であるか否かを示すものであり、付加情報の表示を必要とするか否かを示すものでもある。
 付加情報出力判定部53は、付加情報等を取得した後に、付加情報の表示が必要か否かを判定する。より具体的には、単語の難しさを示すレベルがユーザの大まかな知識を示すユーザレベル以下である場合や(ステップS104のN)、学習済フラグが学習済であることを示す場合には(ステップS106のY)、付加情報は表示しないと判定して表示データにその単語のみを付加する(ステップS105)。ここで表示データは、後述する表示制御部54が画面に表示させる文字列を示すデータである。後述するが、表示制御部54は表示データに付加情報が含まれていればその付加情報を表示し、含まれていなければその付加情報を表示しないように制御する。なお、図5には示していないが、単語に紐付けられる付加情報がない場合にも付加情報出力判定部53は付加情報を表示しないと判定し、ステップS105で表示データにその単語を付加し、付加情報は付加しない。
 一方、単語の難しさを示すレベルがユーザレベルより高く(ステップS104のY)かつ表示不要フラグが表示可能を示す場合には(ステップS106のN)、付加情報出力判定部53はその付加情報を表示すると判定し、付加情報出力判定部53は、表示データに単語と付加情報とを追加する(ステップS107)。なお、付加情報の追加の方法としては、HTMLにおいて<RUBY>タグを用いてルビを表示させる情報を追加してもよいし、他の表示用言語を用いて単語と付加情報とを表現してもよい。
 次に、付加情報出力判定部53は、その単語についての学習状況を示す情報を更新する。はじめに、付加情報出力判定部53は、その単語についての学習スコアを計算し学習データの学習スコア欄を更新する(ステップS108)。
 学習スコアの計算方法についてさらに説明する。付加情報出力判定部53は、文書データに含まれる複数の単語のそれぞれについて、これまでの単語が出現した位置および時間の少なくとも一方に基づいて学習スコアを計算する。この単語が出現した位置や時間を考慮するために、学習データには、前回の単語の出現時に計算された学習スコアと、その単語が出現した位置や時間に基づくカウントとが単語と関連づけられて記憶されている。図6は、図3に示す文書のうち先頭からIDが「wb50」の単語が出現するまでの処理により格納される学習データの例である。カウントは、ページの中における位置や、閲覧開始からの時間が進むにつれて大きくなる値である。付加情報出力判定部53は記憶部12にシステムとしてのカウントを有し、この機能が最初に起動されてから、一定の周期が経過するごとにそのカウントの値を増やし、また処理対象となる文字が進むごとにそのカウントの値を増やす。また付加情報出力判定部53は、この処理時点でのシステムのカウントを学習データのカウント欄に記憶させる。このカウントは、前回この単語をみてからの時間経過に伴う忘却を考慮するために用いられる。次にスコアの計算式を示す。
Figure JPOXMLDOC01-appb-M000001
 数式(1)において、Sk+1はこの処理で計算されるスコアを示し、Ccは現在のシステムのカウントを示し、SとCはそれぞれ、単語が前回出現した際に計算されたスコアとカウントを示す。Aはユーザの忘れやすさを示す忘却パラメータであり、Bは単語の付加情報を表示することによる新たな学習量を示すパラメータである。Bは単語が一度出現するごとに増加する学習スコアの量に相当する。(Cc-Ck)×Aは前回の単語の出現時の学習スコアのうち、忘れることにより減少する量の割合を示す。Aは0より大きく1より小さい値である。この式により、学習スコアが単語のユーザにとっての出現頻度を示すものになる。
 ここで、付加情報が表示される単語の頻度やその単語の種類の数の多さに応じてスコアが増える量を決めてもよい。付加情報が表示される頻度が多かったり、付加情報が表示される単語の種類の数が多い場合は、ユーザの負担が大きく、記憶することが難しくなると考えられる。このような場合に学習が進まない扱いにするよう、スコアの計算に関わるパラメータであるAやBの値を調整させることで、よりユーザの学習の現実に沿った対応が可能となる。
 学習スコアが計算されると、付加情報出力判定部53はその学習スコアがユーザ閾値を超えたか否かを判定する(ステップS109)。学習スコアがユーザ閾値を超えた場合には(ステップS109のY)、ユーザはその単語について学習ができ、例えばルビ無しで単語が読めるようになったとして、学習データの学習済フラグを学習済に設定する(ステップS110)。
 ここで、パラメータ設定部56は、プロセッサ11および記憶部12を中心として実現される。パラメータ設定部56は、ユーザの学習能力に応じたパラメータを設定する。
 ステップS108で用いられるユーザ閾値はパラメータ設定部56が設定するパラメータの1つである。図示していないが、パラメータ設定部56は、ステップS109の処理を行う際またはその前に、ユーザ閾値を設定する。例えば、パラメータ設定部56はユーザのレベルLuと単語のレベルLwとの差が大きいほどユーザ閾値を大きく設定し、ユーザがよく読む文書のジャンル(得意ジャンル)と単語のジャンルとが重なる場合にはユーザ閾値を小さく設定する。これにより、単語の種類に応じたユーザの学習のしやすさを付加情報の表示の判定に反映させることが可能になる。
 そして、ステップS110またはステップS105で表示用データに単語等が追加されたら、付加情報出力判定部53は表示の単位であるページの終わりまで文書データを読込んだかを確認する(ステップS111)。読込位置がまだページの終わりで無い場合は(ステップS111のN)、次に読込対象となる単語が次の単語になるように読込位置を進め(ステップS112)、ステップS102から繰り返す。また、読込位置がページの終わりである場合は(ステップS111のY)、このページについての処理を終了する。なお、システムのカウント、ユーザのレベルの情報、学習データ等は処理が終わっても記憶部12に保持され、例えばこの文書の他のページや、他の文書について次に付加情報出力判定部53の処理をする際にも用いられる。
 次に学習データについて説明する。前述の図6は図3に示す文書の文書データにおいて、wb50のIDをもつ単語が出現するまでの処理が行われた際の学習データの内容である。本図は、文書の先頭から処理を開始する際にはシステムのカウントCcや各単語の学習スコアは0である場合の例である。また、ユーザのレベルは1であり、学習スコアの計算方法におけるパラメータBは10であり、パラメータAは200分の1とする。すると、図6に示す時点ではスコアに忘却の影響がでないため、学習スコアは単語の出現回数に比例する。
 図7は、学習データの他の例を示す図である。図7は、文書データでIDがwb90が4回出現した際の学習データの状態を示す図である。ここではIDがwn14である単語が1回目に出現してから2回目に出現するまでに間があいたため、単純に出現回数に比例する値より、学習スコアが小さくなっている。このように忘却を示すパラメータを用いることで、出現間隔が広いか否かを考慮して学習済か否か判断することが可能になる。
 一方、IDがwa10である単語とIDがwb90である単語とでは、学習スコアが低い単語の方が学習済となり、それより学習スコアが高い単語が学習済になっていない。これは、図4にあるようにIDがwa10である単語はレベルが2でありユーザレベルとの差が1のみであるのに対し、IDがwb90である単語はレベルが7でありその差が6であるため、ユーザ閾値が異なっているからである。このようにして、難しい単語ほど学習までに時間がかかるという学習の法則を考慮した対応をすることが可能となる。
 ここで、パラメータ設定部56は、ユーザ閾値を変化させる代わりに、数式(1)における計算方法のパラメータAやBを変化させてもよい。例えば、パラメータBを、ユーザのレベルLuと単語のレベルLwとの差や、ジャンルの相違に応じて計算される値にしてもよい。例えばLwとLuとの差が大きいほど値を小さくし、予めユーザが指定したユーザの得意ジャンルと単語のジャンルが重なれば値を大きくするといった計算をすることで、これらの要素を考慮することが可能になる。
 表示制御部54は、プロセッサ11、記憶部12,および表示部14を中心として実現される。表示制御部54は、文書データに含まれる複数の単語と、表示すると判断された付加情報とを画面に表示させるよう制御する。より具体的には、表示データに格納されている文書の単語と、付加情報との表示形式を整えて表示部14などを介して画面に出力するように制御する。
 図8は、ルビ付きで表示される文書の一例を示す図である。図8では、IDがwa10である単語については、3回目から付加情報であるルビの表示がされなくなっている。このように、付加情報出力判定部53と表示制御部54とがユーザの学習状況を予想して付加情報の表示を制御することができる。これにより、学習状況に応じた付加情報の表示の制御が可能になる。
 閲覧者指示取得部55は、プロセッサ11、記憶部12、表示部14および入力部15を中心として実現される。閲覧者指示取得部55は画面に表示された文書に対する閲覧者の行動に基づいて、文書中の単語に対する付加情報を必要としているか否かに関連する情報を取得する。より具体的には、閲覧者指示取得部55は画面に表示された文書に対する操作に基づいて、単語に対する付加情報の表示または非表示の操作を取得し、その単語について付加情報を表示し、または表示されている付加情報を削除する。図9は、ルビを表示させる操作の一例を示す図である。例えば、ユーザが単語を一定時間選択すると、閲覧者指示取得部55は付加情報を表示するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザがルビを表示する旨の操作をすると、その付加情報の表示の指示を取得する。そして、表示制御部54にその指示を渡し、表示制御部54はその単語に付加情報を表示させる処理を行う。
 一方、図10はルビの表示を抑制させる操作の一例を示す図である。例えば、ユーザが付加情報が表示されている単語を一定時間選択したりすると、閲覧者指示取得部55は付加情報の表示を抑制するか否かを確認するポップアップを画面に表示する。このポップアップに対してチェックボックスの選択などにより、ユーザが付加情報の表示を抑制させる旨の操作をすると、その指示を取得する。そして、表示制御部54にその指示を渡し、表示制御部54はその単語およびそのページの他の同じ単語について付加情報の表示を抑制し、その付加情報を画面から消すとともに、学習データでその単語を学習済にする処理を行う。
 なお、閲覧者指示取得部55は、ユーザの視線を用いてルビの表示要求を検知してもよい。例えば周知の視線検出技術によりユーザの視線を検出し、検出されたユーザの視線から見ている単語を予測し、その単語を見ている時間が予め定められた時間より長い場合には、ユーザが単語を読むのが難しいとしてその単語に対する表示要求を取得してもよい。
 また、閲覧者指示取得部55は、ユーザが音読している音声を用いて正しく読めなかった漢字を特定してもよい。この場合には、閲覧者指示取得部55は、ユーザが音読をしている音声をマイクで取得し、周知の音声認識技術によりその音声を認識し、認識された音声と予め記憶された文章のよみ(かな)とを照合する。これらの処理により、閲覧者指示取得部55は正しく読めなかった単語(付加情報を必要とする単語)を特定する。この正しく読めなかったと特定された単語は、以降の処理では上述の表示要求がされた単語と同様に扱われる。
 一方、パラメータ設定部56は、これらの付加情報を表示させる指示や非表示にする指示に基づいて、ユーザの学習能力を示すパラメータを変更する処理を行う。例えば、学習データにおいて学習済とされている単語について付加情報を表示する旨の操作がされた場合には、ユーザの学習能力が低いとして、ユーザ閾値を大きく設定する。なお、この代わりに、学習スコアの計算方法を変えてもよい。例えばパラメータ設定部56は、代わりに数式(1)におけるパラメータBを小さくしたりパラメータAを大きくしてもよい。また、パラメータ設定部56は付加情報の表示を抑制する操作の頻度が予め定められた値より多い場合には、ユーザ閾値を小さくするか、パラメータBを大きくしたりパラメータAを小さくしてもよい。なお、文書を読む時点で単語を既に知っているために付加情報を非表示にする操作をする場合には学習能力との関係が薄いと考えられるので、それまでに初めて付加情報を表示した単語である場合には、パラメータ設定部56は非表示の指示があってもパラメータを変更しなくてもよい。
 なお、本発明は漢字とかなとの組合せに限らず適用できる。例えば、中国語における漢字の単語と、その読みを示すピンインとの組合せに適用することも可能であるし、英単語とその発音を示す文字列との組合せに適用することも可能である。また、ある言語の文書を構成する単語と、その意味を示す他の言語の単語との組合せに適用することも可能である。どれも、文書の本体である単語と、それに対する付加情報との関係があるからである。
 11 プロセッサ、12 記憶部、13 通信部、14 表示部、15 入力部、51 文書情報取得部、52 付加情報取得部、53 付加情報出力判定部、54 表示制御部、55 閲覧者指示取得部、56 パラメータ設定部。

Claims (10)

  1.  複数の単語を含む文書の情報を取得する文書取得手段と、
     前記複数の単語のそれぞれに紐付けられた付加情報を取得する付加情報取得手段と、
     前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定する判定手段と、
     前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御する表示制御手段と、
     を含み、
     前記判定手段は、前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
     ことを特徴とする文書処理装置。
  2.  前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方に基づいて当該単語が表示された頻度を示すスコアを計算し、前記スコアに基づいて前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
     ことを特徴とする請求項1に記載の文書処理装置。
  3.  前記判定手段は、ユーザの学習能力に応じたパラメータに基づいて、前記複数の単語に紐付けられた付加情報を表示するか否かを判定する、
     ことを特徴とする請求項2に記載の文書処理装置。
  4.  閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の指示を取得する指示取得手段と、
     前記付加情報の表示または非表示の操作に基づいて、ユーザの学習能力に応じたパラメータを設定する設定手段と、をさらに含む、
     ことを特徴とする請求項3に記載の文書処理装置。
  5.  前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
     前記取得された難易度に基づいてユーザの学習能力に応じたパラメータを設定する設定手段をさらに含む、
     ことを特徴とする請求項3または4に記載の文書処理装置。
  6.  閲覧者の画面に対する操作に基づいて、表示された単語に対する付加情報の表示または非表示の操作を取得する手段と、
     前記付加情報の表示または非表示の操作に基づいて、前記スコアの計算方法を設定する設定手段と、をさらに含む、
     ことを特徴とする請求項2に記載の文書処理装置。
  7.  前記付加情報取得手段は前記単語に紐付けられた難易度を示す情報を取得し、
     前記判定手段は、前記複数の単語のそれぞれについて、当該単語が出現する以前に当該単語と同じ1または複数の単語が前記付加情報とともに表示された位置および時間の少なくとも一方と、当該単語の難易度とに基づいてスコアを計算する、
     ことを特徴とする請求項2または6に記載の文書処理装置。
  8.  複数の単語を含む文書の情報を取得し、
     前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
     前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
     前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
     前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
     ことを特徴とする文書処理方法。
  9.  複数の単語を含む文書の情報を取得し、
     前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
     前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
     前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
     前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
     処理をコンピュータに実行させるプログラム。
  10.  複数の単語を含む文書の情報を取得し、
     前記複数の単語のそれぞれに紐付けられた付加情報を取得し、
     前記複数の単語のそれぞれについて、当該単語に紐付けられた付加情報を表示するか否かを判定し、
     前記複数の単語と、表示すると判定された前記付加情報とを画面に表示させるよう制御し、
     前記付加情報を表示するか否かを判定する際に、前記複数の単語のそれぞれについて、前記単語に紐付けられた付加情報とともに当該単語が表示された頻度を示す情報に基づいて当該付加情報を表示するか否かを判定する、
     処理をコンピュータに実行させるプログラムを記憶したコンピュータ読取り可能な情報記憶媒体。
     
PCT/JP2013/057908 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体 WO2014147767A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2013/057908 WO2014147767A1 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
US14/778,081 US10275445B2 (en) 2013-03-19 2013-03-19 Document processing device, document processing method, program, and information storage medium
JP2015506462A JP5877272B2 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/057908 WO2014147767A1 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Publications (1)

Publication Number Publication Date
WO2014147767A1 true WO2014147767A1 (ja) 2014-09-25

Family

ID=51579499

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/057908 WO2014147767A1 (ja) 2013-03-19 2013-03-19 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体

Country Status (3)

Country Link
US (1) US10275445B2 (ja)
JP (1) JP5877272B2 (ja)
WO (1) WO2014147767A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016091020A (ja) * 2014-10-29 2016-05-23 キヤノンマーケティングジャパン株式会社 プログラム、処理方法、および情報処理装置
WO2016174945A1 (ja) * 2015-04-30 2016-11-03 シナノケンシ株式会社 学習用デジタルコンテンツ再生表示装置
JP2017054038A (ja) * 2015-09-10 2017-03-16 カシオ計算機株式会社 学習支援装置及びその学習支援装置用のプログラム
CN108885843A (zh) * 2016-02-18 2018-11-23 肖恩·劳伦斯 语言学习界面

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9990564B2 (en) * 2016-03-29 2018-06-05 Wipro Limited System and method for optical character recognition
JP7069766B2 (ja) * 2018-02-02 2022-05-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US11194956B2 (en) * 2018-04-30 2021-12-07 Patent Bots LLC Offline interactive natural language processing results
US11645561B2 (en) * 2019-03-18 2023-05-09 International Business Machines Corporation Question answering system influenced by user behavior and text metadata generation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139298A (ja) * 1997-07-18 1999-02-12 Nippon Telegr & Teleph Corp <Ntt> ふりがな制御装置
JP2001125892A (ja) * 1999-10-26 2001-05-11 Sharp Corp ルビ表示装置、ルビ表示方法およびルビ表示プログラムを記録した媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0784587A (ja) * 1993-09-13 1995-03-31 Pioneer Electron Corp 表示制御装置
US6128632A (en) * 1997-03-06 2000-10-03 Apple Computer, Inc. Methods for applying rubi annotation characters over base text characters
JP2002108853A (ja) 2000-09-29 2002-04-12 Wac.Com:Kk 文章情報編集方法及びコンピュータ読取り可能な記録媒体
US20060010378A1 (en) * 2004-07-09 2006-01-12 Nobuyoshi Mori Reader-specific display of text
US8103445B2 (en) * 2005-04-21 2012-01-24 Microsoft Corporation Dynamic map rendering as a function of a user parameter
US9275019B2 (en) * 2007-12-21 2016-03-01 Sap Se System and method for performing Unicode matching
US8490011B2 (en) * 2008-05-14 2013-07-16 At&T Intellectual Property I, L.P. Display of supplementary information on a graphical user interface
JP4623169B2 (ja) * 2008-08-28 2011-02-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4999938B2 (ja) * 2010-01-07 2012-08-15 シャープ株式会社 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
JP5193263B2 (ja) * 2010-10-21 2013-05-08 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
JP5144736B2 (ja) * 2010-11-10 2013-02-13 シャープ株式会社 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US8816966B2 (en) * 2011-05-23 2014-08-26 Microsoft Corporation Touchscreen japanese character selection through sliding input
US9087048B2 (en) * 2011-06-10 2015-07-21 Linkedin Corporation Method of and system for validating a fact checking system
US8943404B1 (en) * 2012-01-06 2015-01-27 Amazon Technologies, Inc. Selective display of pronunciation guides in electronic books
US9460089B1 (en) * 2012-11-07 2016-10-04 Amazon Technologies, Inc. Flow rendering of annotation characters

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139298A (ja) * 1997-07-18 1999-02-12 Nippon Telegr & Teleph Corp <Ntt> ふりがな制御装置
JP2001125892A (ja) * 1999-10-26 2001-05-11 Sharp Corp ルビ表示装置、ルビ表示方法およびルビ表示プログラムを記録した媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016091020A (ja) * 2014-10-29 2016-05-23 キヤノンマーケティングジャパン株式会社 プログラム、処理方法、および情報処理装置
WO2016174945A1 (ja) * 2015-04-30 2016-11-03 シナノケンシ株式会社 学習用デジタルコンテンツ再生表示装置
JP2016212167A (ja) * 2015-04-30 2016-12-15 シナノケンシ株式会社 学習用デジタルコンテンツ再生表示装置
JP2017054038A (ja) * 2015-09-10 2017-03-16 カシオ計算機株式会社 学習支援装置及びその学習支援装置用のプログラム
CN108885843A (zh) * 2016-02-18 2018-11-23 肖恩·劳伦斯 语言学习界面
JP2019513243A (ja) * 2016-02-18 2019-05-23 ローレンス,ショーン 言語学習インターフェース

Also Published As

Publication number Publication date
JP5877272B2 (ja) 2016-03-02
US10275445B2 (en) 2019-04-30
JPWO2014147767A1 (ja) 2017-02-16
US20160055146A1 (en) 2016-02-25

Similar Documents

Publication Publication Date Title
JP5877272B2 (ja) 文書処理装置、文書処理方法、プログラムおよび情報記憶媒体
JP6596511B2 (ja) デジタルグラフィックノベルの自動翻訳
KR101892723B1 (ko) 실시간 필기 인식 관리
US20150169212A1 (en) Character Recognition Using a Hybrid Text Display
US20190244542A1 (en) Systems and methods for accessible widget selection
KR20180077152A (ko) 핸드라이팅 입력을 가이드하는 시스템 및 방법
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
US8872845B2 (en) Information display apparatus and computer-readable storage medium
CN110287460B (zh) 电子书的展示方法、计算设备及计算机存储介质
KR20170132643A (ko) 문자 디스플레이 방법 및 그 장치
JP6485495B2 (ja) 文書表示装置、文書表示方法、文書表示システムおよびプログラム
JP2014194637A (ja) 情報処理装置、情報処理方法およびプログラム
JP6286897B2 (ja) 文書表示装置、文書表示方法及び文書表示プログラム
JP2017091383A (ja) 画像形成装置、画像形成方法及び画像形成プログラム
JP2019215936A (ja) 自動翻訳装置及び自動翻訳プログラム
CN110989894B (zh) 电子设备、电子设备的控制方法和记录有程序的记录介质
JP2013130916A (ja) 文書速読支援装置
JP7139647B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2016062442A (ja) 情報表示装置、情報表示プログラムおよび情報表示方法
US20090244002A1 (en) Method, Device and Program for Controlling Display, and Printing Device
JP2023116952A (ja) 文書評価装置、文書評価方法、及び、プログラム
JP2022124871A (ja) 情報処理装置及び情報処理プログラム
JP5855794B1 (ja) 動作入力システム、動作入力方法およびプログラム
JP6303355B2 (ja) 表示制御装置、表示制御プログラム及び表示制御方法
US20170212870A1 (en) Method and System to Display Content from a PDF Document on a Small Screen

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13878699

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015506462

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13878699

Country of ref document: EP

Kind code of ref document: A1