JP2012230540A - Document generation support method, document generation support device and document generation support program - Google Patents
Document generation support method, document generation support device and document generation support program Download PDFInfo
- Publication number
- JP2012230540A JP2012230540A JP2011098263A JP2011098263A JP2012230540A JP 2012230540 A JP2012230540 A JP 2012230540A JP 2011098263 A JP2011098263 A JP 2011098263A JP 2011098263 A JP2011098263 A JP 2011098263A JP 2012230540 A JP2012230540 A JP 2012230540A
- Authority
- JP
- Japan
- Prior art keywords
- word
- data
- browsing
- component
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、複数の構成要素から構成される文書データの生成を支援する文書生成支援方法、文書生成支援装置および文書生成支援プログラムに関する。 The present invention relates to a document generation support method, a document generation support apparatus, and a document generation support program that support generation of document data composed of a plurality of components.
昨今、利用者の利用する機器の種類および機会が増えていることに伴い、機器のメーカは、各機器が幅広いユーザに利用されることを想定する必要が生じている。それに伴い、機器の取扱説明書などは、ユーザの誰もが容易に理解できるように、記載されることが好ましい。 With the recent increase in the types and opportunities of devices used by users, device manufacturers have to assume that each device is used by a wide range of users. Accordingly, it is preferable that the instruction manual of the device is described so that any user can easily understand it.
誰もが理解容易な取扱説明書を作成するために、取扱説明書において機器の利用方法などを説明する際、機器に用いられる専門用語を回避し、平易な単語で説明されることが好ましい。しかし、どのような単語が専門用語であって一般的でないのか、また、どのような状況において使うべきではないのか、について作成者が判断することは、一般的に困難である。 In order to create an instruction manual that is easy for everyone to understand, it is preferable to avoid technical terms used in the equipment and explain in plain words when explaining how to use the equipment in the instruction manual. However, it is generally difficult for the creator to determine what words are technical terms and are not common, and in what circumstances they should not be used.
どのような単語が専門用語であって一般的でないのかを判断する際、単語の容易度が用いられる。単語の容易度は、例えば、非特許文献1に記載された単語親密度が相当する。単語親密度は、機器に利用される専門用語に対して、単語に馴染みがあるかどうかについて、アンケート調査を実施し、その結果得られたデータに基づいて、点数化されたものである。単語親密度が高い単語は、馴染みやすく容易度が高い一方、単語親密度が低い単語は、馴染みにくく容易度が低いと考えられる。また、取扱説明書の単語の親密度を用いて、人間に理解しやすい解析結果を出力する方法もある(特許文献1参照。)。 The word ease is used in determining what words are technical terms and not common. For example, the word familiarity described in Non-Patent Document 1 corresponds to the word ease. The word familiarity is scored on the basis of data obtained as a result of a questionnaire survey on whether or not the word is familiar with the technical term used for the device. A word having a high word familiarity is easy to be familiar and has a high degree of ease, while a word having a low word familiarity is difficult to become familiar and has a low degree of ease. There is also a method of outputting an analysis result that is easy for humans to understand by using the familiarity of words in the instruction manual (see Patent Document 1).
しかしながら、同じ専門用語でも、取扱説明書の使われる場所によって、取扱説明書の理解容易性の評価が異なる場合がある。例えば、読み手の目につきにくい場所よりも、読み手の目につきやすい場所の単語の方が、理解容易性の評価に大きな影響を与える。 However, even in the same technical terms, the evaluation of the understandability of the instruction manual may differ depending on the location where the instruction manual is used. For example, a word in a place where the reader is easily noticed has a greater influence on the evaluation of comprehension than a place where the reader is difficult to see.
従って、取扱説明書において、専門用語が使用される位置や、紙面構成なども考慮して、取扱説明書の理解容易性が評価されるべきである。しかしながら、上記の特許文献および非特許文献に記載の方法では、専門用語の位置や紙面構成なども考慮した理解容易性の評価は困難である。 Therefore, in the instruction manual, the ease of understanding of the instruction manual should be evaluated in consideration of the position where technical terms are used and the configuration of the paper surface. However, with the methods described in the above-mentioned patent documents and non-patent documents, it is difficult to evaluate the ease of understanding in consideration of the position of technical terms and the configuration of paper.
また、取扱説明書の作成者にとっては、専門用語に慣れ親しんでいるため、客観的な評価が難しい問題がある。そこで、ユーザビリティの専門家が取扱説明書の分析および評価し、または、想定する読み手がマニュアル評価実験をする場合もある。しかしながら、このような方法は、時間面および費用面で、多大なコストがかかってしまう問題がある。 In addition, there is a problem that it is difficult for the creator of the instruction manual to objectively evaluate because it is familiar with technical terms. Therefore, usability experts may analyze and evaluate the instruction manual, or an assumed reader may conduct a manual evaluation experiment. However, there is a problem that such a method is very expensive in terms of time and cost.
そこで、作成者が想定する読み手の閲覧の流れや紙面構成を考慮して、コンピュータが、取扱説明書などの文書データの理解容易性を評価し、文書データの生成を支援する技術の開発が期待されている。 Therefore, it is expected that the computer will evaluate the ease of understanding of the document data such as the instruction manual and develop the technology that supports the generation of the document data in consideration of the reader's browsing flow and the page structure assumed by the creator. Has been.
従って本発明の目的は、理解容易性の高い文書データの生成を支援する文書生成支援方法、文書生成支援装置および文書生成支援プログラムを提供することである。 Accordingly, an object of the present invention is to provide a document generation support method, a document generation support apparatus, and a document generation support program that support generation of document data with high comprehension.
上記課題を解決するために、本発明の第1の特徴は、複数の構成要素から構成される文書データの生成を支援する文書生成支援方法に関する。すなわち本発明の第1の特徴に係る文書生成支援方法は、文書データの評価の対象となる対象単語と、当該対象単語の容易度と、を対応づけた対象単語容易度データを記憶するステップと、文書データにおいて、読み手の閲覧の流れを示す閲覧順序データを取得するとともに、構成要素ごとに、閲覧の流れにおいて読み手の目にとまりやすい座標である想定閲覧座標を算出して、想定閲覧座標データを出力するステップと、構成要素における対象単語と一致する単語および当該単語の容易度を抽出するとともに、当該構成要素における想定閲覧座標と、抽出された単語の距離を算出し、単語、当該単語の容易度および距離を関連づけた単語情報データを出力するステップと、単語情報データの各単語について、容易度が低く距離が近い単語について修正優先度が高くなるように、当該単語の修正優先度を算出して、重み付き単語情報データを出力するステップを備える。 In order to solve the above-mentioned problem, a first feature of the present invention relates to a document generation support method for supporting generation of document data composed of a plurality of components. In other words, the document generation support method according to the first feature of the present invention stores the target word ease data in which the target word to be evaluated for document data is associated with the ease of the target word. In the document data, the browsing order data indicating the reading flow of the reader is acquired, and for each component, the assumed reading coordinates that are easily caught by the reader in the reading flow are calculated, and the assumed reading coordinate data , A word that matches the target word in the component and the ease of the word are extracted, the assumed browsing coordinates in the component and the distance between the extracted words are calculated, and the word, A step of outputting word information data in which the degree of ease and the distance are associated, and for each word of the word information data, a word having a low degree of ease and a short distance So that the modified priority have increased, comprising the step of calculating the modified priority of the word, and outputs the weighted word information data.
ここで重み付き単語情報データを出力するステップは、単語の表示属性も考慮して、修正優先度を算出しても良い。 Here, in the step of outputting the weighted word information data, the correction priority may be calculated in consideration of the display attribute of the word.
また、単語の修正優先度に基づいて、構成要素ごとの修正優先度を算出し、重み付き構成要素情報データを出力するステップをさらに備えても良い。 Further, the method may further include a step of calculating a correction priority for each component based on the word correction priority and outputting weighted component information data.
本発明の第2の特徴は、複数の構成要素から構成される文書データの生成を支援する文書生成支援装置に関する。すなわち本発明の第2の特徴に係る文書生成支援装置は、文書データの評価の対象となる対象単語と、当該対象単語の容易度と、を対応づけた対象単語容易度データを記憶する対象単語容易度データ記憶部と、文書データにおいて、読み手の閲覧の流れを示す閲覧順序データを取得するとともに、構成要素ごとに、閲覧の流れにおいて読み手の目にとまりやすい座標である想定閲覧座標を算出して、想定閲覧座標データを出力する閲覧順序取得手段と、構成要素における対象単語と一致する単語および当該単語の容易度を抽出するとともに、当該構成要素における想定閲覧座標と、抽出された単語の距離を算出し、単語、当該単語の容易度および距離を関連づけた単語情報データを出力する対象単語抽出手段と、単語情報データの各単語について、容易度が低く距離が近い単語について修正優先度が高くなるように、当該単語の修正優先度を算出して、重み付き単語情報データを出力する単語評価手段を備える。 A second feature of the present invention relates to a document generation support apparatus that supports generation of document data composed of a plurality of components. That is, the document generation support apparatus according to the second feature of the present invention stores a target word that stores target word ease data in which a target word to be evaluated for document data is associated with the ease of the target word. In the ease data storage unit and document data, browsing order data indicating the reader's browsing flow is acquired, and for each component, assumed browsing coordinates that are easily caught by the reader's eyes in the browsing flow are calculated. The browsing order acquisition means for outputting the assumed browsing coordinate data, the word that matches the target word in the component and the ease of the word are extracted, and the assumed browsing coordinate in the component and the distance between the extracted words Target word extracting means for calculating word and outputting word information data in which the word, the ease and distance of the word are associated, and each word of the word information data. Te, so that the distance Simplicity is low modification priority for the word is higher closer comprises calculates the modification priority of the word, the word evaluation means for outputting the weighted word information data.
ここで単語評価手段は、単語の表示属性も考慮して、修正優先度を算出しても良い。 Here, the word evaluation means may calculate the correction priority in consideration of the display attribute of the word.
また、単語の修正優先度に基づいて、構成要素ごとの修正優先度を算出し、重み付き構成要素情報データを出力する構成要素評価手段をさらに備えても良い。 Further, it may further comprise a component evaluation means for calculating a correction priority for each component based on the word correction priority and outputting weighted component information data.
本発明の第3の特徴は、コンピュータに本発明の第1の特徴に記載のステップを実行させるための文書生成支援プログラムに関する。 A third feature of the present invention relates to a document generation support program for causing a computer to execute the steps described in the first feature of the present invention.
本発明によれば、理解容易性の高い文書データの生成を支援する文書生成支援方法、文書生成支援装置および文書生成支援プログラムを提供することができる。 According to the present invention, it is possible to provide a document generation support method, a document generation support apparatus, and a document generation support program that support generation of document data with high comprehension.
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。 Next, embodiments of the present invention will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.
(実施の形態)
本発明の実施の形態に係る文書生成支援装置1は、作成者が想定する読み手の閲覧の流れや紙面構成を考慮して、作成者が作成した文書データ11aを評価し、理解容易性の高い文書データの生成を支援する。文書生成支援装置1は、例えば、読み手の閲覧の流れに近くにある難しい単語や、サイズや色が目立つ単語や、そのような単語が多く含まれる構成要素を優先的に修正するよう、作成者に提案することができる。作成者はこの提案に従って、この修正対象を重点的に修正することができる。このように本発明の実施の形態に係る文書生成支援装置1は、読み手が容易に理解しやすい文書データ11aの生成を支援することができる。
(Embodiment)
The document generation support apparatus 1 according to the embodiment of the present invention evaluates the document data 11a created by the creator in consideration of the reader's browsing flow and the page layout assumed by the creator, and is highly understandable. Supports generation of document data. For example, the document generation support device 1 is configured so that a difficult word close to the reader's browsing flow, a word that is conspicuous in size or color, or a component that includes many such words is preferentially corrected. Can be proposed. The creator can intensively correct the correction target according to the proposal. As described above, the document generation support apparatus 1 according to the embodiment of the present invention can support the generation of the document data 11a that can be easily understood by the reader.
ここで、文書データ11aは、例えば、専門家が一般ユーザに向けて頒布する文書のデータである。具体的には文書データ11aは、機器の取扱説明書や、保守用マニュアルなどである。 Here, the document data 11a is, for example, data of a document distributed by an expert to a general user. Specifically, the document data 11a is an instruction manual for equipment, a maintenance manual, or the like.
図1に示すように、本発明の実施の形態に係る文書生成支援装置1は、記憶装置10、中央処理制御装置30、入力装置40および出力装置50を備える一般的なコンピュータである。 As shown in FIG. 1, the document generation support apparatus 1 according to the embodiment of the present invention is a general computer including a storage device 10, a central processing control device 30, an input device 40, and an output device 50.
図1に示す例においては、便宜上第1の記憶装置10aおよび第2の記憶装置10bと二つの記憶装置を備えるが、一つの記憶装置のみを備えても良いし、複数の記憶装置を備えても良い。また、記憶装置10aおよび10bは、文書生成支援装置1に内蔵されていなくても良い。記憶装置10aおよび10bは、文書生成支援装置1が読み出し可能な記憶装置であれば良い。 In the example shown in FIG. 1, the first storage device 10a and the second storage device 10b and two storage devices are provided for convenience, but only one storage device or a plurality of storage devices may be provided. Also good. Further, the storage devices 10 a and 10 b may not be built in the document generation support device 1. The storage devices 10 a and 10 b may be storage devices that can be read by the document generation support device 1.
図1に示す第1の記憶装置10aには、処理に先立って、予め記憶されるデータが記憶される。一方第2の記憶装置10bには、処理によって出力されるデータが記憶される。なお実施の形態において、第1の記憶装置10aおよび第2の記憶装置10bを特に区別しない場合、単に記憶装置10と記載する場合がある。 The first storage device 10a shown in FIG. 1 stores data stored in advance prior to processing. On the other hand, data output by the processing is stored in the second storage device 10b. In the embodiment, when the first storage device 10a and the second storage device 10b are not particularly distinguished, they may be simply referred to as the storage device 10.
入力装置40は、マウス、キーボードなどである。作成者は、入力装置40を介して、中央処理制御装置30に指示を与えることができる。出力装置50は、液晶ディスプレイなどである。出力装置50は、中央処理制御装置30の指示に従って画面にデータを表示し、作成者に閲覧させることができる。文書生成支援装置1は、このような一般的なコンピュータに、所定の処理を実行するためのプログラムがインストールされ実行されることによって実現される。 The input device 40 is a mouse, a keyboard, or the like. The creator can give an instruction to the central processing control device 30 via the input device 40. The output device 50 is a liquid crystal display or the like. The output device 50 can display data on a screen in accordance with an instruction from the central processing control device 30 and allow a creator to view the data. The document generation support apparatus 1 is realized by installing and executing a program for executing predetermined processing in such a general computer.
記憶装置10は、文書データ記憶部11、対象単語容易度データ記憶部12、閲覧順序データ記憶部13、想定閲覧座標データ記憶部14、単語情報データ記憶部15、構成要素情報データ記憶部16、重み付き単語情報データ記憶部17、重み付き構成要素情報データ記憶部18および評価結果データ記憶部19を備える。ここで記憶装置10は、例えばハードディスク、RAMなどであって、不揮発性または揮発性の記憶装置である。 The storage device 10 includes a document data storage unit 11, a target word ease data storage unit 12, a browsing order data storage unit 13, an assumed browsing coordinate data storage unit 14, a word information data storage unit 15, a component information data storage unit 16, A weighted word information data storage unit 17, a weighted component information data storage unit 18, and an evaluation result data storage unit 19 are provided. Here, the storage device 10 is, for example, a hard disk or RAM, and is a nonvolatile or volatile storage device.
文書データ記憶部11は、記憶装置10のうち、文書データ11aが記憶された記憶領域である。文書データ11aは、複数の構成要素から構成される。ここで構成要素は、本発明の実施の形態における処理の単位である。構成要素は、改行で区切られる段落であっても良いし、「。」で区切られる文章であっても良い。また、文書データ11aがHTMLなどの構造化文書の場合、構成要素は、divなどのタグで区切られる範囲であっても良い。divのタグは、レイアウト、文字サイズ、色などに関するタグである。構成要素が文章の単位の場合、例えば正規表現を用いた文字列処理によって、文書データ11aは文章に分割される。 The document data storage unit 11 is a storage area in the storage device 10 in which the document data 11a is stored. The document data 11a is composed of a plurality of components. Here, the component is a unit of processing in the embodiment of the present invention. The component may be a paragraph delimited by a line feed or a sentence delimited by “.”. Further, when the document data 11a is a structured document such as HTML, the component may be in a range delimited by a tag such as div. The div tag is a tag related to layout, character size, color, and the like. When the constituent element is a sentence unit, the document data 11a is divided into sentences by, for example, character string processing using a regular expression.
文書データ11aは、文書生成支援装置1が、文書データ11aに含まれる文字を読み取り可能なデータである。文書データ11aは例えば、PDFやHTMLなどの電子データであって、文字のサイズ、色などの単語情報も設定可能なデータである。また文書データ11aは、紙面をスキャナなどで読み取ったデータを、OCR(Optical Character Reader)を使って文字を電子化したデータであっても良い。 The document data 11a is data that allows the document generation support apparatus 1 to read characters included in the document data 11a. The document data 11a is electronic data such as PDF and HTML, for example, and is data in which word information such as character size and color can be set. The document data 11a may be data obtained by digitizing characters using an OCR (Optical Character Reader) from data obtained by reading a paper surface with a scanner or the like.
本発明の実施の形態において文書データ11aは、HTML形式で表現されたデータで、構成要素は、”div”のタグで区切られる単位に基づいて定義される場合について説明する。 In the embodiment of the present invention, the document data 11a is data expressed in the HTML format, and a description will be given of a case where the constituent elements are defined based on a unit delimited by a “div” tag.
図2を参照して、本発明の実施の形態に係る文書データ11aの一例を説明する。図2に示す文書データ11aは、図3に示すHTML形式のソースデータをプレビュー表示したものである。文書データ11aは、左から右に文字が流れる横書き形式で、二段組み形式である。文書データ11aは、タイトルとして「取扱説明書」が付され、「概要」、「手順1」、「手順2」、「手順3」、「注意事項」の項目を備える。「注意事項」の項目は、右上に小さく設けられ、注釈として参照される。 An example of the document data 11a according to the embodiment of the present invention will be described with reference to FIG. The document data 11a shown in FIG. 2 is a preview display of the HTML format source data shown in FIG. The document data 11a is a horizontal writing format in which characters flow from left to right, and is a two-column format. The document data 11 a has “instruction manual” as a title, and includes items of “overview”, “procedure 1”, “procedure 2”, “procedure 3”, and “notes”. The “Notes” item is provided small in the upper right and is referred to as an annotation.
図3および図4に示すように、本発明の実施の形態において、文書データ11aは、5つの構成要素E1ないしE5を備える。図4は、図2に示すプレビュー表示と、文書データ11aの構成要素E1ないしE5を対応づけて示す。 As shown in FIGS. 3 and 4, in the embodiment of the present invention, the document data 11a includes five components E1 to E5. FIG. 4 shows the preview display shown in FIG. 2 in association with the components E1 to E5 of the document data 11a.
第1の構成要素E1は、図3に示すHTMLソースにおいて、<div class=“introduction”>から直後の</div>で囲まれる文字列である。第1の構成要素E1は、図4に示すように、「概要」のサブタイトルの文字列と、それに続く文字列を含む。第2の構成要素E2は、図3に示すHTMLソースにおいて、<div class=“step1”>から直後の</div>で囲まれる文字列である。第2の構成要素E2は、図4に示すように、「手順1」のサブタイトルの文字列と、それに続く文字列を含む。第3の構成要素E3は、図3に示すHTMLソースにおいて、<div class=“step2”>から直後の</div>で囲まれる文字列である。第3の構成要素E3は、図4に示すように、「手順2」のサブタイトルの文字列と、それに続く文字列を含む。第4の構成要素E4は、図3に示すHTMLソースにおいて、<div class=“step3”>から直後の</div>で囲まれる文字列である。第4の構成要素E4は、図4に示すように、「手順3」のサブタイトルの文字列と、それに続く文字列を含む。第5の構成要素E5は、図3に示すHTMLソースにおいて、<div class=“note”>から直後の</div>で囲まれる文字列である。第5の構成要素E5は、図4に示すように、「注意事項」のサブタイトルの文字列と、それに続く文字列を含む。 The first component E1 is a character string enclosed in </ div> immediately after <div class = “introduction”> in the HTML source shown in FIG. As shown in FIG. 4, the first component E <b> 1 includes a subtitle character string “Summary” and a character string following the character string. The second component E2 is a character string enclosed in </ div> immediately after <div class = “step1”> in the HTML source shown in FIG. As shown in FIG. 4, the second component E <b> 2 includes a subtitle character string “procedure 1” and a character string following the character string. The third component E3 is a character string surrounded by </ div> immediately after <div class = "step2"> in the HTML source shown in FIG. As shown in FIG. 4, the third component E3 includes a character string of the subtitle “Procedure 2” and a subsequent character string. The fourth component E4 is a character string surrounded by </ div> immediately after <div class = “step3”> in the HTML source shown in FIG. As shown in FIG. 4, the fourth component E4 includes a character string of the subtitle “Procedure 3” and a character string subsequent thereto. The fifth component E5 is a character string enclosed in </ div> immediately after <div class = “note”> in the HTML source shown in FIG. 3. As shown in FIG. 4, the fifth component E5 includes a subtitle character string “notes” and a subsequent character string.
ここで本発明の実施の形態において、構成要素は、<div>タグに基づいて決定される場合を説明するが、どのような条件で決定されても良い。また、図2ないし図4に示す文書データ11aは、文字のみによって構成されるが、図が含まれていても良い。 Here, in the embodiment of the present invention, the case where the component is determined based on the <div> tag will be described, but it may be determined under any condition. Further, the document data 11a shown in FIGS. 2 to 4 is composed only of characters, but may include figures.
対象単語容易度データ記憶部12は、記憶装置10のうち、対象単語容易度データ12aが記憶された記憶領域である。対象単語容易度データ12aは、図5に示すように、文書データの評価の対象となる対象単語と、当該対象単語の容易度と、を対応づけたデータである。ここで、対象単語の容易度とは、読み手にとっての対象単語の難しさを数値化したものである。対象単語の容易度は、例えば、読み手に馴染みのある単語ほど容易度は高く、馴染みのない単語ほど容易度は低く設定される。図5に示す例では、容易度は、0から1の値を採る。容易度が「1」に近い単語ほど、理解が簡単で、容易度が「0」に近い単語ほど、理解が困難である。 The target word ease data storage unit 12 is a storage area in the storage device 10 in which the target word ease data 12a is stored. As shown in FIG. 5, the target word ease data 12a is data in which a target word to be evaluated for document data is associated with the ease of the target word. Here, the ease of the target word is a numerical value of the difficulty of the target word for the reader. The ease of the target word is set such that, for example, a word familiar to the reader has a high degree of ease, and a word unfamiliar with the degree of ease is set low. In the example illustrated in FIG. 5, the ease is a value from 0 to 1. Words with a degree of ease closer to “1” are easier to understand, and words with a degree of ease closer to “0” are more difficult to understand.
対象単語容易度データ12aの容易度は、例えば、単語親密度が考えられる(特許文献1および非特許文献。)。単語親密度は、機器などに利用される専門用語について、単語に馴染みがあるか否かについて、予めアンケート調査を実施して得たデータを解析して算出される。 As the ease of the target word ease data 12a, for example, word familiarity can be considered (Patent Literature 1 and Non-Patent Literature). The word familiarity is calculated by analyzing data obtained by conducting a questionnaire survey in advance as to whether or not a word is familiar with a technical term used in a device or the like.
閲覧順序データ記憶部13は、記憶装置10のうち閲覧順序データ13aおよび閲覧順序データ13bが記憶された記憶領域である。想定閲覧座標データ記憶部14は、記憶装置10のうち想定閲覧座標データ14aが記憶された記憶領域である。単語情報データ記憶部15は、記憶装置10のうち単語情報データ15aが記憶された記憶領域である。構成要素情報データ記憶部16は、記憶装置10のうち構成要素情報データ16aが記憶された記憶領域である。重み付き単語情報データ記憶部17は、記憶装置10のうち重み付き単語情報データ17aが記憶された記憶領域である。重み付き構成要素情報データ記憶部18は、記憶装置10のうち重み付き構成要素情報データ18aが記憶された記憶領域である。評価結果データ記憶部19は、記憶装置10のうち評価結果データ19aが記憶された記憶領域である。 The browsing order data storage unit 13 is a storage area in which the browsing order data 13 a and the browsing order data 13 b are stored in the storage device 10. The assumed browsing coordinate data storage unit 14 is a storage area in which the assumed browsing coordinate data 14 a of the storage device 10 is stored. The word information data storage unit 15 is a storage area in which the word information data 15 a of the storage device 10 is stored. The component element information data storage unit 16 is a storage area in which the component element information data 16a of the storage device 10 is stored. The weighted word information data storage unit 17 is a storage area in which the weighted word information data 17a of the storage device 10 is stored. The weighted component information data storage unit 18 is a storage area in which the weighted component information data 18a of the storage device 10 is stored. The evaluation result data storage unit 19 is a storage area in which the evaluation result data 19a of the storage device 10 is stored.
ここで、閲覧順序データ13a、閲覧順序データ13b、想定閲覧座標データ14a、単語情報データ15a、構成要素情報データ16a、重み付き単語情報データ17a、重み付き構成要素情報データ18aおよび評価結果データ19aは、後述する中央処理制御装置30の各手段によって出力されるデータであるので、後述する。 Here, the browsing order data 13a, the browsing order data 13b, the assumed browsing coordinate data 14a, the word information data 15a, the component element information data 16a, the weighted word information data 17a, the weighted component information data 18a, and the evaluation result data 19a are: Since it is data output by each means of the central processing control device 30 described later, it will be described later.
中央処理制御装置30は、閲覧順序取得手段31、対象単語抽出手段32、単語評価手段33、構成要素評価手段34および出力手段35を備える。 The central processing control device 30 includes a browsing order acquisition unit 31, a target word extraction unit 32, a word evaluation unit 33, a component evaluation unit 34, and an output unit 35.
閲覧順序取得手段31は、文書データ11aにおいて、読み手の閲覧の流れFを示す閲覧順序データ13aを取得する。さらに閲覧順序取得手段31は、構成要素ごとに、閲覧の流れFにおいて読み手の目にとまりやすい座標である想定閲覧座標を算出して、想定閲覧座標データ14aを出力する。 The browsing order acquisition unit 31 acquires browsing order data 13a indicating a reader's browsing flow F in the document data 11a. Furthermore, the browsing order acquisition means 31 calculates the assumed browsing coordinates which are coordinates that are easily caught by the reader in the browsing flow F for each component, and outputs the assumed browsing coordinate data 14a.
閲覧順序データ13aは、文書データ11aにおける読み手の閲覧の流れFを、構成要素の単位で示すデータである。閲覧順序データ13aは、文書データ11aにおいて作成者が読み手に読ませたい範囲でもある。閲覧順序データ13aは、例えば図6(a)に示すように、構成要素の識別子を列挙して、閲覧の流れFを示したデータである。図6(a)に示すデータでは、第1の構成要素E1から、第2の構成要素E2、第3の構成要素E3、第4の構成要素E4の順で、閲覧の流れFが示されている。図6(a)において、閲覧順序データ13aに、第5の構成要素E5の情報が含まれていない。これは、第5の構成要素E5が、作成者の閲覧の流れF上に存在しないことを示している。 The browsing order data 13a is data indicating a reader's browsing flow F in the document data 11a in units of components. The browsing order data 13a is also a range that the creator wants the reader to read in the document data 11a. The browsing order data 13a is data indicating the browsing flow F by listing the identifiers of the constituent elements as shown in FIG. 6A, for example. In the data shown in FIG. 6A, the browsing flow F is shown in the order of the first component E1, the second component E2, the third component E3, and the fourth component E4. Yes. In FIG. 6A, the browsing order data 13a does not include information on the fifth component E5. This indicates that the fifth component E5 does not exist on the viewing flow F of the creator.
閲覧の流れFを入力装置40で作成者に入力させた場合、閲覧順序データ記憶部13はさらに、閲覧順序データ13bとして、図6(b)に示すように、閲覧の流れFの座標データを記憶しても良い。閲覧順序データ13bは、作成者が示した閲覧の流れFの軌跡のx座標とy座標とを対応づけたデータである。 In the case where the creator inputs the browsing flow F with the input device 40, the browsing order data storage unit 13 further displays the coordinate data of the browsing flow F as the browsing order data 13b as shown in FIG. You may remember. The browsing order data 13b is data in which the x coordinate and the y coordinate of the trajectory of the browsing flow F indicated by the creator are associated with each other.
想定閲覧座標データ14aは、構成要素ごとの想定閲覧座標のデータである。想定閲覧座標データ14aは、例えば図7に示すように、構成要素と想定閲覧座標とを対応づけたデータである。図7において、第5の構成要素E5に想定閲覧座標が対応づけられていない。これは、第5の構成要素E5が、作成者の閲覧の流れF上に存在しないことを示している。 The assumed browsing coordinate data 14a is assumed browsing coordinate data for each component. Assumed browsing coordinate data 14a is data in which components and assumed browsing coordinates are associated with each other, for example, as shown in FIG. In FIG. 7, the assumed browsing coordinates are not associated with the fifth component E5. This indicates that the fifth component E5 does not exist on the viewing flow F of the creator.
ここで、想定閲覧座標は、閲覧の流れFを考慮した、読み手の目にとまりやすい座標であって、構成要素ごとに算出される。本発明の実施の形態において想定閲覧座標は、閲覧の流れF上の座標であって、各構成要素に最初に重なる座標であるとする。想定閲覧座標は、読み手の目にとまりやすい座標であれば、どのようなものでも構わない。例えば、文書データ11aが縦書きか横書きかによっても、想定閲覧座標の算出方法が異なっても良い。 Here, the assumed browsing coordinates are coordinates that are easily caught by the reader in consideration of the browsing flow F, and are calculated for each component. In the embodiment of the present invention, it is assumed that the assumed browsing coordinates are coordinates on the browsing flow F and first overlap each component. Assumed viewing coordinates may be any coordinates as long as they are easily caught by the reader. For example, the method of calculating the assumed browsing coordinates may differ depending on whether the document data 11a is written vertically or horizontally.
閲覧順序取得手段31は、図8に示すように、作成者に、図2に示す文書データ11aのプレビュー表示において、作成者が想定する読み手の閲覧の流れを、マウスやペンタブレットなどの入力装置40を使って、作成者に閲覧の流れFを入力させる。図6示す例では、閲覧の流れFは、画面の左列の上から下、さらに右列の上から下の流れで入力される。なお、画面右上に表示された注意事項については、閲覧の流れFから外れる。 As shown in FIG. 8, the browsing order acquisition unit 31 provides the creator with an input device such as a mouse or a pen tablet for the flow of reading that the creator assumes in the preview display of the document data 11 a shown in FIG. 2. 40, the creator inputs the browsing flow F. In the example shown in FIG. 6, the browsing flow F is input in the flow from the top to the bottom of the left column of the screen and further from the top to the bottom of the right column. Note that the precautions displayed in the upper right of the screen are out of the browsing flow F.
閲覧順序取得手段31は、文書データ11aがプレビュー表示に閲覧の流れFを重畳して表示する。閲覧順序取得手段31は、文書データ11aのプレビュー表示における閲覧の流れFの軌跡のx座標およびy座標を算出し、図6(b)に示す閲覧順序データ13bとして、閲覧順序データ記憶部13に記憶する。 The browsing order acquisition unit 31 displays the document data 11a with the browsing flow F superimposed on the preview display. The browsing order acquisition means 31 calculates the x coordinate and y coordinate of the trajectory of the browsing flow F in the preview display of the document data 11a, and stores it in the browsing order data storage unit 13 as the browsing order data 13b shown in FIG. Remember.
さらに、閲覧順序取得手段31は、入力された閲覧の流れFの座標と、文書データ11aのプレビューにおける構成要素の表示領域の座標とを比べて、構成要素単位での閲覧の流れを算出する。閲覧順序取得手段31は、ここで算出した構成要素単位での閲覧の流れを、閲覧順序データ13aとして、閲覧順序データ記憶部13に記憶する。図6に示す例で構成要素単位での閲覧の流れは、第1の構成要素E1、第2の構成要素E2、第3の構成要素E3および第4の構成要素E4の順番となる。ここで、第5の構成要素E5は、閲覧の流れから外れる。 Further, the browsing order acquisition unit 31 compares the input coordinates of the browsing flow F with the coordinates of the display area of the component in the preview of the document data 11a, and calculates the browsing flow in units of components. The browsing order acquisition unit 31 stores the browsing flow in units of components calculated here as browsing order data 13 a in the browsing order data storage unit 13. In the example shown in FIG. 6, the flow of browsing in units of constituent elements is the order of the first constituent element E1, the second constituent element E2, the third constituent element E3, and the fourth constituent element E4. Here, the fifth component E5 deviates from the browsing flow.
閲覧順序取得手段31は、閲覧順序データ13aおよび閲覧順序データ13bに基づいて、想定閲覧座標を算出する。想定閲覧座標は、構成要素ごとに算出される。本発明の実施の形態において閲覧順序取得手段31は、各構成要素について、閲覧の流れF上の座標であって、各構成要素に最初に重なる座標を算出し、構成要素の識別子と、その構成要素の想定閲覧座標とを対応づけて、想定閲覧座標データ14aを算出する。 The browsing order acquisition unit 31 calculates assumed browsing coordinates based on the browsing order data 13a and the browsing order data 13b. Assumed browsing coordinates are calculated for each component. In the embodiment of the present invention, the browsing order acquisition means 31 calculates the coordinates on the browsing flow F for each component, which first overlap each component, the identifier of the component, and its configuration The assumed browsing coordinate data 14a is calculated by associating the assumed browsing coordinates of the element.
図8に示すように、第1の構成要素E1の想定閲覧座標は、閲覧の流れF上の座標であって、第1の構成要素E1の上辺と重なった点P1である。第2の構成要素E2の想定閲覧座標は、閲覧の流れF上の座標であって、第2の構成要素E2の上辺と重なった点P2である。第3の構成要素E3の想定閲覧座標は、閲覧の流れF上の座標であって、第3の構成要素E3の左辺と重なった点P3である。第4の構成要素E4の想定閲覧座標は、閲覧の流れF上の座標であって、第4の構成要素E4の上辺と重なった点P4である。ここで、第5の構成要素E5と閲覧の流れFは重ならないので、第5の構成要素E5について、想定閲覧座標は存在しない。従って、図7に示す想定閲覧座標データ14aにおいて、第5の構成要素E5には、想定閲覧座標は対応づけられていない。 As shown in FIG. 8, the assumed viewing coordinates of the first component E1 are coordinates on the viewing flow F and are a point P1 that overlaps the upper side of the first component E1. The assumed viewing coordinates of the second component E2 are coordinates on the viewing flow F, and are a point P2 that overlaps with the upper side of the second component E2. The assumed viewing coordinates of the third component E3 are coordinates on the viewing flow F and are a point P3 that overlaps the left side of the third component E3. The assumed browsing coordinates of the fourth component E4 are coordinates on the browsing flow F, and are a point P4 overlapping the upper side of the fourth component E4. Here, since the fifth component E5 and the browsing flow F do not overlap, there is no assumed browsing coordinate for the fifth component E5. Therefore, in the assumed browsing coordinate data 14a shown in FIG. 7, the assumed browsing coordinates are not associated with the fifth component E5.
図10を参照して、本発明の実施の形態に係る閲覧順序取得手段31による閲覧順序取得処理を説明する。 With reference to FIG. 10, the browsing order acquisition process by the browsing order acquisition means 31 which concerns on embodiment of this invention is demonstrated.
まず閲覧順序取得手段31は、ステップS101において記憶装置10から文書データ11aを読み出し、ステップS102において閲覧の流れFを取得する。上述した様に、作成者が入力装置40を用いて文書データ11aのプレビュー表示上に閲覧の流れFを入力する。閲覧順序取得手段31は、作成者が入力した閲覧の流れFの座標を取得し、閲覧順序データ13bを出力することができる。 First, the browsing order acquisition unit 31 reads the document data 11a from the storage device 10 in step S101, and acquires the browsing flow F in step S102. As described above, the creator uses the input device 40 to input the browsing flow F on the preview display of the document data 11a. The browsing order acquisition means 31 can acquire the coordinates of the browsing flow F input by the creator and output the browsing order data 13b.
ステップS103において閲覧順序取得手段31は、ステップS102で取得した閲覧の流れFに従って、文書データ11aの構成要素の閲覧順序を決定する。閲覧順序取得手段31は、構成要素の表示領域と、閲覧の流れFの座標とを比較して、構成要素の単位での閲覧の流れを決定し、閲覧順序データ13aを出力する。構成要素の単位の閲覧の流れが決定されると、各構成要素についてステップS105およびステップS106の処理を繰り返す。 In step S103, the browsing order acquisition unit 31 determines the browsing order of the components of the document data 11a according to the browsing flow F acquired in step S102. The browsing order acquisition unit 31 compares the display area of the component and the coordinates of the browsing flow F, determines the browsing flow in units of the component, and outputs the browsing order data 13a. When the flow of browsing in units of constituent elements is determined, the processes in steps S105 and S106 are repeated for each constituent element.
まずステップS105において閲覧順序取得手段31は、当該構成要素と、閲覧の流れFが重なるかを判定する。閲覧順序取得手段31は、閲覧順序データ13に当該構成要素の識別子が含まれている場合、当該構成要素と閲覧の流れFが重なると判断する。構成要素と閲覧の流れFが重なる場合、ステップS106において閲覧順序取得手段31は、当該構成要素における想定閲覧座標を算出する。一方、重ならない場合、閲覧順序取得手段31は、次の構成要素についてステップS105およびステップS106の処理を繰り返す。 First, in step S105, the browsing order acquisition unit 31 determines whether the component and the browsing flow F overlap each other. When the browsing order data 13 includes the identifier of the constituent element, the browsing order acquisition unit 31 determines that the constituent element and the browsing flow F overlap. When the component and the browsing flow F overlap, in step S106, the browsing order acquisition unit 31 calculates assumed browsing coordinates in the component. On the other hand, when not overlapping, the browsing order acquisition means 31 repeats the process of step S105 and step S106 about the following component.
すべての構成要素について、ステップS105およびステップS106の処理が終了すると、閲覧順序取得手段31は、構成要素の識別子と、想定閲覧座標を算出できた場合はその想定閲覧座標と、を対応づけた想定閲覧座標データ14aを出力する。 When the processing of step S105 and step S106 is completed for all the constituent elements, the browsing order acquisition unit 31 assumes that the identifiers of the constituent elements are associated with the assumed browsing coordinates when the assumed browsing coordinates can be calculated. The browsing coordinate data 14a is output.
次に、対象単語抽出手段32を説明する。対象単語抽出手段32は、構成要素ごとに、当該構成要素における対象単語と一致する単語および当該単語の容易度を抽出する。さらに対象単語抽出手段32は、当該構成要素における想定閲覧座標と、抽出された単語の距離を算出し、単語、当該単語の容易度および距離を関連づけた単語情報データ15aを出力する。さらに対象単語抽出手段32は、構成要素情報データ16aを出力する。 Next, the target word extracting unit 32 will be described. The target word extraction unit 32 extracts, for each component, a word that matches the target word in the component and the ease of the word. Further, the target word extraction unit 32 calculates the assumed browsing coordinates in the component and the distance between the extracted words, and outputs the word information data 15a that associates the word, the ease of the word, and the distance. Further, the target word extraction means 32 outputs the component element information data 16a.
単語情報データ15aは、単語、当該単語の容易度および距離を関連づけたデータである。単語情報データ15aにはさらに、流れにおける出現位置や単語の表示属性が対応づけられても良い。表示属性は例えば、単語の大きさ、色などの単語の装飾情報である。 The word information data 15a is data that associates a word, the ease of the word, and the distance. The word information data 15a may further be associated with an appearance position in the flow and a display attribute of the word. The display attributes are, for example, word decoration information such as word size and color.
単語情報データ15aは、例えば、図11に示すデータ構造とデータの一例を備える。単語情報データ15aは、文書データ11aに含まれる単語の識別子、単語、出現位置、流れとの距離、文字の大きさ、文字の色および容易度を対応づけたデータである。ここで、単語の識別子は、対象単語抽出手段32が採番する。単語、文字の大きさおよび文字の色は、文書データ11aから取得される。対象単語抽出手段32は、文書データ11aがHTML形式の場合、そのソースファイルのタグから容易に取得できる。容易度は、対象単語容易度データ12aにおいて、当該単語に対応づけられた容易度である。ここで、図の説明文の一部として単語が表示される場合、図が大きいほど、単語の文字の大きさを大きくなるように調整し、この説明文における単語の重要度が高くなるように設定しても良い。 The word information data 15a includes, for example, an example of the data structure and data shown in FIG. The word information data 15a is data in which a word identifier, a word, an appearance position, a distance from a flow, a character size, a character color, and an ease included in the document data 11a are associated with each other. Here, the target word extraction means 32 numbers the word identifier. The word, character size, and character color are acquired from the document data 11a. When the document data 11a is in the HTML format, the target word extraction unit 32 can easily obtain the target word extraction unit 32 from the tag of the source file. The easiness is an easiness associated with the word in the target word easiness data 12a. Here, when a word is displayed as a part of the explanatory text in the figure, the larger the figure, the larger the character size of the word, and the higher the importance of the word in the explanatory text. May be set.
出現位置は、閲覧の流れFにおける単語の位置である。当該単語が、閲覧の流れFの最初に出現するのか、後方に出現するのか、あるいは閲覧の流れFの範囲外なのか、が示される。出現位置の算出においては、例えば図6(a)に示す閲覧順序データ13aが参照される。対象単語抽出手段32は、構成要素ごとに、閲覧の流れの前半、中盤、後半を対応づけるとともに、閲覧順序データ13aに含まれない構成要素に、範囲外を対応づける。図11に示す例は、第1の構成要素E1に含まれる単語の出現位置について前半、第2の構成要素E2および第3の構成要素E3に含まれる単語の出現位置について中盤、第4の構成要素E4に含まれる単語の出現位置について後半、第5の構成要素E5に含まれる単語の出現位置について範囲外と、それぞれ対応づける。本発明の実施の形態においては、構成要素に基づいて出現位置を決定する場合を説明するが、これに限られない。 The appearance position is a word position in the browsing flow F. Whether the word appears at the beginning of the browsing flow F, appears backward, or is outside the range of the browsing flow F is indicated. In calculating the appearance position, for example, browsing order data 13a shown in FIG. The target word extraction unit 32 associates the first half, the middle, and the second half of the flow of browsing for each component, and associates out-of-range with the components not included in the browsing order data 13a. The example shown in FIG. 11 shows the first half of the appearance position of the word included in the first component E1, the middle part of the appearance position of the word included in the second component E2 and the third component E3, and the fourth configuration. The appearance position of the word included in the element E4 is associated with the latter half, and the appearance position of the word included in the fifth component E5 is associated with out of range. In the embodiment of the present invention, the case where the appearance position is determined based on the components will be described, but the present invention is not limited to this.
流れとの距離は、単語と、各構成要素ごとの想定閲覧座標からの距離である。本発明の実施の形態において流れとの距離は、単閲覧の流れを考慮した距離である。本発明の実施の形態において流れとの距離は、単語と想定閲覧座標との物理的な距離とは異なることが一般的である。本発明の実施の形態において流れとの距離は、各構成要素について、各構成要素の想定閲覧座標を基準に読み手が閲覧する流れを考慮して算出される。 The distance to the flow is the distance from the word and the assumed viewing coordinates for each component. In the embodiment of the present invention, the distance to the flow is a distance considering a single browsing flow. In the embodiment of the present invention, the distance from the flow is generally different from the physical distance between the word and the assumed viewing coordinates. In the embodiment of the present invention, the distance from the flow is calculated for each component in consideration of the flow that the reader browses based on the assumed viewing coordinates of each component.
構成要素情報データ16aは、図12示すように、構成要素の識別子と、当該構成要素に含まれる単語の識別子を対応づけたデータである。 As shown in FIG. 12, the constituent element information data 16a is data in which constituent element identifiers are associated with identifiers of words included in the constituent elements.
対象単語抽出手段32は、文書データ11aから対象単語を抽出する。対象単語抽出手段32は、文書データ11aを形態素解析して名詞を抽出する。対象単語抽出手段32は、抽出された名詞のうち、対象単語容易度データ12aに含まれる対象単語を、文書データ11aに用いられている単語として抽出する。ここで抽出される単語は、本発明の実施の形態に係る文書生成支援装置1の評価対象となる。さらに対象単語抽出手段32は、この単語の文字の大きさおよび文字の色を取得するとともに、対象単語容易度データ12aを参照して、この単語の容易度を取得する。対象単語抽出手段32は、取得した単語に単語識別子を採番するとともに、単語、単語の文字の大きさ、文字の色および容易度を対応づけて、単語情報データ15aを生成し、単語情報データ記憶部15に記憶する。 The target word extraction unit 32 extracts a target word from the document data 11a. The target word extracting unit 32 extracts nouns by performing morphological analysis on the document data 11a. The target word extraction means 32 extracts the target word contained in the target word ease data 12a among the extracted nouns as a word used in the document data 11a. The word extracted here becomes an evaluation target of the document generation support apparatus 1 according to the embodiment of the present invention. Further, the target word extraction means 32 acquires the character size and character color of the word, and acquires the ease of the word with reference to the target word ease data 12a. The target word extraction unit 32 assigns a word identifier to the acquired word, associates the word, the character size of the word, the color of the character, and the ease, and generates word information data 15a. Store in the storage unit 15.
対象単語抽出手段32は、取得した単語について、その単語の含まれる構成要素を対応づけて、構成要素情報データ16aを生成する。また、対象単語抽出手段32は、閲覧の流れFを考慮して、前半、中盤、後半、範囲外など、構成要素の出現位置を算出する。本発明の実施の形態において対象単語抽出手段32は、構成要素の出現位置の情報を、単語の出現位置の情報として、単語情報データ15aに記憶する。 The target word extracting unit 32 generates the component information data 16a by associating the acquired word with the component included in the word. In addition, the target word extraction unit 32 calculates the appearance positions of the constituent elements in consideration of the browsing flow F, such as the first half, the middle board, the second half, and out of range. In the embodiment of the present invention, the target word extraction unit 32 stores the information on the appearance position of the component in the word information data 15a as the information on the appearance position of the word.
さらに対象単語抽出手段32は、各単語の流れとの距離を算出する。本発明の実施の形態において流れとの距離は、文書データ11a全体における閲覧の流れFと、各構成要素において想定閲覧座標を基準に読み手が閲覧する流れに基づいて算出される。 Further, the target word extraction unit 32 calculates a distance from each word flow. In the embodiment of the present invention, the distance from the flow is calculated based on the browsing flow F in the entire document data 11a and the flow that the reader browses based on the assumed browsing coordinates in each component.
図13を参照して、本発明の実施の形態に係る流れとの距離の算出方法を説明する。図13は、文書データ11aの第1の構成要素E1を拡大した図である。第1の構成要素E1上に、閲覧の流れFの一部が重なっている。図8に示すように、この閲覧の流れFは、図13に示す図の上から下へ流れる。本発明の実施の形態において想定閲覧座標は、閲覧の流れF上の座標であって、各構成要素に最初に重なる座標である。従って、第1の構成要素E1の想定閲覧座標は、P1となる。また、本発明の実施の形態のおいて流れとの距離は、各構成要素について、各構成要素の想定閲覧座標を基準に読み手が閲覧する流れを考慮して算出される。そこで流れとの距離Lは、下記の式1で表現される。 With reference to FIG. 13, the calculation method of the distance with the flow which concerns on embodiment of this invention is demonstrated. FIG. 13 is an enlarged view of the first component E1 of the document data 11a. A part of the browsing flow F overlaps the first component E1. As shown in FIG. 8, this browsing flow F flows from the top to the bottom of the diagram shown in FIG. In the embodiment of the present invention, the assumed browsing coordinates are coordinates on the browsing flow F, and are the coordinates that first overlap each component. Accordingly, the assumed viewing coordinate of the first component E1 is P1. In the embodiment of the present invention, the distance from the flow is calculated for each component in consideration of the flow that the reader browses based on the assumed viewing coordinates of each component. Therefore, the distance L from the flow is expressed by the following formula 1.
流れとの距離L=基本距離+文字数k×係数n
=SQRT((x1−x0)^2+(y1−y0)^2)+k×n
・・・(式1)
ここで、基本距離とは、想定閲覧座標P1と、第1の構成要素E1の左上端の頂点P0との距離である。文字数は、第1の構成要素E1の文字列の先頭から、単語までの文字の数である。係数nは、各単語の文字の幅に相当する長さである。
Distance to flow L = basic distance + number of characters k × coefficient n
= SQRT ((x1-x0) ^ 2 + (y1-y0) ^ 2) + k * n
... (Formula 1)
Here, the basic distance is a distance between the assumed viewing coordinate P1 and the top left vertex P0 of the first component E1. The number of characters is the number of characters from the beginning of the character string of the first component E1 to the word. The coefficient n is a length corresponding to the character width of each word.
基本距離は、閲覧の流れFに従って読み手が文書データ11aを閲覧し、この第1の構成要素E1の文字列を閲覧する際、第1の構成要素E1の文字列の先頭から、評価対象となる単語まで、読み手が目を動かす距離となる。対象単語抽出手段32は、第1の構成要素E1の文字列の先頭から、評価対象の単語までの文字数kに係数nを乗算したものを、基本距離に加算することにより、流れとの距離Lとして、想定閲覧座標P1から、単語までの距離を算出することができる。 The basic distance is an evaluation target from the beginning of the character string of the first component E1 when the reader browses the document data 11a according to the browsing flow F and browses the character string of the first component E1. The distance that the reader moves his eyes to the word. The target word extraction unit 32 adds the number k of characters from the head of the character string of the first component E1 to the word to be evaluated multiplied by the coefficient n to the basic distance, thereby adding a distance L to the flow. As described above, the distance to the word can be calculated from the assumed browsing coordinates P1.
ここで、閲覧順序データ13aにおいて、閲覧の流れFの範囲外とされた構成要素においても、流れとの距離Lは算出される。このような構成要素に含まれる単語について、対象単語抽出手段32は、最も近い想定閲覧座標との距離を、この単語と流れとの距離Lと算出する。例えば、図9に示す例において、「注意事項」で始まる第5の構成要素E5は、閲覧の流れFの範囲外である。そこで対象単語抽出手段32は、この第5の構成要素E5に最も近い想定閲覧座標として、第3の構成要素E3の想定閲覧座標P3を特定し、この想定閲覧座標P3と単語との距離を、流れとの距離Lとして算出する。 Here, in the browsing order data 13a, the distance L to the flow is calculated even for components that are outside the range of the browsing flow F. For a word included in such a component, the target word extraction unit 32 calculates the distance L between this word and the flow as the distance from the closest assumed viewing coordinate. For example, in the example illustrated in FIG. 9, the fifth component E <b> 5 that starts with “Caution” is out of the range of the browsing flow F. Therefore, the target word extraction means 32 specifies the assumed browsing coordinates P3 of the third component E3 as the assumed browsing coordinates closest to the fifth component E5, and determines the distance between the assumed browsing coordinates P3 and the word, Calculated as a distance L to the flow.
図14を参照して、本発明の実施の形態に係る対象単語抽出手段32による対象単語抽出処理を説明する。 With reference to FIG. 14, the target word extraction process by the target word extraction means 32 which concerns on embodiment of this invention is demonstrated.
対象単語抽出手段32は、ステップS201において記憶装置10から文書データ11aを読み出すとともに、ステップS202において対象単語容易度データ12aを読み出す。次に対象単語抽出手段32は、文書データ11aの各構成要素について、ステップS203ないしステップS209の処理を繰り返す。 The target word extraction unit 32 reads the document data 11a from the storage device 10 in step S201, and reads the target word ease data 12a in step S202. Next, the target word extracting unit 32 repeats the processing from step S203 to step S209 for each component of the document data 11a.
対象単語抽出手段32は、ステップS203において、当該構成要素から対象単語容易度データ12aに登録された対象単語を抽出する。ステップS204において対象単語抽出手段32は、ステップS203で抽出した単語と、当該構成要素とを対応づけて、構成要素情報データ16aに出力する。さらに、対象単語抽出手段32は、当該構成要素について、前半、中盤、後半、範囲外などの、閲覧の流れFにおける当該構成要素の出現位置を算出する。 In step S203, the target word extraction unit 32 extracts the target word registered in the target word ease data 12a from the component. In step S204, the target word extracting unit 32 associates the word extracted in step S203 with the constituent element and outputs the same to the constituent element information data 16a. Further, the target word extraction unit 32 calculates the appearance position of the component in the browsing flow F, such as the first half, the middle, the second half, and the out of range for the component.
次に、ステップS203で抽出された各単語について、ステップS206ないしステップS209の処理を繰り返す。 Next, the processing from step S206 to step S209 is repeated for each word extracted in step S203.
対象単語抽出手段32は、ステップS206において対象単語容易度データ12aから、当該単語の容易度を抽出し、ステップS207において想定閲覧座標からの距離を算出する。さらにステップS208において対象単語抽出手段32は、単語の文字の大きさ、色などの表示属性を取得する。 The target word extraction unit 32 extracts the ease of the word from the target word ease data 12a in step S206, and calculates the distance from the assumed viewing coordinates in step S207. In step S208, the target word extracting unit 32 acquires display attributes such as the size and color of the characters of the word.
ステップS209において対象単語抽出手段32は、単語と、ステップS205で算出した出現位置と、ステップS206で取得した容易度と、ステップS207で算出した想定閲覧座標からの距離と、ステップS208で取得した単語の表示属性と、を対応づけたレコードを生成する。対象単語抽出手段32は、生成したレコードを、単語情報データ15aに出力する。 In step S209, the target word extraction unit 32 determines the word, the appearance position calculated in step S205, the ease acquired in step S206, the distance from the assumed viewing coordinates calculated in step S207, and the word acquired in step S208. A record that associates the display attribute with is generated. The target word extraction unit 32 outputs the generated record to the word information data 15a.
すべての構成要素および単語について、ステップS203ないしステップS209の処理が終了すると、対象単語抽出手段32による対象単語抽出処理は終了する。 When the processing from step S203 to step S209 is completed for all the constituent elements and words, the target word extraction processing by the target word extraction unit 32 is completed.
次に、単語評価手段33を説明する。単語評価手段33は、単語情報データ15aの各単語について、容易度が低く距離が近い単語について修正優先度が高くなるように、単語の修正優先度を算出して、重み付き単語情報データ17aを出力する。ここで、単語の修正優先度とは、文書データ11aにおいて、単語の修正を必要とする度合いである。修正優先度が高い単語は、文書データ11aの理解容易度を向上させるために、作業者によって修正されることが好ましい。ここで、単語評価手段33は、単語の容易度および流れとの距離だけではなく、単語の表示属性も考慮して、修正優先度を算出しても良い。 Next, the word evaluation means 33 will be described. For each word in the word information data 15a, the word evaluation means 33 calculates a correction priority of the word so that the correction priority is high for a word with a low degree of ease and a short distance, and the weighted word information data 17a is obtained. Output. Here, the word correction priority is a degree of necessity of correcting the word in the document data 11a. A word having a high correction priority is preferably corrected by an operator in order to improve the understanding level of the document data 11a. Here, the word evaluation means 33 may calculate the correction priority in consideration of not only the ease of the word and the distance from the flow but also the display attribute of the word.
図15を参照して、本発明の実施の形態に係る重み付き単語情報データ17aを説明する。図15に示す重み付き単語情報データ17aは、図11に示す単語情報データ15aと比べて、修正優先度および点数の項目を備えている点が異なる。この点数は、単語情報データ15aの各項目から算出される。図15に示す例において、単語の修正優先度は、点数を降順にソートした順番である。 With reference to FIG. 15, the weighted word information data 17a according to the embodiment of the present invention will be described. The weighted word information data 17a shown in FIG. 15 is different from the word information data 15a shown in FIG. 11 in that it has correction priority and score items. This score is calculated from each item of the word information data 15a. In the example shown in FIG. 15, the word correction priority is the order in which the scores are sorted in descending order.
本発明の実施の形態において単語の修正優先度は、閲覧の流れFに基づいて読み手の目にとまりやすい難しい単語ほど高く設定される。具体的には、単語の容易度が低く、想定閲覧座標からの距離が近く、出現位置が前半であり、文字サイズが大きく、文字の色が誘目度の高いほど、修正すべきであると考える。図15に示す例では、修正すべき単語ほど点数が高くなるように、点数が設定される。また、修正すべき単語ほど、修正優先度の数値が小さくなるように設定される。 In the embodiment of the present invention, the word correction priority is set higher for difficult words that are easily caught by the reader based on the browsing flow F. Specifically, the easier the word is, the shorter the distance from the assumed viewing coordinate, the first half of the appearance position, the larger the character size, and the higher the color of the character, the more the character should be corrected. . In the example shown in FIG. 15, the score is set so that the word to be corrected has a higher score. Further, the correction priority value is set to be smaller for the word to be corrected.
ここで、単語評価手段33が、(1)単語の容易度、(2)想定閲覧座標からの距離、(3)出現位置、(4)文字サイズおよび(5)文字の色の各要素点を総合的に評価して、単語の修正優先度を決定する場合を説明する。 Here, the word evaluation means 33 determines each element point of (1) word ease, (2) distance from assumed viewing coordinates, (3) appearance position, (4) character size, and (5) character color. A case will be described in which overall evaluation is performed to determine the word correction priority.
単語評価手段33は、(1)単語の容易度について、X1=1−容易度を設定する。単語評価手段33は、(2)想定閲覧座標からの距離について、X2=距離点を設定する。単語評価手段33は、(3)出現位置について、X3=位置点を設定する。単語評価手段33は、(4)文字サイズについて、X4=サイズ点を設定する。単語評価手段33は、(6)文字の色について、X5=誘目度点を設定する。ここで、距離点、位置点、サイズ点および誘目度点の各要素点は、単語情報データ15aの各データに基づいて、0から1の間の範囲内に換算されて設定される。この各要素点は、想定閲覧座標からの距離が近く、出現位置が前半であり、文字サイズが大きく、文字の色が誘目度の高いほど、1に近くなるように設定される。 The word evaluation means 33 sets (1) X1 = 1-easyness for (1) word ease. The word evaluation unit 33 sets (2) a distance point with respect to the distance from the assumed viewing coordinates (2). The word evaluation means 33 (3) sets X3 = position point for the appearance position. The word evaluation means 33 sets X4 = size point for (4) character size. The word evaluation means 33 (6) sets X5 = attraction level for the character color. Here, each element point of the distance point, the position point, the size point, and the attractiveness point is converted and set within a range between 0 and 1 based on each data of the word information data 15a. Each element point is set to be closer to 1 as the distance from the assumed viewing coordinate is closer, the appearance position is in the first half, the character size is larger, and the character color is higher in degree of attraction.
単語評価手段33は、これらX1〜X5の各要素点素店を用いて、式2により、単語の点数Yを算出することができる。 The word evaluation means 33 can calculate the score Y of the word by Equation 2 using each of the element point stores X1 to X5.
Y=20×ΣXi (I=1..5) ・・・(式2)
ここで、図15に示す単語識別し「W1」の単語「LAN」について、点数Yを算出するにあたり、各要素点が予め設定される。ここでは、各要素点が、(1)単語の容易度(=0.7)について、X1=1−0.7=0.3、(2)閲覧順序との距離(=近い)について、X2=1点、(3)出現位置(=前半)について、X3=1点、(4)文字サイズ(=普通)について、X4=0.9点、(5)文字の色(=黒)について、X5=0.9点と設定されるとする。
Y = 20 × ΣXi (I = 1..5) (Formula 2)
Here, in calculating the score Y for the word “LAN” identified by the word “W1” shown in FIG. 15, each element point is set in advance. Here, each element point has (1) X1 = 1−0.7 = 0.3 for the word ease (= 0.7), and (2) X2 for the distance (= close) from the viewing order. = 1 point, (3) For the appearance position (= first half), X3 = 1 point, (4) For the character size (= normal), X4 = 0.9 point, (5) For the character color (= black) It is assumed that X5 = 0.9 point is set.
この場合、点数Yは、20×((1−0.7)+1+1+0.9+0.9)=82点と算出される。この単語は、容易度が高い言葉であるが、読み手の目にとまる可能性が高いので、点数Yは高く算出される。ここでは、単語の容易度、距離点、位置点、サイズ点および誘目度点のすべてを考慮して点数Yを算出したが、この例に限られない。例えば、単語の容易度および距離点のみを使って点数Yを算出しても、読み手の閲覧の流れを考慮して、単語を評価することができる。また、単語の容易度、距離点、位置点、サイズ点および誘目度点をそれぞれ重み付けして、点数Yが算出されても良い。 In this case, the score Y is calculated as 20 × ((1−0.7) + 1 + 1 + 0.9 + 0.9) = 82 points. Although this word is a word with high ease, it is highly likely that it will be caught by the reader's eyes, so the score Y is calculated to be high. Here, the score Y is calculated in consideration of all of the word ease, the distance point, the position point, the size point, and the attractiveness point, but the present invention is not limited to this example. For example, even if the score Y is calculated using only the word ease and distance points, the word can be evaluated in consideration of the flow of reading by the reader. Further, the score Y may be calculated by weighting the word ease, distance point, position point, size point, and attraction degree point.
単語評価手段33は、このように算出した点数を、単語識別子「W1」の点数として、重み付き単語情報データ17aに出力する。単語評価手段33は、単語情報データ15aのすべての単語について点数Yを算出すると、点数Yに基づいて降順にソートする。単語評価手段33は、ソートされた順番に基づいて、修正優先度を付与する。単語評価手段33は、単語と、この単語について算出した点数および修正優先度を対応づけて、重み付き単語情報データ17aに出力する。 The word evaluation means 33 outputs the score thus calculated to the weighted word information data 17a as the score of the word identifier “W1”. When the word evaluation means 33 calculates the score Y for all the words in the word information data 15a, the word evaluation means 33 sorts in descending order based on the score Y. The word evaluation means 33 gives a correction priority based on the sorted order. The word evaluation means 33 associates the word with the score calculated for this word and the modification priority, and outputs it to the weighted word information data 17a.
図16を参照して、本発明の実施の形態に係る単語評価手段33による単語評価処理を説明する。 With reference to FIG. 16, the word evaluation process by the word evaluation means 33 which concerns on embodiment of this invention is demonstrated.
単語評価手段33は、ステップS301において記憶装置10から単語情報データ15aを読み出し、単語情報データ15aの各単語について、ステップS302を処理する。単語評価手段33は、ステップS302について、単語情報データ15aの単語の点数を算出する。 The word evaluation means 33 reads the word information data 15a from the storage device 10 in step S301, and processes step S302 for each word in the word information data 15a. The word evaluation means 33 calculates the score of the word of the word information data 15a about step S302.
単語情報データ15aのすべての単語について点数を算出すると、ステップS303において単語評価手段33は、ステップS302で算出した点数に基づいて、修正優先度を付与する。ステップS303において単語評価手段33は、単語と、ステップS302で算出した点数と、ステップS303で付与した修正優先度と、を対応づけて、重み付き単語情報データ17aに出力する。ここで単語評価手段33は、単語情報データ15aの各項目も、対応づけて重み付き単語情報データ17aに出力しても良い。 When the scores are calculated for all the words in the word information data 15a, in step S303, the word evaluation means 33 gives a correction priority based on the scores calculated in step S302. In step S303, the word evaluation unit 33 associates the word, the score calculated in step S302, and the modification priority given in step S303, and outputs the result to the weighted word information data 17a. Here, the word evaluation means 33 may also associate each item of the word information data 15a and output it to the weighted word information data 17a.
次に、構成要素評価手段34を説明する。構成要素評価手段34は、単語の修正優先度に基づいて、構成要素ごとの修正優先度を算出し、重み付き構成要素情報データ18aを出力する。構成要素評価手段34は、重み付き単語情報データ17aを参照して、文書データ11aの各対象単語の点数を取得する。構成要素評価手段34は、構成要素情報データ16aを参照して、構成要素ごとに、当該構成要素に含まれる単語に対応する点数に基づいて、構成要素ごとの点数を算出する。 Next, the component element evaluation means 34 will be described. The component evaluation means 34 calculates a correction priority for each component based on the word correction priority, and outputs weighted component information data 18a. The component evaluation means 34 refers to the weighted word information data 17a and acquires the score of each target word in the document data 11a. The component evaluation means 34 refers to the component information data 16a, and calculates the score for each component based on the score corresponding to the word included in the component for each component.
重み付き構成要素情報データ18aは、図17に示すように、構成要素の識別子と、当該構成要素に含まれる単語の識別子と、修正優先度と、点数とを対応づけたデータである。図17に示す重み付き構成要素情報データ18aは、図12に示す構成要素情報データ16aと比べて、修正優先度および点数の項目を備えている点が異なる。この点数は、重み付き単語情報データ17aの点数から算出される。図17に示す例において、単語の修正優先度は、点数を降順にソートした順番である。 As shown in FIG. 17, the weighted component information data 18a is data in which a component identifier, a word identifier included in the component, a modification priority, and a score are associated with each other. The weighted component information data 18a shown in FIG. 17 is different from the component information data 16a shown in FIG. 12 in that it includes items of correction priority and score. This score is calculated from the score of the weighted word information data 17a. In the example shown in FIG. 17, the correction priority of words is the order in which the scores are sorted in descending order.
構成要素ごとの点数の算出方法として、構成要素に含まれるすべての対象単語の点数を加算した点数を、構成要素ごとの点数とする方法がある。この構成要素ごとに算出された点数を用いて、構成要素評価手段34は、例えば、構成要素ごとの点数が高いほどこの構成要素の修正優先度が高くなるように、構成要素ごとの修正優先度を算出する。 As a method for calculating the score for each component, there is a method in which the score obtained by adding the scores of all target words included in the component is used as the score for each component. Using the score calculated for each component, the component evaluation means 34, for example, the modification priority for each component so that the modification priority of this component increases as the score for each component increases. Is calculated.
図18を参照して、構成要素評価手段34による構成要素評価処理を説明する。構成要素評価手段34は、ステップS401において記憶装置10から構成要素情報データ16aを読み出すとともに、ステップS402において重み付き単語情報データ17aを読み出す。次に構成要素評価手段34は、文書データ11aの各構成要素について、ステップS403およびステップS404の処理を繰り返す。 With reference to FIG. 18, the component evaluation process by the component evaluation means 34 is demonstrated. The component evaluation means 34 reads the component element information data 16a from the storage device 10 in step S401, and reads the weighted word information data 17a in step S402. Next, the constituent element evaluation unit 34 repeats the processing of step S403 and step S404 for each constituent element of the document data 11a.
ステップS403において構成要素評価手段34は、構成要素情報データ16aから当該構成要素に含まれるすべての単語の識別子を取得するとともに、重み付き単語情報データ17aからこれらの単語の点数を取得する。ステップS404において、構成要素評価手段34は、ステップS403で取得した単語の点数の合計を、当該構成要素の点数とする。 In step S403, the constituent element evaluation means 34 acquires identifiers of all words included in the constituent element from the constituent element information data 16a, and acquires the scores of these words from the weighted word information data 17a. In step S404, the component evaluation means 34 sets the total score of the words acquired in step S403 as the score of the component.
すべての構成要素について点数を算出すると、ステップS405において構成要素評価手段34は、ステップS404で算出した点数に基づいて、修正優先度を付与する。ステップS406において構成要素評価手段34は、構成要素の識別子と、ステップS404で算出した点数と、ステップS405で付与した修正優先度と、を対応づけて、重み付き構成要素情報データ18aに出力する。 When the scores have been calculated for all the constituent elements, the constituent element evaluation means 34 assigns a correction priority in step S405 based on the scores calculated in step S404. In step S406, the component evaluation means 34 associates the identifier of the component, the score calculated in step S404, and the modification priority given in step S405, and outputs the result to the weighted component information data 18a.
次に、出力手段35を説明する。出力手段35は、重み付き単語情報データ17aおよび重み付き構成要素情報データ18aに基づいた評価結果を、出力装置50に出力して、作成者に閲覧させる手段である。出力手段35による評価結果の出力方法として、様々な方法が考えられる。例えば、表データとして一覧表示する方法や、プレビュー画面に評価結果を重畳する方法などが考えられる。 Next, the output means 35 will be described. The output means 35 is a means for outputting an evaluation result based on the weighted word information data 17a and the weighted component information data 18a to the output device 50 and allowing the creator to view it. Various methods can be considered as a method for outputting the evaluation result by the output means 35. For example, a method of displaying a list as tabular data, a method of superimposing evaluation results on a preview screen, or the like can be considered.
評価結果を表データとして一覧表示する場合、出力手段35は、図15に示す重み付き単語情報データ17aや、図18に示す重み付き構成要素情報データ18aを、表形式で、出力装置50に表示する。 When the evaluation results are displayed as a list of table data, the output unit 35 displays the weighted word information data 17a shown in FIG. 15 and the weighted component information data 18a shown in FIG. 18 on the output device 50 in a table format. To do.
プレビュー画面に評価結果を表示する場合の表示画面の一例を、図19および図20を参照して説明する。この場合出力手段35は、文書データ11aに、評価結果を重畳した評価結果データ19aを生成し、この評価結果データ19aを出力装置50に出力する。 An example of the display screen when the evaluation result is displayed on the preview screen will be described with reference to FIGS. 19 and 20. In this case, the output unit 35 generates evaluation result data 19a in which the evaluation result is superimposed on the document data 11a, and outputs the evaluation result data 19a to the output device 50.
図19は、出力手段35が、背景色で修正優先度を表現した結果表示画面P101の一例である。図19に示す例において出力手段35は、評価対象の単語および構成要素について、修正優先度に合わせて背景をつけた評価結果データ19aを出力する。文書データ11aがHTML形式の場合、出力手段35は、文書データ11aに基づいて、タグを使って背景色を設定した評価結果データ19aを出力する。出力手段35は、修正優先度の高い単語および構成要素については、誘目度の高い背景を設定し、修正優先度が下がるに従って、誘目度の低い背景を設定する。出力手段35は、特に修正の必要のない単語および構成要素については、背景を重畳しない。 FIG. 19 is an example of a result display screen P101 in which the output unit 35 expresses the correction priority with the background color. In the example shown in FIG. 19, the output means 35 outputs evaluation result data 19a with a background according to the correction priority for the words and components to be evaluated. When the document data 11a is in the HTML format, the output unit 35 outputs the evaluation result data 19a in which the background color is set using a tag based on the document data 11a. The output means 35 sets a background with a high degree of attractiveness for words and components having a high correction priority, and sets a background with a low degree of attractiveness as the correction priority decreases. The output unit 35 does not superimpose the background on words and components that do not need to be particularly corrected.
出力手段35は、評価結果データ19aに従って、文書データ11aのプレビュー画面にこれらの背景色を設定して表示する。従って、作成者は、背景色によって修正優先度を把握することができるので、プレビュー画面全体の流れを考慮しつつ、修正するべき項目を特定することができる。 The output means 35 sets and displays these background colors on the preview screen of the document data 11a according to the evaluation result data 19a. Therefore, the creator can grasp the correction priority based on the background color, and thus can specify an item to be corrected in consideration of the flow of the entire preview screen.
図20は、出力手段35が、構成要素の修正優先度を、記号で表現した結果表示画面P102の一例である。図20に示す例において出力手段35は、評価対象の構成要素について、修正優先度に合わせて記号を付した評価結果データ19aを出力する。出力手段35は、修正優先度の高い構成要素については、「×」の記号を設定し、修正優先度が低い構成要素について「○」を設定する。 FIG. 20 is an example of a result display screen P102 in which the output unit 35 expresses the modification priority of the component by a symbol. In the example illustrated in FIG. 20, the output unit 35 outputs evaluation result data 19 a with symbols attached to the evaluation target components according to the correction priority. The output means 35 sets a symbol “x” for a component with a high modification priority, and sets “◯” for a component with a low modification priority.
出力手段35は、評価結果データ19aに従って、文書データ11aのプレビュー画面にこれらの記号を付して表示する。このように修正優勢度を可視化することによって、作成者は、修正優先度を把握することができる。これにより作成者は、プレビュー画面全体の流れを考慮しつつ、修正するべき項目を特定したり、文書データ11aの改善に役立てることができる。また、図20に示す例においては、文書データ11a全体の修正優先度から算出された点数が表示されている。出力手段35は例えば、すべての構成要素が「○」の場合、100点と表示しても良い。なお、図19および図20を参照して説明した結果表示画面は一例であり、様々な結果表示画面が考えられる。 The output means 35 attaches and displays these symbols on the preview screen of the document data 11a according to the evaluation result data 19a. By visualizing the correction dominance in this way, the creator can grasp the correction priority. As a result, the creator can specify items to be corrected or can improve the document data 11a while considering the flow of the entire preview screen. Further, in the example shown in FIG. 20, the score calculated from the correction priority of the entire document data 11a is displayed. For example, when all the constituent elements are “◯”, the output means 35 may display 100 points. The result display screen described with reference to FIGS. 19 and 20 is an example, and various result display screens are conceivable.
本発明の実施の形態に係る文書生成支援装置1は、作成者が想定する読み手の閲覧の流れを指定することにより、文書データのうち、作成者が意図する、読ませたい範囲を指定する。このように指定された、作成者の想定する読み手の閲覧の流れを考慮して、文書生成支援装置1は、読み手が理解しやすいか否かについて、文書データに含まれる単語や構成要素を個々に評価する。これにより文書生成支援装置1は、作成者に、読み手の理解に障害となるような単語や構成要素を指摘することができる。作成者は、文書生成支援装置1によって指摘された単語や構成要素を修正することにより、読み手が理解しやすい文書データを生成することができる。 The document generation support apparatus 1 according to the embodiment of the present invention designates a range that the creator intends to read, by designating a reader's browsing flow assumed by the creator. In consideration of the reader's browsing flow assumed by the creator specified in this way, the document generation support device 1 individually determines the words and components included in the document data as to whether or not the reader can easily understand. To evaluate. As a result, the document generation support device 1 can point out to the creator a word or a constituent element that hinders the reader's understanding. The creator can generate document data that is easy for the reader to understand by correcting the words and components pointed out by the document generation support apparatus 1.
また本発明の実施の形態に係る文書生成支援装置1は、読み手の閲覧の流れを考慮することにより、文書データ11a中の構成要素の単位で、修正優先度を決定することができる。従って文書生成支援装置1は、限られた紙面において表現された文書データについても、優先的に改善箇所を指摘することができる。 In addition, the document generation support apparatus 1 according to the embodiment of the present invention can determine the modification priority in units of components in the document data 11a by considering the flow of reading by the reader. Therefore, the document generation support apparatus 1 can preferentially point out an improved portion even for document data expressed on a limited page.
本発明の実施の形態に係る文書生成支援装置1は、読み手が理解しやすいか否かに関する文書データの評価を、コンピュータ処理により自動化することができる。これにより、専門家や被験者が文書データを確認する必要がないので、文書データの生成のコストを大幅に削減することができる。 The document generation support apparatus 1 according to the embodiment of the present invention can automate the evaluation of document data regarding whether or not a reader can easily understand by computer processing. Thereby, since it is not necessary for an expert or a test subject to confirm document data, the production cost of document data can be reduced significantly.
このように本発明の実施の形態に係る文書生成支援装置1は、理解容易性の高い文書データの生成を支援することができる。 As described above, the document generation support apparatus 1 according to the embodiment of the present invention can support generation of document data with high understanding.
(変形例)
ここで、閲覧順序取得手段31の変形例に係る閲覧順序取得手段31aを説明する。本発明の実施の形態において閲覧順序取得手段31は、作成者に、入力装置40を使って閲覧の流れFの軌跡を入力させたが、閲覧順序取得手段31aは、作成者に、構成要素ごとの閲覧の順序を入力させる場合を説明する。
(Modification)
Here, the browsing order acquisition means 31a which concerns on the modification of the browsing order acquisition means 31 is demonstrated. In the embodiment of the present invention, the browsing order acquisition unit 31 causes the creator to input the trajectory of the browsing flow F using the input device 40, but the browsing order acquisition unit 31a allows the creator to A case of inputting the browsing order of will be described.
作成者は、図22に示すように、文書データ11aの構成要素ごとに示した想定する閲覧の流れを入力する。図22に示す例では、まず、タイトルの「取扱説明書」を読ませ、次に、「概要」、「手順1」、「手順2」および「手順3」の順で、閲覧を想定していることを示す。「概要」、「手順1」、「手順2」および「手順3」の後続の括弧には、図3に示すソースデータの<p>から</p>で区切られる文字列が入力される。ここで、この閲覧順序の入力方法は、図22に示す例に限らない。閲覧順序取得手段31aが、構成要素の単位で、作成者が想定する読み手の閲覧の流れの順序がわかれば、どのように入力されても構わない。 As shown in FIG. 22, the creator inputs the assumed browsing flow shown for each component of the document data 11a. In the example shown in FIG. 22, first read the “Instruction Manual” of the title, and then assume browsing in the order of “Summary”, “Procedure 1”, “Procedure 2”, and “Procedure 3”. Indicates that In the parentheses following “Summary”, “Procedure 1”, “Procedure 2”, and “Procedure 3”, a character string delimited by <p> to </ p> of the source data shown in FIG. 3 is input. Here, the browsing order input method is not limited to the example shown in FIG. The browsing order acquisition unit 31a may be input in any way as long as the reading order of the reader assumed by the creator is known in units of components.
このように閲覧の流れが入力されると、閲覧順序取得手段31aは、閲覧順序データ13bを生成する。閲覧順序データ13bは、図6(a)に示すように、想定する閲覧の順序に従って、構成要素の識別子が列挙されたデータである。 When the browsing flow is input in this way, the browsing order acquisition unit 31a generates browsing order data 13b. As shown in FIG. 6A, the browsing order data 13b is data in which identifiers of constituent elements are listed according to an assumed browsing order.
文書データ11aは、左から右に文字が流れる横書きである。そこで変形例においては、想定閲覧座標は、閲覧の流れFを考慮した、読み手の目にとまりやすい座標として、各構成要素の左上端の座標とする。 The document data 11a is horizontal writing in which characters flow from left to right. Therefore, in the modified example, the assumed browsing coordinates are the coordinates of the upper left corner of each component as the coordinates that are easily caught by the reader in consideration of the browsing flow F.
従って閲覧順序取得手段31aは、図23に示すように、第1の構成要素E1の左上端の頂点を、第1の構成要素E1の想定閲覧座標P1とする。同様に閲覧順序取得手段31aは、第2の構成要素E2の想定閲覧座標P2、第3の構成要素E3の想定閲覧座標P3および第4の構成要素E4の想定閲覧座標P4を算出する。閲覧順序取得手段31aは、このように算出された想定閲覧座標P1ないしP4を、図7を参照して説明した想定閲覧座標データ14aとして記憶する。 Therefore, as shown in FIG. 23, the browsing order acquisition unit 31a sets the top left vertex of the first component E1 as the assumed browsing coordinate P1 of the first component E1. Similarly, the browsing order acquisition unit 31a calculates an assumed browsing coordinate P2 of the second component E2, an assumed browsing coordinate P3 of the third component E3, and an assumed browsing coordinate P4 of the fourth component E4. The browsing order acquisition unit 31a stores the assumed browsing coordinates P1 to P4 calculated in this way as the assumed browsing coordinate data 14a described with reference to FIG.
文書データ11aの形式によっても閲覧の流れも異なるので、想定閲覧座標は異なっても良い。例えば、文書データ11aが縦書き形式の場合、構成要素の右上端の頂点を、構成要素の想定座標としても良い。 Since the browsing flow differs depending on the format of the document data 11a, the assumed browsing coordinates may be different. For example, when the document data 11a is in the vertical writing format, the vertex at the upper right end of the component may be the assumed coordinate of the component.
このように、想定閲覧の流れを決定する方法および想定閲覧座標を決定する方法として、様々な方法が考えられる。 As described above, various methods are conceivable as a method for determining the flow of assumed browsing and a method for determining assumed viewing coordinates.
(その他の実施の形態)
上記のように、本発明の実施の形態および変形例によって記載したが、この開示の一部をなす論述および図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例および運用技術が明らかとなる。
(Other embodiments)
As described above, the embodiments and modifications of the present invention have been described. However, it should not be understood that the descriptions and drawings constituting a part of this disclosure limit the present invention. From this disclosure, various alternative embodiments, examples, and operational techniques will be apparent to those skilled in the art.
例えば、本発明の最良の実施の形態に記載した文書生成支援装置は、図1に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。また、既存の情報処理システム上に実現されても良い。 For example, the document generation support apparatus described in the best embodiment of the present invention may be configured on a single piece of hardware as shown in FIG. 1, or a plurality of pieces of hardware depending on the functions and the number of processes. It may be configured above. Moreover, you may implement | achieve on the existing information processing system.
本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。 It goes without saying that the present invention includes various embodiments not described herein. Therefore, the technical scope of the present invention is defined only by the invention specifying matters according to the scope of claims reasonable from the above description.
1 文書生成支援装置
10 記憶装置
11 文書データ記憶部
12 対象単語容易度データ記憶部
13 閲覧順序データ記憶部
14 想定閲覧座標データ記憶部
15 単語情報データ記憶部
16 構成要素情報データ記憶部
17 重み付き単語情報データ記憶部
18 重み付き構成要素情報データ記憶部
19 評価結果データ記憶部
30 中央処理制御装置
31 閲覧順序取得手段
32 対象単語抽出手段
33 単語評価手段
34 構成要素評価手段
35 出力手段
40 入力装置
50 出力装置
DESCRIPTION OF SYMBOLS 1 Document production | generation assistance apparatus 10 Memory | storage device 11 Document data memory | storage part 12 Target word ease data storage part 13 Browsing order data memory | storage part 14 Assumed browsing coordinate data memory | storage part 15 Word information data memory | storage part 16 Component element information data memory | storage part 17 Weighted Word information data storage unit 18 Weighted component information data storage unit 19 Evaluation result data storage unit 30 Central processing control device 31 Browsing order acquisition unit 32 Target word extraction unit 33 Word evaluation unit 34 Component evaluation unit 35 Output unit 40 Input device 50 output device
Claims (7)
文書データの評価の対象となる対象単語と、当該対象単語の容易度と、を対応づけた対象単語容易度データを記憶するステップと、
文書データにおいて、読み手の閲覧の流れを示す閲覧順序データを取得するとともに、前記構成要素ごとに、前記閲覧の流れにおいて読み手の目にとまりやすい座標である想定閲覧座標を算出して、想定閲覧座標データを出力するステップと、
前記構成要素における前記対象単語と一致する単語および当該単語の容易度を抽出するとともに、当該構成要素における前記想定閲覧座標と、抽出された単語の距離を算出し、前記単語、当該単語の容易度および距離を関連づけた単語情報データを出力するステップと、
前記単語情報データの各単語について、容易度が低く距離が近い単語について修正優先度が高くなるように、当該単語の修正優先度を算出して、重み付き単語情報データを出力するステップ
を備えることを特徴とする文書生成支援方法。 A document generation support method for supporting generation of document data composed of a plurality of components,
Storing target word ease data in which a target word to be evaluated for document data is associated with the ease of the target word;
In the document data, browsing order data indicating a reader's browsing flow is acquired, and for each component, an assumed browsing coordinate which is a coordinate that is easily perceived by the reader in the browsing flow is calculated. Outputting data, and
The word that matches the target word in the component and the ease of the word are extracted, the assumed browsing coordinates in the component and the distance between the extracted words are calculated, and the word and the ease of the word And outputting word information data associated with the distance;
For each word of the word information data, the step of calculating the correction priority of the word and outputting the weighted word information data so that the correction priority is high for a word with low ease and a short distance. A document generation support method characterized by the above.
ことを特徴とする請求項1に記載の文書生成支援方法。 The document generation support method according to claim 1, wherein the step of outputting the weighted word information data calculates the modification priority in consideration of a display attribute of the word.
をさらに備えることを特徴とする請求項1または2に記載の文書生成支援方法。 The document generation according to claim 1, further comprising: calculating a correction priority for each component based on the correction priority of the word and outputting weighted component information data. Support method.
文書データの評価の対象となる対象単語と、当該対象単語の容易度と、を対応づけた対象単語容易度データを記憶する対象単語容易度データ記憶部と、
文書データにおいて、読み手の閲覧の流れを示す閲覧順序データを取得するとともに、前記構成要素ごとに、前記閲覧の流れにおいて読み手の目にとまりやすい座標である想定閲覧座標を算出して、想定閲覧座標データを出力する閲覧順序取得手段と、
前記構成要素における前記対象単語と一致する単語および当該単語の容易度を抽出するとともに、当該構成要素における前記想定閲覧座標と、抽出された単語の距離を算出し、前記単語、当該単語の容易度および距離を関連づけた単語情報データを出力する対象単語抽出手段と、
前記単語情報データの各単語について、容易度が低く距離が近い単語について修正優先度が高くなるように、当該単語の修正優先度を算出して、重み付き単語情報データを出力する単語評価手段
を備えることを特徴とする文書生成支援装置。 A document generation support device that supports generation of document data composed of a plurality of components,
A target word ease data storage unit for storing target word ease data in which target words to be evaluated for document data are associated with the ease of the target words;
In the document data, browsing order data indicating a reader's browsing flow is acquired, and for each component, an assumed browsing coordinate which is a coordinate that is easily perceived by the reader in the browsing flow is calculated. Browsing order acquisition means for outputting data;
The word that matches the target word in the component and the ease of the word are extracted, the assumed browsing coordinates in the component and the distance between the extracted words are calculated, and the word and the ease of the word And target word extraction means for outputting word information data associated with the distance,
For each word of the word information data, a word evaluation means for calculating the correction priority of the word and outputting the weighted word information data so that the correction priority is high for a word with low ease and a short distance A document generation support apparatus comprising:
ことを特徴とする請求項4に記載の文書生成支援装置。 The document generation support apparatus according to claim 4, wherein the word evaluation unit calculates the modification priority in consideration of a display attribute of the word.
をさらに備えることを特徴とする請求項4または5に記載の文書生成支援装置。 The component evaluation means which calculates the correction priority for every said component based on the said correction priority of the said word, and outputs weighted component information data, The further characterized by the above-mentioned. Document generation support device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098263A JP5466197B2 (en) | 2011-04-26 | 2011-04-26 | Document generation support method, document generation support device, and document generation support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098263A JP5466197B2 (en) | 2011-04-26 | 2011-04-26 | Document generation support method, document generation support device, and document generation support program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230540A true JP2012230540A (en) | 2012-11-22 |
JP5466197B2 JP5466197B2 (en) | 2014-04-09 |
Family
ID=47432039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011098263A Active JP5466197B2 (en) | 2011-04-26 | 2011-04-26 | Document generation support method, document generation support device, and document generation support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5466197B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017010107A (en) * | 2015-06-17 | 2017-01-12 | 大日本印刷株式会社 | Information processing device, information processing system and program |
-
2011
- 2011-04-26 JP JP2011098263A patent/JP5466197B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017010107A (en) * | 2015-06-17 | 2017-01-12 | 大日本印刷株式会社 | Information processing device, information processing system and program |
Also Published As
Publication number | Publication date |
---|---|
JP5466197B2 (en) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5439454B2 (en) | Electronic comic editing apparatus, method and program | |
US8952985B2 (en) | Digital comic editor, method and non-transitory computer-readable medium | |
US8588526B2 (en) | Visualization program, visualization method and visualization apparatus for visualizing reading order of content | |
JP5818172B2 (en) | Information display device, display control program, and display control method | |
JP6553418B2 (en) | Display control method, display control device and control program | |
JP2012118959A (en) | Translation display device | |
JP2003308310A (en) | Display method, display, display program, and recording medium recorded with display program | |
US9619126B2 (en) | Computer-readable non-transitory storage medium with image processing program stored thereon, element layout changed material generating device, image processing device, and image processing system | |
JP2021184271A (en) | Digital ink generation device, method, and program | |
JP5466197B2 (en) | Document generation support method, document generation support device, and document generation support program | |
JP5451696B2 (en) | Subtitle adding apparatus, content data, subtitle adding method and program | |
CN109445900B (en) | Translation method and device for picture display | |
JP5012605B2 (en) | Media production system | |
JP2013020558A (en) | Content data display device, content data display method, and program | |
JP4720695B2 (en) | Content provision method | |
JP5528410B2 (en) | Viewer device, server device, display control method, electronic comic editing method and program | |
US20180189251A1 (en) | Automatic multi-lingual editing method for cartoon content | |
JP5703244B2 (en) | Trace support device, trace support system, trace support method, and trace support program | |
JP5626891B2 (en) | Electronic book processing apparatus, electronic book processing method, and program | |
JP2014112333A (en) | Image information generation device, information processor, image information generation program, and information processing program | |
JP2018036684A (en) | Content display device and control method | |
JP2012068859A (en) | Display device, display method, program and recording medium therefor | |
JP2009157470A (en) | Electronic document processor and program | |
JP2008191879A (en) | Information display device, display method for information display device, information display program, and recording medium with information display program recorded | |
JP6048492B2 (en) | Color information storage device, color information storage method, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5466197 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |