JP2017102496A - Document review support program, document review support device, and document review support method - Google Patents
Document review support program, document review support device, and document review support method Download PDFInfo
- Publication number
- JP2017102496A JP2017102496A JP2015232603A JP2015232603A JP2017102496A JP 2017102496 A JP2017102496 A JP 2017102496A JP 2015232603 A JP2015232603 A JP 2015232603A JP 2015232603 A JP2015232603 A JP 2015232603A JP 2017102496 A JP2017102496 A JP 2017102496A
- Authority
- JP
- Japan
- Prior art keywords
- information
- document
- attribute information
- document file
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、文書校閲支援プログラム、文書校閲支援装置及び文書校閲支援方法に関する。 The present invention relates to a document review support program, a document review support apparatus, and a document review support method.
利用者に対してサービスを提供する事業者(以下、単に事業者とも呼ぶ)は、例えば、利用者に対して各種サービスを提供するために、業務システムの構築を行う。具体的に、事業者は、例えば、文書ファイルの生成元となるデータ(以下、生成元データとも呼ぶ)から、利用者が指定したファイル形式の文書ファイルを生成する機能を有する業務システムを構築する。 A provider that provides services to users (hereinafter, also simply referred to as a provider) constructs a business system in order to provide various services to users, for example. Specifically, for example, a business operator constructs a business system having a function of generating a document file in a file format designated by a user from data that is a generation source of a document file (hereinafter also referred to as generation source data). .
そして、利用者は、この場合、例えば、生成する文書ファイルのファイル形式(例えば、複数のファイル形式)を指定し、業務システムに対して生成元データを入力する。その後、業務システムは、例えば、生成元データの入力に応じて、その生成元データの変換し、利用者が指定したファイル形式の文書ファイルを生成する。これにより、利用者は、用途に応じた文書ファイルを取得することが可能になる(例えば、特許文献1乃至3参照)。
In this case, for example, the user designates the file format (for example, a plurality of file formats) of the document file to be generated, and inputs the generation source data to the business system. Thereafter, the business system, for example, converts the generation source data in accordance with the input of the generation source data, and generates a document file in a file format designated by the user. As a result, the user can acquire a document file corresponding to the application (see, for example,
利用者が同一の生成元データから異なるファイル形式の文書ファイルを複数生成する場合、各文書ファイルは、全て同一の内容である必要がある。しかしながら、生成元データから文書ファイルを生成するための変換プロセスは、ファイル形式によって異なる。そのため、業務システムが生成した複数の文書ファイルの内容には、差分が存在する場合がある。したがって、事業者は、複数の文書ファイルを生成した場合、生成した複数の文書ファイル間に存在する差分を抽出するために、例えば、生成した複数の文書ファイルの比較を行う。 When a user generates a plurality of document files having different file formats from the same generation source data, all the document files need to have the same contents. However, the conversion process for generating the document file from the generation source data differs depending on the file format. Therefore, there may be a difference in the contents of a plurality of document files generated by the business system. Therefore, when a plurality of document files are generated, the business operator compares, for example, the generated plurality of document files in order to extract differences existing between the generated plurality of document files.
具体的に、事業者は、この場合、生成した複数の文書ファイルをそれぞれ出力する。そして、事業者は、例えば、画像データを比較する機能を有する装置(以下、画像比較装置とも呼ぶ)を用いて、複数の文書ファイルの出力結果を画像データとして比較する。これにより、事業者は、生成した複数の文書ファイルに存在する差分を抽出することが可能になる。 Specifically, in this case, the business operator outputs the generated plurality of document files. Then, for example, the business operator compares the output results of a plurality of document files as image data using an apparatus having a function of comparing image data (hereinafter also referred to as an image comparison apparatus). As a result, the business operator can extract differences existing in the plurality of generated document files.
しかしながら、画像比較装置は、内容が同一であっても画像データ上の位置のみが異なる部分を差分として認識する場合がある。そのため、事業者は、この場合、生成した複数の文書ファイルに存在する差分の抽出を効率的に行うことができない。 However, the image comparison apparatus may recognize a difference in only the position on the image data even if the contents are the same. Therefore, in this case, the business operator cannot efficiently extract differences existing in the generated plurality of document files.
一方、事業者は、例えば、書面等から文字情報の読み込みを行い、読み込んだ文字情報を比較する機能を有する装置(以下、情報比較装置とも呼ぶ)を用いて、複数の文書ファイルの出力結果から文字情報の読み込みを行い、読み込んだ文字情報の比較を行う場合がある。 On the other hand, for example, the business operator reads character information from a document or the like, and uses a device having a function of comparing the read character information (hereinafter also referred to as an information comparison device), from the output results of a plurality of document files. There are cases where character information is read and the read character information is compared.
しかしながら、情報比較装置は、文書ファイルの出力結果に含まれる文字情報に対して行われている文字装飾(例えば、文字色の変更)等の有無を認識することができない場合がある。そのため、事業者は、この場合についても、生成した複数の文書ファイルに存在する差分の抽出を効率的に行うことができない。 However, the information comparison apparatus may not be able to recognize the presence / absence of character decoration (for example, change of character color) performed on the character information included in the output result of the document file. Therefore, even in this case, the business operator cannot efficiently extract differences existing in the generated plurality of document files.
そこで、一つの側面では、本発明は、ファイル形式の異なる複数の文書ファイル間における差分確認の利便性向上を図ることを可能とする文書校閲支援プログラム、文書校閲支援装置及び文書校閲支援方法を提供することを目的とする。 Accordingly, in one aspect, the present invention provides a document review support program, a document review support device, and a document review support method that can improve the convenience of checking differences between a plurality of document files having different file formats. The purpose is to do.
実施の形態の一態様では、コンピュータに、文書ファイルの生成に用いられる同一の生成元データに基づいて生成された、ファイル形式の異なる複数の文書ファイルについて、文書ファイルに含まれる文書の行単位の属性情報を生成し、前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する、処理を実行させる。 In one embodiment of the present invention, a plurality of document files having different file formats generated based on the same generation source data used for generating a document file are stored in a computer in line units of documents included in the document file. A process of generating attribute information and outputting a result of comparing the attribute information for each line in the document for the plurality of document files is executed.
一つの側面によれば、ファイル形式の異なる複数の文書ファイル間における差分確認の利便性向上を図ることを可能とする。 According to one aspect, it is possible to improve the convenience of checking differences between a plurality of document files having different file formats.
[情報処理システムの構成]
図1は、情報処理システム10の構成を示す図である。図1に示す情報処理システム10は、情報処理装置1(以下、文書校閲支援装置1またはコンピュータ1とも呼ぶ)と、記憶部2とを有する。そして、利用者端末11は、インターネットやイントラネット等からなるネットワークNWを介して情報処理装置1にアクセスすることが可能である。
[Configuration of information processing system]
FIG. 1 is a diagram illustrating a configuration of the
情報処理装置1は、例えば、生成元データから各ファイル形式の文書ファイルを生成する機能を有する業務システムが構築されている。具体的に、利用者は、例えば、利用者端末11を介して、文書ファイルの生成を行うファイル形式を指定し、業務システムに対して生成元データの入力を行う。そして、業務システムは、例えば、生成元データの入力があった場合に、その生成元データから、利用者が指定したファイル形式の文書ファイルを生成する処理(以下、文書ファイル生成処理とも呼ぶ)を実行する。
In the
また、情報処理装置1は、例えば、同一の生成元データから複数の文書ファイルを生成した場合に、生成された複数の文書ファイルの内容を比較し、差分が存在するか否かを判定する処理(以下、文書校閲支援処理とも呼ぶ)を実行する。文書校閲支援処理については後述する。
In addition, for example, when a plurality of document files are generated from the same generation source data, the
記憶部2は、利用者端末11を介して入力された生成元データや、情報処理装置1が生成した文書ファイル等を記憶する。
The
なお、情報処理装置1は、生成済の文書ファイルが記憶部2に記憶されている場合、文書ファイル生成処理を実行せずに、文書校閲支援処理のみを実行するものであってよい。
Note that when the generated document file is stored in the
[文書ファイル生成処理の具体例]
次に、文書ファイル生成処理の具体例について説明を行う。図2は、文書ファイル生成処理の具体例を説明する図である。
[Specific example of document file generation processing]
Next, a specific example of the document file generation process will be described. FIG. 2 is a diagram illustrating a specific example of the document file generation process.
情報処理装置1は、例えば、利用者が利用者端末11を介して生成元データを入力した場合、その生成元データから、予め利用者が指定したファイル形式の文書ファイルを生成する。具体的に、情報処理装置1は、図2に示すように、例えば、HTML(HyperText Markup Language)形式の文書ファイル(以下、単にHTMLファイルとも呼ぶ)を生成する。また、情報処理装置1は、図2に示すように、例えば、PDF(Portable Document Format)形式の文書ファイル(以下、単にPDFファイルとも呼ぶ)を生成する。
For example, when the user inputs generation source data via the
上記のように、同一の生成元データから異なるファイル形式の文書ファイルを複数生成する場合、各文書ファイルの内容は、全て同一である必要がある。しかしながら、生成元データから文書ファイルを生成するための変換プロセスは、ファイル形式によって異なる。そのため、業務システムが生成した複数の文書ファイルの内容には、差分が含まれる可能性がある。したがって、事業者は、複数の文書ファイルを生成した場合、生成した複数の文書ファイル間に存在する差分を抽出するために、例えば、生成した複数の文書ファイルの比較を行う。 As described above, when a plurality of document files having different file formats are generated from the same generation source data, the contents of each document file must all be the same. However, the conversion process for generating the document file from the generation source data differs depending on the file format. Therefore, there is a possibility that differences are included in the contents of a plurality of document files generated by the business system. Therefore, when a plurality of document files are generated, the business operator compares, for example, the generated plurality of document files in order to extract differences existing between the generated plurality of document files.
具体的に、事業者は、この場合、生成した複数の文書ファイルをそれぞれ出力する。そして、事業者は、例えば、画像比較装置を用いて、複数の文書ファイルの出力結果を画像データとして比較する。これにより、事業者は、生成した複数の文書ファイルに存在する差分を抽出することが可能になる。 Specifically, in this case, the business operator outputs the generated plurality of document files. Then, the business operator compares the output results of a plurality of document files as image data using, for example, an image comparison device. As a result, the business operator can extract differences existing in the plurality of generated document files.
しかしながら、画像比較装置は、内容が同一であっても画像データ上の位置のみが異なる部分を差分として認識する場合がある。そのため、事業者は、この場合、生成した複数の文書ファイルに存在する差分の抽出を効率的に行うことができない。 However, the image comparison apparatus may recognize a difference in only the position on the image data even if the contents are the same. Therefore, in this case, the business operator cannot efficiently extract differences existing in the generated plurality of document files.
一方、事業者は、例えば、情報比較装置を用いて、複数の文書ファイルの出力結果から文字情報の読み込みを行い、読み込んだ文字情報の比較を行う場合がある。 On the other hand, for example, an operator may use an information comparison device to read character information from the output results of a plurality of document files and compare the read character information.
しかしながら、情報比較装置は、文書ファイルの出力結果に含まれる文字情報に対して行われている文字装飾(例えば、文字色の変更)等の有無を認識することができない場合がある。そのため、事業者は、この場合についても、生成した複数の文書ファイルに存在する差分の抽出を効率的に行うことができない。 However, the information comparison apparatus may not be able to recognize the presence / absence of character decoration (for example, change of character color) performed on the character information included in the output result of the document file. Therefore, even in this case, the business operator cannot efficiently extract differences existing in the generated plurality of document files.
そこで、本実施の形態における情報処理装置1は、ファイル形式の異なる複数の文書ファイル(同一の生成元データに基づいて生成された複数の文書ファイル)について、文書ファイルに含まれる文書の属性情報を生成する。そして、情報処理装置1は、複数の文書ファイルについて、属性情報を比較した結果を出力する。
Therefore, the
すなわち、本実施の形態における情報処理装置1は、比較を行う複数の文書ファイルからそれぞれ抽出した情報から、同一のフォーマットからなる属性情報をそれぞれ生成する。具体的に、情報処理装置1は、例えば、文書ファイルに含まれる文字に対して文字修飾が行われているか否かを示す情報や、文書ファイルに空白文字(空白)が存在するか否かを示す情報等、事業者が事前に指定した情報(差分確認を行う必要がある情報)が含まれるように、属性情報を生成する。
That is, the
これにより、情報処理装置1は、各属性情報の比較を行うことで、事業者が指定した情報に関する差分が複数の文書ファイル間において存在するか否かの判定を行うことが可能になる。そのため、情報処理装置1は、複数の文書ファイル間において差分が存在するか否かの判定を容易に行うことが可能になる。したがって、情報処理装置1は、ファイル形式の異なる複数の文書ファイル間における差分確認の利便性向上を図ることを可能にする。
Thereby, the
[情報処理装置のハードウエア構成]
次に、情報処理装置1のハードウエア構成について説明する。図3は、情報処理装置1のハードウエア構成を示す図である。
[Hardware configuration of information processing device]
Next, the hardware configuration of the
情報処理装置1は、プロセッサであるCPU101と、メモリ102と、外部インターフェース(I/Oユニット)103と、記憶媒体104とを有する。各部は、バス105を介して互いに接続される。
The
記憶媒体104は、例えば、記憶媒体104内のプログラム格納領域(図示しない)に、文書校閲支援処理等を行うためのプログラム110を記憶する。また、記憶媒体104は、例えば、文書校閲支援処理等を行う際に用いられる情報を記憶する情報格納領域130(以下、記憶部130とも呼ぶ)を有する。
The
CPU101は、図3に示すように、プログラム110の実行時に、プログラム110を記憶媒体104からメモリ102にロードし、プログラム110と協働して文書校閲支援処理等を行う。また、外部インターフェース103は、利用者端末11と通信を行う。
As shown in FIG. 3, when executing the program 110, the
[情報処理装置の機能]
次に、情報処理装置1の機能について説明する。図4は、情報処理装置1の機能ブロック図である。
[Functions of information processing device]
Next, functions of the
情報処理装置1のCPU101は、プログラム110と協働することにより、例えば、文書ファイル生成部111と、属性情報生成部112(以下、単に情報生成部112とも呼ぶ)と、情報管理部113と、情報比較部114と、結果出力部115として動作する。また、情報格納領域130には、生成元データ131(以下、生成元情報131とも呼ぶ)と、文書ファイル132(以下、第1文書ファイル情報132とも呼ぶ)と、文書ファイル133(以下、第2文書ファイル情報133とも呼ぶ)と、フォーマット情報134とが記憶されている。さらに、情報格納領域130には、第1属性情報135と、第2属性情報136と、比較結果情報137とが記憶されている。情報格納領域130は、例えば、図1で説明した記憶部2に対応するものであってよい。
The
第1文書ファイル情報132及び第2文書ファイル情報133は、生成元情報131を変換することにより生成された文書ファイルである。具体的に、第1文書ファイル情報132は、例えば、PDFファイルであり、第2文書ファイル情報133は、例えば、HTMLファイルである。第1文書ファイル情報132及び第2文書ファイル情報133の具体例については後述する。
The first
なお、以下、第1文書ファイル情報132及び第2文書ファイル情報133の比較を行う場合について説明を行うが、情報処理装置1は、3つ以上の異なるファイル形式の文書ファイルを比較するものであってもよい。
Hereinafter, a case where the first
文書ファイル生成部111は、文書ファイル生成処理を実行する。すなわち、文書ファイル生成部111は、例えば、利用者端末11から生成元情報131の入力があった場合に、入力された生成元情報131から、第1文書ファイル情報132及び第2文書ファイル情報133を生成する。
The document
なお、文書ファイル生成部111は、例えば、所定のタイミングになったときに、予め情報格納領域130に記憶された生成元情報131を取得し、第1文書ファイル情報132及び第2文書ファイル情報133を生成するものであってもよい。
For example, the document
属性情報生成部112は、フォーマット情報134に従って、第1文書ファイル情報132から第1属性情報135を生成する。また、属性情報生成部112は、フォーマット情報134に従って、第2文書ファイル情報133から第2属性情報136を生成する。フォーマット情報134、第1属性情報135及び第2属性情報136の具体例については後述する。
The attribute
情報管理部113は、利用者端末11から生成元情報131が入力された場合に、入力された生成元情報131を情報格納領域130に記憶する。また、情報管理部113は、文書ファイル生成部111が第1文書ファイル情報132または第2文書ファイル情報133を生成した場合に、生成された第1文書ファイル情報132または第2文書ファイル情報133を情報格納領域130に記憶する。さらに、情報管理部113は、属性情報生成部112が第1属性情報135または第2属性情報136を生成した場合に、生成された第1属性情報135または第2属性情報136を情報格納領域130に記憶する。
When the
情報比較部114は、属性情報生成部112が生成した第1属性情報135及び第2属性情報136を比較し、比較結果情報137を生成する。そして、情報管理部113は、この場合、生成された比較結果情報137を情報格納領域130に記憶する。
The
結果出力部115は、情報比較部114が生成した比較結果情報137を出力する。結果出力部115は、例えば、比較結果情報137を利用者端末11に出力する。
The
[第1の実施の形態]
次に、第1の実施の形態について説明する。図5は、第1の実施の形態における文書校閲支援処理の概略を説明するフローチャート図である。また、図6は、第1の実施の形態における文書校閲支援処理の概略を説明する図である。図6を参照しながら図5の文書校閲支援処理の概略について説明する。
[First Embodiment]
Next, a first embodiment will be described. FIG. 5 is a flowchart for explaining the outline of the document review support process in the first embodiment. FIG. 6 is a diagram for explaining the outline of the document review support process in the first embodiment. The outline of the document review support process of FIG. 5 will be described with reference to FIG.
情報処理装置1は、図5に示すように、第1文書ファイル情報132及び第2文書ファイル情報133の比較を行うタイミング(以下、文書校閲タイミングとも呼ぶ)になるまで待機する(S1のNO)。文書校閲タイミングは、例えば、情報処理装置1が文書ファイル生成処理を実行し、第1文書ファイル情報132及び第2文書ファイル情報133が生成した直後のタイミングであってよい。また、文書校閲タイミングは、例えば、第1文書ファイル情報132及び第2文書ファイル情報133の比較を行う旨の入力が利用者端末11からあったタイミングであってよい。
As shown in FIG. 5, the
そして、文書校閲タイミングになった場合(S1のYES)、情報処理装置1は、図6に示すように、同一の生成元情報131に基づいて生成された第1文書ファイル情報132及び第2文書ファイル情報133について、文書ファイルに含まれる文書の行単位の第1属性情報135及び第2属性情報136をそれぞれ生成する(S2)。
When the document review timing is reached (YES in S1), the
具体的に、情報処理装置1は、情報格納領域130に記憶されたフォーマット情報134に従って、情報格納領域130に記憶された第1文書ファイル情報132を第1属性情報135に変換する。また、情報処理装置1は、情報格納領域130に記憶されたフォーマット情報134に従って、情報格納領域130に記憶された第2文書ファイル情報133を第2属性情報136に変換する。
Specifically, the
すなわち、情報処理装置1は、ファイル形式の異なる文書ファイルである第1文書ファイル情報132及び第2文書ファイル情報133から、事業者が差分確認を行うために指定した情報を含む第1属性情報135及び第2属性情報136を生成する。
That is, the
これにより、情報処理装置1は、第1属性情報135及び第2属性情報136の比較を行うことで、事業者が指定した情報に関する差分が第1文書ファイル情報132及び第2文書ファイル情報133の間に存在するか否かの判定を行うことが可能になる。そのため、事業者は、第1文書ファイル情報132及び第2文書ファイル情報133の間に差分が存在するか否かを容易に判定することが可能になる。
As a result, the
また、情報処理装置1は、第1属性情報135及び第2属性情報136を、文書ファイルに含まれる文書の行単位に生成する。これにより、情報処理装置1は、各文書ファイルの出力結果に含まれる改行の数が異なる等、出力結果の形式が異なる場合であっても、文書の内容に関する差分のみを抽出することが可能になる。
In addition, the
その後、情報処理装置1は、図6に示すように、第1文書ファイル情報132及び第2文書ファイル情報133について、第1属性情報135及び第2属性情報136を比較する(S3)。具体的に、情報処理装置1は、第1文書ファイル情報132及び第2文書ファイル情報133について、文書内の行それぞれについての属性情報(第1属性情報135及び第2属性情報136)を比較する。そして、情報処理装置1は、S3の処理で比較した結果を利用者端末11に出力する(S4)。
Thereafter, the
このように、情報処理装置1は、同一の生成元情報131に基づいて生成されたファイル形式の異なる複数の文書ファイル(第1文書ファイル情報132及び第2文書ファイル情報133)について、例えば、各文書ファイルに含まれる文書の行単位の属性情報(第1属性情報135及び第2属性情報136)を生成する。そして、情報処理装置1は、複数の文書ファイルについて、文書内の行毎に各属性情報を比較した結果を出力する。
In this way, the
これにより、情報処理装置1は、各属性情報の比較を行うことで、事業者が指定した情報に関する差分が複数の文書ファイル間において存在するか否かの判定を行うことが可能になる。そのため、情報処理装置1は、複数の文書ファイル間において差分が存在するか否かの判定を容易に行うことが可能になる。したがって、情報処理装置1は、ファイル形式の異なる複数の文書ファイル間における差分確認の利便性向上を図ることを可能にする。
Thereby, the
[第1の実施の形態の詳細]
次に、第1の実施の形態の詳細について説明する。図7は、第1の実施の形態における文書校閲支援処理の詳細を説明するフローチャート図である。また、図8から図22は、第1の実施の形態における文書校閲支援処理の詳細を説明する図である。図8から図22を参照しながら、図7の文書校閲支援処理の詳細を説明する。なお、以下、第1文書ファイル情報132がPDFファイルであり、第2文書ファイル情報133がHTMLファイルであるものとして説明を行う。
[Details of First Embodiment]
Next, details of the first embodiment will be described. FIG. 7 is a flowchart for explaining the details of the document review support processing in the first embodiment. FIGS. 8 to 22 are diagrams for explaining the details of the document review support process in the first embodiment. Details of the document review support process of FIG. 7 will be described with reference to FIGS. In the following description, it is assumed that the first
情報処理装置1の属性情報生成部112は、図7に示すように、文書校閲タイミングになるまで待機する(S11のNO)。そして、文書校閲タイミングになった場合(S11のYES)、属性情報生成部112は、情報格納領域130に記憶されている第1文書ファイル情報132、第2文書ファイル情報133及びフォーマット情報134を取得する(S12)。以下、第1文書ファイル情報132、第2文書ファイル情報133及びフォーマット情報134の具体例について説明を行う。
As shown in FIG. 7, the attribute
[第1文書ファイルの具体例]
初めに、第1文書ファイル情報132の具体例について説明を行う。図8は、第1文書ファイル情報132の具体例を説明する図である。また、図9は、図8に示す第1文書ファイル情報132の出力結果を説明する図である。なお、図8に示す第1文書ファイル情報132は、図9に示す文書を利用者端末11等に表示するためのPDFファイルである。
[Specific example of the first document file]
First, a specific example of the first
図8に示す第1文書ファイル情報132には、利用者端末11等に出力する際に、1行目として出力される文書を定義する部分情報132aと、2行目として出力される文書を定義する部分情報132bと、3行目として出力される文書を定義する部分情報132cとが含まれる。なお、図8では、第1文書ファイル情報132に含まれるヘッダやトレーラ等の情報の記載を省略している。
The first
具体的に、図8に示す例において、「BT」は、出力する文書を定義する部分であるテキストオブジェクトの開始位置を示している。そして、「/F1 24 Tf」は、F1によって識別されるフォントを使用し、24ポイントの大きさで文書を出力する旨を示している。また、「ET」は、テキストオブジェクトの終了位置を示している。
Specifically, in the example shown in FIG. 8, “BT” indicates the start position of a text object that is a part that defines a document to be output. “/
次に、図8に示す例において、部分情報132aに含まれる「1 0 0 1 0 648 Tm」は、座標(0,648)から文書の出力を行う旨を示している。そして、部分情報132aに含まれる「( Hello World) Tj」は、図9に示すように、「 Hello World」を出力する旨を示している。なお、「 Hello World」の「H」の前には、半角2文字分の空白が存在する。
Next, in the example shown in FIG. 8, “1 0 0 1 0 648 Tm” included in the
続いて、図8に示す例において、部分情報132bに含まれる「1 0 0 1 72 612 Tm」は、座標(72,612)から文書の出力を行う旨を示している。そして、部分情報132bに含まれる「<20204D53835383568362834E3234> Tj」は、図9に示すように、「 MSゴシック24」を出力する旨を示している。なお、「 MSゴシック24」の「M」の前には、半角2文字分の空白が存在する。
Subsequently, in the example shown in FIG. 8, “1 0 0 1 72 612 Tm” included in the
また、図8に示す例において、部分情報132bに含まれる「0.5 0 0 rg」は、赤色の文字の出力を開始する旨を示している。そして、部分情報132bに含まれる「<837C834383938367> Tj」は、図9に示すように、「ポイント」を出力する旨を示している。
In the example shown in FIG. 8, “0.5 0 0 rg” included in the
さらに、図8に示す例において、部分情報132cに含まれる「1 0 0 1 72 576 Tm」は、座標(72,576)から文書の出力を行う旨を示している。また、図8に示す例において、部分情報132cに含まれる「0 g」は、黒色の文字の出力を開始する旨を示している。そして、部分情報132cに含まれる「<82BB82EA82F08A44904682C982B582BD82E082CC> Tj」は、図9に示すように、「それを灰色にしたもの」を出力する旨を示している。
Further, in the example shown in FIG. 8, “1 0 0 1 72 576 Tm” included in the
[第2文書ファイルの具体例]
次に、第2文書ファイル情報133の具体例について説明を行う。図10は、第2文書ファイル情報133の具体例を説明する図である。また、図11は、図10に示す第2文書ファイル情報133の出力結果を説明する図である。なお、図10に示す第2文書ファイル情報133は、図11に示す文書を利用者端末11等に出力するためのHTMLファイルである。
[Specific example of the second document file]
Next, a specific example of the second
図10に示す第2文書ファイル情報133には、利用者端末11等に出力する際に、1行目として出力される文書を定義する部分情報133aと、2行目として出力される文書を定義する部分情報133bと、3行目として出力される文書を定義する部分情報133cとが含まれる。なお、図10では、第2文書ファイル情報133に含まれるbody部の情報についてのみ記載している。
The second
具体的に、図10に示す例において、部分情報133aは、24ポイントの空白(半角2文字分)と、フォントがMSゴシックである24ポイントの「Hello World」とを出力する旨を示している。
Specifically, in the example illustrated in FIG. 10, the
続いて、図10に示す例において、部分情報133bは、24ポイントの空白(半角2文字分)と、半角6文字分の空白(「 」によって指定された半角5文字分の空白と、「 」の後のスペースによって指定された半角1文字分の空白)とを出力する旨を示している。
Subsequently, in the example illustrated in FIG. 10, the
また、部分情報133bは、フォントがMSゴシックである24ポイントの「MS」、「ゴシック」及び「24」を出力する旨を示している。そして、部分情報133bは、フォントがMSゴシックであって24ポイントの赤色の文字である「ポイント」を出力する旨を示している。
Further, the
さらに、図10に示す例において、部分情報133cは、24ポイントの空白(半角2文字分)と、半角4文字分の空白(「 」によって指定された半角3文字分の空白と、「 」の後のスペースによって指定された半角1文字分の空白)とを出力する旨を示している。そして、部分情報133cは、フォントがMSゴシックである24ポイントの「それを灰色にしたもの」を出力する旨を示している。図10に示す他の情報については説明を省略する。
Further, in the example shown in FIG. 10, the
[フォーマット情報の具体例]
次に、フォーマット情報134の具体例について説明を行う。図12は、フォーマット情報134の具体例を説明する図である。
[Specific examples of format information]
Next, a specific example of the
図12に示すフォーマット情報134は、第1文書ファイル情報132または第2文書ファイル情報133の出力結果におけるページ数を示す「ページ数」を含む。また、図12に示すフォーマット情報134は、第1文書ファイル情報132または第2文書ファイル情報133の出力結果における行数を示す「行数」を含む。
The
そして、図12に示すフォーマット情報134は、第1文書ファイル情報132または第2文書ファイル情報133の出力結果に含まれる各行において文字の出力が開始される位置を示す「文字開始列」と、各行において文字が出力される文字数を示す「全体文字数」とを含む。また、図12に示すフォーマット情報134は、各行の文字について文字修飾が行われている回数を示す「修飾数」を含む。文字修飾は、例えば、文字色の変更、文字の太文字化、文字の斜体化及び文字の下線追加等を含むものであってよい。
The
さらに、図12に示すフォーマット情報134は、各行において文字修飾された文字の表示が開始される位置を示す「修飾開始列」を、「修飾数」が示す数(図12に示す例では「n」)だけ含む。また、図12に示すフォーマット情報134は、各行において文字修飾された文字が表示される文字数を示す「修飾文字数」を、「修飾数」が示す数(図12に示す例では「n」)だけ含む。そして、図12に示すフォーマット情報134は、フォーマット情報134に含まれる各情報の終端を示す情報が設定される「ENDコード」を含む。
Further, the
図7に戻り、属性情報生成部112は、S12の処理で取得したフォーマット情報134に従って、S12の処理で取得した第1文書ファイル情報132から第1属性情報135を生成する(S13)。また、属性情報生成部112は、S12の処理で取得したフォーマット情報134に従って、S12の処理で取得した第2文書ファイル情報133から第2属性情報136を生成する(S14)。以下、第1属性情報135及び第2属性情報136の具体例について説明を行う。
Returning to FIG. 7, the attribute
[第1属性情報の具体例]
図13は、図8で説明した第1文書ファイル情報132から生成された第1属性情報135の具体例を説明する図である。図13に示す第1属性情報135は、図12で説明したフォーマット情報134に含まれる各情報を項目として有している。なお、図13に示す第1属性情報135は、説明の便宜上、第1属性情報135に含まれる各情報を識別する「項番」を項目として有している。
[Specific example of first attribute information]
FIG. 13 is a diagram illustrating a specific example of the
具体的に、図8に示す第1文書ファイル情報132の部分情報132aは、「Hello world」の先頭に、半角2文字分の空白が存在する旨の情報を含んでいる。そのため、この場合、「Hello world」の出力の開始位置は、行の先頭から半角3文字目である。
Specifically, the
また、「Hello world」は、半角11文字からなる。そのため、「Hello world」は、行の先頭から半角3文字目から半角13文字目までに出力される。したがって、属性情報生成部112は、図13に示すように、「ページ数」が「1」であって「行数」が「1」である情報の「文字開始列」に「3」を設定し、「全体文字数」に「13」を設定する。
“Hello world” consists of 11 single-byte characters. Therefore, “Hello world” is output from the third half-width character to the 13th half-width character from the beginning of the line. Therefore, as shown in FIG. 13, the attribute
そして、図8に示す第1文書ファイル情報132の部分情報132aには、文字修飾についての情報が含まれていない。そのため、属性情報生成部112は、図13に示すように、「ページ数」が「1」であって「行数」が「1」である情報の「修飾数」、「修飾開始列」及び「修飾文字数」に、情報が存在しないことを示す「−」を設定する。さらに、属性情報生成部112は、例えば、図13に示すように、「ENDコード」に、各行に設定される情報の終端を示す「END」を設定する。
The
次に、図8に示す第1文書ファイル情報132の部分情報132bは、文書の出力の開始が座標(72,612)から行われる旨の情報を含んでいる。また、図8に示す第1文書ファイル情報132において、文字のフォントは24ポイントである。そのため、属性情報生成部112は、X座標である72をフォントの24で除算することにより、文書の出力が開始される位置の前には、全角3文字分(半角6文字分)の空白が存在するものと判定する。そして、「MSゴシック24ポイント」の文字列の先頭には、半角2文字分の空白が存在する。すなわち、「MSゴシック24ポイント」の前には、半角8文字分の空白が存在する。
Next, the
また、「MSゴシック24ポイント」は、半角20文字からなる。そのため、「MSゴシック24ポイント」は、行の先頭から半角9文字目から半角28文字目までに出力される。したがって、属性情報生成部112は、図13に示すように、「ページ数」が「1」であって「行数」が「2」である情報の「文字開始列」に「9」を設定し、「全体文字数」に「28」を設定する。
“MS Gothic 24-point” consists of 20 single-byte characters. Therefore, “MS Gothic 24-point” is output from the 9th character to the 28th character from the beginning of the line. Therefore, as shown in FIG. 13, the attribute
そして、図8に示す第1文書ファイル情報132の部分情報132bには、「ポイント」が赤色の文字である旨の情報が含まれている。そのため、属性情報生成部112は、図13に示すように、「修飾数」に「1」を設定し、「修飾開始列」に「ポイント」の文字開始列である「21」を設定し、「修飾文字数」に「ポイント」の文字数である「8」を設定する。さらに、属性情報生成部112は、例えば、「ENDコード」に「END」を設定する。
The
続いて、図8に示す第1文書ファイル情報132の部分情報132cにおいて、文書の出力の開始が座標(72,576)から行われる旨の情報を含んでいる。また、図8に示す第1文書ファイル情報132において、文字のフォントは24ポイントである。そのため、属性情報生成部112は、X座標である72をフォントの24で除算することにより、「それを灰色にしたもの」の前には、全角3文字分(半角6文字分)の空白が存在するものと判定する。
Subsequently, the
そして、「それを灰色にしたもの」は、半角20文字からなる。そのため、「それを灰色にしたもの」は、行の先頭から半角7文字目から半角26文字目までに出力される。そのため、属性情報生成部112は、図13に示すように、「ページ数」が「1」であって「行数」が「3」である情報の「文字開始列」に「7」を設定し、「全体文字数」に「26」を設定する。
And “what made it gray” consists of 20 half-width characters. For this reason, “the color in gray” is output from the 7th half-width character to the 26th half-width character from the beginning of the line. Therefore, as shown in FIG. 13, the attribute
さらに、図8に示す第1文書ファイル情報132の部分情報132cには、文字修飾についての情報が含まれていない。そのため、属性情報生成部112は、図13に示すように、「ページ数」が「1」であって「行数」が「3」である情報の「修飾数」、「修飾開始列」及び「修飾文字数」に「−」を設定する。さらに、属性情報生成部112は、例えば、図13に示すように、「ENDコード」に「END」を設定する。
Further, the
[第2属性の具体例]
次に、第2属性情報136の具体例について説明を行う。図14は、図10で説明した第2文書ファイル情報133から生成された第2属性情報136の具体例を説明する図である。図14に示す第2属性情報136は、図12で説明したフォーマット情報134に含まれる各情報を項目として有している。なお、図14に示す第2属性情報136は、説明の便宜上、図13で説明した場合と同様に、第2属性情報136に含まれる各情報を識別する「項番」を項目として有している。
[Specific example of the second attribute]
Next, a specific example of the
具体的に、図10に示す第2文書ファイル情報133の部分情報133aは、「Hello world」の先頭に、半角2文字分の空白が存在する旨の情報を含んでいる。そのため、この場合、「Hello world」の出力の開始位置は、行の先頭から半角3文字目である。
Specifically, the
また、「Hello world」は、半角11文字からなる。そのため、「Hello world」は、行の先頭から半角3文字目から半角13文字目までに出力される。したがって、属性情報生成部112は、図14に示すように、「ページ数」が「1」であって「行数」が「1」である情報の「文字開始列」に「3」を設定し、「全体文字数」に「13」を設定する。
“Hello world” consists of 11 single-byte characters. Therefore, “Hello world” is output from the third half-width character to the 13th half-width character from the beginning of the line. Therefore, as shown in FIG. 14, the attribute
そして、図10に示す第2文書ファイル情報133の部分情報133aには、文字修飾についての情報が含まれていない。そのため、属性情報生成部112は、図14に示すように、「ページ数」が「1」であって「行数」が「1」である情報の「修飾数」、「修飾開始列」及び「修飾文字数」に「−」を設定する。さらに、属性情報生成部112は、例えば、図14に示すように、「ENDコード」に「END」を設定する。
The
次に、図10に示す第2文書ファイル情報133の部分情報133bは、「MSゴシック24ポイント」の前に、半角8文字分の空白が存在する旨の情報を含んでいる。また、「MSゴシック24ポイント」は、半角20文字からなる。そのため、「MSゴシック24ポイント」は、行の先頭から半角9文字目から半角28文字目までに出力される。したがって、属性情報生成部112は、図14に示すように、「ページ数」が「1」であって「行数」が「2」である情報の「文字開始列」に「9」を設定し、「全体文字数」に「28」を設定する。
Next, the
そして、図10に示す第2文書ファイル情報133の部分情報133bには、「ポイント」が赤色の文字である旨の情報が含まれている。そのため、属性情報生成部112は、図14に示すように、「修飾数」に「1」を設定し、「修飾開始列」に「ポイント」の文字開始列である「21」を設定し、「修飾文字数」に「ポイント」の文字数である「8」を設定する。さらに、属性情報生成部112は、例えば、「ENDコード」に「END」を設定する。
The
続いて、図10に示す第2文書ファイル情報133の部分情報133cは、「それを灰色にしたもの」の前に、半角6文字分の空白が存在する旨の情報を含んでいる。また、「それを灰色にしたもの」は、半角20文字からなる。そのため、「それを灰色にしたもの」は、行の先頭から半角7文字目から半角26文字目までに出力される。したがって、属性情報生成部112は、図14に示すように、「ページ数」が「1」であって「行数」が「3」である情報の「文字開始列」に「7」を設定し、「全体文字数」に「26」を設定する。
Subsequently, the
そして、図10に示す第2文書ファイル情報133の部分情報133cには、文字修飾についての情報が含まれていない。そのため、属性情報生成部112は、図14に示すように、「ページ数」が「1」であって「行数」が「3」である情報の「修飾数」、「修飾開始列」及び「修飾文字数」に「−」を設定する。さらに、属性情報生成部112は、例えば、図14に示すように、「ENDコード」に「END」を設定する。
The
すなわち、属性情報生成部112は、S13及びS14の処理において、ファイル形式の異なる第1文書ファイル情報132及び第2文書ファイル情報133から、同一のフォーマットである第1属性情報135及び第2属性情報136を生成する。これにより、属性情報生成部112は、第1属性情報135と第2属性情報136とを比較することで、第1文書ファイル情報132及び第2文書ファイル情報133に差分が存在するか否かの判定を容易に行うことが可能になる。
That is, the attribute
具体的に、図13に示す第1属性情報135及び図14に示す第2属性情報136は、同一の内容である。そのため、属性情報生成部112は、後述するように、図8に示す第1文書ファイル情報132と、図10に示す第2文書ファイル情報133との間(図9に示す出力結果と、図11に示す出力結果との間)には、差分が存在しない旨の比較結果情報137を出力する。これにより、事業者は、第1文書ファイル情報132及び第2文書ファイル情報133が、差分を発生させることなく生成されたことを確認することが可能になる。第1属性情報135と第2属性情報136との間に差分が存在する場合の具体例については後述する。
Specifically, the
図7に戻り、情報処理装置1の情報比較部114は、第1属性情報135及び第2属性情報136に含まれる情報のうち、比較を行わない情報の削除を行うか否かを判定する(S15)。具体的に、情報比較部114は、例えば、事業者が情報処理装置1に対して予め行った設定の内容を参照し、比較を行わない情報の削除を行うか否かを判定するものであってよい。
Returning to FIG. 7, the
そして、比較を行わない情報の削除を行わない場合(S15のNO)、情報比較部114は、S13の処理で生成した第1属性情報135と、S14の処理で生成した第2属性情報136とを比較する(S18)。その後、結果出力部115は、例えば、S18の処理で情報比較部114が比較した結果である比較結果情報137を利用者端末11等に出力する(S19)。以下、S18及びS19の処理の具体例について説明する。
If the information not to be compared is not deleted (NO in S15), the
[S18及びS19の処理の具体例(1)]
図15は、第1属性情報135の具体例を説明する図である。また、図16は、第2属性情報136の具体例を説明する図である。さらに、図17は、比較結果情報137の具体例を説明する図である。なお、図15から図17は、図8から図14で説明した具体例とは異なる具体例を説明する図である。
[Specific Example of Processing in S18 and S19 (1)]
FIG. 15 is a diagram illustrating a specific example of the
具体的に、図15に示す第1属性情報135において、「ページ数」が「1」であって「行数」が「2」である情報には、「修飾数」として「2」が設定され、「修飾1開始列」として「8」が設定され、「修飾1文字数」として「3」が設定されている。さらに、図15に示す第1属性情報135において、「ページ数」が「1」であって「行数」が「2」である情報には、「修飾2開始列」として「12」が設定され、「修飾2文字数」として「4」が設定されている。すなわち、図15に示す第1属性情報135における「ページ数」が「1」であって「行数」が「2」である情報には、文字修飾に関する情報が2つ含まれている。
Specifically, in the
一方、図16に示す第2属性情報136において、「ページ数」が「1」であって「行数」が「2」である情報には、「修飾数」として「1」が設定され、「修飾1開始列」として「8」が設定され、「修飾1文字数」として「3」が設定されている。すなわち、図16に示す第1属性情報135における「ページ数」が「1」であって「行数」が「2」である情報には、文字修飾に関する情報が1つのみ含まれている。
On the other hand, in the
そのため、情報比較部114は、この場合、S18の処理において、第1属性情報135及び第2属性情報136のうち、第1属性情報135にのみ存在する文字修飾の情報が存在すると判定する。
Therefore, in this case, the
さらに、図15に示す第1属性情報135において、「ページ数」が「1」であって「行数」が「4」である情報には、「文字開始列」として「3」が設定され、「全体文字数」として「10」が設定されている。一方、図16に示す第2属性情報136において、「ページ数」が「1」であって「行数」が「4」である情報には、「文字開始列」として「1」が設定され、「全体文字数」として「8」が設定されている。
Further, in the
そのため、情報比較部114は、この場合、S18の処理において、図15に示す第1属性情報135に情報が含まれる空白の数と、図16に示す第2属性情報136に情報が含まれる空白の数とが異なっていると判定する。
Therefore, in this case, in the processing of S18, the
そして、結果出力部115は、S19の処理において、S18の処理における比較結果から比較結果情報137を生成し、利用者端末11に出力する。具体的に、結果出力部115は、例えば、図17に示すように、「PDF文書の1ページ目の2行目」に「文字修飾の差異が存在」する旨の情報を比較結果情報137に含める。また、結果出力部115は、例えば、図17に示すように、「PDF文書の1ページ目の5行目」に「表示位置の差異が存在」する旨の情報を比較結果情報137に含める。
And the
これにより、結果出力部115は、事業者に対し、比較結果情報137に情報が含まれる箇所についての見直しを行う契機を与えることが可能になる。
As a result, the
なお、図16に示す第2属性情報136において、「修飾2開始列」及び「修飾2文字数」には、「−」が設定されている。そのため、属性情報生成部112は、図16に示す第2属性情報136を生成する際に、「修飾2開始列」及び「修飾2文字数」の項目を含めないものであってもよい。
In the
図7に戻り、S15の処理において、比較を行わない情報の削除を行わない場合(S15のNO)、情報比較部114は、例えば、第1属性情報135及び第2属性情報136から、ページ数を示す情報及び行を示す情報を削除する(S16)。
Returning to FIG. 7, in the process of S <b> 15, when the information not to be compared is not deleted (NO in S <b> 15), the
すなわち、例えば、PDFファイルには、ページ数の概念があるのに対し、HTMLファイルには、ページ数の概念がない。そのため、HTMLファイル(第2文書ファイル情報133)から生成した属性情報(第2属性情報136)は、全ての情報が1ページに含まれるものとして生成される。そのため、この場合、第1属性情報135及び第2属性情報136において、同じ内容の情報を含む行に対応する「ページ数」及び「行数」に、それぞれ異なる情報が設定される可能性がある。したがって、情報比較部114は、この場合、第1属性情報135及び第2属性情報136の比較を行うことができない。
That is, for example, a PDF file has a concept of the number of pages, whereas an HTML file does not have a concept of the number of pages. Therefore, the attribute information (second attribute information 136) generated from the HTML file (second document file information 133) is generated assuming that all information is included in one page. Therefore, in this case, in the
そこで、情報比較部114は、第1属性情報135及び第2属性情報136の比較を行う前に、例えば、「ページ数」及び「行数」(ファイル形式間において単純に比較することができない項目)に対応する情報を、比較を行う情報から除外するものであってよい。これにより、情報比較部114は、第1属性情報135及び第2属性情報136に、単純に比較することができない項目に対応する情報が含まれている場合であっても、第1属性情報135及び第2属性情報136の比較を行うことが可能になる。
Therefore, before comparing the
さらに、情報比較部114は、S16の処理の後、第1属性情報135及び第2属性情報136から、改行が含まれる旨を示す情報を削除する(S17)。
Further, after the process of S16, the
すなわち、第1文書ファイル情報132の出力結果に含まれる改行の数と、第2文書ファイル情報133の出力結果に含まれる改行の数とが異なる場合がある。この場合、第1属性情報135に含まれる情報の行数と第2属性情報136に含まれる情報の行数とが異なることになるため、情報比較部114は、第1属性情報135及び第2属性情報136の比較を行うことができない。
That is, the number of line breaks included in the output result of the first
そこで、情報比較部114は、第1属性情報135及び第2属性情報136の比較を行う前に、例えば、第1属性情報135及び第2属性情報136のうち、改行が含まれる旨を示す情報を削除するものであってよい。これにより、情報比較部114は、第1属性情報135に含まれる情報の行数と第2属性情報136に含まれる情報の行数とを合わせることが可能になる。そのため、情報比較部114は、第1属性情報135に含まれる情報の行数と第2属性情報136に含まれる情報の行数とが異なる場合であっても、第1属性情報135及び第2属性情報136の比較を行うことが可能になる。
Therefore, before comparing the
そして、S17の処理の後、情報比較部114は、S18以降の処理を実行する。なお、情報比較部114は、S16及びS17の処理のうち、一方の処理のみを行うものであってもよい。以下、S18及びS19の処理の他の具体例について説明する。
And after the process of S17, the
[S18及びS19の処理の具体例(2)]
図18及び図20は、第1属性情報135の具体例を説明する図である。また、図19及び図21は、第2属性情報136の具体例を説明する図である。さらに、図22は、比較結果情報137の具体例を説明する図である。なお、図18及び図22は、図8から図14で説明した具体例、及び図15から図17で説明した具体例とは異なる具体例を説明する図である。
[Specific Example of Processing in S18 and S19 (2)]
18 and 20 are diagrams for explaining a specific example of the
具体的に、図18に示す第1属性情報135において、「ページ数」には、「1」または「2」が設定されている。一方、図19に示す第2属性情報136において、「ページ数」には、「1」のみが設定されている。
Specifically, in the
また、図19に示す第2属性情報136において、「ページ数」が「1」であって「行数」が「3」及び「5」である情報には、「項番」、「ページ数」、「行数」及び「ENDコード」にのみ情報が設定されている。すなわち、図19に示す第2属性情報136において、「ページ数」が「1」であって「行数」が「3」及び「5」である情報は、改行が存在することを示す情報である。
Further, in the
そのため、情報比較部114は、図18に示す第1属性情報135に含まれる情報に、図20に示す第2属性情報136に含まれる情報と単純に比較することができない情報が存在するものと判定する。
Therefore, the
そこで、情報比較部114は、図20に示すように、図18に示す第1属性情報135に含まれる項目のうち、「ページ数」及び「行数」に対応する情報を削除する。
Therefore, as illustrated in FIG. 20, the
また、情報比較部114は、図21に示すように、図19に示す第2属性情報136に含まれる項目のうち、「ページ数」及び「行数」に対応する情報を削除する。さらに、情報比較部114は、改行コードのみを含む行に対応する情報である「ページ数」が「1」であって「行数」が「3」及び「5」である情報を削除する。
Further, as illustrated in FIG. 21, the
これにより、図19及び図21に示すように、第1属性情報135に含まれる情報に対応する行の数は、第2属性情報136に含まれる情報に対応する行の数と一致する。そのため、情報比較部114は、S18の処理において、第1属性情報135及び第2属性情報136の比較を行うことが可能になる。
Accordingly, as shown in FIGS. 19 and 21, the number of lines corresponding to the information included in the
なお、図19及び図21に示す例において、図19に示す第1属性情報135における「項番」が「5」である情報には、「文字開始列」として「5」が設定され、「全体文字数」として「10」が設定されている。一方、図21に示す第2属性情報136における「項番」が「5」である情報には、「文字開始列」として「1」が設定され、「全体文字数」として「6」が設定されている。
In the example shown in FIG. 19 and FIG. 21, “5” is set as the “character start string” in the information whose “item number” is “5” in the
そのため、情報比較部114は、この場合、S18の処理において、図19に示す第1属性情報135に情報が存在する空白の数と、図21に示す第2属性情報136に情報が存在する空白の数とが異なっていると判定する。
Therefore, in this case, in the processing of S18, the
そして、結果出力部115は、S19の処理において、例えば、図22に示すように、「PDF文書の2ページ目の2行目」に「表示位置の差異が存在」する旨の情報を比較結果情報137に含める。
Then, the
これにより、結果出力部115は、第1属性情報135及び第2属性情報136に、単純に比較することができない項目に対応する情報が含まれている場合であっても、事業者に対し、比較結果情報137が示す情報の見直しを行う契機を与えることが可能になる。
As a result, even if the
以上の実施の形態をまとめると、以下の付記のとおりである。 The above embodiment is summarized as follows.
(付記1)
コンピュータに、
文書ファイルの生成に用いられる同一の生成元データに基づいて生成された、ファイル形式の異なる複数の文書ファイルについて、文書ファイルに含まれる文書の行単位の属性情報を生成し、
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する、
処理を実行させることを特徴とする文書校閲支援プログラム。
(Appendix 1)
On the computer,
For each of a plurality of document files having different file formats generated based on the same generation source data used for generating the document file, the attribute information for each line of the document included in the document file is generated,
Outputting a result of comparing the attribute information for each line in the document for the plurality of document files;
A document review support program characterized by causing processing to be executed.
(付記2)
付記1において、
前記属性情報は、前記文書ファイルに含まれる文書の修飾方法を示す情報を含む、
ことを特徴とする文書校閲支援プログラム。
(Appendix 2)
In
The attribute information includes information indicating a modification method of a document included in the document file.
Document review support program characterized by this.
(付記3)
付記1において、
前記属性情報は、前記文書ファイルに含まれる文書に空白文字が含まれる旨を示す情報を含む、
ことを特徴とする文書校閲支援プログラム。
(Appendix 3)
In
The attribute information includes information indicating that the document included in the document file includes a blank character,
Document review support program characterized by this.
(付記4)
付記1において、
前記属性情報は、前記文書ファイルに含まれる文書の出力時における前記文書のページを示す情報及び行を示す情報を含み、
前記出力では、前記属性情報のうち、前記ページを示す情報及び前記行を示す情報以外の情報について比較を行う、
ことを特徴とする文書校閲支援プログラム。
(Appendix 4)
In
The attribute information includes information indicating a page of the document and information indicating a line when the document included in the document file is output,
In the output, the attribute information is compared for information other than information indicating the page and information indicating the row.
Document review support program characterized by this.
(付記5)
付記1において、
前記属性情報は、前記文書ファイルに含まれる文書に改行が含まれる旨を示す情報を含み、
前記出力では、前記属性情報のうち、前記改行が含まれる旨を示す情報以外の情報について比較を行う、
ことを特徴とする文書校閲支援プログラム。
(Appendix 5)
In
The attribute information includes information indicating that the document included in the document file includes a line feed,
In the output, the attribute information is compared with information other than information indicating that the line feed is included.
Document review support program characterized by this.
(付記6)
付記1において、
前記生成では、同一の特定フォーマットに従って、前記複数の文書ファイルについての前記属性情報を生成する、
ことを特徴とする文書校閲支援プログラム。
(Appendix 6)
In
In the generation, the attribute information for the plurality of document files is generated according to the same specific format.
Document review support program characterized by this.
(付記7)
付記1において、
前記属性情報は、前記文書ファイルに含まれる文書の文字数を示す情報を含む、
ことを特徴とする文書校閲支援プログラム。
(Appendix 7)
In
The attribute information includes information indicating the number of characters of a document included in the document file.
Document review support program characterized by this.
(付記8)
文書ファイルの生成に用いられる同一の生成元データに基づいて生成された、ファイル形式の異なる複数の文書ファイルについて、文書ファイルに含まれる文書の行単位の属性情報を生成する情報生成部と、
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する結果出力部と、を有する、
ことを特徴とする文書校閲支援装置。
(Appendix 8)
An information generation unit for generating line-by-line attribute information of a document included in the document file for a plurality of document files having different file formats generated based on the same generation source data used for generating the document file;
A result output unit that outputs a result of comparing the attribute information for each line in the document for the plurality of document files;
Document review support device characterized by the above.
(付記9)
文書ファイルの生成に用いられる同一の生成元データに基づいて生成された、ファイル形式の異なる複数の文書ファイルについて、文書ファイルに含まれる文書の行単位の属性情報を生成し、
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する、
ことを特徴とする文書校閲支援方法。
(Appendix 9)
For each of a plurality of document files having different file formats generated based on the same generation source data used for generating the document file, the attribute information for each line of the document included in the document file is generated,
Outputting a result of comparing the attribute information for each line in the document for the plurality of document files;
Document review support method characterized by this.
1:情報処理装置 2:記憶部
11:利用者端末 NW:ネットワーク
1: Information processing device 2: Storage unit 11: User terminal NW: Network
Claims (8)
文書ファイルの生成に用いられる同一の生成元データに基づいて生成された、ファイル形式の異なる複数の文書ファイルについて、文書ファイルに含まれる文書の行単位の属性情報を生成し、
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する、
処理を実行させることを特徴とする文書校閲支援プログラム。 On the computer,
For each of a plurality of document files having different file formats generated based on the same generation source data used for generating the document file, the attribute information for each line of the document included in the document file is generated,
Outputting a result of comparing the attribute information for each line in the document for the plurality of document files;
A document review support program characterized by causing processing to be executed.
前記属性情報は、前記文書ファイルに含まれる文書の修飾方法を示す情報を含む、
ことを特徴とする文書校閲支援プログラム。 In claim 1,
The attribute information includes information indicating a modification method of a document included in the document file.
Document review support program characterized by this.
前記属性情報は、前記文書ファイルに含まれる文書に空白文字が含まれる旨を示す情報を含む、
ことを特徴とする文書校閲支援プログラム。 In claim 1,
The attribute information includes information indicating that the document included in the document file includes a blank character,
Document review support program characterized by this.
前記属性情報は、前記文書ファイルに含まれる文書の出力時における前記文書のページを示す情報及び行を示す情報を含み、
前記出力では、前記属性情報のうち、前記ページを示す情報及び前記行を示す情報以外の情報について比較を行う、
ことを特徴とする文書校閲支援プログラム。 In claim 1,
The attribute information includes information indicating a page of the document and information indicating a line when the document included in the document file is output,
In the output, the attribute information is compared for information other than information indicating the page and information indicating the row.
Document review support program characterized by this.
前記属性情報は、前記文書ファイルに含まれる文書に改行が含まれる旨を示す情報を含み、
前記出力では、前記属性情報のうち、前記改行が含まれる旨を示す情報以外の情報について比較を行う、
ことを特徴とする文書校閲支援プログラム。 In claim 1,
The attribute information includes information indicating that the document included in the document file includes a line feed,
In the output, the attribute information is compared with information other than information indicating that the line feed is included.
Document review support program characterized by this.
前記生成では、同一の特定フォーマットに従って、前記複数の文書ファイルについての前記属性情報を生成する、
ことを特徴とする文書校閲支援プログラム。 In claim 1,
In the generation, the attribute information for the plurality of document files is generated according to the same specific format.
Document review support program characterized by this.
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する結果出力部と、を有する、
ことを特徴とする文書校閲支援装置。 An information generation unit for generating line-by-line attribute information of a document included in the document file for a plurality of document files having different file formats generated based on the same generation source data used for generating the document file;
A result output unit that outputs a result of comparing the attribute information for each line in the document for the plurality of document files;
Document review support device characterized by the above.
前記複数の文書ファイルについて、文書内の行それぞれについての前記属性情報を比較した結果を出力する、
ことを特徴とする文書校閲支援方法。 For each of a plurality of document files having different file formats generated based on the same generation source data used for generating the document file, the attribute information for each line of the document included in the document file is generated,
Outputting a result of comparing the attribute information for each line in the document for the plurality of document files;
Document review support method characterized by this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015232603A JP2017102496A (en) | 2015-11-30 | 2015-11-30 | Document review support program, document review support device, and document review support method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015232603A JP2017102496A (en) | 2015-11-30 | 2015-11-30 | Document review support program, document review support device, and document review support method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017102496A true JP2017102496A (en) | 2017-06-08 |
Family
ID=59016879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015232603A Pending JP2017102496A (en) | 2015-11-30 | 2015-11-30 | Document review support program, document review support device, and document review support method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017102496A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220001844A (en) * | 2020-06-30 | 2022-01-06 | 주식회사 폴라리스오피스 | Method and apparatus for providing data indicating whether electronic documents in different formats match |
-
2015
- 2015-11-30 JP JP2015232603A patent/JP2017102496A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220001844A (en) * | 2020-06-30 | 2022-01-06 | 주식회사 폴라리스오피스 | Method and apparatus for providing data indicating whether electronic documents in different formats match |
KR102414935B1 (en) * | 2020-06-30 | 2022-07-01 | 주식회사 폴라리스오피스 | Method and apparatus for providing data indicating whether electronic documents in different formats match |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190251143A1 (en) | Web page rendering method and related device | |
CN107766328B (en) | Text information extraction method of structured text, storage medium and server | |
US20150058711A1 (en) | Presenting fixed format documents in reflowed format | |
US20160026858A1 (en) | Image based search to identify objects in documents | |
JP2015143899A (en) | Information processing apparatus, information hiding method, and information hiding program | |
US20180330156A1 (en) | Detection of caption elements in documents | |
CN112906359A (en) | Superimposed information processing method based on man-machine interaction and related device | |
JP2017102496A (en) | Document review support program, document review support device, and document review support method | |
US20160026613A1 (en) | Processing image to identify object for insertion into document | |
US9940305B2 (en) | Preparation of textual content | |
CN109657184B (en) | Rich text processing method, rich text processing device, server and computer readable medium | |
US9075776B2 (en) | Document processing apparatus, document processing method, and program | |
JP6933395B2 (en) | Automatic translation device and automatic translation program | |
US20130311489A1 (en) | Systems and Methods for Extracting Names From Documents | |
JP2020115260A (en) | Information processing device and information processing program | |
KR20150085282A (en) | Operating method of terminal for correcting electronic document | |
JP2014044555A (en) | Image processing apparatus, image processing system, and program | |
JP2019149125A (en) | Information processor, method for processing information, and program | |
JP2014199476A (en) | Machine translation device, machine translation method and program | |
JP7096629B1 (en) | Information processing equipment, information processing methods and programs | |
WO2017158748A1 (en) | Web page comparison device, web page comparison method, recording medium, and program | |
JP2007179505A (en) | Retrieval device, system, method and program, and storage medium | |
JP6982347B1 (en) | Document extraction program in computer language processing, semantically similar document extraction method and language processing device | |
JP3786436B2 (en) | Table generation processing apparatus and method | |
CN116957918A (en) | Intelligent image synthesis method and device, electronic equipment and storage medium |