JP7275641B2 - 文書処理装置、文書処理方法及び文書処理プログラム - Google Patents

文書処理装置、文書処理方法及び文書処理プログラム Download PDF

Info

Publication number
JP7275641B2
JP7275641B2 JP2019032455A JP2019032455A JP7275641B2 JP 7275641 B2 JP7275641 B2 JP 7275641B2 JP 2019032455 A JP2019032455 A JP 2019032455A JP 2019032455 A JP2019032455 A JP 2019032455A JP 7275641 B2 JP7275641 B2 JP 7275641B2
Authority
JP
Japan
Prior art keywords
difference
text data
document processing
text
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019032455A
Other languages
English (en)
Other versions
JP2020135796A (ja
Inventor
秀夫 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019032455A priority Critical patent/JP7275641B2/ja
Publication of JP2020135796A publication Critical patent/JP2020135796A/ja
Application granted granted Critical
Publication of JP7275641B2 publication Critical patent/JP7275641B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、文書処理装置、文書処理方法及び文書処理プログラムに関する。
一般では、あるテキストに対して、そのテキストを基として別のテキストを作成し、これらのテキストを表示して比較する場合がある。また、従来では、2つのテキストデータを自動的にアライメントするグローバルアライメント技術(Needleman-Wunchアルゴリズム)が提案されている。
このアルゴリズムでは、2つのテキストデータが入力されると、一方のテキストデータと他方のテキストデータとの差異を、一方のテキストデータに対する文字列の挿入、置換、削除の何れかとして表示させる。
しかしながら、従来の技術では、2つのテキストデータの差異の要因を区別できない。このため、従来の技術では、例えば、2つのテキストデータの差異が表示されたとしても、その差異の要因が、人間による変更であるのか、又は、文字認識処理における誤認識等によるものであるのか、を見分けることは困難である。
開示の技術は、テキストの差異の要因を容易に把握させることを目的とする。
開示の技術は、第一のテキストデータと、第二のテキストデータとの入力を受け付ける入力受付部と、前記第一又は第二のテキストデータの何れか一方は、文字認識処理の結果として取得されたテキストデータであって、前記第一のテキストデータと前記第二のテキストデータとの差異を検出する差異検出部と、検出された差異の文字数に基づき、前記検出された差異の要因が、前記文字認識処理における誤認識と定められる差異と、前記検出された差異の要因が、前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異と、に分類する差異分類部と、前記検出された差異を、前記分類に応じた表示態様で表示させる表示制御部と、を有する文書処理装置である。

テキストの差異の要因を容易に把握させることができる。
文書処理装置の動作の概略を説明する図である。 文書処理装置のハードウェア構成の一例を示す図である。 文書処理部の機能を説明する図である。 文書処理装置の処理を説明する第一のフローチャートである。 テキストデータが示すテキストの一例を示す図である。 差異検出部による差異の検出結果の表示例を示す図である。 文書処理装置の動作を説明する第二のフローチャートである。 表示用データの表示例を示す第一の図である。 表示用データの表示例を示す第二の図である。 比較例を示す図である。 文書処理装置を含むシステムのシステム構成を説明する図である。
以下に図面を参照して、実施形態について説明する。図1は、文書処理装置の動作の概略を説明する図である。
本実施形態の文書処理装置100は、文書処理部110、出力部120を有する。本実施形態の文書処理部110は、テキストデータ10と、テキストデータ20の入力を受け付けると、2つのテキストデータを比較して差異を検出し、差異の種類を分類する。そして、文書処理部110は、テキストデータ10とテキストデータ20のうち何れか一方を、他方との差異の分類に応じた表示態様とした表示用データ30を生成し、出力部120へ渡す。
具体的には、本実施形態の文書処理部110は、テキストデータ10とテキストデータ20とから検出された差異の要因が、人間によるテキストデータの内容の変更であるのか、又は、文字認識処理による誤認識であるのか、の推定に基づき、差異を分類する。そして、文書処理部110は、分類結果に応じた表示態様で表示されるテキストデータを、表示用データ30として出力する。
出力部120は、この表示用データ30を表示装置等に表示させる。尚、出力部120は、表示用データを、例えば、画像形成装置等へ出力し、印刷物として出力させても良い。
このように、本実施形態では、2つのテキストデータのうちの一方のテキストデータと、他方のテキストデータとの差異の表示態様を、この差異から推定される要因に応じて異ならせる。したがって、本実施形態によれば、テキストの差異の要因の把握を容易にすることができる。
尚、本実施形態のテキストデータ10、テキストデータ20は、複数の単語を含む文脈(ユニット)を示すテキストデータであれば良い。具体的には、例えば、テキストデータ10、20のそれぞれは、例えば、1つの文であっても良いし、複数の文の集合であっても良い。
また、テキストデータ10、20のそれぞれは、例えば、単なる文字列群であっても良く、文を含んでいなくても良い。具体的には、例えば、特定の文書データから切り出された文字列群を、テキストデータ10、20としても良い。
次に、図2を参照して、本実施形態の文書処理装置100のハードウェア構成について説明する。図2は、文書処理装置のハードウェア構成の一例を示す図である。
本実施形態の文書処理装置100は、それぞれバスBで相互に接続されている入力装置11、出力装置12、ドライブ装置13、補助記憶装置14、メモリ装置15、演算処理装置16及びインターフェース装置17を含む情報処理装置である。
入力装置11は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等であっても良い。出力装置12は、各種の情報の出力を行うためものであり、例えばディスプレイ等であっても良い。インターフェース装置17は、LANカード等を含み、ネットワークに接続する為に用いられる。
文書処理プログラムは、文書処理装置100を制御する各種プログラムの少なくとも一部である。文書処理プログラムは例えば記憶媒体18の配布やネットワークからのダウンロード等によって提供される。文書処理プログラムを記録した記憶媒体18は、CD-ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。
また、文書処理プログラムは、文書処理プログラムを記録した記憶媒体18がドライブ装置13にセットされると、記憶媒体18からドライブ装置13を介して補助記憶装置14にインストールされる。ネットワークからダウンロードされた文書処理プログラムは、インターフェース装置17を介して補助記憶装置14にインストールされる。
補助記憶装置14は、インストールされた文書処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置15は、文書処理装置100の起動時に補助記憶装置14から文書処理プログラムを読み出して格納する。そして、演算処理装置16はメモリ装置15に格納された文書処理プログラムに従って、後述するような各種処理を実現している。
次に、図3を参照して、本実施形態の文書処理装置100の文書処理部110の機能について説明する。図3は、文書処理部の機能を説明する図である。以下の説明する各部は、演算処理装置16が、メモリ装置15に格納された文書処理プログラムを読み出して実行することで実現される。
本実施形態の文書処理部110は、入力受付部111、差異検出部112、差異分類部113、表示制御部114を有する。
入力受付部111は、文書処理装置100において、差異の検出が行われるテキストデータ10(第一のテキストデータ)と、テキストデータ20(第二のテキストデータ)の入力を受け付ける。
差異検出部112は、テキストデータ10とテキストデータ20との差異を検出する。尚、本実施形態の差異検出部112は、テキストデータ10とテキストデータ20との差異の検出に、グローバルアライメント技術(Needleman-Wunch法)を用いるものとした。
差異分類部113は、差異検出部112によって検出された差異毎に、差異の存在を示す情報を表示させる差異か、又は、差異の存在を示す情報を非表示とする差異か、に分類する。以下の説明では、存在を示す情報を表示させる差異を存在表示差異と呼び、存在を示す情報を表示させない差異を、存在非表示差異と呼ぶ場合がある。差異分類部113の処理の詳細は後述する。
表示制御部114は、差異分類部113による分類結果に応じて、表示用データ30を生成する。表示制御部114は、表示判定部115、表示態様決定部116、表示用データ生成部117を有する。
表示判定部115は、差異分類部113による分類結果に基づき、差異毎に、差異の存在を示す情報を表示させるか否かを判定する。表示態様決定部116は、存在を示す情報を表示すると判定された差異について、差異の表示態様を決定する。表示用データ生成部117は、表示判定部115と表示態様決定部116の処理の結果に基づき、表示用データ30を生成する。
以下に、図4を参照して、本実施形態の文書処理装置100の処理について説明する。図4は、文書処理装置の処理を説明する第一のフローチャートである。
文書処理装置100の文書処理部110は、入力受付部111により、テキストデータ10とテキストデータ20との入力を受け付ける(ステップS401)。
続いて、文書処理部110は、差異検出部112により、テキストデータ10が示す文字列であるテキストT1と、テキストデータ20が示す文字列であるテキストT2との差異を検出する(ステップS402)。テキストT1と、テキストT2については後述する。
次に、文書処理部110の差異分類部113は、ステップS402で、2つのテキストから検出された差異のうち、1つの差異を差異Xとする(ステップS403)。ここで検出される差異の種類は、削除、置換、挿入の何れかである。
続いて、差異分類部113は、差異Xを、差異の存在を示す情報を表示させる存在表示差異、又は、差異の存在を示す情報を非表示とする存在非表示差異の何れかに分類する(ステップS404)。
続いて、差異分類部113は、差異Xが検出された差異のうち、最後の差異であるか否かを判定する(ステップS405)。言い換えれば、差異分類部113は、検出された差異の全てについて、分類を行ったか否かを判定する。
ステップS405において、差異Xが最後の差異でない場合、差異分類部113は、ステップS403に戻る。
ステップS405において、差異Xが最後の差異である場合、文書処理部110は、表示制御部114により、差異の分類に応じた表示態様で表示される表示用データ30を生成し(ステップS406)、出力部120へ渡す。ステップS406の処理の詳細は後述する。
出力部120は、表示用データを表示装置等に出力して(ステップS407)、処理を終了する。
ここで、図5及び図6を参照して、本実施形態の差異分類部113の処理について、具体的に説明する。
図5は、テキストデータが示すテキストの一例を示す図である。図5において、テキストデータ10が示すテキストT1は「本条以外の黙示的な保証はないものとします」である。また、図5において、テキストデータ20が示すテキストT2は、「本以外の燃示的な条件は一切ないものとします」である。
この2つのテキストについて、差異検出部112によって差異を検出した場合、以下の4つの差異が検出される。
差異1:テキストT1の文字「条」がテキストT2では削除されている。
差異2:テキストT1の文字「黙」がテキストT2では「燃」に置換されている。
差異3:テキストT1の文字列「保証」がテキストT2では「条件」に置換されている。
差異4:テキストT1にない文字列「一切」がテキストT2に挿入されている。
図6は、差異検出部による差異の検出結果の表示例を示す図である。図6では、テキストT1とテキストT2の間にマーク「:」が付されている場合は、2つのテキストに含まれる文字に差異がないことを示す。また、図6では、テキストT1とテキストT2の間にマーク「*」が付されている場合は、2つのテキストに含まれる文字に差異があることを示す。
図6では、文字の差異を示すマーク61~64が付されている。マーク61は上述した差異1と対応し、マーク62は上述した差異2と対応し、マーク63は上述した差異3、マーク64は上述した差異4に対応している。
マーク61とマーク62が示す差異1と差異2は、1文字の差異である。マーク63とマーク64が示す差異は、2文字の差異である。
本実施形態の差異分類部113は、この差異1~差異4を順に取り出し、差異の文字数に応じて、存在表示差異又は存在非表示差異に分類する。
本実施形態では、人間が意図的にテキストデータの内容を変更した場合には、差異が1文字になる可能性は低く、テキストデータに対してOCR(Optical Character Recognition/Reader)等による文字認識において、文字が誤認識された場合には、1文字の差異となる可能性が高い点に着目し、差異の分類を行う。
言い換えれば、本実施形態の差異分類部113は、検出された差異から定められる、この差異の要因に応じて、差異を分類する。
具体的には、本実施形態の差異分類部113は、1文字の差異は、文字認識を行った結果の誤認識と推定されるため、存在非表示差異に分類し、それ以外の差異は、人間による内容の変更によるものと推定されるため、存在表示差異に分類する。
つまり、差異分類部113は、1文字の差異は、文字認識を行った結果の誤認識と定め、定められた要因に応じて、1文字の差異を存在非表示差異に分類する。また、差異分類部113は、それ以外の差異は、人間による内容の変更によるものと定め、定められた要因に応じて、1文字以外の差異を存在表示差異に分類する。
したがって、図6の例では、差異が1文字である差異1と差異2は、存在非表示差異に分類され、差異3と差異4は存在表示差異に分類される。
本実施形態では、このように分類することで、人間による意図的な内容の変更が要因と考えられる差異のみを、可視化できる。
尚、1文字の差異を存在表示差異に分類し、それ以外の差異を存在非表示差異に分類すれば、文字認識による誤認識が要因と考えられる差異のみを可視化できる。
尚、差異分類部113による差異の分類の方法は、上述した方法に限定されない。例えば、差異分類部113は、確率的言語モデルにより差異を構成する文字列の生起確率を求め、その確率が予め定めた閾値より小さい場合は、この差異を文字認識による誤認と見なして存在非表示差異に分類し、それ以外の差異は存在表示差異に分類してもよい。
次に、図7を参照して、表示制御部114の処理について説明する。図7は、文書処理装置の動作を説明する第二のフローチャートである。図7は、図4のステップS406の処理の詳細を示している。
本実施形態の表示制御部114は、テキストデータ10を表示用データ30の初期値に設定する(ステップS701)。尚、テキストデータ20を表示用データ30の初期値にしても良い。
続いて、表示制御部114は、テキストT1とテキストT2から検出された差異の1つを差異Xとする(ステップS702)。
続いて、表示制御部114は、表示判定部115により、差異Xが、存在表示差異に分類されているか否かを判定する(ステップS703)。ステップS703において、差異Xが存在表示差異に分類されていない場合、つまり、差異Xが存在非表示差異に分類されている場合、表示制御部114は、後述するステップS705へ進む。
ステップS703において、差異Xが、存在表示差異に分類されている場合、表示制御部114は、表示態様決定部116により、差異Xの種類に応じたマークを示すデータをテキストデータ10と対応付ける(ステップS704)。
具体的には、表示態様決定部116は、差異Xの種類が「削除」である場合、表示用データ30の差異Xに相当する位置にマーク「x」を付与する。また、表示態様決定部116は、差異Xの種類が「挿入」である場合、表示用データ30の差異Xに相当する位置にマーク「#」を付与する。また、表示態様決定部116は、差異Xの種類が「置換」である場合、表示用データ30の差異Xに相当する位置にマーク「=」を付与する。
続いて、表示制御部114は、差異Xが、テキストT1とテキストT2とから検出された差異のうち、最後の差異であるか否かを判定する(ステップS705)。言い換えれば、表示制御部114は、検出された全ての差異について、ステップS705までの処理を実行したか否かを判定する。
ステップS705において、差異Xが最後の差異でない場合、表示制御部114は、ステップS702へ戻る。
ステップS705において、差異Xが最後の差異である場合、表示制御部114は、表示用データ生成部117により、差異毎に付与されたマークを含む表示用データ30を生成して出力部120により表示させ(ステップS706)、処理を終了する。
図8は、表示用データの表示例を示す第一の図である。図8の画面81は、例えば、文書処理装置100の有する出力装置(ディスプレイ)12等に表示された画面の例である。
画面81には、テキストデータ10が示すテキストT1と、テキストT1に対して表示態様決定部116によって付与されたマーク82、83とを含む表示用データ30が表示されている。
表示用データ30では、テキストT1において、存在表示差異に分類された差異3と差異4の位置に、差異の種類が置換であることを示すマーク82と、差異の種類が挿入であることを示すマーク83とが対応付けられて表示されている。
したがって、画面81では、テキストT1において、人間が意図的に内容を変更した箇所が2箇所あることが容易に把握できる。
尚、表示態様決定部116によって決められる表示態様は、図7及び図8に示す例に限定されない。
表示態様決定部116は、例えば、存在表示差異に分類された差異と対応する箇所に、マーカを付与するようにしても良い。表示態様決定部116は、テキストT1において、存在表示差異に分類された差異と対応する文字列を、テキストT1に含まれる他の文字列と異なる態様で表示させれば良い。
また、本実施形態は、検出された差異を、差異の存在を示す情報を表示させるものと、差異の存在を示す情報を表示させないものとして分類するものとしたが、これに限定されない。
文書処理装置100は、例えば、検出された差異について、差異の要因毎に分類し、要因に対応したマーカをテキストデータの差異と対応する箇所に付与しても良い。
具体的には、例えば、文書処理装置100は、検出された差異のうち、1文字の差異を、文字認識における誤認識を要因とする差異に分類し、それ以外の差異を、人間による内容の変更を要因とする差異に分類しても良い。
この場合、文書処理装置100は、テキストT1では、誤認識を要因とする差異に分類される差異1、差異2に対応する箇所に対し、誤認識であることを示すマークが付与される。また、テキストT1では、人間による内容の変更を要因とする差異に分類される差異3と差異4と対応する箇所に、人間による変更であることを示すマークが付与される。
このように、本実施形態では、検出された差異を、差異の要因毎に分類し、要因毎のマークをテキストに付与することで、このテキストを閲覧する人に、差異の要因を容易に把握させることができる。
また、上述した実施形態では、テキストを表現する言語を日本語としたが、言語は任意の言語であって良い。例えば、テキストを表現する言語が英語である場合、テキスト「step」とテキスト「stop」との比較においては、差異が1文字であるため、この差異は、存在非表示差異に分類される。同様に、テキスト「step」とテキスト「street」との比較においては、差異が1文字以上となるため、この差異は存在表示差異に分類される。
また、本実施形態では、1文字の差異を文字認識における誤認識として、存在非表示差異に分類するものとしたが、これに限定されない。本実施形態では、例えば、単語に含まれる文字列に差異が生じたことによって、この単語が単語としての意味を成さなくなった場合には、この差異を、文字認識における誤認識として、存在非表示差異に分類しても良い。この場合の差異は、1文字の差異に限定されない。
図9は、表示用データの表示例を示す第二の図である。図9の画面81Aは、テキストT1において、存在表示差異に分類された差異3と差異4の位置に、差異が存在することを示すマーカ82A、83Aが表示されている。
尚、図9の例では、マーカ82Aとマーカ83Aは同一の種類としたが、両者を差異の種類に応じて異ならせても良い。
図10は、比較例を示す図である。比較例として示す画面81Bでは、存在表示差異と存在非表示差異との分類が行われておらず、存在非表示差異である差異1と差異2に対応する位置にも、マーカ84とマーカ85が付与されている。したがって、比較例では、画面81Bを閲覧している人に対して、4つの差異のうち、どの差異が人間によって内容が変更された箇所であるかを容易に把握させることができない。
これに対し、図9に示す画面91Aでは、人間による内容の変更が要因となった差異のみにマーカを付与しているため、画面81Aを閲覧している人に対して、人間によって内容が変更された箇所であるかを容易に把握させることができる。つまり、本実施形態によれば、テキストの差異の要因を容易に把握させることができる。
また、本実施形態によれば、例えば、テキストデータ10を作成した人とは別の人が、テキストデータ10の内容を変更した後に紙に印刷し、その紙面上で押印や署名したものにOCR処理を施すことでテキストデータ20が得られた場合等において、テキストデータ10とテキストデータ20との差異の内、別の人による変更によって生じた差異のみを表示させる、といったことができる。
尚、本実施形態の文書処理装置100は、文書処理装置100を含むシステムを構成しても良い。図11は、文書処理装置を含むシステムのシステム構成を説明する図である。
図11に示す文書処理システム200は、文書処理装置100と端末装置300とを含み、端末装置300は、文書処理装置100とネットワーク等を介して接続される。
文書処理システム200において、文書処理装置100は、例えば、端末装置300から、テキストデータ10、20を受信すると、このテキストデータ10、20に基づき、文書処理部110の処理を実行する。そして、文書処理部110の処理の結果として取得された表示用データ30を、出力部120により、端末装置300へ出力する。
尚、端末装置300から受信するテキストデータ10、20は、予め2つのテキストファイルとして受信されても良いし、1つのテキストファイルとして受信しても良い。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
10、20 テキストデータ
11、21 テキスト
30 表示用データ
100 文書処理装置
110 文書処理部
111 入力受付部
112 差異検出部
113 差異分類部
114 表示制御部
115 表示判定部
116 表示態様決定部
117 表示用データ生成部
120 出力部
200 文書処理システム
300 端末装置
特開平9-251518号公報

Claims (7)

  1. 第一のテキストデータと、第二のテキストデータとの入力を受け付ける入力受付部と、
    前記第一又は第二のテキストデータの何れか一方は、文字認識処理の結果として取得されたテキストデータであって、前記第一のテキストデータと前記第二のテキストデータとの差異を検出する差異検出部と、
    検出された差異の文字数に基づき、前記検出された差異の要因が、前記文字認識処理における誤認識と定められる差異と、前記検出された差異の要因が、前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異と、に分類する差異分類部と、
    前記検出された差異を、前記分類に応じた表示態様で表示させる表示制御部と、を有する文書処理装置。
  2. 前記差異分類部は、
    前記文字認識処理における誤認識と定められる差異を、前記検出された差異が1文字の差異とし、
    前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異を、前記検出された差異が1文字以外の差異とする、請求項記載の文書処理装置。
  3. 前記差異分類部は、
    前記文字認識処理における誤認識と定められる差異を、差異の存在を非表示とする差異に分類し、
    前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異を、差異の存在を表示させる差異に分類する、請求項載の文書処理装置。
  4. 前記表示制御部は、
    前記第一又は第二のテキストデータの何れか一方のテキストデータと、
    前記何れか一方のテキストデータにおける、前記存在を表示させる差異に分類された差異と対応する位置に対応付けられた、前記差異が存在することを示す情報と、を表示させる、請求項記載の文書処理装置。
  5. 前記差異検出部は、
    前記第一のテキストデータと前記第二のテキストデータとの差異を、文字の削除、挿入、置換の何れかとして検出する、請求項1乃至の何れか一項に記載の文書処理装置。
  6. 文書処理装置による文書処理方法であって、前記文書処理装置が、
    第一のテキストデータと、第二のテキストデータとの入力を受け付け、
    前記第一又は第二のテキストデータの何れか一方は、文字認識処理の結果として取得されたテキストデータであって、前記第一のテキストデータと前記第二のテキストデータとの差異を検出し、
    検出された差異の文字数に基づき、前記検出された差異の要因が、前記文字認識処理における誤認識と定められる差異と、前記検出された差異の要因が、前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異と、に分類し、
    前記検出された差異を、前記分類に応じた表示態様で表示させる、を文書処理方法。
  7. 第一のテキストデータと、第二のテキストデータとの入力を受け付ける処理と、
    前記第一又は第二のテキストデータの何れか一方は、文字認識処理の結果として取得されたテキストデータであって、前記第一のテキストデータと前記第二のテキストデータとの差異を検出する処理と、
    検出された差異の文字数に基づき、前記検出された差異の要因が、前記文字認識処理における誤認識と定められる差異と、前記検出された差異の要因が、前記第一又は第二のテキストデータに対する内容の変更によるものと定められる差異と、に分類する処理と、
    前記検出された差異を、前記分類に応じた表示態様で表示させる処理と、を文書処理装置に実行させる、文書処理プログラム。
JP2019032455A 2019-02-26 2019-02-26 文書処理装置、文書処理方法及び文書処理プログラム Active JP7275641B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019032455A JP7275641B2 (ja) 2019-02-26 2019-02-26 文書処理装置、文書処理方法及び文書処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019032455A JP7275641B2 (ja) 2019-02-26 2019-02-26 文書処理装置、文書処理方法及び文書処理プログラム

Publications (2)

Publication Number Publication Date
JP2020135796A JP2020135796A (ja) 2020-08-31
JP7275641B2 true JP7275641B2 (ja) 2023-05-18

Family

ID=72278872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019032455A Active JP7275641B2 (ja) 2019-02-26 2019-02-26 文書処理装置、文書処理方法及び文書処理プログラム

Country Status (1)

Country Link
JP (1) JP7275641B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011125402A (ja) 2009-12-15 2011-06-30 Toshiba Corp 読影レポート作成支援システム
JP2016186695A (ja) 2015-03-27 2016-10-27 株式会社日立ソリューションズ ファイル管理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011125402A (ja) 2009-12-15 2011-06-30 Toshiba Corp 読影レポート作成支援システム
JP2016186695A (ja) 2015-03-27 2016-10-27 株式会社日立ソリューションズ ファイル管理装置

Also Published As

Publication number Publication date
JP2020135796A (ja) 2020-08-31

Similar Documents

Publication Publication Date Title
US9754176B2 (en) Method and system for data extraction from images of semi-structured documents
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
WO2010073540A1 (en) Business document processor
CN113168498A (zh) 语言校正系统及其方法以及系统中的语言校正模型学习方法
JP2002352191A (ja) 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
US10769360B1 (en) Apparatus and method for processing an electronic document to derive a first electronic document with electronic-sign items and a second electronic document with wet-sign items
JP2007058605A (ja) 文書管理システム
EP3779783A1 (en) Image processing device, image processing method, and storage medium storing program
JP2010055142A (ja) 文書処理装置およびプログラム
JP2008021068A (ja) 帳票認識装置及び帳票認識プログラム
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
JP7275641B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN111859923A (zh) 信息处理装置、记录媒体及信息处理方法
CN110942075A (zh) 信息处理装置、存储介质及信息处理方法
US20100134851A1 (en) Image processing apparatus, method for performing image processing and computer readable medium
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP7222218B2 (ja) 文書校正支援システム、文書校正支援装置、文書校正支援方法、及びプログラム
CN112149402A (zh) 文档对比方法、装置、电子设备和计算机可读存储介质
JP6759955B2 (ja) 地名抽出プログラム、地名抽出装置および地名抽出方法
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP7027696B2 (ja) 情報処理装置及び情報処理プログラム
JP2007058415A (ja) テキストマイニング装置、テキストマイニング方法、およびテキストマイニング用プログラム
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230417

R151 Written notification of patent or utility model registration

Ref document number: 7275641

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151