JP2019176434A - 情報処理システムおよび情報処理方法 - Google Patents

情報処理システムおよび情報処理方法 Download PDF

Info

Publication number
JP2019176434A
JP2019176434A JP2018065896A JP2018065896A JP2019176434A JP 2019176434 A JP2019176434 A JP 2019176434A JP 2018065896 A JP2018065896 A JP 2018065896A JP 2018065896 A JP2018065896 A JP 2018065896A JP 2019176434 A JP2019176434 A JP 2019176434A
Authority
JP
Japan
Prior art keywords
character string
information processing
image data
ocr
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018065896A
Other languages
English (en)
Other versions
JP7043929B2 (ja
Inventor
蚊爪 聖子
Kiyoko Kazume
聖子 蚊爪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2018065896A priority Critical patent/JP7043929B2/ja
Priority to US16/353,252 priority patent/US11055558B2/en
Publication of JP2019176434A publication Critical patent/JP2019176434A/ja
Application granted granted Critical
Publication of JP7043929B2 publication Critical patent/JP7043929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】出現頻度は低いが管理上重要な文字列をファイル名として登録できない。【解決手段】画像データのOCR結果を取得するOCR取得部と、OCR結果からあらかじめ特定された第一の文字列を抽出する第一の抽出部と、抽出された第一の文字列から画像データに付与するファイル名を生成するファイル名生成部とを備えた情報処理システムである。【選択図】図6

Description

本発明は、情報処理システムおよび情報処理方法に関する。
MFP(Multifunction Peripheral/Printer/Product)などの画像処理装置において、光学文字認識(OCR:Optical Character Recognition)処理を行う機能が実装されている。
OCR処理とは手書きの文字や印刷された文字をスキャナなどで光学的に読み取った原稿の画像データ、またファクシミリなどで受信した原稿の画像データから、文字を抽出し文字(テキスト)データへと変換する処理として知られている。
特許文献1には画像読取り装置が記載されており、その画像読取り装置は、原稿画像を読み込み、文字認識して抽出した文字列(語句)からさらに、出現頻度の高い文字列を抽出している。その後、画像読取り装置は、抽出された出現頻度の高い文字列の中に、あらかじめ設定された禁則文字が含まれているかを判断する。そして禁則文字が含まれていなければ、ユーザに対して抽出した文字列を表示し、その中からユーザが選択した文字列をファイル名と決定している。
しかし、特許文献1に記載の画像読取り装置では、画像データ中の出現頻度の高い文字列が抽出されるため、出現頻度は低いが管理上重要な文字列をファイル名として登録できない。
上記課題を解決するために、請求項1にかかる発明は、画像データのOCR結果を取得するOCR取得部と、前記OCR結果からあらかじめ特定された第一の文字列を抽出する第一の抽出部と、抽出された前記第一の文字列から前記画像データに付与するファイル名を生成するファイル名生成部とを備えた情報処理システムである。
本発明によれば、画像データ中の出現頻度に関わらず、特定の文字列をファイル名に使用して画像データを管理できる。
一実施形態に係る情報処理システムの全体構成図である。 一実施形態に係る端末装置のハードウェア構成図である 一実施形態に係る情報処置装置のハードウェア構成図である 一実施形態に係るサーバ装置のハードウェア構成図である 一実施形態に係る情報処理システムの機能ブロック図である。 画像データに応じて期限を判断する処理の一例を示すフロー図である。 画像データの一例である。 画像データのOCR結果の一例である。 OCR結果からの文字列抽出の一例である。 OCR結果からの抽出文字列の出力の一例である。 画像データを保存するフォルダの一例である。 画像データ転送処理の一例を示すフロー図である。 OCR取得工程の一例を示すシーケンス図である。
以下、添付の図面に基づき、本発明の実施の形態について説明する。なお、本発明の実施の形態を説明するための各図面において、同一の機能もしくは形状を有する部材や構成部品等の構成要素については、判別が可能な限り同一符号を付すことにより一度説明した後ではその説明を省略する。
図1は、一実施形態に係る情報処理システムの全体構成図である。この情報処理システムは、画像データに含まれる特定の文字列を画像データのファイル名として使用可能な情報処理システムである。図1に示されているように、情報処理システム1は、PC(Personal Computer)などの端末装置10、画像形成装置20A,20B、およびサーバ装置50A,50Bによって構築されている。以下の説明では、画像形成装置20A,20Bのうち任意のものを画像形成装置20と表す。サーバ装置50A,50Bのうち任意のものをサーバ装置50と表す。
情報処理システム1において、端末装置10の数は1台に限定されない。また、画像形成装置20およびサーバ装置50の数は、それぞれ2台に限定されない。以下、原稿が文書である場合について説明する。ただし、原稿は、文字を含む画像であれば特に限定されず、例えば、図面であってもよい。文字には、OCR処理により認識可能な数字、記号、符号、アイコンなども含まれる。また、文字列は一文字以上であればよい。
端末装置10は、例として、汎用PCや汎用携帯情報端末などの端末装置である。
画像形成装置20は、一例として、MFP(Multifunction Peripheral/Printer/Product)と称される複合機であり、ファクシミリ、スキャナ、コピー、OCR処理、あるいはプリンタなどの画像処理機能、さらに通信機能を有する情報処理装置である。なお、画像形成装置20で処理される「画像」は、画像データだけでなく、画像データが含まれていないデータ、つまり文字情報のみのデータも含む。
画像形成装置20は、OCR処理の結果(以下、OCR結果と表す)を表示画像として出力してもよいし、データとして出力してもよい。上記のスキャナは、サーバ(クラウドサーバを含む)との通信、または通信端末との通信、もしくは、外部ストレージへの書き込みにより、OCR結果をデータとして出力するハンディスキャナであってもよい。OCR結果をデータとして出力する場合、データの形式は特に限定されない。画像形成装置20は、OCR結果を、例えば、テキストデータとして出力してもよいし、PDFファイルに埋め込んで出力してもよい。以下、画像形成装置20がMFPである場合について説明する。
画像形成装置20は、文書の画像を文字コードに変換するOCRモジュールを搭載している。ただし、OCRモジュールがオプションの機能である場合、画像形成装置20のうちいずれかは、OCRモジュールを搭載していなくてもよい。また画像形成装置20は、指定された文書の画像に対し、OCR処理を要求するアプリケーションを実装している。以後、「アプリケーション」を、「アプリ」と表す。
サーバ装置50は、画像処理機能および通信機能を有する情報処理装置である。サーバ装置50は、文書の画像を文字コードに変換するOCRモジュールを搭載している。そしてサーバ装置50は、アプリからの要求に基づいて、OCR処理を実行するサーバ機能を有する。
端末装置10、画像形成装置20およびサーバ装置50Aは、LAN2L(Local Area Network)に接続している。画像形成装置20は、LAN2Lからインターネット2Iに接続し、インターネット2I上のクラウドサーバとしてのサーバ装置50Bに接続する。以下では、LAN2Lおよびインターネット2Iのうち任意のものを通信ネットワーク2と表す。通信ネットワーク2の全部又は一部には、Wi−Fi(Wireless Fidelity)などの無線による通信が行われる箇所があってもよい。
図2は、一実施形態に係る端末装置のハードウェア構成図である。図2を用いて、図1の情報処理システムにおける端末装置10のハードウェア構成について説明する。
端末装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、HDD(Hard Disk Drive)14と、メディアI/F(Interface)15と、ネットワークI/F17と、操作部18と、バスライン19と、を有する。
CPU11は、サーバ装置10全体の動作を制御する。ROM12は、サーバ装置10上で動作するOS(Operating System)、アプリ、SDK(Software evelopment Kit)、あるいはAPI(Application Programming Interface)などの各種プログラムを記憶する。
RAM13は、CPU11のワークエリアとして使用される。HDD14は、各種プログラムで利用されるデータを記憶する。HDD14は、SSD(Solid state Drive)などの不揮発性のストレージに置き換え可能である。メディアI/F15は、外部メモリなどの記録メディア16に記憶されている情報を読み出したり、記録メディア16に情報を書き込んだりするためのインタフェースである。
ネットワークI/F17は、例えば、Ethernet(登録商標)またはWi−Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。操作部18は、ユーザによる操作入力を受け付けるためのインタフェースである。操作部18は、例えば、タッチパネル機能を搭載した液晶表示装置または有機EL(Electro Luminescence)表示装置、もしくはキーボードおよびマウスである。バスライン19は、上記各構成要素を図2に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
図3は、一実施形態に係る画像形成装置20のハードウェア構成図である。図3を用いて、図1の情報処理システムにおける画像形成装置20のハードウェア構成について説明する。
画像形成装置20のコントローラ200は、CPU21と、ROM22と、RAM23と、NVRAM24(Non−volatile RAM)と、HDD25と、ネットワークI/F26と、エンジンI/F27と、パネルI/F28と、スキャナI/F29と、FCU(Fax Cotroller Unit)30と、メディアI/F35と、バスライン31と、を有する。また、画像形成装置20は、プロッタエンジン32と、操作部33と、スキャナエンジン34と、を有する。
CPU21は、画像形成装置20全体の動作を制御する。ROM22は、画像形成装置20上で動作するOS、アプリ、SDK、APIなどの各種プログラムを記憶する。RAM23は、CPU21のワークエリアとして使用される。NVRAM24およびHDD25は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。
ネットワークI/F26は、例えば、Ethernet(登録商標)またはWi−Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。エンジンI/F27は、プロッタエンジン32と接続するためのインタフェースである。パネルI/F28は、操作部33と接続するためのインタフェースである。スキャナI/F29は、スキャナエンジン34と接続するためのインタフェースである。FCU30は、他のファクシミリ端末との間で画像データであるファクシミリデータを送受信するファクシミリ通信を行う。
メディアI/F35は、外部メモリなどの記録メディア36に記憶されている情報を読み出したり、記録メディア36に情報を書き込んだりするためのインタフェースである。バスライン31は、上記各構成要素を図3に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
プロッタエンジン32は、印刷処理において、画像形成装置20におけるプロッタの動作を制御する。プロッタは、インクジェット方式の場合、例えば、インクジェットヘッドであり、レーザープリンタ方式の場合、例えば、感光体、レーザー照射装置、あるいは転写装置である。操作部33は、タッチパネル機能を搭載した液晶表示装置または有機EL表示装置であり、ユーザから設定、条件、指示などの入力を受け付ける。
スキャナエンジン34は、画像形成装置20におけるスキャナの動作を制御する。なお、スキャナは、特に限定されないが、例えば、圧板、ADF(Auto Document Feeder)、および撮像素子を有し、原稿から画像を読み取る任意の装置である。
図4は、一実施形態に係るサーバ装置のハードウェア構成図である。図4を用いて、図1の情報処理システムにおけるサーバ装置50のハードウェア構成について説明する。
サーバ装置50は、CPU51と、ROM52と、RAM53と、HDD54(Hard Disk Drive)と、メディアI/F55と、ネットワークI/F57と、操作
部58と、バスライン59と、を有する。
CPU51は、サーバ装置50全体の動作を制御する。ROM52は、サーバ装置50上で動作するOS、アプリ、SDK、あるいはAPIなどの各種プログラムを記憶する。RAM53は、CPU51のワークエリアとして使用される。HDD54は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。HDD54は、SSDなどの不揮発性のストレージに置き換え可能である。メディアI/F55は、外部メモリなどの記録メディア56に記憶されている情報を読み出したり、記録メディア56に情報を書き込んだりするためのインタフェースである。
ネットワークI/F57は、例えば、Ethernet(登録商標)またはWi−Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。操作部58は、ユーザによる操作入力を受け付けるためのインタフェースである。操作部58は、例えば、タッチパネル機能を搭載した液晶表示装置または有機EL(Electro Luminescence)表示装置、もしくはキーボードおよびマウスである。バスライン59は、上記各構成要素を図4に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
次に、端末装置10、画像形成装置20およびサーバ装置50の機能構成について説明する。図5は、図1の情報処理システムにおける端末装置10、画像形成装置20およびサーバ装置50の機能ブロック図である。図5において、端末装置10、画像形成装置20およびサーバ装置50は、通信ネットワーク2を介して通信可能に接続されている。
端末装置10は、通信部120と、読出・書込処理部130と、記憶部140とを有する。これら各部は、図2に示されている各構成要素のいずれかが、ROM12からRAM13上に展開された端末装置10用のプログラムに従ったCPU11からの命令によって動作することで実現される機能である。
通信部120は、CPU11からの命令およびネットワークI/F17の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
読出・書込処理部130は、CPU11がRAM13を作業領域としてROM12またはHDD14を実行することによって実現され、記憶部140に各種データを記憶したり、記憶された各種データを読み出したりする機能を実行する。
記憶部140は、ROM12またはHDD14の処理によって実行され、各種プログラムやデータ、動作に必要な各種設定情報等を格納する機能を実行する。RAM13の一時的な記憶機能により実行してもよい。
画像形成装置20は、入力受付部210と、通信部220と、読出・書込処理部230と、記憶部240とを有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM22からRAM23上に展開された画像形成装置20用のプログラムに従ったCPU21からの命令によって動作することで実現される機能である。
入力受付部210は、CPU21がRAM23を作業領域としてROM22またはHDD25を実行することによって実現され、外部機器からの指示入力や、ユーザからの入力を受け付ける。
通信部220は、CPU21からの命令およびネットワークI/F26の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
読出・書込処理部230は、CPU21がRAM23を作業領域としてROM22またはHDD25に記憶されたプログラムを実行することによって実現され、記憶部240に各種データを記憶したり、記憶された各種データを読み出したりする機能を実行する。
記憶部240は、ROM22またはHDD25の処理によって実行され、各種プログラムやデータ、動作に必要な各種設定情報等を格納する機能を実行する。RAM23の一時的な記憶機能により実行してもよい。
記憶部240は、表1で示される文字列1リスト、および表2で示される文字列2リストを記憶する。第一の文字列である文字列1、第二の文字列である文字列2はそれぞれ、ユーザによってファクシミリ文書の管理に使用する文字列としてあらかじめ設定された特定の文字列である。そいて文字列1リストはユーザが文字列1として複数設定した場合の複数の文字列1からなるリストである。また文字列2リストはユーザが文字列2として複数設定した場合の複数の文字列2からなるリストである。これら文字列リストのユーザからの入力を入力受付部210が受け付け、受け付けられた文字列リストは、読出・書込処理部230の機能により記憶部240に記憶される。














































ここで第一の文字列としての文字列1、第二の文字列としての文字列2について説明すると、文字列1と文字列2は、互いに異なる種類の文字列である。
文字列1は一例として、期限を表す単語を示す文字列である。期限を表す単語として具体的には、表1に示されるように『納期』『回答納期』『期限』の3つの文字列1が記憶部240にあらかじめ記憶されている。
文字列2は一例として、期限自体を表す単語を示す文字列である。期限自体を表す単語として具体的には、表2に示されるような、年月日を示す『平成YY年MM月DD日』『YYYY年MM月DD日』『YYYY/MM/DD』の3つの文字列2が記憶部240にあらかじめ記憶されている。なお、Y,M,Dは特定の文字列ではなくそれぞれ任意の数字を表している。
表1、表2それぞれ3つの文字列からなる文字列リストであるが、記憶される文字列の数はこれに限られず、記憶される順番も任意である。また表2には年月日を記憶しているが、期限を表すものであればこれに限られず、他に曜日や時間、これらを組み合わせたものでもよい。また特定の文字列とはすべて特定された文字からなるものだけでなく、文字列2のように、特定の文字列と任意の文字列との組み合わせであってもよい。
画像形成装置20は、さらに、画像データ処理部250と、要求先判断部260と、OCR処理部270とを有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM22からRAM23上に展開された画像形成装置20A用のプログラムに従ったCPU21からの命令によって動作することで実現される機能である。
画像データ処理部250は、期限設定制御部251と、転送制御部252を有し、画像データを期限が設定された文書として端末装置10に転送する機能を実行する。詳細には、まず期限設定制御部251は、画像データに応じて期限を設定する機能を実行する。そして転送制御部252は、期限が設定された文書としての画像データを端末装置10に転送する機能を実行する。
期限設定制御部251は、OCR取得部2511と、文字列1抽出部2512と、文字列2抽出部2513と、期限判断部2514と、ファイル名生成部2515とを有する。
OCR取得部2511は、OCRモジュールに対するOCR要求を行い、画像データのOCRを取得する機能を実行する。文字列1抽出部2512と、文字列2抽出部2513は、OCR結果から、それぞれ文字列1、文字列2を抽出する機能を実行する。期限判断部2514は、抽出された文字列から期限が設定された文書であるかどうかを判断する。ファイル名生成部2515は、抽出された文字列に基づき、期限が設定された文書として画像データに新たに付与するファイル名を生成する機能を実行する。
転送制御部252は、フォルダ名指定部2521と、転送処理部2522とを有する。フォルダ名指定部2521は、期限が設定された文書としての画像データを保存するフォルダ名(ディレクトリ名)を指定する。転送処理部2522は、端末装置10に期限が設定された文書としての画像データを転送する機能を実行する。
要求先判断部260は、OCR要求先としてOCR処理可能なOCRモジュールを判断する機能を実行する。
OCR処理部270は、OCR要求に応じて画像データにOCR処理を行い、OCR結果を出力する機能を実行する。
サーバ装置50は、通信部520と、OCRモジュールであるOCR処理部570とを有する。これら各部は、図4に示されている各構成要素のいずれかが、ROM52からRAM53上に展開されたサーバ装置50用のプログラムに従ったCPU51からの命令によって動作することで実現される機能である。
通信部520は、CPU51からの命令およびネットワークI/F57の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
OCR処理部570は、OCR要求に応じて画像データにOCR処理を行い、OCR結果を出力する機能を実行する。
続いて、情報処理システム1における処理について説明する。図6は画像データに対して期限を設定する処理を説明するフロー図である。ファクシミリでk頁分の画像データを受信したり、入力受付部210からユーザにより所定のk頁分の画像データに対する本処理フロー実行の命令が入力されたりすることで開始される。
まず、期限設定制御部251はkを初期化、ここではk=0とし(S1)、次にkを1加算する(S2)。OCR取得部2511はOCR取得工程として、ファクシミリで受信した、またはスキャナで読み取られた画像データのk頁目に対するOCR結果を取得する(S3)。一例として、ファクシミリとして受信した図7に示す画像データについて、ステップS3で取得したOCR結果であるテキストデータを図8に示す。
文字列1抽出部2512は第一の抽出工程として、取得したOCR結果から記憶部240の表1を参照して、期限を表す単語である文字列1が含まれているかを判断する(S4)。図9は、一例として、図8に示すOCR結果から抽出される文字列1を説明する図である。図9中に示される文字列T2『納期』が、表1の文字列1リストに含まれる文字列として判断される。
図9のように文字列1リストに含まれる文字列があれば、文字列1抽出部2512は、該当する文字列を抽出して抽出結果として出力し(S5)、ない場合は、期限設定制御部251が、k頁が最終頁であるかを判断する(S6)。
期限設定制御部 251は、最終頁であった場合は、期限文書ではなく、通常文書としての処理を実行して(S12)終了する。通常文書としての処理の例としては、期限文書ではなく通常文書に該当する旨のユーザへのメッセージ作成し、メッセージを操作部33に表示したり、メッセージを端末装置10にメール送信したりすることなどが挙げられる。また、通常文書としての処理の他の例として、前述のメッセージ作成と合わせて、もしくは前述のメッセージ作成の代わりに、端末装置10において通常文書として保存するためにあらかじめ定められたフォルダを指定して、端末装置10に転送する等、ユーザや本情報処理システムの管理者等が適宜設定すればよい。
さらに、文字列2抽出部2513は第二の抽出工程として、取得したOCR結果から記憶部240の表2を参照して、期限自体(年月日、曜日、時間やその組み合わせ)を表す文字列2が含まれているかを判断する(S7)。図9で説明すると、図9中に示される文字列T1『2017年2月13日』、文字列T3『2017年03月06日』が、表2の文字列2リストに含まれる文字列として判断される。
図9のように文字列2リストに含まれる文字列があれば、文字列2抽出部2513は、該当する文字列を抽出して抽出結果として出力し(S8)、ない場合は期限設定制御部251が、通常文書としての処理を行い(S12)、終了する。
図10は、ステップS5およびS8で抽出された抽出結果である。図10に示されるように、図7の画像データ中に出現した順に、文字列1としての「2017年2月13日」、文字列2としての「納期」、文字列1としての「2017年03月06日」というテキストデータが抽出されている。
次に、期限判断部2514は期限判断工程として、前述の抽出結果を参照して、抽出した文字列1の後ろに、抽出した文字列2が出現しているかどうかを判断し(S9)、出現している場合は、画像データを期限管理する文書と判断する(S10)。
図10を参照すると、文字列1である『納期』が含まれており、文字列1である『納期』の後に文字列2である『2017年03月06日』が出現している為、文字列が抽出された画像データは、2017年03月06日を期限として管理する文書と判断される。
そしてファイル名生成部2515は、ファイル名生成工程として、前述の抽出結果に基づき、期限管理する文書のファイル名(以降、期限ファイル名と呼ぶことがある。)を生成する(S11)。期限ファイル名は、一例として、画像データの元のファイル名の前に、文字列1、そして当該文字列1の後に出現した文字列2、の順に付加したファイル名とする。
一例として図10の抽出結果を用いた場合、ファイル名生成部2515は、元の画像データのファイル名の先頭に『納期20170306_』を付加する。図7に示される元の画像データのファイル名が『Oomori_office-20170217.tif』の場合は、期限文書として新たに付与するファイル名は『納期20170306_Oomori_office-20170217.tif』となる。これに限られず、文字列1のみ、つまり『納期』だけを付加するなどしてもよい。
このように、画像データのOCR結果にユーザによってファクシミリ文書の管理に使用するようあらかじめ設定された文字列である特定の文字列が含まれていれば、その特定の文字列を用いて画像データのファイル名を生成する。したがって特定の文字列でファクシミリなどの画像データを管理することが可能となる。
なお、文字列1および文字列2を互いに独立して管理に使用することも可能であるが、本実施形態では、組み合わせて利用することにより、具体的にはステップS9のように文書中での文字列1と文字列2の出現順を利用することにより、精度の良い管理を行っている。その他、ステップS11のファイル名生成においても、文字列1と文字列2の使用の順番を決めておくことで、よりユーザが使用しやすい管理システムとなっている。
また図6のフロー図では、ステップS4において、文字列1を含んでいれば以降の頁についてはOCR結果の取得ステップS3を行っていない。こうすることにより、複数ページからなる画像データの全ての頁についてOCR処理を行った場合に比べて時間とシステムの負荷が低減できる。特に抽出する文字列が期限に関するものであれば、一般的に一つの文書の中の出現頻度は高くないため、最初に取得した文字列で期限ファイル名を作成することが可能である。このような負荷低減を考えなければ、OCR処理を全ての頁について行ってもよく、その場合は期限ファイル名を、作成する度に上書きしたり、全てを保存してその中から使用する期限ファイル名をユーザが選択したりするなどしてもよい。
また、図6のフロー図ではステップ10の期限判断工程の後にステップ11のファイル名生成工程を実行しているが、ファイル名生成工程においては抽出結果が出力されていればファイル名を生成することが出来るため、ファイル名生成工程を実行するにあたり、期限判断工程は必ずしも必要なく、期限設定工程とは独立して実行することも可能である。
図11を用いて、画像データの転送処理について説明する。図6のフロー図で画像データの期限ファイル名が決定した後、端末装置10に画像データを転送する処理を説明するフロー図である。
まずフォルダ名指定部2521は、フォルダ名指定工程として、期限ファイル名を構成する文字列のうち、先頭から文字列を取得し(S13)、取得した文字列をフォルダ名として指定する(S14)。転送処理部2522は転送処理工程として、期限ファイル名が付与された画像データを、フォルダ名の指定とともに端末装置10に転送する(S15)。
すると端末装置10の記憶部140に、指定されたフォルダ名のフォルダが作成され、期限ファイル名が付与された画像データが記憶される。この際、指定されたフォルダ名が無い場合は前述のように新たに作成し、指定されたフォルダ名と同じフォルダ名がすでにある場合は、そのフォルダに記憶する。なおフォルダ指定工程で取得される文字列は、文字列1だけでもよいし文字列1と文字列2を合わせた文字列など適宜設定すればよい。
このように、特定の文字列を用いたフォルダ名を画像データの転送先における保存フォルダ名に指定することで、フォルダを開く工程を少なくフォルダ内のデータを把握することができる。なお、フォルダ名はユーザが使用しているOSなどによりディレクトリ名と呼ぶこともある。
図12は、画像データの転送先である端末装置10内のフォルダの階層構造を説明する図である。比較として図12(a)は、期限管理を行っていない時点でのフォルダを示す。例えばファクシミリを自動転送するフォルダである『フォルダ』に自動的に蓄積されている。ファイル名は『ABCD Company-20170217.tif』『XYZ_Station-20170220.tif』等、任意に付与されている。
それに対し図12(b)は、図11で説明した転送処理を実施して転送されたフォルダを示す。『納期20170306_Oomori_office-20170217.tif』の先頭から、文字列1および文字列2を取得し、フォルダ名(ディレクトリ名)としている。なおフォルダ名もファイル名と同様、必ずしも文字列1、文字列2を両方使用する必要はない。
次に図13のシーケンス図を用いて、図6のステップS1であるOCR取得工程の詳細を説明する。なお、画像形成装置20とサーバ50間のやり取りは、それぞれの通信部220、通信部520を通じて、ネットワーク2を介して行われる。
画像データ処理部250はOCR取得部2511の処理により、ファクシミリで画像データを受信したり、入力受付部210からユーザにより所定の画像データに対する本処理フロー実行の命令が入力されたりすると、要求先判断部260にOCR要求を送信する(S1−1)。要求先判断部260はまず、自身が搭載されている画像形成装置20内でOCR要求に対してOCR処理が行えるかどうか、つまりOCR処理部であるOCRモジュールを有するかを判断する(S1−2)。以下の説明では、要求先判断部260自身が搭載されている画像形成装置20を「自機」と呼ぶ。
自機内でOCR処理が可能な場合は、OCR処理部270にOCR処理要求を送信し(S1−3)、OCR処理部270がOCR処理を実行して(S1−4)、OCR結果を要求先判断部260に送信し(S1−5)、要求先判断部260はOCR取得部2511にOCR結果を送信する(S1−11)。
自機内でOCR処理が不可能な場合、つまり画像形成装置20内にOCRモジュールであるOCR処理部270が搭載されていない場合や、搭載されていても使用できる状態ではない場合は、要求先判断部260は、自機外でOCR処理可能かどうかを判断する(S1−6)。使用できる状態でない場合とは、例えば搭載しているOCRモジュールがその時点で他データに対するOCR処理を実行中である場合や、自機内の処理に負荷がかかっている場合なども含む。
利用可能なOCRモジュールを搭載しているサーバは、画像形成装置20の出荷前にあらかじめ記憶部240に記憶しておいてもよいし、ユーザが記憶部240に記憶してもよい。ユーザが記憶部240に記憶するために、要求先判断部260は操作部33に利用可能なサーバを登録するために必要な画面を表示させる機能を有していてもよい。
ここで、画像形成装置20内に、OCR処理部270が搭載されていない場合は、図5の画像形成装置20からOCR処理部270のみ削除した構成として説明できる。この時、図5の画像形成装置20を図1の画像形成装置20A、図5の画像形成装置20からOCR処理部270のみ削除した構成を図1の画像形成装置20Bとして区別できる。
自機外にOCR処理可能なサーバとしてサーバ50があれば、要求先判断部260は、サーバ装置50のOCR処理部570にCOR処理要求を送信し(S1−7)、OCR処理部570がOCR処理を実行して(S1−8)、OCR結果を要求先判断部260に送信し(S1−9)、要求先判断部260はOCR取得部2511にOCR結果を送信する(S1−11)。
自機外にもOCR処理可能OCR処理部が存在しない場合は、要求先判断部260は、必要なエラー処理を行う(S1−10)。エラー処理としては、一例としてOCR取得部2511に対するエラーメッセージの生成であり、OCR取得部2511に対しエラーメッセージを送信する(S1−11)。
このように、アプリケーションではOCR要求を行うだけで、実際のOCR処理がどこで行われるかを意識しなくてよい。なお、OCR処理部270、OCR処理部570は、S1−5,S1−9のようにOCR結果を、要求先判断部260を介してではなく直接OCR取得部2511へ送信してもよい。
以上で説明した画像形成装置20用のプログラムは、インストール可能な形式又は実行可能な形式のファイルによって、コンピュータで読み取り可能な記録媒体に記録されて流通されるようにしてもよい。また、上記記録媒体の他の例として、CD−R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、ブルーレイディスク等が挙げられる。また、上記記録媒体、あるいは、これらプログラムが記憶されたHD(Hard Disk)は、プログラム製品(Program Product)として、国内又は国外へ提供できる。
また、上記で説明した各実施形態における画像形成装置20は、単一の装置によって構築されてもよいし、各部(機能又は手段)を分割して任意に割り当てられた複数の装置によって構築されていてもよい。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路を含むプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)や従来の回路モジュール等のデバイスを含むものとする。
10 端末装置
20 画像形成装置
50 サーバ装置
250 画像データ処理部
260 要求先判断部
270 OCR処理部
570 OCR処理部
特開2006−211261号公報

Claims (8)

  1. 画像データのOCR結果を取得するOCR取得部と、
    前記OCR結果からあらかじめ特定された第一の文字列を抽出する第一の抽出部と、
    抽出された前記第一の文字列から前記画像データに付与するファイル名を生成するファイル名生成部とを備えた情報処理システム。
  2. 前記OCR結果からあらかじめ特定された第二の文字列を抽出する第二の抽出部をさらに有し、前記ファイル名生成部は、抽出された前記第一の文字列および抽出された前記第二の文字列から前記画像データに付与する前記ファイル名を生成する請求項1の情報処理システム。
  3. 前記第一の文字列は期限を表す単語であり、前記第二の文字列は期限自体を表す請求項2の情報処理システム。
  4. 前記OCR取得部は、前記画像データが複数ページからなる場合に、前記第一の文字列が抽出された時点で残りのページについては前記OCR結果を取得しない請求項1ないし3いずれかの情報処理システム。
  5. 前記情報処理システムはさらにフォルダ名指定部を有し、
    前記フォルダ名指定部は、前記ファイルの保存フォルダ名として、前記画像データに付与された前記ファイル名から抽出された文字列を用いたフォルダ名を指定する請求項1ないし3いずれかの情報処理システム。
  6. 前記情報処理システムは、
    記憶部を有する端末装置と、
    前記端末装置に前記画像データを転送する情報処理装置とを有し、
    前記情報処理装置は、前記フォルダ名指定部を有し、
    前記フォルダ名指定部は、前記画像データが前記端末装置に転送されて前記記憶部に記憶される際のフォルダ名を指定する請求項5の情報処理システム。
  7. 前記情報処理システムは、ファクシミリを受信可能な情報処理装置を有し、
    記憶部を有する端末装置と、
    前記端末装置に前記画像データを転送する情報処理装置とを有し、
    前記画像データは前記情報処理装置が受信したファクシミリの画像データである請求項1ないし5いずれかの情報処理システム。
  8. 画像データのOCR結果を取得するOCR取得工程と、
    前記OCR結果からあらかじめ特定された第一の文字列を抽出する第一の抽出工程と、
    抽出された前記第一の文字列から前記画像データに付与するファイル名を生成するファイル名生成工程とからなる情報処理方法。
JP2018065896A 2018-03-29 2018-03-29 情報処理システムおよび情報処理方法 Active JP7043929B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018065896A JP7043929B2 (ja) 2018-03-29 2018-03-29 情報処理システムおよび情報処理方法
US16/353,252 US11055558B2 (en) 2018-03-29 2019-03-14 Information processing system, method of processing information, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018065896A JP7043929B2 (ja) 2018-03-29 2018-03-29 情報処理システムおよび情報処理方法

Publications (2)

Publication Number Publication Date
JP2019176434A true JP2019176434A (ja) 2019-10-10
JP7043929B2 JP7043929B2 (ja) 2022-03-30

Family

ID=68056384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018065896A Active JP7043929B2 (ja) 2018-03-29 2018-03-29 情報処理システムおよび情報処理方法

Country Status (2)

Country Link
US (1) US11055558B2 (ja)
JP (1) JP7043929B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360461A (zh) * 2021-06-28 2021-09-07 武汉众邦银行股份有限公司 一种推送逾期数据到催收系统进行解析的方法及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
US11113559B2 (en) * 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium
JP7293693B2 (ja) * 2019-02-05 2023-06-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7353771B2 (ja) * 2019-02-28 2023-10-02 キヤノン株式会社 プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7400397B2 (ja) * 2019-11-26 2023-12-19 京セラドキュメントソリューションズ株式会社 情報処理装置
US11393234B2 (en) * 2020-01-21 2022-07-19 Canon Kabushiki Kaisha Image processing system for computerizing document, control method thereof, and storage medium
JP7414554B2 (ja) * 2020-01-27 2024-01-16 シャープ株式会社 情報処理装置、制御方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211428A (ja) * 2014-04-30 2015-11-24 キヤノン株式会社 管理装置、コンピュータプログラム、管理方法
JP2016165059A (ja) * 2015-03-06 2016-09-08 シャープ株式会社 画像処理装置
JP2017073591A (ja) * 2015-10-05 2017-04-13 キヤノン株式会社 画像処理装置、制御方法、及びプログラム
JP2017129926A (ja) * 2016-01-18 2017-07-27 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP2018030330A (ja) * 2016-08-26 2018-03-01 京セラドキュメントソリューションズ株式会社 画像形成装置及びプログラム
JP2019115011A (ja) * 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603056A (ja) * 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置
JPH01297770A (ja) * 1988-05-26 1989-11-30 Hitachi Ltd 画像ファイリング装置のタイトル情報入力用帳票作成方法及び画像ファイリング方法
US5301350A (en) * 1989-10-10 1994-04-05 Unisys Corporation Real time storage/retrieval subsystem for document processing in banking operations
US5170466A (en) * 1989-10-10 1992-12-08 Unisys Corporation Storage/retrieval system for document
US5448375A (en) * 1992-03-20 1995-09-05 Xerox Corporation Method and system for labeling a document for storage, manipulation, and retrieval
JPH0844827A (ja) * 1994-07-27 1996-02-16 Ricoh Co Ltd デジタル複写機
US5751287A (en) * 1995-11-06 1998-05-12 Documagix, Inc. System for organizing document icons with suggestions, folders, drawers, and cabinets
US7032030B1 (en) * 1999-03-11 2006-04-18 John David Codignotto Message publishing system and method
JP4235411B2 (ja) * 2001-09-11 2009-03-11 キヤノン株式会社 文書登録システム、方法、プログラム及び記憶媒体
US7031838B1 (en) * 2003-03-25 2006-04-18 Integrated Environmental Services. Inc. System and method for a cradle-to-grave solution for investigation and cleanup of hazardous waste impacted property and environmental media
CN100382096C (zh) * 2003-08-20 2008-04-16 奥西-技术有限公司 文档扫描设备及方法
JP4247138B2 (ja) 2004-02-25 2009-04-02 株式会社リコー ネットワーク複合機
JP4134056B2 (ja) 2005-01-27 2008-08-13 京セラミタ株式会社 画像読取り装置および画像読取りプログラム
US8705081B2 (en) * 2006-11-22 2014-04-22 Fuji Xerox Co., Ltd. System and method for including input method information on a printed document
US9734168B1 (en) * 2013-12-08 2017-08-15 Jennifer Shin Method and system for organizing digital files
US10949662B2 (en) * 2017-12-27 2021-03-16 Seiko Epson Corporation Image processing apparatus

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211428A (ja) * 2014-04-30 2015-11-24 キヤノン株式会社 管理装置、コンピュータプログラム、管理方法
JP2016165059A (ja) * 2015-03-06 2016-09-08 シャープ株式会社 画像処理装置
JP2017073591A (ja) * 2015-10-05 2017-04-13 キヤノン株式会社 画像処理装置、制御方法、及びプログラム
JP2017129926A (ja) * 2016-01-18 2017-07-27 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP2018030330A (ja) * 2016-08-26 2018-03-01 京セラドキュメントソリューションズ株式会社 画像形成装置及びプログラム
JP2019115011A (ja) * 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360461A (zh) * 2021-06-28 2021-09-07 武汉众邦银行股份有限公司 一种推送逾期数据到催收系统进行解析的方法及存储介质
CN113360461B (zh) * 2021-06-28 2022-08-12 武汉众邦银行股份有限公司 一种推送逾期数据到催收系统进行解析的方法及存储介质

Also Published As

Publication number Publication date
US20190303701A1 (en) 2019-10-03
JP7043929B2 (ja) 2022-03-30
US11055558B2 (en) 2021-07-06

Similar Documents

Publication Publication Date Title
JP7043929B2 (ja) 情報処理システムおよび情報処理方法
JP5534666B2 (ja) ドキュメント処理装置およびその制御方法、ドキュメント管理システムおよび該システムにおけるデータ処理方法並びにコンピュータプログラム
US9262112B2 (en) Image processing apparatus having file server function, and control method and storage medium therefor
US7952736B2 (en) Received document input and output device and input and output method of received document
US10216751B2 (en) Information processing apparatus, method for controlling the same, and storage medium
US10306085B2 (en) Information processing apparatus, control method of information processing apparatus, and recording medium
JP6634744B2 (ja) 情報処理システム、情報処理装置、機器、情報処理方法、プログラム
JP2008071196A (ja) 印刷システム、印刷装置、ユーザ端末、プログラム及びプログラムが記録された記録媒体
JP6699143B2 (ja) 情報処理システム、電子機器及びプログラム
US20150081702A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
US10656890B2 (en) Image forming apparatus, storage medium, and control method
US20070050378A1 (en) Pin point searching map document input and output device and pin point searching map document input and output method of the device
JP2019067361A (ja) 情報処理装置、通信システム、画像形成方法、プログラム
JP2008059332A (ja) 多機能装置および利用条件設定プログラム
US9225873B2 (en) Information processing system, information processing apparatus, information processing method, and program
US20160316093A1 (en) Apparatus equipped with fax function, control method thereof, and storage medium
JP6907659B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2016096393A (ja) 情報処理装置、システム、情報処理方法およびプログラム
US20130107302A1 (en) Image processing apparatus, image processing method and memory medium
US20200310699A1 (en) Management apparatus and terminal apparatus
JP2007007922A (ja) 画像処理装置
JP2018042152A (ja) 画像処理装置、画像処理プログラム、画像処理システムおよび画像処理方法
US11868669B2 (en) Image processing apparatus and control method for displaying a setting history for which authentication information is required to execute a job
US10750034B2 (en) Image reading apparatus and method of controlling image reading apparatus
JP7131024B2 (ja) 情報処理システム、情報処理装置、制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220228

R151 Written notification of patent or utility model registration

Ref document number: 7043929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151