JP2015187846A - 文書処理システム、及び文書処理装置 - Google Patents

文書処理システム、及び文書処理装置 Download PDF

Info

Publication number
JP2015187846A
JP2015187846A JP2015037577A JP2015037577A JP2015187846A JP 2015187846 A JP2015187846 A JP 2015187846A JP 2015037577 A JP2015037577 A JP 2015037577A JP 2015037577 A JP2015037577 A JP 2015037577A JP 2015187846 A JP2015187846 A JP 2015187846A
Authority
JP
Japan
Prior art keywords
document
image
character
character strings
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015037577A
Other languages
English (en)
Inventor
大黒 慶久
Yoshihisa Oguro
慶久 大黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2015037577A priority Critical patent/JP2015187846A/ja
Priority to US14/644,752 priority patent/US20150261735A1/en
Publication of JP2015187846A publication Critical patent/JP2015187846A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】予め定められた書式に記入された手書き文字を含む文書等を電子化して容易に利用できるようにする文書処理システムを提供する。
【解決手段】文書処理システムは、予め定められた一つ以上の文字列と、前記文字列のそれぞれに対応する記入範囲とを含む文書画像を蓄積する文書蓄積手段と、前記文書画像の前記文字列と、前記文字列のそれぞれに対応する記入範囲とを対応づけて記憶する対応情報記憶手段と、前記記憶した文字列の中から、要求された検索文字列を含む文字列を検索する検索手段と、前記蓄積した文書画像の前記検索された文字列に対応する記入範囲の画像を一覧表示させる表示制御手段と、を有する。
【選択図】図4

Description

本発明は、文書処理システム、及び文書処理装置に関する。
例えば、帳票や問診票等の予め定められた書式の文書に記入された手書き文字を認識し、検索する文書管理装置が知られている。例えば、活字文字と手書文字とが混在する文書画像データを活字領域の画像データと、手書領域の画像データとに分離し、夫々の領域で文字認識処理を行ってインデックステーブルを作成し、検索対象とする文書管理装置が知られている(例えば、特許文献1参照)。
活字テキストは、文字形状が安定しているため高精度で文字認識を行うことができるが、手書テキストは、個人差が大きく、形状が不安定なので、高精度で文字認識を行うことが困難である。また、手書テキストの認識精度を上げるために、1マス毎に1文字を記入させる方法もあるが、1マス毎に1文字を記入させるような手書専用の帳票に長文を記入することは、使用感が著しく低下する等、記入者に好まれないので一般的には用いられていない。
一方、帳票や問診票等において、選択肢のある設問について、OMR(Optical Mark Recognition)技術を用いて、鉛筆等の筆記具で塗りつぶされた記入欄を特定することにより、記入者の選択した選択肢を高精度に認識することができる。しかし、この場合でも、例えば、選択肢に含まれない回答等、手書きで記入されたテキストは、認識が困難であり、手書入力されたテキスト部分は、例えば、オペレータが目視してキー入力すること等により電子化する必要がある。
このように、予め定められた書式に記入された手書文字を含む文書等を電子化して利用することには困難を伴っていた。
本発明の実施の形態は、上記問題点に鑑みてなされたものであって、予め定められた書式に記入された手書き文字を含む文書等を電子化して容易に利用できるようにする文書処理システムを提供することを目的とする。
上記課題を解決するため、本発明の一実施形態に係る文書処理システムは、予め定められた一つ以上の文字列と、前記文字列のそれぞれに対応する記入範囲とを含む文書画像を蓄積する文書蓄積手段と、前記文書画像の前記文字列と、前記文字列のそれぞれに対応する記入範囲とを対応づけて記憶する対応情報記憶手段と、前記記憶した文字列の中から、要求された検索文字列を含む文字列を検索する検索手段と、前記蓄積した文書画像の前記検索された文字列に対応する記入範囲の画像を一覧表示させる表示制御手段と、を有する。
本発明の実施の形態によれば、予め定められた書式に記入された手書き文字を含む文書等を電子化して容易に利用できるようにする文書処理システムを提供することができる。
一実施形態に係る文書処理システムの構成例を示す図である。 一実施形態に係るコンピュータのハードウェア構成例を示す図である。 一実施形態に係る画像形成装置のハードウェア構成例を示す図である。 一実施形態に係る文書処理システムの機能構成図である。 一実施形態に係る文書の例を示す図である。 一実施形態係る文書の例の拡大図である。 一実施形態に係るOCR処理について説明するための図である。 一実施形態に係る記入範囲を特定する処理について説明するための図である。 一実施形態に係るテンプレートの例を示す図である。 一実施形態に係るテンプレート登録処理の流れを示すフローチャートである。 一実施形態に係る文書情報の蓄積処理の流れを示すフローチャートである。 一実施形態に係る文書表示処理の流れを示すフローチャートである。 一実施形態に係る文書情報の蓄積処理のシーケンスチャートである。 一実施形態に係る文書情報の検索処理のシーケンスチャートである。 一実施形態に係る検索ワードの入力画面の例を示す図である。 一実施形態に係る画像一覧の表示画面の例を示す図である。 一実施形態に係る文書画像の表示画面の例を示す図である。
以下に、本発明の実施の形態について、添付の図面を参照して説明する。
<システムの構成>
図1は一実施形態に係る文書処理システムの構成例を示す図である。文書処理システム100は、例えば、インターネットや、LAN(Local Area Net Work)等のネットワーク104に接続されたサーバ装置101、画像形成装置102、及び端末装置103等を有する。
サーバ装置101は、一般的なコンピュータの構成を有する情報処理装置であり、本発明に係る文書管理装置の一例である。文書管理装置としての各機能は、例えば、サーバ装置101で動作するプログラム等により実現される。画像形成装置102は、例えば、プリンタ、スキャナ、コピー、ファクシミリ等の機能を一つの筐体に搭載した複合機等の画像読取機能を有する機器である。端末装置103は、例えば、PC(Personal Computer)、タブレット端末、スマートフォン等、一般的なコンピュータの構成を有する情報処理装置である。
図1の構成において、文書処理システム100に文書画像を登録するユーザは、例えば、画像形成装置102を用いて文書処理システム100に登録する文書の画像(文書画像)の読取を行い、読取った文書画像をサーバ装置101に蓄積する。また、文書処理システム100に蓄積された文書画像を閲覧するユーザは、端末装置103を用いて、例えば、検索文字列等を入力し、検索結果を端末装置103の表示画面等で確認する。
尚、図1の構成は、あくまで一例である。例えば、文書管理装置としての機能を実現するプログラムは、例えば、画像形成装置102、端末装置103等にインストールされていても良い。すなわち、画像形成装置102、端末装置103等が文書管理装置であっても良い。また、画像形成装置102は、例えば、サーバ装置101又は端末装置103等に接続されたスキャナ装置等であっても良い。さらに、文書管理装置の各機能は複数のサーバ装置101等に分散して備えられていても良い。
<ハードウェア構成>
(サーバ装置、端末装置)
サーバ装置101、及び端末装置103は、例えば、一般的なコンピュータの構成を有している。
図2は、一実施形態に係るコンピュータのハードウェア構成例を示す図である。サーバ装置101、又は端末装置103は、例えば、CPU(Central Processing Unit)201、RAM(Random Access Memory)202、ROM(Read Only Memory)203、ストレージ部204、外部I/F(Interface)部205、入力部206、表示部207、通信I/F部208、バス209等を有する。
CPU201は、ROM203やストレージ部204等に格納されたプログラムやデータをRAM202上に読み出し、処理を実行することで、サーバ装置101、又は端末装置103の各機能を実現する演算装置である。RAM202は、CPU201のワークエリア等として用いられる揮発性のメモリである。ROM203は、電源を切ってもプログラムやデータを保持することができる不揮発性のメモリであり、例えば、フラッシュROM等により構成される。
ストレージ部204は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)等のストレージ装置であり、OS(Operation System)、アプリケーションプログラム、及び各種データ等を記憶する。
外部I/F205は、外部装置とのインタフェースである。外部装置には、例えば、記録媒体210等がある。サーバ装置101及び端末装置103は、外部I/F205を介して、記録媒体210の読取り及び/又は書き込みを行うことができる。記録媒体210には、例えば、光学ディスク、磁気ディスク、メモリカード、USB(Universal Serial Bus)メモリ等が含まれる。
また、記録媒体210に所定のプログラムを格納し、この記録媒体210に格納されたプログラムを外部I/F205を介して、サーバ装置101、又は端末装置103にインストールすることにより、所定のプログラムが実行可能となる。
入力部206は、マウス等のポインティングデバイスや、キーボード等を含み、サーバ装置101、又は端末装置103に各操作信号を入力するのに用いられる。表示部207はディスプレイ等を含み、サーバ装置101、又は端末装置103による処理結果等を表示する。
通信I/F208は、サーバ装置101、又は端末装置103をネットワーク104に接続するインタフェースである。これにより、サーバ装置101、又は端末装置103は通信I/F208を介して、他の機器とネットワーク104を介してデータ通信を行うことができる。バス209は、上記各構成要素に接続され、アドレス信号、データ信号、及び各種制御信号等を伝送する。
尚、図2の構成はあくまで一例である。例えば、サーバ装置101、又は端末装置103は、入力部206、表示部207等を外部に有していても良いし、入力部206、表示部207が一体となったタッチパネルディスプレイ等を有していても良い。
(画像形成装置)
図3は、一実施形態に係る画像形成装置のハードウェア構成例を示す図である。画像形成装置102は、例えば、コントローラボード300と、オペレーションパネル309と、FCU(Facsimile Control Unit)310と、プリンタ311、スキャナ312等のハードウェアエンジンとを有する。
コントローラボード300は、一般的なコンピュータの構成を含んでおり、例えば、CPU301、システムメモリ302、NB(North Bridge)303、SB(South Bridge)304、ASIC(Application Specific Integrated Circuit)306、ローカルメモリ307、HDD308、NIC(Network Interface Card)313、USBインタフェース314、IEEE1394インタフェース315、セントロニクスインタフェース316等を有する。
オペレーションパネル309は、コントローラボード300のASIC306に接続されている。また、SB304、NIC313、USBインタフェース314、IEEE1394インタフェース315、及びセントロニクスインタフェース316は、NB303にPCIバスで接続されている。また、FCU310、プリンタ311、スキャナ312は、コントローラボード300のASIC306にPCIバスで接続されている。
尚、コントローラボード300は、ASIC306にローカルメモリ307、HDD308等が接続されると共に、CPU301とASIC306とがCPUチップセットのNB303を介して接続されている。また、ASIC306とNB303とは、PCIバスを介して接続されているのではなく、高速化のために、AGP(Accelerated Graphics Port)305を介して接続されている。
CPU301は、画像形成装置102の全体制御を行うプロセッサである。CPU301は、例えば、HDD308等に記憶されたオペレーティングシステム、アプリケーション、各種サービス等のプログラムを実行し、画像形成装置102の各機能を実現する。
NB303は、CPU301、システムメモリ302、SB304及びASIC306を接続するためのブリッジである。システムメモリ302は、画像形成装置102の描画用メモリ等として用いるメモリである。SB304は、NB303とPCIバス、周辺デバイスとを接続するためのブリッジである。また、ローカルメモリ307は、コピー用画像バッファ、符号バッファとして用いるメモリである。システムメモリ302又はローカルメモリ307は、以下の説明で、単にメモリ、又は記憶領域と表現する場合がある。
ASIC306は、画像処理用のハードウェア要素を有する画像処理用途向けの集積回路である。HDD308は、例えば、画像、プログラム、フォントデータ、フォーム等の蓄積を行うためのストレージ装置である。
また、オペレーションパネル309は、ユーザからの入力操作を受け付けるためのハードウェア(操作部)であると共に、ユーザに向けた表示を行うハードウェア(表示部)である。FCU310は、例えば、G3 FAX(Group 3 Facsimile)等の規格に従ってFAXデータの送受信を行う。プリンタ311は、例えば、CPU301で動作するプログラム等の制御に応じて印刷を行う。スキャナ312は、例えば、CPU301で動作するプログラム等の制御に応じて画像の読取を行う。
NIC313は、画像形成装置102をネットワーク104に接続し、データの送受信を行うための通信インタフェースである。USBインタフェース314は、例えば、USBメモリ等の記録媒体や、各種USB機器を接続するためのシリアルバスインタフェースである。IEEE1394インタフェース315は、高速シリアルバス規格のIEEE1394に準拠した機器を接続するためのインタフェースである。セントロニクスインタフェース316は、パラレルポートの仕様であるセントロニクス仕様に準拠した機器を接続するためのインタフェースである。
尚、図3の構成はあくまで一例である。画像形成装置102は、例えば、ファックス機能を有さないコピー機や、印刷機能を有さないスキャナ等の画像形成装置であっても良い。
<機能構成>
図4は、一実施形態に係る文書処理システムの機能構成図である。
(サーバ装置の機能構成)
図4において、サーバ装置(文書処理装置)101は、通信手段401、文書蓄積手段402、対応情報記憶手段403、特定手段404、検索手段405、表示制御手段406、抽出手段407等を有する。
通信手段401は、サーバ装置101をネットワーク104に接続し、画像形成装置102や、端末装置103等とデータの送受信を行う手段であり、例えば、図2の通信I/F部208等に対応する。
文書蓄積手段402は、処理対象となる、予め定められた一つ以上の文字列と、この文字列のそれぞれに対応する記入範囲とを含む文書の画像(文書画像)を蓄積する。文書蓄積手段402は、例えば、画像形成装置102等で取得した処理対象となる文書画像等を、図2のストレージ部204等の記憶手段に文書データ408として記憶(蓄積)する。
ここで、文書処理システム100の処理対象となる文書(文書画像)について説明する。図5は、一実施形態に係る文書の例を示す図である。図5において、文書の一例である問診票500には、質問文が活字で印刷されており、質問文に対応する記入範囲に手書きで回答が記入されるようになっている。本実施形態では、例えば、この問診票500のように、予め作成された活字テキストによって記入内容が指示される記入用紙に対して、例えば、手書き文字等が記入される文書を処理対象とする。言い換えると、予め定められた一つ以上の文字列(活字テキスト)と、この文字列のそれぞれに対応する(手書文字の)記入範囲とを含む文書を処理対象とする。尚、問診票500は、あくまで一例であって、本実施形態で取り扱う文書は、活字テキストによって記入内容が指示される記入用紙に対して、例えば、手書き文字等が記入される文書であれば、例えば、手書帳票、点検結果記入票等、他の書式の文書であっても良い。
図4に戻って、サーバ装置101の機能構成の説明を続ける。対応情報記憶手段403は、処理対象となる文書画像の予め定められた一つ以上の文字列(活字テキスト)と、その文字列のそれぞれに対応する手書き文字等の記入範囲とを対応づけて、図2のストレージ部204等の記憶手段に対応情報409等として記憶する。
図6は、一実施形態に係る文書の例の拡大図である。図6は、図5に示した問診票500の一部のエリア501を拡大した図である。図6において、「負傷の原因(1)」という項目601の、「何をしていて?」という活字テキストによる設問602に対して、「寝違いを起こし、起床時より」という手書テキストによる回答603が記載されている。対応情報409には、例えば、この「何をしていて?」という設問602の文字列と、設問602の文字列に対して、手書テキストにより回答603が記入される記入範囲とが、関連付けて記録されている。
図4に戻って、サーバ装置101の機能構成の説明を続ける。特定手段404は、例えば、画像形成装置102等によって読取った文書画像等に基づいて、対応情報409に記憶される文字列(活字テキスト等)のそれぞれに対応する記入範囲を特定する(特定処理)。また、特定手段404は、文書画像に含まれる文字列(活字テキスト)と、文字列のそれぞれに対応する記入範囲とを特定するものであっても良い。尚、特定処理の処理内容については後述する。
検索手段405は、対応情報409に記憶された文字列の中から、端末装置103等に要求された検索文字列を含む文字列を検索する。尚、対応情報409は、文字列(活字テキスト)と、対応する(手書き文字等の)記入範囲とを対応づけて記憶しているので、検索により、検索文字列を含む設問等に対応する記入範囲を特定することができる。
表示制御手段406は、文書データ408として蓄積された文書画像の、検索手段405によって検索された文字列に対応する記入範囲の画像を、例えば、端末装置103等に一覧表示させる。例えば、図6に示す文書画像おいて、検索文字列として「何をしていて?」が指定された場合、図6の文書画像は、検索文字列「何をしていて?」に対応する文字列が3つ含まれている。この場合、表示制御手段406は、検索された「何をしていて?」という3つの文字列に対応する記入範囲の手書き文字の画像である「寝違いを起こし、起床時より」、「階段で誤って転倒し」、「買い物した重い荷物を持ち運んで」を端末装置103等に一覧表示させる。
抽出手段407は、端末装置103に一覧表示させた手書き文字の中から、選択された手書き文字に対応する入力範囲の画像を抽出する。表示制御手段406は、抽出手段407によって抽出された画像を、例えば、端末装置103等に一覧表示させる。
尚、文書蓄積手段402、対応情報記憶手段403、特定手段404、検索手段405、表示制御手段406、抽出手段407等は、例えば、サーバ装置101で動作するプログラム等によって実現される。
(画像形成装置の機能構成)
図4において、画像形成装置102は、読取手段410、文字認識手段411、入力表示手段412、通信手段413等を有する。
読取手段410は、処理対象となる文書を読取り、文書画像等の電子データに変換する手段であり、例えば、図3のスキャナ312と、その制御プログラム等を含む。
文字認識手段411は、読取手段410によって読取された文書画像に含まれる文字画像をテキストデータに変換するOCR(Optical Character Recognition)処理を行い、文書画像に含まれる文字列(活字テキスト)と、その座標情報を取得する。文字認識手段411は、例えば、図3のCPU301等で動作するプログラム等によって実現される。
入力表示手段412は、各種情報を表示すると共に、ユーザによる入力操作を受け付ける手段であり、例えば、図3のオペレーションパネル309と、その制御プログラム等を含む。尚、入力表示手段412は、例えば、入力手段と表示手段とに分けて設けられていても良い。
通信手段413は、画像形成装置102をネットワーク104に接続し、サーバ装置101や、端末装置103等とデータの送受信を行うための手段であり、例えば、図3のNIC313等に対応する。
(端末装置の機能構成)
図4において、端末装置103は、入力手段414、表示手段415、通信手段416を有する。
入力手段414は、ユーザの入力操作を受け付ける手段であり、例えば、図2の入力部206等に相当する。
表示手段415は、端末装置103の処理画面等の各種情報を表示する手段であり、例えば、図2の表示部207等に相当する。また、サーバ装置101の表示制御手段406の制御に応じて、画像の一覧表示画面等を表示する。
通信手段416は、端末装置103をネットワーク104に接続し、サーバ装置101や、画像形成装置102等とデータの送受信を行うための手段であり、例えば、図2の通信I/F208等に対応する。
尚、上記機能構成はあくまで一例であり、本発明の範囲を限定するものではない。例えば、サーバ装置101が有する各手段は、画像形成装置102、端末装置103等が有していても良い。また、文字認識手段411、入力手段414、表示手段415等をサーバ装置101が有していても良い。さらに、画像形成装置102は、通信手段413を介さずに、例えば、USBインタフェース等によってサーバ装置101、端末装置103等に接続されていても良い。
<特定処理について>
ここで、文書画像に含まれる一つ以上の文字列(活字テキスト等)と、その文字列に対応する手書き文字等の記入範囲とを特定する処理について説明する。
図7は、一実施形態に係る活字OCR処理について説明するための図である。図7の(a)は、本実施の形態の説明に不要な要素を削除して簡略化した問診票701の例である。図7(a)の問診票701は、予め定められた一つ以上の文字列(活字テキスト)と、文字列に対応する手書き文字が記入される記入範囲(図示なし)を含む、文書処理システム100の処理対象となる文書の一例である。
図7(b)は、図7(a)の問診票701を画像形成装置102の読取手段410で読取った文書画像を文字認識手段411によってOCR処理した状態を示している。図7(b)において、破線で囲われた範囲が文字認識手段411によって特定された活字テキストの位置である。文字認識手段411は、破線で囲われた活字テキストの位置を特定し、また活字テキストを文字コード等のテキストデータに変換する。
読取手段410によって読取られた文書画像と、文字認識手段411によって特定された活字テキストの位置及びテキストデータは、画像形成装置102の通信手段413により、サーバ装置101に送信される。
図8は、一実施形態に係る記入範囲を特定するための処理について説明するための図である。サーバ装置101は、画像形成装置102から文書画像、活字テキストの位置、テキストデータ等を受信すると、特定手段404により、活字テキスト、活字テキストに対応する手書き文字等の記入範囲との対応関係を特定する。
例えば、図8の問診票701において、手書き記入範囲は、活字テキスト801、803、805、807等が存在しない範囲にあると考えられる。また、活字テキスト801が横書きの場合、活字テキスト801に対応する手書き記入範囲である範囲A802は、活字テキスト801の下にあると考えられる。一方、活字テキスト801が縦書きの場合には、活字テキスト801に対応する手書き記入範囲は、縦書きの活字テキストの左側に位置すると考えられる。
さらに、例えば、活字テキストに対応する手書き記入範囲の形状を矩形とし、手書き記入範囲は、活字テキスト及び他の手書き記入範囲とオーバーラップしないものとする。
例えばこのような条件により、活字テキスト801の「名前」に対応する手書き記入範囲を、例えば、斜線でハッチングされた範囲A802に特定することができる。範囲A802は、例えば、活字テキスト801の位置によって指定される座標(Xa,Ya)と、活字テキスト803、805の位置によって指定される(Xb,Yb)とによって定義される。
尚、図8の範囲C806、範囲D808のように、下側(又は上側)に活字テキストが存在しない場合、手書き記入範囲の高さ制限の条件を追加すること等により、範囲C806、及び範囲D808を特定することができる。また、範囲B804、範囲D808のように、右側(又は左側)に活字テキストが存在しない場合、手書き記入範囲の幅制限の条件を追加すること等により、範囲B804、及び範囲D808を特定することができる。
図9は、一実施形態に係るテンプレートの例を示す図である。図9のテンプレート900は、問診票ID901、活字テキスト902、手書き記入範囲903等の情報を含む。
問診票ID901は、問診票を特定するための識別情報である。活字テキスト902、手書き記入範囲903等の情報は、問診票によって異なるので、問診票の種類を問診票ID901によって管理する。
また、テンプレート900には、特定手段404によって特定された、活字テキスト902と、手書き記入範囲903とが関連付けられて記録されている。テンプレート900は、例えば、図2のストレージ部204等の記憶手段等に記憶される。
<処理の流れ>
(テンプレート登録処理)
図10は、一実施形態に係るテンプレート登録処理の流れを示すフローチャートである。ユーザは、例えば、記入前の問診票等を画像形成装置102に読み込ませることにより、テンプレート900を登録することができる。
ステップS1001において、新たにテンプレート900を登録したい記入前の問診票等がある場合、問診票ID(帳票ID)901を更新してステップS1002に進む。一方、テンプレート900を登録する帳票がない場合、処理を終了する。尚、問診票はあくまで処理対象となる文書の一例であり、他の帳票等であっても良い。
ステップS1002において、読取手段410は、記入前の問診票を読取り、画像データに変換する。
ステップS1003において、文字認識手段411は、読取手段410が取得した画像データに対して、活字OCR処理を実行し、活字テキストの文字コード(テキストデータ)と、位置(座標等)を取得する。
ステップS1004において、特定手段404は、文字認識手段411が取得した活字テキストの文字コードと位置に基づいて、手書き文字等の記入範囲を特定する。
ステップS1005において、特定手段404は、ステップS1003で取得した活字テキストの文字コードと、ステップS1004で特定した活字テキストに対応する手書き文字等の記入範囲に基づいて、例えば、図9に示すテンプレート900を作成する。
ステップ1006において、特定手段404が作成したテンプレート900を、図2のストレージ部204等の記憶手段に記憶する。
また、登録する問診票が無くなるまで、上記処理を繰り返す。
尚、上記説明では、記入前(未記入)の問診票を用いてテンプレートを作成するものとして説明を行ったが、記入後の問診票を用いてテンプレートを作成することも可能である。この場合、例えば、ステップS1003において、活字テキスト(活字文字)と、手書文字とを識別し、識別された活字テキストを処理対象とすれば良い。
尚、活字テキストと、手書き文字の判定は、例えば、活字OCRで手書き文字を認識した場合、認識確信度スコアが低いことを利用して、あるしきい値以下の認識確信度スコアであれば手書き文字と認識するものであっても良い。尚、認識確信度スコアが低い認識結果は、そもそもご認識の可能性が高いことから、被検索対象テキストとして有効でない恐れがあるので、無駄な検索を避ける意味でも、この結果を利用しないことは都合が良い。
上記処理により、ユーザは、記入前の問診票、又は記入後の問診票等を用いて、文書処理システム100にテンプレート900を登録することができる。
(文書情報の蓄積処理)
図11は、一実施形態に係る文書情報の蓄積処理の流れを示すフローチャートである。ユーザは、記入済の問診票等を画像形成装置102に読み込ませることにより、文書情報(文書画像)をサーバ装置101等に蓄積することができる。
ステップS1101において、新たに蓄積する記入済の問診票等がある場合、文書IDを更新してステップS1102に進む。一方、蓄積する記入済の問診票等がない場合、処理を終了する。尚、文書IDは、文書画像を特定するための識別情報であり、文書画像毎に異なる値が付与される。また、問診票はあくまで一例であり、他の帳票であっても良い。
ステップS1102において、読取手段410は、記入済の問診票を読取り、画像データに変換する。
ステップS1103において、文字認識手段411は、読取手段410が取得した画像データに対して、活字OCR処理を実行し、活字テキストの文字コード(テキストデータ)と、位置(座標情報)を取得する。尚、このとき、文字認識手段411は、活字テキストと手書き文字を判定して、活字テキストのみにOCR処理を行っても良いし、活字テキストと手書き文字を区別せずに活字OCR処理を行うものであっても良い。
ステップS1104において、例えば、特定手段404は、文字認識手段411による活字テキストの認識結果(活字テキスト等)と、テンプレート900の情報(活字テキスト等)とを比較し、どのテンプレート900が使用されているかを判断する。
テンプレート900の判断方法の一例として、比較する文書毎に、文字コードの出現回数、単語の出現回数等を求める。ここで、求めた出現回数をベクトルの各々の次元とみなせば、文書の特徴はベクトルとして表現され、比較する2つの文書の類似度は、ベクトル間のユークリッド距離で求めることができる。従って、識別したい文書から求めたベクトルと、複数のテンプレート900のベクトルとを比較し、最もユークリッド距離の近いテンプレート900を、識別したい文書のテンプレート900と判断することができる。さらに、出現頻度だけではなく、文字の存在位置も加味すれば、より高精度に識別が可能である。尚、このテンプレート900の判断方法は、あくまで一例であり、テンプレート900の判断方法は、別の任意の方法であっても良い。
ステップS1105において、特定手段404は、ステップS1104で判断したテンプレート900に基づいて、読取手段410が取得した画像の手書き記入範囲を特定する。
ステップS1106において、特定手段404は、ステップS1105で特定した記入範囲に基づいて、例えば、図9に示すテンプレート900と同様の形式で、読取手段410が取得した画像の対応情報409を作成する。尚、対応情報409は、図9のテンプレート900の問診票ID901に代えて、ステップS1101で説明した文書IDが記録され、活字テキスト902、及び手書き記入範囲903等の情報は、テンプレート900と同様で良い。
ステップ1107において、対応情報記憶手段403は、特定手段404が作成した対応情報409を、ストレージ部204等の記憶手段に記憶する。また、文書蓄積手段402は、対応情報409と対応づけて読取手段410が取得した画像データを、ストレージ部204等の記憶手段に文書データ408として記憶する。尚、文書データ408と対応情報409とは、例えば、前述した文書ID等により対応づけされる。
上記処理により、ユーザは、記入済の問診票等の文書データ408、及び対応情報409とを文書処理システム100に蓄積することができる。
(検索処理)
ユーザは、例えば、端末装置103等により、文書処理システム100に蓄積された文書画像の中から、必要な情報を閲覧することができる。
図12は、一実施形態に係る文書表示処理の流れを示すフローチャートである。
ステップS1201において、ユーザにより検索語(検索文字列)が入力される。
ステップS1202において、検索手段405は、対応情報409に記憶した文字列のうち、入力された検索文字列を含む、又は検索文字列と一致する文字列を検索する。
ステップS1203において、検索手段405によって検索された文字列に対応する手書き記入範囲の画像を抽出し、ステップS1204において、表示制御手段406は、抽出された画像を、端末装置103等に表示させる。このとき、表示制御手段406は、一覧性を高めるために画像を縮小して表示(サムネイル表示等)させるものであっても良い。
ステップS1205において、例えば、端末装置103のユーザに、一覧表示した画像の選択を促し、ユーザにより画像が選択される。
ここで、例えば、文書処理システム100に問診票IDが異なる複数の文書画像が蓄積されている場合は、ステップS1205で、選択された画像と同じ問診票ID901を有する文書画像を検索する。
ステップ1207において、ステップS1206で抽出された文書画像のステップS1205で選択された画像と同じ記入範囲の画像を抽出する。
ステップS1208において、表示制御手段406は、ステップS1207で抽出された画像を一覧表示させる。このとき、一覧性を高めるために画像を縮小して表示しても良い。
ステップS1209において、例えば、端末装置103のユーザに、画像の選択を促し、ユーザにより画像が選択される。
ステップS1210において、ステップS1209でユーザが選択した画像を含む文書画像(全体)を、端末装置103等に表示させる。
ここで、具体的な検索処理の一例として、特定の人物が記入した問診票を探す場合の処理について説明する。
例えば、ユーザは、問診票を記入した人物の名前を見るために、端末装置103の入力手段414を用いて、検索語として「名前」という文字列を入力する。これに応じて、端末装置103の表示手段415には、問診票の「名前」欄に記載された手書き文字の画像と共に、例えば、「今日食べた果物の名前を記入せよ」等、「名前」が含まれる設問欄に記載された手書き文字の画像等も一覧表示される。尚、この処理は、図12のステップS1201〜S1204に相当する。
次に、ユーザは、表示手段415に一覧表示された画像の中から、問診票の「名前」欄に該当する画像を、入力手段414等を用いて選択すると、表示手段415には、問診表示の「名前」欄の手書き文字画像のみが一覧表示される。尚、この処理は、図12のステップS1205〜S1208に相当する。
ユーザは、表示手段415に一覧表示された画像の中から、特定の人物の名前が手書き記入された画像を、入力手段414等を用いて選択する。これにより、表示手段415には、選択された画像を含む問診票の全体画像が表示手段415に表示される。尚、この処理は、図12のステップS1209、S1210に相当する。
例えばこのようにして、本実施の形態では、予め定められた書式に記入された手書き文字を含む文書等を電子化して容易に利用することができる。
図13は、一実施形態に係る文書情報の蓄積処理のシーケンスチャートである。
文書画像を文書処理システム100に蓄積するユーザ1は、例えば、画像形成装置102を用いて所定の開始操作を行う(ステップS1301)。これに応じて、画像形成装置102は、サーバ装置101に開始要求を送信する(ステップS1302)。
開始要求を受信したサーバ装置101は、例えば、アプリケーションの実行を開始し(ステップS1303)、サーバ装置101は、アプリケーションにより、画像形成装置102に文書のスキャンを要求する(ステップS1304)。
スキャン要求を受けた画像形成装置102は、文書の読取を行い(ステップS1305)、読取った画像データに対してOCR処理を行う(ステップS1306)。また、取得した文書画像と、OCR処理の結果(テキストデータ、座標情報等)をサーバ装置101に送信する(ステップS1307)。
画像形成装置102から文書画像とOCR処理の結果を受信したサーバ装置101は、例えば、特定手段404により記入範囲を特定し(ステップS1308)、文字列と記入範囲との対応情報409を作成し、(ステップS1309)記憶する。また、文書蓄積手段402は、画像形成装置102から受信した文書データ408を記憶する文書蓄積処理を行う(ステップS1310)。尚、図13において、OCR処理(ステップS1306)は、サーバ装置101が行うものであっても良い。
図14は、一実施形態に係る文書情報の検索処理のシーケンスチャートである。
文書処理システム100で検索を行うユーザ2は、例えば、端末装置103から検索ワード(検索文字列)を入力する(ステップS1401)。尚、端末装置103では、例えば、文書処理システム100に対応するプログラムが動作しているものとする。検索ワードが入力されると、端末装置103は、入力された検索ワードをサーバ装置101に送信する(ステップS1402)。
サーバ装置101は、端末装置103から検索ワードを受信すると、検索手段405によりテキスト検索処理を行い(ステップS1403)、検索結果に基づいて画像一覧を端末装置103へ送信する(ステップS1404)。
端末装置103は、受信した画像を表示手段415に一覧表示させ(ステップS1405)、ユーザ2に画像の選択を促す。ユーザ2により画像が選択されると(ステップS1406)、端末装置103は、選択された画像の情報をサーバ装置101へ送信する(ステップS1407)。
サーバ装置101は、選択された画像の情報を受信すると、選択された画像と同じ問診票ID等を有する文書画像の選択された画像と同じ記入範囲の画像を抽出し(ステップS1407)、画像の一覧を端末装置103へ送信する(ステップS1409)。
端末装置103は、受信した画像を表示手段415に一覧表示させ(ステップS1410)、ユーザ2に画像の選択を促す。ユーザ2により画像が選択されると(ステップS1411)、端末装置103は、選択された画像の情報をサーバ装置101へ送信する(ステップS1412)。
サーバ装置101は、端末装置103から選択された画像の情報を受信すると、選択された画像を含む文書画像を読み出し(ステップS1413)、選択された文書画像を端末装置103へ送信する(ステップS1414)。
端末装置103は、サーバ装置101から受信した文書画像を表示手段415に表示する(ステップS1415)。
このようにして、ユーザ2は、簡単な操作により、目的の文書画像を閲覧することができる。
次に、図15〜17を用いて、図14に示した処理を実行した際の端末装置103の表示画面の遷移を説明する。
<表示画面の例>
図15は、一実施形態に係る検索ワードの入力画面の例を示す図である。端末装置103は、図14のステップS1401において、図15(a)に示す画面1501を表示する。図15(a)の画面1501は、文書画像の種類を選択可能に表示する。文書画像の種類とは、例えば問診票やカルテ、アンケート等である。端末装置103は、図15(a)の画面1501において、文書画像の種類が選択され「実行」ボタン1502が選択されると、図15(b)に示す画面1503を表示する。
図15(b)の画面1503は、キーワードの入力欄1504と共に、検索の対象となる項目1505を選択可能に表示する。端末装置103は、図15(b)の画面1503において、キーワードが入力され「検索実行」ボタン1506が選択されると、図14のステップS1402に示す「検索ワード送信」の処理を実行する。そして、端末装置103は、図14のステップS1404において画像一覧を受信すると、図16に示す画面1601を表示する(図14のステップS1405)。
図16は、一実施形態に係る画像一覧の表示画面の例を示す図である。図16に示す画面1601は、受信した画像の一覧を表示する。画像の一覧は、図5に示すような画像全体をアイコンのように並べた画面が表示される一覧でも良い。しかし、端末装置103の画面が小さい場合、同じフォーマットの画像を並べても、どの画像がユーザの求める画像かわからない場合がある。そのため、例えば図16に示すように、検索されたキーワードが含まれる部分を抽出した画像の一覧を表示すると良い。
端末装置103は、図16に示す画面1601において、一の画像が選択されると(図14ステップS1411)、図14のステップS1412に示す「選択情報送信」の処理を実行する。そして、端末装置103は、図14ステップS1414において選択された文書画像を受信すると、図17に示すような画面1701を表示する(ステップS1415)。
図17は、一実施形態に係る文書画像の表示画面の例を示す図である。図17に示す画面1701は、受信した文書画像に基づく表示画面を表示する。端末装置103は、画面1701の左上に文書画像全体1702を表示する。また、端末装置103は、画面下部に、画像全体のうち検索されたキーワードが含まれる部分を拡大した画像1703を表示する。また、端末装置103は、画面右上に文書画像の書誌事項1704や、画像に対して実行する処理を選択するためのボタンを表示する。処理を選択するためのボタンには、例えば印刷ボタン1705、全画面表示ボタン1706、及びキャンセルボタン1707等がある。
印刷ボタン1705が選択されると、端末装置103は、サーバ装置101に表示された文書画像の印刷要求を送信する。サーバ装置101は、受信した印刷要求に応じて、画像形成装置102に文書画像の印刷指示を送信する。画像形成装置102は、印刷指示に基づき文書画像を印刷する。
全画面表示ボタン1706が選択されると、端末装置103は、画面全体を利用して文書画像を表示する。キャンセルボタン1707が選択されると、端末装置103は、現在の処理をキャンセルして、例えば、図15に示す検索ワードの入力画面を表示させる。
以上、本実施の形態に係る文書処理システム100によれば、予め定められた書式に記入された手書き文字を含む文書等を電子化して容易に利用することができるようになる。
[その他の実施形態]
尚、上記実施の形態は一例であり、本発明の範囲を限定するものではない。本発明は、システムの要求や用途等に応じて様々なシステム構成や応用が可能である。
例えば、上記実施形態では、図8で説明したように、活字テキストの位置に基づいて、活字テキストに対応する手書き記入範囲を特定する方法について説明した。しかし、複雑なレイアウトの問診票や帳票の場合等、図8にて説明した規則が適用できない場合もあり得る。そのため、文書処理システム100は、ユーザの操作により、手書き記入範囲を設定し、活字テキストと関連づける手段を有していても良い。
この場合、例えば、図8において、手書き記入範囲を示す範囲A802の矩形を示す座標(Xa,Ya)と(Xb,Yb)とをユーザの操作で入力する。また、入力した座標範囲と対応する活字テキストを対応づけるため、入力した座標範囲と、活字テキストの範囲内の任意の座標とを入力すれば良い。また、表示上の工夫としては、手書き記入範囲を破線の矩形で表示し、関連する活字テキスト部を破線矢印で指示する方法がある。
また、文書処理システム100は、例えば、サーバ装置101、画像形成装置102、又は端末装置103等で動作するプログラムによって実現される文書処理装置であっても良い。
100 文書処理システム
101 サーバ装置(文書処理装置の一例)
102 画像形成装置(文書処理装置の一例)
103 端末装置(文書処理装置の一例)
402 文書蓄積手段
403 対応情報記憶手段
404 特定手段
405 検索手段
406 表示制御手段
411 文字認識手段
特開2007−011683号公報

Claims (9)

  1. 予め定められた一つ以上の文字列と、前記文字列のそれぞれに対応する記入範囲とを含む文書画像を蓄積する文書蓄積手段と、
    前記文書画像の前記文字列と、前記文字列のそれぞれに対応する記入範囲とを対応づけて記憶する対応情報記憶手段と、
    前記記憶した文字列の中から、要求された検索文字列を含む文字列を検索する検索手段と、
    前記蓄積した文書画像の前記検索された文字列に対応する記入範囲の画像を一覧表示させる表示制御手段と、
    を有する文書処理システム。
  2. 前記一つ以上の文字列のそれぞれに対応する前記記入範囲を特定する特定手段を有する請求項1に記載の文書処理システム。
  3. 前記一つ以上の文字列と、前記一つ以上の文字列の座標情報とを取得する文字認識手段を有し、
    前記特定手段は、前記取得した座標情報に基づいて前記記入範囲を特定する請求項2に記載の文書処理システム。
  4. 前記文字認識手段は、前記記入範囲に未記入の文書画像を用いて前記一つ以上の文字列と、前記一つ以上の文字列の座標情報とを取得する請求項3に記載の文書処理システム。
  5. 前記一つ以上の文字列は活字文字を含み、
    前記記入範囲は手書文字を含み、
    前記文字認識手段は、
    前記文書画像の前記活字文字と前記手書文字とを識別し、前記識別された活字文字に基づいて前記一つ以上の文字列と、前記一つ以上の文字列の座標情報とを取得する請求項3に記載の文書処理システム。
  6. 前記一覧表示させた画像の中から一の画像が選択された場合、
    前記蓄積した文書画像の前記選択された一の画像と同じ記入範囲の画像を一覧表示させる請求項1乃至5のいずれか一項に記載の文書処理システム。
  7. 前記一覧表示させた画像の中から一の画像が選択された場合、
    前記蓄積した文書画像のうちの前記選択された画像を含む文書画像を表示させる請求項1乃至6のいずれか一項に記載の文書処理システム。
  8. 前記特定手段は、前記文書画像の前記一つ以上の文字列と、前記一つ以上の文字列のそれぞれに対応する記入範囲とをユーザに設定させる請求項2に記載の文書処理システム。
  9. 予め定められた一つ以上の文字列と、前記文字列のそれぞれに対応する記入範囲とを含む文書画像を蓄積する文書蓄積手段と、
    前記文書画像の前記文字列と、前記文字列のそれぞれに対応する記入範囲とを対応づけて記憶する対応情報記憶手段と、
    前記記憶した文字列の中から、要求された検索文字列を含む文字列を検索する検索手段と、
    前記蓄積した文書画像の前記検索された文字列に対応する記入範囲の画像を一覧表示させる表示制御手段と、
    を有する文書処理装置。
JP2015037577A 2014-03-12 2015-02-27 文書処理システム、及び文書処理装置 Pending JP2015187846A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015037577A JP2015187846A (ja) 2014-03-12 2015-02-27 文書処理システム、及び文書処理装置
US14/644,752 US20150261735A1 (en) 2014-03-12 2015-03-11 Document processing system, document processing apparatus, and document processing method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014048663 2014-03-12
JP2014048663 2014-03-12
JP2015037577A JP2015187846A (ja) 2014-03-12 2015-02-27 文書処理システム、及び文書処理装置

Publications (1)

Publication Number Publication Date
JP2015187846A true JP2015187846A (ja) 2015-10-29

Family

ID=54069068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015037577A Pending JP2015187846A (ja) 2014-03-12 2015-02-27 文書処理システム、及び文書処理装置

Country Status (2)

Country Link
US (1) US20150261735A1 (ja)
JP (1) JP2015187846A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826306A (zh) * 2019-11-05 2020-02-21 泰康保险集团股份有限公司 数据采集的方法、装置、计算机可读存储介质及电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2936232A1 (en) * 2014-01-11 2015-07-16 Kenneth W. IAMS Apparatus and method for grading unstructured documents using automated field recognition
JP6337661B2 (ja) * 2014-07-08 2018-06-06 富士通株式会社 入力支援装置、入力支援システム、入力支援方法、および入力支援プログラム
US9542136B2 (en) 2015-03-19 2017-01-10 Ricoh Company, Ltd. Communication control system, communication control apparatus, and communication control method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5416849A (en) * 1992-10-21 1995-05-16 International Business Machines Corporation Data processing system and method for field extraction of scanned images of document forms
US20030210428A1 (en) * 2002-05-07 2003-11-13 Alex Bevlin Non-OCR method for capture of computer filled-in forms
JP5033724B2 (ja) * 2007-07-12 2012-09-26 株式会社沖データ 文書検索装置及び画像形成装置、文書検索システム
US8824785B2 (en) * 2010-01-27 2014-09-02 Dst Technologies, Inc. Segregation of handwritten information from typographic information on a document
JP5764988B2 (ja) * 2011-03-14 2015-08-19 株式会社リコー 表示装置、表示システム及びプログラム
US9374501B2 (en) * 2014-03-04 2016-06-21 Xerox Corporation Methods and devices for form-independent registration of filled-out content

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826306A (zh) * 2019-11-05 2020-02-21 泰康保险集团股份有限公司 数据采集的方法、装置、计算机可读存储介质及电子设备
CN110826306B (zh) * 2019-11-05 2023-04-07 泰康保险集团股份有限公司 数据采集的方法、装置、计算机可读存储介质及电子设备

Also Published As

Publication number Publication date
US20150261735A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
JP6507472B2 (ja) 処理方法、処理システム及びコンピュータプログラム
US6697056B1 (en) Method and system for form recognition
JP5042562B2 (ja) 画像処理装置、手書き情報認識方法、手書き情報認識プログラム
US20190294912A1 (en) Image processing device, image processing method, and image processing program
JP4785655B2 (ja) 文書処理装置及び文書処理方法
CN107133615A (zh) 信息处理设备和信息处理方法
US11243670B2 (en) Information processing system, information processing apparatus, information processing method and non-transitory computer readable medium
JP2015187846A (ja) 文書処理システム、及び文書処理装置
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム
US20130339002A1 (en) Image processing device, image processing method and non-transitory computer readable recording medium
US10803233B2 (en) Method and system of extracting structured data from a document
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
CN109074355A (zh) 用于表意字符分析的方法和系统
US20240143163A1 (en) Digital ink processing system, method, and program
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP7035474B2 (ja) 文書処理装置およびプログラム
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
US9152885B2 (en) Image processing apparatus that groups objects within image
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
CN110909723B (zh) 信息处理装置及计算机可读存储介质
JP4278134B2 (ja) 情報検索装置及びプログラム並びに記録媒体
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム