JP7007609B2 - 情報処理装置、情報処理装置の制御方法、プログラム - Google Patents

情報処理装置、情報処理装置の制御方法、プログラム Download PDF

Info

Publication number
JP7007609B2
JP7007609B2 JP2020089867A JP2020089867A JP7007609B2 JP 7007609 B2 JP7007609 B2 JP 7007609B2 JP 2020089867 A JP2020089867 A JP 2020089867A JP 2020089867 A JP2020089867 A JP 2020089867A JP 7007609 B2 JP7007609 B2 JP 7007609B2
Authority
JP
Japan
Prior art keywords
character string
arrangement
item
position information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020089867A
Other languages
English (en)
Other versions
JP2020126697A (ja
Inventor
健翔 大田
唯仁 八尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2020089867A priority Critical patent/JP7007609B2/ja
Publication of JP2020126697A publication Critical patent/JP2020126697A/ja
Application granted granted Critical
Publication of JP7007609B2 publication Critical patent/JP7007609B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、情報処理装置の制御方法、プログラムに関し、特に、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減する技術に関する。
帳票を取り扱うOCR(Optical Character Reader)では、帳票に手書きで入力された文字列(以下、入力文字列)を認識したのち、入力文字列を帳票にあらかじめ設定された項目の文字列(以下、項目文字列)と対応付けて電子媒体に記録して業務に利用するが、そのためにはユーザが手書きで入力した入力文字列が帳票上のどの項目文字列に対応したものであるかを特定する必要がある。
従来の技術では、帳票設計時に専用のレイアウトソフト等を用いて、項目文字列とそれに対応する入力文字列がどこに位置するかをあらかじめ設定する必要があり手間が発生していた。そのような手間を削減するために、帳票レイアウトの情報から自動的に対応付けを行う技術が提案されている。
特許文献1には、帳票内の項目文字列および入力文字列の位置情報を取得し、あらかじめ帳票レイアウトに合わせて設定されたルールによって、所定の位置関係にある項目文字列および入力文字列を対応付ける技術が開示されている。
特開2011-150466号公報
しかし、特許文献1に記載の技術では、ルールは帳票レイアウト上の格子枠に依存しているため、格子枠の設計に合わせてルールを用意する必要があり、レイアウトによってはルールを複雑に与えなければならないという課題がある。
また、特許文献1に記載の技術では、格子枠がない帳票の場合、項目文字列と入力文字列の対応付けが困難である恐れがあった。
本発明は、文字列の並び方が特定される画像から得られる、第1の文字列と第2の文字列との組を決定する仕組みを提供することを目的とする。
本発明は、画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、前記画像における第1の文字列と第2の文字列との並び方を特定する特定手段と、前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定手段とを備えることを特徴とする。
また、本発明は、情報処理装置の制御方法であって、取得手段が、画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得ステップと、特定手段が、前記画像における第1の文字列と第2の文字列との並び方を特定する特定ステップと、決定手段が、前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定ステップとを備えることを特徴とする。
また、本発明は、報処理装置を、画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、前記画像における第1の文字列と第2の文字列との並び方を特定する特定手段と、前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定手段として機能させるためのプログラムである。
本発明によれば、文字列の並び方が特定される画像から得られる、第1の文字列と第2の文字列との組を決定する仕組みを提供することが可能となる。
本発明の実施形態における、項目文字列と、入力文字列の対応付けの対応付けシステム構成の一例を示す図である。 本発明の実施形態における、PCのハードウェア構成の一例を示すブロック図である。 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。 本発明の実施形態における、帳票画像および検出した文字列領域の一例を示す図である。 本発明の実施形態における、項目文字列データベースの一例を示す図である。 本発明の実施形態における、入力文字列データベースの一例を示す図である。 本発明の実施形態における、帳票データベースの一例を示す図である。 本発明の実施形態における、スコア関数データベースの一例を示す図である。 本発明の実施形態における、対応付けの機能構成の一例を示す図である。 本発明の実施形態における、距離スコアを算出する処理の概要を示す図である。 本発明の実施形態における、角度スコアを算出する処理の概要を示す図である。 本発明の実施形態における、対応付け結果を抽出する処理の概要を示す図である。 本発明の実施形態における、対応付け結果を格納したデータテーブルの一例を示す図である。 本発明の実施形態における、各スコアを示す式である。 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。 本発明の実施形態における、スコア関数のインターフェースの一例を示す図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明の実施形態における項目文字列と、入力文字列の対応付けのシステム構成の一例を示す図である。
対応付けの主要な処理を行うためのPC101、および帳票をスキャンして画像ファイル化するスキャナ301がネットワーク401を介して接続される構成となっている。
ネットワーク401はスキャナ301の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。
ネットワーク401上にはファイルサーバー501を置いてもよい。スキャナ301でスキャンした画像をPC101に取り込む方法として、スキャナ301からPC101に直接画像を送信する方法、スキャナ301で取り込んだ画像ファイルを一旦ファイルサーバー501に保管し、PC101がファイルサーバー501から画像ファイルを取り出す方法どちらをとっても良い。
図2は、本発明の実施形態におけるPC101のハードウェア構成の一例を示すブロック図である。ファイルサーバー501も同様の構成となる。
図2に示すように、PC101は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
次に図9を参照して、本発明の実施形態におけるPC101(情報処理装置)の機能構成の一例について説明する。
PC101は、取得部901、第1の特定部902、第2の特定部903、決定部904、管理部905を含む。
取得部は、スキャナ301でスキャンして画像ファイル化された帳票データを取得する。帳票データには、項目を示す文字列である項目文字列、および項目文字列の位置情報と、項目文字列に対応して入力された入力文字列、および入力文字列の位置情報とをそれぞれ複数含む。
第1の特定部902は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列から入力文字列それぞれまでの距離を特定する。
第2の特定部903は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列の位置情報と、入力文字列それぞれの位置情報とを用いて、項目文字列と入力文字列それぞれとの位置関係を示す情報(具体的には角度スコア)を特定する。
決定部904は、第1の特定部902で特定された距離と、第2の特定部903で特定された位置関係を示す情報とを用いて、項目文字列ごとに、管理部905で項目文字列と対応付けて管理する入力文字列を決定する。
管理部905は、決定部904による決定に従って、項目文字列と入力文字列とを対応付けて図13の表1301を作成し、RAM203に記憶する。
なお、本実施形態においては、取得部901~管理部905の機能をPC101が備えているが、例えばこれらの構成をファイルサーバー501が備えるよう構成してもよいものとする。
次に図3のフローチャートを用いて、本発明の実施形態におけるPC101が実行する処理について説明する。
図3のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
図4はスキャナ301でスキャンした帳票の画像の一例であり、手書きで記入後の帳票画像402に、帳票にあらかじめ印刷されている項目を示す項目文字列名と、当該項目文字列名の項目文字列ID、位置情報を含む領域情報403~405、および帳票に手書きで記入された入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406~407がある。項目文字列IDや入力文字列IDは、各項目文字列名や各入力文字列名を一義に識別可能なIDが手動または自動で採番される。
ステップS301では、PC101のCPU201は、ユーザから帳票上の項目文字列と入力文字列の対応付け要求を受け付ける。この要求には対応付け対象の記入後帳票画像402、対象帳票の種類を示す帳票ID、項目文字列の項目文字列IDと項目文字列名と位置情報を含む領域情報403~405、および入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406~407が電文として含まれる。
本実施形態において、上記の電文は、PC101内で生成されることを想定しているが、他の実施形態として、上記電文を、スキャナ301からPC101に送信してもよいし、ファイルサーバー501を経由してファイルの形でPC101に送信してもよい。
ステップS301は、本発明における、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段の一例である。
ステップS302では、PC101のCPU201は、S401の要求に含まれる項目文字列の領域情報403~405を、図5の項目文字列に関するデータベース500の対応するカラム(502~504)に格納する。
ステップS303では、PC101のCPU201は、S401の要求に含まれる入力文字列の領域情報406~407を、図6の入力文字列に関するデータベース602の対応するカラム(621~623)に格納する。
ステップS304では、PC101のCPU201は、S401の要求に含まれる帳票IDに基づき、図8のスコア関数データベース801から使用する帳票レイアウトで用いるスコア関数のレコード811を取り出す。図16に定義されたインターフェースに基づいて実装されたモジュール群中から、取り出したスコア関数名のモジュールを読み込んで実行する。
ステップS305では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で距離スコアを算出する。距離スコアを算出するための定義は図14の数式2の通りである(数式2のRectV1、RectV2は四角形の4頂点座標の集合、x1、x2は水平方向、y1、y2は垂直方向の座標、Lは使用する帳票の対角線の長さ)。また、図10にて、項目の領域情報405と入力の領域情報407の距離スコアを求める際の概略図を示す。
距離スコアは項目の領域情報405と入力の領域情報407の各頂点同士を結んだ線分(1001~1004)の直線距離のうち、直線距離が最も短い頂点の長さを帳票の対角線の長さで割った後、1から割った後の値を引いたもののうち最も大きい値となるものである。対角線の長さで割るのは、値を0以上1以下に収めるためである。1から割った後の値を引くのは、距離の小さいものほど大きなスコアを取るためである。なお、帳票の対角線の長さは、図7の帳票データベース701から所定の帳票ID711をキーとする帳票ファイルを取得し、算出しておく。
図10では例として、項目の領域情報405の右上の頂点と入力の領域情報407の各頂点のうち最短の距離(最大の値)を持つ線分1001を求めているところを示している。このあと、項目の領域情報405の右下、左上、左下の頂点と入力の領域情報407の各頂点で最短領域を求めた後、さらに最短距離をとるものを選び、その時の最大スコアを距離スコアとする。
ステップS305は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段の一例である。
ステップS306では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で角度スコアを算出する。角度スコアの定義は図14の数式3(数式3のθは項目文字列の外形を示す四角形と入力文字列の外形を示す四角形それぞれの中心点を結ぶ線分と水平直線が時計回りになす角度)の通りである。図11にて、項目の領域情報405と入力の領域情報407の角度スコアを求める際の概略図を示す。
水平直線1102と線分1103が時計回りになす角1101を求め、角度をθとする。角度スコアの定義は図14の数式3の通りである。数式3は、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
ステップS306は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段の一例である。
ステップS307では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で求めた距離スコアと角度スコアから図14の数式1に従って総合スコアを求める。総合スコアは距離スコアと角度スコアの重み付き和である。距離スコアの重み係数λと角度スコアの重み係数1-λは足すと1になるが、これはスコアの比率を調整することを目的としている。重み係数λは予めユーザが設定しておく。総合スコアを、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの組み合わせですべて求め、図12の表1201を作成し、RAM203に記憶する。
ステップS308では、PC101のCPU201は、ステップS307で算出した総合スコア表1201に基づいて、項目文字列と入力文字列を対応付ける。
その方法は、表1201中で最も高いスコアを持つ要素の行と列の組み合わせとなる項目文字列IDと入力文字列IDのペアを記憶するというものである。ペアIDは、データベース500の各レコードと入力文字列に関するデータベース602を用いて、図13の表1301のように、項目文字列名と入力文字列名で記憶される。記憶後は表1202のように、最大要素を取っていた行と列を削除することで、複数の対応付けが行われることを防ぐ。上記のように表中の最大スコアを持つ行と列のペアを記憶、削除を行または列がなくなるまで繰り返す。
ステップS308は、本発明における、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段の一例である。
ステップS309では、PC101のCPU201は、ステップS308で作成した表1301を出力する。
以上で、図3の説明を終了する。
次に、図15のフローチャートを用いて、図3のフローチャートに示したPC101が実行する帳票上の項目文字列と入力文字列の対応付けをする処理の他の実施形態について説明する。
図15のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
図3では、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを想定しているため、角度スコアを求める際に、数式3を用いたが、帳票の中には、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトである帳票もあれば、入力文字列の位置が項目文字列の位置の下にあるレイアウトである帳票もある。入力文字列の位置が項目文字列の位置の下にあるレイアウトである場合には、数式3を用いることができないため、別の数式(具体的には図14の数式4)を用いる必要があるが、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、ユーザが帳票ごとに指定するのは大変手間である。そこで、本実施形態(図15のフローチャート)では、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、PC101が自動で判断し、判断結果に基づいて、角度スコアを求める際に用いる数式をPC101が自動で決定することで、ユーザの手間を軽減する。
ステップS1501~ステップS1509までの各処理は、それぞれ図3のステップS301~ステップS309までの各処理と同じ処理であるため説明は省略する。
ステップS1510では、PC101のCPU201は、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか、そうでないか、つまり項目文字列の位置の下にあるレイアウトであるか、を判定する。
レイアウトの判定方法としては、図7の帳票データベース701に、項目文字列が、縦並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか)、それとも、項目文字列が、横並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか)を帳票ごとに記憶しておき、当該帳票データベース701の情報を用いることでレイアウトを判定しても良い。または、ステップS1501で取得した電文に含まれる領域情報403~405中の各項目文字列の位置情報と、領域情報406~407中の入力文字列の位置情報とから、レイアウトを特定しても良い。具体的には、例えば、項目文字列の位置情報から項目文字列が縦に並んでいると特定され、かつ、入力文字列の位置情報から、項目文字列間に入力文字列が配置されていないと特定された場合に、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであると特定される。
ステップS1511では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式3を用いると決定する。
ステップS1512では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式4を用いると決定する(数式4のθは2つの四角形の中心点を結ぶ線分と水平直線が時計回りになす角度)。数式4は、入力文字列の位置が項目文字列の位置の下にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の下にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
以上で、図15の説明を終了する。
本発明の実施形態においては、図3および図15のフローチャートに示す各処理をPC101において実行する構成として説明したが、ファイルサーバー501で実行するよう構成してもよい。
以上、本発明によると、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することができる。
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD-ROM、CD-R、CD-RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD-ROM,DVD-R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD-ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
101 PC
301 スキャナ
401 ネットワーク
501 ファイルサーバー

Claims (7)

  1. 画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、
    前記画像における第1の文字列と第2の文字列との並び方を特定する特定手段と、
    前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定手段と
    を備えることを特徴とする情報処理装置。
  2. 前記第1の並び方とは前記画像における第1の文字列と第2の文字列が並び、前記第2の並び方とは前記画像における第1の文字列と第2の文字列が縦並びであることを特徴とする請求項1に記載の情報処理装置。
  3. 前記並び方が横並びと特定された場合、前記第1の評価方法により、前記取得された第2の文字列が前記取得された第1の文字列の水平かつ右に位置する場合に最良と評価され、一方、前記並び方が縦並びと特定された場合、前記第2の評価方法により、前記取得された第2の文字列が前記取得された第1の文字列の垂直かつ下に位置する場合に最良と評価されることを特徴とする請求項2に記載の情報処理装置。
  4. 前記第1および第2の評価方法は、第1の文字列と第2の文字列との方向が所定の基準方向となす角度に従って評価されることを特徴とする請求項1~3のいずれか1項に記載の情報処理装置。
  5. 前記特定手段は、前記取得された複数の第1の文字列の位置情報と複数の第2の文字列の位置情報とに基づいて、前記画像における第1の文字列と第2の文字列との並び方を特定することを特徴とする請求項1~4のいずれか1項に記載の情報処理装置。
  6. 情報処理装置の制御方法であって、
    取得手段が、画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得ステップと、
    特定手段が、前記画像における第1の文字列と第2の文字列との並び方を特定する特定ステップと、
    決定手段が、前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定ステップと
    を備えることを特徴とする情報処理装置の制御方法。
  7. 報処理装置を、
    画像から得られる、複数の第1の文字列、および前記第1の文字列の位置情報と、複数の第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、
    前記画像における第1の文字列と第2の文字列との並び方を特定する特定手段と、
    前記取得された第1の文字列と第2の文字列との位置情報による角度を用いた評価方法のうち、前記特定された並び方が第1の並び方の場合は第1の評価方法、前記特定された並び方が第2の並び方の場合は第2の評価方法により、第1の文字列と第2の文字列との組を決定する決定手段
    として機能させるためのプログラム。
JP2020089867A 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム Active JP7007609B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020089867A JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020089867A JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017096734A Division JP6741949B2 (ja) 2017-05-15 2017-05-15 情報処理装置、情報処理装置の制御方法、プログラム

Publications (2)

Publication Number Publication Date
JP2020126697A JP2020126697A (ja) 2020-08-20
JP7007609B2 true JP7007609B2 (ja) 2022-01-24

Family

ID=72084148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020089867A Active JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Country Status (1)

Country Link
JP (1) JP7007609B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009110416A (ja) 2007-10-31 2009-05-21 Fujitsu Ltd 論理構造認識プログラム、論理構造認識装置、および論理構造認識方法
JP2012014608A (ja) 2010-07-05 2012-01-19 Kadokawa Group Publishing Co Ltd 情報処理装置、情報処理方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009110416A (ja) 2007-10-31 2009-05-21 Fujitsu Ltd 論理構造認識プログラム、論理構造認識装置、および論理構造認識方法
JP2012014608A (ja) 2010-07-05 2012-01-19 Kadokawa Group Publishing Co Ltd 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2020126697A (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
JP5270027B1 (ja) 情報処理装置および手書き文書検索方法
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2018124730A (ja) 情報処理システム、情報処理方法、プログラム
JP7007609B2 (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP5147640B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6741949B2 (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP3942098B2 (ja) 情報処理システム、情報登録用情報処理装置、情報検索用情報処理装置、情報登録用情報処理方法、情報検索用情報処理方法、プログラム、及び記録媒体
JP6423933B2 (ja) 情報処理装置、帳票管理システム、帳票管理サーバ、情報処理方法、及びそのプログラム
JP4430490B2 (ja) データエントリ装置及びその制御方法、プログラム
JP5999236B2 (ja) 情報処理システム、その制御方法、及びプログラム、並びに情報処理装置、その制御方法、及びプログラム
JP5880637B2 (ja) 情報処理装置、その制御方法、及びプログラム、並びに情報処理システム、その制御方法、及びプログラム
JP6190549B1 (ja) 文書処理システム
JP2022137608A (ja) 情報処理装置、情報処理方法およびプログラム
JP7035474B2 (ja) 文書処理装置およびプログラム
JP7366474B1 (ja) 戸籍解析システム
JP6128097B2 (ja) 情報処理装置、制御方法、及びプログラム
JP2020067721A (ja) 情報処理装置、サーバ、電子文書の表示方法、電子文書の配信方法、電子文書生成システムおよびプログラム
JP2009054118A (ja) ユーザインターフェース装置、ユーザインターフェース方法およびプログラム
JP2019045920A (ja) 情報処理装置、その制御方法とプログラム
JP7315817B2 (ja) 情報処理装置及びその制御方法、プログラム
JP6705988B2 (ja) 情報処理システム、その制御方法、及びプログラム
JP6634820B2 (ja) 情報処理装置、その制御方法、及びプログラム
JP2018205825A (ja) ワークフローサーバ、情報処理方法及びプログラム
WO2015004730A1 (ja) 検索方法及び電子機器
TWI604315B (zh) 利用單一啟始點整合多程序執行之方法及系統

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211220