JP2020126697A - 情報処理装置、情報処理装置の制御方法、プログラム - Google Patents

情報処理装置、情報処理装置の制御方法、プログラム Download PDF

Info

Publication number
JP2020126697A
JP2020126697A JP2020089867A JP2020089867A JP2020126697A JP 2020126697 A JP2020126697 A JP 2020126697A JP 2020089867 A JP2020089867 A JP 2020089867A JP 2020089867 A JP2020089867 A JP 2020089867A JP 2020126697 A JP2020126697 A JP 2020126697A
Authority
JP
Japan
Prior art keywords
character string
item
input
item character
specifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020089867A
Other languages
English (en)
Other versions
JP7007609B2 (ja
Inventor
健翔 大田
Kento Ota
健翔 大田
唯仁 八尾
Tadahito Yao
唯仁 八尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2020089867A priority Critical patent/JP7007609B2/ja
Publication of JP2020126697A publication Critical patent/JP2020126697A/ja
Application granted granted Critical
Publication of JP7007609B2 publication Critical patent/JP7007609B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】 項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することが可能となる技術を提供する。【解決手段】 帳票データに含まれる項目文字列ごとに、項目文字列から入力文字列それぞれまでの距離を特定し、項目文字列ごとに、項目文字列の位置情報と、入力文字列それぞれの位置情報とを用いて、項目文字列と入力文字列それぞれとの位置関係を示す情報を特定し、特定した距離と、位置関係を示す情報とを用いて、項目文字列ごとに、管理手段で項目文字列と対応付けて管理する入力文字列を決定する。【選択図】 図14

Description

本発明は、情報処理装置、情報処理装置の制御方法、プログラムに関し、特に、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減する技術に関する。
帳票を取り扱うOCR(Optical Character Reader)では、帳票に手書きで入力された文字列(以下、入力文字列)を認識したのち、入力文字列を帳票にあらかじめ設定された項目の文字列(以下、項目文字列)と対応付けて電子媒体に記録して業務に利用するが、そのためにはユーザが手書きで入力した入力文字列が帳票上のどの項目文字列に対応したものであるかを特定する必要がある。
従来の技術では、帳票設計時に専用のレイアウトソフト等を用いて、項目文字列とそれに対応する入力文字列がどこに位置するかをあらかじめ設定する必要があり手間が発生していた。そのような手間を削減するために、帳票レイアウトの情報から自動的に対応付けを行う技術が提案されている。
特許文献1には、帳票内の項目文字列および入力文字列の位置情報を取得し、あらかじめ帳票レイアウトに合わせて設定されたルールによって、所定の位置関係にある項目文字列および入力文字列を対応付ける技術が開示されている。
特開2011−150466号公報
しかし、特許文献1に記載の技術では、ルールは帳票レイアウト上の格子枠に依存しているため、格子枠の設計に合わせてルールを用意する必要があり、レイアウトによってはルールを複雑に与えなければならないという課題がある。
また、特許文献1に記載の技術では、格子枠がない帳票の場合、項目文字列と入力文字列の対応付けが困難である恐れがあった。
本発明は、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することを目的とする。
本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段とを備えることを特徴とする。
また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置の制御方法であって、前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定工程と、前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定工程とを備えることを特徴とする。
また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段として機能させることを特徴とする。
本発明によれば、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することが可能となる。
本発明の実施形態における、項目文字列と、入力文字列の対応付けの対応付けシステム構成の一例を示す図である。 本発明の実施形態における、PCのハードウェア構成の一例を示すブロック図である。 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。 本発明の実施形態における、帳票画像および検出した文字列領域の一例を示す図である。 本発明の実施形態における、項目文字列データベースの一例を示す図である。 本発明の実施形態における、入力文字列データベースの一例を示す図である。 本発明の実施形態における、帳票データベースの一例を示す図である。 本発明の実施形態における、スコア関数データベースの一例を示す図である。 本発明の実施形態における、対応付けの機能構成の一例を示す図である。 本発明の実施形態における、距離スコアを算出する処理の概要を示す図である。 本発明の実施形態における、角度スコアを算出する処理の概要を示す図である。 本発明の実施形態における、対応付け結果を抽出する処理の概要を示す図である。 本発明の実施形態における、対応付け結果を格納したデータテーブルの一例を示す図である。 本発明の実施形態における、各スコアを示す式である。 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。 本発明の実施形態における、スコア関数のインターフェースの一例を示す図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明の実施形態における項目文字列と、入力文字列の対応付けのシステム構成の一例を示す図である。
対応付けの主要な処理を行うためのPC101、および帳票をスキャンして画像ファイル化するスキャナ301がネットワーク401を介して接続される構成となっている。
ネットワーク401はスキャナ301の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。
ネットワーク401上にはファイルサーバー501を置いてもよい。スキャナ301でスキャンした画像をPC101に取り込む方法として、スキャナ301からPC101に直接画像を送信する方法、スキャナ301で取り込んだ画像ファイルを一旦ファイルサーバー501に保管し、PC101がファイルサーバー501から画像ファイルを取り出す方法どちらをとっても良い。
図2は、本発明の実施形態におけるPC101のハードウェア構成の一例を示すブロック図である。ファイルサーバー501も同様の構成となる。
図2に示すように、PC101は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
次に図9を参照して、本発明の実施形態におけるPC101(情報処理装置)の機能構成の一例について説明する。
PC101は、取得部901、第1の特定部902、第2の特定部903、決定部904、管理部905を含む。
取得部は、スキャナ301でスキャンして画像ファイル化された帳票データを取得する。帳票データには、項目を示す文字列である項目文字列、および項目文字列の位置情報と、項目文字列に対応して入力された入力文字列、および入力文字列の位置情報とをそれぞれ複数含む。
第1の特定部902は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列から入力文字列それぞれまでの距離を特定する。
第2の特定部903は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列の位置情報と、入力文字列それぞれの位置情報とを用いて、項目文字列と入力文字列それぞれとの位置関係を示す情報(具体的には角度スコア)を特定する。
決定部904は、第1の特定部902で特定された距離と、第2の特定部903で特定された位置関係を示す情報とを用いて、項目文字列ごとに、管理部905で項目文字列と対応付けて管理する入力文字列を決定する。
管理部905は、決定部904による決定に従って、項目文字列と入力文字列とを対応付けて図13の表1301を作成し、RAM203に記憶する。
なお、本実施形態においては、取得部901〜管理部905の機能をPC101が備えているが、例えばこれらの構成をファイルサーバー501が備えるよう構成してもよいものとする。
次に図3のフローチャートを用いて、本発明の実施形態におけるPC101が実行する処理について説明する。
図3のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
図4はスキャナ301でスキャンした帳票の画像の一例であり、手書きで記入後の帳票画像402に、帳票にあらかじめ印刷されている項目を示す項目文字列名と、当該項目文字列名の項目文字列ID、位置情報を含む領域情報403〜405、および帳票に手書きで記入された入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407がある。項目文字列IDや入力文字列IDは、各項目文字列名や各入力文字列名を一義に識別可能なIDが手動または自動で採番される。
ステップS301では、PC101のCPU201は、ユーザから帳票上の項目文字列と入力文字列の対応付け要求を受け付ける。この要求には対応付け対象の記入後帳票画像402、対象帳票の種類を示す帳票ID、項目文字列の項目文字列IDと項目文字列名と位置情報を含む領域情報403〜405、および入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407が電文として含まれる。
本実施形態において、上記の電文は、PC101内で生成されることを想定しているが、他の実施形態として、上記電文を、スキャナ301からPC101に送信してもよいし、ファイルサーバー501を経由してファイルの形でPC101に送信してもよい。
ステップS301は、本発明における、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段の一例である。
ステップS302では、PC101のCPU201は、S401の要求に含まれる項目文字列の領域情報403〜405を、図5の項目文字列に関するデータベース500の対応するカラム(502〜504)に格納する。
ステップS303では、PC101のCPU201は、S401の要求に含まれる入力文字列の領域情報406〜407を、図6の入力文字列に関するデータベース602の対応するカラム(621〜623)に格納する。
ステップS304では、PC101のCPU201は、S401の要求に含まれる帳票IDに基づき、図8のスコア関数データベース801から使用する帳票レイアウトで用いるスコア関数のレコード811を取り出す。図16に定義されたインターフェースに基づいて実装されたモジュール群中から、取り出したスコア関数名のモジュールを読み込んで実行する。
ステップS305では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で距離スコアを算出する。距離スコアを算出するための定義は図14の数式2の通りである(数式2のRectV1、RectV2は四角形の4頂点座標の集合、x1、x2は水平方向、y1、y2は垂直方向の座標、Lは使用する帳票の対角線の長さ)。また、図10にて、項目の領域情報405と入力の領域情報407の距離スコアを求める際の概略図を示す。
距離スコアは項目の領域情報405と入力の領域情報407の各頂点同士を結んだ線分(1001〜1004)の直線距離のうち、直線距離が最も短い頂点の長さを帳票の対角線の長さで割った後、1から割った後の値を引いたもののうち最も大きい値となるものである。対角線の長さで割るのは、値を0以上1以下に収めるためである。1から割った後の値を引くのは、距離の小さいものほど大きなスコアを取るためである。なお、帳票の対角線の長さは、図7の帳票データベース701から所定の帳票ID711をキーとする帳票ファイルを取得し、算出しておく。
図10では例として、項目の領域情報405の右上の頂点と入力の領域情報407の各頂点のうち最短の距離(最大の値)を持つ線分1001を求めているところを示している。このあと、項目の領域情報405の右下、左上、左下の頂点と入力の領域情報407の各頂点で最短領域を求めた後、さらに最短距離をとるものを選び、その時の最大スコアを距離スコアとする。
ステップS305は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段の一例である。
ステップS306では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で角度スコアを算出する。角度スコアの定義は図14の数式3(数式3のθは項目文字列の外形を示す四角形と入力文字列の外形を示す四角形それぞれの中心点を結ぶ線分と水平直線が時計回りになす角度)の通りである。図11にて、項目の領域情報405と入力の領域情報407の角度スコアを求める際の概略図を示す。
水平直線1102と線分1103が時計回りになす角1101を求め、角度をθとする。角度スコアの定義は図14の数式3の通りである。数式3は、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
ステップS306は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段の一例である。
ステップS307では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で求めた距離スコアと角度スコアから図14の数式1に従って総合スコアを求める。総合スコアは距離スコアと角度スコアの重み付き和である。距離スコアの重み係数λと角度スコアの重み係数1−λは足すと1になるが、これはスコアの比率を調整することを目的としている。重み係数λは予めユーザが設定しておく。総合スコアを、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの組み合わせですべて求め、図12の表1201を作成し、RAM203に記憶する。
ステップS308では、PC101のCPU201は、ステップS307で算出した総合スコア表1201に基づいて、項目文字列と入力文字列を対応付ける。
その方法は、表1201中で最も高いスコアを持つ要素の行と列の組み合わせとなる項目文字列IDと入力文字列IDのペアを記憶するというものである。ペアIDは、データベース500の各レコードと入力文字列に関するデータベース602を用いて、図13の表1301のように、項目文字列名と入力文字列名で記憶される。記憶後は表1202のように、最大要素を取っていた行と列を削除することで、複数の対応付けが行われることを防ぐ。上記のように表中の最大スコアを持つ行と列のペアを記憶、削除を行または列がなくなるまで繰り返す。
ステップS308は、本発明における、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段の一例である。
ステップS309では、PC101のCPU201は、ステップS308で作成した表1301を出力する。
以上で、図3の説明を終了する。
次に、図15のフローチャートを用いて、図3のフローチャートに示したPC101が実行する帳票上の項目文字列と入力文字列の対応付けをする処理の他の実施形態について説明する。
図15のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
図3では、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを想定しているため、角度スコアを求める際に、数式3を用いたが、帳票の中には、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトである帳票もあれば、入力文字列の位置が項目文字列の位置の下にあるレイアウトである帳票もある。入力文字列の位置が項目文字列の位置の下にあるレイアウトである場合には、数式3を用いることができないため、別の数式(具体的には図14の数式4)を用いる必要があるが、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、ユーザが帳票ごとに指定するのは大変手間である。そこで、本実施形態(図15のフローチャート)では、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、PC101が自動で判断し、判断結果に基づいて、角度スコアを求める際に用いる数式をPC101が自動で決定することで、ユーザの手間を軽減する。
ステップS1501〜ステップS1509までの各処理は、それぞれ図3のステップS301〜ステップS309までの各処理と同じ処理であるため説明は省略する。
ステップS1510では、PC101のCPU201は、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか、そうでないか、つまり項目文字列の位置の下にあるレイアウトであるか、を判定する。
レイアウトの判定方法としては、図7の帳票データベース701に、項目文字列が、縦並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか)、それとも、項目文字列が、横並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか)を帳票ごとに記憶しておき、当該帳票データベース701の情報を用いることでレイアウトを判定しても良い。または、ステップS1501で取得した電文に含まれる領域情報403〜405中の各項目文字列の位置情報と、領域情報406〜407中の入力文字列の位置情報とから、レイアウトを特定しても良い。具体的には、例えば、項目文字列の位置情報から項目文字列が縦に並んでいると特定され、かつ、入力文字列の位置情報から、項目文字列間に入力文字列が配置されていないと特定された場合に、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであると特定される。
ステップS1511では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式3を用いると決定する。
ステップS1512では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式4を用いると決定する(数式4のθは2つの四角形の中心点を結ぶ線分と水平直線が時計回りになす角度)。数式4は、入力文字列の位置が項目文字列の位置の下にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の下にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
以上で、図15の説明を終了する。
本発明の実施形態においては、図3および図15のフローチャートに示す各処理をPC101において実行する構成として説明したが、ファイルサーバー501で実行するよう構成してもよい。
以上、本発明によると、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することができる。
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
101 PC
301 スキャナ
401 ネットワーク
501 ファイルサーバー
本発明は、画像から得られる、第1の文字列と第2の文字列との組を決定する仕組みを提供することを目的とする。
本発明は、画像から得られる、第1の文字列、および前記第1の文字列の位置情報と、第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、前記取得に基づき、第1の文字列と第2の文字列との並び方を特定する特定手段と、前記特定された並び方に基づく、第1の文字列と第2の文字列との位置情報による角度を用いた評価方法により、第1の文字列と第2の文字列との組を決定する決定手段とを備えることを特徴とする。
また、本発明は、報処理装置の制御方法であって、取得手段が、画像から得られる、第1の文字列、および前記第1の文字列の位置情報と、第2の文字列、および前記第2の文字列の位置情報とを取得する取得ステップと、特定手段が、前記取得に基づき、第1の文字列と第2の文字列との並び方を特定する特定ステップと、決定手段が、前記特定された並び方に基づく、第1の文字列と第2の文字列との位置情報による角度を用いた評価方法により、第1の文字列と第2の文字列との組を決定する決定手段とを備えることを特徴とする。
また、本発明は、報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、画像から得られる、第1の文字列、および前記第1の文字列の位置情報と、第2の文字列、および前記第2の文字列の位置情報とを取得する取得手段と、前記取得に基づき、第1の文字列と第2の文字列との並び方を特定する特定手段と、前記特定された並び方に基づく、第1の文字列と第2の文字列との位置情報による角度を用いた評価方法により、第1の文字列と第2の文字列との組を決定する決定手段として機能させるためのプログラムである
本発明によれば、画像から得られる、第1の文字列と第2の文字列との組を決定する仕組みを提供することが可能となる。

Claims (7)

  1. 項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段と、
    前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
    前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段と、
    前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段と
    を備えることを特徴とする情報処理装置。
  2. 前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報とは、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列の中心付近に定められた点と、前記入力文字列の中心付近に定められた点とを結ぶ線分と、前記項目文字列から前記入力文字列方向に引いた水平線とのなす角度であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記第1の特定手段で特定された距離を所定の数式に代入することにより、距離スコアを算出する第1の算出手段と、
    前記第2の特定手段で特定された前記角度を所定の数式に代入することにより、角度スコアを算出する第2の算出手段と、
    前記距離スコアと、前記角度スコアを所定の数式に代入することにより、総合スコアを算出する第3の算出手段とを備え、
    前記決定手段は、前記項目文字列に対して、前記第3の算出手段で算出されたスコアが、最も高いスコアとなった前記入力文字列を、当該項目文字列に対応付けて管理する入力文字列であると決定することを特徴とする請求項2に記載の情報処理装置。
  4. 前記第2の算出手段に用いる複数の数式を管理する管理手段と、
    前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであるか、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであるかを判定する判定手段と、
    前記判定手段により、前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであると判定された場合と、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであると判定された場合とで、前記管理手段で管理する複数の数式うち、前記第2の算出手段に用いる数式を異ならしめることを特徴とする請求項3に記載の情報処理装置。
  5. 前記決定手段により前記項目文字列と対応付けて管理すると決定された入力文字列を、前記第1の特定手段による特定、および前記第2の特定手段による特定に用いないように制御する制御手段
    を備えることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置の制御方法であって、
    前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、
    前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定工程と、
    前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定工程と
    を備えることを特徴とする情報処理装置の制御方法。
  7. 項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置で読み取り実行可能なプログラムであって、
    前記情報処理装置を、
    前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
    前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段と、
    前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段と
    して機能させることを特徴とするプログラム。
JP2020089867A 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム Active JP7007609B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020089867A JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020089867A JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017096734A Division JP6741949B2 (ja) 2017-05-15 2017-05-15 情報処理装置、情報処理装置の制御方法、プログラム

Publications (2)

Publication Number Publication Date
JP2020126697A true JP2020126697A (ja) 2020-08-20
JP7007609B2 JP7007609B2 (ja) 2022-01-24

Family

ID=72084148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020089867A Active JP7007609B2 (ja) 2020-05-22 2020-05-22 情報処理装置、情報処理装置の制御方法、プログラム

Country Status (1)

Country Link
JP (1) JP7007609B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009110416A (ja) * 2007-10-31 2009-05-21 Fujitsu Ltd 論理構造認識プログラム、論理構造認識装置、および論理構造認識方法
JP2012014608A (ja) * 2010-07-05 2012-01-19 Kadokawa Group Publishing Co Ltd 情報処理装置、情報処理方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009110416A (ja) * 2007-10-31 2009-05-21 Fujitsu Ltd 論理構造認識プログラム、論理構造認識装置、および論理構造認識方法
JP2012014608A (ja) * 2010-07-05 2012-01-19 Kadokawa Group Publishing Co Ltd 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP7007609B2 (ja) 2022-01-24

Similar Documents

Publication Publication Date Title
JP5270027B1 (ja) 情報処理装置および手書き文書検索方法
JP5270018B1 (ja) システム及び手書き文書管理方法
US9485387B2 (en) Icon arrangement drawing creation system
JPWO2014147719A1 (ja) 電子機器および手書き文書処理方法
JP2022137608A (ja) 情報処理装置、情報処理方法およびプログラム
JP6741949B2 (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP2020126697A (ja) 情報処理装置、情報処理装置の制御方法、プログラム
JP5917461B2 (ja) 情報処理装置、プログラム
JP5330576B1 (ja) 情報処理装置および筆跡検索方法
JP6790886B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
JP4430490B2 (ja) データエントリ装置及びその制御方法、プログラム
JP2014149769A (ja) 電子機器および手書き文書検索方法
JP6190549B1 (ja) 文書処理システム
JP2018074429A (ja) 情報処理装置、情報処理方法、プログラム
JP7366474B1 (ja) 戸籍解析システム
JP5944338B2 (ja) 情報処理装置、情報処理プログラム、および情報処理方法
JP2009054118A (ja) ユーザインターフェース装置、ユーザインターフェース方法およびプログラム
US20230299974A1 (en) Display apparatus, method for generating electronic signature, and electronic signature system
JP5666011B1 (ja) 方法及び電子機器
JP2019045920A (ja) 情報処理装置、その制御方法とプログラム
JP7484198B2 (ja) 文書処理装置およびプログラム
JP2020067721A (ja) 情報処理装置、サーバ、電子文書の表示方法、電子文書の配信方法、電子文書生成システムおよびプログラム
JP7504674B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
JP6634820B2 (ja) 情報処理装置、その制御方法、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211220

R151 Written notification of patent or utility model registration

Ref document number: 7007609

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151