JP2022186026A - プログラム、情報処理装置及び方法 - Google Patents

プログラム、情報処理装置及び方法 Download PDF

Info

Publication number
JP2022186026A
JP2022186026A JP2021094035A JP2021094035A JP2022186026A JP 2022186026 A JP2022186026 A JP 2022186026A JP 2021094035 A JP2021094035 A JP 2021094035A JP 2021094035 A JP2021094035 A JP 2021094035A JP 2022186026 A JP2022186026 A JP 2022186026A
Authority
JP
Japan
Prior art keywords
input
text information
information
read
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021094035A
Other languages
English (en)
Inventor
択 渡久地
Taku Toguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Inside Inc
Original Assignee
AI Inside Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Inside Inc filed Critical AI Inside Inc
Priority to JP2021094035A priority Critical patent/JP2022186026A/ja
Publication of JP2022186026A publication Critical patent/JP2022186026A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】複数の手段によりテキスト情報を取得する際のテキスト情報を管理する。【解決手段】テキスト情報生成管理システム1のサーバ20は、その機能として、読取項目(テキスト情報)の内容を示す属性情報を取得する入力項目取得モジュール2033と、読取項目の属性情報に基づき、オンライン経由でテキスト情報の入力を受け付けるための入力フォームを生成する入力フォーム生成モジュール2034と、入力フォームからテキスト情報の入力を受け付けるテキスト入力受付モジュール2035と、読取項目の属性情報に基づき、帳票にOCR処理を行ってテキスト情報を生成する帳票読取モジュール2036と、入力フォームから受け付けたテキスト情報と、OCR処理により生成されたテキスト情報を関連付けて記憶し、ワークフローで一元管理するワークフロー管理モジュール2037と、を備える。【選択図】図4

Description

新規性喪失の例外適用申請有り
本開示は、プログラム、情報処理装置及び方法に関する。
企業活動等において、顧客から住所、氏名のような各種情報を取得することは、通常よく行われている。例えば、顧客に対して申込書のような帳票類に記載してもらい、その帳票類をイメージスキャナ等で読み取り、OCR(Optical Character Recognition)処理を行うことにより、当該帳票に記載されている文字情報を所定の文字コードに変換し、テキスト情報を生成する技術が普及している。特許文献1には、手書きの書類等を画像としてスキャンした画像データから、機械学習により文字認識を行う文字識別システムが開示されている。
顧客から各種情報を取得する他の例として、Webサイトに入力フォームから入力してもらい、オンライン経由で入力情報を取得することもよく行われており、このような入力フォームを容易に設定する技術も普及している。特許文献2には、管理者用のページにおいて入力フォーム項目の設定をするだけで入力フォームの表示内容を変更することが可能なデータベース提供システムが開示されている。
特開2015-069256号公報 特開2020-009278号公報
ところで、帳票類をOCR処理により読み込み、テキスト情報として取得する場合、帳票上の各項目の位置情報及び項目情報を設定する必要があり、手間がかかっている。その点、Webサイトの入力フォームからテキスト情報を取得する方がはるかに効率的ではあるが、顧客からの多様な情報取得手段を確保する必要がある場合、どちらか一方の手段のみに限定することはできない。そのため、このような複数の手段によりテキスト情報を取得する場合、重複チェックのような一元管理が必要になり、管理コストがかかっていた。
そこで、本開示では、複数の手段によりテキスト情報を取得する際のテキスト情報を管理する技術について説明する。
本開示の一実施形態によると、プロセッサと、記憶部とを備えるコンピュータに実行させ、テキスト情報を管理するためのプログラムが提供される。メモリは、帳票におけるテキスト情報の属性情報を記憶する。プログラムは、プロセッサに、読取項目の属性情報に基づき、オンライン経由で帳票の記載項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、入力フォームから、テキスト情報の入力を受け付けるステップと、読取項目の属性情報に基づき、帳票に記載されているテキスト情報を読み取るステップと、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報とを関連付けてメモリに記憶させるステップと、を実行させる。
本開示によれば、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報とを関連付けて記憶する。そのため、複数の手段によりテキスト情報を取得する場合であっても、テキスト情報を一元管理することが可能になる。
本開示による入力フォーム生成の例を示す図である。 テキスト情報生成管理システム1の全体の構成を示す図である。 実施の形態1のテキスト情報生成管理システム1を構成する端末装置10の機能的な構成を示すブロック図である。 実施の形態1のテキスト情報生成管理システム1を構成するサーバ20の機能的な構成を示す図である。 サーバ20が記憶する帳票項目データベース2021のデータ構造を示す図である。 サーバ20が記憶するワークフローデータベース2023のデータ構造を示す図である。 実施の形態1のテキスト情報生成管理システム1による帳票読取処理を行う流れの一例を示すフローチャートである。 実施の形態1のテキスト情報生成管理システム1による入力フォーム生成処理を行う流れの一例を示すフローチャートである。 実施の形態1のテキスト情報生成管理システム1によるテキスト情報入力受付処理を行う流れの一例を示すフローチャートである。 端末装置10に表示するワークフローの表示画面例を示す図である。 実施の形態2のテキスト情報生成管理システム1を構成するサーバ20の機能的な構成を示す図である。 端末装置10に表示するインプットデータの選択画面の例を示す図である。
以下、図面を参照しつつ、本開示の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称及び機能も同じである。従って、それらについての詳細な説明は繰り返さない。
<概要>
以下、本開示に係るテキスト情報生成管理システムについて説明する。このテキスト情報生成管理システムは、1または複数の手段によるテキスト情報の入力を受け付けて管理するためのシステムである。ここで、入力を受け付けるテキスト情報は、各種申込書のような帳票に記載されている記載内容を、デジタルデータであるテキスト情報として取得するものである。また、テキスト情報の入力手段の例として、紙に印刷された帳票類をイメージスキャナ等で読み取り、OCR処理を行ってテキスト情報を生成する手段、及びWebサイトの入力フォームからの入力を受け付ける手段がある。
本開示に係るテキスト情報生成管理システムは、帳票類に対してOCR処理を行うため、帳票における記載内容を読み取る読取項目について、読取項目の内容を示す属性情報を保持している。属性情報とは、具体的には申込書の申込者氏名、住所、電話番号のような読取項目の種類の情報や、全角漢字かな、英数字(全角または半角)、特定のコード値のような値の種類の情報が含まれる。なお、テキスト情報生成管理システムは、帳票内の位置情報を保持してもよい。
また、本開示に係るテキスト情報生成管理システムは、帳票の読取項目の内容を示す属性情報から、Webサイトから入力を受け付けるための入力フォームを生成する。入力フォームは、Webサイト(インターネット上のオープンなサイトでもよく、イントラネットのような特定の者のみがアクセス可能なサイトでもよい)から文字入力を受け付けるための入力欄が設けられたフォームである。この入力フォームは、例えば各種申込書のような帳票の記載内容(主に手書きの帳票)を電子データであるテキスト情報として生成するサービスを提供する企業等において、入力用及び確認、修正用に使用されるものであってもよく、一般顧客から直接入力を受け付けるものであってもよい。
テキスト情報生成管理システムでは、帳票からOCR処理によりテキスト情報を生成する処理と、入力フォームからテキスト情報を受け付ける処理とを並行して行ってもよく、OCR処理により生成されたテキスト情報を入力フォームにて確認、修正をする、という流れで処理してもよい。
図1は、本開示による入力フォーム生成の例を示す図である。図1の上方に示す、契約申込書を例とする帳票60は、本開示に係るテキスト情報生成管理システムにおいて、OCR処理を行う対象である帳票類であり、読取項目の例として、申込者氏名カナ61と、申込者氏名漢字62と、郵便番号63と、住所64とが印刷されている。図1に示す申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64は、帳票60内の図1に破線で示す位置の情報を、例えば帳票60の左上の端点を原点とする座標の情報として設定されている。また、申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64の属性情報として、記載される文字の種類(全角漢字かな、半角英数字等)が設定されている。
図1の下方に示す請求書入力フォーム70は、本開示に係るテキスト情報生成管理システムが生成する入力フォームの例であり、入力項目の例として、申込者氏名カナ71と、申込者氏名漢字72と、郵便番号73と、住所74とが設定されている。図1に示す申込者氏名カナ71、申込者氏名漢字72、郵便番号73、及び住所74は、帳票60の申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64に対応して設定された入力項目である。テキスト情報生成管理システムは、帳票60の申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64の属性情報に対応させて、申込者氏名カナ71、申込者氏名漢字72、郵便番号73、及び住所74を設定し、請求書入力フォーム70を生成する。これにより、帳票60をOCR処理で読み取るだけではなく、請求書入力フォーム70から入力を受け付けることにより、複数の手段によりテキスト情報を取得することを可能にしている。
また、本開示に係るテキスト情報生成管理システムは、帳票60をOCR処理で読み取ったテキスト情報と、請求書入力フォーム70から受け付けたテキスト情報とを、ワークフローで一元管理する。これにより、テキスト情報を取得する手段ごとに個別に管理する必要がなくなり、管理が容易になる。
<第1の実施の形態>
以下、テキスト情報生成管理システム1について説明する。以下の説明では、例えば、端末装置10がサーバ20へアクセスすることにより、サーバ20が、端末装置10で画面を生成するための情報を応答する。端末装置10は、サーバ20から受信した情報に基づいて画面を生成し表示する。
<1 テキスト情報生成管理システム1の全体構成>
図2は、テキスト情報生成管理システム1の全体の構成を示す図である。図2に示すように、テキスト情報生成管理システム1は、複数の端末装置(図2では、端末装置10A及び端末装置10Bを示している。以下、総称して「端末装置10」ということもある)と、サーバ20とを含む。端末装置10と、サーバ20とは、ネットワーク80を介して相互に通信可能に接続されている。ネットワーク80は、有線または無線ネットワークにより構成される。
端末装置10は、各ユーザが操作する装置である。ここで、ユーザとは、端末装置10を使用して入力フォームからテキスト情報の入力を行い、ワークフローでテキスト情報を取得する作業工程を参照する者である。端末装置10は、据え置き型のPC(Personal Computer)、ラップトップPC等により実現される。この他、端末装置10は、例えば移動体通信システムに対応したタブレットや、スマートフォン等の携帯端末であるとしてもよい。
端末装置10は、ネットワーク80を介してサーバ20と通信可能に接続される。端末装置10は、4G、5G、LTE(Long Term Evolution)等の通信規格に対応した無線基地局81、IEEE(Institute of Electrical and Electronics Engineers)802.11等の無線LAN(Local Area Network)規格に対応した無線LANルータ82等の通信機器と通信することにより、ネットワーク80に接続される。図2に端末装置10Bとして示すように、端末装置10は、通信IF(Interface)12と、入力装置13と、出力装置14と、メモリ15と、記憶部16と、プロセッサ19とを備える。
通信IF12は、端末装置10が外部の装置と通信するため、信号を入出力するためのインタフェースである。入力装置13は、ユーザからの入力操作を受け付けるための入力装置(例えば、キーボードや、タッチパネル、タッチパッド、マウス等のポインティングデバイス等)である。出力装置14は、ユーザに対し情報を提示するための出力装置(ディスプレイ、スピーカ等)である。メモリ15は、プログラム、及び、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等の揮発性のメモリである。記憶部16は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD(Hard Disc Drive)である。プロセッサ19は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路等により構成される。
サーバ20は、帳票にOCR処理を行ってテキスト情報を生成し、Webサイトの入力フォームから入力されたテキスト情報を受け付け、これらのテキスト情報をワークフローで一元管理する装置である。また、サーバ20は、帳票の読取項目の属性情報を保持し、この属性情報に基づいて入力フォームを生成し、ユーザから入力フォームを介してテキスト情報の入力を受け付ける。
サーバ20は、ネットワーク80に接続されたコンピュータである。サーバ20は、通信IF22と、入出力IF23と、メモリ25と、ストレージ26と、プロセッサ29とを備える。
通信IF22は、サーバ20が外部の装置と通信するため、信号を入出力するためのインタフェースである。入出力IF23は、ユーザからの入力操作を受け付けるための入力装置、及び、ユーザに対し情報を提示するための出力装置とのインタフェースとして機能する。メモリ25は、プログラム、及び、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等の揮発性のメモリである。ストレージ26は、データを保存するための記憶装置であり、例えばフラッシュメモリ、HDD(Hard Disc Drive)である。プロセッサ29は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路等により構成される。
<1.1 端末装置10の構成>
図3は、実施の形態1のテキスト情報生成管理システム1を構成する端末装置10の機能的な構成を示すブロック図である。図3に示すように、端末装置10は、複数のアンテナ(アンテナ111、アンテナ112)と、各アンテナに対応する無線通信部(第1無線通信部121、第2無線通信部122)と、操作受付部130(キーボード131及びマウス132を含む)と、音声処理部140と、マイク141と、スピーカ142と、ディスプレイ150と、記憶部160と、制御部170とを含む。端末装置10は、図3では特に図示していない機能及び構成(例えば、電力を保持するためのバッテリー、バッテリーから各回路への電力の供給を制御する電力供給回路等)も有している。図3に示すように、端末装置10に含まれる各ブロックは、バス等により電気的に接続される。
アンテナ111は、端末装置10が発する信号を電波として放射する。また、アンテナ111は、空間から電波を受信して受信信号を第1無線通信部121へ与える。
アンテナ112は、端末装置10が発する信号を電波として放射する。また、アンテナ112は、空間から電波を受信して受信信号を第2無線通信部122へ与える。
第1無線通信部121は、端末装置10が他の無線機器と通信するため、アンテナ111を介して信号を送受信するための変復調処理等を行う。第2無線通信部122は、端末装置10が他の無線機器と通信するため、アンテナ112を介して信号を送受信するための変復調処理等を行う。第1無線通信部121と第2無線通信部122とは、チューナー、RSSI(Received Signal Strength Indicator)算出回路、CRC(Cyclic Redundancy Check)算出回路、高周波回路等を含む通信モジュールである。第1無線通信部121と第2無線通信部122とは、端末装置10が送受信する無線信号の変復調や周波数変換を行い、受信信号を制御部170へ与える。
操作受付部130は、ユーザの入力操作を受け付けるための機構を有する。具体的には、操作受付部130は、キーボード131と、マウス132とを含む。なお、操作受付部130は、例えば静電容量方式のタッチパネルを用いることによって、タッチパネルに対するユーザの接触位置を検出する、タッチスクリーンとして構成してもよく、この場合は後述するディスプレイ150を備えなくてもよい。
キーボード131は、端末装置10のユーザの入力操作を受け付ける。キーボード131は、文字入力を行う装置であり、入力された文字情報を入力信号として制御部170へ出力する。
マウス132は、端末装置10のユーザの入力操作を受け付ける。マウス132は、ディスプレイ150に表示されている表示物を選択等するためのポインティングデバイスであり、画面上で選択された位置情報と、ボタン押下されていることを示す情報とを入力信号として制御部170へ出力する。
音声処理部140は、音声信号の変復調を行う。音声処理部140は、マイク141から与えられる信号を変調して、変調後の信号を制御部170へ与える。また、音声処理部140は、音声信号をスピーカ142へ与える。音声処理部140は、例えば音声処理用のプロセッサによって実現される。マイク141は、音声入力を受け付けて、当該音声入力に対応する音声信号を音声処理部140へ与える。スピーカ142は、音声処理部140から与えられる音声信号を音声に変換して当該音声を端末装置10の外部へ出力する。
ディスプレイ150は、制御部170の制御に応じて、画像、動画、テキスト等のデータを表示する。ディスプレイ150は、例えばLCD(Liquid Crystal Display)や有機EL(Electro-Luminescence)ディスプレイによって実現される。
記憶部160は、例えばフラッシュメモリ等により構成され、端末装置10が使用するデータ及びプログラムを記憶する。ある局面において、記憶部160は、ユーザ情報161を記憶する。
ユーザ情報161は、端末装置10を使用してテキスト情報生成管理システム1の機能である入力フォームからテキスト情報の入力を行い、ワークフローでテキスト情報を取得する作業工程を参照するユーザの情報である。ユーザ情報としては、ユーザを識別する情報(ユーザID)やパスワード、ユーザの氏名や名称、ユーザが所属している企業等の組織情報等が含まれる。
制御部170は、記憶部160に記憶されるプログラムを読み込んで、プログラムに含まれる命令を実行することにより、端末装置10の動作を制御する。制御部170は、例えば予め端末装置10にインストールされているアプリケーションである。制御部170は、プログラムに従って動作することにより、入力操作受付部171と、送受信部172と、データ処理部173と、通知制御部174としての機能を発揮する。
入力操作受付部171は、キーボード131またはマウス132等の入力装置に対するユーザの入力操作を受け付ける処理を行う。
送受信部172は、端末装置10が、サーバ20等の外部の装置と、通信プロトコルに従ってデータを送受信するための処理を行う。
データ処理部173は、端末装置10が入力を受け付けたデータに対し、プログラムに従って演算を行い、演算結果をメモリ等に出力する処理を行う。
通知制御部174は、ユーザに対し情報を提示する処理を行う。通知制御部174は、表示画像をディスプレイ150に表示させる処理、音声をスピーカ142に出力させる処理等を行う。
<1.2 サーバ20の機能的な構成>
図4は、実施の形態1のテキスト情報生成管理システム1を構成するサーバ20の機能的な構成を示す図である。図4に示すように、サーバ20は、通信部201と、記憶部202と、制御部203としての機能を発揮する。
通信部201は、サーバ20が外部の装置と通信するための処理を行う。
記憶部202は、サーバ20が使用するデータ及びプログラムを記憶する。記憶部202は、帳票項目データベース2021と、入力フォームデータベース2022と、ワークフローデータベース2023等を記憶する。
帳票項目データベース2021は、テキスト情報生成管理システム1において、OCR処理を行う対象の帳票から読み取るテキスト情報である読取項目に関する各種情報、例えば読取項目の属性情報、及び位置情報を保持するためのデータベースである。詳細は後述する。
入力フォームデータベース2022は、テキスト情報生成管理システム1において、帳票項目データベース2021に保持されている帳票の読取項目の属性情報から生成された、Webサイトから入力を受け付けるための入力フォームの情報を保持するためのデータベースである。例えば、入力フォームデータベース2022には、図1に示す請求書入力フォーム70のような入力フォームを所定のWebサイト上に表示させるための情報が格納されており、具体的には、所定のWebサイトを識別するアドレス(URL)や、Webサイト上に表示させるためのHTML、CSS、JavaScript(登録商標)等のコード情報により構成されている。なお、入力フォームデータベース2022は、これらの情報を直接格納する必要はなく、これらの情報が格納されているWebサーバへのアドレス(URL)のリンク情報が格納されてもよい。
ワークフローデータベース2023は、帳票をOCR処理で読み取ったテキスト情報と、入力フォームから受け付けたテキスト情報とを一元管理する、ワークフローの情報を保持するためのデータベースである。詳細は後述する。
制御部203は、サーバ20のプロセッサがプログラムに従って処理を行うことにより、各種モジュールとして受信制御モジュール2031、送信制御モジュール2032、入力項目取得モジュール2033、入力フォーム生成モジュール2034、テキスト入力受付モジュール2035、帳票読取モジュール2036、及びワークフロー管理モジュール2037に示す機能を発揮する。
受信制御モジュール2031は、サーバ20が外部の装置から通信プロトコルに従って信号を受信する処理を制御する。
送信制御モジュール2032は、サーバ20が外部の装置に対し通信プロトコルに従って信号を送信する処理を制御する。
入力項目取得モジュール2033は、後述する入力フォーム生成モジュール2034にて入力フォームを生成するため、基になる読取項目(テキスト情報)の内容を示す属性情報を取得する処理を制御する。この属性情報は、帳票に対してOCR処理を行うために帳票における記載内容を読み取る読取項目について設定された情報であり、図1に示す申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64のように、項目名と、属性情報として記載される文字種類(全角漢字かな、半角英数字)とが設定されている。この属性情報は、例えば、帳票項目データベース2021に格納されているため、入力項目取得モジュール2033は、帳票項目データベース2021を読み込むことで属性情報を取得する。
また、入力項目取得モジュール2033は、帳票における読取項目の位置を示す位置情報を取得してもよい。この位置情報は、例えば、帳票項目データベース2021に格納されているため、入力項目取得モジュール2033は、帳票項目データベース2021を読み込むことで位置情報を取得する。
入力フォーム生成モジュール2034は、入力項目取得モジュール2033で取得した読取項目(テキスト情報)の内容を示す属性情報に基づき、オンライン経由でWebサイトから、帳票の記載項目に対応するテキスト情報の入力を受け付けるための入力フォームを生成する処理を制御する。生成する入力フォームは、帳票の記載項目に対応する入力項目が設定されたものであり、例えば、図1に示す申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64に対応させて、申込者氏名カナ71、申込者氏名漢字72、郵便番号73、及び住所74を設定し、請求書入力フォーム70を生成する。このとき、入力フォーム生成モジュール2034は、読取項目の属性情報に基づき、当該読取項目の文字種類(全角漢字かな、英数字)に対応する文字しか入力できないように入力フォームを設定してもよい。例えば、入力する際に(文字入力時の辞書ソフトの設定等で)異なる文字の種類を選択できないように設定してもよく、異なる文字種類を選択すると警告や注意喚起が表示されるように設定してもよい。また、顧客の性別や、郵便番号、金融機関名や支店名、金融機関コード等のように入力可能なテキスト情報の内容が限定される場合、「男性/女性」のようにプルダウン等で限定される内容を選択して入力するように設定してもよい。
また、入力フォーム生成モジュール2034は、入力項目取得モジュール2033で取得した読取項目の位置を示す位置情報に基づき、帳票の記載項目に対応するテキスト情報の入力を受け付けるための入力フォームを生成してもよい。例えば、図1に示す申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64と、申込者氏名カナ71、申込者氏名漢字72、郵便番号73、及び住所74のように、基になる帳票の読取項目の位置情報の配置順に合わせた順番で配置してもよい。
さらに、入力フォーム生成モジュール2034は、生成した入力フォームをWebサイトで参照できるように、所定のWebサイトにアップロード、または所定のWebサイト上で生成する処理を制御する。例えば、入力フォームをHTML、CSS、JavaScriptで生成してもよく、特定のCMS(コンテンツ・マネジメント・システム)で提供されている各種ツール等に従って入力フォームを生成してもよい。生成する入力フォームのWebサイトは、帳票の記載内容からテキスト情報を生成して提供する企業内におけるイントラネット上のサイトでもよく、一般ユーザが参照可能なインターネット上のサイトでもよい。また、入力フォーム生成モジュール2034は、生成した入力フォームのデータまたはアドレス(URL)を、入力フォームデータベース2022に格納する。
テキスト入力受付モジュール2035は、入力フォーム生成モジュール2034が生成した入力フォームから、テキスト情報の入力を受け付ける処理を制御する。テキスト情報生成管理システム1を使用するユーザは、上記のような企業内におけるイントラネット上のサイト、または一般ユーザが参照可能なインターネット上のサイトに設けられた入力フォームから、テキスト情報を入力し、例えば入力フォームに設けられた送信ボタンを押下する等の操作により送信するので、テキスト入力受付モジュール2035は、送信されたテキスト情報を受信し、テキスト情報を取得する。また、テキスト入力受付モジュール2035は、受け付けたテキスト情報を、例えばワークフローデータベース2023に格納する。
テキスト入力受付モジュール2035は、読取項目の属性情報に基づき、当該文字種類(全角漢字かな、英数字)に対応する正しい文字が入力されているか否かを判定してもよく、特定の情報(性別、郵便番号、金融機関コードのような所定の値しか入力されない項目)が正しく入力されているか否かを判定してもよい。このとき、テキスト入力受付モジュール2035は、判定結果が正しくない場合、入力された(送信された)端末装置10に対して正しくない旨を通知してもよい。なお、当該機能はサーバ20の機能として備えてもよく、JavaScript等で組み込まれて入力フォームで入力する端末装置10で稼働するように構成してもよい。
帳票読取モジュール2036は、紙に印刷された帳票類をイメージスキャナ等で読み取り、読取項目(テキスト情報)の内容を示す属性情報に基づき、OCR処理を行ってテキスト情報を生成する処理を制御する。また、帳票読取モジュール2036は、読取項目の位置を示す位置情報に基づき、OCR処理を行ってテキスト情報を生成してもよい。読取項目の属性情報及び位置情報は、例えば、帳票項目データベース2021に格納されているため、帳票読取モジュール2036は、帳票項目データベース2021を読み込むことで属性情報及び位置情報を取得する。なお、帳票類をイメージスキャナ等で読み取った画像データは、記憶部202に格納してもよく、外部サーバ等から取得したものであってもよい。また、帳票読取モジュール2036は、読み取ったテキスト情報を、例えばワークフローデータベース2023に格納する。
具体的には、帳票読取モジュール2036は、図1の上方に示す請求書のような帳票60をイメージスキャナ等で読み取り、読取項目の位置情報に基づき、帳票60内の図1に破線で示す位置を特定し、申込者氏名カナ61、申込者氏名漢字62、郵便番号63、及び住所64の破線で示す位置に記載されている記載内容をOCR処理により読み取り、テキスト情報を読取項目ごとに生成する。このとき、読取項目の属性情報に基づき、文字の種類を特定する。例えば読み取った文字が縦棒のような形状であった場合、属性情報に定義されている文字の種類が数字の場合、「1」と判定して読み取り、英字(アルファベット)の場合、小文字の「l」(エル)と判定して読み取る。
帳票読取モジュール2036は、上記のような文字の判定、読み取りの処理を、文字認識を推定するための機械学習モデルを使用して判定してもよい。このような機械学習モデルは、帳票読取モジュール2036の機能として行われた機械学習により生成してもよく、他の装置により機械学習が行われた結果生成された機械学習モデルを取得してもよい。このような機械学習は、所定の教師データを使用した教師あり機械学習により行われてもよく、教師なし機械学習により行われてもよく、ディープラーニングにより行われてもよい。また、帳票読取モジュール2036による読取結果と入力フォームの入力内容とを対比可能に構成し、さらなる機械学習による学習結果をマージするアグリゲーション処理を行ってもよい。
ワークフロー管理モジュール2037は、テキスト入力受付モジュール2035により入力フォームから受け付けたテキスト情報と、帳票読取モジュール2036により生成されたテキスト情報とを関連付けて記憶し、ワークフローで一元管理する処理を制御する。ここで、ワークフローとは、1または複数の作業工程、進捗状況等を管理し、ユーザの要求に応じて作業工程や進捗状況の情報、個別のテキスト情報を表示するためのソフトウェアであり、ワークフロー管理モジュール2037では、複数の入力手段により入力されたテキスト情報を、入力手段ごとに管理し、端末装置10に送信してディスプレイ150に表示させる。
例えば、ワークフロー管理モジュール2037は、1または複数の帳票の種類ごとに、入力フォームから受け付けたテキスト情報と、OCR処理により生成されたテキスト情報とをそれぞれ記憶し、ワークフローで一元管理する。具体的には、それぞれのテキスト情報を同一のデータベースのレコードとして格納する。
また、ワークフロー管理モジュール2037は、入力フォームから受け付けたテキスト情報の作業工程の情報と、OCR処理により生成されたテキスト情報の作業工程の情報とをそれぞれ記憶し、ワークフローで一元管理する。作業工程の情報とは、テキスト情報を取得するために必要な作業工程の情報であり、具体的には「データ化」、「チェック」等の工程である。この作業工程の情報は、テキスト情報の取得元(入力フォームから、OCR処理から)ごとに異なる作業工程であってもよい。
また、ワークフロー管理モジュール2037は、入力フォームから受け付けたテキスト情報の進捗状況の情報と、OCR処理により生成されたテキスト情報の進捗状況の情報とをそれぞれ記憶し、ワークフローで一元管理する。進捗状況の情報とは、例えば、処理する全体のテキスト情報の件数のうち、取得済のテキスト情報の件数のように、作業の進捗として数値等で示すことが可能な情報である。この進捗状況は、上記の作業工程ごとに管理してもよい。
さらに、ワークフロー管理モジュール2037は、ワークフローで管理されているテキスト情報及びその管理情報を、端末装置10へ送信し、ディスプレイ150に表示させる処理を制御する。
<2 データ構造>
図5は、サーバ20が記憶する帳票項目データベース2021のデータ構造を示す図である。また、図6は、サーバ20が記憶するワークフローデータベース2023のデータ構造を示す図である。
図5に示すように、帳票項目データベース2021のレコードのそれぞれは、項目「帳票ID」と、項目「帳票種類名」と、項目「項目詳細情報」等を含む。
項目「帳票ID」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である、帳票それぞれを識別する情報である。
項目「帳票種類名」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である、帳票の名称である。例えば、項目「帳票種類名」には、「○△社仕様請求書」、「▽□社仕様口座振替申込書」のような帳票の種類及び名称の情報が格納されている。
項目「項目詳細情報」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である帳票に記載されている読取項目に関する情報であり、具体的には、項目「No.」と、項目「項目名」と、項目「位置」と、項目「属性」等を含む。この項目「項目詳細情報」は、帳票読取モジュール2036が帳票を読み取るための情報であり、入力フォーム生成モジュール2034が入力フォームを生成するための情報である。
項目「No.」は、項目「項目詳細情報」に格納されている読取項目の順番を示す情報であり、例えば、入力フォームを生成する際の入力項目の順番にも使用される情報である。
項目「項目名」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である帳票に記載されている読取項目の名称の情報である。
項目「位置」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である帳票における、当該項目の位置の情報であり、例えば、帳票の左上の端点を原点とする座標の情報である。
項目「属性」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である帳票における、当該項目の属性の情報であり、例えば、文字の種類(全角漢字かな、半角英数字)の情報や、性別や金融機関名、金融機関コード等のように入力可能なテキスト情報の内容が限定される場合における一覧情報が記載されたリストの名称(「性別リスト」、「金融機関リスト」等)である。
サーバ20では、新たな帳票についての処理を受け付ける場合、帳票項目データベース2021が更新される。
図6に示すように、ワークフローデータベース2023のレコードのそれぞれは、項目「帳票ID」と、項目「帳票読取工程情報」と、項目「入力フォーム工程情報」等を含む。
項目「帳票ID」は、テキスト情報生成管理システム1によりOCR処理を行ってテキスト情報を生成する対象である、帳票それぞれを識別する情報であり、帳票項目データベース2021の項目「帳票ID」に対応している。
項目「帳票読取工程情報」は、テキスト情報生成管理システム1にて帳票をOCR処理で読み取ってテキスト情報を生成する際の、作業工程に関する情報であり、具体的には、項目「工程ID」と、項目「工程名称」と、項目「件数」等を含む。
項目「工程ID」は、テキスト情報生成管理システム1にて帳票をOCR処理で読み取ってテキスト情報を生成する、作業工程それぞれを識別する情報である。
項目「工程名称」は、テキスト情報生成管理システム1にて帳票をOCR処理で読み取ってテキスト情報を生成する、作業工程の名称である。例えば、項目「工程名称」には、「データ化」、「読取チェック」のような作業工程の名称の情報が格納されている。
項目「件数」は、テキスト情報生成管理システム1にて帳票をOCR処理で読み取ってテキスト情報を生成する、作業工程ごとの処理済件数の情報である。
項目「入力フォーム工程情報」は、テキスト情報生成管理システム1にて入力フォームからテキスト情報の入力を受け付ける際の、作業工程に関する情報であり、具体的には、項目「工程ID」と、項目「工程名称」と、項目「件数」等を含む。
項目「工程ID」は、テキスト情報生成管理システム1にて入力フォームからテキスト情報の入力を受け付ける、作業工程それぞれを識別する情報である。
項目「工程名称」は、テキスト情報生成管理システム1にて入力フォームからテキスト情報の入力を受け付ける、作業工程の名称である。例えば、項目「工程名称」には、「データ入力」、「入力チェック」のような作業工程の名称の情報が格納されている。
項目「件数」は、テキスト情報生成管理システム1にて入力フォームからテキスト情報の入力を受け付ける、作業工程ごとの処理済件数の情報である。
なお、図示は省略するが、ワークフローデータベース2023には、帳票をOCR処理で読み取って生成したテキスト情報、及び入力フォームから受け付けたテキスト情報を格納してもよく、または他の格納先のリンク情報が格納されてもよい。
サーバ20のテキスト入力受付モジュール2035は、入力フォームからテキスト情報の入力を受け付けることに伴って、ワークフローデータベース2023を更新する。また、帳票読取モジュール2036は、帳票をOCR処理で読み取ってテキスト情報を生成することに伴って、ワークフローデータベース2023を更新する。
<3 動作>
以下、図7ないし図9を参照しながら、第1の実施の形態におけるテキスト情報生成管理システム1による帳票読取処理、入力フォーム生成処理及びテキスト情報入力受付処理について説明する。
図7は、実施の形態1のテキスト情報生成管理システム1による帳票読取処理を行う流れの一例を示すフローチャートである。
ステップS111において、サーバ20の帳票読取モジュール2036は、帳票項目データベース2021を読み込み、読取項目(テキスト情報)の内容を示す属性情報、及び読取項目の位置を示す位置情報を取得する。
ステップS112において、サーバ20の帳票読取モジュール2036は、紙に印刷された帳票をイメージスキャナ等で読み取った画像データを取得する。画像データの取得先は、記憶部202に格納されたものでもよく、外部サーバ等から取得してもよい。外部サーバ等から取得する場合、通信部201を介して取得する。
ステップS113において、サーバ20の帳票読取モジュール2036は、ステップS111で取得した読取項目の属性情報及び位置情報に基づき、ステップS112で取得した画像データに対してOCR処理を行い、読取項目ごとにテキスト情報を生成する。
ステップS114において、サーバ20の帳票読取モジュール2036は、ステップS113で生成したテキスト情報を、ワークフローデータベース2023に格納する。また、ワークフロー管理モジュール2037は、ステップS113で生成したテキスト情報を、後述する入力フォームから受け付けたテキスト情報と関連付けて記憶する。具体的には、図6に示すワークフローデータベース2023のように、帳票をOCR処理で読み取ったテキスト情報と、入力フォームから受け付けたテキスト情報とを対応付けて記憶する。
以上のように、テキスト情報生成管理システム1では、読取項目の属性情報及び位置情報に基づき、帳票をスキャンした画像データに対してOCR処理を行い、読取項目ごとにテキスト情報を生成する。
図8は、実施の形態1のテキスト情報生成管理システム1による入力フォーム生成処理を行う流れの一例を示すフローチャートである。
ステップS211において、サーバ20の入力項目取得モジュール2033は、帳票項目データベース2021を読み込み、入力フォーム生成の基になる読取項目(テキスト情報)の内容を示す属性情報を取得する。ここで、読取項目の位置を示す位置情報を取得してもよい。
ステップS212において、サーバ20の入力フォーム生成モジュール2034は、ステップS211で取得した読取項目の属性情報及び位置情報に基づき、オンライン経由でWebサイトから、帳票の記載項目に対応するテキスト情報の入力を受け付けるための入力フォームを生成する。生成する入力フォームは、帳票の記載項目に対応する入力項目が設定されたものであり、例えば、読取項目の位置情報の順に入力するように生成される。
ステップS213において、サーバ20の入力フォーム生成モジュール2034は、ステップS212で生成した入力フォームを、Webサイトで参照できるように、所定のWebサイトにアップロードする。なお、特定のCMSで提供されている各種ツール等に従って入力フォームを生成したような場合、Webサーバ上で入力フォームが生成されるため、当該ステップは実行されなくてもよい。
以上のように、テキスト情報生成管理システム1では、読取項目の属性情報及び位置情報に基づき、オンライン経由でWebサイトからテキスト情報の入力を受け付けるための入力フォームを生成する。
図9は、実施の形態1のテキスト情報生成管理システム1によるテキスト情報入力受付処理を行う流れの一例を示すフローチャートである。
ステップS311において、端末装置10の入力操作受付部171は、テキスト情報生成管理システム1にアクセスするための情報(URL、ユーザID、パスワード等)、及びステップS212で生成した、入力を行う対象の入力フォームの選択を、ユーザから受け付ける。送受信部172は、受け付けた各種情報をサーバ20へ送信する。
ステップS321において、サーバ20は、ユーザID及びパスワードを、通信部201を介して受け付けて所定の認証を行い、当該ユーザのアクセスを受け付ける。サーバ20のテキスト入力受付モジュール2035は、選択された入力フォームを当該ユーザの端末装置10のディスプレイ150に表示させる指示情報、及び入力フォームの情報を、端末装置10へ通信部201を介して送信する。
ステップS312において、端末装置10の送受信部172は、サーバ20から送信された入力フォームを表示させる指示情報、及び入力フォームの情報を受け付ける。通知制御部174は、受け付けた入力フォームを、ディスプレイ150に表示させる。端末装置10の入力操作受付部171は、入力フォームへのテキスト情報の入力を、ユーザから受け付ける。このとき、入力フォームの各入力項目に設定された文字の種類(全角漢字かな、数値)に対応する正しい文字が入力されているか否かを判定してもよい。送受信部172は、(判定結果が正しい場合)受け付けたテキスト情報をサーバ20へ送信する。
ステップS322において、サーバ20のテキスト入力受付モジュール2035は、端末装置10から送信されたテキスト情報を受け付ける。
ステップS323において、サーバ20のテキスト入力受付モジュール2035は、ステップS322で受け付けたテキスト情報について、入力フォームの各入力項目に設定された文字の種類(全角漢字かな、数値)に対応する正しい文字が入力されているか否か、特定の情報(性別、金融機関コードのような所定の値しか入力されない項目)が正しく入力されているか否かを判定する。
ステップS324において、サーバ20のテキスト入力受付モジュール2035は、ステップS323の判定結果が正しい場合、ステップS322で受け付けたテキスト情報を、ワークフローデータベース2023に格納する。また、ワークフロー管理モジュール2037は、ステップS322で受け付けたテキスト情報を、帳票をOCR処理で読み取ったテキスト情報と関連付けて記憶する。具体的には、図6に示すワークフローデータベース2023のように、帳票をOCR処理で読み取ったテキスト情報と、入力フォームから受け付けたテキスト情報とを対応付けて記憶する。
以上のように、テキスト情報生成管理システム1は、生成した入力フォームから、テキスト情報の入力を受け付ける。これにより、効率的なテキスト情報の取得が可能である。
<4 画面例>
以下、図10を参照しながら、テキスト情報生成管理システム1によるワークフローの提示処理の画面例について説明する。
図10は、端末装置10に表示するワークフローの表示画面例を示す図である。図10の画面例は、サーバ20のワークフロー管理モジュール2037が、図7に示す帳票読取処理の作業工程及び進捗状況、図9に示すテキスト情報入力受付処理の作業工程及び進捗状況が表示した画面例を示す。
図10に示すように、端末装置10のディスプレイ150には、当該ワークフローで管理されている1または複数の帳票の種類を表示する欄が、画面左側に設けられている。図10に示す例では、帳票の種類を表示する欄に選択ボタン1031a,1031bが選択可能に表示されている。ユーザは、参照したい帳票の種類に対応する選択ボタン1031a,1031bを選択してマウス132によるクリック等により押下する。
また、図10に示すように、端末装置10のディスプレイ150には、当該ワークフローで管理されている、入力フォームから受け付けたテキスト情報の作業工程の情報と、OCR処理により生成されたテキスト情報の作業工程の情報とを表示する欄が、画面右側に設けられている。図10に示す例では、選択ボタン1031a,1031bのいずれかを選択した帳票の種類を表示する帳票種類表示欄1031c、OCR読取工程表示欄1031d、入力フォーム受付工程表示欄1031eが選択可能に表示されている。
図10に示すように、OCR読取工程表示欄1031d、入力フォーム受付工程表示欄1031eには、テキスト情報の取得手段(帳票OCR読取または入力フォーム受付)を表示する取得手段表示欄1031d1と、それぞれの作業工程と進捗状況とを表示する工程表表示欄1031d2とが表示されている。工程表表示欄1031d2は、図6に示すワークフローデータベース2023の項目「帳票読取工程情報」、項目「入力フォーム工程情報」への格納内容に従って、項目「工程名称」に対応する工程の名称が表示され、項目「件数」に対応する処理件数が、全体のうちどの程度消化したかが分かるように円グラフで表示されている。これにより、テキスト情報の取得の作業工程、及び作業工程ごとの進捗状況を把握することができる。
<小括>
以上のように、本実施形態によると、読取項目の属性情報及び位置情報に基づき、帳票をスキャンした画像データに対してOCR処理を行い、読取項目ごとにテキスト情報を生成する。読取項目の属性情報及び位置情報に基づき、オンライン経由でWebサイトからテキスト情報の入力を受け付けるための入力フォームを生成する。これにより、複数の手段によりテキスト情報を効率的に取得することが可能になる。
また、帳票の画像データに対してOCR処理を行って生成したテキスト情報と、入力フォームから受け付けたテキスト情報とを、関連付けて記憶する。これにより、複数の手段によりテキスト情報を取得する場合であっても、テキスト情報を一元管理することが可能になる。
さらに、OCR処理により生成されたテキスト情報と、入力フォームから受け付けたテキスト情報とを、ワークフローで一元管理し、作業工程、進捗工程を記憶して一元管理する。これらの情報は、ユーザの端末装置に提示される。これにより、テキスト情報の取得の作業工程、及び作業工程ごとの進捗状況を一目で把握することが可能になる。
<第2の実施の形態>
以下、テキスト情報生成管理システム1の他の実施の形態について説明する。
<1 テキスト情報生成管理システム1の全体構成>
図11は、第2の実施の形態のテキスト情報生成管理システム1を構成するサーバ20の機能的な構成を示す図である。第2の実施の形態におけるテキスト情報生成管理システム1の全体の構成、端末装置10の構成は、第1の実施の形態と同様であるので、繰り返して説明しない。サーバ20の構成については、図11に示すように、新たに制御部203の機能として、手書き入力受付モジュール2038、及びアップロード受付モジュール2039の機能を備える以外、第1の実施の形態と同様である。以下、第2の実施の形態における手書き入力受付モジュール2038、及びアップロード受付モジュール2039の機能について説明する。
手書き入力受付モジュール2038は、端末装置10で入力された手書き入力情報の入力を受け付け、手書き入力情報に対して文字認識処理を行ってテキスト情報を生成する処理を制御する。このとき、手書き入力受付モジュール2038は、手書き入力情報の入力を入力項目ごとに受け付け、帳票読取モジュール2036と同様に、手書き入力情報が入力された入力項目に対して、帳票項目データベース2021に格納されている読取項目の属性情報に基づいて文字認識処理を行う。手書き入力情報の入力を受け付ける端末装置10は、タッチパネル装置上をユーザの指やタッチパネルに入力可能な所定のペン等によりなぞることにより入力された軌跡の画像を、手書き文字情報として受け付けてもよく、マウス132により入力された軌跡の画像を、手書き文字情報として受け付けてもよい。また、手書き入力受付モジュール2038は、認識したテキスト情報を、例えばワークフローデータベース2023に格納する。
手書き入力受付モジュール2038は、上記のような文字認識処理を、帳票読取モジュール2036と同様に機械学習モデルを使用して判定してもよい。このような機械学習モデルは、手書き入力受付モジュール2038の機能として行われた機械学習により生成してもよく、他の装置により機械学習が行われた結果生成された機械学習モデルを取得してもよい。このような機械学習は、所定の教師データを使用した教師あり機械学習により行われてもよく、教師なし機械学習により行われてもよく、ディープラーニングにより行われてもよい。また、手書き入力受付モジュール2038による読取結果と入力フォームの入力内容とを対比可能に構成し、さらなる機械学習による学習結果をマージするアグリゲーション処理を行ってもよい。
アップロード受付モジュール2039は、端末装置10から、あらかじめ構造化されたテキスト情報として作成されていたファイルの送信を受け付ける処理を制御する。アップロード受付モジュール2039が受け付けるファイルは、例えば、他の端末装置やサーバ等により作成された、入力項目ごとにテキスト情報が構造化されたファイル形式のものであり、具体的にはCSV形式で作成されたファイルや、表計算ソフト等で作成されたファイルである。アップロード受付モジュール2039は、このようなファイル送信を、例えばユーザが端末装置10を手動で操作することにより送信されたファイルを受け付けてもよい。また、アップロード受付モジュール2039は、受け付けたテキスト情報を、例えばワークフローデータベース2023に格納する。
また、アップロード受付モジュール2039は、API連携により、外部サーバ等から自動で、あらかじめ構造化されたテキスト情報として作成されていたファイルの送信を受け付けてもよい。さらに、アップロード受付モジュール2039は、複合機のような読取装置からテキスト情報として受け付けてもよい。
<2 データ構造>
第2の実施の形態におけるデータ構造は、第1の実施の形態と同様であるので、繰り返して説明しない。
<3 動作>
第2の実施の形態における動作は、第1の実施の形態と同様であるので、繰り返して説明しない。
<4 画面例>
以下、図12を参照しながら、テキスト情報生成管理システム1によるインプットデータの選択画面の例について説明する。
図12は、端末装置10に表示するインプットデータの選択画面の例を示す図である。図12の画面例は、ワークフロー管理モジュール2037が提示するワークフローの画面の一例であり、サーバ20の帳票読取モジュール2036が生成したテキスト情報、テキスト入力受付モジュール2035が受け付けたテキスト情報、手書き入力受付モジュール2038が認識したテキスト情報、アップロード受付モジュール2039が受け付けたテキスト情報のいずれをワークフロー上のインプットデータとして登録するかを選択する画面例を示す。
図12に示すように、端末装置10のディスプレイ150には、当該ワークフローで管理されているインプットデータの種類を表示する欄が、画面左側に設けられている。図12に示す例では、帳票をスキャンした画像データからテキスト情報を生成する作業工程のフローを示す作業フロー1032aが表示されている。また、図12に示すように、端末装置10のディスプレイ150には、当該ワークフローで管理されているインプットデータの種類を選択するボタンを表示する欄が、画面右側に設けられている。図12に示す例では、帳票読取モジュール2036が生成した(帳票OCR読取による)テキスト情報を選択する画像データ選択ボタン1032b、テキスト入力受付モジュール2035が受け付けた(入力フォームによる)テキスト情報を選択するフォームデータ選択ボタン1032c、手書き入力受付モジュール2038が認識したテキスト情報を選択するデジタル手書きデータ選択ボタン1032d、アップロード受付モジュール2039が手動アップロードにより受け付けたテキスト情報を選択する手動アップロード選択ボタン1032e、アップロード受付モジュール2039がAPI連携により受け付けたテキスト情報を選択するAPI選択ボタン1032f、アップロード受付モジュール2039が複合機から受け付けたテキスト情報を選択する複合機選択ボタン1032gが選択可能に表示されている。
ユーザは、インプットデータとして選択するテキスト情報の種類を、画像データ選択ボタン1032b、フォームデータ選択ボタン1032c、デジタル手書きデータ選択ボタン1032d、手動アップロード選択ボタン1032e、API選択ボタン1032f、複合機選択ボタン1032gから1または複数選択してマウス132によるクリック等により押下すると、作業フロー1032aに選択したテキスト情報の作業フローが表示される。このような構成により、多様な手段によるテキスト情報の入力を受け付け、一元管理することが可能になる。
<小括>
以上のように、本実施形態によると、端末装置で入力された手書き入力情報の入力を受け付け、文字認識処理を行ってテキスト情報を生成する。また、あらかじめ構造化されたテキスト情報として作成されていたファイルの送信を受け付ける。これらの手法により取得したテキスト情報も、ワークフローで一元管理する。これにより、多様な手段によるテキスト情報の入力を受け付け、一元管理することが可能になる。
以上、開示に係る実施形態について説明したが、これらはその他の様々な形態で実施することが可能であり、種々の省略、置換及び変更を行なって実施することができる。これらの実施形態及び変形例ならびに省略、置換及び変更を行なったものは、特許請求の範囲の技術的範囲とその均等の範囲に含まれる。
<付記>
以上の各実施形態で説明した事項を、以下に付記する。
(付記1)プロセッサ29と、メモリ25とを備えるコンピュータに実行させ、テキスト情報を管理するためのプログラムであって、プログラムは、プロセッサ29に、帳票をOCRで読み取るための読取項目の属性情報に基づき、前記帳票に記載されているテキスト情報を読み取るステップ(S113)と、読取項目の属性情報に基づき、オンライン経由で帳票の読取項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップ(S212)と、入力フォームから、テキスト情報の入力を受け付けるステップ(S322)と、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報とを関連付けてメモリに記憶させるステップ(S114,S324)と、を実行させる、プログラム。
(付記2)プログラムは、帳票における読取項目の位置情報と、読取項目の属性情報とに基づき、帳票に記載されているテキスト情報を読み取るステップを実行させる、(付記1)に記載のプログラム。
(付記3)プログラムは、プロセッサ29に、さらに、帳票をOCRで読み取り、帳票における読取項目の属性情報を取得するステップを実行させる、(付記1)または(付記2)に記載のプログラム。
(付記4)メモリは、あらかじめ取得された、帳票における読取項目の属性情報を記憶する、(付記1)または(付記2)に記載のプログラム。
(付記5)読取項目の属性情報として、読取項目の項目名と、読取項目の文字種類とを取得する、(付記3)または(付記4)に記載のプログラム。
(付記6)入力フォームを生成するステップにおいて、読取項目の項目名を入力フォームの入力項目として設定する、(付記5)に記載のプログラム。
(付記7)入力フォームを生成するステップにおいて、入力フォームの入力項目に読取項目の文字種類のみを入力可能に設定する、(付記5)または(付記6)に記載のプログラム。
(付記8)プログラムは、プロセッサ29に、さらに、端末装置上で入力された、手書き入力情報の入力を受け付けるステップと、手書き入力情報からテキスト情報を読み取るステップと、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報と、手書き入力情報から読み取ったテキスト情報とを関連付けてメモリ25に記憶させるステップと、を実行させる、(付記1)から(付記7)のいずれかに記載のプログラム。
(付記9)端末装置が備えるタッチパネル装置上をなぞることにより入力された、手書き入力情報の入力を受け付ける、(付記8)に記載のプログラム。
(付記10)プログラムは、プロセッサ29に、さらに、構造化されたテキスト情報の送信を受け付けるステップと、構造化されたテキスト情報を取得するステップと、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報と、構造化されたテキスト情報とを関連付けてメモリ25に記憶させるステップと、を実行させる、(付記1)から(付記9)のいずれかに記載のプログラム。
(付記11)プログラムは、プロセッサ29に、さらに、テキスト情報を同一または関連付けたワークフローで一元管理するステップを実行させる、(付記1)から(付記10)のいずれかに記載のプログラム。
(付記12)帳票の種類ごとに、テキスト情報をワークフローで一元管理する、(付記11)に記載のプログラム。
(付記13)テキスト情報を受け付ける作業工程の情報をワークフローで一元管理する、(付記11)または(付記12)に記載のプログラム。
(付記14)テキスト情報を取得した取得元ごとに異なる作業工程の情報をワークフローで一元管理する、(付記13)に記載のプログラム。
(付記15)テキスト情報を受け付ける作業工程の情報及び進捗状況の情報をワークフローで一元管理する、(付記13)または(付記14)に記載のプログラム。
(付記16)テキスト情報を受け付けた件数の情報をワークフローで一元管理する、(付記15)に記載のプログラム。
(付記17)プログラムは、プロセッサ29に、さらに、ワークフローをユーザに提示するステップを実行させる、(付記11)から(付記16)のいずれかに記載のプログラム。
(付記18)複数の取得元から取得したテキスト情報を同一のデータベースに格納して一元管理する、(付記1)から(付記17)のいずれかに記載のプログラム。
(付記19)制御部203と、記憶部202とを備え、テキスト情報を管理する情報処理装置であって、制御部203は、帳票をOCRで読み取るための読取項目の属性情報に基づき、帳票に記載されているテキスト情報を読み取るステップと、読取項目の属性情報に基づき、オンライン経由で帳票の記載項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、入力フォームから、テキスト情報の入力を受け付けるステップと、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報とを関連付けて記憶部に記憶させるステップと、を実行する、情報処理装置。
(付記13)プロセッサ29と、メモリ25とを備えるコンピュータにより実行され、テキスト情報を管理するための方法であって、方法は、プロセッサ29が、帳票をOCRで読み取るための読取項目の属性情報に基づき、帳票に記載されているテキスト情報を読み取るステップと、読取項目の属性情報に基づき、オンライン経由で帳票の記載項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、入力フォームから、テキスト情報の入力を受け付けるステップと、入力フォームから受け付けたテキスト情報と、帳票から読み取ったテキスト情報とを関連付けてメモリに記憶させるステップと、を実行する、方法。
10 端末装置、20 サーバ、80 ネットワーク、130 操作受付部、161 ユーザ情報、22 通信IF、23 入出力IF、25 メモリ、26 ストレージ、29 プロセッサ、201 通信部、202 記憶部、2021 帳票項目データベース、2022 入力フォームデータベース、2023 ワークフローデータベース、203 制御部


Claims (20)

  1. プロセッサと、メモリとを備えるコンピュータに実行させ、テキスト情報を管理するためのプログラムであって、
    前記プログラムは、前記プロセッサに、
    帳票をOCRで読み取るための読取項目の属性情報に基づき、前記帳票に記載されているテキスト情報を読み取るステップと、
    前記読取項目の属性情報に基づき、オンライン経由で前記帳票の読取項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、
    前記入力フォームから、テキスト情報の入力を受け付けるステップと、
    前記入力フォームから受け付けたテキスト情報と、前記帳票から読み取ったテキスト情報とを関連付けて前記メモリに記憶させるステップと、を実行させる、プログラム。
  2. 前記プログラムは、帳票における前記読取項目の位置情報と、前記読取項目の属性情報とに基づき、前記帳票に記載されているテキスト情報を読み取るステップを実行させる、請求項1に記載のプログラム。
  3. 前記プログラムは、前記プロセッサに、さらに、
    前記帳票をOCRで読み取り、前記帳票における前記読取項目の属性情報を取得するステップを実行させる、請求項1または請求項2に記載のプログラム。
  4. 前記メモリは、
    あらかじめ取得された、前記帳票における前記読取項目の属性情報を記憶する、請求項1または請求項2に記載のプログラム。
  5. 前記読取項目の属性情報として、前記読取項目の項目名と、前記読取項目の文字種類とを取得する、請求項3または請求項4に記載のプログラム。
  6. 前記入力フォームを生成するステップにおいて、前記読取項目の項目名を前記入力フォームの入力項目として設定する、請求項5に記載のプログラム。
  7. 前記入力フォームを生成するステップにおいて、前記入力フォームの入力項目に前記読取項目の文字種類のみを入力可能に設定する、請求項5または請求項6に記載のプログラム。
  8. 前記プログラムは、前記プロセッサに、さらに、
    端末装置上で入力された、手書き入力情報の入力を受け付けるステップと、
    前記手書き入力情報からテキスト情報を読み取るステップと、
    前記入力フォームから受け付けたテキスト情報と、前記帳票から読み取ったテキスト情報と、前記手書き入力情報から読み取ったテキスト情報とを関連付けて前記メモリに記憶させるステップと、を実行させる、請求項1から請求項7のいずれか1項に記載のプログラム。
  9. 前記端末装置が備えるタッチパネル装置上をなぞることにより入力された、手書き入力情報の入力を受け付ける、請求項8に記載のプログラム。
  10. 前記プログラムは、前記プロセッサに、さらに、
    構造化されたテキスト情報の送信を受け付けるステップと、
    前記構造化されたテキスト情報を取得するステップと、
    前記入力フォームから受け付けたテキスト情報と、前記帳票から読み取ったテキスト情報と、前記構造化されたテキスト情報とを関連付けて前記メモリに記憶させるステップと、を実行させる、請求項1から請求項9のいずれか1項に記載のプログラム。
  11. 前記プログラムは、前記プロセッサに、さらに、
    前記テキスト情報を同一または関連付けたワークフローで一元管理するステップを実行させる、請求項1から請求項10のいずれか1項に記載のプログラム。
  12. 前記帳票の種類ごとに、前記テキスト情報を前記ワークフローで一元管理する、請求項11に記載のプログラム。
  13. 前記テキスト情報を受け付ける作業工程の情報を前記ワークフローで一元管理する、請求項11または請求項12に記載のプログラム。
  14. 前記テキスト情報を取得した取得元ごとに異なる作業工程の情報を前記ワークフローで一元管理する、請求項13に記載のプログラム。
  15. 前記テキスト情報を受け付ける作業工程の情報及び進捗状況の情報を前記ワークフローで一元管理する、請求項13または請求項14に記載のプログラム。
  16. 前記テキスト情報を受け付けた件数の情報を前記ワークフローで一元管理する、請求項15に記載のプログラム。
  17. 前記プログラムは、前記プロセッサに、さらに、
    前記ワークフローをユーザに提示するステップを実行させる、請求項11から請求項16のいずれか1項に記載のプログラム。
  18. 複数の取得元から取得した前記テキスト情報を同一のデータベースに格納して一元管理する、請求項1から請求項17のいずれか1項に記載のプログラム。
  19. 制御部と、記憶部とを備え、テキスト情報を管理する情報処理装置であって、
    前記制御部は、
    帳票をOCRで読み取るための読取項目の属性情報に基づき、前記帳票に記載されているテキスト情報を読み取るステップと、
    前記読取項目の属性情報に基づき、オンライン経由で前記帳票の読取項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、
    前記入力フォームから、テキスト情報の入力を受け付けるステップと、
    前記入力フォームから受け付けたテキスト情報と、前記帳票から読み取ったテキスト情報とを関連付けて前記記憶部に記憶させるステップと、を実行する、情報処理装置。
  20. プロセッサと、メモリとを備えるコンピュータに実行され、テキスト情報を管理するための方法であって、
    前記方法は、前記プロセッサが、
    帳票をOCRで読み取るための読取項目の属性情報に基づき、前記帳票に記載されているテキスト情報を読み取るステップと、
    前記読取項目の属性情報に基づき、オンライン経由で前記帳票の読取項目に対応するテキスト入力を受け付けるための入力フォームを生成するステップと、
    前記入力フォームから、テキスト情報の入力を受け付けるステップと、
    前記入力フォームから受け付けたテキスト情報と、前記帳票から読み取ったテキスト情報とを関連付けて前記メモリに記憶させるステップと、を実行する、方法。
JP2021094035A 2021-06-04 2021-06-04 プログラム、情報処理装置及び方法 Pending JP2022186026A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021094035A JP2022186026A (ja) 2021-06-04 2021-06-04 プログラム、情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021094035A JP2022186026A (ja) 2021-06-04 2021-06-04 プログラム、情報処理装置及び方法

Publications (1)

Publication Number Publication Date
JP2022186026A true JP2022186026A (ja) 2022-12-15

Family

ID=84441726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021094035A Pending JP2022186026A (ja) 2021-06-04 2021-06-04 プログラム、情報処理装置及び方法

Country Status (1)

Country Link
JP (1) JP2022186026A (ja)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266887A (ja) * 1993-03-15 1994-09-22 Hitachi Ltd フォーマット作成方法およびそれを用いた光学文字読取装置
JPH1011531A (ja) * 1996-06-21 1998-01-16 Mitsubishi Electric Corp 帳票読取装置
JP2001344393A (ja) * 2000-05-31 2001-12-14 Kansai Electric Power Co Inc:The 文書電子化支援システム
JP2002342695A (ja) * 2001-05-17 2002-11-29 Nec Corp 情報入力システムの構築支援装置および構築支援方法
JP2006107319A (ja) * 2004-10-08 2006-04-20 Fujitsu Ltd データエントリ管理方法
JP2007087322A (ja) * 2005-09-26 2007-04-05 Ricoh Co Ltd ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
JP2010033357A (ja) * 2008-07-29 2010-02-12 Fuji Xerox Co Ltd 作業制御プログラム及び作業制御システム
JP2010128904A (ja) * 2008-11-28 2010-06-10 Canon It Solutions Inc 画像処理装置及び方法、並びにプログラム
JP2015187765A (ja) * 2014-03-26 2015-10-29 グローリー株式会社 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP2019191904A (ja) * 2018-04-25 2019-10-31 ニッセイ情報テクノロジー株式会社 業務支援システム、業務支援方法及びプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266887A (ja) * 1993-03-15 1994-09-22 Hitachi Ltd フォーマット作成方法およびそれを用いた光学文字読取装置
JPH1011531A (ja) * 1996-06-21 1998-01-16 Mitsubishi Electric Corp 帳票読取装置
JP2001344393A (ja) * 2000-05-31 2001-12-14 Kansai Electric Power Co Inc:The 文書電子化支援システム
JP2002342695A (ja) * 2001-05-17 2002-11-29 Nec Corp 情報入力システムの構築支援装置および構築支援方法
JP2006107319A (ja) * 2004-10-08 2006-04-20 Fujitsu Ltd データエントリ管理方法
JP2007087322A (ja) * 2005-09-26 2007-04-05 Ricoh Co Ltd ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
JP2010033357A (ja) * 2008-07-29 2010-02-12 Fuji Xerox Co Ltd 作業制御プログラム及び作業制御システム
JP2010128904A (ja) * 2008-11-28 2010-06-10 Canon It Solutions Inc 画像処理装置及び方法、並びにプログラム
JP2015187765A (ja) * 2014-03-26 2015-10-29 グローリー株式会社 帳票フォーマット情報登録方法及びシステム並びにプログラム
JP2019191904A (ja) * 2018-04-25 2019-10-31 ニッセイ情報テクノロジー株式会社 業務支援システム、業務支援方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
""[プレスリリース]民生版「+Focus」提供開始 | 株式会社ミラボ"", [ONLINE], JPN6022010902, 30 October 2020 (2020-10-30), ISSN: 0004877440 *

Similar Documents

Publication Publication Date Title
US9715360B2 (en) Repository-based print services
JP2017215996A (ja) 変更要求フォームの注釈
US10757286B2 (en) Information processing system for performing a series of processes on electronic data
JP5115746B2 (ja) 通信システム、サーバ装置、情報処理方法およびプログラム
US9652445B2 (en) Methods and systems for creating tasks of digitizing electronic document
US11501063B2 (en) Information processing apparatus, recording medium, and information processing system
US20080252934A1 (en) Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP7425771B2 (ja) プログラム、情報処理装置及び方法
TWI688868B (zh) 用於提取訊息並使用所述訊息擷取聯絡人訊息的系統、非暫時性電腦可讀媒體和方法
US20220392006A1 (en) Information processing system, system, and information processing method
US11729331B2 (en) Service providing system to generate duplicated application and transmit it to the electronic device for display on a display, information processing method, and non-transitory recording medium
JP2022186026A (ja) プログラム、情報処理装置及び方法
US20210256863A1 (en) Information processing system, information processing apparatus, and information processing method
JP2018195077A (ja) 文書変換プログラム、文書変換方法および文書変換装置
JP7411137B1 (ja) プログラム、情報処理装置、方法及びシステム
JP7308574B1 (ja) 情報提供システムおよび情報提供方法
US20230297543A1 (en) Data management device, data management system, and recording medium
US20230307100A1 (en) Information processing apparatus, information processing system, and information processing method
JP2023096926A (ja) プログラム、情報処理装置及び方法
TWI220203B (en) Method for mobile device real-time edit and access on-line data
US20230385539A1 (en) Electronic file transmission control apparatus and method
JP2023162584A (ja) プログラム、方法及び情報処理装置
JP2023175186A (ja) プログラム、方法及び情報処理装置
JP2023163384A (ja) プログラム、情報処理装置及び方法
JP2023137077A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210604

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210604

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20210702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220322

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220920