JP2020170273A - 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム - Google Patents

文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム Download PDF

Info

Publication number
JP2020170273A
JP2020170273A JP2019070283A JP2019070283A JP2020170273A JP 2020170273 A JP2020170273 A JP 2020170273A JP 2019070283 A JP2019070283 A JP 2019070283A JP 2019070283 A JP2019070283 A JP 2019070283A JP 2020170273 A JP2020170273 A JP 2020170273A
Authority
JP
Japan
Prior art keywords
image
text data
client device
characters
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019070283A
Other languages
English (en)
Inventor
真之 織田
Masayuki Oda
真之 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019070283A priority Critical patent/JP2020170273A/ja
Publication of JP2020170273A publication Critical patent/JP2020170273A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】光学文字認識により判断された文字を目視して確認する。【解決手段】クライアント装置の第1の制御回路は、文字を含む画像を取得して記憶装置に記憶し、サーバー装置に、画像を送信し、サーバー装置の第2の制御回路は、クライアント装置から、画像を受信し、画像を光学文字認識することにより、画像に含まれる文字を判断し、判断した文字を示すテキストデータを生成し、画像内での文字の位置を示す情報である位置情報を生成し、クライアント装置に、テキストデータ及び位置情報を送信し、クライアント装置の第1の制御回路は、サーバー装置から、テキストデータ及び位置情報を受信し、記憶装置から、画像を読み出し、読み出した画像の位置情報に基づく位置に、テキストデータが示す文字を配置することにより、合成画像を生成する。【選択図】図4

Description

本開示は、文字を含む画像を取得するクライアント装置と、この画像を光学文字認識するサーバー装置とを有する文字認識システムに関する。本開示は、さらに、このクライアント装置が実行する文字認識クライアントプログラムと、このサーバー装置が実行する文字認識サーバープログラムとに関する。
クライアント装置が文字を含む画像を取得し、サーバー装置がこの画像を光学文字認識することにより、この画像に含まれる文字を判断する技術が知られている。
特開2018−151925号公報 特開2015−204015号公報 特開2012−58904号公報
光学文字認識により判断された文字が、画像に実際に含まれる文字に対して正確であるかどうか、ユーザーがクライアント装置に表示された結果を目視して確認することが望ましい。
本開示の一形態に係る文字認識システムは、
第1の制御回路及び記憶装置を有するクライアント装置と、
第2の制御回路を有し、前記クライアント装置と通信可能に接続されたサーバー装置と
を具備し、
前記クライアント装置の前記第1の制御回路は、
文字を含む画像を取得して前記記憶装置に記憶し、
前記サーバー装置に、前記画像を送信し、
前記サーバー装置の前記第2の制御回路は、
前記クライアント装置から、前記画像を受信し、
前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、
前記画像内での前記文字の位置を示す情報である位置情報を生成し、
前記クライアント装置に、前記テキストデータ及び前記位置情報を送信し、
前記クライアント装置の前記第1の制御回路は、
前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、
前記記憶装置から、前記画像を読み出し、
読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する。
(1)本実施形態によれば、サーバー装置は、クライアント装置に、光学文字認識の結果として、テキストデータ及び位置情報を送信する。これにより、例えば、クライアント装置が、画像及び文字を含むウェブページ(HTMLデータ)を、ウェブサーバー装置からダウンロードする場合に比べて、ネットワークトラフィックが削減される。本実施形態によれば、クライアント装置は、記憶装置から読み出した画像の、サーバー装置から受信した位置情報に基づく位置に、サーバー装置から受信したテキストデータが示す文字を配置することにより、合成画像を生成する。典型的に、クライアント装置のCPUやメモリ等の処理能力は、サーバー装置のCPUやメモリ等の処理能力より劣る。しかしながら、本実施形態によれば、クライアント装置は、ローカルの記憶装置から読み出した画像と、受信したテキストデータとを合成して、ユーザーが一目で把握することが容易な合成画像を生成することができる。これにより、サーバー装置が画像(を含む合成画像を表示するためのHTMLデータ)を送信しないことでネットワークトラフィックを削減できると同時に、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置がローカルで生成することができる。
前記クライアント装置の前記第1の制御回路は、
前記画像内の前記位置情報が示す位置に、前記テキストデータが示す前記文字を配置することにより、前記合成画像を生成する。
(2)本実施形態によれば、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置がローカルで生成することができる。
前記クライアント装置の前記第1の制御回路は、
前記画像を仮想的に示す領域内の前記位置情報が示す位置に、前記テキストデータが示す前記文字を配置し、前記文字を配置した前記領域と前記画像とを互いに重畳しないように配置することにより、前記合成画像を生成する。
(3)本実施形態によれば、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置がローカルで生成することができる。
前記クライアント装置は、撮像装置をさらに有するモバイルデバイスであり、
前記クライアント装置の前記第1の制御回路は、
前記撮像装置が撮像した画像を、前記文字を含む前記画像として取得する。
(4)典型的に、モバイルデバイスのCPUやメモリ等の処理能力は比較的低い。しかしながら、本実施形態によれば、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置(モバイルデバイス)がローカルで生成することができる。
前記クライアント装置は、表示装置と、入力装置とをさらに有し、
前記クライアント装置の前記第1の制御回路は、さらに、
前記合成画像を前記表示装置に表示し、
前記入力装置に入力された、前記合成画像に含まれる前記文字を別の文字に置換するための要求を検出すると、
前記サーバー装置に、前記別の文字を示す別のテキストデータを送信し、
前記サーバー装置の前記第2の制御回路は、
前記クライアント装置から、前記別のテキストデータを受信し、
生成した前記テキストデータを、受信した前記別のテキストデータに置換する。
(5)本実施形態によれば、例えば、クライアント装置が、置換すべき文字を入力するためのウェブページ(HTMLデータ)を、ウェブサーバー装置からダウンロードする場合に比べて、ネットワークトラフィックが削減される。
本開示の一形態に係る文字認識クライアントプログラムは、
サーバー装置と通信可能に接続され、記憶装置を有するクライアント装置の第1の制御回路を、
文字を含む画像を取得して前記記憶装置に記憶し、
前記サーバー装置に、前記画像を送信し、
前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、前記画像内での前記文字の位置を示す情報である位置情報を生成し、前記クライアント装置に、前記テキストデータ及び前記位置情報を送信する前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、
前記記憶装置から、前記画像を読み出し、
読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する
よう動作させる。
本開示の一形態に係る文字認識サーバープログラムは、
記憶装置を有するクライアント装置と通信可能に接続されたサーバー装置の第2の制御回路を、
文字を含む画像を取得して前記記憶装置に記憶し、前記サーバー装置に、前記画像を送信する前記クライアント装置から、前記画像を受信し、
前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、
前記画像内での前記文字の位置を示す情報である位置情報を生成し、
前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、前記記憶装置から、前記画像を読み出し、読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する前記クライアント装置に、前記テキストデータ及び前記位置情報を送信する
よう動作させる。
本開示によれば、光学文字認識により判断された文字が、画像に実際に含まれる文字に対して正確であるかどうか、ユーザーがクライアント装置に表示された結果を目視して確認することができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示の一実施形態に係る文字認識システムを示す。 クライアント装置のハードウェア構成を示す。 サーバー装置のハードウェア構成を示す。 文字認識システムの機能的構成を示す。 クライアント装置の動作フローを示す。 サーバー装置の動作フローを示す。 クライアント装置が生成及び表示する合成画像の一例を模式的に示す。 クライアント装置が生成及び表示する合成画像の別の例を模式的に示す。
以下、図面を参照しながら、本開示の実施形態を説明する。
1.文字認識システム
図1は、本開示の一実施形態に係る文字認識システムを示す。
文字認識システム1は、クライアント装置10と、サーバー装置20とを有する。クライアント装置10と、サーバー装置20とは、インターネット等のネットワークNを介して通信可能に接続される。
クライアント装置10は、撮像装置(カメラ)を有する。クライアント装置10は、例えば、ノート型パーソナルコンピューター、タブレットコンピューター、スマートフォン等のモバイルデバイスある。クライアント装置10は、撮像装置を用いて文字が記載された原稿を撮影し、文字を含む画像を取得する。原稿に記載された文字は、タイプされた文字でもよいし、手書きの文字でもよい。クライアント装置10は、サーバー装置20に、文字を含む画像を送信する。
サーバー装置20は、クライアント装置10から、文字を含む画像を受信する。サーバー装置20は、画像を光学文字認識(OCR)することにより、画像に含まれる文字を判断する。サーバー装置20は、クライアント装置10に、光学文字認識の結果を送信する。
サーバー装置20は、さらに、電子的なワークフローシステムを提供するワークフローサーバーとしての機能も有する。サーバー装置20は、光学文字認識の結果等を、ワークフローシステムにアップロードする。
2.クライアント装置のハードウェア構成
図2は、クライアント装置のハードウェア構成を示す。
クライアント装置10は、CPU11(Central Processing Unit)、ROM12(Read Only Memory)、RAM13(Random Access Memory)、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量の不揮発性の記憶装置14、ネットワーク通信インターフェース15、操作装置16、表示装置17及び撮像装置19(カメラ)と、これらを相互に接続するバス18とを有する。
CPU11、ROM12、及びRAM13は、制御回路100を構成する。CPU11は、ROM12が記憶する情報処理プログラムをRAM13にロードして実行する。ROM12は、CPU11が実行するプログラムやデータなどを固定的に記憶する。ROM12は、非一過性のコンピューター読み取り可能な記録媒体の一例である。
3.サーバー装置のハードウェア構成
図3は、サーバー装置のハードウェア構成を示す。
サーバー装置20は、CPU21、ROM22、RAM23、HDDやSSD等の大容量の不揮発性の記憶装置24、ネットワーク通信インターフェース25、操作装置26及び表示装置27と、これらを相互に接続するバス28とを有する。
CPU21、ROM22、及びRAM23は、制御回路200を構成する。CPU21は、ROM22が記憶する情報処理プログラムをRAM23にロードして実行する。ROM22は、CPU21が実行するプログラムやデータなどを固定的に記憶する。ROM22は、非一過性のコンピューター読み取り可能な記録媒体の一例である。
4.文字認識システムの機能的構成
図4は、文字認識システムの機能的構成を示す。
クライアント装置10の制御回路100(第1の制御回路)において、CPU11は、ROM12が記憶する情報処理プログラム(文字認識クライアントプログラム)をRAM13にロードして実行することにより、ワークフロー判断部101、画像取得部102、画像供給部103、テキストデータ取得部104、合成画像生成部105及び確認結果供給部106として動作する。
サーバー装置20の制御回路200(第2の制御回路)において、CPU21は、ROM22が記憶する情報処理プログラム(文字認識サーバープログラム)をRAM23にロードして実行することにより、画像取得部201、光学文字認識部202、位置判断部203、テキストデータ供給部204、確認結果取得部205及びワークフロー連携部206として動作する。
5.文字認識システムの動作フロー
図5は、クライアント装置の動作フローを示す。
動作の前提として、ユーザーは、操作装置16を操作することにより、撮像装置19により撮像した画像のアップロード先となるワークフローを選択する。このワークフローは、サーバー装置20が提供する電子的なワークフローシステムに含まれる。また、撮像装置19(カメラ)は、文字が記載された原稿を撮影する。「文字が記載された原稿」は、典型的には、帳票等の、固定的なテンプレート部分と、可変的な文字(数字を含む)を含む原稿である。
クライアント装置10のワークフロー判断部101は、選択されたワークフローを判断する(ステップS101)。
クライアント装置10の画像取得部102は、撮像装置19(カメラ)が撮影した、文字を含む画像を取得する。画像取得部102は、ワークフロー判断部101が判断したワークフローを識別するワークフロー識別子111と、画像112と、画像112を識別する画像識別子113とを、互いに関連付けて、記憶装置14に記憶する(ステップS102)。
クライアント装置10の画像供給部103は、記憶装置14に互いに関連付けて記憶された、画像112と、画像識別子113と、ワークフロー識別子111とを、サーバー装置20に送信する(ステップS103)。
図6は、サーバー装置の動作フローを示す。
サーバー装置20の画像取得部201は、クライアント装置10から、画像112と、画像識別子113と、ワークフロー識別子111とを受信する。画像取得部201は、受信した画像112と、画像識別子113と、ワークフロー識別子111とを、互いに関連付けて記憶装置24に記憶する(ステップS201)。
サーバー装置20の光学文字認識部202は、画像112を光学文字認識することにより、画像に含まれる文字を判断し、判断した文字を示すテキストデータを生成する。光学文字認識部202は、生成したテキストデータ121を、画像識別子113に関連付けて記憶装置24に記憶する(ステップS202)。
なお、画像112がテンプレート部分を含む場合(帳票等)、光学文字認識部202は、テンプレートにより区画される可変的な文字部分(1又は複数)を個々に光学文字認識すればよい。区画された文字部分が複数ある場合、光学文字認識部202は、複数のテキストデータ121を生成すればよい。一方、画像112がテンプレート部分を含まない場合、光学文字認識部202は、画像112全体を光学文字認識すればよい。この場合、光学文字認識部202は、1又は複数のテキストデータ121を生成すればよい。
サーバー装置20の位置判断部203は、テキストデータ121の位置情報を生成する。位置判断部203は、テキストデータ121が複数ある場合は、複数のテキストデータ121それぞれの位置情報を生成する。位置判断部203は、生成した位置情報122を、テキストデータ121に関連付けて記憶装置24に記憶する(ステップS203)。
位置情報122は、画像112内での文字(テキストデータ121が示す文字)の位置を示す情報である。画像112がテンプレート部分を含む場合(帳票等)、位置情報122は、例えば、テンプレートにより区画される可変的な文字部分(1又は複数)の位置(画像112内での座標)を識別する位置情報でよい。一方、画像112がテンプレート部分を含まない場合、位置情報122は、例えば、画像112内での位置(座標)及び文字を含む領域のサイズでよい。
サーバー装置20のテキストデータ供給部204は、記憶装置24に互いに関連付けて記憶された、画像識別子113と、テキストデータ121と、位置情報122とを、クライアント装置10に送信する(ステップS204)。
クライアント装置10のテキストデータ取得部104は、サーバー装置20から、画像識別子113と、テキストデータ121と、位置情報122とを受信する(ステップS104)。
クライアント装置10の合成画像生成部105は、受信した画像識別子113に関連付けて記憶された画像112を、記憶装置14から読み出す(ステップS105)。合成画像生成部105は、サーバー装置20から受信した位置情報122に基づいて、記憶装置14から読み出した画像112と、サーバー装置20から受信したテキストデータ121とを合成することにより、合成画像を生成する。具体的には、合成画像生成部105は、読み出した画像112の位置情報122に応じた位置に、テキストデータ121が示す文字を配置することにより、合成画像を生成する。合成画像生成部105は、生成した合成画像を、表示装置17に表示する(ステップS106)。
図7は、クライアント装置が生成及び表示する合成画像の一例を模式的に示す。
クライアント装置10の表示装置17は、合成画像I1を表示する。合成画像I1は、画像112内の位置情報122が示す位置に、テキストデータ121が示す文字を配置したものである。要するに、合成画像I1は、テキストデータ121が示す文字を、画像112内に(画像112に重畳して)、配置したものである。
図8は、クライアント装置が生成及び表示する合成画像の別の例を模式的に示す。
クライアント装置10の表示装置17は、合成画像I2を表示する。合成画像I2は、テキストデータ121が示す文字を配置した領域123と、画像112とを、互いに重畳しないように配置したものである。領域123は、画像112を仮想的に示す。テキストデータ121が示す文字は、領域123内の位置情報122が示す位置に配置される。要するに、合成画像I2は、テキストデータ121が示す文字を、画像の112内での実際の位置関係に対応するように、仮想的に配置したものである。
ユーザーは、クライアント装置10の表示装置17に表示(ステップS106)された合成画像I1又はI2を目視する。ユーザーは、合成画像I1又はI2に含まれるテキストデータ121が示す文字が正確かどうかを、目視により確認する。例えば、ユーザーは、合成画像I1(図7)に含まれるテキストデータ121が示す文字と、原稿そのものに記載された文字とを見比べる。あるいは、ユーザーは、合成画像I2(図8)に含まれる、テキストデータ121が示す文字と、画像112に含まれる文字とを見比べる。ユーザーは、テキストデータ121が示す文字が正確か、あるいは、別の文字に置換するかを、操作装置16を操作することによりクライアント装置10に入力する。後者の場合、例えば、ユーザーは、操作装置16(物理的キーボード又はソフトウェアキーボード)を用いて、置換すべき別の文字を入力すればよい。
クライアント装置10の確認結果供給部106は、テキストデータ121が示す文字が正確か、あるいは、別の文字に置換するか、の何れがユーザーより操作装置16を介して入力されたか判断する(ステップS107)。
確認結果供給部106は、テキストデータ121が示す文字が正確であることを示す確認結果が入力されたと判断すると(ステップS107、NO)、サーバー装置20に、テキストデータ121が示す文字が正確であることを示す確認結果と、画像識別子113とを送信する(ステップS108)。
一方、確認結果供給部106は、操作装置16に入力された、テキストデータ121が示す文字を別の文字に置換するための要求を検出すると(ステップS107、YES)、サーバー装置20に、確認結果として、別の文字(置換すべき文字)を示す別のテキストデータと、画像識別子113とを送信する(ステップS109)。
サーバー装置20の確認結果取得部205は、クライアント装置10から、確認結果を受信する(ステップS205)。
サーバー装置20の確認結果取得部205は、テキストデータ121が示す文字が正確であることを示す確認結果と、画像識別子113とを受信する(ステップS206、NO)。
サーバー装置20のワークフロー連携部206は、受信した画像識別子113に関連付けられたテキストデータ121を、記憶装置24から読み出す(ステップS207)。ワークフロー連携部206は、さらに、受信した画像識別子113に関連付けられた画像112及び位置情報122を、記憶装置24から読み出す(ステップS208)。ワークフロー連携部206は、受信した画像識別子113に関連付けられたワークフロー識別子111を、記憶装置24から読み出す。ワークフロー連携部206は、読み出したテキストデータ121と、画像112と、位置情報122と、ワークフロー識別子111とを互いに関連付けて、ワークフローシステムにアップロードする(ステップS209)。
一方、サーバー装置20の確認結果取得部205は、別の文字(置換すべき文字)を示す別のテキストデータと、画像識別子113とを受信する(ステップS206、YES)。
サーバー装置20のワークフロー連携部206は、受信した画像識別子113に関連付けられた画像112及び位置情報122を、記憶装置24から読み出す(ステップS208)。ワークフロー連携部206は、受信した画像識別子113に関連付けられたワークフロー識別子111を、記憶装置24から読み出す。ワークフロー連携部206は、受信した別のテキストデータと、読み出した画像112、位置情報122及びワークフロー識別子111とを互いに関連付けて、ワークフローシステムにアップロードする(ステップS209)。
6.結語
サーバー装置が、クライアント装置から文字を含む画像を受信し、画像を光学文字認識(OCR)することにより、画像に含まれる文字を判断する技術がある。この技術においては、光学文字認識により判断された文字が、画像に実際に含まれる文字(原稿に実際に記載された文字)に対して正確であるかどうか、クライアント装置に表示された光学文字認識の結果を、ユーザーが目視して確認することが望ましい。さらに、光学文字認識の結果が不正確とユーザーが判断した場合、クライアント装置からサーバー装置に、正確な文字を供給する必要がある。
例えば、以下の方法が考えられる。サーバー装置はウェブサーバーであり、クライアント装置はウェブアプリケーションを実行する。サーバー装置は、画像及び光学文字認識により判断した文字を合成した合成画像を表示するためのウェブページ(HTMLデータ)を生成する。クライアント装置は、画像及び文字を合成した合成画像を表示するためのウェブページ(HTMLデータ)を、サーバー装置からダウンロードし、表示装置に表示する。また、光学文字認識の結果が不正確とユーザーが判断した場合、クライアント装置は、置換すべき文字を入力するためのウェブページ(HTMLデータ)を、サーバー装置からダウンロードし、表示装置に表示する。この方法では、クライアント装置がウェブページ(HTMLデータ)をサーバー装置からダウンロードするためのネットワークトラフィックを要する。
(1)これに対して、本実施形態によれば、サーバー装置20は、クライアント装置10に、画像112の光学文字認識の結果として、テキストデータ121及び位置情報122を送信する(ステップS204)。これにより、例えば、クライアント装置が、画像及び文字を含むウェブページ(HTMLデータ)を、ウェブサーバー装置からダウンロードする場合に比べて、ネットワークトラフィックが削減される。本実施形態によれば、クライアント装置10は、記憶装置14から読み出した画像112の、サーバー装置20から受信した位置情報122に基づく位置に、サーバー装置20から受信したテキストデータ121が示す文字を配置することにより、合成画像112を生成する(ステップS104乃至S106)。典型的に、クライアント装置10のCPUやメモリ等の処理能力は、サーバー装置20のCPUやメモリ等の処理能力より劣る。しかしながら、本実施形態によれば、クライアント装置10は、ローカルの記憶装置14から読み出した画像112と、受信したテキストデータ121とを合成して、ユーザーが一目で把握することが容易な合成画像を生成することができる。これにより、サーバー装置20が画像112(を含む合成画像を表示するためのHTMLデータ)を送信しないことでネットワークトラフィックを削減できると同時に、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置10がローカルで生成することができる。
(2)本実施形態によれば、クライアント装置10は、画像112内の位置情報122が示す位置に、テキストデータ121が示す文字を配置することにより、合成画像I1(図7)を生成する(ステップS106)。これにより、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置10がローカルで生成することができる。
(3)本実施形態によれば、クライアント装置10は、画像112を仮想的に示す領域123内の位置情報122が示す位置に、テキストデータ121が示す文字を配置し、文字を配置した領域123と画像112とを互いに重畳しないように配置することにより、合成画像I2(図8)を生成する(ステップS106)。これにより、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置10がローカルで生成することができる。
(4)本実施形態によれば、クライアント装置10は、撮像装置19をさらに有するモバイルデバイスである。典型的に、モバイルデバイスのCPUやメモリ等の処理能力は比較的低い。しかしながら、本実施形態によれば、ウェブアプリケーションで表示するような視認性の高い合成画像と同等の合成画像を、クライアント装置10(モバイルデバイス)がローカルで生成することができる。
(5)本実施形態によれば、クライアント装置10は、合成画像112に含まれる文字を別の文字に置換する場合、サーバー装置20に、別の文字(置換すべき文字)を示す別のテキストデータ121を送信する(ステップS109)。これにより、例えば、クライアント装置が、置換すべき文字を入力するためのウェブページ(HTMLデータ)を、ウェブサーバー装置からダウンロードする場合に比べて、ネットワークトラフィックが削減される。
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
文字認識システム1
クライアント装置10
サーバー装置20
ワークフロー判断部101
画像取得部102
画像供給部103
テキストデータ取得部104
合成画像生成部105
確認結果供給部106
画像取得部201
光学文字認識部202
位置判断部203
テキストデータ供給部204
確認結果取得部205
ワークフロー連携部206

Claims (7)

  1. 第1の制御回路及び記憶装置を有するクライアント装置と、
    第2の制御回路を有し、前記クライアント装置と通信可能に接続されたサーバー装置と
    を具備し、
    前記クライアント装置の前記第1の制御回路は、
    文字を含む画像を取得して前記記憶装置に記憶し、
    前記サーバー装置に、前記画像を送信し、
    前記サーバー装置の前記第2の制御回路は、
    前記クライアント装置から、前記画像を受信し、
    前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、
    前記画像内での前記文字の位置を示す情報である位置情報を生成し、
    前記クライアント装置に、前記テキストデータ及び前記位置情報を送信し、
    前記クライアント装置の前記第1の制御回路は、
    前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、
    前記記憶装置から、前記画像を読み出し、
    読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する
    文字認識システム。
  2. 請求項1に記載の文字認識システムであって、
    前記クライアント装置の前記第1の制御回路は、
    前記画像内の前記位置情報が示す位置に、前記テキストデータが示す前記文字を配置することにより、前記合成画像を生成する
    文字認識システム。
  3. 請求項1に記載の文字認識システムであって、
    前記クライアント装置の前記第1の制御回路は、
    前記画像を仮想的に示す領域内の前記位置情報が示す位置に、前記テキストデータが示す前記文字を配置し、前記文字を配置した前記領域と前記画像とを互いに重畳しないように配置することにより、前記合成画像を生成する
    文字認識システム。
  4. 請求項1乃至3の何れか一項に記載の文字認識システムであって、
    前記クライアント装置は、撮像装置をさらに有するモバイルデバイスであり、
    前記クライアント装置の前記第1の制御回路は、
    前記撮像装置が撮像した画像を、前記文字を含む前記画像として取得する
    文字認識システム。
  5. 請求項1乃至4の何れか一項に記載の文字認識システムであって、
    前記クライアント装置は、表示装置と、入力装置とをさらに有し、
    前記クライアント装置の前記第1の制御回路は、さらに、
    前記合成画像を前記表示装置に表示し、
    前記入力装置に入力された、前記合成画像に含まれる前記文字を別の文字に置換するための要求を検出すると、
    前記サーバー装置に、前記別の文字を示す別のテキストデータを送信し、
    前記サーバー装置の前記第2の制御回路は、
    前記クライアント装置から、前記別のテキストデータを受信し、
    生成した前記テキストデータを、受信した前記別のテキストデータに置換する
    文字認識システム。
  6. サーバー装置と通信可能に接続され、記憶装置を有するクライアント装置の第1の制御回路を、
    文字を含む画像を取得して前記記憶装置に記憶し、
    前記サーバー装置に、前記画像を送信し、
    前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、前記画像内での前記文字の位置を示す情報である位置情報を生成し、前記クライアント装置に、前記テキストデータ及び前記位置情報を送信する前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、
    前記記憶装置から、前記画像を読み出し、
    読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する
    よう動作させる
    文字認識クライアントプログラム。
  7. 記憶装置を有するクライアント装置と通信可能に接続されたサーバー装置の第2の制御回路を、
    文字を含む画像を取得して前記記憶装置に記憶し、前記サーバー装置に、前記画像を送信する前記クライアント装置から、前記画像を受信し、
    前記画像を光学文字認識することにより、前記画像に含まれる前記文字を判断し、判断した前記文字を示すテキストデータを生成し、
    前記画像内での前記文字の位置を示す情報である位置情報を生成し、
    前記サーバー装置から、前記テキストデータ及び前記位置情報を受信し、前記記憶装置から、前記画像を読み出し、読み出した前記画像の前記位置情報に基づく位置に、前記テキストデータが示す前記文字を配置することにより、合成画像を生成する前記クライアント装置に、前記テキストデータ及び前記位置情報を送信する
    よう動作させる
    文字認識サーバープログラム。
JP2019070283A 2019-04-02 2019-04-02 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム Pending JP2020170273A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019070283A JP2020170273A (ja) 2019-04-02 2019-04-02 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019070283A JP2020170273A (ja) 2019-04-02 2019-04-02 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム

Publications (1)

Publication Number Publication Date
JP2020170273A true JP2020170273A (ja) 2020-10-15

Family

ID=72745965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019070283A Pending JP2020170273A (ja) 2019-04-02 2019-04-02 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム

Country Status (1)

Country Link
JP (1) JP2020170273A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022075097A1 (ja) 2020-10-08 2022-04-14 株式会社ブリヂストン 防振装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022075097A1 (ja) 2020-10-08 2022-04-14 株式会社ブリヂストン 防振装置

Similar Documents

Publication Publication Date Title
KR101137041B1 (ko) 문서 제어를 위한 컴퓨터 구현 방법, 문서 제어 시스템 및 컴퓨터 판독 가능한 저장 매체
JP2018037087A (ja) 手書き装置の文書の入力領域に用いる方法およびシステム
US9207808B2 (en) Image processing apparatus, image processing method and storage medium
CN104168417A (zh) 图片处理方法及装置
JP2016143182A (ja) 情報処理装置、プログラム
US10084936B2 (en) Display system including an image forming apparatus and a display apparatus
CN105931008A (zh) 将认证并入审查及批准过程的方法、系统及多功能打印机
JP5244386B2 (ja) 電子ペンでのデータ管理
JP2008505387A5 (ja)
JP2013255014A (ja) 画像処理システム、撮像装置、およびサーバ装置
US20070246539A1 (en) Data Processing in an Electric Pen
JP5791219B1 (ja) インスタントメッセージ送受信プログラム、情報処理方法及び情報処理装置
JP2015143899A (ja) 情報処理装置、情報隠蔽方法及び情報隠蔽プログラム
JP2020170273A (ja) 文字認識システム、文字認識サーバープログラム及び文字認識クライアントプログラム
JP2017151913A (ja) Pdfファイル管理システム、pdfファイル管理サーバ、pdfファイルデータ取得サーバ、pdfファイル管理方法、pdfファイルデータ取得方法、pdfファイル管理プログラム、およびpdfファイルデータ取得プログラム
JP4955596B2 (ja) 画像出力方法、装置およびプログラム
CN110136233B (zh) 一种生成美甲效果图的方法、终端以及存储介质
JP2019008728A (ja) 文書管理システムおよび文書管理装置
JP6168872B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2020115327A (ja) 拡張現実の文書編集
JP2016081426A (ja) 文書処理装置、その制御方法、およびプログラム
JP2007282100A (ja) 画像処理システムおよび画像処理方法
US11687312B2 (en) Display apparatus, data sharing system, and display control method
KR20140113242A (ko) 이동 장치의 애플리케이션을 집중 모드로 변환하는 방법
US11675496B2 (en) Apparatus, display system, and display control method