JP2016177364A - 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造 - Google Patents

情報処理装置、および紙媒体への撮像で得られるデータのデータ構造 Download PDF

Info

Publication number
JP2016177364A
JP2016177364A JP2015055251A JP2015055251A JP2016177364A JP 2016177364 A JP2016177364 A JP 2016177364A JP 2015055251 A JP2015055251 A JP 2015055251A JP 2015055251 A JP2015055251 A JP 2015055251A JP 2016177364 A JP2016177364 A JP 2016177364A
Authority
JP
Japan
Prior art keywords
unit
image data
document
text data
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015055251A
Other languages
English (en)
Other versions
JP6390480B2 (ja
Inventor
誠 大角
Makoto Osumi
誠 大角
良樹 吉岡
Yoshiki Yoshioka
良樹 吉岡
柳楽 二郎
Jiro Nagira
二郎 柳楽
田中 義久
Yoshihisa Tanaka
義久 田中
義幸 藤原
Yoshiyuki Fujiwara
義幸 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2015055251A priority Critical patent/JP6390480B2/ja
Publication of JP2016177364A publication Critical patent/JP2016177364A/ja
Application granted granted Critical
Publication of JP6390480B2 publication Critical patent/JP6390480B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】複数の原稿が綴じられてなる冊子を電子化するとともに、そのデータについて従来よりも多様な閲覧形式を提供する。【解決手段】情報処理装置は、撮像部と、撮像部から、複数の原稿が綴じられてなる冊子がめくられる様子を示す動画像データを得る動画像データ取得部と、動画像データを構成する静止画像データに対してOCR処理を行い、複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部と、同一冊子に対するテキストデータと動画像データとを関連付けて記憶する記憶部と、を備える。【選択図】図5

Description

本発明は、情報処理装置、および紙媒体への撮像で得られるデータのデータ構造に関し、特に、複数の原稿が綴じられてなる冊子からテキストデータを抽出する技術に関する。
近年、PC(Personal Computer)やスマートフォン等の情報処理装置の普及に伴い、原稿等の紙媒体に記載された内容の電子化(データ化)が広く行われている。
特許文献1には、紙媒体をカメラ(撮像部)で撮像して静止画像データ化することで、紙媒体に記載された内容の電子化を行う技術が開示されている。また、特許文献1では、得られた静止画像データに対してOCR(Optical Character Recognition)処理を行うことで、紙媒体に含まれる文字を示すテキストデータを抽出している。これにより、紙媒体に記載された内容を検索したり分析することが可能となる。
特開2003−60894号公報
しかしながら、上記の特許文献1が開示する技術では、紙媒体に記載された内容を、静止画像データやテキストデータ等の静止データとして電子化するものであり、データの閲覧形式に限りがある。例えば、複数の原稿が綴じられてなる冊子を閲覧する場合、紙媒体に記載された内容だけでなく冊子をめくる様子等を閲覧したいときがある。
本発明は、上記の事情に鑑みなされたものであり、複数の原稿が綴じられてなる冊子を電子化するとともに、そのデータについて従来よりも多様な閲覧形式を提供することを可能にすることを目的とする。
本発明の一局面にかかる情報処理装置は、撮像部と、前記撮像部から、複数の原稿が綴じられてなる冊子がめくられる様子を示す動画像データを得る動画像データ取得部と、前記動画像データを構成する静止画像データに対してOCR処理を行い、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部と、前記撮像部が撮像する原稿が次のページの原稿に変わったか否かを、前記冊子に対するめくり動作を検出することで判定する原稿判定部と、を備え、前記テキストデータ取得部は、前記原稿判定部により前記撮像部が撮像する原稿が次のページの原稿に変わったものと判定された場合に前記OCR処理を実行する情報処理装置である。
また、本発明の別の一局面にかかるデータ構造は、紙媒体への撮像で得られるデータのデータ構造であって、撮像部を有する情報処理装置により撮像された、複数の原稿が綴じられてなる冊子がめくられる様子を示す動画像データと、前記動画像データを構成する静止画像データに対してOCR処理をすることで得られる、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータと、同一の前記冊子に対する前記動画像データと前記テキストデータとを関連付ける関連付け情報と、を具備するデータ構造である。
本発明によれば、冊子に記載された内容を、静止画像データやテキストデータ等の静止データのみで電子化するのではなく、静止データに加えて、冊子を構成する各原稿および冊子がめくられる様子を含む動画像データで電子化している。これにより、電子化したデータについて従来よりも多様な閲覧形式を提供することができる。
(A)および(B)は、本発明の一実施形態にかかる情報処理装置を示す図であり、(A)は、情報処理装置の表面側を示し、(B)は、情報処理装置の裏面側を示す。 本発明の一実施形態にかかる情報処理装置の使用態様を示す図である。 本発明の一実施形態にかかる情報処理装置の内部構成を示すブロック図である。 (A)および(B)は、本発明の一実施形態にかかる情報処理装置の記憶部が記憶するデータのデータ構造を示す図である。 本発明の一実施形態にかかる情報処理装置の電子化処理における動作の流れを示すフローチャートである。 本発明の一実施形態にかかる情報処理装置の書籍データの閲覧処理における動作の流れを示すフローチャートである。 本発明の一実施形態にかかる情報処理装置の表示部に表示される操作画面の一例を示す図である。 (A)および(B)は、本発明の一実施形態にかかる情報処理装置の表示部に表示される閲覧画面の一例を示す図である。 本発明の一実施形態にかかる情報処理装置のテキストデータの修正処理における動作の流れを示すフローチャートである。 (A)は、本発明の一実施形態にかかる情報処理装置の表示部に表示される確認画面の一例を示す図であり、(B)は、表示部に表示される修正画面の一例を示す図である。 変形例にかかる情報処理装置の電子化処理における動作の流れを示すフローチャートである。 変形例にかかる情報処理装置の使用態様を示す図である。
以下、本発明の一実施形態にかかる情報処理装置、および紙媒体への撮像で得られるデータのデータ構造について図面を参照して説明する。
図1(A)および図1(B)は、本発明の一実施形態にかかる情報処理装置1を示す図であり、図1(A)は、情報処理装置1の表面側を示し、図1(B)は、情報処理装置1の裏面側を示す。
情報処理装置1は、PC、タブレット端末、デジタルカメラ、スマートフォン等の撮像手段を有する情報処理装置である。図1(A)および図1(B)に示す例では、情報処理装置1がスマートフォンである場合を示している。
情報処理装置1は、外郭を構成する筐体10、筐体10内に収容された表示部20、タッチパネル30、物理キー40、スピーカー部50、マイク部51、カメラ部60、および発光部70等を備えている。
表示部20は、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(OLED:Organic Light-Emitting Diode)ディスプレイであって、筐体10内の表面側に配設される。表示部20は、後述する表示制御部102(図3参照)による制御の下、ユーザー操作を受け付けるための操作画面や、カメラ部60が撮像した動画像データや静止画像データ等を表示する。
タッチパネル30は、例えば、マルチタッチを検出可能な静電容量方式のタッチパネルであって、表示部20の表示画面部分の前面に配設される。タッチパネル30は、表示部20の表示画面上におけるユーザーによる接触を接触位置とともに検知する。タッチパネル30は、ユーザーによる接触を検知すると、その接触位置を示す検知信号を後述する受付部103(図3参照)等に出力する。
物理キー40は、筐体10内の表面側に配設され、上記のタッチパネル30とともに、ユーザーによる操作を受け付ける操作部として機能する。図1(A)および図1(B)に示す例では、物理キー40がホーム画面に戻るためのホームボタンである場合を示しているが、他に操作画面を構成するGUIのフォーカスを移動させる矢印キー、操作画面を構成するGUIに対して確定操作を行う決定キー、文字入力を行うための文字入力キー、数値入力を行うための数値入力キー等を備えてもよい。
スピーカー部50は、筐体10内の表面側に配設され、後述する報知制御部109(図3参照)による制御の下、着信音や警告音等の音声を出力する。
マイク部51は、筐体10内の表面側に配設され、情報処理装置1の外部で発生した音声を集音する。
カメラ部60(撮像部)は、被写体からの光を結像する撮像レンズ(不図示)、当該撮像レンズよって結像された被写体像を光電変換する撮像素子(不図示)、および撮像素子を駆動する回路(不図示)等を備える。カメラ部60は、筐体10内の裏面側に配設され、被写体の動画像や静止画像を撮像する。撮像中において表示部20には、カメラ部60が向けられた被写体を示す画像が表示される。このためユーザーは、被写体の様子を確認しながら撮像を行うことができる。
発光部70は、LED(Light-Emitting Diode)等の発光素子を備える。発光部70は、カメラ部60の上部に配設され、カメラ部60が被写体を撮像する際にフラッシュ光を被写体に向けて出射する。
図2は、情報処理装置1の使用態様を示す図である。情報処理装置1は、動作モードとして、通話を行うための通話モードや撮像を行うための撮像モードに加えて、紙媒体に記載された内容の電子化を行う電子化モードを有する。当該電子化モードにおいて、情報処理装置1は、原稿等の紙媒体をカメラ部60で撮像することで、紙媒体に記載された内容を電子化する。図2に示す例では、複数の原稿が綴じられてなる冊子Hが電子化の対象とされている。詳細は後述するが、ユーザーは、まず、電子化したい最初のページである原稿P1にカメラ部60を向け、原稿P1の撮像を行う。原稿P1の撮像後、ユーザーは、原稿P1の次のページである原稿P2にカメラ部60を向け、原稿P2の撮像を行う。原稿P1および原稿P2の撮像後、ユーザーは、冊子Hをめくり原稿P2以降のページの原稿の撮像も行う。こうすることで、冊子Hを構成する各原稿が撮像され、冊子Hの電子化が完了する。
続いて、情報処理装置1の内部構成を説明する。図3は、情報処理装置1の内部構成を示すブロック図である。なお、既に説明した構成については、その説明を簡略または省略する。
通信部80は、無線LANボード等の通信モジュールから構成されるネットワークインターフェイスである。
記憶部90は、HDD(Hard Disk Drive)等の大容量の記憶装置である。
制御ユニット100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等から構成される。制御ユニット100は、上記のROMまたは記憶部90等に記憶された制御プログラムが上記のCPUに実行されることにより、制御部101、表示制御部102、受付部103、撮像制御部104、動画像データ取得部105、テキストデータ取得部106、原稿判定部107、記憶制御部108、および報知制御部109として機能する。なお、制御ユニット100の上記の各構成は、前述の制御プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。
制御部101は、情報処理装置1の全体的な動作制御を司る。制御部101は、表示部20、タッチパネル30、物理キー40、スピーカー部50、マイク部51、カメラ部60、発光部70、通信部80、および記憶部90等と接続されており、接続されている上記各機構の動作制御や、各機構との間での信号又はデータの送受信を行う。
表示制御部102は、表示部20による表示動作を制御する機能を有する。
受付部103は、タッチパネル30や物理キー40等を用いて入力されたユーザー操作に応じた指示を受け付ける機能を有する。
撮像制御部104は、カメラ部60による撮像動作を制御する機能を有する。撮像制御部104は、カメラ部60の撮像レンズ(不図示)を移動させることで焦点距離を変化させる光学ズームにより、カメラ部60のズーム倍率を調整する。
動画像データ取得部105は、カメラ部60から出力されたアナログ信号をデジタル信号に変換しノイズ除去等の処理に基づく補正を行うことで、動画像データを得る機能を有する。情報処理装置1が図2に示す使用態様で用いられた場合、動画像データ取得部105は、冊子を構成する各原稿および冊子がめくられる様子を含む動画像データを得る。
冊子の撮像中、動画像データ取得部105が得た動画像データは、表示制御部102による制御の下、直ちに表示部20に表示される。また、受付部103が冊子の電子化終了指示を受け付けた場合、受付部103が冊子の電子化開始指示を受け付けてから冊子の電子化終了指示を受け付けるまでの間に動画像データ取得部105が得た動画像データが、後述する記憶制御部108による制御の下、記憶部90に記憶される。なお、動画像データ取得部105は、マイク部51から出力される音声信号に基づく音声データを動画像データに含めない。すなわち、記憶部90に記憶される動画像データは、無音の動画像データとなる。
テキストデータ取得部106は、動画像データ取得部105が取得した動画像データを構成する静止画像データに対してOCR処理を行い、冊子を構成する各原稿に含まれる文字を示すテキストデータを取得する機能を有する。
テキストデータ取得部106は、まず、受付部103が冊子の電子化開始指示を受け付けた時点でカメラ部60が撮像している原稿(図2における原稿P1)を示す動画像データの中から、OCR処理対象の静止画像データを1つ抽出する。そして、テキストデータ取得部106は、当該抽出した静止画像データに対してOCR処理を行い、テキストデータを取得する。初回のOCR処理以降については、テキストデータ取得部106は、カメラ部60が撮像する原稿が次のページの原稿に変わる度に、当該次のページの原稿を示す動画像データからOCR処理対象の静止画像データを1つ抽出する。なお、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かは、後述する原稿判定部107により判定される。
受付部103が冊子の電子化終了指示を受け付けた場合、受付部103が冊子の電子化開始指示を受け付けてから冊子の電子化終了指示を受け付けるまでの間にテキストデータ取得部106が得たテキストデータが、後述する記憶制御部108による制御の下、記憶部90に記憶される。
原稿判定部107は、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定する機能を有する。原稿判定部107は、動画像データ取得部105が得た動画像データを解析して、冊子に対するめくり動作を検出するめくり検出を行うことで、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定する。
めくり検出では、原稿判定部107は、動画像データを解析して、ユーザーの手の位置を検出する。そして、原稿判定部107は、検出した手の動きが予め定められた移動パターンに合致するか否かを判定し、予め定められた移動パターンに合致する場合にめくり動作が行われたことを検出する。なお、めくり検出の手法は、上記で説明したものに限られない。例えば、原稿判定部107は、動画像データを解析して原稿の縁部分を検出しておき、当該原稿の縁部分の予め定められた距離以上の移動を検出した場合に、めくり動作が行われたことを検出してもよい。
右綴じ、左綴じ、上綴じの冊子、すなわち見開き部分を有しない冊子では、原稿判定部107が上記のめくり動作を検出することで、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができる。しかしながら、中綴じの冊子、すなわち見開き部分を有する冊子では、原稿判定部107が上記のめくり動作を検出するだけでは、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができない。そこで、原稿判定部107は、上記のめくり検出に加えて、カメラ部60の視点の移動を検出する視点移動検出を行う。
視点移動検出では、原稿判定部107は、動画像データを解析して、特徴点、例えば中綴じの冊子におけるのど部分を検出する(特徴点検出)。そして、原稿判定部107は、当該特徴点の予め定められた距離以上の移動を検出した場合に、カメラ部60の視点の移動が行われたことを検出する。
原稿判定部107は、上記のめくり検出、または、視点移動検出のどちらか一方が検出された場合に、カメラ部60が撮像する原稿が次のページの原稿に変わったことを検出する。これにより、見開き部分を有する冊子においても、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができる。
受付部103が冊子の電子化終了指示を受け付けた場合、原稿判定部107は、受付部103が冊子の電子化開始指示を受け付けてから冊子の電子化終了指示を受け付けるまでの間にカメラ部60が撮像した動画データにおいて、カメラ部60が撮像する原稿が次のページの原稿に変わったタイミングを示すページ間情報を生成する。当該ページ間情報は、後述する記憶制御部108による制御の下、記憶部90に記憶される。
報知制御部109(報知部)は、スピーカー部50による音声の出力動作を制御する機能を有する。報知制御部109は、例えば、テキストデータ取得部106によるOCR処理が成功した場合に、OCR処理が成功した旨を報知するための予め定められた成功報知音をスピーカー部50に出力させる。これにより、ユーザーは、現在カメラ部60を向けている原稿に対するOCR処理が成功したので、カメラ部60を次のページの原稿に向けるべきであることを知ることができる。なお、テキストデータ取得部106によるOCR処理が成功した場合に、表示制御部102が、OCR処理が成功した旨を報知する報知画面を表示部20に表示させてもよい。この場合、表示制御部102が報知部として機能することになる。
記憶制御部108は、記憶部90によるデータの記憶動作を制御する機能を有する。記憶制御部108による制御により、記憶部90には、カメラ部60による冊子への撮像で得られるデータが記憶される。
図4(A)および図4(B)は、記憶部90が記憶するデータのデータ構造を示す図である。記憶部90には、同一の冊子に対する動画像データ、テキストデータ、およびページ間情報を関連付ける関連付け情報が記憶されている。当該関連付け情報は、同一の冊子に対する動画像データ、テキストデータ、およびページ間情報の組み合わせを示す。当該関連付け情報により、動画像データ、テキストデータ、およびページ間情報が、冊子毎に分けられた書籍データ内に格納された状態で記憶部90に記憶される。図4(A)に示す例では、冊子1〜冊子NのN冊の冊子に対する書籍データが記憶部90に記憶されている。
図4(B)は、冊子1に対する書籍データのデータ構造を示している。冊子1に対する書籍データには、カメラ部60による冊子1への撮像により動画像データ取得部105が得た動画像データ、当該動画像データにおいて前記カメラ部60が撮像する原稿が次のページの原稿に変わるタイミングを示すページ間情報、および、テキストデータ取得部106が得た1ページ目からKページ目までの各テキストデータが格納されている。
このように、情報処理装置1では、冊子等の紙媒体に記載された内容を、静止画像データやテキストデータ等の静止データのみで電子化するのではなく、静止データに加えて、冊子を構成する各原稿および冊子がめくられる様子を含む動画像データで電子化している。これにより、電子化したデータについて従来よりも多様な閲覧形式を提供することができる。また、詳細は後述するが、動画像データを用いてテキストデータを修正することが可能となり、再度冊子を撮像する手間を省くことができる。
続いて、情報処理装置1の具体的な動作の流れについて説明する。図5は、情報処理装置1の電子化処理における動作の流れを示すフローチャートである。
情報処理装置1の受付部103が電子化開始指示を受け付けた場合(ステップS10においてYES)、撮像制御部104は、カメラ部60による撮像を開始させる(ステップS11)。図2に示す例では、表示部20に表示された操作画面D1の開始ボタンd1の押下操作がなされた場合に、受付部103は、電子化開始指示を受け付ける。
ステップS11の処理後、テキストデータ取得部106は、動画像データ取得部105が取得した動画像データの中から、OCR処理対象の静止画像データを1つ抽出する(ステップS12)。そして、テキストデータ取得部106は、抽出した静止画像データに対してOCR処理を実行する(ステップS13)。
OCR処理の実行後、テキストデータ取得部106は、OCR処理が成功したか否かを判定する(ステップS14)。具体的には、テキストデータ取得部106は、静止画像データの解像度が低かったり、ピントが合っていなかったりして、文字認識に失敗する領域が予め定められた範囲以上である場合に、OCR処理に失敗したものと判定する。
OCR処理に失敗した場合(ステップS14においてNO)、ステップS12の処理に戻り、テキストデータ取得部106は、OCR処理対象の静止画像データの抽出を再度実行する。
一方、OCR処理に成功した場合(ステップS14においてYES)、報知制御部109は、OCR処理が成功した旨を報知するための予め定められた成功報知音をスピーカー部50に出力させる(ステップS16)。
ステップS15の処理語、受付部103は、電子化終了指示を受け付けたか否かを判定する(ステップS16)。図2に示す例では、表示部20に表示された操作画面D1の終了ボタンd2の押下操作がなされた場合に、受付部103は、電子化終了指示を受け付ける。
電子化終了指示を受け付けない場合(ステップS16においてNO)、原稿判定部107は、カメラ部60が撮像する原稿が次のページの原稿に変化したか否かを判定する(ステップS17)。
ステップS14の処理後予め定められた時間が経過するまでに、カメラ部60が撮像する原稿が次のページの原稿に変化しない場合(ステップS18においてYES)、報知制御部109は、カメラ部60を次のページの原稿に向けるべき旨を報知するための予め定められた警告音をスピーカー部50に出力させる(ステップS19)。
カメラ部60が撮像する原稿が次のページの原稿に変化した場合(ステップS17においてYES)、ステップS12の処理に戻り、次のページの原稿の電子化処理に移行する。
電子化終了指示を受け付けた場合(ステップS16においてYES)、記憶制御部108は、動画像データ取得部105が得た動画像データ、テキストデータ取得部106が得たテキストデータ、および原稿判定部107が生成したページ間情報が、同一の冊子に対するデータであることを示す関連付け情報を生成する。そして、記憶制御部108は、動画像データ、テキストデータ、ページ間情報、および関連付け情報を記憶部90に記憶させる(ステップS20)。
図6は、情報処理装置1の書籍データの閲覧処理における動作の流れを示すフローチャートである。
情報処理装置1の受付部103が閲覧指示を受け付けた場合(ステップS30においてYES)、表示制御部102は、表示部20に操作画面D2を表示させる(ステップS31)。
図7は、表示部20に表示される操作画面D2の一例を示す図である。操作画面D2では、閲覧する書籍データ、および書籍データの閲覧形式が選択可能になっている。当該操作画面D2において、受付部103が書籍データの閲覧形式としてテキストデータ形式の選択を受け付けた場合(ステップS32おいてYES)、表示制御部102は、記憶部90に記憶されている1ページ目のテキストデータを表示部20に表示させる(ステップS33)。
図8(A)は、表示部20に表示される閲覧画面D3の一例を示す図である。閲覧画面D3では、操作ボタンd3および操作ボタンd4が設けられており、受付部103が操作ボタンd3の押下操作を受け付けると、表示制御部102は、表示部20に表示するテキストデータを前のページのテキストデータに変更する。また、受付部103が操作ボタンd4の押下操作を受け付けると、表示制御部102は、表示部20に表示するテキストデータを次のページのテキストデータに変更する。
一方、当該操作画面D2において、受付部103が書籍データの閲覧形式として動画像データ形式の選択を受け付けた場合(ステップS32おいてNO)、表示制御部102は、記憶部90に記憶されている動画像データを表示部20に表示させる(ステップS34)。
図8(B)は、表示部20に表示される閲覧画面D4の一例を示す図である。閲覧画面D4では、再生ボタンd5および停止ボタンd6が設けられており、受付部103が再生ボタンd5の押下操作を受け付けると、表示制御部102は、表示部20に表示する動画像データの再生を開始する。また、受付部103が停止ボタンd6の押下操作を受け付けると、表示制御部102は、表示部20に表示する動画像データの再生を停止する。
このように、情報処理装置1では、表示制御部102が、表示部20に、受付部が受け付けたデータ閲覧形式に関する指示に応じてテキストデータまたは動画像データを選択的に表示させている。
図9は、情報処理装置1のテキストデータの修正処理における動作の流れを示すフローチャートである。
情報処理装置1の受付部103がテキストデータの確認指示を受け付けた場合(ステップS40においてYES)、表示制御部102は、表示部20に確認画面D5を表示させる(ステップS41)。図10(A)は、表示部20に表示される確認画面D5の一例を示す図である。確認画面D5には、冊子1の1ページ目および2ページ目のテキストデータが表示されている。
ステップS41の処理後、受付部103は、修正指示を受け付けたか否かを判定する(ステップS42)。図10(A)に示す例では、確認画面D5に設けられた修正ボタンd7の押下操作がなされた場合に、受付部103は修正指示を受け付ける。
受付部103が修正指示を受け付けた場合(ステップS42においてYES)、表示制御部102は、表示部20に修正画面D6を表示させる(ステップS43)。図10(B)は、表示部20に表示される修正画面D6の一例を示す図である。修正画面D6には、シークバーd8が設けられている。ユーザーは、当該シークバーd8を操作することにより、修正画面D6に表示されている動画像データの再生位置を変更することができる。
ステップS43の処理後、受付部103は、テキストデータの修正に用いる静止画像データの選択を受け付けたか否かを判定する(ステップS44)。図10(B)に示す例では、シークバーd8の操作後、修正画面D6に設けられた修正ボタンd9の押下操作がなされた場合に、受付部103は、押下操作がなされた時点で修正画面D6に表示された静止画像データをテキストデータの修正に用いる静止画像データとする選択指示を受け付ける。
受付部103がテキストデータの修正に用いる静止画像データの選択を受け付けた場合(ステップS44においてYES)、テキストデータ取得部106は、ステップS44の処理で受付部103が受け付けた静止画像データに対してOCR処理を行い、テキストデータを得る(ステップS45)。
その後、記憶制御部108は、ステップS45の処理でテキストデータ取得部106が取得したテキストデータを記憶部90に記憶させる(ステップS46)。
このように情報処理装置1では、冊子をカメラ部60で撮像して得られたテキストデータを確認して、修正が必要な場合には、再度冊子を撮像することなく、記憶部90に記憶された動画像データを用いてテキストデータを修正することができる。
なお、本発明は、上記の実施の形態の構成に限られず種々の変形が可能である。
図11は、変形例にかかる情報処理装置の電子化処理における動作の流れを示すフローチャートである。なお、図5に示す処理と同内容の処理については同符号を付して説明を略する。
変形例にかかる情報処理装置では、OCR処理が失敗した場合に(ステップS14においてNO)、撮像制御部104が、カメラ部60のズーム倍率を上げて当該OCR処理に失敗した領域(読み取り不良領域)を拡大して撮像させる(ステップS50)。
OCR処理の失敗は、静止画像データの解像度が低かったり、ピントが合っていなかったりすることが原因であるため、OCR処理に失敗した領域を拡大して撮像することで、OCR処理の失敗を回避できる。
また、撮像制御部104による制御によりOCR処理に失敗した領域を拡大して撮像させるのではなく、ユーザー操作によりOCR処理に失敗した領域にカメラ部60を近づけさせたり、ユーザー操作によりカメラ部60のズーム倍率に関する設定を調整させることで、OCR処理に失敗した領域を拡大して撮像させるようにしてもよい。この場合、表示制御部102は、表示部20に、OCR処理に失敗した領域を表示させるとともに、当該OCR処理に失敗した領域にカメラ部60を近づけるべき旨、または、カメラ部60のズーム倍率に関する設定を調整して当該OCR処理に失敗した領域を拡大して撮像すべき旨を表示させる。
図12は、変形例にかかる情報処理装置の使用態様を示す図である。図12に示す例では、表示部20に表示される操作画面D1に、読み取り不良領域A1およびA2の位置が表示されるとともに、その領域を拡大して撮像すべき旨が表示されている。
1 情報処理装置
10 筐体
20 表示部
30 タッチパネル
40 物理キー
50 スピーカー部
51 マイク部
60 カメラ部
70 発光部
80 通信部
90 記憶部
100 制御ユニット
101 制御部
102 表示制御部
103 受付部
104 撮像制御部
105 動画像データ取得部
106 テキストデータ取得部
107 原稿判定部
108 記憶制御部
109 報知制御部

Claims (10)

  1. 撮像部と、
    前記撮像部から、複数の原稿が綴じられてなる冊子がめくられる様子を示す動画像データを得る動画像データ取得部と、
    前記動画像データを構成する静止画像データに対してOCR処理を行い、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部と、
    前記撮像部が撮像する原稿が次のページの原稿に変わったか否かを、前記冊子に対するめくり動作を検出することで判定する原稿判定部と、を備え、
    前記テキストデータ取得部は、前記原稿判定部により前記撮像部が撮像する原稿が次のページの原稿に変わったものと判定された場合に前記OCR処理を実行する情報処理装置。
  2. 表示部と、
    前記表示部による表示動作を制御する表示制御部と、
    前記冊子に対するデータ閲覧形式に関する指示を受け付ける受付部と、を更に備え、
    前記表示制御部は、前記表示部に、前記受付部が受け付けた指示に応じて前記テキストデータまたは前記動画像データを選択的に表示させる、請求項1に記載の情報処理装置。
  3. 前記受付部は、更に、前記テキストデータに対する修正指示を受け付けるとともに、前記動画像データのなかからテキストデータの修正に用いる静止画像データの選択を受け付け、
    前記テキストデータ取得部は、前記受付部が受け付けた静止画像データに対してOCR処理を行うことで前記テキストデータを修正する、請求項2に記載の情報処理装置。
  4. 前記テキストデータ取得部によるOCR処理が成功した場合に、OCR処理が成功した旨を報知する報知部を更に備える、請求項1乃至請求項3の何れか1項に記載の情報処理装置。
  5. 前記報知部は、更に、前記テキストデータ取得部によるOCR処理が成功した時から予め定められた時間が経過するまでに、前記撮像部が撮像する原稿がOCR処理済みの原稿から次のページの原稿に変わらない場合に、予め定められた警告報知を行う、請求項4に記載の情報処理装置。
  6. 同一冊子に対する前記動画像データ取得部が得た動画像データと、前記テキストデータ取得部が得たテキストデータとを、関連付けて記憶する記憶部を更に備える、請求項1乃至請求項5の何れか1項に記載の情報処理装置。
  7. 前記テキストデータ取得部が前記原稿の一部の領域についてOCR処理に失敗した場合に、前記撮像部のズーム倍率を上げて当該OCR処理に失敗した領域を拡大して撮像させる撮像制御部を、更に備え、
    前記テキストデータ取得部は、前記拡大した撮像で得られた静止画像データを用いて再度OCR処理を実行する、請求項1乃至請求項6の何れか1項に記載の情報処理装置。
  8. 表示部と、
    前記表示部による表示動作を制御する表示制御部と、を更に備え、
    前記表示制御部は、前記テキストデータ取得部が前記原稿の一部の領域についてOCR処理に失敗した場合に、前記表示部に当該OCR処理に失敗した領域を表示させるとともに、当該OCR処理に失敗した領域に前記撮像部を近づけるべき旨、または、前記撮像部のズーム倍率を上げて当該OCR処理に失敗した領域を拡大して撮像すべき旨を表示させる、請求項1乃至請求項7の何れか1項に記載の情報処理装置。
  9. 紙媒体への撮像で得られるデータのデータ構造であって、
    撮像部を有する情報処理装置により撮像された、複数の原稿が綴じられてなる冊子がめくられる様子を示す動画像データと、
    前記動画像データを構成する静止画像データに対してOCR処理をすることで得られる、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータと、
    同一の前記冊子に対する前記動画像データと前記テキストデータとを関連付ける関連付け情報と、を具備するデータ構造。
  10. 前記動画像データにおいて前記撮像部が撮像する原稿が次のページの原稿に変わるタイミングを示すページ間情報を更に具備する、請求項9に記載のデータ構造。
JP2015055251A 2015-03-18 2015-03-18 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造 Expired - Fee Related JP6390480B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015055251A JP6390480B2 (ja) 2015-03-18 2015-03-18 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015055251A JP6390480B2 (ja) 2015-03-18 2015-03-18 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造

Publications (2)

Publication Number Publication Date
JP2016177364A true JP2016177364A (ja) 2016-10-06
JP6390480B2 JP6390480B2 (ja) 2018-09-19

Family

ID=57071105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015055251A Expired - Fee Related JP6390480B2 (ja) 2015-03-18 2015-03-18 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造

Country Status (1)

Country Link
JP (1) JP6390480B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110114947A (zh) * 2016-11-25 2019-08-09 伊科泰克项目有限公司 具有可分隔框架的导缆器

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620089A (ja) * 1992-06-30 1994-01-28 Canon Inc データ入力装置及びデータ処理装置
JP2005100280A (ja) * 2003-09-26 2005-04-14 Fuji Photo Film Co Ltd 画像入出力装置
JP2005135210A (ja) * 2003-10-31 2005-05-26 Hitachi Ltd 文字認識機能を有する携帯機器
JP2005260663A (ja) * 2004-03-12 2005-09-22 Casio Comput Co Ltd デジタルカメラ、および、プログラム
JP2005322081A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 文書管理装置および方法
JP2009534693A (ja) * 2006-03-30 2009-09-24 ロキュイター,インコーポレイテッド 聴覚的信号を使用することによるテキストの取り込みおよび提示
JP2013069015A (ja) * 2011-09-21 2013-04-18 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2014026407A (ja) * 2012-07-26 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2014060560A (ja) * 2012-09-18 2014-04-03 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2015006754A (ja) * 2013-06-25 2015-01-15 カシオ計算機株式会社 書画カメラシステム及び画像読み取り方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620089A (ja) * 1992-06-30 1994-01-28 Canon Inc データ入力装置及びデータ処理装置
JP2005100280A (ja) * 2003-09-26 2005-04-14 Fuji Photo Film Co Ltd 画像入出力装置
JP2005135210A (ja) * 2003-10-31 2005-05-26 Hitachi Ltd 文字認識機能を有する携帯機器
JP2005260663A (ja) * 2004-03-12 2005-09-22 Casio Comput Co Ltd デジタルカメラ、および、プログラム
JP2005322081A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 文書管理装置および方法
JP2009534693A (ja) * 2006-03-30 2009-09-24 ロキュイター,インコーポレイテッド 聴覚的信号を使用することによるテキストの取り込みおよび提示
JP2013069015A (ja) * 2011-09-21 2013-04-18 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2014026407A (ja) * 2012-07-26 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2014060560A (ja) * 2012-09-18 2014-04-03 Casio Comput Co Ltd 情報処理装置及びプログラム
JP2015006754A (ja) * 2013-06-25 2015-01-15 カシオ計算機株式会社 書画カメラシステム及び画像読み取り方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110114947A (zh) * 2016-11-25 2019-08-09 伊科泰克项目有限公司 具有可分隔框架的导缆器
CN110114947B (zh) * 2016-11-25 2022-08-05 伊科泰克项目有限公司 具有可分隔框架的导缆器

Also Published As

Publication number Publication date
JP6390480B2 (ja) 2018-09-19

Similar Documents

Publication Publication Date Title
US11574115B2 (en) Method of processing analog data and electronic device thereof
JP5347673B2 (ja) 情報処理装置、情報処理方法及びプログラム
US8072495B2 (en) Automatic image capturing system
JP2012138012A (ja) 表示制御装置および方法
JP2011033870A (ja) 画像処理装置、画像処理方法およびプログラム
US10136011B2 (en) Automatic scanning of document stack with a camera
JP2006186589A (ja) 表示制御装置及び表示制御方法
JP2006094082A (ja) 画像撮影装置およびプログラム
US20170185859A1 (en) Information processing apparatus, control method of information processing apparatus, and storage medium
JP4709106B2 (ja) 表示制御装置及びその制御方法
JP6390480B2 (ja) 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造
JP5451088B2 (ja) 画像端末装置及びプログラム
JP6769136B2 (ja) プログラム及び携帯端末
JP2006072506A (ja) 写真処理装置
JP2013074451A (ja) 画像撮影装置
US10440218B2 (en) Image processing apparatus, control method for image processing apparatus, and non-transitory computer-readable recording medium
KR101643609B1 (ko) 멀티미디어 컨텐츠와 연동된 이미지를 생성하고 재생할 수 있는 디지털 영상 처리 장치 및 그 제어 방법
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
JP2016177363A (ja) 情報処理装置
JP2010191907A (ja) 文字入力装置および文字入力方法
JP2015032952A (ja) 表示制御装置、表示制御方法および記録媒体
JP2018185710A (ja) プログラム及び携帯端末
US20200334202A1 (en) Electronic device, method for controlling electronic device, and non-transitory computer readable medium
JP2014203119A (ja) 入力装置、入力処理方法及びプログラム
US9692938B2 (en) Image forming apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R150 Certificate of patent or registration of utility model

Ref document number: 6390480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees