JP2016177363A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2016177363A
JP2016177363A JP2015055250A JP2015055250A JP2016177363A JP 2016177363 A JP2016177363 A JP 2016177363A JP 2015055250 A JP2015055250 A JP 2015055250A JP 2015055250 A JP2015055250 A JP 2015055250A JP 2016177363 A JP2016177363 A JP 2016177363A
Authority
JP
Japan
Prior art keywords
text data
unit
document
information processing
additional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015055250A
Other languages
English (en)
Inventor
誠 大角
Makoto Osumi
誠 大角
良樹 吉岡
Yoshiki Yoshioka
良樹 吉岡
柳楽 二郎
Jiro Nagira
二郎 柳楽
義幸 藤原
Yoshiyuki Fujiwara
義幸 藤原
翔一 坂口
Shoichi Sakaguchi
翔一 坂口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2015055250A priority Critical patent/JP2016177363A/ja
Publication of JP2016177363A publication Critical patent/JP2016177363A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】ユーザーが閲覧しやすい態様で複数の原稿から構成される原稿群を電子化する。【解決手段】情報処理装置1は、原稿群を構成する複数の原稿を撮像して、当該複数の原稿のそれぞれについて当該原稿を示す画像データを得るカメラ部60と、各画像データに対してOCR処理を行い、複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部105と、各テキストデータを解析して、各テキストデータにおける区切り位置を特定する区切り位置特定部106と、各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加した付加テキストデータを生成する付加テキストデータ生成部107と、を備える。【選択図】図3

Description

本発明は、情報処理装置に関し、特に、複数の原稿から構成される原稿群からテキストデータを抽出する技術に関する。
近年、PC(Personal Computer)やスマートフォン等の情報処理装置の普及に伴い、原稿等の紙媒体に記載された内容の電子化(データ化)が広く行われている。
特許文献1には、紙媒体をカメラ(撮像部)で撮像して画像データ化することで、紙媒体に記載された内容の電子化を行う技術が開示されている。また、特許文献1では、得られた画像データに対してOCR(Optical Character Recognition)処理を行うことで、紙媒体に含まれる文字を示すテキストデータを抽出している。これにより、紙媒体に記載された内容を検索したり分析することが可能となる。
特開2003−60894号公報
上記の特許文献1が開示する技術を用いて複数の原稿から構成される原稿群を撮像した場合、当該複数の原稿のそれぞれについて原稿に含まれる文字を示すテキストデータが得られる。ユーザーは、ページを順次切り替えて当該テキストデータを閲覧する。
しかしながら、当該テキストデータでは、1つのまとまりある文章がページ間を跨いでいる場合がある。この場合、1つのまとまりある文章を読む途中でページを切り替えるという作業が必要となり煩わしい。
本発明は、上記の事情に鑑みなされたものであり、ユーザーが閲覧しやすい態様で複数の原稿から構成される原稿群を電子化することを可能にすることを目的とする。
本発明の一局面にかかる情報処理装置は、原稿群を構成する複数の原稿を撮像して、当該複数の原稿のそれぞれについて当該原稿を示す画像データを得る撮像部と、前記各画像データに対してOCR処理を行い、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部と、前記各テキストデータを解析して、前記各テキストデータにおける区切り位置を特定する区切り位置特定部と、前記各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加した付加テキストデータを生成する付加テキストデータ生成部と、を備える情報処理装置である。
本発明によれば、ユーザーが閲覧しやすい態様で複数の原稿から構成される原稿群を電子化することができる。
(A)および(B)は、本発明の一実施形態にかかる情報処理装置を示す図であり、(A)は、情報処理装置の表面側を示し、(B)は、情報処理装置の裏面側を示す。 本発明の一実施形態にかかる情報処理装置の使用態様を示す図である。 本発明の一実施形態にかかる情報処理装置の内部構成を示すブロック図である。 (A)は、本発明の一実施形態にかかる情報処理装置のカメラ部の撮像対象となる原稿を示す図であり、(B)は、(A)に示す原稿をカメラ部が撮像することで、テキストデータ取得部が取得するテキストデータを示す図であり (A)は、図4(B)に示すテキストデータにおいて、本発明の一実施形態にかかる情報処理装置の付加テキストデータ生成部が付加するテキストデータを示す図であり、(B)は、付加テキストデータ生成部が生成する付加テキストデータを示す図である。 (A)〜(D)は、本発明の一実施形態にかかる情報処理装置の記憶部が記憶するデータのデータ構造を示す図である。 本発明の一実施形態にかかる情報処理装置の電子化処理における動作の流れを示すフローチャートである。 本発明の一実施形態にかかる情報処理装置の書籍データの閲覧処理における動作の流れを示すフローチャートである。 本発明の一実施形態にかかる情報処理装置の表示部に表示される操作画面の一例を示す図である。 (A)および(B)は、本発明の一実施形態にかかる情報処理装置の表示部に表示される閲覧画面の一例を示す図である。
以下、本発明の一実施形態にかかる情報処理装置について図面を参照して説明する。
図1(A)および図1(B)は、本発明の一実施形態にかかる情報処理装置1を示す図であり、図1(A)は、情報処理装置1の表面側を示し、図1(B)は、情報処理装置1の裏面側を示す。
情報処理装置1は、PC、タブレット端末、デジタルカメラ、スマートフォン等の撮像手段を有する情報処理装置である。図1(A)および図1(B)に示す例では、情報処理装置1がスマートフォンである場合を示している。
情報処理装置1は、外郭を構成する筐体10、筐体10内に収容された表示部20、タッチパネル30、物理キー40、スピーカー部50、マイク部51、カメラ部60、および発光部70等を備えている。
表示部20は、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(OLED:Organic Light-Emitting Diode)ディスプレイであって、筐体10内の表面側に配設される。表示部20は、後述する表示制御部102(図3参照)による制御の下、ユーザー操作を受け付けるための操作画面や、カメラ部60が撮像した画像データ等を表示する。
タッチパネル30は、例えば、マルチタッチを検出可能な静電容量方式のタッチパネルであって、表示部20の表示画面部分の前面に配設される。タッチパネル30は、表示部20の表示画面上におけるユーザーによる接触を接触位置とともに検知する。タッチパネル30は、ユーザーによる接触を検知すると、その接触位置を示す検知信号を後述する受付部103(図3参照)等に出力する。
物理キー40は、筐体10内の表面側に配設され、上記のタッチパネル30とともに、ユーザーによる操作を受け付ける操作部として機能する。図1(A)および図1(B)に示す例では、物理キー40がホーム画面に戻るためのホームボタンである場合を示しているが、他に操作画面を構成するGUIのフォーカスを移動させる矢印キー、操作画面を構成するGUIに対して確定操作を行う決定キー、文字入力を行うための文字入力キー、数値入力を行うための数値入力キー等を備えてもよい。
スピーカー部50は、筐体10内の表面側に配設され、後述する報知制御部110(図3参照)による制御の下、着信音や警告音等の音声を出力する。
マイク部51は、筐体10内の表面側に配設され、情報処理装置1の外部で発生した音声を集音する。
カメラ部60(撮像部)は、被写体からの光を結像する撮像レンズ(不図示)、当該撮像レンズよって結像された被写体像を光電変換する撮像素子(不図示)、および撮像素子を駆動する回路(不図示)等を備える。カメラ部60は、筐体10内の裏面側に配設され、被写体の画像を撮像する。撮像中において表示部20には、カメラ部60が向けられた被写体を示す画像が表示される。このためユーザーは、被写体の様子を確認しながら撮像を行うことができる。
発光部70は、LED(Light-Emitting Diode)等の発光素子を備える。発光部70は、カメラ部60の上部に配設され、カメラ部60が被写体を撮像する際にフラッシュ光を被写体に向けて出射する。
図2は、情報処理装置1の使用態様を示す図である。情報処理装置1は、動作モードとして、通話を行うための通話モードや撮像を行うための撮像モードに加えて、紙媒体に記載された内容の電子化を行う電子化モードを有する。当該電子化モードにおいて、情報処理装置1は、複数の原稿から構成される原稿群等の紙媒体をカメラ部60で撮像することで、紙媒体に記載された内容を電子化する。図2に示す例では、複数の原稿が綴じられてなる冊子Hが電子化対象の原稿群とされている。詳細は後述するが、ユーザーは、まず、電子化したい最初のページである原稿P1にカメラ部60を向け、原稿P1の撮像を行う。原稿P1の撮像後、ユーザーは、原稿P1の次のページである原稿P2にカメラ部60を向け、原稿P2の撮像を行う。原稿P1および原稿P2の撮像後、ユーザーは、冊子Hをめくり原稿P2以降のページの原稿の撮像も行う。こうすることで、冊子Hを構成する各原稿が撮像され、冊子Hの電子化が完了する。
続いて、情報処理装置1の内部構成を説明する。図3は、情報処理装置1の内部構成を示すブロック図である。なお、既に説明した構成については、その説明を簡略または省略する。
通信部80は、無線LANボード等の通信モジュールから構成されるネットワークインターフェイスである。
記憶部90は、HDD(Hard Disk Drive)等の大容量の記憶装置である。
制御ユニット100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、及びROM(Read Only Memory)等から構成される。制御ユニット100は、上記のROMまたは記憶部90等に記憶された制御プログラムが上記のCPUに実行されることにより、制御部101、表示制御部102、受付部103、撮像制御部104、テキストデータ取得部105、区切り位置特定部106、付加テキストデータ生成部107、原稿判定部108、記憶制御部109、および報知制御部110として機能する。なお、制御ユニット100の上記の各構成は、前述の制御プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。
制御部101は、情報処理装置1の全体的な動作制御を司る。制御部101は、表示部20、タッチパネル30、物理キー40、スピーカー部50、マイク部51、カメラ部60、発光部70、通信部80、および記憶部90等と接続されており、接続されている上記各機構の動作制御や、各機構との間での信号又はデータの送受信を行う。
表示制御部102は、表示部20による表示動作を制御する機能を有する。
受付部103は、タッチパネル30や物理キー40等を用いて入力されたユーザー操作に応じた指示を受け付ける機能を有する。
撮像制御部104は、カメラ部60による撮像動作を制御する機能を有する。撮像制御部104は、カメラ部60の撮像レンズ(不図示)を移動させることで焦点距離を変化させる光学ズームにより、カメラ部60のズーム倍率を調整する。
テキストデータ取得部105は、カメラ部60から出力されたアナログ信号をデジタル信号に変換しノイズ除去等の処理に基づく補正を行うことで、画像データを得る機能を有する。情報処理装置1が図2に示す使用態様で用いられた場合、テキストデータ取得部105は、冊子を構成する複数の原稿のそれぞれについて当該原稿を示す画像データを得る。
テキストデータ取得部105は、更に、取得した画像データに対してOCR処理を行い、冊子を構成する複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを取得する機能を有する。
テキストデータ取得部105は、まず、受付部103が冊子の電子化開始指示を受け付けた時点でカメラ部60が撮像している原稿(図2における原稿P1)を示す画像データを取得する。そして、テキストデータ取得部105は、当該取得した画像データに対してOCR処理を行い、テキストデータを取得する。初回のOCR処理以降については、テキストデータ取得部105は、カメラ部60が撮像する原稿が次のページの原稿に変わる度に、OCR処理対象の画像データを取得する。なお、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かは、後述する原稿判定部108により判定される。
受付部103が冊子の電子化終了指示を受け付けた場合、受付部103が冊子の電子化開始指示を受け付けてから冊子の電子化終了指示を受け付けるまでの間にテキストデータ取得部105が得たテキストデータが、後述する記憶制御部109による制御の下、記憶部90に記憶される。
区切り位置特定部106は、テキストデータ取得部105が取得した各テキストデータを解析して、当該各テキストデータにおける区切り位置を特定する機能を有する。ここで、区切り位置とは、1つのまとまりある文章が終了する位置を意味する。本実施形態にかかる情報処理装置1では、区切り位置特定部106が、テキストデータに含まれる句点(。)を区切り文字として識別して、当該識別した句点のうち最前に位置する句点の位置を区切り位置とする。
付加テキストデータ生成部107は、テキストデータ取得部105が取得した各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加した付加テキストデータを生成する機能を有する。また、付加テキストデータ生成部107は、生成した付加テキストデータの冒頭から当該付加テキストデータの区切り位置までのテキストデータを削除する機能を有する。
上記の区切り位置特定部106および付加テキストデータ生成部107が有する機能の詳細を図4(A)、図4(B)、図5(A)、および図5(B)を用いて説明する。
図4(A)は、カメラ部60の撮像対象となる原稿を示す図である。本図に示す例では、冊子Hを構成する原稿P1〜原稿P4の四ページの原稿がカメラ部60の撮像対象とされている。
図4(B)は、図4(A)に示す原稿をカメラ部60が撮像することで、テキストデータ取得部105が取得するテキストデータを示す図である。本図に示す例では、原稿P1に含まれる文字を示すテキストデータT1、原稿P2に含まれる文字を示すテキストデータT2、原稿P3に含まれる文字を示すテキストデータT3、および原稿P4に含まれる文字を示すテキストデータT4が取得されている。
区切り位置特定部106は、各テキストデータに含まれる区切り文字(句点)を識別する。図4(B)に示す例では、テキストデータT1から句点t1、t2を識別し、テキストデータT2から句点t3、t4、t5を識別し、テキストデータT3から句点t6、t7、t8を識別し、テキストデータT4から句点t9、t10、t11、t12を識別する。
区切り位置特定部106は、識別した句点のうち最前に位置する句点の位置を区切り位置とする。図4(B)に示す例では、句点t1の位置をテキストデータT1における区切り位置とし、句点t3の位置をテキストデータT2における区切り位置とし、句点t6の位置をテキストデータT3における区切り位置とし、句点t9の位置をテキストデータT4における区切り位置とする。
図5(A)は、図4(B)に示すテキストデータにおいて、付加テキストデータ生成部107が付加するテキストデータを示す図である。付加テキストデータ生成部107は、各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加する。図5(A)に示す例では、付加テキストデータ生成部107は、テキストデータT1の末尾に、テキストデータT2における区切り位置t3までのテキストデータT6を付加する。また、付加テキストデータ生成部107は、テキストデータT2の末尾に、テキストデータT3における区切り位置t6までのテキストデータT7を付加する。また、付加テキストデータ生成部107は、テキストデータT3の末尾に、テキストデータT4における区切り位置t9までのテキストデータT8を付加する。なお、テキストデータT4は、カメラ部60の撮像対象となる原稿のうち最後のページの原稿に対するテキストデータであるため、テキストデータの付加は行われない。
図5(B)は、付加テキストデータ生成部107が生成する付加テキストデータを示す図である。付加テキストデータ生成部107は、前のページのテキストデータに付加した部分を削除する処理を行う。すなわち、付加テキストデータ生成部107は、生成した付加テキストデータの冒頭から当該付加テキストデータの区切り位置までのテキストデータを削除する。図5(B)に示す例では、付加テキストデータ生成部107は、テキストデータT2からテキストデータT6を削除して得られるテキストデータT2’とテキストデータT7とからなる付加テキストデータT10を生成している。また、付加テキストデータ生成部107は、テキストデータT3からテキストデータT7を削除して得られるテキストデータT3’とテキストデータT8とからなる付加テキストデータT11を生成している。また、付加テキストデータ生成部107は、テキストデータT4からテキストデータT8を削除して得られるテキストデータT4’からなる付加テキストデータT12を生成している。なお、テキストデータT1は、カメラ部60の撮像対象となる原稿のうち最初のページの原稿に対するテキストデータであるため、テキストデータの削除は行われない。
このように、情報処理装置1では、OCR処理を行うことで得られたテキストデータを解析して、テキストデータにおける区切り位置を特定し、テキストデータの末尾に次のページのテキストデータにおける区切り位置までのテキストデータを付加する付加テキストデータを生成することで、1つのまとまりある文章がページ間を跨ぐ事態を回避することができる。
図3に戻って、原稿判定部108は、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定する機能を有する。原稿判定部108は、カメラ部60が撮像した動画像データを解析して、冊子に対するめくり動作を検出するめくり検出を行うことで、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定する。
めくり検出では、原稿判定部108は、動画像データを解析して、ユーザーの手の位置を検出する。そして、原稿判定部108は、検出した手の動きが予め定められた移動パターンに合致するか否かを判定し、予め定められた移動パターンに合致する場合にめくり動作が行われたことを検出する。なお、めくり検出の手法は、上記で説明したものに限られない。例えば、原稿判定部108は、動画像データを解析して原稿の縁部分を検出しておき、当該原稿の縁部分の予め定められた距離以上の移動を検出した場合に、めくり動作が行われたことを検出してもよい。
右綴じ、左綴じ、上綴じの冊子、すなわち見開き部分を有しない冊子では、原稿判定部108が上記のめくり動作を検出することで、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができる。しかしながら、中綴じの冊子、すなわち見開き部分を有する冊子では、原稿判定部108が上記のめくり動作を検出するだけでは、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができない。そこで、原稿判定部108は、上記のめくり検出に加えて、カメラ部60の視点の移動を検出する視点移動検出を行う。
視点移動検出では、原稿判定部108は、動画像データを解析して、特徴点、例えば中綴じの冊子におけるのど部分を検出する(特徴点検出)。そして、原稿判定部108は、当該特徴点の予め定められた距離以上の移動を検出した場合に、カメラ部60の視点の移動が行われたことを検出する。
原稿判定部108は、上記のめくり検出、または、視点移動検出のどちらか一方が検出された場合に、カメラ部60が撮像する原稿が次のページの原稿に変わったことを検出する。これにより、見開き部分を有する冊子においても、カメラ部60が撮像する原稿が次のページの原稿に変わったか否かを判定することができる。
報知制御部110(報知部)は、スピーカー部50による音声の出力動作を制御する機能を有する。報知制御部110は、例えば、テキストデータ取得部105によるOCR処理が成功した場合に、OCR処理が成功した旨を報知するための予め定められた成功報知音をスピーカー部50に出力させる。これにより、ユーザーは、現在カメラ部60を向けている原稿に対するOCR処理が成功したので、カメラ部60を次のページの原稿に向けるべきであることを知ることができる。なお、テキストデータ取得部105によるOCR処理が成功した場合に、表示制御部102が、OCR処理が成功した旨を報知する報知画面を表示部20に表示させてもよい。この場合、表示制御部102が報知部として機能することになる。
記憶制御部109は、記憶部90によるデータの記憶動作を制御する機能を有する。記憶制御部109による制御により、記憶部90には、カメラ部60による冊子への撮像で得られるデータが記憶される。
図6(A)〜図6(D)は、記憶部90が記憶するデータのデータ構造を示す図である。記憶部90には、同一原稿群に対するテキストデータと付加テキストデータとを関連付ける関連付け情報が記憶されている。当該関連付け情報は、同一の冊子に対するテキストデータと付加テキストデータとの組み合わせを示す。当該関連付け情報により、テキストデータと付加テキストデータとが、冊子毎に分けられた書籍データ内に格納された状態で記憶部90に記憶される。図6(A)に示す例では、冊子1〜冊子NのN冊の冊子に対する書籍データが記憶部90に記憶されている。
図6(B)は、冊子1に対する書籍データのデータ構造を示している。冊子1に対する書籍データには、カメラ部60による冊子1への撮像で得られた画像データに基づき、テキストデータ取得部105が生成したテキストデータ、および付加テキストデータ生成部107が生成した付加テキストデータが格納されている。テキストデータは、図6(C)に示すように1ページ目からKページ目までの各テキストデータから構成されている。また、付加テキストデータは、図6(D)に示すように1ページ目からKページ目までの各付加テキストデータから構成されている。
このように、情報処理装置1では、冊子等の紙媒体に記載された内容を、OCR処理を行うことで得られたテキストデータのみで電子化するのではなく、テキストデータに加えて、当該テキストデータに対応する付加テキストデータで電子化している。これにより、ユーザーが閲覧しやすい態様で複数の原稿から構成される原稿群を電子化することができる。
続いて、情報処理装置1の具体的な動作の流れについて説明する。図7は、情報処理装置1の電子化処理における動作の流れを示すフローチャートである。
情報処理装置1の受付部103が電子化開始指示を受け付けた場合(ステップS10においてYES)、撮像制御部104による制御の下カメラ部60による撮像が開始され、テキストデータ取得部105は、カメラ部60から出力された信号に基づき画像データを取得する(ステップS11)。図2に示す例では、表示部20に表示された操作画面D1の開始ボタンd1の押下操作がなされた場合に、受付部103は、電子化開始指示を受け付ける。
ステップS11の処理後、テキストデータ取得部105は、取得した画像データに対してOCR処理を実行して、テキストデータを取得する(ステップS12)。
ステップS12の処理語、受付部103は、電子化終了指示を受け付けたか否かを判定する(ステップS13)。図2に示す例では、表示部20に表示された操作画面D1の終了ボタンd2の押下操作がなされた場合に、受付部103は、電子化終了指示を受け付ける。
電子化終了指示を受け付けない場合(ステップS13においてNO)、原稿判定部108は、カメラ部60が撮像する原稿が次のページの原稿に変化したか否かを判定する(ステップS14)。
ステップS12の処理後予め定められた時間が経過するまでに、カメラ部60が撮像する原稿が次のページの原稿に変化しない場合(ステップS15においてYES)、報知制御部110は、カメラ部60を次のページの原稿に向けるべき旨を報知するための予め定められた警告音をスピーカー部50に出力させる(ステップS16)。
カメラ部60が撮像する原稿が次のページの原稿に変化した場合(ステップS14においてYES)、ステップS11の処理に戻り、次のページの原稿の電子化処理に移行する。
一方、電子化終了指示を受け付けた場合(ステップS13においてYES)、区切り位置特定部106は、ステップS12の処理で取得した各テキストデータを解析して、当該各テキストデータにおける区切り位置を特定する(ステップS17)。
区切り位置の特定後、付加テキストデータ生成部107は、各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加した付加テキストデータを生成する(ステップS18)。また、ステップS18の処理では、付加テキストデータ生成部107は、各テキストデータの冒頭から当該各テキストデータの区切り位置までのテキストデータを削除する。
ステップS18の処理後、記憶制御部109は、ステップS12の処理で生成したテキストデータ、およびステップS18の処理で生成した付加テキストデータが、同一の冊子に対するデータであることを示す関連付け情報を生成する。そして、記憶制御部109は、テキストデータ、付加テキストデータ、および関連付け情報を記憶部90に記憶させる(ステップS19)。
図8は、情報処理装置1の書籍データの閲覧処理における動作の流れを示すフローチャートである。
情報処理装置1の受付部103が閲覧指示を受け付けた場合(ステップS20においてYES)、表示制御部102は、表示部20に操作画面D2を表示させる(ステップS21)。
図9は、表示部20に表示される操作画面D2の一例を示す図である。操作画面D2では、閲覧する書籍データ、および書籍データの閲覧形式が選択可能になっている。当該操作画面D2において、受付部103が書籍データの閲覧形式として付加テキストデータ形式の選択を受け付けた場合(ステップS22おいてYES)、表示制御部102は、記憶部90に記憶されている1ページ目の付加テキストデータを表示部20に表示させる(ステップS23)。
図10(A)および図10(B)は、表示部20に表示される閲覧画面D3の一例を示す図である。図10(A)は1ページ目の付加テキストデータを示し、図10(B)は2ページ目の付加テキストデータを示している。
表示制御部102は、表示部20に付加テキストデータを表示させる場合に、付加テキストデータにおけるテキストデータの付加部分の表示を、付加テキストデータにおけるテキストデータ部分の表示と表示形態を異ならせる。例えば、表示制御部102は、付加テキストデータにおけるテキストデータの付加部分を赤色で表示させ、付加テキストデータにおけるテキストデータ部分を黒色で表示させる。図10(A)に示す例では、テキストデータT1の文字部分を黒色で表示させ、テキストデータT6の文字部分を赤色で表示させる。図10(B)に示す例では、テキストデータT2’の文字部分を黒色で表示させ、テキストデータT7の文字部分を赤色で表示させる。これにより、ユーザーにテキストデータの付加部分を明示することができる。
閲覧画面D3では、操作ボタンd3および操作ボタンd4が設けられている。受付部103が操作ボタンd3の押下操作を受け付けると、表示制御部102は、表示部20に表示する付加テキストデータを前のページの付加テキストデータに変更する。また、受付部103が操作ボタンd4の押下操作を受け付けると、表示制御部102は、表示部20に表示する付加テキストデータを次のページの付加テキストデータに変更する。
図8に戻って、受付部103が書籍データの閲覧形式としてテキストデータ形式の選択を受け付けた場合(ステップS22おいてNO)、表示制御部102は、記憶部90に記憶されているテキストデータを表示部20に表示させる(ステップS24)。
このように、情報処理装置1では、表示制御部102が、表示部20に、受付部が受け付けたデータ閲覧形式に関する指示に応じてテキストデータまたは付加テキストデータを選択的に表示させている。
なお、本発明は、上記の実施形態の構成に限られず種々の変形が可能である。
例えば、上記の実施形態では、区切り位置を特定する際に、テキストデータに含まれる句点を区切り文字として識別する場合を説明したが、本発明は必ずしもこの場合に限定されない。区切り位置特定部106は、句点以外に、読点(、)、括弧(())、二点リーダ(‥)、三点リーダ(…)、中点(・)、感嘆符(!)、疑問符(?)、米印(※)絵文字、音符マークといった約物を区切り文字として識別してもよい。また、英語などの欧文においては、ピリオド( . )、コンマ ( , )、コロン( : )、セミコロン ( ; )、アスタリスク( * )、ダガー(†)、節記号(§)、段落記号(¶)といった約物を区切り文字として識別してもよい。更には、「第1部」「第1章」「第1節」「第1項目」等の見出しとして文章の最初に記載される符号や、文章の最初に記載される空白(スペース)を区切り文字として識別してもよい。
上記の約物、符号、空白といった区切り文字は、1つのまとまりある文章の冒頭に付けられるもの(第1種区切り文字)と、1つのまとまりある文章の末尾に付けられるもの(第2種区切り文字)とに大別される。例えば、句点、読点、感嘆符、疑問符等は、1つのまとまりある文章の末尾に付けられるものであり、第2種区切り文字とされる。一方、段落記号、節記号、ダガー等は、1つのまとまりある文章の冒頭に付けられるものであり、第1種区切り文字とされる。記憶部90には、上記の約物、符号、空白といった区切り文字が、第1種区切り文字または第2種区切り文字のどちらであるかを示す識別情報が記憶されている。
区切り位置特定部106は、テキストデータに含まれる区切り文字を識別した際、当該区切り文字が第1種区切り文字または第2種区切り文字のどちらであるかを判定する。区切り文字が第2種区切り文字である場合、区切り位置特定部106は、当該第2種区切り文字のうち最前に位置する第2種区切り文字の位置を区切り位置とする。一方、区切り文字が第1種区切り文字である場合、区切り位置特定部106は、当該第1種区切り文字のうち最前に位置する第1種区切り文字の位置よりも1文字前の位置を区切り位置とする。
このように、変形例にかかる情報処理装置1では、句点以外の読点、感嘆符、段落記号等を用いて、テキストデータにおける区切り位置を特定することができる。
1 情報処理装置
20 表示部
30 タッチパネル
50 スピーカー部
60 カメラ部
90 記憶部
100 制御ユニット
101 制御部
102 表示制御部
103 受付部
104 撮像制御部
105 テキストデータ取得部
106 区切り位置特定部
107 付加テキストデータ生成部
108 原稿判定部
109 記憶制御部
110 報知制御部

Claims (7)

  1. 原稿群を構成する複数の原稿を撮像して、当該複数の原稿のそれぞれについて当該原稿を示す画像データを得る撮像部と、
    前記各画像データに対してOCR処理を行い、前記複数の原稿のそれぞれについて当該原稿に含まれる文字を示すテキストデータを得るテキストデータ取得部と、
    前記各テキストデータを解析して、前記各テキストデータにおける区切り位置を特定する区切り位置特定部と、
    前記各テキストデータの末尾に、次のページのテキストデータにおける区切り位置までのテキストデータを付加した付加テキストデータを生成する付加テキストデータ生成部と、を備える情報処理装置。
  2. 前記区切り位置特定部は、前記テキストデータに含まれる句点を識別して、当該識別した句点のうち最前に位置する句点の位置を、前記テキストデータにおける区切り位置とする、請求項1に記載の情報処理装置。
  3. 表示部と、
    前記表示部による表示動作を制御する表示制御部と、
    前記原稿群に対するデータ閲覧形式に関する指示を受け付ける受付部と、を更に備え、
    前記表示制御部は、前記表示部に、前記受付部が受け付けた指示に応じて前記テキストデータまたは前記付加テキストデータを選択的に表示させる、請求項1または請求項2に記載の情報処理装置。
  4. 前記表示制御部は、前記表示部に前記付加テキストデータを表示させる場合に、前記付加テキストデータにおけるテキストデータの付加部分の表示を、前記付加テキストデータにおける前記テキストデータ部分の表示と表示形態を異ならせる、請求項3に記載の情報処理装置。
  5. 同一原稿群に対する前記テキストデータと前記付加テキストデータとを関連付けて記憶する記憶部を、更に備える、請求項1乃至請求項4の何れか1項に記載の情報処理装置。
  6. 前記付加テキストデータ生成部は、更に、前記付加テキストデータの冒頭から当該付加テキストデータの区切り位置までのテキストデータを削除する、請求項1乃至請求項5の何れか1項に記載の情報処理装置。
  7. 前記原稿群は、複数の原稿が綴じられてなる冊子であり、
    前記撮像部が撮像する原稿が次のページの原稿に変わったか否かを、前記冊子に対するめくり動作を検出することで判定する原稿判定部を更に備え、
    前記テキストデータ取得部は、前記原稿判定部により前記撮像部が撮像する原稿が次のページの原稿に変わったものと判定された場合に前記OCR処理を実行する、請求項1乃至請求項7の何れか1項に記載の情報処理装置。
JP2015055250A 2015-03-18 2015-03-18 情報処理装置 Pending JP2016177363A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015055250A JP2016177363A (ja) 2015-03-18 2015-03-18 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015055250A JP2016177363A (ja) 2015-03-18 2015-03-18 情報処理装置

Publications (1)

Publication Number Publication Date
JP2016177363A true JP2016177363A (ja) 2016-10-06

Family

ID=57071324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015055250A Pending JP2016177363A (ja) 2015-03-18 2015-03-18 情報処理装置

Country Status (1)

Country Link
JP (1) JP2016177363A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217965A (ja) * 1990-01-23 1991-09-25 Mitsubishi Electric Corp 文書作成装置
JP2005322081A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 文書管理装置および方法
JP2012083824A (ja) * 2010-10-07 2012-04-26 Fujifilm Corp 文書画像生成装置ならびにその動作制御方法および動作制御プログラム
JP2014026408A (ja) * 2012-07-26 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03217965A (ja) * 1990-01-23 1991-09-25 Mitsubishi Electric Corp 文書作成装置
JP2005322081A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 文書管理装置および方法
JP2012083824A (ja) * 2010-10-07 2012-04-26 Fujifilm Corp 文書画像生成装置ならびにその動作制御方法および動作制御プログラム
JP2014026408A (ja) * 2012-07-26 2014-02-06 Casio Comput Co Ltd 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US11574115B2 (en) Method of processing analog data and electronic device thereof
JP2010250464A (ja) 情報処理装置、情報処理方法及びプログラム
US9614984B2 (en) Electronic document generation system and recording medium
EP2028588A2 (en) Method and apparatus for forwarding media objects to a cellular telephone user
JP2018025885A (ja) 画像処理装置
JP4668345B1 (ja) 情報処理装置、および情報処理装置の制御方法
JP6763209B2 (ja) プログラム及び携帯端末
US10362193B2 (en) Information conversion apparatus capable of changing attribution information of an image based on viewer information and non-transitory computer readable medium storing program
US10270932B2 (en) Non-transitory computer-readable medium and portable device
JP2021149439A (ja) 情報処理装置及び情報処理プログラム
JP2016177363A (ja) 情報処理装置
JP2010140136A (ja) 画像処理装置、画像データ管理方法、およびコンピュータプログラム
JP6390480B2 (ja) 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造
JP6601143B2 (ja) 印刷装置
JP2005135210A (ja) 文字認識機能を有する携帯機器
RU2587406C2 (ru) Способ обработки визуального объекта и электронное устройство, используемое в нем
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
JP6822261B2 (ja) 情報処理装置、プログラムおよび情報処理方法
WO2009104193A1 (en) Provisioning of media objects associated with printed documents
US9906669B2 (en) Scanning system, scanned image processing device and scanning method
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP6975414B2 (ja) プログラム及び携帯端末
JP2018185710A (ja) プログラム及び携帯端末
JP2010191907A (ja) 文字入力装置および文字入力方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180213