JP2018010528A - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP2018010528A JP2018010528A JP2016139698A JP2016139698A JP2018010528A JP 2018010528 A JP2018010528 A JP 2018010528A JP 2016139698 A JP2016139698 A JP 2016139698A JP 2016139698 A JP2016139698 A JP 2016139698A JP 2018010528 A JP2018010528 A JP 2018010528A
- Authority
- JP
- Japan
- Prior art keywords
- function
- information processing
- designated
- processing
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】 ユーザにより指定されたそれぞれの機能をその実行順序に基づき実現するための処理群の実行順序をより簡便に決定するための技術を提供すること。【解決手段】 文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定する。機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する。それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定し、それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、文書画像に対する処理フローとして決定する。【選択図】 図3
Description
本発明は、文書画像を処理するための技術に関するものである。
ユーザが文書に対して実施したい機能を実現するために、例えば、ユーザが所望する処理の実行順序をGUI(グラフィカルユーザインターフェース)を用いて指定していく技術が知られている(特許文献1)。
ユーザが所望する機能と該機能を実現するための処理は必ずしも一対一に対応づけられない場合が存在する。したがって、上述の従来技術では、機能を実現するために必要な処理群の詳細をユーザが理解しておく必要がある。たとえば、文書画像に対して文字認識を行う際は、文書画像を二値で表現する画像形式の文書画像に変換する二値化と呼ばれる処理が必要になる。ユーザが所望する機能としては文字認識のみであるにも関わらず、文字認識を実現するためには二値化が必要であることを理解したうえで、処理の実行順序(以降、処理フローとも記載する)を指定することが求められる。
本発明はこのような問題に鑑みてなされたものであり、ユーザにより指定されたそれぞれの機能をその実行順序に基づき実現するための処理群の実行順序をより簡便に決定するための技術を提供する。
本発明の一様態は、文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定する特定手段と、前記機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する取得手段と、前記それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定し、前記それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、前記文書画像に対する処理フローとして決定する決定手段とを備えることを特徴とする。
本発明の構成により、ユーザにより指定されたそれぞれの機能をその実行順序に基づき実現するための処理群の実行順序をより簡便に決定することができる。これにより、特定の機能を実現するための処理に関する知識がないユーザでも、機能を指示するだけで、所望の処理フローを作成することができる。
以下、添付図面を参照し、本発明の実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施例の1つである。
[第1の実施形態]
以下では、次のような構成を有する情報処理装置としての情報処理システムの一例について説明する。情報処理装置は、文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定し、該機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する。そして、該それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定する。これにより、該それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、文書画像に対する処理フローとして決定する。
以下では、次のような構成を有する情報処理装置としての情報処理システムの一例について説明する。情報処理装置は、文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定し、該機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する。そして、該それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定する。これにより、該それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、文書画像に対する処理フローとして決定する。
先ず、本実施形態に係る情報処理システムの動作例の概要について、図1を用いて説明する。本実施形態に係る情報処理システムは、プロジェクタ、カメラ、操作用センサを有している。図1(a)に示す如く、情報処理システム101は、机102の上に載置された紙文書103をカメラを用いて撮像する。そして情報処理システム101は図1(b)に示す如く、カメラにより撮像された撮像画像中の紙文書103の領域内の画像(文書画像)の解析結果に応じて、該文書画像に対して実施可能な機能の一覧104を、プロジェクタを用いて机102の上に投影する。図1(c)ではユーザは、この一覧104から、文書画像に対して実施したい機能として「QRコード(登録商標)検出」を、自身の指107によるジェスチャ操作でもって指示している。機能「QRコード(登録商標)検出」が指定されると、図1(c)に示す如く、指定した機能である「QRコード(登録商標)検出」を表すアイコン105がプロジェクタにより机102の上に投影される。以降、一覧104から機能が指定されるたびに、該指定した機能を表すアイコンが指定順に机102の上に投影される。図1(d)では「QRコード(登録商標)検出」を指定した後に「情報抽出」を指定したので、アイコン105の右隣に「情報抽出」を表すアイコン106が投影されており、これは、「QRコード(登録商標)検出」の次に「情報抽出」を行う処理フローを表している。このように、一覧104から機能を指定するたびに、指定した機能に対応するアイコンが指定順に並べられて投影され、且つ指定した機能を指定順に実行する処理フローを設定することができる。
次に、情報処理システム101のハードウェア構成例について、図2(a)のブロック図を用いて説明する。
CPU202は、ROM203やRAM204に格納されているコンピュータプログラムやデータを用いて処理を実行する。これによりCPU202は、情報処理システム101全体の動作制御を行うと共に、情報処理システム101が行うものとして後述する各処理を実行若しくは制御する。
ROM203には、書き換え不要の情報処理システム101の設定データやブートプログラムなどが格納されている。
RAM204は、記憶装置205や外部記憶装置206からロードされたコンピュータプログラムやデータ、入力装置207により入力された各種のデータ、を格納するためのエリアを有する。更にRAM204は、I/F(インターフェース)209を介して外部から受信したデータを格納するためのエリア、CPU202が各種の処理を実行若しくは制御する際に用いるワークエリアを有する。このようにRAM204は各種のエリアを適宜提供することができる。
記憶装置205は、ハードディスクドライブ装置に代表される大容量情報記憶装置である。記憶装置205には、OS(オペレーティングシステム)や、情報処理システム101が行うものとして後述する各処理をCPU202に実行若しくは制御させるためのコンピュータプログラムやデータが保存されている。記憶装置205に保存されているデータには、以下の説明において既知の情報として説明するもの、例えば、閾値やテーブル等のデータが含まれている。記憶装置205に保存されているコンピュータプログラムやデータは、CPU202による制御に従って適宜RAM204にロードされ、CPU202による処理対象となる。なお、記憶装置205に保存されているものとして説明したコンピュータプログラムやデータの一部若しくは全部を情報処理システム101以外の装置に保存させておいても良い。このような場合、情報処理システム101は該装置からコンピュータプログラムやデータを読み出すことになる。
外部記憶装置206は、フレキシブルディスク(FD)、CD−ROM、DVD−ROM/RAM、USBメモリ、MO、フラッシュメモリ等の記憶媒体に対する情報の読み書きを行うためのものである。記憶装置205に保存するものとして説明したコンピュータプログラムやデータの一部若しくは全部を記憶媒体に格納しておき、外部記憶装置206がこの記憶媒体からこのようなコンピュータプログラムやデータをRAM204に読み出すようにしても構わない。
入力装置207は、静止画像や動画像を撮像可能なカメラ、ユーザによるジェスチャ操作を検知するために使用される距離画像を撮像する操作用センサ、を有する。カメラは机102の上に載置される紙文書103を撮像可能な位置及び姿勢で設置されており、操作用センサは机102の上に投影される様々な情報に対するユーザのジェスチャ操作を撮像可能な位置及び姿勢で設置されている。
出力装置208は、画像や文字を投影面(上記の例では机102)上に投影するプロジェクタを有する。I/F209は、情報処理システム101が外部機器とのデータ通信を行うために使用するインターフェースとして機能するものである。
CPU202、ROM203、RAM204、記憶装置205、外部記憶装置206、入力装置207、出力装置208、I/F209、は何れもバス201に接続されている。
なお、図2(a)に示した構成は複数の装置で構成されても良く、例えば、CPU202、ROM203、RAM204、記憶装置205、外部記憶装置206、I/F209を有する情報処理装置と、入力装置207と、出力装置208と、で構成しても良い。
次に、情報処理システム101の機能構成例について、図2(b)のブロック図を用いて説明する。図2(b)に示した機能部は何れもハードウェアで実装しても良いが、本実施形態では、特定部301及び決定部304はコンピュータプログラムとして実装し、指定機能保持部302及び処理候補保持部303をRAM204や記憶装置205で実装する。
特定部301は、入力装置207が有するカメラにより撮像された撮像画像中の文書画像に対して実施可能な機能群を特定する。指定機能保持部302は、特定部301が特定した機能群からユーザが指定した機能を保持する。処理候補保持部303は、機能を実現するための複数の処理の候補を保持する。決定部304は、文書画像に対して実際に行う処理のフローを決定する。
次に、情報処理システム101が文書画像に対する処理フローを決定する為に行う処理について、図3(a)のフローチャートを用いて説明する。
ステップS4000では、入力装置207が有するカメラが、机102の上に載置された紙文書103を撮像する。カメラに撮像を指示するための方法には様々な方法がある。
例えば、ユーザによるジェスチャ操作でもってカメラに撮像を指示する方法がある。この方法では先ず、プロジェクタが撮像開始ボタンの画像を机102の上に投影する。操作用センサは机102の上の距離画像を撮像しており、撮像した距離画像から例えばユーザの指などの指示具の位置や動きを検知する。然るに、操作用センサが、ユーザが指示具でもってこの撮像開始ボタンを指定するジェスチャ操作を行ったことを検知(ジェスチャ認識)すると、CPU202は、カメラに撮像を指示する。このようなジェスチャ操作は周知のジェスチャ認識技術により認識可能である。以降のジェスチャ認識も同様にして行われる。
また、ユーザの介入無しにカメラに撮像を指示する方法もある。例えばCPU202が、紙文書103が机102の上に載置されたことを、入力装置207が有する操作用センサにより取得される距離画像を用いて検知し、該検知を契機にカメラに撮像を指示しても良い。またCPU202は、机102の上に何も置かれていない状態の距離画像と現在の距離画像との差分値(例えば距離画像間で対応する画素の画素値の差分の総和)が規定値以上となる期間が規定期間長以上続いたことを契機に、カメラに撮像を指示しても良い。
カメラによる撮像画像には紙文書103だけでなく机102も写っているため、CPU202は、撮像画像中の紙文書103の領域内の画像を文書画像として抽出する。撮像画像から文書画像を抽出する技術は周知であり、例えば、撮像画像内の輝度差を用いてエッジを抽出し、該エッジから紙面と思われる領域を特定する技術が知られている。
次にステップS4010では、CPU202は、文書画像に対して実施可能な機能群を特定する。文書画像に対して実施可能な機能群を特定するための処理には、様々な処理が考えられる。
例えば、文書画像から画像特徴量を抽出し、該抽出した画像特徴量に応じて、文書画像に対して実施可能な機能群を特定する方法がある。このような方法では、記憶装置205には、予め図5に例示するようなテーブルを登録しておく必要がある。図5のテーブルは、文書画像を特定するための画像特徴量、該画像特徴量を有する文書画像に対して実施可能な機能群、該機能群のそれぞれの属性を示す属性タイプ、該属性の値である属性値、が関連づけて登録されたテーブルである。このテーブルによれば、例えば、画像特徴量として「sift1」が抽出された文書画像に対して実施可能な機能は「PDF化」、「情報抽出」、「QRコード(登録商標)検出」、「終了」であることが特定できる。然るに、図5のテーブルを参照することで、文書画像から抽出した画像特徴量に対応する、該文書画像に対して実施可能な機能群を特定することができる。
画像特徴量としては、例えば、SIFT(Scale−Invariant Feature Transform)などの特徴量を用いることができる。画像特徴量としてSIFTを用いることで、SIFTの特徴である画像回転、照明(撮影における外光)変化に対して頑健さを活用することができる。したがって、ユーザは情報処理システム101の設置環境や紙文書103の配置向きを気にする必要性が低くなる。
なお、図5のテーブルは、文書画像で表現される文書種別を一意に特定する画像特徴量と、該画像特徴量に対応する機能群と、を対応付けて登録したものであったが、文書画像に対して実施可能な機能群を動的に決定してもよい。例えば文書画像に対して既存技術である領域解析技術を実施して、該文書画像内に存在するコンテンツの種別を特定し、該種別のコンテンツを含む文書画像に対して実施可能な機能群を特定するようにしても良い。このような場合、コンテンツの種別と、該種別のコンテンツを含む文書画像に対して実施可能な機能群と、を関連づけたテーブルを予め作成しておく必要がある。例えば、領域解析技術によりコンテンツ種別として文字領域・バーコード領域が取得できる場合、文字領域が存在する文書画像に対して実施可能な機能として「情報抽出」をテーブルに登録しておく必要がある。また、バーコード領域が存在する文書画像に対して実施可能な機能として「バーコード認識」をテーブルに登録しておく必要がある。コンテンツ種別に対して実施可能な機能を規定しておくことで、文書種別毎に機能群を規定する必要がなくなる。結果として、新しい種別の文書が本システムの処理対象として追加された場合も、新しい種別に規定済みのコンテンツ種別が含まれていれば、テーブルの更新を不要にすることができる。
そしてプロジェクタは、上記のようにして特定された「文書画像に対して実施可能な機能群」の一覧を机102の上に投影する。投影位置については特定の位置に限るものではなく、例えば、紙文書103と被らないような位置に投影する。例えば、図6(a)に示す如く、紙文書601が机102の上に載置されている場合、図6(b)に示す如く、該紙文書601の文書画像に応じた機能群の一覧602が机102の上に投影される。
ステップS4020では、CPU202は、プロジェクタによって投影された一覧から文書画像に対して実施する機能を指定するユーザ操作を受け付ける。ユーザが指示具でもって一覧から所望の機能を指定するジェスチャ操作を行ったことを操作用センサが検知すると、CPU202は、指定された機能が「終了」であるのか、それとも「終了」以外の機能であるのか、を判断する。この判断の結果、指定された機能が「終了」であれば、処理はステップS4040に進む。一方、指定された機能が「終了」以外の機能であれば、処理はステップS4030に進む。
ステップS4030では、CPU202は、図5のテーブルから、一覧からユーザによるジェスチャ操作によって指定された機能に対応する属性タイプと関連づけられている属性値を特定し、プロジェクタは、該特定した属性値を机102の上に投影する。属性タイプは属性値の形式を示すものであり、本実施形態では「項目」、「座標」、「N/A」の3種のタイプが存在し、属性タイプに応じて属性値を机102の上に投影する。
機能群の一覧からユーザによるジェスチャ操作によって指定された機能に対応する属性タイプが「項目」タイプの場合、プロジェクタによって「高圧縮」、「サーチャブル」の一覧が机102の上に投影される。例えば、図6(b)に示す如く、機能群の一覧602が投影されている状態においてユーザによるジェスチャ操作によって「PDF化」が指定されると、図6(c)に示す如く、対応する属性値「高圧縮」、「サーチャブル」の一覧が投影される。ユーザが指示具でもって属性値の一覧から所望の属性値を指定するジェスチャ操作を行ったことを操作用センサが検知すると、CPU202は、該指定された属性値を、機能の一覧からユーザが指定した機能、該機能の指定順序と共にテーブルに登録する。例えば、最初に指定した機能Aを、該機能Aの属性値、指定順序「1」と共に保存し、その次に指定した機能Bを、該機能Bの属性値、指定順序「2」と共に保存する。そして処理はステップS4020に進む。
機能群の一覧からユーザによるジェスチャ操作によって指定された機能に対応する属性タイプが「座標」タイプの場合、プロジェクタは、対応する属性値で規定される領域に相当する紙文書上の領域に枠や半透明の色で塗りつぶした図形を投影する。図5では、文書画像において左上隅の座標位置が(x1,y1)で幅w1、高さh1の領域、左上隅の座標位置が(x2,y2)で幅w2、高さh2の領域、のそれぞれに対応する紙文書上の領域に枠や半透明の色で塗りつぶした図形を投影する。例えば図6(b)に示す如く、機能群の一覧602が投影されている状態においてユーザによるジェスチャ操作によって「情報抽出」が指定されると、図6(d)に示す如く、対応する属性値で規定される領域に相当する紙文書上の領域604に枠が投影される。ユーザが指示具でもって1以上の枠や図形を指定し、該指定を完了させるジェスチャ操作を行ったことを操作用センサが検知したとする。このときCPU202は、該指定された枠や図形を規定する情報を、機能の一覧からユーザが指定した機能、該機能の指定順序と共にテーブルに登録する。そして処理はステップS4020に進む。なお、枠や図形の形やサイズをジェスチャ操作によって変更しても良い。
機能群の一覧からユーザによるジェスチャ操作によって指定された機能に対応する属性タイプが「N/A」の場合は、CPU202は、機能の一覧からユーザが指定した機能を、該機能の指定順序と共にテーブルに登録する。そして処理はステップS4020に進む。
ステップS4030において、指定順序、機能の一覧から指定した機能、該機能の属性値(属性情報)、が登録されたテーブルの構成例を図7(a)に示す。図7(a)では、機能の一覧から最初に「QRコード(登録商標)検出」が指定されているため、機能「QRコード(登録商標)検出」が指定順序「1」と共にテーブルに登録されている。なお、「QRコード(登録商標)検出」の属性タイプは「N/A」であるため、属性情報としては何も登録されない。一方、図7(a)では、機能の一覧から2番目に「情報抽出」が指定されているため、機能「情報抽出」が指定順序「2」と共にテーブルに登録されている。また、図7(a)では、「情報抽出」の属性値として(x1,x2,w1,h1)が指定されたため、属性情報として(x1,x2,w1,h1)が指定順序「2」及び機能「情報抽出」と関連づけてテーブルに登録される。また、ステップS4030では、上記の如く、指定した機能を表すアイコンがプロジェクタにより机102の上に投影される。
ステップS4040では、CPU202は、図7(a)のテーブルに登録した各機能について、該機能を実現するための処理の候補を複数取得する。例えば、図7(b)に例示するテーブルを予め作成して記憶装置205に登録しておき、図7(a)のテーブルに登録した各機能について、該機能に対応する処理候補を図7(b)のテーブルから取得する。図7(a)の場合、機能として「QRコード(登録商標)検出」、「情報抽出」が登録されている。然るにこのような場合は、「QRコード(登録商標)検出」を実現するための処理の候補として以下の2つの処理候補が図7(b)のテーブルから取得される。
(処理候補1−1) 文字抽出用二値化 → QRコード(登録商標)検出
(処理候補1−2) 表抽出用二値化 → QRコード(登録商標)検出
また、「情報抽出」を実現するための処理の候補として以下の4つの処理候補が図7(b)のテーブルから取得される。
(処理候補1−2) 表抽出用二値化 → QRコード(登録商標)検出
また、「情報抽出」を実現するための処理の候補として以下の4つの処理候補が図7(b)のテーブルから取得される。
(処理候補2−1) 文字抽出用二値化 → 活字OCR
(処理候補2−2) 文字抽出用二値化 → 手書きOCR
(処理候補2−3) 表抽出用二値化 → 活字OCR
(処理候補2−4) 表抽出用二値化 → 手書きOCR
ステップS4050では、CPU202は、図7(a)のテーブルに登録した各機能について、該機能に対応する複数の処理候補のうち1つを決定する。ステップS4050における処理の詳細について、図3(b)のフローチャートを用いて説明する。
(処理候補2−2) 文字抽出用二値化 → 手書きOCR
(処理候補2−3) 表抽出用二値化 → 活字OCR
(処理候補2−4) 表抽出用二値化 → 手書きOCR
ステップS4050では、CPU202は、図7(a)のテーブルに登録した各機能について、該機能に対応する複数の処理候補のうち1つを決定する。ステップS4050における処理の詳細について、図3(b)のフローチャートを用いて説明する。
ステップS9000では、CPU202は、図7(a)のテーブルに登録されている各機能に対応する複数の処理候補(図7(b))を用いて、各機能に対応する処理候補の組み合わせを作成する。すなわちCPU202は、図7(a)のテーブルに登録されている機能を指定順序で実現する処理フローとして複数種類の処理フローを作成する。図7(a)のテーブルでは、文書画像に対して1番目に実施する機能が「QRコード(登録商標)検出」であり、2番目に実施する機能が「情報抽出」であることを規定している。ここで上記の通り、「QRコード(登録商標)検出」を実現するための処理の候補として上記の2つの処理候補が図7(b)のテーブルで規定されており、「情報抽出」を実現するための処理の候補として上記の4つの処理候補が図7(b)のテーブルで規定されている。然るに、このような場合は、以下の8種類の処理フローを作成することができる。
「QRコード(登録商標)検出」を実現するために(処理候補1−1)を実行し、「情報抽出」を実現するために(処理候補2−i)(i=1,2,3,4)を実行する処理フロー(4種類の処理フロー)
「QRコード(登録商標)検出」を実現するために(処理候補1−2)を実行し、「情報抽出」を実現するために(処理候補2−i)(i=1,2,3,4)を実行する処理フロー(4種類の処理フロー)
なお、処理候補の中には、閾値などのパラメータを含むものもあるので、同じ処理フローでもパラメータを変化させることで更に複数の処理フローを作成することも可能である。作成した複数の処理フローの一例を図10に示す。
「QRコード(登録商標)検出」を実現するために(処理候補1−2)を実行し、「情報抽出」を実現するために(処理候補2−i)(i=1,2,3,4)を実行する処理フロー(4種類の処理フロー)
なお、処理候補の中には、閾値などのパラメータを含むものもあるので、同じ処理フローでもパラメータを変化させることで更に複数の処理フローを作成することも可能である。作成した複数の処理フローの一例を図10に示す。
図10では、作成したそれぞれの処理フローに固有の番号(パターンNo)が割り当てられており、同じ処理フローでもパラメータ(ここでは二値化に用いる閾値)を変えることで更に複数の処理フローが作成されている。例えば、パターンNo=1の処理フローとパターンNo=2の処理フローとは同じ処理フローであるが、パターンNo=1の処理フローでは機能「QRコード(登録商標)検出」を実現する処理に含まれている部分処理である文字抽出用二値化で用いる閾値をth1としている。一方、パターンNo=2の処理フローでは、機能「QRコード(登録商標)検出」を実現する処理に含まれている部分処理である文字抽出用二値化において用いる閾値をth2としている。
ステップS9010では、CPU202は、上記のステップS4000において取得した文書画像に対して、ステップS9000において作成したそれぞれの処理フローを実施して、該それぞれの処理フローに対する評価値を求める。評価値には様々なものを適用することができるが、例えば、情報抽出機能を実現するために使用されるOCR処理では文字認識結果の確からしさを示すスコアを出力するので、このスコアを評価値として採用しても良い。なお、処理フローのスコアをそのまま該処理フローの評価値とするのではなく、処理フローごとに重み値を設定しておき、該処理フローのスコアに該処理フローの重み値を乗算した結果を該処理フローの評価値としても良い。この重み値は、スコアを正規化するものであっても良いし、処理フローに応じてユーザが設定した値であっても良い。スコアを正規化することで、評価値の算出方法が異なる処理フローにおける評価値の整合性を確保することができる。
ステップS9020では、CPU202は、ステップS9000において作成したそれぞれの処理フローのうち1以上を該それぞれの処理フローの評価値に基づいて選択する。本ステップにおける処理フローの選択方法には様々な選択方法法が考えられる。
例えば、それぞれの処理フローのうち評価値が最も大きい処理フローを選択する方法がある。また、評価値が大きい順に上位N(Nは2以上の整数)個の処理フローを選択し、該選択したN個の処理フローをプロジェクタでもって机102の上に投影して、ユーザに選択させても良い。ユーザによる処理フローの選択方法は、上記のジェスチャ操作で行えばよい。そしてCPU202は、選択した処理フローを示す情報をRAM204や記憶装置205に登録する。なお、CPU202は、選択した処理フローを示す情報を登録する代わりに若しくは加えて、該選択した処理フローを文書画像に対して実行しても良い。
図7(a)に示した機能を指定順序に実現する場合において、各機能に対応する複数の処理候補が図7(b)に示されているような処理候補である場合に、各機能と、各機能で行う処理と、の関係を図3(c)に示す。図7(a)のテーブルによって機能フローとして規定された「QRコード(登録商標)検出」→「情報抽出」を実現する場合に行う処理フローとして「文字抽出用二値化」→「QRコード(登録商標)検出」→「文字抽出用二値化」→「手書きOCR」が特定されたことがわかる。このように、本実施形態によれば、ユーザが文書画像に対して実施する機能を実現する処理の知識を持たなくとも、機能フローを設計することが可能になる。
[第2の実施形態]
本実施形態を含め、以下の各実施形態では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。本実施形態では、上記のステップS4050では、図8(a)のフローチャートに従った処理を行う。図8(a)のフローチャートにおいて図3(b)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
本実施形態を含め、以下の各実施形態では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。本実施形態では、上記のステップS4050では、図8(a)のフローチャートに従った処理を行う。図8(a)のフローチャートにおいて図3(b)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
ステップS12010では、CPU202は、ステップS9000において作成した各処理フローについて、該処理フロー中の処理で重複する処理があれば該重複する処理のうちより後段の処理を該処理フローから削除する。例えば、図10のパターンNo=1の処理フローでは、閾値th1を使用する文字抽出用二値化が2回登場しているため、該処理フローの先頭から2つ目の文字抽出用二値化を削除することで該処理フローを更新する。
図7(a)に示した機能を指定順序で実施する場合において、各機能に対応する複数の処理候補が図7(b)に示されているような処理候補である場合に、各機能と各機能で行う処理との関係を第1の実施形態と本実施形態とで対比したものを図8(b)に示す。図7(a)のテーブルによって機能フローとして規定された「QRコード(登録商標)検出」→「情報抽出」を実現する場合に行う処理フローが、第1の実施形態では、「文字抽出用二値化」→「QRコード(登録商標)検出」→「文字抽出用二値化」→「手書きOCR」となったとする。このとき本実施形態では、上記のステップS12010の処理により、重複する2つの「文字抽出用二値化」のうち後段の「文字抽出用二値化」をこの処理フローから削除する。このように、第1の実施形態に対して、文字抽出用二値化の処理が1回少ない処理フローになっていることがわかる。このように、本実施形態によれば、処理フローを評価するための処理の負荷や、実際に決定された処理フローを実施する際の処理の負荷を軽減することが可能になる。
[第3の実施形態]
本実施形態では、上記のステップS4050では、図4(a)のフローチャートに従った処理を行う。図4(a)のフローチャートにおいて図3(b)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
本実施形態では、上記のステップS4050では、図4(a)のフローチャートに従った処理を行う。図4(a)のフローチャートにおいて図3(b)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付しており、該処理ステップに係る説明は省略する。
ステップS14010では、CPU202は、ステップS9000において作成した各処理フローについて、該処理フローにおいて連続する処理の間の依存性を判定し、依存性がない場合は、該処理フローを並列処理する2以上の並列処理フローに分解する。例えば、図10のパターンNo=1の処理フローでは、QRコード(登録商標)検出と、該QRコード(登録商標)検出の直後に実施される文字抽出用二値化と、は依存しない関係である。したがって、パターンNo=1の処理フローを、「文字抽出用二値化→QRコード(登録商標)検出」の処理、「文字抽出用二値化→活字OCR」の処理、の2つに分け、それぞれの処理を並列に実行するようにする。処理間の依存性判断は予め規定しておいてもよい。また、実際に処理を実施した結果、処理結果に違いが生じるかを検知し、処理結果に違いが生じない場合は、依存性がないと判断する方法でもよい。
図7(a)に示した機能を指定順序に実現する場合において、各機能に対応する複数の処理候補が図7(b)に示されているような処理候補である場合に、各機能と各機能で行う処理との関係を第1の実施形態と本実施形態とで対比したものを図4(b)に示す。図7(a)のテーブルによって機能フローとして規定された「QRコード(登録商標)検出」→「情報抽出」を実現する場合に行う処理フローが、第1の実施形態では、「文字抽出用二値化」→「QRコード(登録商標)検出」→「文字抽出用二値化」→「手書きOCR」となったとする。このとき本実施形態では、上記のステップS14010の処理により、この処理フローを、「文字抽出用二値化→QRコード(登録商標)検出」の処理、「文字抽出用二値化→手書きOCR」の処理、の2つに分け、それぞれの処理を並列に処理するようにする。このように、第1の実施形態に対して、独立して実施可能な処理が並列化されているため、CPUのコアが多数存在する環境では処理速度の向上が期待できる。
[第4の実施形態]
本実施形態では、第2の実施形態及び第3の実施形態で説明した両方の処理をステップS4050において行う。本実施形態では、上記のステップS4050では、図9(a)のフローチャートに従った処理を行う。図9(a)のフローチャートにおいて図3(b)、4(a)、8(a)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付している。
本実施形態では、第2の実施形態及び第3の実施形態で説明した両方の処理をステップS4050において行う。本実施形態では、上記のステップS4050では、図9(a)のフローチャートに従った処理を行う。図9(a)のフローチャートにおいて図3(b)、4(a)、8(a)のフローチャートにおける処理ステップと同じ処理ステップには同じステップ番号を付している。
図7(a)に示した機能を指定順序に実現する場合において、各機能に対応する複数の処理候補が図7(b)に示されているような処理候補である場合に、各機能と各機能で行う処理との関係を第1の実施形態と本実施形態とで対比したものを図9(b)に示す。図7(a)のテーブルによって機能フローとして規定された「QRコード(登録商標)検出」→「情報抽出」を実現する場合に行う処理フローが、第1の実施形態では、「文字抽出用二値化」→「QRコード(登録商標)検出」→「文字抽出用二値化」→「手書きOCR」となったとする。このとき本実施形態では先ず、上記のステップS12010の処理により、重複する2つの「文字抽出用二値化」のうち後段の「文字抽出用二値化」をこの処理フローから削除することでこの処理フローを更新する。そして次に、上記のステップS14010の処理により、この更新した処理フローにおいて、「QRコード(登録商標)検出」の処理、「手書きOCR」の処理、2つの処理を「文字抽出用二値化」の後に並列に行う処理とする。このように、第1の実施形態の方法に対して、文字抽出用二値化の処理が1回少なく、「QRコード(登録商標)検出」と「手書きOCR」が並列化された処理フローになっていることがわかる。このように、本実施形態によれば、処理フローにおける重複処理の削除と依存性のない処理の並列化により、処理負荷の軽減、処理の効率化を実現することが可能になる。
<変形例>
上記の各実施形態で説明した構成は何れも、特定の機能、特定の処理に限ったものではない。また、紙文書は机以外の面上に載置しても良い。また、上記の各実施形態では、機能や属性値の一覧、ユーザが指定した機能に対応するアイコンは何れもプロジェクタによって机の上に投影していた。しかし、これらの情報をユーザに提示できるのであれば、これらの情報をプロジェクタで投影しなくても、例えば、タッチパネル画面にこれらの情報を表示するようにしても良い。この場合、ユーザはジェスチャ操作ではなく、タッチパネル画面上をタッチしたりすることで、例えば一覧から所望の対象を指定することができる。なお、アイコンの代わり若しくは加えて、ユーザが指定した機能を表す他の情報を投影/表示しても良い。
上記の各実施形態で説明した構成は何れも、特定の機能、特定の処理に限ったものではない。また、紙文書は机以外の面上に載置しても良い。また、上記の各実施形態では、機能や属性値の一覧、ユーザが指定した機能に対応するアイコンは何れもプロジェクタによって机の上に投影していた。しかし、これらの情報をユーザに提示できるのであれば、これらの情報をプロジェクタで投影しなくても、例えば、タッチパネル画面にこれらの情報を表示するようにしても良い。この場合、ユーザはジェスチャ操作ではなく、タッチパネル画面上をタッチしたりすることで、例えば一覧から所望の対象を指定することができる。なお、アイコンの代わり若しくは加えて、ユーザが指定した機能を表す他の情報を投影/表示しても良い。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
301:特定部 302:指定機能保持部 303:処理候補保持部 304:決定部
Claims (10)
- 文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定する特定手段と、
前記機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する取得手段と、
前記それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定し、前記それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、前記文書画像に対する処理フローとして決定する決定手段と
を備えることを特徴とする情報処理装置。 - 前記特定手段は、前記文書画像の画像特徴量に対して予め関連づけられている機能群を特定することを特徴とする請求項1に記載の情報処理装置。
- 前記特定手段は、前記文書画像に含まれているコンテンツの種別に対して予め関連づけられている機能群を特定することを特徴とする請求項1に記載の情報処理装置。
- 前記決定手段は、
前記それぞれの指定機能に対応する複数の候補処理の組み合わせを用いて、前記それぞれの指定機能に対応する候補処理の組み合わせを複数、作成する作成手段と、
前記作成手段が作成したそれぞれの組み合わせを前記文書画像に対して実行した結果に基づいて、該作成したそれぞれの組み合わせのうち1つの組み合わせを決定する手段と
を備えることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。 - 前記候補処理は複数の部分処理を有し、
前記作成手段は、前記組み合わせ中の部分処理において重複する部分処理があれば、該重複する部分処理のうちより後段の部分処理を削除することで該組み合わせを更新することを特徴とする請求項4に記載の情報処理装置。 - 前記候補処理は複数の部分処理を有し、
前記作成手段は、前記組み合わせにおいて依存しない関係にあるそれぞれの部分処理を並列に実行する部分処理とするように該組み合わせを更新することを特徴とする請求項4又は5に記載の情報処理装置。 - 更に、
撮像装置によって撮像された文書の撮像画像から該文書の領域内の画像を前記文書画像として取得する手段を備えることを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。 - 更に投影手段を備え、
前記投影手段は、前記特定手段が特定した機能群の一覧を投影し、
前記指定機能は、該一覧からユーザによって指定された機能であることを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。 - 情報処理装置が行う情報処理方法であって、
前記情報処理装置の特定手段が、文書画像に対して実行可能な機能群を、該文書画像に対する解析結果に応じて特定する特定工程と、
前記情報処理装置の取得手段が、前記機能群のうちユーザによって指定されたそれぞれの指定機能について、該指定機能を実現するために実行する処理の候補として複数の候補処理を取得する取得工程と、
前記情報処理装置の決定手段が、前記それぞれの指定機能について、該指定機能を実現するために実行する処理を該指定機能に対応する複数の候補処理から決定し、前記それぞれの指定機能の指定順に該指定機能について決定した処理を実行する処理フローを、前記文書画像に対する処理フローとして決定する決定工程と
を備えることを特徴とする情報処理方法。 - コンピュータを、請求項1乃至8の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139698A JP2018010528A (ja) | 2016-07-14 | 2016-07-14 | 情報処理装置、情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016139698A JP2018010528A (ja) | 2016-07-14 | 2016-07-14 | 情報処理装置、情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018010528A true JP2018010528A (ja) | 2018-01-18 |
Family
ID=60995418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016139698A Pending JP2018010528A (ja) | 2016-07-14 | 2016-07-14 | 情報処理装置、情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018010528A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153930A (ja) * | 2018-03-02 | 2019-09-12 | 株式会社リコー | 情報処理装置、情報処理方法、プログラム |
-
2016
- 2016-07-14 JP JP2016139698A patent/JP2018010528A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019153930A (ja) * | 2018-03-02 | 2019-09-12 | 株式会社リコー | 情報処理装置、情報処理方法、プログラム |
CN111788590A (zh) * | 2018-03-02 | 2020-10-16 | 株式会社理光 | 信息处理系统、信息处理方法和记录介质 |
JP7167450B2 (ja) | 2018-03-02 | 2022-11-09 | 株式会社リコー | 情報処理装置、情報処理方法、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5084718B2 (ja) | 位置コーディングパターンとバーコードの組合せ検出 | |
US9292186B2 (en) | Note capture and recognition with manual assist | |
US9402025B2 (en) | Detection apparatus, method for detecting feature point and storage medium | |
WO2014045953A1 (ja) | 情報処理装置および方法、並びにプログラム | |
WO2015057804A1 (en) | Organizing digital notes on a user interface | |
JP7102103B2 (ja) | 携帯型の情報処理装置及び当該情報処理装置を用いた方法及びプログラム | |
JP2019525365A (ja) | コンピュータプログラムを生成するデバイス及びコンピュータプログラムを生成する方法 | |
US20150220800A1 (en) | Note capture, recognition, and management with hints on a user interface | |
WO2016006090A1 (ja) | 電子機器、方法及びプログラム | |
JP2018088116A (ja) | 情報処理装置、プログラム、情報処理方法 | |
JP2014006594A (ja) | 文字入力プログラム、情報処理装置および文字入力方法 | |
JP2016103137A (ja) | ユーザインタフェース装置、画像処理装置及び制御用プログラム | |
JP2017120503A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
US10134138B2 (en) | Information processing apparatus, computer-readable storage medium, information processing method | |
JP6229554B2 (ja) | 検出装置および検出方法 | |
JP2018010528A (ja) | 情報処理装置、情報処理方法 | |
JP2015184906A (ja) | 肌色検出条件決定装置、肌色検出条件決定方法及び肌色検出条件決定用コンピュータプログラム | |
JP2017199288A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2014209326A (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
US20130187893A1 (en) | Entering a command | |
JP2014219822A (ja) | コンテンツ表示装置、コンテンツ表示方法、プログラム、及び、コンテンツ表示システム | |
JP2018180986A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6273686B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP6639257B2 (ja) | 情報処理装置及びその制御方法 | |
JP6582954B2 (ja) | 書画カメラ装置、切り抜き支援方法及びプログラム |