JP2015026266A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2015026266A JP2015026266A JP2013155633A JP2013155633A JP2015026266A JP 2015026266 A JP2015026266 A JP 2015026266A JP 2013155633 A JP2013155633 A JP 2013155633A JP 2013155633 A JP2013155633 A JP 2013155633A JP 2015026266 A JP2015026266 A JP 2015026266A
- Authority
- JP
- Japan
- Prior art keywords
- information
- gesture
- electronic
- paper
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
【課題】 資料の分かりやすい説明履歴を反映したフローを生成することができなかった。
【解決手段】 任意の時刻に物体または電子データの位置情報を取得し、前記物体または電子データに対するジェスチャ情報を検出し、前記ジェスチャ情報を検出した時刻と共に記憶し、前記ジェスチャ情報により指定された前記物体または電子データの領域情報を時間順に並べて履歴を生成することにより、実際に資料を説明した履歴から、その資料を説明するのに適切なフローを生成することができる。
【選択図】 図3
【解決手段】 任意の時刻に物体または電子データの位置情報を取得し、前記物体または電子データに対するジェスチャ情報を検出し、前記ジェスチャ情報を検出した時刻と共に記憶し、前記ジェスチャ情報により指定された前記物体または電子データの領域情報を時間順に並べて履歴を生成することにより、実際に資料を説明した履歴から、その資料を説明するのに適切なフローを生成することができる。
【選択図】 図3
Description
本発明は、文書内に存在する複数の情報の説明履歴から文書を説明するフローを生成する技術に関するものである。
販売員が顧客にパンフレットやカタログなどを用いて商品を説明する場面において、販売員の説明を支援するシステムがある。例えば、特許文献1では、商品ごとの説明の流れを予めベテラン販売員が作成しておき、実際に販売員がその商品を説明するときには、その説明の流れをモニターなどに表示をすることで支援するシステムが提案されている。
紙のパンフレットやカタログを用いて説明したり、電子情報を投影して記載されている複数の情報を説明したりする場合に、実際に行われるこれらの資料の説明から使用された情報の履歴を取得することができなかった。
本発明は上記の課題に鑑みてなされたものであり、資料の分かりやすい説明履歴を反映したフローを生成する装置を提供することを目的とする。また、その方法及びプログラムを提供することを目的とする。
本発明は上記の課題に鑑みてなされたものであり、資料の分かりやすい説明履歴を反映したフローを生成する装置を提供することを目的とする。また、その方法及びプログラムを提供することを目的とする。
撮像装置、表示装置、ジェスチャ取得装置を持つシステムにおいて、1つ以上の紙文書または表示されている電子情報の位置取得する文書位置取得手段と、文書位置取得手段によって得られた文書位置を時刻情報と共に記憶する文書位置記憶手段、と紙文書または表示された電子情報に対する1つ以上のジェスチャ位置を検出するジェスチャ位置検出手段と、ジェスチャ位置検出手段によって取得されたジェスチャ位置情報を時刻情報と共に記憶するジェスチャ位置記憶手段と、1つ以上の紙文書または表示されている情報のレイアウト情報を取得するレイアウト情報取得手段と、レイアウト情報取得手段によって得られたレイアウト情報を時刻情報と共に記憶するレイアウト情報記憶手段と、文書位置記憶手段と前記ジェスチャ位置記憶手段と前記レイアウト情報記憶手段に記憶された情報に基づいて説明フローを生成する手段とを有する。
実際に資料を説明した履歴から、その資料を説明するのに適切なフローを生成することができる。
以下に、図面を参照して、この発明の好適な実施の形態を詳しく説明する。なお、以下の実施形態では、本発明を特定の状況に対応したアプリケーションの一機能として説明しているが、あくまで例示であり、本発明の範囲を限定する趣旨のものではない。
<第1の実施形態>
図1(a)は、本実施形態における情報処理装置100のハードウェア構成図である。同図において、CPU101は、CPU(Central Processing Unit)であり、各種処理のための演算や論理判断などを行い、システムバス108に接続された各構成要素を制御する。ROM(Read−Only Memory)102は、後述するフローチャートに示す各種処理手順を含むCPUによる制御のためのプログラムデータを格納する。RAM103(Random Access Memory)103は、データメモリであり、CPU101の上記プログラムのワーク領域、エラー処理時のデータの退避領域、上記制御プログラムのロード領域などを有する。記憶装置104はハードディスクや外部に接続された記憶装置などからなり、本実施形態に係る電子データなどの各種データやプログラムを記憶する。CPU101は、ROM102もしくは記憶装置104に記憶された処理ステップやプログラムを読み出して実行する。これらの処理ステップやプログラムは、ディスクデバイスを始めとする記憶媒体から読み出されたり、ネットワーク通信によって取得されたりして、ROM102もしくは記憶装置104に記憶されることができる。その際CPU101がコントローラとして機能する。本実施形態において、CPU101は、図3などのフローチャートに示された工程を実行することで、後述する情報処理装置100の各機能部として動作する。
図1(a)は、本実施形態における情報処理装置100のハードウェア構成図である。同図において、CPU101は、CPU(Central Processing Unit)であり、各種処理のための演算や論理判断などを行い、システムバス108に接続された各構成要素を制御する。ROM(Read−Only Memory)102は、後述するフローチャートに示す各種処理手順を含むCPUによる制御のためのプログラムデータを格納する。RAM103(Random Access Memory)103は、データメモリであり、CPU101の上記プログラムのワーク領域、エラー処理時のデータの退避領域、上記制御プログラムのロード領域などを有する。記憶装置104はハードディスクや外部に接続された記憶装置などからなり、本実施形態に係る電子データなどの各種データやプログラムを記憶する。CPU101は、ROM102もしくは記憶装置104に記憶された処理ステップやプログラムを読み出して実行する。これらの処理ステップやプログラムは、ディスクデバイスを始めとする記憶媒体から読み出されたり、ネットワーク通信によって取得されたりして、ROM102もしくは記憶装置104に記憶されることができる。その際CPU101がコントローラとして機能する。本実施形態において、CPU101は、図3などのフローチャートに示された工程を実行することで、後述する情報処理装置100の各機能部として動作する。
撮像装置105は、ユーザが操作を行う作業空間を撮像し、入力画像としてシステムに提供する。ジェスチャ取得装置106は、ユーザが操作を行う作業空間を撮像しユーザのジェスチャを取得しシステムに提供する。投影装置107は後述する作業台122に電子データやユーザインタフェース部品を含む映像を投影する。本実施形態では説明の簡略化のため、撮像装置105の位置と撮像画角、ジェスチャ取得装置106の位置と撮影画角、投影装置107の位置と投影画角が固定の場合を例にして説明する。なお、本実施形態では、撮像装置105、ジェスチャ取得装置106、投影装置107は、情報処理装置100内に構成されるが、有線あるいは無線のインターフェースによって接続された外部装置でも良い。
図1(b)は、本実施形態における情報処理装置100の機能構成を表す図である。同図において、撮像部110は、カメラやビデオカメラ等の撮像装置105であって、作業台で上向きに置かれた対象物を上方から撮像し画像データを出力する。また、本実施形態の撮像部110は、作業台の上面全体を撮像範囲に含む。
本実施形態では、後述する各機能部は、CPU101がROM102に格納された各プログラムをRAM103に展開し実行することでその機能を実現する。ただし、本発明は、これらの機能部をハードウェアで実現する情報処理装置によっても同様に実現可能である。
ジェスチャ取得部111は、CPU、ROM、RAM(以下、CPU等)によって構成され、撮影範囲内に行われた使用者の手の動きや手に持った物体の動きをジェスチャとして検出し、作業台上における位置と高さを示す情報を取得する。高さがある一定値以下である場合を「作業台が触れられている状態」と判断する。
紙領域検出部112は、CPU等から構成され、撮像部110から入力された画像データから複数の対象物を検出し、作業台上における対象物の位置を示す情報を取得する。ここで、対象物に含まれる情報とは、文字や画像など対象物の読み取り対象面に記載されている情報である。紙領域の検出処理は、撮像部110から入力される全画像または一定間隔の画像に対して行われる。さらにジェスチャ取得部111からのジェスチャ情報を元に、紙領域検出部112で検出した紙に対してジェスチャが写り込んでいない全紙面が取得されている画像データを選別する処理を行う。
特徴抽出部113は、CPU等から構成され、紙領域検出部112で検出された各紙の領域から文書を特定するための特徴量を取得する。また紙領域検出部112が検出した紙の領域にジェスチャが重なっていなければ、取得した特徴量を記憶部115に入力する。
文書判定部114は、CPU等から構成され、特徴抽出部113で抽出された特徴量と記憶部115に記憶されている特徴量を比較して文書を判定し、紙領域検出部112が出力した紙領域と文書の対応付けを行う。特徴量の比較の結果、一致する文書が無ければ、既存文書と区別可能な番号を付ける。比較する特徴量は、手が写り込んでいない紙から得られた特徴量で比較している。
レイアウト解析部116は、紙領域検出部112が選別した全紙面が取得されている画像データから文書のレイアウトを取得する。撮像部110で撮像された画像データが図9(a)に示すものであったとき、この画像からから紙領域検出部112が検出した1つ紙文書の領域情報を用いて1枚分の紙領域画像を切り出す。切り出された画像データは、図9(b)のようになる。この画像から文書のレイアウト情報を取得する。レイアウト情報としては、文字領域、写真領域、グラフや線画などを含むラインアート領域、線などが取得可能である。レイアウト情報は、紙文書内での座標で表されることになる。
記憶部115は、RAM103に相当し、以下の情報を時刻情報と共に記憶する。
・ジェスチャ取得部111が取得したジェスチャ情報
・紙領域検出部112が検出した各紙領域の位置情報
・特徴抽出部113が検出したジェスチャの重ならない全紙面が取得されている領域の特徴量
・文書判定部114が出力した各紙領域の文書番号
・レイアウト解析部116が出力したレイアウト情報
ジェスチャ選択部117は、CPU等から構成され、記憶部115に記憶されているジェスチャの情報から説明に使われたジェスチャを選択する。紙文書を使用して行われる場合は、紙文書が動かないように紙を押さえる操作が行われることが多い。紙を押さえる動作と説明位置を指し示すジェスチャを区別するために、記憶部115に記憶されている紙の位置情報を用いる。例えば紙を触った位置が紙の端に近い場合や、同一位置に一定の時間以上留まっている場合は紙を押さえる動作と判断する。紙を押さえる操作は資料を説明するジェスチャではないので、説明履歴として記憶するジェスチャから除外する。
・ジェスチャ取得部111が取得したジェスチャ情報
・紙領域検出部112が検出した各紙領域の位置情報
・特徴抽出部113が検出したジェスチャの重ならない全紙面が取得されている領域の特徴量
・文書判定部114が出力した各紙領域の文書番号
・レイアウト解析部116が出力したレイアウト情報
ジェスチャ選択部117は、CPU等から構成され、記憶部115に記憶されているジェスチャの情報から説明に使われたジェスチャを選択する。紙文書を使用して行われる場合は、紙文書が動かないように紙を押さえる操作が行われることが多い。紙を押さえる動作と説明位置を指し示すジェスチャを区別するために、記憶部115に記憶されている紙の位置情報を用いる。例えば紙を触った位置が紙の端に近い場合や、同一位置に一定の時間以上留まっている場合は紙を押さえる動作と判断する。紙を押さえる操作は資料を説明するジェスチャではないので、説明履歴として記憶するジェスチャから除外する。
特徴量決定部118は、CPU等から構成され、記憶部115に記憶されている各紙の複数の特徴量から少なくとも1つ以上の特徴量を決定する。保険商品について説明が行われている間、1つの紙文書について何度も特徴量が取得されることになる。それらの特徴量から絞り込むために行っている。処理方法としては、例えば全部でN個の特徴量があった場合、1つの特徴量を選択し残りN−1個の特徴量とのマッチングを行い類似度の平均値を求める。全N個の特徴量に対して平均の類似度を求め、類似度が最大となった特徴量を選択する。また、1つに絞り込まず平均の類似度の上位M個を選択することや、類似度の絶対値がある一定値以上のものを選択することも可能である。特徴量がx次元のベクトルとして表現できる場合は、全特徴ベクトルの平均ベクトルを算出して特徴量としても良い。また、平均値に対して一番距離が近い特徴量を選択しても良い。
レイアウト情報決定部119は、CPU等から構成され、記憶部115に記憶されている各紙文書の複数のレイアウト情報からその紙文書のレイアウト情報を1つに決定する。
投影部120は、投影装置106に相当し、各処理部が検出した結果や各種電子データを投影する。例えば、ジェスチャ取得部111によって得られたジェスチャに対する応答をユーザに示す。紙領域検出部112が検出した紙の位置に合わせて枠などを投影する。レイアウト解析部116が出力したレイアウト情報を実際の紙に合わせて投影する。
フロー生成部121は、ジェスチャ選択部117から出力されたジェスチャ情報と記憶部115に蓄積された各紙文書の作業台に対しての位置情報、レイアウト情報決定部119で決定された各紙文書のレイアウト情報から、使用された紙文書および各紙文書の領域の順番を決定し説明フローを生成する。
ここで図1(c)は、本実施形態における情報処理装置100の外観の一例を示す図である。本実施形態では、作業台122に対し、撮像装置105は上部に設置され、作業台122に上向きに置かれた紙文書123を俯瞰撮像し、上に向いた読み取り対象面を読み取る。ジェスチャ取得装置106も同様に、作業台122の上面を俯瞰撮像することでユーザの操作ジェスチャを取得する。投影装置107は、作業台122の上面に、ユーザインタフェースを構成する画像や記憶部115に記憶された電子データ、情報処理装置100が生成した電子データ等を含む投影画像を投影する。本実施形態では、撮像装置105、ジェスチャ取得装置106、投影装置107は同一の筐体で構成される。ただし、撮像装置105、ジェスチャ取得装置106、投影装置107それぞれの設置位置と撮像画角の情報を情報処理装置が予め把握されていれば、それぞれ別の場所に設置されてもよい。また、本実施形態では、投影装置107が作業台の上面に投影を行っているが、これに限らず、一般的なディスプレイなどの表示装置を構成しても良い。またジェスチャとして取得する情報がユーザの触った位置だけで足りるのであれば、作業台122の表面に接触型のセンサを配置することによってジェスチャを取得しても良い。
以下では、本実施形態を実現する環境の一例として、保険代理店で販売員と顧客が対面し、保険パンフレットを用いて販売員が顧客に保険商品の説明をする例で説明をする。まず、図2および図3を用いて基本的な本実施形態での動作例を説明する。図2(a)は情報処理装置100の作業台122上に保険商品のパンフレット201が置かれた状態を表している。向かって手前側に顧客がおり、奥側に販売員がいるものとする。販売員は商品の説明をするために、図2(b)のように説明したい紙文書を作業台122に置く。
図3(a)は、この情報処理装置100の概略のフローチャートである。以下、フローチャートは、CPUが制御プログラムを実行することにより実現されるものとする。
販売員が説明の開始時にシステムを起動することで、図3(a)のフローチャートに従った処理が行われる。ステップS3001は、システムがジェスチャ取得装置106を使って販売員や顧客の行うジェスチャを取得するステップである。ステップS3002は、システムが撮像装置105を使って作業台122に置かれた紙文書の位置や種類、投影装置107で作業台に投影された電子情報の位置や種類を取得するステップである。ステップS3003は販売員によって行われた説明履歴を取得し、そのフローを生成するステップであり、販売員の説明終了をトリガーに実行される。販売員の説明終了は、販売員によって指示されても良いし、各装置の電源を切るなどのイベントを検知することによって自動的に判断されても良い。
図3(b)は図3(a)のジェスチャログ取得ステップのS3001の詳細を示したフローチャートである。ステップS3101はジェスチャ取得装置106によってジェスチャが取得される間に行われるループ処理のステップである。ジェスチャ取得装置106がジェスチャを検知したイベントによってステップS3102の処理が行われても良いし、一定の間隔でステップS3102を行っても良い。ユーザは、説明時にどの部分を説明しているかをシステムに知らせるために、例えば、説明したい文書の一部を指先で囲うようになぞっても良いし、領域の対角線をなぞったり、領域の対角点を明示的に知らせたりする。ステップS3101では、そのジェスチャを取得する。または、システムが各領域を投影装置106により明示的に囲う枠などの表示をし、ユーザが、表示された領域の中で説明したいコンテンツの領域を指先でタッチするなどして知らせるジェスチャを、システムが取得しても良い。
ステップS3102は、ジェスチャ取得装置106が検出したジェスチャを履歴情報として記憶部115に記憶するステップである。記憶される情報は、図4(b)のような3次元空間の座標(ジェスチャの履歴例1)か図4(c)のような判定結果(ジェスチャの履歴例2)のどちらでもよい。以下では図4(c)のような判定結果が取得されていることとする。これらの処理が販売員の説明終了まで行われる。
図3(c)は図3(a)の文書ログ取得ステップS3002の詳細を示したフローチャートである。ステップS3201は、撮像部110で撮影された画像が入力される間行われるループ処理のステップである。ステップS3202は、入力されたフレーム画像と前フレームの画像を比較し、差分を抽出するステップである。通常は撮像装置の位置を固定しておき、画像のピクセル単位での差分を抽出する。ステップS3203は、差分の量を判定するステップである。各画素の差分の積分と入力画像の大きさによって決まる閾値を比較することによって判定を行う。差分が大きければステップS3204へ、差分が小さければステップS3215へ処理を進める。
ステップS3204は、紙文書の検出を行うステップであり、撮像部110で撮像された画像が紙領域検出部112に入力されることによって処理が行われる。検出方法は、紙の4辺のエッジを画像から検出することによって行われる。検出は作業台122上にある複数の紙文書全てを対象に行われる。
ステップS3205は、ステップS3204が検出した紙文書ごとに行われるループのステップである。
ステップS3206は紙文書を識別するための特徴量を抽出するステップであり、特徴抽出部113において処理が行われる。入力されたフレーム画像から紙文書の領域を切り出し、切り出された領域内から特徴量を抽出する。
ステップS3207は、紙文書の種類を特定するステップであり、文書判定部114において処理が行われる。記憶部115に記憶されている文書番号と紐付けされている特徴量とのマッチングを行うことで使用されている文書番号の特定を行う。
ステップS3208は、ステップS3207で行われた文書の特定処理の結果によって処理を分けるステップである。特定できた場合はステップS3209へ、特定できなかった場合はステップS3211へ処理を進める。
ステップS3209は、特定された文書番号が、保険商品の説明の履歴取得中に新規に発行されたものか既存のものかで処理を切り分けるステップである。新規発行されたものであれば、ステップS3211へ、既存のものであれば1つの検出された紙文書のループを抜け、ステップ3205に戻り、次に検出された紙文書のループに入る。
ステップS3210は、検出されている紙文書に欠けがあるかどうかを判定するステップである。欠けの有無の判定は、ステップS3204で行われた検出処理によって4辺全てが切れ目なく検出されているかどうかで判定を行う。またこのときジェスチャ取得装置106の出力を参照し、ジェスチャの位置が処理中の紙文書の位置にかかっているかどうかも判定に用いても良い。欠けが無ければ、ステップS3213へ、欠けがあれば1つの検出された紙文書のループを抜け、次に検出された紙文書のループに入る。
ステップS3211も検出されている紙文書に欠けがあるかどうかの判定を行うステップであり、ステップS3210と同じ処理が行われる。欠けが無ければ、ステップS3212へ、欠けがあれば1つの検出された紙文書のループを抜け、次に検出された紙文書のループに入る。
ステップS3212は、新規に文書番号を発行するステップである。この処理は、検出された紙文書が既存のものと一致せず、欠けが無い場合に行われる。
ステップS3213は、紙文書のレイアウト解析を行うステップであり、レイアウト解析部116によって行われる。ステップS3214は、レイアウト情報、特徴量を保存するステップである。この処理は新規に文書番号が発行されたものについてのみ行われ、文書番号に紐付けてステップS3206で生成された特徴量とステップS3214で生成されたレイアウト情報を記憶部115に記憶していく。またこの処理は新規に発行された文書番号の文書と一致した場合に行われるため、1つの新規文書番号に対して複数の特徴量とレイアウト情報が記憶されていくことになる。
ステップS3206からステップS3214までの処理が、ステップS3204で検出された1つの紙文書に対して行われ、次の紙文書のループに入る。
ステップS3215は、履歴情報を生成するステップである。検出された全ての紙文書の文書番号とその紙文書が検出された位置を記憶部115に記憶する。
ステップS3202からステップS3215の処理を撮像部110からフレーム画像が入力される間行うことによって、図4(a)に示す説明中に使用された文書番号とその位置(原稿代に対する座標位置)を履歴として取得することができる。
販売員が一連の説明を終了したと判断すると、図3(d)に示すフローチャートにより説明フローが生成される。新規に発行された同じ文書番号の紙文書に対して、複数の特徴量・レイアウト情報が取得されているため、絞り込む処理を行う。
ステップS3301は、新規発行された文書番号に対してループ処理を行うステップである。ステップS3302は、特徴量決定部118によって処理が行われ少なくとも1つ以上の特徴量を生成する。ステップS3304は、レイアウト情報決定部119によって処理が行われ、1文書に1つのレイアウト情報が生成される。処理の方法としては、撮像された画像に含まれた文書領域が最大となったものを選択する。新規文書番号に対し、ステップS3302からステップS3304の処理が行われる。
ステップS3305は、紙文書と電子情報の検出履歴とジェスチャ履歴から、説明に使われた文書の部分領域の単位(以下、「区間情報」とも記載する。)を生成するステップである。ジェスチャの履歴に含まれる紙文書や電子情報に触ったと考えられる部分に対応する紙文書と電子情報の検出履歴から文書を特定し、タッチした位置が文書中のどの位置にあるかを判定する。その結果を図4(d)に示す。次に対応する文書のレイアウト情報を使用してどの領域を示しているかの判定を行う。図5(a)はレイアウト情報の1例であり、テキスト領域401と円グラフ402は異なる属性の領域として取り出されている。説明に使用されたジェスチャの座標の軌跡が、例えば両方の領域を囲むようになっていれば、図5(b)に示すように2つの領域をまとめて1つの説明領域としてまとめる。この処理によって図4(e)にしめすように各時刻における説明に使われた領域を得る。1つのジェスチャで指示されて説明に使われた連続する領域をまとめることで図4(f)に示す区間情報を生成する。
ステップS3306は、区間情報からこの区間情報を系列として出力するステップである。この処理によって図4(g)に示すような説明領域の順番が説明フローとして生成される。
以上の処理で生成された文書番号、特徴量、説明領域(=区間情報)、説明フローを記憶部115に記憶して終了する。
尚、図4(a)から(d)に示した位置座標は、作業台112に対する座標であり、図4(e)から(g)に示した位置座標は、文書内における位置座標である。
次に蓄積された説明フローの活用について説明する。蓄積された説明フロー対し、従来技術である系列パターンマイニングの手法を説明順序に適用し、頻出する系列パターンを抽出することができる。系列パターンマイニングとは、系列データから頻出する部分系列を抽出する技術であり、PrefixSpanやSPADEなどの手法で実現できる。抽出した系列パターンは、ある保険商品を説明する際に、販売員が良く行っている電子コンテンツデータの表示フローと考えられる。
例えば図6のように、ある保険商品のパンフレット501を説明する際には、領域502→領域503→領域504の順に表示されることが多いという具合である。これはその保険商品を説明するためのノウハウとして再利用されることが望ましい。また、1つの保険商品に1つの表示フローだけが抽出されるわけではなく、複数の表示フローが抽出される。顧客の属性情報と合わせて分析することで、例えば、保険商品について事前の知識がまったくない人向けに良く行われていた表示フローや、保険の乗り換えを検討している人向けに良く行われていた表示フローなどが抽出できる。例えば乗り換えを検討している人は保険の知識があり、ほとんど説明を行わなくても良い部分がある。このような部分が検出されると、乗り換えを検討している人向けのパンフレットを作り、紙面における詳細な説明が不要な部分の面積を小さくし、より重要な部分の面積を大きくするなど営業部門だけではなくパンフレット作成部門へフィードバックすることもできる。
このシステムによるフローの取得は、営業成績の良いベテランの販売員だけではなく、新しく採用された販売員のフローを取得し、そのフローをベテランの販売員のものと比較することで新しく採用された販売員への教育へ利用することができる。
このように生成したフローを例えば商談が成功したかどうかの情報と共に蓄積することによって良いフローと悪いフローに分類することが可能になる。文書毎に複数の良いフローから共通パターンを抽出すれば、紙文書が検出された時点で良い説明フローを推薦することができる。
次に生成された説明順序の推薦方法について説明する。
図7(a)は、保険商品の説明開始時の状態を表している。情報処理装置100の作業台122上に保険商品のパンフレット601が置かれると、撮像部110で撮像された画像が紙領域検出部112に入力され、画像中にある紙の領域が検出される。紙が検出されるとその領域を切り出し特徴抽出部113において紙文書の特徴量が取得される。文書判定部114において記憶部115に記憶されている文書番号と特徴量のマッチングを行うことで使用されている文書番号の特定を行う。特定された場合は、その文書を説明するためのフローを602のように表示する。以降は表示されたフローに従った順番で説明を行えばよい。
ここでは、紙文書と表示された電子情報を例にして説明を行ったが、紙文書だけではなく立体物を用いた説明においてもこのシステムを利用することができる。
さらにMixed Realityシステムと連携し、仮想空間における仮想オブジェクトと実空間における物体の操作履歴を取得し、同様なフローを生成することも可能である。
<第2の実施形態>
第1の実施形態においては、紙文書を作業台122に置いて説明する場合について説明したが、電子文書全体を投影装置107で投影して説明を行う場合も同様に処理を行うことができる。
第1の実施形態においては、紙文書を作業台122に置いて説明する場合について説明したが、電子文書全体を投影装置107で投影して説明を行う場合も同様に処理を行うことができる。
この実施形態の場合は、システムのユーザが投影する電子情報を選択することで行われるため、どの電子情報がどの位置に投影されているかはシステム側で検出可能である。したがって、記憶部115は、システムから得られた電子情報と電子情報の投影位置を時刻と共に記憶する。また文書のレイアウト情報は、あらかじめ電子情報から一意に生成しておくことが可能である。
ジェスチャ情報の取得については、第1の実施形態と同様に行うことで、フロー生成に必要なジェスチャ情報、各電子情報の位置、各電子情報のレイアウト情報から得ることができるため同様にフローの生成が可能となる。
<第3の実施形態>
第1の実施形態においては、生成された説明順序の推薦方法は表示だけであったが、説明の流れによっては表示とは異なる操作を行う場合がある。図6(b)に示すように紙文書601の説明中に紙文書603が作業台122上に置かれる場合がある。この場合紙文書603が検出されることをトリガーとして表示するフローを変更する。この時紙文書603の検出位置によって表示する説明フローを変更する。
第1の実施形態においては、生成された説明順序の推薦方法は表示だけであったが、説明の流れによっては表示とは異なる操作を行う場合がある。図6(b)に示すように紙文書601の説明中に紙文書603が作業台122上に置かれる場合がある。この場合紙文書603が検出されることをトリガーとして表示するフローを変更する。この時紙文書603の検出位置によって表示する説明フローを変更する。
例えば客側に近い位置や既存の紙文書の上に重なるような位置に紙文書603が検出されると、紙文書603の説明フローを優先して表示するが、前記条件を満たさない場合は、現在説明中の601内の説明領域の後に紙文書603の説明領域を表示する。
このように表示されているフローとは異なる操作が行われた場合において、紙文書の検出位置に応じて説明フローを変更することが可能となる。
<第4の実施形態>
第1の実施形態では、販売員の説明が終了した後にフローの生成処理を行ったが、説明中にフローを生成するための区間情報を作り販売員に生成された区間情報が正しいかどうかの判定の入力や区間情報自体の修正を行っても良い。区間情報が紙文書に関するものである場合、図8の801に示すような表示が行われる。このときその時点での紙文書の位置に合わせて表示する必要があるため、最新の紙文書の位置を取得し、その位置へ区間情報が正しく表示されるように座標変換を行って表示を行う。電子情報である場合は、システム側が表示している位置を把握しているため、電子情報の表示に重畳して区間情報を表示する。説明員は、その表示を確認し意図と合っていれば「OK」ボタンを押し、合っていなければ「Cancel」ボタンと押す。また表示されている区間情報の枠を指でタッチして動かすことによって枠の位置を、枠の中をタッチして動かすことで枠の位置を変更することで、意図に沿った枠を作り出すこともできる。また、システム側で生成された区間情報を完全に消してしまい、区間情報となる領域の外接を指でなぞることで区間情報を生成することもできる。生成される区間情報は矩形だけではなく、任意の形状にすることもできる。
第1の実施形態では、販売員の説明が終了した後にフローの生成処理を行ったが、説明中にフローを生成するための区間情報を作り販売員に生成された区間情報が正しいかどうかの判定の入力や区間情報自体の修正を行っても良い。区間情報が紙文書に関するものである場合、図8の801に示すような表示が行われる。このときその時点での紙文書の位置に合わせて表示する必要があるため、最新の紙文書の位置を取得し、その位置へ区間情報が正しく表示されるように座標変換を行って表示を行う。電子情報である場合は、システム側が表示している位置を把握しているため、電子情報の表示に重畳して区間情報を表示する。説明員は、その表示を確認し意図と合っていれば「OK」ボタンを押し、合っていなければ「Cancel」ボタンと押す。また表示されている区間情報の枠を指でタッチして動かすことによって枠の位置を、枠の中をタッチして動かすことで枠の位置を変更することで、意図に沿った枠を作り出すこともできる。また、システム側で生成された区間情報を完全に消してしまい、区間情報となる領域の外接を指でなぞることで区間情報を生成することもできる。生成される区間情報は矩形だけではなく、任意の形状にすることもできる。
また、販売員の説明終了後に、生成された説明フローを表示し、そのフローの修正を行うこともできる。紙文書が使われたときは、その紙文書が作業台122上から取り去られている場合もあるため、この場合は撮像装置105で得られた画像データから紙文書の画像を切り出して保存しておき、その画像を用いてフローを表示する。
<その他の実施形態>
以上、実施形態を詳述したが、本発明は上述の実施形態に限定されるのではなく、本発明の趣旨を逸脱しない限りにおいて適宜変更が可能である。各実施形態の処理を組み合わせることも可能である。
以上、実施形態を詳述したが、本発明は上述の実施形態に限定されるのではなく、本発明の趣旨を逸脱しない限りにおいて適宜変更が可能である。各実施形態の処理を組み合わせることも可能である。
本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (11)
- 任意の時刻に物体または電子データの位置情報を取得する取得手段と、
前記物体または電子データに対するジェスチャ情報を検出し、前記ジェスチャ情報を検出した時刻と共に記憶する検出手段と、
前記ジェスチャ情報により指定された前記物体または電子データの領域情報を時間順に並べて履歴を生成する生成手段と、
を備えることを特徴とする画像処理装置。 - 任意の時刻に物体または電子データの位置情報を取得する取得工程と、
前記物体または電子データに対するジェスチャ情報を検出し、前記ジェスチャ情報を検出した時刻と共に記憶する検出工程と、
前記ジェスチャ情報により指定された前記物体または電子データの領域情報を時間順に並べて履歴を生成する生成工程と、
を備えることを特徴とする画像処理方法。 - コンピュータを、
任意の時刻に物体または電子データの位置情報を取得する取得手段と、
前記物体または電子データに対するジェスチャ情報を検出し、前記ジェスチャ情報を検出した時刻と共に記憶する検出手段と、
前記ジェスチャ情報により指定された前記物体または電子データの領域情報を時間順に並べて履歴を生成する生成手段と、
として機能させるためのプログラム。 - 撮像装置、表示装置、ジェスチャ取得装置を持つシステムにおいて
撮像装置で撮影された画像から1つ以上の物体の位置を取得する物体位置取得手段と、
表示装置で表示されている1つ以上の電子情報の位置を取得する電子情報位置取得手段と、
前記物体位置取得手段によって得られた物体位置と前記電子情報位置取得手段によって取得された電子情報位置を系列データとして記憶する物体位置記憶手段と、
前記1つ以上の物体または表示された情報に対する1つ以上のジェスチャ情報を検出するジェスチャ情報検出手段と、
前記ジェスチャ情報検出手段によって検出されたジェスチャ情報を系列データとして記憶するジェスチャ情報記憶手段、
前記物体位置記憶手段と前記ジェスチャ情報記憶手段に記憶されている系列データから意味付けされた区間情報を生成する区間情報生成手段と、
前記区間情報生成手段によって生成された区間情報によって1つ以上の物体または表示されている1つ以上の電子情報の利用履歴を生成する利用履歴生成手段を有することを特徴とする映像処理システム。 - 前記区間情報生成手段によって生成された区間情報が、物体に関するものである場合に、請求項1記載の物体位置取得手段で得られた物体位置の位置に合わせて表示する手段と、
前記区間情報生成手段によって生成された区間情報が、電子情報に関するものである場合は、電子情報に重畳して表示する手段と、
表示手段によって表示されている区間情報を修正する区間情報修正手段を有することを特徴とする請求項4記載の映像処理システム。 - 前記区間情報生成手段は、
前記物体位置記憶手段に記憶されている物体位置または電子情報の位置と前記ジェスチャ情報記憶手段に記憶されているジェスチャ情報から、物体または電子情報に対する指示操作を抽出する指示操作抽出手段と、
前記指示操作抽出手段によって得られた指示動作に基づいて区間情報生成することを特徴とする請求項4記載の映像処理システム。 - 前記物体位置取得手段によって取得された物体位置と前記ジェスチャ位置取得手段によって取得されたジェスチャ位置によって撮影装置で撮影された画像に含まれる物体に欠けが無いことを判断する物体欠け判断手段と、
前記物体欠け判断手段で物体欠けが無いと判断された物体について物体を識別するための特徴量を取得する特徴量取得手段を有することを特徴とする請求項4乃至請求項6記載の映像処理システム。 - 特徴量取得手段によって取得された複数の特徴量からすくなくとも1つ以上の特徴量を生成する特徴量生成手段を有することを特徴とする請求項7記載の映像処理システム。
- 前記物体が紙文書であり、
撮影装置で撮影された1つ以上の紙文書のレイアウト情報を取得するレイアウト情報取得手段と、
前記レイアウト情報取得手段によって得られたレイアウト情報を記憶するレイアウト情報記憶手段と、
物体位置記憶手段に記憶された1つ以上の紙文書または表示されている電子情報の位置と、ジェスチャ情報記憶手段に記憶されたジェスチャ情報と、
レイアウト情報記憶手段に記憶されたレイアウト情報から、使用されている紙文書または表示されている電子情報の説明領域を生成する手段を有することを特徴とする請求項4から請求項8記載の映像処理システム。 - レイアウト情報記憶手段に記憶された各紙文書の複数のレイアウト情報から、各紙文書のレイアウト情報を決定する手段を有することを特徴とする請求項9記載の映像処理システム。
- 利用履歴生成手段により生成された利用履歴を蓄積し記憶する利用履歴記憶手段と、
前記利用履歴記憶手段に記憶された複数の利用履歴を使用する利用履歴使用手段を有することを特徴とする請求項4から請求項10記載の映像処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013155633A JP2015026266A (ja) | 2013-07-26 | 2013-07-26 | 画像処理装置、画像処理方法及びプログラム |
US14/312,333 US9477879B2 (en) | 2013-06-28 | 2014-06-23 | Information processing apparatus, information processing method, and storage medium for obtaining a relationship between pieces of contents from use history information about the contents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013155633A JP2015026266A (ja) | 2013-07-26 | 2013-07-26 | 画像処理装置、画像処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015026266A true JP2015026266A (ja) | 2015-02-05 |
Family
ID=52490861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013155633A Pending JP2015026266A (ja) | 2013-06-28 | 2013-07-26 | 画像処理装置、画像処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015026266A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015097074A (ja) * | 2013-10-08 | 2015-05-21 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法、及びプログラム、並びに、投影システム、その制御方法、及びプログラム |
JP7470069B2 (ja) | 2021-02-17 | 2024-04-17 | 株式会社日立製作所 | 指示物体検出装置、指示物体検出方法及び指示物体検出システム |
-
2013
- 2013-07-26 JP JP2013155633A patent/JP2015026266A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015097074A (ja) * | 2013-10-08 | 2015-05-21 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法、及びプログラム、並びに、投影システム、その制御方法、及びプログラム |
JP7470069B2 (ja) | 2021-02-17 | 2024-04-17 | 株式会社日立製作所 | 指示物体検出装置、指示物体検出方法及び指示物体検出システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532984B (zh) | 关键点检测方法、手势识别方法、装置及系统 | |
US10230907B2 (en) | Thermal imaging device and normative photographing method for thermal image | |
US8970886B2 (en) | Method and apparatus for supporting user's operation of image reading apparatus | |
CN109101172B (zh) | 多屏联动系统及其互动显示方法 | |
Martin et al. | Human friendly interface design for virtual fitting room applications on android based mobile devices | |
EP2845077A2 (en) | User input processing with eye tracking | |
JP7010542B2 (ja) | 作業分析装置、作業分析方法、及びプログラム | |
JP6841608B2 (ja) | 振る舞い検知システム | |
JP5817149B2 (ja) | 投影装置 | |
JP2007034525A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
US11436453B2 (en) | Using augmented reality to perform complex print jobs | |
CN105468189A (zh) | 识别多点触摸操作的信息处理装置及其控制方法 | |
JP2021185505A (ja) | 情報処理装置、表示位置調整方法、およびプログラム | |
JP2015026266A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4728540B2 (ja) | 会議等支援用画像投影装置 | |
JP6245690B2 (ja) | 画像形成装置 | |
CN110136233B (zh) | 一种生成美甲效果图的方法、终端以及存储介质 | |
JP2018055685A (ja) | 情報処理装置、その制御方法、プログラム、および記憶媒体 | |
JP6948294B2 (ja) | 作業異常検知支援装置、作業異常検知支援方法、および作業異常検知支援プログラム | |
US9477879B2 (en) | Information processing apparatus, information processing method, and storage medium for obtaining a relationship between pieces of contents from use history information about the contents | |
JP2021012586A (ja) | データ生成装置、データ生成システムおよびデータ生成方法 | |
JP6312488B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2009205498A (ja) | 情報提示装置、情報提示方法、情報提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP6639257B2 (ja) | 情報処理装置及びその制御方法 | |
JP7374413B2 (ja) | 現実物体に対するクラスタリングの可視化システム、可視化制御装置、可視化方法および可視化制御用プログラム |