JP2016167227A - 情報処理装置およびその制御方法、情報処理システム - Google Patents

情報処理装置およびその制御方法、情報処理システム Download PDF

Info

Publication number
JP2016167227A
JP2016167227A JP2015047412A JP2015047412A JP2016167227A JP 2016167227 A JP2016167227 A JP 2016167227A JP 2015047412 A JP2015047412 A JP 2015047412A JP 2015047412 A JP2015047412 A JP 2015047412A JP 2016167227 A JP2016167227 A JP 2016167227A
Authority
JP
Japan
Prior art keywords
character string
character
unit
character strings
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015047412A
Other languages
English (en)
Inventor
太史 八村
Hiroshi Yamura
太史 八村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015047412A priority Critical patent/JP2016167227A/ja
Publication of JP2016167227A publication Critical patent/JP2016167227A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】より効率的な議事録作成を可能とするための技術を提供する。【解決手段】情報処理装置は、投射装置により投射された投射画像から1以上の文字列を抽出する抽出手段と、投射画像における1以上の文字列それぞれの出現特徴に基づいて、当該1以上の文字列それぞれに対する評価値を決定する決定手段と、1以上の文字列の入力支援に利用可能とすべく1以上の文字列をそれぞれの評価値に関連付けた文字列情報を生成する生成手段と、を有する。【選択図】図1

Description

本発明は、プロジェクタ等の投射装置により投射された投射画像に含まれる文字列の入力支援のための情報を生成する技術に関するものである。
近年、情報端末であるパーソナルコンピュータ(PC)等を用いて、議事進行と並行してプレゼンテーション中の議事録メモをタイプし、議事記録を残すことが多くなっている。そこで、プロジェクタにより投射された映像やプレゼンテータの発音をテキストにする議事録作成システムが提案されている。
特許文献1では、文字認識テキスト化データと音声認識テキスト化データとを1つのファイルとした議事録データを作成する議事録作成装置が提案されている。具体的には、文字認識テキスト化データを、プロジェクタによって投影された投影画像に含まれる文字列を認識することにより生成している。また、音声認識テキスト化データを、文字認識結果に基づいて分野別の音声認識用辞書データを選択し、選択された音声認識用辞書データを用いて音声認識を行うことにより生成している。
特開2006−267934号公報
しかしながら、上述の特許文献1の議事録作成装置構成により生成された議事録データから最終的な議事録に仕上げる作業は依然として煩雑であるという問題があった。例えば、文字認識テキスト化データ及び音声認識テキスト化データを推敲し、誤認識された語句を議事で実際に使用された語句へ修正するための処理(置換、挿入、削除)を行う必要があった。
本発明はこのような問題を鑑みてなされたものであり、より効率的な議事録作成を可能とするための技術を提供することを目的とする。
上述の問題点を解決するため、本発明に係る情報処理装置は以下の構成を備える。すなわち、情報処理装置は、投射装置により投射された投射画像から1以上の文字列を抽出する抽出手段と、前記投射画像における前記1以上の文字列それぞれの出現特徴に基づいて、該1以上の文字列それぞれに対する評価値を決定する決定手段と、前記1以上の文字列の入力支援に利用可能とすべく、前記1以上の文字列をそれぞれの評価値に関連付けた文字列情報を生成する生成手段と、を有する。
本発明によれば、より効率的な議事録作成を可能とする技術を提供することができる。
第1実施形態に係る情報処理システムの構成を示すブロック図である。 プロジェクタ及びユーザ操作端末のハードウェア構成を示すブロック図である。 投射データの更新による抽出された文字列と評価値の変化を例示的に示す図である。 ポインタやマウスカーソルの指示による抽出された文字列と評価値の変化を例示的に示す図である。 ユーザ操作端末であるタブレット端末における画面表示を例示的に示す図である。 第1実施形態におけるプロジェクタの動作を示すフローチャートである。 第1実施形態におけるタブレット端末の動作を示すフローチャートである。 第2実施形態に係る情報処理システムの構成を示すブロック図である。 投射された画像の領域分割処理を説明する図である。 文字入力支援の一例としての文字列候補表示を説明する図である。 第2実施形態におけるプロジェクタの動作を示すフローチャートである。 第2実施形態におけるPC端末の動作を示すフローチャートである。
以下に、図面を参照して、この発明の好適な実施の形態を詳しく説明する。なお、以下の実施の形態はあくまで例示であり、本発明の範囲を限定する趣旨のものではない。
(第1実施形態)
本発明に係る情報処理装置の第1実施形態として、プロジェクタを例に挙げて以下に説明する。
<装置構成>
図1は、第1実施形態に係る情報処理システムの構成を示すブロック図である。当該情報処理システムは、主に、プロジェクタ1とユーザ操作端末2とを含む。また、図2は、プロジェクタ1及びユーザ操作端末2のハードウェア構成を示すブロック図である。
プロジェクタ1は、プレゼンテーション画像を投影する装置である。投射画像10は、プロジェクタ1がスクリーンなどに投射した画像を例示的に示したものである。ユーザ操作端末2は、ユーザがプレゼンテーション記録(議事録)を作成するために使用する装置である。
まず、プロジェクタ1の構成について説明する。制御部11は、プロジェクタ1内の各機能部を統括的に制御する機能部である。制御部11は、例えばCPU41がROM43に格納された制御プログラムを実行することにより実現される。なお、各機能部は、制御バスやデータバスなどのバス24を介して、相互に接続されているものとする。
記憶部12は、画像撮像部16により取得された撮像画像を保存する。また、プロジェクタ1により投射される画像(投射データ)及び該画像に関連する各種情報を保存する。ここでは、各種情報としては、後述する、投射データから読みとられた文字列、文字列の評価値、及び、文字列リストのデータを想定する。記憶部12は、例えば、ハードディスクドライブ(HDD)48により実現される。また、一時的に各種データを記憶するRAM42も利用される。なお、2次記憶媒体として、HDDのほか、ソリッドステートドライブ(SSD)や、SD(登録商標)メモリーカード等のメモリ素子を用いることも可能である。
データ入力部13は、投射するデータ(投射データ)を受信する機能部であり、例えば、映像入力端子44により実現される。また、データ入力部13は、投射するデータが更新されたことを検出する機能も有する。データ出力部14は、後述する文字列リストを他の機器(ここではユーザ操作端末2)に送信する機能部である。データ出力部14は、例えば、通信インタフェース(I/F)47により実現される。なお、通信I/F47は、例えば、有線通信又は無線通信のインタフェースである。
プロジェクション部15は、データ入力部13から入力されたデータを投射する機能部である。プロジェクション部15は、例えば、画像を光学映像としてスクリーン等に投射するプロジェクタ45により実現される。
画像撮像部16は、外部の映像を撮像し画像を取得する機能部である。なお、以下の説明では、外部の映像として、プロジェクション部15を介してスクリーン等に投射されたプレゼンテーション画像を想定する。画像撮像部16は、例えば、イメージセンサを搭載したカメラ46により実現される。
文字読取部17は、投射データをテキスト化する機能部である。また、文字読取部17は、テキスト化の結果を1以上の文字列に切り分ける機能を有する。評価値処理部18は、文字列に対し所定の評価を行い評価値として導出する機能部である。評価値導出の詳細については後述する。
リストソート部19は、後述する文字列リスト内の文字列をソートする機能部である。ここでは、文字列をそれぞれの文字列に対する評価値をキーとしてソートすることを想定する。リスト管理部20は、文字読取部17によるテキスト化により得られた1以上の文字列を元に文字列リストを作成する機能部である。リスト管理部20は、文字列リスト内の文字列の変更管理や、文字列の評価値の変更管理、及び文字列リスト内の文字列の順序管理も行う。
画像処理部21は、投射データや撮像画像を解析し、投射された映像における変化を各種の画像処理を行うことにより検出する機能部である。例えば、撮像画像におけるマウスカーソルやポインタを検出する。
カーソル検知部22は、撮像画像を画像処理部21を使って解析し、マウスカーソルで指示された箇所の位置データをリスト管理部20に通知する機能部である。同様に、ポインタ検知部23は、撮像画像を画像処理部21を使って解析し、ポインタで指示された箇所の位置データをリスト管理部20通知する機能部である。
ここでは、文字読取部17、評価値処理部18、リストソート部19、リスト管理部20、画像処理部21、カーソル検知部22、ポインタ検知部23は、CPU41がROM43に格納された制御プログラムを実行することにより実現されることを想定する。
次に、ユーザ操作端末2の構成について説明する。制御部25は、ユーザ操作端末2内の各機能部を統括的に制御する機能部である。制御部25は、例えばCPU49がROM51に格納された制御プログラムを実行することにより実現される。なお、各機能部は、制御バスやデータバスなどのバス30を介して、相互に接続されているものとする。
記憶部26は、例えば、議事録作成のためのアプリケーションプログラムを記憶する。また、議事録作成処理に関連する各種情報を保存する。ここでは、各種情報としては、後述する、文字列リストのデータを想定する。記憶部12は、例えば、ハードディスクドライブ(HDD)55により実現される。また、一時的に各種データを記憶するRAM50も利用される。
データ入力部27は、プロジェクタ1から送信される文字列リストを入力する機能部である。データ入力部27は、例えば、通信インタフェース(I/F)53により実現される。なお、通信I/F53は、例えば、有線通信又は無線通信のインタフェースである。操作入力部28は、ユーザからの入力操作を受け付ける機能部であり、例えば、キーボード54により実現される。表示部29は、各種表示を行う機能部であり、各種のディスプレイ52により実現される。ここでは、表示部29は、主に、議事録作成のためのアプリケーションプログラムによる入力画面を表示することを想定する。
<装置の動作>
以下の説明では、図1に示すように、プロジェクタ1を用いたプレゼンテーションが行われている状況で、ユーザが、ユーザ操作端末2を用いて議事録を作成する事例について説明する。特に、プロジェクタ1が、投射したプレゼンテーション画像に基づいた文字列リストを生成し、ユーザ操作端末2であるタブレット端末に文字列リストを送信する事例を示す。
図6は、第1実施形態におけるプロジェクタ1の動作を示すフローチャートである。
ステップS100では、画像撮像部16は、撮像を開始し、撮像された画像を記憶部12に記憶する。また、画像を記憶した際、当該画像の記録時刻をカーソル検知部22及びポインタ検知部23に通知する。プロジェクタ1のデータ入力部13にて映像入力端子から入力されたデータは、プロジェクション部15に送られて、スクリーンに投射される。 ステップS101では、データ入力部13は、入力された投射データを記憶部12に保存すると共に、文字読取部17にデータ更新通知を通知する。文字読取部17は、データ入力部13からのデータ更新通知を受信すると、記憶部12から投射データを読み出し、文字読み取り処理を行う。なお、第1実施形態では文字読み取り手法として光学文字認識(OCR)の技術を用いることを想定するが、電子画像そのものを画像処理するような他の方法を用いて文字読み取りを行っても良い。
ステップS102では、文字読取部17は、文字読み取り処理によりテキスト化したテキストデータを、文字区切り情報に基づいて1以上の文字列に分割して記憶部12に保存する。ここでの文字区切り情報は、句読点や、構文解析による文字のつながり判定情報を想定している。そして、文字読取部17は、評価値処理部18に評価値決定の依頼通知を送信する。なお、形態素解析などを用いてより正確に単語文字列に分解するよう構成してもよい。
ステップS103では、評価値処理部18は、評価値決定の依頼通知を文字読取部17から受信すると、各文字列に対する評価値を計算する。評価値処理部18は、各々の文字列に対し、それぞれの出現特徴に基づいて評価値を算出する。ここでは、投射画像における文字列の大きさと、投射画像内の文字列の出現頻度(現在の投射データ及び過去の投射データにおける出現頻度)に応じて、評価値を決定し、記憶部12に保存する。
図3は、投射データの更新による、抽出された文字列と評価値の変化を例示的に示す図である。プレゼンテーションの1枚目の投射データとして投射画像301に示す画像を、2枚目の投射データとして投射画像302に示す画像をそれぞれ投射する場合を例示的に示している。
なお、ここでは、文字列の評価値は、当該文字列の文字の大きさと、当該文字列の出現頻度をパラメータ化した数値の合計として導出される例を示している。ここでは、文字が大きいほど評価値を大きくし、出現頻度(累計回数)が多いほど評価値を大きくするように構成している。
投射画像301からは、文字が読みとられて文字列リスト300aが生成され、図3における文字列リスト300aにおいては各文字列に対して導出された評価値を併せて表示している。たとえは、文字列リスト300a内の文字列”○○○傾向”については、投射画像301における文字の大きさ(”3”)と、出現頻度(”1”)の合計”4”ポイントとして評価値が決定され関連付けられている。
また、投射されるデータが更新され、投射画像が投射画像301から投射画像302に更新された場合、文字列リスト(文字列および各文字列の評価値)は更新される。具体的には、記憶部12に保存される投射データが更新された時点で、評価が再度実行されて文字列および評価値が更新される。
例えば、投射画像302に更新されると、文字が読みとられて、リスト内の文字列の更新(追加)及び評価値の更新が行われ、文字列リスト300bが生成される。図3における文字列リスト300bにおいては、文字列”○○○傾向”については、投射画像302における文字の大きさ(”2”)と、出現頻度(”2”)の合計”4”ポイントとして評価値が決定され関連付けられている。
文字読取部17は、評価値処理部18により評価値が決定した各文字列とともに、投射データ内処理完了をリスト管理部20に通知する。
ステップS104では、ポインタ検知部23又はカーソル検知部22は、撮像画像において、指示デバイスによる指示マーカーであるポインタ又はマウスカーソルを検知したか否かを判定する。検知した場合は、S105に進み、検知しなかった場合はS106に進む。
すなわち、プレゼンテーションテータが、プレゼンテーション中に、投影画面の注目すべき領域に対して指示行動をすることがある。そこで、ポインタ検知部23は、プレゼンテータによる指示に関する特定の事象としてポインタを検知する。また、カーソル検知部22は、プレゼンテータによる指示に関する特定の事象として、投影制御を行っているパーソナルコンピュータ(PC)上(不図示)あるいはプロジェクタ上でのマウスカーソルを検知する。もちろん、指示棒の先端部を画像認識により検出するよう構成してもよい。
なお、上述のS104において、ポインタ又はマウスカーソルが検知された場合、各々の検知部より、指示された箇所の位置データとその指示の発生時期が、リスト管理部20に通知される。なお、ここでは、画像処理部21による画像処理により指示棒やレーザポインタの検知を行うことを想定している。具体的には、データ入力部13により記憶部12に保存された投射データと、画像撮像部16で撮像され記憶部12に保存された撮像画像とに対して、画像処理を行い比較を行うことで検知を行う。しかしながら、指示棒やレーザポインタの検知は、任意の周知の検知方法を用いることが可能である。
また、マウスカーソルの検知は、例えば、画像撮像部16で撮像されて記憶部12に保存された画像のフレーム間差分を画像処理部21で行うことで、変化のある部分を検出して行うことを想定している。しかしながら、マウスカーソルの検知についても、任意の周知の検知方法を用いることが可能である。
ステップS105では、ポインタ検知部23やカーソル検知部22より指示された箇所の位置データを受信したリスト管理部20は、文字読取部17に対し、文字列リスト内の対応する文字列を特定するよう依頼する。具体的には、リスト管理部20は、文字読取部17に対し、ポインタ又はマウスカーソルで指示された箇所の位置データとその指示の発生時期を通知し、対応する文字列の特定を依頼する。
リスト管理部20より特定処理を依頼された文字読取部17は、指示された箇所の位置データとその指示の発生時期に対応する文字列を、記憶部12の投射データを基に特定する。そして、文字読取部17は、評価値処理部18に対し、当該文字列の評価値更新処理の実行を依頼する。具体的には、文字列の評価値にプレゼンテータ指示ポイント(例えば”5”)を加算するよう評価値処理部18に依頼する。そして、評価値処理部18は、例えばポインタやマウスカーソルの指示する文字列の評価値を更新する。
図4は、ポインタやマウスカーソルの指示による、抽出された文字列と評価値の変化を例示的に示す図である。投射画像401は、投射画像301に対してレーザポインタの操作によるポインタ404が併せて表示されている画像を示している。また、投射画像402は、投射画像302に対してマウス操作によるマウスカーソル405が併せて表示されている画像を示している。
投射画像401からは、文字列リスト300aが更新され文字列リスト400aが生成される。具体的には、文字列”XXX旅行傾向”についてプレゼンテータ指示ポイント(”5”)が加算される。また、S109で後述するが、更新の結果、文字列”XXX旅行傾向”の評価値が最も高くなるため、ソートの結果、文字列リスト400aにおける先頭の文字列として設定されている。
また、投射画像402からは、文字列リスト300bが更新され文字列リスト400bが生成される。具体的には、文字列”○○○National Park”についてプレゼンテータ指示ポイント(”5”)が加算される。更に、S109で後述するが、更新の結果、文字列”○○○National Park”の評価値が最も高くなるため、ソートの結果、文字列リスト400bにおける先頭の文字列として設定されている。
ステップS106では、文字読取部17は、評価値が更新された文字列リストを記憶部12に保存する。また、文字読取部17は、投射データ内処理完了をリスト管理部20に通知する。リスト管理部20は、文字読取部17からの各文字列と投射データ内処理完了を受信するとS107に進む。なお、リスト管理部20は、投射データ内処理完了を受信しない間は、S100〜S105の処理を繰り返す。
ステップS107では、リスト管理部20は、受信した文字列の文字列リストが作成されているかを判定する。作成されている場合はS109に進み、文字列リストが作成されていないと判定された場合はS108に進む。ステップS108では、リスト管理部20は、受信した文字列のリスト形式のデータを作成し、文字列リストとして記憶部12に保存する。
ステップS109では、リストソート部19は、リスト管理部20よりソート依頼を受け、文字列リスト内の文字列を、評価値をキーにしてソートを実行する。リストソート部19は、ソートが終わった文字列リストを記憶部12に保存し、ソート完了通知をリスト管理部20に通知する。
リストソート部19からのソート完了通知を受信したリスト管理部20は、データ出力部14を介して、次の処理を実行する。
ステップS110では、リスト管理部20は、記憶部12に保存された文字列リストの更新の有無を判断する。記憶部12に保存された文字列リストが、更新されていなければ、S111に進む。記憶部12に保存された文字列リストが、更新されていれば、S112に進む。ステップS111では、リスト管理部20は、データ入力部13での記憶部12に保存される投射データの更新を待って、ステップS100に戻る。
ステップS112では、制御部11は、記憶部12に保存された文字列リスト(文字列情報)をユーザ操作端末2に送信する。ステップS113では、制御部11は、プレゼン終了指示があるまで、上述の処理を繰り返し実行する。なお、本実施形態では、文字列リストが生成され、送信される場合の例を中心に説明しているが、文字列と評価値とが対応づけられていれば、その形式はリストに限らない。
図7は、第1実施形態におけるユーザ操作端末2であるタブレット端末の動作を示すフローチャートである。
ステップS121では、データ入力部27は、プロジェクタ1のデータ出力部14から出力された文字列リスト(文字列情報)を受信する。なお、上述のように、プロジェクタ1は、投影画像の更新に伴い文字列リストを更新し、更新された文字列リストはリアルタイムにユーザ操作端末2に送信される。
ステップS122では、制御部25は、受信した文字列リストの各文字列に読み仮名があるかを判断する。第1実施形態では、OCRで画像の形状から文字をテキスト化している為、漢字等の場合に現時点では読み仮名は判明していないとする。なお、文字列リストの各文字列に読み仮名がある場合の処理(S124)については、後述の第2実施形態で説明するが、例えば日本語変換システムにおけるユーザ辞書への登録処理に相当する処理である。
ステップS123では、制御部25は、読み仮名が付加されていないと判断した文字列リストをそのまま記憶部26に保存する。
ステップS125では、制御部25は、操作入力部28を介した文字入力において、文字列リスト参照による入力補助が必要か否かを判断する。この判断は、例えば議事録作成のためのアプリケーションプログラムの起動を検出することにより判断してもよいし、ユーザからの明示的な指示を受け付けて判断するよう構成してもよい。入力補助が必要と判断した場合はS126に進む。
ステップS126では、制御部25は、記憶部26から文字列リストを読みだし、入力候補文字列として表示部29に表示する。なお、文字列リストの評価値は、表示でも非表示でもよい。
図5は、ユーザ操作端末2であるタブレット端末における画面表示を例示的に示す図である。ユーザ操作端末2での表示部29での表示の一例を示す図である。
図5では、入力文字列の候補リスト510が表示されている。ここでは、受信した文字列リストが文字列リスト500に示すものであるとする。この場合、”○○○傾向”の評価値が文字列リスト500内で最も高いため、文字列”○○○傾向”が候補リスト510の先頭に表示されている。例えば、文字列”○○○傾向”をユーザが選択することで、議事録作成のためのアプリケーションプログラムに対して文字列”○○○傾向”が入力される。なお、候補リスト510を表示する機能は、日本語変換ソフトウェアや、予測入力ソフトウェアに組み込む形で実装すると好適である。
ステップS127では、文字入力の操作が終了したか否かを判定し、操作の終了を検知すると、図7の処理を終了する。
以上説明したとおり第1実施形態によれば、プロジェクタにおいて、投射画像(投射データ)に基づく文字列リストを生成し、ユーザ操作端末に送信する。これにより、ユーザ操作端末において、ユーザは、投射画像に表示されている文字列を、より容易に入力することが可能となる。特に、投射画像内で使用されている複数の文字列それぞれに対して評価値を算出し、当該複数の文字列をソートした文字列リストを生成することにより、ユーザは、重要な文字列をより簡単に入力することが可能となる。また、リアルタイムに文字列リストを更新することにより、ユーザは、現在投射されている投射映像に対する議事録をより簡単に作成することが可能となる。
(第2実施形態)
本発明に係る情報処理装置の第2実施形態としてプロジェクタ1を例に挙げて以下に説明する。特に、投射画像を領域分割した後テキスト化を行う点、読み仮名を付与した単語列データを生成する点が第1実施形態と異なる。また、ユーザ操作端末2においては、受信した単語列データをユーザ辞書に登録して使用する点が第1実施形態と異なる。
<装置構成>
図8は、第2実施形態に係る情報処理システムの構成を示すブロック図である。当該情報処理システムは、主に、プロジェクタ1とユーザ操作端末2とを含む。なお、各装置のハードウェア構成は第1実施形態(図2)と同様であるため説明は省略する。
プロジェクタ1は、プレゼンテーション画像を投影する装置である。投射画像10は、プロジェクタ1がスクリーンなどに投射した画像を例示的に示したものである。ユーザ操作端末2は、ユーザがプレゼンテーション記録(議事録)を作成するために使用する装置である。
以下では、第1実施形態(図1)と異なる機能部について説明を行う。図1における参照符号と同一の参照符号を有する機能部については第1実施形態とほぼ同様であるため説明は省略する。
具体的には、図8では、文字読取部17が単語列読取部32に変更になっている。また、リスト管理部20が、文字列リストの代わりに単語列リストを管理する点が異なる。また、領域分割部31及び付加部33が新たに追加されている。
領域分割部31は、投射データの領域分割を行う。以下の説明では、データ入力部13から入力され記憶部12に保存された投射データに対し領域分割処理を行うことを想定する。また、領域分割部31は、各々の分割された領域での投射データ中のテキスト化を担当する。
単語列読取部32は、領域分割部31を使ってテキスト化された文字列を、1以上の文字列に切り分ける処理を行う。付加部33は、単語列読取部32によって切り分けられた文字列それぞれについて、読み仮名辞書を参照することにより読み仮名を検索し付加する機能部である。なお、読み仮名辞書は、記憶部12に記憶されているものとする。
<装置の動作>
以下の説明では、図8に示すように、プロジェクタ1を用いたプレゼンテーションが行われている状況で、ユーザが、ユーザ操作端末2を用いて議事録を作成する事例について説明する。特に、プロジェクタ1が、投射したプレゼンテーション画像に基づいた単語列リストを生成し、ユーザ操作端末2であるPC端末に単語列リストを送信する事例を示す。
図11は、第2実施形態におけるプロジェクタ1の動作を示すフローチャートである。
ステップS200では、画像撮像部16は、撮像を開始し、撮像された画像を記憶部12に記憶する。また、画像を記憶した際、当該画像の記録時刻をカーソル検知部22及びポインタ検知部23に通知する。プロジェクタ1のデータ入力部13にて映像入力端子から入力されたデータは、プロジェクション部15に送られて、スクリーンに投射される。 ステップS201では、データ入力部13は、入力された投射データを記憶部12に保存すると共に、領域分割部31にデータ更新通知を通知する。領域分割部31は、データ入力部13からのデータ更新通知を受信すると、記憶部12から投射データを読み出し、領域分割処理を行う。
図9は、投射された画像の領域分割処理を説明する図である。領域分割処理は、プロジェクタ1において、投射データ900をテキスト化する前処理として実行される。図9では、投射データ900の画像の各領域を、3つの領域種別(テキスト、グラフィック、写真)に基づいて、4つの領域に分割した例を示している。具体的には、投射データ900は、テキスト領域901、テキスト領域902、グラフィック領域903、写真領域904として分割されている。
各領域に対して領域種別の情報を付加した投射データ900を記憶部12に保存する。データ入力部13は、処理完了後、単語列読取部32にデータ更新を通知する。なお、ここでは、データ入力部13において取得された投射データ900を対象として、領域分割及び文字の読み取りを行う形態について説明を行う。しかしながら、S200で取得した撮像画像を対象として領域分割及び文字の読み取りを行う構成も可能である。ただし、一般には、投射データ900を用いた方がより正確な領域分割及び文字の読み取りが可能である。
ステップS202では、単語列読取部32は、各々の領域毎の領域情報に基づいて、文字読み取り処理を行う。また、文字列を文字区切り情報に基づいて1以上の単語列に分割し、領域毎に単語列を収集して、記憶部12に保存する。ここでの文字区切り情報として、句読点や、構文解析による文字のつながり判定情報を用いる。
具体的には、データ入力部13からのデータ更新通知を受信した単語列読取部32は、記憶部12から投射データを読み出し、付加された領域情報に基づいて、各々の領域毎に文字読み取り処理を行う。
例えば、テキスト領域に対しては、画像の2値化を行い、黒画素連結成分を囲む矩形などの画像的な情報を用いる方法の処理で文字切出しを行った後、文字認識を行う。
一方、グラフィック領域に対しては、エッジ強調等の画像フィルタを施した後、文字切出しと文字認識を行う。また、写真領域に対しては、濃淡値ヒストグラムの複数分割に基づく画像分解法や、複雑度など文字領域性評価尺度に基づく画像分解法などの画像処理を実行した後、文字切出しを行い、文字認識行う。
上述のように、領域情報を利用することで、画像全体としての文字画像のテキスト化率が向上させることが可能となる。
ステップS203では、単語列読取部32は、付加部33に対し、文字列に対する読み仮名の付与を依頼する。付加部33は、記憶部12に保存されたテキスト化された文字列に対して、記憶部12に記憶された読み仮名辞書を参照することにより読み仮名を検索し付加する。そして、付加部33は、読み仮名を付与した単語列として記憶部12に保存し、単語化処理完了を単語列読取部32に通知する。
ステップS204では、付加部33からの単語化処理完了を受信した単語列読取部32は、各単語列について、評価値処理部18に評価値計算を依頼する。評価値計算依頼を受信した評価値処理部18は、各々の単語列に対し、その単語列に対応する文字の大きさと、投射データ内における単語列の出現頻度(現在の投射データ及び過去の投射データにおける出現頻度)に応じて、評価値を決定し、記憶部12に保存する。そして、評価値決定完了を単語列読取部32に送信する。なお、評価値の決定詳細動作は、上述の第1実施形態と同様であるため説明を省略する。
S205〜S207は、第1実施形態(図6)におけるS104〜S106において「文字列」を「単語列」と読み替えたものと同様であるため説明は省略する。リスト管理部22は、単語列読取部32から投射データ内処理の完了を受信すると、単語列のリストデータを記憶部12に保存すると共に、単語列リストのソートをリストソート部19に依頼する。
ステップS208では、リストソート部19は、リスト管理部22よりソート依頼を受けると、単語列リストに含まれる単語列について、評価値の値と、読み仮名をキーにしてソートを実行する。例えば、読み仮名の先頭の文字毎に、評価値をキーにした降順ソートを行う。リストソート部19は、ソートが終わった単語列リストを記憶部12に保存し、ソート完了通知をリスト管理部22に通知する。
S209〜S212は、第1実施形態(図6)におけるS110〜S113において「文字列」「文字列リスト」をそれぞれ「単語列」「単語列リスト」と読み替えたものと同様であるため説明は省略する。
なお、リスト管理部22は、単語列リストをユーザ操作端末2に送信する際、単語列リストを、ユーザ操作端末2で利用可能な辞書形式に予め変換し単語辞書として送信してもよい。
図12は、第2実施形態におけるユーザ操作端末2であるPC端末の動作を示すフローチャートである。なお、S221〜S227は、第1実施形態(図7)におけるS121〜S127において「文字列」「文字列リスト」をそれぞれ「単語列」「単語列リスト」と読み替えたものと同様であるため説明は省略する。ただし、上述の第1実施形態の説明においてはS124(文字列リストの各文字列に読み仮名がある場合の処理)に進んだ場合の説明を省略したため、以下で説明する。
ステップS224では、制御部25は、単語列リストを辞書化し、ユーザ辞書として記憶部26に保存する。ここで、ユーザ辞書とは、例えば、日本語変換システムにおける、ユーザにより変換候補が登録された辞書を意味している。
既にユーザ辞書が存在している場合は、ユーザ辞書を更新する。例えば、単語列”National Park”は、読み仮名「なしょなるぱーく」として、単語列”ナイアガラの滝”は、読み仮名「ないあがらのたき」としてユーザ辞書に登録する。なお、単語列リストを予め辞書の形式で受信した場合は、新たなユーザ辞書として設定するか、あるいは、既存のユーザ辞書と結合するよう構成するとよい。
ステップS225では、制御部25は、操作入力部28を介した文字入力において、文字列リスト参照による入力補助が必要か否かを判断する。この判断は、例えば議事録作成のためのアプリケーションプログラムの起動を検出することにより判断してもよいし、ユーザからの明示的な指示を受け付けて判断するよう構成してもよい。入力補助が必要と判断した場合はS226に進む。
ステップS226では、制御部25は、記憶部26からユーザ辞書を読みだし、入力候補文字列として表示部29に表示する。なお、単語列リストの評価値は、表示でも非表示でもよい。なお、S223を介してS226に来た場合は、保存した単語列リスト内の単語列を表示する。
図10は、文字入力支援の一例としての文字列候補表示を例示的に示す図である。ここでは、入力補助として、ユーザが一文字目を入力した時に、当該一文字目と同じ読み仮名を有する入力候補文字列をリストとしてプルダウンで表示する例を示している。
まず、入力文字1000として”な”という一文字を入力する。この時点では、現在参照している1以上の辞書の中から読み仮名の先頭文字が”な”で始まる単語列が候補リスト1010として表示されている。ここでは、単語列”National Park”(読み仮名は「なしょなるぱーく」)の評価値が最も高く、候補リスト1010の先頭に表示されている。
以上説明したとおり第2実施形態によれば、プロジェクタにおいて、投射画像(投射データ)に基づく単語列リストを生成し、ユーザ操作端末に送信する。これにより、ユーザ操作端末において、ユーザは、投射画像に表示されている文字列を構成する単語列を、より容易に入力することが可能となる。また、読み仮名を含む単語列リストとして生成することにより、ユーザ操作端末において、既存の文字入力システムへ容易に組み込むことが可能となる。
(変形例)
上述の第1及び第2実施形態においては、外部情報処理装置であるユーザ操作端末2に文字列リストや単語列リストを送信する構成について説明したが、これらの形態に限定されることはない。すなわち、プロジェクタ自身で、文字列リストや単語列リストを用いて、文字入力の補助処理を行っても良い。
また、プロジェクタ1は、文字列リストや単語列リストを自身の記憶部に格納し、辞書サーバとして動作するよう構成してもよい。この場合、外部情報処理装置であるユーザ操作端末2は、辞書サーバとしてのプロジェクタ1にアクセスしながら動作することになる。また、文字列リストや単語列リストを、第3者装置である共有サーバやクラウドに送信し、ユーザ操作端末から利用する形態としてもよい。
さらに、上述の第1及び第2実施形態においては、文字列リストや単語列リストを、プロジェクタ単位で生成しているが、画像撮像部16により、プレゼンテータ(人物)を特定し、プレゼンテータ単位で生成してもよい。
なお、上記の実施形態では、2次記憶媒体としてHDDを用いる場合の例を中心に説明しているが、HDDに限ることなく、SSDや、SDメモリーカード等のメモリ素子を用いた2次記憶媒体を用いてもよい。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
1 プロジェクタ; 2 ユーザ操作端末; 10 投影画像; 17 文字読取部; 18 評価値処理部; 20 リスト管理部; 21 画像処理部

Claims (13)

  1. 投射装置により投射された投射画像から1以上の文字列を抽出する抽出手段と、
    前記投射画像における前記1以上の文字列それぞれの出現特徴に基づいて、該1以上の文字列それぞれに対する評価値を決定する決定手段と、
    前記1以上の文字列の入力支援に利用可能とすべく、前記1以上の文字列をそれぞれの評価値に関連付けた文字列情報を生成する生成手段と、
    を有することを特徴とする情報処理装置。
  2. 前記生成手段は、前記それぞれの評価値に基づいて前記1以上の文字列をソートした前記文字列情報を生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記文字列情報を外部装置へ送信する送信手段を更に有する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 文字列に対して読み仮名を付加する付加手段と、
    前記文字列情報を、前記抽出手段により抽出された1以上の文字列と該1以上の文字列それぞれに対して付加された読み仮名とを関連付けた辞書形式に変換する変換手段と、
    を更に有する
    ことを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  5. 前記出現特徴は、前記投射画像における文字列の大きさ及び出現頻度の少なくとも一方を含む
    ことを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
  6. 前記出現特徴は、前記投射画像における文字列に対する指示デバイスによる指示の有無を更に含む
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記投射装置は、
    画像を入力する入力手段と、
    前記入力手段により入力された画像を投射する投射手段と、
    を有し、
    前記抽出手段は、前記入力手段により入力された画像を前記投射画像として用い、前記1以上の文字列を抽出する
    ことを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。
  8. 前記抽出手段は、前記入力手段により入力された画像内の各領域から、それぞれに対応する領域種別に応じた画像処理を施して文字列を抽出する
    ことを特徴とする請求項7に記載の情報処理装置。
  9. 前記抽出手段は、前記投射画像を撮像した撮像画像から、前記1以上の文字列を抽出する
    ことを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
  10. 前記生成手段は、前記投射画像の更新に基づいて、前記抽出手段による文字列の抽出及び前記決定手段による評価値の決定を再度実行することにより前記文字列情報を更新する
    ことを特徴とする請求項1乃至9の何れか1項に記載の情報処理装置。
  11. 情報処理装置の制御方法であって
    投射装置により投射された投射画像から1以上の文字列を抽出する抽出工程と、
    前記投射画像における前記1以上の文字列それぞれの出現特徴に基づいて、該1以上の文字列それぞれに対する評価値を決定する決定工程と、
    前記1以上の文字列の入力支援に利用可能とすべく、前記1以上の文字列をそれぞれの評価値に関連付けた文字列情報を生成する生成工程と、
    を有することを特徴とする情報処理装置の制御方法。
  12. 投射装置により投射された投射画像から1以上の文字列を抽出する抽出手段と、
    前記投射画像における前記1以上の文字列それぞれの出現特徴に基づいて、該1以上の文字列それぞれに対する評価値を決定する決定手段と、
    前記1以上の文字列の入力支援に利用可能とすべく、前記1以上の文字列をそれぞれの評価値に関連付けた文字列情報を生成する生成手段と、
    前記文字列情報を利用して、文字列の入力支援を行う入力支援手段と、
    を有することを特徴とする情報処理システム。
  13. コンピュータを、請求項1乃至10の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2015047412A 2015-03-10 2015-03-10 情報処理装置およびその制御方法、情報処理システム Pending JP2016167227A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015047412A JP2016167227A (ja) 2015-03-10 2015-03-10 情報処理装置およびその制御方法、情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015047412A JP2016167227A (ja) 2015-03-10 2015-03-10 情報処理装置およびその制御方法、情報処理システム

Publications (1)

Publication Number Publication Date
JP2016167227A true JP2016167227A (ja) 2016-09-15

Family

ID=56897645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015047412A Pending JP2016167227A (ja) 2015-03-10 2015-03-10 情報処理装置およびその制御方法、情報処理システム

Country Status (1)

Country Link
JP (1) JP2016167227A (ja)

Similar Documents

Publication Publication Date Title
JP6464504B2 (ja) 電子機器、処理方法およびプログラム
US9207808B2 (en) Image processing apparatus, image processing method and storage medium
CN112541359B (zh) 文档内容识别方法、装置、电子设备及介质
JP2014052914A (ja) 情報処理装置および手書き文書検索方法
CN111753717A (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
JP2018128996A (ja) 情報処理装置、制御方法、およびプログラム
JP2010134876A (ja) 情報処理装置及び情報処理方法
JP2015060579A (ja) 情報処理システム、情報処理方法および情報処理プログラム
US10803233B2 (en) Method and system of extracting structured data from a document
CN111209909A (zh) 资质识别模板构建方法、装置、设备和存储介质
JP2019194853A (ja) 情報処理装置、情報処理プログラム及び情報処理システム
US20190114477A1 (en) Terminal apparatus, information processing system, and method of processing information
US20110075941A1 (en) Data managing apparatus, data managing method and information storing medium storing a data managing program
JP2011165092A (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2020095374A (ja) 文字認識システム、文字認識装置、プログラム及び文字認識方法
JP5330576B1 (ja) 情報処理装置および筆跡検索方法
JP5735126B2 (ja) システムおよび筆跡検索方法
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JP2016167227A (ja) 情報処理装置およびその制御方法、情報処理システム
KR20220079431A (ko) 스크린샷 이미지로부터 태그 정보를 추출하는 방법 및 시스템
JP7259403B2 (ja) 情報処理装置及びプログラム
CN111444751A (zh) 信息处理装置、储存介质及信息处理方法
JP2017062584A (ja) 電子機器及び方法
US9906669B2 (en) Scanning system, scanned image processing device and scanning method
JP2021028770A (ja) 情報処理装置及び表認識方法