JP7231529B2 - 情報端末装置、サーバ及びプログラム - Google Patents
情報端末装置、サーバ及びプログラム Download PDFInfo
- Publication number
- JP7231529B2 JP7231529B2 JP2019209383A JP2019209383A JP7231529B2 JP 7231529 B2 JP7231529 B2 JP 7231529B2 JP 2019209383 A JP2019209383 A JP 2019209383A JP 2019209383 A JP2019209383 A JP 2019209383A JP 7231529 B2 JP7231529 B2 JP 7231529B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- unit
- search
- imaging target
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
撮像部1は、所定の撮像対象を撮像して、その撮像画像を推定部2及び提示部5へと出力する。撮像部1を実現するハードウェアとしては例えば、昨今の携帯端末に標準装備されることの多いデジタルカメラを用いることができる。ユーザUによる撮像操作(カメラを撮像対象に対して向ける操作など)により、撮像対象は任意の位置姿勢から撮像部1で撮像され撮像情報が取得される。撮像対象は書籍や新聞、カタログ等といった印刷物などの、紙面上に文字を記録した物理的な媒体を想定して説明するが、撮像対象がプロジェクタによって壁面などに投影される文章や画像などである場合でも本実施形態は適用可能である。
推定部2は、撮像部1で撮像された撮像画像に認識処理を適用することによって撮像対象を特定するとともに、当該特定結果に基づいて撮像対象と撮像部1との相対的な位置姿勢を推定する。推定部2において当該特定された撮像対象の情報は対象情報として検索部3へ、当該推定された位置姿勢は姿勢情報として描画部4へと出力される。
[非特許文献2] 「H.Bay, T.Tuytelaars, and L.V.Gool, SURF: Speed Up Robust Features, Proc. of Int. Conf. of ECCV, (2006)」
R=H・R(i) …(1)
受付部7は、ユーザUが入力する検索語句を受け取り語句情報として検索部3へ出力する。一実施形態では受付部7を実現するハードウェアとしては携帯端末に標準装備(あるいは外部機器として接続)されるキーボードやタッチパネル等を用いることができる。なお、このキーボードは、タッチパネルとして構成されるディスプレイ上に表示されるソフトウェアキーボードであってもよい。あるいは、事前に検索語句をメニューから選択される項目として設定しておくことで、当該キーボード等による入力に代えてメニュー内からの選択入力で検索語句を受け取ってもよい。入力された語句をユーザUが確認できるように、提示部5に語句情報を随時提示してもよい。(なお図1では、この場合における受付部7から提示部5へと語句情報を出力する流れを表す矢印は、描くのを省略している。)
検索部3は、推定部2から対象情報を入力し、また受付部7から語句情報を入力することで、当該入力された対象情報及び語句情報に応じたテキスト情報を第二記憶部62から読み出して領域情報を生成し、当該領域情報を描画部へ出力する。
描画部4は、検索部3で得た領域情報を、推定部2で推定した姿勢情報を反映させた状態として描画した描画情報を得て、この描画情報を提示部5へと出力する。図2等の説明例を用いて既に説明したように、検索部3で得た領域情報R2(i)(あるいはR1(i))は推定部2で認識されたi番目の撮像対象を正対状態で見た際の領域R(i)内において検索語句がヒットした部分領域(R2(i)⊂R(i))であり、式(1)と同様に、推定部2で推定した姿勢情報を表す平面射影変換行列Hで領域情報R2(i)を変換することで以下の式(2)のように、描画部4において、撮像部1を構成するカメラの2次元画像座標(u,v)上での描画情報P2(i)を得ることができる。この式(2)による変換の模式例は図2の右上及び右下に示される通りである。
P2(i)=H・R2(i) …(2)
提示部5は、撮像部1で得た撮像画像に描画部4で得た描画情報を重畳することにより、受付部7に入力した検索語句の領域を視認可能に表示した拡張現実表示を生成し、この拡張現実表示をユーザUに対して表示することにより、検索結果を提示する。
B1= H-1・R1 …(3)
B2= H-1・R2 …(4)
[非特許文献3] Zhang, Z., & He, L. W. (2007). Whiteboard scanning and image enhancement. Digital Signal Processing, 17(2), 414-432.
100…情報処理システム、20…第一サーバ、30…第二サーバ
Claims (13)
- カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定する推定部と、
前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求める検索部と、
前記領域情報を前記推定された位置姿勢において描画した描画情報を得る描画部と、
前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示する提示部と、を備え、
前記撮像対象は書籍、新聞、カタログ、パンフレットその他の印刷又は電子表示される対象物におけるページであり、
前記推定部は、対象物及びページを特定することによって前記撮像対象を認識し、
前記検索部では、前記特定された対象物における前記特定されたページのテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求め、
前記検索部ではさらに、前記特定された対象物における前記特定されたページ以外の別ページのテキスト情報も取得し、ユーザより指定される検索語句の該当箇所を当該別ページのテキスト情報内より検索した結果を別ページ検索結果として取得し、
前記提示部ではさらに、前記別ページ検索結果を表示することを特徴とする情報端末装置。 - カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定する推定部と、
前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求める検索部と、
前記領域情報を前記推定された位置姿勢において描画した描画情報を得る描画部と、
前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示する提示部と、を備え、
前記描画部では前記描画情報を、前記撮像画像の範囲の内部にあるか外部にあるかに応じて区別した態様で描画することを特徴とする情報端末装置。 - カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定する推定部と、
前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求める検索部と、
前記領域情報を前記推定された位置姿勢において描画した描画情報を得る描画部と、
前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示する提示部と、を備え、
前記検索部では、ユーザより指定される検索語句の入力を、当該検索語句を構成する文字列の各文字の入力を逐次的に取得することによって受け付けることで、検索語句の該当箇所を当該逐次的に入力される文字列に関して逐次的な領域情報として求め、
前記描画部では前記逐次的に求まる領域情報を描画することで前記描画情報を逐次的に求め、
前記提示部では前記逐次的に求まる描画情報を逐次的に提示し、
前記検索部では、前記逐次的に入力される文字列に関して逐次的な領域情報を求める際に、前記テキスト情報において既に検索された文字列の該当箇所に、以降の時点で入力される文字列の検索対象を限定することを特徴とする情報端末装置。 - 前記推定部は、複数のリファレンスとしての撮像対象の各々について当該撮像対象の画像より抽出されるリファレンスとしての特徴情報を記憶しているデータベースを参照することにより、複数のリファレンスとしての撮像対象のうち、対応する特徴情報が、前記撮像画像より抽出されるクエリとしての特徴情報と合致すると判定されるような撮像対象を認識結果とすることを特徴とする請求項1ないし3のいずれかに記載の情報端末装置。
- 前記検索部は、複数のリファレンスとしての撮像対象の各々について当該撮像対象に表示されている文字列の情報及び当該文字列に属する各文字のレイアウト情報を含むテキスト情報を記憶しているデータベースを参照することにより、前記認識された撮像対象に対応するテキスト情報を取得することを特徴とする請求項1ないし4のいずれかに記載の情報端末装置。
- 前記推定部では平面射影変換行列で表現されるものとして前記位置姿勢を推定し、
前記描画部では、前記位置姿勢を表現する平面射影変換行列を用いて前記描画情報を得ることを特徴とする請求項1ないし5のいずれかに記載の情報端末装置。 - 前記提示部は、前記描画情報を前記撮像画像に対して重畳して表示することを特徴とする請求項1ないし6のいずれかに記載の情報端末装置。
- 前記カメラをさらに備えることを特徴とする請求項1ないし7のいずれかに記載の情報端末装置。
- 前記検索部では、前記推定された位置姿勢を用いることにより、前記テキスト情報に含まれる文字列に関して前記撮像画像の範囲の内部にあるか外部にあるかを判定し、内部にあると判定されたテキスト情報のみを検索語句の該当箇所の探索対象とすることを特徴とする請求項3に記載の情報端末装置。
- 情報端末装置及びサーバを備える情報処理システムにおけるサーバであって、
前記情報端末装置は推定部及び提示部を備え、前記サーバは検索部及び描画部を備え、
前記推定部は、カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定し、
前記検索部は、前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求め、
前記描画部は、前記領域情報を前記推定された位置姿勢において描画した描画情報を得て、
前記提示部は、前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示し、
前記撮像対象は書籍、新聞、カタログ、パンフレットその他の印刷又は電子表示される対象物におけるページであり、
前記推定部は、対象物及びページを特定することによって前記撮像対象を認識し、
前記検索部では、前記特定された対象物における前記特定されたページのテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求め、
前記検索部ではさらに、前記特定された対象物における前記特定されたページ以外の別ページのテキスト情報も取得し、ユーザより指定される検索語句の該当箇所を当該別ページのテキスト情報内より検索した結果を別ページ検索結果として取得し、
前記提示部ではさらに、前記別ページ検索結果を表示することを特徴とするサーバ。 - 情報端末装置及びサーバを備える情報処理システムにおけるサーバであって、
前記情報端末装置は推定部及び提示部を備え、前記サーバは検索部及び描画部を備え、
前記推定部は、カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定し、
前記検索部は、前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求め、
前記描画部は、前記領域情報を前記推定された位置姿勢において描画した描画情報を得て、
前記提示部は、前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示し、
前記描画部では前記描画情報を、前記撮像画像の範囲の内部にあるか外部にあるかに応じて区別した態様で描画することを特徴とするサーバ。 - 情報端末装置及びサーバを備える情報処理システムにおけるサーバであって、
前記情報端末装置は推定部及び提示部を備え、前記サーバは検索部及び描画部を備え、
前記推定部は、カメラで撮像した撮像画像より撮像対象を認識し、且つ、当該撮像対象の前記カメラを基準とした位置姿勢を推定し、
前記検索部は、前記認識された撮像対象に表示されている文字列の情報および当該文字列に属する各文字のレイアウト情報を含むテキスト情報を取得し、ユーザより指定される検索語句の該当箇所を当該テキスト情報内より領域情報として求め、
前記描画部は、前記領域情報を前記推定された位置姿勢において描画した描画情報を得て、
前記提示部は、前記カメラを基準とした前記検索語句の該当箇所として、前記描画情報を表示し、
前記検索部では、ユーザより指定される検索語句の入力を、当該検索語句を構成する文字列の各文字の入力を逐次的に取得することによって受け付けることで、検索語句の該当箇所を当該逐次的に入力される文字列に関して逐次的な領域情報として求め、
前記描画部では前記逐次的に求まる領域情報を描画することで前記描画情報を逐次的に求め、
前記提示部では前記逐次的に求まる描画情報を逐次的に提示し、
前記検索部では、前記逐次的に入力される文字列に関して逐次的な領域情報を求める際に、前記テキスト情報において既に検索された文字列の該当箇所に、以降の時点で入力される文字列の検索対象を限定することを特徴とするサーバ。 - コンピュータを請求項1ないし9のいずれかに記載の情報端末装置として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019209383A JP7231529B2 (ja) | 2019-11-20 | 2019-11-20 | 情報端末装置、サーバ及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019209383A JP7231529B2 (ja) | 2019-11-20 | 2019-11-20 | 情報端末装置、サーバ及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021082040A JP2021082040A (ja) | 2021-05-27 |
JP7231529B2 true JP7231529B2 (ja) | 2023-03-01 |
Family
ID=75966313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019209383A Active JP7231529B2 (ja) | 2019-11-20 | 2019-11-20 | 情報端末装置、サーバ及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7231529B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006092957A1 (ja) | 2005-03-01 | 2006-09-08 | Osaka Prefecture University Public Corporation | 文書・画像検索方法とそのプログラム、文書・画像登録装置および検索装置 |
JP2009043242A (ja) | 2007-07-11 | 2009-02-26 | Ricoh Co Ltd | グラフィカルユーザインターフェースを生成する方法及びシステム |
JP2018106481A (ja) | 2016-12-27 | 2018-07-05 | セイコーエプソン株式会社 | 表示装置、表示制御装置およびプログラム |
-
2019
- 2019-11-20 JP JP2019209383A patent/JP7231529B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006092957A1 (ja) | 2005-03-01 | 2006-09-08 | Osaka Prefecture University Public Corporation | 文書・画像検索方法とそのプログラム、文書・画像登録装置および検索装置 |
JP2009043242A (ja) | 2007-07-11 | 2009-02-26 | Ricoh Co Ltd | グラフィカルユーザインターフェースを生成する方法及びシステム |
JP2018106481A (ja) | 2016-12-27 | 2018-07-05 | セイコーエプソン株式会社 | 表示装置、表示制御装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021082040A (ja) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9785627B2 (en) | Automated form fill-in via form retrieval | |
US20160344860A1 (en) | Document and image processing | |
US20140348394A1 (en) | Photograph digitization through the use of video photography and computer vision technology | |
JP2011008752A (ja) | ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム | |
WO2007004519A1 (ja) | 検索システム及び検索方法 | |
US9098765B2 (en) | Systems and methods for capturing and storing image data from a negotiable instrument | |
JP2005514704A (ja) | 格納されたデータセットにアクセスする方法及びシステム、及び、手書きメモを格納されたデータセットと関連付ける方法及びシステム | |
US20150242684A1 (en) | Method and system for linking printed objects with electronic content | |
JP5294818B2 (ja) | 情報処理装置及び情報処理方法 | |
US9031308B2 (en) | Systems and methods for recreating an image using white space and check element capture | |
US20180115681A1 (en) | Display system | |
JP6574921B1 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
JP6739937B2 (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP6574920B1 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
CN114283273A (zh) | 对照系统、对照方法和信息存储介质 | |
JP7231529B2 (ja) | 情報端末装置、サーバ及びプログラム | |
WO2023051384A1 (zh) | 显示方法、信息发送方法和电子设备 | |
US20160004789A1 (en) | Visual Search Engine | |
JP6919260B2 (ja) | 情報変換装置及びプログラム | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
JP6408055B2 (ja) | 情報処理装置、方法及びプログラム | |
Uchiyama et al. | On-line document registering and retrieving system for AR annotation overlay | |
JP2017199288A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2004280514A (ja) | Pdfファイル及びpdfファイル作成システム | |
JP7137171B1 (ja) | 画像処理システム、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7231529 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |