JP2016502218A - モバイルデバイスベースのテキスト検出および追跡 - Google Patents
モバイルデバイスベースのテキスト検出および追跡 Download PDFInfo
- Publication number
- JP2016502218A JP2016502218A JP2015551677A JP2015551677A JP2016502218A JP 2016502218 A JP2016502218 A JP 2016502218A JP 2015551677 A JP2015551677 A JP 2015551677A JP 2015551677 A JP2015551677 A JP 2015551677A JP 2016502218 A JP2016502218 A JP 2016502218A
- Authority
- JP
- Japan
- Prior art keywords
- subsequent image
- text block
- text
- image frame
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title abstract description 19
- 238000012015 optical character recognition Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims description 110
- 238000003384 imaging method Methods 0.000 claims description 12
- 238000013519 translation Methods 0.000 claims description 8
- 230000003190 augmentative effect Effects 0.000 claims description 2
- 230000015654 memory Effects 0.000 description 36
- 230000008569 process Effects 0.000 description 28
- 230000033001 locomotion Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 11
- 230000036544 posture Effects 0.000 description 9
- 230000001960 triggered effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000013316 polymer of intrinsic microporosity Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30244—Camera pose
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computing Systems (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Character Input (AREA)
- Studio Devices (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
Description
本出願は、2013年9月9日に出願した「Mobile Device Based Text Tracking and Detection」と題する米国特許出願第14/021,337号に対する利益および優先権を主張し、同様に、2013年1月4日に出願した「Mobile Device Based Text Tracking and Detection」と題する米国特許仮出願第61/749,248号に対する利益および優先権を主張するものであり、両出願は参照によりその全体を本明細書に組み入れられる。
110 カメラ
120 接続
130 慣性測定ユニット(IMU)
145 ディスプレイ
150 プロセッサ
160 メモリ
170 トランシーバ
210 テキストブロック
210-1 テキストブロック
210-2 テキストブロック
230-1 カメラ位置、位置
230-2 カメラ位置、位置
250 一点鎖線
255 破線
260 テキストブロック210-1の初期姿勢
265 テキストブロック210-1の知られている姿勢
270 テキストブロック210-2の姿勢
275 基準系、座標系
280 基準系
285 基準系、ページ座標系
400 テキスト追跡のためのシステムのアーキテクチャ、システム
410 単語認識モジュール
420 単語追跡モジュール、追跡モジュール
430 テキストアセンブラ、テキストアセンブラモジュール
440 今回追跡された単語およびそれらそれぞれの姿勢のリスト
450 今回認識されたテキストブロックの表示
460 フィードバックビジュアライザ
Claims (39)
- 移動局(MS)上の方法であって、
第1のテキストブロックを位置特定して認識するために、前記MS上のカメラによってキャプチャされた画像フレーム上で光学式文字認識(OCR)を実行することによって第1の参照フレームを取得するステップと、
選択された後続の画像フレームと関連付けられたパラメータに基づいて、後続の画像フレームのセットから後続の画像フレームを選択するステップと、
第2のテキストブロックを認識するために、前記選択された後続の画像フレーム上でOCRを実行することによって第2の参照フレームを取得するステップと、
前記第2の参照フレーム内の前記第1のテキストブロックの位置と前記第2の参照フレームと関連付けられたカメラ姿勢とに少なくとも部分的に基づいて前記第1のテキストブロックと前記第2のテキストブロックとの間の幾何学的関係を判断するステップとを含む、方法。 - 前記第1のテキストブロックと前記第2のテキストブロックとの間の前記幾何学的関係に基づいて前記第1のテキストブロックと前記第2のテキストブロックとを連続的にアセンブルするステップをさらに含む、請求項1に記載の方法。
- 前記第1のテキストブロックと前記第2のテキストブロックとの間の前記幾何学的関係が、前記テキストブロックが現れる媒体と関連付けられた基準系に少なくとも部分的に基づく、請求項2に記載の方法。
- 前記アセンブルされた一連の第1および第2のテキストブロックを入力としてテキスト音声アプリケーションに与えるステップをさらに含む、請求項2に記載の方法。
- 前記後続の画像フレームを選択するステップが、
後続の画像フレームの前記セットに対するカメラ姿勢を計算するステップであって、各カメラ姿勢が別個の後続の画像フレームと関連付けられ、前記関連付けられた後続の画像フレームを前記第1の参照フレームと整合させることに少なくとも部分的に基づいて判断される、計算するステップと、
後続の画像フレームの前記セット内の対応する画像フレームと関連付けられたパラメータを、前記計算されたカメラ姿勢に少なくとも部分的に基づいて判断するステップとをさらに含む、請求項1に記載の方法。 - 前記整合させることが、効率的2次最小化(ESM)を使用して実行される、請求項5に記載の方法。
- 前記ESMが、前記関連付けられた後続の画像フレームのより低い分解能バージョン上で動作する、請求項6に記載の方法。
- 後続の画像フレームの前記セットに対するカメラ姿勢を計算するステップが、
前記第1の参照フレーム内の複数の特徴点を識別することによって取得された画像パッチを含む追跡ターゲットを生成するステップと、
前記第1の参照フレームと前記後続の画像フレームとの間の画像パッチの対応に基づいて、前記セット内の後続の画像フレーム内で前記追跡ターゲットのロケーションを判断するステップと、
前記後続の画像フレーム内の前記追跡ターゲットの前記ロケーションに少なくとも部分的に基づいて前記後続の画像フレームと関連付けられたカメラ姿勢を計算するステップとをさらに含む、請求項5に記載の方法。 - 前記特徴点が、前記第1の参照フレーム内の自然特徴に基づく、請求項8に記載の方法。
- 個別の特徴点が重みを割り当てられ、前記第1のテキストブロックの上の特徴点が、前記第1の参照フレーム内の他の場所に位置する特徴点に対してより大きい重みを割り当てられる、請求項8に記載の方法。
- 前記追跡ターゲットの生成が、前記関連付けられた後続の画像フレームを前記第1の参照フレームと整合させることと実質的に並列して実行される、請求項8に記載の方法。
- 前記第1の参照フレームおよび後続の画像フレームの前記セットがマーカーレスである、請求項1に記載の方法。
- 前記パラメータが、
前記選択された後続の画像フレームと前記第1の参照フレームとの間のオーバーラップ領域のパーセンテージか、
前記選択された後続の画像フレーム内で可視の前記第1のテキストブロックの割合であって、前記第1のテキストブロックの全領域に対する前記選択された後続の画像フレーム内の前記第1のテキストブロックの可視の部分を含む領域の比として決定される、割合か、
前記第1の参照フレームに対する前記選択された後続の画像フレームの回転の大きさか、または
前記第1の参照フレームに対する前記選択された後続の画像フレームの並進の大きさのうちの少なくとも1つを含む、請求項1に記載の方法。 - 前記カメラ姿勢が6自由度(6-DoF)で判断され、前記カメラが前記テキストブロックを含む平坦な媒体に対してフロントパラレルである、請求項1に記載の方法。
- 前記方法が、拡張現実(AR)アプリケーションによって起動される、請求項1に記載の方法。
- 仮想オブジェクトが、前記第1のテキストブロックおよび前記第2のテキストブロックの上に前記ARアプリケーションによって配置される、請求項15に記載の方法。
- 前記仮想オブジェクトが、前記第1のテキストブロックおよび前記第2のテキストブロックから翻訳されたテキストを含み、前記翻訳されたテキストが、前記第1のテキストブロックおよび前記第2のテキストブロックを表現するために使用された言語と異なる言語におけるものである、請求項16に記載の方法。
- 第1の画像フレームおよび後続の画像フレームのセットをキャプチャするように構成されたカメラと、
前記カメラに結合されたプロセッサであって、
第1のテキストブロックを位置特定して認識するために、前記第1の画像フレーム上で光学式文字認識(OCR)を実行することによって第1の参照フレームを取得することと、
選択された後続の画像フレームと関連付けられたパラメータに基づいて、後続の画像フレームのセットから後続の画像フレームを選択することと、
第2のテキストブロックを認識するために、前記選択された後続の画像フレーム上でOCRを実行することによって第2の参照フレームを取得することとを行うように構成された単語認識モジュールを備える、プロセッサと、
前記第2の参照フレーム内の前記第1のテキストブロックの位置と前記第2の参照フレームと関連付けられたカメラ姿勢とに少なくとも部分的に基づいて、前記第1のテキストブロックと前記第2のテキストブロックとの間の幾何学的関係を判断するように構成されたテキストアセンブラモジュールとを備える、移動局(MS)。 - 前記テキストアセンブラモジュールが、
前記第1のテキストブロックと前記第2のテキストブロックとの間の前記幾何学的関係に基づいて前記第1のテキストブロックと前記第2のテキストブロックとを連続的にアセンブルするようにさらに構成される、請求項18に記載のMS。 - 前記テキストアセンブラモジュールが、
前記アセンブルされた一連の第1および第2のテキストブロックを入力としてテキスト音声アプリケーションに与えるようにさらに構成される、請求項19に記載のMS。 - 前記プロセッサが、前記単語認識モジュールに動作可能に結合された追跡モジュールをさらに備え、前記追跡モジュールが、
後続の画像フレームの前記セットに対するカメラ姿勢を計算することであって、各カメラ姿勢が別個の後続の画像フレームと関連付けられ、前記関連付けられた後続の画像フレームを前記第1の参照フレームと整合させることに少なくとも部分的に基づいて判断される、計算することと、
後続の画像フレームの前記セット内の対応する画像フレームと関連付けられたパラメータを、前記計算されたカメラ姿勢に少なくとも部分的に基づいて判断することとを行うように構成される、請求項18に記載のMS。 - 前記追跡モジュールが、効率的2次最小化(ESM)を使用して前記整合させることを実行するようにさらに構成される、請求項21に記載のMS。
- 前記ESMが、前記関連付けられた後続の画像フレームのより低い分解能バージョン上で動作する、請求項22に記載のMS。
- 後続の画像フレームの前記セットに対するカメラ姿勢を計算するために、前記追跡モジュールが、
前記第1の参照フレーム内の複数の特徴点を識別することによって取得された画像パッチを含む追跡ターゲットを生成することと、
前記第1の参照フレームと前記後続の画像フレームとの間の画像パッチの対応に基づいて、前記セット内の後続の画像フレーム内で前記追跡ターゲットのロケーションを判断することと、
前記後続の画像フレーム内の前記追跡ターゲットの前記ロケーションに少なくとも部分的に基づいて前記後続の画像フレームと関連付けられたカメラ姿勢を計算することとを行うようにさらに構成される、請求項21に記載のMS。 - 前記特徴点が、前記第1の参照フレーム内の自然特徴に基づく、請求項24に記載のMS。
- 前記第1のテキストブロックの上の特徴点が、前記第1の参照フレーム内の他の場所に位置する特徴点に対してより大きい重みを割り当てられるように、前記追跡モジュールが個別の特徴点に重みを割り当てるように構成される、請求項24に記載のMS。
- 前記追跡モジュールが、前記関連付けられた後続の画像フレームを前記第1の参照フレームと整合させることと実質的に並列して前記追跡ターゲットを生成するように構成される、請求項24に記載のMS。
- 前記第1の参照フレームおよび前記カメラによってキャプチャされた後続の画像フレームの前記セットがマーカーレスである、請求項18に記載のMS。
- 前記パラメータが、
前記選択された後続の画像フレームと前記第1の参照フレームとの間のオーバーラップ領域のパーセンテージか、
前記選択された後続の画像フレーム内で可視の前記第1のテキストブロックの割合であって、前記第1のテキストブロックの全領域に対する前記選択された後続の画像フレーム内の前記第1のテキストブロックの可視の部分を含む領域の比として決定される、割合か、
前記第1の参照フレームに対する前記選択された後続の画像フレームの回転の大きさか、または
前記第1の参照フレームに対する前記選択された後続の画像フレームの並進の大きさのうちの少なくとも1つを含む、請求項18に記載のMS。 - 一連の画像フレームをキャプチャするための撮像手段と、
第1のテキストブロックを位置特定して認識するために、前記一連の画像フレーム内の画像フレーム上で光学式文字認識(OCR)を実行することによって第1の参照フレームを取得するための手段と、
選択された後続の画像フレームと関連付けられたパラメータに基づいて、前記一連の画像フレームから後続の画像フレームを選択するための手段と、
第2のテキストブロックを認識するために、前記選択された後続の画像フレーム上でOCRを実行することによって第2の参照フレームを取得するための手段と、
前記第2の参照フレーム内の前記第1のテキストブロックの位置と前記第2の参照フレームと関連付けられた前記撮像手段の姿勢とに少なくとも部分的に基づいて、前記第1のテキストブロックと前記第2のテキストブロックとの間の幾何学的関係を判断するための手段とを含む、装置。 - 前記第1のテキストブロックと前記第2のテキストブロックとの間の前記幾何学的関係に基づいて前記第1のテキストブロックと前記第2のテキストブロックとを連続的にアセンブルするための手段をさらに含む、請求項30に記載の装置。
- 前記アセンブルされた一連の第1および第2のテキストブロックを入力としてテキスト音声アプリケーションに与えるための手段をさらに含む、請求項31に記載の装置。
- 後続の画像フレームを選択するための前記手段が、
前記一連の画像フレーム内の前記画像フレームに対する前記撮像手段の姿勢を計算するための手段であって、前記撮像手段の計算された姿勢の各々が、別個の画像フレームと関連付けられ、少なくとも部分的に前記関連付けられた画像フレームを前記第1の参照フレームと整合させることによって判断される、計算するための手段と、
前記一連の画像フレーム内の対応する画像フレームと関連付けられたパラメータを、前記撮像手段の前記計算された姿勢に少なくとも部分的に基づいて判断するための手段とを含む、請求項30に記載の装置。 - 前記撮像手段の姿勢を計算するための前記手段が、
前記第1の参照フレーム内の複数の特徴点を識別することによって取得された画像パッチを含む追跡ターゲットを生成するための手段と、
前記第1の参照フレームと前記後続の画像フレームとの間の画像パッチの対応に基づいて、前記一連の画像フレーム内の後続の画像フレーム内で前記追跡ターゲットのロケーションを判断するための手段と、
前記後続の画像フレーム内の前記追跡ターゲットの前記ロケーションに少なくとも部分的に基づいて前記後続の画像フレームと関連付けられたカメラ姿勢を計算するための手段とを含む、請求項33に記載の装置。 - 個別の特徴点が重みを割り当てられ、前記第1のテキストブロックの上の特徴点が、前記第1の参照フレーム内の他の場所に位置する特徴点に対してより大きい重みを割り当てられる、請求項34に記載の装置。
- 前記追跡ターゲットを生成するための前記手段が、前記関連付けられた画像フレームを前記第1の参照フレームと前記整合させることと実質的に並列して動作する、請求項34に記載の装置。
- 前記撮像手段によってキャプチャされた前記一連の画像フレーム内の前記画像フレームがマーカーレスである、請求項30に記載の装置。
- 前記パラメータが、
前記選択された後続の画像フレームと前記第1の参照フレームとの間のオーバーラップ領域のパーセンテージか、
前記選択された後続の画像フレーム内で可視の前記第1のテキストブロックの割合か、
前記第1の参照フレームに対する前記選択された後続の画像フレームの回転の大きさか、または、
前記第1の参照フレームに対する前記選択された後続の画像フレームの並進の大きさのうちの少なくとも1つを含む、請求項30に記載の装置。 - プロセッサによって実行されると移動局(MS)上の方法を実行する命令を含む非一時的コンピュータ可読記録媒体であって、前記方法が、
第1のテキストブロックを位置特定して認識するために、前記MS上のカメラによってキャプチャされた画像フレーム上で光学式文字認識(OCR)を実行することによって第1の参照フレームを取得するステップと、
選択された後続の画像フレームと関連付けられたパラメータに基づいて、後続の画像フレームのセットから後続の画像フレームを選択するステップと、
第2のテキストブロックを認識するために、前記選択された後続の画像フレーム上でOCRを実行することによって第2の参照フレームを取得するステップと、
前記第2の参照フレーム内の前記第1のテキストブロックの位置と前記第2の参照フレームと関連付けられたカメラ姿勢とに少なくとも部分的に基づいて前記第1のテキストブロックと前記第2のテキストブロックとの間の幾何学的関係を判断するステップとを含む、非一時的コンピュータ可読記録媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361749248P | 2013-01-04 | 2013-01-04 | |
US61/749,248 | 2013-01-04 | ||
US14/021,337 | 2013-09-09 | ||
US14/021,337 US20140192210A1 (en) | 2013-01-04 | 2013-09-09 | Mobile device based text detection and tracking |
PCT/US2013/071518 WO2014107246A1 (en) | 2013-01-04 | 2013-11-22 | Mobile device based text detection and tracking |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016502218A true JP2016502218A (ja) | 2016-01-21 |
JP2016502218A5 JP2016502218A5 (ja) | 2016-12-28 |
JP6338595B2 JP6338595B2 (ja) | 2018-06-06 |
Family
ID=51060682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551677A Expired - Fee Related JP6338595B2 (ja) | 2013-01-04 | 2013-11-22 | モバイルデバイスベースのテキスト検出および追跡 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20140192210A1 (ja) |
EP (1) | EP2941736B1 (ja) |
JP (1) | JP6338595B2 (ja) |
KR (1) | KR20150104126A (ja) |
CN (1) | CN104885098B (ja) |
WO (1) | WO2014107246A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018235219A1 (ja) * | 2017-06-22 | 2018-12-27 | 日本電気株式会社 | 自己位置推定方法、自己位置推定装置および自己位置推定プログラム |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108769497B (zh) * | 2013-06-13 | 2021-01-15 | 核心光电有限公司 | 双孔径变焦数字摄影机 |
US10474921B2 (en) * | 2013-06-14 | 2019-11-12 | Qualcomm Incorporated | Tracker assisted image capture |
US9710440B2 (en) * | 2013-08-21 | 2017-07-18 | Microsoft Technology Licensing, Llc | Presenting fixed format documents in reflowed format |
US20150123966A1 (en) * | 2013-10-03 | 2015-05-07 | Compedia - Software And Hardware Development Limited | Interactive augmented virtual reality and perceptual computing platform |
US9565370B2 (en) * | 2014-05-30 | 2017-02-07 | Apple Inc. | System and method for assisting in computer interpretation of surfaces carrying symbols or characters |
US9449239B2 (en) | 2014-05-30 | 2016-09-20 | Apple Inc. | Credit card auto-fill |
US20160092747A1 (en) * | 2014-09-29 | 2016-03-31 | Qualcomm Incorporated | Devices and methods for facilitating digital imagery encoding based on detection of text and computer generated graphics |
JP2016111633A (ja) * | 2014-12-09 | 2016-06-20 | キヤノン株式会社 | 回路情報に従って論理回路を構成可能な回路を持つデバイスと、複数の制御手段とを有する情報処理システム |
US9613273B2 (en) * | 2015-05-19 | 2017-04-04 | Toyota Motor Engineering & Manufacturing North America, Inc. | Apparatus and method for object tracking |
RU2613849C1 (ru) | 2016-05-13 | 2017-03-21 | Общество с ограниченной ответственностью "Аби Девелопмент" | Оптическое распознавание символов серии изображений |
US10108856B2 (en) | 2016-05-13 | 2018-10-23 | Abbyy Development Llc | Data entry from series of images of a patterned document |
RU2619712C1 (ru) * | 2016-05-13 | 2017-05-17 | Общество с ограниченной ответственностью "Аби Девелопмент" | Оптическое распознавание символов серии изображений |
US10701261B2 (en) * | 2016-08-01 | 2020-06-30 | International Business Machines Corporation | Method, system and computer program product for selective image capture |
GB2557237B (en) * | 2016-12-01 | 2022-05-11 | Crane Payment Innovations Ltd | Method and apparatus for money item processing |
CN108629843B (zh) * | 2017-03-24 | 2021-07-13 | 成都理想境界科技有限公司 | 一种实现增强现实的方法及设备 |
WO2019009916A1 (en) | 2017-07-07 | 2019-01-10 | Hewlett-Packard Development Company, L.P. | ALIGNMENTS OF IMAGES THROUGH OPTICAL RECOGNITION OF CHARACTERS |
KR102402148B1 (ko) * | 2017-08-22 | 2022-05-26 | 삼성전자주식회사 | 전자 장치 및 그의 문자 인식 방법 |
RU2657181C1 (ru) | 2017-09-01 | 2018-06-08 | Общество с ограниченной ответственностью "Аби Продакшн" | Способ улучшения качества распознавания отдельного кадра |
CN107679135A (zh) * | 2017-09-22 | 2018-02-09 | 深圳市易图资讯股份有限公司 | 面向网络文本大数据的话题检测与跟踪方法、装置 |
RU2673015C1 (ru) | 2017-12-22 | 2018-11-21 | Общество с ограниченной ответственностью "Аби Продакшн" | Способы и системы оптического распознавания символов серии изображений |
US10699145B1 (en) * | 2018-11-14 | 2020-06-30 | Omniscience Corp. | Systems and methods for augmented reality assisted form data capture |
CN109917644B (zh) * | 2018-12-26 | 2022-06-14 | 达闼科技(北京)有限公司 | 一种提高视觉惯导系统鲁棒性的方法、装置和机器人设备 |
KR20190103085A (ko) * | 2019-08-15 | 2019-09-04 | 엘지전자 주식회사 | 지능형 진단 디바이스 |
US11461164B2 (en) | 2020-05-01 | 2022-10-04 | UiPath, Inc. | Screen response validation of robot execution for robotic process automation |
US11200441B2 (en) * | 2020-05-01 | 2021-12-14 | UiPath, Inc. | Text detection, caret tracking, and active element detection |
US11080548B1 (en) | 2020-05-01 | 2021-08-03 | UiPath, Inc. | Text detection, caret tracking, and active element detection |
CN111931571B (zh) * | 2020-07-07 | 2022-05-17 | 华中科技大学 | 基于在线增强检测的视频文字目标追踪方法与电子设备 |
TR202101347A1 (tr) * | 2021-01-28 | 2022-08-22 | Univ Yildiz Teknik | Bir sesli okuma cihazı. |
CN115797815B (zh) * | 2021-09-08 | 2023-12-15 | 荣耀终端有限公司 | Ar翻译的处理方法及电子设备 |
US12008829B2 (en) * | 2022-02-16 | 2024-06-11 | Vastec, Inc. | System and method for improved OCR efficacy through image segmentation |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003331217A (ja) * | 2002-03-08 | 2003-11-21 | Nec Corp | 文字入力装置、文字入力方法及び文字入力プログラム |
US20050286743A1 (en) * | 2004-04-02 | 2005-12-29 | Kurzweil Raymond C | Portable reading device with mode processing |
WO2012051040A1 (en) * | 2010-10-13 | 2012-04-19 | Qualcomm Incorporated | Text-based 3d augmented reality |
JP2013250932A (ja) * | 2012-06-04 | 2013-12-12 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6137491A (en) * | 1998-06-05 | 2000-10-24 | Microsoft Corporation | Method and apparatus for reconstructing geometry using geometrically constrained structure from motion with points on planes |
SE519405C2 (sv) * | 2000-07-19 | 2003-02-25 | Jacob Weitman | Tillämpningar för en avancerad digitalkamera som tolkar den tagna bilden utifrån dess informationsinnehåll, såsom att överföra bilden, beordra en tjänst, styra ett flöde mm |
US8107721B2 (en) * | 2008-05-29 | 2012-01-31 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for determining poses of semi-specular objects |
FR2947657B1 (fr) * | 2009-07-06 | 2016-05-27 | Valeo Vision | Procede de detection d'un obstacle pour vehicule automobile |
US20110090253A1 (en) * | 2009-10-19 | 2011-04-21 | Quest Visual, Inc. | Augmented reality language translation system and method |
-
2013
- 2013-09-09 US US14/021,337 patent/US20140192210A1/en not_active Abandoned
- 2013-11-22 WO PCT/US2013/071518 patent/WO2014107246A1/en active Application Filing
- 2013-11-22 EP EP13811282.6A patent/EP2941736B1/en not_active Not-in-force
- 2013-11-22 CN CN201380069165.8A patent/CN104885098B/zh not_active Expired - Fee Related
- 2013-11-22 KR KR1020157020751A patent/KR20150104126A/ko not_active Application Discontinuation
- 2013-11-22 JP JP2015551677A patent/JP6338595B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003331217A (ja) * | 2002-03-08 | 2003-11-21 | Nec Corp | 文字入力装置、文字入力方法及び文字入力プログラム |
US20050286743A1 (en) * | 2004-04-02 | 2005-12-29 | Kurzweil Raymond C | Portable reading device with mode processing |
WO2012051040A1 (en) * | 2010-10-13 | 2012-04-19 | Qualcomm Incorporated | Text-based 3d augmented reality |
JP2013250932A (ja) * | 2012-06-04 | 2013-12-12 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018235219A1 (ja) * | 2017-06-22 | 2018-12-27 | 日本電気株式会社 | 自己位置推定方法、自己位置推定装置および自己位置推定プログラム |
JPWO2018235219A1 (ja) * | 2017-06-22 | 2020-03-19 | 日本電気株式会社 | 自己位置推定方法、自己位置推定装置および自己位置推定プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2941736A1 (en) | 2015-11-11 |
EP2941736B1 (en) | 2019-08-14 |
CN104885098A (zh) | 2015-09-02 |
CN104885098B (zh) | 2020-02-21 |
US20140192210A1 (en) | 2014-07-10 |
KR20150104126A (ko) | 2015-09-14 |
JP6338595B2 (ja) | 2018-06-06 |
WO2014107246A1 (en) | 2014-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6338595B2 (ja) | モバイルデバイスベースのテキスト検出および追跡 | |
CN109154501B (zh) | 视觉导航系统中的几何匹配 | |
CN105283905B (zh) | 使用点和线特征的稳健跟踪 | |
US9013550B2 (en) | Online reference generation and tracking for multi-user augmented reality | |
JP6258953B2 (ja) | 単眼視覚slamのための高速初期化 | |
WO2019042426A1 (zh) | 增强现实场景的处理方法、设备及计算机存储介质 | |
JP2018028899A (ja) | 画像レジストレーションの方法及びシステム | |
US9747516B2 (en) | Keypoint detection with trackability measurements | |
WO2014200625A1 (en) | Systems and methods for feature-based tracking | |
US20170228585A1 (en) | Face recognition system and face recognition method | |
JP2012103789A (ja) | オブジェクト表示装置及びオブジェクト表示方法 | |
KR101510312B1 (ko) | 복수의 카메라들을 이용한 3d 얼굴 모델링 장치, 시스템 및 방법 | |
CN113190120B (zh) | 位姿获取方法、装置、电子设备及存储介质 | |
TW201544995A (zh) | 物件辨識方法與裝置 | |
JP2011071746A (ja) | 映像出力装置及び映像出力方法 | |
EP4311221A1 (en) | Information processing device, information processing method, and program | |
JP7075090B1 (ja) | 情報処理システム、及び、情報処理方法 | |
JP7262689B1 (ja) | 情報処理装置、生成方法、及び生成プログラム | |
CN113808216A (zh) | 相机标定方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20150701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161104 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6338595 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |