JP2015504220A5 - - Google Patents

Download PDF

Info

Publication number
JP2015504220A5
JP2015504220A5 JP2014551409A JP2014551409A JP2015504220A5 JP 2015504220 A5 JP2015504220 A5 JP 2015504220A5 JP 2014551409 A JP2014551409 A JP 2014551409A JP 2014551409 A JP2014551409 A JP 2014551409A JP 2015504220 A5 JP2015504220 A5 JP 2015504220A5
Authority
JP
Japan
Prior art keywords
images
image
scene
data
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014551409A
Other languages
English (en)
Other versions
JP6105627B2 (ja
JP2015504220A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2013/020699 external-priority patent/WO2013106346A1/en
Publication of JP2015504220A publication Critical patent/JP2015504220A/ja
Publication of JP2015504220A5 publication Critical patent/JP2015504220A5/ja
Application granted granted Critical
Publication of JP6105627B2 publication Critical patent/JP6105627B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (15)

  1. モバイルデバイスにおいて複数の画像を受信するステップと、
    前記複数の画像の各々の中のデータを認識するステップであって、
    前記複数の画像に対して光学式文字認識を実施するステップ、および
    前記複数の画像の各々に対する前記認識されたデータを含むシーン記述子を生成するステップを含む、認識するステップと、
    前記認識されたデータに少なくとも部分的に基づいて、前記複数の画像のうち少なくとも2つの画像が、第1のシーンにある情報を含むと、前記少なくとも2つの画像の各々に対する前記認識されたデータを含む前記シーン記述子を比較し、前記少なくとも2つの画像が前記第1のシーンに関連付けられることを判断することにより、判断するステップと、
    前記少なくとも2つの画像のうち少なくとも1つの画像、および前記少なくとも1つの画像に関連付けられた前記認識されたデータを使って、前記第1のシーンを表す最終画像を記憶するステップであって、前記少なくとも2つの画像の他の画像データが、前記最終画像の一部として記憶されない、ステップと、
    前記第1のシーンを表す前記最終画像を、前記モバイルデバイス上で表示するステップとを含む方法。
  2. 前記複数の画像のうち前記少なくとも1つの画像、および前記少なくとも1つの画像についての前記認識されたデータの記憶は、後続画像がキャプチャされ、前記後続画像中でデータが認識される間、維持される、請求項1に記載の方法。
  3. 前記最終画像を記憶するのに先立って、前記方法が、前記少なくとも2つの画像と、前記少なくとも2つの画像に関連付けられた前記認識されたデータとを使って、前記最終画像を合成するステップをさらに含み、前記記憶は、前記合成された画像の記憶を含む、請求項1に記載の方法。
  4. 合成する前記ステップが、前記少なくとも2つの画像のうち第2の画像にある要素を前記少なくとも1つの画像に組み込んで、前記最終画像を作成するステップを含む、請求項3に記載の方法。
  5. 前記最終画像が前記少なくとも1つの画像を含み、合成する前記ステップが、前記少なくとも2つの画像のうち第2の画像の前記認識されたデータを、前記少なくとも1つの画像の前記認識されたデータに組み込むステップを含む、請求項3に記載の方法。
  6. 前記最終画像を記憶するのに先立って、前記方法が、前記最終画像として前記第1のシーンを表すための前記少なくとも1つの画像を、前記少なくとも2つの画像から選択するステップをさらに含み、記憶する前記ステップが、前記選択された画像を記憶するステップを含む、請求項1に記載の方法。
  7. 選択する前記ステップが、前記少なくとも2つの画像の各々のエネルギーを比較するステップを含む、請求項6に記載の方法。
  8. 各画像中で認識されたいくつかのグラフィカルオブジェクトと、前記いくつかのグラフィカルオブジェクトの各々の前記認識の信頼度とに基づいて、前記少なくとも2つの画像の各々の前記エネルギーを算出するステップをさらに含む、請求項7に記載の方法。
  9. 判断する前記ステップが、前記少なくとも2つの画像の各々におけるグラフィカルオブジェクト値、グラフィカルオブジェクト色、背景色および前景色のうち1つまたは複数を比較するステップを含む、請求項1に記載の方法。
  10. 前記複数の画像のうち1つまたは複数の画像が、前記第1のシーン以外の1つまたは複数のシーンにある情報を含むと判断するステップと、前記最終画像および前記1つもしくは複数のシーンをそれぞれが表す1つもしくは複数の画像を表示する、または前記少なくとも1つの画像についての、および前記1つもしくは複数のシーンについての前記認識されたデータを表示するステップとをさらに含む、請求項1に記載の方法。
  11. ユーザが前記表示された画像のうち1つまたは前記1つの画像についての表示される認識データを選択したと判断するステップと、前記選択された画像または認識されたデータに関連した情報をプログラムまたはアプリケーションに入力するステップとをさらに含む、請求項10に記載の方法。
  12. 前記最終画像を記憶するのに先立って、前記方法が、
    前記第1のシーンにある2つ以上の画像のうちの第1の画像から、グレアのある第1の領域を識別するステップと、
    前記第1のシーンにある前記2つ以上の画像のうちの第2の画像から、グレアのない第2の領域を識別するステップであって、前記第1の領域および前記第2の領域が、前記第1のシーンの同じ領域を表す、ステップと、
    前記第1の画像および前記第2の画像からのグレアのない前記第2の領域を使って、グレアが低減された前記最終画像を合成するステップとをさらに含む、請求項1に記載の方法。
  13. プロセッサによって実行可能な命令を含む非一時的コンピュータ可読記憶媒体であって、前記命令が、
    数の画像を受信するための命令と、
    前記複数の画像の各々の中のデータを認識するための命令であって、前記複数の画像の各々の中のデータを認識することが、
    前記複数の画像に対して光学式文字認識を実施すること、および
    前記複数の画像の各々に対する前記認識されたデータを含むシーン記述子を生成することを含む、命令と、
    前記認識されたデータに少なくとも部分的に基づいて、前記複数の画像のうち少なくとも2つの画像が、第1のシーンにある情報を含むと、前記少なくとも2つの画像の各々に対する前記認識されたデータを含む前記シーン記述子を比較し、前記少なくとも2つの画像が前記第1のシーンに関連付けられることを判断することにより、判断するための命令と、
    前記少なくとも2つの画像のうち少なくとも1つの画像、および前記少なくとも1つの画像に関連付けられた前記認識されたデータを使って、前記第1のシーンを表す最終画像を記憶するための命令であって、前記少なくとも2つの画像の他の画像データが、前記最終画像の一部として記憶されない、命令と、
    前記第1のシーンを表す前記最終画像を表示するための命令とを含む、非一時的コンピュータ可読記憶媒体。
  14. モバイルデバイスにおいて複数の画像を受信するための手段と、
    前記複数の画像の各々の中のデータを認識するための手段であって、前記複数の画像の各々の中のデータを認識することが、
    前記複数の画像に対して光学式文字認識を実施すること、および
    前記複数の画像の各々に対する前記認識されたデータを含むシーン記述子を生成することを含む、手段と、
    前記認識されたデータに少なくとも部分的に基づいて、前記複数の画像のうち少なくとも2つの画像が、第1のシーンにある情報を含むと、前記少なくとも2つの画像の各々に対する前記認識されたデータを含む前記シーン記述子を比較し、前記少なくとも2つの画像が前記第1のシーンに関連付けられることを判断することにより、判断するための手段と、
    前記少なくとも2つの画像のうち少なくとも1つの画像、および前記少なくとも1つの画像に関連付けられた前記認識されたデータを使って、前記第1のシーンを表す最終画像を記憶するための手段であって、前記少なくとも2つの画像の他の画像データが、前記最終画像の一部として記憶されない、手段と、
    前記第1のシーンを表す前記最終画像を、前記モバイルデバイス上で表示するための手段とを備える装置。
  15. 前記装置がモバイルデバイスを含み、
    前記受信するための手段が、複数の画像を受信するように構成された画像モジュールを含み、
    前記認識するための手段が、光学式文字認識を使って、前記複数の画像の各々の中のデータを認識するように構成されたOCRエンジンを含み、
    前記判断するための手段が、前記認識されたデータに少なくとも部分的に基づいて、前記複数の画像のうち少なくとも2つの画像が、前記第1のシーンにある情報を含むと判断するように構成された照合モジュールを含み、
    前記記憶するための手段が、前記少なくとも2つの画像のうち少なくとも1つの画像、および前記少なくとも1つの画像に関連付けられた前記認識されたデータを使って、前記第1のシーンを表す前記最終画像を記憶するように構成された統合モジュールを含み、
    前記表示するための手段が、前記第1のシーンを表す前記最終画像を、モバイルデバイス上で表示するように構成された表示モジュールを含む、請求項14に記載の装置。
JP2014551409A 2012-01-09 2013-01-08 Ocrキャッシュ更新 Expired - Fee Related JP6105627B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261584765P 2012-01-09 2012-01-09
US61/584,765 2012-01-09
PCT/US2013/020699 WO2013106346A1 (en) 2012-01-09 2013-01-08 Ocr cache update
US13/736,527 US9129177B2 (en) 2012-01-09 2013-01-08 Image cache
US13/736,527 2013-01-08

Publications (3)

Publication Number Publication Date
JP2015504220A JP2015504220A (ja) 2015-02-05
JP2015504220A5 true JP2015504220A5 (ja) 2016-02-04
JP6105627B2 JP6105627B2 (ja) 2017-03-29

Family

ID=48743961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014551409A Expired - Fee Related JP6105627B2 (ja) 2012-01-09 2013-01-08 Ocrキャッシュ更新

Country Status (6)

Country Link
US (1) US9129177B2 (ja)
EP (1) EP2803013A1 (ja)
JP (1) JP6105627B2 (ja)
KR (1) KR20140111341A (ja)
CN (1) CN104106078B (ja)
WO (1) WO2013106346A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9563886B1 (en) * 2012-04-24 2017-02-07 Ecr Software Corporation Systems and methods for an improved self-checkout with speed tender transaction options
EP3058512B1 (en) * 2013-10-16 2022-06-01 3M Innovative Properties Company Organizing digital notes on a user interface
TWI546772B (zh) * 2015-11-18 2016-08-21 粉迷科技股份有限公司 影像疊層處理方法與系統
US10713520B2 (en) * 2016-10-27 2020-07-14 Engineering Innovation, Inc. Method of taking a picture without glare
US10108883B2 (en) * 2016-10-28 2018-10-23 Intuit Inc. Image quality assessment and improvement for performing optical character recognition
RU2661760C1 (ru) 2017-08-25 2018-07-19 Общество с ограниченной ответственностью "Аби Продакшн" Использование нескольких камер для выполнения оптического распознавания символов
RU2659745C1 (ru) 2017-08-28 2018-07-03 Общество с ограниченной ответственностью "Аби Продакшн" Реконструкция документа из серии изображений документа
US10825157B2 (en) 2017-09-29 2020-11-03 Apple Inc. Glare reduction in captured images
CN108153505B (zh) * 2017-12-26 2019-01-18 掌阅科技股份有限公司 手写输入内容的显示方法、电子设备及计算机存储介质
JP2020091748A (ja) * 2018-12-06 2020-06-11 トッパン・フォームズ株式会社 端末装置、プログラム、画像管理方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69435282D1 (de) 1993-07-16 2010-04-29 Sharp Kk Bilddatenprozessor
US5966460A (en) 1997-03-03 1999-10-12 Xerox Corporation On-line learning for neural net-based character recognition systems
JP3821267B2 (ja) 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2003060894A (ja) * 2001-08-21 2003-02-28 Oki Electric Ind Co Ltd 画像合成装置、画像合成システム、画像合成機能付きカメラおよび画像合成サービス方法
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7505056B2 (en) * 2004-04-02 2009-03-17 K-Nfb Reading Technology, Inc. Mode processing in portable reading machine
JP3971783B2 (ja) * 2004-07-28 2007-09-05 松下電器産業株式会社 パノラマ画像合成方法および物体検出方法、パノラマ画像合成装置、撮像装置、物体検出装置、並びにパノラマ画像合成プログラム
US7760962B2 (en) 2005-03-30 2010-07-20 Casio Computer Co., Ltd. Image capture apparatus which synthesizes a plurality of images obtained by shooting a subject from different directions, to produce an image in which the influence of glare from a light is reduced
US7383994B2 (en) 2005-05-03 2008-06-10 Datalogic Scanning, Inc. Methods and systems for forming images of moving optical codes
JP2007079675A (ja) * 2005-09-12 2007-03-29 Seiko Epson Corp 文字認識方法、文字認識用プログラム及び文字読取装置
JP2007334558A (ja) * 2006-06-14 2007-12-27 Sony Corp 画像処理装置および方法、並びにプログラム
US8175394B2 (en) 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
US7646422B2 (en) 2006-10-04 2010-01-12 Branislav Kisacanin Illumination and imaging system with glare reduction and method therefor
CN101271515B (zh) * 2007-03-21 2014-03-19 株式会社理光 能识别多角度目标的图像检测装置
US8144990B2 (en) 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
US8199370B2 (en) 2007-08-29 2012-06-12 Scientific Games International, Inc. Enhanced scanner design
US8320674B2 (en) * 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
CN101667251B (zh) * 2008-09-05 2014-07-23 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置
US8011584B2 (en) 2008-12-12 2011-09-06 The Code Corporation Graphical code readers that are configured for glare reduction
CN101789073B (zh) * 2009-01-22 2013-06-26 富士通株式会社 字符识别装置及其字符识别方法
US8433136B2 (en) 2009-03-31 2013-04-30 Microsoft Corporation Tagging video using character recognition and propagation
EP2339534A1 (en) 2009-11-18 2011-06-29 Panasonic Corporation Specular reflection compensation
US9053098B2 (en) * 2010-01-14 2015-06-09 Abbyy Development Llc Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
CN101777124A (zh) * 2010-01-29 2010-07-14 北京新岸线网络技术有限公司 一种提取视频文本信息的方法及装置
JP2011254240A (ja) * 2010-06-01 2011-12-15 Sony Corp 画像処理装置、画像処理方法およびプログラム

Similar Documents

Publication Publication Date Title
JP2015504220A5 (ja)
US10832086B2 (en) Target object presentation method and apparatus
US9665962B2 (en) Image distractor detection and processng
US10284789B2 (en) Dynamic generation of image of a scene based on removal of undesired object present in the scene
US20150356770A1 (en) Street view map display method and system
US9491366B2 (en) Electronic device and image composition method thereof
US9536352B2 (en) Imitating physical subjects in photos and videos with augmented reality virtual objects
US10824910B2 (en) Image processing method, non-transitory computer readable storage medium and image processing system
WO2016187888A1 (zh) 基于字符识别的关键词通知方法及设备、计算机程序产品
US20130258198A1 (en) Video search system and method
JP2016521892A5 (ja)
KR102127351B1 (ko) 사용자 단말 장치 및 그 제어 방법
CN106203286B (zh) 一种增强现实的内容获取方法、装置及移动终端
US9607394B2 (en) Information processing method and electronic device
US20170168709A1 (en) Object selection based on region of interest fusion
CN108109161B (zh) 基于自适应阈值分割的视频数据实时处理方法及装置
CN108111911B (zh) 基于自适应跟踪框分割的视频数据实时处理方法及装置
BR112016017262B1 (pt) Método para busca de objeto e terminal acoplado de forma comunicativa a um servidor.
CN103412954A (zh) 一种利用增强现实技术的虚拟动态杂志
JP2018107593A5 (ja)
WO2023056835A1 (zh) 视频封面生成方法、装置、电子设备及可读介质
US20160110909A1 (en) Method and apparatus for creating texture map and method of creating database
US9171357B2 (en) Method, apparatus and computer-readable recording medium for refocusing photographed image
CN106778627A (zh) 检测人脸颜值的方法、装置和移动终端
JP2015204030A5 (ja)