JP2017151916A5 - - Google Patents

Download PDF

Info

Publication number
JP2017151916A5
JP2017151916A5 JP2016036188A JP2016036188A JP2017151916A5 JP 2017151916 A5 JP2017151916 A5 JP 2017151916A5 JP 2016036188 A JP2016036188 A JP 2016036188A JP 2016036188 A JP2016036188 A JP 2016036188A JP 2017151916 A5 JP2017151916 A5 JP 2017151916A5
Authority
JP
Japan
Prior art keywords
character
specific
area
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016036188A
Other languages
English (en)
Other versions
JP2017151916A (ja
JP6808330B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2016036188A priority Critical patent/JP6808330B2/ja
Priority claimed from JP2016036188A external-priority patent/JP6808330B2/ja
Priority to US15/424,202 priority patent/US10395131B2/en
Priority to KR1020170022663A priority patent/KR102090973B1/ko
Priority to CN201710102811.6A priority patent/CN107133615B/zh
Publication of JP2017151916A publication Critical patent/JP2017151916A/ja
Publication of JP2017151916A5 publication Critical patent/JP2017151916A5/ja
Application granted granted Critical
Publication of JP6808330B2 publication Critical patent/JP6808330B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明に係る装置は、画像に含まれる各文字に対応する文字領域を識別し、当該識別された文字領域毎に文字認識処理を行ない、前記文字認識処理の結果と前記文字領域の位置座標とを対応付けた情報を得る文字認識手段と、前記文字認識処理の結果から特定文字を判定し、当該判定された特定文字に対応する前記文字領域が拡大されるように、当該特定文字に対応付けられている文字領域の位置座標を変更する領域変更手段と、前記画像を表示する表示手段と、前記表示手段によって表示された前記画像においてユーザにより選択された範囲を取得する取得手段と、前記文字認識処理の結果と前記領域変更手段で変更した後の文字領域の位置座標とを対応付けた情報に基づいて、前記選択された範囲内に包含される複数の文字領域に対応する文字認識結果を出力する出力手段と、を備えたことを特徴とする。

Claims (16)

  1. 画像に含まれる各文字に対応する文字領域を識別し、当該識別された文字領域毎に文字認識処理を行ない、前記文字認識処理の結果と前記文字領域の位置座標とを対応付けた情報を得る文字認識手段と、
    前記文字認識処理の結果から特定文字を判定し、当該判定された特定文字に対応する前記文字領域が拡大されるように、当該特定文字に対応付けられている文字領域の位置座標を変更する領域変更手段と、
    前記画像を表示する表示手段と、
    前記表示手段によって表示された前記画像においてユーザにより選択された範囲を取得する取得手段と、
    前記文字認識処理の結果と前記領域変更手段で変更した後の文字領域の位置座標とを対応付けた情報に基づいて、前記選択された範囲内に包含される複数の文字領域に対応する文字認識結果を出力する出力手段と、
    を備えたことを特徴とする装置。
  2. 前記領域変更手段は、前記特定文字に対応する文字領域が当該特定文字に隣接する文字に対応する文字領域と重なるように、前記特定文字に対応する文字領域の位置座標を変更することを特徴とする請求項1に記載の装置。
  3. 前記特定文字を規定する情報を保存する保存手段をさらに備え、
    前記領域変更手段は、前記保存手段に保存された情報を用いて、前記文字認識処理の結果から特定文字を判定し、当該判定された特定文字に対応する文字領域の位置座標を変更する
    ことを特徴とする請求項2に記載の装置。
  4. 前記領域変更手段は、前記特定文字に対応する文字領域が、当該特定文字に隣接する文字に対応する文字領域の中心位置まで重なるように、前記特定文字に対応する文字領域の位置座標を変更することを特徴とする請求項3に記載の装置。
  5. 前記領域変更手段は、さらに、前記特定文字に隣接する文字に対応する文字領域を、前記特定文字とは逆の方向に一定割合だけ拡げるように、前記特定文字に隣接する文字に対応する文字領域の位置座標を変更することを特徴とする請求項1乃至4のいずれかに記載の装置。
  6. 前記領域変更手段は、前記特定文字に隣接する文字同士の特性が一致するかどうかの判定を行い、特性が不一致の場合は、前記特定文字に隣接する文字に対応する文字領域の位置座標の変更量を、特性が一致する場合よりも大きくすることを特徴とする請求項5に記載の装置。
  7. 前記文字認識処理の結果は、文字コードとして取得され、
    前記領域変更手段は、前記特定文字に対応する文字コードと、当該特定文字に隣接する文字に対応する文字コードとを比較し、文字コードに含まれる要素が異なる場合に、前記特性が不一致であると判定することを特徴とする請求項6記載の装置。
  8. 前記文字認識処理により取得される文字コードは、前記特性として、前記文字認識処理が実行された各文字についてのフォントの種類、フォントサイズ、スタイル、色の要素を含み、
    前記領域変更手段は、少なくとも1つの要素が異なる場合に不一致であると判定する
    ことを特徴とする請求項7に記載の装置。
  9. 前記文字認識手段で識別された各文字に対応する文字領域は、その対応する文字に外接する矩形であることを特徴とする請求項1乃至8のいずれか1項に記載の装置。
  10. 前記画像を属性に応じた領域に分割し、文字属性の領域を特定する領域分割手段をさらに備え、
    前記文字認識手段における前記文字認識処理は、前記領域分割手段で特定された前記文字属性の領域内に含まれる各文字画像単位で行なわれる
    ことを特徴とする請求項1乃至8のいずれか1項に記載の装置。
  11. 前記特定文字は、スペース、コンマ、ピリオドの少なくとも1つを含むことを特徴とする請求項1乃至10のいずれか1項に記載の装置。
  12. 前記範囲の選択は、ユーザがマウスを使って指定することでなされる
    ことを特徴とする請求項1乃至11のいずれか1項に記載の装置。
  13. 前記表示手段はタッチパネルであり、
    前記範囲の選択は、前記タッチパネル上でユーザが指を使って指定することでなされる
    ことを特徴とする請求項1乃至11のいずれか1項に記載の装置。
  14. 前記表示手段は、前記画像を投影するプロジェクタであり、
    前記取得手段は、前記投影された画像に対してのユーザの指先の位置をカメラで撮影し、当該指先の動きを認識することによって、前記ユーザによって選択された範囲を取得する
    ことを特徴とする請求項1乃至11のいずれか1項に記載の装置。
  15. 文字認識結果の出力方法であって、
    画像に含まれる各文字に対応する文字領域を識別し、当該識別された文字領域毎に文字認識処理を行ない、前記文字認識処理の結果と前記文字領域の位置座標とを対応付けた情報を得るステップと、
    前記文字認識処理の結果から特定文字を判定し、当該判定された特定文字に対応する前記文字領域が少なくとも文字列方向に拡がるように、当該特定文字に対応付けられている文字領域の位置座標を変更するステップと、
    前記画像を表示するステップと、
    前記表示された画像においてユーザにより選択された範囲を取得するステップと、
    前記文字認識処理の結果と前記変更した後の文字領域の位置座標とを対応付けた情報に基づいて、前記選択された範囲内に包含される複数の文字領域に対応する文字認識結果を出力するステップと、
    を含むことを特徴とする方法。
  16. コンピュータを、請求項1乃至14のいずれか1項に記載の装置として機能させるためのプログラム。
JP2016036188A 2016-02-26 2016-02-26 情報処理装置、情報処理方法、及びプログラム Active JP6808330B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016036188A JP6808330B2 (ja) 2016-02-26 2016-02-26 情報処理装置、情報処理方法、及びプログラム
US15/424,202 US10395131B2 (en) 2016-02-26 2017-02-03 Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
KR1020170022663A KR102090973B1 (ko) 2016-02-26 2017-02-21 정보 처리장치, 정보 처리방법, 및 기억매체
CN201710102811.6A CN107133615B (zh) 2016-02-26 2017-02-24 信息处理设备和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016036188A JP6808330B2 (ja) 2016-02-26 2016-02-26 情報処理装置、情報処理方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2017151916A JP2017151916A (ja) 2017-08-31
JP2017151916A5 true JP2017151916A5 (ja) 2019-04-04
JP6808330B2 JP6808330B2 (ja) 2021-01-06

Family

ID=59679701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016036188A Active JP6808330B2 (ja) 2016-02-26 2016-02-26 情報処理装置、情報処理方法、及びプログラム

Country Status (4)

Country Link
US (1) US10395131B2 (ja)
JP (1) JP6808330B2 (ja)
KR (1) KR102090973B1 (ja)
CN (1) CN107133615B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6963728B2 (ja) * 2018-02-26 2021-11-10 京セラドキュメントソリューションズ株式会社 画像処理装置
GB2572386B (en) * 2018-03-28 2021-05-19 Canon Europa Nv An image processing system and an image processing method
WO2020036011A1 (ja) * 2018-08-16 2020-02-20 ソニー株式会社 情報処理装置、情報処理方法、および、プログラム
US10402673B1 (en) * 2018-10-04 2019-09-03 Capital One Services, Llc Systems and methods for digitized document image data spillage recovery
CN112233206B (zh) * 2019-07-15 2024-03-22 浙江宇视科技有限公司 字符图像生成方法、装置、设备及存储介质
KR20230166595A (ko) * 2022-05-31 2023-12-07 한림대학교 산학협력단 글자의 크기, 자간, 및 중심점의 높낮이 자동측정을 수행하는 전자 장치, 제어 방법, 및 컴퓨터 프로그램

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3740203B2 (ja) * 1996-01-10 2006-02-01 キヤノン株式会社 画像処理装置およびその方法
JPH11102414A (ja) * 1997-07-25 1999-04-13 Kuraritec Corp ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体
JP2000155802A (ja) * 1998-11-19 2000-06-06 Fujitsu Ltd Ocr入力データ画面修正手段
EP1938249A2 (en) * 2005-09-02 2008-07-02 Blindsight, Inc. A system and method for detecting text in real-world color images
JP2008258994A (ja) * 2007-04-06 2008-10-23 Ricoh Co Ltd 画像処理装置
JP5111268B2 (ja) * 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
EP2350779A4 (en) * 2008-11-25 2018-01-10 Jeffrey R. Spetalnick Methods and systems for improved data input, compression, recognition, correction, and translation through frequency-based language analysis
US8331739B1 (en) * 2009-01-21 2012-12-11 Google Inc. Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment
US9349046B2 (en) * 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
JP5201096B2 (ja) * 2009-07-17 2013-06-05 大日本印刷株式会社 対話操作装置
US9026907B2 (en) * 2010-02-12 2015-05-05 Nicholas Lum Indicators of text continuity
GB2482339A (en) * 2010-07-30 2012-02-01 Jaguar Cars Computing device with improved function element selection
US20120072013A1 (en) * 2010-09-16 2012-03-22 Kabushiki Kaisha Toshiba Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
CN102314314B (zh) * 2011-08-29 2015-08-26 上海量明科技发展有限公司 文档阅读时光标转换的方法及系统
JP2013164728A (ja) 2012-02-10 2013-08-22 Canon Inc 画像内の文字に係る言語を判定する情報処理装置
JP2014115963A (ja) * 2012-12-12 2014-06-26 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP6201686B2 (ja) 2013-11-26 2017-09-27 コニカミノルタ株式会社 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP5886265B2 (ja) * 2013-11-28 2016-03-16 シャープ株式会社 携帯端末装置、プログラム、及び記録媒体
JP2015164021A (ja) * 2014-02-28 2015-09-10 キヤノンマーケティングジャパン株式会社 画像処理システムとその処理方法及びプログラム
JP6463066B2 (ja) * 2014-07-07 2019-01-30 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US10607381B2 (en) 2014-07-07 2020-03-31 Canon Kabushiki Kaisha Information processing apparatus
JP6399872B2 (ja) * 2014-07-07 2018-10-03 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US9501853B2 (en) * 2015-01-09 2016-11-22 Adobe Systems Incorporated Providing in-line previews of a source image for aid in correcting OCR errors

Similar Documents

Publication Publication Date Title
JP2017151916A5 (ja)
CN108876934B (zh) 关键点标注方法、装置和系统及存储介质
CN106598227B (zh) 基于Leap Motion和Kinect的手势识别方法
US9898844B2 (en) Augmented reality content adapted to changes in real world space geometry
US8933970B2 (en) Controlling an augmented reality object
US11030807B2 (en) Image to item mapping
JP6013642B2 (ja) 体験コンテンツデータセットに関するキャンペーン最適化
JP2018124656A5 (ja)
RU2016107189A (ru) Устройства, системы и способы виртуализации зеркала
US11164384B2 (en) Mobile device image item replacements
TWI526877B (zh) Input device, machine, input method and recording medium
US20180190019A1 (en) Augmented reality user interface visibility
JP2014220720A (ja) 電子機器、情報処理方法及びプログラム
JP2016514865A (ja) 現実世界の分析可視化
JP2016071777A5 (ja)
KR101749070B1 (ko) 사용자 인터페이스 평가 장치 및 그 평가 방법
JP2016200860A5 (ja)
US20150262327A1 (en) Image processing apparatus and image processing method
JP6229554B2 (ja) 検出装置および検出方法
Hartanto et al. Real time hand gesture movements tracking and recognizing system
KR102147930B1 (ko) 포즈 인식 방법 및 장치
US9939925B2 (en) Behind-display user interface
US9229608B2 (en) Character display apparatus, character display method, and computer readable medium
WO2018126642A1 (zh) 显示设备和显示方法
CN113703577A (zh) 一种绘图方法、装置、计算机设备及存储介质