JP6698996B1 - 文字検出方法、読書補助装置及び媒体 - Google Patents
文字検出方法、読書補助装置及び媒体 Download PDFInfo
- Publication number
- JP6698996B1 JP6698996B1 JP2019176732A JP2019176732A JP6698996B1 JP 6698996 B1 JP6698996 B1 JP 6698996B1 JP 2019176732 A JP2019176732 A JP 2019176732A JP 2019176732 A JP2019176732 A JP 2019176732A JP 6698996 B1 JP6698996 B1 JP 6698996B1
- Authority
- JP
- Japan
- Prior art keywords
- character
- predetermined indicator
- detected
- image
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 claims description 48
- 238000010586 diagram Methods 0.000 abstract description 19
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 206010044565 Tremor Diseases 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 201000009487 Amblyopia Diseases 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
Claims (17)
- 検出すべき文字対象の第1検出すべき画像を取得するステップと、
前記第1検出すべき画像に所定のインジケータが含まれるか否かを決定するステップと、
前記第1検出すべき画像に前記所定のインジケータが含まれる場合、前記所定のインジケータの位置を決定し、前記検出すべき文字対象の第2検出すべき画像を取得するステップと、
前記第2検出すべき画像に前記所定のインジケータが含まれるか否かを決定するステップと、
前記第2検出すべき画像に前記所定のインジケータが含まれない場合、前記所定のインジケータの位置に基づいて文字検出領域を決定するステップと、を含む、文字検出方法。 - 前記所定のインジケータの位置に基づいて前記文字検出領域を決定した後に、
前記文字検出領域における1つ又は複数の認識すべき文字行を決定するステップ、をさらに含む、請求項1に記載の文字検出方法。 - 前記文字検出領域における1つ又は複数の認識すべき文字行を決定するステップは、
前記所定のインジケータにより指示された文字行を決定するステップ、を含む、請求項2に記載の文字検出方法。 - 前記所定のインジケータにより指示された文字行を決定した後に、
前記所定のインジケータにより指示された文字行の上方に文字行が存在しない場合、前記所定のインジケータにより指示された文字行を認識すべき文字行として決定するステップ、をさらに含む、請求項3に記載の文字検出方法。 - 前記所定のインジケータにより指示された文字行を決定した後に、
前記所定のインジケータにより指示された文字行の上方に文字行が存在する場合、前記所定のインジケータにより指示された文字行の上方の文字行の行数を決定するステップと、
前記所定のインジケータにより指示された文字行の上方の文字行の行数が所定数以上である場合、前記所定のインジケータにより指示された文字行から上の所定数の複数の文字行を認識すべき文字行として決定し、そうでない場合、前記所定のインジケータにより指示された文字行の上方の全ての文字行、及び前記所定のインジケータにより指示された文字行を共に認識すべき文字行として決定するステップと、をさらに含む、請求項4に記載の文字検出方法。 - 前記所定のインジケータにより指示された文字行を決定するステップは、
前記所定のインジケータの位置と前記文字検出領域における1つ又は複数の文字行とが重なっているか否かを決定するステップと、
前記所定のインジケータの位置と前記文字検出領域における1つ又は複数の文字行とが重なっている場合、重なっている1つ又は複数の文字行のうち最も上方に位置する文字行を、前記所定のインジケータにより指示された文字行として決定するステップと、
前記所定のインジケータの位置と前記文字検出領域における文字行とが何れも重なっていない場合、前記所定のインジケータの上方に位置し、且つ前記所定のインジケータの位置に最も近い文字行を、前記所定のインジケータにより指示された文字行として決定するステップと、を含む、請求項3に記載の文字検出方法。 - 前記文字検出領域における1つ又は複数の認識すべき文字行を決定した後に、
前記1つ又は複数の認識すべき文字行に前回の文字検出結果から認識された文字行と重複する文字行が含まれるかを決定するステップと、
前記1つ又は複数の認識すべき文字行に前回の文字検出結果から認識された文字行と重複する文字行が含まれる場合、前記1つ又は複数の認識すべき文字行から前記重複する文字行を削除するステップと、をさらに含む、請求項2に記載の文字検出方法。 - 前記所定のインジケータの位置に基づいて文字検出領域を決定するステップは、
前記第2検出すべき画像における1つ又は複数の文字行の各文字行の位置を決定するステップと、
前記各文字行の位置に基づいて、前記第2検出すべき画像における文字を含む1つ又は複数の領域を取得するステップと、
前記所定のインジケータの位置に基づいて、前記文字を含む1つ又は複数の領域から前記文字検出領域を決定するステップと、を含む、請求項1に記載の文字検出方法。 - 前記所定のインジケータの位置に基づいて、前記文字を含む1つ又は複数の領域から前記文字検出領域を決定するステップは、
前記文字を含む1つ又は複数の領域に前記所定のインジケータの位置の所在する領域が含まれる場合、該領域を前記文字検出領域として選択するステップ、を含む、請求項8に記載の文字検出方法。 - 前記所定のインジケータの位置に基づいて、前記文字を含む1つ又は複数の領域から前記文字検出領域を決定するステップは、前記文字を含む1つ又は複数の領域の何れの領域にも前記所定のインジケータの位置が含まれない場合、
前記文字を含む1つ又は複数の領域が文字を含む1つの領域のみであるとき、該領域を前記文字検出領域として選択するステップと、
前記文字を含む1つ又は複数の領域に文字を含む複数の領域が含まれるとき、前記文字を含む複数の領域のうち前記所定のインジケータの位置に最も近い第1領域及び前記所定のインジケータの位置に2番目に近い第2領域を決定するステップと、
前記第1領域及び前記第2領域の何れかが前記所定のインジケータの位置の左側に位置し、且つ前記所定のインジケータの位置が前記第1領域と前記第2領域との間に位置するとき、前記所定のインジケータの位置の左側に位置する領域を前記文字検出領域として選択し、そうでないとき、前記第1領域及び前記第2領域の何れかが前記所定のインジケータの位置の上方に位置し、且つ前記所定のインジケータの位置が前記第1領域と前記第2領域との間に位置するか否かを決定するステップと、
前記第1領域及び前記第2領域の何れかが前記所定のインジケータの位置の上方に位置し、且つ前記所定のインジケータの位置が前記第1領域と前記第2領域との間に位置するとき、前記所定のインジケータの位置の上方に位置する領域を前記文字検出領域として選択し、そうでいないとき、前記第1領域を前記文字検出領域として選択するステップと、を含む、請求項8に記載の文字検出方法。 - 前記第1検出すべき画像に前記所定のインジケータが含まれる場合、前記所定のインジケータの位置を決定し、前記検出すべき文字対象の第2検出すべき画像を取得するステップは、
前記第1検出すべき画像に前記所定のインジケータが含まれる場合、前記所定のインジケータの位置を決定し、前記所定のインジケータの位置を決定した時から所定の時間が経過した時に、前記検出すべき文字対象の前記第2検出すべき画像を取得するステップ、を含む、請求項1に記載の文字検出方法。 - 前記第1検出すべき画像に前記所定のインジケータが含まれる場合、第1音声プロンプトを出力するステップ、をさらに含む、請求項1に記載の文字検出方法。
- 前記第2検出すべき画像に前記所定のインジケータが含まれない場合、前記所定のインジケータの位置に基づいて文字検出領域を決定する前に、
第2音声プロンプトを出力するステップと、
前記検出すべき文字対象の第3検出すべき画像を取得するステップと、をさらに含み、
前記第3検出すべき画像の解像度は、前記第1検出すべき画像の解像度及び前記第2検出すべき画像の解像度よりも高い、請求項1に記載の文字検出方法。 - 前記所定のインジケータの位置に基づいて文字検出領域を決定するステップは、
前記所定のインジケータの位置に基づいて、前記第3検出すべき画像から文字検出領域を決定するステップ、を含む、請求項13に記載の文字検出方法。 - プロセッサと、
命令を含むプログラムが記憶されているメモリと、を含み、
前記命令が前記プロセッサにより実行される際に、前記プロセッサに請求項1乃至14の何れかに記載の文字検出方法を実行させる、読書補助装置。 - 前記プログラムは、
前記プロセッサにより実行される際に、文字検出結果に基づいて認識すべき文字行における文字を音声に変換する命令、をさらに含む、請求項15に記載の読書補助装置。 - 命令を含むプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
前記命令が電子機器のプロセッサにより実行される際に、前記電子機器に請求項1乃至14の何れかに記載の文字検出方法を実行させる、記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910494385.4 | 2019-06-10 | ||
CN201910494385.4A CN110032994B (zh) | 2019-06-10 | 2019-06-10 | 文字检测方法、阅读辅助设备、电路及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6698996B1 true JP6698996B1 (ja) | 2020-05-27 |
JP2020201924A JP2020201924A (ja) | 2020-12-17 |
Family
ID=67243879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019176732A Active JP6698996B1 (ja) | 2019-06-10 | 2019-09-27 | 文字検出方法、読書補助装置及び媒体 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP3751448B1 (ja) |
JP (1) | JP6698996B1 (ja) |
CN (1) | CN110032994B (ja) |
WO (1) | WO2020248346A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220027081A (ko) | 2019-06-10 | 2022-03-07 | 넥스트브이피유 (상하이) 코포레이트 리미티드 | 텍스트 검출 방법, 판독 지원 디바이스 및 매체 |
CN110032994B (zh) * | 2019-06-10 | 2019-09-20 | 上海肇观电子科技有限公司 | 文字检测方法、阅读辅助设备、电路及介质 |
CN110929805B (zh) * | 2019-12-05 | 2023-11-10 | 上海肇观电子科技有限公司 | 神经网络的训练方法、目标检测方法及设备、电路和介质 |
KR102373960B1 (ko) | 2021-09-10 | 2022-03-15 | (주)웅진씽크빅 | 독서 지원 장치 및 이를 이용한 사용자 입력 감지 방법 |
KR102373961B1 (ko) | 2021-09-10 | 2022-03-15 | (주)웅진씽크빅 | 독서 지원 장치 및 이를 이용한 사용자 입력 감지 방법 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2308213A1 (en) * | 1997-10-22 | 1999-04-29 | James T. Sears | Voice-output reading system with gesture-based navigation |
JPH11203403A (ja) * | 1998-01-16 | 1999-07-30 | Oki Electric Ind Co Ltd | 情報処理装置 |
US8873890B2 (en) * | 2004-04-02 | 2014-10-28 | K-Nfb Reading Technology, Inc. | Image resizing for optical character recognition in portable reading machine |
JP5989479B2 (ja) * | 2012-09-20 | 2016-09-07 | シャープ株式会社 | 文字認識装置、文字認識装置の制御方法、制御プログラム、および制御プログラムを記録したコンピュータ読み取り可能な記録媒体 |
CN109902687B (zh) * | 2013-09-05 | 2023-12-08 | 华为终端有限公司 | 一种图像识别方法及用户终端 |
WO2016092656A1 (ja) * | 2014-12-10 | 2016-06-16 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
KR20180005578A (ko) * | 2016-07-06 | 2018-01-16 | 주식회사 케이티 | 정보 유출 탐지를 위한 장치 및 방법 |
JP6531738B2 (ja) * | 2016-08-08 | 2019-06-19 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN107992867A (zh) * | 2016-10-26 | 2018-05-04 | 深圳超多维科技有限公司 | 用于手势指点翻译的方法、装置及电子设备 |
CN107393356A (zh) * | 2017-04-07 | 2017-11-24 | 深圳市友悦机器人科技有限公司 | 控制方法、控制装置和早教机 |
CN108875694A (zh) * | 2018-07-04 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 语音输出方法和装置 |
CN109325464A (zh) * | 2018-10-16 | 2019-02-12 | 上海翎腾智能科技有限公司 | 一种基于人工智能的手指点读文字识别方法及翻译方法 |
CN110032994B (zh) * | 2019-06-10 | 2019-09-20 | 上海肇观电子科技有限公司 | 文字检测方法、阅读辅助设备、电路及介质 |
-
2019
- 2019-06-10 CN CN201910494385.4A patent/CN110032994B/zh active Active
- 2019-08-02 WO PCT/CN2019/099015 patent/WO2020248346A1/zh active Application Filing
- 2019-08-27 EP EP19193818.2A patent/EP3751448B1/en active Active
- 2019-09-27 JP JP2019176732A patent/JP6698996B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
EP3751448B1 (en) | 2022-12-21 |
CN110032994B (zh) | 2019-09-20 |
EP3751448A1 (en) | 2020-12-16 |
CN110032994A (zh) | 2019-07-19 |
WO2020248346A1 (zh) | 2020-12-17 |
JP2020201924A (ja) | 2020-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6698996B1 (ja) | 文字検出方法、読書補助装置及び媒体 | |
KR102322820B1 (ko) | 카메라 효과를 위한 사용자 인터페이스 | |
US9479693B2 (en) | Method and mobile terminal apparatus for displaying specialized visual guides for photography | |
EP2822267B1 (en) | Method and apparatus for previewing a dual-shot image | |
KR102076773B1 (ko) | 영상 데이터 획득 방법 및 그 방법을 처리하는 전자 장치 | |
EP2680110B1 (en) | Method and apparatus for processing multiple inputs | |
EP2811731B1 (en) | Electronic device for editing dual image and method thereof | |
KR101660576B1 (ko) | 시각 장애 사용자들에 의한 이미지 캡처 및 이미지 검토의 촉진 | |
US10291843B2 (en) | Information processing apparatus having camera function and producing guide display to capture character recognizable image, control method thereof, and storage medium | |
US9509733B2 (en) | Program, communication apparatus and control method | |
RU2648616C2 (ru) | Способ и устройство для добавления шрифта | |
TWI714513B (zh) | 書籍顯示程式產品及書籍顯示裝置 | |
EP3866475A1 (en) | Image text broadcasting method and device, electronic circuit, and computer program product | |
US20170322680A1 (en) | Method and apparatus for setting background of ui control, and terminal | |
KR102061867B1 (ko) | 이미지 생성 장치 및 그 방법 | |
CN110443772B (zh) | 图片处理方法、装置、计算机设备和存储介质 | |
US10796187B1 (en) | Detection of texts | |
JP2014085814A (ja) | 情報処理装置及びその制御方法、プログラム | |
US11776286B2 (en) | Image text broadcasting | |
US20220283698A1 (en) | Method for operating an electronic device in order to browse through photos | |
KR20140127131A (ko) | 영상 출력 방법 및 그 방법을 처리하는 전자장치 | |
KR20140134844A (ko) | 객체 기반 사진 촬영 방법 및 장치 | |
KR20190063803A (ko) | 오브젝트 이미지 합성 방법 및 장치 | |
KR20130104483A (ko) | 객체를 분할하여 사진을 촬영하는 방법 및 장치 | |
CN114581564A (zh) | 一种处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190927 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200203 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6698996 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |