JP2011257952A - 判定装置及び方法及びプログラム - Google Patents
判定装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP2011257952A JP2011257952A JP2010131356A JP2010131356A JP2011257952A JP 2011257952 A JP2011257952 A JP 2011257952A JP 2010131356 A JP2010131356 A JP 2010131356A JP 2010131356 A JP2010131356 A JP 2010131356A JP 2011257952 A JP2011257952 A JP 2011257952A
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- determination
- predetermined value
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、入力された判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる文字数の割合に基づいて文字領域か非文字領域かを判定する。また、判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる文字数の割合に基づいて文字領域か非文字領域かを判定する。
【選択図】 図1
Description
判定対象の領域の入力を受け付ける領域入力手段と、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定手段と、
前記文字領域判定手段の判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力手段と、を有する。
前記検出された未知語の数が所定値A未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む。
前記検出された未知語の数が所定値A未満で、かつ、検出された単語の長さが所定値C以下である単語数の前記領域に含まれる割合が、所定値D未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む。
判定対象の領域の入力を受け付ける領域入力手段と、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定手段と、
前記文字領域判定手段の判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力手段と、を有する。
前記検出された単語の長さが所定値C以下の単語数が、所定値D未満であり、前記該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む。
判定対象の領域の入力を受け付ける領域入力ステップと、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定ステップと、
前記文字領域判定ステップの判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力ステップと、を行う。
前記検出された未知語の数が所定値A未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する。
前記検出された未知語の数が所定値A未満で、かつ、検出された単語の長さが所定値C以下である単語数の前記領域に含まれる割合が、所定値D未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する。
判定対象の領域の入力を受け付ける領域入力ステップと、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定ステップと、
前記文字領域判定ステップの判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力ステップと、を行う。
前記検出された単語の長さが所定値C以下の単語数が、所定値D未満であり、前記該領域に所定値B以上の単語を含む場合に文字領域と判定する。
本実施の形態では、撮影した領域の文字認識を行い、当該領域に含まれる未知語の数に基づいて文字領域か否かを判定する。
本実施の形態は、文字領域を判定する際に、撮影された領域について文字認識を行い、認識結果の未知語の数と1文字の単語の数が規定値未満の場合に文字領域と判定する。
本実施の形態では、第2の実施の形態で文字領域と判定された場合に、当該文字領域に含まれる単語(名詞)を用いてコンテンツ検索を行う。
本実施の形態は、第2の実施の形態を一部変更し、文献1「間野一則,水野秀之,中嶋秀治,宮崎昇,吉田明弘:顧客へのリアルな音声応答を実現するテキスト音声合成技術「Cralinet」電気通信協会 NTT技術ジャーナル 18(11),pp.19-22,2006年11月.」等の技術を用いて、書籍にカメラ付き携帯電話をかざすとその位置を音声で読み上げる視覚障がい者支援システムである。
200 光学文字認識装置
201 単語DB
300 サーバ部
301 サーバ側データ送受信部
302 単語抽出部
303 文字認識判定部
304 コンテンツ問い合わせ部
306 コンテンツ作成部
305 コンテンツ検索部
400 クライアント部
401 ドキュメント撮影部
402 クライアント側データ送受信部
403 判定結果提示部
Claims (13)
- 文字、あるいは、写真、あるいは、図、あるいは、表、あるいは、罫線、あるいは、その他の文字ではないものが記載されたドキュメントの全領域、もしくは部分領域を入力として、該領域が文字を一定割合以上含む文字領域であるかどうか判定する判定装置であって、
判定対象の領域の入力を受け付ける領域入力手段と、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定手段と、
前記文字領域判定手段の判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力手段と、
を有することを特徴とする判定装置。 - 前記文字領域判定手段は、
前記検出された未知語の数が所定値A未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む、
請求項1記載の判定装置。 - 前記文字領域判定手段は、
前記検出された未知語の数が所定値A未満で、かつ、検出された単語の長さが所定値C以下である単語数の前記領域に含まれる割合が、所定値D未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む、
請求項1記載の判定装置。 - 文字、あるいは、写真、あるいは、図、あるいは、表、あるいは、罫線、あるいは、その他の文字ではないものが記載されたドキュメントの全領域、もしくは部分領域を入力として、該領域が文字を一定割合以上含む文字領域であるかどうか判定する判定装置であって、
判定対象の領域の入力を受け付ける領域入力手段と、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定手段と、
前記文字領域判定手段の判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力手段と、
を有することを特徴とする判定装置。 - 前記文字領域判定手段は、
前記検出された単語の長さが所定値C以下の単語数が、所定値D未満であり、前記該領域に所定値B以上の単語を含む場合に文字領域と判定する手段を含む
請求項4記載の判定装置。 - 前記単語の長さの所定値Cを1文字とする
請求項3または5記載の判定装置。 - 文字、あるいは、写真、あるいは、図、あるいは、表、あるいは、罫線、あるいは、その他の文字ではないものが記載されたドキュメントの全領域、もしくは部分領域を入力として、該領域が文字を一定割合以上含む文字領域であるかどうか判定する判定方法であって、
判定対象の領域の入力を受け付ける領域入力ステップと、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された未知語の数及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定ステップと、
前記文字領域判定ステップの判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力ステップと、
を行うことを特徴とする判定方法。 - 前記文字領域判定ステップにおいて、
前記検出された未知語の数が所定値A未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する、
請求項7記載の判定方法。 - 前記文字領域判定ステップにおいて、
前記検出された未知語の数が所定値A未満で、かつ、検出された単語の長さが所定値C以下である単語数の前記領域に含まれる割合が、所定値D未満で、かつ、該領域に所定値B以上の単語を含む場合に文字領域と判定する、
請求項7記載の判定方法。 - 文字、あるいは、写真、あるいは、図、あるいは、表、あるいは、罫線、あるいは、その他の文字ではないものが記載されたドキュメントの全領域、もしくは部分領域を入力として、該領域が文字を一定割合以上含む文字領域であるかどうか判定する判定方法であって、
判定対象の領域の入力を受け付ける領域入力ステップと、
判定対象の領域に文字が記載されているとみなして光学文字認識処理を行った結果、少なくとも、検出された単語の長さ及び該領域に含まれる単語数の割合に基づいて文字領域か非文字領域かを判定する文字領域判定ステップと、
前記文字領域判定ステップの判定結果に基づいて、文字領域または非文字領域のいずれかを出力する判定結果出力ステップと、
を行うことを特徴とする判定方法。 - 前記文字領域判定ステップにおいて、
前記検出された単語の長さが所定値C以下の単語数が、所定値D未満であり、前記該領域に所定値B以上の単語を含む場合に文字領域と判定する
請求項10記載の判定方法。 - 前記単語の長さの所定値Cを1文字とする
請求項6または11記載の判定方法。 - 請求項1乃至6のいずれか1項に記載の判定装置を構成する各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010131356A JP5492666B2 (ja) | 2010-06-08 | 2010-06-08 | 判定装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010131356A JP5492666B2 (ja) | 2010-06-08 | 2010-06-08 | 判定装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011257952A true JP2011257952A (ja) | 2011-12-22 |
JP5492666B2 JP5492666B2 (ja) | 2014-05-14 |
Family
ID=45474070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010131356A Active JP5492666B2 (ja) | 2010-06-08 | 2010-06-08 | 判定装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5492666B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5580502B1 (ja) * | 2013-03-06 | 2014-08-27 | 楽天株式会社 | 画像処理システム、画像処理方法、および画像処理プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04312162A (ja) * | 1991-04-10 | 1992-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 文字列抽出装置 |
JPH11338971A (ja) * | 1998-05-28 | 1999-12-10 | Canon Inc | 撮影装置及び方法及び記憶媒体 |
JP2003203204A (ja) * | 2002-01-04 | 2003-07-18 | Ricoh Co Ltd | 文字認識方法および文字認識装置 |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
-
2010
- 2010-06-08 JP JP2010131356A patent/JP5492666B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04312162A (ja) * | 1991-04-10 | 1992-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 文字列抽出装置 |
JPH11338971A (ja) * | 1998-05-28 | 1999-12-10 | Canon Inc | 撮影装置及び方法及び記憶媒体 |
JP2003203204A (ja) * | 2002-01-04 | 2003-07-18 | Ricoh Co Ltd | 文字認識方法および文字認識装置 |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5580502B1 (ja) * | 2013-03-06 | 2014-08-27 | 楽天株式会社 | 画像処理システム、画像処理方法、および画像処理プログラム |
WO2014136327A1 (ja) * | 2013-03-06 | 2014-09-12 | 楽天株式会社 | 画像処理システム、画像処理方法、および画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5492666B2 (ja) | 2014-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Burie et al. | ICDAR2015 competition on smartphone document capture and OCR (SmartDoc) | |
JP5353148B2 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
CN102053991B (zh) | 用于多语言文档检索的方法及系统 | |
US10665267B2 (en) | Correlation of recorded video presentations and associated slides | |
US9177205B2 (en) | Image attribute discrimination apparatus, attribute discrimination support apparatus, image attribute discrimination method, attribute discrimination support apparatus controlling method, and control program | |
US8081848B2 (en) | Extracting metadata from a digitally scanned document | |
US20090144056A1 (en) | Method and computer program product for generating recognition error correction information | |
JP2010073114A6 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
CN107330040B (zh) | 一种学习题目搜索方法及其系统 | |
KR102292775B1 (ko) | 학습 서비스 시스템 및 방법 | |
US10769247B2 (en) | System and method for interacting with information posted in the media | |
CN110019906B (zh) | 用于显示信息的方法和装置 | |
CN104994404A (zh) | 一种为视频获取关键词的方法及装置 | |
CN110209759B (zh) | 自动识别书页的方法及装置 | |
CN111078915B (zh) | 一种点读模式下的点读内容获取方法及电子设备 | |
CN109344275B (zh) | 基于图片识别的资源获取装置及方法 | |
JP5492666B2 (ja) | 判定装置及び方法及びプログラム | |
KR20170017427A (ko) | 시각장애인을 위한 대체컨텐츠 자동검색장치. | |
CN111078982A (zh) | 一种电子页面的检索方法、电子设备及存储介质 | |
KR102148021B1 (ko) | 딥러닝 텍스트 탐지 기술을 활용한 실생활 영상 속의 정보 검색 방법 및 그 장치 | |
US20140297678A1 (en) | Method for searching and sorting digital data | |
JP2000348142A (ja) | 文字認識装置,文字認識方法,および文字認識方法を実行するプログラムを記録した記録媒体 | |
CN110275860B (zh) | 一种记录讲授过程的系统及方法 | |
CN112259074A (zh) | 一种基于高拍仪获得语音播放方法和系统 | |
KR101911613B1 (ko) | 뉴스 인터뷰 영상의 오버레이 텍스트 기반 인물 인덱싱 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121106 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5492666 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |