JP5717691B2 - 手書き文字検索装置、方法及びプログラム - Google Patents
手書き文字検索装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5717691B2 JP5717691B2 JP2012121304A JP2012121304A JP5717691B2 JP 5717691 B2 JP5717691 B2 JP 5717691B2 JP 2012121304 A JP2012121304 A JP 2012121304A JP 2012121304 A JP2012121304 A JP 2012121304A JP 5717691 B2 JP5717691 B2 JP 5717691B2
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- feature
- handwritten character
- search
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ところで、行領域は軸と平行に筆記されているとは限らないので、表記の回転を吸収するため、右から左か、上から下か、左から右かの3種類の方向に正規化しても良い。文書平面上において、行ブロックの主成分分析により第一主成分を求め、その固有ベクトルと上記の3種類の方向とを比較して、上記の3種類の方向のうちで最も近い方向に、行ブロックを回転させる。なお、筆記されている言語が限定できる場合は、正規化する方向を限定することができる。例えば、アラビア語であるならば、左から右への方向のみに限定し、あるいは、日本語であるならば、右から左への方向と、上から下への方向の2方向に限定するなどが考えられる。
複数の特徴ベクトル列同士のマッチングには、種々の方法を利用することができる。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (19)
- 手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の集合に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とを備え、
前記統合部は、前記手書き文字列を、少なくとも文字領域と文字領域以外の領域とに分類し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークが前記文字領域に属する場合における前記ストロークの属する前記集合に関する特徴量及び前記ストロークが前記文字領域以外の領域に属する場合における前記ストロークの属する前記集合に関する特徴量を含むことを特徴とする手書き文字検索装置。 - 手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の集合に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とを備え、
前記統合部は、前記ストロークのそれぞれが少なくとも2つの集合に属するように、前記手書き文字列を統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記少なくとも2つの集合のそれぞれに関する特徴量を含むことを特徴とする手書き文字検索装置。 - 手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の集合に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とを備え、
前記統合部は、前記手書き文字列を、少なくとも、単語ブロック、文字ブロック又は部首ブロックに統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記単語ブロック、文字ブロック又は部首ブロックに関する特徴量を含むことを特徴とする手書き文字検索装置。 - 前記統合部は、前記手書き文字列を、少なくとも文字領域と文字領域以外の領域とに分類する、請求項2または3に記載の手書き文字検索装置。
- 前記統合部は、前記手書き文字列を、文字領域、段落ブロック、行ブロック、単語ブロック、文字ブロック及び部首ブロックの階層うちの一部又は全部に統合する、請求項1ないし4のいずれか1項に記載の手書き文字検索装置。
- 前記第2の特徴量は、個々の前記ストロークの属する1又は複数の集合についてそれぞれ、当該集合に含まれる全ストロークの総数を示す、特徴量ベクトルである、請求項1ないし5のいずれか1項に記載の手書き文字検索装置。
- 前記第2の特徴量は、個々の前記ストロークの属する1又は複数の前記集合についてそれぞれ、当該集合に含まれる全ストロークに対して前記第1の特徴量を算出する方法と同一の方法を適用することによって得られる特徴量を示す、特徴量ベクトルである、請求項1ないし5のいずれか1項に記載の手書き文字検索装置。
- 前記取得部は、オンラインで手書き文字列をストローク単位で取得する、請求項1ないし7のいずれか1項に記載の手書き文字検索装置。
- 前記取得部は、予め蓄積されている手書き文字列のうちでユーザにより指定されたものを取得する、請求項1ないし7のいずれか1項に記載の手書き文字検索装置。
- 前記取得部は、各々の前記構造に対応して予め用意されたストローク列のテンプレート群を使用して形成された手書き文字列を取得する、請求項1ないし7のいずれか1項に記載の手書き文字検索装置。
- 前記検索部による検索結果を表示する表示部を更に含む請求項1ないし10のいずれか1項に記載の手書き文字検索装置。
- 前記検索部は、取得された前記手書き文字に類似するストローク列を含む手書き文書を検索する、請求項1ないし11のいずれか1項に記載の手書き文字検索装置。
- 検索結果を表示するにあたっては、前記ストローク列を含む手書き文書を表示するとともに、前記ストローク列を強調表示する、請求項12に記載の手書き文字検索装置。
- 手書き文書検索装置の手書き文字検索方法において、
手書き文字列をストローク単位で取得するステップと、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出するステップと、
前記ストロークを複数の集合に統合するステップと、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与するステップと、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行するステップとを含み、
前記統合するステップは、前記手書き文字列を、少なくとも文字領域と文字領域以外の領域とに分類し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークが前記文字領域に属する場合における前記ストロークの属する前記集合に関する特徴量及び前記ストロークが前記文字領域以外の領域に属する場合における前記ストロークの属する前記集合に関する特徴量を含む手書き文字検索方法。 - 手書き文書検索装置の手書き文字検索方法において、
手書き文字列をストローク単位で取得するステップと、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出するステップと、
前記ストロークを複数の集合に統合するステップと、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与するステップと、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行するステップとを含み、
前記統合するステップは、前記ストロークのそれぞれが少なくとも2つの集合に属するように、前記手書き文字列を統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記少なくとも2つの集合のそれぞれに関する特徴量を含む手書き文字検索方法。 - 手書き文書検索装置の手書き文字検索方法において、
手書き文字列をストローク単位で取得するステップと、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出するステップと、
前記ストロークを複数の集合に統合するステップと、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与するステップと、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行するステップとを含み、
前記統合するステップは、前記手書き文字列を、少なくとも、単語ブロック、文字ブロック又は部首ブロックに統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記単語ブロック、文字ブロック又は部首ブロックに関する特徴量を含む手書き文字検索方法。 - コンピュータを手書き文書検索装置として機能させるためのプログラムであって、
手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の構造に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とをコンピュータに実現させるためのものであり、
前記統合部は、前記手書き文字列を、少なくとも文字領域と文字領域以外の領域とに分類し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークが前記文字領域に属する場合における前記ストロークの属する前記集合に関する特徴量及び前記ストロークが前記文字領域以外の領域に属する場合における前記ストロークの属する前記集合に関する特徴量を含む、プログラム。 - コンピュータを手書き文書検索装置として機能させるためのプログラムであって、
手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の構造に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とをコンピュータに実現させるためのものであり、
前記統合部は、前記ストロークのそれぞれが少なくとも2つの集合に属するように、前記手書き文字列を統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記少なくとも2つの集合のそれぞれに関する特徴量を含む、プログラム。 - コンピュータを手書き文書検索装置として機能させるためのプログラムであって、
手書き文字列をストローク単位で取得する取得部と、
前記手書き文字列から、前記ストローク毎に固有の第1の特徴量を抽出する特徴抽出部と、
前記ストロークを複数の構造に統合する統合部と、
前記ストローク毎に前記統合の結果に基づく第2の特徴量を付与する特徴量付与部と、
前記ストロークそれぞれの前記第1の特徴量及び前記第2の特徴量を用いて検索を実行する検索部とをコンピュータに実現させるためのものであり、
前記統合部は、前記手書き文字列を、少なくとも、単語ブロック、文字ブロック又は部首ブロックに統合し、
前記ストローク毎に付与される前記第2の特徴量は、少なくとも、前記ストロークの属する前記単語ブロック、文字ブロック又は部首ブロックに関する特徴量を含む、プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012121304A JP5717691B2 (ja) | 2012-05-28 | 2012-05-28 | 手書き文字検索装置、方法及びプログラム |
CN201210348219.1A CN103455528B (zh) | 2012-05-28 | 2012-09-18 | 手写文字检索装置及方法 |
US13/841,767 US9424477B2 (en) | 2012-05-28 | 2013-03-15 | Handwritten character retrieval apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012121304A JP5717691B2 (ja) | 2012-05-28 | 2012-05-28 | 手書き文字検索装置、方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015050012A Division JP6030172B2 (ja) | 2015-03-12 | 2015-03-12 | 手書き文字検索装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013246731A JP2013246731A (ja) | 2013-12-09 |
JP5717691B2 true JP5717691B2 (ja) | 2015-05-13 |
Family
ID=49621644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012121304A Active JP5717691B2 (ja) | 2012-05-28 | 2012-05-28 | 手書き文字検索装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9424477B2 (ja) |
JP (1) | JP5717691B2 (ja) |
CN (1) | CN103455528B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
CN104699405B (zh) * | 2015-03-26 | 2019-03-29 | 联想(北京)有限公司 | 信息处理方法、信息处理装置和电子设备 |
CN113918072A (zh) * | 2015-08-04 | 2022-01-11 | 株式会社和冠 | 显示控制方法、计算机、存储介质及方法 |
JP6531738B2 (ja) * | 2016-08-08 | 2019-06-19 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN107330430B (zh) * | 2017-06-27 | 2020-12-04 | 司马大大(北京)智能系统有限公司 | 藏文字符识别装置与方法 |
KR102530657B1 (ko) * | 2020-09-15 | 2023-05-09 | 네이버 주식회사 | 이미지에서 인식된 텍스트를 계층화하는 방법, 시스템, 및 컴퓨터 프로그램 |
CN112487875B (zh) * | 2020-11-11 | 2024-05-10 | 深圳市鹰硕技术有限公司 | 笔迹图形化方法、装置及电子设备 |
CN112486337B (zh) * | 2020-11-17 | 2023-11-24 | 深圳市鹰硕技术有限公司 | 笔迹图形分析方法、装置及电子设备 |
CN113297892B (zh) * | 2020-11-27 | 2022-06-14 | 上海交通大学 | 针对形近汉字的图像优化识别系统 |
US20230306774A1 (en) * | 2022-03-24 | 2023-09-28 | International Business Machines Corporation | Search based on abstracted document structure image |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0877295A (ja) * | 1994-09-05 | 1996-03-22 | Hitachi Ltd | 手書き情報検索方法及びそれを用いた手書き入力装置 |
JP3535624B2 (ja) | 1995-09-21 | 2004-06-07 | キヤノン株式会社 | 検索装置及び方法 |
US5832474A (en) * | 1996-02-26 | 1998-11-03 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval system with partial match searching of user-drawn annotations |
JPH1055409A (ja) * | 1996-08-08 | 1998-02-24 | Sharp Corp | 手書き入力情報処理装置 |
JP4098880B2 (ja) * | 1997-06-06 | 2008-06-11 | 松下電器産業株式会社 | 情報検索装置 |
US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
US6501855B1 (en) * | 1999-07-20 | 2002-12-31 | Parascript, Llc | Manual-search restriction on documents not having an ASCII index |
AUPR824301A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw001) |
US7302099B2 (en) * | 2003-11-10 | 2007-11-27 | Microsoft Corporation | Stroke segmentation for template-based cursive handwriting recognition |
US7756337B2 (en) * | 2004-01-14 | 2010-07-13 | International Business Machines Corporation | Method and apparatus for reducing reference character dictionary comparisons during handwriting recognition |
JP4560062B2 (ja) * | 2007-03-29 | 2010-10-13 | 株式会社東芝 | 筆跡判定装置、方法およびプログラム |
CN101299236B (zh) * | 2008-06-25 | 2010-06-09 | 华南理工大学 | 一种中文手写词组识别方法 |
JP5581448B2 (ja) * | 2010-08-24 | 2014-08-27 | ノキア コーポレイション | 重なった手書き文字のストロークを一つ又は複数のグループにグループ分けする方法及び装置 |
-
2012
- 2012-05-28 JP JP2012121304A patent/JP5717691B2/ja active Active
- 2012-09-18 CN CN201210348219.1A patent/CN103455528B/zh active Active
-
2013
- 2013-03-15 US US13/841,767 patent/US9424477B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103455528B (zh) | 2017-09-08 |
US20130315484A1 (en) | 2013-11-28 |
CN103455528A (zh) | 2013-12-18 |
US9424477B2 (en) | 2016-08-23 |
JP2013246731A (ja) | 2013-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5717691B2 (ja) | 手書き文字検索装置、方法及びプログラム | |
US10127199B2 (en) | Automatic measure of visual similarity between fonts | |
JP5774558B2 (ja) | 手書き文書処理装置、方法及びプログラム | |
CN104200240B (zh) | 一种基于内容自适应哈希编码的草图检索方法 | |
US20150154442A1 (en) | Handwriting drawing apparatus and method | |
US8391613B2 (en) | Statistical online character recognition | |
US7860313B2 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
US10902053B2 (en) | Shape-based graphics search | |
JP2013246732A (ja) | 手書き文書検索装置、方法及びプログラム | |
CN113033398A (zh) | 一种手势识别方法、装置、计算机设备及存储介质 | |
CN111492407A (zh) | 用于绘图美化的系统和方法 | |
US9384304B2 (en) | Document search apparatus, document search method, and program product | |
JP4570995B2 (ja) | マッチング方法およびマッチング装置ならびにプログラム | |
JP2015099566A (ja) | 特徴算出装置、方法及びプログラム | |
US9250802B2 (en) | Shaping device | |
Joshi et al. | A machine learning approach to employability evaluation using handwriting analysis | |
Úbeda et al. | Pattern spotting in historical documents using convolutional models | |
JP6125333B2 (ja) | 検索装置、方法及びプログラム | |
JP6030172B2 (ja) | 手書き文字検索装置、方法及びプログラム | |
Xu et al. | On-line sample generation for in-air written chinese character recognition based on leap motion controller | |
Fang et al. | Feature covariance matrix-based dynamic hand gesture recognition | |
Diem et al. | Semi-automated document image clustering and retrieval | |
Tehsin et al. | A caption text detection method from images/videos for efficient indexing and retrieval of multimedia data | |
JP2006260280A (ja) | モデルデータ表示プログラム、モデルデータ表示装置およびモデルデータ表示方法 | |
US20150142784A1 (en) | Retrieval device and method and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140325 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150317 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5717691 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 Free format text: JAPANESE INTERMEDIATE CODE: R313121 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |