JP2007219849A - 単語検索装置、単語検索方法、及びコンピュータプログラム - Google Patents

単語検索装置、単語検索方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP2007219849A
JP2007219849A JP2006039815A JP2006039815A JP2007219849A JP 2007219849 A JP2007219849 A JP 2007219849A JP 2006039815 A JP2006039815 A JP 2006039815A JP 2006039815 A JP2006039815 A JP 2006039815A JP 2007219849 A JP2007219849 A JP 2007219849A
Authority
JP
Japan
Prior art keywords
character
word
character string
characters
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006039815A
Other languages
English (en)
Other versions
JP4744317B2 (ja
Inventor
Hiroshi Tanaka
宏 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006039815A priority Critical patent/JP4744317B2/ja
Priority to US11/438,256 priority patent/US8208730B2/en
Priority to CN2006100924749A priority patent/CN101021850B/zh
Publication of JP2007219849A publication Critical patent/JP2007219849A/ja
Application granted granted Critical
Publication of JP4744317B2 publication Critical patent/JP4744317B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/387Matching; Classification using human interaction, e.g. selection of the best displayed recognition candidate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】誤り訂正時に認識候補文字から所望の文字が欠落することなく、検索された単語数を所定限度まで抑制することが可能な単語検索装置、単語検索方法、及びコンピュータプログラムを提供する。
【解決手段】複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを用い、受け付けた手書き文字を文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、単語辞書から検索する。単語辞書の検索結果の中から一又は複数の文字パターンに対応する文字列のみを抽出して部分文字列を生成する。生成された部分文字列から一の部分文字列の選択を受け付け、選択された部分文字列を含む単語のみを単語辞書に基づく検索結果から抽出し、抽出された単語を表示する。
【選択図】図7

Description

本発明は、ペン型タブレット、マウス等の座標入力手段を有するパーソナルコンピュータ(以下、PC)等で用いられ、手書き入力又はマウス入力等によって筆記された手書き文字を検索キーとして、検索対象の単語辞書から所望の単語を検索する単語検索装置、単語検索方法、及びコンピュータプログラムに関する。
手書き文字を検索キーとして単語を検索する単語検索装置は、ペン型タブレット、マウス等の座標入力手段を有するPC等において使用される。従来の手書き文字を検索キーとした単語検索装置は、ユーザが筆記した文字の筆跡データの座標値を取得し、取得した筆跡データの座標値に基づいて、文字認識辞書に記憶して有る標準的な文字パターンと照合することにより文字認識する。そして、文字認識した結果に基づいて所望の単語を検索して、検索結果を表示装置に表示する(特許文献1参照)。
図1は、従来の手書き単語検索の一例を示す図であり、二重線で囲まれている部分が、文字認識した結果に基づいて検索された検索結果の表示例を示している。図1の例では、文字認識された結果は、ユーザが正しいと認識している「富士通」ではなく、2文字目が誤った「富さ通」として表示されている。ユーザは、誤りを訂正する手段を用いることにより、2文字目を「士」に訂正し、所望の単語を含む単語リストを検索結果として得ることができる。
誤りを訂正する手段は、特に限定されるものではなく、例えば文字認識結果の候補文字(列)をリスト表示しておき、ユーザが誤った文字をペン型タブレット、マウス等で指示することにより、リスト表示された候補文字(列)から所望の文字(列)を選択することによって誤り訂正を行う。
手書き文字を検索キーとして単語を検索する単語検索装置には、上述のように誤り文字を訂正する方法ではなく、認識候補文字まで含めて検索キーであるものとして単語検索を行う方法も用いられている。この場合、優先順位が2位以下の認識候補文字に一致する文字があれば検索キーと一致したものとみなし、該当する単語を検索する。また、認識候補文字の中にユーザが所望する文字が存在しない場合であっても、それ以外の文字が見つかれば単語検索の候補として採用するという方法もある(特許文献2参照)。
特開平9−259218号公報 特開平8−305722号公報
しかし、上述した従来の手書き文字を検索キーとして単語を検索する単語検索装置では、文字認識に誤りが生じた場合はその誤りをユーザが訂正する、又は優先順位が2位以下の認識候補文字を検索キーとして検索した単語も含めて所望の単語を検索する必要がある。前者では、認識候補文字の中から所望の文字を選択する必要が有ることから、認識候補文字の中に所望の文字が存在しない場合には、誤り訂正を行うことができないという問題点があった。この場合、ユーザは再度手書き文字を入力して文字認識を再実行する必要があり、誤り訂正の操作が煩雑になる。特に、ユーザが手書き文字を崩して筆記した場合、所望の文字が認識候補文字に含まれない可能性が高く、単語検索を円滑に実行することが困難になる。
一方、優先順位が2位以下の認識候補文字を含めて検索キーとして検索した単語を含める場合には、検索結果の単語数が膨大になるという問題点があった。例えば、所望の文字が認識候補文字から欠落している場合、検索された単語数は更に増大し、検索結果の単語数が増大することにより、所望の単語を選択する操作がより煩雑となることから、単語検索装置の使い勝手が大幅に低下する。
本発明は斯かる事情に鑑みてなされたものであり、誤り訂正時に認識候補文字から所望の文字が欠落することなく、検索された単語数を所定限度まで抑制することが可能な単語検索装置、単語検索方法、及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するために第1発明に係る単語検索装置は、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを備え、手書き文字の入力を受け付ける手書き文字受け付け手段と、該手書き文字受け付け手段で受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてある単語検索装置において、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段と、生成された部分文字列から一の部分文字列の選択を受け付ける手段と、選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段と、抽出された単語を表示する手段とを備えることを特徴とする。
第2発明に係る単語検索装置は、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを備え、手書き文字の入力を受け付ける手書き文字受け付け手段と、該手書き文字受け付け手段で受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてある単語検索装置において、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段と、生成された部分文字列に基づいて文字ごとの候補文字を抽出する候補文字抽出手段と、抽出された候補文字から一の候補文字の選択を受け付ける手段と、選択された候補文字に基づいて部分文字列を再構成する部分文字列再構成手段と、再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段と、抽出された単語を表示する手段とを備えることを特徴とする。
第3発明に係る単語検索装置は、第1又は第2発明において、前記単語辞書の検索結果に基づいて検索された単語数を計数する手段と、計数された単語数が所定値より大きいか否かを判断する手段と、該手段で大きいと判断された場合にのみ、前記文字列生成手段で前記部分文字列を生成するようにしてあり、該手段で大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付けるようにしてあることを特徴とする。
第4発明に係る単語検索方法は、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを用い、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索する単語検索方法において、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成し、生成された部分文字列から一の部分文字列の選択を受け付け、選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出し、抽出された単語を表示することを特徴とする。
第5発明に係る単語検索方法は、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを用い、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索する単語検索方法において、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成し、生成された部分文字列に基づいて文字ごとの候補文字を抽出し、抽出された候補文字から一の候補文字の選択を受け付け、選択された候補文字に基づいて部分文字列を再構成し、再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出し、抽出された単語を表示することを特徴とする。
第6発明に係る単語検索方法は、第4又は第5発明において、前記単語辞書の検索結果に基づいて検索された単語数を計数し、計数された単語数が所定値より大きいか否かを判断し、大きいと判断された場合にのみ、前記部分文字列を生成し、大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付けることを特徴とする。
第7発明に係るコンピュータプログラムは、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを備え、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてあるコンピュータで実行することが可能なコンピュータプログラムにおいて、前記コンピュータを、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段、生成された部分文字列から一の部分文字列の選択を受け付ける手段、選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段、及び抽出された単語を表示する手段として機能させることを特徴とする。
第8発明に係るコンピュータプログラムは、複数の単語を記憶してある単語辞書と、手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書とを備え、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてあるコンピュータで実行することが可能なコンピュータプログラムにおいて、前記コンピュータを、前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段、生成された部分文字列に基づいて文字ごとの候補文字を抽出する候補文字抽出手段、抽出された候補文字から一の候補文字の選択を受け付ける手段、選択された候補文字に基づいて部分文字列を再構成する部分文字列再構成手段、再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段、及び抽出された単語を表示する手段として機能させることを特徴とする。
第9発明に係るコンピュータプログラムは、第7又は第8発明において、前記コンピュータを、前記単語辞書の検索結果に基づいて検索された単語数を計数する手段、計数された単語数が所定値より大きいか否かを判断する手段、及び該手段で大きいと判断された場合にのみ、前記文字列生成手段で前記部分文字列を生成し、該手段で大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付ける手段として機能させることを特徴とする。
第1発明、第4発明、及び第7発明では、受け付けた手書き文字を文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、単語辞書から検索する。単語辞書の検索結果の中から一又は複数の文字パターンに対応する文字列のみを抽出して部分文字列を生成する。生成された部分文字列から一の部分文字列の選択を受け付け、選択された部分文字列を含む単語のみを単語辞書に基づく検索結果から抽出し、抽出された単語を表示する。これにより、単語辞書を検索するキー情報である部分文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、単語検索装置の使い勝手が大幅に向上する。
第2発明、第5発明、及び第8発明では、受け付けた手書き文字を文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、単語辞書から検索する。単語辞書の検索結果の中から一又は複数の文字パターンに対応する文字列のみを抽出して部分文字列を生成する。生成された部分文字列に基づいて文字ごとの候補文字を抽出し、抽出された候補文字から一の候補文字の選択を受け付け、選択された候補文字に基づいて部分文字列を再構成する。再構成された部分文字列を含む単語のみを単語辞書に基づく検索結果から抽出し、抽出された単語を表示する。これにより、単語辞書を検索するキー情報である部分文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、単語検索装置の使い勝手が大幅に向上する。また、文字の誤り訂正時に認識候補文字の中に所望の文字が必ず存在することから、再度手書き文字を入力して文字認識を再実行することなく、誤り訂正を行うことができ、単語検索を円滑に実行することが可能になる。
第3発明、第6発明、及び第9発明では、単語辞書の検索結果に基づいて検索された単語数を計数し、計数された単語数が所定値より大きいか否かを判断し、大きいと判断された場合にのみ、部分文字列を生成し、大きくないと判断された場合、単語辞書の検索結果からの選択を受け付ける。これにより、検索結果として出力すべき単語数が膨大となった場合にのみ部分文字列を生成することができ、通常の単語検索時に演算処理負荷を増大させることが無く、検索レスポンスの劣化を未然に防止することが可能となる。
第1発明、第4発明、及び第7発明によれば、単語辞書を検索するキー情報である部分文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、単語検索装置の使い勝手が大幅に向上する。
第2発明、第5発明、及び第8発明によれば、単語辞書を検索するキー情報である部分文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、単語検索装置の使い勝手が大幅に向上する。また、文字の誤り訂正時に認識候補文字の中に所望の文字が必ず存在することから、再度手書き文字を入力して文字認識を再実行することなく、誤り訂正を行うことができ、単語検索を円滑に実行することが可能になる。
第3発明、第6発明、及び第9発明によれば、検索結果として出力すべき単語数が膨大となった場合にのみ部分文字列を生成することができ、通常の単語検索時に演算処理負荷を増大させることが無く、検索レスポンスの劣化を未然に防止することが可能となる。
以下、本発明の実施の形態1に係る単語検索装置について図面を参照しながら具体的に説明する。図2は、本発明の実施の形態1に係る単語検索装置1の構成を示すブロック図である。図2において、単語検索装置1は、少なくとも、CPU(中央演算装置)11、記憶手段12、RAM(メモリ)13、外部の通信手段と接続する通信インタフェース部14、手書き文字の入力を受け付けるペン型タブレット等の手書き文字入力手段15、マウス、キーボード等の入力手段16、モニタ等の表示手段17、及び補助記憶手段18で構成される。
CPU11は、内部バス19を介して単語検索装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部を制御するとともに、記憶手段12に記憶されているコンピュータプログラム3に従って、種々のソフトウェア的機能を実行する。記憶手段12に記憶されているコンピュータプログラム3は、単語検索装置1の出荷時に記憶手段12に記憶済みであっても良いし、DVD、CD−ROM等の可搬型記録媒体2を用いて、補助記憶手段18を介して記憶手段12に記憶されたものであっても良い。
記憶手段12は、ハードディスクに代表される固定型記録媒体であり、実行するコンピュータプログラム3、実行するコンピュータプログラム3で使用されるデータ等を記憶する記憶手段である。また、記憶手段12は、単語検索用の単語辞書121及び文字ごとの座標データの標準パターンを記憶してある文字認識辞書122を備えている。RAM13は、SRAM、フラッシュメモリ等で構成され、ソフトウェアの実行時に発生する一時的なデータを記憶する。
通信インタフェース部14は内部バス19に接続されており、LAN、WAN等のケーブルに接続されることにより、処理に必要とされるデータを送受信する。手書き文字入力手段15は内部バス19に接続されており、スタイラスペン、ペン型タブレット等の手書き文字の入力媒体で構成され、手書き文字の筆跡を座標データとして受け付ける。入力手段16は内部バス19に接続されており、マウス、タブレット等のポインティングデバイス、及びキーボードに代表されるキー入力デバイス等で構成される。表示手段17は内部バス19に接続されており、液晶表示装置、CRTディスプレイ等で構成される。
上述した構成の単語検索装置1は、検索結果の単語リストから筆記入力に対応する部分文字列を生成することにより、ユーザが正しい部分文字列を選択し、検索結果の単語リストを選択された部分文字列を含む単語に限定して表示する。
手書き文字入力手段15は、ペン型タブレット、スタイラスペン等により筆記された手書き文字の筆跡を座標データとして受け付ける。座標データの原点は特に限定されるものではなく、表示画面の中央でも良いし、表示画面の四隅のいずれかであっても良い。また手書き文字入力手段15は、表示手段17の画面上に重ねて配置された透明なタブレットでも良いし、別個に設置されたタブレット等の筆跡の座標データを取得することが可能な装置であれば特に限定されるものではない。
単語検索装置1のCPU11は、取得した手書き文字の筆跡の座標データに基づいて、一連の認識候補文字列を出力する。CPU11は、手書き文字の筆跡の座標データから一文字ごとに分離した座標データを生成し、文字認識辞書122に記憶されている文字ごとの標準パターンとの比較により認識候補文字を出力する。手書き文字列を筆記する場合、文字枠内に一文字ずつ筆記する枠あり入力と、文字枠が無い領域に筆記する枠なし入力とがある。枠あり入力の場合、あらかじめ筆跡データは文字ごとに分離されている。
図3は、枠あり入力の場合の手書き文字切り出しの一例を示す図である。枠あり入力の場合、図3に示すように、文字枠ごとに筆記された座標データを、文字枠内の座標データとして取得すれば良い。図4は、枠なし入力の場合の手書き文字切り出しの一例を示す図である。枠なし入力の場合、図4に示すように、手書き文字列を文字ごとに分割した後に座標データを取得する必要がある。枠なし文字列を文字ごとに分割する方法は特に限定されるものではなく、周知の方法であれば何でも良い(例えば「電子情報通信学会研究会技術研究報告PRMU98−139」に開示されている分割方法等)。
CPU11は、文字ごとの認識候補文字と検索対象となる単語とを比較し、一致するものを単語辞書121の中から抽出する。単語辞書121には、複数の単語文字列が記憶されており、それぞれの単語と認識候補文字とを比較して一致の度合いを表す評価値(スコア)を得る。CPU11は、スコアが一定値以上のものを、スコアが大きい順に表示する。なお、単語の表示順序のソートは、単純にスコア順に並べ替えれば良く、二分木ソート、クイックソート等の公知のソートアルゴリズムを用いても良い。
CPU11は、認識候補文字と単語文字列とを順に比較する。ここで、マッチング対象の単語文字列をS(i)とし、認識候補文字をR(j)(k)とする。図5は、認識候補文字と単語文字列との比較の一例を示す図である。図5において、Lは検索された単語の単語長を、Mは手書き文字として取得した文字列の長さを、Dは認識候補文字の数を、それぞれ示している。図5の例では、「秋田富士通株式会社」の「秋」はS(0)で表すことができ、単語長Lは‘9’となる。また筆記した文字列の長さMは‘3’であり、それぞれの認識候補文字の数Dは‘5’となる。よって、例えば2文字目の第3候補である「土」は、R(1)(2)と表現することができる。
図6は、認識候補文字と単語文字列とをマッチングするプログラムの具体例を示す図である。図6は、単語マッチングのアルゴリズムをC言語で記述したものである。図6において、Rは文字コードcodeとその文字の一致度を表すスコアscoreを要素とする構造体struct RSの配列とする。関数matchは認識候補文字R(j)(k)と単語S(i)とを引数に与えると、その単語と認識候補文字との一致度が最も大きな部分を探し、スコアを計算する。単語中の文字と一致した文字が見つかった場合、文字のスコアを合計スコアmaxScoreに加算し、見つからなかった場合は一定の値CONSTを加算する。ここで、一致した文字の数が筆記文字の半分に達しない場合、一致しないものとしてスコアは‘0’とする。
図6に示すプログラムでは、単語と認識候補文字とを比較して、一定値以上の数の文字が一致した場合、一致度が引数pScに記憶されて関数matchはTRUEを返す。その場合、単語と一致した開始位置(図5の場合は3文字目の「富」から始まるので‘2’)がpStに、一致した候補の履歴がpPathに記憶される。
図7は、本発明の実施の形態1に係る単語検索装置1の検索結果限定手順を模式的に示す図である。CPU11が、上述したパターンマッチングにより複数の認識候補文字列を生成し、複数の認識候補文字列をキー情報として単語辞書121を検索することにより、図7に示すように多くの単語を検索結果として抽出する。単語検索装置1のCPU11は、抽出された検索結果の中から、実際にユーザが筆記した文字列に対応する部分文字列を抜き出す。例えば図7では、検索された単語が「富士通明石工場」である場合、筆記した部分と一致したのは1文字目から3文字目までの「富士通」である。したがって、部分文字列として「富士通」を抜き出す。
図6に示すプログラムでは、関数matchの引数であるpStが示す領域に部分文字列の位置が記憶されている。一致した部分の最初の文字の場所は*pStで示されるので、最初の文字(すなわち「富」)は、S(*pSt) であり、2文字目はS(*pSt+1) である。このように、検索結果の中にその履歴を記憶することにより、容易に部分文字列を生成することができる。
また、図6に示すプログラムでは、一つの単語文字列に対して一つの部分文字列が得られる。これを全ての検索結果に対して適用することにより、図7の左側の表のように各検索単語に対して部分文字列が対応した表を得ることができる。ここで、同一の部分文字列を一つにまとめ、それぞれリンク情報を作成する。同一の文字列をまとめる処理は文字列のソートと同様に汎用の手法を用いればよい。以上により、検索結果単語とそれぞれに対応する部分文字列との対応を記述した、部分文字列情報を得ることができる。
このように部分文字列の集合、例えば「富士通」、「冨山通」、「けさ通」等を含む部分文字列の集合を生成することにより、ユーザに提示される部分文字列の数は単語辞書121の検索結果よりも少なくなる。したがって、検索結果として表示される単語数を削減することができる。
図8は、本発明の実施の形態1に係る単語検索装置1のCPU11の処理手順を示すフローチャートである。単語検索装置1のCPU11は、ペン型タブレット、スタイラスペン等により筆記された手書き文字の筆跡の座標データを取得する(ステップS801)。CPU11は、取得した手書き文字の筆跡の座標データに基づいて、文字認識辞書122を照会して、一連の認識候補文字列を抽出する(ステップS802)。
CPU11は、文字ごとの認識候補文字と検索対象となる単語とを比較し、認識候補文字を含む単語を単語辞書121の中から検索結果として取得する(ステップS803)。CPU11は、抽出された検索結果の中から、実際にユーザが筆記した文字列(手書き文字の認識結果)に対応する部分文字列を抽出する(ステップS804)。
CPU11は、抽出された部分文字列が既に抽出されているか否か、すなわちRAM13に既に記憶されているか否かを判断し(ステップS805)、CPU11が未だ抽出されていないと判断した場合(ステップS805:NO)、CPU11は、抽出された部分文字列をRAM13に記憶し(ステップS806)、CPU11が既に抽出されていると判断した場合(ステップS805:YES)、CPU11はステップS806をスキップする。なお、上述のように全ての検索結果を取得した後、部分文字列を取得する方法に限定されるものではなく、例えば1件検索する都度、部分文字列を検索する方法であっても良い。
CPU11は、抽出された全ての検索結果について部分文字列の抽出処理が完了したか否かを判断し(ステップS807)、CPU11が、まだ完了していないと判断した場合(ステップS807:NO)、CPU11は、処理をステップS804へ戻し、上述した処理を繰り返す。CPU11が、完了したと判断した場合(ステップS807:YES)、CPU11は、RAM13に記憶してある部分文字列を含む検索結果のみを表示手段18へ表示出力する(ステップS808)。
このように部分文字列の集合、例えば「富士通」、「冨山通」、「けさ通」等を含む部分文字列の集合を生成することにより、ユーザに提示される部分文字列の数は単語辞書121の検索結果よりも少なくなる。したがって、検索結果として表示される単語数を削減することができる。
CPU11は、ユーザによる検索結果の選択を受け付けるまで待ち状態となり(ステップS809)、CPU11が選択を受け付けたと判断した場合(ステップS809:YES)、CPU11は、単語検索処理を終了する。
図9は、本実施の形態1に係る単語検索装置1の表示画面の一例を示す図である。図9(a)及び(b)は、手書き文字入力領域91、部分文字列表示領域92、及び検索結果表示領域93で表示画面が構成されている。図9(a)に示すように、手書き文字入力領域91に手書き文字で「富士通」と入力された場合、単語辞書151の検索結果が検索結果表示領域93に表示されると共に、上述した処理で抽出された部分文字列が部分文字列表示領域92に表示される。
ユーザは、図9(b)に示すように、スタイラスペン等により部分文字列表示領域92に表示されている部分文字列から所望の部分文字列を選択する。部分文字列が選択されることにより、検索結果表示領域92に表示される検索結果数が大きく削減される。ユーザは、スタイラスペン等により検索結果表示領域93に表示されている検索結果候補から所望の結果を選択することにより、容易に単語を検索することができる。
同様の処理は、英単語においても実現可能である。例えば手書き文字として筆記体で「fuji」の座標データを取得した場合、認識候補文字と単語文字列との比較は図10のようになる。図10は、手書き文字が英単語である場合の認識候補文字と単語文字列との比較の一例を示す図である。図10において、Lは検索された単語の単語長を、Mは手書き文字として取得した文字列の長さを、Dは認識候補文字の数を、それぞれ示している。図10の例では、「fujitsu labs.」の「f」はS(0)で表すことができ、単語長Lは‘13’となる。また筆記した文字列の長さMは‘4’であり、それぞれの認識候補文字の数Dは‘5’となる。よって、例えば2文字目の第3候補である「u」は、R(1)(2)と表現することができる。
マッチング処理は、図6に示すプログラムに従って実行し、一定値以上の数の文字が一致した場合、一致度が引数pScに記憶されて関数matchはTRUEを返す。その場合、単語と一致した開始位置(図10の場合は1文字目の「f」から始まるので‘0’)がpStに、一致した候補の履歴がpPathに記憶される。
図11は、手書き文字が英単語である場合の単語検索装置1の検索結果限定手順を模式的に示す図である。CPU11が、上述したパターンマッチングにより複数の認識候補文字列を生成し、複数の認識候補文字列をキー情報として単語辞書121を検索することにより、図11に示すように多くの単語を検索結果として抽出する。単語検索装置1のCPU11は、抽出された検索結果の中から、実際にユーザが筆記した文字列に対応する部分文字列を抜き出す。例えば図11では、検索された単語が「fujitsu」である場合、筆記した部分と一致したのは1文字目から4文字目までの「fuji」である。したがって、部分文字列として「fuji」を抜き出す。
図6に示すプログラムでは、関数matchの引数であるpStが示す領域に部分文字列の位置が記憶されている。一致した部分の最初の文字の場所は*pStで示されるので、最初の文字(すなわち「f」)は、S(*pSt) であり、2文字目はS(*pSt+1) である。このように、検索結果の中にその履歴を記憶することにより、容易に部分文字列を生成することができる。
また、図6に示すプログラムでは、一つの単語文字列に対して一つの部分文字列が得られる。これを全ての検索結果に対して適用することにより、図11の左側の表のように各検索単語に対して部分文字列が対応した表を得ることができる。ここで、同一の部分文字列を一つにまとめ、それぞれリンク情報を作成する。同一の文字列をまとめる処理は文字列のソートと同様に汎用の手法を用いればよい。以上により、検索結果単語とそれぞれに対応する部分文字列との対応を記述した、部分文字列情報を得ることができる。
このように部分文字列の集合、例えば「fuji」、「tutt」、「gual」等を含む部分文字列の集合を生成することにより、ユーザに提示される部分文字列の数は単語辞書121の検索結果よりも少なくなる。ここで、表示した部分文字列からユーザが意図した部分文字列を選択して、選択された部分文字列を含む検索結果のみを表示することにより、検索結果として表示される単語数をさらに削減することも可能となる。
図12は、手書き文字が英単語である場合の単語検索装置1の表示画面の一例を示す図である。図12(a)に示すように、手書き文字入力領域91に手書き文字で「fuji」と入力された場合、単語辞書151の検索結果が検索結果表示領域93に表示されると共に、上述した処理で抽出された部分文字列が部分文字列表示領域92に表示される。
ユーザは、図12(b)に示すように、スタイラスペン等により部分文字列表示領域92に表示されている部分文字列から所望の部分文字列(例えばfuji)を選択する。部分文字列が選択されることにより、検索結果表示領域92に表示される検索結果数が大きく削減される。ユーザは、スタイラスペン等により検索結果表示領域93に表示されている検索結果候補から所望の結果を選択することにより、容易に単語を検索することができる。
以上のように本実施の形態1によれば、単語辞書を検索するキー情報である文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、ユーザに提示する単語候補の数を削減でき、単語検索効率を改善することができ、ユーザが単語検索を行う際の疲労低減等の効果が期待できる。
(実施の形態2)
以下、本発明の実施の形態2に係る単語検索装置1について図面を参照しながら具体的に説明する。本発明の実施の形態2に係る単語検索装置1の構成は実施の形態1と同様であることから、同一の符号を付することにより詳細な説明を省略する。本実施の形態2は、部分文字列を候補文字ごとに分割する候補文字リストを生成し、ユーザが一文字ごとに認識誤りの訂正を行うことができる点で実施の形態1と相違する。
図13は、候補文字リストの一例を示す図である。候補文字リストは、抽出された部分文字列の文字単位の候補文字を、所定の優先順位に基づいて表示するためのリスト情報である。図13の例では部分文字列は3文字であり、それぞれの文字ごとに同一の候補文字が一つにまとめられ、候補文字リストに変換されている。
図14は、本発明の実施の形態2に係る単語検索装置1のCPU11の処理手順を示すフローチャートである。単語検索装置1のCPU11は、ペン型タブレット、スタイラスペン等により筆記された手書き文字の筆跡の座標データを取得する(ステップS1401)。CPU11は、取得した手書き文字の筆跡の座標データに基づいて、文字認識辞書122を照会して、一連の認識候補文字列を抽出する(ステップS1402)。
CPU11は、文字ごとの認識候補文字と検索対象となる単語とを比較し、一致するものを単語辞書121の中から検索結果として取得する(ステップS1403)。CPU11は、抽出された検索結果の中から、実際にユーザが筆記した文字列(手書き文字の認識結果)に対応する部分文字列を抽出する(ステップS1404)。
CPU11は、抽出された部分文字列を文字単位に分割し(ステップS1405)、分割された文字ごとに優先順位を算出して(ステップS1406)、候補文字リストを生成する(ステップS1407)。生成された候補文字リストは、優先順位に従って訂正処理時に表示手段に表示され、ユーザの選択を受け付けることによって、認識誤りを修正することが可能となる。なお、優先順位の算出方法は、特に限定されるものではなく、後述の方法等、リスト順序を特定することができる方法であれば何でも良い。
図15は、候補文字リストの生成手順を模式的に示す図である。図15に示すように抽出された部分文字列を文字ごとに分割し、同じ位置の文字について同一の文字を一つにまとめることにより、候補文字リストを生成する。候補文字リストは、認識誤りの訂正時に文字ごとに表示され、スタイラスペン等による選択を受け付ける。
CPU11は、文字ごとに訂正の選択を受け付けたか否かを判断し(ステップS1408)、CPU11が訂正の選択を受け付けたと判断した場合(ステップS1408:YES)、受け付けた文字については選択された文字の優先順位を最大とし、該文字を第1位の優先文字として認識する(ステップS1409)。
CPU11は、訂正後の文字に基づいて部分文字列を再構成し(ステップS1410)、実施の形態1のステップS805以下の処理を続行する。部分文字列の再構成は、選択を受け付けたことにより確定した文字を用いて部分文字列を改めて生成する処理である。図16は、部分文字列再構成手順を模式的に示す図である。図16では、3文字目の「通」がユーザに選択されて確定した場合、他の候補文字を含めて構成できる文字列は、図16の中欄に示す20個に限定される。限定された文字列を認識候補文字列として、手書き文字として取得した文字列と一致する文字列を部分文字列として抽出することにより、図16の右欄の3個の部分文字列が再構成される。
このように、部分文字列から候補文字リストを生成することにより、認識候補文字の中に正しく認識すべき文字が脱落している場合であっても、検索結果として表示されている単語から文字を補完することができ、訂正時の候補文字リスト内に選択すべき文字として表示することが可能となる。
なお、候補文字リストを表示する場合の表示優先順位の特定方法は、特に限定されるものではない。例えば、ユーザが候補選択中の文字に関してユーザに提示される文字候補のリストを、それ以外の文字と合わせて同じ部分文字列を構成するものを優先して表示する方法であっても良い。これにより、正しい文字の選択がより容易となる。
図17は、候補文字訂正時の画面表示の一例を示す図である。図17では、「富士通」という3つの文字が1位の優先順位で表示されており、3文字目の「通」が訂正の対象として候補文字リストが表示されている。図17に示すように、候補文字リストでは3文字目には「通」、「道」、「遅」という3つの候補文字が存在する。しかし、1文字目と2文字目に表示されている「富」と「士」を含む部分文字列は「富士通」及び「富士道」のみであることから、3文字目は「通」及び「道」を優先して表示している。優先順位の低い「遅」は図17では点線で示しているが、表示してもしなくても良い。
また、候補文字の表示状態に基づいて、候補文字の選択対象となる文字、図17では3文字目の「通」以外の位置に表示されている文字列について前部及び後部に新たな文字列を生成し、新たな文字列との関連が深い候補文字を優先して表示するようにしても良い。図18は、優先文字列の一例を示す図である。図18では、3文字目の「通」が候補文字の選択対象となっており、前部の優先文字列として「秋田」が、後部の優先文字列として「士通」が生成されている。CPU11は、部分文字列の中から2種類の優先文字列の両方を含むものを選び、その中に含まれる候補文字を優先して表示するよう候補文字リストを並べ替える。このようにすることで、現在表示されている文字列と関連が深い候補文字を優先して表示することができ、ユーザの候補文字の選択がより容易となる。
同様の処理は、実施の形態1と同様、英単語においても実現可能である。図19は、手書き文字として筆記体で「fuji」の座標データを取得した場合の候補文字リストの一例を示す図である。候補文字リストは、抽出された部分文字列の文字単位の候補文字を、所定の優先順位に基づいて表示するためのリスト情報である。図19の例では部分文字列は4文字であり、それぞれの文字ごとに同一の候補文字が一つにまとめられ、候補文字リストに変換されている。
図20は、手書き文字が英単語である場合の候補文字リストの生成手順を模式的に示す図である。図20に示すように抽出された部分文字列を文字ごとに分割し、同じ位置の文字について同一の文字を一つにまとめることにより、候補文字リストを生成する。候補文字リストは、認識誤りの訂正時に文字ごとに表示され、スタイラスペン等による選択を受け付ける。
図21は、手書き文字が英単語である場合の部分文字列再構成手順を模式的に示す図である。図21では、4文字目の「i」がユーザに選択されて確定した場合、他の候補文字を含めて構成できる文字列は、図21の中欄に示す24個に限定される。限定された文字列を認識候補文字列として、手書き文字として取得した文字列と一致する文字列を部分文字列として抽出することにより、図21の右欄の2個の部分文字列「fuji」及び「lyti」が再構成される。
このように、部分文字列から候補文字リストを生成することにより、認識候補文字の中に正しく認識すべき文字が脱落している場合であっても、検索結果として表示されている単語から文字を補完することができ、訂正時の候補文字リスト内に選択すべき文字として表示することが可能となる。
なお、候補文字リストを表示する場合の表示優先順位の特定方法は、特に限定されるものではない。例えば、ユーザが候補選択中の文字に関してユーザに提示される文字候補のリストを、それ以外の文字と合わせて同じ部分文字列を構成するものを優先して表示する方法であっても良い。これにより、正しい文字の選択がより容易となる。
図22は、手書き文字が英単語である場合の候補文字訂正時の画面表示の一例を示す図である。図22では、「fuji」という4つの文字が1位の優先順位で表示されており、4文字目の「i」が訂正の対象として候補文字リストが表示されている。図22に示すように、候補文字リストでは3文字目には「j」、「t」、「a」という3つの候補文字が存在する。しかし、1文字目乃至3文字目に表示されている「f」、「u」及び「j」を含む部分文字列は「fuji」のみであることから、4文字目は「i」のみを優先して表示している。優先順位の低い「t」及び「l」は図22では点線で示しているが、表示してもしなくても良い。
また、候補文字の表示状態に基づいて、候補文字の選択対象となる文字、以外の位置に表示されている文字列について前部及び後部に新たな文字列を生成し、新たな文字列との関連が深い候補文字を優先して表示するようにしても良い。図23は、手書き文字が英単語である場合の優先文字列の一例を示す図である。図23では、3文字目の「j」が候補文字の選択対象となっており、前部の優先文字列として「fu」が、後部の優先文字列として「i」が生成されている。CPU11は、部分文字列の中から2種類の優先文字列の両方を含むものを選び、その中に含まれる候補文字を優先して表示するよう候補文字リストを並べ替える。このようにすることで、現在表示されている文字列と関連が深い候補文字を優先して表示することができ、ユーザの候補文字の選択がより容易となる。
以上のように本実施の形態2によれば、単語辞書を検索するキー情報である文字列を限定することができ、検索候補となる単語の数を大幅に縮小することが可能となる。したがって、ユーザに提示する単語候補の数を削減でき、単語検索効率を改善することができ、ユーザが単語検索を行う際の疲労低減等の効果が期待できる。また、部分文字列から候補文字リストを生成することにより、候補文字の欠落を未然に防止することができ、ユーザは認識誤りを確実に訂正することが可能となる。
(実施の形態3)
以下、本発明の実施の形態3に係る単語検索装置1について図面を参照しながら具体的に説明する。本発明の実施の形態3に係る単語検索装置1の構成は実施の形態1と同様であることから、同一の符号を付することにより詳細な説明を省略する。本実施の形態3は、検索結果として表示出力される単語数が所定値より大きい場合にのみ、上述した部分文字列を生成した単語検索処理を実行する点に特徴を有する。
すなわち、検索結果の単語数がさほど多くない場合には、特に部分文字列による単語数限定を行う必要が無く、ユーザは検索結果として表示されている単語の中から所望の単語を直接選択すれば良い。そこで、CPU11は、検索結果として表示される単語の総数を計数し、計数された単語数が所定値、例えば画面に一度に表示することができる程度の10単語を超えているか否かを判断する。CPU11が、10単語以下であると判断した場合には、実施の形態1及び2のような部分文字列の生成処理を実行しない。
図24は、本発明の実施の形態3に係る単語検索装置1のCPU11の処理手順を示すフローチャートである。単語検索装置1のCPU11は、ペン型タブレット、スタイラスペン等により筆記された手書き文字の筆跡の座標データを取得する(ステップS2401)。CPU11は、取得した手書き文字の筆跡の座標データに基づいて、文字認識辞書122を照会して、一連の認識候補文字列を抽出する(ステップS2402)。
CPU11は、文字ごとの認識候補文字と検索対象となる単語とを比較し、一致するものを単語辞書121の中から検索結果として取得し(ステップS2403)、抽出された単語数を計数する(ステップS2404)。CPU11は、計数された単語数が所定値、例えば‘10’より大きいか否かを判断する(ステップS2405)。
CPU11が、計数された単語数が所定値以下であると判断した場合(ステップS2405:NO)、CPU11は、特に部分文字列を生成して検索単語を削減する必要が無いものと判断し、通常の単語検索処理を実行する。CPU11が、計数された単語数が所定値より大きいと判断した場合(ステップS2405:YES)、CPU11は、実施の形態1のステップS804、あるいは実施の形態2のステップS1404へ処理を移行し、前述した処理を実行する。
以上のように本実施の形態3によれば、検索結果として出力すべき単語数が画面に表示することが可能な数を超えた場合等、ユーザによる選択処理が煩雑になる数となった場合にのみ部分文字列を生成することができ、通常の単語検索時に演算処理負荷を増大させることが無く、検索レスポンスの劣化を未然に防止することが可能となる。
従来の手書き単語検索の一例を示す図である。 本発明の実施の形態1に係る単語検索装置の構成を示すブロック図である。 枠あり入力の場合の手書き文字切り出しの一例を示す図である。 枠なし入力の場合の手書き文字切り出しの一例を示す図である。 認識候補文字と単語文字列との比較の一例を示す図である。 認識候補文字と単語文字列とをマッチングするプログラムの具体例を示す図である。 本発明の実施の形態1に係る単語検索装置の検索結果限定手順を模式的に示す図である。 本発明の実施の形態1に係る単語検索装置のCPUの処理手順を示すフローチャートである。 本実施の形態1に係る単語検索装置の表示画面の一例を示す図である。 手書き文字が英単語である場合の認識候補文字と単語文字列との比較の一例を示す図である。 手書き文字が英単語である場合の単語検索装置の検索結果限定手順を模式的に示す図である。 手書き文字が英単語である場合の単語検索装置の表示画面の一例を示す図である。 候補文字リストの一例を示す図である。 本発明の実施の形態2に係る単語検索装置のCPUの処理手順を示すフローチャートである。 候補文字リストの生成手順を模式的に示す図である。 部分文字列再構成手順を模式的に示す図である。 候補文字訂正時の画面表示の一例を示す図である。 優先文字列の一例を示す図である。 手書き文字として筆記体で「fuji」の座標データを取得した場合の候補文字リストの一例を示す図である。 手書き文字が英単語である場合の候補文字リストの生成手順を模式的に示す図である。 手書き文字が英単語である場合の部分文字列再構成処理を模式的に示す図である。 手書き文字が英単語である場合の候補文字訂正時の画面表示の一例を示す図である。 手書き文字が英単語である場合の優先文字列の一例を示す図である。 本発明の実施の形態3に係る単語検索装置のCPUの処理手順を示すフローチャートである。
符号の説明
1 単語検索装置
2 記録媒体
3 コンピュータプログラム
11 CPU
12 記憶手段
13 RAM
14 通信インタフェース部
15 手書き文字入力手段
16 入力手段
17 表示手段
18 補助記憶手段
19 内部バス
121 単語辞書
122 文字認識辞書

Claims (9)

  1. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を備え、
    手書き文字の入力を受け付ける手書き文字受け付け手段と、
    該手書き文字受け付け手段で受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてある単語検索装置において、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段と、
    生成された部分文字列から一の部分文字列の選択を受け付ける手段と、
    選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段と、
    抽出された単語を表示する手段と
    を備えることを特徴とする単語検索装置。
  2. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を備え、
    手書き文字の入力を受け付ける手書き文字受け付け手段と、
    該手書き文字受け付け手段で受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてある単語検索装置において、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段と、
    生成された部分文字列に基づいて文字ごとの候補文字を抽出する候補文字抽出手段と、
    抽出された候補文字から一の候補文字の選択を受け付ける手段と、
    選択された候補文字に基づいて部分文字列を再構成する部分文字列再構成手段と、
    再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段と、
    抽出された単語を表示する手段と
    を備えることを特徴とする単語検索装置。
  3. 前記単語辞書の検索結果に基づいて検索された単語数を計数する手段と、
    計数された単語数が所定値より大きいか否かを判断する手段と、
    該手段で大きいと判断された場合にのみ、前記文字列生成手段で前記部分文字列を生成するようにしてあり、該手段で大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付けるようにしてあることを特徴とする請求項1又は2記載の単語検索装置。
  4. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を用い、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索する単語検索方法において、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成し、
    生成された部分文字列から一の部分文字列の選択を受け付け、
    選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出し、
    抽出された単語を表示することを特徴とする単語検索方法。
  5. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を用い、手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索する単語検索方法において、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成し、
    生成された部分文字列に基づいて文字ごとの候補文字を抽出し、
    抽出された候補文字から一の候補文字の選択を受け付け、
    選択された候補文字に基づいて部分文字列を再構成し、
    再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出し、
    抽出された単語を表示することを特徴とする単語検索方法。
  6. 前記単語辞書の検索結果に基づいて検索された単語数を計数し、
    計数された単語数が所定値より大きいか否かを判断し、
    大きいと判断された場合にのみ、前記部分文字列を生成し、大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付けることを特徴とする請求項4又は5記載の単語検索方法。
  7. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を備え、
    手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてあるコンピュータで実行することが可能なコンピュータプログラムにおいて、
    前記コンピュータを、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段、
    生成された部分文字列から一の部分文字列の選択を受け付ける手段、
    選択された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段、及び
    抽出された単語を表示する手段
    として機能させることを特徴とするコンピュータプログラム。
  8. 複数の単語を記憶してある単語辞書と、
    手書き文字の標準的な文字パターンの座標データ、及び該座標データに対応する文字を記憶してある文字認識辞書と
    を備え、
    手書き文字の入力を受け付け、受け付けた手書き文字を前記文字認識辞書とパターンマッチングすることにより抽出した一又は複数の文字パターンに対応する文字を含む単語を、前記単語辞書から検索するようにしてあるコンピュータで実行することが可能なコンピュータプログラムにおいて、
    前記コンピュータを、
    前記単語辞書の検索結果の中から一又は複数の前記文字パターンに対応する文字列のみを抽出して部分文字列を生成する部分文字列生成手段、
    生成された部分文字列に基づいて文字ごとの候補文字を抽出する候補文字抽出手段、
    抽出された候補文字から一の候補文字の選択を受け付ける手段、
    選択された候補文字に基づいて部分文字列を再構成する部分文字列再構成手段、
    再構成された部分文字列を含む単語のみを前記単語辞書に基づく検索結果から抽出する手段、及び
    抽出された単語を表示する手段
    として機能させることを特徴とするコンピュータプログラム。
  9. 前記コンピュータを、
    前記単語辞書の検索結果に基づいて検索された単語数を計数する手段、
    計数された単語数が所定値より大きいか否かを判断する手段、及び
    該手段で大きいと判断された場合にのみ、前記文字列生成手段で前記部分文字列を生成し、該手段で大きくないと判断された場合、前記単語辞書の検索結果からの選択を受け付ける手段
    として機能させることを特徴とする請求項7又は8記載のコンピュータプログラム。
JP2006039815A 2006-02-16 2006-02-16 単語検索装置、単語検索方法、及びコンピュータプログラム Expired - Fee Related JP4744317B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006039815A JP4744317B2 (ja) 2006-02-16 2006-02-16 単語検索装置、単語検索方法、及びコンピュータプログラム
US11/438,256 US8208730B2 (en) 2006-02-16 2006-05-23 Word search using handwriting recognition input with dictionary-based correction suggestions
CN2006100924749A CN101021850B (zh) 2006-02-16 2006-05-31 单词检索设备和单词检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006039815A JP4744317B2 (ja) 2006-02-16 2006-02-16 単語検索装置、単語検索方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2007219849A true JP2007219849A (ja) 2007-08-30
JP4744317B2 JP4744317B2 (ja) 2011-08-10

Family

ID=38368541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006039815A Expired - Fee Related JP4744317B2 (ja) 2006-02-16 2006-02-16 単語検索装置、単語検索方法、及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US8208730B2 (ja)
JP (1) JP4744317B2 (ja)
CN (1) CN101021850B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014174665A1 (ja) * 2013-04-26 2014-10-30 株式会社 東芝 システムおよび筆跡検索方法
JP5621777B2 (ja) * 2009-09-24 2014-11-12 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
JP2019128850A (ja) * 2018-01-25 2019-08-01 株式会社リクルート 情報処理装置、動画検索方法、生成方法及びプログラム

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8077974B2 (en) * 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts
CN101206659B (zh) * 2006-12-15 2013-09-18 谷歌股份有限公司 自动搜索查询校正
JP4672692B2 (ja) * 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US9261979B2 (en) * 2007-08-20 2016-02-16 Qualcomm Incorporated Gesture-based mobile interaction
CN107102723B (zh) * 2007-08-20 2019-12-06 高通股份有限公司 用于基于手势的移动交互的方法、装置、设备和非暂时性计算机可读介质
US20120239834A1 (en) 2007-08-31 2012-09-20 Google Inc. Automatic correction of user input using transliteration
US7650445B2 (en) * 2007-09-12 2010-01-19 Motorola, Inc. System and method for enabling a mobile device as a portable character input peripheral device
US8103506B1 (en) * 2007-09-20 2012-01-24 United Services Automobile Association Free text matching system and method
US8229225B2 (en) * 2008-05-06 2012-07-24 Wu Yingchao Candidate selection method for handwriting input
US20100104189A1 (en) * 2008-10-23 2010-04-29 Aravamudhan Bharath Handwriting Identification Method, Program And Electronic Device
TW201216124A (en) * 2010-10-12 2012-04-16 Inventec Corp Multi-block handwriting system and method thereof
CN101996238A (zh) * 2010-10-15 2011-03-30 无敌科技(西安)有限公司 运用多种语言输入提高搜寻匹配度的方法及其装置
CN102682033A (zh) * 2011-03-17 2012-09-19 环达电脑(上海)有限公司 通过二进制特征值匹配以查询文字的方法
KR20130080515A (ko) * 2012-01-05 2013-07-15 삼성전자주식회사 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법.
KR20150007577A (ko) * 2013-07-11 2015-01-21 삼성전자주식회사 데이터 병합을 제어하는 휴대 단말 및 방법
WO2015030461A1 (en) 2013-08-26 2015-03-05 Samsung Electronics Co., Ltd. User device and method for creating handwriting content
CN105204658B (zh) * 2014-06-27 2019-02-05 联想(北京)有限公司 电子设备及其输入控制方法
JP6337661B2 (ja) * 2014-07-08 2018-06-06 富士通株式会社 入力支援装置、入力支援システム、入力支援方法、および入力支援プログラム
US20160154555A1 (en) * 2014-12-02 2016-06-02 Lenovo (Singapore) Pte. Ltd. Initiating application and performing function based on input
US9710701B2 (en) 2015-03-26 2017-07-18 Lenovo (Singapore) Pte. Ltd. Handwriting data search
JP6679350B2 (ja) * 2016-03-09 2020-04-15 キヤノン株式会社 情報処理装置、プログラム及び情報処理方法
CN112836624A (zh) * 2021-01-29 2021-05-25 北京大米科技有限公司 一种文本处理方法、装置、存储介质和电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953985A (ja) * 1982-09-20 1984-03-28 Toshiba Corp 文字認識装置
JPS6097477A (ja) * 1983-10-31 1985-05-31 Fujitsu Ltd 誤読文字修正方式
JPH0728929A (ja) * 1993-06-01 1995-01-31 Mitsubishi Electric Corp 文字入力装置
JPH0785074A (ja) * 1993-06-23 1995-03-31 Hitachi Ltd 文書検索方法および装置
JPH08305722A (ja) * 1995-05-08 1996-11-22 Sharp Corp 文字列検索装置
JPH0973458A (ja) * 1995-09-04 1997-03-18 Sharp Corp 情報検索装置
JPH09259218A (ja) * 1996-03-22 1997-10-03 Mitsubishi Electric Corp 単語入力装置並びに単語入力方法
JP2004046388A (ja) * 2002-07-10 2004-02-12 Hitachi Ltd 情報処理システムおよび文字修正方法
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム
JP2005301914A (ja) * 2004-04-15 2005-10-27 Sharp Corp 携帯情報機器

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58155443A (ja) * 1982-03-11 1983-09-16 Fujitsu Ltd 日本語入力方式
US5191622A (en) * 1987-07-17 1993-03-02 Hitachi, Ltd. Hand-written character recognition apparatus with a personal dictionary preparation function
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
US5649027A (en) * 1992-07-24 1997-07-15 Microsoft Corporation Recognition of handwritten words
JP3560289B2 (ja) * 1993-12-01 2004-09-02 モトローラ・インコーポレイテッド 統合辞書ベースで、ありそうな文字列の手書き認識方法
US5734749A (en) * 1993-12-27 1998-03-31 Nec Corporation Character string input system for completing an input character string with an incomplete input indicative sign
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
JPH096922A (ja) * 1995-06-20 1997-01-10 Sony Corp 手書き文字認識装置
US6011554A (en) * 1995-07-26 2000-01-04 Tegic Communications, Inc. Reduced keyboard disambiguating system
US5818437A (en) * 1995-07-26 1998-10-06 Tegic Communications, Inc. Reduced keyboard disambiguating computer
US5917941A (en) * 1995-08-08 1999-06-29 Apple Computer, Inc. Character segmentation technique with integrated word search for handwriting recognition
DE69806780T2 (de) * 1997-09-25 2003-03-13 Tegic Communications Inc System zur unterdrückung der vieldeutigkeit in einer verringerten tastatur
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US5896321A (en) * 1997-11-14 1999-04-20 Microsoft Corporation Text completion system for a miniature computer
US7319957B2 (en) * 2004-02-11 2008-01-15 Tegic Communications, Inc. Handwriting and voice input with automatic correction
US6801659B1 (en) * 1999-01-04 2004-10-05 Zi Technology Corporation Ltd. Text input system for ideographic and nonideographic languages
US6618697B1 (en) * 1999-05-14 2003-09-09 Justsystem Corporation Method for rule-based correction of spelling and grammar errors
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
WO2000074240A1 (en) * 1999-05-27 2000-12-07 America Online Keyboard system with automatic correction
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7194404B1 (en) * 2000-08-31 2007-03-20 Semantic Compaction Systems Linguistic retrieval system and method
US6970877B2 (en) * 2002-06-28 2005-11-29 Microsoft Corporation Reducing and controlling sizes of prototype-based recognizers
EP1652310A4 (en) * 2003-07-17 2007-11-14 Xrgomics Pte Ltd METHOD FOR ENTERING TEXT BY CHOOSING LETTERS AND WORDS FOR REDUCED KEYBOARDS AND KEYBOARD SYSTEMS
US7088861B2 (en) * 2003-09-16 2006-08-08 America Online, Inc. System and method for chinese input using a joystick
US6989822B2 (en) * 2003-11-10 2006-01-24 Microsoft Corporation Ink correction pad
US8077974B2 (en) * 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953985A (ja) * 1982-09-20 1984-03-28 Toshiba Corp 文字認識装置
JPS6097477A (ja) * 1983-10-31 1985-05-31 Fujitsu Ltd 誤読文字修正方式
JPH0728929A (ja) * 1993-06-01 1995-01-31 Mitsubishi Electric Corp 文字入力装置
JPH0785074A (ja) * 1993-06-23 1995-03-31 Hitachi Ltd 文書検索方法および装置
JPH08305722A (ja) * 1995-05-08 1996-11-22 Sharp Corp 文字列検索装置
JPH0973458A (ja) * 1995-09-04 1997-03-18 Sharp Corp 情報検索装置
JPH09259218A (ja) * 1996-03-22 1997-10-03 Mitsubishi Electric Corp 単語入力装置並びに単語入力方法
JP2004046388A (ja) * 2002-07-10 2004-02-12 Hitachi Ltd 情報処理システムおよび文字修正方法
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム
JP2005301914A (ja) * 2004-04-15 2005-10-27 Sharp Corp 携帯情報機器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5621777B2 (ja) * 2009-09-24 2014-11-12 日本電気株式会社 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
WO2014174665A1 (ja) * 2013-04-26 2014-10-30 株式会社 東芝 システムおよび筆跡検索方法
JP2019128850A (ja) * 2018-01-25 2019-08-01 株式会社リクルート 情報処理装置、動画検索方法、生成方法及びプログラム

Also Published As

Publication number Publication date
US20070189613A1 (en) 2007-08-16
CN101021850B (zh) 2011-06-01
CN101021850A (zh) 2007-08-22
US8208730B2 (en) 2012-06-26
JP4744317B2 (ja) 2011-08-10

Similar Documents

Publication Publication Date Title
JP4744317B2 (ja) 単語検索装置、単語検索方法、及びコンピュータプログラム
US8069033B2 (en) Document based character ambiguity resolution
JP5402099B2 (ja) 情報処理システム、情報処理装置、情報処理方法およびプログラム
US10963717B1 (en) Auto-correction of pattern defined strings
JP5373998B1 (ja) 辞書生成装置、方法、及びプログラム
JP6067952B1 (ja) 翻字処理装置、翻字処理方法、翻字処理プログラム、及び情報処理装置
JP2011238159A (ja) 計算機システム
JP7176233B2 (ja) 検索方法、検索プログラムおよび検索装置
US20150356764A1 (en) Character Recognition System, Character Recognition Program and Character Recognition Method
JP5252596B2 (ja) 文字認識装置、文字認識方法及びプログラム
KR102355731B1 (ko) 해석 프로그램, 해석 방법 및 해석 장치
WO2022026908A1 (en) Systems and methods for machine learning key-value extraction on documents
US20150339279A1 (en) Typing error detecting device and recording medium
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
JP5752073B2 (ja) データ修正装置
JP2021028770A (ja) 情報処理装置及び表認識方法
US20240086438A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, and information processing apparatus
US10515297B2 (en) Recognition device, recognition method, and computer program product
JP6972653B2 (ja) 解析プログラム、解析方法および解析装置
JP5846658B1 (ja) テキスト比較装置、テキスト比較プログラム及びテキスト比較方法
JP2016103219A (ja) 文字列抽出装置およびプログラム
CN114661678A (zh) 一种移除多语言资源的方法、装置、设备及介质
KR100470346B1 (ko) 이미지의 클러스터링 방법 및 이 방법을 이용하여 문자를고속으로 입력 및 교정하는 방법
JP5032557B2 (ja) パターン認識装置およびパターン認識方法
Jonany Date Q/t $/tftit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees