JP2006330780A - 文字認識装置および文字認識プログラム - Google Patents

文字認識装置および文字認識プログラム Download PDF

Info

Publication number
JP2006330780A
JP2006330780A JP2005148907A JP2005148907A JP2006330780A JP 2006330780 A JP2006330780 A JP 2006330780A JP 2005148907 A JP2005148907 A JP 2005148907A JP 2005148907 A JP2005148907 A JP 2005148907A JP 2006330780 A JP2006330780 A JP 2006330780A
Authority
JP
Japan
Prior art keywords
recognition
character
characters
displayed
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005148907A
Other languages
English (en)
Inventor
Hitoshi Shimizu
清水  仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005148907A priority Critical patent/JP2006330780A/ja
Publication of JP2006330780A publication Critical patent/JP2006330780A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】 利用者が正解文字を見つけやすい文字認識装置を提供することを目的とする。
【解決手段】 認識対象入力部4から認識対象が入力されると、認識処理部5で認識処理が行われる。そして、認識結果と比較して形状が類似する文字を予め辞書格納部9に登録されている文字から抽出し、この抽出された文字を認識候補文字として表示部8に表示させる。辞書格納部9に登録されている各文字には、予め使用される環境を示す属性情報が付されており、所定の属性情報を備える認識候補文字のみを優先的に表示部に表示させる処理を自動的に行う。これによって、利用者が正解文字を見つける労力を低減させることができる。
【選択図】 図1

Description

本発明は、文書、音声、手書き文字などを認識する文字認識装置に関し、特に、認識候補から正解文字を確定することを容易にする制御手段に特徴を持つ文字認識装置に関するものである。また、本発明は、認識候補から正解文字を確定することを容易にする処理を行うことを特徴とする文字認識プログラムに関するものである。
タブレットなどによって手書き文字を入力し、入力された文字を認識処理して認識結果の候補を表示する文字認識装置が従来より用いられている。
通常、このような文字認識装置を用いて文字認識を行わせた場合、認識結果の候補が複数個存在するため、これらの候補をタブレットなどの表示部に表示させて、利用者に正解文字を選択させる方法が用いられている。
このとき、認識結果の候補を多数表示させると、利用者は、これら多数の表示された候補の中から唯一の正解文字を選択する必要があるため、一見しては正解文字が認識しづらく、錯誤を生じやすいという問題があった。
この問題を解決する手法として、認識処理前、あるいは認識処理後に利用者に文字種(ひらがな、カタカナ、漢字、英字など)を指定させるとともに、当該指定された文字種のみを表示部に候補として表示させることで、認識候補の表示数の削減を図った文字認識装置が開示されている(例えば、特許文献1、特許文献2参照)。
また別の従来例として、認識候補をひらがな、カタカナ、漢字、英字などの文字種ごとに分類して表示部に表示させることで、利用者に正解文字を確定しやすくした文字認識装置が開示されている(例えば、特許文献3、特許文献4参照)。
さらに別の従来例として、利用者が読みや部首などの属性を指定すると、当該指定された属性が表示部に表示され、これによって認識候補の中に外見上類似した文字が複数含まれている場合においても、正解文字を確定しやすくした文字認識装置が開示されている(例えば、特許文献5参照)。
特開平6−20101号公報 特開平8−123897号公報 特開平7−261918号公報 特開平7−262305号公報 特開平11−96287号公報
しかしながら、特許文献1または特許文献2に記載の文字認識装置においては、利用者が認識処理前後に文字種を指定する必要があるため、予め利用者が文字種を知っていることが前提であり、また、複数の文字を連続して認識処理させる場合において、異なる文字種を連続して認識させるような状況では文字ごとに文字種を指定し直す処理が必要となり、利用者に対する負担が増大する。
また、特許文献3または特許文献4に記載の文字認識装置のように、文字種ごとに分類して表示部に認識候補を表示させる場合、あるいは特許文献5に記載の文字認識装置のように利用者によって指定された別の属性(読み、部首など)を表示部に別途表示させる場合、のいずれの従来例においても、表示部に表示される認識候補の文字数が減少されるわけではないため、利用者が正解文字を探すための手間が大きく削減されるものではない。
本発明は、上記の問題点に鑑みて、利用者に文字種などの属性を意識させることなく一定の規則の下で自動的に認識候補の変更を行い、これによって表示される認識候補の文字数を限定することで、利用者が正解文字を見つけやすくする文字認識装置を提供することを目的とする。また、本発明は、認識候補の文字数を自動的に限定する処理を行う文字認識プログラムを提供することを別の目的とする。
上記目的を達成すべく、本発明の文字認識装置は、一文字以上の文字列で構成される認識対象に対する認識処理を行って認識結果として文字列を出力する文字認識装置であって、認識対象を入力する認識対象入力部と、前記認識対象入力部に入力された認識対象に対する認識処理を行う認識処理部と、予め複数の文字が登録されている辞書格納部と、認識結果が表示される表示部と、利用者が、前記表示部に表示される認識結果から正解となる文字を検索して確定処理を行うために操作する入力操作部と、を備え、前記辞書格納部に登録されている文字には、当該文字が用いられる環境を表す要素である属性情報が文字毎に付されており、前記認識処理部が認識対象に対する認識処理を行い、認識対象に含まれる各文字列と形状が類似する文字である認識候補文字を前記辞書格納部から検索するとともに、検索された認識候補文字のうち、所定の属性情報を備える認識候補文字のみを優先的に前記表示部に表示させるように自動的に処理が行われることを特徴とする。
このように構成されることで、表示部に表示される認識候補文字が予め限定されているため、利用者は表示部に表示された認識候補文字から正解文字を検索しやすい構成となっている。
また、例えば、前記入力操作部を操作することによって、前記所定の属性情報を備える認識候補文字のみを優先的に表示させる処理を行う対象となる認識対象に含まれる文字列を指定できる構成としてもよい。
このように構成されることで、利用者が表示部を確認しただけでは容易に正解文字が判断できない認識対象についてのみ表示部の表示内容を変更させる処理を行う旨の指示を行うことができるため、表示変更処理を行う対象となる文字を減らすことができ、処理時間の短縮化を図ることができる。
また、例えば、少なくとも前記認識対象に含まれる一文字に対して、認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、当該確定処理が行われた文字に含まれる属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われる構成としてもよい。
また、例えば、前記認識処理部によって検索された認識対象に対する認識候補文字のうち、認識対象との間の形状の類似度が所定の閾値を上回る認識候補文字に含まれる属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われる構成としてもよい。
また、例えば、前記認識対象に含まれる複数の文字に対して、認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、すでに確定処理が行われた複数の正解文字のいずれにも同一の属性情報が備えられる場合には、当該属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われる構成としてもよい。
また、例えば、前記認識対象に含まれる文字のうち、連続する2文字以上に対して認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、すでに確定処理が行われた当該連続する2文字以上に対する正解文字のいずれにも同一の属性情報が備えられる場合には、当該属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われる構成としてもよい。
また、本発明の文字認識プログラムは、一文字以上の文字列で構成される認識対象に対する認識処理を行って認識結果として文字列を出力する文字認識プログラムであって、認識対象が入力される第1のステップと、第1のステップで入力された認識対象に対する認識処理が施される第2のステップと、前記第2のステップで認識処理が施された形状と類似する形状を備える文字を、複数の文字が当該文字が用いられる環境を表す要素である属性情報とともに登録されている辞書格納部から検索する第3のステップと、前記第3のステップで検索された文字を認識候補文字として認識結果が表示される表示部に表示する第4のステップと、前記第4のステップで表示された文字のうち、所定の属性情報を備える文字のみを優先的に表示させる表示処理を行う第5のステップと、で構成されることを特徴とする。
本発明の構成によれば、予め辞書格納部に登録されている文字には、当該文字利用される環境を示す属性情報が付されており、所定の属性を示す文字のみが優先的に認識候補文字として表示されるように自動的に表示内容が変更されるため、表示される認識候補の文字数が限定された状態で、利用者は正解文字を探すことができる。これによって利用者が正解文字を探す労力を低減させることができる。
<第1の実施形態>
本発明の第1の実施形態について、図面を参照して説明する。図1は、本発明の文字認識装置の構成を示すブロック図である。
図1に示される文字認識装置1は、利用者によって文字認識装置1自体の操作が行われる入力操作部2と、入力操作部2で受け付けられた操作内容を判断する入力処理判断部3と、文字認識対象となる情報が入力される認識対象入力部4と、認識対象入力部4より入力された文字情報の認識処理が施される認識処理部5と、予め登録されている文字情報が後述する属性情報とともに格納される辞書格納部9と、認識処理部5で認識処理された情報と、辞書格納部9で格納された文字情報とから認識処理された文字に該当する文字候補を検索する認識候補表示制御部6と、認識候補表示制御部6で候補として挙げられる文字を表示するための処理を行う表示処理部7と、表示処理部7によって表示処理された情報が実際に表示される表示部8と、で構成される。
入力操作部2は、利用者によって文字認識装置1自体の操作が行われる部分であり、操作子(ボタン)やタッチパネル(ディスプレイ)で構成される。利用者が操作子を押下する、あるいは文字認識装置1のディスプレイの一部をタッチペンあるいは利用者の指などで操作することで、操作された内容が入力処理判断部3に与えられる。
認識対象入力部4は、文字認識対象となる情報を入力する部分であり、OCRではカメラあるいはスキャナに相当し、手書き認識では手書き用タブレットに相当する。予め準備された画像や文書の情報、あるいは利用者によって入力された手書き入力情報が認識対象入力部4によって取り込まれると、この取り込まれた情報が認識処理部5に与えられる。
認識処理部5では、認識対象入力部4より与えられた情報を実際に文字情報として認識させるための認識処理が行われる。認識対象入力部4より連続して複数の文字が入力されるような場合に、一文字ずつ認識処理が行われ、認識された文字形状を認識候補表示制御部6に出力する。
認識候補表示制御部6は、認識処理部5より与えられた文字形状に近似する文字を認識候補として選択する処理を行う。認識処理部5より与えられた文字形状の情報に基づいて、当該文字形状に近似している文字を辞書格納部9に登録されている文字の中から選択して、この選択された文字を認識候補文字として表示処理部7に出力する。
表示処理部7は、認識候補表示制御部6より与えられる認識候補文字を、所定の規則に従って並べ替えるとともに、表示部8に表示させるための表示処理を行う。表示部8は、表示処理部7によって表示処理が行われた情報が利用者によって視覚的に確認可能な形式で表示される。表示部8は、液晶ディスプレイなどで構成される。
辞書格納部9は、文字認識装置1によって扱うことのできるすべての文字情報が予め登録されており、例えばROMで構成される。具体的には、ひらがな、かたかな、英字(アルファベット)、漢字などの文字情報が登録されている。
利用者は、認識対象入力部4より文字認識処理対象となる情報を入力する。入力された情報は、認識処理部5によって認識処理が行われた後、認識候補表示制御部6に送られる。認識候補表示制御部6は、この認識された形状に近似する文字を辞書格納部9より検索し、所定の規則の下で近似する文字を認識候補文字として選択する。そして、この選択された認識候補文字が表示処理部7によって表示処理されて、表示部8に表示される。
利用者は、表示部8に表示された認識候補文字を確認し、正しい文字(以下、「正解文字」と呼称する)を選択する。具体的には、利用者が入力処理部2を操作することで該当する正解文字を選択し、確定処理を行う。利用者によって選択・確定処理が行われると、この処理内容が入力処理判断部3に与えられて、これにより利用者によって行われた処理内容が判断される。このとき、入力処理判断部3は、表示部8に表示されている内容を表示処理部7から読み出して、利用者によって選択・確定処理が行われた文字情報を認識し、当該文字情報を認識候補表示制御部6に与える。
認識候補表示制御部6は、入力処理判断部3によって確定された文字情報が与えられると、当該文字に関する一連の文字認識処理が終了したことを認識し、確定された文字情報を表示部8に表示させるべく表示処理部7に指示を与える。そして表示処理部7によって表示処理が行われた後、この確定された文字が表示部8に表示される。
このようにして、認識対象入力部4より入力された認識対象文字のうちの一文字が確定されると、次の認識対象文字についての確定処理に移行される。
図2は、表示部8に表示される表示状態の一例を示している。認識対象入力部4から入力された認識対象文字列12を構成する複数の認識対象文字13に対応する認識候補11が表示されている。図2に示される認識対象文字列12は、例えば名刺の画像などを取り込んだ状態を表している。
表示部8には、認識対象文字13ごとに、認識文字の候補である複数の文字群(以下、「認識候補文字群」と呼称する)15が表示される。利用者は、表示部8に表示される認識候補文字群15の中から、正解文字14を選択して確定処理を行う。
例えば、「県」という認識対象文字に対して、認識候補文字群として「原」、「集」、「県」、「黒」、・・・なる候補が表示されている。利用者は、この候補文字群の中から正解文字である「県」を見つけ出し、確定処理を行う。具体的には、操作子あるいはタッチペンなどで、正解文字である「県」を選択して、確定の指示を行う。
利用者は、このように認識対象文字列12の全ての認識対象文字について、正解文字を見つけ出し、確定処理を行う。全ての認識対象文字について正解文字が確定されると、この認識対象文字列に対する文字認識処理が終了する。
なお、図2では、認識対象文字列12を構成する複数の認識対象文字に対する認識候補文字群が、認識対象文字に対して縦列に表示される構成としているが、表示方法に関してはこれに限られるものではない。
本実施形態では、図2に示されるように、複数の認識対象文字に対して正解文字を選択する際に、利用者が正解文字を選択しやすくするために、認識候補文字を所定の規則の下で限定する処理を行うことを特徴とする。以下に、本実施形態における文字認識装置1が行う認識処理の手順について、フローチャートを参照して説明を行う。図3は、本実施形態における文字認識装置1が行う認識処理の手順を示すフローチャートである。
図3に示されるように、文字認識装置1が行う認識処理は、認識対象入力部4より認識対象が入力される入力ステップS1と、入力された認識対象を認識処理部5が認識する認識処理ステップS2と、ステップS2で認識された形状に近似する文字を辞書格納部9より検索する認識候補検索処理ステップS3と、ステップS3で検索された近似文字を認識候補として表示部8に表示する表示ステップS4とを備える。
さらに、文字認識装置1が行う認識処理は、表示ステップS4によって表示された認識候補から、利用者によって正解文字が選択、確定されるステップS5と、未確定認識対象文字が残っているか否かをチェックするステップS6と、ステップS5で確定された正解文字の属性を確認するステップS7と、ステップS7で確認された属性に応じて表示部8に表示される認識候補の表示内容を変更するステップS8と、すべての認識結果を確定するステップS9と、で構成される。
なお、ステップS7で行われる属性確認処理で利用される項目「属性」についての説明は後述する。
まず、利用者は、認識対象入力部4より画像、手書き入力などの情報を入力する(ステップS1)。この入力された情報は、認識処理部5に与えられて文字情報として認識させるための認識処理を行う(ステップS2)。具体的には、連続して複数の文字が入力された場合に、一文字ずつ認識して形状を記憶する処理が行われる。
認識処理部5で認識処理が行われると、認識候補表示制御部6が、記憶された形状に近似する文字を辞書格納部9より検索する(ステップS3)。例えば図2に示す例で言えば、「県」という認識対象文字に対して、その形状に近似する「原」、「集」、「県」、「黒」、などを検索する処理を行う。そして、これら検索された認識候補文字が表示部8に表示される(ステップS4)。
利用者は、表示部8に表示された複数の認識候補文字から一の正解文字を選択し、確定処理を行う(ステップS5)。上記の例で言えば、表示部8に表示された「原」、「集」、「県」、「黒」などの認識候補文字から、正解文字「県」を選択して確定処理を行う。具体的には、表示される文字「県」をタッチペンあるいは操作子などで選択して確定処理を行う。
このように、一の認識対象文字に対する正解文字の確定処理が終了すると、正解文字が確定していない認識対象文字が残存しているかどうかの判断を行う(ステップS6)。そして、未確定の認識対象文字が存在する場合は(ステップS6でNo)、正解文字の属性確認ステップS7へ進む。一方、すべての認識対象文字に対して確定処理が完了すると(ステップS6でYes)、認識結果確定ステップS9へ進む。
ステップS7では、正解文字として確定処理された文字の属性確認が行われる。ここで、文字の属性について、図面を参照して説明する。図4は、辞書格納部9に登録されている文字の登録状態を示す一例である。
図4に示されるように、各文字には予め属性が与えられている。属性とは、辞書格納部9に登録されている各文字が備える性質を表しており、具体的には当該文字が利用される環境が示されている。例えば、「0」という文字は、英語、フランス語、ドイツ語、イタリア語、スペイン語、ギリシャ語、URL、メールアドレス、電話番号に利用される文字であるため、これらの項目には利用されることを表す「1」が表示される。一方で、地名や氏名には利用されないため、これらの項目には「1」が表示されていない。
このように、辞書格納部9に登録されているすべての文字に対して、当該文字が利用される環境が登録されている。利用者が入力操作部2を操作して正解文字を確定すると、認識候補表示制御部6が、この正解文字の属性確認を行う(ステップS7)。
例えば、図2に示す例において、認識対象文字「県」に対して、認識候補文字の中から正解文字「県」が利用者によって確定処理されたとする。このとき、未確定の認識対象文字が残っているため、ステップS7に進む。そして、認識候補表示制御部6がこの正解文字「県」の属性を確認する。
ところで、この文字「県」は、図4に示されるように地名属性を備えている。認識候補表示制御部6は、「県」が地名属性を備えていることを確認すると、未確定の認識対象文字に対する認識候補文字を、地名属性を備えた候補を優先的に表示させるように表示内容の変更を行う(ステップS8)。
一般的に、未確定の認識対象文字が、隣接する文字が用いられる環境と同一の環境で用いられる可能性が高く、言い換えれば、隣接する文字が有する属性と同一の属性を有する可能性が高いことから、予め利用者が正解文字を選択しやすいように、確定した正解文字と同一の属性を示す認識候補文字を優先的に表示させるように表示内容を変更する処理を行うのがステップS8における処理内容である。
ここで、同一の属性を示す認識候補文字を優先的に表示させるとは、具体的には以下のいくつかの表示方法が考えられるが、これらのいずれの方法を利用しても構わないし、これらの表示方法に限られるものではない。
例えば、同一の属性を示す認識候補文字のみを表示部8に表示させ、その他の認識候補文字は利用者によって操作子あるいはタッチペンなどで操作されなければ表示されないように表示内容を変更するものとしてもよい。このようにすることで、利用者は表示部8を確認した際、隣接する文字と同一の属性を有する候補文字のみが表示されていることになり、検索が容易になる。
また、例えば、同一の属性を示す認識候補文字を上位に表示させ、同一の属性を示さない認識候補文字の表示順位を低下させることで、利用者に同一属性を示す認識候補文字を確認しやすくするものとしても良い。
また、例えば、同一の属性を示さない認識候補文字の表示濃度を淡くするなどして、これらの文字を視覚的に確認しづらくするものとしても良いし、逆に、同一の属性を示す認識候補文字の表示濃度を濃くしたり色付けを行うなどして、当該文字を視覚的に目立たせるものとしても良い。いずれにしても、同一の属性を示す認識候補文字のみを利用者が容易に選択することができる構成となる。
残りの認識対象文字についても、同様に表示されている複数の認識候補文字から一の正解文字を選択して確定処理を行う。このようにして認識対象文字のすべてについて、正解文字が確定されると(ステップS6でYes)、認識結果が確定し(ステップS9)、認識対象に対する文字認識処理が終了する。
図5は、本実施形態の文字認識装置1によって文字認識が行われる際の一実施例であり、外国語の文字を認識する際に、さまざまな言語の文字が認識候補として表示される例を示している。
図5は、利用者が認識対象入力部4より認識対象を入力し、表示部8に認識候補が表示されている状態を示している。図では、三文字の認識対象文字と、各々に該当する認識候補文字とが表示されている。なお、図5では属性が表示部8に表示されるものとしているが、これは表示させないものとしても良い。
図5では、一文字目の認識候補文字として、符号31、32、33、34で表される文字が挙げられている。このうち、符号31で表される文字はドイツ語とスウェーデン語を属性として備えており、符号32で表される文字はスウェーデン語とデンマーク語を属性として備えており、符号33で表される文字はポルトガル語を属性として備えており、符号34で表される文字はスペイン語とポルトガル語とハンガリー語を属性として備えている。
また、二文字目の認識候補文字として、符号35、36、37、38で表される文字が挙げられている。このうち、符号35で表される文字はポルトガル語を属性として備えており、符号36で表される文字はフランス語とポルトガル語を属性として備えており、符号37で表される文字はドイツ語とスウェーデン語とトルコ語とハンガリー語を属性として備えており、符号38で表される文字はイタリア語とポルトガル語を属性として備えている。
また、三文字目の認識候補文字として、符号39、40、41、42で表される文字が挙げられている。このうち、符号39で表される文字はドイツ語を属性として備えており、符号40で表される文字はギリシャ語を属性として備えており、符号41で表される文字は全ての言語を属性として備えており、符号42で表される文字はギリシャ語を属性として備えている。
図5に示される表示状態において、利用者が、一文字目の正解文字として符号31で表される文字を選択したとする。このとき、符号31で表される文字はドイツ語とスウェーデン語の属性を備えているため、二文字目以降の認識候補文字として、ドイツ語とスウェーデン語の少なくとも一つの属性を備えた文字が、優先的に表示されるように、表示部8の表示内容が変更される。例えば、二文字目に対する認識候補文字としては符号37で表される文字が該当し、三文字目に対する認識候補文字としては符号39で表される文字と符号41で表される文字が該当する。これら以外の認識候補文字については、上述したように、例えば表示部8に表示されないようにするなどの処置を施して、該当した文字を優先的に表示させるように表示内容が変更される。
このように構成されることで、表示部8が、利用者にとって二文字目以後の正解文字を検索しやすい表示内容に変更されているため、正解文字の検索の手間を少なくすることができる。この実施例によれば、利用者によって一文字目が確定された際、当該正解文字の属性がドイツ語とスウェーデン語を備えていることから、二文字目以後についても、ドイツ語かスウェーデン語で構成される可能性が極めて高いことを利用して、予めドイツ語かスウェーデン語の属性を備える認識候補文字のみを表示部8に優先的に表示させることで、利用者の正解文字の検索に要する労力を低減する効果を得ることができる。
<第2の実施形態>
本発明の第2の実施形態について、図面を参照して説明する。尚、本実施形態において、第1の実施形態と同一の部分については同一の符号を付してその詳細な説明を省略する。
なお、本実施形態の文字認識装置は、第1の実施形態と比較して認識処理の手順が異なる構成であり、備えられる構成要素については同一であるため、その説明を省略する。なお、各構成要素については、図1で用いた符号と同一の符号を付す。
本実施形態においても第1の実施形態と同様、図2に示されるように、複数の認識対象文字に対して正解文字を選択する際に、利用者が正解文字を選択しやすくするために、認識候補文字を所定の規則の下で限定する処理を行うことを特徴とする。以下に、本実施形態における文字認識装置が行う認識処理の手順について、フローチャートを参照して説明を行う。図6は、本実施形態における文字認識装置が行う認識処理の手順を示すフローチャートである。
図6に示されるように、文字認識装置1が行う認識処理は、第1の実施形態と同様に、認識対象入力部4より認識対象が入力される入力ステップS11と、入力された認識対象を認識処理部5が認識する認識処理ステップS12と、ステップS12で認識された形状に近似する文字を辞書格納部9より検索する認識候補検索処理ステップS13と、ステップS13で検索された認識候補文字を認識対象文字の形状と比較して、それぞれの類似度合いを調べる類似度調査ステップS14と、ステップS14で調査された類似度合いが、所定の閾値を上回る類似度を示す認識候補文字を抽出して、それらを優先的に表示部8に表示する認識候補表示ステップS15と、表示ステップS15によって表示された認識候補から、利用者によって正解文字が選択、確定されるステップS16と、未確定認識対象文字が残っているか否かをチェックするステップS17と、ステップS16で確定された正解文字の属性を確認するステップS18と、ステップS18で確認された属性に応じて表示部8に表示される認識候補の表示内容を変更するステップS19と、すべての認識結果を確定するステップS20と、で構成される。
ステップS11〜ステップS13については、それぞれ第1の実施形態のステップS1〜ステップS3と同一ステップであるため、処理内容の説明を省略する。
認識候補表示制御部6が辞書格納部9より認識対象文字に近似する文字を認識候補文字として抽出する(ステップS13)と、これらの文字と認識対象文字の形状とを比較して類似度合いを調べる(ステップS14)。そして、所定の閾値以上の類似度を示す認識候補文字を抽出する。
ここで類似度とは、辞書格納部9に登録されている文字の形状と、認識対象入力部4より入力された認識対象文字の形状との類似具合を示すパラメータであり、例えば形状を構成する各線分の方向や長さの比などを比較することで得られる値である。
そして、ステップS14で抽出された認識候補文字と同一の属性を示す認識候補文字が優先的に表示部8に表示されるように、認識候補表示制御部6が表示処理部7に対して指示を行い、表示処理部7の表示内容を表示部8が表示する(ステップS15)。このとき、ステップS14で抽出された認識候補文字と同一の属性を示す認識候補文字を優先的に表示する表示内容とは、第1の実施形態で上述した内容と同様に、該当する認識候補文字のみを表示部8に表示させその他の認識候補文字は利用者によって操作子あるいはタッチペンなどで操作されなければ表示されないようにするものとしても良いし、同一の属性を示す認識候補文字を上位に表示させ、同一の属性を示さない認識候補文字の表示順位を低下させるものとしても良いし、同一の属性を示さない認識候補文字の表示濃度を淡くするなどして、これらの文字を視覚的に確認しづらくするものとしても良いし、逆に、同一の属性を示す認識候補文字の表示濃度を濃くしたり色付けを行うなどして、当該文字を視覚的に目立たせるものとしても良い。
このように構成されるとき、ステップS15で表示される認識候補文字は、利用者が正解文字を確定する前から制限されたものとなっている。すなわち、所定の閾値以上の類似度を備えた認識候補文字は、正解文字である確率が高いため、これらに該当する文字と同一の属性を示す文字のみを表示することで、利用者が正解文字を検索する手間を少なくすることができる。
このように表示された認識候補文字から、利用者は正解文字を検索して確定を行う(ステップS16)。ステップS16以後のステップについては、第1の実施形態におけるステップS5〜ステップS9と同一の処理内容であるため、その説明を省略する。
第1の実施形態と同様、図5を参照して、本実施形態の文字認識装置1によって文字認識が行われる際の一実施例を説明する。
図5に示される表示状態において、認識対象を入力した後、認識候補表示制御部6が認識候補文字の類似度調査を行い、図5に示す符号31で表される文字のみが閾値を上回る類似度を示していたとする。このとき、ステップS15において、認識候補表示制御部6が符号31で表される文字と同一の属性を備える認識候補を自動的に選択して、優先的に表示する。
すなわち第1の実施形態と同様、符号31で表される文字はドイツ語とスウェーデン語の属性を備えているため、二文字目以降の認識候補文字として、ドイツ語とスウェーデン語の少なくとも一つの属性を備えた文字が、表示部8において優先的に表示される。例えば、二文字目に対する認識候補文字としては符号37で表される文字が該当し、三文字目に対する認識候補文字としては、符号39で表される文字と符号41で表される文字が該当する。これら以外の認識候補文字については、上述したように、例えば表示部8に表示されないようにするなどの処置を施して、該当した文字を優先的に表示させるように表示内容が変更される。
このように構成されることで、表示部8が、利用者にとって二文字目以後の正解文字を検索しやすい表示内容に変更されているため、正解文字の検索の手間を少なくすることができる。しかも、第1の実施形態と異なり、利用者が一文字目の確定処理を行う前からすでに表示部8に表示される認識候補文字が限定されているため、一文字目の正解文字を利用者が検索する手間についても軽減する効果を得ることができる。
なお、本実施形態では、ステップS15において、ステップS14で調査された類似度が所定の閾値を上回る認識候補文字と同一の属性を示す認識候補文字について優先的に表示する処理を行うものとしたが、ステップS14で調査された類似度が最大の認識候補文字と同一の属性を示す認識候補文字について優先的に表示する処理を行うものとしても構わない。
<第3の実施形態>
本発明の第3の実施形態について、図面を参照して説明する。尚、本実施形態において、第1の実施形態と同一の部分については同一の符号を付してその詳細な説明を省略する。
なお、本実施形態の文字認識装置は、第1の実施形態及び第2の実施形態と比較して認識処理の手順が異なる構成であり、備えられる構成要素については同一であるため、その説明を省略する。なお、各構成要素については、図1で用いた符号と同一の符号を付す。
本実施形態においても第1の実施形態と同様、図2に示されるように、複数の認識対象文字に対して正解文字を選択する際に、利用者が正解文字を選択しやすくするために認識候補文字を所定の規則の下で限定する処理を行うことを特徴とする。以下に、本実施形態における文字認識装置が行う認識処理の手順について、フローチャートを参照して説明を行う。図7は、本実施形態における文字認識装置が行う認識処理の手順を示すフローチャートである。
図7に示されるように、文字認識装置1が行う認識処理は、第1の実施形態と同様に認識対象入力部4より認識対象が入力される入力ステップS21と、入力された認識対象を認識処理部5が認識する認識処理ステップS22と、ステップS22で認識された形状に近似する文字を辞書格納部9より検索する認識候補検索処理ステップS23と、ステップS23で検索された近似文字を認識候補として表示部8に表示する表示ステップS24と、表示ステップS24によって表示された認識候補から利用者によって正解文字が選択、確定されるステップS25と、未確定認識対象文字が残っているか否かをチェックするステップS26と、すでに確定されている正解文字の属性を確認するステップS27と、すでに複数の正解文字が確定されている場合においてステップS27で確認された正解文字の属性に共通の属性があるか否かを判断するステップS28と、ステップS28で確認された属性に応じて表示部8に表示される認識候補の表示内容を変更するステップS29と、すべての認識結果を確定するステップS30と、で構成される。
ステップS21〜ステップS26については、それぞれ第1の実施形態のステップS1〜ステップS6と同一ステップであるため、処理内容の説明を省略する。
ステップS26において、正解文字が未確定である認識対象文字が存在すると判断されると(ステップS26でNo)、すでに確定されている正解文字の属性を確認する(ステップS27)。このとき、複数の正解文字がすでに確定されている場合に、これらの正解文字が備える属性に共通の属性が存在するか否かの判断を行う(ステップS28)。
ステップS28において、共通の属性が存在すれば(ステップS28でYes)、未確定の認識対象文字についてもその共通の属性を備える文字である可能性が高いと判断されるため、当該属性を備える認識候補文字が優先的に表示部8に表示されるように、認識候補表示制御部6が表示処理部7に対して指示を行い、表示処理部7の表示内容を表示部8が表示する(ステップS29)。
このとき、ステップS29において、ステップS28で判断された属性と同一の属性を示す認識候補文字を優先的に表示する表示内容とは、第1の実施形態で上述した内容と同様に、該当する認識候補文字のみを表示部8に表示させその他の認識候補文字は利用者によって操作子あるいはタッチペンなどで操作されなければ表示されないようにするものとしても良いし、同一の属性を示す認識候補文字を上位に表示させ、同一の属性を示さない認識候補文字の表示順位を低下させるものとしても良いし、同一の属性を示さない認識候補文字の表示濃度を淡くするなどして、これらの文字を視覚的に確認しづらくするものとしても良いし、逆に、同一の属性を示す認識候補文字の表示濃度を濃くしたり色付けを行うなどして、当該文字を視覚的に目立たせるものとしても良い。
このように構成されるとき、ステップS29で表示される認識候補文字は、まだ残っている未確定認識対象文字に対する正解文字を利用者が確定する前から制限されたものとなっている。すなわち、すでに確定されている複数の正解文字が備える共通の属性と同一の属性を備えた認識候補文字は正解文字である確率が高いため、これらに該当する文字のみを優先的に表示することで利用者が正解文字を検索する手間を少なくすることができる。
そして、このように表示された認識候補文字から利用者は正解文字を検索して確定を行う(ステップS25)。このようにして認識対象文字に対する正解文字が利用者によって順次確定され、すべての認識対象文字に対する確定処理が終了すると(ステップS26でYes)、認識結果確定ステップS30へ進み認識処理が終了する。
なお、ステップS27において、上述ではすでに確定された複数の正解文字に共通の属性が備えられていれば、この属性と同一の属性を備える認識候補を優先的に表示させる指示を行うものとしたが、さらに正確性を向上させる目的で、すでに確定された複数の正解文字のうち、連続する2文字以上の正解文字が同一の属性を備えていれば、認識対象文字列すべての文字がこの属性を備えるものと判断するとしても良い。
この場合、一文字目及び二文字目については、第1の実施形態におけるステップS4と同様に、認識候補が限定されていない通常の表示状態から利用者が正解文字を検索するが、これらの二文字に共通の属性が示される場合、三文字目以後の残りの認識対象文字については、全て当該属性を備えるものと判断されるため、自動的にこの属性を備える認識候補文字が優先的に表示される。
以下に、本実施形態の文字認識装置1によって文字認識が行われる際の一実施例を図面を参照して説明する。図8は、本実施形態の文字認識装置1によって文字認識が行われる際の一実施例であり、利用者が認識対象入力部4より認識対象を入力し、表示部8に認識候補が表示されている状態を示している。
図では、認識対象文字列が五文字で構成される場合を示しており、このうちの最初の一文字目については、正解文字として「奈」を既に確定した後の状態が示されている。
この状態の下で、二文字目の認識対象文字に対する正解文字として、利用者が「良」を選択し、確定処理を行ったとする。このとき、既に確定されている文字「奈」と、二文字目の正解文字として確定処理を行った「良」との双方に備えられる属性が調べられる。この「奈」と「良」には、いずれも属性「地名」が備えられているため、残りの3文字についても「地名」属性が備えられる可能性が高いと判断され、この3文字に対する認識候補文字として、「地名」属性を備える文字のみが優先的に表示部8に表示されるように表示内容が変更される(図8下段)。
このように、図8の例では、最初の2文字を確定した時点で、残りの3文字については認識候補文字が自動的に限定処理されているため、この残りの文字については、利用者が正解文字を検索する手間を少なくすることができる。
なお、上述の各実施形態において、表示部8に表示させる認識候補文字の表示内容を変更する対象を利用者が指定できる構成としても良い。以下にこの構成について説明を行う。
このとき、認識候補文字の表示内容を変更する処理とは、第1の実施形態におけるステップS8(図3)、第2の実施形態におけるステップS19(図6)、第3の実施形態におけるステップS29(図7)、にそれぞれ相当する処理である。
図9は、表示部8に表示されている表示状態の一例を示している。図2と同様、認識対象文字列12に対する認識候補文字群11が表示部8に表示されている状態図である。
図9に示されるように、表示部8に認識候補文字群11が表示されている状態で、利用者が入力操作部2を操作して、表示変更対象文字列21の表示変更対象文字の範囲を指定する。
このように利用者が表示変更対象文字列21を範囲指定すると、この指定された文字列に含まれる認識対象文字に対する認識候補文字(表示変更対象認識候補文字22)として表示部8に表示される表示内容が変更される。
このように構成されることで、利用者が表示部8を確認しただけでは容易に正解文字が判断できない認識対象文字についてのみ表示内容変更処理を行う旨の指示を行うことができるため、表示変更処理を行う対象となる文字を減らすことができ、処理時間の短縮化を図ることができる。
すなわち、第1の実施形態の文字認識装置では、すでに確定した正解文字と同一の属性を備える認識候補文字のみを優先的に表示させる対象となる認識対象文字として、利用者が範囲指定した認識対象文字に対してのみ表示内容の変更を行う処理が行われる構成となる。
また、第2の実施形態の文字認識装置では、閾値を越える類似度を示す認識候補文字と同一の属性を備える認識候補文字のみを優先的に表示させる対象となる認識対象文字として、利用者が範囲指定した認識対象文字に対してのみ表示内容の変更を行う処理が行われる構成となる。
また、第3の実施形態の文字認識装置では、複数の正解文字に共通の属性が備えられている場合に、この属性を備える認識候補文字と同一の属性を備える認識候補文字のみを優先的に表示させる対象として、利用者が範囲指定した認識対象文字に対してのみ表示内容の変更を行う処理が行われる構成となる。
本発明の文字認識装置は、カメラあるいはスキャナ、または手書き用タブレットを備えるPDAや携帯端末、ノートパソコンなどに対して好適に利用され得る。
は、文字認識装置の構成を示すブロック図である。 は、図1における表示部8に表示される表示状態の一例を示している。 は、第1の実施形態における文字認識装置が行う認識処理の手順を示すフローチャートである。 は、図1における辞書格納部9に登録されている文字の登録状態を示す一例である。 は、第1の実施形態の文字認識装置によって文字認識が行われる際の一実施例である。 は、第2の実施形態における文字認識装置が行う認識処理の手順を示すフローチャートである。 は、第3の実施形態における文字認識装置が行う認識処理の手順を示すフローチャートである。 は、第3の実施形態の文字認識装置によって文字認識が行われる際の一実施例である。 は、図1における表示部8に表示されている表示状態の別の一例を示している。
符号の説明
1 文字認識装置
2 入力操作部
3 入力処理判断部
4 認識対象入力部
5 認識処理部
6 認識候補表示制御部
7 表示処理部
8 表示部
9 辞書格納部
11 認識候補
12 認識対象文字列
13 認識対象文字
14 正解文字
15 認識候補文字
21 表示変更対象文字列
22 表示変更対象認識候補文字

Claims (7)

  1. 一文字以上の文字列で構成される認識対象に対する認識処理を行って認識結果として文字列を出力する文字認識装置であって、
    認識対象を入力する認識対象入力部と、
    前記認識対象入力部に入力された認識対象に対する認識処理を行う認識処理部と、
    予め複数の文字が登録されている辞書格納部と、
    認識結果が表示される表示部と、
    前記表示部に表示される認識結果から正解となる文字を検索して確定処理を行うために利用者によって操作される入力操作部と、を備え、
    前記辞書格納部に登録されている文字には、当該文字が用いられる環境を表す要素である属性情報が文字毎に付されており、
    前記認識処理部が認識対象に対する認識処理を行い、認識対象に含まれる各文字列と形状が類似する文字である認識候補文字を前記辞書格納部から検索するとともに、
    検索された認識候補文字のうち、所定の属性情報を備える認識候補文字のみを優先的に前記表示部に表示させるように自動的に処理が行われることを特徴とする文字認識装置。
  2. 前記入力操作部を操作することによって、前記所定の属性情報を備える認識候補文字のみを優先的に表示させる処理を行う対象となる認識対象に含まれる文字列を指定できる構成であることを特徴とする請求項1に記載の文字認識装置。
  3. 少なくとも前記認識対象に含まれる一文字に対して、認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、
    当該確定処理が行われた文字に含まれる属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われることを特徴とする請求項1または請求項2に記載の文字認識装置。
  4. 前記認識処理部によって検索された認識対象に対する認識候補文字のうち、認識対象との間の形状の類似度が所定の閾値を上回る認識候補文字に含まれる属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われることを特徴とする請求項1または請求項2に記載の文字認識装置。
  5. 前記認識対象に含まれる複数の文字に対して、認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、
    すでに確定処理が行われた複数の正解文字のいずれにも同一の属性情報が備えられる場合には、当該属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われることを特徴とする請求項1または請求項2に記載の文字認識装置。
  6. 前記認識対象に含まれる文字のうち、連続する2文字以上に対して認識結果から正解となる文字が利用者によって検索され、確定処理が行われた後、
    すでに確定処理が行われた当該連続する2文字以上に対する正解文字のいずれにも同一の属性情報が備えられる場合には、当該属性情報と同一の属性情報を備える認識候補文字のみを優先的に表示部に表示させるように自動的に処理が行われることを特徴とする請求項1または請求項2に記載の文字認識装置。
  7. 一文字以上の文字列で構成される認識対象に対する認識処理を行って認識結果として文字列を出力する文字認識プログラムであって、
    認識対象が入力される第1のステップと、
    第1のステップで入力された認識対象に対する認識処理が施される第2のステップと、
    前記第2のステップで認識処理が施された形状と類似する形状を備える文字を、複数の文字が当該文字が用いられる環境を表す要素である属性情報とともに登録されている辞書格納部から検索する第3のステップと、
    前記第3のステップで検索された文字を認識候補文字として認識結果が表示される表示部に表示する第4のステップと、
    前記第4のステップで表示された文字のうち、所定の属性情報を備える文字のみを優先的に表示させる表示処理を行う第5のステップと、で構成される文字認識プログラム。
JP2005148907A 2005-05-23 2005-05-23 文字認識装置および文字認識プログラム Pending JP2006330780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005148907A JP2006330780A (ja) 2005-05-23 2005-05-23 文字認識装置および文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005148907A JP2006330780A (ja) 2005-05-23 2005-05-23 文字認識装置および文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2006330780A true JP2006330780A (ja) 2006-12-07

Family

ID=37552441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005148907A Pending JP2006330780A (ja) 2005-05-23 2005-05-23 文字認識装置および文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2006330780A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017058813A (ja) * 2015-09-15 2017-03-23 日本電気株式会社 表示制御装置、表示制御方法、表示制御プログラム、表示制御プログラムを記憶する記憶媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311818A (ja) * 1994-05-16 1995-11-28 Sharp Corp 文字認識装置
JPH08190603A (ja) * 1995-01-10 1996-07-23 Sanyo Electric Co Ltd 文字認識装置及びその候補文字表示方法
JPH09102012A (ja) * 1995-10-06 1997-04-15 Matsushita Electric Ind Co Ltd 文字認識方法および装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311818A (ja) * 1994-05-16 1995-11-28 Sharp Corp 文字認識装置
JPH08190603A (ja) * 1995-01-10 1996-07-23 Sanyo Electric Co Ltd 文字認識装置及びその候補文字表示方法
JPH09102012A (ja) * 1995-10-06 1997-04-15 Matsushita Electric Ind Co Ltd 文字認識方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017058813A (ja) * 2015-09-15 2017-03-23 日本電気株式会社 表示制御装置、表示制御方法、表示制御プログラム、表示制御プログラムを記憶する記憶媒体

Similar Documents

Publication Publication Date Title
EP2383970B1 (en) Camera based method for text input and keyword detection
US8625899B2 (en) Method for recognizing and translating characters in camera-based image
KR20100007722A (ko) 카메라 기반 영상의 문자 인식 및 번역 방법
EP3522038A1 (en) Method for translating characters and apparatus therefor
CN108256523B (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
US20220222292A1 (en) Method and system for ideogram character analysis
RU2605078C2 (ru) Сегментация изображения для верификации данных
RU2665274C2 (ru) Всплывающая панель верификации
CN108062301B (zh) 文字翻译方法及其装置
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
CN111142683B (zh) 输入辅助程序、输入辅助方法以及输入辅助装置
JP2008225676A (ja) 辞書検索装置及びその制御プログラム
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP2006330780A (ja) 文字認識装置および文字認識プログラム
JP6655331B2 (ja) 電子機器及び方法
EP3537341A1 (en) Character input device, character input method, and character input program
JP5381185B2 (ja) 電子機器及び情報表示プログラム
JPH07302306A (ja) 文字入力装置
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JP3221968B2 (ja) 文字認識装置
KR101727953B1 (ko) 문자를 번역하는 방법 및 그 장치
JPH07182441A (ja) 文字認識装置
JP2731394B2 (ja) 文字入力装置
JP2687902B2 (ja) 文書画像認識装置
JPH05120472A (ja) 文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070822

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20071022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101005

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110215