JP2010217996A - 文字認識装置、文字認識プログラム、および文字認識方法 - Google Patents

文字認識装置、文字認識プログラム、および文字認識方法 Download PDF

Info

Publication number
JP2010217996A
JP2010217996A JP2009061148A JP2009061148A JP2010217996A JP 2010217996 A JP2010217996 A JP 2010217996A JP 2009061148 A JP2009061148 A JP 2009061148A JP 2009061148 A JP2009061148 A JP 2009061148A JP 2010217996 A JP2010217996 A JP 2010217996A
Authority
JP
Japan
Prior art keywords
recognition
character
characters
category
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009061148A
Other languages
English (en)
Inventor
Chitei Aizawa
知禎 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2009061148A priority Critical patent/JP2010217996A/ja
Priority to KR1020100010816A priority patent/KR101078086B1/ko
Priority to CN201010123535A priority patent/CN101833661A/zh
Publication of JP2010217996A publication Critical patent/JP2010217996A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】文字が含まれている画像データに対して、手軽な操作で高速の文字認識を実現する文字認識装置、文字認識プログラム、および文字認識方法を提供する。
【解決手段】携帯端末1により、主に英数文字からなる第1認識用英数文字部24aおよびカテゴリ用文字からなる第1認識用カテゴリ文字部24bと、これ以外の文字を含みこれらの文字よりも文字数が多い第2認識用文字についての第2認識用文字部24cとを区別可能に記憶しておき、第1認識用英数文字部24aおよび第1認識用カテゴリ文字部24bによる第1文字認識処理を実行し(ステップS4)、該処理でのマッチング信頼度が低い場合に(ステップS5〜S6)、少なくとも第2認識用文字部24cにより文字認識を実行する第2文字認識処理(ステップS7)を実行する。
【選択図】図4

Description

この発明は、例えば画像データに含まれている文字を認識するような文字認識装置、文字認識プログラム、および文字認識方法に関する。
日本語や中国語の文字数は、英語等に比べて非常に多く、各々第一水準漢字だけで3000文字以上、第二水準漢字も合わせると6000文字以上ある。このため、日本語や中国語などの文字を認識しようとすると、各々の文字の認識処理にてそれら3000〜6000以上の文字と照合する処理が必要となる。この結果、CPUに負荷がかかる重い処理となってしまい、特に携帯機器のような貧弱なCPU環境下において、処理時間の長時間化が深刻な問題となる。
一方、文字認識する対象として、例えば名刺など、記載内容がある程度決まっている文字印刷媒体が存在している。このような文字印刷媒体の文字を読取る装置として、名刺の文字を認識する装置が提案されている(特許文献1〜3参照)。
特許文献1の名刺認識装置は、認識画像範囲をユーザにペンで指定させ、この範囲の認識文字をどの属性(名前、会社名、住所など)に登録するか指定させるものである。
特許文献2の文字認識装置は、文字認識が必要なエリアをテンプレートとして複数登録しておき、このテンプレートを選択させた上で、テンプレートで定まるエリア内の文字を認識するものである。
特許文献3の文字認識装置は、キーボードによって認識対象領域を指定させ、この対象領域について文字を認識するものである。
いずれの装置も、名刺全体を一度に処理するのではなく、領域指定したカテゴリ分についてのみ処理するものである。このため、ユーザが所望するカテゴリ分について速く認識処理をすることができる。すなわち、認識処理を行う範囲がユーザの所望するカテゴリに絞り込まれているため、認識処理を早くすることができ、CPUにかける負荷を抑制することができる。
しかし、このような従来技術は、文字認識の範囲を絞り込むことで認識処理に要する時間を短くしているが、その絞り込んだ範囲での文字認識処理そのものについては時間短縮がされていない。
また、上記従来技術には、作業時間を要し面倒であるという問題点がある。詳述すると、上記従来技術は、名刺1枚毎に文字認識させる範囲(またはテンプレート)をユーザに指定させ、その範囲の文字をどのカテゴリに対応させるかを設定する必要がある。このため、入力したい名刺の数が多数になればなるほど、ユーザにとって面倒な作業を何度も要求することになる。
一方、端末装置により名刺を画像データとして取り込み、取り込んだ画像データを通信ネットワークを介してサーバに送信し、サーバで文字認識を行い、認識結果をサーバから再び通信ネットワークを介して端末装置に送信する名刺OCR処理システムが提案されている(特許文献4参照)。
この方法であれば、端末装置のCPUが貧弱であっても、サーバのCPUが処理能力の高いものであれば、認識処理に要する時間を短縮することができる。
しかし、このような通信ネットワークを用いる方法は、通信時間がかかる。このため、回線の混雑度合いによっては通信時間が長時間化してしまうという問題点がある。また、通信することが必須になるため、例えば携帯電話機のように無線通信を行う携帯端末では、地下など電波の届かない場所で使用できないという問題も生じる。
特開平10−55413号公報 特開2001−202475号公報 特開平2−240787号公報 特開2003−296353号公報
この発明は、上述した問題に鑑み、文字が含まれている画像データに対して、手軽な操作で高速の文字認識を実現する文字認識装置、文字認識プログラム、および文字認識方法を提供し、利用者の満足度を向上させることを目的としている。
この発明は、文字認識用のマッチングデータを記憶する記憶手段と、画像データを取得する画像データ取得手段と、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段とを備えた文字認識装置であって、前記マッチングデータは、予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成され、前記文字認識手段は、前記第1認識用マッチングデータにより前記画像データについて文字認識を実行する第1文字認識処理と、該第1文字認識処理の結果が再認識条件に該当するか否か判別する再認識要否判別処理と、該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより文字認識を実行する第2文字認識処理とを実行する構成である文字認識装置であることを特徴とする。
前記マッチングデータは、文字の特徴を示す特徴データで構成するなど、文字認識のマッチングに用いるデータで構成することができる。
前記記憶手段は、ハードディスクや不揮発性メモリなど、データを記憶する手段で構成することができる。
前記画像データは、カラー画像やグレースケール画像やモノクロ2階調画像など、適宜の画像のデータとすることができる。
前記画像データ取得手段は、例えばCCDカメラやCMOSカメラなどの撮像手段とする、あるいは、このような撮像手段で撮像した文字列画像のデータを該撮像手段から受信するUSB(Universal Serial Bus)やLAN(Local Area Network)などの通信インターフェースとするなど、画像データを取得可能な適宜の手段で構成することができる。
前記文字認識手段は、例えば、画像データ中の文字画像から特徴データを抽出し該特徴データをマッチングデータの特徴データとマッチングし、どの文字かを認識する手段とすることができる。
前記第1認識用文字は、例えば英数文字、カテゴリ判別用文字、またはこれらの複数など、予め定めた適宜の文字とすることができる。
前記第2認識用文字は、例えばひらがな、カタカナ、漢字、またはこれらの複数など、予め定めた適宜の文字とすることができる。
前記文字認識装置は、情報処理を実行するCPUなどの情報処理部と情報記憶を行うメモリなどの情報記憶部と外部装置に接続する接続端子などのインターフェース部とを有する半導体チップなどの装置で構成する、あるいは、撮像手段と制御手段と記憶手段とを備えた携帯電話機やPDA(Personal Digital Assistants)やパーソナルコンピュータなどの情報処理端末で構成するなど、適宜の装置で構成することができる。
この発明により、画像データに対して手軽な操作で高速の文字認識を実現することができ、利用者の満足度を向上させることができる。
この発明の態様として、前記文字認識手段は、前記画像データ内の文字群のカテゴリを判別するカテゴリ判別処理を実行する構成であり、前記第1認識用マッチングデータは、前記カテゴリ判別に用いられるカテゴリ判別用文字が含まれた構成とすることができる。
前記カテゴリ判別用文字は、例えば「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」、またはこれらの複数に用いられる文字など、カテゴリ判別に使用する文字で構成することができる。
この態様により、第1文字認識処理の際にカテゴリ判別も実行することが可能となる。
またこの発明の態様として、前記第1認識用マッチングデータは、前記カテゴリ判別用文字のうち2以上の部品に分かれる結合文字については該結合を要素別に分離した部品文字が含まれた構成とすることができる。
前記結合文字は、文字列方向が左右方向である場合に偏(へん)と旁(つくり)からなる文字、あるいは、文字列方向が上下方向である場合に冠(かんむり)と脚(あし)からなる文字とすることができる。具体的には、例えば「話」や「住」や「所」等とすることができる。
前記部品文字は、文字列方向が左右方向である場合の前記結合文字の偏(へん)または旁(つくり)に該当する文字、あるいは、文字列方向が上下方向である場合の前記結合文字の冠(かんむり)または脚(あし)からなる文字とすることができる。具体的には、例えば「言」と「舌」、「イ」と「主」、「戸」と「斤」等とすることができる。
これにより、1文字の結合文字を2文字の部品文字と誤認識した場合でも、その誤認識した状態でカテゴリを正しく判別することができる。詳述すると、例えば1つの結合文字である「話」を、2つの部品文字「言」と「舌」として認識し、文字列を「電言舌」と認識した場合でも、「電話」のカテゴリであると認識することができる。
またこの発明の態様として、前記文字認識手段は、前記カテゴリ判別処理にてカテゴリが判別された文字群内に該カテゴリで使用されないはずの誤認文字が含まれているか否か判別し、含まれている場合に該誤認文字をカテゴリで使用される文字に補正する補正処理とを実行する構成とすることができる。
これにより、例えば「電話番号」のカテゴリでアルファベットの「Z」と認識した文字を数字の「2」に補正するといったことができ、効率よく認識精度を高めることができる。
またこの発明の態様として、前記補正処理は、前記誤認文字が含まれている場合に、カテゴリで使用される文字のみを認識対象として再度文字認識を実行することにより補正する構成とすることができる。
これにより、マッチングデータのうちカテゴリで使用される文字のデータのみを用いて文字認識できるため、高速かつ高精度に文字認識を実行することができる。
またこの発明の態様として、前記第1文字認識処理は、マッチング信頼度の高いものから複数の文字候補を求めておいて最もマッチング信頼度の高い文字を採用する構成であり、前記補正処理は、前記誤認文字が含まれている場合に、該誤認文字の文字候補のうち、該カテゴリに使用される文字の中で最もマッチング信頼度の高い文字に補正する構成とすることができる
これにより、マッチングデータによる再度の文字認識を実行せずに正しい文字に補正することができ、高速かつ高精度に文字認識を完了することができる。
またこの発明は、予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、画像データ取得手段により画像データを取得する画像データ取得ステップと、前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとをコンピュータに実行させる文字認識プログラムとすることができる。
前記文字認識プログラムは、CD(Compact Disc)、DVD(Digital Versatile Disk)、フレキシブルディスク、メモリ、チップ、またはハードディスクなど、適宜の記憶媒体に格納することができる。
この発明により、コンピュータに文字認識プログラムをインストールすれば、画像データに対して手軽な操作で高速の文字認識を実現することができる。
またこの発明は、予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、画像データ取得手段により画像データを取得する画像データ取得ステップと、前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとを実行する文字認識方法とすることができる。
これにより、画像データに対して手軽な操作で高速の文字認識を実行することができる。
この発明により、撮影された名刺画像等の画像データに対して、手軽な操作で高速の文字認識を実現する文字認識装置、文字認識プログラム、および文字認識方法を提供し、利用者の満足度を向上させることができる。
携帯端末の斜視図。 携帯端末の構成を示すブロック図。 辞書データの構成を説明する説明図。 文字認識プログラムによる文字認識処理のフローチャート。 文字認識する撮影画像や認識文字の説明図。
この発明の一実施形態を以下図面と共に説明する。
図1は、携帯端末1の斜視図を示し、図2は、携帯端末1の構成のブロック図を示し、図3は辞書データの構成図を示す。
携帯端末1は、図1に示すように、画像入力部3、操作部5、及び画面表示部7が設けられている。画像入力部3は、画像を撮像するデジタルカメラであり、操作部5は、押下操作されるボタンであり、画面表示部7は、画像を表示する液晶ディスプレイあるいは有機ELディスプレイである。
図2に示すように、携帯端末1は、画像入力部3、操作部5、及び画面表示部7に加えて、CPU11、ROM12、およびRAM13が、バス16に接続して設けられている。
画像入力部3は、CCDカメラまたはCMOSカメラなどのデジタルカメラであり、バス16に接続されている。画像入力部3が撮像して得た撮像画像は、デジタル画像データとしてCPU11に送信される。このデジタル画像データは、最終的に別途の記憶装置(不揮発性メモリなど)に記憶しても良い。なお、画像入力部3は、CPU11から撮像信号を受けて撮像を開始する。
操作部5は、バス16に接続されている。この操作部5は、利用者に押下操作された押下信号を、バス16を介してCPU11に送信する。
画面表示部7は、操作画面を表示する操作画面表示部7aとしての機能と、文字認識した認識結果を表示する認識結果表示部7bとしての機能とを有している。この操作画面表示部7は、バス16に接続されている。CPU11から画像データが送られてくると、この画像データの画像を操作画面表示部7aまたは認識結果表示部7bに表示する。
CPU11は、ROM12に記憶されたプログラムに従ってRAM13を一時記憶領域に使用して各種動作を行うプロセッサであり、各部を制御する制御機能21と、文字認識機能22を有している。
この文字認識機能22は、文字列抽出処理部31、文字抽出処理部32、文字認識処理部33、認識信頼度判定処理部34、カテゴリ判別処理部35、および認識結果補正処理部36を有している。
文字列抽出処理部31は、画像データから文字列を抽出する処理を実行する。この文字列の抽出は、例えば画像データを2値化して射影データを取得し、この射影データから文字列と余白を区別する等、適宜の方法により実行する。具体的には、例えば名刺などの横書き文字に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素の行が連続している範囲を文字列とする、あるいは葉書の宛名などの縦書き文字に対して画素列別の黒画素数から左右方向のヒストグラムを算出し、所定数以上の黒画素の列が連続している範囲を文字列とするなど、適宜の方法により実行する。
文字抽出処理部32は、前記文字列から文字を抽出する処理を実行する。この文字の抽出は、横書き文字に対して画素列別の黒画素数から左右方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とする、あるいは縦書き文字に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とするなど、適宜の方法により実行する。
文字認識処理部33は、マッチング用辞書データ24のマッチング情報を用いてどの文字のマッチング情報と一致あるいは近似するか判別することで文字を認識する処理と共に、マッチング信頼度を求める処理を実行する。この文字を認識する処理には、英数字を中心とする特定文字のみを高速に認識する特定文字認識処理と、全ての文字を認識する全文字認識処理とがある。
認識信頼度判定処理部34は、文字認識処理部33で求めたマッチング信頼度(認識信頼度)が所定の閾値を超えているか否か判定する処理を実行する。
カテゴリ判別処理部35は、カテゴリ判別用辞書データ25を用いて文字列がどのカテゴリに属するかを判別する処理を実行する。
認識結果補正処理部36は、文字列の中にそのカテゴリで用いられない文字があれば、この文字をカテゴリ内で用いられる文字に補正する処理を実行する。
ROM12は、文字認識プログラム23、マッチング用辞書データ24、およびカテゴリ判別用辞書データ25を記憶している。
マッチング用辞書データ24は、図3(A)に示すように、文字コード、マッチング情報、および対象カテゴリによって構成されている。
文字コードは、例えばShift−JISなどの適宜の方式の文字コードである。
マッチング情報は、文字の特徴データを文字別に記憶している。
対象カテゴリは、1つの文字に対して複数種類登録されている。具体的には、対象カテゴリとして「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」等が登録されている。
このマッチング用辞書データ24に記憶されているデータは、第1認識用英数文字部24a、第1認識用カテゴリ文字部24b、および第2認識用文字部24cに区別可能に記憶されている。
第1認識用英数文字部24aは、主に英語、数字、記号などの欧米系文字で構成されている。
第1認識用カテゴリ文字部24bは、カテゴリの識別に用いられる文字、すなわち、マッチング用辞書データ24の対象カテゴリとして登録された「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」のいずれかで使用される文字で構成されている。
具体的には、対象カテゴリであることを示すキーワードとなる「メ」、「ー」、「ル」、「ホ」、「ム」、「ペ」、「ジ」、「電」、「話」、「フ」、「ァ」、「ッ」、「ク」、「ス」、「郵」、「便」、「番」、「号」などの文字が含まれている。また、この文字のうち「話」、「便」などの結合文字については、その部品となる偏(へん)や旁(つくり)を一文字とした「言」、「舌」、「イ」、「更」などの部品文字も含まれている。
なお、結合文字を分離した部品文字は、少なくとも認識したい文字列方向に部品文字が並んでいる結合文字とすることが好ましい。この文字列方向は、文字が縦方向に並んでいれば縦方向、文字が横方向に並んでいれば横方向とするなど、文字が並んでいる適宜の方向とすることができる。
第2認識用文字部24cは、第1認識用英数文字部24aと第1認識用カテゴリ文字部24bのどちらにも入らない文字(主に日本語文字)で構成されている。
なお、この第2認識用文字部24cは、第1認識用カテゴリ文字部24bを含まない構成としているが、第2認識用文字部24cの一部を第1認識用カテゴリ文字部24bとする構成にしてもよい。
カテゴリ判別用辞書データ25は、図3(B)に示すように、カテゴリ別の複数ファイルによって構成されており、各ファイルには、そのカテゴリとして判別する文字列が記憶されている。文字列には、「電話」と「電言舌」を登録するなど、結合文字を部品文字とした文字列も記憶されている。なお、カテゴリ判別用辞書データ25に記憶する文字列は、文字コードの羅列としてもよい。
RAM13は、CPU11が各種制御や演算に使用するデータを一時記憶すると共に、画像メモリ14に文字列画像などの画像を記憶する。
なお、携帯端末1には、無線通信を行う通信アンテナ、音声出力を行うスピーカ、および集音を行うマイク等も設けられている。これにより、携帯電話機として利用できるように構成されている。
また、図2に仮想線で示すように、CPU11とROM12は、1つのチップ15に搭載して電子部品として構成してもよい。この場合、チップ15を携帯端末1に備えれば、簡単に文字認識機能を追加することができる。
図4は、携帯端末1のCPU11が文字認識プログラム23に従って実行する文字認識処理のフローチャートであり、図5は文字認識する撮影画像や認識文字の説明図である。
まず事前準備として、CPU11は、利用者の操作入力に応じて名刺読取りモードなどの文字認識処理が選択されると、画像入力部3によって画像撮影が可能な状態とし、画面表示部7に図5(A)に示す操作画面表示部7aを表示する。
この操作画面表示部7aには、文字認識を行う画面であることを示す認識画面表示部71、画像入力部3(カメラ)によって撮影しているプレビュー画像を動画表示するプレビュー画像表示部72、前画面に戻るための戻るボタン73、認識処理を開始するための認識ボタン74、およびサブメニューを表示するためのサブメニューボタン75が設けられている。
利用者に認識ボタン74が選択されると、CPU11は、画像入力部3による画像撮影を実行して文字画像を取得する(ステップS1)。
CPU11は、文字列抽出処理部31による文字列抽出処理を実行し、文字画像から文字列を抽出する(ステップS2)。このとき、会社名表示部分の文字列、氏名表示部分の文字列、住所表示部分の文字列など、複数の文字列を取得する。
CPU11は、変数「i」に「0」を代入して初期化し(ステップS3)、i番目の抽出文字列について、文字認識処理部33により第1文字認識処理を実行する(ステップS4)。この第1文字認識処理では、文字抽出処理部32により文字列から抽出した各文字について、マッチング用辞書データ24のうち第1認識用英数文字部24aと第1認識用カテゴリ文字部24bのみを用いて文字認識を実行する。
なお、文字抽出処理部32による文字抽出は、文字と文字の境界を抽出する処理に相当する。例えば、文字列画像について、文字部分が黒になるように2値化され、文字列に垂直方向に黒画素が射影され、その射影データの切れ目を文字と文字の境界の候補とする。
第1認識用英数文字部24aは、英数文字を中心にして構成されており、第1認識用カテゴリ文字部24bはカテゴリ判別に用いられる文字を中心に構成されているため、マッチング用辞書データ24の全文字数に比べて非常に量が少ない。このため、第1文字認識処理は、後に説明する第2文字認識処理よりも非常に高速に完了する。
CPU11は、認識信頼度判定処理部34により第1認識処理でのマッチング信頼度の判定を行う(ステップS5)。ここでマッチング信頼度の判定は、例えば文字単位のマッチング信頼度を確認し、マッチング信頼度の最も低い文字について、そのマッチング信頼度が再認識条件としての所定の閾値以上であれば文字列のマッチング信頼度をOKとし、そうでなければNGとすることができる。他にも、文字列内の各文字のマッチング信頼度の平均値を求め、この平均値が所定の再認識条件としての閾値以上であれば文字列のマッチング信頼度をOKとし、そうでなければNGとすることもできる。
なお、このマッチング信頼度の判定の際、各文字について、複数の文字候補をマッチング信頼度の高い順に所定個数記憶しておくとよい。
CPU11は、マッチング信頼度の判定がOKであれば(ステップS6:Yes)、ステップS8に処理を進める。
マッチング信頼度の判定がNGであれば(ステップS6:No)、CPU11は、i番目の抽出文字列について、文字認識処理部33により第2文字認識処理を実行する(ステップS7)。この第2文字認識処理では、マッチング用辞書データ24の全てのデータを用いて文字認識を実行する。
なお、第2認識用文字部24cのみによる文字認識を行い、第1文字認識処理でのマッチング信頼度も含めて最もマッチング信頼度が高い文字を認識した文字とする構成にしてもよい。
また、この第2文字認識処理では、文字列から文字を抽出する際に、結合文字を複数の部品文字と誤認識しないように、文字の境界候補を検討し、第1文字認識処理よりも1文字を精度良く切り出す構成にしてもよい。この場合、1文字の文字長を認識し、該文字長単位で境界を認識するとよい。この文字長は、文字列方向の1文字の長さを指し、例えば1文字における文字列方向の画素数とすることができる。これにより、文字の認識精度をさらに向上することができる。
CPU11は、変数「i」に1加算し(ステップS8)、「i」が抽出文字列数に達するまで(ステップS9:Yes)、ステップS4に処理を戻して繰り返す。
「i」が抽出文字列数に達すると(ステップS9:No)、CPU11は、変数「i」に「0」を代入して初期化し(ステップS10)、i番目の抽出文字列についてカテゴリ判別処理部35によりカテゴリ判別処理を実行する(ステップS11)。
このカテゴリ判別処理は、ステップS4,S7で認識した文字の並びが、カテゴリ判別用辞書データ25に記憶されている各カテゴリの文字の並びと一致するか判別することにより実行する。一致すれば(マッチング信頼度が所定の閾値より高ければ)、そのカテゴリであると判別する。
CPU11は、認識結果補正処理部36により認識結果補正処理を実行する(ステップS12)。この認識結果補正処理は、i番目の抽出文字列に、ステップS11で判別したカテゴリで使われない文字が含まれていないか判別し、含まれていれば補正する。
この補正を行う認識結果補正処理部36は、ステップS5にて記憶していた複数の文字候補のマッチング信頼度をもとに、そのカテゴリで使われる文字で最もマッチング信頼度の高い文字に補正する。そのカテゴリで使われる文字でマッチング信頼度の高い文字がなければ、そのカテゴリで使用される文字のみを対象にして再度文字認識処理を行い、認識した文字に補正する。
なお、この補正は、マッチング用辞書データ24のうちそのカテゴリの文字だけを使って再度文字認識処理を実行するなど、適宜の方法によって実行すればよい。
CPU11は、変数「i]に1加算し(ステップS13)、「i」が抽出文字列数に達するまで(ステップS14:Yes)、ステップS11に処理を戻して繰り返す。「i」が抽出文字列数に達すれば(ステップS14:No)、CPU11は、図5(B)に示す認識結果表示部7bを画面表示部7に表示して処理を終了する。
この文字認識処理により、図5に図示した例であれば、次のように処理される。
まず、文字列抽出処理(ステップS2)により、図5(B)に示すように、(1)〜(9)の各文字列が認識される。
この(1)〜(9)の各文字列に対して順番に第1文字認識処理(ステップS4)を実行することで、第1認識用英数文字部24aと第1認識用カテゴリ文字部24bで文字認識できるカテゴリの文字認識ができる。すなわち、(4)の郵便番号、(6)の電話番号、(7)のFAX、(8)のE−mail、および(9)のURLを認識できる。
このとき、第1認識用カテゴリ文字部24bには、結合文字を部品に分離した部品文字も登録しているため、図5(C)に示すように、結合文字「話」を「言」と「舌」に分離して文字を切り出していた場合でも、そのまま「言」と「舌」として認識する。
図5(B)の(1)(2)(3)(5)はマッチング信頼度が低くなるため、第2文字認識処理(ステップS7)を実行して全ての文字を使った文字認識を行う。これにより、図5(B)の(1)(2)(3)(5)についても文字認識ができる。
その後、カテゴリ判別処理(ステップS11)により、各文字列のカテゴリを判別することができる。このカテゴリ判別時に、「電話」のように結合文字が含まれるカテゴリは、「電言舌」のように結合文字を部品文字とした文字列もカテゴリ判別用辞書データ25に登録されているため、正しいカテゴリを精度よく容易に認識できる。
すなわち、仮に結合文字を正確に認識しようとすると、文字抽出の際に2文字としてしまわないために文字の境界候補を検討する処理が必要となって計算量が多くなる。しかし、このような処理をしなくても、2文字としてそのまま認識してカテゴリを判別するため、文字の境界が1通りに定まり、その分高速に処理できる。この境界処理の時間削減量は、結合文字を部品文字の集まりと認識するための比較対象の増加による時間増加量よりはるかに大きいため、全体の処理時間を短縮できる。
さらに、認識結果補正処理(ステップS12)により、判別したカテゴリの文字列に対して、そのカテゴリで使われない文字を排除した認識に補正するため、精度の良い文字認識ができる。
具体的には、例えば、図5(B)の(6)の「電話:(075)1234−5678」は、カテゴリが「TEL」の文字列である。これを、第1文字認識処理にて「電話:(075)1Z34−5678」と誤認識してしまった場合、「Z」はカテゴリ「TEL」では使用されることのない文字であるため、これについて補正処理を行い、カテゴリ「TEL」で使用される「2」に補正する。これにより認識精度を向上するとともに、ユーザが違和感を覚えるような認識結果の出力を抑えることができる。
以上の構成および動作により、画像データに対して手軽な操作で高速の文字認識を実現することができ、利用者の満足度を向上させることができる。
限定された文字での第1文字認識処理を実行した後に、マッチング信頼度が閾値より低い文字列のみ第2文字認識処理を実行するため、演算処理の負荷を軽減することができ、日本語や中国語といった文字数の多い言語であっても全体として高速に文字認識することができる。特に、貧弱なCPUであっても十分高速に文字認識することができる。
詳述すると、第1文字認識処理では、第1認識用英数文字部24aとして英語、数字、記号などの欧米系の文字のみ(約100文字)と、さらに少ない第1認識用カテゴリ文字部24bのみを用いるため、全文字での照合を行う場合よりも数倍以上高速に処理できる。
また、名刺の読取りにおいては、「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」を表す文字列は、おおよそ英語、数字、記号などの欧米系の文字で構成されている。そのうち特に「E−Mail」、「URL」は、「氏名」、「会社名」など他のものを表す文字列と比較して、長い文字列であることが多い。したがって、名刺中において、英語、数字、記号などの欧米系の文字が占める割合が大きいことが一般的である。この割合の大きい英語、数字、記号などの欧米系の文字のみを対象とした軽い第1文字認識処理を最初に実行することにより、それらの文字で構成される「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」を表す文字列を確定してしまうことができる。そして、それ以外の文字列についてのみ、日本語や中国語なども対象とした重い第2文字認識処理をすることで、結果、トータルとして名刺読取の処理速度を向上することができる。
また、第1文字認識処理で、第1認識用カテゴリ文字部24bにより、カテゴリを示すキーワードの文字も対象とするため、「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」を表す文字列を第1文字認識処理で確実に認識できる。
詳述すると、「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」等のカテゴリを示すキーワードとして、「メ」「ー」「ル」「ホ」「ム」「ペ」「ジ」のような欧米系以外の文字が名刺に含まれている場合がある。例えば、「メール:abc@****.co.jp」、「ホームページ:http://www.****.co.jp」などが該当する。
このため、仮に第1文字認識処理の際に第1認識用カテゴリ文字部24bの文字がないと、認識の際のマッチング信頼度が悪くなり、「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」を表す文字列を最初に確定できない場合が発生する。これに対し、第1認識用カテゴリ文字部24bを用いることで、この問題を解消できる。
また、文字の境界を検討する必要性を削減し、処理を高速にすることができる。詳述すると、偏(へん)と旁(つくり)からなる「話」などの結合文字については、正しく認識しようとすると、一般的にそれぞれの部品に分離した部品文字「言」「舌」の2文字として認識しないように境界を検討する処理が必要となる。しかし、英語、数字、記号などの欧米系の文字は、このような結合文字がないため、境界を検討する必要がない。にもかかわらず、「E−Mail」、「URL」、「TEL」、「FAX」、「郵便番号」といったカテゴリの文字を認識するために、まれに混ざることがある「電話」などの結合文字のために、全ての文字に対して境界検討の処理を実行すると処理時間が長くなる。
これに対し、第1文字認識処理では、結合文字を部品に分離した部品文字も登録しているため、文字の境界を検討する必要がなく、高速に処理することができる。
特に、結合文字が含まれるのは、例えば「電話」や「郵便番号」の表示など、カテゴリを示す表示部分に限られ、カテゴリの内容の情報(実際の電話番号や郵便番号など)には含まれていない。そして、このカテゴリの表示部分は、「電言舌」と認識しても、「電話」カテゴリであることさえ認識できれば良い。この特性を利用して、結合文字を分離した部品文字も登録して認識しているため、結合文字を部品文字として認識することによる弊害を生じさせることなく(例えば「電言舌」と認識しても文字「電言舌」を登録するわけでなない)、高速に処理することができる。
また、カテゴリを認識した文字列については、補正処理を実行できるため、認識精度を向上するとともに、ユーザが違和感を覚えるような認識結果の出力を抑えることができる。
また、文字列抽出処理部31によって文字列を抽出し、カテゴリ判別処理部35でカテゴリまで判別するため、利用者が文字認識領域を操作によって指定する手間や、指定した領域のカテゴリを選択操作する手間を削減でき、利便性を向上することができる。
なお、文字認識プログラム23は、インターネットなどの電気通信回線に接続されたサーバの記憶手段に記憶しておき、電気通信回線を通じてダウンロード可能とする、あるいは電気通信回線を通じてASP(Application Service Provider)のサービスとして利用可能にする構成とすることも可能である。この場合、通信負荷がかかるが、サーバの演算処理の負荷を軽減することができる。
この発明の構成と、上述の実施形態との対応において、
この発明の文字認識装置およびコンピュータは、実施形態の携帯端末1に対応し、
以下同様に、
画像データ取得手段は、画像入力部3に対応し、
文字認識手段は、CPU11に対応し、
記憶手段は、ROM12に対応し、
マッチングデータは、マッチング用辞書データ24に対応し、
第1認識用マッチングデータは、第1認識用英数文字部24aおよび第1認識用カテゴリ文字部24bに対応し、
第2認識用マッチングデータは、第1認識用英数文字部24a、第1認識用カテゴリ文字部24b、および第2認識用文字部24cに対応し、
カテゴリ判別用文字は、第1認識用カテゴリ文字部24bに対応し、
画像データ取得ステップは、ステップS1に対応し、
第1文字認識処理および第1文字認識ステップは、ステップS4に対応し、
再認識要否判別処理および再認識要否判別ステップは、ステップS5〜S6に対応し、
第2文字認識処理および第2文字認識ステップは、ステップS7に対応し、
カテゴリ判別処理は、ステップS11に対応し、
補正処理は、ステップS12に対応し、
第1認識用文字は、英語、数字、記号、カテゴリ用文字に対応し、
第2認識用文字は、全文字に対応するが、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
この発明は、文字を認識する装置に利用することができ、特に、名刺の読取り、葉書や封筒の宛名の読取りなど、ある程度記載項目(カテゴリ)が定まっている文字表示媒体から文字を認識する装置に利用することができる。
1…携帯端末、3…画像入力部、11…CPU、13…RAM、23…文字認識プログラム、24…マッチング用辞書データ、24a…第1認識用英数文字部、24b…第1認識用カテゴリ文字部、24c…第2認識用文字部

Claims (8)

  1. 文字認識用のマッチングデータを記憶する記憶手段と、
    画像データを取得する画像データ取得手段と、
    前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段とを備えた文字認識装置であって、
    前記マッチングデータは、
    予め定められた第1認識用文字についての第1認識用マッチングデータと、
    前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成され、
    前記文字認識手段は、
    前記第1認識用マッチングデータにより前記画像データについて文字認識を実行する第1文字認識処理と、
    該第1文字認識処理の結果が再認識条件に該当するか否か判別する再認識要否判別処理と、
    該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより文字認識を実行する第2文字認識処理とを実行する構成である
    文字認識装置。
  2. 前記文字認識手段は、前記画像データ内の文字群のカテゴリを判別するカテゴリ判別処理を実行する構成であり、
    前記第1認識用マッチングデータは、前記カテゴリ判別に用いられるカテゴリ判別用文字が含まれた構成である
    請求項1記載の文字認識装置。
  3. 前記第1認識用マッチングデータは、前記カテゴリ判別用文字のうち2以上の部品に分かれる結合文字については該結合を要素別に分離した部品文字が含まれた構成である
    請求項2記載の文字認識装置。
  4. 前記文字認識手段は、
    前記カテゴリ判別処理にてカテゴリが判別された文字群内に該カテゴリで使用されないはずの誤認文字が含まれているか否か判別し、含まれている場合に該誤認文字をカテゴリで使用される文字に補正する補正処理とを実行する構成とした
    請求項2または3記載の文字認識装置。
  5. 前記補正処理は、
    前記誤認文字が含まれている場合に、カテゴリで使用される文字のみを認識対象として再度文字認識を実行することにより補正する構成である
    請求項4記載の文字認識装置。
  6. 前記第1文字認識処理は、マッチング信頼度の高いものから複数の文字候補を求めておいて最もマッチング信頼度の高い文字を採用する構成であり、
    前記補正処理は、
    前記誤認文字が含まれている場合に、該誤認文字の文字候補のうち、該カテゴリに使用される文字の中で最もマッチング信頼度の高い文字に補正する構成である
    請求項4記載の文字認識装置。
  7. 予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、
    画像データ取得手段により画像データを取得する画像データ取得ステップと、
    前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、
    該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、
    該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとをコンピュータに実行させる
    文字認識プログラム。
  8. 予め定められた第1認識用文字についての第1認識用マッチングデータと、前記第1認識用文字以外の文字を含み該第1認識用文字よりも文字数が多い第2認識用文字についての第2認識用マッチングデータとを区別可能に構成されたマッチングデータを記憶手段に記憶しておき、
    画像データ取得手段により画像データを取得する画像データ取得ステップと、
    前記第1認識用マッチングデータにより前記画像データについて文字認識手段で文字認識を実行する第1文字認識ステップと、
    該第1文字認識処理の結果が再認識条件に該当するか否か前記文字認識手段で判別する再認識要否判別ステップと、
    該再認識要否判別処理により再認識を要すると判別した再認識対象に対して、前記第2認識用マッチングデータにより前記文字認識手段で文字認識を実行する第2文字認識ステップとを実行する
    文字認識方法。
JP2009061148A 2009-03-13 2009-03-13 文字認識装置、文字認識プログラム、および文字認識方法 Pending JP2010217996A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009061148A JP2010217996A (ja) 2009-03-13 2009-03-13 文字認識装置、文字認識プログラム、および文字認識方法
KR1020100010816A KR101078086B1 (ko) 2009-03-13 2010-02-05 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
CN201010123535A CN101833661A (zh) 2009-03-13 2010-03-02 字符识别装置、字符识别程序及字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009061148A JP2010217996A (ja) 2009-03-13 2009-03-13 文字認識装置、文字認識プログラム、および文字認識方法

Publications (1)

Publication Number Publication Date
JP2010217996A true JP2010217996A (ja) 2010-09-30

Family

ID=42717725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009061148A Pending JP2010217996A (ja) 2009-03-13 2009-03-13 文字認識装置、文字認識プログラム、および文字認識方法

Country Status (3)

Country Link
JP (1) JP2010217996A (ja)
KR (1) KR101078086B1 (ja)
CN (1) CN101833661A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5143291B2 (ja) * 2011-04-20 2013-02-13 株式会社東芝 画像処理装置、方法、および立体画像表示装置
JP2020160609A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 プログラム及び文字認識方法
KR20200128089A (ko) * 2018-02-28 2020-11-11 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템
US10885325B2 (en) 2017-02-10 2021-01-05 Canon Kabushiki Kaisha Information processing apparatus, control method, and storage medium

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6472218B2 (ja) * 2014-11-17 2019-02-20 株式会社日立情報通信エンジニアリング 文字認識システム及び文字認識方法
CN106372634A (zh) * 2015-07-21 2017-02-01 无锡天脉聚源传媒科技有限公司 一种繁体字的识别方法及装置
CN110135425B (zh) * 2018-02-09 2021-02-26 北京世纪好未来教育科技有限公司 样本标注方法及计算机存储介质
CN108564079B (zh) * 2018-05-08 2022-07-19 东华大学 一种便携式字符识别装置及方法
JP7338158B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2006092138A (ja) * 2004-09-22 2006-04-06 Oki Electric Ind Co Ltd 複数の認識辞書を利用した文字認識装置
JP2008040910A (ja) * 2006-08-08 2008-02-21 Sharp Corp 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (ja) 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd 名刺認識装置
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法
JP2001202475A (ja) 2000-01-19 2001-07-27 Sharp Corp 文字認識装置及び文字認識装置の制御方法
JP4704601B2 (ja) * 2000-11-01 2011-06-15 富士通株式会社 文字認識方法,プログラム及び記録媒体
JP2006065477A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 文字認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005182772A (ja) * 2003-11-28 2005-07-07 Sharp Corp 文字認識装置、プログラムおよび記録媒体
JP2006092138A (ja) * 2004-09-22 2006-04-06 Oki Electric Ind Co Ltd 複数の認識辞書を利用した文字認識装置
JP2008040910A (ja) * 2006-08-08 2008-02-21 Sharp Corp 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5143291B2 (ja) * 2011-04-20 2013-02-13 株式会社東芝 画像処理装置、方法、および立体画像表示装置
US10885325B2 (en) 2017-02-10 2021-01-05 Canon Kabushiki Kaisha Information processing apparatus, control method, and storage medium
KR20200128089A (ko) * 2018-02-28 2020-11-11 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템
JP2021502628A (ja) * 2018-02-28 2021-01-28 キヤノン オイローパ エヌ.ヴェー. 画像処理方法及び画像処理システム
US11170265B2 (en) 2018-02-28 2021-11-09 I.R.I.S. Image processing method and an image processing system
JP7038988B2 (ja) 2018-02-28 2022-03-22 キヤノン オイローパ エヌ.ヴェー. 画像処理方法及び画像処理システム
KR102504635B1 (ko) * 2018-02-28 2023-02-27 캐논 유로파 엔.브이. 영상 처리 방법 및 영상 처리 시스템
JP2020160609A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 プログラム及び文字認識方法
JP7274322B2 (ja) 2019-03-25 2023-05-16 東芝テック株式会社 プログラム及び文字認識方法

Also Published As

Publication number Publication date
KR20100103351A (ko) 2010-09-27
KR101078086B1 (ko) 2011-10-28
CN101833661A (zh) 2010-09-15

Similar Documents

Publication Publication Date Title
JP2010217996A (ja) 文字認識装置、文字認識プログラム、および文字認識方法
US10073859B2 (en) System and methods for creation and use of a mixed media environment
JP4995554B2 (ja) 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
US8600989B2 (en) Method and system for image matching in a mixed media environment
US9357098B2 (en) System and methods for use of voice mail and email in a mixed media environment
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US9405751B2 (en) Database for mixed media document system
US9171202B2 (en) Data organization and access for mixed media document system
US7885955B2 (en) Shared document annotation
US8949287B2 (en) Embedding hot spots in imaged documents
US8335789B2 (en) Method and system for document fingerprint matching in a mixed media environment
US8838591B2 (en) Embedding hot spots in electronic documents
US8195659B2 (en) Integration and use of mixed media documents
EP1917636B1 (en) Method and system for image matching in a mixed media environment
US9772989B2 (en) Template management apparatus, non-transitory computer readable medium, and template management method
KR102373884B1 (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
US20170099403A1 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
US8773733B2 (en) Image capture device for extracting textual information
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
US8908970B2 (en) Textual information extraction method using multiple images
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP4116852B2 (ja) 抽出文字列辞書検索装置及び方法並びにプログラム
JP2010218043A (ja) 文字情報取得装置、文字情報取得プログラム、および文字情報取得方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131126