JP2002298101A - キャラクタ情報認識方法およびキャラクタ情報認識装置 - Google Patents

キャラクタ情報認識方法およびキャラクタ情報認識装置

Info

Publication number
JP2002298101A
JP2002298101A JP2001104449A JP2001104449A JP2002298101A JP 2002298101 A JP2002298101 A JP 2002298101A JP 2001104449 A JP2001104449 A JP 2001104449A JP 2001104449 A JP2001104449 A JP 2001104449A JP 2002298101 A JP2002298101 A JP 2002298101A
Authority
JP
Japan
Prior art keywords
character
information
dot information
code
dot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001104449A
Other languages
English (en)
Inventor
Nariaki Tagami
就章 田上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001104449A priority Critical patent/JP2002298101A/ja
Publication of JP2002298101A publication Critical patent/JP2002298101A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】文字認識率を改善する。 【解決手段】文字、記号、数字などのキャラクタ14の
一部に、このキャラクタを表すキャラクタコードに対応
したドット情報14aが埋め込まれ、このドット情報を
読み取ることでキャラクタを認識する。ドット情報が埋
め込まれたキャラクタを読み取るスキャナと、ドット情
報に対応するキャラクタコード情報がストアされたメモ
リ手段と、ドット情報からキャラクタコードを認識する
キャラクタコード認識手段とを有する。キャラクタのキ
ャラクタコードがドット情報に変換され、これがキャラ
クタの一部に埋め込まれる。このドット情報を読み取
り、キャラクタコードに変換してモニタに表示したり、
プリントアウトする。ドット情報の認識であるので、文
字認識手段(OCR)を使用する場合よりも認識の誤り
率が少なく、文字認識率が大幅に改善される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字などのキャ
ラクタ認識に優れたキャラクタ情報認識方法およびキャ
ラクタ情報認識装置に関する。詳しくは、文字フォント
の一部に、その文字のキャラクタコードや、文字列に関
連した情報をドット情報として付加することで、文字認
識率の改善を図ると共に、付加情報によってはその他の
情報処理検索をも可能にしたものである。
【0002】
【従来の技術】印刷物などに印刷された情報のうち、特
定な情報を読み取り、読み取った情報をモニタなどに表
示する手法としては、二次元のバーコードを使用し、こ
の二次元バーコードを読み取る場合と、光学的文字認識
(OCR)に適したフォントの文字を使用し、このフォ
ント文字を読み取る場合とが考えられる。
【0003】前者の二次元バーコードを使用する場合
は、広告紙面などに印刷された情報を検索するような情
報検索装置に使用される場合がある。これは、図9に示
すように一般的に紙面2の特定位置に印刷されたこの二
次元バーコード3をスキャナ6で読み取り、読み取った
バーコードをパーソナルコンピュータ(パソコン)8な
どに入力してその内容を解析することで、パソコン8に
付随するモニタ8aなどに表示すると共に、インターネ
ット9などにアクセスするシステムである。
【0004】二次元バーコード3の内容としては、広告
紙面の提供スポンサーのインターネット上のURLであ
ったり、特定のアプリケーションソフトを立ち上げるた
めの起動命令などである。
【0005】後者のようにOCRによる文字認識の場合
には、通常の場合にはOCRに適したフォント文字を使
用して印刷されるもので、専用の文字認識ソフトがパソ
コン8に内蔵され、スキャナで読み取られた文字群情報
を解析してキャラクタコードに変化してから、その文字
をモニタなどに表示するようにしている。
【0006】
【発明が解決しようとする課題】ところで、上述した二
次元のバーコードを使用する情報検索システムなどで
は、任意の情報をバーコードに変換して提供できるか
ら、紙面に印刷された内容を解読してこれをモニタに表
示したり、プリントアウトしたりする作業のみならず、
新聞記事、広告などのようにその印刷物の内容と関連す
る情報、例えばインターネットで使用するURLアドレ
スなどの情報をバーコードとして記録しておくことがで
きるので、WWWサーバなどネットワークに接続された
関連ホームページ(Webサイト)への自動接続や、そ
の記事に関連したアプリケーションソフト(例えばその
パソコンが保有するソフト)などを自動的に起動するこ
とができるようになるので、便利である。
【0007】しかし、そのためには図9のように紙面2
の一部を割いて上述した二次元のバーコード3を印刷し
なければならないので、バーコードという特殊な印刷を
行うためのスペースが必要であったり、また印刷された
このバーコード3をスキャナ6で走査することを勧め
る、つまり読み取り走査を行うための説明文などを記載
しなければならないので、使用方法が分かりにくく、使
いにくいものとなっている。
【0008】また、OCRを使用する場合には、その紙
面に掲載された記事内容の全てをモニタに表示したり、
プリントアウトすることができる利便性があるものの、
周知のようにスキャナ6で読み取られた文字(数字、記
号などを含む)の文字認識率が未だ十分でないので、モ
ニタ8aに表示された内容が実際の記事の内容と一致し
ているかどうかを、1文字づつ検証しなければならな
い。誤っているときには、その修正が必要になる。
【0009】さらに、文字の輪郭抽出するための読み取
りソフトが複雑であったり、さらにはスキャンして得ら
れる情報は、文字のみの情報であるから、その記事内容
に関連した情報検索の自動化、例えば上述したURLア
ドレスを使用して関連ホームページに自動的にアクセス
する処理を実行することはできない。
【0010】そこで、この発明はこのような従来の課題
を解決したものであって、特に文字、記号、数字などの
キャラクタの一部若しくはこの文字フォントに関連した
位置に、文字や、複数の文字で構成される文字列に関連
した情報を、ドット情報として埋め込んだり、付加する
ことによって、使い勝手がよく、しかもその文字の認識
率を高められるキャラクタ情報認識方法およびキャラク
タ情報認識装置を提案するものである。
【0011】
【課題を解決するための手段】上述の課題を解決するた
め、請求項1に記載したこの発明に係るキャラクタ情報
認識方法では、文字、記号、数字などのキャラクタの一
部に、このキャラクタを表すキャラクタコードに対応し
たドット情報が埋め込まれ、このドット情報を読み取る
ことで上記キャラクタを認識するようにしたことを特徴
とする。
【0012】また、請求項5に記載したこの発明に係る
キャラクタ情報認識装置では、文字、記号、数字などの
キャラクタの一部に、このキャラクタコードに対応した
ドット情報が埋め込まれたキャラクタを読み取るスキャ
ナと、上記ドット情報に対応する上記キャラクタコード
情報がストアされたメモリ手段と、上記ドット情報から
上記キャラクタコードを認識するキャラクタコード認識
手段と、認識したキャラクタコードを表示するモニタと
を有することを特徴とする。
【0013】この発明では、キャラクタの一部にキャラ
クタコードを変換したドット情報を埋め込む。もしくは
キャラクタにこのドット情報を付加する。キャラクタコ
ードの他に、複数のキャラクタで構成されたキャラクタ
列に関連した情報をその情報全体のキャラクタコードを
ドット情報に変換すると共に、変換したドット情報をア
ンダーラインなどの付加情報として二次元表示する。
【0014】これらドット情報をスキャナで読み取るこ
とでキャラクタを表示したり、プリントアウトする。二
次元バーコードに比べ、キャラクタの一部としてあるい
はキャラクタに付随する情報として印刷できるから、専
用のスペースが不要になる。文字認識(OCR)に比
べ、ドット情報を認識してキャラクタコードに変換する
のでその認識率が改善される。
【0015】
【発明の実施の形態】続いて、この発明に係るキャラク
タ情報認識装置およびその認識方法について、図面を参
照してその実施の形態を説明する。この発明では、文
字、数字、記号などのキャラクタのコード(キャラクタ
コード)をドット情報に変換した上で、キャラクタの一
部に埋め込んだキャラクタをキャラクタ認識用のキャラ
クタとして使用する。あるいはまた、複数のキャラクタ
で構成されたキャラクタ列に関連した情報のキャラクタ
コードをドット情報に変換した上で、このキャラクタ列
に付属する情報として、この特定のキャラクタ列と一緒
に付加して使用することを特徴とするものである。この
新しいキャラクタやキャラクタ列は、広告紙面などを作
成するときに使用すればユーザフレンドリーな広告紙面
を提供できる。
【0016】したがって例えば図3のようにこの発明を
情報検索装置に適用する場合には、紙面2に印刷された
特定のキャラクタや、キャラクタ列4そのものをスキャ
ナ6で読み取ることでキャラクタに埋め込まれたドット
情報や、キャラクタ列に付属したドット情報も同時に読
み込まれる。
【0017】そのドット情報を解析した結果、キャラク
タそのものであるときには、その内容がモニタ8aに表
示される。そしてドット情報が特定の情報集団であると
きには、例えば提供スポンサーのURLであるときには
インターネット9に接続された関連ホームページへの自
動アクセス処理が行われることになる。
【0018】続いて、このような処理を実現するドット
情報を埋め込んだキャラクタについて次に説明する。図
4はこの発明の実施の形態を示すキャラクタの説明図で
あって、例えば「HARD DISK RECORDE
R」の一部を構成する文字列例えば「HARD DIS
K」というそれぞれのキャラクタ(文字)14には、そ
れぞれ対応するドット情報14a、14b、・・・が埋
め込まれている。つまりその文字の文字コードであるキ
ャラクタコードに対応するドット情報が、そのキャラク
タ14の一部として二次元的に埋め込まれている。
【0019】図5はそのうち「H」のキャラクタ14に
埋め込まれたドット情報14aの一例を示す。この例で
は、「H」の左下端部に、「H」を表すキャラクタコー
ドをドット情報14aに変換した上で、二次元に配列し
た状態で文字「H」の一部として埋め込まれている。
【0020】その他のキャラクタについても「H」と同
じように、そのキャラクタを示すキャラクタコードがド
ット情報に変換された上で、二次元のドット情報14
b、14c、14d、・・・が、そのキャラクタ
「A」、「R」、「D」、・・・の一部として埋め込ま
れている。
【0021】例えば、図4のように「A」の場合には左
側の斜め線の下端部に「A」のキャラクタコードに対応
するドット情報14bが二次元に展開した状態で、この
キャラクタ「A」の一部として埋め込まれ、「R」の場
合には左側の直線の下端部に対応するドット情報14c
が、「D」の場合には左側の直線の下端部に対応するド
ット情報14dが埋め込まれている。
【0022】キャラクタコードをドット情報に変換する
テーブルは予め決められたルールにしたがって作成され
ており、したがって文字(漢字、ひらがな、カタカ
ナ)、数字、英文字などのキャラクタのうち、代表的な
キャラクタと、そのキャラクタのドット情報に関するテ
ーブルが一体化された状態で、予め例えば広告用キャラ
クタとして通常のキャラクタとは別に用意されている。
【0023】キャラクタは文字認識装置(OCR)に適
したフォントを使用することもできれば、その他の字体
で構成された別のフォントを使用することもできる。こ
の実施の形態では、文字認識に適したフォントを使用し
た場合である。
【0024】そして例えば広告紙面を作成するときに
は、使用するキャラクタの種類としてこの広告用キャラ
クタを選択することで、例えば[H」のキャラクタを選
択すると、図4に示すドット情報入りキャラクタが選択
され、これがモニタ8aに表示されると共に、プリント
アウトすると、このドット情報入りキャラクタそのもの
が印刷されて出力される。
【0025】上述した実施の形態では、キャラクタの一
部にドット情報を埋め込んだ場合であるが、キャラクタ
自身の一部ではないが、キャラクタの一部と見なせる箇
所に上述したドット情報を線分化して、しかもキャラク
タの付属情報としてこのキャラクタに付加することもで
きる。その実施の形態を図6に示す。
【0026】図6の場合にはキャラクタ14の下側にア
ンダーラインとしてそのキャラクタコードを変換したド
ット情報16a、16b、16c、・・・を二次元情報
として付加した場合である。したがって、図6のように
複数のキャラクタ14を表示した場合、それぞれのキャ
ラクタ14を表すドット情報16a、16b、16c、
・・・がそのキャラクタ14の付属情報(アンダーライ
ン)として、これらキャラクタ14と一体的に表示され
る。
【0027】例えば「HARD DISK」なるキャラ
クタ列があったときその下線部であるアンダーライン1
6は、それらのキャラクタ列をドット情報に変換してさ
らに二次元に配列されたものとして構成される。図7に
はキャラクタとドット情報との関係が示されている。例
示するキャラクタは「H」であり、この場合には「H」
のキャラクタコードをドット情報に変換して、さらにこ
れが「H」の幅と同じ位になるように二次元的に配され
てキャラクタの下線部(アンダーライン)となされる。
【0028】このアンダーライン情報の元となるドット
情報はキャラクタが選択されると、このキャラクタの属
性情報として同時に表示される。このアンダーライン情
報は特定のキャラクタのみに適用することができる。そ
の場合には、広告紙面などのように特に頻繁に使用され
るキャラクタに対してその属性情報として記憶しておく
ことになる。
【0029】この実施の形態の場合においても、このキ
ャラクタ列とそれらの属性情報を同時にスキャナ6で読
み取るか、若しくは属性情報のみこのスキャナ6で読み
取る。属性情報からドット情報が解読され、その解読さ
れたドット情報からキャラクタコードに変換される。変
換されたキャラクタコードからキャラクタ自体がモニタ
8aなどに表示される。もちろんキャラクタ情報を解読
すると共に、このアンダーライン付きキャラクタ自身を
画面に表示することができる。
【0030】このようにアンダーライン付きのキャラク
タは特にキャラクタフォントが小さい場合に適用して好
適である。それは、フォント自体が小さいときには図4
の場合、紙面の汚れなどもドット情報として読み取って
しまう可能性が高く、それだけ文字認識率が低下するお
それがあるからである。
【0031】上述した実施の形態は何れもキャラクタ自
体のキャラクタコードをドット情報に変換したものをキ
ャラクタの一部に埋め込んだり、キャラクタの一部と見
なせる箇所に、そのキャラクタの属性情報として付加し
た例である。
【0032】次に説明する実施の形態では、複数のキャ
ラクタで構成された特定のキャラクタ列に関連した情報
のキャラクタコードをドット情報に変換し、この変換し
たドット情報を二次元情報に配列した場合である。
【0033】ここで、キャラクタ列に関連した情報と
は、そのキャラクタ列が例えば提供スポンサー名である
ときに、その提供スポンサーの電話番号であったり、提
供スポンサーのホームページにアクセスするためのUR
Lアドレスなどの関連情報を言う。
【0034】図8はその一例を示すもので、この例では
特定のメーカ名のURL(例えば)を表すキャラクタコ
ード列18がドット情報19に変換され、変換されたド
ット情報18が二次元情報としてそのキャラクタ列18
のアンダーラインとして付加され、そして表示された場
合である。
【0035】キャラクタ列18に関連した情報としては
上述したようなURLに限らず、特定のアプリケーショ
ンを立ち上げるための起動命令であったり、その他予め
設定された関連情報であれば特にその内容には制限され
ない。
【0036】このような特定のキャラクタ列は予めメモ
リ手段(後述するフォントデータ蓄積用メモリ手段な
ど)に複数用意され、それらのキャラクタ列が選択され
たときには、それらのキャラクタ列を表示すると同時
に、このキャラクタ列に付属する関連ドット情報がその
キャラクタ列のアンダーライン情報として表示されるよ
うになっている。ユーザが入力した任意のキャラクタ列
に対応させて、ユーザが指定する任意の関連情報をドッ
ト情報に変換してこれをキャラクタ列の関連ドット情報
としてアンダーライン表示するようにすることもでき
る。
【0037】さて、上述したようなキャラクタに対応し
たドット情報をこのキャラクタの一部、またはキャラク
タの属性情報として設けたキャラクタから目的のドット
情報を読み込んで、そのキャラクタを表示したり、関連
情報を解析してホームページなどを自動的に立ち上げた
りするためのこの発明に係るキャラクタ情報認識装置2
0の実施の形態を図1を参照して説明する。
【0038】この実施の形態はキャラクタに対応したド
ット情報はもちろんのこと、キャラクタに関連する情報
をも解読できるようにしたキャラクタ情報認識装置20
を説明する。
【0039】図1はその実施の形態であって、その装置
本体20はマイクロコンピュータよりなる制御装置とし
て構成されている。したがって装置本体20はCPU2
2を有する他、キャラクタに関するドット情報を解析し
て該当するキャラクタコードから該当するキャラクタを
表示したり、キャラクタのフォントからそのキャラクタ
コードを検索したりする制御プログラムが内蔵されたメ
モリ手段(ROMなど)24や、ドット情報からキャラ
クタコードに変換するためのコード解析用ワーキングメ
モリとして機能したり、解析情報の一部を一時的に保存
したりするためのメモリ手段(RAMなど)26が設け
られている。
【0040】この他に、通常の文字を表示するフォント
データや、この発明に係る文字認識に使用するドット情
報付きフォントデータ、さらには関連ドット情報付きキ
ャラクタ列用フォントデータを蓄積するためのメモリ手
段(RAMなど)28や、インターネットに接続された
ホームページにアクセスするためのWWWブラウザ30
などが設けられている。
【0041】さらに、この発明では外部機器との接続を
行うための各種インタフェースが設けられている。ま
ず、例えば広告紙面2の情報を読み取るスキャナ6が設
けられ、これがインタフェース36によって装置本体2
0と接続される。同様に、外部入力手段であるキーボー
ド38やマウス40などがインタフェース42を介して
CPU22と接続されている。
【0042】また、モニタ44(若しくは8a)やプリ
ンタ46がそれぞれインタフェース48,50を介して
CPU22に接続されており、さらにインタフェース5
2を介してインターネットなどとの接続を行う外部回線
に接続されている。
【0043】このように構成されたキャラクタ情報認識
装置20の動作を次に説明する。説明の都合上、キャラ
クタの一部にドット情報が埋め込まれた一体型のキャラ
クタを読み取ったときを例示する。
【0044】この場合には広告紙面2からキャラクタ情
報がスキャナ6によって読み取られる。この読み取られ
た情報のうち、キャラクタそのものは蓄積されたフォン
トデータを参照した文字認識処理(OCR処理)が行わ
れて、最適なキャラクタが検索されたのちキャラクタコ
ードに変換される。そしてこのキャラクタコードが一時
的に保存される。
【0045】これと同時に、キャラクタの一部に埋め込
まれた二次元ドット情報の解析が行われ、このドット情
報の組み合わせから該当するキャラクタコードが検索さ
れる。検索終了したキャラクタコードが保存される。
【0046】次に、OCR用キャラクタコードとドット
情報用キャラクタコードとの照合処理が行われ、両者が
一致したときには何れかのキャラクタコードを用いてこ
のキャラクタコードに対応するキャラクタがモニタ44
上に表示される。
【0047】両者が一致しないときには、ドット情報用
キャラクタコードが優先され、そのキャラクタコードに
対応するキャラクタがモニタ44上に表示される。ドッ
ト情報用キャラクタコードを優先するのは、上述したよ
うにドット情報を利用した場合の方が文字認識率が高い
からである。
【0048】OCR機能を有しないときには、スキャナ
6で読み込みまれた情報のうちドット情報のみが選択さ
れてこのドット情報を利用して上述したと同じような変
換処理が行われて、該当するキャラクタがモニタ44上
に表示されることになる。
【0049】このように通常のスキャナの操作と全く同
じ操作をすることで、目的のキャラクタ情報をモニタ4
4などに映し出したり、プリンタ46によってそのキャ
ラクタをプリントアウトすることができる。
【0050】その場合、OCR処理してキャラクタを認
識する場合よりも、ドット情報を解析してキャラクタコ
ードを認識する場合の方が文字認識率が高いので、文字
読み取りの誤り率を従来よりも大幅に軽減できる。もち
ろん、二次元バーコードのように特定のスペースを利用
する必要もないので、特にバーコード用のスペースを確
保する必要がなくなるから、この発明を広告紙面などに
応用する場合には紙面でのレイアウト、配置などの自由
度が増えるなどの特徴がある。また、特定のキャラクタ
からなるキャラクタ列をスキャンするだけであるので、
バーコードをスキャンするなどと言った注意書きが不要
になり、紙面の利用効率が改善される。
【0051】続いて、キャラクタ列に関連したドット情
報を読み取る場合について次に説明する。この場合にお
いてもスキャナ6によって紙面の情報を読み取る。その
ときある特定のキャラクタ列がOCR機能を利用してキ
ャラクタコードに変換されると共に、これがモニタ44
上に表示される。
【0052】さらにキャラクタ列に対応したドット情報
が印刷されているときには、このドット情報がキャラク
タ列を読み取ると同時に読み取られ、その二次元ドット
情報からキャラクタコード列が解析される。解析された
キャラクタコード列が例えば、そのキャラクタ列で構成
されるメーカのURLであると判断したときには、WW
Wブラウザ30を起動すると共に、該当するメーカのホ
ームページへのアクセス処理が自動的に行われる。
【0053】これによって、ユーザは広告紙面の該当す
るキャラクタ列をスキャンするだけで、該当するホーム
ページを開くことができ、非常に便利である。URLの
アドレス情報を間違いなく入力するには相当の注意を払
う必要があると共に、時には入力ミスを起こし、何度か
入力し直すことはしばしば経験するところである。
【0054】しかし、この発明のようにキャラクタ列を
スキャンするだけでホームページに自動的にアクセスす
るようにすれば、このような事態を招来することなく、
直ちに目的のホームページを開くことができる。
【0055】このキャラクタ列に関連したドット情報
が、他のアプリケーションを立ち上げるための起動命令
などのときには、上述したと同じように目的のアプリケ
ーションを自動的に起動できるなど、高い利便性を発揮
する。
【0056】図2はこの発明の他の実施の形態であっ
て、この場合にはスキャナ6の代わりか、若しくはスキ
ャナ6と併設してビデオカメラ(スチルカメラ)60に
よってキャラクタやキャラクタ列に関連したドット情報
を読み取るようにした場合である。このカメラ60より
得られたドット情報を解析して上述したようにキャラク
タの表示、プリントアウト、ホームページへの自動アク
セスなどを行うことができる。
【0057】
【発明の効果】以上説明したようにこの発明に係るキャ
ラクタ情報認識方法では、文字、記号、数字などのキャ
ラクタの一部に、このキャラクタを表すキャラクタコー
ドに対応したドット情報が埋め込まれ、このドット情報
を読み取ることでキャラクタを認識するようにしたこと
を特徴とする。
【0058】またこの発明に係るキャラクタ情報認識装
置では、文字、記号、数字などのキャラクタの一部に、
このキャラクタコードに対応したドット情報が埋め込ま
れたキャラクタを読み取るスキャナと、ドット情報に対
応するキャラクタコード情報がストアされたメモリ手段
と、ドット情報からキャラクタコードを認識するキャラ
クタコード認識手段と、認識したキャラクタコードを表
示するモニタとを有することを特徴とする。
【0059】これによれば、ドット情報を読み取ってキ
ャラクタコードに変換するようにしたので、従来のよう
な文字認識手段(OCR)を使用する場合よりも認識の
誤り率が少なくなって、従来よりも文字認識率が大幅に
改善される。従来では二次元のバーコードを特別に印刷
しなければならないが、この発明では特定のキャラクタ
を認識するために、そのキャラクタの一部に認識情報を
持たせると共に、キャラクタを印刷すると同時にその認
識情報も印刷されるようにしてあるため、専用の印刷場
所を設定するような煩わしさがない。そのため、広告紙
面にキャラクタを印刷する場合にもレイアウトの自由度
を十分に確保できる。
【0060】さらに、複数のキャラクタで構成された特
定のキャラクタ列に対して、このキャラクタ列に関連し
た情報のドット情報を付属させるときには、そのドット
情報を解析した結果を自動処理に連動させることができ
るようになる。例えばホームページを自動アクセスした
り、特定のアプリケーションを自動的に立ち上げること
ができるから、ホームページにアクセスするためのUR
Lの入力ミスなどが解消され、非常に便利であるなどの
特徴を有する。
【図面の簡単な説明】
【図1】この発明に係るキャラクタ情報認識装置の実施
の形態を示す要部の系統図である。
【図2】この発明に係るキャラクタ情報認識装置の他の
実施の形態を示す要部の系統図である。
【図3】この発明を情報検索システムに適用したときの
系統図である。
【図4】ドット情報をキャラクタの一部に埋め込むとき
の実施の形態を示す説明図である。
【図5】その拡大図である。
【図6】ドット情報をキャラクタの一部に付属させると
きの実施の形態を示す説明図である。
【図7】その拡大図である。
【図8】ドット情報をキャラクタ列に付属させるときの
実施の形態を示す説明図である。
【図9】従来の情報検索システムの系統図である。
【符号の説明】
6・・・スキャナ、20・・・キャラクタ情報認識装
置、22・・・CPU、26・・・キャラクタコード解
析手段、28・・・フォントデータ蓄積手段、30・・
・・WWWブラウザ
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 AA03 BB02 BB15 5B035 BB08 5B064 AA01 AB10 BA01 5B072 BB00 CC21

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字、記号、数字などのキャラクタの一
    部に、このキャラクタを表すキャラクタコードに対応し
    たドット情報が埋め込まれ、 このドット情報を読み取ることで上記キャラクタを認識
    するようにしたことを特徴とするキャラクタ情報認識方
    法。
  2. 【請求項2】 上記キャラクタコードに対応するドット
    情報を上記キャラクタの付属情報として上記キャラクタ
    に付加することを特徴とする請求項1記載のキャラクタ
    情報認識方法。
  3. 【請求項3】 文字、記号、数字などで構成された複数
    のキャラクタ情報をキャラクタ列とし、 このキャラクタ列に関連した情報のキャラクタコードに
    対応するドット情報を、上記キャラクタ列の一部として
    付加すると共に、 このドット情報を読み取ることによって上記キャラクタ
    列に関連した情報を認識するようにしたことを特徴とす
    る請求項1記載のキャラクタ情報認識方法。
  4. 【請求項4】 上記キャラクタ列に関連した情報は、提
    供スポンサーの電話番号、インターネットのホームペー
    ジをアクセスするアドレス情報などであることを特徴と
    する請求項3記載のキャラクタ情報認識方法。
  5. 【請求項5】 文字、記号、数字などのキャラクタに関
    するキャラクタコードをその一部に埋め込まれたキャラ
    クタを読み取るスキャナと、 上記ドット情報に対応する上記キャラクタコード情報が
    ストアされたメモリ手段と、 上記ドット情報から上記キャラクタコードを認識するキ
    ャラクタコード認識手段と、 認識したキャラクタコードを表示するモニタとを有する
    ことを特徴とするキャラクタ情報認識装置。
  6. 【請求項6】 文字、記号、数字などで構成された複数
    のキャラクタをキャラクタ列としたとき、このキャラク
    タコード列に関連した情報の変換ドット情報を、上記キ
    ャラクタ列に付加して表示したドット情報付きキャラク
    タ列を読み取ることによって、上記キャラクタ列に関連
    した情報を認識するようにしたことを特徴とする請求項
    5記載のキャラクタ情報認識装置。
JP2001104449A 2001-04-03 2001-04-03 キャラクタ情報認識方法およびキャラクタ情報認識装置 Pending JP2002298101A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001104449A JP2002298101A (ja) 2001-04-03 2001-04-03 キャラクタ情報認識方法およびキャラクタ情報認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001104449A JP2002298101A (ja) 2001-04-03 2001-04-03 キャラクタ情報認識方法およびキャラクタ情報認識装置

Publications (1)

Publication Number Publication Date
JP2002298101A true JP2002298101A (ja) 2002-10-11

Family

ID=18957305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001104449A Pending JP2002298101A (ja) 2001-04-03 2001-04-03 キャラクタ情報認識方法およびキャラクタ情報認識装置

Country Status (1)

Country Link
JP (1) JP2002298101A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141233A (ja) * 2005-11-15 2007-06-07 Xerox Corp 改良された光学文字認識
JP2009525524A (ja) * 2006-02-02 2009-07-09 ホーホシューレ・ダルムシュタット・ユニバーシティー・オブ・アプライド・サイエンシズ 情報をデコードする方法
JP2014182663A (ja) * 2013-03-19 2014-09-29 Fujitsu Ltd 情報処理プログラム、情報処理方法および情報処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141233A (ja) * 2005-11-15 2007-06-07 Xerox Corp 改良された光学文字認識
JP2009525524A (ja) * 2006-02-02 2009-07-09 ホーホシューレ・ダルムシュタット・ユニバーシティー・オブ・アプライド・サイエンシズ 情報をデコードする方法
JP2014182663A (ja) * 2013-03-19 2014-09-29 Fujitsu Ltd 情報処理プログラム、情報処理方法および情報処理装置

Similar Documents

Publication Publication Date Title
JP4509366B2 (ja) 文書上の情報をスキャンしてフォーマット化するシステム
US7081975B2 (en) Information input device
US6697056B1 (en) Method and system for form recognition
US6546385B1 (en) Method and apparatus for indexing and searching content in hardcopy documents
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
US20040268243A1 (en) Document processing apparatus and document processing method
GB2305525A (en) Paper hypertext system
US7536649B2 (en) Apparatus, system, and server capable of effectively specifying information in document
JPH03161891A (ja) 表形式文書読取装置
US20100082937A1 (en) Data generating device, scanner and computer program
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
CN101796509A (zh) 准备显示文档用于分析的设备
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2005182460A (ja) 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JPH1145289A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2002298101A (ja) キャラクタ情報認識方法およびキャラクタ情報認識装置
US20010034744A1 (en) Data input form generation system, data input form generation method, and computer-readable recording medium
JP2006252164A (ja) 中国語文書処理装置
JP4278134B2 (ja) 情報検索装置及びプログラム並びに記録媒体
JP3122417B2 (ja) 情報表示方法及び情報処理装置
JP2006171851A (ja) 文書ファイル解析システム、文書ファイル解析方法及びプログラム
JP4809024B2 (ja) 帳票読取装置、プログラム及び帳票読取システム
US20090031203A1 (en) Hyperlinks
JP4294386B2 (ja) 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体
JPH10240763A (ja) 文書情報管理システム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060529