JPH0546814A - 文字読み取り装置 - Google Patents

文字読み取り装置

Info

Publication number
JPH0546814A
JPH0546814A JP3207675A JP20767591A JPH0546814A JP H0546814 A JPH0546814 A JP H0546814A JP 3207675 A JP3207675 A JP 3207675A JP 20767591 A JP20767591 A JP 20767591A JP H0546814 A JPH0546814 A JP H0546814A
Authority
JP
Japan
Prior art keywords
character
character string
dictionary
recognition
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3207675A
Other languages
English (en)
Inventor
Yuusuke Takamune
雄輔 高棟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3207675A priority Critical patent/JPH0546814A/ja
Publication of JPH0546814A publication Critical patent/JPH0546814A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】文字列を読み込む文字読み取り部1と、読み込
んだ文字列を電子計算機に定められた文字コードに変換
する文字認識部21と、文字コードに変換した文字列を
単語および文節単位に分割する文節認識部22と、文字
列を格納している辞書部3と、単語および文節単位に分
割された文字列が辞書部内に格納された文字列と同一の
ものがあるかを検索する辞書検索部23とを備える。検
索した結果、認識された文字列が辞書部に存在する場合
は、認識が正しいとして文字認識を終了し、認識された
文字列が辞書部に存在しない場合は、再度前記文字認識
部が輪郭の近い他の文字列に置換して認識した文字列が
辞書部にある文字列と一致するまで繰り返す。 【効果】認識した文字列の正誤性を判断し、誤って認識
された文字列を修正する機能を有することにより、効率
よく且つ正確に文字認識ができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字読み取り装置に関
し、特に効率良くかつ正確に文字を読み取り認識を行う
文字読み取り装置に関する。
【0002】
【従来の技術】従来の文字読み取り装置は、読み取った
文字1文字つづ認識し、認識困難な文字は誤って認識す
るか認識出来ないかであった。
【0003】
【発明が解決しようとする課題】上述した従来の文字読
み取り装置にて読み取った文字は、誤認識されたものお
よび認識されないものがあり、認識結果について人間が
直接確認し修正しなければならなかった。
【0004】
【課題を解決するための手段】本発明の文字読み取り装
置は、文字認識を必要とする文字列を読み込む文字読み
取り部と、読み込んだ前記文字列を電子計算機に定めら
れた文字コードに変換する文字認識部と、文字コードに
変換した前記文字列を単語および文節単位に分割する文
節認識部と、文字列を格納している辞書部と、前記単語
および文節単位に分割された前記文字列が前記辞書部内
に格納された文字列と同一のものがあるかを検索する辞
書検索部とを備え、検索した結果、認識された前記文字
列が前記辞書部に存在する場合は、認識が正しいとして
文字認識を終了し、認識された前記文字列が前記辞書部
に存在しない場合は、再度前記文字認識部が輪郭の近い
他の文字列に置換して認識した文字列が辞書部にある文
字列と一致するまで繰り返す。
【0005】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0006】図1は本発明の文字読み取り装置の一実施
例を示すブロック図である。
【0007】本実施例の文字読み取り装置は、図1に示
すように、文字を読み取るための文字読み取り部1、文
字認識を行う制御部2、認識する言語の単語および文節
が記録されている辞書部3にわかれている。また制御部
2には、文字を認識する文字認識部21、読み取った文
字列を文節単位に分ける文節認識部22び辞書を検索す
る辞書検索部23を包含している。
【0008】図2は本実施例の流れ図を示し、図2を参
照して説明する。
【0009】文字認識を必要とする文書等の書類を文字
読み取り部1より入力し、文書を読み込ませる(ステッ
プS1)。前記読み込んだ文書は文字認識部21にて電
子計算機に定められた文字コードに変換する(ステップ
S2)。前記コード化された文字列は、文節認識部22
にて単語および文節単位に分割される(ステップS
3)。辞書検索部23は、前記分割された文字列が辞書
部3内に格納された文字列と同一のものがあるかを検索
する(ステップS4)。検索した結果、認識された文字
列が辞書部3に存在する場合は、認識が正しいとして次
処理にうつる(ステップS5のYES)。認識された文
字列が辞書部3に存在しない場合は(ステップS5のN
O)、再度文字認識部21が輪郭の近い他の文字列に置
換して(ステップS2)、以下同一処理を行い、認識し
た文字列が辞書部3にある文字列と一致するまで繰り返
す。
【0010】図3は、実際に「富士山は日本一高い山で
す」を例にとり本実施例を説明している。
【0011】まず、ステップS1で被読み込み文字列で
ある「富士山は日本一高い山です」を読み取る。これを
ステップS2で第一回目の文字認識を行い「富土山は日
木一高い山です」を得る。次にステップS3で「富土山
は」、「日木一」、「高い山です」の3っの文節に分離
する。ステップS4でこのように分割された文字列が辞
書部3内に格納された文字列と同一のものがあるかを検
索する。ここで「富土山は」の“土”は“士”の、また
「日木一」の“木”は“本”の誤認識であり(×印の
所)このような文字列は辞書部3内には格納されていな
い。そのためステップS5のNOで検索結果が不良と判
定され、ステップS2で再度文字認識部21が輪郭の近
い他の文字列に置換して認識する。このステップS2の
再度の認識では「富士山は日本一高い山です」と認識さ
れたためステップS4では文字列が辞書部3内に格納さ
れた文字列が存在しステップS5のYESで検索結果が
良と判定され文字読み取り認識終了になる。
【0012】
【発明の効果】以上説明したように、本発明の文字読み
取り装置は、認識した文字列の正誤性を判断し、誤って
認識された文字列を修正する機能を有することにより、
効率よく且つ正確に文字認識ができる。
【図面の簡単な説明】
【図1】本発明の文字読み取り装置の一実施例を示すブ
ロック図である。
【図2】本実施例の文字読み取り装置における動作の一
例を示す流れ図である。
【図3】本実施例の文字読み取り装置における動作の一
例を具体的に実際の文字列を用いて説明した図である。
【符号の説明】 1 文字読み取り部 2 制御部 3 辞書部 21 文字認識部 22 文節認識部 23 辞書検索部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字認識を必要とする文字列を読み込む
    文字読み取り部と、読み込んだ前記文字列を電子計算機
    に定められた文字コードに変換する文字認識部と、文字
    コードに変換した前記文字列を単語および文節単位に分
    割する文節認識部と、文字列を格納している辞書部と、
    前記単語および文節単位に分割された前記文字列が前記
    辞書部内に格納された文字列と同一のものがあるかを検
    索する辞書検索部とを備え、検索した結果、認識された
    前記文字列が前記辞書部に存在する場合は、認識が正し
    いとして文字認識を終了し、認識された前記文字列が前
    記辞書部に存在しない場合は、再度前記文字認識部が輪
    郭の近い他の文字列に置換して認識した文字列が辞書部
    にある文字列と一致するまで繰り返すことを特徴とする
    文字読み取り装置。
JP3207675A 1991-08-20 1991-08-20 文字読み取り装置 Pending JPH0546814A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3207675A JPH0546814A (ja) 1991-08-20 1991-08-20 文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3207675A JPH0546814A (ja) 1991-08-20 1991-08-20 文字読み取り装置

Publications (1)

Publication Number Publication Date
JPH0546814A true JPH0546814A (ja) 1993-02-26

Family

ID=16543708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3207675A Pending JPH0546814A (ja) 1991-08-20 1991-08-20 文字読み取り装置

Country Status (1)

Country Link
JP (1) JPH0546814A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19547812A1 (de) * 1994-12-20 1996-07-04 Nec Corp Lesegerät für Schriftzeichenketten
US8855424B2 (en) 2009-12-29 2014-10-07 Omron Corporation Word recognition method, word recognition program, and information processing device
WO2018079426A1 (ja) * 2016-10-31 2018-05-03 パナソニックIpマネジメント株式会社 加熱調理器および加熱調理器の制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19547812A1 (de) * 1994-12-20 1996-07-04 Nec Corp Lesegerät für Schriftzeichenketten
DE19547812C2 (de) * 1994-12-20 1999-08-05 Nec Corp Lesegerät für Schriftzeichenketten
US6014460A (en) * 1994-12-20 2000-01-11 Nec Corporation Character strings reading device
US8855424B2 (en) 2009-12-29 2014-10-07 Omron Corporation Word recognition method, word recognition program, and information processing device
WO2018079426A1 (ja) * 2016-10-31 2018-05-03 パナソニックIpマネジメント株式会社 加熱調理器および加熱調理器の制御方法
CN109844410A (zh) * 2016-10-31 2019-06-04 松下知识产权经营株式会社 加热烹调器以及加热烹调器的控制方法
JPWO2018079426A1 (ja) * 2016-10-31 2019-09-19 パナソニックIpマネジメント株式会社 加熱調理器および加熱調理器の制御方法
CN109844410B (zh) * 2016-10-31 2020-02-14 松下知识产权经营株式会社 加热烹调器以及加热烹调器的控制方法

Similar Documents

Publication Publication Date Title
JPH08194719A (ja) 検索装置および辞書/テキスト検索方法
JPH0546814A (ja) 文字読み取り装置
JPH06131500A (ja) 文字認識装置
JP2000090193A (ja) 文字認識装置および項目分類方法
JP3327642B2 (ja) 仮名漢字交じり変換装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
EP0314503A2 (en) Dictionary structure for document processing apparatus
JPH0256086A (ja) 文字認識の後処理方法
JP2939945B2 (ja) ローマ字住所認識装置
JP3725206B2 (ja) 文字認識装置
JP2570784B2 (ja) 文書リーダ後処理装置
JPH0554145B2 (ja)
JPH05210635A (ja) 入力装置
KR0175247B1 (ko) 음성합성을 위한 텍스트 변환방법
JPH0778155A (ja) 文書認識装置
JP3139624B2 (ja) 形態素解析装置
JPH01297768A (ja) 文書処理装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH03189891A (ja) 辞書参照による知識処理を行う文字列読み取り装置
JPH05189620A (ja) 文字認識装置
JPS60144886A (ja) 文字認識装置における後処理方式
JPH05181900A (ja) 固有名詞処理装置
JPH07282067A (ja) 内容抽出装置
JPH0528132A (ja) 単語辞書照合装置
JPH0460754A (ja) 仮名漢字変換方法