JPH087046A - 文書認識装置 - Google Patents

文書認識装置

Info

Publication number
JPH087046A
JPH087046A JP6139786A JP13978694A JPH087046A JP H087046 A JPH087046 A JP H087046A JP 6139786 A JP6139786 A JP 6139786A JP 13978694 A JP13978694 A JP 13978694A JP H087046 A JPH087046 A JP H087046A
Authority
JP
Japan
Prior art keywords
character
morpheme
word
document
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6139786A
Other languages
English (en)
Inventor
Yoshihiko Matsukawa
善彦 松川
Makoto Hirai
誠 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6139786A priority Critical patent/JPH087046A/ja
Publication of JPH087046A publication Critical patent/JPH087046A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 入力文書に対して柔軟な認識処理ができ、正
しい意味の文章として認識可能な文書認識装置を提供す
ること。 【構成】 画像入力装置101と、文書画像を分割する
領域分割装置102と、分割された文字領域から文字列
を得る文字認識装置103と、得られた文字列を形態素
に分割する形態素解析装置104と、形態素に分けられ
た文章の構文を認識する構文解析装置105と、各処理
装置から出力される、それぞれの処理において問題が発
生した場合に、その問題を解消可能な処理装置を、次に
起動すべき処理装置とするメッセージに基づき、処理装
置を起動する制御装置とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、用紙等に印刷された文
書を入力し、認識する文書認識装置に関するものであ
る。
【0002】
【従来の技術】従来、文書認識装置は、文字切り出し、
文字認識、単語辞書引きといった一連の処理単位に分割
され、それぞれの処理の順番は予め決められていた。そ
うすることによって、一度認識された文字を再認識する
ことは困難であった。また、それぞれの処理を再度起動
できるような構造とはなっているもののシステムにその
手順が組み込まれていた。そして、文字認識後の誤認識
の訂正手段として単語の辞書引きを利用していた(例え
ば、「文書画像の認識・再利用システム」信学技報、P
RU91ー27)。
【0003】
【発明が解決しようとする課題】ところで、文字認識さ
れる文字はその前後の文字、あるいは形態素、あるいは
文章の意味からある程度推測され得るので、その少しで
も可能性のある文字集合を用いて文字認識するべきであ
る。しかしながら、文字認識が一度しか起動しないよう
な処理構造であれば柔軟な処理は不可能になる。さら
に、単語辞書引きといった処理は、文字認識の誤認識を
訂正するための後処理として位置づけられているのであ
るが、それでは文字認識の候補と同じく複数の候補が出
力され正解の文字を限定するまでには至らない。また、
形態素解析や構文解析等の自然言語処理は、従来正確な
文章が入力されることを前提としており、ここで取り扱
うような誤字を含む文章には適応できなかった。結果と
して、文字あるいは単語の単位での誤りを訂正する事は
可能であったが、本来、所望とする正しい意味の文章と
して認識するまでにはいたっていないという課題があ
る。
【0004】本発明は、従来の文書認識装置のこのよう
な課題を考慮し、入力文書に対して柔軟な認識処理がで
き、正しい意味の文章として認識可能な文書認識装置を
提供することを目的とするものである。
【0005】
【課題を解決するための手段】本発明は、文書画像を入
力する画像入力装置と、文書画像を領域分割する領域分
割装置と、その分割領域の文字を認識する文字認識装置
と、その認識された文字の文字列を形態素に分割する形
態素解析装置と、その形態素解析された文字列を構文解
析する構文解析装置と、それら各処理装置の起動を制御
する制御装置とを備え、各処理装置は、それぞれの処理
において問題が発生した場合に、その問題を解消可能な
処理装置を、次に起動すべき処理装置とするメッセージ
を出力するものであって、制御装置は、出力されたメッ
セージに基づいて、そのメッセージが示す処理装置を起
動する文書認識装置である。
【0006】
【作用】本発明は、領域分割装置が、画像入力装置から
入力された文書画像を領域分割し、文字認識装置が、分
割された領域から文字を認識し、形態素解析装置が、認
識された文字の文字列を形態素に分割し、構文解析装置
が、形態素解析された文字列を構文解析し、制御装置
が、各処理装置から出力される、次に起動すべき処理装
置を示すメッセージに基づいて、該当する処理装置を起
動する。
【0007】
【実施例】以下に、本発明をその実施例を示す図面に基
づいて説明する。
【0008】図1は、本発明にかかる一実施例の文書認
識装置の構成図である。すなわち、文書認識装置には、
文書110を入力する画像入力装置101、その入力さ
れた文書画像109を文字認識できるように領域に分割
する領域分割装置102、その分割された領域から文字
を認識し文字列を得る文字認識装置103、その得られ
た文字列を形態素に分割する形態素解析装置104、そ
の形態素解析された文章を構文解析する構文解析装置1
05が設けられ、更に、それら各処理装置の起動などを
制御する制御装置108、各処理装置での処理結果を格
納するデータバッファ107、各処理装置から出力され
るメッセージを格納するメッセージバッファ111、制
御装置108が各処理装置を動作させるための条件を記
憶するルールテーブル106が設けられている。
【0009】又、図2は、上述の形態素解析装置104
の内部を示す構成図である。この形態素解析装置104
には、文字認識装置103で得られた文字列から単語を
検索する単語検索装置201、その単語検索された文字
列から形態素を抽出する形態素抽出装置202、形態素
抽出された文字列から誤認識文字を検出する誤認識検出
装置203、その誤認識検出された文字を修正する文字
修正装置204が設けられ、それら装置は上述の各処理
装置と同様にメッセージをメッセージバッファ111へ
出力する。
【0010】ここで、データバッファ107に格納され
るデータには二種類あり、それぞれがフレーム形式のデ
ータ構造をもっている。一つは領域分割や文字認識等の
画像処理の結果を格納する画像情報フレームで、もう一
つは形態素解析や構文意味処理等の結果を格納する言語
情報フレームである。それぞれのフレームには予め決め
られたレコード名があって、各処理の結果がこのレコー
ドにバインドされてゆく。
【0011】次に、上記実施例の文書認識装置の動作に
ついて、図面を参照しながら説明する。
【0012】まず、画像入力装置101から入力された
文書110の文書画像109を領域分割装置102で領
域分割する。分割は大きな領域から小さな領域へと再帰
的に分割される。また、領域分割の対象となる領域が文
章領域か否かを判定し、文章領域であれば行を切り出
し、その際に横書であれば文字高を、縦書きであれば文
字幅を求め、それをそれぞれ文字幅、文字高とみなして
文字を切り出す。この文字の切り出しと同時に領域分割
装置102はメッセージバッファ111に、その領域に
ついて文字認識を行なうようにメッセージを書き込む。
この時、分割された一つの領域毎に画像情報フレームが
用意され、データバッファ107に書き込まれる。ここ
で書き込まれる情報としては領域の座標、隣接する画像
情報フレームのフレーム名、この領域を含む親の領域の
フレーム名、親フレームの子フレームとして書き込まれ
る自分のフレーム名、この領域の種類がある。また、切
り出された領域の大きさが文字の四分の一以下であれ
ば、句読点であるとみなし、その情報もフレームに書き
込む。これら隣接あるいは親子関係を記述しておくこと
で各フレームのつながりがわかるので、文章あるいは段
落を構成するフレームの集合を簡単に求めることができ
る。
【0013】次に、文字認識装置103では、画像情報
フレームを受けとり、このフレームに書き込まれている
領域に属する画像について文字認識を行ない。文字認識
の結果をこの画像情報フレームに格納する。この時、句
読点であるフレームが入力されれば、前述の言語情報フ
レームを用意する。そして、上記の隣接あるいは親子関
係をたどって文章を構成する画像情報フレームを選び出
し、用意した言語情報フレームに格納する。また、この
言語情報フレームにも画像情報フレームと同様の方法で
隣接あるいは親子関係を記述しておく。他の情報として
は、文章・段落・章・写真・図表・タイトル等の文書内
での単位に分けた時の種類を書くこともできる。さら
に、文章を構成する画像情報フレームそれぞれから文字
認識結果の第一候補を抽出し文字列を構成し、これから
処理する初期文章として言語情報フレームに書き込んで
おく。この言語情報フレームの生成と同時にメッセージ
バッファ111に単語検索を行なうようにメッセージを
書き込む。
【0014】そうすると、形態素解析装置104では
(図2参照)、単語検索装置201が言語情報フレーム
を受けとり、このフレームに書きこまれた初期文章から
単語を抜き出す。この時、図3に示すように、初期文章
301中の文字にはそれぞれ指標302が付けてあり、
各指標から始まる5文字以内の単語を全て取り出し、単
語ラティスとして言語情報フレームに格納する。例え
ば、初期文章301の指標7から始まる単語ラティスは
303のように求めることができる。
【0015】さらに、片仮名や英字のような同一字種が
連続する部分の誤認識を訂正するため、図4に示すよう
な類似文字テーブル401を用意し、同一字種による文
字列を強制的に生成し、単語を見つける。この例では、
注目文字(ここでは「レ」、「ベ」、「ー」)の前後の
文字が類似文字テーブル401のインデックス文字に存
在するか否かを調べ、もし存在すれば対応する類似文字
集合中の文字に順次置きかえて同一字種の文字列集合を
生成する。例えば、「エレベータ」、「ェレベータ」、
「エレベーダ」、「ェレベーダ」である。そして、これ
らの文字列集合の中で単語辞書に登録されている文字列
(ここでは「エレベータ」)を求める。その後、メッセー
ジバッファ111に形態素を抽出するようにメッセージ
を書き込む。
【0016】次に、形態素抽出装置202は、図5に示
すように、言語情報フレーム503を受けとり、その中
にある単語ラティス501を用いて形態素を抽出し、形
態素ラティス502として再び言語情報フレーム503
に格納する。さらに、この形態素ラティス502を用い
て誤認識文字の位置を検出するようにメッセージバッフ
ァ111にメッセージを書き込む。
【0017】次に、誤認識検出装置203が言語情報フ
レームを受けとり、このフレームに格納されている形態
素ラティスあるいは認識文字の第一候補を用いて誤認識
を起していると思われる誤認識文字を検出する(図6参
照)。ただし、その位置は形態素ラティスを文章の先頭
から調べてゆき形態素が途切れる部分601、形態素と
して漢字1文字が抽出されている部分602、あるいは
認識された第一候補文字として片仮名、数字、英字、記
号がある部分603とする。そして、抽出された誤認識
文字から始まる単語を抽出するようにメッセージバッフ
ァ111にメッセージを書き込む。
【0018】それをうけて文字修正装置204が起動さ
れ、前述の誤認識文字から始まる単語が抽出される(図
7参照)。まず、その誤認識文字701からどこまでが
単語となり得るかを決定しなければいけないが、それは
誤認識文字以降の文字で形態素の長さが1以上となる文
字の手前702か、認識文字の第一候補に平仮名が出現
する文字の一つ手前の文字703とする。そして、その
単語を含むと思われる被修正部分704に対して次のよ
うな二種類の修正方法を適応する。一つは、図8に示す
ように、被修正部分801に対して単に各認識文字候補
の組みあわせを求め、辞書引きをし、単語となるもの8
02を求める。これは被修正部分の単語幅がいくらでも
適応できる。もう一つは、図9に示すように、被修正部
分901の幅が1であり、かつ被修正部分901の次の
文字902の認識第一候補が平仮名である場合、その平
仮名を活用語尾、被修正部分901を活用語の語幹であ
るとみなし、この活用語尾から先行する活用語の品詞を
推定し、その品詞に属する文字集合の中から文字認識を
行ない確からしい単語を得る。図9の場合、「ん」を活
用語尾とするような一文字の動詞はマ行子音動詞、ナ行
子音動詞、バ行子音動詞であり、これらの動詞を用いて
再度文字認識をすることになる。このようにして得られ
た単語903を言語情報フレーム904の単語ラティス
905に付け加え、誤認識文字の位置から再び形態素を
抽出するようにメッセージをメッセージバッファ111
に書き込む。
【0019】以上のようにして、ある言語情報フレーム
について、考えられる形態素が全て抽出できた後、すな
わち誤認識検出装置203において誤認識文字が検出さ
れなくなれば、この言語情報フレームについて構文を解
析するようにメッセージバッファ111にメッセージを
書き込む。
【0020】次に、ある言語情報フレームについて構文
解析装置105が起動され、言語情報フレームの中の形
態素ラティスを用いて構文が解析され、文法及び意味に
矛盾がなくなるような形態素が選択され文章の候補が得
られる。この文章の候補も言語情報フレームに格納され
る。最後に文章の最後の形態素の品詞あるいは活用語尾
を参照して、句読点の句点か読点を判別し、対応する画
像情報フレームに記述される。
【0021】以上のように、各処理装置それぞれから出
力されたメッセージは、次に行われる処理装置の名前
と、その処理装置に渡されるデータからなり、メッセー
ジバッファ111に書かれたこれらのメッセージと、ル
ールテーブル106とを制御装置108が参照して、次
に行うべき処理装置を起動する。
【0022】ここで、ルールテーブル106の中の各ル
ールは、メッセージに対するテンプレートを持ってお
り、メッセージとテンプレートがマッチした時に、その
ルールが選択される。又、ルールには、そのルールを適
用するときのデータの状態、選択されたときに実行すべ
き処理、そしてその処理が成功したか否かによって消去
すべきメッセージあるいは追加すべきメッセージかが記
述されている。
【0023】このメッセージを自由に追加削除出来る機
能により、通常は各処理装置が前述したように順番に起
動されていくが、一旦、どこかの処理装置で問題が発生
すれば、その問題を解消可能な処理装置を起動するため
に、何等かのメッセージが出力され、処理が後戻りする
ことになる。例えば、文字認識装置103において、ど
うしても文字認識が困難となった場合、処理を領域分割
装置102まで戻したり、極端には、画像入力装置10
1まで後戻りさせることも可能である。従って、従来に
比べると柔軟な処理が可能となり、誤った処理をそれ以
外の処理でカバーすることができ、最終的には誤認識を
自動訂正することが可能になる。
【0024】以上のように、画像入力装置101、領域
分割装置102、文字認識装置103、形態素解析装置
104、構文解析装置105の各処理装置は独立してお
り、各処理結果は全てデータバッファ107に蓄えられ
ている。一方、各処理装置はメッセージバッファ111
にメッセージを送ることができ、制御装置108は、そ
のメッセージとルールテーブル106のルールを参照し
て次に起動すべき処理装置に起動命令を下すことによ
り、柔軟な処理が可能になる。
【0025】又、形態素解析装置104の中では、ま
ず、単語検索装置201によって、考えられる単語が全
て抽出され、それをうけて形態素抽出装置202で形態
素が抽出される。ここで、誤認識検出装置203によっ
て誤認識をしている位置を検出し、その位置を用いて文
字修正装置204によって正しい文字に修正し、その誤
認識部分から始まる単語が抽出され、再度形態素抽出装
置202によって形態素が抽出される。もし、誤認識検
出装置203で誤認識が認められなかった場合は、構文
解析装置105に処理がうつる。構文解析装置105
は、文法及び意味を調べ、複数の可能性のある形態素の
中から意味の通じるものだけを選び、正しい意味の文章
を出力することができる。
【0026】又、得られた形態素の結果から誤認識文字
を自動的に検出でき、また本来日本語のように単語の切
れ目がわからない言語において、単語の存在する可能性
がある部分を抽出することが可能となる。また、片仮名
や英字、数字のように同一字種が続くという知識を用い
ることにより、本来の字種を別の字種に間違えるという
誤認識を修正することが可能となる。さらに、活用語を
誤認識した場合に、その活用語尾からその活用語を限定
することができ、結果として文字認識の精度が向上す
る。
【0027】従って、各処理装置を起動するルールが分
離され、起動の順序が変更できることにより、新たな構
造の文書が入力された場合にも柔軟に対処できる。ま
た、各処理装置が誤認識を行なっても、その後の処理装
置によって誤りが指摘されるため、精度のよい認識が行
なえる。さらに、各処理装置が独立しているため、新し
い処理装置を容易に付加できる。
【0028】又、複数の形態素候補が抽出された場合、
形態素間の係り受けまたは意味を考慮することによっ
て、正しい形態素を絞りこむことが可能となり、結果と
して意味の正しい文章を出力することができる。。
【0029】さらに、本来画像の上では小さくて誤認識
を起しやすい句読点を句点か読点かのどちらかに判別す
ることが可能となる。
【0030】なお、上記実施例では、通常の処理順序の
場合も各処理装置から次に起動する処理装置を決めるメ
ッセージを出力する構成としたが、これに限らず、処理
を実行している処理装置で問題が生じたときのみ、処理
を後戻りさせるためメッセージを出力するように構成し
てもよい。
【0031】また、上記実施例では、各処理装置を専用
のハードウェアにより構成したが、これに代えて、同様
の機能をコンピュータを用いてソフトウェア的に実現し
てもよい。
【0032】
【発明の効果】以上述べたところから明らかなように本
発明は、各処理において問題が発生した場合に、その問
題を解消可能な処理装置を、次に起動することができる
ので、入力文書に対して柔軟な認識処理ができ、正しい
意味の文章として認識できるという長所を有する。
【図面の簡単な説明】
【図1】本発明にかかる一実施例の文書認識装置の構成
図である。
【図2】同実施例における形態素解析装置の構成図であ
る。
【図3】同実施例における単語検索装置による処理結果
の例を示す図である。
【図4】同実施例における片仮名に対する類似文字テー
ブルの例を示す図である。
【図5】同実施例における形態素抽出装置による処理結
果の例を示す図である。
【図6】同実施例における誤認識検出装置による処理手
順の例を示す図である。
【図7】同実施例における文字修正装置による処理手順
の例を示す図である。
【図8】同実施例における文字修正装置による処理手順
の例を示す図である。
【図9】同実施例における文字修正装置による処理手順
の例を示す図である。
【符号の説明】
101 画像入力装置 102 領域分割装置 103 文字認識装置 104 形態素解析装置 105 構文解析装置 106 ルールテーブル 107 データバッファ 108 制御装置 111 メッセージバッファ 201 単語検索装置 202 形態素抽出装置 203 誤認識検出装置 204 文字修正装置

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を入力する画像入力装置と、前
    記文書画像を領域分割する領域分割装置と、その分割領
    域の文字を認識する文字認識装置と、その認識された文
    字の文字列を形態素に分割する形態素解析装置と、その
    形態素解析された文字列を構文解析する構文解析装置
    と、それら各処理装置の起動を制御する制御装置とを備
    え、前記各処理装置は、それぞれの処理において問題が
    発生した場合に、その問題を解消可能な処理装置を、次
    に起動すべき処理装置とするメッセージを出力するもの
    であって、前記制御装置は、前記出力されたメッセージ
    に基づいて、そのメッセージが示す処理装置を起動する
    ことを特徴とする文書認識装置。
  2. 【請求項2】 形態素解析装置は、単語を検索する単語
    検索装置と、その検索された単語に基づいて形態素を抽
    出する形態素抽出装置と、その抽出結果に基づいて誤認
    識文字を検出する誤認識検出装置と、その誤認識文字を
    もとに文字を修正する文字修正装置とを有し、前記各装
    置は、それぞれの処理において問題が発生した場合に、
    その問題を解消可能な装置を、次に起動すべき装置とす
    るメッセージを出力するものであって、前記制御装置
    は、前記出力されたメッセージに基づいて、そのメッセ
    ージが示す装置を起動することを特徴とする請求項1記
    載の文書認識装置。
  3. 【請求項3】 形態素解析装置は、前記修正された文字
    を用いて再度形態素解析を行い、文字認識の誤認識が発
    生しても考え得る全ての形態素を抽出することを特徴と
    する請求項2記載の文書認識装置。
  4. 【請求項4】 単語検索装置は同一字種結合手段を有
    し、字種を間違えて認識した場合でも、正しい文字列を
    単語として出力することを特徴とする請求項2記載の文
    書認識装置。
  5. 【請求項5】 同一字種結合手段は、特定字種に対して
    インデックス文字と前記特定字種の類似文字集合の対か
    らなる類似文字テーブルを有し、設定した注目文字の前
    後の文字が、前記類似文字テーブルのインデックス文字
    にそれぞれ存在するか否かを調べ、もし存在すれば対応
    する類似文字集合中の文字に順次置きかえて同一字種の
    文字列集合を生成し、前記文字列集合の中で単語辞書に
    登録されている文字列を出力することを特徴とする請求
    項4記載の文書認識装置。
  6. 【請求項6】 誤認識検出装置は、形態素が切り出せな
    い位置、あるいは形態素として漢字1文字が切り出され
    る位置、あるいは片仮名、数字、英字、記号として認識
    された文字がある位置を誤認識文字であると検出するこ
    とを特徴とする請求項2記載の文書認識装置。
  7. 【請求項7】 文字修正装置は、被修正部分検出手段
    と、単語候補抽出手段とを有し、前記誤認識文字から始
    まる被修正部分を検出し、前記被修正部分の文字認識候
    補から単語を出力することを特徴とする請求項2記載の
    文書認識装置。
  8. 【請求項8】 被修正部分検出手段は、前記誤認識文字
    から始まり、認識文字の第一候補に平仮名がある文字の
    手前、あるいは前記形態素の長さが1以上となる文字の
    手前までを被修正部分とすることを特徴とする請求項7
    記載の文書認識装置。
  9. 【請求項9】 単語候補抽出手段は、前記被修正部分内
    の各文字認識候補の組み合せから文字列集合を求め、前
    記文字列集合の中から辞書に登録されている文字列を単
    語として出力することを特徴とする請求項7記載の文書
    認識装置。
  10. 【請求項10】 単語候補抽出手段は、前記被修正部分
    の幅が1文字でかつその次の文字が平仮名の場合、前記
    平仮名以降の部分に活用語尾が含まれるとみなし、前記
    活用語尾を持つ活用語の文字集合を求め、この文字集合
    を用いて前記被修正部分を再認識し、その認識結果を単
    語として出力することを特徴とする請求項7記載の文書
    認識装置。
  11. 【請求項11】 構文解析装置は、最後の形態素の品詞
    あるいは活用語尾を参照して最後の句読点が句点か読点
    かを判定することを特徴とする請求項1記載の文書認識
    装置。
JP6139786A 1994-06-22 1994-06-22 文書認識装置 Pending JPH087046A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6139786A JPH087046A (ja) 1994-06-22 1994-06-22 文書認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6139786A JPH087046A (ja) 1994-06-22 1994-06-22 文書認識装置

Publications (1)

Publication Number Publication Date
JPH087046A true JPH087046A (ja) 1996-01-12

Family

ID=15253401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6139786A Pending JPH087046A (ja) 1994-06-22 1994-06-22 文書認識装置

Country Status (1)

Country Link
JP (1) JPH087046A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120294A (ja) * 1997-10-17 1999-04-30 Matsushita Electric Ind Co Ltd 文字認識装置および媒体
JP2009077048A (ja) * 2007-09-19 2009-04-09 Canon Inc 画像処理装置、および画像処理方法
CN112307712A (zh) * 2019-07-31 2021-02-02 株式会社理光 文本评价装置和方法以及存储介质和计算机装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120294A (ja) * 1997-10-17 1999-04-30 Matsushita Electric Ind Co Ltd 文字認識装置および媒体
JP2009077048A (ja) * 2007-09-19 2009-04-09 Canon Inc 画像処理装置、および画像処理方法
CN112307712A (zh) * 2019-07-31 2021-02-02 株式会社理光 文本评价装置和方法以及存储介质和计算机装置
CN112307712B (zh) * 2019-07-31 2024-04-16 株式会社理光 文本评价装置和方法以及存储介质和计算机装置

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
JP4301515B2 (ja) 文章表示方法、情報処理装置、情報処理システム、プログラム
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPH07325828A (ja) 文法チェックシステム
JPH07325824A (ja) 文法チェックシステム
JP2002517039A (ja) 中国語テキストにおける単語分割
CN110147546B (zh) 一种英语口语的语法校正方法及装置
JP5314195B2 (ja) 自然言語処理装置、方法、及びプログラム
JPH0211934B2 (ja)
JP3309174B2 (ja) 文字認識方法及び装置
JPH087046A (ja) 文書認識装置
JPH06215184A (ja) 抽出領域のラベリング装置
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
JPH07325825A (ja) 英文法チェックシステム装置
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JP3599734B2 (ja) 文章校正装置およびその方法
JP2902138B2 (ja) 誤読文字修正方法
JPH0546612A (ja) 文章誤り検出装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH03156589A (ja) 誤読文字の検出,修正方法
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPH05233619A (ja) 日本語文章誤り訂正方法およびその装置
JPS5899829A (ja) 誤り文字検出・修正支援装置