JPH0546612A - 文章誤り検出装置 - Google Patents

文章誤り検出装置

Info

Publication number
JPH0546612A
JPH0546612A JP3208244A JP20824491A JPH0546612A JP H0546612 A JPH0546612 A JP H0546612A JP 3208244 A JP3208244 A JP 3208244A JP 20824491 A JP20824491 A JP 20824491A JP H0546612 A JPH0546612 A JP H0546612A
Authority
JP
Japan
Prior art keywords
sentence
word
analysis
storage means
result storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3208244A
Other languages
English (en)
Inventor
Akio Yamashita
明男 山下
Juhei Nakagaki
寿平 中垣
Hiroshi Yamaguchi
浩 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3208244A priority Critical patent/JPH0546612A/ja
Publication of JPH0546612A publication Critical patent/JPH0546612A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】日本語文章における誤字、脱字などの誤りを検
出する文章誤り検出装置において、誤り箇所を認定する
ための処理時間を短縮すると共に、1文中に2個以上誤
りがある場合でも、誤りを含む部分を細かく検出するこ
とができるようにする。 【構成】解析過程において、入力文を構成する互いに接
続可能な単語列がない時には、解析結果記憶手段の内容
を参照して、直前の文節位置まで解析位置を戻し、未知
語を切り出す処理を行い、未知語が終わる位置に解析位
置を戻して解析を再開するという構成にした。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、日本語文章における
誤字、脱字などの誤りを検出する文章誤り検出装置に関
する。
【0002】
【従来の技術】近年、ワードプロセッサなどの普及によ
り日本語文章を作成することが多くなってきたが、日本
語文章から誤字、脱字などの誤りを発見し訂正する作業
は、依然として人手で行っているのが現状である。これ
に対して、最近このような校正作業を支援する校正支援
システムが開発されてきている。
【0003】例えば、特開平1−315866号公報に
は、単語の表記と品詞情報、及び品詞同士の接続可否情
報を用いて、互いに接続可能な単語列が作成不可のとき
に誤りを認定する2つの方式が開示されている。第1の
方式は、入力日本語文の各々の文字を、1字の誤り語と
して検索された単語に付加し、再度単語列を総て求めた
後、その単語列中で最も誤り語数が少なくて誤り語同士
が接近している単語列が誤り箇所であると認定するもの
である。第2の方式は、文頭からの最長単語列と文末か
らの最長単語列とを求め、これらの2つの最長単語列間
にはさまれる文字列、もしくはこれらの2つの最長単語
列に共通する文字列、又はこれらの2つの最長単語列の
端の文字が誤り箇所であると認定するものである。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
1−315866号公報に開示された方式では、誤り箇
所を認定するために再度単語列を総て求めるようにして
いるため、処理に時間がかかるという問題点があった。
また、1文中に2個以上誤りがある場合には、誤りを含
む部分を細かく検出することができないという問題点が
あった。
【0005】この発明は、処理時間を短縮すると共に、
複数の誤り部分を特定することができる文章誤り検出装
置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、この発明に係わる文章誤り検出装置では、入力され
た文字列を記憶する記憶手段と、前記文字列からなる文
章を単語単位又は文節単位に解析する文章解析手段と、
解析の途中経過ならびに解析結果を記憶する解析結果記
憶手段と、前記文章を構成する互いに接続可能な単語列
が無い場合に、前記解析結果記憶手段の内容を参照して
直前の文節末位置まで解析の状態を戻し、例えば次の1
文字ないしは漢字1文字あるいは戻した解析位置の前後
の連続するカタカナ文字列を自立語とみなして解析を続
行する未知語処理手段とを具えている。
【0007】
【作用】文章解析手段は、入力文の先頭より文末に向か
って解析位置をひとつずつ移動しながら、単語辞書や単
語間の接続情報などを用いて、単語単位及び文節単位に
解析する。その過程で入力文を構成する互いに接続可能
な単語列がないときには、解析結果記憶手段の内容を参
照して文節末位置まで解析位置を戻し、未知語を切り出
す処理を行う。ここで、未知語の切り出しとは、戻した
解析位置より始まる平仮名1文字ないしは漢字1文字あ
るいは戻した解析位置の前後の連続するカタカナ文字列
を未知語の候補とし、これを自立語とみなして解析結果
記憶手段に結果を記憶することをいう。未知語を切り出
した後、未知語が終わる位置に解析位置を戻して解析を
再開する。文末まで解析位置を移動する過程で再び未知
語が検出されたならば、同様に文節末位置まで解析位置
を戻し、同様して未知語を切り出して解析を続行する。
【0008】したがって、未知語の位置を求めるために
文章全体を再度解析する必要がなく、1文中に複数の未
知語が存在していても、その未知語の位置を容易に特定
することができる。
【0009】
【実施例】以下、この発明に係わる文章誤り検出装置の
一実施例を添付図面を参照して説明する。
【0010】図1は、この発明に係わる文章誤り検出装
置の概略構成を示す機能ブロック図である。この文章誤
り検出装置は、文章記憶手段1、文章解析手段2、解析
結果記憶手段3、未知語処理手段4、表示手段5、日本
語辞書6、接続関係記憶手段7から構成されている。
【0011】文章記憶手段1は、予め入力された日本語
文章が記憶されている記憶装置である。この文章記憶手
段1は、磁気ディスクやフロッピーディスクなどの日本
語文章を記憶できるものであればどのような構成でもよ
い。また、日本語文章はキーボードなどから入力された
ものや、音声認識や文字認識の結果入力されたものでも
よいし、ネットワークやフロッピ−ディスクなどによっ
て他の装置から転送されたものでもよい。
【0012】文章解析手段2は、入力された日本語文章
を単語単位及び文節単位に分割し、解析結果記憶手段3
に格納する。そして、未知語処理手段4の起動を含む解
析や誤り検出処理全般の制御を行う。例えば、入力文の
先頭より文末に向かって解析位置をひとつずつ移動しな
がら、単語の表記とその品詞情報などの属性情報を登録
した日本語辞書6と、単語間の接続可否の情報を登録し
た接続関係記憶手段7を用いて日本語文章を互いに接続
可能な単語列に分割する。
【0013】ここで、日本語辞書6の内容の一例を図2
に、接続関係記憶手段7の内容の一部を図3にそれぞれ
示す。図2の日本語辞書では、名詞や動詞などの自立語
が上半分に、助詞や語尾などの付属語が下半分に示され
ている。句読点も自立語とみなして辞書に登録してもよ
い。日本語辞書はこのような構成以外でも、自立語と付
属語を一緒にして文字コード順に並べたり、別々の辞書
として構成したりというように、単語の検索ができる構
成であればよい。また、図3において、接続が可能であ
る組み合わせは「1」で示され、接続が不可能である組
み合わせは「0」で示されている。なお、組み合わせが
定義されていない場合も、接続は不可能である。図3で
は、単語間の接続の可能性だけでなく、文節末の可能性
の判定も可能にするために仮想的な文節の先頭を設けて
いる。
【0014】文章解析手段2は、文の文頭から文末まで
単語を検索し、単語間の接続関係や文節末条件をチェッ
クする。そして、単語間の接続関係が正しい組み合わせ
のうち、文節の数が最も少ないものを結果として出力す
る文節数最小法により文章解析を行う。なお、互いに接
続可能な単語の列の組み合わせの中から、最も適切なも
のを選ぶ方法は、最長一致法や文節数最小法などどのよ
うなものでもよい。
【0015】解析結果記憶手段3は、前記文章解析手段
2によって解析された解析結果を記憶する記憶装置であ
る。解析結果記憶手段3は、文章記憶手段1と同様に磁
気ディスクやフロッピーディスクなどの解析結果を記憶
できるものであればどのような構成でもよい。
【0016】未知語処理手段4は、入力文を単語単位及
び文節単位に解析する過程で入力文を構成する互いに接
続可能な単語列がないときに、文章解析手段2により起
動され、解析結果記憶手段3の内容を参照して直前の文
節末位置まで解析位置を戻し、未知語を切り出す処理を
行う。未知語の切り出しとは、戻した解析位置より始ま
る平仮名1文字ないしは漢字1文字あるいは戻した解析
位置の前後の連続するカタカナ文字列を未知語の候補と
し、これを自立語とみなして解析結果記憶手段に結果を
記憶することをいう。その後、未知語が終わる位置に解
析位置を戻して解析を再開する。
【0017】表示手段5は、文章記憶手段1に記憶され
ている内容を表示するとともに、前記解析結果記憶手段
3に記憶されている解析結果の中で、未知語として切り
出された文字列を検出し、他の部分と区別して表示す
る。他の部分と区別して表示する方法としては、例え
ば、反転する、アンダ−ラインを付ける、色を変える、
文字の大きさを変える、文字の字体を変えるなどの手段
があるが、この実施例ではアンダ−ラインを付けて表示
している。
【0018】次に、上述した文章誤り検出装置につい
て、日本語文章から未知語を検出し、未知語を誤りとし
て検出する場合の処理手順を図4のフローチャートに基
づいて説明する。
【0019】まず、文章解析手段2は文章記憶手段1内
に取り出すべき日本語文があるかどうかを判断し(ステ
ップ101)、日本語文があるときは、その1文を取り
出す(ステップ102)。以下の処理では、この文が処
理の対象となる。ここでは、具体例として「文書顔ずの
データベスを作成する。」という文が取り出されたとす
る。この文は、正しくは「文書画像のデータベースを作
成する。」であるが、ローマ字仮名変換時のミスタイプ
(gazou→kaozu)と仮名漢字変換により誤り
を犯したものである。
【0020】次に、解析の制御に用いる変数N、P、E
の初期値を設定する(ステップ103)。ここでは、文
長を示すNには文の文字数16を設定し、解析位置を示
すPを0、解析結果記憶手段3に格納された単語の終端
の内、最も文末側の位置を示すEも0に設定する。
【0021】続いて、ステップ104で解析位置を示す
PがNと等しいかどうかを判断する。P=Nであれば、
1文の解析を終了したので、次の文を解析するためにス
テップ101に戻る。ここでは、P=0、N=16なの
で、ステップ105に移る。
【0022】ステップ105では、解析位置を示すPが
Eを越えたかどうかを判断する。PがEを越えていれ
ば、未知語処理手段4を起動するためにステップ114
に移る。、ここでは、P=0、E=0なのでステップ1
06に移る。ステップ106では、位置Pより始まる単
語を日本語辞書6より検索する。以下、検索された単語
を検索単語と呼ぶ。その結果、検索単語は「文(名
詞)」「文書(名詞)」となり、ステップ107に移
る。
【0023】ステップ107では、検索単語の個数を調
べ、0であればステップ113に移り、1個以上であれ
ばステップ108に移る。今、検索単語の個数は2であ
るのでステップ108に移る。
【0024】ステップ108では、P=0かどうかを判
断する。ここでは、P=0なのでステップ109に移
る。P=0とは、解析位置が文頭にあることを意味す
る。文は文節の連なりであり、文節は自立語で始まる。
ステップ109では、自立語のみを残して付属語の検索
単語は除き、ステップ111に移る。
【0025】ステップ111では、残された検索単語の
文節末の条件を、図3の接続関係記憶手段7を用いて判
定する。「文(名詞)」「文書(名詞)」は仮想的な文
節の先頭と接続可能であるので、文節末の可能性があ
る。この判定結果を含む単語情報を解析結果記憶手段3
に格納する。その結果は、図6のNo.1、2のように
なる。
【0026】次に、ステップ112では、格納された単
語候補の終端の内、最も文末側の位置側の位置とEを比
較して大きい方をEに設定する。ここでは、最も文末側
の位置側の位置は「文書」の2であり、Eは0なので、
Eは2に更新される。
【0027】ステップ113では、位置Pを一つ増やし
てステップ104に戻る。今、P=0なので、Pを1と
する。
【0028】ステップ104では、P=1、N=16で
あるので、ステップ105に移り、ステップ105で
は、P=1、E=2であり、P>Eではないので、ステ
ップ106に移る。ステップ106で、P=1、すなわ
ち「書顔ず…」と照合する単語を日本語辞書6より検索
する。その結果、検索単語は「書(名詞)」、「書(カ
行5段動詞語幹)」となり、ステップ107に移る。こ
こで、検索単語の個数は2であるので、ステップ108
に移る。ステップ108では、P=1であるので、ステ
ップ110に移る。ステップ110では、位置Pで終わ
る単語候補を解析結果記憶手段3よりもとめ、これらと
検索単語どうしの接続可能性を接続関係記憶手段7を参
照して判断し、接続可能な検索単語を残してステップ1
11に移る。今、P=1であるので、1で終わる単語候
補は「文」である。「文」と「書(名詞)」、「書(カ
行5段動詞語幹)」は接続可能であるので、「書(名
詞)」、「書(カ行5段動詞語幹)」が残される。ステ
ップ111で、残された検索単語の文節末の条件をチェ
ックすると、「書(名詞)」は文節末になりえるが、
「書(カ行5段動詞語幹)」は文節末になりえない。こ
の判定結果を含む単語情報を解析結果記憶手段3に格納
する。その結果は、図6のNo.3、4のようになる。
ステップ112では、格納された単語候補の終端の内、
最も文末側の位置は2であるので、Eの値は変わらず2
のままである。ステップ113では、Pを一つ増やして
2とし、ステップ104に戻る。
【0029】P=2の場合について、同様にステップ1
04、105、106、107、108、110、11
1、112を実行すると、解析結果記憶手段3の内容
は、図6のNo.5のようになる。解析結果記憶手段3
に格納されるのは、「顔(名詞)」であり、Eの値は3
に更新される。ステップ113では、Pを一つ増やして
3とし、ステップ104に戻る。
【0030】P=3の場合について、同様にステップ1
04、105、106を実行すると、「ずのデータ…」
に照合する単語が日本語辞書6に登録されていないの
で、ステップ107からステップ113に移り、解析結
果記憶手段3には何も格納されず、Eも更新されない。
ステップ113では、Pを一つ増やして4とし、ステッ
プ104に戻る。
【0031】P=4の場合にステップ104、105を
実行すると、E=3であるので、ステップ105からス
テップ114に移る。ステップ114から117が未知
語処理手段4の処理手順に相当する。ステップ114で
は、解析結果記憶手段3を参照して位置Pを直前の文節
末位置にする。P=4であるので、ここより文頭に向か
って解析結果記憶手段3の内容を捜し、最初に文節末の
可能性が1である単語の終了位置3まで解析位置を戻
し、ステップ115に移る。ステップ115の処理を図
5のフローチャートに示す。図5に示すように、解析位
置を戻したら、Pで始まる文字が平仮名かどうかを調べ
る(ステップ201)。例文「文書顔ず…」の場合、解
析位置3で始まる文字は平仮名の「ず」であるので、ス
テップ202で「ず」を未知語として図4のステップ1
16に戻る。ステップ116では、切り出した「ず」と
いう未知語に未知語(平仮名)を表す文法情報を付け
て、検索単語としてステップ117に移る。ステップ1
17では、位置Pを未知語「ず」の終端位置マイナス
1、すなわちP=3に変更する。続いて、ステップ11
1、112を実行すると、「ず」という未知語が解析結
果記憶手段3に格納される。その結果は、図6のNo.
6のようになる。ステップ112で、Eは4に更新さ
れ、ステップ113でPを一つ増やして4とし、ステッ
プ104に戻る。
【0032】P=4の場合について、同様にステップ1
04、105、106、107、108、110、11
1、112を実行すると、解析結果記憶手段3の内容は
図6のNo.7のようになる。解析結果記憶手段3に格
納されるのは「の(格助詞)」であり、Eは5に更新さ
れる。ステップ113でPを一つ増やして5とし、ステ
ップ104に戻る。
【0033】P=5の場合について、同様にステップ1
04、105、106、107、108、110、11
1、112を実行すると、解析結果記憶手段3の内容は
図6のNo.8のようになる。解析結果記憶手段3に格
納されるのは「データ(名詞)」であり、Eは8に更新
される。ステップ113でPを一つ増やして6とし、ス
テップ104に戻る。
【0034】P=6の場合について、同様にステップ1
04、105、106を実行すると、「ータベスを…」
に照合する単語が日本語辞書6に登録されていないの
で、ステップ107からステップ113に移る。この場
合、解析結果記憶手段3には何も格納されず、Eも更新
されない。ステップ113では、Pを一つ増やして7と
し、ステップ104に戻る。P=7の場合について、同
様にステップ104、105、106を実行すると、
「タベスを…」に照合する単語が日本語辞書6に登録さ
れていないので、ステップ107からステップ113に
移る。この場合、解析結果記憶手段3には何も格納され
ず、Eも更新されない。ステップ113では、Pを一つ
増やして8とし、ステップ104に戻る。P=8の場合
について、同様にステップ104、105、106を実
行すると、「ベスを…」に照合する単語が日本語辞書6
に登録されていないのでステップ107からステップ1
13に移る。この場合、解析結果記憶手段3には何も格
納されず、Eも更新されない。ステップ113では、P
を一つ増やして9とし、ステップ104に戻る。
【0035】P=9の場合にステップ104、105を
実行すると、E=8であるので、ステップ105からス
テップ114に移る。ステップ114では、解析結果記
憶手段3を参照して解析位置Pを直前の文節末位置にす
る。P=9であるので、ここより文頭に向かって解析結
果記憶手段3の内容を捜し、最初に文節末可能性が1で
ある単語の終了位置8まで解析位置を戻し、ステップ1
15に移る。図5のフローチャートに示すように、解析
位置を戻したら、Pで始まる文字が平仮名かどうかを調
べる(ステップ201)。例文「文書顔ずのデータベス
を…」の場合、解析位置8で始まる文字はカタカナの
「ベ」であるので、ステップ203に移る。Pで始まる
文字が平仮名であるときは、その1文字の平仮名を未知
語とし(ステップ202)、図4のステップ116に戻
る。ステップ203では、Pで始まる文字が漢字かどう
かを調べる。Pで始まる文字は漢字ではないので、ステ
ップ205に移る。Pで始まる文字が漢字であるとき
は、その1文字の漢字を未知語とし(ステップ20
4)、図4のステップ116に戻る。ステップ205で
は、Pで始まる文字がカタカナかどうかを調べる。Pで
始まる文字はカタカナであるのでステップ206に移
り、解析位置8の前後の連続するカタカナ文字列「デー
タベス」を未知語とし、図4のステップ116に戻る。
Pで始まる文字がカタカナでないときは、次の一文字を
未知語とし(ステップ207)、図4のステップ116
に戻る。
【0036】ステップ116では、「データベス」とい
う未知語に未知語(カタカナ)を表す文法情報をつけ
て、検索単語としてステップ117に移る。ステップ1
17では、位置Pを未知語「データベス」の終端位置マ
イナス1、すなわち9に変更してステップ111に移
る。ステップ111、112を実行すると、「データベ
ス」という未知語が解析結果記憶手段3に格納される。
その結果は、図6のNo.9のようになる。Eは10に
更新される。ステップ113では、Pを一つ増やして1
0とし、ステップ104に戻る。
【0037】P=10の場合について、同様にステップ
104、105、106、107、108、110、1
11、112を実行すると、解析結果記憶手段3の内容
は、図6のNo.10のようになる。解析結果記憶手段
3に格納されるのは「を(格助詞)」であり、Eの値は
11に更新される。ステップ113でPを一つ増やして
11とし、ステップ104に戻る。
【0038】その後Pは、12、13、14、15と変
化し、同様にステップ104、105、106、10
7、108、110、111、112、113を実行す
ると、解析結果記憶手段3の内容は図6のNo.11〜
No.14のようになる。Pが15でステップ113で
Pを一つ増やして16にしてステップ104に戻ると、
ステップ104でP=Nとなるので、「文書顔ずのデー
タベスを作成する。」という文の処理が終わり、ステッ
プ104からステップ101に戻る。誤りを検出しよう
とする文を1つとすれば、ステップ101からステップ
118に移る。ステップ118では、未知語として記憶
された文字列を解析結果記憶手段3より求め、その文字
列にアンダーラインを付けて表示する。未知語として記
憶された文字列にアンダーラインを付けて表示した例を
図7に示す。この実施例では、「ず」と「データベス」
を未知語として検出することができた。
【0039】
【発明の効果】以上説明したように、この発明に係わる
文章誤り検出装置においては、入力文を構成する互いに
接続可能な単語列がない時には、解析結果記憶手段の内
容を参照して、直前の文節位置まで解析位置を戻し、未
知語を切り出す処理を行い、未知語が終わる位置に解析
位置を戻して解析を再開するという構成にしたため、未
知語の位置を求めるために文章全体を再度解析する必要
がないので、処理時間を短縮することができる。また、
1文中に複数の未知語が存在していても、その未知語の
位置を正確に特定することができる。
【図面の簡単な説明】
【図1】この発明に係わる文章誤り検出装置の概略構成
を示す機能ブロック図。
【図2】日本語辞書の内容の一例を示す図。
【図3】接続関係記憶手段の内容の一部を示す図。
【図4】日本語文章から未知語を検出し未知語を誤りと
して検出する場合の処理手順を示すフローチャート。
【図5】未知語処理手段の処理手順を示すフローチャー
ト。
【図6】解析結果記憶手段に格納された内容の一例を示
す図。
【図7】表示手段の表示例を示す図。
【符号の説明】
1…文章記憶手段、2…文章解析手段、3…解析結果記
憶手段、4…未知語処理手段、5…表示手段、6…日本
語辞書、7…接続関係記憶手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山口 浩 神奈川県横浜市保土ケ谷区神戸町134番地 横浜ビジネスパーク イーストタワー 富士ゼロツクス株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字列を記憶する記憶手段と、前記文字列
    からなる文章を単語単位又は文節単位に解析する文章解
    析手段と、解析の途中経過ならびに解析結果を記憶する
    解析結果記憶手段と、前記文章を構成する互いに接続可
    能な単語列が無い場合に、前記解析結果記憶手段の内容
    を参照して、直前の文節末位置まで解析の状態を戻すと
    共に、文字の種類に応じて所定の解析を継続して行う未
    知語処理手段とを具えたことを特徴とする文章誤り検出
    装置。
JP3208244A 1991-08-20 1991-08-20 文章誤り検出装置 Pending JPH0546612A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3208244A JPH0546612A (ja) 1991-08-20 1991-08-20 文章誤り検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3208244A JPH0546612A (ja) 1991-08-20 1991-08-20 文章誤り検出装置

Publications (1)

Publication Number Publication Date
JPH0546612A true JPH0546612A (ja) 1993-02-26

Family

ID=16553042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3208244A Pending JPH0546612A (ja) 1991-08-20 1991-08-20 文章誤り検出装置

Country Status (1)

Country Link
JP (1) JPH0546612A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100957824B1 (ko) * 2008-03-10 2010-05-13 주식회사 언어과학 문법오류 검사방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100957824B1 (ko) * 2008-03-10 2010-05-13 주식회사 언어과학 문법오류 검사방법

Similar Documents

Publication Publication Date Title
US7424675B2 (en) Language input architecture for converting one text form to another text form with tolerance to spelling typographical and conversion errors
US7165019B1 (en) Language input architecture for converting one text form to another text form with modeless entry
US5680628A (en) Method and apparatus for automated search and retrieval process
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2002517039A (ja) 中国語テキストにおける単語分割
EP1627325B1 (en) Automatic segmentation of texts comprising chunks without separators
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
US7328404B2 (en) Method for predicting the readings of japanese ideographs
JP5097802B2 (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
JP3309174B2 (ja) 文字認識方法及び装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JPH0546612A (ja) 文章誤り検出装置
KR20020054244A (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
Minin et al. Elaborating Russian spelling-correction algorithms with custom n-gram models
JPH087046A (ja) 文書認識装置
JP3084864B2 (ja) 文章入力装置
JP2575947B2 (ja) 文節切出し装置
JPH10240736A (ja) 形態素解析装置
JPH0683862A (ja) 文書作成装置
JPH05233619A (ja) 日本語文章誤り訂正方法およびその装置
JPH11175522A (ja) 自然言語処理方法及び装置
JPH0567076A (ja) かな漢字変換装置
JPH08241315A (ja) 文書処理装置の単語登録機構