JPH0239357A - 日本文誤り自動検定・訂正装置 - Google Patents

日本文誤り自動検定・訂正装置

Info

Publication number
JPH0239357A
JPH0239357A JP63190165A JP19016588A JPH0239357A JP H0239357 A JPH0239357 A JP H0239357A JP 63190165 A JP63190165 A JP 63190165A JP 19016588 A JP19016588 A JP 19016588A JP H0239357 A JPH0239357 A JP H0239357A
Authority
JP
Japan
Prior art keywords
word
dictionary
homophone
words
noun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63190165A
Other languages
English (en)
Inventor
Masahiro Oku
雅博 奥
Yoshihiko Hayashi
良彦 林
Koji Matsuoka
浩司 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63190165A priority Critical patent/JPH0239357A/ja
Publication of JPH0239357A publication Critical patent/JPH0239357A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は日本語文芹処理装置に係り、特に2入力された
日本語文書中から自動的に同音異義語の使用誤りを検出
し、(−の正解候補を提示するE1本文誤り自動検定・
訂正装置に関するくうのである1、〔従来の技術〕 一般に日本語ワー ドブITIセッザでは、かな列を入
力し、単語あるいは文節単位の一括変換を実施するため
、単語変換誤りや変換域誤り等によって同音異義語選択
誤りが発生ずる。この種の同音異義語誤りは、同音異義
語の意味的な使い分けに熟知する必要があるため、単に
原文文書作成の過程で1)作成溝の思込みによる使用誤
りが頻発する。
さらに、文字認識装置においても、文字認識不良による
読取り誤りにより同音異義語誤りが発生する。
従来、入力された日本文文書中の入力誤り、文字認識不
良による読取り誤り、あるいは、カナ漢字変換における
単語の選択誤りにより生じる名詞連続複合語内の同音異
義語誤りの自動検定は、誤りやすい同音異義語を辞書に
マークしておき、入力文書において、辞書中の該同音異
義語の文字列と一致する個所すべてを同音異義語誤りの
候補として抽出していた。
〔発明が解決しようとする課題〕
従来技術においては、入力された日本文中の、辞書にマ
ークしておいた同音異義語の文字列と一致する個所すべ
てを同音異義語誤りの候補とするため、 ■正しく使用
されている語も、すべて誤り候補として抽出してしまう
、■人手による検定とはゾ同じ工数が力いる、■訂正候
補を出力することが困難であるなどの問題があった。
本発明の目的は、上記問題点を解決し、入力された日本
文文書について真に同音異義語誤りであるものを検出し
、その訂正候補を提示する日本文誤り自動検定・訂正装
置を提供することにある。
〔課題を解決するための手段〕
本発明の日本語誤り自動検出装置においては、入力され
た名詞連続複合語を単語列に分割し、各単語の読みや品
詞などの形態素情報を得る第1の手段と、上記名詞連続
複合語を構成する単語と同一である読みを有する単語を
訂正候補として抽出する第2の手段と、上記名詞連続複
合語を構成する単語を該抽出した訂正候補で置き換えた
単語列を生成する第3の手段と、該生成された単語列お
よび該単語列の訂正候補を含む部分単語列のうち、少な
くとも1つの単語列が、日本語単語辞書、ユーザ辞書、
固有名詞辞書、専門用語辞書等のいずれかに登録されて
いる際、入力された名詞連続複合語は同音異義語誤りを
含むと検定し、さらに該単語列の訂正候補を該同音異義
語誤りの正解候補として提示する第4の手段とから構成
されることを特徴とする。
〔作 用〕
上記本発明の日本文誤り自動検定・訂正装置では、入力
装置から入力された日本文文書中の入力誤り、文字認識
不良による読み取り誤り、あるいは、カナ漢字変換にお
ける単語の選択誤りにより生じる名詞連続複合語内の同
音異義語誤りについて、検定の結果、誤っていると判定
された同音異義語のみが抽出される。この抽出された訂
正候補で置き換えた単語列が日本語単語辞書、ユーザ辞
書、固有名詞辞書、専門用語辞書等のいずれかに長単位
で登録されている場合に、その単語列に含まれる訂正候
補を正解として提示することにより、正確な訂正候補が
得られ、訂正作業を容易に行うことができる。
〔実施例〕
以下1本発明の一実施例について図面により説明する。
第1図は本発明の一実施例の構成図を示す。第1図にお
いて、10は日本語誤り自動検定・訂正装置本体であっ
て、ハードウェア的には汎用計算機と同様で演算装置(
CPU)、メモリ等で構成されるが1機能的には、形態
素解析部1、同音異義語訂正候補抽出部2、同音異義語
置換え単語列生成部3、同音異義語検定部4及び辞書検
索部5に分かれる。形態素解析部1は、当該装置10の
入力である名詞連続複合語を、日本語単語辞書6、ユー
ザ辞書7および文法辞書8を用いて単語分割し、各単語
に品詞や読みなどの形態素情報を付与する部分である。
同音異義語訂正候補抽出部2は、該名詞連続複合語を構
成する各単語の読みをキーとして辞書検索を行い、同音
異義語の訂正候補を得る部分である。同音異義語置換え
単語列生成部3は、該名詞連続複合語の部分単語列でか
つ、該名詞連続複合語を構成する訂正候補を有する単語
のうち少なくとも1つの単語を同音異義語訂正候補抽出
部2で得られた訂正候補に置き換えた部分単語列をすべ
て生成する部分である。同音異義語検定部4は、同音異
義語置換え単語列生成部3で生成された部分単語列1つ
1つをキーとして辞書検索を行い、該部分単語列が辞書
見出しと完全にマツチするかまたは部分マツチした場合
には、該部分単語に含まれる訂正候補を同音異義語誤り
の正解候補として出力ファイル9に出力する部分である
。辞書検索部5は、日本語m語辞書6.ユーザ辞書7お
よび文法辞書8を検索する部分である。
日本語単語辞−JI6は日本語単語の品詞情報や読みな
どの形態素情報を記述している7ユーザ辞書7はユーザ
が登録したい語を自由に登録、修正、削除することがで
きるユーザ辞書である。文法辞書8は、日本語単語の持
つ品詞間の接続関係や係り受は関係などの文法情報を記
述している。
第2図は、該日本文誤り自動検定・訂正装置lOの動作
の概略フローである。
(ステップS1) 日本文誤り自動検定・訂正装置10の入力である名詞連
続複合語に対して、形態素解析部1では。
日本語中詰辞書6、ユーザ辞書7および文法辞書8を用
いた単語候補抽出1品詞接続検定などの形態素解析を行
い、該名詞連続複合語を単語分割し、各単語に品詞情報
、読みなどを付与した後、解析結果を同音異義語訂正候
補抽出部2へ送る。
(ステップS2> 同音異義語訂正候補抽出部2では、名詞連続複合語を構
成する各単語の読みをキーとして辞書検索部5に日本語
単語辞書6.ユーザ辞杏7を検索することを要求する。
要求を受番プたn暑検索部5は、日本語単語辞書6、ニ
ー(デ辞書7を各m語の読みで検索し、検索に成功した
場合には、該読みを持つすべての見出し語を訂正候補と
して抽出し、同音異義語訂正候補抽出部2を通して同音
異義語置換え単語列生成部3に送る。
(ステップS3) ステップS2において訂正候補が抽出されなかった場合
には。処理を終了する。1つでも訂正候補が抽出された
場合には、ステップS4に進む。
(ステップS4) 入力された名詞連続複合語の全単語列および部分単語列
のうち、訂正候補を有する単語(ステップS2において
検索に成功した読みを有する単語、以下検定対象単語と
呼ぶ)を少なくとも1つ含み。
かつ、検定対象単語を訂正候補に置き換えた全単語列お
よび部分単語列(以下、全単語列を含めτ部分単語列と
いう)をすべて生成し、同音異義語検定部4に送る。
(ステップS5) 同音異義語検定部4では、同音異義語置換え甲語列生成
部3で生成された部分1語列1つJつについて、その字
面をキーとして辞書検索を行うことを辞書検索部5に要
求する。要求を受(′jた辞書検索部5ば、]」本語単
語辞書6.ユーザ辞書7を部分単語列の字面で検索する
(ステップS6) 検索の結果、日本語単語辞書6またはユーザ辞書7中に
、検索のキーとなった部分単語列そのものが登録されて
いる場合(完全マツチ)、および、検索のキーとなった
部分単語列を含む見出し語が登録されている場合(部分
マツチ)には、辞書中に登録されている見出し語を同音
具a語検定部4に送り、ステップS7へ進む。そうでな
い場合には、ステップS8へ進む。
(ステップS7) 同音異義語検定部4では、ステップS6で検索に成功し
た部分単語列に含まれる訂正候補を元の単語(同音異義
語誤り)の正解候補として出力ファイル9に出力する。
(ステップS8) ステップS4で生成した部分単語列が他にも存在すれば
、それをキーとしてステップS5に戻り、同様の動作を
繰り返す。他に部分単語列が存在しなければ処理を終了
する。
つぎに、具体例について説明するゆこ\で、名詞連続複
合語の形態素解析結果は第3図の如くであるとする。な
お、これらの情報を得る形態素解析の手法についてはこ
5では特に限定しない。
はじめ、日本文誤り自動検定・訂正装置1oの入力とし
て「機会翻訳システム」を考える。この名詞連続複合語
は誤りを含んでおり、正解は「機械翻訳システム」であ
る。
形態素解析部1では、「機会翻訳システム」を日本語単
語辞書6.ユーザ辞#7および文法辞書8を用いて形態
素解析する。この形態素解析結果が第3図(1)であり
、これが同音同義語訂正候補抽出部2に送られる。
同音異義語訂正候補抽出部2では、「機会翻訳システム
」を構成する単語「機会」、「翻訳」、「システム」の
それぞれの読み“きかい′はんやく”しすてむ″をキー
として日本語単語辞書6、ユーザ辞書7を検索すること
を辞書検定部5に要求する。
要求を受けた辞書検索部5は、上記の読み“きかい”、
′はんや<”   ”t、すてむ”をキーとして日本語
単語辞書6、ユーザ辞書7を検索する。
日本語単語辞IF6の内容が第4図のごとくなっている
と、′はんやく”、′しすてむ″をキーとした場合には
元の単語字面のもしか得られないが、″きかい”をキー
とした場合には「機械」、「器械」の2つが訂正候補と
して抽出される。この2つの訂正候補は、同音異義語訂
正抽出部2を通して同音異義語置換え単語列生成部3に
送られ、同時に、「機会」が検定対象語であるこも同音
異義語置換え単語列生成部3に送られる。
同音異義語置換え単語列生成部3では、入力の「機会翻
訳システム」の部分単語列のうち、検定対象語「機会」
を含む部分単語列(この例の場合。
「機会翻訳」と「機会翻訳システム」の2つ)の検定対
象語を訂正候補(この場合、「機械」と「器械」の2つ
)に置き換えた部分単語列をすべて生成する。第5図に
生成される部分単語列を示す、これら4つの部分単語列
(機械翻訳システム、機械翻訳、器械翻訳システム、器
械翻訳)は同音異義語検定部4に送られる。
同音異義語検定部4では、送られてきた4つの部分単語
列(第5図)の字面をキーとして日本語単語辞書6、ユ
ーザ辞書7を検索することを辞書検索部5に要求する。
要求を受けた辞書検索部5は、4つの部分単語列の字面
1つ1つをキーとして日本語単語辞書6、ユーザ辞書7
を検索するが、日本語単語辞書6は第4図のごとくであ
るので、4つの部分単語列(機械翻訳システム、機械翻
訳、器械翻訳システム、器械翻訳)すべて検索に失敗す
る。一方、ユーザ辞書7は第6図のごとくであると、4
つの部分単語列のうち、「機械翻訳」がユーザ辞書7と
完全マツチし、検索に成功する。
辞書検索部5は検索に成功した「機械翻訳」を同音異義
語検定部4に送る。
同音異義語検定部4では、「機械翻訳」に含まれる検定
対象語「機会」の訂正候補「機械」を正解候補として出
力ファイル9に出力する。
この例では、同音異義語検定部4において、辞書との完
全マツチの例を示したが、辞書とのマツチングは部分マ
ツチでも良い(例えば、入力が「機械翻訳」で、辞書項
目が「機械翻訳システム」のとき、辞書を検索するキー
「機械翻訳」は辞書項目「機械翻訳システム」と部分マ
ツチするので、訂正候補として「機械」を出力する)。
次に5日本文誤り自動検定・訂正装置10の入力として
「原価焼却」を考える。この名詞連続複合語は誤りを含
んでおり、正解は「減価償却」である。
検態素解析部1では、「原価焼却」を日本語単語辞書6
、ユーザ辞書7および文法辞書8を用いて形態素解析す
る。この形態素解析結果が第3図(2)であり、これが
同音異義語訂正候補抽出部2に送られる。
同音異義語訂正候補抽出部2では、1M価焼却」を構成
する単語「原価」、「焼却」のそれぞれの読み“げんか
II   11 L、ようきやく”をキーとして日本語
単語辞書6、ユーザ辞書7を検索することを辞書検索部
5に要求する。
要求を受けた辞書検索部5は、上記の読みパげんか”、
シょうきゃ<″をキーとして日本語単語辞書6、ユーザ
辞書7を検索する0日本語単語辞書6の内容が第7図の
ごとくなっていると、“げんか″に対して「減価」が、
′しゃうきゃ<″に対して「消却」、「償却」の2語が
それぞれ訂正候補として抽出される。これら3つの訂正
候補は、同音異義語訂正候補抽出部2を通して同音異義
語置換え単語列生成部3に送られ、同時に、「原価」お
よび「焼却」の2語が検定対象語であることも同音異義
語置換え単語列生成部3に送られる。
同音異義語置換え単語列生成部3では、入力のrR価焼
却」の部分単語列のうぢ、検定対象語「原価」、「焼却
」のうち少なくとも一方を含む部分m語列(この例の場
合、原価焼却のみ)の検定対象語を訂正候補(この場合
、減価と償却および消却の;3つ)に置き換えた部分単
語列をすべて生成する。第8図に生成される部分単語列
示す、二わらの5つの部分単語列(原価償却、原価消却
、減価焼却、減価償却、減価消却)は同音異義語検定部
4に送られる。
同行異義語検定部4では、送られできた5つの部分の部
分貼語列(第8図)の字面をキーとして日本語単語辞書
6.ユーザ辞書7を検索することを辞jト検索部5に要
求する。要求を受けた辞書検索部5は、5つの部分単語
列の字面1つ1つをキーとして日本語単語辞書6、ユー
ザ辞書7を検索するが、日本語単語n書6は第7図のご
とくであるので、部分単語列の1つである[減価償却1
が日本語単語辞書6と完全マツチし、検索に成功する(
他の部分単語列は失敗する)。辞書検索部5は、この検
索に成功した部分単語列1゛減価償却」を同音異義語検
定部4に送る。
同音異義語検定部4では、「減価償却」に1まれる検定
対象語「原価」の訂正候補「減価」と、もう1つの検定
対象語「焼却」の訂正候補1゛信却」の2つをそれぞれ
の正解候補として出カッアイル9に出力する。
以上のようにして、入力された「機会翻訳システム」に
ついては検定対象語゛Cある「機会」の正解語「機械」
が正解候補として、[原価焼却」については検定対象語
である「原価」と「焼却」それぞれの正解語「減価」、
「償却」がilE解候補としてそれぞれ出力ファイル9
に得られる。
上記の2つの例では、検定対象語を含む部分単語列が日
本語単語辞書6またはユーザ辞書7に登録されているが
、登録されていなかった場合には検定対象語は誤りでは
ないとして処理を終ri−る。
また、上記の例では形態素解析において、日本語単語辞
書6.ユーザ辞書7、文法辞書803つを使ったが、さ
らに固有名詞辞書や専用語辞書などを加えることもでき
る。このときには、訂正候補の抽出、同音異義語検定+
、、’おいて、これらの辞書もまた、11本語単語辞暑
6やユーザ辞書7と同様に働く。
第5)図に本発明の他の実施例の構成図に示虻。
第1図どの違いは、同音異義語訂正候補抽出部2におい
て、訂正候補を求める先が、辞書でなく、同音異義語テ
ーブルi ]である点である。同音異義語テーブルJ、
 ]は、検定対象とする単語の読みとその読みを持つ同
音異義の関係にある中、語を集めたテーブルである。第
10図に同音異義語チー・プル」−J、の内容例を示す
7 第9図の動作は、基本的には第1図の実施例と同じであ
るが、同音異義語訂正候補抽出部2の動作が異なる。即
ち、同音異義語訂正抽出部2では、同音異義語テ・−プ
ル11−を名詞連続複合語を構成する各単語の読みで検
索し、該読み紮有する翳語を得る。そして7元の単語と
は、字面が異なる単語すべてを訂正候補として抽出し、
これらを同音異義語置換え単語列生成部3に送る。
第9図の実施例においても、第1図と同じく正解候補が
得られることは明らかである。第9図では、同音異義語
チー・プル11に登@されているもの5みを同音異義語
検定の対象にするので、ユーザが検定したい11語のみ
を検定できるという利点がある。
第11、図に本発明の更に他の実施例の構成図を示す、
第11図との違いは、同音異義語検定部4において、日
本語単語辞書6、ユーザ辞J、ドアだ目でなく、簡易ユ
ーザ辞書】2を検定する点である、簡易ユーザ辞書]2
は、誤りやすい複合語や専門用語などの字面のみを登録
できる簡易ユーザ辞書であって、基本的な形態素情報ず
べてを入力づ−る必要があるユーザ辞書7とは異なるも
のである。
簡易ユ・−ザ辞杏の内容例を第12図に示す。
第11図の動作は、基本的には第1図と同じであるが、
同音異義語検定部4の動作が異なる8即ち、同音異義語
検定部41″!は、辞井検索部5に11本語Q1語辞杏
Gと1・−ザ辞賽7とを部分単語列の字面で検索するこ
とを要求し、辞書引きだけでなく、同音異義語検定部4
にのみ接続された簡易ユーザ辞書12をも検索する。そ
して、部分単語列が1日本語単語辞書6、ユーザ辞書7
、簡易ユーザ辞書12のいずれかに登録されていれば、
登録されていた部分単語列に含まれる訂正候補を正解候
補として出力ファイル9に出力する。
第11図の実施例においても、第1図と同じく正解候補
が得られることは明らかである。さらに、第11図では
簡易ユーザ辞書12も使って同音異義語検定を行うので
、ユーザが持っている校正の知識を複合語という形で容
易に登録でき、この結果、同音異義語の検定・訂正がよ
り正確になるという利点がある。
第13図は本発明の更に他の実施例の構成図を示す。本
実施例は第9図と第11@とを組み合せたものであり、
従って、動作および効果においても、それらを組み合せ
たものとすることは明らかである。
〔発明の効果〕
以上の説明から明らかな如く1本発明の日本文誤り自動
検定・訂正装置によれば次のような効果が得られる。
■ 検定対象である単語を訂正候補に置き換えた名詞連
続複合語の全部または該訂正候補を含む部分単語列が、
長単位で日本語辞書あるいはユーザ辞書に登録されてい
る場合に、この単語に含まれる訂正候補を出方するので
、正確な訂正候補が得られる。
■ 同音異義語の誤りを検出した場合に、その訂正候補
を出力するので、訂正作業を容易に行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、第2図は第1図の
動作の概略フロー図、第3図は形態素解析結果の具体例
を示す図、第4図は日本語単語辞書の内容例を示す図、
第5図は同音異義語置換え単語列生成部で生成される部
分単語列の具体例を示す図、第6図はユーザ辞書の内容
例を示す図、第7@は日本語単語辞書の他の内容例を示
す図。 第8@は同音異義語置換え単語列生成部で生成される部
分単語列の他の具体例を示す図、第9図は本発明の他の
実施例の構成図、第10図は同音異義語テーブルの内容
例を示す図、第11図は本発明の更に他の実施例の構成
図、第12図は簡易ユーザ辞書12の内容例を示す図、
第13図は本発明の更に他の実施例の構成図である。 l・・・形態素解析部、 2・・・同音異義語訂正候補
抽出部、 3・・・同音異義語置換え単語列生成部、4
・・・同音異義語検定部、 5・・・辞書検索部、6・
・・日本語単語辞書、 7・・・ユーザ辞書、8・・・
文法辞書、 9・・・出力ファイル、10・・・日本語
誤り自動検定・訂正装置、11・・・同音異義語テーブ
ル、 12・・・簡易ユーザ辞書。 第1図 糸用連続棧今仔 代理人弁理士  鈴 木   !  耳1,1)゛ \
ヅ 第2図 才じ相 胚hブ 第4 図 第3図 (1〕A竣」鰭シ又?h(正′Nf15..賓県墳I引
あスデリの形鱈總祈(5町(2)錆の方p(正13!f
tz、漬倒I動刑且所伽凍、薯司 一1鶏司 す*s i;+1 第5 図 第8 図 ■EfX’!車r 第7図 第9図 創41t5υ欝否 第11図 1μ鏝材企ti 第13図

Claims (1)

    【特許請求の範囲】
  1. (1)入力日本文中の名詞連続複合語内に含まれる同音
    異義語誤りを自動的に検定、訂正する装置において、 入力された名詞連続複合語を単語列に分割し、各単語の
    読みや品詞などの形態素情報を得る第1の手段と、 上記名詞連続複合語を構成する単語と同一である読みを
    有する単語を訂正候補として抽出する第2の手段と、 上記名詞連続複合語を構成する単語を上記抽出した訂正
    候補で置き換えた単語列を生成する第3の手段と、 上記生成された単語列および該単語列の訂正候補を含む
    部分単語列のうち、少なくとも1つの単語列が、日本語
    単語辞書、ユーザ辞書、固有名詞辞書、専門用語辞書等
    のいずれかに登録されている際に、入力された名詞連続
    複合語は同音異義語誤りを含むと検定し、さらに、該単
    語列の訂正候補を該同音異義語誤りの正解候補として提
    示する第4の手段と、 から構成されることを特徴とする日本文誤り自動検定・
    訂正装置。
JP63190165A 1988-07-29 1988-07-29 日本文誤り自動検定・訂正装置 Pending JPH0239357A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63190165A JPH0239357A (ja) 1988-07-29 1988-07-29 日本文誤り自動検定・訂正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63190165A JPH0239357A (ja) 1988-07-29 1988-07-29 日本文誤り自動検定・訂正装置

Publications (1)

Publication Number Publication Date
JPH0239357A true JPH0239357A (ja) 1990-02-08

Family

ID=16253513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63190165A Pending JPH0239357A (ja) 1988-07-29 1988-07-29 日本文誤り自動検定・訂正装置

Country Status (1)

Country Link
JP (1) JPH0239357A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04174055A (ja) * 1990-11-02 1992-06-22 Chubu Nippon Denki Software Kk 日本語ワードプロセッサの誤変換語検出訂正方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04174055A (ja) * 1990-11-02 1992-06-22 Chubu Nippon Denki Software Kk 日本語ワードプロセッサの誤変換語検出訂正方式

Similar Documents

Publication Publication Date Title
JPS61163467A (ja) 機械翻訳システム
JPS6299865A (ja) 自然言語の共起関係辞書保守方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
Glass et al. A naive salience-based method for speaker identification in fiction books
Van Der Goot et al. Norm It!: Lexical Normalization for Italian and Its Downstream Effects for Dependency Parsing
Tufiş et al. DIAC+: A professional diacritics recovering system
Ganfure et al. Design and implementation of morphology based spell checker
JPH0239357A (ja) 日本文誤り自動検定・訂正装置
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
JPS6190269A (ja) 翻訳方式
Ogrodniczuk et al. Evaluating machine translation of Latin interjections in the digital library of polish and Poland-related news pamphlets
Koskenniemi Guessing lexicon entries using finite-state methods
Ledbetter et al. Cost-effectiveness in building a low-resource morphological analyzer for learner language
Botev et al. Deciphering and Characterizing Out-of-Vocabulary Words for Morphologically Rich Languages
Khoroshilov et al. Machine phraseological translation of scientific-technical texts based on the model of generalized syntagmas
PETIC Lexical derivation approaches for functional extention of computational linguistic resources
JPH01316863A (ja) 日本文誤り自動検定・訂正装置
Rachel et al. Vyakranly: Hindi Grammar & Spelling Errors Detection and Correction System
Ledbetter et al. Automatic morphological analysis of learner Hungarian
Ore et al. Studying language change through indexed and interlinked dictionaries
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
Lowe et al. Computerized tools for reconstruction in Tibeto-Burman
JP2003308319A (ja) 訳語選択装置、翻訳装置、訳語選択プログラム、及び翻訳プログラム
JPH1031676A (ja) 対訳例文検索装置
JP3386520B2 (ja) 仮名漢字変換装置および方法