JP2595043B2 - 日本文誤り自動検定装置 - Google Patents

日本文誤り自動検定装置

Info

Publication number
JP2595043B2
JP2595043B2 JP63138886A JP13888688A JP2595043B2 JP 2595043 B2 JP2595043 B2 JP 2595043B2 JP 63138886 A JP63138886 A JP 63138886A JP 13888688 A JP13888688 A JP 13888688A JP 2595043 B2 JP2595043 B2 JP 2595043B2
Authority
JP
Japan
Prior art keywords
word
determination table
concatenation
category
homonym
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63138886A
Other languages
English (en)
Other versions
JPH01307861A (ja
Inventor
雅博 奥
勝美 島崎
伸一郎 高木
浩司 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63138886A priority Critical patent/JP2595043B2/ja
Publication of JPH01307861A publication Critical patent/JPH01307861A/ja
Application granted granted Critical
Publication of JP2595043B2 publication Critical patent/JP2595043B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は日本語文書処理装置に係り、特に、入力され
た日本語文書中から自動的に同音異義語の使用誤りを指
摘し、その訂正候補を提示する日本文誤り自動検定装置
に関するものである。
〔従来の技術〕
一般に日本語ワードプロセッサでは、かな列を入力
し、単語あるいは文節単位の一括変換を実施するため、
単語変換誤りや変換域誤り等によって同音異義語選択誤
りが発生する。この種の同音異義語誤りは、同音異義語
の意味的な使い分けを熱知する必要があるため、単に原
文文書作成の過程でも作成者の思込みによる使用誤りが
頻発する。さらに、文字認識装置においても、文字認識
不良による読取り誤りにより同音異義語誤りが発生す
る。
従来、入力された日本文中の入力誤り、文字認識不良
による読取り誤り、あるいは、カナ漢字変換における単
語の選択誤りにより生じる名詞連続複合語内の同音異義
語誤りの自動検定は、誤りやすい同音異義語を辞書にマ
ークしておき、入力文書において、辞書中の該同音異義
語の文字列と一致する個所すべてを同音異義語誤りの候
補として抽出していた。
〔発明が解決しようとする課題〕
従来技術においては、入力された日本文中の、辞書に
マークしておいた同音異義語の文字列と一致する個所す
べてを同音異義語誤りの候補とするため、 正しく使
用されている語も、すべて語り候補として抽出してま
う、 人手による検定とほゞ同じ工数がかゝる、
訂正候補を出力することが困難であるなどの問題があっ
た。
本発明の目的は、上記問題点を解決し、入力された日
本文について的確に同音異義語誤りを指摘して、訂正候
補を提示する日本文誤り自動検定装置を提供することに
あるる。
〔課題を解決するための手段〕
本発明の日本語誤り自動検定装置においては、名詞を
その意味によって分類するための意味カテゴリ体系に基
づいて、同音異義語の字面とその読みの2つをキーと
し、該同音意義語の字面と、その直前直後に位置する単
語の持つ意味カテゴリとの連接可否情報を記述した意味
カテゴリ連接判定テーブルと、入力日本文の形態素解析
を行い、名詞連続複合語を単語列に分割する第1手段
と、名詞連続複合語を構成する各単語の字面をキーとし
て前記意味カテゴリ連接判定テーブルを検索し、検索に
成功した場合には、この単語を同音異義語使用誤りの検
定対象単語とする第2手段と、前記検定対象単語をキー
として持つ前記意味カテゴリ連接判定テーブル中のレコ
ードに記述されている情報を用いて、該検定対象単語を
含む名詞連続複合語の構成単語のうち、該検定対象単語
の直前または直後の単語の持つカテゴリと、該検定対象
単語との連接の可否を判定し、連接不可の場合に誤りで
あると検定する第3手段と、前記誤りであると検定され
た同音異義語に対して、該同音異義語の読みをキーとし
て前記意味カテゴリ連接判定テーブルを検索し、該同音
異義語に対する訂正候補を抽出し、出力する第4手段と
から構成される。
〔作 用〕
入力された日本文中の名詞連続複合語を構成する各単
語の字面をキーとして前方/後方意味をカテゴリ連接判
定テーブルを検索し、検索に成功した場合には、この単
語を検定対象単語として同音異義語使用誤りの検定を開
始する。そして、該検定対象単語をキーとして持つ前記
意味カテゴリ連接判定テーブル中のレコードに記述され
ている情報を用いて、該検定対象単語を含む名詞連続複
合語の構成単語のうち、該検定対象単語の直前または直
後の単語を持つ意味カテゴリと、該検定対象単語との連
接の可否を判定し、誤りであると検定された同音異義語
に対しては、該同音異義語の読みをキーとして前記意味
カテゴリ連接判定テーブルを検索し、該同音異義語に対
する訂正候補を抽出する。
これにより名詞連続複合語に含まれる同音異義語の誤
りを該名詞連続複合語を構成する名詞の意味カテゴリを
用いて自動的に検定でき、しかも、検定の結果、誤って
いると判定されたものゝみを抽出し、同音異義語の誤り
を検出した場合、あらかじめ作成した意味カテゴリ連接
判定テーブル中から訂正候補を抽出し、出力することが
できる。
〔実施例〕
以下、本発明の一実施例について図面により説明す
る。
第1図は本発明の一実施例の基本構成図を示す。第1
図において、11は日本語誤り自動検定装置本体で、ハー
ド的にはCPU、メモリ等で構成されが、機能的には形態
素解析部1、同音異義語抽出部2、同音異義語検定部
3、同音異義語候補抽出部4及び意味カテゴリ連接判定
テーブル検索部5よりなる。形態素解析部1は本装置11
の入力である名詞連続複合語を、日本語単語辞書6と文
法辞書7とを用いて単語分割し、各単語に品詞や意味カ
テゴリなどの付与を行う。同音異義語抽出部2は該名詞
連続複合語中に同音異義語が存在するか否かを、前方/
後方意味カテゴリ連接判定テーブル8,9を用いて判定
し、存在する場合には該同音異義語を抽出する。同音異
義語検定部3は同意味カテゴリ連接判定テーブル8,9の
該同意異義語に関する情報を用いて該同音異義語が直前
または直後に位置する単語と連接しうるかどうかを判定
することによって、該同音異義語の使用誤りを検定す
る。同音異義語候補抽出部4は、同意味カテゴリ連接判
定テーブル8,9を該同音異義語の読みをキーとして検索
し、訂正候補を抽出する。意味カテゴリ連接判定テーブ
ル検索部5は同意味カテゴリ連接判定テーブル8,9を検
索するものである。
日本語単語辞書6は日本語単語の品詞情報や意味カテ
ゴリなどの形態素情報を記述している。文法辞書7は日
本語単語の持つ品詞間の接続関係や係り受け案系などの
文法情報を記述している。前方意味カテゴリ連接判定テ
ーブル8は、同音異義語の字面とその読みの2つをキー
として持ち、該同音異義語と、その直前に位置する単語
の持つ意味カテゴリとの間の連接可否情報を記述してい
る。後方意味カテゴリ連接判定テーブル9は、同音異義
語の字面とその読みを2つのキーとして持ち、該同音異
義語と、その直後に位置する単語の持つ意味カテゴリと
の間の連接可否情報を記述している。10は出力ファイル
である。
第2図は日本文誤り自動検定装置11の動作の概略フロ
ーである。
日本文誤り自動検定装置11の入力である名詞連続複合
語に対して、形態素解析部1では、日本語単語辞書6、
文法辞書7を用いた単語候補抽出、品詞接続検定などの
形態素解析を行い、該名詞連接複合語を単語分割し、そ
れぞれの単語に品詞情報、意味カテゴリなどを付与した
のち、解析結果を同音異義語抽出部2へ送る(ステップ
S1)。同音異義語抽出部2では、名詞連続複合語を構成
する各名詞の字面をキーとして前方/後方意味カテゴリ
連接判定テーブル8,9を検索するように意味カテゴリ連
接判定テーブル検索部5に要求する。
要求を受けた意味カテゴリ連接判定テーブル検索部5
では、 検索すべき単語が名詞連続複合語において先
頭の単語である場合には、後方意味カテゴリ連接判定テ
ーブル9を検索し、 検索すべき単語が名詞連続複合
語において最後尾の単語である場合には、前方意味カテ
ゴリ連接判定テーブル8を検索し、 どちらでもない
場合には、前方意味カテゴリ連接判定テーブル8、後方
意味カテゴリ連接判定テーブル9の両方を検索する(ス
テップS2)。おして、検索に成功した場合(以下、検索
に成功した単語のことを検定対象単語と呼ぶ)には、検
索に成功した意味カテゴリ連接判定テーブル名(の場
合には後方意味カテゴリ連接判定テーブル、の場合に
は前方意味カテゴリ連接判定テーブル、の場合には一
方または両方の意味カテゴリ連接判定テーブル、以下で
は、検定対象テーブルと呼ぶ)とそのレコードの情報す
べてを同音異義語抽出部2に送る(ステップS3,S4)。
検索に失敗した場合には処理を終了する。
同音異義語抽出部2では、意味カテゴリ連接判定テー
ブル検索部5から送られてきた情報と、形態素解析部1
から送られてきている形態素解析結果とを同音異義語検
定部3に送る。
同音異義語検定部3では、まず、 検定対象テーブ
ルが前方意味カテゴリ連接判定テーブル8である場合に
は、検定対象単語の直前に位置する単語(被検定単語)
のもつ意味カテゴリを、形態素解析結果から取出し、
検定対象テーブルが後方意味カテゴリ連接判定テーブ
ル9である場合には、検定対象単語の直後に位置する単
語(被検定単語)の持つ意味カテゴリを、形態素解析結
果から取出す(ステップS5)。なお、検定対象テーブル
が両方の意味カテゴリ連接判定テーブル8,9である場合
には,の両方の単語の意味カテゴリを取出す。
さらに、同音異義語検定部3では、検定対象テーブル
内の検定対象単語に対するレコード中の連接可否情報が
記述されているフィールドにおいて、被検定対象単語の
持つ意味カテリとの連接が可であるか、不可であるかを
検定し(ステップS6)、連接可の場合には、「連接OK」
として処理を終了し(ステップS7)、連続不可の場合に
は、「誤りである」とする(ステップS8)。そして、こ
れらの情報を同音異義語候補抽出部4に送る。
同音異義語候補抽出部4では、同音異義語検定部3か
ら送られてきた「誤りである」と判定された語の読みを
キーとして検定対象テーブルを検索し、「誤りである」
と判定された語に対する訂正候補を抽出し(ステップS
9)、出力ファイル10に出力する(ステップS10)。
第3図に前方意味カテゴリ連接判定テーブル8のフィ
ールド構成例を示す。なお、後方意味カテゴリ連接判定
テーブル9についても同様である。12は意味カテゴリ連
接判定テーブルを検索するときのキーとなる同音異義語
の字面、13は同音異義語候補抽出部4において意味カテ
ゴリ連接判定テーブルを検索する際のキーとなる同音異
義語の読み、14はあらかじめ設けた意味カテゴリ体系
(第3図では、N個の意順カテゴリからなる)の各意味
カテゴリに対して付与した番号対応に、12の字面とこの
直前に位置する単語の持つ意味カテゴリ(後方意味カテ
ゴリ連接判定テーブルの場合には直後に位置する単語の
持つ意味カテゴリ)との連接可否情報を記述したカテゴ
リ番号対応の連接可否情報部、15は14の各意味カテゴリ
番号の連接可否情報を示すフィールドであり、#nは連
接可の場合は「○」、連接不可の場合には「×」を表し
ている。16は前方意味カテゴリ連接テーブルの1レコー
ドである。
以下、具体例について説明する。こゝで、名詞連続複
合語の形態素解析結果は第4図の如くであるとする。第
4図で意味カテゴリと意味カテゴリ番号とは1:1に対応
している。従って、意味カテゴリが決まれば、意味カテ
ゴリ番号も一意に決まる。第5図に前方意味カテゴリ連
接判定テーブル8の内容例を、第6図に後方意味カテゴ
リ連接判定テーブル9の内容例をそれぞれ示す。
(1)前方意味カテゴリ連接判定テーブル8を検索する
場合 日本文誤り自動検定装置11の入力として“自然化学”
を考える。この名詞連続複合語は、誤りを含んでおり、
正解は“自然科学”である。
形態素解析部1では、“自然化学”を日本語単語辞書
6、文法辞書7を用いて形態素解析し、第4図(1)如
く、“自然”と“化学”に単語分割する。この形態素解
析結果は同音異義語抽出部2に送られる。
同音異義語抽出部2では、“自然化学”を構成する名
詞“自然”と“化学”をキーとして意味カテゴリ連接判
定テーブル検索部5に前方/後方意味カテゴリ連接判定
テーブル8,9を検索するように要求する。
要求を受けた意味カテゴリ連接判定テーブル検索部5
では、まず“自然”について処理を行う。“自然”は、
名詞連続複合語“自然化学”の先頭の単語であるので、
後方意味カテゴリ連続判定テーブル9を“自然”をキー
として検索する。後方意味カテゴリ連接判定テーブル9
の内容は、第6図のごとくであるので、“自然”に対し
ては検索が失敗する。次に“化学”について処理を行
う。“化学”は、名詞連続複合語“自然化学”の最後尾
の単語であるので、前方意味カテゴリ連接判定テーブル
8を“化学”をキーとして検索する。前方意味カテゴリ
連接判定テーブル8の内容は、第5図のごとくであるの
で、“化学”に対する検索は成功する。従って、検定対
象単語=化学、検定対象テーブル=前方意味カテゴリ連
接判定テーブルとし、“化学”に対する前方意味カテゴ
リ連接判定テーブル8中の情報すべてを同音異義語抽出
部2に送る。
同音異義語抽出部2では、第4図(1)の形態素解析
結果と意味カテゴリ連接判定テーブル検索部5から送ら
れてきた情報すべてを同音異義語検定部3に送る。
同音異義語検定部3では、検定対象テーブル=前方意
味カテゴリ連接判定テーブルであるので、検定対象単語
=化学の直前に位置する単語“自然”(=被検定単語)
の持つ意味カテゴリ=「自然」(意味カテゴリ番号=2
4)を形態素解析結果(第4図(1))より取出す。さ
らに同音異義語検定部3では、第5図の前方意味カテゴ
リ連接判定テーブル8中の“化学”に関するレコードに
おいて、意味カテゴリ番号=24が連接可能かどうかを見
る。第5図より、意味カテゴリ番号=24に対する連接は
不可である(第5図において24の位置が「×」となって
いる)。従って、「誤りである」と判定し、これらの情
報を同音異義語候補抽出部4に送る。
同音異義語候補抽出部4では、「誤りである」と判定
された語“化学”の読み“かがく”をキーとして検定対
象テーブル=前方意味カテゴリ連接判定テーブル8を検
索する。第5図より明らかなように、訂正候補としては
“科学”が得られる。これを出力ファイル10に出力す
る。
以上のようにして、正解である“科学”を訂正候補と
して出力ファイル10に出力することができる。
(2)後方意味カテゴリ連接判定テーブル9を検索する
場合 日本文誤り自動検定装置11の入力として“科学実験”
を考える。この名詞連続複合語は、語りを含んでおり、
正解“化学実験”である。
形態素解析部1では、“科学実験”を日本語単語辞書
6、文法辞書7を用いて形態素解析し、第4図(2)の
如く、“科学”と“実験”に単語分割する。この形態素
解析結果は同音異義語抽出部2に送られる。
同音異義語抽出部2では、“科学実験”を構成する名
詞“科学”と“実験”をキーとして意味カテゴリ連接判
定テーブル検索部5に前方/後方意味カテゴリ連接判定
テーブル8,9を検索するように要求する。
要求を受けた意味カテゴリ連接判定テーブル検索部5
では、まず“科学”について処理を行う。“科学”は、
名詞連続複合語“科学実験”の先頭の単語であるので、
後方意味カテゴリ連接判定テーブル9を“科学”をキー
として検索する。後方意味カテゴリ連接判定テーブル9
の内容は、第6図のごとくであるので、“科学”に対す
る検索は成功する。次に“実験”について処理を行う。
“実験”は、名詞連続複合語“科学実験”の最後尾の単
語であるので、前方意味カテゴリ連接判定テーブル8を
“実験”をキーとして検索する。前方意味カテゴリ連接
判定テーブル8の内容は、第5図のごとくであるので、
“実験”に対して検索が失敗する。従って、検定対象単
語=科学、検定対象テーブル=後方意味カテゴリ連接判
定テーブルとし、“科学”に対する後方意味カテゴリ連
接テーブル9中の情報すべてを同音異義語抽出部2に送
る。
同音異義語抽出部2では、第4図(2)の形態素解析
結果と意味カテゴリ連接判定テーブル検索部5から送ら
れてきた情報すべてを同音異義語検定部3に送る。
同音異義語検定部3では、検定対象テーブル=後方意
味カテゴリ連接判定テーブルであるので、検定対象単語
=科学の直後に位置する単語“実験”(=被検定単語)
の持つ意味カテゴリ=「思考」(意味カテゴリ番号=8
7)を形態素解析結果(第4図(2))より取出す。さ
らに同音異義語検定部3では、第6図の後方意味カテゴ
リ連接判定テーブル9中の“科学”に関するレコードに
おいて意味カテゴリ番号=87が連接可能かどうかを見
る。第6図より意味カテゴリ番号=87に対する連接は不
可である(第6図において87の位置が「×」となってい
る)。従って、「誤りである」と判定し、これらの情報
を同音異義語候補抽出部4に送る。
同音異義語候補抽出部4では、「誤りである」と判定
された語“科学”の読み“かがく”をキーとして検定対
象テーブル=後方意味カテゴリ連接判定テーブルを検索
する。第6図より明らかなように訂正候補としては“化
学”が得られる。これを出力ファイル10に出力する。
このようにして、正解である“化学”を訂正候補とし
て出力ファイル10に出力することができる。
(3)前方意味カテゴリ連接判定テーブル8、後方意味
カテゴリ連接判定テーブル9の両方を検索する場合 日本文誤り自動検定装置11の入力として“全面帰省撤
廃”を考える。この名詞連続複合語は、語りを含んでお
り、正解は“全面規制撤廃”である。
形態素解析部1では、“全面帰省撤廃”を日本語単語
辞書6、文法辞書7を用いて形態素解析し、第4図
(3)の如く“全面”、“帰省”および“撤廃”に単語
分割する。この形態解析結果は同音異義語抽出部2に送
られる。
同音異義語抽出部2では、“全面帰省撤廃”を構成す
る名詞“全面”、“帰省”および“撤廃”をキーとして
意味カテゴリ連接判定テーブル検索部5に意味カテゴリ
連接判定テーブル8,9を検索するように要求する。
要求を受けた意味カテゴリ連接判定テーブル検索部5
では、まず“全面”について処理を行う。“全面”は、
名詞連続複合語“全面帰省撤廃”の先頭の単語であるの
で、後方意味カテゴリ連接判定テーブル9を“全面”を
キーとして検索する。後方意味カテゴリ連接判定テーブ
ル9の内容は、第6図のごとくであるので、“全面”に
対する検索は失敗する。次に“帰省”について処理を行
う。“帰省”は、名詞連続複合語“全面帰省撤廃”の中
間に位置する単語であるので、前方意味カテゴリ連接判
定テーブル8および後方意味カテゴリ連接判定テーブル
9の両方を“帰省”をキーとして検索する。前方意味カ
テゴリ連接判定テーブル8の内容は、第5図のごとくで
あるので、“帰省”に対する検索は成功する。また、後
方意味カテゴリ連接判定テーブル9の内容は、第6図の
ごとくであるので、同じく“帰省”に対する検索は成功
する。次に、“撤廃”について処理を行う。“撤廃”
は、名詞連続複合語”全面帰省撤廃”の最後尾の単語で
あるので、前方意味カテゴリ連接判定テーブル8を“撤
廃”をキーとして検索する。前方意味カテゴリ連接判定
テーブル8の内容は、第5図のごとくであるので、“撤
廃”に対しては検索が失敗する。従って、検定対象単語
=帰省、検定対象テーブル=前方意味カテゴリ連接判定
テーブルおよび後方意味カテゴリ連接判定テーブルと
し、“帰省”に対する前方意味カテゴリ連接判定テーブ
ル8中の情報すべてと後方意味カテゴリ連接判定テーブ
ル9中の情報すべてとを同音異義語抽出部2に送る。
同音異義語抽出部2では、第4図(3)の形態素解析
結果と意味カテゴリ連接判定テーブル検定部5から送ら
れてきた情報すべてを同音異義語検定部3に送る。
同音異義語検定部3では、検定対象テーブル=前方意
味カテゴリ連接判定テーブルおよび後方意味カテゴリ連
接判定テーブルであるので、まず、前方意味カテゴリ連
接判定テーブル8による検定を試みる。検定対象単語=
帰省の直後に位置する単語“撤廃”(=被検定単語)の
持つ意味カテゴリ=「発生・消滅」(意味カテゴリ番号
=112)を形態素解判結果(第4図(3))より取出
す。さらに同音異義語検定部3では、第5図の前方意味
カテゴリ連接判定テーブル8中の“帰省”に関するレコ
ードにおいて、意味カテゴリ番号=112が連接可能かど
うかを見る。第5図より意味カテゴリ番号=112に対す
る連接は不可である(第5図において112の位置が
「×」となっている)。次に、後方意味カテゴリ連接判
定テーブル9による検定を試みる。検定対象単語=帰省
の直前に位置する単語“全面”(=被検定単語)の持つ
意味カテゴリ=「全体・部分」(意味カトゴリ番号=15
8)を形態素解析結果(第4図(3)より取出す。さら
に同音異義検定部3では、第6図の後方意味カテゴリ連
接判定テーブル9中の“帰省”に関するレコードにおい
て、意味カテゴリ番号=158が連接可能かどうかを見
る。第6図より意味カテゴリ番号=158に対する連接は
不可である(第6図において158の位置が×となってい
る)。従って、「誤りである」と判定し、これらの情報
を同音異義語候補抽出部4に送る。なお、こゝでは、前
方、後方とも連接不可であるが、一方が連接不可である
場合も「誤りである」と判定する。
同音異義語候補抽出部4では、「誤りである」と判定
された語“帰省”の読み“きせい”をキーとして検定対
象テーブル=前方意味カテゴリ連接判定テーブルおよび
後方意味カテゴリ連接判定テーブルを検索する。第5図
より前方意味カテゴリ連接判定テーブル8からは訂正候
補として“規制”と“規整”とが得られる。また、第6
図より後方意味カテゴリ連接判定テーブル9からは訂正
候補として“規制”が得られる。両者の和である“規
制”と“規整”とを出力ファイル10に出力する。
なお、以上の例では説明していないが、単語が複数の
意味カテゴリを持つ場合には、すべての組合せについて
検定を行い、1ケ所でも連接可のものがあれば「連接O
K」とする。
このようにして、正解である“規制”を含む訂正候補
群を出力ファイル10に出力することができる。
〔発明の効果〕
以上の説明から明らかなように、本発明の日本文誤り
自動検定装置によれば次のような効果が得られる。
(1)名詞連続複合語に含まれる同音異義語の誤りを該
名詞連続複合語を構成する名詞の意味カテゴリを用いて
自動的に検定することにより、誤って使用されているも
のゝみを的確に抽出することができる。
(2)同音異義語の誤りを検出した場合、あらかじめ作
成した意味カテゴリ連接判定テーブル中から訂正候補を
抽出し、出力することができ、訂正作業を容易に行うこ
とができる。
(3)検定の結果、誤っていると判定されたものゝみを
抽出し、訂正候補を提示するのであるから、人手による
検定よりも工数が小さい。
【図面の簡単な説明】
第1図は本発明の一実施例の基本構成図、第2図は第1
図の動作を説明するための概略フロー図、第3図は前方
意味カテゴリ連接判定テーブルのフィールド構成例を示
す図、第4図は名詞連続複合語の形態素解析結果の一例
を示す図、第5図は前方意味カテゴリ連接判定テーブル
の内容例を示す図、第6図は後方意味カテゴリ連接判定
テーブルの内容例を示す図である。 1……形態素解析部、2……同音異義語抽出部、3……
同音異義語検定部、4……同音異義語候補抽出部、5…
…意味カテゴリ連接判定テーブル検索部、6……日本語
単語辞書、7……文法辞書、8……前方意味カテゴリ連
接判定テーブル、9……後方意味カテゴリ連接判定テー
ブル、10……出力ファイル、11……日本文誤り自動検定
装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松岡 浩司 東京都千代田区内幸町1丁目1番6号 日本電信電話株式会社内 (56)参考文献 特開 昭58−82368(JP,A) 特開 昭60−3017(JP,A) 特開 昭61−3267(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力日本文中の名詞連続複合語内に含まれ
    る同音異義語誤りを自動的に検出及び訂正する装置にお
    いて、 名詞をその意味によって分類するための意味カテゴリ体
    系に基づいて、同音異義語の字面とその読みの2つをキ
    ーとし、該同音意義語の字面と、その直前直後に位置す
    る単語の持つ意味カテゴリとの連接可否情報を記述した
    意味カテゴリ連接判定テーブルと、 入力日本文の形態素解析を行い、名詞連続複合語を単語
    列に分割する第1手段と、 名詞連続複合語を構成する各単語の字面をキーとして前
    記意味カテゴリ連接判定テーブルを検索し、検索に成功
    した場合には、この単語を同音異義語使用誤りの検定対
    象単語とする第2手段と、 前記検定対象単語をキーとして持つ前記意味カテゴリ連
    接判定テーブル中のレコードに記述されている情報を用
    いて、該検定対象単語を含む名詞連続複合語の構成単語
    のうち、該検定対象単語の直前または直後の単語の持つ
    カテゴリと、該検定対象単語との連接の可否を判定し、
    連接不可の場合に誤りであると検定する第3手段と、 前記誤りであると検定された同音異義語に対して、該同
    音異義語の読みをキーとして前記意味カテゴリ連接判定
    テーブルを検索し、該同音異義語に対する訂正候補を抽
    出し、出力する第4手段と、 から構成されることを特徴とする日本文誤り自動検定装
    置。
JP63138886A 1988-06-06 1988-06-06 日本文誤り自動検定装置 Expired - Lifetime JP2595043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63138886A JP2595043B2 (ja) 1988-06-06 1988-06-06 日本文誤り自動検定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63138886A JP2595043B2 (ja) 1988-06-06 1988-06-06 日本文誤り自動検定装置

Publications (2)

Publication Number Publication Date
JPH01307861A JPH01307861A (ja) 1989-12-12
JP2595043B2 true JP2595043B2 (ja) 1997-03-26

Family

ID=15232417

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63138886A Expired - Lifetime JP2595043B2 (ja) 1988-06-06 1988-06-06 日本文誤り自動検定装置

Country Status (1)

Country Link
JP (1) JP2595043B2 (ja)

Also Published As

Publication number Publication date
JPH01307861A (ja) 1989-12-12

Similar Documents

Publication Publication Date Title
US7243305B2 (en) Spelling and grammar checking system
US5680628A (en) Method and apparatus for automated search and retrieval process
US8027966B2 (en) Method and system for searching a multi-lingual database
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPS61163467A (ja) 機械翻訳システム
US20050086214A1 (en) Computer system and method for multilingual associative searching
JP2595043B2 (ja) 日本文誤り自動検定装置
JP2595047B2 (ja) 日本文誤り自動検定・訂正装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
KR100422809B1 (ko) 기계 번역을 위한 장문 분할 방법
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP3308723B2 (ja) 統語解析装置
JP3109187B2 (ja) 形態素解析方式
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
JP2546486B2 (ja) 文書解析方法および装置
JP2718966B2 (ja) 誤り検出装置
JPH02105968A (ja) 日本文誤り自動検定・訂正方式
JPH06149872A (ja) 文章入力装置
JPH09223143A (ja) 文書情報処理装置
JPH052602A (ja) 推敲支援システム
JPH0758491B2 (ja) 日本文誤り自動検定・訂正装置
JPH0546612A (ja) 文章誤り検出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071219

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 12