JP3470927B2 - 自然語解析方法及び装置 - Google Patents

自然語解析方法及び装置

Info

Publication number
JP3470927B2
JP3470927B2 JP11333295A JP11333295A JP3470927B2 JP 3470927 B2 JP3470927 B2 JP 3470927B2 JP 11333295 A JP11333295 A JP 11333295A JP 11333295 A JP11333295 A JP 11333295A JP 3470927 B2 JP3470927 B2 JP 3470927B2
Authority
JP
Japan
Prior art keywords
word
reading
notation
dictionary
furigana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP11333295A
Other languages
English (en)
Other versions
JPH08305698A (ja
Inventor
成人 岩瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11333295A priority Critical patent/JP3470927B2/ja
Publication of JPH08305698A publication Critical patent/JPH08305698A/ja
Application granted granted Critical
Publication of JP3470927B2 publication Critical patent/JP3470927B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然語解析方法及び装
置に係り、特に、人名、企業名、住所、ビル名等を扱う
顧客システムで、人名を姓と名に分割したり、企業名か
ら固有名・職業・地名を抽出する等のテキスト処理を行
う場合の自然語解析方法及び装置に関する。
【0002】詳しくは、複合化された人名・企業名・地
名・職業等の漢字で示された複合化された文字列を単語
分解してふりがなを割り当てる際に正しく付与されてい
るかを解析する自然語解析方法及び装置に関する。
【0003】
【従来の技術】従来の第1の方法として、特開平6−1
9379が開示されている。この方法は、辞書に単語の
表記とふりがなの両方を対にして登録し、表記とふりが
なの両方を同時に解析するものである。
【0004】図は、従来の第1の方法を実現した場合
の単語解析装置の例を示す。同図に示す構成は、表記入
力部110、ふりがな入力部120、表記ふりがな解析
部130、単語辞書140及び出力部150より構成さ
れる。同図の構成において、単語辞書140は、単語と
その単語の読み及び意味が登録されている。表記入力部
110から表記文字列を、ふりがな入力部120からふ
りがなを表記ふりがな解析部130に入力すると、表記
ふりがな解析部130は、単語辞書140を参照して、
入力された文字列を解析する。
【0005】また、従来の第2の方法として、特開平2
−300961が開示されている。この方法は、単語辞
書と一文字毎の読みをもつ文字辞書を使用してふりがな
の解析を行い、出力部150より解析結果を出力する。
は、従来の第2の方法を実現した場合の単語解析装
置の例を示す。同図に示す構成は、ふりがな入力部21
0、表記入力部220、表記解析部230、単語辞書2
40、ふりがな解析部250、文字辞書260及び出力
部270より構成される。文字辞書260は、1文字毎
の読みを持つ。同図の構成において、ふりがな入力部2
10はふりがなをふりがな解析部250に入力し、表
記入力部220は、表記文字列を表記解析部230にそ
れぞれ入力する。表記解析部230は、単語辞書240
を参照して、解析した結果をふりがな解析部250に出
力する。ふりがな解析部250は、入力されたふりがな
と表記文字列の解析結果に基づいて文字辞書260を参
照して、表記と読みの妥当を取得して出力分270よ
り解析結果を出力する。
【0006】
【発明が解決しようとする課題】しかしながら、上記の
従来の第1の方法は、固有名、特に人名では文字の読み
方が多数存在する。従って、単語の読みを考えた時、読
み方の組み合わせは非常に多数になるため、辞書が巨大
なものとなる。
【0007】また、文字の読み方としては新しくなくて
も、単語としては新しい読み方が発生したときに対応で
きないという問題がある。例えば、「昌夫:マサオ」と
「正治:マサハル」が辞書にあっても、「昌治:マサハ
ル」が辞書に登録されていない場合には、対処できない
という問題がある。但し、この場合には、文字単位に読
みを登録した文字辞書があれば対処できる。
【0008】また、従来の第2の方法は、補助情報がな
く、単に1文字毎に読みを持つ辞書のみでは、文字表記
の解析で分割の候補が多数あるとき、正解を決定するこ
とができないので、解析精度が悪くなる。例えば、「福
島県北運輸」を単語分割すると、「福島|県/北/運
輸」と「福島|県北/運輸」が候補として解析される
(/:文節区切り、|:接尾詞区切り)。ここで、ふり
がなが「フクシマケンポクウンユ」の場合には、後者を
正解にすべきであるが、単に漢字と読みとの対応のみを
登録した辞書では処理できない。
【0009】また、表記に間違いを含む場合、表記だけ
の解析では間違いと判断することはできない。例えば、
「末満」の読みが「ミマン」ならば間違いであるが、
「スエミツ」ならば正しい答えである。ふりがな名の解
析結果を表記の解析結果に反映することでは正しく訂正
できるが、上記の従来の方法では表記とふりがな名を別
々に解析しているので正しく訂正できない。
【0010】また、「日本橋本町」を単語分割すると、
「日本橋/本町」と「日本/橋本|町」が候補として出
力されるが、ふりがなが「ニホンバシホンチョウ」のと
き、「橋」に対して「バシ」という濁音化した読みが対
応するが、先頭に濁音化した読みは表れないので、「日
本橋/本町」が正解であるが、上記従来の方法では、正
しい解を特定できない。
【0011】また、人名を含む表記を解析する場合、表
記の解析だけでは、一般名詞と人名の多義を区別できな
い。例えば、「政治」には一般名詞(セイジ)と人名
(マサハル)の読みがある。ふりがなが「マサハル」な
らば、単語の意味は人名であるが、表記とふりがなの解
析を別々に行っていては多義の解消はできない。
【0012】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、分割の多義・意味の多
義を少なくでき、正確な解析が可能な自然語解析方法及
び装置を提供することを目的とする。
【0013】
【課題を解決するための手段】本発明は、複数の単語が
連結した複合語と、当該複合語全体に対するふりがなを
取得し、該複合語を構成する各単語を切り出すと共に、
切り出された各単語個別にふりがなを割り当てるための
自然言語解析方法において、表記入力部により入力され
た前記複合語を、表記解析部が、単語及び該単語の意味
の対を登録した単語辞書及び、単語間の接続関係を登録
した接続文法辞書を用いて、前記複合語の単語分割を行
い、一時記憶部に解候補を格納する表記単語分割過程
と、 ふりがな解析部が、一時記憶部から解候補を一つず
つ選択する解選択過程と、 ふりがな解析部が、選択した
解候補とふりがな入力部から入力された複合語全体に対
するふりがなに基づいて、漢字に対するふりがなを登録
した文字辞書を検索して、単語毎にふりがなを振るふり
がな解析過程と、 表記修正部が、単語に振られたふりが
なの種類に基づいて、単語の接続性をチェックして接続
しないと判断された場合には、該当する解候補を棄却す
る読み種類チェック過程と、 表記修正部が、単語に振ら
れたふりがなの属性に基づいて、解候補の単語の多義を
解消する読み属性チェック過程と、 表記修正部が、単語
に振られたふりがなの修正表記に基づいて、解候補の単
語表記を修正する表記訂正過程と、 解選択過程、ふりが
な解析過程、読み種類チェック過程、読み属性チェック
過程、及び、表記訂正過程を、一時記憶部に格納されて
いる全ての解候補について繰り返す過程と、からなる。
【0014】また、本発明は、表記訂正過程において、
表記修正部が、少なくとも1つの文字からなる被登録単
語に対応する少なくとも1つの種類の読み、該被登録単
語の誤った読みおよび該誤った読みに対応する正しい読
み、または、正しい表記、及び各読みに関連した人名固
有の読み、及び当て字読みを登録した読み文法辞書を参
照して、人名固有の読み、及び当て字に合致する解候補
の単語表記を修正する。
【0015】本発明は、複数の単語が連結した複合語
と、当該複合語全体に対するふりがなを取得し、該複合
語を構成する各単語を切り出すと共に、切り出された各
単語個別にふりがなを割り当てるための自然言語解析装
置であって、 単語及び該単語の意味の対を登録した単語
辞書及び、単語間の接続関係を登録した接続文法辞書
と、 漢字に対するふりがなを登録した文字辞書と、 接続
文法辞書を用いて、複合語の単語分割を行い、一時記憶
部に解候補を格納する表記単語分割手段と、 一時記憶部
から前記解候補を一つずつ選択する解選択手段と文字
辞書を検索して、単語毎にふりがなを振るふりがな解析
手段と、 単語に振られたふりがなの種類に基づいて、単
語の接続性をチェックして接続しないと判断された場合
には、該当する解候補を棄却する読み種類チェック手段
と、 単語に振られたふりがなの属性に基づいて、解候補
の単語の多義を解消する読み属性チェック手段と、 単語
に振られたふりがなの修正表記に基づいて、解候補の単
語表記を修正する表記訂正手段と、からなる。
【0016】また、本発明の表記訂正手段は、 少なくと
も1つの文字からなる被登録単語に対応する少なくとも
1つの種類の読み、該被登録単語の誤った読みおよび該
誤った読みに対応する正しい読み、または、正しい表
記、及び各読みに関連した人名固有の読み、及び当て字
読みを登録した読み文法辞書を参照して、解候補が人名
固有の読み、及び当て字に合致する解候補の単語表記を
修正する手段を含む
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【作用】本発明は、辞書を小さくするために原則として
漢字1文字に読みを登録する。但し、人名等で特殊な読
みをする単語については単語単位で読みを登録する。こ
の場合には必然的に表記は2文字以上になる。一般には
特殊な読みをする単語の数は少ないので、辞書が大きく
なることはない。さらに、この辞書に読みの種類・属性
・訂正情報等の補助情報を登録できるようにする。この
補助情報を用いて表記の解析における分割の多義・単語
の多義を解消し、間違いを訂正する機能を設けることで
解析精度を向上させることが可能となる。
【0029】
【実施例】以下、図面と共に本発明の実施例を説明す
る。図は、本発明の一実施例の自然語解析装置の構成
を示す。同図に示す自然語解析装置は、表記入力部30
1、表記を構成する単語とその意味が登録されている単
語辞書302、単語と単語の接続関係が記述されている
接続文法を登録した接続文法辞書303、表記を単語に
分割する表記解析部304、表記を解析した結果を一時
記憶する一時記憶部305、ふりがなを入力するふりが
な入力部306、1文字毎の漢字の読みと2文字以上の
単語の特殊読みを登録した文字辞書307、表記の単語
毎のふりがなを付与するふりがな解析部308、読みの
種類や属性に関する文法を登録した読み文法辞書30
9、読みの文法を使って表記や表記の意味を修正する表
記修正部310、及び解析結果を出力する出力部311
より構成される。
【0030】なお、以下に、文字辞書307と読み文法
辞書309の2つの辞書について説明する。は、本
発明の一実施例の文字辞書の例を示す。文字辞書307
は、読みの対象となる文字(漢字)、読み、種類・属性
・修正表記、修正読み等が登録されている。例えば、
『東』の読みは、“ヒガシ”、その種類・属性は、“訓
読”である。また、同じ『東』において読みが“ド
ウ”、その種類・属性は“音読”である。また、文字
『末満』の読みは、“ミマン”であり、種類・属性は
“単語訂正”であり、その単語訂正に対する修正表記は
“未満”である。
【0031】なお、文字辞書307の種類・属性、修正
表記及び修正読みは、補助情報と呼ぶものとする。図
は、本発明の一実施例の読み文法辞書の例を示す。読み
文法辞書309は、複数の種類の読み、誤った読み、ま
たは当該誤った読みに対応する正しい読みまたは正し
い表記が登録される。さらに、読み文法辞書309は、
単語または複合語における文字の出現位置と読みの属性
に関する規則を有する。また、読み文法辞書309は、
人名固有の読み及び当て字読みを有する。例えば、文法
として『1文字人名地名』においてその種類・属性は
“1文字”であり、例として「隆:タカシ」が登録され
ている。また、文法として「単語の最後に来ない」につ
いては、その種類・属性は“促音・撥音”であり、例と
して、「学:ガッ、富:トン」が登録されている。
【0032】なお、読み文法辞書309の種類・属性の
項目を補助情報と呼ぶものとする。以下に具体例を用い
て説明する。例えば、読み文法辞書309に読みを登録
する場合には、「末満」に対して「ミマン」というふり
がなの場合、表記漢字が誤っているので、修正表記して
「未満」を登録する。また、「女王」を「ジョウオウ」
と読む場合は間違っているので修正読みに「ジョオウ」
を登録する。
【0033】また、例えば、次のような読みの種類を登
録する。先頭が濁音(半濁音)化した語(畑:バタ
ケ)、末尾の促音(学:ガッ)、末尾の撥音(神:カ
ン)等である。濁音(半濁音)化した単語は語の先頭
に位置しない。促音、撥音は語の末尾には位置しない。
このような内容を読み文法辞書309に登録する。
【0034】また、次のような読みの属性を登録する。
人名用の読み(隆:タカ)、当て字読み(優美子:ユミ
コの優)、1文字読み(勝:マサル)、2文字以上の読
み(工:ク)等の組み合わせで登録する。これらの属性
を利用して読み文法辞書309に登録する。表記修正部
310は読み文法辞書309の属性を利用して表記の単
語の意味や文字数をチェックする。
【0035】次に、ふりがな解析の方法について説明す
る。図は、本発明の一実施例のふりがなの解析を説明
するフローチャートである。ステップ110) まず、
表記入力部301から表記文字列(複合語)が入力され
ると、表記解析部304は、単語辞書302と接続文法
辞書303を参照して、入力された複合語を構成する各
単語に分割した分割結果候補を一時記憶部305に出力
する。
【0036】ステップ120) 次に、ふりがな解析部
308は、一時記憶部305から1つずつ分類結果候補
を選択する。 ステップ130) ふりがな解析部308は、選択した
分類結果候補に含まれる単語とふりがな入力部306か
ら入力されるふりがな名を入力として、文字辞書307
を参照し、分類結果候補に含まれる各単語により当該文
字辞書307を検索して、当該単語に対応する複数の読
みを取得し、各単語毎の読みの候補を取得して、表記修
正部310に転送する。
【0037】ステップ140−1) 表記修正部310
は、読み文法辞書309を参照して、入力された各単語
毎の読みをチェックする。ここで、読みが読み文法の内
容と不一致の場合には、読みに誤りがあると判断され
る。誤りがある場合には、ステップ130に移行して、
他の読みの候補を取得する。また、正しい場合にはステ
ップ140−2に移行する。
【0038】ステップ140−2) 次に、読み文法辞
書309を参照して読み属性をチェックする。読みが読
み文法辞書309の読み属性に一致していない場合に
は、読みに誤りがあると判断される。誤りがある場合に
は、ステップ130に移行して他の読みの候補を取得す
る。また、正しい場合には、ステップ140−3に移行
する。
【0039】ステップ140−3) 次に、表記修正部
310は、読み文法辞書309を参照して、必要であれ
ば、読み文法の訂正に関する補助情報を使用して表記の
修正を行う。 ステップ140−4) 一時記憶部305に格納されて
いる全ての文字列(候補)を解析したら処理を終了す
る。
【0040】上記のように、入力された表記は、表記解
析部304で単語に分割され、一時記憶部305に解の
候補として記憶される。複数の解析結果が有る場合には
複数一時記憶部305に記憶される。次に、ふりがな解
析部308は一時記憶部305から一つずつ解析結果で
ある候補を取り出してふりがなを解析する。まず、先頭
の語から文字辞書307を検索して文字と読みがあるか
をチェックする。見つかったときは、補助情報を参照し
て分割の多義解消、意味の多義解消、表記の修正等を行
う。見つからない場合には、他の候補を解析する。最後
に文字列を全て解析したら終了する。
【0041】図において、ステップ140における表
記の修正については、上記のステップ140−1,14
0−2において、読みの種類のチェック及び読み属性の
チェックで読み文法辞書309に対応しないふりがなで
ある場合には、次の分割結果候補を取得するように制御
されているが、この例に限定されることなく、1つの分
割結果において読み文法辞書309を参照して、適宜修
正することも可能である。
【0042】以下に、具体的な処理を説明する。 (1)先ず、表記を修正する場合について説明する。例
えば、「臨海末満実験室:リンカイミマンジッケンシ
ツ」を単語分解すると「臨海/未満/実験/室」とな
る。ここで、「末満」の読みを解析すると、「ミマン」
が相当するので、文字辞書307の補助情報より表記が
誤っていると解釈し、「臨海/未満/実験/室:リンカ
イ/ミマン/ジッケン/シツ」と出力する。
【0043】(2)次に、解候補を棄却する場合につい
説明する。例えば、「福島県北運輸:フクシマケンポ
クウンユ」を単語に分割すると、「福島|県/北/運
輸」と「福島/県北/運輸」が候補として解析される。
最初に「福島|県/北/運輸」という候補を解析する
と、「北」の読みを解析して「ポク」が相当することが
文字辞書307を参照することによりわかる。さらに、
文字辞書307の補助情報を参照すると、「半濁音化」
と記述してある。さらに、図に示すような読み文法辞
書309を参照すると、「半濁音化した文字は単語の先
頭に来ない」と記述してあるので、この解は棄却され、
「福島/県北/運輸」の解析に移る。この解は正常に終
了し、「福島/県北/運輸:フクシマ/ケンポク/ウン
ユ」が出力部311より出力される。
【0044】(3)次に、多義の解消を行う場合を説明
する。例えば、「鈴木政治事務所:スズキマサハルジム
ショ」を単語分割すると、「鈴木(姓)/政治(事、
名)/事務所(語尾)」と解析される。ここで「政治」
の読みを解析すると「マサハル」が対応する。「政:マ
サ」の補助情報を参照すると人名という設定がされてい
るので、意味を「名」にする。最終的には、「鈴木
(姓)/政治(名)/事務所(語尾):スズキ/マサハ
ル/ジムショ」が出力される。
【0045】(4)また、(2)、(3)に記載された
動作の組み合わせで実現することが可能である。上記の
ように、単語辞書302は、1文字毎の読みを登録する
ので、単語辞書がコンパクトになる。試験データによる
と、ふりがなを単語辞書302に含まないので、単語辞
書302のレコード長が半分に、1単語につき、平均3
個の読みがあるので、レコード数が1/3になる。
【0046】また、単語辞書302以外に文字辞書30
7が追加されると、その大きさは単語辞書の1/3にす
ぎない。全体では、2/9の辞書サイズで入力された複
合語を解析することができる。また、ふりがなの解析結
果を表記の解析結果に反映させるので、 単語の多義を解消できる。 分割の多義を解消できる。 文字辞書に訂正情報を登録すれば間違いを訂正でき
る。
【0047】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0048】
【発明の効果】上述のように本発明の自然語解析方法及
び装置によれば、分割の多義・意味の多義を少なくでき
るので、正確な解析が可能となる。また、間違え易い単
語を訂正情報として辞書に登録すれば、自動的に訂正で
きる。その結果、正確に姓名、住所、ビル名等が抽出す
ることが可能である。
【図面の簡単な説明】
【図1】本発明の一実施例の自然語解析装置の構成図で
ある。
【図2】本発明の一実施例の文字辞書の例を示す図であ
る。
【図3】本発明の一実施例の読み文法辞書の例を示す図
である。
【図4】本発明の一実施例のふりがな解析を説明するた
めのフローチャートである。
【図5】従来の第1の方法を実施した場合の単語解析装
置の例を示す図である。
【図6】従来の第2の方法を実現した場合の単語解析装
置の例を示す図である。
【符号の説明】
301 表記入力部 302 単語辞書 303 接続文法辞書 304 表記解析部 305 一時記憶部 306 ふりがな入力部 307 文字辞書 308 ふりがな解析部 309 読み文法辞書 310 表記修正部 311 出力部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 550 G06F 17/22 512

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の単語が連結した複合語と、当該複
    合語全体に対するふりがなを取得し、該複合語を構成す
    る各単語を切り出すと共に、切り出された各単語個別に
    ふりがなを割り当てるための自然言語解析方法におい
    て、表記入力部により入力された前記複合語を、表記解析部
    が、単語及び該単語の意味の対を登録した単語辞書及
    び、単語間の接続関係を登録した接続文法辞書を用い
    て、前記複合語の単語分割を行い、一時記憶部に解候補
    を格納する表記単語分割過程と、 ふりがな解析部が、前記一時記憶部から前記解候補を一
    つずつ選択する解選択過程と、 前記ふりがな解析部が、選択した解候補とふりがな入力
    部から入力された前記複合語全体に対するふりがなに基
    づいて、漢字に対するふりがなを登録した文字辞書を検
    索して、単語毎にふりがなを振るふりがな解析過程と、 表記修正部が、単語に振られたふりがなの種類に基づい
    て、単語の接続性をチェックして接続しないと判断され
    た場合には、該当する解候補を棄却する読み種類チェッ
    ク過程と、 前記表記修正部が、単語に振られたふりがなの属性に基
    づいて、前記解候補の単語の多義を解消する読み属性チ
    ェック過程と、 前記表記修正部が、前記単語に振られたふりがなの修正
    表記に基づいて、前記解候補の単語表記を修正する表記
    訂正過程と、 前記解選択過程、前記ふりがな解析過程、前記読み種類
    チェック過程、前記読み属性チェック過程、及び、前記
    表記訂正過程を、前記一時記憶部に格納されている全て
    の解候補について繰り返す過程と、 からなることを 特徴とする自然語解析方法。
  2. 【請求項2】 前記表記訂正過程において、 前記表記修正部が、少なくとも1つの文字からなる被登
    録単語に対応する少なくとも1つの種類の読み、該被登
    録単語の誤った読みおよび該誤った読みに対応する正し
    い読み、または、正しい表記、及び各読みに関連した人
    名固有の読み、及び当て字読みを登録した読み文法辞書
    を参照して、人名固有の読み、及び当て 字に合致する解
    候補の単語表記を修正する請求項1記載の自然語解析方
    法。
  3. 【請求項3】 複数の単語が連結した複合語と、当該複
    合語全体に対するふりがなを取得し、該複合語を構成す
    る各単語を切り出すと共に、切り出された各単語個別に
    ふりがなを割り当てるための自然言語解析装置であっ
    て、 単語及び該単語の意味の対を登録した単語辞書及び、単
    語間の接続関係を登録した接続文法辞書と、 漢字に対するふりがなを登録した文字辞書と、 前記接続文法辞書を用いて、前記複合語の単語分割を行
    い、一時記憶部に解候補を格納する表記単語分割手段
    と、 前記複合語全体に対するフリガナが入力されると、前記
    一時記憶部から前記解候補を一つずつ選択し、前記文字
    辞書を検索して、単語毎にふりがなを振るふりがな解析
    手段と、 単語に振られたふりがなの種類に基づいて、単語の接続
    性をチェックして接続しないと判断された場合には、該
    当する解候補を棄却する読み種類チェック手段と、 単語に振られたふりがなの属性に基づいて、前記解候補
    の単語の多義を解消する読み属性チェック手段と、 単語に振られたふりがなの修正表記に基づいて、前記解
    候補の単語表記を修正する表記訂正手段と、 からなることを特徴とする自然語解析装置。
  4. 【請求項4】 前記表記訂正手段は、 少なくとも1つの文字からなる被登録単語に対応する少
    なくとも1つの種類の読み、該被登録単語の誤った読み
    および該誤った読みに対応する正しい読み、または、正
    しい表記、及び各読みに関連した人名固有の読み、及び
    当て字読みを登録した読み文法辞書を参照して、人名固
    有の読み、及び当て字に合致する解候補の単語表記を修
    正する手段を含む請求項3記載の自然語解析装置。
JP11333295A 1995-05-11 1995-05-11 自然語解析方法及び装置 Expired - Lifetime JP3470927B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11333295A JP3470927B2 (ja) 1995-05-11 1995-05-11 自然語解析方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11333295A JP3470927B2 (ja) 1995-05-11 1995-05-11 自然語解析方法及び装置

Publications (2)

Publication Number Publication Date
JPH08305698A JPH08305698A (ja) 1996-11-22
JP3470927B2 true JP3470927B2 (ja) 2003-11-25

Family

ID=14609566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11333295A Expired - Lifetime JP3470927B2 (ja) 1995-05-11 1995-05-11 自然語解析方法及び装置

Country Status (1)

Country Link
JP (1) JP3470927B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101083540B1 (ko) * 2009-07-08 2011-11-14 엔에이치엔(주) 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법
JP5937496B2 (ja) * 2012-11-26 2016-06-22 日本電信電話株式会社 読み仮名誤り検出装置、方法並びにプログラム
JP6221764B2 (ja) * 2014-01-20 2017-11-01 富士通株式会社 読み推定装置、読み推定方法及び読み推定用コンピュータプログラム

Also Published As

Publication number Publication date
JPH08305698A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
JPH07325828A (ja) 文法チェックシステム
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
US20040193399A1 (en) System and method for word analysis
US6393444B1 (en) Phonetic spell checker
JP3470927B2 (ja) 自然語解析方法及び装置
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JPS5892063A (ja) イデイオム処理方式
Krause et al. Lemmatizing German newspaper texts with the aid of an algorithm
JP3548372B2 (ja) 文字認識装置
JPH0363767A (ja) テキスト音声合成装置
JPS63163956A (ja) 文書作成・校正支援装置
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
JPH0589281A (ja) 誤読修正・検出方法
JPH01114976A (ja) 文書処理装置の辞書構造
JPH0682366B2 (ja) 文字列訂正方式
JP3118880B2 (ja) 日本語文章処理装置
JPS63234348A (ja) 文章校正支援方式
JPS61177574A (ja) 日本語文章作成装置
Hays An Introduction to Computational Procedures in Linguistic Research
JPS62247481A (ja) 文字認識後処理方式
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH0773174A (ja) 日本語処理システム
Khine et al. Myanmar Words Sorting
JPH02136959A (ja) 日本文訂正候補抽出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term