JPH0850588A - 未知語登録装置 - Google Patents

未知語登録装置

Info

Publication number
JPH0850588A
JPH0850588A JP6185555A JP18555594A JPH0850588A JP H0850588 A JPH0850588 A JP H0850588A JP 6185555 A JP6185555 A JP 6185555A JP 18555594 A JP18555594 A JP 18555594A JP H0850588 A JPH0850588 A JP H0850588A
Authority
JP
Japan
Prior art keywords
unit
candidate
unknown word
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6185555A
Other languages
English (en)
Other versions
JP3257264B2 (ja
Inventor
Takao Fukushige
貴雄 福重
Masanori Takahashi
雅則 高橋
Tadashi Nagano
正 永野
Hideko Mori
秀子 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP18555594A priority Critical patent/JP3257264B2/ja
Publication of JPH0850588A publication Critical patent/JPH0850588A/ja
Application granted granted Critical
Publication of JP3257264B2 publication Critical patent/JP3257264B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 未知語登録に構文解析を用いることにより、
効率の良い未知語登録作業が可能な未知語登録装置を提
供する。 【構成】 構文解析部109が、候補保持部108に保
持された候補を用いて構文解析を行い、候補評価部11
1が構文解析結果に基づき候補の評価を行うことによ
り、無駄な候補お排除すると共に、構文解析により得ら
れる文法情報を活用することで未知語の登録においてユ
ーザが新たに文法情報を入力する作業を軽減でき、未知
語の辞書への効率的な登録を実現できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語処理装置にお
ける、未知語(辞書への未登録語)の登録装置に関する
ものである。
【0002】
【従来の技術】未知語登録装置は、ワープロや機械翻訳
装置などにおける処理において、システムが使用する辞
書に、語句が登録されていないことにより発生する不都
合を解消するために、システムが使用する辞書に新しい
語句を追加登録する装置である。
【0003】以下に、従来の未知語登録装置について説
明する。図6は、従来の未知語登録装置の構成を示すも
のである。従来例の未知語処理装置は、原文入力部60
1と、形態素解析部602と、活用規則保持部603
と、辞書検索/編集部604と、参照用辞書605と、
未知語保持部606と、候補作成部607と、候補保持
部608と、候補表示部609と、コマンド入力部61
0と、未知語登録制御部611と、登録用辞書612と
を有している。
【0004】以上のように構成された従来の未知語登録
装置について、以下その動作について説明する。図7
は、従来の未知語登録装置の動作を示したものである。
まず原文入力部601に入力された原文に対して形態素
解析が行なわれる(701)。未知語が文中に現れた場
合、まず、形態素解析部602が未知語を検出する。検
出された未知語は、未知語保持部606に保持される。
次に候補作成部607が活用規則保持部603に格納さ
れた活用規則を参照して、未知語に対する文法情報を、
未知語の形態的情報から推定する(702)。
【0005】候補は候補表示部609によってユーザに
示される(703)。ユーザは示された文法情報候補の
中から、適切と判断するものを選択する(704)。こ
の時点で、ユーザは必要ならば候補の持つ文法情報の編
集をコマンド入力部610を介して行なえる(70
5)。ユーザは必要な編集を行なった後、辞書への登録
が必要ならコマンド入力部610を通して登録を指示す
る。辞書への登録が必要ない場合は、登録をしないこと
もできる。辞書への登録コマンドは、コマンド入力部6
10から未知語登録制御部611を経由して辞書検索/
編集部604に送られる。辞書検索/編集部604は辞
書への登録コマンドにしたがって、候補保持部中の候補
のうち、現在選択されているものを登録用辞書に登録す
る(706)。
【0006】
【発明が解決しようとする課題】しかしながら、上記の
構成では、日本語などのように活用語尾などの形態的情
報により品詞などの文法情報が特定しやすい言語におい
ては、未知語に対する文法情報の推定が比較的有効に行
なわれるが、英語などのように、活用の少ない言語や、
中国語などのように活用のない言語においては、未知語
の字面だけを見ても文法情報の推定が有効に行なわれな
いという課題があった。
【0007】また、未知語が動詞などであった場合、取
り得る目的語の数や格などの文法情報に関しては、形態
的情報としては現れないため、推定ができないという課
題があった。
【0008】本発明は、上記従来の課題を解決するもの
で、形態的情報から文法情報を推定しにくい言語におい
ても、文法情報の推定をより有効に行なえ、また、形態
的情報により推定できない種類の文法情報に関しても有
効な推定を行なえ、その結果従来の未知語登録装置に比
べてより効率の良い未知語登録作業が可能な未知語登録
装置を提供することを目的とする。
【0009】
【課題を解決するための手段】この課題を達成するため
に、本発明の未知語処理装置は、形態素解析を行ない未
知語を検出する形態素解析部と、検出された未知語を保
持する未知語保持部と、活用規則を保持する活用規則保
持部と、活用規則保持部に格納された活用規則を参照し
て、未知語の形態的情報から未知語の文法情報を推定す
る候補作成部と、推定された文法情報の候補を保持する
候補保持部と、形態素解析、構文解析に必要な単語の情
報を格納した参照用辞書と、新しく単語に関する情報を
登録するための登録用辞書と、形態素解析部の行なう形
態素解析のために参照用辞書と登録用辞書を検索すると
ともに、辞書への登録コマンドにしたがって登録辞書へ
の登録を行なう、辞書検索/編集部と、候補保持部に格
納された候補を利用して構文解析を行なう構文解析部
と、構文解析結果を保持する構文情報保持部と、構文情
報保持部に格納された構文解析結果を参照し、未知語に
対して推定された文法情報の候補の適切さを評価し、不
適切な候補を棄却し、残った候補について優先順位づけ
を行ない、各候補を優先度順に候補保持部に格納しなお
す候補評価部と、候補表示部に格納された候補をユーザ
に示す候補表示部と、ユーザからのコマンドを取得する
コマンド入力部と、入力された辞書への登録コマンドを
辞書検索/編集部へ送る未知語登録制御部とを有してい
る。
【0010】
【作用】この構成によって、未知語が文中に現れた場
合、まず、形態素解析部が未知語を検出する。検出され
た未知語は、未知語保持部に保持される。次に候補作成
部が活用規則保持部に格納された活用規則を参照して、
未知語の形態的情報から未知語の文法情報を推定する。
推定された文法情報の候補は候補保持部に格納される。
次に、構文解析部が、候補保持部に格納された候補を利
用して構文解析を行なう。構文解析結果は構文情報保持
部に格納される。
【0011】次に候補評価部が構文情報保持部に格納さ
れた構文解析結果を参照し、未知語に対して推定された
各文法情報の候補の適切さを評価し、不適切な候補を棄
却する。また、残った候補についても構文規則や単語の
使用頻度、共起頻度等に基づき優先順位づけを行ない、
各候補を優先度順に候補保持部に格納しなおす。
【0012】格納しなおされた候補は候補表示部によっ
てユーザに示される。ユーザは示された文法情報候補の
中から、適切と判断するものを選択する。この時点で、
ユーザは必要ならば候補の持つ文法情報の編集をコマン
ド入力部を介して行なえる。ユーザは必要な編集を行な
った後、辞書への登録をコマンド入力部を通して指示す
る。辞書への登録コマンドは、コマンド入力部から未知
語登録制御部を経由して辞書検索/編集部に送られる。
辞書検索/編集部は辞書への登録コマンドにしたがっ
て、候補保持部中の候補のうち、現在選択されているも
のを登録用辞書に登録する。
【0013】このように作用することにより、各未知語
に対して、形態的情報から推定される文法情報の中か
ら、その語を取り巻く構文的状況に対して不適切なもの
は、あらかじめ捨てられ、最も状況に適したものから順
にユーザに示される。
【0014】したがって、構文情報を考慮しない場合に
比べて、ユーザに示される候補は絞られており、未知語
の辞書への登録が効率的になる。また、形態的情報だけ
からは得られない格情報等の文法的情報も、構文解析結
果から推定されているので、ユーザは新たに入力する必
要がなく、効率的に未知語を登録できる。
【0015】
【実施例】
(実施例1)以下本発明の一実施例について、図面を参
照しながら説明する。本実施例は、機械翻訳装置におけ
る未知語登録装置の使用例である。 図1において、1
01は原文入力部、102は形態素解析部、103は活
用規則保持部、104は辞書検索/編集部、105は参
照用辞書、106は未知語保持部、107は候補作成
部、108は候補保持部、109は構文解析部、110
は構文情報保持部、111は候補評価部、112は候補
表示部、113はコマンド入力部、114は未知語登録
制御部、115は登録用辞書、116は変換生成部、1
17は訳文出力部である。
【0016】以上のように構成された機械翻訳装置につ
いて、1文の翻訳を行なう時の動作を図2を用いて説明
する。まず、原文入力部101に入力された第1言語の
原文に対して形態素解析が行なわれる(201)。未知
語が文中に現れた場合、まず、形態素解析部102が未
知語を検出する。検出された未知語は、未知語保持部1
06に保持される。次にすべての未知語に対して、候補
作成部107が活用規則保持部103に格納された活用
規則を参照して、未知語の形態的情報から未知語の文法
情報を推定する(202)。
【0017】推定された文法情報の候補は候補保持部1
08に格納される。次に、構文解析部が、候補保持部1
08に格納された候補を利用して構文解析を行なう(2
03)。構文解析結果は構文情報保持部110に格納さ
れる。次に候補評価部111が構文情報保持部110に
格納された構文解析結果を参照し、各未知語に対して推
定された各文法情報の候補の適切さを評価し、不適切な
候補を棄却する。
【0018】また、残った候補についても優先順位づけ
を行ない、各候補を優先度順に候補保持部108に格納
しなおす(204)。格納しなおされた候補は候補表示
部112によってユーザに示される(205)。ユーザ
は示された文法情報候補の中から、適切と判断するもの
を選択する(206)。この時点で、ユーザは必要なら
ば候補の持つ文法情報の編集をコマンド入力部113を
介して行なえる(207)。
【0019】ユーザは必要な編集を行なった後、辞書へ
の登録が必要ならコマンド入力部113を通して登録を
指示する。辞書への登録が必要ない場合は、登録をしな
いこともできる。辞書への登録コマンドは、コマンド入
力部113から未知語登録制御部114を経由して辞書
検索/編集部104に送られる。辞書検索/編集部10
4は辞書への登録コマンドにしたがって、候補保持部1
08中の候補のうち、現在選択されているものを登録用
辞書115に登録する(208)。
【0020】すべての未知語について、文法情報の選択
(および必要に応じて修正・登録)が終ると、構文解析
部109は、選択・修正された文法情報を用いて、 再
度構文解析を行ない、 その結果を構文情報保持部11
0に書き込む(209)。変換生成部116は、構文情
報保持部110に格納された構文解析結果をもとに、対
応する第2言語の文の生成を行ない、訳文出力部17に
渡す(210)。訳文出力部117は渡された第2言語
の文を出力する(211)。
【0021】図3は、従来例における未知語登録時の画
面例と、本実施例における未知語登録時の画面例を比較
したものである。ここでは、例として、”My mot
her runs her own car.”という
文において、”runs”という単語が未知語であった
とする(図3(a))。
【0022】まず、従来例においては、”runs”に
対して形態情報から文法情報の候補の絞り込みをおこな
う。ここでは、簡単のために、未知語として名詞と動詞
がありうるとシステムによって仮定されているとする。
この場合、形態情報から可能なのは、「名詞単数形」
「名詞複数形(単数形”run”)」「動詞1・2人称
現在単数形/現在複数形」「動詞3人称現在単数形(原
形”run”)」である。不規則変かの場合も考えれ
ば、「動詞過去形」なども可能だが、ここでは簡単のた
めに形態的情報の分析により候補が以上の4つに限定さ
れたとする(図3(b))。 この時、ユーザは、示され
た4つの候補の中から正しい候補「動詞3人称現在単数
形(原形”run”)」を選択する。これに対して、本
実施例においては、”runs”という語に対して、形
態的に可能として候補保持部に格納された上記の4つの
候補に対して、例えばそれぞれを仮定して構文解析が成
功するかどうか調べるということにより、構文的に可能
かどうかという観点で絞り込みが行なわれる。この場
合、入力文が英語の構文的に正しい文となるのは、”r
uns”が動詞であり、”My mother”が主語
であり、”her owncar”が目的語である場合
のみであり、さらに、主語である”My mothe
r”が単数であることから、主語と動詞の数の一致によ
り動詞である”runs”も単数形でなければいけな
い。
【0023】ここで、構文解析部10において、英語の
文法的制限が十分に具現化されており、これらに反する
構文解析結果は生成されないものと仮定すると、”ru
ns”に対する上記の4つの候補を当てはめて構文解析
を行なうと、4つの候補のうち、構文的に可能なのは
「動詞3人称現在単数形(原形”run”)」に限られ
ることがわかる。したがって、ユーザには、「動詞3人
称現在単数形(原形”run”)」の候補のみが示さ
れ、ユーザは、それを確認することによって、選択を行
なう(図3c)。
【0024】さらに、本実施例においては、この未知
語”runs”は、直接目的語をとるということも構文
情報から判明しているので、それもユーザに示され、ユ
ーザはそれを確認することによって、”run(s)”
が直接目的語をとるという情報を辞書に登録することが
できる。
【0025】従来例において”run(s)”が直接目
的語をとるという情報を辞書に登録するには、「動詞3
人称現在単数形(原形”run”)」選択後、それが直
接目的語をとるかとらないかを、ユーザが何らかの手段
で入力しなければならなかった。
【0026】以上のように、本実施例においては、形態
素解析を行ない未知語を検出する形態素解析部と、検出
された未知語を保持する未知語保持部と、活用規則を保
持する活用規則保持部と、活用規則保持部に格納された
活用規則を参照して、未知語の形態的情報から未知語の
文法情報を推定する候補作成部と、推定された文法情報
の候補を保持する候補保持部と、形態素解析、構文解析
に必要な単語の情報を格納した参照用辞書と、新しく単
語に関する情報を登録するための登録用辞書と、形態素
解析部の行なう形態素解析のために参照用辞書と登録用
辞書を検索するとともに、辞書への登録コマンドにした
がって登録辞書への登録を行なう、辞書検索/編集部
と、候補保持部に格納された候補を利用して構文解析を
行なう構文解析部と、構文解析結果を保持する構文情報
保持部と、構文情報保持部に格納された構文解析結果を
参照し、未知語に対して推定された文法情報の候補の適
切さを評価し、不適切な候補を棄却し、残った候補につ
いて優先順位づけを行ない、各候補を優先度順に候補保
持部に格納しなおす候補評価部と、候補表示部に格納さ
れた候補をユーザに示す候補表示部と、ユーザからのコ
マンドを取得するコマンド入力部と、入力された辞書へ
の登録コマンドを辞書検索/編集部へ送る未知語登録制
御部とを設けることにより、未知語の登録においてユー
ザが新たに文法情報を入力する作業を軽減でき、未知語
の辞書への効率的な登録を実現できる。
【0027】(実施例2)以下、本発明の第2の実施例
について、図面を参照しながら説明する。本発明の第2
の実施例は、構成は第1の実施例と同一であるが、一つ
の語句に対して行なった未知語登録結果により、構文解
析結果が更新され、他の未知語に対する文法情報の候補
の再評価が行なわれるという点において動作が異なる。
【0028】図4は、本発明の第2の実施例における動
作を示す図である。まず、原文入力部101に入力され
た第1言語の原文に対して形態素解析が行なわれる(4
01)。未知語が文中に現れた場合、まず、形態素解析
部102が未知語を検出する。検出された未知語は、未
知語保持部106に保持される。次にすべての未知語に
対して、候補作成部107が活用規則保持部103に格
納された活用規則を参照して、未知語の形態的情報から
未知語の文法情報を推定する(402)。
【0029】推定された文法情報の候補は候補保持部1
08に格納される。次に、構文解析部109が、候補保
持部に格納された候補を利用して構文解析を行なう(4
03)。構文解析結果は構文情報保持部110に格納さ
れる。次に候補評価部111が構文情報保持部110に
格納された構文解析結果を参照し、各未知語に対して推
定された各文法情報の候補の適切さを評価し、不適切な
候補を棄却する。また、残った候補についても優先順位
づけを行ない、各候補を優先度順に候補保持部に格納し
なおす(404)。
【0030】格納しなおされた候補は候補表示部112
によってユーザに示される(405)。ユーザは示され
た文法情報候補の中から、適切と判断するものを選択す
る(406)。この時点で、ユーザは必要ならば候補の
持つ文法情報の編集をコマンド入力部を介して行なえる
(407)。ユーザは必要な編集を行なった後、辞書へ
の登録が必要ならコマンド入力部113を通して登録を
指示する。辞書への登録が必要ない場合は、登録をしな
いこともできる。辞書への登録コマンドは、コマンド入
力部113から未知語登録制御部114を経由して辞書
検索/編集部104に送られる。
【0031】辞書検索/編集部104は辞書への登録コ
マンドにしたがって、候補保持部中の候補のうち、現在
選択されているものを登録用辞書115に登録する(4
08)。この時点で、新たに登録あるいは確認された未
知語に対する文法情報を利用して入力文に対して再度構
文解析が行なわれる。そして、その結果をもとに残りの
未知語に対する文法情報の候補の絞り込みが行なわれ、
再度ユーザに示され、ユーザの指示を待つことになる。
【0032】ここでは、新たに未知語に対して文法情報
が登録あるいは確認されるたびに構文解析を繰り返し、
残りの未知語に対する文法情報の新しい候補としたが、
最初に構文解析を行なった時に、いくつかの未知語の持
つ文法情報間に成り立つ共起関係を構文情報保持部11
0において記憶しておき、新たに登録あるいは確認され
た文法情報と矛盾のないもののみを残りの未知語に対す
る文法情報の新しい候補としてもよい。
【0033】すべての未知語について、文法情報の選択
(および必要に応じて修正・登録)が終ると、変換生成
部は、構文情報保持部に格納されている最新の構文解析
結果をもとに、対応する第2言語の文の生成を行ない、
訳文出力部に渡す(409)。訳文出力部は渡された第
2言語の文を出力する(410)。
【0034】図5は、実施例1における未知語登録時の
画面例と実施例2における未知語登録時の画面例を比較
したものである。ここでは、例として、”Time f
lies like an arrow.”という文に
おいて、”Time”という単語と”flies”とい
う単語が未知語であったとする(図5a)。
【0035】まず、両実施例において共通に、”Tim
e”,”flies”に対して形態情報と構文情報から
文法情報の候補の絞り込みをおこなう。ここでも、簡単
のために、未知語として名詞と動詞がありうるとシステ
ムによって仮定されているとする。この場合、形態的、
構文的に可能なのは、(表1)に示す7通りの組合せで
ある。不規則変化などを考えに入れると実際はもっと可
能な組合せは出てくるが、動作の根本には影響しないの
で簡単のために、組合せはそれらに限定して説明する。
【0036】
【表1】
【0037】このとき、最初はユーザに対しては、”T
ime”、”flies”の両方について、それぞれ可
能な候補が示される。ユーザはこれに対し、まずどちら
かの語について文法情報の確認あるいは登録を行なう。
【0038】ユーザはどちらの語について先に文法情報
の確認あるいは登録を行なっても良いが、ここでは、ユ
ーザが未知語”Time”に対して、 それが「直接目
的語をとる動詞原形」であると指定したとする。する
と、本実施例では、その情報を、元に残りの”flie
s”の文法情報候補について絞り込みが行なわれる。
(表1)に示したように、 ”Time”が「直接目的
語をとる動詞原形」である場合、”flies”の文法
情報として可能なのは、「名詞単数形・無冠詞で用い
る」、「名詞複数形(単数形fly)」、「名詞複数形
(単数形flie)」の三つであるから、ユーザに対し
て改めて提示される”flies”の文法情報の候補は
それら三つになる(図5c)。
【0039】これに対して、実施例1の場合は、改めて
候補の絞り込みは行なわないので、ユーザに示されれ
る”flies”の文法情報の候補は5つのままである
(図5d)。
【0040】従来例の場合は、構文情報を参照しないの
で、絞り込みが起こらないのはいうまでもない。
【0041】以上のように、本実施例においては、形態
素解析を行ない未知語を検出する形態素解析部と、検出
された未知語を保持する未知語保持部と、活用規則を保
持する活用規則保持部と、活用規則保持部に格納された
活用規則を参照して、未知語の形態的情報から未知語の
文法情報を推定する候補作成部と、推定された文法情報
の候補を保持する候補保持部と、形態素解析、構文解析
に必要な単語の情報を格納した参照用辞書と、新しく単
語に関する情報を登録するための登録用辞書と、形態素
解析部の行なう形態素解析のために参照用辞書と登録用
辞書を検索するとともに、辞書への登録コマンドにした
がって登録辞書への登録を行なう、辞書検索/編集部
と、候補保持部に格納された候補を利用して構文解析を
行なう構文解析部と、構文解析結果を保持する構文情報
保持部と、構文情報保持部に格納された構文解析結果を
参照し、未知語に対して推定された文法情報の候補の適
切さを評価し、不適切な候補を棄却し、残った候補につ
いて優先順位づけを行ない、各候補を優先度順に候補保
持部に格納しなおす候補評価部と、候補表示部に格納さ
れた候補をユーザに示す候補表示部と、ユーザからのコ
マンドを取得するコマンド入力部と、入力された辞書へ
の登録コマンドを辞書検索/編集部へ送る未知語登録制
御部とを設け、さらに一つの語句に対して行なった未知
語登録結果により、構文解析結果が更新され、他の未知
語に対する文法情報の候補の再評価が行なわれるように
することにより、未知語の登録においてユーザが新たに
文法情報を入力する作業を軽減でき、未知語の辞書への
効率的な登録を実現できる。
【0042】なお、実施例において、未知語登録装置は
機械翻訳装置の一部になっている例を説明したが、本発
明の未知語登録装置はワードプロセッサなど機械翻訳装
置以外の装置に応用できることはいうまでもない。その
場合、実施例における、「変換生成部」と「訳文出力
部」が、その装置の中心的処理によって置き換えられこ
とになる。
【0043】
【発明の効果】以上のように本発明は、コマンド入力部
と、未知語登録制御部と、形態素解析部と、未知語保持
部と、活用規則保持部と、候補作成部と、候補保持部
と、候補表示部と、辞書検索/編集部と、参照用辞書
と、登録用辞書と、構文解析部と、構文情報保持部と、
候補評価部とを設けることにより、未知語の登録におい
てユーザが新たに文法情報を入力する作業を軽減でき、
未知語の辞書への効率的な登録を実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における未知語登録装置
の構成図
【図2】本発明の第1の実施例における未知語登録装置
の動作を示す流れ図
【図3】(a)未知語”runs”を含む例文図 (b)従来例における表示画面図 (c)本発明の第1の実施例における表示画面図
【図4】本発明の第2の実施例における未知語登録装置
の動作を示す流れ図
【図5】(a)未知語”Time”、”flies”を
含む例文図 (b)本発明の第1、第2の実施例における最初の表示
画面図 (c)本発明の第2の実施例における2番目の表示画面
図 (d)本発明の第1の実施例における2番目の表示画面
【図6】従来の未知語登録装置の構成図
【図7】従来の未知語登録装置の動作を表す流れ図
【符号の説明】
101 原文入力部 102 形態素解析部 103 活用規則保持部 104 辞書検索/編集部 105 参照用辞書 106 未知語保持部 107 候補作成部 108 候補保持部 109 構文解析部 110 構文情報保持部 111 候補評価部 112 候補表示部 113 コマンド入力部 114 未知語登録制御部 115 登録用辞書 116 変換生成部 117 訳文出力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 8420−5L G06F 15/38 E 8420−5L C (72)発明者 森 秀子 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 形態素解析を行ない未知語を検出する形
    態素解析部と、検出された未知語を保持する未知語保持
    部と、活用規則を保持する活用規則保持部と、活用規則
    保持部に格納された活用規則を参照して、未知語の形態
    的情報から未知語の文法情報を推定する候補作成部と、
    推定された文法情報の候補を保持する候補保持部と、形
    態素解析、構文解析に必要な単語の情報を格納した参照
    用辞書と、新しく単語に関する情報を登録するための登
    録用辞書と、形態素解析部の行なう形態素解析のために
    参照用辞書と登録用辞書を検索するとともに、辞書への
    登録コマンドにしたがって登録辞書への登録を行なう、
    辞書検索/編集部と、候補保持部に格納された候補を利
    用して構文解析を行なう構文解析部と、構文解析結果を
    保持する構文情報保持部と、構文情報保持部に格納され
    た構文解析結果を参照し、未知語に対して推定された文
    法情報の候補の適切さを評価し、不適切な候補を棄却
    し、残った候補について優先順位づけを行ない、各候補
    を優先度順に候補保持部に格納しなおす候補評価部と、
    候補表示部に格納された候補をユーザに示す候補表示部
    と、ユーザからのコマンドを取得するコマンド入力部
    と、入力された辞書への登録コマンドを辞書検索/編集
    部へ送る未知語登録制御部とを備えた未知語登録装置。
  2. 【請求項2】 候補評価部が、一つの語句に対して行な
    った未知語登録結果により更新された構文解析結果に基
    づき、他の未知語に対する文法情報の候補の再評価を行
    うことを特徴とする請求項第1項記載の未知語登録装
    置。
JP18555594A 1994-08-08 1994-08-08 未知語登録装置 Expired - Fee Related JP3257264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18555594A JP3257264B2 (ja) 1994-08-08 1994-08-08 未知語登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18555594A JP3257264B2 (ja) 1994-08-08 1994-08-08 未知語登録装置

Publications (2)

Publication Number Publication Date
JPH0850588A true JPH0850588A (ja) 1996-02-20
JP3257264B2 JP3257264B2 (ja) 2002-02-18

Family

ID=16172862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18555594A Expired - Fee Related JP3257264B2 (ja) 1994-08-08 1994-08-08 未知語登録装置

Country Status (1)

Country Link
JP (1) JP3257264B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078962A (ja) * 2002-08-15 2004-03-11 Microsoft Corp コーパスの中のテキストを構文解析する方法および記録媒体
JP2008176392A (ja) * 2007-01-16 2008-07-31 Nec Corp 新語収集装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078962A (ja) * 2002-08-15 2004-03-11 Microsoft Corp コーパスの中のテキストを構文解析する方法および記録媒体
JP2008176392A (ja) * 2007-01-16 2008-07-31 Nec Corp 新語収集装置、方法およびプログラム

Also Published As

Publication number Publication date
JP3257264B2 (ja) 2002-02-18

Similar Documents

Publication Publication Date Title
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
JP3575242B2 (ja) キーワード抽出装置
JP3257264B2 (ja) 未知語登録装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JPS61282969A (ja) 言語翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JP3244286B2 (ja) 翻訳処理装置
JP2719453B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JPH01126767A (ja) 辞書参照装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JPH03240876A (ja) 機械翻訳装置
JPH07141382A (ja) 外国語文書作成支援装置
JPS63136264A (ja) 機械翻訳装置
JPH01185766A (ja) かな漢字変換装置
JPH07200592A (ja) 文章処理装置
JPH0785057A (ja) 構文解析方法及び装置
JPH05225228A (ja) 指示詞照応装置
JPH02110771A (ja) 電訳機
JPS63136268A (ja) 機械翻訳装置
JPH0443462A (ja) 翻訳後校正支援システム
JPH02302874A (ja) 自然言語の解析変換方法
JPH0793333A (ja) 自動翻訳装置
JPH07182349A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071207

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091207

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees