JPS6337472A - 冠詞設定方式 - Google Patents
冠詞設定方式Info
- Publication number
- JPS6337472A JPS6337472A JP61179937A JP17993786A JPS6337472A JP S6337472 A JPS6337472 A JP S6337472A JP 61179937 A JP61179937 A JP 61179937A JP 17993786 A JP17993786 A JP 17993786A JP S6337472 A JPS6337472 A JP S6337472A
- Authority
- JP
- Japan
- Prior art keywords
- article
- language
- database
- information
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims abstract description 22
- 238000013519 translation Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000002910 structure generation Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、冠詞を設定する方式に係り、例えば機械翻訳
システムで訳文を生成する方式に関する。
システムで訳文を生成する方式に関する。
従来、第一言語から第二言語へ文章を翻訳する処理装置
では、例えば特公昭59−121574 に示される
ように第一言語の形態素解析を行ない、構文解析したあ
と、第一言語と第二言語を対応づけた辞書よシ第二言語
の文字列を生成する方法が一般的である。
では、例えば特公昭59−121574 に示される
ように第一言語の形態素解析を行ない、構文解析したあ
と、第一言語と第二言語を対応づけた辞書よシ第二言語
の文字列を生成する方法が一般的である。
しかしながら、このままでは日本語のように冠詞を有し
ない言語が第一言語で、英語のように冠詞を有する言語
が第二言語である場合、第一言語の解析により得られる
情報には冠詞の情報が欠如しているため、第二言語に冠
詞を設定することが不可能であるという問題があった。
ない言語が第一言語で、英語のように冠詞を有する言語
が第二言語である場合、第一言語の解析により得られる
情報には冠詞の情報が欠如しているため、第二言語に冠
詞を設定することが不可能であるという問題があった。
本発明の目的は、上記の問題点を解決し、高い確率で文
法的に適切な冠詞を設定する方式を提供することにある
。
法的に適切な冠詞を設定する方式を提供することにある
。
上記目的は、記憶装置内に冠詞情報を持つ辞書データベ
ースと冠詞情報を持つ第二言語の句構造生成規則データ
ベースを設けること及び冠詞情報を冠詞属性値とその確
からしさを示す評価函数値から構成することにより達成
される。
ースと冠詞情報を持つ第二言語の句構造生成規則データ
ベースを設けること及び冠詞情報を冠詞属性値とその確
からしさを示す評価函数値から構成することにより達成
される。
冠詞の設定は、本来、意味や文脈を考慮した上で決定さ
れるべきものである。しかしながら、ある種の語や構文
によっては極めて高い確率で冠詞を決定できることも多
い。これらの語や構文によって決定される冠詞は相反す
ることもあるが、その確からしさけ優劣をつけることが
可能である。
れるべきものである。しかしながら、ある種の語や構文
によっては極めて高い確率で冠詞を決定できることも多
い。これらの語や構文によって決定される冠詞は相反す
ることもあるが、その確からしさけ優劣をつけることが
可能である。
本発明では、冠詞属性値の確からしさを示す評価函数を
含む冠詞情報を備えた記憶装置内の複数の記憶エリアか
ら冠詞情報を取りだし、この評価函数を用いて冠詞属性
を決定することにより、高い確率で文法的に適切な冠詞
を設定できる。
含む冠詞情報を備えた記憶装置内の複数の記憶エリアか
ら冠詞情報を取りだし、この評価函数を用いて冠詞属性
を決定することにより、高い確率で文法的に適切な冠詞
を設定できる。
〔実施例〕
以下、本発明を日英機械翻訳システムに適用した場合の
例を図面を用いて詳細に説明する。
例を図面を用いて詳細に説明する。
第2図は、日英機械翻訳システムのハード構成図である
。1は日本文を入力する装置である。2は翻訳システム
の中央処理装置であり、日本文を解析し英文に変換する
処理を行なう。3は英文を出力する装置である。4は翻
訳処理に必要な情報を蓄える記憶装置であり、ここでは
その記憶エリアとして辞書データベース及び英語句構造
生成規則データベースを含んでいるものとする。
。1は日本文を入力する装置である。2は翻訳システム
の中央処理装置であり、日本文を解析し英文に変換する
処理を行なう。3は英文を出力する装置である。4は翻
訳処理に必要な情報を蓄える記憶装置であり、ここでは
その記憶エリアとして辞書データベース及び英語句構造
生成規則データベースを含んでいるものとする。
辞書データベース及び英語句構造生成規則データベース
には冠詞情報として冠詞属性値及びその評価函数値が記
憶されている。ここでは、冠詞属性値としてB、 D、
Iがあり、それぞれ、無冠詞、定冠詞、不定冠詞属
性を表すものとする。また、評価函数値は自然数とし、
値が小さいほど優先度が高いものとする。
には冠詞情報として冠詞属性値及びその評価函数値が記
憶されている。ここでは、冠詞属性値としてB、 D、
Iがあり、それぞれ、無冠詞、定冠詞、不定冠詞属
性を表すものとする。また、評価函数値は自然数とし、
値が小さいほど優先度が高いものとする。
第3図は、辞書データベースのレコードの例である。辞
書データベースは日本語見だし201、英訳語のスペル
202、冠詞属性値203、冠詞属性の評価函数値20
4から構成されている。この例では、語”’ they
”が一般に冠詞を伴わないため冠詞属性値Bが記述され
ている。また、語“1ast” は、それが修飾する
名詞が唯−物を意味するため定冠詞が付き易い性質が有
り、冠詞属性値りが記述されている。
書データベースは日本語見だし201、英訳語のスペル
202、冠詞属性値203、冠詞属性の評価函数値20
4から構成されている。この例では、語”’ they
”が一般に冠詞を伴わないため冠詞属性値Bが記述され
ている。また、語“1ast” は、それが修飾する
名詞が唯−物を意味するため定冠詞が付き易い性質が有
り、冠詞属性値りが記述されている。
第4図は、句構造生成規則データベースに蓄えられた規
則の例である。句構造生成規則は格7レーム301に対
応して英語句構造302を生成する規則である。格フレ
ームとは中心動詞と各名詞句との間の意味的関係を表し
たものである。英語句構造は英語表層文の構造を表した
ものでNP。
則の例である。句構造生成規則は格7レーム301に対
応して英語句構造302を生成する規則である。格フレ
ームとは中心動詞と各名詞句との間の意味的関係を表し
たものである。英語句構造は英語表層文の構造を表した
ものでNP。
v、ppは、それぞれ名詞句、動詞、前置詞句を表して
いる。句構造生成規則データベースは各フレーム301
、英語句構造302のほか冠詞属性値303、冠詞属性
の評価函数1直304から構成されている。この例では
、as−前置詞句内の名詞が不定冠詞を取り易いため冠
詞属性値工が記述されている。
いる。句構造生成規則データベースは各フレーム301
、英語句構造302のほか冠詞属性値303、冠詞属性
の評価函数1直304から構成されている。この例では
、as−前置詞句内の名詞が不定冠詞を取り易いため冠
詞属性値工が記述されている。
、次に、第1図に示したフローチャート図に従って、本
発明の処理方式を説明する。まず、入力された日本文を
入力装置1より読み込み(101)、単語分割しく10
2)、更に構文解析を行ない、格フレーム301を決定
する(103)。この格フレームに対応した英語句構造
302を生成する(1041゜生成された句構造に対し
、冠詞属性が設定されていない名詞句があるか否か判定
しく105)、未設定の名詞句があれば、辞書データベ
ース及び句構造生成規則データベースに属性情報がある
か否か判定する(106)。属性情報があればこれを取
得し、なければデフォルト値を該当名詞句に設定する(
110)、デフォルトの冠詞属性値は、可算名詞単数形
に対して不定冠詞属性工、それ以外のときは無冠詞属性
Bを設定することにする。冠詞情報には属性値及び属性
値の評価函数値が含まれている。名詞句は、一般に■の
主名詞、■主名詞以外の名詞、■形容詞等名詞以外の修
飾語から成っているが、辞書データベースからは、この
うち上記■、■の英単語の各々に対してそのレコードか
ら冠詞属性値及び冠詞属性値の評価函数値を取得する。
発明の処理方式を説明する。まず、入力された日本文を
入力装置1より読み込み(101)、単語分割しく10
2)、更に構文解析を行ない、格フレーム301を決定
する(103)。この格フレームに対応した英語句構造
302を生成する(1041゜生成された句構造に対し
、冠詞属性が設定されていない名詞句があるか否か判定
しく105)、未設定の名詞句があれば、辞書データベ
ース及び句構造生成規則データベースに属性情報がある
か否か判定する(106)。属性情報があればこれを取
得し、なければデフォルト値を該当名詞句に設定する(
110)、デフォルトの冠詞属性値は、可算名詞単数形
に対して不定冠詞属性工、それ以外のときは無冠詞属性
Bを設定することにする。冠詞情報には属性値及び属性
値の評価函数値が含まれている。名詞句は、一般に■の
主名詞、■主名詞以外の名詞、■形容詞等名詞以外の修
飾語から成っているが、辞書データベースからは、この
うち上記■、■の英単語の各々に対してそのレコードか
ら冠詞属性値及び冠詞属性値の評価函数値を取得する。
また、句構造生成規則データベースより、該名詞句の冠
詞属性値及び冠詞属性値の評価函数値を取得する(10
7)。
詞属性値及び冠詞属性値の評価函数値を取得する(10
7)。
これらの取得した冠詞属性値のうちその評価函数の一番
手さな1属性値を該名詞句の冠詞属性値として設定する
(108)。すべての名詞句に対して冠詞属性値を設定
したら、冠詞を含んだ形の英文を出力する(120)。
手さな1属性値を該名詞句の冠詞属性値として設定する
(108)。すべての名詞句に対して冠詞属性値を設定
したら、冠詞を含んだ形の英文を出力する(120)。
次に、例文として「彼等は最後の手段として武力に訴え
た。」という文をとりあげ、上記の冠詞設定方式を説明
する。入力日本文は、単語分割、構文解析により格フレ
ーム301を生成した後、英梧句構造302に変換され
る。この英語句構造の各名詞句に対して、順次、冠詞属
性を設定していく。簡単のため、英語句構造302の名
詞句を左から順にNPI、NF2.NF2とする。まず
、動作主格に対応する名詞句NPIでは、辞書データベ
ースの見出し語「彼等」のレコードから無冠詞属性B及
びその評価函数値1が得られる。この他に取得すべき属
性情報はないので、NPlの冠詞属性は無冠詞となる。
た。」という文をとりあげ、上記の冠詞設定方式を説明
する。入力日本文は、単語分割、構文解析により格フレ
ーム301を生成した後、英梧句構造302に変換され
る。この英語句構造の各名詞句に対して、順次、冠詞属
性を設定していく。簡単のため、英語句構造302の名
詞句を左から順にNPI、NF2.NF2とする。まず
、動作主格に対応する名詞句NPIでは、辞書データベ
ースの見出し語「彼等」のレコードから無冠詞属性B及
びその評価函数値1が得られる。この他に取得すべき属
性情報はないので、NPlの冠詞属性は無冠詞となる。
次の名詞句NP2に対しては取得すべき属性情報はない
ので、デフォルト値として無冠詞属性値を設定する。最
後の名詞句NP3では、辞書データベースの見出し語「
最後の」のレコードから定冠詞属性り及びその評価函数
値3が、句構造生成規則データベースからは不定冠詞属
性工及びその評価函数1ii2が得られる。
ので、デフォルト値として無冠詞属性値を設定する。最
後の名詞句NP3では、辞書データベースの見出し語「
最後の」のレコードから定冠詞属性り及びその評価函数
値3が、句構造生成規則データベースからは不定冠詞属
性工及びその評価函数1ii2が得られる。
ここで、評価函数値Fi3より2の方が小さいため。
NF2には不定冠詞属性が設定されることになる。
以上ですべての名詞句の冠詞属性が設定されたことにな
り、これより英文“’l’hey appealed
t。
り、これより英文“’l’hey appealed
t。
arms as a 1ast resort、’が出
力されることになる。
力されることになる。
冠詞情報を含む記t、!装置内辞書データベースとして
は、上に述べた通常の辞書データベース以外にも、特定
の専門分野用辞書データベースを使用することが可能で
ある。例えばコンピュータ関連の分野では、第5図に示
すような専門分野用辞書データベースを作成できる。第
5図では、「ホスト」、「ライ≠ブラリ」という飴が一
般に用いられる場合と異なりコンピュータ関連の分野で
は特定のものを指すことが多く定冠詞を伴い易いため定
冠詞属性り及びその評価函数値1が専門分野用辞書デー
タベースの該当するレコードに記述されることになる。
は、上に述べた通常の辞書データベース以外にも、特定
の専門分野用辞書データベースを使用することが可能で
ある。例えばコンピュータ関連の分野では、第5図に示
すような専門分野用辞書データベースを作成できる。第
5図では、「ホスト」、「ライ≠ブラリ」という飴が一
般に用いられる場合と異なりコンピュータ関連の分野で
は特定のものを指すことが多く定冠詞を伴い易いため定
冠詞属性り及びその評価函数値1が専門分野用辞書デー
タベースの該当するレコードに記述されることになる。
専門分野用辞書データベースの冠詞情報の評価函数値を
通常の辞書データベースの冠詞情報の評価函数値よりも
高くすることにより冠詞決定の精度を更に高めることが
できる。
通常の辞書データベースの冠詞情報の評価函数値よりも
高くすることにより冠詞決定の精度を更に高めることが
できる。
また、本発明では、冠詞情報を評価函数を用いて表わし
ているため、極めて確実性の高い情報からそれほど高く
ない情報までを一律に記述することが可能である。例え
ば、文の始めにくる語は未知の語より既知の語である可
能性が高く定冠詞が付き易いといったあいまいな情報も
、評価函数値を低くすることによって第6図のような句
構造生成規則データベースとして記述できる。
ているため、極めて確実性の高い情報からそれほど高く
ない情報までを一律に記述することが可能である。例え
ば、文の始めにくる語は未知の語より既知の語である可
能性が高く定冠詞が付き易いといったあいまいな情報も
、評価函数値を低くすることによって第6図のような句
構造生成規則データベースとして記述できる。
以上で述べたように、本発明によれば、冠詞を有する1
語に対し、高い確率で文法的に正しく適切な冠詞を付け
ることが可能になる。
語に対し、高い確率で文法的に正しく適切な冠詞を付け
ることが可能になる。
第1図は、本発明の処理手順の一実施例を示すフローチ
ャート、第2図は本発明に係る日英機械翻訳システムの
ハード構成図、第3図は本発明による辞書データベース
のレコードの例を示す説明図、第4図は本発明による句
構造生成規則データベース内の規則の例を示す説明図、
第5図は本発明辞書データベースの変形例を示す説明図
、第6図は句構造生成規則データベースの変形例を示す
説明図である。 1・・・入力装置、2・・・中央処理装置、3・・・出
力装置、茅 1 図 ZZ 図 13 図 不 4 図
ャート、第2図は本発明に係る日英機械翻訳システムの
ハード構成図、第3図は本発明による辞書データベース
のレコードの例を示す説明図、第4図は本発明による句
構造生成規則データベース内の規則の例を示す説明図、
第5図は本発明辞書データベースの変形例を示す説明図
、第6図は句構造生成規則データベースの変形例を示す
説明図である。 1・・・入力装置、2・・・中央処理装置、3・・・出
力装置、茅 1 図 ZZ 図 13 図 不 4 図
Claims (1)
- 【特許請求の範囲】 1、第一言語から冠詞を有する第二言語へ文章を翻訳す
る翻訳装置において、冠詞情報をもつ辞書データベース
及び冠詞情報をもつ第二言語の句構造生成規則データベ
ースを使用して、生成された第二言語の文章に冠詞を設
定することを特徴とする冠詞設定方式。 2、冠詞情報として冠詞属性値及び冠詞属性値の確から
しさを示す評価函数を使用する第1項記載の冠詞設定方
式。 3、上記辞書データベースが優先度の異なる複数の辞書
データベースから構成された第1項記載の冠詞設定方式
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61179937A JPS6337472A (ja) | 1986-08-01 | 1986-08-01 | 冠詞設定方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61179937A JPS6337472A (ja) | 1986-08-01 | 1986-08-01 | 冠詞設定方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6337472A true JPS6337472A (ja) | 1988-02-18 |
Family
ID=16074543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61179937A Pending JPS6337472A (ja) | 1986-08-01 | 1986-08-01 | 冠詞設定方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6337472A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0242571A (ja) * | 1988-08-03 | 1990-02-13 | Sharp Corp | 電訳機 |
US5884247A (en) * | 1996-10-31 | 1999-03-16 | Dialect Corporation | Method and apparatus for automated language translation |
-
1986
- 1986-08-01 JP JP61179937A patent/JPS6337472A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0242571A (ja) * | 1988-08-03 | 1990-02-13 | Sharp Corp | 電訳機 |
US5884247A (en) * | 1996-10-31 | 1999-03-16 | Dialect Corporation | Method and apparatus for automated language translation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5895446A (en) | Pattern-based translation method and system | |
US4641264A (en) | Method for automatic translation between natural languages | |
KR101120798B1 (ko) | 텍스트로부터 세만틱 구조들을 식별하기 위한 방법 및장치 | |
US5418717A (en) | Multiple score language processing system | |
JP3476237B2 (ja) | 構文解析装置 | |
JP2005507525A (ja) | 機械翻訳 | |
JP2005507524A (ja) | 機械翻訳 | |
JPS61163467A (ja) | 機械翻訳システム | |
TW202013217A (zh) | 語意處理方法、電子裝置以及非暫態電腦可讀取記錄媒體 | |
Salam et al. | Developing the bangladeshi national corpus-a balanced and representative bangla corpus | |
JPS6337472A (ja) | 冠詞設定方式 | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JP2632806B2 (ja) | 言語解析装置 | |
Davis et al. | Natural Language Processing for Detecting Undefined Values in Specifications | |
KR100371135B1 (ko) | 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법 | |
JP2626722B2 (ja) | 日本語生成装置 | |
JP3236027B2 (ja) | 機械翻訳装置 | |
JP3680489B2 (ja) | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Ahmed et al. | English to Urdu translation system | |
JP3783053B2 (ja) | 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置 | |
JP2752025B2 (ja) | 機械翻訳装置 | |
Riabtseva | Machine translation output and translation theory | |
JP4023384B2 (ja) | 自然言語翻訳方法及び装置及び自然言語翻訳プログラム | |
JPH1115846A (ja) | 情報検索装置および記録媒体 | |
JP2608384B2 (ja) | 機械翻訳装置及びその方法 |