JP2002108859A - 対訳表現自動抽出装置および記録媒体 - Google Patents

対訳表現自動抽出装置および記録媒体

Info

Publication number
JP2002108859A
JP2002108859A JP2000300943A JP2000300943A JP2002108859A JP 2002108859 A JP2002108859 A JP 2002108859A JP 2000300943 A JP2000300943 A JP 2000300943A JP 2000300943 A JP2000300943 A JP 2000300943A JP 2002108859 A JP2002108859 A JP 2002108859A
Authority
JP
Japan
Prior art keywords
language
bilingual
word
sentence
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000300943A
Other languages
English (en)
Inventor
Naoto Kato
直人 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2000300943A priority Critical patent/JP2002108859A/ja
Publication of JP2002108859A publication Critical patent/JP2002108859A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 共起頻度に依存しないで対訳表現を自動抽出
する。 【解決手段】 最適対訳表現対応計算装置4は、動的計
画法の手法を使用して、第1の言語の文章中に対応する
第2の言語の対訳文章中の単語を検出し、新規単語を対
訳表現辞書に登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、たとえば、日本語
およびその英語の対訳のそれぞれの文章から、一方の単
語に対応する対訳表現を自動的に検出することが可能な
対訳表現自動抽出装置および記録媒体に関する。
【0002】
【従来の技術】従来、機械翻訳システムでは、対訳表現
辞書を使用し、たとえば、日本語から英語に自動翻訳す
る。対訳表現辞書に全ての分野の全ての単語が登録され
ているいることは稀である。このため、従来の機械翻訳
システムまたは機械翻訳ソフトでは、機械翻訳の精度を
上げるために、人間が、日本語の単語およびその対訳の
英語の単語の双方を1組として対訳表現辞書に登録する
操作を行っている。
【0003】しかしながら、人間がその都度、対訳表現
を登録したり、同一の単語について複数の対訳表現が存
在する場合、好適な対訳表現を手動動作で設定すること
は大変な労力であるので、好適な対訳表現を自動登録/
設定するために対訳コーパスから対訳表現を自動的に抽
出する手法が提案されている(たとえば、宇津路武仁,
松本裕治:対訳表現辞書および統計情報を用いた二言語
対訳テキスト照合,コンピュータソフトウェア,Vo
l.12,No,pp12−21,1995.)。ここ
で、対訳コーパスとは、第1言語、たとえば、日本語の
文章とその対訳である第2言語、たとえば、英語の文章
が対となった大量の言語データのことを言う。
【0004】上記手法は、文や章などの範囲における、
第1の言語の単語と第2言語の単語の間で、共起する頻
度に基づいて対訳表現を、自動抽出していた。なお、共
起とは、第1言語の文章の単語が、第2言語における対
訳表現の形で、第2言語の文章でも出現することを言
う。
【0005】第1言語として日本語、第2言語として英
語を想定した場合、上記従来の方法を説明する。次のよ
うな対訳文章が与えられたとする。 (日本語−英語対訳文章) 〔日本語(第1言語)文章〕
【0006】
【外1】 〔英語(第2言語)文書〕
【0007】
【外2】
【0008】また、対訳表現辞書に“building(s)”の
対訳表現として、「建築物」、「建物」、「ビルディン
グ」という3つの日本語が登録されているものとする。
すなわち、“building(s)”の対訳表現として一意に決
まっていない。
【0009】英語文章の中に“building(s)”という単
語は3回出現している。一方、日本語文章には、「建
物」という単語は4回と高い出現回数で出現している
が、「建築物」と「ビルディング」はまったく出現して
いない。そこで、従来の手法では、日本語の出現頻度が
4回と多く、これは英語文章での出現頻度3回とも近い
値である単語、すなわち、「建物」を“building(s)”
の対訳表現と決定する。そして対訳表現辞書に改めて
「建物」のみを登録すれば、“building(s)”の対訳表
現は一意に「建物」となるので、現在の翻訳対象に対訳
表現辞書をチューニングすることができる。
【0010】このように従来のような共起の頻度に基づ
いて第1の言語の単語と対応する第2の言語の対訳表現
を抽出する方法は、共起頻度が高い場合に有効である。
あるいは、元の文章が逐語的に翻訳されるような場合
(たとえば、英語を第1言語、フランス語を第2言語と
した場合)には、共起頻度が同じになるので、従来の手
法では、対訳表現を集める(検出する)ことができる。
【0011】
【発明が解決しようとする課題】しかしながら、日本語
と英語の放送ニュースのような対訳表現の場合には、文
章が短い、逐語的に翻訳がなされないので、従来の手法
では自動的に集めることができる対訳表現が少なくなる
場合がある。
【0012】たとえば、対訳表現辞書に“houses”の対
訳表現として、「家」、「住宅」が登録されている場合
を考える。“houses”は先の英語の文章の中では、1回
しか出現していない。一方、日本語文章中には、「家」
はJ1中に1回出現し、「住宅」はJ4中に1回出現し
ている。
【0013】したがって、両方の対訳表現とも同じ頻度
で出現しているので、従来の対訳表現を決定することが
できない。この場合には、前後の単語情報を使用して、
対訳表現を決定することが考えられる。たとえば、“te
mporary”の対訳表現として「仮」、「臨時」が対訳表
現辞書に登録されているものとする。なお、「仮設」は
登録されていないものとする。“temporary”は英語文
章の中では“houses”の前に位置し、その対訳表現は日
本語文章中では「仮」がJ4中に出現し,「臨時」がJ
1中に出現している。もしJ1で出現している対訳表現
を優先させるならば、従来の手法では、“temporary”
の対訳表現は「臨時」に、“houses”の対訳表現は
「家」と決定される。一方、J4で出現している対訳表
現を優先するならば、“temporary”の対訳表現は
「仮」に、“houses”の対訳表現は「住宅」に決定され
る。
【0014】しかしながら、従来手法では、上述のよう
に同一の単語“temporary”に対する対訳表現「臨時」
と「仮」とが同じ共起頻度となった場合、どちらを優先
させてよいかが対訳表現自動抽出装置ではわからず、対
訳表現を自動抽出できないという第1の問題がある。
【0015】さらに“temporary houses”の対訳表現で
は「仮設住宅」(J4参照)が使用されているので、従
来手法では、対訳表現辞書に記載されている文字(上記
の例では「仮」)を一部に含むような対訳表現「仮設住
宅」は対訳表現自動抽出装置により自動検出することが
できないとう第2の問題がある。
【0016】そこで、本発明の目的は、共起頻度に依存
せず、対訳表現を精度よく抽出することができる対訳表
現抽出装置および記録媒体を提供することにある。
【0017】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、第1の言語の文章と該第
1の言語の文章の対訳の第2の言語の文章を入力する入
力手段(FDD106または入力装置104)と、第1
の言語の単語および該単語に対応する第2の言語の対訳
表現を記載した辞書を有する記憶手段(ハードディスク
105)と、前記第1の言語の中の近接する少なくとも
2つの単語列に対応する対訳表現を前記辞書から取得す
る手段(CPU100)と、当該取得した対訳表現が近
接して記載されている前記第2の言語の文章の単語を検
出する検出手段(CPU100)とを具えたことを特徴
とする。
【0018】請求項2の発明は、請求項1に記載の対訳
表現自動抽出装置において、前記検出手段により検出さ
れた第2の言語の単語の間に含まれる文字が所定数以下
の場合に、当該第2の言語の単語および該単語の間に含
まれる文字で構成される単語列と、第1の言語の前記少
なくとも2つの単語列とを前記辞書に登録する手段(C
PU100)をさらに具えたことを特徴とする。
【0019】請求項3の発明は、請求項2に記載の対訳
表現自動抽出装置において、前記所定数は1であること
を特徴とする。
【0020】請求項4の発明は、請求項1に記載の対訳
表現自動抽出装置において、前記検出手段は、前記取得
する手段により取得した少なくとも2つの対訳表現の前
記第2の言語の文章中の位置を検出し、当該検出した少
なくとも2つの位置が近接している単語を検出すること
を特徴とする。
【0021】請求項5の発明は、第1の言語の単語およ
び該単語に対応する第2の言語の対訳表現を記載した辞
書を有する記憶手段を対訳自動抽出装置が有しており、
第1の言語の文章と該第1の言語の文章の対訳の第2の
言語の文章を入力する入力ステップと、前記第1の言語
の中の近接する少なくとも2つの単語列に対応する対訳
表現を前記辞書から取得するステップと、当該取得した
対訳表現が近接して記載されている前記第2の言語の文
章の単語を検出する検出ステップとを具えたプログラム
を記録したことを特徴とする。
【0022】請求項6の発明は、請求項5に記載の記録
媒体において、前記検出ステップにより検出された第2
の言語の単語の間に含まれる文字が所定数以下の場合
に、当該第2の言語の単語および該単語の間に含まれる
文字で構成される単語列と、第1の言語の前記少なくと
も2つの単語列とを前記辞書に登録するステップを前記
プログラムがさらに具えたことを特徴とする。
【0023】請求項7の発明は、請求項6に記載の記録
媒体において、前記所定数は1であることを特徴とす
る。
【0024】請求項8の発明は、請求項5に記載の記録
媒体において、前記検出ステップでは、前記取得するス
テップにより取得した少なくとも2つの対訳表現の前記
第2の言語の文章中の位置を検出し、当該検出した少な
くとも2つの位置が近接している単語を検出することを
特徴とする。
【0025】発明の理解を容易にするために、上記構成
要件の実施形態の対応個所を()で示しておく。しかし
ながら、()で示した対応個所はこれに限定されるもの
ではない。
【0026】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。
【0027】本願発明者は、たとえば、英語で名詞連続
で表される表現は、対訳表現の日本語側でも名詞連続に
なりやすいとう言語特徴を発見し、特徴を使用して従来
では検出できなかった対訳表現を検出できる対訳表現自
動抽出装置を発明した。
【0028】本発明実施形態の機能構成を図1に示す。
本実施形態の対訳表現自動抽出装置は汎用コンピュータ
が対訳自動抽出プログラムを実行することにより実現さ
れるので、その機能構成が図1に示されている。
【0029】図1において、i1は第2言語の文章を入
力する端子である。i2は第2言語の文章に対する対訳
の第1の言語の文章を入力する端子である。o1は第1
の言語の文章および第2の言語の文章から得られた対訳
表現を出力する端子である。
【0030】対訳表現辞書保存装置1は、対訳表現辞
書、すなわち、第2の単語を見出しとし、その単語の品
詞と第1の言語の対訳表現(1以上)を記載した辞書を
保存する。
【0031】第2言語形態素解析装置2は、対訳表現辞
書保存装置に保存された辞書を使用して、入力の第2言
語の文章を単語に分割し、品詞を決定して、第1の言語
の対訳表現を出力する。同一の単語について単語辞書に
複数の対訳表現が記載されている場合には、複数の対訳
表現が出力される。本実施形態ではこれら複数の対訳表
現を対訳表現候補と呼ぶことにする。第2言語形態素解
析装置2は従来例でも使用されてるので詳細な説明を省
略する。
【0032】対訳表現対応候補検索装置3は、第2言語
形態素解析装置2から出力された複数の対訳表現候補が
第1の言語の文章(i2から入力された文章)の中で出
現する位置を検出する。
【0033】最適対訳表現対応計算装置4は対訳表現対
応候補検索装置3により位置が検出された複数の対訳表
現候補の中から、対訳表現として最適な対訳表現候補を
選択する。その選択に際し、連続DPの手法を使用し
て、距離計算により最適な対訳表現候補を選択する。こ
の情報処理手法については後で説明する。
【0034】対訳表現辞書登録装置5は、最適対訳表現
対応計算装置4により選択された(最適)対応表現の中
で、予め定めた条件に合致する対応表現については、こ
の対応表現に対応する第1の言語の文章の単語および第
2の言語の文書の単語を対訳表現保存装置1の単語辞書
に登録する装置である。
【0035】以上の機能構成による具体的な処理例を説
明する。以下では、第1言語を日本語、第2言語を英語
とする。
【0036】(ステップS0)端子i1に対して、下記
の英語の文章が入力される。下記の英語の文章の先頭部
分のE1〜E5は説明の便宜上付した符号であり、実際
には、英語の文章中には含まれていない。(英語の文
章)
【0037】
【外3】
【0038】(ステップS1)第2言語形態素解析装置
2は、下記のような内容を有する対訳表現保存装置1の
対訳表現辞書を使用して、上記英語の文章を形態素分析
して、単語に分割すると共に、各単語の品詞を従来手法
により決定する。
【0039】
【外4】
【0040】たとえば、E5の英文では、下記の形態素
解析結果、すなわち、単語分割結果と品詞が得られる。
(形態素解析結果)
【0041】
【外5】
【0042】(ステップS2)対訳表現対応候補検索装
置3は、上述のようにして分割された各単語に対応する
第1の言語(日本語)の対訳表現候補を対訳表現保存装
置1内の対訳表現辞書から全て取得する。英語の文書E
5の場合には、下記のような対訳表現候補が得られる。
【0043】
【外6】
【0044】次に対訳表現対応候補検索装置3は、上記
対訳表現候補が、端子i2から入力された第1の言語
(日本語)の文章の中で出現する位置を検出する。第1
の言語の文章として下記の文章が入力されたとすると、
(日本語文章)
【0045】
【外7】
【0046】E5の英語の対訳表現(候補)が第1の言
語の文章中で出願する位置は、下記となる。(対訳表現
候補出現位置)
【0047】
【外8】
【0048】たとえば、E5の英語の文章の中の“temp
orary”は、対訳表現辞書から、「仮」および「臨時」
の2つの対訳表現候補が得られる。「仮」が上記日本語
の文章中に出現する位置は、J4の文の中の4番目の節
に出現している。「仮」の単語の先頭位置は、文章の先
頭位置からの343番目の位置にあり、「仮」の単語の
終了位置は、343番目の位置となっている。したがっ
て、対訳表現候補の出現位置を(先頭位置,終了位置,
節位置、文位置)で表すと、「仮」の出現位置は(34
3,343,4,4)と表される。ただし、日本語の文
章中に対訳表現候補と同じ単語が出現しない場合にはそ
の対訳表現候補については(−1,−1,−1,−1)
と表している。
【0049】(ステップS3)最適対訳表現対応辞書計
算装置4は、以下の計算を行って、同一単語に関する複
数の対訳表現候補の中から最適の対訳表現候補を選択す
る。
【0050】上記のように対訳表現候補およびその出現
位置は、第2の言語の文章の単語の並べ順(対訳表現の
例を参照)に沿って記載すると、対訳表現候補群および
出現位置は、1つのネットワークととみなすことができ
る。このネットワークにおいて、先頭の対訳表現候補群
から最後尾の対訳表現候補群にいたるまで、各対訳表現
候補を任意に1つずつ選択すると、1つの経路ができあ
がり、対訳表現候補群の中から他の候補を選択すること
により複数の経路ができあがる。
【0051】本実施形態では、各経路上の対訳表現の隣
接の度合い(距離)を連続DPの手法を使用して計算す
る。
【0052】ある位置の対訳表現候補群の中の1つの対
訳表現候補w1の位置を(i1,j1,m1,n1)と
表す。また、上記対訳表現候補w1が含まれる対訳候補
群の次に位置する対訳表現候補群の中の1つの対訳表現
候補w2の位置を(i2,j2,m2,n2)と表す。
i1,i2は、対訳表現候補の先頭文字の出現位置であ
る。j1,j2は対訳表現候補の最後尾の文字の出現位
置である。m1,m2は、対訳表現候補が出現する節の
位置である。n1,n2は対訳表現候補が出現する文の
位置である。
【0053】1つの経路上にある隣接する2つの対訳表
現候補の間の距離distPos(w1,w2)は、下
記式により計算することができる。
【0054】(ステップS4)
【0055】
【外9】
【0056】たとえば、英語の文章の中の隣接する2つ
の単語“temporary”,“houses”については、それぞ
れ、対訳表現候補群が存在する。“temporary”に対応
する対訳表現候補群(仮,臨時)の中の「仮」をw1と
し、“houses”の対訳表現候補群(家、住宅)の中の
「家」をw2とすると、2つの対訳表現候補の間の距離
を上記式にしたがって、計算すると、次のような計算結
果が得られる。
【0057】
【外10】
【0058】(ステップS5)英語の文章E5の対訳表
現候補の組み合わせは下記となる。
【0059】
【外11】
【0060】そこで、1つの経路に沿って、その経路の
上の2つの対訳表現候補の間の距離を合計すると、経路
の距離が得られる。複数の経路の距離の中で、最短の距
離の値となる経路が、英語の文章に対応する最適の対訳
表現候補で構成される経路となる。
【0061】英語の文章(入力された英語の文章)の単
語同士は近接しているので、日本語の対訳の文章(入力
された英語の文章)中でも対訳の単語もほぼ近接してい
る。
【0062】上述の計算処理は、日本語側の対訳文章の
中の近接している単語列を、英語の単語に対する対訳表
現(対訳表現辞書から取得した単語)に基づいて検出し
ていることにほかならない。
【0063】上記最短経路の計算結果としては下記が得
られる。(最適対訳表現対応)
【0064】
【外12】
【0065】この計算プロセスに連続DP(動的計画
法)と呼ばれる計算手法を使用すると計算時間を高速と
することができる。上記対訳表現対応を単語で表すと、
以下の単語の組合せが得られる。
【0066】
【外13】
【0067】(ステップS6)以上までの処理で、共起
頻度に依存せずに、英語の文章の各単語と対応する日本
語の対訳文章の中の単語を自動検出することができるの
であるが、本実施形態では、さらに、抽出精度を向上さ
せるために、以下の抽出条件を使用して、対訳表現辞書
に記載された対訳表現を含む単語を検出する。
【0068】(条件)「前後の対訳表現が一致してお
り、その間の1文字は不一致でもよい」たとえば、E5
の英語の文章の中の“temporary houses”の日本語の対
訳文章の対応単語として、上記計算処理により「仮」
「住宅」が検出される。上記条件を当てはめて新たに日
本語の文章を参照すると、前後が一致している「仮」と
「住宅」の対訳表現の間には「設」の文字が存在する。
そこで、「設」の文字は「仮」に付属する単語して、取
り扱われ、“temporary houses”の対訳表現として、日
本語の対訳文章から「仮設住宅」が抽出される。
【0069】(ステップS7)最適対訳表現対応計算装
置により抽出された対訳表現「仮設住宅」およびその英
語表現“temporary houses”が対訳辞書登録装置5によ
り対訳保存装置5の対訳表現辞書に新たに登録される。
なお、この際に、“temporary houses”の品詞は最後尾
の英単語の品詞とすればよい。これの例では“houses”
が名詞であるので、“temporary houses”は名詞(no
u)として次のように登録される。
【0070】
【外14】
【0071】次に、パソコンなどの汎用コンピュータで
上記対訳表現自動抽出装置を実現するためのシステム構
成を図2に示す。
【0072】図2において、CPU100はシステムメ
モリ101にロードされた対訳表現自動抽出プログラム
を実行する。システムメモリ101は上記プログラムの
他、CPU100に対する入出力データを記憶する。
【0073】ディスプレイ102は、CPU100に対
する各種の入力データおよびCPU100の情報処理結
果、この形態では、対訳表現の自動抽出結果を表示す
る。プリンタ100は必要に応じて、入力された第1お
よび第2の言語の文章や、自動抽出結果を印刷出力す
る。入力装置104はマウスおよびキーボードを有し、
CPU100に対して、対訳表現自動抽出プログラムの
インストールや起動を指示する。第1および第2の言語
の文書を入力装置104から入力することも可能であ
る。
【0074】ハードディスク105は対訳表現自動抽出
プログラムを保存記憶する。対訳表現自動抽出プログラ
ムはこのプログラムを記録したCDROMやフロッピー
(登録商標)ディスクからハードディスク105にイン
ストールされる。
【0075】フロッピーディスクドライブ(FDD)
は、対訳表現自動抽出プログラムを記録したフロッピー
ディスクや、第1および第2の言語の文章を記録したフ
ロッピーディスクから記録データを読み取る。
【0076】第1および第2の言語の文章の入力のため
に、LAN,インターネットなどの通信ネットワークを
介して外部から入力してもよい。
【0077】対訳表現自動抽出プログラムの概略処理手
順を参考のために図3に示しておく。図3の処理ステッ
プ番号は、図1を参照して説明した対訳表現自動抽出処
理のステップ番号と対応しているので、詳細な説明を省
略する。対訳表現自動抽出プログラムはC言語,C++
言語等各種のプログラム言語やスクリプト言語で作成す
ればよい。図1の機能構成のうち、対訳表現保存装置1
はハードディスク105が対応するが、その他の装置2
〜5は、対訳表現自動抽出プログラムを実行するCPU
100により実現される。
【0078】以上、説明した実施形態の他に次の形態を
実施できる。1)上述の実施形態では、第1言語を日本
語第2言語を英語としたが第1言語を英語、第2言語を
日本語としてもよい。また、言語は日本語、英語に限定
される必要はない。
【0079】
【発明の効果】以上、説明したように、本発明によれ
ば、第1の言語の文章中で近接する単語に着目して、第
2の言語の文書でも対応の近接する単語を検出すること
により、第1の言語の文章の対訳の単語を第2の言語の
文書中から抽出することができる。さらには、複合語や
複数の文字からなる新しい用語も第2の言語の文章中で
検出して、対訳表現辞書に登録することができる。本発
明では、従来のように共起頻度を計算しなくてもよいの
で、共起頻度が低頻度であっても新しい単語を対訳表現
辞書に登録することができる。
【図面の簡単な説明】
【図1】本発明実施形態の機能構成を示すブロック図で
ある。
【図2】本発明実施形態の具体的なシステム構成を示す
ブロック図である。
【図3】対訳表現自動抽出プログラムの概略処理手順を
示すフローチャートである。
【符号の説明】
1 対訳表現保存装置 2 第2言語形態素解析装置2 3 対訳表現対応候補検索装置 4 最適対訳表現対応計算装置 5 対訳表現辞書登録装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1の言語の文章と該第1の言語の文章
    の対訳の第2の言語の文章を入力する入力手段と、 第1の言語の単語および該単語に対応する第2の言語の
    対訳表現を記載した辞書を有する記憶手段と、 前記第1の言語の中の近接する少なくとも2つの単語列
    に対応する対訳表現を前記辞書から取得する手段と、 当該取得した対訳表現が近接して記載されている前記第
    2の言語の文章の単語を検出する検出手段とを具えたこ
    とを特徴とする対訳表現自動抽出装置。
  2. 【請求項2】 請求項1に記載の対訳表現自動抽出装置
    において、前記検出手段により検出された第2の言語の
    単語の間に含まれる文字が所定数以下の場合に、当該第
    2の言語の単語および該単語の間に含まれる文字で構成
    される単語列と、第1の言語の前記少なくとも2つの単
    語列とを前記辞書に登録する手段をさらに具えたことを
    特徴とする対訳表現自動抽出装置。
  3. 【請求項3】 請求項2に記載の対訳表現自動抽出装置
    において、前記所定数は1であることを特徴とする対訳
    表現自動抽出装置。
  4. 【請求項4】 請求項1に記載の対訳表現自動抽出装置
    において、前記検出手段は、前記取得する手段により取
    得した少なくとも2つの対訳表現の前記第2の言語の文
    章中の位置を検出し、当該検出した少なくとも2つの位
    置が近接している単語を検出することを特徴とする対訳
    表現自動抽出装置。
  5. 【請求項5】 第1の言語の単語および該単語に対応す
    る第2の言語の対訳表現を記載した辞書を有する記憶手
    段を対訳自動抽出装置が有しており、 第1の言語の文章と該第1の言語の文章の対訳の第2の
    言語の文章を入力する入力ステップと、 前記第1の言語の中の近接する少なくとも2つの単語列
    に対応する対訳表現を前記辞書から取得するステップ
    と、 当該取得した対訳表現が近接して記載されている前記第
    2の言語の文章の単語を検出する検出ステップとを具え
    たプログラムを記録したことを特徴とする記録媒体。
  6. 【請求項6】 請求項5に記載の記録媒体において、前
    記検出ステップにより検出された第2の言語の単語の間
    に含まれる文字が所定数以下の場合に、当該第2の言語
    の単語および該単語の間に含まれる文字で構成される単
    語列と、第1の言語の前記少なくとも2つの単語列とを
    前記辞書に登録するステップを前記プログラムがさらに
    具えたことを特徴とする記録媒体。
  7. 【請求項7】 請求項6に記載の記録媒体において、前
    記所定数は1であることを特徴とする記録媒体。
  8. 【請求項8】 請求項5に記載の記録媒体において、前
    記検出ステップでは、前記取得するステップにより取得
    した少なくとも2つの対訳表現の前記第2の言語の文章
    中の位置を検出し、当該検出した少なくとも2つの位置
    が近接している単語を検出することを特徴とする記録媒
    体。
JP2000300943A 2000-09-29 2000-09-29 対訳表現自動抽出装置および記録媒体 Pending JP2002108859A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000300943A JP2002108859A (ja) 2000-09-29 2000-09-29 対訳表現自動抽出装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000300943A JP2002108859A (ja) 2000-09-29 2000-09-29 対訳表現自動抽出装置および記録媒体

Publications (1)

Publication Number Publication Date
JP2002108859A true JP2002108859A (ja) 2002-04-12

Family

ID=18782547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000300943A Pending JP2002108859A (ja) 2000-09-29 2000-09-29 対訳表現自動抽出装置および記録媒体

Country Status (1)

Country Link
JP (1) JP2002108859A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723362A (zh) * 2013-10-28 2016-06-29 余自立 自然表达处理方法、处理及回应方法、设备及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105723362A (zh) * 2013-10-28 2016-06-29 余自立 自然表达处理方法、处理及回应方法、设备及系统
JP2017503282A (ja) * 2013-10-28 2017-01-26 自立 余 自然表現の処理方法、処理及び応答方法、装置、及びシステム
US9753914B2 (en) 2013-10-28 2017-09-05 Zili Yu Natural expression processing method, processing and response method, device, and system
US9760565B2 (en) 2013-10-28 2017-09-12 Zili Yu Natural expression processing method, processing and response method, device, and system

Similar Documents

Publication Publication Date Title
JP4993762B2 (ja) 用例ベースの機械翻訳システム
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
US6418403B2 (en) Translating apparatus, dictionary search apparatus, and translating method
US20140156258A1 (en) Foreign language writing support apparatus and method
Grishman Iterative alignment of syntactic structures for a bilingual corpus
JP4431759B2 (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
KR100792203B1 (ko) 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
JP2002108859A (ja) 対訳表現自動抽出装置および記録媒体
JP7117168B2 (ja) 情報処理装置および情報処理方法
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
JP2005326952A (ja) 概念辞書への単語登録方法、装置、およびプログラム
JP2010067021A (ja) 機械翻訳装置及び機械翻訳プログラム
JP4001605B2 (ja) 翻訳パターン作成装置
JP3258079B2 (ja) 複合語辞書登録装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP2003228578A (ja) 情報検索方法及び情報検索装置及び情報検索装置の制御プログラム
JP4021813B2 (ja) 複合語登録プログラムおよび登録装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JP2000250914A (ja) 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体
JP4480741B2 (ja) 翻訳パターン作成装置
JP3139624B2 (ja) 形態素解析装置
JP2002297587A (ja) 言語解析用データ作成方法、言語解析方法及び前記方法に用いるプログラム
JPH11282839A (ja) 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1091622A (ja) 文書処理装置および文書処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050401

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605