JPH1031676A - 対訳例文検索装置 - Google Patents

対訳例文検索装置

Info

Publication number
JPH1031676A
JPH1031676A JP8186111A JP18611196A JPH1031676A JP H1031676 A JPH1031676 A JP H1031676A JP 8186111 A JP8186111 A JP 8186111A JP 18611196 A JP18611196 A JP 18611196A JP H1031676 A JPH1031676 A JP H1031676A
Authority
JP
Japan
Prior art keywords
example sentence
sentence
new
bilingual
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8186111A
Other languages
English (en)
Other versions
JP4007630B2 (ja
Inventor
Shinji Tokunaga
信治 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP18611196A priority Critical patent/JP4007630B2/ja
Publication of JPH1031676A publication Critical patent/JPH1031676A/ja
Application granted granted Critical
Publication of JP4007630B2 publication Critical patent/JP4007630B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 第2の言語の文章について、第1の言語によ
る訳文を自動生成し、対訳例文データベースに登録する
ことのできる対訳例文検索装置を提供する。 【解決手段】 対訳例文検索装置は、第1の言語と第2
の言語との対訳例文を含む対訳例文データベース101
と、第1の言語の検索要求を入力するための検索要求入
力部102と、対訳例文データベース101から検索要
求と所定の関係を有する対訳例文を検索するための検索
部103と、検索部103により検索された対訳例文を
表示するための表示部118と、第2の言語の新規例文
の入力が可能であり、入力された新規例文に基づいて第
1の言語の対応の訳文を自動的に生成して、対訳例文と
して対訳例文データベース101に登録するための登録
部104とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理分野に関
し、特に自国語でない言語の文章を作成するための文章
作成装置における対訳例文検索装置に関する。
【0002】
【従来の技術】他国語文章の作成の際には、辞典で訳語
を調べるとともに、近い意味の他国語文の用例を探して
利用する。また、常に他国語文章を作成する人の場合
は、自分が過去に作った他国語文を参考にして、作成す
る場合が多い。
【0003】この対訳例文参照を支援するための方式と
して、特開平6−195388号公報の文章検索方式を
用いて、類似の文章を検索する方式が知られている。こ
の方式では、文章蓄積部に他国語例文に対応する自国語
例文を持たせておく。検索しようとする場合には、検索
対象とする他国語文の内容を自国語を用いて入力する。
入力された自国語を検索要求文として、類似の文章を検
索する。すると、文章蓄積部の自国語例文のそれぞれに
対応する他国語例文が表示されるので、表示された他国
語例文を参考にして、他国語の文を作成する。
【0004】この場合には、対訳例文が充実しているこ
とが必須条件である。特に、ユーザが作成した文を、後
日、再利用するために登録するユーザ登録例文の充実が
不可欠である。実際、他国語文を多く作成する人は、本
人が過去に作成した文と類似の文を作成することが多い
と考えられ、本人が過去に作成した文を参考にするのが
有効である。
【0005】このユーザ登録例文は、登録しようとする
他国語文の自国語による翻訳をユーザが自分で行ない、
ユーザ自ら翻訳した自国語訳と登録しようとする他国語
例文とを対訳にしてデータベースに登録していた。
【0006】
【発明が解決しようとする課題】しかし、他国語文の作
成の最中に、自分で書き上げた他国語の文を自国語に翻
訳して登録するのでは、他国語文章作成のための思考の
流れを止めてしまうという不都合がある。
【0007】それゆえに、本願の請求項1に記載の発明
の目的は、ユーザ作成の他国語の文章について、他国語
文章作成のための思考の流れを止めることなく、自国語
を含む対訳を対訳例文データベースに登録することがで
き、自国語により検索の対象とすることができる対訳例
文検索装置を提供することにある。
【0008】請求項2に記載の発明の目的は、請求項1
に記載の発明の目的に加え、検索要求文から抽出された
キーワードに基づいて、ユーザ作成の他国語の文章につ
いて、他国語文章作成のための思考の流れを止めること
なく、自国語を含む対訳が登録された対訳例文データベ
ースから、その対訳を自国語により検索することができ
る対訳例文検索装置を提供することにある。
【0009】請求項3に記載の発明の目的は、請求項2
に記載の発明の目的に加え、ユーザ作成の他国語の文章
を機械翻訳してキーワードを付与し、対訳例文データベ
ースに登録することができる対訳例文検索装置を提供す
ることにある。
【0010】請求項4に記載の発明の目的は、請求項1
に記載の発明の目的に加え、ユーザ作成の他国語の文章
について、ユーザ自ら自国語による訳文を作成すること
なく、自国語を含む対訳が登録された対訳例文データベ
ースから、検索要求文の意味に最も近い意味の対訳例文
を検索することのできる対訳例文検索装置を提供するこ
とにある。
【0011】請求項5に記載の発明の目的は、請求項4
に記載の発明の目的に加え、ユーザ作成の他国語の文章
を機械翻訳するとともに、検索要求文の意味に最も近い
対訳例文を検索するための検索要求特徴ベクトルを付与
して、対訳例文データベースに登録することのできる対
訳例文検索装置を提供することにある。
【0012】請求項6に記載の発明の目的は、請求項5
に記載の発明の目的に加え、検索要求特徴ベクトルに基
づいて、検索要求文の意味に最も近い意味の対訳例文を
検索することのできる対訳例文検索装置を提供すること
にある。
【0013】請求項7に記載の発明の目的は、請求項6
に記載の発明の目的に加え、機械翻訳による新規対訳例
文にキーワードを付与して対訳例文データベースに登録
することのできる対訳例文検索装置を提供することにあ
る。
【0014】請求項8に記載の発明の目的は、請求項3
または請求項7に記載の発明の目的に加え、機械翻訳し
た結果の適、不適を対訳例文データベースに登録する前
に、ユーザがチェックすることができる対訳例文検索装
置を提供することにある。
【0015】
【課題を解決するための手段】請求項1に記載の対訳例
文検索装置は、第1の言語と第2の言語との対訳例文を
含む対訳例文データベースと、第1の言語の検索要求を
入力するための検索要求入力手段と、前記対訳例文デー
タベースから前記検索要求文と所定の関係を有する対訳
例文を検索するための検索手段と、前記検索手段により
検索された対訳例文を表示するための表示手段と、前記
第2の言語の新規例文の入力が可能であり、入力された
前記新規例文に基づいて前記第1の言語の対応の訳文を
自動的に生成して、対訳例文として前記対訳例文データ
ベースに登録するための登録手段とを含むことを特徴と
する。
【0016】請求項2に記載の対訳例文検索装置は、請
求項1に記載の対訳例文検索装置であって、前記対訳例
文データベースは、前記対訳例文に付与された前記第1
の言語の検索用キーワードをさらに含み、前記検索手段
は、前記検索要求文からキーワードを抽出して当該キー
ワードを有する対訳例文を検索するためのキーワード抽
出手段を含むことを特徴とする。
【0017】請求項3に記載の対訳例文検索装置は、請
求項2に記載の対訳例文検索装置であって、前記登録手
段は、前記第2の言語の新規例文を入力するための新規
例文入力手段と、前記新規例文を機械翻訳して前記第1
の言語による訳文を作成し、前記訳文と前記新規例文と
を含む新規対訳例文を生成するための翻訳処理手段と、
前記訳文からキーワードを抽出し、前記新規対訳例文に
付与するためのキーワード抽出手段と、前記キーワード
抽出手段によりキーワードを付与された前記新規対訳例
文を前記対訳例文データベースに登録するための新規対
訳例文登録手段とを含むことを特徴とする。
【0018】請求項4に記載の対訳例文検索装置は、請
求項1に記載の対訳例文検索装置であって、前記対訳例
文データベースは、前記対訳例文の意味的特徴を表わす
ための特徴ベクトルをさらに含み、前記検索手段は、前
記検索要求から前記検索要求の意味的特徴を表わすため
の検索要求特徴ベクトルを生成するための検索要求特徴
ベクトル生成手段と、前記対訳例文データベースから、
前記検索要求特徴ベクトルとの距離が最も近い特徴ベク
トルを付与された対訳例文を検索するための特徴ベクト
ル検索手段とを含むことを特徴とする。
【0019】請求項5に記載の対訳例文検索装置は、請
求項4に記載の対訳例文検索装置であって、前記登録手
段は、前記第2の言語の新規例文を入力するための新規
例文入力手段と、前記新規例文を機械翻訳して前記第1
の言語による訳文を作成し、前記訳文と前記新規例文と
を含む新規対訳例文を生成するための翻訳処理手段と、
前記訳文から前記新規例文の意味的特徴を表わす新規例
文特徴ベクトルを生成して前記新規例文に付与するため
の新規例文特徴ベクトル生成手段と、前記新規例文特徴
ベクトル生成手段により新規例文特徴ベクトルを付与さ
れた前記新規対訳例文を、前記対訳例文データベースに
登録するための新規対訳例文登録手段とを含むことを特
徴とする。
【0020】請求項6に記載の対訳例文検索装置は、請
求項5に記載の対訳例文検索装置であって、前記検索手
段は、キーワードとキーワードの意味的特徴を表わすキ
ーワード特徴ベクトルとを含む単語辞書データベース
と、前記キーワード特徴ベクトルに基づいて前記検索要
求特徴ベクトルを算出するための検索要求特徴ベクトル
算出手段とを含むことを特徴とする。
【0021】請求項7に記載の対訳例文検索装置は、請
求項6に記載の対訳例文検索装置であって、前記登録手
段は、前記新規対訳例文からキーワードを抽出して前記
新規例文特徴ベクトルを生成するためのキーワード抽出
手段をさらに含むことを特徴とする。
【0022】請求項8に記載の対訳例文検索装置は、請
求項3または請求項7に記載の対訳例文検索装置であっ
て、前記登録手段は、前記キーワード抽出手段で抽出さ
れたキーワードを採用するか否かをユーザが確認処理す
るためのユーザ確認処理手段をさらに含むことを特徴と
する。
【0023】請求項1に記載の発明によれば、対訳例文
データベースには、第1の言語と第2の言語との対訳例
文が記憶される。検索要求文入力手段により、第1の言
語の検索要求文が入力されると検索手段により、対訳例
文データベースから検索要求文と所定の関係を有する対
訳例文が検索される。表示手段が、検索手段により検索
された対訳例文を表示する。登録手段により、第2の言
語の新規例文を入力すると、入力された新規例文に基づ
いて第1の言語の対応の訳文が自動的に生成され、対訳
例文として対訳例文データベースに登録される。
【0024】したがって、第2の言語の新規例文につい
て、第1の言語の対応の訳文を自動生成し、その対訳を
対訳例文データベースに自動的に登録することができる
ので、第1の言語の翻訳をユーザが手動で行なう必要が
ない。
【0025】請求項2に記載の発明によれば、請求項1
に記載の発明の作用に加え、対訳例文データベースはさ
らに、対訳例文に付与された第1の言語の検索用キーワ
ードを記憶する。キーワード抽出手段が、検索要求文か
らキーワードを抽出する。
【0026】したがって、検索要求文から抽出されたキ
ーワードに基づいて、対訳例文データベースから、その
キーワードを含む対訳を検索することができる。
【0027】請求項3に記載の発明によれば、請求項2
に記載の発明の作用に加え、新規例文入力手段により、
第2の言語の新規例文が入力されると、翻訳処理手段に
より、新規例文が機械翻訳されて、第1の言語による訳
文が作成され、訳文と新規例文とを含む新規対訳例文が
生成される。キーワード抽出手段により、訳文からキー
ワードが抽出され、新規対訳例文に付与される。新規対
訳例文登録手段により、この新規対訳例文が、対応のキ
ーワードとともに対訳例文データベースに登録される。
【0028】したがって、ユーザ作成の第2の言語の文
章は、機械翻訳されてキーワードが付与され、自動的に
対訳例文データベースに登録されるので、第1の言語の
翻訳をユーザが手動で行なうことなく、第1の言語によ
り対訳例文を検索することができる。
【0029】請求項4に記載の発明によれば、請求項1
に記載の発明の作用に加え、対訳例文データベースによ
り、対訳例文の意味的特徴を表わすための特徴ベクトル
が記憶される。検索要求特徴ベクトル生成手段により、
検索要求から検索要求の意味的特徴を表わすための検索
要求特徴ベクトルが生成される。特徴ベクトル検索手段
により、対訳例文データベースから検索要求特徴ベクト
ルとの距離が最も近い特徴ベクトルを付与された対訳例
文が検索される。
【0030】したがって、機械翻訳により自動生成され
た訳文を含む対訳が登録された対訳例文データベースか
ら、検索要求の検索要求特徴ベクトルと最も近い意味の
特徴ベクトルが付与された対訳例文を検索することがで
きる。
【0031】請求項5に記載の発明によれば、請求項4
に記載の発明の作用に加え、新規例文入力手段により、
第2の言語の新規例文が入力される。翻訳処理手段によ
り、新規例文が機械翻訳され、第1の言語による訳文が
作成され、訳文と新規例文とを含む新規対訳例文が生成
される。新規例文特徴ベクトル生成手段により、訳文か
ら新規例文の意味的特徴を表わす新規例文特徴ベクトル
が生成される。新規対訳例文登録手段により、新規例文
特徴ベクトル生成手段により新規例文特徴ベクトルを付
与された新規対訳例文が対訳例文データベースに登録さ
れる。
【0032】したがって、新規例文の訳文が機械翻訳に
より自動生成され、新規例文特徴ベクトルが新規対訳例
文に付与されて対訳例文データベースに登録されるの
で、第1の言語の翻訳をユーザが手動で行なうことな
く、第1の言語により検索要求文に最も近い意味の対訳
を検索することができる。
【0033】請求項6に記載の発明によれば、請求項5
に記載の発明の作用に加え、単語辞書データベースによ
り、キーワードとキーワードの意味的特徴を表わすため
のキーワード特徴ベクトルとが記憶される。検索要求特
徴ベクトル算出手段により、キーワード特徴ベクトルに
基づいて検索要求特徴ベクトルが算出される。
【0034】したがって、新規対訳例文にキーワードが
付与され、単語辞書データベースに記憶されるキーワー
ド特徴ベクトルに基づいて、検索要求特徴ベクトルが算
出されるので、第1の言語の翻訳をユーザが手動で行な
うことなく、第1の言語により、検索要求文に最も近い
意味の対訳を検索することができる。
【0035】請求項7に記載の発明によれば、請求項6
に記載の発明の作用に加え、キーワード抽出手段によ
り、新規対訳例文からキーワードが抽出され、新規例文
特徴ベクトルが生成される。
【0036】したがって、キーワード抽出手段により抽
出されたキーワードに基づいて、新規例文特徴ベクトル
が生成されるので、検索要求から生成された検索要求特
徴ベクトルとの距離が最も近い特徴ベクトルが付与され
た対訳を検索することができる。
【0037】請求項8に記載の発明によれば、請求項3
または請求項7に記載の発明の作用に加え、ユーザ確認
処理手段により、キーワード抽出手段で抽出されたキー
ワードを採用するか否かをユーザが確認処理するための
ユーザ確認処理が行なわれる。
【0038】したがって、機械翻訳された新規対訳例文
から抽出されたキーワードがユーザによりチェックされ
るので、検索要求文に最も近い意味の対訳の検索におけ
る検索精度を向上させることができる。
【0039】
【発明の実施の形態】本願発明の1実施の形態に係る対
訳例文検索装置について、図面を参照して詳細に説明す
る。図1は、本実施の形態に係る対訳例文検索装置のブ
ロック図である。図1を参照して、対訳例文検索装置
は、第1の言語と第2の言語との対訳例文を含む対訳例
文データベース101と、第1の言語の検索要求を入力
するための検索要求文入力部102と、対訳例文データ
ベース101から検索要求と所定の関係を有する対訳例
文を検索するための検索部103と、検索部103によ
り検索された対訳例文を表示するための表示部118
と、第2の言語の新規例文の入力が可能であり、入力さ
れた新規例文に基づいて第1の言語の対応の訳文を自動
的に生成して対訳例文として対訳例文データベース10
1に登録するための登録部104とを含む。
【0040】検索部103は、検索要求文からキーワー
ドを抽出するためのキーワード抽出部105と、キーワ
ードの意味的特徴を表わすキーワード特徴ベクトルを含
む単語辞書データベース106と、検索要求文とキーワ
ード特徴ベクトルとに基づいて、検索要求特徴ベクトル
を生成するための検索要求特徴ベクトル生成部107
と、対訳例文データベース101から、検索要求特徴ベ
クトルとの距離が最も近い特徴ベクトルを付与された対
訳例文を検索するための特徴ベクトル検索部108と、
検索モードを選択するためのモードフラグ109とを含
む。
【0041】登録部104は、第2の言語の新規例文を
入力するための新規例文入力部110と、新規例文に第
1の言語の訳文が含まれているか否かを判定するための
対訳判定部111と、新規例文の機械翻訳に使用するた
めの翻訳辞書・文法データベース112と、新規例文を
機械翻訳して第1の言語による訳文を作成し、その訳文
と新規例文とを含む新規対訳例文を生成するための翻訳
処理部113と、訳文から新規例文の意味的特徴を表わ
す新規例文特徴ベクトルを生成するための新規例文特徴
ベクトル生成部114と、新規例文特徴ベクトル生成部
114により新規例文特徴ベクトルを付与された新規対
訳例文を対訳例文データベース101に登録するための
新規対訳例文登録部115と、新規対訳例文からキーワ
ードを抽出して新規対訳例文に付与するためのキーワー
ド抽出部116と、キーワード抽出部116で抽出され
たキーワードを採用するか否かをユーザが確認処理する
ためのユーザ確認処理部117とを含む。
【0042】以下、本実施の形態では、第1の言語が自
国語である日本語であり、第2の言語が他国語である英
語である場合を例に挙げて説明するが、本発明の範囲は
これに限定されるものではなく、任意の第1の言語およ
び第2の言語に対して適用可能である。
【0043】図2は、本実施の形態に係る対訳例文検索
装置のハードウェア構成図である。図2および図1を参
照して、対訳例文検索装置は、検索要求文と新規例文と
を入力するための入力装置201と、対訳例文の検索結
果を表示するための表示部202と、検索要求入力部1
02、検索部103、登録部104、および表示部11
8の動作を実現するためのプログラムを格納するための
内部記憶装置203と、対訳例文データベース101、
単語辞書データベース106、および翻訳辞書・文法デ
ータベース112を格納するための外部記憶装置204
と、対訳例文検索装置の動作を制御するためのCPU
(Central Processing Unit )205とを含む。
【0044】入力装置201により、検索要求入力部1
02、および新規例文入力部110が構成され、表示部
202により、表示部118が構成される。内部記憶装
置203により、キーワード抽出部105、検索要求特
徴ベクトル生成部107、特徴ベクトル検索部108、
モードフラグ109、対訳判定部111、翻訳処理部1
13、新規例文特徴ベクトル生成部104、新規対訳例
文登録部115、キーワード抽出付与部116、および
ユーザ確認処理部117が構成される。外部記憶装置2
04により、対訳例文データベース101、単語辞書デ
ータベース106、および翻訳辞書・文法データベース
112が構成される。
【0045】次に、本実施の形態に係る対訳例文検索装
置の動作を説明する。図3は、本実施の形態に係る対訳
例文検索装置の動作を示すフローチャートである。図3
および図1を参照して、まず、検索においてキーワード
検索を行なうか、意味検索を行なうか、および例文登録
においてユーザ確認を行なうか否かが選択され、そのモ
ードがモードフラグ109にセットされる(S1)。な
お、このステップを設けずに、後述する、モードをチェ
ックするためのS5、およびユーザ確認を行なうか否か
を判断するためのS14でユーザがキー等で選択できる
ようにしておいてもよい。つまり、後述するS5で、キ
ーワード検索か意味検索かを選べるようにしてもよく、
S14で、ユーザが自国語キーワードを確認してから例
文登録するか否かを選べるようにしてもよい。
【0046】次に、他国語文作成の参考に、対訳例文を
検索するか、既存のもしくはユーザ自ら作成した、他国
語文を今後の他国語文作成時の参考にできるように、対
訳例文検索装置に登録するか、または作業を終了するか
を選択する(S2)。検索を選択する場合は、S3へ進
み、登録を選択する場合はS10へ進み、終了を選択す
る場合はシステムを終了する。
【0047】次に、検索要求入力部102において検索
要求が入力される(S3)。入力手段は、かな漢字変
換、文字認識など、どのような手段でもよい。
【0048】次に、キーワード抽出部105において、
単語辞書データベース106に登録されている語を検索
要求文の中から抽出する(S4)。対訳例文データベー
ス101に登録されている例文のキーワードは、単語辞
書データベース106に登録されている語の1つ以上か
らなっているので、前記抽出された語がキーワードとな
る。
【0049】次に、モードフラグ16がチェックされる
(S5)。キーワード検索モードであれば、S8のキー
ワード検索へ進み、意味検索モードであれば、S6へ進
む。S1で前述したように、モードフラグ16によるの
ではなく、ユーザがここでモードを選択するようにして
もよい。
【0050】次に、検索要求特徴ベクトル生成部107
において、S4で抽出したキーワードから検索要求の特
徴ベクトルが生成される(S6)。検索要求ベクトル生
成部107は、単語辞書データベース106を参照しな
がら、S4で抽出されたキーワードの各単語の単語特徴
ベクトルを得て、これらの単語特徴ベクトルの総和を正
規化した単位ベクトルを検索要求特徴ベクトルとして検
索部108へ出力する。
【0051】検索要求から検索要求特徴ベクトルが得ら
れるまで(S4およびS6)の例を図4に示す。図4
は、本実施の形態に係る対訳例文検索装置の検索要求か
ら検索要求特徴ベクトルを得る動作の説明図である。図
4を参照して、ここでは「テレビを修理する方法」とい
う検索要求文が入力された例を考える。検索要求は「修
理」のように単語であってもよいし、複数の文よりなる
文章データであってもよい。「テレビを修理する方法」
という検索要求が入力されたら、単語辞書データベース
106を用いて辞書びきが行なわれる。辞書びきのアル
ゴリズムは、特に本発明の問題ではなく、単語辞書デー
タベース106に登録されている語を検索要求の中から
抽出さえできればよい。抽出されたそれぞれの語である
「テレビ」、「修理」、および「方法」に対応する単語
特徴ベクトルは、単語辞書データベース106より、そ
れぞれベクトル長を備えた(長さ1)ベクトルV1、V
2、V3として得られる。この例では、各単語特徴ベク
トルの大きさはすべて同じになるようにしたが、状況に
よって単語ごとにベクトル長を変えて重みづけをするこ
とがあってもよい。最後に、V1、V2、V3の総和を
正規化したベクトルVsを検索要求ベクトルとする。
【0052】再び図3を参照して、前述したように、S
5でモードフラグ109が意味検索モードである場合に
は、検索部108で、検索要求特徴ベクトルに最も近い
意味の対訳例文が対訳例文データベース101から検索
される(S7)。図5を用いて具体的に説明する。
【0053】図5は、実施の形態に係る対訳例文検索装
置の検索要求に近い例文データを得る動作の説明図であ
る。図5を参照して、対訳例文データベース101に保
持されている各例文データiに対する特徴ベクトルVi
と検索要求特徴ベクトルVsとの内積Vs・Viを計算
し、この内積値を検索要求と対訳例文データiとの意味
的近似度Aiと定義する。そこで、上記の値が大きくな
る対訳例文データ、すなわち、検索要求に対して意味的
に近いと考えられる対訳例文データから順に表示部11
8に送る。この際、最も近いもの1件だけを送ってもよ
いし、上位n件を送ってもよい。また、一定の意味的近
似度を内積値のしきい値としてこれを満たすものを送っ
てもよい。
【0054】再び図3を参照して、一方、S5でモード
フラグがキーワード検索モードである場合には、S4で
得られた検索要求のキーワードの全部もしくは一部が含
まれている例文を、対訳例文データベース101から捜
し出す(S8)。全キーワードが一致した例文を最も先
に表示部118へ送り、以降、より多くのキーワードが
一致した例文を送る。予め定められた例文数のみを送る
ようにしておくのが現実的である。
【0055】次に、送られてきた対訳例文データが表示
部118に表示される(S9)。ユーザは、この表示さ
れた対訳例文の他国語文を参考にして、一部、変更など
をして、必要な他国語文を作成する。次に、S1に戻
り、対訳例文検索装置の動作が続行される。
【0056】次に、新規例文の登録時の動作を説明す
る。前述したS2で登録が選択された場合には、新規例
文入力部110で、対訳例文データベース101に登録
しようとする他国語文(本実施の形態では英語)が入力
される(S10)。
【0057】対訳判定部111で、新規例文入力部11
0で入力された新規例文が自国語文と他国語文との双方
を含む対訳文であるか否かがチェックされる(S1
1)。入力画面として、予め自国語欄と他国語欄とを用
意し、他国語欄を埋めるのは必須とする。対訳文である
か否かは自国語欄のデータの有無により判断する。な
お、ここは、他の方法を用いて判断してもよい。新規例
文が対訳である場合には、S13へ進み、対訳でない場
合はS12へ進む。
【0058】新規例文が対訳でない場合には、新規例文
入力部110で、入力された新規例文が翻訳処理部11
3により、翻訳辞書・文法データベース112を用いて
機械翻訳される(S12)。本実施の形態の場合は、英
日翻訳が行なわれる。翻訳方式は特に本発明の問題では
なく、公知の方式のいずれの方式でもよい。一般的な翻
訳処理の流れを図6に示し、そのときのデータの変化を
図7に示す。また機械翻訳による新規例文の登録の動作
を図8に示す。
【0059】図8は、本実施の形態に係る対訳例文検索
装置の機械翻訳による新規例文の登録の動作の説明図で
ある。図8を参照して、英文801から機械翻訳により
日本語文802が生成される。日本語文802から、キ
ーワード803が抽出される。キーワード803に基づ
いて特徴ベクトルを含む対訳例文804が生成される。
【0060】図6は、本実施の形態に係る対訳例文検索
装置の機械翻訳処理の動作を示すフローチャートであ
る。図7は、本実施の形態に係る対訳例文検索装置の機
械翻訳処理の処理概要の説明図である。機械翻訳処理は
翻訳処理部113で実行される。図6および図7を参照
して、原文が入力されると、辞書びき(S31)、およ
び形態素解析(S32)が行なわれ、機械翻訳された英
文の単語のそれぞれに品詞が付与される。たとえば、
「I」は代名詞(PRON)、「have」は動詞(V
ERB)、「a」は冠詞(DET)、「pen」は名詞
(NOUN)というがごとくである。次に、構文解析
(S33)を行ない、英語の木構造が得られる。この木
構造により、主動詞がどこにあり、主語がどれで、目的
語がどれであるかが明らかになる。この木構造が、日本
語の構造に変換され(S34)、日本語の述語を中心と
した構造に変わる。この構造は、日本語の格構造を表わ
しており、係り受け関係などが明らかになる。次に、生
成部(S35)で内部的に持っている属性などが付属語
の形で付加され、日本文が生成される。これらの処理
は、翻訳辞書・文法データベース112に保持されてい
る辞書・文法情報を用いて行なわれる。前述した図8に
おいては、英文801から日本文802が得られたとこ
ろに該当する。
【0061】再び図3を参照して、予めユーザが入力し
た自国語文、もしくは、S12の機械翻訳によって得ら
れた自国語文から、単語辞書データベース106を利用
して、キーワード抽出・付与部116でキーワードが抽
出される(S13)。この抽出方法は、S4で前述し
た、検索要求に対して行なった抽出方法と同じ抽出方法
が使用される。前述した、図8では、日本文802から
日本語キーワード803が得られたところに該当する。
【0062】次に、抽出されたキーワードに対してユー
ザ確認を行なうか否かがモードフラグ109により判断
される(S14)。前述したように、ここでユーザが指
示してもよい。
【0063】ユーザ確認を行なうと判断された場合に
は、ユーザ確認処理部117で、抽出されたキーワード
が正しいか否かをユーザがチェックする(S15)。
【0064】図9は本実施の形態に係る対訳例文検索装
置の新規例文登録時のユーザ確認画面の説明図である。
現状の機械翻訳は、曖昧性のある文章などを確実に翻訳
できるものではない。図9の例では、「pen」の訳語
が「ペン」であるのか、「おり(檻)」であるのかを機
械翻訳は判断することができない。ユーザが図8の確認
画面を見て英語を書いたときに意図していなかった訳語
をみつけて、排除するのは、容易に行なうことができ
る。このステップを挟むことにより、意図していなかっ
た意味の単語をキーワードとしないですみ、対訳例文デ
ータベースの確度が保たれ、以降の検索精度が向上する
ことになる。
【0065】なお、上記のキーワードチェックよりも手
間取るが、キーワードのみならず、日本語訳文自体をチ
ェックして、修正することも考えられる。しかし、対訳
例文データベース101において、他国語文は他国語作
文の参考にするものであるため高レベルのものが要求さ
れるのに対して、自国語文は、主に検索手段として使用
されるものであるから、それほど精度が要求されること
はない。したがって、キーワードのチェックで十分であ
るといえる。
【0066】再び図3を参照して、S13で得られたキ
ーワード、もしくはS15でユーザがチェックした後の
キーワードに対して、新規例文特徴ベクトル生成部11
4により、単語辞書データベース106を利用して、新
規例文特徴ベクトルが生成される(S16)。この特徴
ベクトル生成方法は、S6で前述した、検索要求に対し
て行なった特徴ベクトル生成方法と同じ方法である。こ
の特徴ベクトルの生成方法については、図6で前述した
ので、同一の説明はここでは繰返さない。図8では、日
本語キーワード803から、特徴ベクトルを含む対訳例
文804が得られたところに該当する。
【0067】S10で、ユーザが入力した英文(対訳で
ある場合は英文および日本文)、S12の機械翻訳結果
である日本文(対訳である場合は機械翻訳は行なわれな
い。)、S13で抽出したキーワード、およびS16で
生成した新規例文特徴ベクトルをセットにして、対訳例
文データベース101に登録し(S17)、S1に戻
る。
【0068】以上詳述してきたことから明らかなよう
に、本実施の形態によれば、対訳例文データの登録に際
して、必須である他国語文を入力するだけで、自動的に
機械翻訳が行なわれ、自国語文および自国語キーワード
が付与されるため、自国語の訳文をユーザが手動で作成
することなく、登録作業を容易に行なうことができる。
【0069】また、他国語文章作成のためのユーザの思
考の流れを止めることなく、ユーザの作成した他国語の
文例を自国語の訳文とともに対訳例文データベースに登
録することができ、後日再利用することができる。
【0070】また、システムが表示した自国語キーワー
ド候補について、ユーザが、他国語文作成時に意図して
いない単語が含まれていないかどうかをチェックするこ
とにより、現状では機械翻訳の精度が十分でないという
問題を解消することができ、検索に使用する新規例文の
キーワードの精度を容易に保つことができる。
【0071】さらに、単語辞書データベース106に他
国語の単語も登録しておいて、それを利用して、他国語
の文のみに特徴ベクトルをつけることも可能である。し
かし、この方法では、他国語単語の特徴ベクトルを作成
する手間がかかるのみならず、検索要求は自国語である
ことから、他国語単語と自国語単語の概念のずれ(図8
で説明したように、「pen」には日本語の「ペン」と
「檻」とが対応しており、「pen」と「ペン」とは同
一ではない。)が生じ、検索にノイズが乗ることにな
る。したがって、機械翻訳を利用して自国語に翻訳した
後、自国語の単語辞書データベース106で、新規例文
の訳文に特徴ベクトルを付与することにより、新規例文
の特徴ベクトルによる検索の精度を容易に保つことがで
きる。
【図面の簡単な説明】
【図1】本実施の形態に係る対訳例文検索装置のブロッ
ク図である。
【図2】本実施の形態に係る対訳例文検索装置のハード
ウェア構成図である。
【図3】本実施の形態に係る対訳例文検索装置の動作を
示すフローチャートである。
【図4】本実施の形態に係る対訳例文検索装置の検索要
求から検索要求特徴ベクトルを得る動作の説明図であ
る。
【図5】本実施の形態に係る対訳例文検索装置の検索要
求に近い例文データを得る動作の説明図である。
【図6】本実施の形態に係る対訳例文検索装置の機械翻
訳処理の動作を示すフローチャートである。
【図7】本実施の形態に係る対訳例文検索装置の機械翻
訳処理の処理概要の説明図である。
【図8】本実施の形態に係る対訳例文検索装置の機械翻
訳による新規例文の登録の動作の説明図である。
【図9】本実施の形態に係る対訳例文検索装置の新規例
文登録時のユーザ確認画面の説明図である。
【符号の説明】
101 対訳例文データベース 102 検索要求入力部 103 検索部 104 登録部 105 キーワード抽出部 106 単語辞書データベース 107 検索要求特徴ベクトル生成部 108 特徴ベクトル検索部 110 新規例文入力部 113 翻訳処理部 114 新規例文特徴ベクトル生成部 115 新規対訳例文登録部 116 キーワード抽出部 117 ユーザ確認処理部 118 表示部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1の言語と第2の言語との対訳例文を
    含む対訳例文データベースと、 第1の言語の検索要求を入力するための検索要求入力手
    段と、 前記対訳例文データベースから前記検索要求と所定の関
    係を有する対訳例文を検索するための検索手段と、 前記検索手段により検索された対訳例文を表示するため
    の表示手段と、 前記第2の言語の新規例文の入力が可能であり、入力さ
    れた前記新規例文に基づいて前記第1の言語の対応の訳
    文を自動的に生成して、対訳例文として前記対訳例文デ
    ータベースに登録するための登録手段とを含む、対訳例
    文検索装置。
  2. 【請求項2】 前記対訳例文データベースは、前記対訳
    例文に付与された前記第1の言語の検索用キーワードを
    さらに含み、 前記検索手段は、前記検索要求文からキーワードを抽出
    して当該キーワードを有する対訳例文を検索するための
    キーワード抽出手段を含む、請求項1に記載の対訳例文
    検索装置。
  3. 【請求項3】 前記登録手段は、前記第2の言語の新規
    例文を入力するための新規例文入力手段と、 前記新規例文を機械翻訳して前記第1の言語による訳文
    を作成し、前記訳文と前記新規例文とを含む新規対訳例
    文を生成するための翻訳処理手段と、 前記訳文からキーワードを抽出し、前記新規対訳例文に
    付与するためのキーワード抽出手段と、 前記キーワード抽出手段によりキーワードを付与された
    前記新規対訳例文を前記対訳例文データベースに登録す
    るための新規対訳例文登録手段とを含む、請求項2に記
    載の対訳例文検索装置。
  4. 【請求項4】 前記対訳例文データベースは、前記対訳
    例文の意味的特徴を表わすための特徴ベクトルをさらに
    含み、 前記検索手段は、 前記検索要求から前記検索要求の意味的特徴を表わすた
    めの検索要求特徴ベクトルを生成するための検索要求特
    徴ベクトル生成手段と、 前記対訳例文データベースから、前記検索要求特徴ベク
    トルとの距離が最も近い特徴ベクトルを付与された対訳
    例文を検索するための特徴ベクトル検索手段とを含む、
    請求項1に記載の対訳例文検索装置。
  5. 【請求項5】 前記登録手段は、前記第2の言語の新規
    例文を入力するための新規例文入力手段と、 前記新規例文を機械翻訳して前記第1の言語による訳文
    を作成し、前記訳文と前記新規例文とを含む新規対訳例
    文を生成するための翻訳処理手段と、 前記訳文から前記新規例文の意味的特徴を表わす新規例
    文特徴ベクトルを生成して前記新規例文に付与するため
    の新規例文特徴ベクトル生成手段と、 前記新規例文特徴ベクトル生成手段により新規例文特徴
    ベクトルを付与された前記新規対訳例文を、前記対訳例
    文データベースに登録するための新規対訳例文登録手段
    とを含む、請求項4に記載の対訳例文検索装置。
  6. 【請求項6】 前記検索手段は、キーワードとキーワー
    ドの意味的特徴を表わすキーワード特徴ベクトルとを含
    む単語辞書データベースと、 前記キーワード特徴ベクトルに基づいて前記検索要求特
    徴ベクトルを算出するための検索要求特徴ベクトル算出
    手段とを含む、請求項5に記載の対訳例文検索装置。
  7. 【請求項7】 前記登録手段は、前記新規対訳例文から
    キーワードを抽出して前記新規例文特徴ベクトルを生成
    するためのキーワード抽出手段をさらに含む、請求項6
    に記載の対訳例文検索装置。
  8. 【請求項8】 前記登録手段は、前記キーワード抽出手
    段で抽出されたキーワードを採用するか否かをユーザが
    確認処理するためのユーザ確認処理手段をさらに含む、
    請求項3または請求項7に記載の対訳例文検索装置。
JP18611196A 1996-07-16 1996-07-16 対訳例文登録装置 Expired - Fee Related JP4007630B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18611196A JP4007630B2 (ja) 1996-07-16 1996-07-16 対訳例文登録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18611196A JP4007630B2 (ja) 1996-07-16 1996-07-16 対訳例文登録装置

Publications (2)

Publication Number Publication Date
JPH1031676A true JPH1031676A (ja) 1998-02-03
JP4007630B2 JP4007630B2 (ja) 2007-11-14

Family

ID=16182560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18611196A Expired - Fee Related JP4007630B2 (ja) 1996-07-16 1996-07-16 対訳例文登録装置

Country Status (1)

Country Link
JP (1) JP4007630B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523000B1 (en) 1998-12-25 2003-02-18 Nec Corporation Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database
JP2004110835A (ja) * 2002-09-19 2004-04-08 Microsoft Corp 確認文を検索するための方法およびシステム
JP2005141630A (ja) * 2003-11-10 2005-06-02 Masanori Fukushima 翻訳支援辞書装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324719A (ja) * 1992-05-26 1993-12-07 Sanyo Electric Co Ltd 文書検索システム
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324719A (ja) * 1992-05-26 1993-12-07 Sanyo Electric Co Ltd 文書検索システム
JPH064584A (ja) * 1992-06-24 1994-01-14 Sharp Corp 文章検索装置
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523000B1 (en) 1998-12-25 2003-02-18 Nec Corporation Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database
JP2004110835A (ja) * 2002-09-19 2004-04-08 Microsoft Corp 確認文を検索するための方法およびシステム
US7974963B2 (en) 2002-09-19 2011-07-05 Joseph R. Kelly Method and system for retrieving confirming sentences
JP2005141630A (ja) * 2003-11-10 2005-06-02 Masanori Fukushima 翻訳支援辞書装置

Also Published As

Publication number Publication date
JP4007630B2 (ja) 2007-11-14

Similar Documents

Publication Publication Date Title
US5311429A (en) Maintenance support method and apparatus for natural language processing system
US5321607A (en) Automatic translating machine
US20080040095A1 (en) System for Multiligual Machine Translation from English to Hindi and Other Indian Languages Using Pseudo-Interlingua and Hybridized Approach
JP2002215617A (ja) 品詞タグ付けをする方法
JPS62163173A (ja) 機械翻訳方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2815714B2 (ja) 翻訳装置
JPH02254564A (ja) 翻訳用辞書編集装置
JP4007630B2 (ja) 対訳例文登録装置
JPH0332106B2 (ja)
JP2003006191A (ja) 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
JPS6190269A (ja) 翻訳方式
JP2004178351A (ja) 数量表現検索装置
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP2719453B2 (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JPH05225232A (ja) テキスト自動前編集装置
JP2002259424A (ja) クロスリンガル情報検索方法及び装置及びプログラム
JPH0973454A (ja) 文書作成装置及び文書作成方法
JPH03225468A (ja) 機械翻訳装置
JPH02294779A (ja) 機械翻訳システム
JPH04130577A (ja) 自然言語処理装置
JPH0332105B2 (ja)
JPH07141382A (ja) 外国語文書作成支援装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040413

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040525

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040721

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040805

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070828

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120907

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130907

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees