JP2001306562A - 機械翻訳装置、その辞書データ改良方法および記録媒体 - Google Patents

機械翻訳装置、その辞書データ改良方法および記録媒体

Info

Publication number
JP2001306562A
JP2001306562A JP2000127471A JP2000127471A JP2001306562A JP 2001306562 A JP2001306562 A JP 2001306562A JP 2000127471 A JP2000127471 A JP 2000127471A JP 2000127471 A JP2000127471 A JP 2000127471A JP 2001306562 A JP2001306562 A JP 2001306562A
Authority
JP
Japan
Prior art keywords
morpheme
target
target language
data
compound word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000127471A
Other languages
English (en)
Inventor
Masako Yoshimura
雅子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000127471A priority Critical patent/JP2001306562A/ja
Publication of JP2001306562A publication Critical patent/JP2001306562A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 原言語形態素の訳語候補と目的言語形態素と
を用いて機械翻訳用辞書に登録可能な複合語データを自
動的に抽出して機械翻訳用辞書データの改良を行うこと
ができる機械翻訳装置を提供すること。 【解決手段】 原言語の各形態素の訳語候補情報を用い
て目的言語形態素リストから複合語候補を抽出する複合
語候補抽出手段8を備え、複合語候補抽出手段8は、連
続する原言語形態素の訳語候補を接続した目的言語形態
素が目的言語形態素リストに存在する場合は連続する原
言語形態素と接続した目的言語形態素を複合語候補とし
て抽出し、連続する原言語形態素の訳語候補を接続する
際、原言語形態素間のハイフンについては訳語候補を接
続対象語としない。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ある言語(原言
語)を異なる言語(目的言語)に翻訳する機械翻訳装
置、その辞書データ改良方法、およびその方法を実行す
るための記録媒体に関するものである。
【0002】
【従来の技術】機械翻訳は、文法ルールと辞書データの
2つの知識ベースに基づいて実行されるため、辞書デー
タの改良は翻訳精度の向上に必要不可欠な作業の1つで
ある。近年、日本語においては、複合語が多用される傾
向があるが、この複合語データを自動的に辞書データに
反映させる有効な手段が存在しない。機械翻訳の構文解
析において複合語を正しく認識することは、曖昧性の減
少と適切な訳語の選択とを可能にし、翻訳精度の向上が
見込めるため、必要な複合語には人手で対応しているの
が現状である。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
機械翻訳装置では、必要な複合語には人手で対応してい
るので、日々、新しく誕生する複合語に人手で対応する
場合、膨大な作業が必要となり、また、この作業には、
その言語の専門知識が必要となるという問題点を有して
いた。
【0004】この機械翻訳装置、辞書データ改良方法お
よび記録媒体では、対象とする機械翻訳の原言語と目的
言語との2つの言語で同一内容について記述した対訳文
書(対訳テキストファイル)を使用し、対訳テキストフ
ァイルにおける原言語形態素の訳語候補と目的言語形態
素とを用いて、機械翻訳用辞書に登録可能な複合語デー
タを自動的に抽出し、機械翻訳用辞書データの改良を行
えることが要求されている。
【0005】本発明は、この要求を満たすため、原言語
形態素の訳語候補と目的言語形態素とを用いて機械翻訳
用辞書に登録可能な複合語データを自動的に抽出して機
械翻訳用辞書データの改良を行うことができる機械翻訳
装置、および、原言語形態素の訳語候補と目的言語形態
素とを用いて機械翻訳用辞書に登録可能な複合語データ
を自動的に抽出して機械翻訳用辞書データの改良を行う
ための機械翻訳装置の辞書データ改良方法、ならびに、
その辞書データ改良方法を実行するための記録媒体を提
供することを目的とする。
【0006】
【課題を解決するための手段】上記課題を解決するため
に本発明の機械翻訳装置は、対象文書の指定や実行指示
を行う入力装置と、対訳テキストファイルのテキストを
一文ごとに分割する文認定処理手段と、目的言語の解析
に必要な単語に関する情報を格納した目的言語解析用単
語辞書と、原言語から目的言語への翻訳に必要な単語に
関する情報を格納した翻訳用単語辞書と、目的言語解析
用単語辞書を参照して目的言語で記述された文を形態素
単位に分割する目的言語形態素解析処理手段と、翻訳用
単語辞書を参照して原言語で記述された文を形態素単位
に分割する原言語形態素解析処理手段と、原言語と目的
言語で記述された対訳テキストファイルの形態素解析結
果を原言語形態素リストと目的言語形態素リストとして
格納する形態素リスト格納部と、原言語の各形態素の訳
語候補情報を用いて目的言語形態素リストから複合語候
補を抽出する複合語候補抽出手段と、抽出した複合語候
補を対訳テキストファイルと対応づけて格納する抽出複
合語データ記憶部と、抽出複合語データ記憶部のデータ
から辞書登録対象データを抽出する登録対象データ抽出
手段と、翻訳用単語辞書を構成する翻訳用辞書データベ
ースと、翻訳用辞書データベースへ指定された語に関す
るデータを追加する辞書データ登録手段と、データ等を
表示する表示装置と、文認定処理手段、目的言語形態素
解析処理手段、原言語形態素解析処理手段、複合語候補
抽出手段、登録対象データ抽出手段、辞書データ登録手
段の動作および形態素リスト格納部、抽出複合語データ
記憶部に格納されたデータの流れを制御する制御手段と
を有し、複合語候補抽出手段は、連続する原言語形態素
の訳語候補を接続した目的言語形態素が目的言語形態素
リストに存在する場合は連続する原言語形態素と接続し
た目的言語形態素を複合語候補として抽出し、連続する
原言語形態素の訳語候補を接続する際、原言語形態素間
のハイフンについては訳語候補を接続対象語としない構
成を備えている。
【0007】これにより、原言語形態素の訳語候補と目
的言語形態素とを用いて機械翻訳用辞書に登録可能な複
合語データを自動的に抽出して機械翻訳用辞書データの
改良を行うことができる機械翻訳装置が得られる。
【0008】上記課題を解決するために本発明の機械翻
訳装置の辞書データ改良方法は、使用する対訳テキスト
ファイルを指定する指定ステップと、指定した対訳テキ
ストファイルにおいて原言語テキストファイルを形態素
解析して原言語形態素と訳語候補を列挙した原言語形態
素リストを作成する原言語形態素リスト作成ステップ
と、指定した対訳テキストファイルにおいて目的言語テ
キストファイルを形態素解析して目的言語形態素を列挙
した目的言語形態素リストを作成する目的言語形態素リ
スト作成ステップと、連続する原言語形態素の訳語候補
を接続した目的言語形態素が目的言語形態素リストに存
在する場合は連続する原言語形態素と接続した目的言語
形態素とを複合語候補として抽出する抽出ステップと、
連続する原言語形態素の訳語候補を接続する際、原言語
形態素間のハイフンについては訳語候補を接続対象語と
せずに複合語候補を抽出し、抽出した複合語候補を翻訳
用辞書データベースに登録する登録ステップとを有する
構成を備えている。
【0009】これにより、原言語形態素の訳語候補と目
的言語形態素とを用いて機械翻訳用辞書に登録可能な複
合語データを自動的に抽出して機械翻訳用辞書データの
改良を行うための機械翻訳装置の辞書データ改良方法が
得られる。
【0010】上記課題を解決するために本発明の記録媒
体は、上記辞書データ改良方法の各ステップを実行する
ためのプログラムを格納した構成を備えている。
【0011】これにより、上記辞書データ改良方法を実
行するための記録媒体が得られる。
【0012】
【発明の実施の形態】本発明の請求項1に記載の機械翻
訳装置は、対象文書の指定や実行指示を行う入力装置
と、対訳テキストファイルのテキストを一文ごとに分割
する文認定処理手段と、目的言語の解析に必要な単語に
関する情報を格納した目的言語解析用単語辞書と、原言
語から目的言語への翻訳に必要な単語に関する情報を格
納した翻訳用単語辞書と、目的言語解析用単語辞書を参
照して目的言語で記述された文を形態素単位に分割する
目的言語形態素解析処理手段と、翻訳用単語辞書を参照
して原言語で記述された文を形態素単位に分割する原言
語形態素解析処理手段と、原言語と目的言語で記述され
た対訳テキストファイルの形態素解析結果を原言語形態
素リストと目的言語形態素リストとして格納する形態素
リスト格納部と、原言語の各形態素の訳語候補情報を用
いて目的言語形態素リストから複合語候補を抽出する複
合語候補抽出手段と、抽出した複合語候補を対訳テキス
トファイルと対応づけて格納する抽出複合語データ記憶
部と、抽出複合語データ記憶部のデータから辞書登録対
象データを抽出する登録対象データ抽出手段と、翻訳用
単語辞書を構成する翻訳用辞書データベースと、翻訳用
辞書データベースへ指定された語に関するデータを追加
する辞書データ登録手段と、データ等を表示する表示装
置と、文認定処理手段、目的言語形態素解析処理手段、
原言語形態素解析処理手段、複合語候補抽出手段、登録
対象データ抽出手段、辞書データ登録手段の動作および
形態素リスト格納部、抽出複合語データ記憶部に格納さ
れたデータの流れを制御する制御手段とを有し、複合語
候補抽出手段は、連続する原言語形態素の訳語候補を接
続した目的言語形態素が目的言語形態素リストに存在す
る場合は連続する原言語形態素と接続した目的言語形態
素を複合語候補として抽出し、連続する原言語形態素の
訳語候補を接続する際、原言語形態素間のハイフンにつ
いては訳語候補を接続対象語としないこととしたもので
ある。
【0013】この構成により、同一内容について記述し
た対訳文書を用いて、原言語形態素間にハイフンを含ん
だ新出の複合語へも対応した翻訳用辞書データの改良を
行うことができるという作用を有する。
【0014】請求項2に記載の機械翻訳装置は、請求項
1に記載の機械翻訳装置において、複合語候補抽出手段
は、連続する原言語形態素の訳語候補を接続した目的言
語形態素が目的言語形態素リストに存在する場合は連続
する原言語形態素と接続した目的言語形態素を複合語候
補として抽出し、連続する原言語形態素の訳語候補を接
続する際、そのまま接続または中黒(・)を挟んで接続
した目的言語形態素が目的言語形態素リストに存在する
場合は複合語候補として抽出することとしたものであ
る。
【0015】この構成により、同一内容について記述し
た対訳文書を用いて、目的言語形態素中に中黒(・)を
含む新出の複合語へも対応した翻訳用辞書データの改良
を行うことができるという作用を有する。
【0016】請求項3に記載の機械翻訳装置は、請求項
1又は2に記載の機械翻訳装置において、複合語候補抽
出手段は、連続する原言語形態素の訳語候補を接続した
目的言語形態素または連続する原言語形態素の読みのカ
タカナ表記語を接続した目的言語形態素が目的言語形態
素リストに存在する場合は連続する原言語形態素と、連
続する原言語形態素の訳語候補または読みのカタカナ表
記語を接続した目的言語形態素とを複合語候補として抽
出することとしたものである。
【0017】この構成により、同一内容について記述し
た対訳文書において、原言語形態素の読みのカタカナ表
記語を用いることで、より多くの新出の複合語へも対応
した翻訳用辞書データの改良を行うことができるという
作用を有する。
【0018】請求項4に記載の機械翻訳装置は、請求項
1乃至3のいずれか1に記載の機械翻訳装置において、
登録対象データ抽出手段は、抽出複合語データ記憶部に
格納されたデータから登録対象データを抽出する際、原
言語形態素がハイフンで接続されている場合とそうでな
い場合とで異なる条件を用いることとしたものである。
【0019】この構成により、新出の複合語に対応する
信頼度の高い翻訳用辞書データの改良を行うことができ
るという作用を有する。
【0020】請求項5に記載の機械翻訳装置は、請求項
3又は4に記載の機械翻訳装置において、登録対象デー
タ抽出手段は、抽出複合語データ記憶部に格納されたデ
ータから登録対象データを抽出する際、原言語形態素の
読みのカタカナ表記語を用いた場合とそうでない場合と
で異なる条件を用いることとしたものである。
【0021】この構成により、新出の複合語に対応する
信頼度の高い翻訳用辞書データの改良を行うことができ
るという作用を有する。
【0022】請求項6に記載の機械翻訳装置の辞書デー
タ改良方法は、使用する対訳テキストファイルを指定す
る指定ステップと、指定した対訳テキストファイルにお
いて原言語テキストファイルを形態素解析して原言語形
態素と訳語候補を列挙した原言語形態素リストを作成す
る原言語形態素リスト作成ステップと、指定した対訳テ
キストファイルにおいて目的言語テキストファイルを形
態素解析して目的言語形態素を列挙した目的言語形態素
リストを作成する目的言語形態素リスト作成ステップ
と、連続する原言語形態素の訳語候補を接続した目的言
語形態素が目的言語形態素リストに存在する場合は連続
する原言語形態素と接続した目的言語形態素とを複合語
候補として抽出すると共に、連続する原言語形態素の訳
語候補を接続する際、原言語形態素間のハイフンについ
ては訳語候補を接続対象語とせずに複合語候補を抽出す
る抽出ステップと、抽出した複合語候補を翻訳用辞書デ
ータベースに登録する登録ステップとを有することとし
たものである。
【0023】この構成により、同一内容について記述し
た対訳文書を用いて、原言語形態素間にハイフンを含ん
だ新出の複合語へも対応した翻訳用辞書データの改良を
行うことができるという作用を有する。
【0024】請求項7に記載の機械翻訳装置の辞書デー
タ改良方法は、使用する対訳テキストファイルを指定す
る指定ステップと、指定した対訳テキストファイルにお
いて原言語テキストファイルを形態素解析して原言語形
態素と訳語候補を列挙した原言語形態素リストを作成す
る原言語形態素リスト作成ステップと、指定した対訳テ
キストファイルにおいて目的言語テキストファイルを形
態素解析して目的言語形態素を列挙した目的言語形態素
リストを作成する目的言語形態素リスト作成ステップ
と、連続する原言語形態素の訳語候補を接続した目的言
語形態素が目的言語形態素リストに存在する場合は連続
する原言語形態素と接続した目的言語形態素を複合語候
補として抽出すると共に、連続する原言語形態素の訳語
候補を接続する際、そのまま接続または中黒(・)を挟
んで接続した目的言語形態素が目的言語形態素リストに
存在する場合は連続する原言語形態素と接続した目的言
語形態素とを複合語候補として抽出する抽出ステップ
と、複合語候補を翻訳用辞書データベースに登録する登
録ステップとを有することとしたものである。
【0025】この構成により、同一内容について記述し
た対訳文書を用いて、目的言語形態素中に中黒(・)を
含む新出の複合語へも対応した翻訳用辞書データの改良
を行うことができるという作用を有する。
【0026】請求項8に記載の機械翻訳装置の辞書デー
タ改良方法は、使用する対訳テキストファイルを指定す
る指定ステップと、指定した対訳テキストファイルにお
いて原言語テキストファイルを形態素解析して原言語形
態素と訳語候補を列挙した原言語形態素リストを作成す
る原言語形態素リスト作成ステップと、指定した対訳テ
キストファイルにおいて目的言語テキストファイルを形
態素解析して目的言語形態素を列挙した目的言語形態素
リストを作成する目的言語形態素リスト作成ステップ
と、連続する原言語形態素の訳語候補を接続した目的言
語形態素または連続する原言語形態素の読みのカタカナ
表記語を接続した目的言語形態素が目的言語形態素リス
トに存在する場合は連続する原言語形態素と接続した目
的言語形態素とを複合語候補として抽出する抽出ステッ
プと、抽出した複合語候補を翻訳用辞書データベースに
登録する登録ステップとを有することとしたものであ
る。
【0027】この構成により、同一内容について記述し
た対訳文書において、原言語形態素の読みのカタカナ表
記語を用いることで、より多くの新出の複合語へも対応
した翻訳用辞書データの改良を行うことができるという
作用を有する。
【0028】請求項9に記載の機械翻訳装置の辞書デー
タ改良方法は、使用する対訳テキストファイルを指定す
る指定ステップと、指定した対訳テキストファイルにお
いて原言語テキストファイルを形態素解析して原言語形
態素と訳語候補を列挙した原言語形態素リストを作成す
る原言語形態素リスト作成ステップと、指定した対訳テ
キストファイルにおいて目的言語テキストファイルを形
態素解析して目的言語形態素を列挙した目的言語形態素
リストを作成する目的言語形態素リスト作成ステップ
と、連続する原言語形態素の訳語候補を接続した目的言
語形態素または連続する原言語形態素の読みのカタカナ
表記語を接続した目的言語形態素が目的言語形態素リス
トに存在する場合は連続する原言語形態素と接続した目
的言語形態素とを複合語候補として抽出する抽出ステッ
プと、原言語形態素がハイフンで接続されている場合と
そうでない場合とで異なる条件を用いて抽出した複合語
候補から登録対象データを抽出し、抽出した登録対象デ
ータを翻訳用辞書データベースに登録する登録ステップ
とを有することとしたものである。
【0029】この構成により、新出の複合語に対応する
信頼度の高い翻訳用辞書データの改良を行うことができ
るという作用を有する。
【0030】請求項10に記載の機械翻訳装置の辞書デ
ータ改良方法は、使用する対訳テキストファイルを指定
する指定ステップと、指定した対訳テキストファイルに
おいて原言語テキストファイルを形態素解析して原言語
形態素と訳語候補を列挙した原言語形態素リストを作成
する原言語形態素リスト作成ステップと、目的言語テキ
ストファイルを形態素解析して目的言語形態素を列挙し
た目的言語形態素リストを作成する目的言語形態素リス
ト作成ステップと、連続する原言語形態素の訳語候補を
接続した目的言語形態素または連続する原言語形態素の
読みのカタカナ表記語を接続した目的言語形態素が目的
言語形態素リストに存在する場合は連続する原言語形態
素と接続した目的言語形態素とを複合語候補として抽出
する抽出ステップと、原言語形態素の読みのカタカナ表
記語を用いた場合とそうでない場合とで異なる条件を用
いて抽出した複合語候補から登録対象データを抽出し、
抽出した登録対象データを翻訳用辞書データベースに登
録する登録ステップとを有することとしたものである。
【0031】この構成により、新出の複合語に対応する
信頼度の高い翻訳用辞書データの改良を行うことができ
るという作用を有する。
【0032】請求項11に記載の記録媒体は、請求項6
乃至10のいずれか1に記載の辞書データ改良方法の各
ステップを実行するためのプログラムを格納することと
したものである。
【0033】この構成により、請求項6乃至10のいず
れか1に記載の辞書データ改良方法が任意の場所、任意
の時間に実行可能になるという作用を有する。
【0034】以下、本発明の実施の形態について図1〜
図12を用いて説明する。
【0035】(実施の形態1)図1は本発明の実施の形
態1による機械翻訳装置を示すブロック図である。
【0036】図1において、1は対象文書の指定や実行
指示を行う入力装置、2は対訳テキストファイルのテキ
ストを一文ごとに分割する文認定処理手段、3は目的言
語の解析に必要な単語に関する情報を格納した目的言語
解析用単語辞書、4は原言語から目的言語への翻訳に必
要な単語に関する情報を格納した翻訳用単語辞書、5は
目的言語解析用単語辞書3を参照して目的言語で記述さ
れた文を形態素単位に分割する目的言語形態素解析処理
手段、6は翻訳用単語辞書4を参照して原言語で記述さ
れた文を形態素単位に分割する原言語形態素解析処理手
段、7は原言語と目的言語で記述された対訳テキストフ
ァイルの形態素解析結果を格納する形態素リスト格納
部、8は原言語の各形態素の訳語候補情報を用いて目的
言語形態素リストから複合語候補を抽出する複合語候補
抽出手段、9は抽出した複合語候補を対訳テキストファ
イルと対応づけて格納する抽出複合語データ記憶部、1
0は抽出複合語データ記憶部9のデータから辞書登録対
象データを抽出する登録対象データ抽出手段、11は後
述の翻訳用辞書データベース12へ指定された語に関す
るデータを追加する辞書データ登録手段、12は翻訳用
単語辞書4を構成する翻訳用辞書データベース、13は
データ等を表示する表示装置、14は文認定処理手段
2、目的言語形態素解析処理手段5、原言語形態素解析
処理手段6、複合語候補抽出手段8、登録対象データ抽
出手段10、辞書データ登録手段11の動作および形態
素リスト格納部7、抽出複合語データ記憶部9に格納さ
れたデータの流れを制御する制御手段である。
【0037】図2は図1の機械翻訳装置を具体的に示す
装置構成ブロック図である。
【0038】図2において、15はキーボード、16は
中央処理装置(以下、「CPU」と記載する)、17は
陰極線管ディスプレイ(以下、「CRT」と記載す
る)、18はリードオンリーメモリ(以下、「ROM」
と記載する)、19はランダムアクセスメモリ(以下、
「RAM」と記載する)、20はCD−ROMなどの記
録媒体21からデータを読み込むディスク・ドライブで
ある。
【0039】図1の入力装置1はキーボード15により
実現され、形態素リスト格納部7、抽出複合語データ記
憶部9、翻訳用辞書データベース12はRAM19によ
り、目的言語解析用単語辞書3、翻訳用単語辞書4はR
OM18により、文認定処理手段2、目的言語形態素解
析処理手段5、原言語形態素解析処理手段6、複合語候
補抽出手段8、登録対象データ抽出手段10、辞書デー
タ登録手段11、制御手段14はCPU16が、ROM
18およびRAM19とデータのやりとりを行いながら
ROM18のプログラム格納領域に記憶されたプログラ
ムを実行することにより実現され、また表示装置13は
CRT17により実現されている。すなわち、図1の手
段2、5、6、8、10、11、14はROM格納のプ
ログラムにより機能が実現される機能実現手段であり、
各装置1、13、各部7、9、単語辞書3、4、データ
ベース12はハードウェアである。なお、本実施の形態
では、CPU16がROM18に記憶されたプログラム
を実行することにより制御する形態が示されているが、
コンピュータで読み取り可能な記録媒体21に記録され
た制御プログラムをディスク・ドライブ20から読み込
み、RAM19上に展開した後、CPU16が実行する
形態であっても構わない。このような形態を取ることに
より、本実施の形態を汎用コンピュータで容易に実現す
ることができる。
【0040】上記のように構成された機械翻訳装置につ
いて、入力装置1によって、使用する対訳テキストファ
イルが指定されて実行が指示された場合(指定ステップ
が実行された場合)に行われる処理動作を図3を用いて
説明する。図3は図1の機械翻訳装置における辞書改良
データ処理の動作を示すフローチャートである。
【0041】まず制御手段14は、対訳テキストファイ
ルから原言語テキストファイルを取り出し、文認定処理
手段2に渡す(A1)。文認定処理手段2は、指定され
た対訳テキストファイルを対象に、記述された言語に応
じて文認定を行って文単位に分割する(A2)。次に、
原言語形態素解析処理手段6は、文単位に分割されたテ
キストを対象に、翻訳用単語辞書4を参照して1文ずつ
形態素解析を行い、各形態素に対し訳語候補を優先度順
に列挙した原言語形態素リストを形態素リスト格納部7
に格納する。図4は、形態素リスト格納部7に格納する
原言語形態素リストの例を示すデータ図である。次に、
対応する目的言語テキストファイルの解析を行う。まず
制御手段14は、ステップA1で取り出した原言語テキ
ストファイルに対応する目的言語テキストファイルを取
り出し、文認定処理手段2に渡す(A4)。文認定処理
手段2は、指定されたテキストファイルを対象に、記述
された言語に応じて文認定を行って文単位に分割する
(A5)。目的言語形態素解析処理手段5は、文単位に
分割されたテキストを対象に、目的言語解析用単語辞書
3を参照して1文ずつ形態素解析を行い、各形態素を列
挙した目的言語形態素リストを形態素リスト格納部7に
格納する。図5は、形態素リスト格納部7に格納する目
的言語形態素リストの例を示すデータ図である。次に、
複合語候補抽出手段8は、形態素リスト格納部7に格納
した原言語形態素リスト(図4)および目的言語形態素
リスト(図5)を対象に複合語候補抽出処理を行い、抽
出した複合語候補データを抽出複合語データ記憶部9に
格納する。なお、図3において、ステップA1〜A3は
原言語形態素リスト作成ステップを構成し、ステップA
4〜A6は目的言語形態素リスト作成ステップを構成
し、ステップA7は抽出ステップを構成する。
【0042】次に、図3のステップA7で行う複合語候
補抽出処理について、その動作を図6を用いて詳細に説
明する。図6は、複合語候補抽出処理を示すフローチャ
ートであり、従って複合語候補抽出手段8の動作を示
す。
【0043】形態素リスト格納部7に格納した原言語形
態素リストに形態素情報があるか否かを判定し(A7−
1)、形態素情報があると判定した場合、原言語形態素
データと一形態素分の訳語候補データとを取得する(A
7−2)。次に、訳語候補データが取得されたか否かを
判定し(A7−3)、訳語候補データが取得されなかっ
たと判定した場合、ステップA7−4に進む。ステップ
A7−4では、現在の複合語チェックデータリストをリ
セットしてステップA7−1に戻り、次の形態素情報に
関する処理を行う。
【0044】ステップA7−3で訳語候補データが取得
されたと判定した場合、ステップA7−5に進む。ステ
ップA7−5では、複合語チェックデータを1つ取り出
したか否かを判定し、ステップA7−6で、訳語候補デ
ータから訳語を1つ取り出したか否かを判定する。ステ
ップA7−5で複合語チェックデータを1つ取り出した
と判定し、ステップA7−6で訳語候補データから訳語
を1つ取り出したと判定した場合、ステップA7−7に
進む。ステップA7−7で、ステップA7−6で取り出
した訳語と、ステップA7−5で取り出した複合語チェ
ックデータとを照合し、訳語が複合語を構成可能な場
合、ステップA7−8に進む。訳語が複合語を構成でき
ない場合はステップA7−6に戻り、次の訳語候補デー
タに対して処理を行う。
【0045】ステップA7−8では、ステップA7−7
で照合した複合語チェックデータが複合語として成立し
たかどうかをチェックし、成立していない場合はステッ
プA7−9に進み、ステップA7−9で、該複合語チェ
ックデータに該訳語情報および該原言語形態素情報を付
与したデータを新複合語チェックデータとして保管して
ステップA7−6に戻り、次の訳語候補データに対して
も同様に処理を行う。ステップA7−6で次の訳語候補
データが取得できない場合、ステップA7−11に進
み、原言語形態素がハイフンの場合、ステップA7−1
2に進む。ステップA7−12では、該複合語チェック
データに該原言語形態素情報("−")を付与したデータ
を新複合語チェックデータとして保管してステップA7
−5に戻り、次の複合語チェックデータに対して処理を
行う。
【0046】ステップA7−8で該複合語チェックデー
タが複合語として成立した場合はステップA7−10に
進み、ステップA7−10で、該複合語チェックデータ
に該訳語情報および該原言語形態素情報を付与し、対応
する複合語候補を抽出複合語データリストに保管し、ス
テップA7−5に戻り、次の複合語チェックデータに対
して処理を行う。
【0047】ステップA7−5で次の複合語チェックデ
ータが取得できない場合はステップA7−13に進み、
ステップA7−13で、現在の複合語チェックデータリ
ストを新複合語チェックデータリストと置換する。次
に、訳語候補データから訳語を1つ取り出したか否かを
判定し(A7−14)、訳語を1つ取り出した場合はス
テップA7−15に進み、ステップA7−15で、形態
素リスト格納部7における目的言語形態素リストから、
該訳語で始まる複合語候補を取得し、複合語チェックデ
ータリストに追加する。
【0048】ステップA7−14で次の訳語が存在しな
いと判定した場合はステップA7−1に戻り、次の形態
素情報に関する処理を行う。ステップA7−1で、次の
形態素情報が存在しない場合、ステップA7−16で、
抽出複合語データ(抽出した複合語候補データ)を抽出
複合語データ記憶部9に保管し、処理を終了する。
【0049】次に、図4、図5の形態素リストを用いて
具体的に説明する。
【0050】図4、5の形態素リストの場合、まず、ス
テップA7−2で、(原言語形態素:"market"、
訳語候補データ:マーケット、市場、商店、店、販路、
需要)が取得される。最初の形態素に関する処理では、
複合語チェックデータが存在しないため、ステップA7
−5でステップA7−13に進み、ステップA7−14
で、訳語「マーケット」を取り出す。ステップA7−1
5で、目的言語形態素リストから、「マーケット」で始
まる目的言語形態素「マーケットリサーチコンサルタン
ト」を取得し、複合語チェックデータを複合語チェック
データリストに追加する。
【0051】複合語チェックデータは、連続する形態素
とのチェックが可能な形式のデータとし、例えば、目的
言語形態素、原言語形態素、訳語のセットなどを使用す
ることが可能である。この場合、(目的言語形態素「マ
ーケットリサーチコンサルタント」、原言語形態素"m
arket"、訳語「マーケット」)のセットを複合語
チェックデータリストに追加する。更にステップA7−
14に戻り、次の訳語「市場」を取り出し、ステップA
7−15で、目的言語形態素リストから、「市場」で始
まる目的言語形態素「市場調査」を取得し、複合語チェ
ックデータを複合語チェックデータリストに追加する。
前出の形式によれば、(「市場調査」、"marke
t"、「市場」)のセットをリストに追加する。
【0052】この処理を最後の訳語候補「需要」まで行
い、ステップA7−14で、次の訳語が取り出せない場
合、ステップA7−1に戻る。
【0053】ステップA7−1で、次の形態素情報があ
るため、ステップA7−2で、(原言語形態素:"−"、
訳語候補データ:−)が取得される。ステップA7−5
で、複合語チェックデータ(目的言語形態素「マーケッ
トリサーチコンサルタント」、原言語形態素"mark
et"、訳語「マーケット」)を取り出す。次に、ステ
ップA7ー6で訳語「−」を取り出し、ステップA7−
7で、訳語「−」が複合語「マーケットリサーチコンサ
ルタント」を構成可能か否かをチェックし、構成しえな
いため、ステップA7−6に戻り、次の訳語が存在しな
いため、ステップA7−11に進む。
【0054】ステップA7−11では、原言語形態素
が"−"なので、ステップA7−12に進み、新複合語チ
ェックデータとして、(目的言語形態素「マーケットリ
サーチコンサルタント」、原言語形態素"market
−"、訳語「マーケット」)のセットを新複合語チェッ
クデータリストに保管する。
【0055】次に、ステップA7−5に戻り、次の複合
語チェックデータ(目的言語形態素「市場調査」、原言
語形態素"market"、訳語「市場」を)取り出し、
同様の処理を繰り返し、ステップA7−12で新複合語
チェックデータとして、(目的言語形態素「市場調
査」、原言語形態素"market−"、訳語「市場」)
のセットを新複合語チェックデータリストに保管する。
【0056】ステップA7−5で、次の複合語チェック
データが取り出せないため、ステップA7−13に進
み、現在の複合語チェックデータを、ステップA7−9
およびステップA7−12で保管した新しい複合語チェ
ックデータと置換する。次に、ステップA7−14、A
7−15で、訳語候補「−」に関する複合語チェックデ
ータが取得できないため、ステップA7−1に戻り、次
の形態素情報があるため、ステップA7−2で、(原言
語形態素:"research"、訳語候補データ:研
究、リサーチ、学術調査、調査、研究する)が取得され
る。
【0057】ステップA7−5で、複合語チェックデー
タ(目的言語形態素「マーケットリサーチコンサルタン
ト」、原言語形態素"market−"、訳語「マーケッ
ト」)を取り出す。次に、ステップA7ー6で訳語「研
究」を取り出し、ステップA7−7で、訳語「研究」が
複合語「マーケットリサーチコンサルタント」を構成可
能かをチェックし、構成しえないため、ステップA7−
6に戻り、次の訳語「リサーチ」を取り出す。ステップ
A7−7で、訳語「リサーチ」は複合語「マーケットリ
サーチコンサルタント」を構成可能なため、ステップA
7−8に進み、複合語「マーケットリサーチコンサルタ
ント」が「マーケットリサーチ」と合致しないことによ
り訳語として成立していないため、ステップA7−9で
新複合語チェックデータとして、(目的言語形態素「マ
ーケットリサーチコンサルタント」、原言語形態素"m
arket−research"、訳語「マーケットリ
サーチ」)のセットを新複合語チェックデータリストに
保管し、ステップA7−6に戻り次の訳語を取り出す。
【0058】ステップA7−6で次の訳語が取り出せな
い場合、ステップA7−11に進み、原言語形態素が"
−"でないので、ステップA7−5に戻り、次の複合語
チェックデータ(目的言語形態素「市場調査」、原言語
形態素"market−"、訳語「市場」)を取り出し、
同様の処理を繰り返し、ステップA7−6で訳語「調
査」を取り出すと、ステップA7−7で、訳語「調査」
は複合語「市場調査」を構成可能なため、ステップA7
−8に進み、複合語「市場調査」が成立しているため、
ステップA7−10で抽出複合語データリストへ、複合
語"market−research"、訳語「市場調
査」を保管する。
【0059】ステップA7−5で、次の複合語チェック
データが取り出せないため、ステップA7−13に進
み、現在の複合語チェックデータを、ステップA7−9
およびステップA7−12で保管した新しい複合語チェ
ックデータと置換する。
【0060】ステップA7−14、A7−15で、訳語
候補がなくなるまで複合語チェックデータの取得を行
い、ステップA7−13の複合語チェックデータに追加
する。この時点での複合語チェックデータのリストを図
7に示す。図7は複合語チェックデータのリストを示す
データ図である。
【0061】ステップA7−1で次の形態素情報がなく
なると、ステップA7−16に進み、ステップA7−1
0で保管した抽出複合語データ(複合語"market
−research"、訳語「市場調査」)を抽出複合
語データ記憶部9に保管し、複合語候補抽出処理を終了
する。図4と図5に示す形態素解析リストを用いて上記
処理を行った結果の抽出複合語データを図8に示す。図
8は抽出複合語データを示すデータ図である。
【0062】複合語候補抽出処理終了後、登録対象デー
タ抽出手段10によって、辞書登録対象となる抽出複合
語データを取り出し、辞書データ登録手段11により、
翻訳用辞書データベース12へ登録する。
【0063】以上のように本実施の形態によれば、複合
語候補抽出手段8は、連続する原言語形態素の訳語候補
を接続した目的言語形態素が目的言語形態素リストに存
在する場合は連続する原言語形態素と接続した目的言語
形態素を複合語候補として抽出し、連続する原言語形態
素の訳語候補を接続する際、原言語形態素間のハイフン
については訳語候補を接続対象語としないようにしたこ
とにより、同一内容について記述した対訳文書を用い
て、原言語形態素間にハイフンを含んだ新出の複合語へ
も対応した翻訳用辞書データの改良を行うことができ
る。また、図6の各ステップを実行するためのプログラ
ムを記録媒体に記録することとすれば、任意の場所、任
意の時間に上記処理を実行することができる。
【0064】(実施の形態2)本発明の実施の形態2に
よる機械翻訳装置の構成は実施の形態1と同様、図1、
図2に示す構成である。
【0065】このように構成された機械翻訳装置につい
て、その動作を図6と図9を用いて説明する。図9は複
合語チェックデータと訳語との照合処理(図6のステッ
プA7−7の処理)を示すフローチャートである。
【0066】入力装置1によって、使用する対訳テキス
トファイルが指定されて実行が指示された場合に行われ
る処理の流れは実施の形態1の場合と同様であるが、図
6のステップA7−7で訳語が複合語を構成可能か否か
を判定する際、中黒(・)を考慮して判定を行う。以
下、その動作を図9に基づいて説明する。
【0067】まず、複合語チェックデータと照合するた
めの訳語データを作成する(B1)。複合語チェックデ
ータとして、実施の形態1と同じ、目的言語形態素、原
言語形態素、訳語のセットを使用している場合、複合語
チェックデータの訳語の末尾に対象訳語を接続した訳語
を作成する。次に、ステップB1で作成した訳語と複合
語チェックデータの目的言語形態素の先頭部分を比較す
る(B2)。目的言語形態素の先頭部分と同じ場合、ス
テップB1で用いた対象訳語は複合語を構成可能なので
図6のステップA7−8へ進む。目的言語形態素の先頭
部分と異なる場合、ステップB3に進む。
【0068】ステップB3で、複合語チェックデータの
目的言語形態素における対象訳語該当部分の文字列が中
黒(・)の場合、ステップB4に進む。中黒(・)でな
い場合、ステップB1で用いた対象訳語は複合語を構成
し得ないためステップA7−6に戻る。
【0069】ステップB4では、複合語チェックデータ
と照合するための、中黒(・)を追加した訳語データを
作成する。複合語チェックデータとして、実施の形態1
と同じ、目的言語形態素、原言語形態素、訳語のセット
を使用している場合、複合語チェックデータの訳語の末
尾に中黒(・)と対象訳語を接続した訳語を作成する。
【0070】次に、ステップB4で作成した訳語と複合
語チェックデータの目的言語形態素の先頭部分を比較す
る(B5)。目的言語形態素の先頭部分と同じ場合、ス
テップB4で用いた対象訳語は複合語を構成可能なので
ステップA7−8へ進む。目的言語形態素の先頭部分と
異なる場合、ステップB4で用いた対象訳語は複合語を
構成し得ないためステップA7−6に戻る。
【0071】以下、複合語チェックデータ(目的言語形
態素「リサーチ・ツール」、原言語形態素"resea
rch"、訳語「リサーチ」)において、訳語「ツー
ル」が複合語を構成可能か否かを判定する場合の処理に
ついて説明する。
【0072】まず、ステップB1で、複合語チェックデ
ータと照合するための訳語データとして、複合語チェッ
クデータの訳語「リサーチ」の末尾に対象訳語「ツー
ル」を接続した訳語「リサーチツール」を作成する。
【0073】ステップB2で、ステップB1で作成した
訳語「リサーチツール」が、複合語チェックデータの目
的言語形態素「リサーチ・ツール」の先頭部分と異なる
ため、ステップB3に進む。
【0074】ステップB3で、複合語チェックデータの
目的言語形態素「リサーチ・ツール」の先頭から、複合
語チェックデータの訳語「リサーチ」を除いた対象訳語
該当部分の文字列が中黒(・)なので、ステップB4に
進む。
【0075】ステップB4では、複合語チェックデータ
と照合するための訳語データとして、複合語チェックデ
ータの訳語「リサーチ」の末尾に中黒(・)と対象訳語
「ツール」を接続した訳語「リサーチ・ツール」を作成
する。
【0076】ステップB5で、ステップB4で作成した
訳語「リサーチ・ツール」が、複合語チェックデータの
目的言語形態素「リサーチ・ツール」の先頭部分と同じ
であり、対象訳語「ツール」は複合語を構成可能なので
ステップA7−8へ進む。
【0077】以上のように本実施の形態では、複合語候
補抽出手段8は、連続する原言語形態素の訳語候補を接
続した目的言語形態素が目的言語形態素リストに存在す
る場合は連続する原言語形態素と接続した目的言語形態
素を複合語候補として抽出し、連続する原言語形態素の
訳語候補を接続する際、そのまま接続または中黒(・)
を挟んで接続した目的言語形態素が目的言語形態素リス
トに存在する場合は複合語候補として抽出するようにし
たことにより、同一内容について記述した対訳文書を用
いて、目的言語形態素中に中黒(・)を含む新出の複合
語へも対応した翻訳用辞書データの改良を行うことがで
きる。また、図9の各ステップを実行するためのプログ
ラムを記録媒体に記録することとすれば、任意の場所、
任意の時間に上記処理を実行することができる。
【0078】(実施の形態3)本発明の実施の形態3に
よる機械翻訳装置の構成は実施の形態1と同様、図1、
図2に示す構成である。
【0079】このように構成された機械翻訳装置につい
て、その動作を図3と図10を用いて説明する。図10
は複合語候補抽出処理を示すフローチャートである。な
お、入力装置1によって、使用する対訳テキストファイ
ルが指定されて実行が指示された場合に行われる処理の
流れは実施の形態1の場合と同様である。
【0080】図3のステップA7で行う複合語候補抽出
処理について、以下、その動作を図10に基づいて説明
する。
【0081】図10のステップC7−1〜C7−4は図
6のステップA7−1〜A7−4と同様であるので、そ
の説明は省略する。
【0082】ステップC7−5で、翻訳用辞書データベ
ース12から、ステップC7−2で取得した原言語形態
素の読みのカタカナ表記語を取得し、以下、訳語候補と
同様に処理を行う。
【0083】ステップC7−6以降の処理は図6のステ
ップA7−5以降の処理と同様であるが、ステップC7
−5で取得した原言語形態素の読みのカタカナ表記語を
対象とするため、ステップC7−7およびステップC7
−15では、訳語と同様にカタカナ表記語を取り出し、
同様の処理を行う。
【0084】以上のように本実施の形態では、複合語候
補抽出手段8は、連続する原言語形態素の訳語候補を接
続した目的言語形態素または連続する原言語形態素の読
みのカタカナ表記語を接続した目的言語形態素が目的言
語形態素リストに存在する場合は連続する原言語形態素
と、連続する原言語形態素の訳語候補または読みのカタ
カナ表記語を接続した目的言語形態素とを複合語候補と
して抽出するようにしたことにより、同一内容について
記述した対訳文書において、原言語形態素の読みのカタ
カナ表記語を用いることで、より多くの新出の複合語へ
も対応した翻訳用辞書データの改良を行うことができ
る。また、図10の各ステップを実行するためのプログ
ラムを記録媒体に記録することとすれば、任意の場所、
任意の時間に上記処理を実行することができる。
【0085】(実施の形態4)本発明の実施の形態4に
よる機械翻訳装置の構成は実施の形態1と同様、図1、
図2に示す構成である。
【0086】このように構成された機械翻訳装置につい
て、その動作を図11を用いて説明する。図11は複合
語登録処理を示すフローチャートである。なお、入力装
置1によって使用する対訳テキストファイルが指定され
て実行が指示された場合に行われる複合語候補抽出処理
については、実施の形態1、2、3のいずれかの処理と
する。
【0087】全対訳ファイルについて、各々、複合語候
補抽出処理を行い、その後行う複合語登録処理につい
て、以下、その動作を図11に基づいて説明する。
【0088】まず、登録対象データ抽出手段10は、抽
出複合語データ記憶部9に格納された各ファイルに対応
した複合語データを統計処理し、各複合語のファイル出
現頻度を集計する(D1)。次に、ステップD1の集計
リストから複合語データを1つ取り出す(D2)。次い
で、該複合語データの原言語形態素がハイフンで接続さ
れているか否かを確認し、ハイフンで接続された形態素
の場合、ステップD4に進む(D3)。
【0089】ステップD4で、ステップD2で取り出し
た複合語データのファイル出現頻度が、予め設定したハ
イフン接続語登録頻度(条件A)より高頻度の場合、ス
テップD6で、辞書データ登録手段11により、翻訳用
辞書データベース12へ登録する。
【0090】ステップD3でハイフン接続語でないと判
定した場合、ステップD5に進み、ステップD5で、ス
テップD2で取り出した複合語データのファイル出現頻
度が、予め設定した登録頻度(条件B)より高頻度の場
合、ステップD6で、辞書データ登録手段11により、
翻訳用辞書データベース12へ登録する。
【0091】ステップD4、D5で、ファイル出現頻度
が一定頻度に達していないと判定した場合、該複合語は
翻訳用辞書データベース12へ登録せず、ステップD2
に戻る。ステップD2で、次のデータが取得できない場
合、処理を終了する。
【0092】なお、本実施の形態においては、各ファイ
ルに対応した複合語データを統計処理する際、各複合語
のファイル出現頻度を集計し、登録の条件として頻度を
用いたが、実施の形態としては、登録の条件として、原
言語形態素がハイフンで接続されている場合の条件Aを
そうでない場合の条件Bより緩和するという条件を満た
す、別の統計処理による条件を用いる形態も可能であ
る。
【0093】以上のように本実施の形態では、登録対象
データ抽出手段10は、抽出複合語データ記憶部9に格
納されたデータから登録対象データを抽出する際、原言
語形態素がハイフンで接続されている場合とそうでない
場合とで異なる条件を用いるようにしたことにより、新
出の複合語に対応する信頼度の高い翻訳用辞書データの
改良を行うことができる。また、図11の各ステップを
実行するためのプログラムを記録媒体に記録することと
すれば、任意の場所、任意の時間に上記処理を実行する
ことができる。
【0094】(実施の形態5)本発明の実施の形態5に
よる機械翻訳装置の構成は実施の形態1と同様、図1、
図2に示す構成である。
【0095】このように構成された機械翻訳装置につい
て、その動作を図12を用いて説明する。図12は複合
語登録処理を示すフローチャートである。なお、入力装
置1によって使用する対訳テキストファイルが指定され
て実行が指示された場合に行われる複合語候補抽出処理
については、実施の形態3の処理と同様である。ただ
し、抽出複合語データ記憶部9に格納された各複合語デ
ータが、原言語形態素の読みのカタカナ表記語を用いた
データか否かが判定可能でなければならないため、ステ
ップC7−7またはステップC7−15でカタカナ表記
語を取り出した場合には、ステップC7−10またはス
テップC7−16での複合語チェックデータ格納時にカ
タカナ表記語使用フラグをセットし、ステップC7−1
1での抽出複合語データ格納時にカタカナ表記語使用情
報を追加する。
【0096】全対訳ファイルについて、各々、複合語候
補抽出処理を行い、その後行う複合語登録処理につい
て、以下、その動作を図12に基づいて説明する。
【0097】まず、登録対象データ抽出手段10は、抽
出複合語データ記憶部9に格納された各ファイルに対応
した複合語データを統計処理し、各複合語のファイル出
現頻度を集計する(E1)。次に、ステップE1のリス
トから複合語データを1つ取り出す(E2)。次いで、
該複合語データが原言語形態素の読みのカタカナ表記語
を使用したデータか否かを確認し、カタカナ表記語使用
データの場合、ステップE4に進む(E3)。
【0098】ステップE4で、ステップE2で取り出し
た複合語データのファイル出現頻度が、予め設定したカ
タカナ表記語使用データ登録頻度(条件C)より高頻度
の場合、ステップE6で、辞書データ登録手段11によ
り、翻訳用辞書データベース12へ登録する。
【0099】ステップE3でカタカナ表記語未使用デー
タと判定した場合、ステップE5に進み、ステップE5
で、ステップE2で取り出した複合語データのファイル
出現頻度が、予め設定した登録頻度(条件B)より高頻
度の場合、ステップE6で、辞書データ登録手段11に
より、翻訳用辞書データベース12へ登録する。
【0100】ステップE4、E5で、ファイル出現頻度
が一定頻度に達していないと判定した場合、該複合語は
翻訳用辞書データベース12へ登録せず、ステップE2
に戻る。ステップE2で、次のデータが取得できない場
合、処理を終了する。
【0101】なお、本実施の形態においては、各ファイ
ルに対応した複合語データを統計処理する際、各複合語
のファイル出現頻度を集計し、登録の条件として頻度を
用いたが、実施の形態としては、登録の条件として、カ
タカナ表記語使用時の条件Cがそうでない場合の条件B
よりもきついという条件を満たす、別の統計処理による
条件を用いる形態も可能である。
【0102】以上のように本実施の形態では、登録対象
データ抽出手段10は、抽出複合語データ記憶部9に格
納されたデータから登録対象データを抽出する際、原言
語形態素の読みのカタカナ表記語を用いた場合とそうで
ない場合とで異なる条件を用いるようにしたことによ
り、新出の複合語に対応する信頼度の高い翻訳用辞書デ
ータの改良を行うことができる。また、図12の各ステ
ップを実行するためのプログラムを記録媒体に記録する
こととすれば、任意の場所、任意の時間に上記処理を実
行することができる。
【0103】(実施の形態6)前述した実施の形態1〜
5においては、複数の複合語抽出方法および複合語登録
方法を各々別々の実施の形態に分けて説明を行ったが、
実施の形態としては、各実施の形態における複数の複合
語抽出方法および複合語登録方法を組み合わせた実施の
形態とすることも可能である。
【0104】以上のように本実施の形態では、各実施の
形態における複数の複合語抽出方法および複合語登録方
法を組み合わせた実施の形態としたことにより、各実施
の形態による効果を組み合わせた効果を奏することがで
きる。
【0105】
【発明の効果】以上説明したように本発明の請求項1に
記載の機械翻訳装置によれば、対象文書の指定や実行指
示を行う入力装置と、対訳テキストファイルのテキスト
を一文ごとに分割する文認定処理手段と、目的言語の解
析に必要な単語に関する情報を格納した目的言語解析用
単語辞書と、原言語から目的言語への翻訳に必要な単語
に関する情報を格納した翻訳用単語辞書と、目的言語解
析用単語辞書を参照して目的言語で記述された文を形態
素単位に分割する目的言語形態素解析処理手段と、翻訳
用単語辞書を参照して原言語で記述された文を形態素単
位に分割する原言語形態素解析処理手段と、原言語と目
的言語で記述された対訳テキストファイルの形態素解析
結果を原言語形態素リストと目的言語形態素リストとし
て格納する形態素リスト格納部と、原言語の各形態素の
訳語候補情報を用いて目的言語形態素リストから複合語
候補を抽出する複合語候補抽出手段と、抽出した複合語
候補を対訳テキストファイルと対応づけて格納する抽出
複合語データ記憶部と、抽出複合語データ記憶部のデー
タから辞書登録対象データを抽出する登録対象データ抽
出手段と、翻訳用単語辞書を構成する翻訳用辞書データ
ベースと、翻訳用辞書データベースへ指定された語に関
するデータを追加する辞書データ登録手段と、データ等
を表示する表示装置と、文認定処理手段、目的言語形態
素解析処理手段、原言語形態素解析処理手段、複合語候
補抽出手段、登録対象データ抽出手段、辞書データ登録
手段の動作および形態素リスト格納部、抽出複合語デー
タ記憶部に格納されたデータの流れを制御する制御手段
とを有し、複合語候補抽出手段は、連続する原言語形態
素の訳語候補を接続した目的言語形態素が目的言語形態
素リストに存在する場合は連続する原言語形態素と接続
した目的言語形態素を複合語候補として抽出し、連続す
る原言語形態素の訳語候補を接続する際、原言語形態素
間のハイフンについては訳語候補を接続対象語としない
ことにより、対訳テキストファイルの解析データを用
い、原言語形態素の訳語候補情報と目的言語形態素情報
を用いて、機械翻訳用辞書に登録可能な複合語データを
自動的に抽出し、機械翻訳用辞書のデータ改良を行うこ
とができるので、新しい複合語に自動的に対応すること
ができるという有利な効果が得られる。また、同一内容
について記述した対訳文書を用いて、原言語形態素間に
ハイフンを含んだ新出の複合語へも対応した翻訳用辞書
データの改良を行うことができるという有利な効果が得
られる。
【0106】請求項2に記載の機械翻訳装置によれば、
請求項1に記載の機械翻訳装置において、複合語候補抽
出手段は、連続する原言語形態素の訳語候補を接続した
目的言語形態素が目的言語形態素リストに存在する場合
は連続する原言語形態素と接続した目的言語形態素を複
合語候補として抽出し、連続する原言語形態素の訳語候
補を接続する際、そのまま接続または中黒(・)を挟ん
で接続した目的言語形態素が目的言語形態素リストに存
在する場合は複合語候補として抽出することにより、同
一内容について記述した対訳文書を用いて、目的言語形
態素中に中黒(・)を含む新出の複合語へも対応した翻
訳用辞書データの改良を行うことができるという有利な
効果が得られる。
【0107】請求項3に記載の機械翻訳装置によれば、
請求項1又は2に記載の機械翻訳装置において、複合語
候補抽出手段は、連続する原言語形態素の訳語候補を接
続した目的言語形態素または連続する原言語形態素の読
みのカタカナ表記語を接続した目的言語形態素が目的言
語形態素リストに存在する場合は連続する原言語形態素
と、連続する原言語形態素の訳語候補または読みのカタ
カナ表記語を接続した目的言語形態素とを複合語候補と
して抽出することにより、同一内容について記述した対
訳文書において、原言語形態素の読みのカタカナ表記語
を用いることで、より多くの新出の複合語へも対応した
翻訳用辞書データの改良を行うことができるという有利
な効果が得られる。
【0108】請求項4に記載の機械翻訳装置によれば、
請求項1乃至3のいずれか1に記載の機械翻訳装置にお
いて、登録対象データ抽出手段は、抽出複合語データ記
憶部に格納されたデータから登録対象データを抽出する
際、原言語形態素がハイフンで接続されている場合とそ
うでない場合とで異なる条件を用いることにより、新出
の複合語に対応する信頼度の高い翻訳用辞書データの改
良を行うことができるという有利な効果が得られる。
【0109】請求項5に記載の機械翻訳装置によれば、
請求項3又は4に記載の機械翻訳装置において、登録対
象データ抽出手段は、抽出複合語データ記憶部に格納さ
れたデータから登録対象データを抽出する際、原言語形
態素の読みのカタカナ表記語を用いた場合とそうでない
場合とで異なる条件を用いることにより、新出の複合語
に対応する信頼度の高い翻訳用辞書データの改良を行う
ことができるという有利な効果が得られる。
【0110】請求項6に記載の機械翻訳装置の辞書デー
タ改良方法によれば、使用する対訳テキストファイルを
指定する指定ステップと、指定した対訳テキストファイ
ルにおいて原言語テキストファイルを形態素解析して原
言語形態素と訳語候補を列挙した原言語形態素リストを
作成する原言語形態素リスト作成ステップと、指定した
対訳テキストファイルにおいて目的言語テキストファイ
ルを形態素解析して目的言語形態素を列挙した目的言語
形態素リストを作成する目的言語形態素リスト作成ステ
ップと、連続する原言語形態素の訳語候補を接続した目
的言語形態素が目的言語形態素リストに存在する場合は
連続する原言語形態素と接続した目的言語形態素とを複
合語候補として抽出すると共に、連続する原言語形態素
の訳語候補を接続する際、原言語形態素間のハイフンに
ついては訳語候補を接続対象語とせずに複合語候補を抽
出する抽出ステップと、抽出した複合語候補を翻訳用辞
書データベースに登録する登録ステップとを有すること
により、同一内容について記述した対訳文書を用いて、
原言語形態素間にハイフンを含んだ新出の複合語へも対
応した翻訳用辞書データの改良を行うことができるとい
う有利な効果が得られる。
【0111】請求項7に記載の機械翻訳装置の辞書デー
タ改良方法によれば、使用する対訳テキストファイルを
指定する指定ステップと、指定した対訳テキストファイ
ルにおいて原言語テキストファイルを形態素解析して原
言語形態素と訳語候補を列挙した原言語形態素リストを
作成する原言語形態素リスト作成ステップと、指定した
対訳テキストファイルにおいて目的言語テキストファイ
ルを形態素解析して目的言語形態素を列挙した目的言語
形態素リストを作成する目的言語形態素リスト作成ステ
ップと、連続する原言語形態素の訳語候補を接続した目
的言語形態素が目的言語形態素リストに存在する場合は
連続する原言語形態素と接続した目的言語形態素を複合
語候補として抽出すると共に、連続する原言語形態素の
訳語候補を接続する際、そのまま接続または中黒(・)
を挟んで接続した目的言語形態素が目的言語形態素リス
トに存在する場合は連続する原言語形態素と接続した目
的言語形態素とを複合語候補として抽出する抽出ステッ
プと、複合語候補を翻訳用辞書データベースに登録する
登録ステップとを有することにより、同一内容について
記述した対訳文書を用いて、目的言語形態素中に中黒
(・)を含む新出の複合語へも対応した翻訳用辞書デー
タの改良を行うことができるという有利な効果が得られ
る。
【0112】請求項8に記載の機械翻訳装置の辞書デー
タ改良方法によれば、使用する対訳テキストファイルを
指定する指定ステップと、指定した対訳テキストファイ
ルにおいて原言語テキストファイルを形態素解析して原
言語形態素と訳語候補を列挙した原言語形態素リストを
作成する原言語形態素リスト作成ステップと、指定した
対訳テキストファイルにおいて目的言語テキストファイ
ルを形態素解析して目的言語形態素を列挙した目的言語
形態素リストを作成する目的言語形態素リスト作成ステ
ップと、連続する原言語形態素の訳語候補を接続した目
的言語形態素または連続する原言語形態素の読みのカタ
カナ表記語を接続した目的言語形態素が目的言語形態素
リストに存在する場合は連続する原言語形態素と接続し
た目的言語形態素とを複合語候補として抽出する抽出ス
テップと、抽出した複合語候補を翻訳用辞書データベー
スに登録する登録ステップとを有することにより、同一
内容について記述した対訳文書において、原言語形態素
の読みのカタカナ表記語を用いることで、より多くの新
出の複合語へも対応した翻訳用辞書データの改良を行う
ことができるという有利な効果が得られる。
【0113】請求項9に記載の機械翻訳装置の辞書デー
タ改良方法によれば、使用する対訳テキストファイルを
指定する指定ステップと、指定した対訳テキストファイ
ルにおいて原言語テキストファイルを形態素解析して原
言語形態素と訳語候補を列挙した原言語形態素リストを
作成する原言語形態素リスト作成ステップと、指定した
対訳テキストファイルにおいて目的言語テキストファイ
ルを形態素解析して目的言語形態素を列挙した目的言語
形態素リストを作成する目的言語形態素リスト作成ステ
ップと、連続する原言語形態素の訳語候補を接続した目
的言語形態素または連続する原言語形態素の読みのカタ
カナ表記語を接続した目的言語形態素が目的言語形態素
リストに存在する場合は連続する原言語形態素と接続し
た目的言語形態素とを複合語候補として抽出する抽出ス
テップと、原言語形態素がハイフンで接続されている場
合とそうでない場合とで異なる条件を用いて抽出した複
合語候補から登録対象データを抽出し、抽出した登録対
象データを翻訳用辞書データベースに登録する登録ステ
ップとを有することにより、新出の複合語に対応する信
頼度の高い翻訳用辞書データの改良を行うことができる
という有利な効果が得られる。
【0114】請求項10に記載の機械翻訳装置の辞書デ
ータ改良方法によれば、使用する対訳テキストファイル
を指定する指定ステップと、指定した対訳テキストファ
イルにおいて原言語テキストファイルを形態素解析して
原言語形態素と訳語候補を列挙した原言語形態素リスト
を作成する原言語形態素リスト作成ステップと、目的言
語テキストファイルを形態素解析して目的言語形態素を
列挙した目的言語形態素リストを作成する目的言語形態
素リスト作成ステップと、連続する原言語形態素の訳語
候補を接続した目的言語形態素または連続する原言語形
態素の読みのカタカナ表記語を接続した目的言語形態素
が目的言語形態素リストに存在する場合は連続する原言
語形態素と接続した目的言語形態素とを複合語候補とし
て抽出する抽出ステップと、原言語形態素の読みのカタ
カナ表記語を用いた場合とそうでない場合とで異なる条
件を用いて抽出した複合語候補から登録対象データを抽
出し、抽出した登録対象データを翻訳用辞書データベー
スに登録する登録ステップとを有することにより、新出
の複合語に対応する信頼度の高い翻訳用辞書データの改
良を行うことができるという有利な効果が得られる。
【0115】請求項11に記載の記録媒体によれば、請
求項6乃至10のいずれか1に記載の辞書データ改良方
法の各ステップを実行するためのプログラムを格納する
ことにより、請求項6乃至10のいずれか1に記載の辞
書データ改良方法が任意の場所、任意の時間に実行可能
になるという有利な効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1による機械翻訳装置を示
すブロック図
【図2】図1の機械翻訳装置を具体的に示す装置構成ブ
ロック図
【図3】図1の機械翻訳装置における辞書改良データ処
理の動作を示すフローチャート
【図4】形態素リスト格納部に格納する原言語形態素リ
ストの例を示すデータ図
【図5】形態素リスト格納部に格納する目的言語形態素
リストの例を示すデータ図
【図6】複合語候補抽出処理を示すフローチャート
【図7】新複合語チェックデータを示すデータ図
【図8】抽出複合語データを示すデータ図
【図9】複合語チェックデータと訳語との照合処理を示
すフローチャート
【図10】複合語候補抽出処理を示すフローチャート
【図11】複合語登録処理を示すフローチャート
【図12】複合語登録処理を示すフローチャート
【符号の説明】
1 入力装置 2 文認定処理手段 3 目的言語解析用単語辞書 4 翻訳用単語辞書 5 目的言語形態素解析処理手段 6 原言語形態素解析処理手段 7 形態素リスト格納部 8 複合語候補抽出手段 9 抽出複合語データ記憶部 10 登録対象データ抽出手段 11 辞書データ登録手段 12 翻訳用辞書データベース 13 表示装置 14 制御手段 15 キーボード(入力装置) 16 CPU(中央処理装置) 17 CRT(表示装置) 18 ROM 19 RAM 20 ディスク・ドライブ 21 記録媒体

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】対象文書の指定や実行指示を行う入力装置
    と、対訳テキストファイルのテキストを一文ごとに分割
    する文認定処理手段と、目的言語の解析に必要な単語に
    関する情報を格納した目的言語解析用単語辞書と、原言
    語から目的言語への翻訳に必要な単語に関する情報を格
    納した翻訳用単語辞書と、前記目的言語解析用単語辞書
    を参照して目的言語で記述された文を形態素単位に分割
    する目的言語形態素解析処理手段と、前記翻訳用単語辞
    書を参照して原言語で記述された文を形態素単位に分割
    する原言語形態素解析処理手段と、原言語と目的言語で
    記述された前記対訳テキストファイルの形態素解析結果
    を原言語形態素リストと目的言語形態素リストとして格
    納する形態素リスト格納部と、原言語の各形態素の訳語
    候補情報を用いて目的言語形態素リストから複合語候補
    を抽出する複合語候補抽出手段と、前記抽出した複合語
    候補を前記対訳テキストファイルと対応づけて格納する
    抽出複合語データ記憶部と、前記抽出複合語データ記憶
    部のデータから辞書登録対象データを抽出する登録対象
    データ抽出手段と、前記翻訳用単語辞書を構成する翻訳
    用辞書データベースと、前記翻訳用辞書データベースへ
    指定された語に関するデータを追加する辞書データ登録
    手段と、データ等を表示する表示装置と、前記文認定処
    理手段、前記目的言語形態素解析処理手段、前記原言語
    形態素解析処理手段、前記複合語候補抽出手段、前記登
    録対象データ抽出手段、前記辞書データ登録手段の動作
    および前記形態素リスト格納部、前記抽出複合語データ
    記憶部に格納されたデータの流れを制御する制御手段と
    を有し、前記複合語候補抽出手段は、連続する原言語形
    態素の訳語候補を接続した目的言語形態素が前記目的言
    語形態素リストに存在する場合は前記連続する原言語形
    態素と前記接続した目的言語形態素を複合語候補として
    抽出し、前記連続する原言語形態素の訳語候補を接続す
    る際、原言語形態素間のハイフンについては訳語候補を
    接続対象語としないことを特徴とする機械翻訳装置。
  2. 【請求項2】前記複合語候補抽出手段は、連続する原言
    語形態素の訳語候補を接続した目的言語形態素が前記目
    的言語形態素リストに存在する場合は前記連続する原言
    語形態素と前記接続した目的言語形態素を複合語候補と
    して抽出し、前記連続する原言語形態素の訳語候補を接
    続する際、そのまま接続または中黒(・)を挟んで接続
    した目的言語形態素が前記目的言語形態素リストに存在
    する場合は複合語候補として抽出することを特徴とする
    請求項1に記載の機械翻訳装置。
  3. 【請求項3】前記複合語候補抽出手段は、連続する原言
    語形態素の訳語候補を接続した目的言語形態素または前
    記連続する原言語形態素の読みのカタカナ表記語を接続
    した目的言語形態素が前記目的言語形態素リストに存在
    する場合は前記連続する原言語形態素と、前記連続する
    原言語形態素の訳語候補または読みのカタカナ表記語を
    接続した目的言語形態素とを複合語候補として抽出する
    ことを特徴とする請求項1又は2に記載の機械翻訳装
    置。
  4. 【請求項4】前記登録対象データ抽出手段は、前記抽出
    複合語データ記憶部に格納されたデータから登録対象デ
    ータを抽出する際、原言語形態素がハイフンで接続され
    ている場合とそうでない場合とで異なる条件を用いるこ
    とを特徴とする請求項1乃至3のいずれか1に記載の機
    械翻訳装置。
  5. 【請求項5】前記登録対象データ抽出手段は、前記抽出
    複合語データ記憶部に格納されたデータから登録対象デ
    ータを抽出する際、原言語形態素の読みのカタカナ表記
    語を用いた場合とそうでない場合とで異なる条件を用い
    ることを特徴とする請求項3又は4に記載の機械翻訳装
    置。
  6. 【請求項6】使用する対訳テキストファイルを指定する
    指定ステップと、前記指定した対訳テキストファイルに
    おいて原言語テキストファイルを形態素解析して原言語
    形態素と訳語候補を列挙した原言語形態素リストを作成
    する原言語形態素リスト作成ステップと、前記指定した
    対訳テキストファイルにおいて目的言語テキストファイ
    ルを形態素解析して目的言語形態素を列挙した目的言語
    形態素リストを作成する目的言語形態素リスト作成ステ
    ップと、連続する原言語形態素の訳語候補を接続した目
    的言語形態素が前記目的言語形態素リストに存在する場
    合は前記連続する原言語形態素と前記接続した目的言語
    形態素とを複合語候補として抽出すると共に、前記連続
    する原言語形態素の訳語候補を接続する際、原言語形態
    素間のハイフンについては訳語候補を接続対象語とせず
    に複合語候補を抽出する抽出ステップと、前記抽出した
    複合語候補を翻訳用辞書データベースに登録する登録ス
    テップとを有することを特徴とする機械翻訳装置の辞書
    データ改良方法。
  7. 【請求項7】使用する対訳テキストファイルを指定する
    指定ステップと、前記指定した対訳テキストファイルに
    おいて原言語テキストファイルを形態素解析して原言語
    形態素と訳語候補を列挙した原言語形態素リストを作成
    する原言語形態素リスト作成ステップと、前記指定した
    対訳テキストファイルにおいて目的言語テキストファイ
    ルを形態素解析して目的言語形態素を列挙した目的言語
    形態素リストを作成する目的言語形態素リスト作成ステ
    ップと、連続する原言語形態素の訳語候補を接続した目
    的言語形態素が前記目的言語形態素リストに存在する場
    合は前記連続する原言語形態素と前記接続した目的言語
    形態素を複合語候補として抽出すると共に、前記連続す
    る原言語形態素の訳語候補を接続する際、そのまま接続
    または中黒(・)を挟んで接続した目的言語形態素が前
    記目的言語形態素リストに存在する場合は前記連続する
    原言語形態素と前記接続した目的言語形態素とを複合語
    候補として抽出する抽出ステップと、前記複合語候補を
    翻訳用辞書データベースに登録する登録ステップとを有
    することを特徴とする機械翻訳装置の辞書データ改良方
    法。
  8. 【請求項8】使用する対訳テキストファイルを指定する
    指定ステップと、前記指定した対訳テキストファイルに
    おいて原言語テキストファイルを形態素解析して原言語
    形態素と訳語候補を列挙した原言語形態素リストを作成
    する原言語形態素リスト作成ステップと、前記指定した
    対訳テキストファイルにおいて目的言語テキストファイ
    ルを形態素解析して目的言語形態素を列挙した目的言語
    形態素リストを作成する目的言語形態素リスト作成ステ
    ップと、連続する原言語形態素の訳語候補を接続した目
    的言語形態素または前記連続する原言語形態素の読みの
    カタカナ表記語を接続した目的言語形態素が前記目的言
    語形態素リストに存在する場合は前記連続する原言語形
    態素と前記接続した目的言語形態素とを複合語候補とし
    て抽出する抽出ステップと、前記抽出した複合語候補を
    翻訳用辞書データベースに登録する登録ステップとを有
    することを特徴とする機械翻訳装置の辞書データ改良方
    法。
  9. 【請求項9】使用する対訳テキストファイルを指定する
    指定ステップと、前記指定した対訳テキストファイルに
    おいて原言語テキストファイルを形態素解析して原言語
    形態素と訳語候補を列挙した原言語形態素リストを作成
    する原言語形態素リスト作成ステップと、前記指定した
    対訳テキストファイルにおいて目的言語テキストファイ
    ルを形態素解析して目的言語形態素を列挙した目的言語
    形態素リストを作成する目的言語形態素リスト作成ステ
    ップと、連続する原言語形態素の訳語候補を接続した目
    的言語形態素または前記連続する原言語形態素の読みの
    カタカナ表記語を接続した目的言語形態素が前記目的言
    語形態素リストに存在する場合は前記連続する原言語形
    態素と前記接続した目的言語形態素とを複合語候補とし
    て抽出する抽出ステップと、原言語形態素がハイフンで
    接続されている場合とそうでない場合とで異なる条件を
    用いて前記抽出した複合語候補から登録対象データを抽
    出し、前記抽出した登録対象データを翻訳用辞書データ
    ベースに登録する登録ステップとを有する機械翻訳装置
    の辞書データ改良方法。
  10. 【請求項10】使用する対訳テキストファイルを指定す
    る指定ステップと、前記指定した対訳テキストファイル
    において原言語テキストファイルを形態素解析して原言
    語形態素と訳語候補を列挙した原言語形態素リストを作
    成する原言語形態素リスト作成ステップと、目的言語テ
    キストファイルを形態素解析して目的言語形態素を列挙
    した目的言語形態素リストを作成する目的言語形態素リ
    スト作成ステップと、連続する原言語形態素の訳語候補
    を接続した目的言語形態素または前記連続する原言語形
    態素の読みのカタカナ表記語を接続した目的言語形態素
    が前記目的言語形態素リストに存在する場合は前記連続
    する原言語形態素と前記接続した目的言語形態素とを複
    合語候補として抽出する抽出ステップと、原言語形態素
    の読みのカタカナ表記語を用いた場合とそうでない場合
    とで異なる条件を用いて前記抽出した複合語候補から登
    録対象データを抽出し、前記抽出した登録対象データを
    翻訳用辞書データベースに登録する登録ステップとを有
    することを特徴とする機械翻訳装置の辞書データ改良方
    法。
  11. 【請求項11】請求項6乃至10のいずれか1に記載の
    辞書データ改良方法の各ステップを実行するためのプロ
    グラムを格納したことを特徴とする記録媒体。
JP2000127471A 2000-04-27 2000-04-27 機械翻訳装置、その辞書データ改良方法および記録媒体 Pending JP2001306562A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000127471A JP2001306562A (ja) 2000-04-27 2000-04-27 機械翻訳装置、その辞書データ改良方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000127471A JP2001306562A (ja) 2000-04-27 2000-04-27 機械翻訳装置、その辞書データ改良方法および記録媒体

Publications (1)

Publication Number Publication Date
JP2001306562A true JP2001306562A (ja) 2001-11-02

Family

ID=18637062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000127471A Pending JP2001306562A (ja) 2000-04-27 2000-04-27 機械翻訳装置、その辞書データ改良方法および記録媒体

Country Status (1)

Country Link
JP (1) JP2001306562A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021473A (ja) * 2015-07-08 2017-01-26 日本電気株式会社 複合語検索装置、複合語検索方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021473A (ja) * 2015-07-08 2017-01-26 日本電気株式会社 複合語検索装置、複合語検索方法及びプログラム

Similar Documents

Publication Publication Date Title
US7752032B2 (en) Apparatus and method for translating Japanese into Chinese using a thesaurus and similarity measurements, and computer program therefor
JPH07282063A (ja) 機械翻訳装置
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP4734400B2 (ja) 文書検索装置およびプログラム
JP2001306562A (ja) 機械翻訳装置、その辞書データ改良方法および記録媒体
JP7415495B2 (ja) 文書処理プログラム、文書処理装置、及び文書処理方法
JP3398729B2 (ja) キーワード自動抽出装置およびキーワード自動抽出方法
JPH10207875A (ja) 表作成装置およびその方法
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3692711B2 (ja) 機械翻訳装置
JP3952009B2 (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JPH07334526A (ja) 辞書検索表示装置
JPH11203279A (ja) かな漢字変換装置、かな漢字変換方法、及び記憶媒体
JP2000029882A (ja) 要約文作成装置
JP2023129001A (ja) 情報処理装置及び情報処理プログラム
JP2002082940A (ja) 韓国語の入力支援方法およびその方法を用いた韓国語入力用のプログラム記録媒体
JP3893709B2 (ja) 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体
JP3316884B2 (ja) 言語翻訳装置
JPH11282841A (ja) 言語解析装置および言語解析プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0785026A (ja) 辞書更生方法及び装置
JP2004280275A (ja) 多言語マニュアル作成装置およびその方法と、プログラムおよびその記録媒体