JP3278889B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP3278889B2 JP3278889B2 JP06450992A JP6450992A JP3278889B2 JP 3278889 B2 JP3278889 B2 JP 3278889B2 JP 06450992 A JP06450992 A JP 06450992A JP 6450992 A JP6450992 A JP 6450992A JP 3278889 B2 JP3278889 B2 JP 3278889B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- unregistered word
- dictionary
- unregistered
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【0001】
【産業上の利用分野】本発明は、原文を訳文に翻訳する
機械翻訳装置に関するもである。
機械翻訳装置に関するもである。
【0002】
【従来の技術】機械翻訳において、システムで予め用意
された辞書(以下、システム辞書)には、book, have,
I など、一般に用いられる単語を登録した基本辞書があ
り、またユーザが必要に応じて単語及びその語彙情報を
登録できるユーザ辞書もあり、これらの辞書などによ
り、機械翻訳装置における辞書部が形成されている。
された辞書(以下、システム辞書)には、book, have,
I など、一般に用いられる単語を登録した基本辞書があ
り、またユーザが必要に応じて単語及びその語彙情報を
登録できるユーザ辞書もあり、これらの辞書などによ
り、機械翻訳装置における辞書部が形成されている。
【0003】現在の機械翻訳装置の利用目的を考える
と、マニュアル作成、翻訳など、専門的な文書が多いと
思われる。このような、専門的な文書には、その分野特
有の語が、数多く存在するため、システム辞書だけで
は、まかないきれず、辞書に存在しない単語(以下、未
登録語という)が、どうしても出現してしまう。
と、マニュアル作成、翻訳など、専門的な文書が多いと
思われる。このような、専門的な文書には、その分野特
有の語が、数多く存在するため、システム辞書だけで
は、まかないきれず、辞書に存在しない単語(以下、未
登録語という)が、どうしても出現してしまう。
【0004】この未登録語を含む原文を翻訳するには、
この未登録語をその語彙情報と共に辞書部に登録しなけ
ればならない。また、ある未登録語の語彙情報を登録す
るには、その未登録語が含まれている文(原文)全体を
参照しながら、登録することが望ましい。
この未登録語をその語彙情報と共に辞書部に登録しなけ
ればならない。また、ある未登録語の語彙情報を登録す
るには、その未登録語が含まれている文(原文)全体を
参照しながら、登録することが望ましい。
【0005】
【発明が解決しようとする課題】ところが従来の機械翻
訳装置では、ユーザがその未登録語を含む文を参照した
い場合は、例えば、単語をキーとして文を検索するなど
して、わざわざ、原文中からこの未登録語を含む文を探
し出し、この探し出した文を参照しなければならなかっ
た。したがって、未登録語の登録の操作が煩雑であると
いう問題点があった。
訳装置では、ユーザがその未登録語を含む文を参照した
い場合は、例えば、単語をキーとして文を検索するなど
して、わざわざ、原文中からこの未登録語を含む文を探
し出し、この探し出した文を参照しなければならなかっ
た。したがって、未登録語の登録の操作が煩雑であると
いう問題点があった。
【0006】
【課題を解決するための手段】本発明は、上記問題点を
解決するために、入力された原文文字列を翻訳して訳文
を出力する機械翻訳装置であって、単語と対応付けて当
該単語の語彙情報が登録されている辞書部と、単語に基
づいて前記辞書部を検索する辞書検索手段と、前記辞書
検索手段による検索の結果、入力された原文中から前記
辞書部に登録されていない未登録語を検出する未登録語
検出手段と、前記未登録語検出手段により検出された未
登録語を、当該未登録語を含む文と共に一覧表示させる
手段と、操作者からの語彙情報を入力する入力手段と、
前記入力手段から入力された語彙情報を前記表示された
未登録語の語彙情報として前記辞書部へ登録する未登録
語登録手段とを備えている。
解決するために、入力された原文文字列を翻訳して訳文
を出力する機械翻訳装置であって、単語と対応付けて当
該単語の語彙情報が登録されている辞書部と、単語に基
づいて前記辞書部を検索する辞書検索手段と、前記辞書
検索手段による検索の結果、入力された原文中から前記
辞書部に登録されていない未登録語を検出する未登録語
検出手段と、前記未登録語検出手段により検出された未
登録語を、当該未登録語を含む文と共に一覧表示させる
手段と、操作者からの語彙情報を入力する入力手段と、
前記入力手段から入力された語彙情報を前記表示された
未登録語の語彙情報として前記辞書部へ登録する未登録
語登録手段とを備えている。
【0007】
【作用】本発明は、上記構成により、未登録語を一覧表
示する際、その語を含む文と共に表示される。したがっ
てユーザは、未登録語登録時に、原文中を探すまでもな
く、容易にこの未登録語を含む文を参照でき、未登録語
の登録を円滑に行うことができる。
示する際、その語を含む文と共に表示される。したがっ
てユーザは、未登録語登録時に、原文中を探すまでもな
く、容易にこの未登録語を含む文を参照でき、未登録語
の登録を円滑に行うことができる。
【0008】
【実施例】次に図面を参照しながら、本発明の実施例を
説明する。
説明する。
【0009】図1は本発明の一実施例における機械翻訳
装置の機能ブロック図である。1は、原文をキーボード
やOCR(光学式文字読取装置)などから入力する原文
入力部である。この原文入力部1から入力された原文
は、記憶部12に記憶される。2は、単語とその語彙情
報が登録されている基本辞書である。3は、単語をキー
として基本辞書2を検索し、語彙情報を獲得する基本辞
書検索部である。4は、基本辞書2に登録されていない
未登録語の語彙情報をユーザより獲得し、未登録語とそ
の語彙情報を対応付けて登録するユーザ辞書である。5
は、単語をキーとしてユーザ辞書4を検索し、語彙情報
を獲得するユーザ辞書検索部である。これら基本辞書2
とユーザ辞書4とから辞書部Dが形成され、これら基本
辞書検索部3とユーザ辞書検索部5とから辞書検索部S
が形成される。
装置の機能ブロック図である。1は、原文をキーボード
やOCR(光学式文字読取装置)などから入力する原文
入力部である。この原文入力部1から入力された原文
は、記憶部12に記憶される。2は、単語とその語彙情
報が登録されている基本辞書である。3は、単語をキー
として基本辞書2を検索し、語彙情報を獲得する基本辞
書検索部である。4は、基本辞書2に登録されていない
未登録語の語彙情報をユーザより獲得し、未登録語とそ
の語彙情報を対応付けて登録するユーザ辞書である。5
は、単語をキーとしてユーザ辞書4を検索し、語彙情報
を獲得するユーザ辞書検索部である。これら基本辞書2
とユーザ辞書4とから辞書部Dが形成され、これら基本
辞書検索部3とユーザ辞書検索部5とから辞書検索部S
が形成される。
【0010】6は、原文入力部1より入力された原文中
から、未登録語を検出する未登録語検索部である。7
は、未登録語検索部6で検出された未登録語とその語を
含む文を一時格納しておく未登録語格納テーブルであ
る。8は、未登録語格納テーブル7に格納された未登録
語とこの未登録語を含む文を一覧表示するCRTなどの
表示部である。9は、表示部8で一覧表示された未登録
語の語彙情報を、ユーザから獲得し、未登録語とその語
彙情報をユーザ辞書4へ登録する未登録語登録部であ
る。10は、原文から訳文へ翻訳する翻訳実行部であ
る。11は、原文入力部1、基本辞書検索部3、ユーザ
辞書検索部5、未登録語検索部6、表示部8、未登録語
登録部9、翻訳実行部10を制御するCPUなどの制御
部である。なお、これらの検索部3,5,6、未登録語
登録部9、翻訳実行部10は、CPUがROM内のプロ
グラムを実行することにより実現される。
から、未登録語を検出する未登録語検索部である。7
は、未登録語検索部6で検出された未登録語とその語を
含む文を一時格納しておく未登録語格納テーブルであ
る。8は、未登録語格納テーブル7に格納された未登録
語とこの未登録語を含む文を一覧表示するCRTなどの
表示部である。9は、表示部8で一覧表示された未登録
語の語彙情報を、ユーザから獲得し、未登録語とその語
彙情報をユーザ辞書4へ登録する未登録語登録部であ
る。10は、原文から訳文へ翻訳する翻訳実行部であ
る。11は、原文入力部1、基本辞書検索部3、ユーザ
辞書検索部5、未登録語検索部6、表示部8、未登録語
登録部9、翻訳実行部10を制御するCPUなどの制御
部である。なお、これらの検索部3,5,6、未登録語
登録部9、翻訳実行部10は、CPUがROM内のプロ
グラムを実行することにより実現される。
【0011】以上のように構成された本実施例の機械翻
訳装置における未登録語の登録についての処理手順を図
2のフローチャートに基づいて説明する。ここでは、英
文から日本文に翻訳する場合を例にとって説明する。
訳装置における未登録語の登録についての処理手順を図
2のフローチャートに基づいて説明する。ここでは、英
文から日本文に翻訳する場合を例にとって説明する。
【0012】まず、ステップ(イ)で、原文入力部1よ
り、原文(英文)が入力され、この原文が記憶部12に
記憶される。
り、原文(英文)が入力され、この原文が記憶部12に
記憶される。
【0013】次に、ステップ(ロ)で、記憶部12内の
原文について、基本辞書検出部3及びユーザ辞書検出部
5により、基本辞書2、ユーザ辞書4を参照しながら、
原文中の未登録語を検出する。なお、もちろんこれらの
辞書2,4のいずれにも登録されていない語を未登録語
とする。そして、検出された未登録語は、その語を含む
文と共に未登録語格納テーブル7へ格納される。この未
登録語格納テーブル7は図3に示すように、未登録語、
その未登録語を含む文の数、その未登録語を含む文(複
数可)といった3つの情報を格納できる構成になってい
る。この未登録語格納テーブル7へ未登録語を格納する
際、同一の語が既に格納されていないかチェックし、格
納されていれば、「未登録語を含む文」のみ追加格納す
る。
原文について、基本辞書検出部3及びユーザ辞書検出部
5により、基本辞書2、ユーザ辞書4を参照しながら、
原文中の未登録語を検出する。なお、もちろんこれらの
辞書2,4のいずれにも登録されていない語を未登録語
とする。そして、検出された未登録語は、その語を含む
文と共に未登録語格納テーブル7へ格納される。この未
登録語格納テーブル7は図3に示すように、未登録語、
その未登録語を含む文の数、その未登録語を含む文(複
数可)といった3つの情報を格納できる構成になってい
る。この未登録語格納テーブル7へ未登録語を格納する
際、同一の語が既に格納されていないかチェックし、格
納されていれば、「未登録語を含む文」のみ追加格納す
る。
【0014】例えば、 (a) C is not tied to any particular hardware or
system. という英文(a)中の「hardware」が未登録語であった
とする。未登録語格納テーブル7 に「hardware」が格納
されていなければ、「hardware」と英文(a)をこのテ
ーブル7に格納し、文の数を1とする。この格納をした
後で、 (b)The code is independent of hardware characte
ristics. という英文(b)が原文中にあらわれたとする。この英
文(b)も「hardware」を含んでいる。ここで英文
(a)が原文中にあらわれた際「hardware」なる語を未
登録語格納テーブル7に既に格納したものであるが、こ
の「hardware」なる語は、依然としてユーザ辞書4には
登録されていない。したがって英文(b)があらわれた
状態においても、「hardware」は未登録語である。した
がって、ここでも、「hardware」を未登録語格納テーブ
ル7に格納する。しかし、「hardware」の語自身は、既
に、英文(a)において未登録語として格納されている
ので、ここでは、この未登録語を含む新たな文である英
文(b)のみ格納し、文の数を2とする(図4)。
system. という英文(a)中の「hardware」が未登録語であった
とする。未登録語格納テーブル7 に「hardware」が格納
されていなければ、「hardware」と英文(a)をこのテ
ーブル7に格納し、文の数を1とする。この格納をした
後で、 (b)The code is independent of hardware characte
ristics. という英文(b)が原文中にあらわれたとする。この英
文(b)も「hardware」を含んでいる。ここで英文
(a)が原文中にあらわれた際「hardware」なる語を未
登録語格納テーブル7に既に格納したものであるが、こ
の「hardware」なる語は、依然としてユーザ辞書4には
登録されていない。したがって英文(b)があらわれた
状態においても、「hardware」は未登録語である。した
がって、ここでも、「hardware」を未登録語格納テーブ
ル7に格納する。しかし、「hardware」の語自身は、既
に、英文(a)において未登録語として格納されている
ので、ここでは、この未登録語を含む新たな文である英
文(b)のみ格納し、文の数を2とする(図4)。
【0015】こうして、全ての文について、未登録語の
検出が終われば、ステップ(ハ)で、未登録語があった
かどうかチェックし、未登録語が1つでもあれば、ステ
ップ(ニ)、なければステップ(ヘ)の処理が移る。
検出が終われば、ステップ(ハ)で、未登録語があった
かどうかチェックし、未登録語が1つでもあれば、ステ
ップ(ニ)、なければステップ(ヘ)の処理が移る。
【0016】ステップ(ニ)では、図5に示すように、
ステップ(ロ)で検出された未登録語とその語を含む文
を表示部8へ一覧表示する。なお、図5において8aは
表示部8の表示画面であり、下線部が、未登録語を示
す。
ステップ(ロ)で検出された未登録語とその語を含む文
を表示部8へ一覧表示する。なお、図5において8aは
表示部8の表示画面であり、下線部が、未登録語を示
す。
【0017】そして、ステップ(ホ)で、ユーザより未
登録語の語彙情報(ここでは、訳語と品詞)を図6のよ
うに一覧表示に書き込んでもらい(キーボードから入
力)、この未登録語とこの未登録語の語彙情報を対応付
けてユーザ辞書4へ登録する。これにより未登録語「ha
rdware」は、辞書部Dに登録されたので、爾後登録語と
なる。
登録語の語彙情報(ここでは、訳語と品詞)を図6のよ
うに一覧表示に書き込んでもらい(キーボードから入
力)、この未登録語とこの未登録語の語彙情報を対応付
けてユーザ辞書4へ登録する。これにより未登録語「ha
rdware」は、辞書部Dに登録されたので、爾後登録語と
なる。
【0018】最後に、ステップ(ヘ)で、翻訳実行部1
0を作動して、記憶部12に記憶されている原文(英
文)に対し、新たに登録語となった「hardware」の語な
どを辞書部Dにより参照しながら、英語から日本語へ翻
訳を行う。
0を作動して、記憶部12に記憶されている原文(英
文)に対し、新たに登録語となった「hardware」の語な
どを辞書部Dにより参照しながら、英語から日本語へ翻
訳を行う。
【0019】このように本実施例によれば、文書一括翻
訳における未登録語の辞書登録において未登録語を一覧
表示する際に、その語を含む文も同時に表示される。し
たがってユーザは、未登録語を辞書部へ登録するにあた
り、この登録を正確に行うべく、わざわざ原文中からこ
の未登録語及びこの語を含む文を探し出して参照しなく
とも足り、極めて円滑に未登録語を辞書部へ登録するこ
とができるものである。
訳における未登録語の辞書登録において未登録語を一覧
表示する際に、その語を含む文も同時に表示される。し
たがってユーザは、未登録語を辞書部へ登録するにあた
り、この登録を正確に行うべく、わざわざ原文中からこ
の未登録語及びこの語を含む文を探し出して参照しなく
とも足り、極めて円滑に未登録語を辞書部へ登録するこ
とができるものである。
【0020】
【発明の効果】本発明は、入力された原文文字列を翻訳
して訳文を出力する機械翻訳装置であって、単語と対応
付けて当該単語の語彙情報が登録されている辞書部と、
単語に基づいて前記辞書部を検索する辞書検索手段と、
前記辞書検索手段による検索の結果、入力された原文中
から前記辞書部に登録されていない未登録語を検出する
未登録語検出手段と、前記未登録語検出手段により検出
された未登録語を、当該未登録語を含む文と共に一覧表
示させる手段と、操作者からの語彙情報を入力する入力
手段と、前記入力手段から入力された語彙情報を前記表
示された未登録語の語彙情報として前記辞書部へ登録す
る未登録語登録手段とを備えているので、未登録語が、
その語を含む文と共に一覧表示される。したがって、未
登録語登録時に、原文中においてわざわざ未登録語を含
む文を探し出す必要がなく、円滑に未登録語を辞書部に
登録することができる。
して訳文を出力する機械翻訳装置であって、単語と対応
付けて当該単語の語彙情報が登録されている辞書部と、
単語に基づいて前記辞書部を検索する辞書検索手段と、
前記辞書検索手段による検索の結果、入力された原文中
から前記辞書部に登録されていない未登録語を検出する
未登録語検出手段と、前記未登録語検出手段により検出
された未登録語を、当該未登録語を含む文と共に一覧表
示させる手段と、操作者からの語彙情報を入力する入力
手段と、前記入力手段から入力された語彙情報を前記表
示された未登録語の語彙情報として前記辞書部へ登録す
る未登録語登録手段とを備えているので、未登録語が、
その語を含む文と共に一覧表示される。したがって、未
登録語登録時に、原文中においてわざわざ未登録語を含
む文を探し出す必要がなく、円滑に未登録語を辞書部に
登録することができる。
【図1】本発明の一実施例に係る機械翻訳装置の機能ブ
ロック図
ロック図
【図2】本発明の一実施例に係る機械翻訳装置の処理手
順
順
【図3】本発明の一実施例に係る機械翻訳装置の未登録
語格納テーブルの説明図
語格納テーブルの説明図
【図4】本発明の一実施例に係る機械翻訳装置の未登録
語格納テーブルの説明図
語格納テーブルの説明図
【図5】本発明の一実施例に係る機械翻訳装置の表示部
に一覧表示をした状態図
に一覧表示をした状態図
【図6】本発明の一実施例に係る機械翻訳装置の表示部
に一覧表示をした状態図
に一覧表示をした状態図
1 原文入力部 6 未登録語検索部 8 表示部 9 未登録語登録部
Claims (1)
- 【請求項1】入力された原文文字列を翻訳して訳文を出
力する機械翻訳装置であって、 単語と対応付けて当該単語の語彙情報が登録されている
辞書部と、 単語に基づいて前記辞書部を検索する辞書検索手段と、 前記辞書検索手段による検索の結果、入力された原文中
から前記辞書部に登録されていない未登録語を検出する
未登録語検出手段と、 前記未登録語検出手段により検出された 未登録語を、当
該未登録語を含む文と共に一覧表示させる手段と、操作者からの語彙情報を入力する入力手段と、 前記入力手段から入力された語彙情報を前記表示された
未登録語の語彙情報として前記辞書部へ登録する未登録
語登録手段とを備えたことを特徴とする機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06450992A JP3278889B2 (ja) | 1992-03-23 | 1992-03-23 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06450992A JP3278889B2 (ja) | 1992-03-23 | 1992-03-23 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05266065A JPH05266065A (ja) | 1993-10-15 |
JP3278889B2 true JP3278889B2 (ja) | 2002-04-30 |
Family
ID=13260244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06450992A Expired - Fee Related JP3278889B2 (ja) | 1992-03-23 | 1992-03-23 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3278889B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544144B (zh) * | 2012-07-10 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 移动客户端云翻译方法和移动客户端云翻译系统 |
-
1992
- 1992-03-23 JP JP06450992A patent/JP3278889B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05266065A (ja) | 1993-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5890183A (en) | Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input | |
JPH09198395A (ja) | 文書検索装置 | |
JP3278889B2 (ja) | 機械翻訳装置 | |
JP3034295B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
JP4007630B2 (ja) | 対訳例文登録装置 | |
JPH0765008A (ja) | 用語登録制御方法及び同装置 | |
JP2010055561A (ja) | 電子辞書、電子辞書における検索方法、およびプログラム | |
JPH05282360A (ja) | 多国語入力装置 | |
JPH10198664A (ja) | 日本語入力システム及び日本語入力プログラムを記録した媒体 | |
JPH06332934A (ja) | 電子辞書引き装置 | |
JPH03129568A (ja) | 文書処理装置 | |
JPS62203266A (ja) | 機械翻訳システム | |
JPH11203281A (ja) | 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体 | |
JPH01126767A (ja) | 辞書参照装置 | |
JP3118880B2 (ja) | 日本語文章処理装置 | |
JPH0452868A (ja) | 機械翻訳装置 | |
JPH04138564A (ja) | 文章読解支援装置 | |
JP2005070873A (ja) | 電子辞書 | |
JPH0683807A (ja) | 文書作成装置 | |
JP2000194389A (ja) | 情報処理装置 | |
JPH06243164A (ja) | 機械翻訳における文字検索装置 | |
JPS62180465A (ja) | 仮名漢字変換方式 | |
JPH0727526B2 (ja) | かな漢字変換装置 | |
JPS6210764A (ja) | 仮名漢字変換方式 | |
JP2002041516A (ja) | 機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |