JP2023052750A - 自動翻訳装置及び自動翻訳プログラム - Google Patents
自動翻訳装置及び自動翻訳プログラム Download PDFInfo
- Publication number
- JP2023052750A JP2023052750A JP2023011475A JP2023011475A JP2023052750A JP 2023052750 A JP2023052750 A JP 2023052750A JP 2023011475 A JP2023011475 A JP 2023011475A JP 2023011475 A JP2023011475 A JP 2023011475A JP 2023052750 A JP2023052750 A JP 2023052750A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- delimiter
- word
- result
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 376
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 26
- 240000000220 Panda oleosa Species 0.000 claims description 6
- 235000016496 Panda oleosa Nutrition 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 238000013518 transcription Methods 0.000 abstract 1
- 230000035897 transcription Effects 0.000 abstract 1
- 230000014616 translation Effects 0.000 description 304
- 238000012545 processing Methods 0.000 description 62
- 230000000877 morphologic effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 10
- 238000003379 elimination reaction Methods 0.000 description 8
- 239000004973 liquid crystal related substance Substances 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000008030 elimination Effects 0.000 description 6
- 239000010979 ruby Substances 0.000 description 3
- 229910001750 ruby Inorganic materials 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 244000144730 Amygdalus persica Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 244000141359 Malus pumila Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】翻訳結果の冗長性が除去できるようにした自動翻訳装置を提供する。【解決手段】第1の言語から第2の言語へ翻訳する自動翻訳装置であって、検出手段と翻訳手段とを備える。検出手段は、第1の言語の原文から、括弧などの区切り記号で囲んだ区切り記号付語句を検出する。翻訳手段は、検出手段で検出された区切り記号付語句の区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号内の語句の前記翻訳結果は出力しない。【選択図】図1
Description
この発明は、第1の言語、例えば日本語の原文を、英語などの第2の言語に自動翻訳する自動翻訳装置及び、その自動翻訳に用いられるプログラムに関する。
日本語の文においては、対の区切り記号(以下、単に区切り記号という)で囲んだ区切り記号付語句、例えば括弧で囲んだ括弧付語句が含まれることが多々ある。例えば、「田中(たなか)」のように、人の名前の漢字の後にその漢字の読みを区切り記号(括弧)付語句として挿入する。また、「特許(パテント)」のように、特定の語句の後のその英語のカタカナ表記を区切り記号(括弧)付語句として挿入する場合もある。また、「Patent(パテント)」のように、英語表記の後にその英語のカタカナ表記を区切り記号(括弧)付語句として挿入する場合や、その逆に、「パテント(Patent)」のように、英語のカタカナ表記の後に、その英語表記を区切り記号(括弧)付語句として挿入する場合もある。
さらに、区切り記号付語句としては、課題(1)や課題(a)のように、数字やアルファベットなどを括弧付語句とすることで、直前の語句の項目番号や項目記号を表す態様や、果物(リンゴ、いちご、桃など)のように、括弧付語句により直前の語句の例示をするもの、ソクラテス(古代ギリシャの哲人)やプラトン(紀元前427年-紀元前347年)のように、直前の語句の説明を括弧付語句でするものなどがある。
日本語の文を、例えば英語に自動翻訳する場合、区切り記号付語句の翻訳結果は、上記の項目番号や項目記号の場合や、直前の語句の例示、直前の語句の説明の場合についてはほとんど問題とならない。しかし、上記の人の名前の漢字の読み、英語のカタカナ表記などの場合には、自動翻訳の翻訳結果は、「Tanaka(Tanaka)」や「Patent(Patent)」となって、同一のワードが無意味に繰り返され冗長なものとなってしまうという問題があった。
このような日本語の文を外国語に自動翻訳する場合における区切り記号付語句の問題点を改善することを企図した発明が特許文献1(特開平11-3334号公報)に開示されている。この特許文献1の開示されている翻訳装置においては、「括弧表現パターンとその括弧表現の分類及び個々の括弧表現に対するアクション等の知識に関する情報(対応テーブル情報)を記憶しておくと共に、文章中の括弧表現を解析し、冗長若しくは不要となる部分は翻訳しないようにすること可能」にしている。
しかしながら、特許文献1の発明においては、括弧表現パターンと、その括弧表現の分類と、個々の括弧表現に対するアクションとを対応付けた対応テーブル情報を予め作成して記憶しておく必要があると共に、文章中の括弧表現を解析して、括弧表現パターンや分類が、対応テーブル情報のいずれに対応しているかを判別する必要があり、処理が複雑となってしまう問題がある。
また、対応テーブル情報に予め登録されていない括弧表現パターンの場合には、処理ができないという問題もある。
なお、以上は区切り記号として括弧について説明したが、上記のような問題は、漢字の読みや、英語のカタカナ表記などを、括弧以外の区切り記号、例えば-○○-のように用いるハイフン記号などの場合にも同様に生じる。また、括弧には、括弧内語句を○で表すと、(○)、{○}、[○]、〔○〕、(○)(ただし()は墨付き括弧)、<○>、‘○’、“〇”などの各種の記号が含まれる。また、括弧以外の区切り記号には、前記のハイフン以外に、・○・、|○|、*○*、~〇~なども含まれ、同様の問題が生じる。
この発明は、以上の問題点に鑑み、括弧などの区切り記号付語句を含む日本語などの第1の言語の原文を第2の言語に自動翻訳する場合に、翻訳結果の冗長性が除去できるようにした自動翻訳装置や自動翻訳プログラムを提供することを目的とする。
上記の課題を解決するために、請求項1の発明は、
第1の言語から第2の言語へ翻訳する自動翻訳装置であって、
前記第1の言語の原文から、区切り記号で囲んだ区切り記号付語句を検出する検出手段と、
前記検出手段で検出された前記区切り記号付語句の前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号内の語句の前記翻訳結果は出力しない翻訳手段と、
を備える自動翻訳装置を提供する。
第1の言語から第2の言語へ翻訳する自動翻訳装置であって、
前記第1の言語の原文から、区切り記号で囲んだ区切り記号付語句を検出する検出手段と、
前記検出手段で検出された前記区切り記号付語句の前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号内の語句の前記翻訳結果は出力しない翻訳手段と、
を備える自動翻訳装置を提供する。
上述の構成の請求項1の発明によれば、検出手段で括弧などの区切り記号付語句を検出した場合には、翻訳手段は、区切り記号付語句の区切り記号の直前の語句が漢字であって、かつ、区切り記号内の語句が漢字の読み仮名である場合には、区切り記号内の語句の翻訳結果は出力しない。
これにより、括弧などの区切り記号付語句の直前の語句が読みが難しい漢字であり、区切り記号付語句の場合のように、両者の翻訳結果が不一致になる場合に、翻訳結果として不要な読み仮名の翻訳は出力されず、翻訳結果の冗長性を除去できる。
この発明によれば、括弧などの区切り記号付語句の直前の語句が読みが難しい漢字であり、区切り記号付語句の場合のように、両者の翻訳結果が不一致になる場合に、翻訳結果として不要な読み仮名の翻訳は出力されず、翻訳結果の冗長性を除去できるようにした自動翻訳装置や自動翻訳プログラムを提供することができる。
以下、この発明による自動翻訳装置の実施形態を、図を参照しながら説明する。この自動翻訳装置は専用の装置で構成されてもよいが、この実施形態では、例えばパーソナルコンピュータやタブレット型端末、更には、スマートフォンと呼ばれる高機能携帯電話端末に、この発明による自動翻訳装置用プログラムの実施形態をインストールすることで構成される。以下の実施形態は、第1の言語が日本語であって、第2の言語として英語などの外国語を想定した場合である。
[第1の実施形態]
図1は、この発明による自動翻訳装置の第1の実施形態の構成例を説明するためのブロック図である。この図1のブロック図においては、この発明による自動翻訳装置の実施形態の理解を容易にするために、自動翻訳用プログラムで実行する処理部分の一部(要部)も、機能ブロックとして示してある。
図1は、この発明による自動翻訳装置の第1の実施形態の構成例を説明するためのブロック図である。この図1のブロック図においては、この発明による自動翻訳装置の実施形態の理解を容易にするために、自動翻訳用プログラムで実行する処理部分の一部(要部)も、機能ブロックとして示してある。
この実施形態の自動翻訳装置は、コンピュータ(プロセッサ)で構成される制御部101に対して、システムバス100を通じて、メモリ102、ディスプレイインターフェース103、操作入力部インターフェース104、外部入力インターフェース105、原文メモリ106、翻訳条件受付部107、形態素解析部108、翻訳実行部109、翻訳用辞書記憶部110、翻訳結果メモリ111、区切り記号付語句処理部112、のそれぞれが接続されて構成されている。
メモリ102は、制御部101で実行される処理を支援するためのプログラムやデータを記憶する。プログラムには、自動翻訳用プログラムを含む。
ディスプレイインターフェース103には、例えばLCD(Liquid Crystal Display;液晶ディスプレイ)からなるディスプレイ121が接続されている。
また、操作入力部インターフェース104には、ディスプレイ121を構成するLCDの表示画面に重ねて配設されているタッチセンサで構成される操作入力部122が接続されている。ディスプレイ121の表示画面には、各種の入力用画面に含まれるソフトウェアボタン(アイコンボタン)が表示され、これらソフトウェアボタンへの操作を、タッチセンサからなる操作入力部122で検出し、操作入力部インターフェース104を通じて、制御部101に伝達される。制御部101は、操作入力部122での操作入力に応じた処理を行う。なお、操作入力部は、この例のようなタッチセンサを用いるものに限られる訳ではなく、キーボードや操作ボタン群で構成されていても勿論よい。また、マイクロフォンを用いた音声入力であってもよい。
外部入力インターフェース105は、例えばUSBメモリのインターフェースや、カード型メモリのインターフェースなどで構成されている。また、外部入力インターフェース105は、光ディスクドライブで構成されていてもよい。この実施形態では、この外部入力インターフェース105を通じて、USBメモリや、光ディスクなどに記憶されている日本語の原文のデータが取り込まれる。
原文メモリ106には、利用者により操作入力部122を通じて入力された日本語の原文のデータや、外部入力インターフェース105を通じて取り込まれた日本語の原文のデータが記憶される。
翻訳条件受付部107は、利用者により操作入力部122を通じて指定(文字入力として直接入力により指定される場合のほか、選択指定を含む)された翻訳条件が記憶される。この場合、翻訳条件には、翻訳対象の日本語の原文の指定、指定された日本語の原文から、例えば、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語のいずれの言語に翻訳するのかの外国語の指定のほか、区切り記号付語句についての冗長性除去の処理を行うか否かの選択指定を含む。ここで、区切り記号付語句についての冗長性除去の処理とは、区切り記号の直前の語句の翻訳結果と、区切り記号内の語句の翻訳結果とが同一となる場合に、その区切り記号と、その区切り記号内語句の翻訳結果とを、最終的な自動翻訳結果に含めないようにする処理である。
この実施形態の自動翻訳装置は、区切り記号付語句についての冗長性除去の処理を常に行うのではなく、利用者により「冗長性除去の処理をする」との選択指定がなされたときに行うようにする。このように利用者の選択指定を行えるようにしたのは、翻訳には、意訳は許されずに、原文の逐語翻訳(逐語訳、逐字訳)のままでなければならない場合があることを考慮したものである。なお、区切り記号直前の語句と区切り記号付語句についての一覧を提示し、利用者がその一覧から選択指定を行えるようにしてもよい。
形態素解析部108は、翻訳対象の日本語の原文を形態素(言語の意味を持つ最小単位)の列に分割し、それぞれの品詞(名詞、動詞、接続詞、括弧などの区切り記号や句読点などの記号)を判別するようにする。形態素解析部108は、その解析結果の形態素の列とそれぞれの品詞とからなる解析結果情報を翻訳実行部109に送る。形態素解析部108は、形態素として区切り記号や句読点などの記号をも検出するので、区切り記号付語句検出手段の機能を備えるものである。
翻訳実行部109は、形態素解析部108からの日本語の原文についての解析結果情報と、翻訳用辞書記憶部110に記憶されている外国語と日本語との対訳辞書とを用いて、指定された日本語の原文について、指定された外国語への自動翻訳を実行する。翻訳用辞書記憶部110には、予め、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語のそれぞれについて、日本語の語句との対訳辞書が記憶されている。なお、対訳辞書は、インターネット上のサーバに存在し、随時アップデートされるようにしてもよい。
翻訳結果メモリ111は、翻訳実行部109で生成した自動翻訳結果を一時記憶する。そして、この翻訳結果メモリ111の自動翻訳結果は、ディスプレイインターフェース103を通じてディスプレイ121の表示画面に表示されて、利用者に呈示される。
区切り記号付語句処理部112は、この実施形態では、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行う選択指定を受け付けたときに起動される。そして、区切り記号付語句処理部112は、形態素解析部108での解析結果と、翻訳実行部109での翻訳結果とを受けて、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とを比較し、両者が一致しているか否か判別する。
そして、区切り記号付語句処理部112は、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とが一致していると判別したときには、翻訳結果メモリ111に記憶する自動翻訳結果から、区切り記号及び区切り記号内語句についての翻訳結果を削除する(つまり、区切り記号付語句は自動翻訳結果として出力しない)。ここで、翻訳結果が一致する区切り記号内語句の翻訳結果のみを出力しないのではなく、括弧()などの区切り記号を翻訳結果として出力しないのは、区切り記号内語句の翻訳結果を出力しない状態では、区切り記号内に何の語句も存在しない括弧などの区切り記号のみが残って違和感のある自動翻訳結果となるのを避けるためである。
また、区切り記号付語句処理部112は、この実施形態では、区切り記号付語句の区切り記号内語句の翻訳結果と、当該区切り記号の直前の語句の翻訳結果とが一致していないと判別したときには、区切り記号及び区切り記号内語句の翻訳結果をそのまま、翻訳結果メモリ111に記憶する自動翻訳結果に含める。
なお、図1の自動翻訳装置の構成において、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112は、制御部101がメモリ102に格納されているプログラムを実行することによるソフトウェア処理機能部の構成とすることができるものである。
[第1の実施形態の自動翻訳装置の処理動作]
この第1の実施形態においては、自動翻訳の開始に先立ち、利用者により、原文メモリ106に記憶されている日本語の原文のファイルの中から、翻訳の対象とされる日本語の原文のファイルが選択指定される。そして、選択指定された日本語の原文が、図2に示すように、ディスプレイ121の表示画面121Dの原文表示欄1211に表示される。
この第1の実施形態においては、自動翻訳の開始に先立ち、利用者により、原文メモリ106に記憶されている日本語の原文のファイルの中から、翻訳の対象とされる日本語の原文のファイルが選択指定される。そして、選択指定された日本語の原文が、図2に示すように、ディスプレイ121の表示画面121Dの原文表示欄1211に表示される。
そして、このディスプレイ121の表示画面121Dには、図2に示すように、利用者による翻訳条件の選択指定を受け付ける入力欄1212及び1213が表示されている。入力欄1212は、日本語の原文から翻訳結果を得たい第2の言語としての外国語の選択指定を受ける欄であり、利用者は、図示を省略するプルダウンメニューとして提示される翻訳可能な英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語の中の一つを選択指定することができる。図2では、英語が選択指定されている場合を示している。
入力欄1213は、上述した冗長性除去処理をするか、しないかの選択入力を受け付ける欄であり、利用者は、冗長性除去処理をする場合には、「する」に、冗長性除去処理をしない場合には、「しない」に、それぞれチェックを入力する。
この実施形態の自動翻訳装置においては、以上のようにして利用者の操作入力により、上述した翻訳条件の選択指定入力が完了すると、翻訳開始ボタン(アイコンボタン)1214及び翻訳中止ボタン(アイコンボタン)1215が画面に表示されて、利用者により押下操作可能とされる。なお、この実施形態の場合は、翻訳条件の選択指定入力は一括で行われているが、冗長性除去処理をするか、しないかの候補箇所が順次提示され、提示に従って、個別に選択指定入力をすることもできる。もちろん、選択指定した後、選択指定箇所をプレビューできるようにし、利用者がプレビューを確認後、選択指定を完了するようにすることもできる。
また、冗長性除去処理をするか、しないかの選択入力を行うのではなく、デフォルトで冗長性除去処理をすることにし、しない場合のみ、その旨を入力するようにしてもよい。その逆に、デフォルトで冗長性除去処理をせず、する場合にのみ、その旨を入力するようにしてもよい。
そして、翻訳開始ボタン1214が利用者により押下操作されると、この第1の実施形態の自動翻訳装置における自動翻訳処理動作が開始される。また、翻訳中止ボタン1215が利用者により押下操作されると、自動翻訳処理動作は開始されず、中止される。
図3および図4は、上述の構成の第1の実施形態の自動翻訳装置における自動翻訳処理動作の流れの一例を示すフローチャートである。以下、この図3および図4のフローチャートを参照しながら、第1の実施形態の自動翻訳装置における自動翻訳処理動作の例について説明する。なお、この図3および図4のフローチャートの各ステップの処理は、制御部101が、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112の各機能処理を、メモリ102に格納されているプログラムを実行することでソフトウェア処理とした場合として説明する。
先ず、制御部101は、操作入力部122を通じて利用者により翻訳開始ボタン1214が押下操作されて、自動翻訳の開始指示がなされたか否か判別する(ステップS1)。開始指示がなされた場合、制御部101は、冗長性除去処理についての入力欄1213をチェックし(ステップS2)、「冗長性除去処理をする」に選択指定されているか否かを判別する(ステップS3)。
ステップS3で、「冗長性除去処理をしない」に選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析し、逐語翻訳を実行し(ステップS4)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(図2参照)に、その翻訳結果を表示する(ステップS5)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS6)、終了していないと判別したときには、処理をステップS4に戻し、このステップS4以降の処理を繰り返す。また、ステップS6で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
そして、ステップS3で、「冗長性除去処理をする」に選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析する(図4のステップS11)。次に、制御部101は、形態素解析の結果から、区切り記号付語句を検出したか否か判別する(ステップS12)。
このステップS12で、区切り記号付語句を検出してはいないと判別したときには、制御部101は、逐語翻訳を実行し(ステップS13)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(図2参照)に、その翻訳結果を表示する(ステップS17)。
次に、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。
そして、ステップS12で、区切り記号付語句を検出したと判別したときには、制御部101は、日本語の原文を逐語翻訳し、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とを比較し(ステップS14)、両翻訳結果が一致しているか否か判別する(ステップS15)。制御部101は、ステップS15で、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とが不一致であれば、区切り記号の直前の語句の翻訳結果と、括弧付の語句の翻訳結果のそれぞれとを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS17)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。
また、ステップS15で、区切り記号内の語句の翻訳結果と区切り記号の直前の語句の翻訳結果とが一致していると判別したときには、区切り記号及び区切り記号内の語句の翻訳結果とを、逐語翻訳結果から除去し(ステップS16)、区切り記号の直前の語句の翻訳結果のみを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS17)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS18)、終了していないと判別したときには、処理をステップS11に戻し、このステップS11以降の処理を繰り返す。また、ステップS18で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
[第1の実施形態における自動翻訳処理結果の具体例]
以上の第1の実施形態における自動翻訳処理における「冗長性除去処理をする」と選択指定されている場合における動作を、図5に示すように、具体例を挙げて、さらに説明する。図5は、図2に示した日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。
以上の第1の実施形態における自動翻訳処理における「冗長性除去処理をする」と選択指定されている場合における動作を、図5に示すように、具体例を挙げて、さらに説明する。図5は、図2に示した日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。
図5(A)の例は、漢字(図の例は人の名前)に対してその読みが括弧付語句として記述されている場合であり、この場合には、図5(A)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、共に「Tanaka」となって一致する。そこで、制御部101は、括弧と翻訳結果、すなわち、括弧記号()及びTanakaを除去した、つまり(Tanaka)を除去した「Tanaka」のみを自動翻訳結果とする。
また、図5(B)の例は、漢字に対して、その英語のカタカナ表記が括弧付語句として記述されている場合であり、この場合には、図5(B)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、共に「Patent」となって一致する。そこで、制御部101は、括弧と翻訳結果、すなわち、(Patent)を除去した「Patent」のみを自動翻訳結果とする。
また、図5(C)の例は、直前の語句の説明を括弧付語句でするものとして記述されている場合であり、この場合には、図5(C)の右側に示すように、逐語翻訳をしたとき、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、通常、不一致となる。なお、図5(C)の例は、直前の語句の説明として、当該直前の語句を特定するための語句が括弧付語句とされている場合である。この場合には、括弧の直前の翻訳結果と括弧内語句の翻訳結果とは、不一致となるので、制御部101は、逐語翻訳を、そのまま括弧付で、自動翻訳結果として出力する。
なお、図5(C)の例の類型としては、漢字の字画構成などの成り立ちを括弧付注記として説明したり、フォントのない繁体字の中国漢字の説明を括弧付注記として説明したりするものもある。例えば、「薬(草冠に楽)」や、「●(欲の上の冠が不)」などである。
上述のように、この実施形態の自動翻訳装置によれば、区切り記号の直前の語句の翻訳結果と、区切り記号内の語句の翻訳結果とを比較し、両者が一致したときに区切り記号及び区切り記号内語句を、自動翻訳結果から除去するようにして、自動翻訳結果の冗長性除去処理をするので、冒頭で説明した従来のように、予め、区切り記号付語句の類型と、各類型に応じた対応テーブルを記憶部に記憶しておく必要がなく、簡単な処理により、自動翻訳結果の冗長性除去処理をすることができる。
また、上述した第1の実施形態では、利用者が自動翻訳の用途に応じて冗長性除去処理をするか否かを選択指定することができるので、例えば意訳のできない証明用の自動翻訳などの利用用途の場合には、冗長性除去処理をすることなく、逐語翻訳をすることができて便利である。
[第2の実施形態]
上述の第1の実施形態では、冗長性除去処理をしないと利用者により選択指定された場合の翻訳結果については、何等の処理も行わず、単に同一の翻訳結果の語句が、区切り記号付で連続するものとした。しかし、上述したように、同一の翻訳結果の語句が連続する場合であっても、区切り記号の直前の語句と区切り記号付語句との関係としては、「漢字とその読み」や、「漢字と対応する英語のカタカナ表記」のほか、英語とその発音表記(カタカナ表記)など、種々の態様(分類=属性)がある。これは、区切り記号の直前の語句に対する区切り記号付語句の属性の違いとして分類することができる。
上述の第1の実施形態では、冗長性除去処理をしないと利用者により選択指定された場合の翻訳結果については、何等の処理も行わず、単に同一の翻訳結果の語句が、区切り記号付で連続するものとした。しかし、上述したように、同一の翻訳結果の語句が連続する場合であっても、区切り記号の直前の語句と区切り記号付語句との関係としては、「漢字とその読み」や、「漢字と対応する英語のカタカナ表記」のほか、英語とその発音表記(カタカナ表記)など、種々の態様(分類=属性)がある。これは、区切り記号の直前の語句に対する区切り記号付語句の属性の違いとして分類することができる。
利用者は、自動翻訳結果として、同一の翻訳結果の語句が、区切り記号付で連続する場合に、原文における区切り記号の直前の語句と区切り記号付語句との関係がどのようなものであったかを知ることができれば便利である。
そこで、この第2の実施形態では、冗長性除去処理をしないと利用者により選択指定された場合の翻訳結果について、区切り記号の直前の語句に対する区切り記号付語句の属性の違いに応じた注釈を自動翻訳結果に含ませることができるようにする。
図6は、この第2の実施形態の自動翻訳装置の構成例を示すブロック図であり、図1の第1の実施形態と同一部分には、同一参照符号を付してある。この第2の実施形態の自動翻訳装置においては、第1の実施形態の自動翻訳装置の前述した各処理部に加えて、システムバス100に対して、区切り記号付語句属性判定部113と、テーブル情報記憶部114とが接続される。そして、第1の実施形態の区切り記号付語句処理部112に代えて、区切り記号付語句処理部112Aが設けられる。その他は、第1の実施形態と同様の構成とされる。
テーブル情報記憶部114には、図7に示すように、区切り記号付語句についての前記属性と、それぞれの属性に対する注釈の例との対応テーブルの情報が記憶されている。すなわち、図7の例について説明すると、区切り記号付語句の例と、その属性と、その属性について翻訳結果に付加する注釈とが、それぞれ対応付けられたものが、テーブル情報記憶部114に記憶されている。この例では、翻訳結果に付加する注釈としては複数通り(図の例では注釈1と注釈2の2通り)が用意されており、後述するように、利用者により、何れの注釈を用いるかを選択指定可能とされている。
具体的には、図7に示すように、区切り記号付語句例No.1の「田中(たなか)」における区切り記号付語句の属性は、直前の「漢字の読み」となり、区切り記号付語句例No.2の「特許(パテント)」における区切り記号付語句の属性は、直前の「漢字の英語訳カタカナ表記」となり、区切り記号付語句例No.3の「Patent(特許)」における区切り記号付語句の属性は、直前の「英語の日本語訳」となり、区切り記号付語句例No.4の「Patent(パテント)」における区切り記号付語句の属性は、直前の「英語の日本語訳カタカナ表記」となり、区切り記号付語句例No.5の「特許(Patent)」における区切り記号付語句の属性は、直前の「漢字の英語訳」となる。
そして、図7の例においては、注釈の一つ(注釈1)は、記号*と数字とを組み合わせた態様であり、また、注釈の他の態様(注釈2)は、上記の属性を翻訳結果の言語に翻訳したものとされる。なお、この例では、注釈2は、上記の属性を簡略に翻訳したものとして、注釈が長くなって冗長になるのを避けるようにしている。このため、図7の注釈2の英語例では、区切り記号付語句例No.2~No.5は、全て「translation」とされるが、それぞれを区別するために、「translation」のそれぞれに、語句例の数字番号が付加されている。
以上の区切り記号付語句の例は、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号内語句とで同一となる場合の例であるが、区切り記号付語句には、前述したように、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号内語句とで不一致となる場合もある。しかし、この実施形態では、逐語翻訳の結果が、区切り記号の直前の語句と区切り記号付語句とで同一となる場合についてのみ注釈を翻訳結果に付加することが可能とされている。
すなわち、この実施形態では、図7に示すように、テーブル情報としては、区切り記号付語句例No.6のように、区切り記号の直前の語句と区切り記号内語句とで不一致となる例については、テーブル情報には、その属性は記憶されているが、注釈は定義されず、記憶されない。すなわち、この実施形態では、区切り記号の直前の語句と区切り記号内語句とで不一致となる区切り記号付語句例については、注釈は付加しないからである。
なお、図7では注釈2として英語の場合のみを示したが、この実施形態において、日本語から翻訳される英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などの外国語の全てについて、注釈2が用意されていてもよいことは言うまでもない。
また、この第2の実施形態では、注釈1が利用者により選択指定されて、自動翻訳結果に当該注釈1の「記号*と数字の組み合わせ」が付加されたときには、当該付加された注釈1のそれぞれを利用者がクリックすると、その付加された注釈1に対応する属性が何であるかを、翻訳結果の言語による図7の属性の翻訳が、例えばポップアップ表示されるように構成されている。同様にして、注釈2が利用者により選択指定された場合において、「translation 数字番号」を利用者がクリックすると、その付加された注釈2の「translation 数字番号」に対応する属性が何であるかを、翻訳結果の言語による図7の属性の翻訳が、例えばポップアップ表示されるように構成されている。
区切り記号付語句属性判定部113は、この第2の実施形態では、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行わないとの選択指定を受け付けたときであって、注釈を付与すると選択指定されたときに起動される。そして、区切り記号付語句属性判定部113は、起動されたときには、形態素解析部108での解析結果として括弧付語句が検出されたときに、区切り記号付語句の当該区切り記号の直前の語句に対する属性を判定する。そして、区切り記号付語句属性判定部113は、その判定結果の属性情報を、区切り記号付語句処理部112Aに転送する。
区切り記号付語句処理部112Aは、第1の実施形態の区切り記号付語句処理部112と同様の処理を実行する他、この第2の実施形態においては、利用者から、操作入力部122を通じて、区切り記号付語句についての冗長性除去の処理を行わないとの選択指定を受け付けたときであって、注釈を付与すると選択指定されたときには、区切り記号付語句属性判定部113からの判定結果の属性情報を受けて、利用者により選択指定された注釈を、自動翻訳結果に付加する処理を実行する。
[第2の実施形態の自動翻訳装置の処理動作]
この第2の実施形態においても、自動翻訳の開始に先立ち、利用者による、原文メモリ106に記憶されている日本語の原文のファイルの中からの、翻訳の対象の原文のファイルの選択指定を受け付け、また、日本語から翻訳する外国語の選択指定を受け付けると共に、区切り記号付語句について冗長性除去処理をするか、しないかの選択入力を受け付ける。
この第2の実施形態においても、自動翻訳の開始に先立ち、利用者による、原文メモリ106に記憶されている日本語の原文のファイルの中からの、翻訳の対象の原文のファイルの選択指定を受け付け、また、日本語から翻訳する外国語の選択指定を受け付けると共に、区切り記号付語句について冗長性除去処理をするか、しないかの選択入力を受け付ける。
さらに、この第2の実施形態においては、区切り記号付語句について冗長性除去処理をしないと選択指定されたときには、区切り記号付語句についての注釈付加処理をするか否かの選択指定を受け付けると共に、区切り記号付語句についての注釈付加処理をすると選択指定された場合には、注釈1または注釈2のいずれの注釈を付加するかの選択指定を受け付ける。
そして、この第2の実施形態の場合、利用者の操作入力に基づいて上述した翻訳条件の選択指定入力が完了すると、翻訳開始ボタン(アイコンボタン)が画面に表示され、その
翻訳開始ボタンが利用者により押下操作されると、この第2の実施形態の自動翻訳装置における自動翻訳処理動作が開始される。
翻訳開始ボタンが利用者により押下操作されると、この第2の実施形態の自動翻訳装置における自動翻訳処理動作が開始される。
図8および図9は、上述の構成の第2の実施形態の自動翻訳装置における自動翻訳処理動作の流れの一例を示すフローチャートである。以下、この図8および図9のフローチャートを参照しながら、第2の実施形態の自動翻訳装置における自動翻訳処理動作の例について説明する。なお、この図8および図9のフローチャートの各ステップの処理は、制御部101が、翻訳条件受付部107、形態素解析部108、翻訳実行部109、区切り記号付語句処理部112A、区切り記号付語句属性判定部113の各機能処理を、メモリ102に格納されているプログラムを実行することでソフトウェア処理とした場合として説明する。
先ず、制御部101は、操作入力部122を通じて利用者により翻訳開始ボタン1214が押下操作されて、自動翻訳の開始指示がなされたか否か判別する(ステップS21)。開始指示がなされた場合、制御部101は、冗長性除去処理についての入力欄1213をチェックし(ステップS22)、「冗長性除去処理をする」に選択指定されているか否かを判別する(ステップS23)。
ステップS23で、「冗長性除去処理をする」に選択指定されていると判別したときには、制御部101は、第1の実施形態の場合と同様に、図4のフローチャートに示した処理を実行するようにする。ここでは、重複を避けるため説明を省略する。
そして、ステップS23で、「冗長性除去処理をしない」に選択指定されていると判別したときには、制御部101は、利用者により、「注釈を付加する」と選択指定されているか否か判別する(ステップS24)。
このステップS24で、「注釈を付加しない」と選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析して、逐語翻訳を実行し(ステップS25)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(図2参照)に、その翻訳結果を表示する(ステップS26)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS27)、終了していないと判別したときには、処理をステップS25に戻し、このステップS25以降の処理を繰り返す。また、ステップS27で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
ステップS24で、「注釈を付加する」と選択指定されていると判別したときには、制御部101は、日本語の原文を形態素解析し(図9のステップS31)、その形態素解析の結果から、区切り記号付語句を検出したか否か判別する(ステップS32)。
このステップS32で、区切り記号付語句を検出してはいないと判別したときには、制御部101は、逐語翻訳を実行し(ステップS33)、その翻訳結果を翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216(図2参照)に、その翻訳結果を表示する(ステップS36)。
次に、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS37)、終了していないと判別したときには、処理をステップS31に戻し、このステップS31以降の処理を繰り返す。
そして、ステップS32で、区切り記号付語句を検出したと判別したときには、制御部101は、当該区切り記号付語句の属性を判定する(ステップS34)。そして、制御部101は、区切り記号の直前の語句及び区切り記号付語句を順次に逐語翻訳すると共に、ステップS34で判定した属性によりテーブル情報記憶部114を参照して、区切り記号内の語句の翻訳結果に付与する注釈を、判定した属性に応じて決定して付加する(ステップS35)。ここで、注釈1あるいは注釈2のいずれを付加するかは、前述したように、翻訳開始前に利用者により選択指定されているので、その選択指定されている方の注釈を付加する。
なお、前述したように、区切り記号付語句の属性によっては、注釈を付加する必要がない場合があることは、前述した通りである。
次に、制御部101は、区切り記号の直前の語句の翻訳結果と、区切り記号付語句の翻訳結果と、必要に応じて付加された注釈とを、翻訳結果メモリ111に書き込むと共に、ディスプレイ121の表示画面121Dの翻訳結果表示欄1216に、その翻訳結果を表示する(ステップS36)。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS37)、終了していないと判別したときには、処理をステップS31に戻し、このステップS31以降の処理を繰り返す。また、ステップS37で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
そして、制御部101は、翻訳対象の日本語の原文の最後まで翻訳が終了したか否か判別し(ステップS37)、終了していないと判別したときには、処理をステップS31に戻し、このステップS31以降の処理を繰り返す。また、ステップS37で、翻訳対象の日本語の原文の最後まで翻訳が終了したと判別したときには、制御部101は、この自動翻訳処理を終了する。
[注釈付加の具体例]
以上の第2の実施形態における自動翻訳処理における「冗長性除去処理をしない」場合において実行される注釈の付加処理の具体例を、図10に示す。図10は、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。また、注釈1は、区切り記号内において、区切り記号内語句の直後に付加され、注釈2は、区切り記号内において、区切り記号内語句の直後に[]付で付加される。
以上の第2の実施形態における自動翻訳処理における「冗長性除去処理をしない」場合において実行される注釈の付加処理の具体例を、図10に示す。図10は、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。なお、この例では、区切り記号が全て括弧の場合であるが、前述もしたように、区切り記号は、括弧に限られるものではないことは言うまでもない。また、注釈1は、区切り記号内において、区切り記号内語句の直後に付加され、注釈2は、区切り記号内において、区切り記号内語句の直後に[]付で付加される。
図10(A)の例は、図7において、区切り記号付語句例No.1の、属性が漢字の読みの場合であり、この場合には、図10(A)の右側に示すように、利用者により注釈1が選択指定されているときには、「*1」が括弧内語句の直後に付加され、また、利用者により注釈2が選択指定されているときには、[translation 2]が括弧内語句の直後に付加される。
また、図10(B)の例は、図7において、区切り記号付語句例No.2の、属性が漢字の英語訳カタカナ表記の場合であり、この場合には、図10(B)の右側に示すように、利用者により注釈1が選択指定されているときには、「*2」が括弧内語句の直後に付加され、また、利用者により注釈2が選択指定されているときには、[translation 2]が括弧内語句の直後に付加される。
そして、この第2の実施形態では、図10では、図示は省略するが、表示画面に表示されている注釈1の「*1」や「*2」を利用者がクリックすると、対応する区切り記号付語句属性が、例えばポップアップ表示される。同様に、表示画面に表示されている注釈2の[translation 1]や[translation 2]を利用者がクリックすると、対応する区切り記号付語句属性が、例えばポップアップ表示される。
[第2の実施形態の効果]
第2の実施形態の自動翻訳装置によれば、第1の実施形態の自動翻訳装置と同様の効果が得られると共に、冗長性除去処理をしないとした場合において、区切り記号の直前の語句の翻訳結果と区切り記号内の語句の翻訳結果が同一となる場合においても、区切り記号内の語句についての翻訳結果に、区切り記号付語句の属性に応じた注釈が付加されることで、原文において、区切り記号付語句が直前の語句に対してどのような関係となっているかを容易に理解することができて便利であるという効果がある。
第2の実施形態の自動翻訳装置によれば、第1の実施形態の自動翻訳装置と同様の効果が得られると共に、冗長性除去処理をしないとした場合において、区切り記号の直前の語句の翻訳結果と区切り記号内の語句の翻訳結果が同一となる場合においても、区切り記号内の語句についての翻訳結果に、区切り記号付語句の属性に応じた注釈が付加されることで、原文において、区切り記号付語句が直前の語句に対してどのような関係となっているかを容易に理解することができて便利であるという効果がある。
そして、上述の第2の実施形態の自動翻訳装置によれば、自動翻訳結果に付加されている注釈を利用者が指示することにより、当該注釈が意味する属性についての詳細な情報が、利用者に提示されるので、非常に便利であるという効果もある。
[第2の実施形態の変形例]
上述の第2の実施形態の説明では、注釈は、区切り記号内語句についてのみ付加するようにしたが、区切り記号の直前の語句と、区切り記号内の語句との両方に対して注釈を付加するようにすることにより、区切り記号付語句の、その直前の語句との関係を、より詳しく示すことができる。例えば図11は、そのように注釈を付加表示する場合の一例であり、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。
上述の第2の実施形態の説明では、注釈は、区切り記号内語句についてのみ付加するようにしたが、区切り記号の直前の語句と、区切り記号内の語句との両方に対して注釈を付加するようにすることにより、区切り記号付語句の、その直前の語句との関係を、より詳しく示すことができる。例えば図11は、そのように注釈を付加表示する場合の一例であり、日本語の原文に含まれる区切り記号付語句について、英語に翻訳した場合の処理例を示すものである。
図11(A)の例は、図7において、区切り記号付語句例No.1の、属性が漢字の読みの場合であり、この場合には、図11(A)の右側に示すように、区切り記号(括弧)の直前の漢字「田中」の翻訳結果「Tanaka」には[kanji]が直後に付加され、区切り記号内(括弧内)の読み「たなか」の翻訳結果「Tanaka」には[kana]が直後に付加される。これにより、日本語の原文では、区切り記号付語句が、漢字の読みであったことが容易に理解できるようになる。
また、図11(B)の例は、図7において、区切り記号付語句例No.3の、属性が英語の日本語訳の場合であり、この場合には、図11(B)の右側に示すように、区切り記号(括弧)の直前の英語「Patent」の翻訳結果「Patent」には[English]が直後に付加され、区切り記号内(括弧内)の日本語訳「特許」の翻訳結果「Patent」には[Japanese]が直後に付加される。これにより、日本語の原文では、区切り記号付語句が、英語の日本語訳であったことが容易に理解できるようになる。もちろん、英語のフランス語訳の場合、[French]が付加され、ドイツ語訳の場合、[German]が付加される。
[その他の実施形態又は変形例]
上述の第2の実施形態では、注釈は、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが同一になる場合にのみ、自動翻訳結果に付加するようにしたが、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが不一致になる場合にも、区切り記号付語句属性判定部113で判定した属性に応じた注釈を付加するようにしてもよい。
上述の第2の実施形態では、注釈は、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが同一になる場合にのみ、自動翻訳結果に付加するようにしたが、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが不一致になる場合にも、区切り記号付語句属性判定部113で判定した属性に応じた注釈を付加するようにしてもよい。
また、区切り記号付語句が、読みが難しい漢字のルビの場合、区切り記号の直前の語句の翻訳結果と、区切り記号内語句の翻訳結果とが不一致になるが、外国語への翻訳の場合には、そのルビの翻訳は不要であるので、自動翻訳結果に、当該ルビの翻訳結果を含めないようにしてもよい。
上述の実施形態では、区切り記号付語句の区切り記号内語句が1つの場合について説明したが、「、」(カンマ、コンマ)、「:」(コロン)、「;」(セミコロン)、「。」などの句読点で区切られて、区切り記号内語句が複数の場合であっても適用できる。この場合には、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句のそれぞれの翻訳結果との一致、不一致を判定すると共に、区切り記号内の複数の語句のそれぞれの翻訳結果同士の一致、不一致をも判定するようにする。
なお、区切り記号内語句が句読点で区切られていない場合には、当該句読点で区切られていない語句の全体を1つの語句として扱って、区切り記号の直前の語句との間での翻訳結果の一致、不一致の判定をするようにするのは、上述の第1の実施形態と同様である。
そして、区切り記号直前の語句と、区切り記号内の複数の語句のそれぞれとの翻訳結果の全てが一致した場合には、区切り記号及び区切り記号内の複数の語句の翻訳結果を、自動翻訳結果から除去するようにする。
また、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句の翻訳結果とは一致しないが、区切り記号内の複数の語句の翻訳結果同士は互いに一致する場合には、区切り記号は翻訳結果として残すと共に、その区切り記号内には、一致した1個の翻訳結果を残すようにする。
さらに、区切り記号直前の語句の翻訳結果と、区切り記号内の複数の語句の翻訳結果との全てではなく、区切り記号内の複数の語句の翻訳結果の一部とが一致する場合には、区切り記号は翻訳結果として残すと共に、その区切り記号内には、一致した翻訳結果は除去するようにする。
具体例を挙げてさらに説明する。例えば、「Patent(特許、パテント)」に対して、第1の実施形態において、冗長性除去処理をしないで自動翻訳する場合は、逐語翻訳結果は「Patent(Patent、Patent)」となり、区切り記号直前の語句と、区切り記号内の複数の語句のそれぞれとの翻訳結果の全てが一致する。このため、冗長性除去処理をすると、区切り記号内語句の「Patent」と、2つの「Patent」の間の「、」と、区切り記号()が除去され、つまり、(Patent、Patent)が除去され、「Patent」となる。なお、第2の実施形態では、区切り記号内語句が複数の場合には、例えば、図7の注釈1にしたがえば、「Patent(Patent*3、Patent*4)」となり、注釈2にしたがえば、「Patent(Patent[translation 3]、Patent[translation 4])」となる。
また、例えば「LCD(Liquid Crystal Display;液晶ディスプレイ)」に対して、冗長性除去処理をしないで自動翻訳(逐語翻訳)する場合には、「LCD(Liquid Crystal Display;Liquid Crystal Display)」または「LCD(Liquid Crystal Display;LCD)」となる。一方、この発明の冗長性除去処理をすると、前者の場合は、区切り記号内の複数の語句が互いに「Liquid Crystal Display」となるので一致が判定され、重複が避けられて翻訳結果が一つになるよう、区切り記号内語句の翻訳結果の内の一つの「Liquid Crystal Display」と句読点「;」を除去し、翻訳結果は、「LCD(Liquid Crystal Display)」となる。後者の場合は、区切り記号の直前の語句と区切り記号内の複数の語句の一部との一致が判定され、一致した区切り記号内語句「LCD」と「;」とを除去し、翻訳結果は「LCD(Liquid Crystal Display)」となる。
さらに、他の例として、「プラトン(Platon、紀元前427年-紀元前347年)」に対して、冗長性除去処理をしないで自動翻訳する場合、「Platon(Platon、B.C.427-B.C.347)」となるが、冗長性除去処理をすると、「Platon(B.C.427-B.C.347)」となる。
なお、上述の実施形態では、第1の言語が日本語の場合について説明したが、第1の言語は、日本語に限られるものではないことは勿論であり、英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などであってもよい。また、第2の言語は、英語に限られるものではないことは勿論であり、日本語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、韓国語などであってもよい。
また、上述の実施形態では、区切り記号付語句の存在を前提としていたが、フォントを通常の書体にイタリック体などの別の書体を挿入することで、区切り記号がなくても、区切り記号付語句と同様の効果を得ることもできる。この場合、イタリック体などの別の書体自体を区切り記号付語句とみなすことができる。
なお、この発明による自動翻訳装置や自動翻訳プログラムは、パーソナルコンピュータやタブレット型端末、スマートフォンなどの携帯電話端末に適用されるばかりではなく、腕時計型端末、眼鏡型端末、カーナビゲーション、券売機、案内板、電子掲示板、電子メニュー、デジタルサイネージ、各種表示装置などにも適用されるのは勿論である。
101…制御部、106…原文メモリ、107…翻訳条件受付部、108…形態素解析部、109…翻訳実行部、110…翻訳用辞書記憶部、111…翻訳結果メモリ、112,112A…区切り記号付語句処理部、113…区切り記号付語句属性判定部
Claims (23)
- 第1の言語から第2の言語へ翻訳する自動翻訳装置であって、
前記第1の言語の原文から、区切り記号で囲んだ区切り記号付語句を検出する検出手段と、
前記検出手段で検出された前記区切り記号付語句の前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号内の語句の前記翻訳結果は出力しない翻訳手段と、
を備える自動翻訳装置。 - 前記翻訳手段は、前記検出手段で検出された前記区切り記号付語句の前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号も除去して出力する
ことを特徴とする請求項1に記載の自動翻訳装置。 - 前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句と、前記区切り記号の直前の語句との前記第2の言語への翻訳結果が一致しないと判別した場合において、前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名でない場合には、前記区切り記号の直前の語句の前記翻訳結果と、前記区切り記号内の語句の前記翻訳結果とを出力する
ことを特徴とする請求項1又は請求項2に記載の自動翻訳装置。 - 前記翻訳結果は、翻訳結果としての原文のままの語句を含む
ことを特徴とする請求項1~請求項3のいずれかに記載の自動翻訳装置。 - 前記翻訳手段は、前記検出手段で検出された前記区切り記号付語句の区切り記号内の語句と、前記区切り記号の直前の語句との前記第2の言語への翻訳結果が一致するか否か判別し、一致しないと判別した場合において、前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号の直前の語句の前記翻訳結果は出力するが、前記区切り記号内の語句の前記翻訳結果は出力しない
ことを特徴とする請求項1に記載の自動翻訳装置。 - 前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句と、前記区切り記号の直前の語句との前記第2の言語への翻訳結果が一致すると判別した場合には、前記第1の言語から前記第2の言語へ翻訳結果として、少なくとも前記区切り記号内の語句を除去したものを出力する
ことを特徴とする請求項2に記載の自動翻訳装置。 - 前記区切り記号の直前の語句に対する前記区切り記号内の語句の属性を判定する属性判定手段を備え、
前記翻訳手段は、前記検出手段で検出された前記区切り記号付語句の区切り記号内の語句と、前記区切り記号の直前の語句との前記第2の言語への翻訳結果が一致すると判別した場合に、前記区切り記号の直前の語句の前記翻訳結果及び前記区切り記号内の語句の前記翻訳結果を出力すると共に、少なくとも前記区切り記号内の語句の前記翻訳結果に、前記属性判定手段で判定された前記区切り記号内の語句の属性に応じた注釈を付加して出力する
ことを特徴とする請求項1~請求項5のいずれかに記載の自動翻訳装置。 - 前記属性判別手段で判定される前記属性は、予め複数の属性に分類分けされており、
前記注釈は、いずれの分類の属性であるかを示す表示態様で、前記翻訳結果に付加されて出力される
ことを特徴とする請求項7に記載の自動翻訳装置。 - 前記注釈と、前記分類分けされた前記複数の属性のそれぞれとの対応関係を示すテーブル情報を記憶する記憶部を備え、
前記翻訳結果に付加されて表示されている前記注釈が選択されたときに、前記記憶部の前記テーブル情報に基づいて、対応する属性が何であるかを示す手段を備える
ことを特徴とする請求項8に記載の自動翻訳装置。 - 前記注釈は、前記分類分けされた前記複数の属性のそれぞれを前記第2の言語に翻訳したものである
ことを特徴とする請求項8又は請求項9に記載の自動翻訳装置。 - 前記注釈は、前記第2の言語の翻訳を意味する語と、前記分類分けされた前記複数の属性のそれぞれを区別するための数字とからなる
ことを特徴とする請求項8~請求項10のいずれかに記載の自動翻訳装置。 - 前記注釈は、前記分類分けされた前記複数の属性のそれぞれを区別するための記号と数字との組み合わせからなる
ことを特徴とする請求項8~請求項11のいずれかに記載の自動翻訳装置。 - 前記注釈は、前記分類分けされた前記複数の属性のそれぞれを前記第2の言語に翻訳したもの、及び/又は前記第2の言語の翻訳を意味する語と、前記分類分けされた前記複数の属性のそれぞれを区別するための数字とからなる第1の注釈と、前記分類分けされた前記複数の属性のそれぞれを区別するための記号と数字との組み合わせからなる第2の注釈とが、選択的に用いられるものであり、
前記第1の注釈と、前記第2の注釈とのいずれを付加するかの選択を受け付ける手段を備える
ことを特徴とする請求項8~請求項12のいずれかに記載の自動翻訳装置。 - 前記区切り記号付語句について注釈を付加するか否かの使用者による指示を受け付ける受付手段を備え、
前記翻訳手段は、前記受付手段で、前記区切り記号付語句の処理をするとの指定を受け付けた場合に、少なくとも前記区切り記号の直前の語句の前記翻訳結果に注釈を付加したものを出力する
ことを特徴とする請求項7~請求項13のいずれかに記載の自動翻訳装置。 - 前記区切り記号付語句について注釈を付加しないとの指定を受け付けたときには、前記区切り記号の直前の語句及び前記区切り記号付語句を、前記第1の言語の原文通りに逐語翻訳する
ことを特徴とする請求項14に記載の自動翻訳装置。 - 所定の書体と異なる別の書体の語句を、前記区切り記号付語句として、前記翻訳を行う
ことを特徴とする請求項1~請求項15のいずれかに記載の自動翻訳装置。 - パーソナルコンピュータ、タブレット型端末、携帯電話端末、腕時計型端末、眼鏡型端末、カーナビゲーション、券売機、案内板、電子掲示板、電子メニュー、デジタルサイネージ、表示装置のいずれかに適用される
ことを特徴とする請求項1~請求項16のいずれかに記載の自動翻訳装置。 - 前記区切り記号の直前の語句の前記翻訳結果と、前記区切り記号内の語句の前記翻訳結果が一致するか否か判別し、一致しないと判別した場合には、前記区切り記号内の語句の前記翻訳結果に注釈を付加しない
ことを特徴とする請求項7~請求項17のいずれかに記載の自動翻訳装置。 - 前記区切り記号付語句の処理をするか否かの使用者による指示を受け付ける受付手段を備える
ことを特徴とする請求項1~請求項18のいずれかに記載の自動翻訳装置。 - 前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句が複数個である場合には、前記区切り記号内の複数個の語句のそれぞれと、前記区切り記号の直前の語句について、前記第2の言語への翻訳結果が一致するか否か判別し、前記区切り記号内の複数個の語句のうち、前記一致すると判別した語句を除去したものを、前記翻訳結果として出力する
ことを特徴とする請求項1~請求項19のいずれかに記載の自動翻訳装置。 - 前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句が複数個である場合には、前記区切り記号内の複数個の語句のそれぞれの前記第2の言語への翻訳結果が一致するか否か判別し、前記区切り記号の直前の語句の前記第2の言語への翻訳結果とは不一致であるが、前記区切り記号内の複数個の語句が一致すると判別した場合には、前記翻訳結果として、前記一致した翻訳結果の一つを前記区切り記号内に残すようにする
ことを特徴とする請求項1~請求項20のいずれかに記載の自動翻訳装置。 - 前記翻訳手段は、前記区切り記号付語句の区切り記号内の語句が複数個である場合に、前記区切り記号内の複数個の語句の一部と、前記区切り記号の直前の語句の前記第2の言語への翻訳結果と一致する場合には、前記区切り記号を残すと共に、前記区切り記号内には、一致した前記翻訳結果は除去する
ことを特徴とする請求項1~請求項21のいずれかに記載の自動翻訳装置。 - 第1の言語から第2の言語へ翻訳するために、コンピュータを、
前記第1の言語の原文から、区切り記号で囲んだ区切り記号付語句を検出する検出手段、
前記検出手段で検出された前記区切り記号付語句の区切り記号内の語句と、前記区切り記号の直前の語句との前記第2の言語への翻訳結果が一致するか否か判別し、一致しないと判別した場合において、前記区切り記号の直前の語句が漢字であって、かつ、前記区切り記号内の語句が前記漢字の読み仮名である場合には、前記区切り記号の直前の語句の前記翻訳結果は出力するが、前記区切り記号内の語句の前記翻訳結果は出力しない翻訳手段、
として機能させるための自動翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023011475A JP2023052750A (ja) | 2019-09-25 | 2023-01-30 | 自動翻訳装置及び自動翻訳プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019173953A JP6933395B2 (ja) | 2015-07-27 | 2019-09-25 | 自動翻訳装置及び自動翻訳プログラム |
JP2021131497A JP7223450B2 (ja) | 2019-09-25 | 2021-08-12 | 自動翻訳装置及び自動翻訳プログラム |
JP2023011475A JP2023052750A (ja) | 2019-09-25 | 2023-01-30 | 自動翻訳装置及び自動翻訳プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021131497A Division JP7223450B2 (ja) | 2019-09-25 | 2021-08-12 | 自動翻訳装置及び自動翻訳プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023052750A true JP2023052750A (ja) | 2023-04-12 |
Family
ID=78767501
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021131497A Active JP7223450B2 (ja) | 2019-09-25 | 2021-08-12 | 自動翻訳装置及び自動翻訳プログラム |
JP2023011475A Pending JP2023052750A (ja) | 2019-09-25 | 2023-01-30 | 自動翻訳装置及び自動翻訳プログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021131497A Active JP7223450B2 (ja) | 2019-09-25 | 2021-08-12 | 自動翻訳装置及び自動翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7223450B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03260766A (ja) * | 1990-03-09 | 1991-11-20 | Mitsubishi Electric Corp | 括弧生成判定機能付翻訳装置 |
JPH07200588A (ja) * | 1993-12-28 | 1995-08-04 | Sharp Corp | 翻訳装置 |
JPH113334A (ja) * | 1997-06-12 | 1999-01-06 | Canon Inc | 翻訳装置及び翻訳方法 |
JP2003058536A (ja) * | 2002-06-14 | 2003-02-28 | Sharp Corp | 翻訳装置 |
-
2021
- 2021-08-12 JP JP2021131497A patent/JP7223450B2/ja active Active
-
2023
- 2023-01-30 JP JP2023011475A patent/JP2023052750A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP7223450B2 (ja) | 2023-02-16 |
JP2021184295A (ja) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pasha et al. | Madamira: A fast, comprehensive tool for morphological analysis and disambiguation of arabic. | |
US7895030B2 (en) | Visualization method for machine translation | |
US8726148B1 (en) | Method and apparatus for processing text and character data | |
JP2016186805A5 (ja) | ||
JP2016186805A (ja) | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 | |
US20060149557A1 (en) | Sentence displaying method, information processing system, and program product | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
WO2014205232A1 (en) | Language input method editor to disambiguate ambiguous phrases via diacriticization | |
JP2010198241A (ja) | 中国語入力装置およびプログラム | |
JP7481999B2 (ja) | 辞書編集装置、辞書編集方法及び辞書編集プログラム | |
Sharma et al. | Word prediction system for text entry in Hindi | |
JP6933395B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
JP7223450B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
US10073832B2 (en) | Method and system for transcription of a lexical unit from a first alphabet into a second alphabet | |
Abufardeh et al. | Software localization: the challenging aspects of Arabic to the localization process (Arabization) | |
JP6598241B2 (ja) | 自動翻訳装置及び自動翻訳プログラム | |
US11947580B2 (en) | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program | |
JP3935374B2 (ja) | 辞書構築支援方法、装置及びプログラム | |
US20240232537A9 (en) | Natural language processing system, natural language processing method, and natural language processing program | |
US20240135107A1 (en) | Natural language processing system, natural language processing method, and natural language processing program | |
JP2008140074A (ja) | 例文検索装置および例文検索処理プログラム | |
JPH05290030A (ja) | 文書処理装置 | |
JPH10198664A (ja) | 日本語入力システム及び日本語入力プログラムを記録した媒体 | |
Felea | Romanian Slavonic in Unicode: problems and solutions | |
WO2014138756A1 (en) | System and method for automatic diacritizing vietnamese text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240417 |