JP2924955B2 - 翻訳方法および翻訳装置 - Google Patents
翻訳方法および翻訳装置Info
- Publication number
- JP2924955B2 JP2924955B2 JP8328257A JP32825796A JP2924955B2 JP 2924955 B2 JP2924955 B2 JP 2924955B2 JP 8328257 A JP8328257 A JP 8328257A JP 32825796 A JP32825796 A JP 32825796A JP 2924955 B2 JP2924955 B2 JP 2924955B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- character data
- data
- character
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、翻訳編集作業の効
率化を図り得る翻訳方法および翻訳装置に関する。 【0002】 【従来の技術】近時、コンピュータを利用して入力原文
を自動的に機械翻訳し、その訳文を求める機械翻訳装置
が注目されている。例えば日本語文を入力してその英訳
文を求めたり、また英語文を入力してその和訳文を求め
たりする自然原語の機械翻訳装置の開発が種々試みられ
ている。 【0003】この種の装置は、基本的には入力原文を形
態解析や構文解析等して、例えば語(語句)等の所定の
処理単位に区分する。そして、上記処理単位毎に翻訳辞
書を検索して各処理単位に対応した訳語(訳語句)を求
め、これらの訳語(訳語句)を所定の訳文規則に従って
結合しその訳文を求める如く構成される。 【0004】 【発明が解決しようとする課題】ところで、従来の機械
翻訳装置では、原文の文書情報を形成する文字データ列
を入力し、これを上述したような手順で翻訳処理して訳
文を生成している。 【0005】この為、入力された文書情報中の文字デー
タのみを抽出して順次機械翻訳処理を実行していくと、
上記文書情報中に含まれていた各種の非文字情報が欠落
してしまい、その翻訳結果が非常にわかり難いものとな
ってしまう。具体的には、例えばフォーマット情報が欠
落すると、翻訳結果である訳文をフォーマット整形する
のに多大な労力を必要とする。またそのパラグラフ情報
が失われた場合には、翻訳文の意味的解釈が非常に困難
になる等の不具合を招来する。 【0006】本発明は、このような事情を考慮してなさ
れたもので、その目的とするところは、原文中に含まれ
る非文字データが示す情報を損うことなく、翻訳結果を
効果的に得ることができる機械翻訳装置を提供すること
にある。 【0007】 【課題を解決するための手段】本発明は、入力された原
文を翻訳辞書部に格納された情報を用いて翻訳部で翻訳
処理し、この翻訳処理により求められた訳文を出力する
翻訳方法において、前記原文を形成する文字データ列と
該原文中のタイトル部分を示す非文字データを含むデー
タ系列を記憶する記憶部から該データ系列を読出し、該
読出したデータ系列に含まれる前記非文字データを検出
し、該検出した前記非文字データを、前記訳文を形成す
る文字データ列の前記データ系列に含まれる該非文字デ
ータの位置と対応する位置に付加して得た、該記訳文を
形成する文字データ列と該訳文中のタイトル部分を示す
非文字データを含むデータ系列を出力することを特徴と
する。また、本発明は、入力された原文を翻訳辞書部に
格納された情報を用いて翻訳部で翻訳処理し、この翻訳
処理により求められた訳文を出力する翻訳装置におい
て、前記原文を形成する文字データ列と該原文中のタイ
トル部分を示す非文字データを含むデータ系列を記憶す
る記憶手段と、この記憶手段から読出されたデータ系列
に含まれる前記非文字データを検出する手段と、この手
段により検出された前記非文字データを、前記訳文を形
成する文字データ列の前記データ系列に含まれる該非文
字データの位置と対応する位置に付加して得た、該記訳
文を形成する文字データ列と該訳文中のタイトル部分を
示す非文字データを含むデータ系列を出力する手段とを
具備することを特徴とする。 【0008】本発明では、翻訳処理が終了し、その翻訳
結果である訳文を表示・出力したとき、原文に付加され
たタイトル部分を示す非文字データに従って訳文を構成
する文字データ列がタイトル部分が分かるように出力さ
れる。すなわち、原文中のタイトル部分と訳文中のタイ
トル部分を対応させることができる。 【0009】従って原文と訳文との対応関係を明確に示
すことが可能となり、翻訳結果に対する後処理編集に対
する負担を大幅に軽減できる。故に、翻訳編集作業の簡
易化を図り、簡易に効率良く適切な言語表現の訳文を得
ることが可能となる。 【0010】 【発明の実施の形態】以下、図面を参照して本発明の一
実施形態につき説明する。 【0011】この実施形態は英語文を入力し、これを日
本語に機械翻訳するもので、図1は実施形態装置の概略
構成図である。 【0012】図1において、1はキーボード等からなる
入力部1である。この入力部1を構成するキーボード
は、例えば図2に示すように文字データ入力用のキー群
1aに加えて、翻訳指示用のキー1b、編集用キー群1
c、機能制御キー群1d、前記表示部8におけるカーソ
ル制御用キー群1e等を備えて構成される。 【0013】しかしてこの入力部1等から入力された英
語文は翻訳処理に供せられる原文として原文記憶部2に
格納される。この際、原文を形成する文字データと共に
上記入力部1から入力されるフォーマット情報や文字属
性情報等の非文字データは、非文字データ認識部3にて
認識される。そしてその認識結果に従って、非文字デー
タの情報はその検出箇所近傍の文字データに関連付けら
れて、或いは入力原文を管理する文番号等に関連付けら
れて前記原文記憶部2に記憶される。 【0014】編集制御部4は、上記原文記憶部2に格納
された原文を文番号による管理の下で順に読出し、翻訳
部5に与えている。翻訳部5では、翻訳辞書部6に予め
格納された翻訳処理の為の知識情報を用い、上記原文記
憶部2から読出された原文を順次所定の処理単位で機械
翻訳処理する。 【0015】尚、翻訳辞書部6に格納された知識情報
は、例えば規則・不規則変化辞書6a、単語(訳語)辞
書6b、接続不可能品詞列規則辞書6c、訳文係り受け
辞書6d等からなる。このような知識情報を用いて上記
原文を機械翻訳して求められた訳文である日本語文は、
これを得た原文に対応付け管理されて順次訳文記憶部7
に格納される。 【0016】しかして前記編集制御部3は、上記訳文を
訳文記憶部7に格納するに際して、前記入力原文から認
識された非文字データの情報に従い、この非文字データ
の情報を上記訳文中に展開挿入している。この非文字デ
ータの訳文中への展開挿入は、非文字データ展開部8に
よって行われる。この非文字データ展開部8は、例えば
原文中における非文字データの検出位置に従って、その
文番号に関連付けてフォーマット情報を訳文に付加した
り、下線等の文字属性情報をその原語に対する訳語に対
応付けて付加する等の処理を行うものである。このよう
な非文字データの情報の訳文への展開挿入によって、前
記訳文記憶部7に記憶される訳文に非文字データに関す
る情報が付加されることになる。 【0017】また表示部9は、表示制御部10の制御の
下で前記原文記憶部2に格納された英語文(原文)、お
よび訳文記憶部6に格納された日本語文(訳文)を相互
に対応付けて表示するものである。またこの表示部9に
て、機械翻訳処理に必要な訳語候補の選択情報等も表示
される。この表示部9は、例えば図3に示すように、そ
の表示画面を画面上部の翻訳編集領域9a、画面左側の
原文表示領域9b、および画面右側の訳文表示領域9c
に3分割して構成されている。この原文表示領域9bに
前記原文記憶部2に格納された入力原文が順次表示さ
れ、また訳文表示領域9cには前記訳文記憶部7に格納
された訳文が、例えばその訳文を得た原文に対応してそ
れぞれ横書き表示される。尚、翻訳編集領域9aには、
前述したように前記翻訳辞書部6から検索された翻訳処
理に供せられる訳語候補等の翻訳処理に必要な情報が表
示される。 【0018】このようにして原文とその訳文とが表示部
9に表示されて、その訳文の後編集処理に供される。こ
の後編集処理は、前記入力部1から入力される制御情報
に従って、後述するように、例えば前記翻訳辞書部6に
格納されている知識情報を参照する等して実行される。 【0019】そしてこのような後編集処理が施されて完
成された前記原文(英語文)に対する訳文(日本語文)
は、前記非文字データ展開部8による非文字データ情報
に基く展開処理が施された後、印刷部11にてハードコ
ピー出力される。 【0020】図4はこのように構成された実施形態装置
の基本的な動作シーケンスを示すものである。編集制御
部4はこのような動作シーケンスに従って、翻訳部5か
ら与えられる翻訳終了の情報や前記入力部1から入力さ
れる各種のキー情報を判定し、対話的にその翻訳・編集
処理を制御する。 【0021】即ち、編集制御部4は、翻訳部5における
翻訳処理状態を監視し(ステップA)、翻訳部5におけ
る1つの原文の翻訳処理の完了を検出したとき、その翻
訳処理によって求められた訳文を前記非文字データの情
報に従って展開し、また非文字データの情報を挿入して
前記訳文記憶部7に格納すると共に、その訳文を原文に
対応させて表示部9に表示する(ステップB)。 【0022】また翻訳部5から翻訳処理の完了を示す信
号が与えられない場合には、編集制御部4は前記入力部
1から入力されるキー情報を判定している(ステップ
C,D,E,F)。そしてその入力キー情報が『翻訳指
示キー』である場合(ステップC)、編集制御部4は前
記原文記憶部2に格納された入力原文を翻訳部5に与
え、その翻訳処理を開始させる(ステップG)。 【0023】この翻訳処理は、例えば図5にその処理シ
ーケンスを示すように、先ず翻訳処理対象とする原文の
言語形態を前記規則・不規則変化辞書6aを用いて解析
する(ステップP)。この形態解析によって、例えば活
用変形や語尾変化を生じた原語をその原形(基本形)に
変換する。具体的には過去形や進行形で表現された語を
現在形に変換し、また比較級や最上級で表現された語を
その原形に変換する処理からなる。 【0024】次に上記の如く形態解析された原文の各原
語に対して、前記訳語辞書6bを用いてその品詞情報や
訳語候補等の情報を求める(ステップQ)。この処理
は、上記原語を見出し語として訳語辞書6bを検索する
ことにより行われる。 【0025】しかる後、辞書検索された情報に従ってそ
の訳語候補の接続可能性の検証が行われる(ステップ
R)。この検証は、前記接続不可能品詞列規則6cを参
照して行われ、矛盾のない構文解析結果(訳語候補の品
詞列の並び)が得られるまで繰返して行われる。この構
文解析によって、前記原文を構成する原語の品詞の並び
構造や、その係り受け関係、時制の態様等が求められ
る。 【0026】その後、この構文解析された原文の構造
を、前記訳文係り受け辞書6dを用いて前記訳文の構文
構造に変換し、各原語の訳語候補の並びからなる訳文を
生成する(ステップS)。この際、前記原文の構文解析
結果に従って、各訳語候補を活用変形および語尾変形処
理し、その訳文を適切な言語表現とする。 【0027】このような翻訳処理によって、原文に対す
る訳文が求められる。 【0028】一方、前記図4に戻って、前記入力キー情
報が『文字キー』である場合には(ステップD)、その
文字キーが示す文字コードが入力バッファに格納される
(ステップH)。そして、その文字コードを前記原文記
憶部2に格納し、その文字パターンを前記表示部8に表
示する(ステップI)。この入力バッファに格納された
文字コードの各文字パターン表示によって、前記入力部
1から入力された原文が表示されることになる。 【0029】更に入力キー情報が『編集キー』である場
合には(ステップE)、その編集キーに対応した編集処
理が前記訳文に対して実行される(ステップJ)。同様
にして入力キー情報が『機能キー』である場合には(ス
テップF)、その機能キーに対応して処理が実行される
(ステップK)。 【0030】そしてキー情報の入力がない場合、或いは
入力キー情報が上述した『キー』以外のものである場合
には、その他の処理、例えば前記訳文記憶部6に得られ
た訳文のハードコピー出力等が行われる。 【0031】このような編集制御部3の動作シーケンス
により、例えばオペレータがキーボードの前記文字入力
用キー群1aを操作して文字入力すると、その文字情報
は入力バッファに順次セットされ、翻訳処理に供せられ
る原文として原文記憶部2に順に格納される(ステップ
D,H)。そしてその入力原文が表示部8の前記原文表
示領域8bに表示される(ステップI)。 【0032】しかして文字入力の任意の時点、例えば1
文の入力終了時点で翻訳指示キー1bを操作すると、そ
のキー入力情報に従って上記入力バッファに格納された
入力原文に対する翻訳処理が開始される(ステップC,
G)。そしてその翻訳処理が完了すると、これによって
求められた訳文が前記表示部8の訳文表示領域8cに表
示されることになる(ステップA,B)。 【0033】尚、入力原文の修正等の編集が必要な場合
には、文字入力用キー群1aの操作による原文入力の途
中で、例えば前記カーソル制御キー群1eを操作してそ
の修正箇所にカーソルを合せ、訂正・挿入・削除等の編
集キー群1cを操作することによって、その編集処理が
実行される(ステップE,J)。 【0034】このようにして機械翻訳処理の基本的動作
が制御され、この翻訳処理によって求められた前記原文
に対する訳文が、前記訳文記憶部7に格納されると共
に、その原文に対応して表示される。尚、1つの原文に
対する訳文が複数種類得られた場合には、例えば1つの
訳文だけを表示し、同時に他の訳文が存在する旨を識別
表示するようにすれば良い。 【0035】ここで前記編集キーの指示入力による、上
記訳文に対する翻訳編集処理について簡単に説明する。 【0036】この訳文に対する翻訳編集処理は、前記表
示部9の画面上でカーソルによって指示された語(原
語、原語句、訳語、訳語句)に対し、操作された編集キ
ーに対応した処理を行うことによって実現される。具体
的には、(1) 挿入キーの操作によってカーソル位置の前
に文字を挿入すると、(2) 削除キーの操作によってカー
ソルが指示している範囲の文字列を削除する、 (3) 移
動キーの操作によってカーソルが指示している範囲の文
字列を移動する、 (4) 取消しキーの操作によって上記
各キーによってそれぞれ指定された各編集機能を無効と
する、(5) 係り受けキーの操作によってカーソルが指示
している語句の他の係り受け候補を表示する等の翻訳編
集処理からなる。 【0037】また前述した機能制御キーが操作されると
次のような機能が呈せられ、上述した訳文の翻訳編集に
利用される。即ち、(1) 訳語表示キーが操作されると、
カーソルが指示する訳文中の語に対してその訳語を表示
する、(2) 辞書表示キーが操作されると、後述するよう
にカーソルが指示する原文中の語を見出し語とする翻訳
辞書の内容を表示する、(3) 辞書登録キーが操作される
と、カーソルが指示する文字列を新語・熟語として辞書
登録する、(4) 辞書削除キーが操作されると、辞書登録
された新語・熟語を登録抹消する、 (5) 部分訳キーが
操作されると、カーソルによって指示され、翻訳処理に
失敗した原文に対する部分訳を表示する等の機能によっ
て実現される。 【0038】尚、上述したカーソルによる文字列(語)
等の指示は、前記カーソル移動キーの操作によって表示
画面上でカーソルを移動させつつ、カーソル制御キーに
よってカーソル・サイズを可変する等して行われる。 【0039】このような各種の機能を利用して前述した
訳文に対する訳語修正等の後処理が対話的に行われる。 【0040】以上が本装置が基本的に持つ翻訳処理機能
である。 【0041】ここで本装置が特徴とする非文字データに
対する処理について更に詳しく説明する。 【0042】前記入力部1を介して入力される原文の情
報(文書情報)は、文章自体を構成する文字データと、
フォーマットや文字属性等を示す非文字データとに分け
られる。 【0043】図7はその分類例を示すものである。即
ち、前記入力部1から入力されるデータは、(1) 文書を
構成する文字データ、(2) タブ、改行、改頁、空白、イ
ンデント等の文字データの位置を制御する文字位置制御
データ、(3) 字種、大きさ、下線の有無、網掛け等の文
字の属性に関する文字属性データ、(4) タブの設定位
置、図表領域、用紙サイズ等を特定するレイアウトデー
タ、(5) 原文の前処理編集時に付加され、翻訳処理の手
助けとして用いられる、挿入句指定情報、接続詞のスコ
ープ情報等からなる翻訳補助データとして分類できる。 【0044】ここで文字位置制御データは、通常、文字
データと同様に1つのコード単位に割当てられる。また
文字属性データは、1つのコード単位の数ビットを用い
てその文字属性を表すか、或いはその属性を示すシフト
コードまたコードシーケンスを準備し、このコードを入
力データ系列中に埋め込むことによって表現される。ま
たレイアウトデータは、そのレイアウトを示すコードシ
ーケンスを設定し、これを入力データ系列中に埋め込む
ことによって表現される。 【0045】そして翻訳補助データに関しては、特殊コ
ードまたは文字属性として表現される情報として与える
ことができる。 【0046】このような非文字データに対する表現法
は、装置の仕様に応じて任意に設定できるものである
が、ここでは図7に例示するように、文字位置制御デー
タおよび翻訳補助データをそれぞれコードとして、また
文字属性データを各種文字属性のシフトイン/シフトア
ウトを示すコードとして、更にレイアウトデータを各種
レイアウト情報のコードシーケンスの設定によって与え
るものとする。 【0047】前記非文字データ認識部3は、この図7に
示すようなコードテーブルを備え、図6に示すシーケン
スによって入力データ系列中の非文字データを認識して
いる。 【0048】即ち、先ず入力部1から入力されたデータ
系列を認識部3に読込み(ステップa)、該認識部3に
準備された非文字データ変換規則3aを用いて入力デー
タ系列中の非文字データを認識している。この非文字デ
ータ変換規則3aは、例えば図8に示すように、入力デ
ータ系列に対するパターンを記述した条件部(I)と、
そのパターンに対する変換処理を記述した変換部(II)
とから構成されている。 【0049】このような条件部(I)のパターンを順次
入力データ系列とパターンマッチング処理し(ステップ
b)、パターンマッチング時にこれを非文字をデータの
検出として該非文字データを入力データ系列中に展開し
(ステップc)、前記変換部(II)の情報を出力してい
る(ステップd)。 【0050】具体的には、 X=[abc]…abcをXに代入する {Z}+ …1以上のZの繰返しとのマッチング {Z}* …0以上のZの繰返しとのマッチング Word…その前後を0以上のブランクで挟まれた非ブ
ランク文字とのマッチング 等の規則に従ってデータ系列をパターンマッチングす
る。尚、『直前の文字』なる項目情報は、パターンマッ
チング処理の際の、マッチング開始点に関する情報であ
り、変換パターンは、マッチングの取れたパターンをど
のように置換えるかを指定するものである。 【0051】このような規則によって、例えば C/R 2.1 Software Model C/R C/R なるデータ系列が与えられたとき(ステップa)、最初
のC/Rの次のブランク点をスタートとして、次に出現
するC/Rの位置までのデータ系列がパターンマッチン
グされる(ステップb)。この場合、図8の変換規則の
1番目の条件にパターンマッチングすることから、入力
データ系列は、例えば C/R TS 2.1 Software Model C/R C/R として変換されることになる(ステップc)。尚、ここ
に例示したパターンマッチングは、原文中におけるタイ
トル部分(TS)の検出を示している。 【0052】このようにして非文字データ認識部3で
は、入力データ系列中の非文字データを検出し、必要に
応じて非文字データの削除、非文字データ系列の任意の
記号列への変換、または移動を行い、前記編集制御部4
が想定しているデータ系列体系に変換している。そして
このような非文字データの情報を含む入力原文の情報を
前記原文記憶部2に格納するようにしている(ステップ
d)。 【0053】尚、この非文字データの変換処理について
は、上述したように規則の形で記述することに代えて、
プログラムを用いて直接記述することも可能である。 【0054】ところで前記編集制御部4では、前述した
如く認識された非文字データを次のようにして取扱って
いる。 【0055】この編集制御部4では、非文字データに関
して、その内容に応じて表示画面上に表示するか否かを
制御し、また翻訳部5に送る文字データにその非文字デ
ータの情報を付加するか否かを制御している。更には、
翻訳結果である訳文を出力する際に、その文字データ列
に上記非文字データの情報を付加するか否かを制御して
いる。 【0056】図10はこのような非文字データに対する
処理の例を示すものである。即ち、ここでは、例えばそ
の非文字データの情報が『文開始』を示す場合、原文表
示および訳文表示に関しては、その文番号を生成し、こ
れを表示するような制御が行われる。また非文字データ
の情報が『改行』を示す場合には、その文末に改行マー
クを付加して表示するように制御される。更に原文に対
する接続詞のスコープ情報が与えられた場合には、これ
を原文の該当箇所に付加して翻訳部5に与えている。 【0057】編集制御部4では、このようにしてその非
文字データの種類に応じて、該非文字データの情報の表
示等を制御している。 【0058】尚、図10に示す処理内容には、字種、サ
イズ、下線等の文字属性に対する処理については示して
いないが、例えば実際の表示画面上でそのまま文字属性
を反映した文字パターンの表示を行わせたり、或いはイ
タリックシフトのように、その属性記号として表示する
ようにすれば十分である。 【0059】尚、ここに示される処理の形態は、装置の
仕様に応じて設定されるものである。従ってここに例示
されない他の非文字データの情報についても、例えば同
様な手法によって原文表示、訳文表示、翻訳部への転送
等を行うようにすれば良い。またこの例では、レイアウ
トデータについては、表示画面上に表示しないようにし
ているが、その情報を他のデータと共に表示させること
も勿論可能である。 【0060】更にこの実施形態では対話的な処理を想定
して上述した如き処理を設定しているが、バッチ的に一
括翻訳処理を行うような場合には、別の非文字データ処
理内容を設定することも勿論可能である。 【0061】またこの編集制御部4では、このような非
文字データに関する処理制御に加えて、非文字データの
修正処理が行われる。この修正処理は、前記入力部1か
らの入力信号に応じてカーソルを表示画面上の任意の位
置に移動させ、そのカーソル位置、或いはその前後の位
置に非文字データを挿入したり、またその位置に存在す
る非文字データを削除したりする処理からなる。この非
文字データに関する編集処理は、文字データに対する編
集処理と同様に行われる。 【0062】この処理によって、例えば接続詞スコープ
等の翻訳補助データを原文に付け加え、その翻訳処理を
容易ならしめる等の作業が行われる。 【0063】さて、このような編集制御部4の制御の下
で、前記非文字データ展開部8における非文字データの
展開・挿入は次のようにして行われる。この非文字デー
タの展開・挿入処理は、例えば図9に示すようなコード
認識変換テーブルの情報を用いて行われる。 【0064】この変換テーブルは、翻訳結果の出力機器
に応じて、非文字データに対してどのような出力データ
を得るかについて記述したものである。そしてその非文
字データの種類(性質)に応じて原文および訳文を形成
する文字データの出力形式が制御されるようになってい
る。 【0065】例えば訳文の文末にパラグラフ終了コード
PGが存在するとき、『0A0D0A0D』なるコード
を出力して、その文末の後に2行分の空白行が設けられ
るようにしている。つまり『0A』によるシリアルプリ
ンタのラインフィードと、『0D』によるキャリッジリ
ターンを繰返し指示し、その訳文を形成する文字データ
系列の印字出力を制御するようにしている。 【0066】このような非文字データの情報に基く文字
データ系列の出力制御によって、その訳文出力の形式が
原文を反映して制御される。 【0067】尚、このようなコード変換は、非文字デー
タの情報と出力機器の制御コードとに従って定められる
ことは云うまでもない。 【0068】かくしてこのような非文字データに対する
処理機能を備えた本装置によれば、例えば第11図
(a)に示すような英語文が翻訳処理に供せられる原文
として入力されると、そのデータ系列中に含まれる非文
字コードを認識処理し、そのコード変換によって、例え
ば第11図(b)に示すような形式の非文字データの情
報含む原文データが原文記憶部2に得られる。図11
(b)において、TSがタイトル部分を示す非文字デー
タである。 【0069】この原文中の非文字データの情報に従って
原文の翻訳処理が制御される。そして、この翻訳処理に
よって求められた訳文に上記非文字データの情報が付加
され、例えば第11図(c)に示すようなデータ系列と
して訳文記憶部7に格納される。 そして、前記原文お
よび訳文にそれぞれ付加された非文字データの情報が前
記非文字データ展開部8にて展開され、入力原文とその
訳文とが、例えば第12図に示すように表示されること
になる。即ち、原文のパラグラフ情報がその表示文に付
加され、また下線等の文字属性情報に従ってその文字の
表示形態が制御される等して、翻訳結果が表示されるこ
とになる。 【0070】故に、本装置によれば、原文の文書情報と
して与えられる非文字データの情報がそのまま翻訳文の
表示・出力に反映されることになり、原文と訳文との対
応関係を明確に把握することが可能となる。従って、そ
の翻訳編集処理を容易に行うことが可能となり、訳文の
フォーマット整形等が不要となることから、オペレータ
に対する負担を大幅に軽減することが可能となる等の実
用上多大なる効果が奏せられる。 【0071】しかも、非文字データである翻訳補助デー
タによって翻訳処理を効果的に支援することが可能とな
るので、翻訳処理効率自体の向上も図り得る等の効果も
期待することができる。 【0072】尚、本発明は上述した実施形態に限定され
るものではない。ここでは英語文からの日本語文への機
械翻訳について説明したが、他の自然言語間の機械翻訳
にも同様に適用することができる。またここで取扱われ
る非文字データ、およびその非文字データに対する処理
は装置の仕様に応じて定めれば良いものである。要する
に本発明はその要旨を逸脱しない範囲で種々変形して実
施することができる。 【0073】 【発明の効果】本発明によれば、訳文を表示・出力する
とき、原文中のタイトル部分を示す非文字データに従っ
て訳文を構成する文字データ列がタイトル部分が分かる
ように出力される。すなわち、原文中のタイトル部分と
訳文中のタイトル部分を対応させることができる。 【0074】従って原文と訳文との対応関係を明確に示
すことが可能となり、翻訳結果に対する後処理編集に対
する負担を大幅に軽減できる。故に、翻訳編集作業の簡
易化を図り、簡易に効率良く適切な言語表現の訳文を得
ることが可能となる。
率化を図り得る翻訳方法および翻訳装置に関する。 【0002】 【従来の技術】近時、コンピュータを利用して入力原文
を自動的に機械翻訳し、その訳文を求める機械翻訳装置
が注目されている。例えば日本語文を入力してその英訳
文を求めたり、また英語文を入力してその和訳文を求め
たりする自然原語の機械翻訳装置の開発が種々試みられ
ている。 【0003】この種の装置は、基本的には入力原文を形
態解析や構文解析等して、例えば語(語句)等の所定の
処理単位に区分する。そして、上記処理単位毎に翻訳辞
書を検索して各処理単位に対応した訳語(訳語句)を求
め、これらの訳語(訳語句)を所定の訳文規則に従って
結合しその訳文を求める如く構成される。 【0004】 【発明が解決しようとする課題】ところで、従来の機械
翻訳装置では、原文の文書情報を形成する文字データ列
を入力し、これを上述したような手順で翻訳処理して訳
文を生成している。 【0005】この為、入力された文書情報中の文字デー
タのみを抽出して順次機械翻訳処理を実行していくと、
上記文書情報中に含まれていた各種の非文字情報が欠落
してしまい、その翻訳結果が非常にわかり難いものとな
ってしまう。具体的には、例えばフォーマット情報が欠
落すると、翻訳結果である訳文をフォーマット整形する
のに多大な労力を必要とする。またそのパラグラフ情報
が失われた場合には、翻訳文の意味的解釈が非常に困難
になる等の不具合を招来する。 【0006】本発明は、このような事情を考慮してなさ
れたもので、その目的とするところは、原文中に含まれ
る非文字データが示す情報を損うことなく、翻訳結果を
効果的に得ることができる機械翻訳装置を提供すること
にある。 【0007】 【課題を解決するための手段】本発明は、入力された原
文を翻訳辞書部に格納された情報を用いて翻訳部で翻訳
処理し、この翻訳処理により求められた訳文を出力する
翻訳方法において、前記原文を形成する文字データ列と
該原文中のタイトル部分を示す非文字データを含むデー
タ系列を記憶する記憶部から該データ系列を読出し、該
読出したデータ系列に含まれる前記非文字データを検出
し、該検出した前記非文字データを、前記訳文を形成す
る文字データ列の前記データ系列に含まれる該非文字デ
ータの位置と対応する位置に付加して得た、該記訳文を
形成する文字データ列と該訳文中のタイトル部分を示す
非文字データを含むデータ系列を出力することを特徴と
する。また、本発明は、入力された原文を翻訳辞書部に
格納された情報を用いて翻訳部で翻訳処理し、この翻訳
処理により求められた訳文を出力する翻訳装置におい
て、前記原文を形成する文字データ列と該原文中のタイ
トル部分を示す非文字データを含むデータ系列を記憶す
る記憶手段と、この記憶手段から読出されたデータ系列
に含まれる前記非文字データを検出する手段と、この手
段により検出された前記非文字データを、前記訳文を形
成する文字データ列の前記データ系列に含まれる該非文
字データの位置と対応する位置に付加して得た、該記訳
文を形成する文字データ列と該訳文中のタイトル部分を
示す非文字データを含むデータ系列を出力する手段とを
具備することを特徴とする。 【0008】本発明では、翻訳処理が終了し、その翻訳
結果である訳文を表示・出力したとき、原文に付加され
たタイトル部分を示す非文字データに従って訳文を構成
する文字データ列がタイトル部分が分かるように出力さ
れる。すなわち、原文中のタイトル部分と訳文中のタイ
トル部分を対応させることができる。 【0009】従って原文と訳文との対応関係を明確に示
すことが可能となり、翻訳結果に対する後処理編集に対
する負担を大幅に軽減できる。故に、翻訳編集作業の簡
易化を図り、簡易に効率良く適切な言語表現の訳文を得
ることが可能となる。 【0010】 【発明の実施の形態】以下、図面を参照して本発明の一
実施形態につき説明する。 【0011】この実施形態は英語文を入力し、これを日
本語に機械翻訳するもので、図1は実施形態装置の概略
構成図である。 【0012】図1において、1はキーボード等からなる
入力部1である。この入力部1を構成するキーボード
は、例えば図2に示すように文字データ入力用のキー群
1aに加えて、翻訳指示用のキー1b、編集用キー群1
c、機能制御キー群1d、前記表示部8におけるカーソ
ル制御用キー群1e等を備えて構成される。 【0013】しかしてこの入力部1等から入力された英
語文は翻訳処理に供せられる原文として原文記憶部2に
格納される。この際、原文を形成する文字データと共に
上記入力部1から入力されるフォーマット情報や文字属
性情報等の非文字データは、非文字データ認識部3にて
認識される。そしてその認識結果に従って、非文字デー
タの情報はその検出箇所近傍の文字データに関連付けら
れて、或いは入力原文を管理する文番号等に関連付けら
れて前記原文記憶部2に記憶される。 【0014】編集制御部4は、上記原文記憶部2に格納
された原文を文番号による管理の下で順に読出し、翻訳
部5に与えている。翻訳部5では、翻訳辞書部6に予め
格納された翻訳処理の為の知識情報を用い、上記原文記
憶部2から読出された原文を順次所定の処理単位で機械
翻訳処理する。 【0015】尚、翻訳辞書部6に格納された知識情報
は、例えば規則・不規則変化辞書6a、単語(訳語)辞
書6b、接続不可能品詞列規則辞書6c、訳文係り受け
辞書6d等からなる。このような知識情報を用いて上記
原文を機械翻訳して求められた訳文である日本語文は、
これを得た原文に対応付け管理されて順次訳文記憶部7
に格納される。 【0016】しかして前記編集制御部3は、上記訳文を
訳文記憶部7に格納するに際して、前記入力原文から認
識された非文字データの情報に従い、この非文字データ
の情報を上記訳文中に展開挿入している。この非文字デ
ータの訳文中への展開挿入は、非文字データ展開部8に
よって行われる。この非文字データ展開部8は、例えば
原文中における非文字データの検出位置に従って、その
文番号に関連付けてフォーマット情報を訳文に付加した
り、下線等の文字属性情報をその原語に対する訳語に対
応付けて付加する等の処理を行うものである。このよう
な非文字データの情報の訳文への展開挿入によって、前
記訳文記憶部7に記憶される訳文に非文字データに関す
る情報が付加されることになる。 【0017】また表示部9は、表示制御部10の制御の
下で前記原文記憶部2に格納された英語文(原文)、お
よび訳文記憶部6に格納された日本語文(訳文)を相互
に対応付けて表示するものである。またこの表示部9に
て、機械翻訳処理に必要な訳語候補の選択情報等も表示
される。この表示部9は、例えば図3に示すように、そ
の表示画面を画面上部の翻訳編集領域9a、画面左側の
原文表示領域9b、および画面右側の訳文表示領域9c
に3分割して構成されている。この原文表示領域9bに
前記原文記憶部2に格納された入力原文が順次表示さ
れ、また訳文表示領域9cには前記訳文記憶部7に格納
された訳文が、例えばその訳文を得た原文に対応してそ
れぞれ横書き表示される。尚、翻訳編集領域9aには、
前述したように前記翻訳辞書部6から検索された翻訳処
理に供せられる訳語候補等の翻訳処理に必要な情報が表
示される。 【0018】このようにして原文とその訳文とが表示部
9に表示されて、その訳文の後編集処理に供される。こ
の後編集処理は、前記入力部1から入力される制御情報
に従って、後述するように、例えば前記翻訳辞書部6に
格納されている知識情報を参照する等して実行される。 【0019】そしてこのような後編集処理が施されて完
成された前記原文(英語文)に対する訳文(日本語文)
は、前記非文字データ展開部8による非文字データ情報
に基く展開処理が施された後、印刷部11にてハードコ
ピー出力される。 【0020】図4はこのように構成された実施形態装置
の基本的な動作シーケンスを示すものである。編集制御
部4はこのような動作シーケンスに従って、翻訳部5か
ら与えられる翻訳終了の情報や前記入力部1から入力さ
れる各種のキー情報を判定し、対話的にその翻訳・編集
処理を制御する。 【0021】即ち、編集制御部4は、翻訳部5における
翻訳処理状態を監視し(ステップA)、翻訳部5におけ
る1つの原文の翻訳処理の完了を検出したとき、その翻
訳処理によって求められた訳文を前記非文字データの情
報に従って展開し、また非文字データの情報を挿入して
前記訳文記憶部7に格納すると共に、その訳文を原文に
対応させて表示部9に表示する(ステップB)。 【0022】また翻訳部5から翻訳処理の完了を示す信
号が与えられない場合には、編集制御部4は前記入力部
1から入力されるキー情報を判定している(ステップ
C,D,E,F)。そしてその入力キー情報が『翻訳指
示キー』である場合(ステップC)、編集制御部4は前
記原文記憶部2に格納された入力原文を翻訳部5に与
え、その翻訳処理を開始させる(ステップG)。 【0023】この翻訳処理は、例えば図5にその処理シ
ーケンスを示すように、先ず翻訳処理対象とする原文の
言語形態を前記規則・不規則変化辞書6aを用いて解析
する(ステップP)。この形態解析によって、例えば活
用変形や語尾変化を生じた原語をその原形(基本形)に
変換する。具体的には過去形や進行形で表現された語を
現在形に変換し、また比較級や最上級で表現された語を
その原形に変換する処理からなる。 【0024】次に上記の如く形態解析された原文の各原
語に対して、前記訳語辞書6bを用いてその品詞情報や
訳語候補等の情報を求める(ステップQ)。この処理
は、上記原語を見出し語として訳語辞書6bを検索する
ことにより行われる。 【0025】しかる後、辞書検索された情報に従ってそ
の訳語候補の接続可能性の検証が行われる(ステップ
R)。この検証は、前記接続不可能品詞列規則6cを参
照して行われ、矛盾のない構文解析結果(訳語候補の品
詞列の並び)が得られるまで繰返して行われる。この構
文解析によって、前記原文を構成する原語の品詞の並び
構造や、その係り受け関係、時制の態様等が求められ
る。 【0026】その後、この構文解析された原文の構造
を、前記訳文係り受け辞書6dを用いて前記訳文の構文
構造に変換し、各原語の訳語候補の並びからなる訳文を
生成する(ステップS)。この際、前記原文の構文解析
結果に従って、各訳語候補を活用変形および語尾変形処
理し、その訳文を適切な言語表現とする。 【0027】このような翻訳処理によって、原文に対す
る訳文が求められる。 【0028】一方、前記図4に戻って、前記入力キー情
報が『文字キー』である場合には(ステップD)、その
文字キーが示す文字コードが入力バッファに格納される
(ステップH)。そして、その文字コードを前記原文記
憶部2に格納し、その文字パターンを前記表示部8に表
示する(ステップI)。この入力バッファに格納された
文字コードの各文字パターン表示によって、前記入力部
1から入力された原文が表示されることになる。 【0029】更に入力キー情報が『編集キー』である場
合には(ステップE)、その編集キーに対応した編集処
理が前記訳文に対して実行される(ステップJ)。同様
にして入力キー情報が『機能キー』である場合には(ス
テップF)、その機能キーに対応して処理が実行される
(ステップK)。 【0030】そしてキー情報の入力がない場合、或いは
入力キー情報が上述した『キー』以外のものである場合
には、その他の処理、例えば前記訳文記憶部6に得られ
た訳文のハードコピー出力等が行われる。 【0031】このような編集制御部3の動作シーケンス
により、例えばオペレータがキーボードの前記文字入力
用キー群1aを操作して文字入力すると、その文字情報
は入力バッファに順次セットされ、翻訳処理に供せられ
る原文として原文記憶部2に順に格納される(ステップ
D,H)。そしてその入力原文が表示部8の前記原文表
示領域8bに表示される(ステップI)。 【0032】しかして文字入力の任意の時点、例えば1
文の入力終了時点で翻訳指示キー1bを操作すると、そ
のキー入力情報に従って上記入力バッファに格納された
入力原文に対する翻訳処理が開始される(ステップC,
G)。そしてその翻訳処理が完了すると、これによって
求められた訳文が前記表示部8の訳文表示領域8cに表
示されることになる(ステップA,B)。 【0033】尚、入力原文の修正等の編集が必要な場合
には、文字入力用キー群1aの操作による原文入力の途
中で、例えば前記カーソル制御キー群1eを操作してそ
の修正箇所にカーソルを合せ、訂正・挿入・削除等の編
集キー群1cを操作することによって、その編集処理が
実行される(ステップE,J)。 【0034】このようにして機械翻訳処理の基本的動作
が制御され、この翻訳処理によって求められた前記原文
に対する訳文が、前記訳文記憶部7に格納されると共
に、その原文に対応して表示される。尚、1つの原文に
対する訳文が複数種類得られた場合には、例えば1つの
訳文だけを表示し、同時に他の訳文が存在する旨を識別
表示するようにすれば良い。 【0035】ここで前記編集キーの指示入力による、上
記訳文に対する翻訳編集処理について簡単に説明する。 【0036】この訳文に対する翻訳編集処理は、前記表
示部9の画面上でカーソルによって指示された語(原
語、原語句、訳語、訳語句)に対し、操作された編集キ
ーに対応した処理を行うことによって実現される。具体
的には、(1) 挿入キーの操作によってカーソル位置の前
に文字を挿入すると、(2) 削除キーの操作によってカー
ソルが指示している範囲の文字列を削除する、 (3) 移
動キーの操作によってカーソルが指示している範囲の文
字列を移動する、 (4) 取消しキーの操作によって上記
各キーによってそれぞれ指定された各編集機能を無効と
する、(5) 係り受けキーの操作によってカーソルが指示
している語句の他の係り受け候補を表示する等の翻訳編
集処理からなる。 【0037】また前述した機能制御キーが操作されると
次のような機能が呈せられ、上述した訳文の翻訳編集に
利用される。即ち、(1) 訳語表示キーが操作されると、
カーソルが指示する訳文中の語に対してその訳語を表示
する、(2) 辞書表示キーが操作されると、後述するよう
にカーソルが指示する原文中の語を見出し語とする翻訳
辞書の内容を表示する、(3) 辞書登録キーが操作される
と、カーソルが指示する文字列を新語・熟語として辞書
登録する、(4) 辞書削除キーが操作されると、辞書登録
された新語・熟語を登録抹消する、 (5) 部分訳キーが
操作されると、カーソルによって指示され、翻訳処理に
失敗した原文に対する部分訳を表示する等の機能によっ
て実現される。 【0038】尚、上述したカーソルによる文字列(語)
等の指示は、前記カーソル移動キーの操作によって表示
画面上でカーソルを移動させつつ、カーソル制御キーに
よってカーソル・サイズを可変する等して行われる。 【0039】このような各種の機能を利用して前述した
訳文に対する訳語修正等の後処理が対話的に行われる。 【0040】以上が本装置が基本的に持つ翻訳処理機能
である。 【0041】ここで本装置が特徴とする非文字データに
対する処理について更に詳しく説明する。 【0042】前記入力部1を介して入力される原文の情
報(文書情報)は、文章自体を構成する文字データと、
フォーマットや文字属性等を示す非文字データとに分け
られる。 【0043】図7はその分類例を示すものである。即
ち、前記入力部1から入力されるデータは、(1) 文書を
構成する文字データ、(2) タブ、改行、改頁、空白、イ
ンデント等の文字データの位置を制御する文字位置制御
データ、(3) 字種、大きさ、下線の有無、網掛け等の文
字の属性に関する文字属性データ、(4) タブの設定位
置、図表領域、用紙サイズ等を特定するレイアウトデー
タ、(5) 原文の前処理編集時に付加され、翻訳処理の手
助けとして用いられる、挿入句指定情報、接続詞のスコ
ープ情報等からなる翻訳補助データとして分類できる。 【0044】ここで文字位置制御データは、通常、文字
データと同様に1つのコード単位に割当てられる。また
文字属性データは、1つのコード単位の数ビットを用い
てその文字属性を表すか、或いはその属性を示すシフト
コードまたコードシーケンスを準備し、このコードを入
力データ系列中に埋め込むことによって表現される。ま
たレイアウトデータは、そのレイアウトを示すコードシ
ーケンスを設定し、これを入力データ系列中に埋め込む
ことによって表現される。 【0045】そして翻訳補助データに関しては、特殊コ
ードまたは文字属性として表現される情報として与える
ことができる。 【0046】このような非文字データに対する表現法
は、装置の仕様に応じて任意に設定できるものである
が、ここでは図7に例示するように、文字位置制御デー
タおよび翻訳補助データをそれぞれコードとして、また
文字属性データを各種文字属性のシフトイン/シフトア
ウトを示すコードとして、更にレイアウトデータを各種
レイアウト情報のコードシーケンスの設定によって与え
るものとする。 【0047】前記非文字データ認識部3は、この図7に
示すようなコードテーブルを備え、図6に示すシーケン
スによって入力データ系列中の非文字データを認識して
いる。 【0048】即ち、先ず入力部1から入力されたデータ
系列を認識部3に読込み(ステップa)、該認識部3に
準備された非文字データ変換規則3aを用いて入力デー
タ系列中の非文字データを認識している。この非文字デ
ータ変換規則3aは、例えば図8に示すように、入力デ
ータ系列に対するパターンを記述した条件部(I)と、
そのパターンに対する変換処理を記述した変換部(II)
とから構成されている。 【0049】このような条件部(I)のパターンを順次
入力データ系列とパターンマッチング処理し(ステップ
b)、パターンマッチング時にこれを非文字をデータの
検出として該非文字データを入力データ系列中に展開し
(ステップc)、前記変換部(II)の情報を出力してい
る(ステップd)。 【0050】具体的には、 X=[abc]…abcをXに代入する {Z}+ …1以上のZの繰返しとのマッチング {Z}* …0以上のZの繰返しとのマッチング Word…その前後を0以上のブランクで挟まれた非ブ
ランク文字とのマッチング 等の規則に従ってデータ系列をパターンマッチングす
る。尚、『直前の文字』なる項目情報は、パターンマッ
チング処理の際の、マッチング開始点に関する情報であ
り、変換パターンは、マッチングの取れたパターンをど
のように置換えるかを指定するものである。 【0051】このような規則によって、例えば C/R 2.1 Software Model C/R C/R なるデータ系列が与えられたとき(ステップa)、最初
のC/Rの次のブランク点をスタートとして、次に出現
するC/Rの位置までのデータ系列がパターンマッチン
グされる(ステップb)。この場合、図8の変換規則の
1番目の条件にパターンマッチングすることから、入力
データ系列は、例えば C/R TS 2.1 Software Model C/R C/R として変換されることになる(ステップc)。尚、ここ
に例示したパターンマッチングは、原文中におけるタイ
トル部分(TS)の検出を示している。 【0052】このようにして非文字データ認識部3で
は、入力データ系列中の非文字データを検出し、必要に
応じて非文字データの削除、非文字データ系列の任意の
記号列への変換、または移動を行い、前記編集制御部4
が想定しているデータ系列体系に変換している。そして
このような非文字データの情報を含む入力原文の情報を
前記原文記憶部2に格納するようにしている(ステップ
d)。 【0053】尚、この非文字データの変換処理について
は、上述したように規則の形で記述することに代えて、
プログラムを用いて直接記述することも可能である。 【0054】ところで前記編集制御部4では、前述した
如く認識された非文字データを次のようにして取扱って
いる。 【0055】この編集制御部4では、非文字データに関
して、その内容に応じて表示画面上に表示するか否かを
制御し、また翻訳部5に送る文字データにその非文字デ
ータの情報を付加するか否かを制御している。更には、
翻訳結果である訳文を出力する際に、その文字データ列
に上記非文字データの情報を付加するか否かを制御して
いる。 【0056】図10はこのような非文字データに対する
処理の例を示すものである。即ち、ここでは、例えばそ
の非文字データの情報が『文開始』を示す場合、原文表
示および訳文表示に関しては、その文番号を生成し、こ
れを表示するような制御が行われる。また非文字データ
の情報が『改行』を示す場合には、その文末に改行マー
クを付加して表示するように制御される。更に原文に対
する接続詞のスコープ情報が与えられた場合には、これ
を原文の該当箇所に付加して翻訳部5に与えている。 【0057】編集制御部4では、このようにしてその非
文字データの種類に応じて、該非文字データの情報の表
示等を制御している。 【0058】尚、図10に示す処理内容には、字種、サ
イズ、下線等の文字属性に対する処理については示して
いないが、例えば実際の表示画面上でそのまま文字属性
を反映した文字パターンの表示を行わせたり、或いはイ
タリックシフトのように、その属性記号として表示する
ようにすれば十分である。 【0059】尚、ここに示される処理の形態は、装置の
仕様に応じて設定されるものである。従ってここに例示
されない他の非文字データの情報についても、例えば同
様な手法によって原文表示、訳文表示、翻訳部への転送
等を行うようにすれば良い。またこの例では、レイアウ
トデータについては、表示画面上に表示しないようにし
ているが、その情報を他のデータと共に表示させること
も勿論可能である。 【0060】更にこの実施形態では対話的な処理を想定
して上述した如き処理を設定しているが、バッチ的に一
括翻訳処理を行うような場合には、別の非文字データ処
理内容を設定することも勿論可能である。 【0061】またこの編集制御部4では、このような非
文字データに関する処理制御に加えて、非文字データの
修正処理が行われる。この修正処理は、前記入力部1か
らの入力信号に応じてカーソルを表示画面上の任意の位
置に移動させ、そのカーソル位置、或いはその前後の位
置に非文字データを挿入したり、またその位置に存在す
る非文字データを削除したりする処理からなる。この非
文字データに関する編集処理は、文字データに対する編
集処理と同様に行われる。 【0062】この処理によって、例えば接続詞スコープ
等の翻訳補助データを原文に付け加え、その翻訳処理を
容易ならしめる等の作業が行われる。 【0063】さて、このような編集制御部4の制御の下
で、前記非文字データ展開部8における非文字データの
展開・挿入は次のようにして行われる。この非文字デー
タの展開・挿入処理は、例えば図9に示すようなコード
認識変換テーブルの情報を用いて行われる。 【0064】この変換テーブルは、翻訳結果の出力機器
に応じて、非文字データに対してどのような出力データ
を得るかについて記述したものである。そしてその非文
字データの種類(性質)に応じて原文および訳文を形成
する文字データの出力形式が制御されるようになってい
る。 【0065】例えば訳文の文末にパラグラフ終了コード
PGが存在するとき、『0A0D0A0D』なるコード
を出力して、その文末の後に2行分の空白行が設けられ
るようにしている。つまり『0A』によるシリアルプリ
ンタのラインフィードと、『0D』によるキャリッジリ
ターンを繰返し指示し、その訳文を形成する文字データ
系列の印字出力を制御するようにしている。 【0066】このような非文字データの情報に基く文字
データ系列の出力制御によって、その訳文出力の形式が
原文を反映して制御される。 【0067】尚、このようなコード変換は、非文字デー
タの情報と出力機器の制御コードとに従って定められる
ことは云うまでもない。 【0068】かくしてこのような非文字データに対する
処理機能を備えた本装置によれば、例えば第11図
(a)に示すような英語文が翻訳処理に供せられる原文
として入力されると、そのデータ系列中に含まれる非文
字コードを認識処理し、そのコード変換によって、例え
ば第11図(b)に示すような形式の非文字データの情
報含む原文データが原文記憶部2に得られる。図11
(b)において、TSがタイトル部分を示す非文字デー
タである。 【0069】この原文中の非文字データの情報に従って
原文の翻訳処理が制御される。そして、この翻訳処理に
よって求められた訳文に上記非文字データの情報が付加
され、例えば第11図(c)に示すようなデータ系列と
して訳文記憶部7に格納される。 そして、前記原文お
よび訳文にそれぞれ付加された非文字データの情報が前
記非文字データ展開部8にて展開され、入力原文とその
訳文とが、例えば第12図に示すように表示されること
になる。即ち、原文のパラグラフ情報がその表示文に付
加され、また下線等の文字属性情報に従ってその文字の
表示形態が制御される等して、翻訳結果が表示されるこ
とになる。 【0070】故に、本装置によれば、原文の文書情報と
して与えられる非文字データの情報がそのまま翻訳文の
表示・出力に反映されることになり、原文と訳文との対
応関係を明確に把握することが可能となる。従って、そ
の翻訳編集処理を容易に行うことが可能となり、訳文の
フォーマット整形等が不要となることから、オペレータ
に対する負担を大幅に軽減することが可能となる等の実
用上多大なる効果が奏せられる。 【0071】しかも、非文字データである翻訳補助デー
タによって翻訳処理を効果的に支援することが可能とな
るので、翻訳処理効率自体の向上も図り得る等の効果も
期待することができる。 【0072】尚、本発明は上述した実施形態に限定され
るものではない。ここでは英語文からの日本語文への機
械翻訳について説明したが、他の自然言語間の機械翻訳
にも同様に適用することができる。またここで取扱われ
る非文字データ、およびその非文字データに対する処理
は装置の仕様に応じて定めれば良いものである。要する
に本発明はその要旨を逸脱しない範囲で種々変形して実
施することができる。 【0073】 【発明の効果】本発明によれば、訳文を表示・出力する
とき、原文中のタイトル部分を示す非文字データに従っ
て訳文を構成する文字データ列がタイトル部分が分かる
ように出力される。すなわち、原文中のタイトル部分と
訳文中のタイトル部分を対応させることができる。 【0074】従って原文と訳文との対応関係を明確に示
すことが可能となり、翻訳結果に対する後処理編集に対
する負担を大幅に軽減できる。故に、翻訳編集作業の簡
易化を図り、簡易に効率良く適切な言語表現の訳文を得
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る機械翻訳装置の概略
構成図 【図2】同実施形態におけるキーボードの構成例を示す
図 【図3】同実施形態における表示画面の例を示す図 【図4】同実施形態における基本的な動作シーケンスを
示す図 【図5】同実施形態における翻訳処理シーケンスを示す
図 【図6】同実施形態における非文字データの認識処理シ
ーケンスの例を示す図 【図7】同実施形態における入力データの分類例を示す
図 【図8】同実施形態における非文字データの認識変換規
則の例を示す図 【図9】同実施形態における非文字データの出力変換例
を示す図 【図10】同実施形態における非文字データに対する出
力制御の例を示す図 【図11】同実施形態における非文字データの取扱い例
を示す図 【図12】同実施形態における翻訳結果の出力表示例を
示す図 【符号の説明】 1…入力部 2…原文記憶部 3…非文字データ認識部 4…編集制御部 5…翻訳部 6…翻訳辞書部 7…訳文記憶部 8…非文字データ展開部 9…表示部 10…表示制御部 11…印刷部
構成図 【図2】同実施形態におけるキーボードの構成例を示す
図 【図3】同実施形態における表示画面の例を示す図 【図4】同実施形態における基本的な動作シーケンスを
示す図 【図5】同実施形態における翻訳処理シーケンスを示す
図 【図6】同実施形態における非文字データの認識処理シ
ーケンスの例を示す図 【図7】同実施形態における入力データの分類例を示す
図 【図8】同実施形態における非文字データの認識変換規
則の例を示す図 【図9】同実施形態における非文字データの出力変換例
を示す図 【図10】同実施形態における非文字データに対する出
力制御の例を示す図 【図11】同実施形態における非文字データの取扱い例
を示す図 【図12】同実施形態における翻訳結果の出力表示例を
示す図 【符号の説明】 1…入力部 2…原文記憶部 3…非文字データ認識部 4…編集制御部 5…翻訳部 6…翻訳辞書部 7…訳文記憶部 8…非文字データ展開部 9…表示部 10…表示制御部 11…印刷部
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 安達 久博
神奈川県川崎市幸区小向東芝町1番地
株式会社東芝総合研究所内
(72)発明者 天野 真家
神奈川県川崎市幸区小向東芝町1番地
株式会社東芝総合研究所内
(72)発明者 河田 勉
神奈川県川崎市幸区小向東芝町1番地
株式会社東芝総合研究所内
(56)参考文献 特開 昭61−228572(JP,A)
特開 昭58−101365(JP,A)
特開 昭61−15274(JP,A)
特開 昭61−282965(JP,A)
Claims (1)
- (57)【特許請求の範囲】 1.入力された原文を翻訳辞書部に格納された情報を用
いて翻訳部で翻訳処理し、この翻訳処理により求められ
た訳文を出力する翻訳方法において、 前記原文を形成する文字データ列と該原文中のタイトル
部分を示す非文字データとを含むデータ系列を記憶する
記憶部から該データ系列を読み出し、 読み出されたデータ系列に含まれる前記非文字データを
検出し、 検出された非文字データを、前記原文のデータ系列に含
まれる該非文字データの位置と対応する前記訳文中の文
字データ列の位置に付加し、 該非文字データが付加された訳文中のタイトル部分に対
して、前記非文字データに基づく表示制御を行い、該訳
文を出力する ことを特徴とする翻訳方法。2. 非文字データに基づくタイトル部分の表示制御は、
字種、サイズ、下線、イタリックシフトであることを特
徴とする請求項1記載の翻訳方法。 3.入力された原文を翻訳辞書部に格納された情報を用
いて翻訳部で翻訳処理し、この翻訳処理により求められ
た訳文を出力する翻訳装置において、 前記原文を形成する文字データ列と該原文中のタイトル
部分を示す非文字データとを含むデータ系列を記憶する
記憶手段と、 この記憶手段から読み出されたデータ系列に含まれる前
記非文字データを検出する手段と、この手段により検出された前記非文字データを、前記原
文のデータ系列に含まれる該非文字データの位置と対応
する前記訳文中の文字データ列の位置に付加する手段
と 、この手段により前記非文字データが付加された訳文中の
タイトル部分に対して、前記非文字データに基づく表示
制御を行い、訳文を出力する表示制御手段 とを具備する
ことを特徴とする翻訳装置。4. 表示制御手段による非文字データに基づくタイトル
部分の表示制御は、字種、 サイズ、下線、イタリックシ
フトであることを特徴とする請求項3記載の翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8328257A JP2924955B2 (ja) | 1996-12-09 | 1996-12-09 | 翻訳方法および翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8328257A JP2924955B2 (ja) | 1996-12-09 | 1996-12-09 | 翻訳方法および翻訳装置 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3323060A Division JP2848729B2 (ja) | 1991-12-06 | 1991-12-06 | 翻訳方法および翻訳装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09171512A JPH09171512A (ja) | 1997-06-30 |
| JP2924955B2 true JP2924955B2 (ja) | 1999-07-26 |
Family
ID=18208206
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8328257A Expired - Lifetime JP2924955B2 (ja) | 1996-12-09 | 1996-12-09 | 翻訳方法および翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2924955B2 (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58101365A (ja) * | 1981-12-14 | 1983-06-16 | Hitachi Ltd | 機械翻訳システム |
-
1996
- 1996-12-09 JP JP8328257A patent/JP2924955B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH09171512A (ja) | 1997-06-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4962452A (en) | Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence | |
| US4831529A (en) | Machine translation system | |
| EP0370774B1 (en) | Machine translation system | |
| JP3220560B2 (ja) | 機械翻訳装置 | |
| JPH0442705B2 (ja) | ||
| JP2848729B2 (ja) | 翻訳方法および翻訳装置 | |
| JPH0442704B2 (ja) | ||
| JP2924955B2 (ja) | 翻訳方法および翻訳装置 | |
| JP2726416B2 (ja) | 翻訳装置及び翻訳方法 | |
| JPH0773185A (ja) | 機械翻訳装置及び方法 | |
| JPS6277676A (ja) | 機械翻訳システム | |
| JPS62211774A (ja) | 機械翻訳システム | |
| JPS62203265A (ja) | 機械翻訳システム | |
| JPH0550778B2 (ja) | ||
| JPS6244872A (ja) | 機械翻訳装置 | |
| JPH07219962A (ja) | キーワード作成装置 | |
| JPS6244876A (ja) | 機械翻訳装置 | |
| JPS6320570A (ja) | 機械翻訳システム | |
| JPH03129562A (ja) | インデックス作成支援装置 | |
| JPS63300361A (ja) | 機械翻訳装置 | |
| JPH0212458A (ja) | 機械翻訳システム | |
| JPH04259057A (ja) | 文書編集方法及び機械翻訳方法 | |
| JPH02140873A (ja) | 機械翻訳システム | |
| JPS62200462A (ja) | 機械翻訳システム | |
| JPS63311479A (ja) | 機械翻訳装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |