JPH1063659A - 文書処理システム - Google Patents

文書処理システム

Info

Publication number
JPH1063659A
JPH1063659A JP8225464A JP22546496A JPH1063659A JP H1063659 A JPH1063659 A JP H1063659A JP 8225464 A JP8225464 A JP 8225464A JP 22546496 A JP22546496 A JP 22546496A JP H1063659 A JPH1063659 A JP H1063659A
Authority
JP
Japan
Prior art keywords
data
character style
style
character
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8225464A
Other languages
English (en)
Inventor
Tadayuki Tsunashima
督之 綱島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8225464A priority Critical patent/JPH1063659A/ja
Publication of JPH1063659A publication Critical patent/JPH1063659A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 表示、印刷出力時に発揮される文字列の修飾
情報であるスタイル情報を変換させる変換情報をユーザ
が容易に入力できる。入力を容易化させても、スタイル
情報に関連した変換を正しく実行できる。 【解決手段】 スタイル情報の名称と、そのスタイル情
報の文書中でのデータ形式との対応関係を記憶している
スタイル情報変換内容記憶手段と、あるスタイルを他の
スタイルに変換したり、あるスタイルによる修飾を取消
したりするための変換情報であってスタイル名称で記述
された変換情報を取込み、取込んだスタイル名称を文書
中でのデータ形式におけるスタイル情報に変換するスタ
イル情報取込手段とを備える。また、文書中でのデータ
形式におけるスタイル情報に変換された変換情報の変換
元に該当する、処理対象文書のスタイル情報を検出し
て、変換情報に従ったスタイル情報の変換を実行するス
タイル変換実行手段を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書処理システムに
関し、例えば、タグ情報を含むハイパーテキスト等の文
書を他の言語に翻訳する機械翻訳システムに適用し得る
ものである。
【0002】
【従来の技術】文書が表示、印刷出力されたときの形式
(表示、印刷出力されたときに発揮する特殊効果;例え
ば下線付与や、文字強調や、文字部を複数に区分する区
切り罫線付与等)を指定するような文字列でなるタグ情
報を含んだ文書を、計算機システムを用いて翻訳する方
式が既に提案されている(例えば、下記文献参照)。こ
の方式は、タグ情報部分を翻訳せずに、タグ情報以外の
文章部分を翻訳し、訳文にもそのタグ情報を残すという
方式である。
【0003】文献『石川直太、檜山正幸共著、「タグ付
き文書の英日機械翻訳支援システム」、CALS Japan '9
4, S2-1』 なお、この明細書においては、タグ情報は、HTML
(Hypertext Markup Language )に準拠して表してい
る。
【0004】
【発明が解決しようとする課題】タグ付文書では、その
文章を構成する字体が下線、太字、斜体、強調等により
修飾されて表示、印刷出力されることが多い。このよう
な文書を翻訳する場合において、上記文献に記載の翻訳
方式を適用した場合、原文データの文字スタイル(別
名、字体修飾、文字修飾、文字属性)をそのまま引き継
いだ翻訳結果(訳文データ)が出力される。
【0005】しかし、原文を構成する原言語と目的言語
とでは、同じ文字スタイルでも、字体自体の違い等から
異なった印象で表示、印刷され、目的言語では異なる文
字スタイルをユーザが望む場合がある。このような要求
に応えるように翻訳結果を整備するためには、ユーザが
翻訳結果を見て一つ一つ後編集により文字スタイルを変
更しなければならず、使い勝手が未だ不十分である。ま
た、後編集によらなければならないため、翻訳作業の効
率を阻害する原因となっている。
【0006】なお、表示、印刷時に発揮する効果の単位
が1文字を単位とした文字スタイル(文字スタイルはい
わゆるインラインタグで規定される)だけでなく、それ
より大きな単位を対象としたスタイルに関しても、原言
語と目的言語とで変更したいことも生じるが、この場合
にも同様な課題が生じる。
【0007】また、タグ付文書以外の文書においても、
文章中の各文字に対して文字スタイル等が指定されるこ
とがあり、上述と同様な課題を生じている。
【0008】さらに、機械翻訳を実行するか否かに拘ら
ず、入力文書の各文字についての文字スタイル等を一括
して変更したいことも生じるが、一々変更操作しなけれ
ばならず、上述と同様に、使い勝手上の課題が存在す
る。
【0009】そのため、スタイル(字体修飾等)の変更
を一括して指定でき、入力文書に対して一括指定された
スタイルの変更を実行できる文書処理システムが望まれ
ている。
【0010】
【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、表示、印刷出力時に発揮される
文字列に対する修飾情報であるスタイル情報を修飾対象
の文字列が伴なうことがある文書を処理する文書処理シ
ステムにおいて、以下の各手段を有することを特徴とす
る。
【0011】すなわち、(1) スタイル情報の名称と、そ
のスタイル情報の文書中でのデータ形式との対応関係を
記憶しているスタイル情報変換内容記憶手段と、(2) あ
るスタイルを他のスタイルに変換したり、あるスタイル
による修飾を取消したりするための変換情報であってス
タイル名称で記述された変換情報を取込み、取込んだス
タイル名称を、スタイル情報変換内容記憶手段の記憶内
容を参照して、文書中でのデータ形式におけるスタイル
情報に変換するスタイル情報取込手段と、(3)スタイル
情報取込手段が取込み、文書中でのデータ形式における
スタイル情報に変換されている変換情報の変換元に該当
する、処理対象文書のスタイル情報を検出して、変換情
報に従ったスタイル情報の変換を実行するスタイル変換
実行手段とを有することを特徴とする。
【0012】このような構成により、表示、印刷出力時
に発揮される文字列に対する修飾情報であるスタイル情
報を変換させる、処理対象文書に対する変換情報をユー
ザが容易に入力でき、このように入力を容易化させて
も、スタイル情報に関連した変換を正しく実行させるこ
とができる。
【0013】
【発明の実施の形態】以下、本発明による文書処理シス
テムを機械翻訳システムに適用した一実施形態を図面を
参照しながら詳述する。
【0014】この実施形態の機械翻訳システムは、例え
ば、入力装置や処理装置や記憶装置(補助記憶装置を含
む)や出力装置を備えたワークステーション等の情報処
理装置上に構築されるが、機能的には図1のブロック図
に示す構成を有する。
【0015】図1において、この機械翻訳システムは、
機能的には、モード判定部101、入力処理部102、
タグ情報抽出部103、翻訳部104、タグ情報合成部
105、文字スタイル変換判定処理部106、出力処理
部107、文字スタイル処理制御部108、入力バッフ
ァ109、タグ情報保持部110、出力バッファ11
1、文字スタイル登録・編集テーブル112、文字スタ
イル変換参照テーブル113及び文字スタイル変換照合
テーブル114から構成されている。
【0016】モード判定部101は、ユーザの指定した
モードの判定を行ない、データの処理を制御する部分で
ある。この実施形態の場合、処理モードには2種類あ
る。すなわち、タグ付文書の翻訳処理を実行する翻訳処
理モードと、タグ付文書中に存在する文字スタイルの変
更を指定するために、その原文データ中の文字スタイル
と変更後の文字スタイルの情報を登録又は編集する文字
スタイル登録・編集処理モードとがある。
【0017】翻訳処理モードが選択されたときには、入
力処理部102へと制御が移り、文字スタイル登録・編
集処理モードが選択されたときには、文字スタイル処理
制御部108に制御が移る。
【0018】入力処理部102は、モード判定部101
の判定に基づき起動し、キーボード等の入力装置から入
力される原文データあるいは外部記憶装置内にある原文
データを管理し、処理が実行されると必要な原文データ
を入力バッファ109に格納し、次段のタグ情報抽出部
103へと必要な原文データを転送するものである。ま
た、入力処理部102は、出力処理部107からの信号
により、次の原文データをタグ情報抽出部103に転送
したり、あるいは処理すべき原文データが存在しないと
きには、モード判定部101に制御を移したりするもの
である。
【0019】タグ情報抽出部103は、入力処理部10
2から出力された原文データを入力し、タグ情報を抽出
分離し、その位置情報と共にタグ情報をタグ情報保持部
110に出力格納し、また、タグ情報が分離されたテキ
ストデータを翻訳部104へ出力するものである。
【0020】なお、文字スタイルに関する情報も、タグ
情報であるので、原文データ中に存在する場合には分離
されるものである。
【0021】翻訳部104は、タグ情報抽出部103か
ら出力されたタグ情報が存在しない原文データを入力
し、ユーザの指定した目的言語へと翻訳し(例えば、英
語から日本語あるいは日本語から英語)、翻訳結果(訳
文データ)をタグ情報合成部105に出力するものであ
る。
【0022】タグ情報合成部105は、翻訳部104か
ら出力された訳文データを入力し、タグ情報保持部11
0から抽出した原文データに付与されていたタグ情報を
もとに、訳文データにタグ情報を付与合成して、そのタ
グ付の訳文データを文字スタイル変換判定処理部106
に出力するものである。
【0023】文字スタイル変換判定処理部106は、後
述するようにタグ情報合成部105から出力された訳文
データを入力し、文字スタイル変換照合テーブル114
から抽出したデータを用いて、ユーザが登録した文字ス
タイルの変更指定した内容を判定し、該当する文字スタ
イルが入力された訳文データ中に存在している場合に
は、ユーザの指定する文字スタイルへと変更し、変更後
の訳文データを出力処理部107に出力するものであ
る。
【0024】出力処理部107は、文字スタイル変換判
定処理部106から出力された訳文データを入力し、出
力バッファ111に格納し、ユーザの指示操作によりデ
ィスプレイ装置に訳文データを表示したり、あるいは外
部記憶装置に訳文データを転送して訳文データを保存し
たりするものである。また、出力処理部107は、訳文
データの格納が完了したときなどに、そのことを入力処
理部102に通知して、次の原文データの入力を起動し
たりするものである。
【0025】文字スタイル処理制御部108は、モード
判定部101の判定に基づき起動され、ユーザが文字ス
タイル登録・編集テーブル112を用いて原文データ中
の文字スタイルの変更指定する内容を登録したり編集し
たりするための処理や、登録された変更指定内容を用い
て文字スタイル変換参照テーブル113を参照し、文字
スタイル変換照合テーブル114にデータをセットした
りする処理を制御するものである。
【0026】文字スタイル登録・編集テーブル112
は、ユーザが原文データ中の文字スタイルを変更指定す
る内容を登録したり編集したりするために用いるテーブ
ルである。このテーブルへの登録又は編集では、ユーザ
はタグ付文書で扱われる特殊な形態を意識せずに、通常
の文字スタイルの名称で登録することができるようにな
されている。例えば、文書データ(原文データ又は訳文
データ)中ではボールド(太字体)はタグ情報文字列
「<B>」、「</B>」で表されるが、この登録・編
集時には、ユーザが文字スタイルの種別名「ボールド」
と入力すれば良いようになされている。文字スタイル登
録・編集テーブル112の構成は、後述する登録例を示
す図3に示している。
【0027】文字スタイル変換参照テーブル113は、
例えば、後述する図2に示す構成を有し、ユーザが文字
スタイル登録・編集テーブル112に登録・編集した原
文データ中の文字スタイルの変更指定内容を、これに対
応するタグ付文書で特殊な形態として扱われる記号(タ
グ情報を規定する文字列)に変換するための情報を格納
しているものである。この文字スタイル変換参照テーブ
ル113の格納データは、文字スタイル処理制御部10
8が、ユーザが文字スタイル登録・編集テーブル112
の格納データに応じたデータを、文字スタイル変換照合
テーブル114にセットする際に参照されるものであ
る。
【0028】文字スタイル変換照合テーブル114は、
例えば、後述する図4に示す構成を有し、ユーザが登録
・編集した文字スタイルの変更指定内容に対応する、タ
グ付文書で特殊な形態として扱われる記号がセットされ
るものである。セットされたデータは、文字スタイル変
換判定処理部106で利用される。
【0029】図2は、上述した文字スタイル変換参照テ
ーブル113の構成例を示す説明図である。
【0030】文字スタイル変換参照テーブル113は、
文字スタイル参照見出し項目113Aと文字スタイル変
換参照見出し項目113Bとから構成されている。
【0031】文字スタイル参照見出し項目113Aに
は、通常の文字スタイルの名称(例えば、「ボール
ド」、「イタリック」、「アンダーライン」等)が格納
されており、文字スタイル変換参照見出し項目113B
には、文字スタイル参照見出し項目113Aのデータに
対応するタグ付文書の中で特殊な形態で用いられる記号
の見出し(例えば、「<B>」、「</B>」等)が格
納されている。
【0032】図3の例では、文字スタイル参照見出し項
目113Aのデータとして、「デフォルト文字」、「ボ
ールド」、「イタリック」、「アンダーライン」、「強
調」、「強い強調」が格納され、これに対応する文字ス
タイル変換参照見出し項目113Bのデータとして、
「デフォルト文字」ではデータがなく、「ボールド」で
は「<B>」と「</B>」、「イタリック」では「<
I>」と「</I>」、「アンダーライン」では「<U
>」と「</U>」、「強調」では「<EM>」と「<
/EM>」、「強い強調」では「<STRONG>」と
「</STRONG>」が格納されている。また、この
中で、「デフォルト文字」とは文字スタイル(字体修
飾)の指定がないものである。なお、「<B>」はその
直後の文字からボールド(太文字)とすることを表すタ
グ情報であり、「</B>」はその直前の文字までボー
ルドとすることを表すタグ情報であり、他の記号(タグ
情報)も同様である。
【0033】図3は、ユーザが原文データ中の文字スタ
イルを変更指定する内容を登録したり編集したりするた
めに用いる文字スタイル登録・編集テーブル112の構
成及びその登録例を示す説明図である。
【0034】文字スタイル登録・編集テーブル112
は、文字スタイル見出し項目112Aと文字スタイル変
換見出し項目112Bとから構成されている。文字スタ
イル見出し項目112Aには、ユーザが入力した原文デ
ータ中の変更したい文字スタイルの名称が格納され、文
字スタイル変換見出し項目112Bには、ユーザが入力
した文字スタイル見出し項目112Aに登録した原文デ
ータ中の変更したい文字スタイルの名称に対応した変更
後の文字スタイルの名称を格納している。
【0035】図3の例では、文字スタイル見出しデータ
として、「イタリック」及び「ボールド」が登録され、
これらのそれぞれに対応する文字スタイル変換見出しデ
ータとして、「ボールド」及び「強調」が登録されてい
る。
【0036】図4は、文字スタイル変換照合テーブル1
14の構成例及び格納内容例を示す説明図である。な
お、図4は、文字スタイル変換参照テーブル113の格
納内容が図2に示す内容であり、文字スタイル登録・編
集テーブル112の格納内容が図3に示す内容である場
合の文字スタイル変換照合テーブル114の格納内容を
示している。
【0037】文字スタイル変換照合テーブル114に
は、図3に示した文字スタイル登録・編集テーブル11
2へのユーザの文字スタイルを変更指定作業が終了した
ときに、文字スタイル処理制御部108が図2に示した
文字スタイル変換参照テーブル113を参照し、ユーザ
が文字スタイル登録・編集テーブル112に登録・編集
した原文データ中の文字スタイルの変更指定内容を、こ
れに対応するタグ付文書で特殊な形態として扱われる記
号に変換したデータがセットされる。
【0038】文字スタイル変換照合テーブル114は、
文字スタイル照合見出し項目114A及び文字スタイル
変換照合見出し項目114Bとから構成されている。
【0039】文字スタイル照合見出し項目114Aに
は、文字スタイル登録・編集テーブル112の文字スタ
イル見出し項目112Aのデータを、文字スタイル変換
参照テーブル113を参照し、タグ付文書の中で特殊な
形態で用いられる記号に変換したデータがセットされ
る。
【0040】一方、文字スタイル変換照合見出し項目1
14Bには、文字スタイル登録・編集テーブル112の
文字スタイル変換見出し項目112Bのデータを、文字
スタイル変換参照テーブル113を参照しタグ付文書の
中で特殊な形態で用いられる記号に変換したデータがセ
ットされる。
【0041】図4の例は、文字スタイル照合見出し項目
114Aには、図3の文字スタイル登録・編集テーブル
112の文字スタイル見出し項目112Aのデータであ
る「イタリック」に対しては、図2の文字スタイル変換
参照テーブル113が参照されて「<I>」及び「</
I>」がセットされ、「ボールド」に対しては「<B
>」及び「</B>」がセットされている。
【0042】また、文字スタイル変換照合見出し項目1
14Bには、図3の文字スタイル登録・編集テーブル1
12の文字スタイル変換見出し項目112Bのデータで
ある「ボールド」に対しては、図2の文字スタイル変換
参照テーブル113が参照されて「<B>」及び「</
B>」がセットされ、「強調」に対しては「<EM>」
及び「</EM>」がセットされている。
【0043】以下、この実施形態の特徴的な処理を実行
する文字スタイル処理制御部108及び文字スタイル変
換判定処理部106の動作を順に説明する。
【0044】ここで、図5及び図6は、文字スタイル処
理制御部108の処理フローチャートである。
【0045】上述したように、文字スタイル処理制御部
108は、大きく言えば、モード判定部101の判定に
基づき起動され、ユーザが文字スタイル登録・編集テー
ブル112を用いて原文データ中の文字スタイルを変更
指定する内容を登録したり編集したりするための処理
や、作成された情報を用いて文字スタイル変換参照テー
ブル113を参照し、文字スタイル変換照合テーブル1
14にデータをセットする処理を制御し、一連の処理が
終了するとモード判定部101に制御を戻す。
【0046】ユーザにより文字スタイル登録・編集処理
モードが指定されると、モード判定部101がこのモー
ドを判定し、文字スタイル処理制御部108による制御
を起動し、このとき、文字スタイル処理制御部108は
図5及び図6に示す一連の処理を開始する。
【0047】まず、文字スタイル登録・編集テーブル1
12から、存在する文字スタイル登録・編集テーブルデ
ータを抽出し、ユーザが新たに文字スタイルデータを登
録又は編集できるように表示する(ステップ100
1)。
【0048】その後、ユーザとのインタラクティブなデ
ータ授受を通じて、表示された文字スタイル登録・編集
テーブルデータに対し、ユーザに原文データ中の文字ス
タイルを変更指定する情報の登録・編集作業を実行さ
せ、その登録・編集作業を完了まで導き、ユーザからの
完了命令を受信すると、次のステップ1004へと制御
を移す(ステップ1002、1003)。なお、上述し
たように、このテーブルへの登録・編集作業において
は、ユーザはタグ付文書で扱われる特殊な記号形態を意
識せずに、通常の文字スタイルの名称で作業を行なうこ
とができる。
【0049】次のステップ1004では、登録・編集作
業を終了した文字スタイル登録・編集テーブルデータを
文字スタイル登録・編集テーブル112に保存する。
【0050】その後、保存した文字スタイル登録・編集
テーブル112のデータと文字スタイル変換参照テーブ
ル113の文字スタイル参照見出し項目113Aのデー
タとを照合し(ステップ1005)、その照合結果を確
認し、文字スタイル登録・編集テーブル112のデータ
が文字スタイル参照見出し項目113Aのデータに該当
しているか判定する(ステップ1006)。
【0051】判定した結果、該当するデータが存在しな
い文字スタイル登録・編集テーブル112のデータが1
個でもあると(そのデータにマッチする文字スタイル参
照見出し項目113Aのデータがなければ)、対象とす
る文字スタイル登録・編集テーブル112のデータを削
除し(ステップ1007)、ステップ1001に制御を
移し、文字スタイル参照見出し項目113Aに存在しな
いデータが空の表項目となった文字スタイル登録・編集
テーブル112から文字スタイル登録・編集テーブルデ
ータを抽出して表示させ、ユーザに正しいデータの登録
を促し、以下、ステップ1002〜1006へと進み、
同様の判定が行なわれ、文字スタイル登録・編集テーブ
ル112のデータが全てマッチするまでかかる処理ルー
プを繰返す。
【0052】文字スタイル登録・編集テーブル112の
全てのデータ(スタイル名)が文字スタイル参照見出し
項目113Aのデータに該当している場合には、ステッ
プ1004で保存した文字スタイル登録・編集テーブル
112のデータから1個の未抽出データの抽出動作を行
ない(ステップ1008)、未抽出データが存在するか
否かを判定する(ステップ1009)。
【0053】ステップ1008の未抽出データの抽出動
作は、ステップ1008〜ステップ1012である処理
ループが繰返される毎に1回ずつ行なわれるが、その各
回で抽出する未抽出データの抽出順番は、例えば、以下
の通りである。
【0054】まず、文字スタイル登録・編集テーブル1
12の文字スタイル見出し項目112Aのデータから先
に抽出し、次に、このステップ1008に制御が移った
ときには抽出した文字スタイル見出し項目112Aのデ
ータに対応する文字スタイル変換見出し項目112Bの
データを抽出し、その次は文字スタイル見出し項目11
2Aの次のデータというように変化する。
【0055】文字スタイル登録・編集テーブル112か
ら未抽出データが抽出できなければ(全てのデータを抽
出して処理済であって未抽出データが存在しなけれ
ば)、文字スタイル処理制御部108は一連の処理を終
了する。
【0056】これに対して、文字スタイル登録・編集テ
ーブル112から未抽出データが抽出できた場合には、
抽出したデータ(文字スタイル名)と、文字スタイル変
換参照テーブル113の文字スタイル参照見出し項目1
13Aのデータ(文字スタイル名)との照合を行なう
(ステップ1010)。その後、マッチした文字スタイ
ル参照見出し項目113Aのデータ(文字スタイル名)
に対応する文字スタイル変換参照見出し項目113Bの
データ(タグ)を抽出し、対象データ(文字スタイル
名)を抽出したデータ(タグ情報)に置換する(ステッ
プ1011)。
【0057】そして、置換された対象とするデータ(タ
グ情報)を文字スタイル変換照合テーブル114中の文
字スタイル照合見出し項目114A又は文字スタイル変
換照合見出し項目114Bにセットし(ステップ101
2)、上述したステップ1008に戻る。
【0058】ここで、文字スタイル変換照合テーブル1
14中にセットする順番は、文字スタイル登録・編集テ
ーブル112からデータを抽出する順番と対応してお
り、例えば、以下の通りである。
【0059】最初に文字スタイル照合見出し項目114
Aにセットし、次にステップ1012にきたときには、
データを文字スタイル変換照合見出し項目114Bにセ
ットし、その次にステップ1012にきたときには、デ
ータを文字スタイル照合見出し項目114Aにセット
し、以下、項目114B及び114Aを交互に切り替え
るいうような順番である。
【0060】これにより、文字スタイル登録・編集テー
ブル112の文字スタイル見出し項目112Aから抽出
したデータの置換データは、文字スタイル変換照合テー
ブル114の文字スタイル照合見出し項目114Aにセ
ットされ、文字スタイル登録・編集テーブル112の文
字スタイル変換見出し項目112Bから抽出したデータ
の置換データは、文字スタイル変換照合テーブル114
の文字スタイル照合見出し項目114Aに対応して文字
スタイル変換照合見出し項目114Bにセットされる。
【0061】上述したステップ1008〜ステップ10
12でなる処理ループは、文字スタイル登録・編集テー
ブル112に存在するデータ数だけ繰り返され、文字ス
タイル登録・編集テーブル112から抽出される未抽出
データが存在しなくなれば、文字スタイル処理制御部1
08は一連の処理を終了する。
【0062】次に、以上のようにしてセットされた文字
スタイル変換照合テーブル114の格納内容を適宜利用
する文字スタイル変換判定処理部106の動作を、図面
を参照しながら説明する。
【0063】ここで、図7及び図8が、文字スタイル変
換判定処理部106の処理フローチャートである。例え
ば、タグ情報合成部105からはタグ付の訳文データが
1文ずつ出力される場合には、図7及び図8の処理は、
ある1文に対する処理を示している。
【0064】文字スタイル変換判定処理部106は、大
きく言えば、タグ情報合成部105から出力されたタグ
付訳文データを入力し、文字スタイル変換照合テーブル
114から抽出した文字スタイル変換用のデータを用い
て、ユーザが登録した文字スタイルの変更指定した内容
を判定し、訳文データに該当する文字スタイル(タグ)
が存在している場合には、ユーザの指定する文字スタイ
ルへと変更し、その変更後のデータ(変更が不要な場合
にはタグ情報合成部105から出力されたデータ)を出
力処理部107へ出力する処理を制御するように動作す
る。
【0065】文字スタイル変換判定処理部106は、図
7及び図8に示す処理を開始すると、まず、タグ情報合
成部105から出力されたタグ付の訳文データを読み込
む(ステップ2001)。
【0066】その後、文字スタイル変換照合テーブル1
14の文字スタイル照合見出し項目114Aから1デー
タ(文字スタイルに係るタグ情報)を抽出しようとする
(ステップ2002)。なお、次にこのステップ200
2に制御が移った場合には、文字スタイル変換照合テー
ブル114の文字スタイル照合見出し項目114Aから
予め定まっている順番に従って次のデータを抽出しよう
とする。
【0067】このような抽出動作を実行すると、この抽
出動作によって未抽出のデータが抽出できたか否か、言
い換えると、文字スタイル変換照合テーブル114の文
字スタイル照合見出し項目114Aに、抽出されていな
いデータが存在するか否かを判定する(ステップ200
3)。
【0068】ここで、抽出動作によっても、未抽出デー
タが取出せなければ(文字スタイル照合見出し項目11
4Aに、抽出されていないデータが存在しなければ)、
後述するステップ2009に進む。
【0069】これに対して、文字スタイル変換照合テー
ブル114の文字スタイル照合見出し項目114Aから
データ(文字スタイルに係るタグ情報)が抽出できる
と、タグ情報合成部105から読み込んだタグ付訳文デ
ータにおける、今回の抽出データ(文字スタイルに係る
タグ情報)に係る文字列を他のデータ(他の文字スタイ
ルに係るタグ情報)に置き換えるためのステップ200
4〜ステップ2008でなる処理ルーチンに移行する。
【0070】かかる処理ルーチンではまず、タグ情報合
成部105から読み込んだタグ付訳文データの先頭側か
ら文字データを抽出し(ステップ2004)、その文字
データの最後の文字データ(文末データ)でないことを
確認しながら(ステップ2005)、訳文データから抽
出したその文字データと、上述したステップ2002で
抽出した文字スタイル変換照合テーブル114の文字ス
タイル照合見出し項目114Aのデータ(文字スタイル
に係るタグ情報)とを照合し(ステップ2006)、マ
ッチし、しかも実行記号が付与されていないものかをを
判定し(ステップ2007)、マッチしなければ、又
は、マッチするが実行記号が付されているならば、上述
したステップ2004に戻って、タグ付訳文データから
次の文字データを抽出する。
【0071】ここで、実行記号とは、後続のステップ2
008の処理において処理の対象となった文字データに
処理実行済みであることを明示するために付与された記
号であり、これにより対象データの処理の競合を排除す
ることが可能となる。すなわち、ステップ2008で置
き換えられた文字データ(例えば「<I>」から「<B
>」)が、その後に入ったステップ2008で置き換え
られる(例えば「<B>」から「<EM>」)ことを防
止するために、最初の置換え時に付与される記号であ
る。
【0072】上述したステップ2004〜ステップ20
07の処理ループを繰返すことにより、ステップ200
2で抽出した文字スタイル変換照合テーブル114の文
字スタイル照合見出し項目114Aのあるデータ(文字
スタイルに係るタグ情報)にマッチする、しかも、実行
記号が付されていない訳文データにおける文字データが
見付かると(ステップ2007で肯定結果)、マッチし
た文字スタイル変換照合テーブル114の文字スタイル
照合見出し項目114Aのデータに対応する文字スタイ
ル変換照合テーブル114の文字スタイル変換照合見出
し項目114Bのデータ(文字スタイルに係るタグ情
報)を抽出し、訳文データのマッチした文字データの部
分と置換すると共に、処理の実行済みであることを明示
するために実行記号を付与する(ステップ2008)。
【0073】この処理が終了したときにも、文末側にま
だマッチする文字データがある可能性があるので、ステ
ップ2004に戻って、次の文字データの抽出を行な
う。
【0074】以上のようにして、ステップ2004〜ス
テップ2007の処理ループ、又は、ステップ2004
〜ステップ2008の処理ループを繰返して、今回のス
テップ2002で文字スタイル変換照合テーブル114
の文字スタイル照合見出し項目114Aから抽出したデ
ータにマッチする、文頭から文末間の全ての文字データ
の置換えを終了したときには、ステップ2005で肯定
結果が得られ、ステップ2002に戻って、文字スタイ
ル変換照合テーブル114から次の未抽出データを抽出
する。
【0075】ここで、文字スタイル変換照合テーブル1
14の文字スタイル照合見出し項目114Aに格納され
ている全てのデータについて上述した処理を繰返し、ス
テップ2002でデータが抽出できなくなると、入力さ
れたデータからステップ2009で付与された実行記号
を除去、出力し(ステップ2009)、一連の処理を終
了する。
【0076】以下、この実施形態の機械翻訳システムに
よる動作を、英文を日本文に翻訳処理する場合として、
例文を用いて具体的に説明する。
【0077】ここでは、以下の英文(以下では、表示、
印刷出力としてではなく、文書データとして示してい
る)が原文データとして入力され、この英文を日本文に
翻訳する場合を説明する。また、英文の「イタリック
体」の部分(「<I>」及び「</I>で挟まれた部
分)を日本文では「ボールド体」の部分(「<B>」及
び「</B>で挟まれた部分)に、英文の「ボールド
体」の部分を日本文では「強調」の部分(「<EM>」
及び「</EM>で挟まれた部分)に変換して訳出させ
るとして説明する。
【0078】原文データ “<I>President
Clinton</I> made a speec
h about <B>the internatio
nnal situation</B>.” ここで、英文の「イタリック体」の部分を日本文では
「ボールド体」の部分に、英文の「ボールド体」の部分
を日本文では「強調」の部分に変換して訳出させるため
に、文字スタイルを変更指定するデータを登録する必要
がある。
【0079】この登録を行なうためには、この実施形態
の機械翻訳システムを起動し、モード判定部101に
て、その原文データ中の文字スタイルと変更後の文字ス
タイルの情報を登録又は編集するモードである文字スタ
イル登録・編集処理モードを選択することにより行な
う。文字スタイル登録・編集処理モードが選択される
と、文字スタイル処理制御部108に制御が移る。
【0080】文字スタイル処理制御部108では、ステ
ップ1001において、文字スタイル登録・編集テーブ
ル112から、存在する文字スタイル登録・編集テーブ
ルデータを抽出し、ユーザが文字スタイルの変更指定デ
ータを登録又は編集できるように表示する。
【0081】次に、ステップ1002で、表示された文
字スタイル登録・編集テーブル112のデータに対し、
ユーザが文字スタイル変更指定データを登録・編集する
作業を行なう。この例では、文字スタイル登録・編集テ
ーブル112の文字スタイル見出し項目112Aに「イ
タリック」、「ボールド」というデータを登録し、文字
スタイル変換見出し項目112Bに、文字スタイル見出
し項目112Aに登録したデータに対応させて変換後の
文字スタイルである「ボールド」、「強調」というデー
タを登録する。登録された状態は、上述した図3に示す
ようになる。
【0082】次に、ステップ1003で、ユーザがステ
ップ1002の登録・編集作業を完了し、完了命令をシ
ステムに指定すると、文字スタイル処理制御部108が
受信し、次のステップ1004へと制御を移す。このス
テップ1004では、登録・編集作業を終了した文字ス
タイル登録・編集テーブルのデータを文字スタイル登録
・編集テーブル112に保存する。
【0083】次に、ステップ1005で、ステップ10
04で保存した文字スタイル登録・編集テーブル112
のデータ(文字スタイル名)と文字スタイル変換参照テ
ーブル113の文字スタイル参照見出し項目113Aの
データと照合する処理を行ない、ステップ1006で、
照合結果を確認し、文字スタイル登録・編集テーブル1
12のデータが文字スタイル参照見出し項目113Aの
データに該当しているか否かを判定する。
【0084】判定した結果、該当するデータが存在しな
ければマッチするデータが存在しないので、ステップ1
007に進み、対象とする文字スタイル登録・編集テー
ブル112のデータを削除し、ステップ1001に制御
を移す。
【0085】例えば、ユーザが「イタリック」と登録す
べきところを誤って「イタリク」と登録したならば、ス
テップ1006で文字スタイル参照見出し項目113A
のデータにマッチするデータが存在しないので、ステッ
プ1007に進み、「イタリク」と登録されたデータを
文字スタイル登録・編集テーブル112から削除し、ス
テップ1001に制御が戻ることになる。制御が戻った
ステップ1001では、文字スタイル参照見出し項目1
13Aに存在しないデータが空の表項目となった文字ス
タイル登録・編集テーブル112から、文字スタイル登
録・編集テーブルが抽出表示されるので、図9(A)に
示すような文字スタイル登録・編集テーブルが表示され
ることになる。
【0086】これにより、ユーザは文字スタイル登録・
編集テーブル112への登録・編集作業に際し、誤った
データを登録・編集したこと、あるいは、システムの指
定可能な範囲を認識することが可能となり、この空白の
表項目は次のステップ1002で修正して再度登録した
り、そのデータ登録を抹消したりすることになる。
【0087】以下、ステップ1003〜1006へと進
み、同様の判定が行なわれ、文字スタイル登録・編集テ
ーブル112のデータが文字スタイル参照見出し項目1
13Aのデータとマッチすれば、ステップ1008に進
む。
【0088】今回の例は、英文の「イタリック体」の部
分を日本文では「ボールド体」の部分に、英文の「ボー
ルド体」の部分を日本文では「強調」の部分に変換して
訳出させるために、文字スタイルを変更指定するデータ
を登録するので、正しく登録した場合には、図3に示す
ようになり、図2に示す文字スタイル変換参照テーブル
113の文字スタイル参照見出し項目113Aのデータ
とマッチし、ステップ1008に進むことになる。
【0089】ステップ1008では、ステップ1004
で保存した文字スタイル登録・編集テーブル112のデ
ータを抽出する処理を行なう。未抽出データを抽出する
順番は、上述した通り、文字スタイル見出し項目112
Aのデータと、文字スタイル変換見出し項目112Bの
データとを交互に抽出する順番とする。
【0090】従って、今回の例では、文字スタイル登録
・編集テーブル112の文字スタイル見出し項目112
Aの最初にあるデータである「イタリック」が抽出さ
れ、次にこのステップ1008に制御が移ったときには
文字スタイル変換見出し項目112Bの最初にあるデー
タ「ボールド」が抽出され、以下、「ボールド」、「強
調」の順で抽出されていく。
【0091】ステップ1009で、文字スタイル登録・
編集テーブル112から抽出したデータの存在を判定
し、存在しなければ、文字スタイル処理制御部108の
処理を終了させるが、最初にステップ1008に入った
直後では、「イタリック」というデータが存在するので
次のステップ1010に進む。
【0092】ステップ1010では、ステップ1008
で抽出したデータと文字スタイル変換参照テーブル11
3の文字スタイル参照見出し項目113Aのデータとの
照合を行なう。ここでは、抽出されたデータは「イタリ
ック」であり、この「イタリック」を、文字スタイル変
換参照テーブル113の文字スタイル参照見出し項目1
13Aのデータと照合する。
【0093】その後、ステップ1011で、ステップ1
010の照合結果を確認し、マッチした文字スタイル参
照見出し項目113Aのデータに対応する文字スタイル
変換参照見出し項目113Bのデータを抽出し、対象と
しているステップ1008で抽出したデータと置換す
る。
【0094】今回の例では、対象とするステップ100
8で抽出したデータは「イタリック」であり、文字スタ
イル変換参照テーブル113の文字スタイル参照見出し
項目113Aにマッチするデータが存在し、対応する文
字スタイル変換参照見出し項目113Bのデータは「<
I>」及び「</I>」であるので、以下、対象データ
を「<I>」と「</I>」に置換する。
【0095】次に、ステップ1012で、対象とするデ
ータを文字スタイル変換照合テーブル114中の文字ス
タイル照合見出し項目114Aと文字スタイル変換照合
見出し項目114Bにセットする。セットする順番は、
最初に文字スタイル照合見出し項目114Aをセット
し、次のデータは文字スタイル変換照合見出し項目11
4Bにセットし、さらに次のデータは文字スタイル照合
見出し項目114Aにセットするというように順次デー
タをセットする。
【0096】これにより、文字スタイル登録・編集テー
ブル112の文字スタイル見出し項目112Aから抽出
したデータは、文字スタイル変換照合テーブル114の
文字スタイル照合見出し項目114Aにセットされ、文
字スタイル登録・編集テーブル112の文字スタイル変
換見出し項目112Bから抽出したデータは、文字スタ
イル変換照合テーブル114の文字スタイル照合見出し
項目114Aに対応して文字スタイル変換照合見出し項
目114Bにセットされることになる。
【0097】今回の例では、ステップ1011で置換さ
れたデータ「<I>」及び「</I>」が、文字スタイ
ル変換照合テーブル114中の文字スタイル照合見出し
項目114Aにセットされる。データがセットされた文
字スタイル変換照合テーブル114の状態を、図9
(B)に示す。
【0098】次に、ステップ1008に制御が移り、文
字スタイル登録・編集テーブル112の文字スタイル変
換見出し項目112Bから次のデータとして「ボール
ド」が抽出され、ステップ1009でデータの存在が判
定され、データが存在するのでステップ1010に進
み、ステップ1010で文字スタイル変換参照テーブル
113の文字スタイル参照見出し項目113Aのデータ
と照合される。
【0099】ステップ1011で、ステップ1010の
照合結果を確認し、マッチした文字スタイル参照見出し
項目113Aのデータに対応する文字スタイル変換参照
見出し項目113Bのデータを抽出し、対象としている
ステップ1008で抽出したデータと置換する。今回の
例では、対象とするステップ1008で抽出したデータ
は「ボールド」であり、文字スタイル変換参照テーブル
113の文字スタイル参照見出し項目113Aにマッチ
するデータが存在し、対応する文字スタイル変換参照見
出し項目113Bのデータは「<B>」及び「</B
>」であるので、対象データ「ボールド」を「<B>」
と「</B>」に置換する。
【0100】次に、ステップ1012で、対象とするデ
ータを文字スタイル変換照合テーブル114中の文字ス
タイル照合見出し項目114Aと文字スタイル変換照合
見出し項目114Bにセットする。今回の例では、ステ
ップ1011で置換されたデータ「<B>」及び「</
B>」が、文字スタイル変換照合テーブル114中の文
字スタイル変換照合見出し項目114Bにセットされ
る。このデータがセットされた文字スタイル変換照合テ
ーブル114の状態は、図9(C)に示すようになる。
【0101】次に、再度ステップ1008に制御が移
り、文字スタイル登録・編集テーブル112からデータ
を抽出し、順次、文字スタイル登録・編集テーブル11
2に存在するデータ数だけステップ1008からステッ
プ1012が繰り返される。
【0102】そして、文字スタイル登録・編集テーブル
112から抽出されるデータが存在しなくなれば、ステ
ップ1009で判定され、文字スタイル処理制御部10
8の処理を終了する。
【0103】今回の例では、最終的に文字スタイル変換
照合テーブル114は、上述した図4に示すようにな
る。
【0104】文字スタイル処理制御部108の処理が終
了すると、モード判定部101に制御が戻る。このとき
に、登録した文字スタイルの変更指定データを確認した
り、あるいは登録した文字スタイルの変更指定データを
修正する場合には、文字スタイル登録・編集処理モード
を選択する。また、登録した文字スタイルの変更指定デ
ータを反映させ、タグ付文書の翻訳処理を実行する場合
には、翻訳処理モードを選択する。
【0105】以下、上述した文字スタイル処理制御部1
08の処理が終了したときに、翻訳処理モードが選択さ
れた場合について説明する。
【0106】翻訳処理モードが選択されると、入力処理
部102に制御が移る。翻訳対象となる画面表示された
英文は“President Clinton mad
ea speech about the inter
nationnal situation.”であり、
“President Clinton”の部分がイタ
リック体の文字スタイルで、“the interna
tionnal situation”の部分がボール
ド体の文字スタイルで画面表示されている。しかし、入
力処理データとしては文書が印刷された時の形式を指定
するようなタグを含んだ文書データであり、上述したよ
うに、“<I>PresidentClinton</
I> made a speech about <B
>the internationnal situa
tion</B>.”となっている。この文書データが
入力処理部102の入力データとなり、入力バッファ1
09に格納され、次段のタグ情報抽出部103に渡され
る。
【0107】なお、入力バッファ中に複数の文が格納さ
れており、処理対象文が全て処理されると、モード判定
部101に制御が戻る。
【0108】入力英文は、詳述は避けるが、タグ情報抽
出部103、翻訳部104、タグ情報合成部105を順
次介することにより、「<I>クリントン大統領</I
>が<B>国際状勢</B>について演説した。」とい
うタグ付の日本文に変換されてタグ情報合成部105か
ら出力され、文字スタイル変換判定処理部106へ入力
される。
【0109】文字スタイル変換判定処理部106では、
ステップ2001でタグ情報合成部105から出力され
たデータを読み込む。
【0110】ステップ2002で、文字スタイル変換照
合テーブル114の文字スタイル照合見出し項目114
Aから1データを抽出する。また、次にこのステップ2
002に制御が移った場合には、次のデータが順次抽出
される。今回の例では、文字スタイル変換照合テーブル
114は、図4に示すようになっている。最初のステッ
プ2002の処理では、文字スタイル照合見出し項目1
14Aから先頭にあるデータ「<I>」が抽出される。
【0111】次に、ステップ2003で、ステップ20
02で抽出した文字スタイル照合見出し項目114Aの
データが存在するか否かを判定し、存在しなければステ
ップ2009に進み、抽出した文字スタイル照合見出し
項目114Aのデータが存在すれば、次のステップ20
04に進むことになる。今回の例では、データ「<I
>」が存在するので、次のステップ2004に進み、ス
テップ2001で読み込んだデータ「<I>クリントン
大統領</I>が<B>国際状勢</B>について演説
した。」の先頭から文字データが抽出され、ステップ2
005で文末の有無が判定されるまで文字データの抽出
が行なわれる。
【0112】抽出された文字データは、ステップ200
6で、ステップ2002で抽出した文字スタイル変換照
合テーブル114の文字スタイル照合見出し項目114
Aのデータ「<I>」と照合され、ステップ2007
で、その照合処理が判定され、マッチしていて実行記号
の付与されていない文字データが存在すれば、次のステ
ップ2008へと進む。入力データ「<I>クリントン
大統領</I>が<B>国際状勢</B>について演説
した。」には文字スタイル照合見出し項目114Aのデ
ータ「<I>」が一つ存在し、しかも実行記号が付与さ
れていないので、ステップ2007で1回だけマッチす
ることが判定され、ステップ2008に進む。
【0113】ステップ2008では、マッチした文字ス
タイル変換照合テーブル114の文字スタイル照合見出
し項目114Aのデータ「<I>」に対応する文字スタ
イル変換照合テーブル114の文字スタイル変換照合見
出し項目114Bのデータ「<B>」が文字スタイル変
換照合テーブル114から抽出され、入力データ「<I
>クリントン大統領</I>が<B>国際状勢</B>
について演説した。」の中でマッチした文字列データと
置換され、処理の実行済みであることを明示する実行記
号が付与される。すなわち、置換処理の結果、「*<B
>クリントン大統領</I>が<B>国際状勢</B>
について演説した。」というデータが生成される。ここ
で、「*」は実行記号を表している。
【0114】次に、ステップ2004へと進み、次の文
字データの抽出が行なわれるが、マッチする文字列デー
タが存在しないので、文末まで抽出し、ステップ200
5で文末と判定され、ステップ2002に進む。
【0115】この2回目のステップ2002では文字ス
タイル変換照合テーブル114の文字スタイル照合見出
し項目114Aから次のデータ「</I>」の抽出が行
なわれ、以下、ステップ2003〜ステップ2007へ
と進み、入力データ中にマッチするデータの存在が判定
され、ステップ2008で置換処理及び実行記号付与処
理が行なわれ、「*<B>クリントン大統領*<?/B
>が<B>国際状勢</B>について演説した。」とい
うデータが生成される。
【0116】次に、ステップ2004へと進み、次の文
字データの抽出が行なわれるが、マッチする文字列デー
タが存在しないので、ステップ2005で文末と判定さ
れ、ステップ2002に進む。
【0117】この3回目のステップ2002では文字ス
タイル変換照合テーブル114の文字スタイル照合見出
し項目114Aから次のデータ「<B>」が抽出され、
以下、ステップ2003〜ステップ2007を介し、入
力データ中にマッチするデータの存在が判定され、ステ
ップ2008で置換処理及び実行記号付与処理が行なわ
れ、「*<B>クリントン大統領*</B>が*<EM
>国際状勢</B>について演説した。」というデータ
が生成される。
【0118】次に、ステップ2004へと進み、次の文
字データの抽出が行なわれるが、マッチする文字列デー
タが存在しないので、ステップ2005で文末と判定さ
れ、ステップ2002に進む。
【0119】この4回目のステップ2002では文字ス
タイル変換照合テーブル114の文字スタイル照合見出
し項目114Aから次のデータ「</B>」が抽出さ
れ、以下、ステップ2003〜ステップ2007を介
し、入力データ中にマッチするデータの存在が判定さ
れ、ステップ2008で置換処理及び実行記号付与処理
が行なわれ、「*<B>クリントン大統領*</B>が
*<EM>国際状勢*</EM>について演説した。」
というデータが生成される。
【0120】次に、ステップ2004へと進み、次の文
字データの抽出が行なわれるが、マッチする文字列デー
タが存在しないので、ステップ2005で文末と判定さ
れ、ステップ2002に進む。
【0121】この5回目のステップ2002では、抽出
すべきデータが存在しないのでデータを抽出できず、ス
テップ2003で不存在と判定され、ステップ2009
に進み、ステップ2008で置換処理及び実行記号付与
処理が施された入力データ「*<B>クリントン大統領
*</B>が*<EM>国際状勢*</EM>について
演説した。」から、実行記号を除去する処理が行なわ
れ、最終的に、以下のデータが出力処理部107に出力
される。
【0122】「<B>クリントン大統領</B>が<E
M>国際状勢</EM>について演説した。」 出力処理部107では、文字スタイル変換判定処理部1
06から出力されたデータを入力し、出力バッファ11
1に格納すると共に、入力処理部102に処理の終了メ
ッセージを発信する。また、出力処理部107は、出力
バッファ111のデータをユーザの指示操作によりディ
スプレイ装置に表示したり、あるいは外部記憶装置に転
送して訳文を保存したりする。
【0123】なお、この出力されたデータの画面表示で
は、「クリントン大統領」がボールド体で表示され、
「国際状勢」が強調字体で表示され、ユーザの文字スタ
イルの変更指定通りの結果となる。
【0124】以上のように、上記実施形態によれば、原
文データ中のタグ情報として存在する文字スタイルを、
ユーザの望む形態の文字スタイルへと変換し訳出するに
際し、翻訳処理の実行以前に文字スタイルの変更を一括
して指定でき、また、その指定内容を翻訳結果に反映さ
せることができる。そのため、従来のような翻訳結果を
確認し、文字スタイルの変更を後編集する必要がなく、
タグ付文書の翻訳処理を柔軟に効率良く行なうことでき
る機械翻訳システムを提供でき、効率的な翻訳環境を実
現できるという実用上多大なる効果を奏する。
【0125】なお、上記実施形態においては、文字スタ
イル情報がタグ情報となっているタグ付文書を翻訳する
ものを示したが、文字スタイル情報を有する文書(例え
ば文字の属性値として文字スタイル情報を有する文書)
であれば翻訳対象文書はタグ付文書に限定されない。
【0126】また、上記実施形態においては、文字スタ
イル変換判定処理部を、タグ情報合成部及び出力処理部
間に介挿したものを示したが、文字スタイル変換判定処
理部を、タグ情報抽出部及びタグ情報保持部間や、タグ
情報保持部及びタグ情報合成部間等の他の位置に介挿す
るようにしても良い。
【0127】さらに、上記実施形態においては、文字ス
タイル特殊記号登録・編集テーブルを有するものを示し
たが、これを省略し、ユーザ登録情報が入力されたとき
に、文字スタイルを名称からタグ情報へ変換しながら直
ちに文字スタイル変換照合テーブルに格納させるように
しても良い。この場合、文字スタイルの変換情報の登録
内容を編集させるべく表示させる際にも、文字スタイル
変換照合テーブルから読出したタグ情報をスタイル名へ
変換させることを要する。
【0128】さらにまた、上記実施形態においては、文
字スタイル変換照合テーブルを備えて文字スタイルに関
連する変換情報を文字スタイル登録・編集テーブルに登
録した際に、スタイル名からタグ情報への変換を行なう
ものを示したが、文字スタイル変換照合テーブルを省略
し、文字スタイル変換判定処理部が、文字スタイル特殊
記号処理制御部へデータの取出しやスタイル名からタグ
情報への変換を所定タイミング(ステップ2002、ス
テップ2008)で依頼するものであっても良い。
【0129】また、上記実施形態においては、文字スタ
イル変換判定処理部が文字スタイル変換照合テーブルに
記憶されている文字スタイルの変換内容にマッチする訳
文データの文字データを常に変換するものを示したが、
文字スタイル変換判定処理部による変換動作を実行させ
るか実行させないかを入力装置から選択できるようにし
ても良い。
【0130】さらに、上記実施形態においては、文字を
単位としたスタイル情報(文字スタイル)を変換するも
のを示したが、これより大きい単位を最小単位としたス
タイル種別間の変換にも本発明を適用することができ
る。
【0131】さらにまた、上記実施形態においては、単
独の情報処理装置上に構成したシステムを示したが、ネ
ットワークを介して接続されたシステムの端末装置に本
発明に係るシステムを適用するようにしても良い。例え
ば、タグ記号等を含むテキスト又はハイパーテキスト
が、コンピュータネットワーク上の任意のサーバに存在
し、他の任意のクライアントから検索して、クライアン
ト上に表示するようなシステムにおける機械翻訳システ
ムにおいても適用可能である。
【0132】また、上記実施形態においては、本発明
を、機械翻訳システムに適用したものを示したが、本発
明はこれに限定されず、文字スタイルを含む文書を処理
する他の文書処理システムにも適用することができる。
例えば、文字スタイル情報を含むタグ付文書を要約する
要約システム等にも適用することができる。
【0133】
【発明の効果】以上のように、本発明の文書処理システ
ムによれば、(1) スタイル情報の名称と、そのスタイル
情報の文書中でのデータ形式との対応関係を記憶してい
るスタイル情報変換内容記憶手段と、(2) あるスタイル
を他のスタイルに変換したり、あるスタイルによる修飾
を取消したりするための変換情報であってスタイル名称
で記述された変換情報を取込み、取込んだスタイル名称
を文書中でのデータ形式におけるスタイル情報に変換す
るスタイル情報取込手段と、(3) 文書中でのデータ形式
におけるスタイル情報に変換された変換情報の変換元に
該当する、処理対象文書のスタイル情報を検出して、変
換情報に従ったスタイル情報の変換を実行するスタイル
変換実行手段とを有するので、表示、印刷出力時に発揮
される文字列に対する修飾情報であるスタイル情報を変
換させる、処理対象文書に対する変換情報をユーザが容
易に入力でき、このように入力を容易化させても、スタ
イル情報に関連した変換を正しく実行させることができ
る。
【図面の簡単な説明】
【図1】実施形態の全体構成を示す機能ブロック図であ
る。
【図2】実施形態の文字スタイル変換参照テーブルの構
成例の説明図である。
【図3】実施形態の文字スタイル登録・編集テーブルの
登録例の説明図である。
【図4】実施形態の文字スタイル変換照合テーブルの構
成、登録例の説明図である。
【図5】実施形態の文字スタイル処理制御部の処理フロ
ーチャート(1)である。
【図6】実施形態の文字スタイル処理制御部の処理フロ
ーチャート(2)である。
【図7】実施形態の文字スタイル変換判定処理部の処理
フローチャート(1)である。
【図8】実施形態の文字スタイル変換判定処理部の処理
フローチャート(2)である。
【図9】実施形態の具体的動作の説明に供する図面であ
る。
【符号の説明】
101…モード判定部、102…入力処理部、103…
タグ情報抽出部、104…翻訳部、105…タグ情報合
成部、106…文字スタイル変換判定処理部、107…
出力処理部、108…文字スタイル処理制御部、109
…入力バッファ、110…タグ情報保持部、111…出
力バッファ、112…文字スタイル登録・編集テーブ
ル、113…文字スタイル変換参照テーブル、114…
文字スタイル変換照合テーブル。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 表示、印刷出力時に発揮される文字列に
    対する修飾情報であるスタイル情報を修飾対象の文字列
    が伴なうことがある文書を処理する文書処理システムに
    おいて、 スタイル情報の名称と、そのスタイル情報の文書中での
    データ形式との対応関係を記憶しているスタイル情報変
    換内容記憶手段と、 あるスタイルを他のスタイルに変換したり、あるスタイ
    ルによる修飾を取消したりするための変換情報であって
    スタイル名称で記述された変換情報を取込み、取込んだ
    スタイル名称を、上記スタイル情報変換内容記憶手段の
    記憶内容を参照して、文書中でのデータ形式におけるス
    タイル情報に変換するスタイル情報取込手段と、 上記スタイル情報取込手段が取込み、文書中でのデータ
    形式におけるスタイル情報に変換されている変換情報の
    変換元に該当する、処理対象文書のスタイル情報を検出
    して、上記変換情報に従ったスタイル情報の変換を実行
    するスタイル変換実行手段とを有することを特徴とする
    文書処理システム。
  2. 【請求項2】 上記文書が、表示、印刷出力時の形式を
    規定するタグ情報を含むタグ付文書であることを特徴と
    する請求項1に記載の文書処理システム。
  3. 【請求項3】 上記原言語の文書を目的言語の文書に翻
    訳する翻訳手段をさらに備え、上記特殊記号変換実行手
    段が原言語の文書の段階又は目的言語の文書の段階で、
    スタイル情報に関連した文書部分の変換を実行すること
    を特徴とする請求項1又は2に記載の文書処理システ
    ム。
JP8225464A 1996-08-27 1996-08-27 文書処理システム Pending JPH1063659A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8225464A JPH1063659A (ja) 1996-08-27 1996-08-27 文書処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8225464A JPH1063659A (ja) 1996-08-27 1996-08-27 文書処理システム

Publications (1)

Publication Number Publication Date
JPH1063659A true JPH1063659A (ja) 1998-03-06

Family

ID=16829742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8225464A Pending JPH1063659A (ja) 1996-08-27 1996-08-27 文書処理システム

Country Status (1)

Country Link
JP (1) JPH1063659A (ja)

Similar Documents

Publication Publication Date Title
US6119077A (en) Translation machine with format control
EP0597611B1 (en) Apparatus and Method for Use in Aligning Bilingual Corpora
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH1063659A (ja) 文書処理システム
US5640581A (en) CD-ROM information editing apparatus
JPH1063667A (ja) 文書処理システム
JPH0883280A (ja) 文書処理装置
JPH03233670A (ja) テキストデータ変換方式
JPH09325960A (ja) 文書処理システム
JP3893709B2 (ja) 文字列変換装置および方法、仮名漢字変換装置、文章校正装置並びにそのプログラムを記録した記録媒体
JPH03185559A (ja) 文書整形装置及び文書整形方法
JPH0765005A (ja) 文書速読支援表示装置並びに文書処理装置及びディジタル複写装置
JPH0954775A (ja) 翻訳方法及び機械翻訳装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH08297675A (ja) 翻訳支援装置
JP2924955B2 (ja) 翻訳方法および翻訳装置
JPH1011449A (ja) 文書処理システム
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JPH04330565A (ja) 自然言語処理システム
JPH1097539A (ja) 文書変換装置
JPH0635955A (ja) 機械翻訳装置
JPH0668136A (ja) 機械翻訳システム
JPH07182344A (ja) 機械翻訳装置