JP3898799B2 - 文書変換装置 - Google Patents

文書変換装置 Download PDF

Info

Publication number
JP3898799B2
JP3898799B2 JP14027497A JP14027497A JP3898799B2 JP 3898799 B2 JP3898799 B2 JP 3898799B2 JP 14027497 A JP14027497 A JP 14027497A JP 14027497 A JP14027497 A JP 14027497A JP 3898799 B2 JP3898799 B2 JP 3898799B2
Authority
JP
Japan
Prior art keywords
display
set information
target text
text
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP14027497A
Other languages
English (en)
Other versions
JPH1097539A (ja
Inventor
領一 杉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP14027497A priority Critical patent/JP3898799B2/ja
Publication of JPH1097539A publication Critical patent/JPH1097539A/ja
Application granted granted Critical
Publication of JP3898799B2 publication Critical patent/JP3898799B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は機械翻訳装置や翻訳ソフトウェアなど、ある言語で書かれたテキストデータを他の言語へ翻訳したり、同一言語内である方言で記述されたテキストデータから他の方言のテキストデータへ変換したりする情報処理装置に関し、より詳しくは翻訳前、変換前のテキストデータに付加されている表示属性も含めて翻訳、変換を行う装置に関する。
【0002】
【従来の技術】
近年インターネット等の国際的な通信ネットワークを通じて外国との間でテキストデータを送受する機会が増えている。通常テキストデータはタグ記号とタグ記号を含まないテキスト本体とからなっている。タグ記号は開始タグと終了タグとからなり、開始タグは”<”と”>”の間にタグ名を記入して構成され、終了タグはタグ名の前に”/”が付された構造をしている。タグ名はテキスト本体の書体、文字修飾等の表示属性を示す。タグ名は例えばHTMLにおいては太字で表示する場合はBが、アンダーラインを付す場合はUが、イタリック体で表示する場合はIが夫々用いられる。また、インターネットを通じて送受信されるテキストデータは、前記開始タグとしてアンカータグを用いて、他のファイルへのポインタを示すことができるようになっている。アンカータグは<A HREF=”リンク先文字列”>という形式で記述されている。
【0003】
ところで、インターネット等で外国からテキストデータを受信した場合、外国語で記述されたテキスト本体を母国語へ翻訳する必要があり、そのために機械翻訳装置が利用されている。 従来において機械翻訳装置としては特開平6−44296号公報が知られている。この従来装置は、インターネットなどから受信したソース言語としてのテキストデータをテキスト本体とタグ記号とに分離する分離部と、タグ記号をそれが付されていた単語と関連付けて記憶する記憶部と、テキスト本体に対して辞書引き・形態素解析処理を行う辞書引き・形態素解析処理部と、形態素解析されたテキスト本体に対して構文解析を行う構文解析部と、構文解析の結果を変換してターゲット言語の構造解析木を生成するための変換部と、記憶部の内容を参照してターゲット言語の構造解析木に基づき、タグ記号が挿入されたターゲット言語の翻訳文を生成するための翻訳文生成部とからなっている。
【0004】
【発明が解決しようとする課題】
ところで、上記従来の機械翻訳装置によれば、ソース言語においてタグ記号が付された単語と対応するターゲット言語側単語に対してタグ記号が付されるので、ターゲット言語の表示形態もソース言語の表示形態と同じであり、違和感はないのであるが、時としてタグ記号が単語の中の一部の文字だけに付される場合があり、その場合ソース言語のテキストデータに付されていた表示属性がターゲット言語のテキストデータにおいては無視されてしまい、表示にも反映されなくなるといった問題がある。例えば、ソース言語のテキストデータが”I <B>h</B>ave a pen.”であった場合、ターゲット言語のテキストデータにおいては前記タグ記号が欠落され、”私はペンを持っている。”というテキスト本体だけになってしまうのである。このため、翻訳に不自然さが生じてしまうのである。
【0005】
また、インターネットを通じて受信したテキストデータには既に述べたように他のファイルへのリンクを示すポインタがアンカータグとして含まれているが、この場合もそのアンカータグが単語の中の一部の文字に対して付されていた場合、翻訳語の文書データではそのタグ記号が欠落してしまい、従って翻訳文を用いてはリンク先ファイルへの移行ができない場合も生じている。 以上の問題点はある言語から他の言語への翻訳に伴って生じる問題であるが、同様な問題は同一言語間における一の方言から他の一の方言への変換とかいった文章データの変換に際しても起こり得るものである。
【0006】
従ってこの発明は表示属性が単語相当文字列のうちの一部の文字だけに付されているソーステキストであってもその表示属性を欠落させることなくターゲットテキストの対応する部所に反映表示することのできる文字列処理装置を提供することを主たる目的としている。
【0007】
【課題を解決するための手段】
上記目的を達成するため、本発明はソーステキストからターゲットテキストに変換する文書変換装置であって、ソーステキストを記憶しているソーステキスト記憶手段と、ソーステキスト中の文字修飾及びリンク先ファイルのポインタを含む表示属性とそれが付されている位置との組み合わせである第1の表示組情報を記憶する第1表示組情報記憶手段と、ソーステキストから前記表示属性を除いたテキスト本体をターゲットテキスト本体に変換する変換手段と、変換されたターゲットテキスト本体を記憶するターゲットテキスト記憶手段と、ソーステキスト本体の単語相当の文字列がターゲットテキスト本体中の単語相当の文字列のどれに該当するかの組み合わせを示す変換組情報を記憶する変換組情報記憶手段と、第1表示組情報と変換組情報を検索してターゲットテキスト本体の加工と、 ソーステキスト中の前記表示属性に相当する表示属性をターゲットテキスト中のどの位置に付すべきかを示す第2表示組情報の作成とを行う加工処理手段と、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に、第2表示組情報作成手段から得る第2表示組情報の内容に従って表示属性を付与し、ターゲットテキストを作成するターゲットテキスト作成手段と、作成したテキストを表示する表示手段とを備え、
前記加工処理手段は、第1表示組情報が示す表示属性が付されている位置と変換組情報のソーステキスト側の単語相当文字列を参照して、表示属性がいずれの文字列中の文字に付されているかを一文字毎に検出する表示属性付与範囲検出部と、検出結果に従って表示属性が文字列の一部に付されているか、文字列全体に付されているか判別する判別部と、変換組情報のターゲットテキスト側の単語相当文字列を参照し、前記判別結果を用いてターゲットテキスト本体の加工と第2表示組情報の作成を行う加工処理本体部とを含み前記加工処理本体部は、ソーステキスト側の単語相当文字列に対応する単語相当文字列がターゲットテキスト側に存在するかどうかを、変換組情報を検索して検出する変換単語存否検出部と、変換単語存否検出部がターゲットテキスト側に対応する単語相当文字列が存在しないと検出したときに、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に特殊記号を付加する処理を行うと共に、特殊記号を対象とする第2表示組情報を作成する第1の作成処理部と、ターゲットテキスト側に対応する単語相当文字列が存在すると検出したときに、その単語相当文字列内文字を対象とした第2の表示組情報を作成する第2の作成処理部とを含み、更に、前記ソーステキスト及びターゲットテキストはHTML文書であり、表示属性の内容及び付される範囲はタグ記号を用いて指示されていることを特徴としている。
【0009】
また、上記目的を達成するため本発明は、文書変換装置であって、外部からHTMLで記述されたソーステキストを取得し、記憶するソーステキスト取得手段と、記憶されているソーステキストを読み出し、ソーステキストに付されたタグマークを検出して表示属性の内容とその表示属性が付されている位置とを求め、第1表示組情報を作成する第1表示組情報作成手段と、ソーステキストから表示属性を除いたテキスト本体をターゲットテキスト本体に変換する変換手段と、変換されたターゲットテキスト本体を記憶するターゲットテキスト記憶手段と、ソーステキスト本体の単語相当の文字列がターゲットテキスト本体中の単語相当の文字列のどれに該当するかの組み合わせを示す変換組情報を記憶する変換組情報記憶手段と、第1表示組情報と変換組情報を検索してターゲットテキスト本体の加工と、ソーステキスト中の表示属性に相当する表示属性をターゲットテキスト中のどの位置に付すべきかを示す第2表示組情報の作成とを行う加工処理手段と、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に、第2表示組情報の内容に従ってタグ記号を挿入し、テキストを作成するターゲットテキスト作成手段と、作成したテキストを表示する表示手段とを備え
前記加工処理手段は、第1表示組情報が示す表示属性が付されている位置と変換組情報のソーステキスト側の単語相当文字列を参照して、表示属性がいずれの文字列中の文字に付されているかを一文字毎に検出する表示属性付与範囲検出部と、検出結果に従って表示属性が文字列の一部に付されているか、文字列全体に付されているか判別する判別部と、変換組情報のターゲットテキスト側の単語相当文字列を参照し、前記判別結果を用いてターゲットテキスト本体の加工と第2表示組情報の作成を行う加工処理本体部とを含み、
前記加工処理本体部は、ソーステキスト側の単語相当文字列に対応する単語相当文字列がターゲットテキスト側に存在するかどうかを、変換組情報を検索して検出する変換単語存否検出部と、変換単語存否検出部がターゲットテキスト側に対応する単語相当文字列が存在しないと検出したときに、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に特殊記号を付加する処理を行うと共に、特殊記号を対象とする第2表示組情報を作成する第1の作成処理部と、ターゲットテキスト側に対応する単語相当文字列が存在すると検出したときに、その単語相当文字列内文字を対象とした第2の表示組情報を作成する第2の作成処理部とを含む ことを特徴としている。
【0010】
【発明の実施の形態】
<全体構成>
図1は本発明の一例としての文字列変換装置を示し、図中、1はテキストデータ取得部で、例えばインターネット等を通じてテキストデータを取得する。テキストデータの例を図2に示す。同図に示すようにテキストデータは一対のタグ記号a1 a2 とタグ記号a1 a2 を含まないテキスト本体とからなっている。タグ記号は既述したように開始タグと終了タグとからなっている。テキストデータ取得部1の取得したテキストデータはソースデータ記憶部2に記憶される。
【0011】
変換部3は従来の機械翻訳装置の全構成のうちタグ記号の記憶部を除いた構成を含む、即ち、ソース言語のテキストデータをテキスト本体とタグ記号とに分離する分離部、辞書引き・形態素解析部、構文解析部、構文解析の結果を変換してターゲット語の構造解析木を生成するための変換部及び前記記憶部の内容を参照して、ターゲット言語の構造解析木に基づき、ターゲット言語のテキスト本体を生成する翻訳文生成部を含む。
【0012】
図3(A)は変換部3においてタグ記号と分離されたソース言語のテキスト本体、図3(B)はターゲット言語のテキスト本体を示す。各テキスト本体の下部に付された数字はテキスト本体の先頭から各文字までの字数である。単語間の空白も1字と数え、また先頭文字は0番目としている。図3(C)はソース言語とターゲット言語のテキスト本体の対応する単語同士を、テキスト本体先頭からの字数のペアで表わしたものである。この図3(C)の組み情報を変換組み情報と呼ぶ。 変換部3でテキスト本体と分離されたタグ記号は第1表示組情報作成記憶部4に送られるし、翻訳文生成部で生成されたテキスト本体はターゲットデータ記憶部5に記憶される。また、変換組み情報は対応関係記憶部6に記憶される。
【0013】
第1表示組情報作成記憶部4は、変換部3からタグ記号を受け取ると、ソースデータ記憶部2に記憶されているテキストデータを参照し、一対のタグ記号で囲まれている文字列のテキストデータ先頭からの文字数とタグ名の組を作成し、記憶する。上記のように作成した組情報を第1表示組情報という。図4(C)に図4(A)の文書データを参照して作成した第1表示組情報を示す。 表示情報検索部7は、第1表示組情報作成記憶部4で作成された第1表示組情報を用いて、対応関係記憶部6に記憶されている変換組情報を検索し、ターゲット言語のテキスト本体を加工すると共に、そのテキスト本体上での対応するタグ記号が付されるべき位置を演算によって求める。このようにして求めた組情報を第2表示組情報と呼ぶ。テキスト本体の加工とは、後述するようにテキスト本体に特殊記号を付す処理をいう。
【0014】
図4の例では第1表示組情報は(2−2,Bold)と(9−11,Bold)の2つであり、このうち(9−11,Bold)の組情報については図2(C)の変換組情報からソース言語の文字位置9−11に対応するターゲット言語の文字位置が2−3であることが明らかであるので、対応する第2表示組情報は直ちに(2−3,Bold)と求まる。一方、第1表示組情報(2−2,Bold)については、図2(C)の変換組情報のソース言語に(2−2)に一致するものがないため、次のように演算して求める。即ち、文字位置(2−2)をソース言語側に含む変換組情報を検索し、両者の重なり文字数αと重なり開始文字位置βを求める。今の場合、(2−2)を含む変換組情報のソース言語側は(2−5)であり、α=1,β=0である。但し、βは変換側情報の先頭文字からの文字数で計算している。そして、(2−5)に対応する変換組情報のターゲット言語は(5−10)であり、この先頭文字からβ文字目よりα文字数をターゲット言語側の表示属性を付すべき文字であると判断する。ここで、α=1,β=0であるので、結局、ターゲット言語側の表示属性を付すべき文字は(5−5)となる。かくして(2−2,Bold )の第1表示組情報に対応する第2表示組情報は(5−5,Bold )と決定される。図5(A)に上記のようにして決定された第2表示組情報を示す。同図(B)はこの表示組情報に従ってターゲット言語のテキスト本体を表示した例を示している。第2表示組情報が指示する順位の文字が太字で表示され、丁度図2に示したソース言語の文書データと自然に対応しているのが理解される。尚、表示情報検索部7のより詳しい処理動作は図8〜図16のフローチャートに示し、後述する。
【0015】
表示組情報検索部7が検索し、決定した第2表示組情報は第2表示組情報記憶部8に一時記憶される。但し、この第2表示組情報は表示情報変換部9の働きによって書き換えられる場合がある。 表示情報変換部9は優先表示属性記憶部10と接続されている。優先表示属性記憶部10はソース言語のテキストデータが命令文とか感嘆文とかのある特定の文型である場合であるとか、特定のソース言語から特定のターゲット言語への翻訳の場合であるとか、ソース言語側に特定の表示属性が付されている場合であるとかにソース言語側の表示属性とは異なった特定の表示属性をターゲット言語側に付すための情報が記述されている。例えば英文で”That's it!”という表示文字列は日本語で”そこまで”というように表示属性をそのまま残して表記するよりも、アンダーラインをなくし、文字自体を大きくして表記した方が日本人一般に対してより一層注意を喚起することができ、その方が意味を汲んだ訳といえる。優先表示属性記憶部10はこのようなソース言語の特定文に対する表示属性の変更を指示する情報が格納されている。
【0016】
表示情報変換部9は第2表示組情報記憶部8に表示組情報検索部7で作成された第2表示組情報が書き込まれた際に、ソースデータ記憶部2に記憶されたテキストデータを参照して優先表示属性記憶部10内を検索し、ヒットする情報を探す。該当する情報があれば、それに基づいて第2表示組情報の表示属性の書き換えを行って、該当情報がなければ書き換えは行わない。
【0017】
書き換え部11は、表示組情報検索部7の機能の一つである特殊記号の挿入を実行すると共に、その特殊記号の挿入によって挿入位置より後方の文字位置が一文字分ずれることによる変換組情報、第2表示組情報の書き換えを行う部分である。特殊記号は例えば図7の列番号2と4のターゲット言語の表示書の文列にみられるPが該当する。特殊記号Pの挿入はターゲットデータ記憶部5内のテキスト本体に対して行われる。この場合、特殊記号の挿入を図7の列番号4に示すようにテキスト本体の中程の文字間に対して行う場合には、挿入位置よりも後方の各文字の文字位置が挿入前の位置よりも+1ズレる。そして、この文字位置のズレに起因して変換情報及び第2の表示組情報の書き換えが必要になる。書き換え部11はそのために対応関係記憶部6及び第2表示組情報記憶部8に対して該当する組情報の書き換えを行う。
【0018】
ターゲットHTML作成部12は、ターゲット記憶部5に格納された最終のテキスト本体と第2表示組情報記憶部8に記憶された最終の第2表示組情報とを用いてHTML文書を作成する。 表示部13は、ソースデータ記憶部2が記憶しているソーステキスト(HTML文書)とターゲットHTML作成部12で作成されたターゲットテキスト(HTML文書)とを表示属性の内容に従って表示する。図6は表示部11で表示された例を示している。図中のL1がソース言語、L2がターゲット言語である。
【0019】
<フローチャートの説明>
次に、表示組情報検索部7及び書き換え部11の制御動作について図8〜図16のフローチャートを用いて、図7の各例を参照しながら説明する。
図8は、メインフローでプログラムが起動すると、スタック格納処理(S1)を行い、続いて第2表示組情報作成処理(S2)を行う。これら各ステップS1,S2は図9〜図16のサブルーチンに詳細に示されている。
【0020】
最初にフローチャート上で使用している記号について解説しておく。iは第1表示組情報の番号である。一つのテキストデータに対していくつかの第1表示組情報が作成されるが、その場合、文書データ先頭からの文字順位の小さな値を有している第1表示組情報に小さなi番号が割り振られている。jは変換組情報の番号である。この番号jについても、ソース言語側或いはターゲット言語側のいずれかの文字順位が小さなものに小さな値を割り振っている。A,Bは処理中の第1表示組情報の左端の文字位置、右端の文字位置をセットするレジスタである。例えば図7において列番号1番の文書データに関する第1表示組情報(9−11,Bold)の場合であると、A=9,B=11にセットされる。A1,B1は、変換組情報のソース言語側の左端文字位置、右端文字位置がセットされるレジスタである。例えば変換組情報が(9−11,2−3)であると、A1=9,B1=11にセットされる。同様にA2,B2は変換組情報のターゲット言語側の左端文字位置、右端文字位置がセットされるレジスタである。A2,B2はA1,B1へのセットと同時に行われる。図9、図10はS1のサブルーチンである。(1)スタック格納処理
表示組情報検索部7は第1表示組情報作成記憶部4にて新たに第1表示組情報が作成されて記憶されると起動され、起動後ステップS1にてサブルーチンコールされ、図9、10の処理を行う。まず、i,jのリセットを行い(S11、S12)、1番目の第1表示組情報を読み込んで(S14)、その情報を参照し、A,Bの値をレジスタにセットする(S15)。例えば、図7の列番号4の文書データであると、1番目の第1表示組情報として(9,UL)が読み込まれ、A,B=9とセットされる。続いて1番目の変換組情報が対応関係記憶部6から読み込まれ(S17)、ソース言語の左端文字位置、右端文字位置をA1,B1レジスタにセットする(S18)。図7の列番号4の文書データの場合、1番目の変換組情報は(0,0−1)であるので、A1,B1=0とセットされる。
【0021】
続くS19〜S23においてはA,Bの値とA1,B1の値が比較される。比較によってA,BとA1,B1の値の関係が図17に示すいずれのパターンに該当するかが判断される。図17においてパターン1はA番目からB番目までの文字範囲(以下、A〜Bと表記する)にA1,B1の値が包含される形態を示し、パターン2はA〜BとA1〜B1が一部一致する形態を示し、パターン3はA〜BとA1〜B1が全く異なっており一部の一致もしていない形態を示している。更に、パターン4はA〜BがA1〜B1に完全に包含される形態(パターン1と逆の関係の形態)を示している。
【0022】
ステップS19→S20→S21でYes と判断されると、パターン1を意味し、S21でNoと判断された場合及びS19→S22→S23でいずれもNoと判断された場合はパターン2を意味し、S20でNoと判断された場合、及びS22でYes と判断された場合はパターン3を意味し、S23でYes と判断された場合にはパターン4を意味している。
【0023】
パターン1,2,4のいずれかと判断された場合にはi番目の第1表示組情報とj番目の変換組情報を該当する第1〜第3のスタックに格納する(S24〜S27)。パターン3と判断された場合はいずれのスタックにも格納しない。パターン1,2,4と判断された場合はスタックへの格納を終わった後、パターン3と判断された場合は直ちにステップ(S28)に進み、jを1つインクリメントし、2番目の変換組情報を読み込んで(S17)、先ほどと同様スタックへの格納処理を行う(S18→S19→・・・S27)。以後jを1つずつインクリメントして文書データの最後の変換組み情報に到るまで同様な処理を行う。そして、最後の変換組み情報についての処理も完了すると(S16)、次にiを1つインクリメントし(S29)、またjをリセットして(S12)、2番目の第1表示組情報を読み込み(S14)、この2番目の第1表示組情報についてjを1ずつインクリメントしながら各変換組情報と比較し、パターン1〜4のいずれかであるか判定し、パターン1,2,4については該当するスタックに1セットの第1表示組情報と変換組情報を格納する処理を行う。この処理を1つのテキストデータに存する全ての第1表示組情報に対して行う。例えば図7の列番号4の文書データであれば、全ての第1表示組情報を変換組情報と逐一比較した場合、スタック1,スタック2には何らの情報も格納されていないが、スタック3には(9,UL):(9−11,2−3),(10,Bold):(9−11,2−3),(11,Italy:Pointer ):(9−11,2−3)の3セットの情報が格納される。
【0024】
同様に列番号1の文書データであればスタック1に(9−11,Bold):(9−11,2−3)の1セットの情報が格納されるだけであり、列番号2の文書データであれば、いずれのスタックへも格納されない。列番号3のテキストデータの場合、スタック3に(2−3,UL):(2−5,5−9)と(4−5,Bold):(2−5,5−9)との2セットの情報が格納される。列番号5のテキストデータの場合には、スタック1に(2−6,UL):(2−6,2−4)と(2−6,UL):(2−6,7−8)との2セットの情報が格納される。更に列番号6のテキストデータの場合、スタック1に(0−9,UL):(0−9,0−3)の1セットの情報が格納される。但し、この列番号6のテキストデータは既述したように優先表示属性記憶部10の内容によって書き換えられるので、表示に供されることはない。
(2)第2表示情報の作成及び特殊記号の挿入
全て第1表示情報についてのスタック格納処理が終了すると(S13)、メインフローへリターンする。そして、ステップ2に進み、図11〜16のサブルーチンがコールされる。図11は、第2表示組情報作成及び特殊起動挿入処理を示しており、最初、S30にて第1表示組情報を指定する変数iを1にセットする。ここで、iが指定する第1表示組情報は第1表示組情報記憶部4に格納されているものである。そして、1番目に指定した第1表示組情報といずれかの変換組情報との組からなるセットがスタック3,2,1のいずれかに格納されているかどうかを検索する(S32〜S34)。スタック3又はスタック2に格納されている場合には第2表示組情報作成処理1を行い(S35,S36)、スタック1に格納されている場合には第2表示組情報作成処理2を行う(S37)。第1表示組情報は第1表示組情報作成記憶部4には記憶されていないが、いずれのスタックにも格納されていない場合には、不定詞等の和文へ訳出しない単語に表示属性が付されていると判定して特定記号挿入処理を行う(S38)。
【0025】
以上の処理をi番目の第1表示組情報について残すところなく行えば(S31)、iを1つアップして(S40)、次順位の第1表示組情報について同様な処理を行い、これを第1表示組情報作成記憶部4に格納されている全ての第1表示組情報について行うと(S39)、メインフローへリターンする。
尚、S31でi番目の第1表示組情報についてS35〜S38の処理を全て行ったかどうかの判断は、i番目の第1表示組情報と変換組情報のセットがいずれかのスタック1〜3にまだ格納されているかどうかの検出と、いずれのスタックにも存在しなくても処理済のセット識別子を書き込んだ処理済記憶部に該当する情報の識別子が格納されているかどうかの検出によって行える。
(2−1)第2表示組情報作成処理1及び2
次に、1番目の第1表示組情報といずれかの変換組情報からなるセットがスタック3に格納されていると判明した場合における第2表示組情報の作成処理1を図12、図13、図14に基づき説明する。先ず、第1表示組情報とセットになっている変換組情報のソース言語側の左端文字位置、右端文字位置をA1,B1レジスタに、ターゲット言語側の左端文字位置、右端文字位置をA2,B2レジスタに夫々セットし(S43)、文字位置A1〜B1とパターン2又はパターン4の関係にある第1表示組情報が他にないか、スタック2,3を検索する(S44)。検索の結果、無いと判明すれば(S45)、1番目の第1表示組情報が含む左端文字、右端文字位置をレジスタA,Bにセットし(S46)、A〜B、A1〜B1からソース言語側の単語と表示属性が付された文字列との重なり文字数αとA1から重なり開始位置までの文字数βを求める(S47)。続いてβとターゲット言語側単語の文字数(B2−A2+1)を比較する(S48)。この判断は、ターゲット言語の対応する単語の文字数が少なく、ソース言語の単語の先頭から表示属性が付された文字までの字数の方が多い場合に対処するためである。即ち、そのような場合には、ターゲット言語の対応する単語の後(B2番目の文字の後)に表示属性を示す特殊記号を挿入し(S49)、次いで、特殊記号の挿入によって文字位置の書き換えが必要となる第2表示組情報と変換組情報についてS491にて文字位置を+1する処理を行う。続いて、特殊文字挿入位置(B2+1)と第1表示組情報の表示属性を用いて第2表示組情報を作成する(S50)。例えば図7の列番号のターゲット言語の表示書体における”ペン”の後に挿入された”P”は特殊文字の例である。この例では、ソース言語の単語”PEN”の”N”がリンク先ファイルを示すポインタとなっているので、ターゲット言語側においてもポインタであることを示す”P”を用いている。そして、このPの挿入位置を用いて第2表示組情報が作成されている。
【0026】
一方、S48においてターゲット言語の単語の文字数(B2−A2+1)がβの値より多いと判定された場合には、更にその単語の文字数(B2−A2+1)がβ+α値より多いか否かが判定される(S51)。この判断によって、ターゲット言語の単語の文字数がソース言語の単語の先頭から表示属性が付された文字列の最後の文字までの文字数よりも多いか少ないかが明らかになり、ターゲット言語の文字数の方が少ないと判断された場合は、ターゲット言語において表示属性を付す範囲をターゲット言語の単語の後端とし(S52)、他方、多いと判断された場合にはターゲット言語において表示属性を付す範囲をソース言語に表示属性が付された範囲と同じ範囲(β〜α+β)とする(S53)。
【0027】
以上の如くして第2の表示組情報の作成を完了すると、スタック3から該当するセットを削除し(S54)、削除したセット識別子を処理済記憶部に書き込む(S55)。S54においてセットをスタックから削除するのは、同じセットが繰り返しスタックから読み出されるのを防ぐためである。また、S55において使用済みセット識別子を処理済記憶部に格納するのは、いずれかのスタックに格納されていたセットであった事実を記憶し、いずれのスタックにも格納されることのない第1表示組情報と区別できるようにするためである。
【0028】
尚、S45においてスタック2,3の中に複数の第1表示組情報が存在することが判明すると、存在する全てのセットを読み出し(S56)、読み出したセットに対応した第2表示組情報を作成する(S57)。この作成処理は、セットがスタック2に格納されている場合はS35と同一であるし、セットがスタック3に格納されている場合は既に述べたS46〜S55の処理と同一であり、S35については後に説明しているので、詳細な説明はここでは省略する。読み出したセットについてS57の処理を繰り返し行い、もはや未処理のセットが無くなった場合には(S58)、S57において第2表示組情報の作成に使用されたセットを該当するスタックから削除(S54)し、削除したセット中の第1表示組情報識別子を処理済記憶部に書込み(S55)、リターンする。ここで、S45→S56→S57→S58の一連の処理で第2の表示組情報の作成に用いられるセットは、ソース言語側テキスト本体の文字数A1〜B1をカバーし、A1〜B1にカバーされ、A1〜B1とオーバラップする第1表示組情報(i番目には限らない)とA1〜B1をソース言語側文字位置とする変換情報とのセットであり、i番目の表示組情報の全てではないことに注意すべきである。即ち、i番目の第1表示組情報であってもソース言語側文字位置がA1〜B1以外の変換情報とのセットがあるからである。例えば、パターン2のようにソース言語の単語と表示属性が付された範囲の重合が一部だけの場合がこれに該当する。重合から外れた表示属性の付与部分は多くの場合隣の単語の一部又は全部と重合しているからである。
【0029】
以上のようにしてS35の処理が終われば、1番目の第1表示組情報についていずれかの変換組情報とのセットがスタック2、スタック1に格納されていないか判定し(S31)、まだ格納されていれば、それらの処理を行う。例えば、該当するセットがスタック2に格納されていると判定すると(S33)、第2表示組情報作成処理2のサブルーチンを実行する。この処理2は既に述べた処理1と同じサブルーチンによって実行される。しかも1番目の第1表示組情報については、処理1を通じてスタック3のみでなくスタック2にも格納されているセットの検索並びに削除が完了しているので、処理2を実行する際にスタック2に残っている1番目の第1表示組情報を含むセットは残り少ない。おそらく、処理1においてA1,B1レジスタに文字位置を登録した単語を対象としたセットは残っていないので、その単語の隣の単語を対象としたセット(パターン2に属するセットであろう。)が残っているだけになる。但し、その隣の単語を対象にし、2番目以降の第1表示組情報を含むセットはパターン3,パターン2のものが存在すると予想される。従って、処理2はこのようなセットを対象とした第2表示組情報の作成になる。尚、第2の表示組情報作成処理2は処理1と同一サブルーチンで実行されるのでこれ以上の説明は省略する。
(2−2)第2表示組情報作成処理3
そして、以上の処理が終わると、スタック1に1番目の第1表示組情報を含むセットが存在するかどうか判定し(S31,S34)、存在する場合には第2表示組情報再生処理3を実行する(S37)。スタック1に格納されていると判定すると、図15のサブルーチンを実行する。スタック1に格納されているセットはソース言語の一単語と表示属性の付された文字列とが図17に示すパターン1の関係にあり、表示属性が付された範囲が一単語の文字数よりも必ず広い点が他のパターンと異なっている。このため、セットがスタック2,3に格納されている場合と、スタック1に格納されている場合とで第2表示組情報の作成処理を分けて行うようにしている。
【0030】
この場合の処理はまず1番目の第1表示組情報に含まれる文字左端位置、右端位置をA,Bレジスタにセットし(S81)、文字位置A〜Bに含まれる文字位置(A1〜B1)をもつ他の変換組情報がスタック1内に存在しないか検索する(S82)。即ち、文字位置A〜Bを共通にするパターン1のセットが他にないか検索するのである。検索の結果、他に存在することが判明すると(S83)、発見した全てのセットの中で、最左端の文字位置(ソース言語)を持った変換組情報を選択して第2表示組情報を作成する(S84)。この場合の第2表示組情報の文字位置は変換組情報のターゲット言語側の文字位置をそのまま用い、表示属性は第1表示組情報の表示属性をそのまま用いる。第2表示組情報の作成を完了すると、使用したセットをスタック1から削除し(S85)、削除したセット中の第1表示組情報の識別子を処理済記憶部に書き込む(S86)。そして、再び発見したセットの中で最左端の文字位置をもった変換組情報を用いて第2表示組情報を作成する(S84)。この処理をスタック1内から発見される最後のセットまで行う。
【0031】
以上で、S37の処理を終え、再びS31にて1番目の第1表示組情報について未処理のものが残っていないか、各スタックを検索する。残っていない場合には、iを1つインクリメントして2番目の第1表示組情報について1番目の第1表示組情報と同様な処理を行い、第2表示組情報を作成する。
(2−3)特殊記号挿入処理
2番目の第1表示組情報に関して、例えばそれと変換組情報のセットがいずれのスタック1〜3からも検出されず、また処理済記憶部にも処理済セット識別子が存在しなかったとすると、処理はS38に進み、特定記号の挿入を行う。即ち、このように全スタック1〜3に2番目の第1表示組情報を含むセットが存在せず、しかも2番目の第1表示組情報に関する処理済セット識別子が処理済記憶部に全く書き込まれていなくて、第1表示組情報は存在するという場合は、ターゲット言語には訳出されない単語、例えば不定冠詞の”a”であることを意味する。従って、このような単語に表示属性が付されていた場合には、S38に進んで、ターゲット言語のテキスト本体に特定記号を挿入する処理を行い、看者に対して訳出されない単語に表示属性が付されていることを明示するのである。この特殊記号挿入処理は図16に示すように、ターゲットデータ記憶部の文末相当部分に特殊記号を挿入し(S91)、その挿入位置と第1表示組情報が含む表示属性の組で第2表示組情報を作成する(S92)。そして、処理済記憶部に、2番目の第1表示組情報識別子を書き込む(S93)。この識別子を書き込むのは、S31に処理が進んだとき、特殊記号挿入処理が既に完了しているかどうかを確認できるようにするためである。特殊記号挿入処理が完了していると確認すれば、その第1表示組情報を用いての第2表示組情報の作成は全て終了していることとなり、iをインクリメントして次順の第1表示組情報についての処理にかかる。
【0032】
以上のようにして、全ての第1表示組情報を対象にした第2表示組情報の作成が完了すると(S39)、メインフローへリターンする。かくして、一つの文書データについての第2表示組情報の作成処理を終了する。
図7の1〜4の各列に揚げる第2表示組情報は、同一列の第1表示組情報と変換組情報を用いて、上記フローチャートによって作成された例を示している。
【0033】
尚、図7の列番号5のソーステキストの本体のように"never" にアンダーラインがある場合、第1表示組情報が(2−6,UL)であり、変換組情報に(2−6,2−4)と(2−6,7−8)のようにソース側文字位置を共通にするものが2つ含まれているので、上記実施例の構成であれば第2表示組情報は2つ作成され、その結果、ターゲットテキストでは「決して」と「ない」の2つの文字列部分にアンダーラインが付される処理が行われる。この場合、ソーステキストの1箇所のアンダーラインにターゲットテキストの2箇所のアンダーラインが対応することとなってやや不自然さがあると感じられる。そのため、このような場合は2つ生成される第2表示組情報の一方の出力を停止させ、第2表示組情報記憶部8には他の一方のみ書き込むようにする。例えばターゲットテキストにおいて文後端に近い方の第2表示組情報のみ選択し、記憶部8に書き込む。図7の列番号5のターゲット側の表示書体はこのように一方の第2表示組情報のみ選択された場合の表示例を示している。
【0034】
また上記実施例はソーステキストとして英文、ターゲットテキストとして日本文の例を示しているが言語はこれに限られるものではない。更に、ソーステキストとターゲットテキストとで言語は必ずしも異なっている必要はなく、同一言語で異なった方言の文章に変換する場合にも適用できる。
【0035】
【発明の効果】
以上説明したように本発明に係る文書変換装置は、変換組情報の他に、ソーステキストに含まれている表示属性とそれが付されている位置との組み合わせである第1の表示組情報とを用い、加工処理手段にて第2の表示組情報を作成し、更に必要な場合にはターゲットテキスト本体に加工を施して、これらを直接及びターゲットテキスト記憶手段を通じてターゲットテキスト作成手段に送給してターゲットテキストを作成し、表示手段にてそのテキストの表示を行うものであるから、従来技術のようにソーステキストに付された表示属性のうち単語の先頭から後端にわたって付された表示属性だけをターゲットテキストの対応する文字列に付する処理を行うものと異なり、単語の一部の文字列に表示属性が付されていたとしてもその内容が第1表示組情報に反映されている限り、ターゲットテキストにおいても対応する文字列部分に表示属性を付す処理が行え、表示した状態においても不自然さがなくなるものである。
【0036】
その上、ソーステキストに付された表示属性がリンク先のファイルのアドレスを示すものである場合、テキストデータにおいても対応する表示属性が付されるので、ターゲットテキストを主体にファイルの呼び出しが行え便利である。
加えて、本発明において、前記加工処理手段は、第1表示組情報が示す表示属性が付されている位置と変換組情報のソーステキスト側の単語相当文字列を参照して、表示属性がいずれの文字列中の文字に付されているかを一文字毎に検出する表示属性付与範囲検出部と、検出結果に従って表示属性が文字列の一部に付されているか、文字列全体に付されているか判別する判別部と、変換組情報のターゲットテキスト側の単語相当文字列を参照し、前記判別結果を用いてターゲットテキスト本体の加工と第2表示組情報の作成を行う加工処理本体部とを含むので、表示属性がソーステキストの一文字に付されていたとしてもターゲットテキストの対応箇所に表示属性を付与でき、ターゲットテキストとソーステキストとの表示属性に関する厳密な一致が図れるものである。
【0037】
また、前記加工処理本体部は、ソーステキスト側の単語相当文字列に対応する単語相当文字列がターゲットテキスト側に存在するかどうかを、変換組情報を検索して検出する変換単語存否検出部と、変換単語存否検出部がターゲットテキスト側に対応する単語相当文字列が存在しないと検出したときに、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に特殊記号を付加する処理を行うと共に、特殊記号を対象とする第2表示組情報を作成する第1の作成処理部と、ターゲットテキスト側に対応する単語相当文字列が存在すると検出したときに、その単語相当文字列内文字を対象とした第2の表示組情報を作成する第2の作成処理部と、を含むので、ソーステキスト側に存在する単語に対応する文字列がターゲットテキスト側にない場合であってもこれを検出し、特殊記号をターゲットテキスト側に付加すると共に、これに表示属性を付することができ、言語の違いからくる対応単語不遜剤の場合にも表示属性に関してはソーステキストとターゲットテキストとの厳密な一致が図られるものである。
【図面の簡単な説明】
【図1】本発明の一実施例としての文書変換装置のブロック図である。
【図2】ソーステキストの一例を示す図である。
【図3】ソーステキスト本体、ターゲットテキスト本体及びそれらのテキスト本体に関する変換組情報を示した図である。
【図4】第1表示組情報を作成する手順及び作成した第1表示組情報を示す図である。
【図5】第2表示組情報とターゲットテキストの表示形態を示す図である。
【図6】ソーステキストとターゲットテキストの表示例を示す図である。
【図7】複数のソーステキストに対応したターゲットテキスト及び第1、第2変換組情報、変換組情報をテーブル形式で示した図である。
【図8】表示組情報検索部及び書き換え部の処理を示すメインフローチャートである。
【図9】スタック格納処理を示すフローチャートの前半部分を示す図である。
【図10】スタック格納処理を示すフローチャートの後半部分を示す図である。
【図11】第2表示組情報作成及び特殊記号挿入処理を示すフローチャートである。
【図12】第2表示組情報作成処理1及び2を示すフローチャートである。
【図13】第2表示組情報作成処理1及び2を示すフローチャートである。
【図14】第2表示組情報作成処理1及び2を示すフローチャートである。
【図15】第2表示組情報作成処理3を示すフローチャートである。
【図16】特殊記号挿入処理を示すフローチャートである。
【図17】表示属性が付される範囲と単語との重なりパターンを示した図である。

Claims (9)

  1. ソーステキストからターゲットテキストに変換する文書変換装置であって、ソーステキストを記憶しているソーステキスト記憶手段と、ソーステキスト中の文字修飾及びリンク先ファイルのポインタを含む表示属性とそれが付されている位置との組み合わせである第1の表示組情報を記憶する第1表示組情報記憶手段と、ソーステキストから前記表示属性を除いたテキスト本体をターゲットテキスト本体に変換する変換手段と、変換されたターゲットテキスト本体を記憶するターゲットテキスト記憶手段と、ソーステキスト本体の単語相当の文字列がターゲットテキスト本体中の単語相当の文字列のどれに該当するかの組み合わせを示す変換組情報を記憶する変換組情報記憶手段と、第1表示組情報と変換組情報を検索してターゲットテキスト本体の加工と、ソーステキスト中の前記表示属性に相当する表示属性をターゲットテキスト中のどの位置に付すべきかを示す第2表示組情報の作成とを行う加工処理手段と、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に、第2表示組情報作成手段から得る第2表示組情報の内容に従って表示属性を付与し、ターゲットテキストを作成するターゲットテキスト作成手段と、作成したテキストを表示する表示手段とを備え、
    前記加工処理手段は、第1表示組情報が示す表示属性が付されている位置と変換組情報のソーステキスト側の単語相当文字列を参照して、表示属性がいずれの文字列中の文字に付されているかを一文字毎に検出する表示属性付与範囲検出部と、検出結果に従って表示属性が文字列の一部に付されているか、文字列全体に付されているか判別する判別部と、変換組情報のターゲットテキスト側の単語相当文字列を参照し、前記判別結果を用いてターゲットテキスト本体の加工と第2表示組情報の作成を行う加工処理本体部とを含み前記加工処理本体部は、ソーステキスト側の単語相当文字列に対応する単語相当文字列がターゲットテキスト側に存在するかどうかを、変換組情報を検索して検出する変換単語存否検出部と、変換単語存否検出部がターゲットテキスト側に対応する単語相当文字列が存在しないと検出したときに、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に特殊記号を付加する処理を行うと共に、特殊記号を対象とする第2表示組情報を作成する第1の作成処理部と、ターゲットテキスト側に対応する単語相当文字列が存在すると検出したときに、その単語相当文字列内文字を対象とした第2の表示組情報を作成する第2の作成処理部とを含み、
    更に、前記ソーステキスト及びターゲットテキストはHTML文書であり、表示属性の内容及び付される範囲はタグ記号を用いて指示されている
    ことを特徴とする文書変換装置。
  2. 文書変換装置であって、外部からHTMLで記述されたソーステキストを取得し、記憶するソーステキスト取得手段と、記憶されているソーステキストを読み出し、ソーステキストに付されたタグマークを検出して表示属性の内容とその表示属性が付されている位置とを求め、第1表示組情報を作成する第1表示組情報作成手段と、ソーステキストから表示属性を除いたテキスト本体をターゲットテキスト本体に変換する変換手段と、変換されたターゲットテキスト本体を記憶するターゲットテキスト記憶手段と、ソーステキスト本体の単語相当の文字列がターゲットテキスト本体中の単語相当の文字列のどれに該当するかの組み合わせを示す変換組情報を記憶する変換組情報記憶手段と、第1表示組情報と変換組情報を検索してターゲットテキスト本体の加工と、ソーステキスト中の表示属性に相当する表示属性をターゲットテキスト中のどの位置に付すべきかを示す第2表示組情報の作成とを行う加工処理手段と、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に、第2表示組情報の内容に従ってタグ記号を挿入し、テキストを作成するターゲットテキスト作成手段と、作成したテキストを表示する表示手段とを備え、
    前記加工処理手段は、第1表示組情報が示す表示属性が付されている位置と変換組情報のソーステキスト側の単語相当文字列を参照して、表示属性がいずれの文字列中の文字に付されているかを一文字毎に検出する表示属性付与範囲検出部と、検出結果に従って表示属 性が文字列の一部に付されているか、文字列全体に付されているか判別する判別部と、変換組情報のターゲットテキスト側の単語相当文字列を参照し、前記判別結果を用いてターゲットテキスト本体の加工と第2表示組情報の作成を行う加工処理本体部とを含み前記加工処理本体部は、ソーステキスト側の単語相当文字列に対応する単語相当文字列がターゲットテキスト側に存在するかどうかを、変換組情報を検索して検出する変換単語存否検出部と、変換単語存否検出部がターゲットテキスト側に対応する単語相当文字列が存在しないと検出したときに、ターゲットテキスト記憶手段に記憶されているターゲットテキスト本体に特殊記号を付加する処理を行うと共に、特殊記号を対象とする第2表示組情報を作成する第1の作成処理部と、ターゲットテキスト側に対応する単語相当文字列が存在すると検出したときに、その単語相当文字列内文字を対象とした第2の表示組情報を作成する第2の作成処理部とを含むことを特徴とする文書変換装置。
  3. 前記第1の作成処理部の行う特殊記号の付加処理は、特殊記号としてターゲットテキスト本体において使われないキャラクターを用い、それをターゲットテキスト本体の文頭又は文末位置に付加する処理であるこことを特徴とする請求項1、2のいずれかに記載の文書変換装置。
  4. 前記第2の作成処理部は、判別部が単語相当文字列の全体に表示属性が付されていると判別した場合に作動する第1の処理ユニットと、判別部が単語相当文字列の一部に表示属性が付されていると判別した場合に作動する第2の処理ユニットとを含むことを特徴とする請求項1ないし3に記載の文書変換装置。
  5. 第1の処理ユニットは、変換組情報からソーステキスト側文字列に対応するターゲットテキスト側文字列を検出し、その文字列全体に表示属性を付することを内容とする第2表示組情報を作成し、第2の作成処理ユニットは、ターゲットテキスト側の対応する文字列の一部に表示属性を付することを内容とする第2表示組情報を作成することを特徴とする請求項4記載の文書変換装置。
  6. 第2の作成処理ユニットは、ソーステキスト側の単語相当文字列の先頭から表示属性が付されている最初の文字までの文字数を検出する文字検出エレメントと、ターゲットテキスト側の対応する単語相当文字列の先頭から前記検出文字数と同一文字数離れた位置から表示属性を付することを内容とする第2表示組情報を作成する処理エレメントからなることを特徴とする請求項5記載の文書変換装置。
  7. 前記処理エレメントは、ターゲットテキスト側の単語相当文字列の文字数を前記文字検出部分の検出文字数と比較する比較エレメントと、比較の結果ターゲットテキスト側の単語相当文字列の文字数が検出文字数と同数かそれより多い場合に作動する第1エレメントと、ターゲットテキスト側の単語相当文字列の文字数が検出文字数よりも少ない場合に作動する第2エレメントとからなることを特徴とする請求項6記載の文書変換装置。
  8. 第1エレメントは、ターゲットテキスト側の単語相当文字列の先頭から検出文字列の後端までの文字に表示属性を付することを内容とする第2表示組情報を作成することを特徴とする請求項7記載の文書変換装置。
  9. 第2エレメントは、ターゲットテキスト記憶手段に記憶されたターゲットテキスト本体の単語相当文字列の後に特殊記号を挿入する処理を行うと共に、その特殊記号を対象とした第2表示組情報を作成することを特徴とする請求項7又は8に記載の文書変換装置。
JP14027497A 1996-05-29 1997-05-29 文書変換装置 Expired - Lifetime JP3898799B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14027497A JP3898799B2 (ja) 1996-05-29 1997-05-29 文書変換装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-134619 1996-05-29
JP13461996 1996-05-29
JP14027497A JP3898799B2 (ja) 1996-05-29 1997-05-29 文書変換装置

Publications (2)

Publication Number Publication Date
JPH1097539A JPH1097539A (ja) 1998-04-14
JP3898799B2 true JP3898799B2 (ja) 2007-03-28

Family

ID=26468677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14027497A Expired - Lifetime JP3898799B2 (ja) 1996-05-29 1997-05-29 文書変換装置

Country Status (1)

Country Link
JP (1) JP3898799B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5833087B2 (ja) * 2013-11-13 2015-12-16 日本電信電話株式会社 文字列処理装置、方法、及びプログラム
JP6017409B2 (ja) * 2013-12-24 2016-11-02 日本電信電話株式会社 翻訳装置、方法、及びプログラム

Also Published As

Publication number Publication date
JPH1097539A (ja) 1998-04-14

Similar Documents

Publication Publication Date Title
US5987403A (en) Document conversion apparatus for carrying out a natural conversion
US6151570A (en) Translating apparatus, dictionary search apparatus, and translating method
US6119077A (en) Translation machine with format control
JP4330285B2 (ja) 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体
US7823061B2 (en) System and method for text segmentation and display
US5303151A (en) Method and system for translating documents using translation handles
US20040193627A1 (en) Devices for interpreting and retrieving XML documents, methods of interpreting and retrieving XML documents, and computer product
US8181104B1 (en) Automatic creation of cascading style sheets
JP2001195404A (ja) 句翻訳方法およびシステム
US6516296B1 (en) Translating apparatus, dictionary search apparatus, and translating method
JP3898799B2 (ja) 文書変換装置
JPH056396A (ja) 機械翻訳装置
JP4301879B2 (ja) 抄録作成支援システム及び特許文献検索システム
JP2870375B2 (ja) 文章訂正装置
JP2006215679A (ja) 情報処理装置及び情報処理方法並びに記録媒体
JP3302260B2 (ja) 文書処理システム
JPH10269203A (ja) 自動リンク付け装置
JP3329476B2 (ja) かな漢字変換装置
JPH08190561A (ja) 文書修正装置
JP3516700B2 (ja) 文書処理装置及び文書処理方法
JPH1115826A (ja) 文書解析装置及び方法
JPH09325960A (ja) 文書処理システム
JP3969689B2 (ja) 文書作成支援装置、文書作成支援方法及び文書作成支援プログラムを記憶した記憶媒体
JP2003006190A (ja) 辞書作成装置、自動翻訳装置、辞書作成方法、自動翻訳方法、辞書作成プログラム、自動翻訳プログラム、辞書作成プログラムを記録したコンピュータ読み取り可能な記録媒体、自動翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体及び翻訳文の製造方法
JP3367198B2 (ja) 文字属性を用いたテキスト処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061222

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110105

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120105

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130105

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130105

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term