JP4361143B2 - Text translation method and apparatus - Google Patents

Text translation method and apparatus Download PDF

Info

Publication number
JP4361143B2
JP4361143B2 JP27998497A JP27998497A JP4361143B2 JP 4361143 B2 JP4361143 B2 JP 4361143B2 JP 27998497 A JP27998497 A JP 27998497A JP 27998497 A JP27998497 A JP 27998497A JP 4361143 B2 JP4361143 B2 JP 4361143B2
Authority
JP
Japan
Prior art keywords
translation
data
sentence
range
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27998497A
Other languages
Japanese (ja)
Other versions
JPH10154146A (en
Inventor
光廣 合田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aida Mitsuhiro
Original Assignee
Aida Mitsuhiro
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aida Mitsuhiro filed Critical Aida Mitsuhiro
Priority to JP27998497A priority Critical patent/JP4361143B2/en
Publication of JPH10154146A publication Critical patent/JPH10154146A/en
Application granted granted Critical
Publication of JP4361143B2 publication Critical patent/JP4361143B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、情報処理装置、文書処理装置、通信制御装置等に於て、原語から目的語への翻訳を行なうテキスト翻訳方法と装置に関する。
【0002】
【従来の技術】
従来の言語変換処理に於て、機械翻訳装置は、与えられた言語文章データの文法・意味解析、分解、変換処理等を行ない、原語から目的語の文章に変換するが、その翻訳処理は、文章部分間の係り受けの取扱や、多品詞・多義の単語を持つ例えば英語から日本語への変換の場合、正しい目的語への変換には、多岐にわたる論理判断プロセスが要求され、現在の機械翻訳装置では、そのための十分な処理機能を持つに至っていない。
【0003】
【発明が解決しようとする課題】
原語文章の目的語への変換に於ては、語数が多く、長い文章になるほど、一般的にその翻訳処理の正確性、翻訳結果の品質が低下する。例えば、主語+動詞+目的語+補語で構成される一般的な文章でも、例えば、and、or、等で結ばれる語句が多くなれば、各文章部分間の係り受け関係や、各語句及び語句間の意味解析・判断等が難しくなる。更に各種の接続表現語句で文章が結ばれる複文形式になれば、解析・変換上の判断要素が増え、正しい変換結果を得る事が難しくなる。
【0004】
かかる状況に於て、重文・複文を含む比較的複雑な文章に対しても、その構文処理の誤りが少なく、結果として人間にとって有用、且つ、その作業を軽減する事が可能で、その後の、人間による後処理にも耐えるレベルの翻訳手段が望まれる。
【0005】
【課題を解決する為の手段】
本発明の請求項1によれば、
原語文章データを入力する入力ステップと、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲特定のための、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、特定された範囲の翻訳のための、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶ステップと、
入力手段から入力された原語文章データと、辞書記憶ステップに登録された一般辞書語句及び範囲特定データ及び翻訳特定データを照合し、合致するデータがあるか否かを判定する判定ステップと、判定ステップにより合致すると判定されると、範囲特定データと合致すると判定されたデータと、その他の範囲特定データと合致すると判定されたデータ又は文頭又は文末との間の区間にある語句の中、翻訳特定データと合致したデータから、その他の翻訳特定データと合致したデータ又は前記区間の冒頭又は区間の終わりまでの語句を、一般辞書語句と翻訳特定データを用いて、目的語訳に変換する翻訳ステップと、翻訳結果を編集出力する編集出力ステップより成る。
【0006】
又、本発明の請求項2によれば、
原語文章データを入力する入力手段と、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲特定のための、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、特定された範囲の翻訳のための、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段と、
入力手段から入力された原語文章データと辞書記憶手段を照合し、辞書記憶手段内の一般辞書語句及び範囲特定データ及び翻訳特定データと合致するデータがあるか否かを判定する判定手段と、
判定手段により合致すると判定されると、範囲特定データと合致すると判定されたデータと、その他の範囲特定データと合致すると判定されたデータ又は文頭又は文末の間の区間にある語句の中、翻訳特定データと合致したデータから、その他の翻訳特定データと合致したデータ又は前記区間の冒頭又は区間の終わりまでの語句を、辞書記憶手段の一般辞書語句及び翻訳特定データを用いて、目的語訳に変換する翻訳手段と、
翻訳手段による翻訳結果と、範囲特定データの訳語を結び、翻訳結果を編集出力する文章編集出力手段より成る。
【0007】
又、本発明の請求項3によれば、
従属接続詞、関係代名詞、疑問代名詞、関係副詞、疑問副詞、疑問詞の、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データを、複数記憶する辞書記憶手段を備える。
又、本発明の請求項4によれば、
接続表現語句の文字記号列の先頭部分の文字記号列に他の語句が続き、その後に後続の接続表現語句の文字記号列がある相関接続詞を含む語句の場合、その後続部分を、範囲特定データの関連情報として記憶する辞書記憶手段を備える。
【0008】
又、本発明の請求項5によれば、
等位接続詞、固有名詞、固有名詞+動詞、固有名詞+助動詞、固有名詞+助動詞+動詞、代名詞、代名詞+動詞、代名詞+助動詞、代名詞+助動詞+動詞、助動詞+動詞、be動詞、have動詞、do動詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段を備える。
【0009】
又、本発明の請求項6によれば、
前置詞、不定詞、分詞、動名詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段を備える。


又、本発明の請求項7によれば、辞書記憶手段が記憶する範囲特定データ及び翻訳特定データが、範囲特定データ及び翻訳特定データの前後にあるべき文章部分の中、前後の直近の他の範囲特定データ又は翻訳特定データ又は文頭又は文末までの、一部又は全部の語句の文章情報を含む。
【0010】
【作用】
本発明によれば,
本テキスト翻訳方法は、
原語文章データの入力ステップ、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、従属接続詞、関係代名詞、疑問代名詞、関係副詞、疑問副詞、疑問詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、等位接続詞、相関接続詞、代名詞+動詞、代名詞+助動詞+動詞、助動詞+動詞、be動詞,have動詞、do動詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データ、
及び、前置詞、不定詞、分詞、動名詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶ステップ、
入力された原語文章データと辞書記憶ステップを突き合わせて、原語文章デ−タと合致する一般辞書語句及び範囲特定データ及び翻訳特定データの有無を判定する判定ステップ、
判定手段により判定された範囲特定データによって特定された範囲内の、各文章部分を、一般辞書語句と翻訳特定データを用いて目的語に変換する翻訳ステップ、
翻訳結果と範囲特定データの訳語を結合、編集出力する文章編集出力ステップを含む。
入力ステップは、処理対象となる原語文章デ−タを入力し、
辞書記憶ステップは、範囲特定データ及び翻訳特定データの、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなるデ−タを、複数記憶し、
判定ステップは、入力された原語文章データと辞書記憶手段内の一般辞書語句及び範囲特定データ及び翻訳特定データを照合し、合致するデータが、辞書記憶手段内に存在するか否かを判定し、
合致すると判定された場合、範囲特定データと、その他の範囲特定データ又は文頭又は文末との間の区間の語句を、翻訳ステップにより、翻訳特定データ及び一般辞書語句を活用して目的語に変換し、
文章編集出力ステップは、範囲特定データの訳語と、翻訳ステップによる処理結果とを接合、編集して、所定の順に出力する。

又、本発明によれば,
本テキスト翻訳装置は,
原語文章データの入力手段,
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、従属接続詞、関係代名詞、疑問代名詞、関係副詞、疑問副詞、疑問詞の、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、等位接続詞、相関接続詞、代名詞+動詞、代名詞+助動詞+動詞、助動詞+動詞、be動詞,have動詞、do動詞の、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データ、
及び、前置詞、不定詞、分詞、動名詞の、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段、
入力された原語文章データと辞書記憶手段を突き合わせて、原語文章デ−タと合致する一般辞書語句及び範囲特定データ及び翻訳特定データの有無を判定する判定手段、
範囲特定データによって特定された範囲内の各文章部分を、一般辞書語句と翻訳特定データを用いて目的語に変換する翻訳手段、
翻訳結果と範囲特定データの訳語を接合し、編集出力する文章編集出力手段を含む。

従って、
入力手段は、処理対象となる原語文章デ−タを入力し、
辞書記憶手段は、一般辞書語句、及び、範囲特定データ及び翻訳特定データの、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなるデ−タを、複数記憶し、
判定手段は、原語文章データと辞書記憶手段内のデータを照合し、原語文章データと合致する一般辞書語句及び範囲特定データ及び翻訳特定データが、辞書記憶手段内に存在するか否かを判定し、
翻訳手段は、合致すると判定された範囲特定データと、他の範囲特定データ又は文頭又は文末との間の区間の語句を、翻訳特定データ及び一般辞書語句を活用して目的語に変換し、
文章編集出力手段は、判定手段によって判定された範囲特定データの訳語と、翻訳手段による処理結果とを接合、編集して、所定の順に出力することにより、
入力された原語文章データに対して、範囲特定データにより、翻訳範囲を特定し、特定された範囲を、翻訳特定データを用いて翻訳し、翻訳結果と、範囲特定データの訳語を接合して、編集・出力するので、翻訳が面倒な重文・複文に対しても、文章構成の解析結果に起因する翻訳誤りを少なくする事が期待出来る。
【0011】
【実施例】
図1は,本発明の一実施例として,テキスト変換方法と装置のブロック図を示す.本装置は,入力内容や変換処理結果等を表示する液晶等の表示部1と,文字情報を入力するキ−ボ−ド、手書き入力装置、光学・磁気文字読取装置等の入力部2と,Read Only MemoryやRandom Access Memory等からなる特定データを格納する辞書記憶部3,制御プログラムや入力デ−タ等を記憶するRAM等から成るメモリ−部4,及び,表示部1,入力部2,辞書記憶部3,メモリ−部4等を制御する制御部5を含む.
【0012】
図2、図3、図4、図5、図6、図7は、本実施例の動作を説明するフローチャートであり、それらを用いて、本発明の一実施例について説明する。
【0013】
先ず、図2を参照して、処理の開始に際し、201にて、以降の処理手順で用いられるカウンターや作業領域の内容等を初期化する。202は、原語の文章を、入力手段より読み込む。次の203では、入力された内容が、文章データが終了を示すコードか否かを判定する。その判定で、データが終りであれば、そこで処理を終了する。処理すべき文章データが入力されたのであれば、処理は701に進み、補充特定データの判定とその挿入処理に移る。その後、204に戻る。204では、入力文章内の文章データの読みだしポインターのセットを行なう。この場合の読みだしポインターとは、文章を読みこんだ領域にある文章を、先頭から、順次、データを取り出すための、カウンターを意味する。入力文章データは、このポインターを使って、順次読み出して処理をするので、処理済のデータの次のデータを読み出すために、読みだしポインターの内容値を更新し、先に進める。最初は、前記の201で、初期化され、対象領域の先頭の値がセットされる。次に、205では、先にセットされたポインターの位置、この場合、n桁目から始まり、m桁分の文字列を意味し、その値を用いて、辞書を索引する。この場合のmは、1以上の必要な数値である。次の、206では、205の辞書索引の結果、合致する範囲特定データがあるか否かを判定する。辞書には、一般辞書語句と、範囲特定データと、翻訳特定データ、補充特定データ、品詞特定データが記憶されており、それぞれ区分コードで区別され、随時一般辞書を引き、品詞等の情報を取得し、範囲特定データと照合し、その文章情報、条件式等の設定情報条件を判定し、範囲特定データと合致するか否かを判定する。範囲特定データの有無の判定に於て、副詞等の修飾語句が混在している場合、即ち、例えば、It also has・・・・のごとき文章があったと仮定し、It hasで登録されている範囲特定データがあれば、この場合、登録有りと判定し、このalsoに限らず、他の修飾語句や句読点等が混在していても、この場合のalsoと同様の判定をして、特定データの判定を行う。前記206の判定で、範囲特定データが無ければ、207に進み、引き続き辞書索引を行なう為に、n桁目からm桁分の読みだし位置ポインターの中の、m桁を初期化して、204に戻る。前述の206の判定で、合致の範囲特定データがあれば、301の判定に進む。
【0014】
図3を参照して、301は、合致する範囲特定データが単一であるかどうかを判定する。例えば、1例として、ship・shipping・shipmentのデータが辞書にあると仮定し、shipまで入力した時点では、3語存在しているので、301の判定結果、処理は303に進む。303では、辞書索引を続ける為に、n桁目からm桁分の読みだし位置ポインターの中の、m桁をカウントアップして、205に戻り、辞書索引を続ける。前述の301の判定で、単一であった場合は、302に進む。302では、合致した範囲特定データを取込み、翻訳用テーブルにセットし、204に戻って辞書索引処理を継続する為に、読みだしポインターのn桁目(開始位置)の内容を先に進め、次の304に進む。304では、処理すべき文章データが終りか否か、即ち、文章の末尾までの内容を辞書と突き合せたか否かを判定し、処理済であれば次の305に進む。まだ処理すべき文章データが残って居る場合は、303に移り、303では、以後の辞書索引の為に、n桁目からm桁分の読みだし位置ポインターの中の、m桁をカウントアップして、205に戻り、辞書と突合せ、範囲特定データの合致判定を続ける。304の判定で、処理すべき文章データが終了であれば、次の305に進み、305では、それまでの処理で合致した範囲特定データ群が格納された翻訳用テーブルの内容を整えて、次の306に進む。306では、翻訳用テーブルの内容を参照し、文章の先頭が範囲特定データであるかどうかを判定する。これは、翻訳特定データによる、翻訳処理の起点位置を設定するためであり、先頭が範囲特定データでなければ、次の307で文章の先頭位置を翻訳起点位置として設定し、先頭が範囲特定データであれば、308で1番目の範囲特定データの位置を翻訳起点位置に、それぞれ、セットした後に、401に進む。
【0015】
図4を参照して、401では、307、或は、308でセットされた翻訳起点位置n桁目から、読みだし位置ポインターのm桁分の値を進めながら、文字列を、順次辞書と突き合せて、翻訳特定データと合致するかどうかを判定する。次の402では、合致のデータがあるかどうか、或は、データが終りであるかどうかを判定して、終りであれば、504に進む。402の判定で、データが終りではなく、合致の翻訳特定データが有る場合は、処理は403に進む。403では、前後の直近の特定データ又は文頭又は文末の位置を走査する。即ち、例えば、順方向に、合致の翻訳特定データの位置から内容を走査して、次の翻訳特定データの位置を調べ、それを翻訳終了位置としてセットする。もし次の範囲特定データの位置までに、翻訳特定データが存在しなければ、その範囲特定データの位置を翻訳終了位置としてセットする。更に範囲特定データも見つからない場合は、末尾を翻訳終了位置とする。次の404では、翻訳特定データと一般辞書語句情報を用いて、403の走査の結果によってセットされた翻訳開始位置と、翻訳終了位置の間の語句を目的語に翻訳する。この場合、多品詞語句があれば、品詞特定データを用いて品詞の確定処理を随時行う。翻訳特定データの翻訳制御情報等の設定内容により、特定データの後続語句だけではなく、特定データの前・後の語句を翻訳して、それらの目的語を結合する処理も含まれる。翻訳対象の語句の中に、副詞、形容詞等の修飾語句がある場合、次の501以降で処理される。
【0016】
図5を参照して、501では、辞書に登録された翻訳特定データの所定の処理対象範囲に入らない語句が、その翻訳開始・終了位置内に存在する場合、例えば、副詞、形容詞等を含む修飾語句があれば、それらを翻訳して、目的語に加える。次の502では、合致の翻訳特定データが動詞を含むものであった場合、主語+(助動詞)動詞等とそれに続く語句内の動詞に対する目的語と補語を特定し、翻訳する。関連する副詞、形容詞等の修飾語句については、前述の501で行なう。次の、503では、翻訳領域内で、翻訳開始位置を次の翻訳範囲特定データの先頭位置に、読み出しポインターを進める。その後、処理は401に戻り、翻訳特定データの合致判定を繰返す。前記の402から、データが終りの場合に、この504の処理に移り、ここでは、翻訳特定データが見つからなかった場合や、翻訳データによる翻訳が十分でなかった時の補足的な翻訳処理をする。例えば、ここで、主語+動詞+目的語・補語、主語+助動詞+動詞+目的語+補語等を特定するための処理を行ない、特定出来たなら、その部分を目的語に翻訳する。次の、505では、翻訳された目的語に原語が含まれているか否かを判定して、原語が残っていれば、506に進み、原語出力区分コードを前後に付加して、601に進む。原語が含まれていなければ、601に進む。
【0017】
図6を参照して、601では、予め辞書に記憶されている特定データの目的語訳と、翻訳特定データを基に翻訳された結果の目的語を接合して、編集する。601は、特定データの持つ翻訳制御情報に基づき、出力順位を調整して編集する。その後、602、603でその編集結果を出力してから、202に戻り、次の文章入力を行なう。次に、図7を参照して、203の文章終了判定の所で、まだ処理すべき文章があれば、701に移り、補充特定データの判定・挿入処理を行う。701では、入力文章内のデータの読み出しポインターの内容をセットをする。これは文章内の処理開始位置の値である。次の702では、読み出しポインターの内容値で示される位置(n桁目からm桁分)のデータ列により、辞書内容を索引する。702での索引の後、704に進み、補充特定データがあるか否かを判定して、無ければ処理は703に移り、索引するデータ列の位置を示すm桁分を示す桁カウントをクリアして、次の語句の処理に移る用意をして、701に戻る。もし、702の辞書索引処理で、補充特定データがあった場合、次の705で、補充特定データを挿入し、706に進む。706では、合致の補充特定データの桁数分、読み出しポインターの内容を進めて、707に行く。707では、データが終わりか否かを判定し、終わりなら、204に戻って、特定データの合致判定処理に移る。もし終わりでなければ、708に進み、読み出しポインターの内容値の内、m桁分の桁カウントをアップしてから、702に戻り、補充特定データの索引を継続する。
【0018】
図8は、原語文章の例である。この図の(1)から(15)、翻訳処理の一例として、入力文章データと特定データを記憶する辞書内容を照合し、合致した特定データを基に、語句をグループ分けした結果に、番号を付したものである。with(翻訳特定データ),is(翻訳特定データ),that(翻訳範囲特定データ),they(翻訳特定データ),may(翻訳特定データ)+overlook,and(翻訳特定データ),as(翻訳範囲特定データ),you(翻訳特定データ),they(翻訳特定データ),do(翻訳特定データ)が、それぞれ特定データである。この例では、範囲特定データによって文章範囲が定められた後、その範囲内で、辞書に登録された翻訳特定データを先頭にするか、又は、翻訳特定データを含む語句を目的語に翻訳する。そして、それに関連指定の副詞・形容詞を含む修飾語句の翻訳、動詞に対する目的語・補語に相当する語句の翻訳、及び、それまでに未だデータ特定・翻訳が成されていなければ、主語+動詞、主語+助動詞+動詞に相当する語句を、辞書内容を適宜参照して特定し、目的語に翻訳する。以上の結果として、”原語から目的語への変換の例”を、次の図9に示す。
【0019】
図9は、原語から目的語への変換の例である。左欄に記載の原語の各部分に対応する中間段階での目的語が、右欄に記載されており、それらを結び付けた翻訳結果の出力例が、下部に記載されている。1行目を参照して、(1)は、そのすぐ下のwithが特定データとして設定されており、この場合、文頭とwithとの間で区切られている語句The problemである。次の(2)withは、この場合、翻訳特定データとして登録されている。(3)using this method onlyは、この例では、前のwithと次のisがそれぞれ特定データであり、その間の語句として区切られている。(4)is、(5)that、(6)they,(7)may+overlookは、それぞれ、特定データとして登録されている。
【0020】
(7)は、この場合、助動詞mayとそれに続く動詞overlookが共に区切られている。次の(8)other relatedは、次の等位接続詞のandとの間で区切られ、(9)andは、特定データとして登録され、(10)important topicsは、特定データandと、次の特定データasとの間で区切られた語句である。(11)asは、特定データである。(12)youは、特定データで、(13)expectは、(12)特定データyouと、(14)特定データtheyとの間で区切られている。(13)expectの下の<that>は、この例において補充特定データとして挿入されるものである。もし挿入の補充特定データが、別途範囲の特定ないしは翻訳の為の特定データとして登録されている場合には、その該当する特定データの翻訳制御が適用される。(14)they,(15)doは、それぞれ登録の特定データである。
【0021】
以上の区切られた各語句を基に翻訳を進め、訳語出力順は、その一例として、この場合、後部から前方向に進行し、(14、15)の15の述語指定でその前後(主語・目的語)が変わり、15、14の順列(この場合14、15の順で後部から訳語の結合が進む事を意味する)となり、次に、補充特定データのthatの訳語が挿入され、(12、13)の13の述語指定で前後が入れ替わって13、12の順となり、(13、12、that、15、14、即ち、14、15、that、12、13の順で訳語編集が進む)=Aの順に編成。次に、(11)が入り、特定データandを含む(8、9、10)の9の等位接続詞指定で前後調整され、(10、9、8、11、即ち、11、8、9、10の順で訳語の結合が進む)の順となり、次の(6、7)における7の述語指定で、主語・目的語が入れ替わり、(7、6、即ち、6、7の順で後部から訳語の結合が進む)=Bの順で、(7、6、10、9、8、11)の順となる。 次に、(5)が続き、(3、4)では、4の述語指定で主語・目的語部分の入れ替えが起こり、この場合、(4、3、即ち、3、4の順で後部から訳語の結合が進む)となるが、(3)は特定データを含まず、翻訳は特定データを基に進行するので、(3)に関わる処理は未だ確定せず、次の(2)with、及び、withと文頭の間にある(1)The problemを含めて、(1、2、3、即ち、3、2、1の順で後部から訳語の結合が進む)となり、4と前後が入れ替わり、(4、1、2、3)となる。その結果、全体として、訳文は、”14>15>that>12>13>8>9>10>6>7>5>3>2>1>4”の順序で出力される。ここでは、後部から前方向に進行する訳語出力の例を示したが、実際にはこれに限らない。即ち、例えば、接続詞を先頭の語とする文章があれば、その先頭部分を先に出力することが必要であり、特定データの関連情報の設定を含めた対応となる。
【0022】
図10は、特定データの例、その1である。(見出し行、左端の)データ種別のRは、Range(範囲)のRであり、この辞書内では、範囲特定データであることを意味する。Rl(アールエル)は、出力レベル情報(l=エル)付のRデータである。Tは翻訳特定データ、SUは補充特定データ、UPは品詞特定データを示す。この例では、この種別コードにより、辞書記憶手段内に、特定データ、一般辞書語句を混在させる。(右側の)キーワードは、特定データの値そのもので、この値を基準に、データを直接的に索引出来る編成方法で辞書記憶手段内に記憶する。
【0023】
(右側の)標準目的語は、キーワードの目的語である。多義語の場合、後述のキーワードの前後の文章情報等を指定して、それに対応の目的語を適用する。(右側の)翻訳制御は、範囲特定データの場合、範囲特定データの前後に続く語句の目的語を、範囲特定データの後に接合するか、前に接合するかを含め、翻訳上の処理指定を指定する。”ー後”は、後続の語句の目的語の後に、予め設定の特定データの標準目的語を結び付けることを意味する。”前ー”は、後続の語句の目的語の前に、予め設定の特定データの標準目的語を結び付けることを意味する。
【0024】
(右側の)キーワードの前の文章情報、熟語、条件式は、文章の中で、範囲特定データの前に存在する文章部分の品詞等の文法情報、熟語の範囲特定データの場合の先行語句、範囲特定データの前にあるべき他の特定データとの共起条件、等を指定する。(右側の)キーワードの後の文章情報、熟語、条件式は、文章の中で、範囲特定データの後に存在する文章部分の品詞等の文法情報、熟語の範囲特定データの場合の後続語句、範囲特定データの後にあるべき他の特定データとの共起条件、等を指定する。多義の範囲特定データのキーワードの場合、複数の標準目的語を使い分ける為には、このキーワードの前後の文章情報、条件式を指定して、それに該当する標準目的語を適用出来るように設定する。
【0025】
次に、Rで始まる1行目の設定データの例を参照し、Rは範囲特定データを表し、althoughはキーワードで、その標準目的語が、”だが”であり、 訳語順は、”ー後”で、althoughの後続語句の目的語の後に”だが”を結合することを意味する。次のキーワードの前の文章情報は、この場合、設定されていないので、条件無しと見なし、キーワードの後の文章情報は、名詞(n)が必須であり、その名詞の前に、冠詞(a)、形容詞(aj)、代名詞(pron)が存在し得るものとし、それらが括弧内にあるので、必須では無く、次の”+”以降は、後に続くものとして、v(動詞)が必須であり、その動詞の前に、auv(助動詞)、adv(副詞)が存在し得るものとし、それらが括弧内にあるので、必須では無く、又、この場合は、副詞が、v(動詞)と相前後しても差し支えない。v(動詞)は、一般動詞、及び、be、do、have等を含む。
【0026】
次のRで始まる行は、asの例である。as は多義語であり、この辞書の例は、その一部であり、asの1行目は、althoughの場合に準ずるので説明を省略し、2行目に移る。キーワードがas、標準目的語が”(の)通り”、”−後”の指定があり、キーワードの後の文章情報として、(adv)vが指定されており、例えば、as was already statedなどの例である。次行の例は、例えば、・・・the same as・・・への対応である。キーワードの前の文章情報として、the sameがあり、キーワードの後の文章情報として、(a、aj、pron)nが設定され、名詞(n)が必須であり、その前に、冠詞(a)、形容詞(aj)、代名詞(pron)が存在し得るものとし、それらが括弧内にあるので、必須では無い。
【0027】
次行に続くthatは、キーワードの後の文章情報として、前後共に(a、aj、pron)n+(auv、adv)vが指定され、これは、we know that it is right・・・のような文章への対応である。次行のthatの例に、SUが指定されているが、これは、SUpplementのSUで、補充特定データを意味する。この例では、”(a,aj,pron)n+(auv,adv)v”が、それぞれ前後の文章情報として設定され、対象となる文章内に、この文章情報に合致する語句の配列が検出されると、thatが、前後の文章情報で示される語句の間に挿入され、共に翻訳される。次行のthatは、関係代名詞のthatで、UPは、Unique Part of speechの略で、唯一品詞を意味する。即ち、多品詞語句の品詞を特定するものである。下欄の注に、この辞書の例における品詞指定、条件式、文字列の一部を記述し、他の品詞等については、特にここでは必要が無いので省略する。この範囲特定データの設定内容は、利用者自身又はソフトウエアにより、辞書記憶手段内に設定・更新される。
【0028】
下欄の注)内の説明にあるany of・・・、except・・・、PRDーBY・・・、FLDーBY・・・は、文章情報等と共に設定できる条件式で、キーワードの前の文章情報、又は、キーワードの後の文章情報のいずれにも設定できる。any ofは、指定のn個の”語句”、”品詞”のいずれでも存在し得る条件で、その中の全て又は何れでも良いが、それ以外は許されない。exceptは、指定のn個の”語句””品詞”が全て許されず、それ以外であれば許される。(”語句又は品詞”)and(”語句又は品詞”)として、and条件とすることも可能であり、他の例としては、(”語句又は品詞”and”語句又は品詞”)or(”語句又は品詞”and”語句又は品詞”)のように、複合条件としても良い。次の、PRDーBY R:は、PReceDed BY R:の略で、R:”語句””品詞”、等で指定の語句、品詞が、R=範囲特定データとして先行することが条件となる。Rの代わりにTを指定すれば、後述の、T=翻訳特定データに対する指定となる。FLD BY R:は、FoLloweD BY R:の略で、R:”語句”or”品詞”、等で指定の語句、品詞が、R=範囲特定データとして後続することが条件となる。T:は、後述の、翻訳特定データに対する指定となる。R:、又は、T:以外であれば、範囲特定データや翻訳特定データではなく、一般語句の文字列指定とする。キーワードの前後の各文章情報指定、条件式は、それらをand、or条件として扱うことが出来る。
【0029】
図11は、特定データの例、その2である。見出し行の左端は、データ種別で、この場合は、翻訳を意味するT(Translation)である。次の右側は、翻訳特定データのキーワードであり、この値を基準に、辞書記憶手段内に設定される。次は翻訳特定データの標準目的語である。その次の翻訳制御については、範囲特定データのケースに準ずるが、”ー述ー”、”ー等ー”、”主ー”などについて以降で説明する。次のキーワードの前の文章情報、熟語、条件式、及び、キーワードの後の文章情報、熟語、条件式は、前述の範囲特定データの場合に準ずる指定方法となる。
【0030】
Tで始まる1行目に移り、Tは翻訳特定データを示し、キーワードはand、標準目的語は、”及び、そして”であり、対応するキーワードの前・後の文章情報、熟語、条件式を指定する。翻訳制御は、”−等−”=等位接続詞であり、その前後の語句を、等位として、接続する。キーワードの前後の文章情報として、(a、aj、pron)nがあり、n(名詞)が必須であり、必須では無いが、その前に、a(冠詞)、aj(形容詞)、pron(代名詞)が存在し得ることを示す。次の前後各2行の2件の情報は、キーワードの前後の文章情報の例であり、いずれも、翻訳特定データandを特定するための情報の例である。その内の一つ、r−pn+(auv,adv)v+o/sは、先ずr−pn(関係代名詞)が来て、その後に、括弧内の、必須ではないが、auv=助動詞、adv=副詞が存在し得る事を示し、v=動詞は必須で、次に、必須では無いが、括弧内の、o/s=目的語・補語が存在し得る事を意味する。
【0031】
以上のごとき情報を判定の結果、その条件に合致した場合、andの前後の語句を、一方が他に従属する形では無く、等位で接続する。次に、次の行、doについて説明する。doの標準目的語の”する”に関して、この場合、doの前に主語があり、後に目的語(補語)が続くはずであり、その為のキーワードの前・後の文章情報を設定している。即ち、この場合、前の部分において、n(名詞)は必須であり、a(冠詞)、aj(形容詞)、pron(代名詞)が括弧内にあるので、必須では無いが、存在し得る事を意味する。pronはnに置き換えることも可能。後の部分において、auv(助動詞)、adv(副詞)、v(動詞)が、必須では無いが存在し得る事を示す。
【0032】
次に続く行の、翻訳特定データ、is、may、の例は、doと同じ”ー述ー”指定であり、前記のdoの場合に準ずる。その次のtoの1行目は、to不定詞の場合であり、例えば、1行目はto go、(前に副詞を含む)not tosee等である。toの2行目は、名詞用法で、He began to laugh等のケースである。toの3・4行目は、疑問詞+to do形式の、whether to go(行くべきか)や、where to date(どこでデートするか)のような適用例である。
【0033】
toの5行目は、一般的な前置詞用法で、(本屋)へ、(10歳)まで、などの例である。次行は、theyの例で、代名詞として、その後に、必須ではないが、(副詞、助動)が続き、動詞、及び、その後に、名詞等が続く。次行のwithには、多くの前置詞表現があるが、ここでは、手段(道具)・材料(内容)・開始(終了)等で多用される、”で”の例をあげる。with *vingは、with+現在分詞の例である。次行のyouの1行目は、主語のyouで、その後に、動詞、名詞等が続く。youの2行目は、目的語のyouであり、指定の前後の語句情報で区別する。
【0034】
図12、図13は、一般辞書語句の例である。見出し欄の左端は、データ種別であり、この場合は、G(General)となる。この例では、同じ辞書記憶手段内に、前記の範囲特定データ、翻訳特定データと共に、この一般辞書語句を直接参照できる編成方法で記憶する。次の見出し語句は、一般辞書語句のキーワードである。この値を基にしてデータが編成・記憶される。次の品詞コードは、n(名詞)、pron(代名詞)、v(動詞)・・・等の品詞を区別する情報である。前記の範囲特定データや翻訳特定データの例における品詞区分と同じであるが、基本的な語句情報を保持するので、各処理段階で適時参照され、ここでは、vi(自動詞)、vt(他動詞)等の区別も成される。次の属性コードは、その語句が属する分野、特質、等を含み、その他の関連語句情報についての説明はここでは省略する。図12のGで始まる1行目に移り、Gは一般辞書語句である事を示し、見出し語句は,andで、品詞コードは、conj(接続詞)である。訳語は、品詞毎に、複数の意味を持つ場合が多く、入力された原語文章の内容を解析結果に基づいて、適切な訳を割り付ける必要があるが、本発明の方法では、実例ベースで、多義の重要語句を、範囲特定データ、及び、翻訳特定データとして、必要十分なアイテムを辞書に取込み、適切な目的語訳を期する。
【0035】
【発明の効果】
本発明によれば、
原語文章データを入力する入力ステップと、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲特定のための範囲特定データ、及び、特定範囲翻訳のための翻訳特定データの、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなるデータを、複数記憶する辞書記憶ステップと、
前記入力ステップから原語文章データが入力されると辞書記憶ステップと照合し、原語文章データの中に、一般辞書語句及び範囲特定データ及び翻訳特定データと合致するデータがあるか否かを判定する判定ステップと、
判定ステップにより合致するデータがあると判定されると、原語文章内の、当該範囲特定データと他の範囲特定データ又は文頭又は文末までの区間の語句を、一般辞書語句及び翻訳特定データを用いて、目的語訳に変換する翻訳ステップと、
翻訳ステップによる翻訳結果と、予め設定の範囲特定データの訳語を結び、翻訳結果を編集出力する文章編集出力ステップより成る。
従って、長文など、翻訳上、誤りが発生しがちな部分を、予め設定の範囲特定データを活用して範囲を特定し、特定された文章部分を、翻訳特定データと一般辞書語句を活用して翻訳処理を進めるので、誤りの少ない翻訳結果が期待出来る。
【0036】
本発明によれば、
原語文章データを入力する入力手段と、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲を特定するための範囲特定データの、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報、
及び、範囲特定データによって区切られた文章部分内の語句を翻訳するための翻訳特定データの、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報を、複数記憶する辞書記憶手段と、
入力手段から入力の原語文章データと辞書記憶手段とを照合し、辞書記憶手段内の一般辞書語句及び範囲特定データ及び翻訳特定データと合致するデータがあるか否かを判定する判定手段と、
判定手段により合致すると判定された場合、範囲特定データと他の範囲特定データ又は文頭又は文末までの間の区間の語句を、辞書記憶手段の一般辞書語句及び翻訳特定データを用いて、目的語に変換する翻訳手段と、
翻訳手段による翻訳結果と、範囲特定データの訳語を結び、翻訳結果を編集出力する文章編集出力手段より成る。
従って、翻訳の難しい部分や標準化出来る部分を、予め、範囲特定データ及び翻訳特定データとして辞書記憶手段に登録し、それにより特定された文章部分を、翻訳特定データと一般辞書語句を活用して翻訳処理を進めるので、構文上の誤りが少ない翻訳処理が期待出来る。
【0037】
又、本発明によれば、
従属接続詞、関係代名詞、疑問代名詞、関係副詞、疑問副詞、疑問詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データを、複数記憶する辞書記憶手段を備える。
従って、予め必要に応じ、特定の品詞や文字号列等を選択して、範囲特定データを設定し、各種の文章の翻訳に対応出来る。
【0038】
又、本発明によれば、
相関接続詞を含めて、接続表現語句が、複数の語句から成り、文章内でその語句の順序が連続しない場合、その後続部分を、範囲特定データの関連情報として記憶する辞書記憶手段を備える。
従って、相関接続詞を含む各種の接続表現語句に対して、確実に合致判定が出来る。
【0039】
又、本発明によれば、
等位接続詞、固有名詞、固有名詞+動詞、固有名詞+助動詞、固有名詞+助動詞+動詞、代名詞、代名詞+動詞、代名詞+助動詞、代名詞+助動詞+動詞、助動詞+動詞、be動詞、have動詞、do動詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段を備える。
従って、予め必要に応じ、特定の品詞や文字列を選択して、翻訳特定データを設定し、各種の文章に対応した翻訳処理が出来る。
【0040】
又、本発明によれば、
前置詞、不定詞、分詞、動名詞の、見出し語句、訳語、翻訳制御、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段を備える。
従って、予め必要に応じ、特定の品詞や文字列を選択して、翻訳特定データを設定し、各種の文章に対応する翻訳処理が出来る。
【0041】
又、本発明によれば、
範囲特定データ及び翻訳特定データが、その前後にあるべき文章部分の中、前後の直近の他の前記範囲特定データ又は翻訳特定データ又は文頭又は文末までの、一部又は全部の語句の文章情報を含む
【0042】
従って、範囲特定データ及び翻訳特定データの、前後の語句の文章情報、その他の範囲特定データ及び翻訳特定データとの関連情報を、辞書記憶手段に登録し、入力文章データと、範囲特定データ及び翻訳特定データとの合致判定を確実に出来る。
【0043】
【図面の簡単な説明】
【図1】本発明の一実施例のテキスト翻訳方法と装置を実現する処理装置のブロック図である。
【図2】本発明の一実施例の文章入力、範囲特定データの辞書索引、及び、翻訳特定データの有無を判定するフローである。
【図3】本発明の一実施例の範囲特定データの辞書索引結果の唯一(単一)判定、範囲特定の為の文章データの終了判定、及び、翻訳の為の特定データの辞書索引の初期処理のフローである。
【図4】本発明の一実施例の翻訳特定データの辞書索引処理、翻訳特定データを基にする翻訳対象の文章データの終了判定、及び、翻訳処理のフローである。
【図5】本発明の一実施例の翻訳特定データに基づく翻訳処理に関連して副詞を含む修飾語句の翻訳、動詞を含む翻訳特定データの目的語、補語に相当する語句の翻訳、それ以外の翻訳対象外の語句、主語+動詞、主語+助動詞+動詞の特定と翻訳、及び、翻訳結果が原語を含む場合の処理のフローである。
【図6】本発明の一実施例の範囲特定データの目的語と翻訳特定データとそれを含むかそれに続く語句の翻訳結果を結び付け、出力順位を調整して出力するフローである。
【図7】本発明の一実施例の補充特定データの判定と挿入処理のフローである。
【図8】本発明の一実施例の原語文章の例である。
【図9】本発明の一実施例の原語から目的語への変換の例である。
【図10】本発明の一実施例の特定データの例、その1である。
【図11】本発明の−実施例の特定データの例、その2である。
【図12】本発明の一実施例の一般辞書語句の例、その1である。
【図13】本発明の−実施例の一般辞書語句の例、その2である。
【符号の説明】
1 表示部
2 入力部
3 辞書記憶部
4 メモリー部
5 制御部
[0001]
[Industrial application fields]
The present invention relates to a text translation method and apparatus for translating an original word into a target word in an information processing apparatus, document processing apparatus, communication control apparatus, and the like.
[0002]
[Prior art]
In the conventional language conversion processing, the machine translation device performs grammar / semantic analysis, decomposition, conversion processing, etc. of the given language sentence data, and converts the original language into the target sentence. In the case of dependency handling between sentence parts and conversion from English to Japanese, for example, with multiple parts of speech and ambiguous words, a wide range of logical judgment processes are required for conversion to the correct object. The translation apparatus does not have a sufficient processing function for that purpose.
[0003]
[Problems to be solved by the invention]
In the conversion of an original sentence into an object, as the number of words increases and the sentence becomes longer, the accuracy of the translation process and the quality of the translation result generally deteriorate. For example, even in a general sentence composed of a subject + verb + object + complement, for example, if there are many words connected by and, or, etc., the dependency relationship between each sentence part, each word and phrase Semantic analysis and judgment between them become difficult. Furthermore, if a compound sentence format is formed in which sentences are connected with various connection expression phrases, the determination elements for analysis and conversion increase, and it becomes difficult to obtain a correct conversion result.
[0004]
In such a situation, even for relatively complex sentences including heavy sentences and compound sentences, there are few errors in syntax processing, and as a result, it is useful for humans and can reduce the work. A translation means that can withstand post-processing by humans is desired.
[0005]
[Means for solving the problems]
According to claim 1 of the present invention,
An input step for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And range specification data consisting of sentence information including headwords, translations, translation control, part of speech of phrases before and after the sentence part, conditional expression, idiom character string for translation range specification,
And a dictionary for storing a plurality of translation specifying data including sentence information including headwords, translations, translation control, parts of speech of phrases before and after a sentence, conditional expressions, and idiom character strings for translation within a specified range A memory step;
Original text data input from the input means and registered in the dictionary storage step General dictionary words and The step of comparing the range specifying data and the translation specifying data and determining whether or not there is a matching data, and if determined to match by the determination step, the data determined to match the range specifying data and other Among the data that is determined to match the range identification data or the phrase in the section between the beginning or end of the sentence, from the data that matches the translation identification data, the data that matches the other translation identification data, or the beginning or section of the section This includes a translation step for converting words up to the end of the word into a target word translation using general dictionary words and translation specific data, and an edit output step for editing and outputting the translation result.
[0006]
According to claim 2 of the present invention,
An input means for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And range specification data consisting of sentence information including headwords, translations, translation control, part of speech of phrases before and after the sentence part, conditional expression, idiom character string for translation range specification,
And a dictionary for storing a plurality of translation specifying data including sentence information including headwords, translations, translation control, parts of speech of phrases before and after a sentence, conditional expressions, and idiom character strings for translation within a specified range Storage means;
The original sentence data input from the input means is compared with the dictionary storage means, General dictionary words and Determining means for determining whether there is data that matches the range specifying data and the translation specifying data;
If it is determined by the determination means that the data is determined to match the range specifying data and the data determined to match the other range specifying data or the phrase in the section between the beginning or end of the sentence, the translation specification Data that matches the data, data that matches the other translation specific data, or words from the beginning of the section or the end of the section are converted into target word translations using general dictionary words and translation specific data in the dictionary storage means. Translation means,
It consists of sentence editing output means for connecting the translation result of the translation means and the translated word of the range specifying data, and editing and outputting the translation result.
[0007]
According to claim 3 of the present invention,
Scope specification consisting of subordinate conjunctions, relational pronouns, interrogative pronouns, relational adverbs, interrogative adverbs, interrogative words, headwords, translations, translation controls, parts of speech of the preceding and following sentence parts, conditional expressions, and idiom character strings A dictionary storage means for storing a plurality of data is provided.
According to claim 4 of the present invention,
In the case of a phrase that contains a correlated conjunction followed by another phrase following the string of the first part of the character string of the connected expression phrase, followed by the character string of the subsequent connected expression phrase, the subsequent part is replaced with range-specific data. Dictionary storage means for storing as related information.
[0008]
According to claim 5 of the present invention,
Coordinate conjunction, proper noun, proper noun + verb, proper noun + auxiliary verb, proper noun + auxiliary verb + verb, pronoun, pronoun + verb, pronoun + auxiliary verb, pronoun + auxiliary verb + verb, auxiliary verb + verb, be verb, have verb, It includes dictionary storage means for storing a plurality of translation specifying data consisting of heading phrases, translations, translation control information, part-of-speech phrases in the preceding and following sentence parts, conditional expressions, and sentence information including idiom character strings.
[0009]
According to claim 6 of the present invention,
A dictionary that stores multiple translation-specific data consisting of sentence information including prepositions, infinitives, participle, verbal nouns, headwords, translations, translation control information, parts of speech of previous and next sentence parts, conditional expressions, and idiom character strings A storage means is provided.


According to claim 7 of the present invention, the range specifying data and the translation specifying data stored in the dictionary storage means are the other parts immediately before and after the sentence portion that should be before and after the range specifying data and the translation specifying data. It includes text information of some or all of the words up to the range specification data, translation specification data, or the beginning or end of the sentence.
[0010]
[Action]
According to the present invention,
This text translation method is
Input step of original sentence data,
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And subordinate conjunctions, relational pronouns, interrogative pronouns, relational adverbs, interrogative adverbs, interrogative words, headwords, translations, translation control information, parts of speech of phrases in the surrounding text parts, conditional expressions, idioms Range specific data,
And equivalent conjunctions, correlated conjunctions, pronouns + verbs, pronouns + auxiliary verbs + verbs, auxiliary verbs + verbs, be verbs, have verbs, do verbs, headwords, translations, translation control information, parts of speech , Translation specific data consisting of sentence information including conditional expressions, idiom character strings,
And multiple translation-specific data consisting of prepositions, infinitives, participles, verbal nouns, headwords, translations, translation control information, parts of speech of phrases before and after sentences, conditional expressions, and idiom character strings Dictionary storage step,
Matches the original text data with the input text data and dictionary storage step General dictionary words and A determination step for determining presence / absence of range specifying data and translation specifying data;
A translation step of converting each sentence portion within the range specified by the range specifying data determined by the determining means into an object using a general dictionary phrase and translation specifying data;
A sentence editing / outputting step for combining, editing and outputting the translation result and the translation of the range specifying data is included.
In the input step, the source sentence text data to be processed is input,
The dictionary storage step stores a plurality of data including sentence information including range words, translation words, translation words, part of speech of words before and after the sentence part, conditional expressions, and idiom character strings of range specification data and translation specification data. And
The determination step includes the input source language sentence data and the dictionary storage means. General dictionary words and Collate range specific data and translation specific data, determine whether matching data exists in the dictionary storage means,
If it is determined that they match, the words in the section between the range specification data and other range specification data or the beginning or end of the sentence are converted into objects using the translation specification data and general dictionary words in the translation step. ,
In the sentence editing / outputting step, the translation of the range specifying data and the processing result of the translation step are joined and edited, and output in a predetermined order.

Also, according to the present invention,
This text translation device
Input means for source sentence data,
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And subordinate conjunctions, relational pronouns, interrogative pronouns, relational adverbs, interrogative adverbs, interrogative words, headwords, translations, translation controls, parts of speech of phrases in the preceding and following sentence parts, conditional expressions, and idiom character strings. Range identification data,
And equipositional conjunctions, correlated conjunctions, pronouns + verbs, pronouns + auxiliary verbs + verbs, auxiliary verbs + verbs, be verbs, have verbs, do verbs, headwords, translations, translation controls, parts of speech of phrases before and after, Translation specific data consisting of sentence information including conditional expressions, idiom character strings,
A plurality of translation specifying data consisting of sentence information including prepositions, infinitives, participles, verbal nouns, headwords, translations, translation control, parts of speech of the preceding and following sentence parts, conditional expressions, and idiom character strings are stored. Dictionary storage means,
Matches source language sentence data with dictionary storage means to match source language sentence data General dictionary words and Determination means for determining the presence or absence of range specific data and translation specific data;
Translation means for converting each sentence portion within the range specified by the range specification data into an object using a general dictionary word and translation specification data;
Sentence editing output means for joining the translation result and the translation word of the range specifying data and editing and outputting it is included.

Therefore,
The input means inputs source language sentence data to be processed,
Dictionary storage means General dictionary words, and A plurality of pieces of data including sentence information including range words, translation words, translation parts, translation part information, part of speech of the sentence parts before and after, sentence expression, conditional expression, idiom character string,
The judging means collates the source language sentence data with the data in the dictionary storage means, and matches the source language sentence data. General dictionary words and Determining whether the range specifying data and the translation specifying data exist in the dictionary storage means;
The translation means converts the phrase of the section between the range identification data determined to match and the other range identification data or the beginning or end of the sentence to the target word using the translation identification data and the general dictionary phrase,
The sentence edit output means combines and edits the translation of the range specifying data determined by the determination means and the processing result by the translation means, and outputs the result in a predetermined order.
For the input source language sentence data, the range specification data is used to specify the translation range, the specified range is translated using the translation specification data, the translation result and the translation of the range specification data are joined, Because it is edited and output, it can be expected to reduce translation errors caused by the analysis result of sentence structure even for heavy sentences and compound sentences that are troublesome to translate.
[0011]
【Example】
FIG. 1 shows a block diagram of a text conversion method and apparatus as an embodiment of the present invention. This apparatus includes a display unit 1 such as a liquid crystal display for displaying input contents and conversion processing results, an input unit 2 such as a keyboard for inputting character information, a handwriting input device, an optical / magnetic character reader, and the like. Dictionary storage unit 3 for storing specific data such as Read Only Memory and Random Access Memory 3, memory unit 4 including RAM for storing control programs, input data, etc. It includes a control unit 5 that controls the dictionary storage unit 3, the memory unit 4, and the like.
[0012]
2, 3, 4, 5, 6, and 7 are flowcharts for explaining the operation of the present embodiment, and the embodiment of the present invention is described using these flowcharts.
[0013]
First, referring to FIG. 2, at the start of processing, at 201, counters used in the subsequent processing procedures, contents of work areas, and the like are initialized. 202 reads the sentence of an original language from an input means. In the next 203, it is determined whether or not the input content is a code indicating the end of the text data. If it is determined that the data is over, the process is terminated. If the text data to be processed is input, the process proceeds to 701, and the process proceeds to determination of supplement specific data and its insertion process. Thereafter, the process returns to 204. In 204, the reading pointer of the text data in the input text is set. The reading pointer in this case means a counter for sequentially extracting data from the head of the text in the area where the text has been read. Since the input text data is sequentially read and processed using this pointer, in order to read the next data after the processed data, the content value of the read pointer is updated and advanced. Initially initialized at 201 above, Target area The first value of is set. Next, in 205, the position of the previously set pointer, in this case, the character string for m digits starting from the nth digit is used, and the dictionary is indexed using the value. In this case, m is a necessary numerical value of 1 or more. Next, in 206, it is determined whether there is matching range specifying data as a result of the dictionary index 205. The dictionary stores general dictionary words, range identification data, translation identification data, supplemental identification data, and part-of-speech identification data, each of which is distinguished by a category code and draws a general dictionary as needed to obtain information such as part-of-speech Then, it collates with the range specifying data, determines the setting information conditions such as the sentence information and the conditional expression, and determines whether or not it matches the range specifying data. In the determination of the presence or absence of range specifying data, if there is a mixture of modifiers such as adverbs, that is, for example, it is assumed that there is a sentence such as Italso has ... registered with Ithas If there is range specifying data, in this case, it is determined that there is registration, and not only this also, but also other modifiers, punctuation marks, etc. are mixed, the same determination as also in this case is performed, and the specific data Judgment is made. If it is determined in 206 that there is no range specifying data, the process proceeds to 207, and in order to continue the dictionary index, m digits in the reading position pointer for the m digits from the n-th digit are initialized to 204. Return. If it is determined in 206 that there is matching range specifying data, the process proceeds to 301.
[0014]
Referring to FIG. 3, 301 determines whether there is a single matching range specifying data. For example, as an example, it is assumed that the data of “ship”, “shipping”, and “shipment” exist in the dictionary, and there are three words at the time of inputting up to “ship”. In 303, in order to continue the dictionary index, m digits in the reading position pointer for m digits from the n-th digit are counted up, and the flow returns to 205 to continue the dictionary index. If the determination at 301 is single, the process proceeds to 302. In 302, the matched range specifying data is fetched, set in the translation table, and in order to return to 204 and continue the dictionary index processing, the contents of the nth digit (start position) of the reading pointer are advanced, and the next Proceed to 304. In 304, it is determined whether or not the sentence data to be processed has ended, that is, whether or not the contents up to the end of the sentence have been matched with the dictionary. If there is still text data to be processed, the process proceeds to 303. In 303, for the subsequent dictionary index, m digits in the read position pointer for m digits from the nth digit are counted up. Then, returning to 205, matching with the dictionary is performed, and the match determination of the range specifying data is continued. If it is determined in 304 that the sentence data to be processed is completed, the process proceeds to the next 305. In 305, the contents of the translation table storing the range specifying data group matched in the previous processes are arranged, and the next Proceed to 306. In 306, the contents of the translation table are referred to and it is determined whether or not the head of the sentence is range specifying data. This is for setting the starting position of the translation processing based on the translation specifying data. If the head is not the range specifying data, the head position of the sentence is set as the translation starting position in the next 307, and the head is the range specifying data. If so, the process proceeds to 401 after setting the position of the first range specifying data in 308 as the translation start position.
[0015]
Referring to FIG. 4, in 401, the character string is sequentially checked against the dictionary while a value corresponding to m digits of the reading position pointer is advanced from the nth digit of the translation starting position set in 307 or 308. In addition, it is determined whether or not it matches the translation specific data. In next step 402, it is determined whether there is matching data or whether the data is the end. If it is determined in 402 that the data is not the end and there is matching translation specifying data, the process proceeds to 403. In 403, the position of the immediately preceding specific data or the beginning or end of the sentence is scanned. That is, for example, in the forward direction, the content is scanned from the position of the matching translation specifying data, the position of the next translation specifying data is examined, and it is set as the translation end position. If there is no translation specifying data before the position of the next range specifying data, the position of the range specifying data is set as the translation end position. Furthermore, if no range specifying data is found, the end is set as the translation end position. In the next 404, using the translation specifying data and general dictionary phrase information, the phrase between the translation start position and the translation end position set according to the scan result of 403 is translated into the target word. In this case, if there are multiple parts of speech phrases, the part of speech determination process is performed as needed using the part of speech specifying data. Depending on the setting contents such as the translation control information of the translation specific data, not only the subsequent phrase of the specific data but also the process of translating the phrases before and after the specific data and combining these target words is included. If there are modifiers such as adverbs and adjectives in the words to be translated, they are processed in the next step 501 and after.
[0016]
Referring to FIG. 5, in 501, when a phrase that does not fall within the predetermined processing target range of the translation specific data registered in the dictionary exists in the translation start / end position, for example, an adverb, adjective, etc. are included. If there are modifiers, translate them and add them to the object. In the next step 502, if the matching translation specifying data includes a verb, the object and the complement for the verb in the subject + (auxiliary verb) verb and the subsequent phrase are specified and translated. The related adverb, adjective, and other modifiers are performed in 501 described above. In the next step 503, the read pointer is advanced in the translation area with the translation start position set to the start position of the next translation range specifying data. Thereafter, the process returns to 401 to repeat the matching determination of the translation specific data. From the above-mentioned 402, when the data is over, the process proceeds to 504. Here, a supplementary translation process is performed when the translation specific data is not found or when the translation by the translation data is not sufficient. . For example, here, processing for specifying subject + verb + object / complement, subject + auxiliary verb + verb + object + complement, etc. is performed, and if it can be specified, that part is translated into an object. In the next step 505, it is determined whether or not the original word is included in the translated object, and if the original word remains, the process proceeds to 506, the original language output classification code is added before and after, and the process proceeds to 601. . If the original language is not included, the process proceeds to 601.
[0017]
Referring to FIG. 6, at 601, the object translation of specific data stored in advance in the dictionary and the object translated as a result of translation based on the translation specific data are joined and edited. Reference numeral 601 edits by adjusting the output order based on the translation control information of the specific data. Thereafter, the editing result is output at 602 and 603, and then the process returns to 202 to input the next sentence. Next, referring to FIG. 7, if there is a sentence to be processed at the sentence end determination 203, the routine proceeds to 701, where the supplementary specific data is determined and inserted. In 701, the contents of the read pointer of the data in the input sentence are set. This is the value of the processing start position in the sentence. In the next step 702, the contents of the dictionary are indexed by the data string at the position indicated by the content value of the read pointer (from the nth digit to the mth digit). After indexing in 702, the process proceeds to 704 to determine whether or not there is supplement specific data. If not, the process proceeds to 703, and the digit count indicating m digits indicating the position of the data string to be indexed is cleared. Then, the process returns to 701 to prepare for the next word processing. If there is supplement specific data in the dictionary index processing of 702, the supplement specific data is inserted in the next 705, and the process proceeds to 706. In step 706, the contents of the read pointer are advanced by the number of digits of the matching supplement specific data, and the flow advances to step 707. In 707, it is determined whether or not the data is finished. If the data is finished, the process returns to 204, and the process proceeds to the matching judgment process for the specific data. If it is not the end, the process proceeds to 708, the m-digit count of the content value of the read pointer is incremented, and then the process returns to 702 to continue the index of supplement specific data.
[0018]
FIG. 8 is an example of a source language sentence. As an example of the translation processing, (1) to (15) in this figure, the input sentence data is compared with the contents of the dictionary storing the specific data, and the number is added to the result of grouping the words based on the matched specific data. It is attached. with (translation specific data), is (translation specific data), that (translation range specific data), they (translation specific data), may (translation specific data) + overlook, and (translation specific data), as (translation range specific data) ), You (translation specific data), thee (translation specific data), and do (translation specific data) are specific data. In this example, after the sentence range is determined by the range specifying data, the translation specifying data registered in the dictionary is headed within the range, or a phrase including the translation specifying data is translated into the target word. Then, translation of modifiers including adverbs and adjectives specified in relation to them, translation of phrases corresponding to object / complement for verbs, and subject + verb, if data identification / translation has not been done so far, The phrase corresponding to the subject + auxiliary verb + verb is identified with reference to the contents of the dictionary as appropriate, and translated into the object. As a result of the above, “example of conversion from original language to target language” is shown in FIG.
[0019]
FIG. 9 is an example of conversion from the original language to the target language. The object in the intermediate stage corresponding to each part of the original language described in the left column is described in the right column, and an output example of the translation result connecting them is described in the lower part. Referring to the first line, (1) is a phrase The problem that is set immediately below with as specific data, and in this case, is delimited between the sentence head and the with. The next (2) with is registered as translation specifying data in this case. (3) In this example, the “using this method only” includes specific data for the previous “whis” and the next “is”, and is divided as a phrase between them. (4) is, (5) that, (6) they, and (7) may + overlook are respectively registered as specific data.
[0020]
In this case, (7) is delimited by the auxiliary verb may and the subsequent verb overlook. The next (8) other related is separated from the next equivalent conjunction and, (9) and is registered as specific data, (10) important topics is the specific data and the next specific This is a phrase separated from the data as. (11) as is specific data. (12) you are specific data, and (13) expect is delimited between (12) specific data you and (14) specific data they. (13) <that> under expect is inserted as supplement specific data in this example. If the supplementary specific data for insertion is registered separately as specific data for range specification or translation, translation control of the corresponding specific data is applied. (14) thee and (15) do are specific data for registration.
[0021]
For example, in this case, the translation output order proceeds from the rear to the front, and before and after (14, 15) by specifying the 15 predicates (subject / subject) Object) is changed to become a permutation of 15 and 14 (in this case, meaning that the translation of the translation proceeds from the rear in the order of 14 and 15), and then the translation of tat of the supplement specific data is inserted (12 13) in order of 13 predicates by 13 predicate designations, and in the order of 13 and 12 (translation of the translated words proceeds in the order of 13, 12, that, 15, 14, ie, 14, 15, that, 12, 13) = Organized in the order of A. Next, (11) is entered and is adjusted back and forth with the designation of 9 equal conjunctions of (8, 9, 10) including specific data and (10, 9, 8, 11, ie 11, 8, 9, The combination of the translations proceeds in the order of 10), and the subject / object is switched by the predicate specification of 7 in the next (6, 7). (Translation of translated words proceeds) = B in order, (7, 6, 10, 9, 8, 11). Next, (5) continues, and in (3, 4), the subject / object part is exchanged by specifying the predicate of 4, and in this case, (4, 3, ie, 3, 4 from the back (3) does not include specific data, and translation proceeds based on the specific data. Therefore, the processing related to (3) is not yet determined, and the following (2) with, and , With and the beginning of the sentence, including (1) The problem (translation of translations from the rear in the order of 1, 2, 3, ie 3, 2, 1), and 4 and before and after are swapped, (4, 1, 2, 3). As a result, as a whole, the translations are output in the order of “14>15>that>12>13>8>9>10>6>7>5>3>2>1> 4”. Here, an example of translation output that progresses in the forward direction from the rear has been shown, but the present invention is not limited to this. That is, for example, if there is a sentence having a connective as the first word, it is necessary to output the first part first, which corresponds to setting of related information of specific data.
[0022]
FIG. 10 shows an example of specific data, part 1. R of the data type (at the heading line, at the left end) is R of Range (range), and means range specifying data in this dictionary. Rl (R) is R data with output level information (l = L). T represents translation specific data, SU represents supplement specific data, and UP represents part of speech specific data. In this example, specific data and general dictionary words are mixed in the dictionary storage means by this type code. The keyword (on the right side) is the value of the specific data itself, and is stored in the dictionary storage means by an organization method that can directly index the data based on this value.
[0023]
The standard object (on the right) is the keyword object. In the case of a polysemy, text information or the like before and after a keyword, which will be described later, is specified, and a corresponding object is applied thereto. In the case of range specification data, the translation control (on the right) specifies the processing for translation including whether the object of the phrase that follows the range specification data is joined after or before the range specification data. specify. “-After” means that the standard object of the specific data set in advance is connected to the object of the subsequent phrase. “Previous-” means that a standard object of specific data set in advance is connected before an object of a subsequent phrase.
[0024]
Sentence information, idioms, and conditional expressions before the keyword (on the right) are grammatical information such as part of speech of the sentence part existing before the range specifying data in the sentence, antecedent phrases in the case of idiom range specifying data, Specify the co-occurrence conditions with other specific data that should be before the range specific data. Sentence information, idioms, and conditional expressions after the keyword (on the right) are grammatical information such as part of speech of the sentence part that exists after the range specification data in the text, and subsequent phrases and ranges in the case of idiom range specification data Specify the co-occurrence conditions with other specific data that should be after the specific data, etc. In the case of a keyword of ambiguous range identification data, in order to use a plurality of standard objects properly, text information and conditional expressions before and after the keyword are specified, and settings are made so that the corresponding standard objects can be applied.
[0025]
Next, referring to the example of the setting data on the first line starting with R, R represents range specifying data, “although” is a keyword, its standard object is “but”, and the translation order is “after” “,” Means that “but” is combined after the object of the subsequent phrase of “although”. Since the sentence information before the next keyword is not set in this case, it is considered that there is no condition, and the sentence information after the keyword requires a noun (n), and an article (a ), Adjectives (aj), and pronouns (pron) can exist, and they are in parentheses, so they are not required. Yes, there can be auv (auxiliary verb), adv (adverb) before the verb, and they are in parentheses, so it is not essential, and in this case the adverb is v (verb) It doesn't matter if they are mixed. v (verb) includes general verbs and be, do, have, and the like.
[0026]
The next line starting with R is an example of as. “as” is an ambiguous word, and this dictionary example is a part of the dictionary. Since the first line of “as” is similar to the case of “although”, the description is omitted, and the second line moves. The keyword is “as”, the standard object is “(no) street”, “-after”, and (adv) v is specified as the text information after the keyword. For example, as was ready state It is an example. An example of the next line is, for example, correspondence to... There is the same as the text information before the keyword, (a, aj, pron) n is set as the text information after the keyword, the noun (n) is essential, and the article (a) , Adjectives (aj), pronouns (pron) may be present, and are not required because they are in parentheses.
[0027]
The “that” that follows the next line specifies (a, aj, pron) n + (auv, adv) v as the text information after the keyword, and this is like we know that it is right. It is correspondence to sentences. In the example of “that” in the next line, SU is specified. This means that SU is the SU in the supplement and means supplement specific data. In this example, “(a, aj, pron) n + (auv, adv) v” is set as the preceding and following sentence information, and an array of phrases matching the sentence information is detected in the target sentence. Then, that is inserted between words indicated by preceding and following sentence information and translated together. The next line, “that”, is a relative pronoun “that”, and “UP” is an abbreviation for “Unique Part of speech”, which means only the part of speech. That is, it specifies the part of speech of a multi-part of speech phrase. The part of speech specification, conditional expression, and part of the character string in this dictionary example are described in the note in the lower column, and other parts of speech are not particularly necessary here and are omitted here. The setting contents of the range specifying data are set / updated in the dictionary storage means by the user or software.
[0028]
Any of ..., exception ..., PRD-BY ..., FLD-BY ... in the description in the note below) are conditional expressions that can be set together with text information etc. It can be set to either text information or text information after the keyword. Any of is a condition that can exist in any of the designated n “phrases” and “parts of speech”, and may be all or any of them, but is not allowed otherwise. “except” does not allow all the specified n “phrases” and “parts of speech”, but otherwise. ("Phrase or part of speech") and ("Phrase or part of speech") can be an "and" condition. Other examples include ("Phrase or part of speech" and "Phrase or part of speech") or ("Phrase Alternatively, it may be a compound condition such as part of speech “and” phrases or parts of speech ”). The following PRD-BY R: is an abbreviation for PReceDed BY R: and R: “phrase” “part of speech”, etc., and the phrase and part of speech specified by R = range specifying data are the condition. If T is specified instead of R, then T = translation specific data will be specified. FLD BY R: is an abbreviation for FoLowD BY R: and is conditional on R: “phrase“ or ”part-of-speech” or the like, followed by R = range specifying data. T: is a designation for the translation specific data described later. If it is other than R: or T :, the character string designation of the general phrase is used instead of the range specifying data and the translation specifying data. Each text information designation and conditional expression before and after the keyword can be handled as an and or condition.
[0029]
FIG. 11 shows an example of specific data, part 2. The left end of the heading row is a data type, and in this case, T (Translation) meaning translation. The next right side is a keyword of translation specific data, and is set in the dictionary storage means based on this value. The following is the standard object of translation specific data. Subsequent translation control is based on the case of range specification data, but “-description”, “-etc.”, “Main-”, etc. will be explained later. Sentence information, idioms, and conditional expressions before the next keyword, and sentence information, idioms, and conditional expressions after the keyword are a designation method according to the above-described range specifying data.
[0030]
Moving to the first line starting with T, T indicates translation specific data, the keyword is “and”, the standard object is “and”, and the text information, idioms, and conditional expressions before and after the corresponding keyword. specify. The translation control is “−equal −” = equal conjunction, and the words before and after are connected as equivalence. As text information before and after the keyword, there are (a, aj, pron) n, n (noun) is indispensable and not indispensable, but before that, a (article), aj (adjective), pron (pronoun) ) May be present. The two pieces of information in the next two lines before and after the next are examples of text information before and after the keyword, and both are examples of information for specifying the translation specifying data and. One of them, r-pn + (auv, adv) v + o / s, comes first with r-pn (relative pronoun), then in parentheses, auv = auxiliary verb, adv = adverb V = verb is essential, and then not required, but o / s = object / complement in parentheses may exist.
[0031]
As a result of the determination of the information as described above, when the condition is met, the phrases before and after “and” are connected in equal positions, not in a form in which one is subordinate to the other. Next, the next line, do, will be described. Regarding “do” of the standard object of do, in this case, there should be a subject before do, followed by an object (complement), and text information before and after the keyword is set for that purpose. . That is, in this case, in the previous part, n (noun) is essential, and a (article), aj (adjective), and pron (pronoun) are in parentheses. means. pron can be replaced with n. In the latter part, it is shown that auv (auxiliary verb), adv (adverb), and v (verb) are not essential but may exist.
[0032]
The example of the translation specifying data, is, and May in the next line has the same “description” designation as do, and conforms to the case of do. The next line of to is the case of to infinitive, for example, the first line is to go, not tosee (including the adverb before), and the like. The second line of to is a noun usage and is a case of He began to rough or the like. The third and fourth lines of to are application examples such as where to go (where to go) and where to date (where to date) in the form of interrogative + to do.
[0033]
The fifth line of to is a general preposition usage, such as going to (bookstore), up to (10 years old). The next line is an example of thee, and as a pronoun, it is not necessary, but is followed by (adverb, auxiliary), followed by a verb, and then a noun. There is a lot of preposition expressions in the “with” in the next line. Here, an example of “de”, which is frequently used for means (tool), material (content), start (end), etc., is given. “with * ving” is an example of “with + current participle”. The first line of “you” on the next line is the subject “you”, followed by a verb, a noun, and the like. The second line of “you” is the target “you”, and is distinguished by phrase information before and after the designation.
[0034]
12 and 13 are examples of general dictionary phrases. The left end of the heading column is a data type, and in this case, G (General). In this example, the general dictionary word / phrase is stored in the same dictionary storage means together with the range specifying data and the translation specifying data by an organization method that allows direct reference to the general dictionary words / phrases. The next headword is a keyword of a general dictionary phrase. Data is organized and stored based on this value. The next part-of-speech code is information that distinguishes parts of speech such as n (noun), pron (pronoun), v (verb). Although it is the same as the part of speech classification in the example of the range specifying data and the translation specifying data, it holds basic word / phrase information and is referred to at each processing stage. Here, vi (automatic verb), vt (transitive verb) Etc. are also made. The next attribute code includes the field, characteristic, etc. to which the phrase belongs, and description of other related phrase information is omitted here. Moving on to the first line beginning with G in FIG. 12, G indicates that this is a general dictionary word / phrase, the headword word / phrase is “and”, and the part-of-speech code is conj (conjunction). The translation often has multiple meanings for each part of speech, and it is necessary to assign an appropriate translation based on the analysis result of the contents of the input source language sentence. Necessary and sufficient items are taken into the dictionary as ambiguous important words / phrases as range specifying data and translation specifying data, and an appropriate object translation is expected.
[0035]
【The invention's effect】
According to the present invention,
An input step for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And the range specification data for specifying the translation range, and the translation specification data for the specific range translation, the headword, translation, translation control information, the part of speech, the conditional expression, and the idiom character string A dictionary storage step for storing a plurality of pieces of data including sentence information,
When the source language sentence data is input from the input step, the dictionary storage step is collated, and in the source language sentence data, General dictionary words and Range identification data And translation specific data A determination step for determining whether there is data that matches
If it is determined in the determination step that there is matching data, the range specifying data and other range specifying data in the source language sentence, or the words and phrases in the section to the beginning or end of the sentence, using the general dictionary words and translation specifying data A translation step to convert it into an object translation;
It consists of a sentence edit output step for connecting the translation result of the translation step and the translation of the preset range specifying data and editing and outputting the translation result.
Therefore, parts that are prone to errors in translation, such as long sentences, are specified using the preset range specification data, and the specified sentence portion is used using translation specification data and general dictionary phrases. As the translation process proceeds, you can expect translation results with few errors.
[0036]
According to the present invention,
An input means for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And the range specification data for specifying the translation range, headword, translation, translation control information, part of speech of the phrase part before and after, conditional expression, sentence information including idiom character string,
And sentences containing translation words, translations, translation controls, parts of speech, conditional expressions, and idiom character strings of the preceding and following sentences in the translation identification data for translating the words in the sentence parts delimited by the range identification data Dictionary storage means for storing a plurality of information;
The original sentence text data input from the input means is compared with the dictionary storage means, General dictionary words and Determining means for determining whether there is data that matches the range specifying data and the translation specifying data;
If it is determined by the determination means that the words match, the word in the section between the range specification data and other range specification data or the beginning or end of the sentence is converted into the object using the general dictionary words and translation specification data in the dictionary storage means. Translation means to convert;
It consists of sentence editing output means for connecting the translation result of the translation means and the translated word of the range specifying data, and editing and outputting the translation result.
Therefore, parts that are difficult to translate or can be standardized are registered in advance in the dictionary storage means as range specification data and translation specification data, and the sentence parts specified thereby are translated using translation specification data and general dictionary phrases. As processing proceeds, translation processing with few syntax errors can be expected.
[0037]
Moreover, according to the present invention,
Range consisting of subordinate conjunctions, relational pronouns, interrogative pronouns, relational adverbs, interrogative adverbs, interrogatives, headwords, translations, translation control information, part of speech of phrases in the preceding and following sentence parts, conditional expressions, and sentence information including idiom character strings A dictionary storage means for storing a plurality of specific data is provided.
Therefore, it is possible to select a specific part of speech or character code string in advance as necessary, set range specifying data, and cope with translation of various sentences.
[0038]
Moreover, according to the present invention,
When the connected expression phrase including the correlated conjunction is composed of a plurality of phrases, and the order of the phrases is not continuous in the sentence, a dictionary storage unit is provided that stores the subsequent portion as related information of the range specifying data.
Therefore, it is possible to reliably determine whether or not various connection expression phrases including correlated conjunctions are included.
[0039]
Moreover, according to the present invention,
Coordinate conjunction, proper noun, proper noun + verb, proper noun + auxiliary verb, proper noun + auxiliary verb + verb, pronoun, pronoun + verb, pronoun + auxiliary verb, pronoun + auxiliary verb + verb, auxiliary verb + verb, be verb, have verb, It includes dictionary storage means for storing a plurality of translation specifying data consisting of heading phrases, translations, translation control information, part-of-speech phrases in the preceding and following sentence parts, conditional expressions, and sentence information including idiom character strings.
Accordingly, if necessary, a specific part of speech or character string is selected, translation specific data is set, and translation processing corresponding to various sentences can be performed.
[0040]
Moreover, according to the present invention,
Dictionary storage that stores multiple translation-specific data consisting of prepositions, infinitives, participles, verbal nouns, headwords, translations, translation control, part of speech of phrases before and after sentences, conditional expressions, and idioms Means.
Accordingly, if necessary, a specific part of speech or character string is selected in advance, translation specific data is set, and translation processing corresponding to various sentences can be performed.
[0041]
Moreover, according to the present invention,
The range specifying data and the translation specifying data include the sentence information of a part or all of the words in the sentence portion that should be before and after that, to the other immediately preceding and following the range specifying data or translation specifying data or the beginning or end of the sentence. Include
[0042]
Therefore, the text information of the preceding and following words of the range specifying data and the translation specifying data, and other related information with the range specifying data and the translation specifying data are registered in the dictionary storage means, the input sentence data, the range specifying data and the translation Matching with specific data can be ensured.
[0043]
[Brief description of the drawings]
FIG. 1 is a block diagram of a processing apparatus for realizing a text translation method and apparatus according to an embodiment of the present invention.
FIG. 2 is a flow for determining whether or not there is text input, a dictionary index of range specifying data, and translation specifying data according to an embodiment of the present invention.
FIG. 3 is an example of a unique (single) determination of a range index data dictionary index result, an end determination of sentence data for range determination, and an initial dictionary index of specific data for translation according to an embodiment of the present invention; It is a flow of processing.
FIG. 4 is a flow of a dictionary index process for translation specific data, an end determination of sentence data to be translated based on the translation specific data, and a translation process according to an embodiment of the present invention.
FIG. 5 shows translation of modifiers including adverbs, translation target data including verbs, translation of phrases corresponding to complements, and others in relation to translation processing based on translation specific data according to an embodiment of the present invention. This is a flow of processing in the case where a phrase and a subject + verb, subject + auxiliary verb + verb are identified and translated, and the translation result includes the original word.
FIG. 6 is a flow of connecting an object of range specifying data, translation specifying data, and a translation result of a word including or following the range specifying data according to an embodiment of the present invention, and adjusting and outputting an output order;
FIG. 7 is a flow of replenishment specific data determination and insertion processing according to an embodiment of the present invention.
FIG. 8 is an example of a source language sentence according to an embodiment of the present invention.
FIG. 9 is an example of conversion from an original word to an object according to an embodiment of the present invention.
FIG. 10 is a first example of specific data according to an embodiment of the present invention.
FIG. 11 is a second example of specific data according to an embodiment of the present invention.
FIG. 12 is a first example of a general dictionary word / phrase according to an embodiment of the present invention;
FIG. 13 is a second example of a general dictionary word / phrase according to an embodiment of the present invention.
[Explanation of symbols]
1 Display section
2 Input section
3 Dictionary storage
4 Memory section
5 Control unit

Claims (7)

コンピュータが実行するテキスト翻訳方法であって、
原語文章データを入力する入力ステップと、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲特定のための、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、前記範囲特定データによって特定された範囲の翻訳のための、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶ステップと、
前記入力ステップで入力された原語文章データと、前記複数記憶する辞書記憶ステップで記憶された一般辞書語句及び範囲特定データ及び翻訳特定データの登録内容を照合し、合致するデータが前記原語文章データの中にあるか否かを判定する判定ステップと、
前記判定ステップにより、前記範囲特定データと合致すると判定されたデータと、その他の前記範囲特定データと合致すると判定されたデータ又は文頭又は文末との間の区間にある語句の中、
前記翻訳特定データと合致したデータから、その他の前記翻訳特定データと合致したデータ又は前記区間の冒頭又は前記区間の終わりまでの語句を、前記翻訳特定データ及び一般辞書語句を用いて、目的語に変換する翻訳ステップと、
前記翻訳ステップで変換された目的語と、前記範囲特定データの訳語を結び、前記範囲特定データ及び翻訳特定データの翻訳制御情報により語順を調整し、編集出力する文章編集出力ステップを備えることを特徴とするテキスト翻訳方法。
A text translation method executed by a computer,
An input step for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And range specification data comprising sentence information including headwords, translations, translation control information, parts of speech of phrases in the preceding and following sentence parts, conditional expressions, and idiom character strings for specifying a translation range,
And translation specification data comprising sentence information including headwords, translations, translation control information, part of speech of phrases in the preceding and following sentence parts, conditional expressions, and idiom character strings for translation of the range specified by the range specification data A dictionary storage step for storing a plurality of
The source sentence text data input in the input step is compared with the registered contents of the general dictionary words and range specification data and translation specification data stored in the dictionary storage step for storing a plurality of data. A determination step of determining whether or not
Among the words in the section between the data determined to match the range specifying data and the data determined to match the other range specifying data or the beginning or end of the sentence by the determining step,
The data from the data that matches the translation specific data to the data that matches the other translation specific data or the words from the beginning of the section or the end of the section are converted into the object using the translation specific data and the general dictionary phrase. A translation step to convert,
A sentence editing output step of connecting the target word converted in the translation step and the translated word of the range specifying data, adjusting a word order according to the translation control information of the range specifying data and the translation specifying data, and editing and outputting the word order; A text translation method.
原語文章データを入力する入力手段と、
見出し語句、品詞コード、訳語、属性その他情報を含む一般辞書語句、
及び、翻訳範囲特定のための、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データ、
及び、前記範囲特定データによって特定された範囲の翻訳のための、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する辞書記憶手段と、
前記入力手段から入力された原語文章データと前記辞書記憶手段に記憶された一般辞書語句及び範囲特定データ及び翻訳特定データの登録内容を照合し、合致するデータがあるか否かを判定する判定手段と、
前記判定手段により、前記範囲特定データと合致すると判定されたデータと、その他の前記範囲特定データと合致すると判定されたデータ又は文頭又は文末の間の区間にある語句の中、前記翻訳特定データと合致したデータを含み、前記翻訳特定データと合致したデータから、その他の前記翻訳特定データと合致したデータ又は前記区間の冒頭又は前記区間の終わりまでの語句を、前記翻訳特定データ及び一般辞書語句を用いて、目的語に変換する翻訳手段と、
前記翻訳手段による目的語と、前記範囲特定データの訳語を結び、前記範囲特定データ及び翻訳特定データの翻訳制御情報により語順を調整し、編集出力する文章編集出力手段を備えることを特徴とするテキスト翻訳装置。
An input means for inputting source language sentence data;
General dictionary phrases including headwords, part of speech codes, translations, attributes and other information,
And range specification data comprising sentence information including headwords, translations, translation control information, parts of speech of phrases in the preceding and following sentence parts, conditional expressions, and idiom character strings for specifying a translation range,
And translation specification data comprising sentence information including headwords, translations, translation control information, part of speech of phrases in the preceding and following sentence parts, conditional expressions, and idiom character strings for translation of the range specified by the range specification data Dictionary storage means for storing a plurality of
Judgment means for collating the original sentence text data input from the input means with the registered contents of the general dictionary words and range specification data and translation specification data stored in the dictionary storage means and determining whether or not there is matching data When,
Among the data determined to match the range specifying data by the determining means and the data determined to match the other range specifying data or the phrase in the section between the beginning or end of the sentence, the translation specifying data and Including matching data, data matching the translation specifying data, other data matching the translation specifying data, or words from the beginning of the section or the end of the section, the translation specifying data and general dictionary words Using translation means to convert to the object,
A text editing output unit that connects a target word by the translation unit and a translation of the range specification data, adjusts the word order according to the translation control information of the range specification data and the translation specification data, and edits and outputs the text. Translation device.
前記請求項2に記載のテキスト翻訳装置に於て、従属接続詞、関係代名詞、疑問代名詞、関係副詞、疑問副詞、疑問詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる範囲特定データを、複数記憶する前記辞書記憶手段を備えることを特徴とするテキスト翻訳装置。  3. The text translation apparatus according to claim 2, wherein the subordinate conjunction, the relative pronoun, the interrogative pronoun, the relative adverb, the interrogative adverb, the interrogative, the headword phrase, the translation, the translation control information, and the part of speech of the preceding and following sentence parts. A text translation apparatus comprising the dictionary storage means for storing a plurality of range specifying data including sentence information including conditional expressions and idiom character strings. 前記請求項3に記載のテキスト翻訳装置に於て、接続に関わる語句の先頭部分の文字記号列に他の語句が続き、前記の他の語句の後に、前記接続に関わる語句の後続部分の文字記号列がある形式の相関接続詞を含む語句に対し、その後続部分も関連情報として保持する前記範囲特定データを、複数記憶する前記辞書記憶手段を備える事を特徴とするテキスト翻訳装置。  4. The text translation apparatus according to claim 3, wherein another word follows the character symbol string at the beginning of the word related to connection, and the character of the subsequent part of the word related to connection after the other word. A text translation apparatus comprising the dictionary storage means for storing a plurality of the range specifying data for holding a subsequent part as related information for a phrase including a correlated connective in a certain form of a symbol string. 前記請求項2に記載のテキスト翻訳装置に於て、等位接続詞、固有名詞、固有名詞+動詞、固有名詞+助動詞、固有名詞+助動詞+動詞、代名詞、代名詞+動詞、代名詞+助動詞、代名詞+助動詞+動詞、助動詞+動詞、be動詞、have動詞、do動詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する前記辞書記憶手段を備える事を特徴とするテキスト翻訳装置。  3. The text translation apparatus according to claim 2, wherein the equivalence conjunction, proper noun, proper noun + verb, proper noun + auxiliary verb, proper noun + auxiliary verb + verb, pronoun, pronoun + verb, pronoun + auxiliary verb, pronoun + Translation specification consisting of auxiliary verbs + verbs, auxiliary verbs + verbs, be verbs, have verbs, do verbs, headwords, translations, translation control information, parts of speech of phrases before and after, sentence expressions, conditional expressions, idioms A text translation apparatus comprising the dictionary storage means for storing a plurality of data. 前記請求項2に記載のテキスト翻訳装置に於て、前置詞、不定詞、分詞、動名詞の、見出し語句、訳語、翻訳制御情報、前後の文章部分の語句の品詞、条件式、熟語文字列を含む文章情報からなる翻訳特定データを、複数記憶する前記辞書記憶手段を備える事を特徴とするテキスト翻訳装置。  The text translation apparatus according to claim 2, wherein prepositions, infinitives, participles, verbal nouns, headwords, translations, translation control information, parts of speech of phrases before and after, sentence expressions, idioms, A text translation apparatus comprising the dictionary storage means for storing a plurality of translation specifying data including sentence information. 前記請求項2に記載のテキスト翻訳装置に於て、前記辞書記憶手段が記憶する前記範囲特定データ及び翻訳特定データが、前記範囲特定データ又は翻訳特定データの前後にあるべき文章部分の中、前後の直近の他の前記範囲特定データ又は翻訳特定データ、又は、文頭、又は、文末、までの、一部又は全部の語句の文章情報を含む事を特徴とするテキスト翻訳装置。  3. The text translation apparatus according to claim 2, wherein the range specifying data and the translation specifying data stored in the dictionary storage means are located before and after the sentence portion that should be before and after the range specifying data or the translation specifying data. A text translation apparatus comprising text information of a part or all of the words up to the other range specifying data or translation specifying data, or the beginning or end of a sentence.
JP27998497A 1996-09-30 1997-09-27 Text translation method and apparatus Expired - Fee Related JP4361143B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27998497A JP4361143B2 (en) 1996-09-30 1997-09-27 Text translation method and apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-294325 1996-09-30
JP29432596 1996-09-30
JP27998497A JP4361143B2 (en) 1996-09-30 1997-09-27 Text translation method and apparatus

Publications (2)

Publication Number Publication Date
JPH10154146A JPH10154146A (en) 1998-06-09
JP4361143B2 true JP4361143B2 (en) 2009-11-11

Family

ID=26553564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27998497A Expired - Fee Related JP4361143B2 (en) 1996-09-30 1997-09-27 Text translation method and apparatus

Country Status (1)

Country Link
JP (1) JP4361143B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472026B (en) * 2019-07-15 2024-08-27 中国平安人寿保险股份有限公司 Text information processing method and system, readable storage medium and terminal equipment

Also Published As

Publication number Publication date
JPH10154146A (en) 1998-06-09

Similar Documents

Publication Publication Date Title
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US5903858A (en) Translation machine for editing a original text by rewriting the same and translating the rewrote one
US5890103A (en) Method and apparatus for improved tokenization of natural language text
JP3220560B2 (en) Machine translation equipment
US4831529A (en) Machine translation system
US4964044A (en) Machine translation system including semantic information indicative of plural and singular terms
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
GB2234614A (en) Machine translation apparatus
US20160335254A1 (en) Machine Translation System and Method
US5299124A (en) Translation machine capable of analyzing syntactic of sentence
US4964030A (en) Apparatus for translating sentences containing punctuation marks
US5353221A (en) Translation machine capable of translating sentence with ambiguous parallel disposition of words and/or phrases
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JP4361143B2 (en) Text translation method and apparatus
USRE35464E (en) Apparatus and method for translating sentences containing punctuation marks
JP4361146B2 (en) Text translation device and recording medium
Harper et al. The use of machines in the construction of a grammar and computer program for structural analysis
Sagot et al. From raw corpus to word lattices: robust pre-parsing processing
JP2697926B2 (en) Natural language processor
JPH052605A (en) Machine translation system
JP2966473B2 (en) Document creation device
JP3884001B2 (en) Language analysis system and method
JP2719453B2 (en) Machine translation equipment

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070908

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090812

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees