JPH0728821A - Text processor - Google Patents

Text processor

Info

Publication number
JPH0728821A
JPH0728821A JP5169443A JP16944393A JPH0728821A JP H0728821 A JPH0728821 A JP H0728821A JP 5169443 A JP5169443 A JP 5169443A JP 16944393 A JP16944393 A JP 16944393A JP H0728821 A JPH0728821 A JP H0728821A
Authority
JP
Japan
Prior art keywords
definition
morphological analysis
speech
attribute
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5169443A
Other languages
Japanese (ja)
Inventor
Wataru Nagami
渡 永見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5169443A priority Critical patent/JPH0728821A/en
Publication of JPH0728821A publication Critical patent/JPH0728821A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To generate a proper translation in accordance with a pattern match definition and an action definition by presenting the vocabulary information of the original by utilizing a machine translation engine and correcting the information by these definitions by looking at the information by a user. CONSTITUTION:This processor is provided with a machine translation engine 21, a morpheme analysis calling part 2 calling a morpheme analysis for an inputted original, a vocabulary information output processing part 3 taking out parts of speech and representative attributes for each word for which the morpheme analysis is performed by referring to a vocabulary information table 8 and a processing execution part 6 generating a translation by performing a processing in accordance with the action definition 14 when a matching is obtained by performing a pattern collation with the pattern match definition 13 in a preliminarily prepared tuning definition 12 based on the word of the inputted original, the taken out parts of speech and a grammar attribute.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、機械翻訳エンジンを利
用してテキスト処理を行なうテキスト処理装置に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a text processing device which uses a machine translation engine to perform text processing.

【0002】[0002]

【従来の技術】現状の機械翻訳は、入力された原文を形
態素解析および構文解析して構造化表現にした後、翻訳
対象の言語の構造化表現にして翻訳文を生成している。
この際、文法や辞書を使用するため、これらを整備して
より完全な翻訳文を作成できるようにすることが行われ
ている。
2. Description of the Related Art In the current machine translation, an input original sentence is morphologically and syntactically analyzed into a structured representation, and then the translated sentence is formed into a structured representation of a language to be translated.
At this time, since a grammar and a dictionary are used, these are maintained so that a more complete translation can be created.

【0003】また、通常、文書を編集する場合、ワープ
ロを用いて行なうが、これは利用者が全て文書の構造や
内容を考慮して一々修正などするようにしている。
Usually, when a document is edited, a word processor is used, but this is done by the user in consideration of the structure and contents of the document.

【0004】[0004]

【発明が解決しようとする課題】上述した前者の機械翻
訳は、完全な訳を生成することが難しい。文法や辞書の
整備を重ねても、ユーザが満足する完全な訳はでてこな
い場合がある。翻訳結果が正当であっても、ユーザの希
望通りの訳でないと、失敗文と同等の扱いをされてしま
うという問題があった。
It is difficult for the former machine translation described above to generate a complete translation. Even if the grammar and dictionaries are improved, it may not be possible to obtain the perfect translation for the user. Even if the translation result is valid, there is a problem that if the translation is not as desired by the user, it will be treated in the same way as the failed sentence.

【0005】また、上述した後者のワープロなどによる
文書の編集は、作成された文書を操作するには不十分で
あり、字面のパターンマッチングや変更に過ぎない。資
産である文書から、有効な情報を活用してより望ましい
文書に操作することができず、テキスト処理が不十分で
あるという問題があった。
Further, the editing of the document by the latter word processor or the like described above is not sufficient for operating the created document, and is merely pattern matching or change of the letter surface. There is a problem that text processing is insufficient because it is not possible to operate a more desirable document by utilizing valid information from a document which is an asset.

【0006】本発明は、これらの問題を解決するため、
機械翻訳エンジンを利用して原文の語彙情報を提示し、
ユーザがこれを見てパターンマッチ定義およびアクショ
ン定義によって修正し、これら定義に従った適切な訳文
を生成することを目的としている。
The present invention solves these problems.
Present the original vocabulary information using a machine translation engine,
The user sees this and corrects it by the pattern matching definition and the action definition, and the purpose is to generate an appropriate translated sentence according to these definitions.

【0007】[0007]

【課題を解決するための手段】図1は、本発明の原理構
成図を示す。図1において、形態素解析呼び出し部2
は、入力された原文について形態素解析を呼び出して形
態素解析させるものである。
FIG. 1 is a block diagram showing the principle of the present invention. In FIG. 1, the morphological analysis calling unit 2
Is to call the morphological analysis for the input original sentence to perform morphological analysis.

【0008】語彙情報出力処理部3は、形態素解析した
各単語について、語彙情報テーブル8を参照して品詞、
代表属性を取り出したり、あるいは形態素解析した各単
語について、辞書9を検索して取り出した暗号化されて
いる文法属性をもとに絞り込みテーブル10を検索して
暗号化されている代表属性を取り出し、この取り出した
暗号化されている代表属性について対応コードテーブル
11を参照して品詞、代表属性を取り出したりするもの
である。
The vocabulary information output processing unit 3 refers to the vocabulary information table 8 for each word subjected to morphological analysis,
For each word whose representative attribute is extracted or morphologically analyzed, the dictionary 9 is searched and the narrowed table 10 is searched based on the encrypted grammatical attribute extracted and the encrypted representative attribute is extracted. The part of speech and the representative attribute of the extracted encrypted representative attribute are referred to by referring to the corresponding code table 11.

【0009】処理実行部6は、入力された原文の単語お
よび取り出した品詞、文法属性をもとに、予め作成した
チューニング定義12中のパターンマッチ定義13とパ
ターン照合して一致したときに、それのアクション定義
14に従い、処理を行って翻訳文を生成するものであ
る。
The processing execution unit 6 performs pattern matching with the pattern match definition 13 in the tuning definition 12 created in advance based on the input original sentence word, the extracted part-of-speech, and grammatical attribute, and when there is a match, it According to the action definition 14 of No. 1, processing is performed to generate a translated sentence.

【0010】機械翻訳エンジン21は、形態素解析、構
文解析、および訳文生成するものである。
The machine translation engine 21 is for morphological analysis, syntactic analysis, and translation generation.

【0011】[0011]

【作用】本発明は、図1に示すように、入力された原文
について、形態素解析呼び出し部2が機械翻訳エンジン
21の形態素解析を呼び出して形態素解析を行わせ、そ
の結果の単語について、語彙情報出力処理部3が語彙情
報テーブル8を参照して品詞、代表属性を取り出し、処
理実行部6が入力された原文の単語および取り出した品
詞、文法属性をもとに、予め作成したチューニング定義
12中のパターンマッチ定義13とパターン照合して一
致したときに、それのアクション定義14に従い、処理
を行って翻訳文を生成するようにしている。
According to the present invention, as shown in FIG. 1, the morpheme analysis calling unit 2 calls the morpheme analysis of the machine translation engine 21 to perform morpheme analysis on the input original sentence, and the vocabulary information about the resulting word is used. The output processing unit 3 refers to the vocabulary information table 8 to extract a part of speech and a representative attribute, and the process execution unit 6 extracts a part of speech and a grammatical attribute from the original sentence input word and the extracted part of speech and grammatical attribute. When the pattern is matched with the pattern match definition 13 of No. 1 and is matched, the processing is performed according to the action definition 14 to generate a translated sentence.

【0012】また、入力された原文について、形態素解
析呼び出し部2が機械翻訳エンジン21の形態素解析を
呼び出して形態素解析を行わせ、その結果の単語につい
て、語彙情報出力処理部3が辞書9を検索して取り出し
た暗号化されている文法属性をもとに絞り込みテーブル
10を検索して暗号化されている代表属性を取り出し、
この取り出した暗号化されている代表属性について対応
コードテーブル11を参照して品詞、代表属性を取り出
し、処理実行部6が入力された原文の単語および取り出
した品詞、文法属性をもとに、予め作成したチューニン
グ定義12中のパターンマッチ定義13とパターン照合
して一致したときに、それのアクション定義14に従
い、処理を行って翻訳文を生成するようにしている。
The morphological analysis calling unit 2 calls the morphological analysis of the machine translation engine 21 to perform morphological analysis on the input original sentence, and the lexical information output processing unit 3 searches the dictionary 9 for the resulting word. Then, based on the encrypted grammatical attribute extracted, the narrowing table 10 is searched to extract the encrypted representative attribute,
With respect to the extracted representative attribute, the part-of-speech and the representative attribute are extracted with reference to the correspondence code table 11, and the processing execution unit 6 preliminarily uses the input original word and the extracted part-of-speech and grammar attribute. When the pattern matching definition 13 in the created tuning definition 12 is matched with the pattern, the action definition 14 is processed to generate a translated sentence.

【0013】これらの際に、入力された原文の単語およ
び取り出した品詞、文法属性について、単語の表記を取
り除くあるいは正規表現で表現したパターンマッチ定義
13、およびこのパターンマッチ定義13に合致したパ
ターンに対する処理を定義したアクション定義14を予
め作成して保存するようにしている。
In these cases, with respect to the input original sentence word, the extracted part-of-speech, and grammatical attribute, the pattern match definition 13 in which the word notation is removed or expressed by a regular expression, and the pattern matching the pattern match definition 13 are applied. The action definition 14 defining the process is created in advance and saved.

【0014】従って、機械翻訳エンジンを利用して原文
の語彙情報を提示し、ユーザがこれを見てパターンマッ
チ定義13およびアクション定義14によって修正して
保存し、これら定義に従った適切な訳文を自動生成する
ことが可能となる。
Therefore, the vocabulary information of the original sentence is presented by using the machine translation engine, the user sees this and corrects it by the pattern matching definition 13 and the action definition 14 and saves it. It can be automatically generated.

【0015】[0015]

【実施例】次に、図1から図5を用いて本発明の実施例
の構成および動作を順次詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the construction and operation of an embodiment of the present invention will be described in detail with reference to FIGS.

【0016】図1は、本発明の原理構成図を示す。図1
において、機械翻訳エンジン付テキスト処理装置1は、
機械翻訳エンジン21を利用して訳文を生成するテキス
ト処理装置であって、形態素解析呼び出し部2、語彙情
報出力処理部3、チューニング制御部4、および結果出
力部7などから構成されるものである。
FIG. 1 is a block diagram showing the principle of the present invention. Figure 1
In the text processing device 1 with a machine translation engine,
A text processing apparatus that uses the machine translation engine 21 to generate a translated sentence, and includes a morphological analysis calling unit 2, a vocabulary information output processing unit 3, a tuning control unit 4, a result output unit 7, and the like. .

【0017】形態素解析呼び出し部2は、入力された原
文を形態素解析するために、機械翻訳エンジン21中の
形態素解析22を呼び出し、原文の形態素解析を依頼す
るものである。
The morphological analysis calling unit 2 calls the morphological analysis 22 in the machine translation engine 21 to request morphological analysis of the original sentence in order to perform morphological analysis of the input original sentence.

【0018】語彙情報出力処理部3は、入力された原文
の単語の語彙情報を生成し、語彙情報テーブル8に保存
したりなどするものである(図2参照)。チューニング
制御部4は、入力された原文が、予め作成して保存した
パターンマッチング定義13のいずれにマッチするか判
別し、マッチしたときにそのアクション定義14に従っ
て処理を実行する処理実行部6などから構成されるもの
である(図4参照)。
The vocabulary information output processing unit 3 generates vocabulary information of the input original word and stores it in the vocabulary information table 8 (see FIG. 2). The tuning control unit 4 determines which of the pattern matching definitions 13 created and stored in advance matches the input original sentence, and when matching, executes the process according to the action definition 14 from the process execution unit 6 or the like. It is configured (see FIG. 4).

【0019】マッチング処理部5は、入力された原文を
形態素解析した単語の語彙情報(品詞、文法属性など)
と、予め定義して保存したチューニング定義12中のパ
ターンマッチング定義13とのマッチングを行い、一致
するものを見つけるものである。
The matching processing unit 5 performs morphological analysis on the input original sentence to obtain vocabulary information (part of speech, grammatical attribute, etc.).
And the pattern matching definition 13 in the tuning definition 12 which is defined and saved in advance, and the matching one is found.

【0020】処理実行部6は、マッチング処理部5によ
ってマッチングするパターンマッチング定義13が見つ
かったときに、これのアクション定義14に従った処理
を実行するものである。
When the matching processing unit 5 finds a matching pattern matching definition 13, the processing executing unit 6 executes processing according to the action definition 14.

【0021】結果出力部7は、訳文を生成した結果など
を出力するものである。語彙情報テーブル8は、語彙情
報出力処理部3が生成した語彙情報(品詞、文法属性な
ど)を保存したものである(図3の(d)参照)。
The result output unit 7 outputs the result of generating a translated sentence. The vocabulary information table 8 stores vocabulary information (part of speech, grammatical attributes, etc.) generated by the vocabulary information output processing unit 3 (see (d) of FIG. 3).

【0022】辞書9は、表記に対応づけて暗号化された
文法属性を予め登録した辞書である。絞り込みテーブル
10は、辞書9から検索した暗号化された文法属性から
代表属性を取り出すためのテーブルである(図3の
(b)参照)。
The dictionary 9 is a dictionary in which grammatical attributes encrypted in association with the notation are registered in advance. The narrowing table 10 is a table for extracting a representative attribute from the encrypted grammatical attributes retrieved from the dictionary 9 (see (b) of FIG. 3).

【0023】対応テーブル11は、絞り込みテーブル1
0から取り出した暗号化された代表属性に対応づけて、
暗号化されていない文法属性および品詞を予め登録した
ものである。
The correspondence table 11 is the narrowing table 1
Corresponding to the encrypted representative attribute extracted from 0,
The grammatical attributes and parts of speech that are not encrypted are registered in advance.

【0024】チューニング定義12は、訳文をチューニ
ングするための定義であって、パターンマッチ定義13
およびアクション定義14から構成されるものである。
パターンマッチ定義13は、入力された原文の単語およ
び語彙情報のパターンに適用するアクション定義14を
見つけるためのパターンを予め定義したものである。例
えば −−,名詞,TOOL;*;に;誤り;が;あっ;た である。ここで、−−は表記除去を表し、*は正規表現
であって任意の文字列を表す。
The tuning definition 12 is a definition for tuning a translated sentence, and is a pattern match definition 13
And action definition 14.
The pattern match definition 13 defines in advance a pattern for finding an action definition 14 to be applied to the input original sentence word and vocabulary information pattern. For example,-, noun, TOOL; *; in; error; Here, −− represents notation removal, * represents a regular expression and represents an arbitrary character string.

【0025】アクション定義14は、パターンマッチ定
義13に、原文の単語および語彙情報のパターンが一致
したときに、実行する処理内容を定義したものである。
例えば (F:DICT $1);contain(F:CON $1);an;error;. である。ここで、(F:DICT $1)は1番目($1)の単語
を辞書引き(F:DICT)するを表す。contain(F:CO
N $1)は1番目の単語に活用(F:CON)を依存さ
せ、cotainsあるいはcotainにするを表す。これらの機
能を含め、アクション定義で使用する機能には下記のよ
うなものがある。
The action definition 14 defines the processing content to be executed when the pattern of the original sentence and the vocabulary information match the pattern match definition 13.
For example (F: DICT $ 1); contain (F: CON $ 1); an; error ;. Here, (F: DICT $ 1) means to look up the first ($ 1) word in the dictionary (F: DICT). contain (F: CO
(N $ 1) indicates that the first word depends on the conjugation (F: CON) and is made into cotains or cotain. Including these functions, the following functions are used in the action definition.

【0026】DICT:辞書引き CON:活用 TRANS:翻訳 ファイル名:ユーザツール(データはパイプ渡し) PUT:標準出力に続く文字列を出力 次に、図2のフローチャートに示す順序に従い、語彙情
報およびアクション定義を作成するときの動作を詳細に
説明する。
DICT: Dictionary lookup CON: Utilization TRANS: Translation file name: User tool (data is piped) PUT: Output character string following standard output Next, in accordance with the order shown in the flowchart of FIG. 2, vocabulary information and actions The operation when creating a definition will be described in detail.

【0027】図2において、S1は、原文を読み込む。
これは、例えば右側に記載した原文 コパイラ処理に誤りがあった (1) を読み込む。
In FIG. 2, S1 reads the original sentence.
This reads, for example, (1) in which there is an error in the original text copier processing described on the right side.

【0028】S2は、形態素解析を行なう。形態素解析
の結果、右側に記載したように コパイラ;処理;に;誤り;が;あっ;た (2) となる。ここで、;は単語の区切りを表す。
At S2, morphological analysis is performed. As a result of the morphological analysis, as described on the right side, Copiler; Treatment; Here ,; represents a word delimiter.

【0029】S3は、形態素情報あるか判別する。これ
は、(2)の形態素解析の結果の先頭から1つづつ形態
素情報(単語)を取り出し、未だ形態素情報があるか判
別する。YESの場合には、S4に進む。NOの場合に
は、形態素情報がなくなったので、S10に進む。
In step S3, it is determined whether or not there is morpheme information. This is to extract morpheme information (words) one by one from the beginning of the result of the morpheme analysis of (2) and determine whether there is still morpheme information. In the case of YES, it progresses to S4. In the case of NO, since there is no morpheme information, the process proceeds to S10.

【0030】S4は、1つの形態素情報から語彙情報を
取り出す。これは、1つの形態素情報、例えば“コンパ
イラ”から語彙情報“名詞、TOOL”を、S5からS
9によって取り出し、バッファに設定する。以下説明す
る。
In step S4, vocabulary information is extracted from one piece of morpheme information. This is one morpheme information, for example, the lexical information "noun, TOOL" from "compiler", S5 to S
It is taken out by 9 and set in the buffer. This will be described below.

【0031】S5は、代表情報絞り込みを、S6および
S7によって行なう。S6は、ルート属性検索する。こ
れは、例えば形態素情報“コンパイラ”について、図3
の(a)の辞書9を参照して取り出した当該“コンパイ
ラ”の暗号化された文法属性“文法属性1、2、3、m
1、m22”について、図3の(b)の絞り込みテーブ
ル10を参照してルート属性検索し、ここでは、m22
について、ルート属性m−m2−m22を見つけて取り
出す。
At S5, the representative information is narrowed down at S6 and S7. In S6, the route attribute is searched. This is shown in FIG. 3 for the morpheme information “compiler”, for example.
The encrypted grammatical attribute “grammar attribute 1, 2, 3, m of the“ compiler ”extracted by referring to the dictionary 9 in (a) of FIG.
For “1, m22”, a route attribute search is performed by referring to the narrowing-down table 10 in FIG.
For, the root attribute m-m2-m22 is found and taken out.

【0032】S7は、代表属性を取り出す。これは、S
6で見つけたルート属性のうち、代表属性として、末尾
のm22を取り出す。S8は、対応コードテーブル11
を見て、代表属性を暗号化されていない文法属性及び品
詞に変換する。これは、例えばS7で取り出した代表属
性m22について、図3の(c)の対応コードテーブル
11を見て、m22の品詞および文法属性とし、“名
詞、TOOL”に変換する。
In step S7, the representative attribute is extracted. This is S
Of the root attributes found in 6, the m22 at the end is taken out as the representative attribute. S8 is the corresponding code table 11
, And convert the representative attributes into unencrypted grammar attributes and parts of speech. For example, regarding the representative attribute m22 extracted in S7, the corresponding code table 11 in FIG. 3C is looked at, and the part of speech and grammatical attribute of m22 are taken and converted into "noun, TOOL".

【0033】S9は、バッファに設定する。これは、1
つの形態素情報(例えば“コンパイラ”)について、S
8で変換した品詞、文法属性(例えば“名詞、TOO
L”)を一緒にした 語句 品詞 文法属性 コンパイラ、名詞、TOOL (3) をシソーラスな語彙情報(語句を意味によって分類、配
列した情報)としてバッファに設定する。
S9 is set in the buffer. This is 1
For one morpheme information (eg "compiler"), S
Part of speech and grammatical attributes converted in 8 (for example, “noun, TOO
L ”) together word / part of speech grammatical attribute compiler, noun, and TOOL (3) are set in the buffer as thesaurus information (information in which words are classified and arranged according to meaning).

【0034】S10は、語彙情報Aを出力する。以上に
よって、原文を形態素解析した各形態素情報について品
詞、文法属性を求め、語句を意味によって分類・配列し
た語彙情報を生成することが可能となる。例えば上記
(1)の原文に対して下記の(4)の語彙情報を生成し
て出力することができる。
In step S10, the vocabulary information A is output. As described above, it is possible to obtain vocabulary information and grammatical attributes for each morpheme information obtained by morpheme analysis of the original sentence, and generate lexical information in which words are classified and arranged according to meaning. For example, the following vocabulary information (4) can be generated and output with respect to the original sentence (1).

【0035】 コパイラ,名詞,TOOL;処理;に;誤り;が;あっ;た (4) 次に、チューニング定義12の作成について詳細に説明
する。図2において、S11は、利用者が編集する。こ
れは、利用者が表記を取り除く、あるいは正規表現を利
用して、語彙情報A’(パターンマッチ定義)を作成す
る。例えば右側に記載した語彙情報 コンパイラ,名詞,TOOL;処理;に;誤り;が;あっ;た (5) について、ここでは、右側に記載したように、“コンパ
イラ”の表記を除去し、“処理”を正規表現“*”(任
意の文字列)で置き換えた、下記(6)の語彙情報A’
(パターンマッチ定義13)を作成する。
Copier, noun, TOOL; processing; error; there is; a (4) Next, the creation of the tuning definition 12 will be described in detail. In FIG. 2, S11 is edited by the user. In this case, the user removes the notation or uses a regular expression to create the vocabulary information A ′ (pattern match definition). For example, the vocabulary information on the right side: compiler, noun, TOOL; process; to; error; to; a; (5) Here, as described on the right side, the "compiler" notation is removed and "process" The lexical information A'in (6) below, in which "" is replaced with the regular expression "*" (arbitrary character string)
(Pattern match definition 13) is created.

【0036】 −−,名詞,TOOL;*;に;誤り;が;あっ;た (6) S12は、利用者がアクション定義14を作成する。こ
れは、例えば右側に記載したように、 (F:DICT $1);contain(F:CON $1);an;error;. (7) を作成する。ここで、(F:DICT $1)は第1番目の単語の
辞書引きするを表す。contain(F:CON $1)は、containの
活用について第1番目の単語に依存させるを表す。
---, noun, TOOL; * ;; error; there is; there; (6) In S12, the user creates the action definition 14. This creates (F: DICT $ 1); contain (F: CON $ 1); an; error ;. (7), for example, as described on the right. Here, (F: DICT $ 1) represents the dictionary lookup of the first word. contain (F: CON $ 1) indicates that the use of contain depends on the first word.

【0037】以上によって、パターンマッチ定義13で
ある(6)にマッチングするパターンが原文の語彙情報
に現れたときに、(7)のアクション定義14によって
定義された処理を実行する旨の定義(チューニング定義
12)が作成され、保存されたこととなる。
As described above, when the pattern matching the pattern matching definition 13 (6) appears in the vocabulary information of the original sentence, the definition (tuning) to execute the process defined by the action definition 14 of (7). The definition 12) is created and saved.

【0038】図3は、本発明の辞書/テーブル例を示
す。図3の(a)は、辞書9の例を示す。この辞書9
は、図示のように、表記と暗号化された文法属性を予め
登録したものである。ここでは、例えば 表記 文法属性(暗号化されている) コンパイラ 文法属性1、2、3、m1、m22 コンバータ 文法属性7、8、9、m22、x11 と予め登録する。
FIG. 3 shows an example dictionary / table of the present invention. FIG. 3A shows an example of the dictionary 9. This dictionary 9
As shown in the figure, the notation and the encrypted grammar attribute are registered in advance. Here, for example, the following notations are registered in advance as grammar attributes (encrypted) compiler grammar attributes 1, 2, 3, m1, m22 converter grammar attributes 7, 8, 9, m22, x11.

【0039】図3の(b)は、絞り込みテーブル10の
例を示す。この絞り込みテーブル10は、図3の(a)
の辞書9を検索して取り出した暗号化されてた文法属性
につついて、ルート属性を検索して代表属性を取り出す
ためのものである。例えば辞書9から表記“コンパイ
ラ”の文法属性“文法属性1、2、3、m1、m22”
を取り出した場合、文法属性のうちのm22は、文法属
性m−m2−m22というルート属性を見つける。末尾
のm22を代表属性として取り出す。そして、図3の
(c)の対応コードテーブル11から代表属性“m2
2”の品詞および暗号化されていない文法属性を取り出
し、語彙情報とする。
FIG. 3B shows an example of the narrowing table 10. This narrowing table 10 is shown in FIG.
This is for searching the root attribute and retrieving the representative attribute in the encrypted grammar attribute retrieved and retrieved from the dictionary 9. For example, from the dictionary 9, the grammar attribute of the notation "compiler""grammar attribute 1, 2, 3, m1, m22"
When m is extracted, m22 of the grammatical attributes finds a root attribute called grammatical attribute m-m2-m22. The last m22 is extracted as a representative attribute. Then, from the corresponding code table 11 of FIG.
The part of speech of 2 "and the unencrypted grammatical attribute are extracted and used as vocabulary information.

【0040】図3の(c)は、対応コードテーブル11
の例を示す。この対応コードテーブル11は、図3の
(b)の絞り込みテーブル10を参照して見つけた代表
属性について、暗号化されていない文法属性、品詞を取
り出すためのものである。
FIG. 3C shows the corresponding code table 11
For example: The correspondence code table 11 is for extracting unencrypted grammatical attributes and parts of speech from the representative attributes found by referring to the narrowing-down table 10 of FIG.

【0041】図3の(d)は、語彙情報テーブル8の例
を示す。この語彙情報テーブル8は、図2のS1からS
10によって生成した語彙情報(表記、品詞、文法属
性)を保存したものである。
FIG. 3D shows an example of the vocabulary information table 8. This vocabulary information table 8 includes S1 to S in FIG.
The vocabulary information (notation, part-of-speech, grammatical attribute) generated by 10 is stored.

【0042】次に、図4の(a)のフローチャートに示
す順序に従い、図2のフローチャートに従って作成・定
義されたパターンマッチ定義13およびアクション定義
14からなるチューニング定義12を使用し、利用者固
有の訳文を生成するときの動作を詳細に説明する。
Next, according to the order shown in the flowchart of FIG. 4A, the tuning definition 12 including the pattern match definition 13 and the action definition 14 created and defined according to the flowchart of FIG. The operation when generating a translated sentence will be described in detail.

【0043】図4の(a)において、S21は、初期処
理・ルール展開する。これは、各種初期処理およびルー
ルとしてチューニング定義ファイル8の内容(パターン
マッチ定義13、アクション定義14)を読み込んで使
用可能状態にすると共に、コア展開を行ない、S22以
降の翻訳が可能な状態にする。
In FIG. 4A, in S21, initial processing and rule expansion are performed. This is to read the contents of the tuning definition file 8 (pattern match definition 13, action definition 14) as various initial processes and rules to make it available, and at the same time, perform core expansion to make the translation after S22 possible. .

【0044】S22は、入力文があるか判別する。YE
Sの場合には、S23に進む。NOの場合には、終了す
る(END)。S23は、形態素解析する。これは、形
態素解析呼び出し部2が機械翻訳エンジン21の形態素
解析を呼び出し、入力文の形態素解析を依頼する。ここ
では、下記の(8)に示すように形態素解析する。
A step S22 decides whether or not there is an input sentence. YE
If S, go to S23. If NO, the process ends (END). S23 performs morphological analysis. In this, the morphological analysis calling unit 2 calls the morphological analysis of the machine translation engine 21 and requests the morphological analysis of the input sentence. Here, morphological analysis is performed as shown in (8) below.

【0045】 コンバータ;機能;に;誤り;が;あっ;た (8) S24は、1つの形態素情報から語彙情報を取り出す。
これは、1つの形態素情報、例えば“コンバータ”から
語彙情報“名詞、TOOL”を、S25からS29によ
って取り出し、バッファに設定する。
Converter; function; to; error; to; yes; (8) S24 extracts vocabulary information from one morpheme information.
For this, one morpheme information, for example, the lexical information “noun, TOOL” from “converter” is taken out from S25 to S29 and set in the buffer.

【0046】S25は、代表情報絞り込みを、S26お
よびS27によって行なう。S26は、ルート属性検索
する。これは、例えば形態素情報“コンバータ”につい
て、図3の(a)の辞書9を参照して取り出した当該
“コンバータ”の暗号化された文法属性“文法属性7、
8、9、m22、x11”について、図3の(b)の絞
り込みテーブル10を参照してルート属性検索し、ここ
では、m22について、ルート属性m−m2−m22を
見つけて取り出す。
In S25, the representative information is narrowed down in S26 and S27. In S26, the route attribute is searched. This is, for example, for the morpheme information “converter”, the encrypted grammatical attribute “grammar attribute 7,” which is extracted by referring to the dictionary 9 in FIG.
For 8, 9, m22, x11 ", the route attribute search is performed by referring to the narrowing table 10 in FIG. 3B, and here, for m22, the route attribute m-m2-m22 is found and taken out.

【0047】S27は、代表属性を取り出す。これは、
S26で見つけたルート属性のうち、代表属性として、
末尾のm22を取り出す。S28は、対応コードテーブ
ル11を見て、代表属性を暗号化されていない文法属性
及び品詞に変換する。これは、例えばS27で取り出し
た代表属性m22について、図3の(c)の対応コード
テーブル11を見て、m22の品詞および文法属性と
し、“名詞、TOOL”に変換する。
In step S27, the representative attribute is extracted. this is,
Of the root attributes found in S26, as a representative attribute,
Take out the last m22. In step S28, the correspondence code table 11 is looked up and the representative attribute is converted into the unencrypted grammar attribute and part of speech. For example, regarding the representative attribute m22 extracted in S27, the corresponding code table 11 in FIG. 3C is looked at, and the part of speech and grammatical attribute of m22 are set and converted into "noun, TOOL".

【0048】S29は、バッファに設定する。これは、
1つの形態素情報(例えば“コンバータ”)について、
S28で変換した品詞、文法属性(例えば“名詞、TO
OL”)を一緒にした 語句 品詞 文法属性 コンバータ 名詞、TOOL (9) をシソーラスな語彙情報(語句を意味によって分類、配
列した情報)としてバッファに設定する。
S29 is set in the buffer. this is,
For one morpheme information (eg "converter"),
Part of speech and grammatical attributes converted in S28 (for example, "noun, TO
OL ”) together words / parts of speech / grammar attribute converter Noun, TOOL (9) is set in the buffer as thesaurus information (information in which words are classified and arranged by meaning).

【0049】以上の処理を繰り返すことにより、下記
(10)の語彙情報が生成される。 コンバータ,名詞,TOOL;機能;に;誤り;が;あっ;た (10) S30は、マッチング処理を行なう。これは、入力文か
ら作成した(10)の語彙情報について、予め登録した
チューニング定義12中のパターンマッチ定義13とパ
ターンマッチングを行ない、一致するものを見つける。
ここでは、図2のS11、S12で定義した −−,名詞,TOOL;*;に;誤り;が;あっ;た と右側に記載したようにマッチングすると判明する。
By repeating the above processing, the following vocabulary information (10) is generated. Converter, noun, TOOL; function; to; error; but; A; Yes (10) S30 performs matching processing. For this, the vocabulary information (10) created from the input sentence is subjected to pattern matching with the pattern match definition 13 in the tuning definition 12 registered in advance, and a matching one is found.
In this case, it is found that matching is performed as described on the right-hand side; “error” is present in the noun, TOOL; *; defined in S11 and S12 of FIG.

【0050】S31は、あるルール(パターンマッチ定
義13)にマッチか判別する。ここでは、YESである
ので、S32に進む。NOの場合には、マッチするルー
ル(パターンマッチ定義13)が見つからなかったの
で、終了する。
In step S31, it is determined whether a certain rule (pattern match definition 13) is matched. Here, since the answer is YES, the process proceeds to S32. In the case of NO, since the matching rule (pattern match definition 13) was not found, the process ends.

【0051】S31は、アクション処理を行なう。これ
は、S31のYESでマッチすると判明したので、マッ
チしたパターンマッチ定義13のアクション定義14、
例えば右側に記載した下記のアクション定義14 (F:DICT $1);contain(F:CON $1);an;error;. に従った処理を実行する。ここで、(F:DICT $1)は右側
に記載したように、1番目の単語(コンバータ)を辞書
引きする(S33のCASE:辞書引き)。ここでは、
converterが得られる。
At S31, action processing is performed. Since this is found to match with YES in S31, the action definition 14 of the matched pattern match definition 13,
For example, the process according to the following action definition 14 (F: DICT $ 1); contain (F: CON $ 1); an; error ;. Here, as described on the right side, (F: DICT $ 1) looks up the first word (converter) in the dictionary (CASE of S33: Look up in dictionary). here,
You get a converter.

【0052】contain(F:CON $1)は右側に記載したよう
に、活用は1番目の単語(コンバータ)に依存させる
(S34のCASE:活用処理)。ここでは、converte
rsとする。
As described on the right side, contain (F: CON $ 1) makes the utilization depend on the first word (converter) (CASE of S34: utilization processing). Here, converte
rs.

【0053】図4の(b)は、翻訳結果を示す。ここで
は、以上のS21からS34の処理により、図示のよう
に、翻訳結果は コンパイラ処理に誤りがあった→The mistake was foun
d in the compiler. が、 →The compiler con
tains an error. になる。また、 コンバータ機能に誤りがあった→The converter contai
ns an error.となる。
FIG. 4B shows the translation result. Here, as a result of the above-described processing of S21 to S34, the translation result has an error in the compiler processing → The mistake was foun
d in the compiler. → The compiler con
tains an error. Also, there was an error in the converter function → The converter contai
ns an error.

【0054】以上のように、ユーザがチューニング定義
12(パターンマッチ定義13および当該パターンマッ
チ定義13にマッチしたときの処理を定義したアクショ
ン定義14)を任意に予め定義しておくことにより、ユ
ーザ固有の訳文を生成することが可能となる。
As described above, the user can predefine the tuning definition 12 (the pattern match definition 13 and the action definition 14 that defines the process when the pattern match definition 13 is matched), so that It is possible to generate a translated sentence of.

【0055】次に、図5のフローチャートに示す順序に
従い、機械翻訳以外のテキスト処理について説明する。
図5の(a)において、S40は、マッチング処理を行
なう。
Next, the text processing other than machine translation will be described in the order shown in the flowchart of FIG.
In FIG. 5A, S40 performs matching processing.

【0056】S41は、あるルールにマッチか判別す
る。これらS40、S41は、図3のS30、S31と
同一であって、右側に記載したように、入力文の語彙情
報として、コンパイラ,名詞,TOOL;処理,瞬間的 ;に;誤り;が;あっ;
た が生成された場合、予め定義したパターンマッチ定義1
3 *;に;誤り;が;あっ;た と図示のようにマッチングする。このパターンマッチ定
義13のアクション定義14として、S43、S44、
S45の定義が記載されていた場合、右側に記載したア
クション処理が実行される。
In step S41, it is determined whether a certain rule matches. These S40 and S41 are the same as S30 and S31 of FIG. 3, and as described on the right side, as the vocabulary information of the input sentence, there are compiler, noun, TOOL; ;
When pattern is generated, pattern match definition 1 defined in advance
3 *; to; err; to; As the action definition 14 of this pattern match definition 13, S43, S44,
When the definition of S45 is described, the action process described on the right side is executed.

【0057】S43は、CASE:翻訳を行なう。これ
は、(F:TRAN $0)のアクション定義に対応して、原文の
全体($0)を翻訳する()。 S44は、CASE:文の書換えを行なう。これは、
“$1;は誤りを含みます”と、原文を書き換える。
At S43, CASE: translation is performed. This translates the entire original text ($ 0) corresponding to the action definition of (F: TRAN $ 0) (). In S44, the CASE: sentence is rewritten. this is,
Rewrite the original text, "$ 1; contains an error."

【0058】S45は、CASE、ユーザツールによっ
て処理を行なう。これは、(F:/root/atlas/mytool $b)
のアクション定義に対応して、アクション処理のb番目
(ここでは2番目)の出力(コンパイラ処理は誤りを含み
ます。)をmytoolに渡して処理を行なう()。
In step S45, the processing is performed by CASE and the user tool. This is (F: / root / atlas / mytool $ b)
Corresponding to the action definition of
The output (the second one here is incorrect in the compiler process) is passed to mytool and processed ().

【0059】以上の、、についてまとめて記述す
ると、図5の(b)の、、に記載する下記のよう
になる。 のアクション処理の出力結果 →The mistake was found in The compiler. のアクション処理の出力結果 →コンパイラは誤りを含みます。
The above items and can be summarized as follows, which is described in the item of (b) of FIG. Action process output result → The mistake was found in The compiler. Action process output result → The compiler contains an error.

【0060】のアクション処理(ここでは、/root/atl
as/mytoolプログラムが機械翻訳のプログラムとする)の
出力結果 →The compiler contains the mistake.
Action processing of (here, / root / atl
The output result of (As / mytool program is a machine translation program) → The compiler contains the mistake.

【0061】[0061]

【発明の効果】以上説明したように、本発明によれば、
機械翻訳エンジンを利用して原文の語彙情報を提示し、
ユーザがこれを見てパターンマッチ定義13およびアク
ション定義14によって修正して保存し、これらを利用
して翻訳する構成を採用しているため、ユーザ定義のパ
ターンマッチ定義13およびアクション定義14に従っ
たユーザ固有の適切な訳文を自動生成することができ
る。これらにより、 ユーザによるチューニングの幅が広がり、適切な翻
訳文を生成可能となる。
As described above, according to the present invention,
Present the original vocabulary information using a machine translation engine,
Since the user sees this, the pattern matching definition 13 and the action definition 14 are modified and saved, and the structure is used for translation, so that the user defined pattern matching definition 13 and action definition 14 are followed. An appropriate translated text unique to the user can be automatically generated. As a result, the range of tuning by the user is widened, and it becomes possible to generate an appropriate translated sentence.

【0062】 機械翻訳エンジンを有効に利用し、機
械翻訳のみならず、テキスト処理に当該機械翻訳を活か
すことができる。
By effectively utilizing the machine translation engine, the machine translation can be utilized not only for machine translation but also for text processing.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明の語彙情報出力処理/チューニング定義
フローチャートである。
FIG. 2 is a vocabulary information output process / tuning definition flowchart of the present invention.

【図3】本発明の辞書/テーブル例である。FIG. 3 is an example dictionary / table of the present invention.

【図4】本発明の動作説明フローチャート(翻訳時)で
ある。
FIG. 4 is a flowchart for explaining the operation of the present invention (during translation).

【図5】本発明の機械翻訳以外のテキスト処理説明図で
ある。
FIG. 5 is an explanatory diagram of text processing other than machine translation of the present invention.

【符号の説明】[Explanation of symbols]

1:機械翻訳エンジン付テキスト処理装置 2:形態素解析呼び出し部 3:語彙情報出力処理部 4:チューニング制御部 5:マッチング処理部 6:処理実行部 7:結果出力部 8:語彙情報テーブル 9:辞書 10:絞り込みテーブル 11:対応テーブル 12:チューニング定義 13:パターンマッチ定義 14:アクション定義 21:機械翻訳エンジン 22:形態素解析 23:構文解析 24:訳文生成 25:辞書 1: Text processing device with machine translation engine 2: Morphological analysis calling unit 3: Vocabulary information output processing unit 4: Tuning control unit 5: Matching processing unit 6: Process execution unit 7: Result output unit 8: Vocabulary information table 9: Dictionary 10: Narrowing table 11: Correspondence table 12: Tuning definition 13: Pattern match definition 14: Action definition 21: Machine translation engine 22: Morphological analysis 23: Syntax analysis 24: Translated sentence generation 25: Dictionary

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】機械翻訳エンジンを利用してテキスト処理
を行なうテキスト処理装置において、 形態素解析、構文解析、および訳文生成する機械翻訳エ
ンジン(21)と、 入力された原文について上記形態素解析を呼び出して形
態素解析する形態素解析呼び出し部(2)と、 この形態素解析した各単語について、語彙情報テーブル
(8)を参照して品詞、代表属性を取り出す語彙情報出
力処理部(3)と、 入力された原文の上記単語および取り出した品詞、文法
属性をもとに、予め作成したチューニング定義(12)
中のパターンマッチ定義(13)とパターン照合して一
致したときに、それのアクション定義(14)に従い、
処理を行って翻訳文を生成する処理実行部(6)とを備
えたことを特徴とするテキスト処理装置。
1. A text processing apparatus for performing text processing using a machine translation engine, comprising a machine translation engine (21) for morphological analysis, syntactic analysis, and translation generation, and calling the above morphological analysis for an input original sentence. A morphological analysis calling unit (2) for morphological analysis, a vocabulary information output processing unit (3) for extracting a part of speech and a representative attribute by referring to the vocabulary information table (8) for each morphologically analyzed word, and the input original text. Tuning definition created in advance based on the above words, extracted parts of speech, and grammatical attributes (12)
When the pattern matching definition (13) in the pattern is matched and matched, according to the action definition (14),
A text processing device comprising: a processing execution unit (6) for performing processing to generate a translated sentence.
【請求項2】機械翻訳エンジンを利用してテキスト処理
を行なうテキスト処理装置において、 形態素解析、構文解析、および訳文生成する機械翻訳エ
ンジン(21)と、 入力された原文について上記形態素解析を呼び出して形
態素解析する形態素解析呼び出し部(2)と、 この形態素解析した各単語について、辞書(9)を検索
して取り出した暗号化されている文法属性をもとに絞り
込みテーブル(10)を検索して暗号化されている代表
属性を取り出し、この取り出した暗号化されている代表
属性について対応コードテーブル(11)を参照して品
詞、代表属性を取り出す語彙情報出力処理部(3)と、 入力された原文の上記単語および取り出した品詞、文法
属性をもとに、予め作成したチューニング定義(12)
中のパターンマッチ定義(13)とパターン照合して一
致したときに、それのアクション定義(14)に従い、
処理を行って翻訳文を生成する処理実行部(6)とを備
えたことを特徴とするテキスト処理装置。
2. A text processing device for performing text processing using a machine translation engine, a machine translation engine (21) for morphological analysis, syntactic analysis, and translation generation, and calling the above morphological analysis for an input original sentence. A morphological analysis calling unit (2) for morphological analysis and a narrowing-down table (10) based on the encrypted grammatical attributes retrieved by searching the dictionary (9) for each morphologically analyzed word. The encrypted representative attribute is extracted, and the vocabulary information output processing unit (3) for extracting the part of speech and the representative attribute with reference to the corresponding code table (11) for the extracted encrypted representative attribute is input. Tuning definition created in advance based on the above words in the original sentence, extracted parts of speech, and grammatical attributes (12)
When the pattern matching definition (13) in the pattern is matched and matched, according to the action definition (14),
A text processing device comprising: a processing execution unit (6) for performing processing to generate a translated sentence.
【請求項3】入力された原文の上記単語および取り出し
た品詞、文法属性について、単語の表記を取り除くある
いは正規表現で表現したパターンマッチ定義(13)、
およびこのパターンマッチ定義(13)に合致したパタ
ーンに対する処理を定義したアクション定義(14)を
予め作成して保存するように構成したことを特徴とする
請求項1および請求項2記載のテキスト処理装置。
3. A pattern match definition (13) in which the word notation is removed or a regular expression is expressed with respect to the above-mentioned word of the input original sentence and the extracted part-of-speech and grammatical attribute,
The text processing device according to claim 1 or 2, wherein an action definition (14) defining a process for a pattern matching the pattern matching definition (13) is created and stored in advance. .
JP5169443A 1993-07-09 1993-07-09 Text processor Withdrawn JPH0728821A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5169443A JPH0728821A (en) 1993-07-09 1993-07-09 Text processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5169443A JPH0728821A (en) 1993-07-09 1993-07-09 Text processor

Publications (1)

Publication Number Publication Date
JPH0728821A true JPH0728821A (en) 1995-01-31

Family

ID=15886704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5169443A Withdrawn JPH0728821A (en) 1993-07-09 1993-07-09 Text processor

Country Status (1)

Country Link
JP (1) JPH0728821A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377276A (en) * 2021-05-19 2021-09-10 深圳云译科技有限公司 System, method and device for quick recording and translation, electronic equipment and storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377276A (en) * 2021-05-19 2021-09-10 深圳云译科技有限公司 System, method and device for quick recording and translation, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
JP2654001B2 (en) Machine translation method
US5895446A (en) Pattern-based translation method and system
JPH0567144A (en) Method and device for pre-edit supporting
JPS6318458A (en) Method and apparatus for extracting feeling information
JPH02112068A (en) System for simply displaying text
JPH0728821A (en) Text processor
JP4635585B2 (en) Question answering system, question answering method, and question answering program
JP3892227B2 (en) Machine translation system
JP2742059B2 (en) Dictionary editor for translation
JP6573839B2 (en) Sentence generating apparatus, method, and program
JP3244286B2 (en) Translation processing device
JP3339006B2 (en) Parallel Noun Phrase Processor in Machine Translation Equipment
JPS6244872A (en) Machine translator
JP3233800B2 (en) Machine translation equipment
JP2856736B2 (en) Dictionary reference device and dictionary reference method
JP2002351871A (en) Morpheme analysis device, morpheme analysis method, program, and recording medium
JPH0550778B2 (en)
JPH0778166A (en) Translating method and machine translation system
JPH01112368A (en) Machine translator
JPH02208775A (en) Machine translation system
JPH0540781A (en) Japanese-language syntax analysis system
JPH0748216B2 (en) Expression conversion method
JP2004086919A (en) Mechanical translation system
JP2004199519A (en) Mechanical translation method, mechanical translation device, and mechanical translation program
JP2004157688A (en) Translation device, translation method and translation program

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001003