JPH05324718A - Proper noun processor - Google Patents

Proper noun processor

Info

Publication number
JPH05324718A
JPH05324718A JP4126280A JP12628092A JPH05324718A JP H05324718 A JPH05324718 A JP H05324718A JP 4126280 A JP4126280 A JP 4126280A JP 12628092 A JP12628092 A JP 12628092A JP H05324718 A JPH05324718 A JP H05324718A
Authority
JP
Japan
Prior art keywords
proper noun
chinese
input
proper
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4126280A
Other languages
Japanese (ja)
Inventor
Kokui Jiyo
国偉 徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4126280A priority Critical patent/JPH05324718A/en
Publication of JPH05324718A publication Critical patent/JPH05324718A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To convert a proper noun of a language which uses the alphabet into an adequate proper noun of KANJI (Chinese character) without generating a syllable-KANJI translation dictionary, an exceptional pronunciation rule, etc. CONSTITUTION:When the proper noun in alphabet description is inputted from an input part 21, a proper noun-Chinese word conversion part 22 converts the input proper noun into a corresponding natural proper noun in Chinese through a neural network 22a. The converted proper noun is outputted from an output part 23. Thus, the proper noun of alphabet characters can be converted into the natural Chinese proper noun without generating the syllable-KANJI translation dictionary, exceptional pronunciation rule, etc., by using the neural network 22a. Further, this processor is provided with a means which decides that an inputted proper noun is a female name and its output is supplied to the neural network 22a to enable conversion into a proper noun suitable to the female name.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は入力されたアルファベッ
ト文字を使用する言語のテキスト処理システムにおける
固有名詞の処理装置に関し、特に、文字列の中にある固
有名詞をニューラルネットを用いて対応する中国語に変
換する固有名詞処理装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a proper noun processing apparatus in a text processing system for a language that uses input alphabetic characters, and more particularly to a proper noun in a character string using a neural network. The present invention relates to a proper noun processing device for converting into words.

【0002】[0002]

【従来の技術】アルファベット文字を使用する言語のテ
キスト処理システムにおいて、入力文の中に辞書にない
固有名詞があった場合、従来においてはその固有名詞
をアルファベット文字のまま出力したり、あるいは、
音節−漢字対訳辞書を用いて中国語の漢字に変換し、曖
昧性のある場合には、例外発音規則などを用いて判別し
ていた。
2. Description of the Related Art In a text processing system for a language that uses alphabetic characters, if there is a proper noun in the input sentence that is not in the dictionary, the proper noun is conventionally output as it is, or
It was converted to Chinese kanji by using a syllable-kanji bilingual dictionary, and when there was ambiguity, it was judged using exception pronunciation rules.

【0003】[0003]

【発明が解決しようとする課題】ところで、上記した従
来の技術において、の方法は人間がアルファベット文
字を中国語に変換するする必要があり、また、アルファ
ベット文字をそのまま中国語の固有名詞に変換した場合
には、自然な中国語文を得ることができない。また、
の方法は、人間が対訳辞書を作ったり、複雑な例外発音
規則を作る必要がある。
By the way, in the above-mentioned conventional technique, in the method of (1), it is necessary for a human to convert an alphabet character into Chinese, and the alphabet character is directly converted into a proper noun of Chinese. If you can't get a natural Chinese sentence. Also,
This method requires humans to create bilingual dictionaries and complicated exception pronunciation rules.

【0004】本発明は上記した従来技術の欠点を改善す
るためになされたものであって、アルファベット文字を
使用する言語の固有名詞を、対応した中国語漢字の固有
名詞に変換するに際して、音節−漢字対訳辞書、例外発
音規則などを作る必要がなく、また、処理システムに未
登録の固有名詞があっても自然な中国語の固有名詞に変
換することが可能な、固有名詞処理装置を提供すること
を目的とする。
The present invention has been made in order to improve the above-mentioned drawbacks of the prior art. In converting a proper noun of a language using alphabetic characters into a proper proper noun of Chinese kanji, a syllable- Provide a proper noun processing device that does not need to create a Kanji bilingual dictionary, exceptional pronunciation rules, etc., and can convert a proper noun in a processing system into a natural Chinese proper noun. The purpose is to

【0005】[0005]

【課題を解決するための手段】図1は本発明の原理図で
ある。本発明は上記課題を解決するため、図1に示すよ
うに構成したものであり、本発明の請求項1の発明は、
アルファベット文字を使用する言語を中国語に変換する
テキスト処理システムの固有名詞処理装置において、ア
ルファベット文字で表記された固有名詞を入力する入力
部21と、ニューラルネット22aより構成され、入力
部21より与えられるアルファベット文字表記の固有名
詞を中国語漢字の固有名詞に変換する固有名詞−中国語
変換部22と、固有名詞−中国語変換部22の出力を受
けて、中国語漢字表記に変換された固有名詞を出力する
出力部23とを設け、アルファベット文字を使用する言
語の固有名詞を、対応する中国語漢字の固有名詞に変換
するように構成したものである。
FIG. 1 shows the principle of the present invention. The present invention is configured as shown in FIG. 1 in order to solve the above problems, and the invention of claim 1 of the present invention is
In a proper noun processing device of a text processing system for converting a language using alphabetic characters into Chinese, an input unit 21 for inputting proper nouns expressed by alphabetical characters and a neural net 22a are provided, and are given from the input unit 21. A proper noun-Chinese conversion unit 22 for converting a proper noun in alphabetical character notation into a proper Chinese-Kanji character noun, and a proper noun converted to Chinese-Kanji notation in response to outputs from the proper noun-Chinese conversion unit 22 An output unit 23 for outputting a noun is provided to convert a proper noun of a language using alphabetic characters into a corresponding proper noun of Chinese kanji.

【0006】本発明の請求項2の発明は、請求項1の発
明において、アルファベット文字に対応する中国語漢字
表記の固有名詞を教師信号としてニューラルネット22
aに与える手段24と、教師信号とニューラルネット2
2aの出力を比較する手段25とを設け、アルファベッ
ト文字に対応する中国語漢字表記の固有名詞と教師信号
を、固有名詞−中国語変換部22のニューラルネット2
2aに与えて、ニューラルネット22aに学習させたの
ち、アルファベット文字を使用する言語の固有名詞を、
対応する中国語漢字表記の固有名詞に変換するように構
成したものである。
According to a second aspect of the present invention, in the first aspect of the invention, the neural network 22 uses the proper noun of Chinese kanji notation corresponding to the alphabet character as a teacher signal.
means 24 for giving a, the teacher signal and the neural network 2
A means 25 for comparing the outputs of 2a is provided, and the proper noun and the teacher signal in the Chinese kanji notation corresponding to the alphabetic character are output to the neural network 2 of the proper noun-Chinese conversion unit 22.
2a, the neural network 22a is trained, and then proper nouns of a language using alphabetic characters are given.
It is configured to be converted into a proper noun in the corresponding Chinese kanji notation.

【0007】本発明の請求項3の発明は、請求項1また
は請求項2の発明において、入力された固有名詞が女性
名であるか否かを判別し、入力された固有名詞が女性名
の場合に出力を発生する判別手段22bと、判別手段2
2bの出力に反応するユニットを入力層に設けたニュー
ラルネット22aとを設け、入力された固有名詞が女性
名の場合に、女性にふさわしい中国語漢字表記の固有名
詞に変換するように構成したものである。
In the invention of claim 3 of the present invention, in the invention of claim 1 or 2, it is determined whether or not the input proper noun is a female name, and the input proper noun is a female name. Discriminating means 22b for generating an output in some cases, and discriminating means 2
A neural network 22a in which a unit that reacts to the output of 2b is provided in the input layer, and when the input proper noun is a female name, it is configured to convert it into a proper noun in Chinese kanji notation suitable for a woman Is.

【0008】[0008]

【作用】請求項1の発明において、入力部21よりアル
ファベット文字表記の固有名詞を入力すると、固有名詞
−中国語変換部22はニューラルネット22aにより入
力されたアルファベット文字表記の固有名詞を対応する
自然な中国語漢字表記の固有名詞に変換する。固有名詞
−中国語変換部22により変換された固有名詞は出力部
23より出力される。
In the invention of claim 1, when a proper noun in alphabetical character notation is input from the input unit 21, the proper noun-Chinese conversion unit 22 corresponds to the proper noun in alphabetical character notation input by the neural network 22a. Convert to proper Chinese nouns. The proper noun converted by the proper noun-Chinese conversion unit 22 is output from the output unit 23.

【0009】ニューラルネット22aを用いて固有名詞
を変換するので、音節−漢字対訳辞書、例外発音規則な
どを作ることなく、アルファベット文字で表記された固
有名詞を適切な中国語漢字表記の固有名詞に変換するこ
とができる。また、請求項2の発明の発明においては、
教師信号とニューラルネット22aの出力を比較する手
段25を設け、その結果によりニューラルネット22a
を学習させるので、アルファベット文字表記の固有名詞
を自然な中国語漢字の固有名詞に変換することができ
る。
Since the proper nouns are converted using the neural network 22a, proper nouns expressed in alphabetic characters can be converted into proper proper Chinese kanji notations without making a syllable-kanji bilingual dictionary or exceptional pronunciation rules. Can be converted. According to the invention of claim 2,
Means 25 for comparing the teacher signal and the output of the neural network 22a are provided, and the result of the neural network 22a
By learning, it is possible to convert proper nouns written in alphabetical characters into natural nouns of Chinese characters.

【0010】さらに、請求項3の発明においては、入力
された固有名詞が女性名の場合に出力を発生する判別手
段22bを設けたので、アルファベット文字で表記され
た女性名の固有名詞を、女性にふさわしい中国語漢字の
固有名詞に変換することができる。
Further, according to the third aspect of the present invention, since the discrimination means 22b for generating an output when the input proper noun is a female name is provided, the proper noun of the female name represented by alphabetic characters is It can be converted into proper Chinese kanji proper nouns.

【0011】[0011]

【実施例】図2は本発明において用いられるニューラル
ネットの構成を示す図である。同図において、Aは入力
層、Bは中間層、Cは出力層であり、出力層Cは1−1
ないし1−378の378個の出力ユニットから構成さ
れており、各出力ユニットは377個の外国人用漢字と
1個のスキップに対応している。
FIG. 2 is a diagram showing the structure of a neural network used in the present invention. In the figure, A is an input layer, B is an intermediate layer, C is an output layer, and the output layer C is 1-1.
1 to 378 of 378 output units, and each output unit corresponds to 377 foreign Kanji characters and 1 skip.

【0012】中間層Bは2−1ないし2−85の85個
のユニットから構成されている。入力層Aは3aないし
3gの7個のグループと3−1の女性名に対応する1個
のユニットから構成されている。各グループ3aないし
3gは、26個のアルファベット文字に反応する26個
のユニットと、固有名詞の切れ目に反応する2個のユニ
ットの合わせて28個のユニットから構成されており、
入力層Aは合わせて197個のユニット3−1ないし3
−197から構成される。
The intermediate layer B is composed of 85 units 2-1 to 2-85. The input layer A is composed of seven groups 3a to 3g and one unit corresponding to the female name 3-1. Each group 3a to 3g is composed of 26 units that respond to 26 alphabetic characters and 2 units that respond to breaks in proper nouns, for a total of 28 units,
The input layer A has a total of 197 units 3-1 to 3
-197.

【0013】また、図2において、4は教師信号、5は
出力層の出力と教師信号4を比較する比較手段、6,7
は比較手段5の出力により定まる重み値である。上記ニ
ューラルネットを用いて、アルファベット文字の固有名
詞を漢字の固有名詞に変換するには、まず、入力層Aよ
りアルファベット文字で表記した固有名詞を入力すると
ともに、教師信号4としてアルファベット文字の固有名
詞に対応した中国語漢字表記の固有名詞を入力し、ニュ
ーラルネットを使って学習させる。
Further, in FIG. 2, 4 is a teacher signal, 5 is a comparing means for comparing the output of the output layer with the teacher signal 4, 6, 7
Is a weight value determined by the output of the comparison means 5. In order to convert a proper noun of an alphabetic character into a proper noun of kanji using the above neural network, first, the proper noun expressed by the alphabetical character is input from the input layer A, and the proper noun of the alphabetic character is given as the teacher signal 4. Input the proper noun in Chinese and Chinese corresponding to and learn using a neural network.

【0014】図3は学習データの一例を示した図であ
り、同図の左の欄のアルファベット文字で表記した固有
名詞をニューラルネットの入力層Aより入力するととも
に、同図の右欄に示される中国語漢字表記の固有名詞を
教師信号4としてニューラルネットの出力層Cの出力側
に設けられた比較手段5に与える。ニューラルネットの
入力層Aの各グループ3aないし3gより、図3のアル
ファベット文字で表記した固有名詞を入力すると、各グ
ループ3aないし3g内の対応したユニットは、入力さ
れたアルファベット文字に反応する。
FIG. 3 is a diagram showing an example of the learning data. The proper noun represented by the alphabetical characters in the left column of the figure is input from the input layer A of the neural network and is shown in the right column of the figure. The proper noun in Chinese-Kanji notation is given as the teacher signal 4 to the comparison means 5 provided on the output side of the output layer C of the neural network. When a proper noun written in alphabetical characters in FIG. 3 is input from each group 3a to 3g in the input layer A of the neural network, the corresponding unit in each group 3a to 3g responds to the input alphabetical character.

【0015】この信号は入力層Aの各ユニットで変換さ
れ、中間層Bを介して、出力層Cに出てくる。比較手段
5は出力層Cに表れる中国語漢字表記の固有名詞と、教
師信号4を比較して、その差が減少するように、重み値
6,7を変え、各層のユニットの結合の強さを変える。
This signal is converted in each unit of the input layer A, and is output to the output layer C via the intermediate layer B. The comparing means 5 compares the proper nouns written in Chinese and Chinese characters appearing in the output layer C with the teacher signal 4 and changes the weight values 6 and 7 so as to reduce the difference, and the strength of the unit coupling of each layer. change.

【0016】この際、ニューラルネットは次に示すバッ
クプロパゲーション・アルゴリズムを用いて、学習を行
う。各層におけるユニットの入力Xi (iは前の層のユ
ニット)とその出力yj (jは出力層Cのユニット)を
次の(1)、(2)式のように定める。
At this time, the neural network uses the following backpropagation algorithm for learning. The input X i (i is the unit of the previous layer) and the output y j (j is the unit of the output layer C) of the unit in each layer are defined by the following equations (1) and (2).

【0017】[0017]

【数1】 [Equation 1]

【0018】 但し、Xi :入力 Wji:重み値(前の層の第i番目のユニットからの入力
に対する重み) θj :しきい値 fj :出力関数、例:f(u) =1/(1+exp(-u))(si
gmoid 関数) yj :出力 uj :内部関数 I :入力ユニット数 ある入力パターンpを与えた時、出力層Cのユニットj
における実際の出力パターンをyip、望ましい出力パタ
ーン(教師信号)をtjpとして、実際の出力パターンと
望ましい出力パターンとの誤差を次の(3)式のように
定義する。
Where X i : input W ji : weight value (weight for the input from the i-th unit of the previous layer) θ j : threshold value f j : output function, example: f (u) = 1 / (1 + exp (-u)) (si
gmoid function) y j : output u j : internal function I: number of input units When a certain input pattern p is given, the unit j of the output layer C
The error between the actual output pattern and the desired output pattern is defined as in the following expression (3), where y ip is the actual output pattern and the desired output pattern (teaching signal) is t jp .

【0019】[0019]

【数2】 [Equation 2]

【0020】ここで、nはn回目の学習(重みの更新)
であることを意味する。ニューラルネットのネットワー
クに学習をさせるためには、この誤差を減らすように全
ての結合の強さ、即ち、重み値Wを変えればよい。バッ
クプロパゲーション法では、この誤差の2乗和が最小に
なるように重み値Wを順次に更新していき、出力層にお
ける出力パターンと望ましい出力パターンとの誤差が一
定値以下になると学習を終了する。
Here, n is the n-th learning (update of weight)
Means that. In order to train the network of the neural network, the strength of all the couplings, that is, the weight value W may be changed so as to reduce this error. In the back-propagation method, the weight value W is sequentially updated so that the sum of squares of the error is minimized, and the learning ends when the error between the output pattern in the output layer and the desired output pattern becomes a certain value or less. To do.

【0021】中間層Bと出力層Cの各ユニットへの重み
値の修正量ΔWを以下の方法に基づいて求める。 (a)中間層Bと出力層Cとの間の重みWjiの修正量Δ
p ji(n) を次式(4)、(5)により求める。なお、
下式においてδjpは出力層Cのユニットjにおける誤差
の後向き伝播量である。
The correction amount ΔW of the weight value for each unit of the intermediate layer B and the output layer C is obtained based on the following method. (A) Correction amount Δ of the weight Wji between the intermediate layer B and the output layer C
p W ji (n) is calculated by the following equations (4) and (5). In addition,
In the following equation, δ jp is the backward propagation amount of the error in the unit j of the output layer C.

【0022】 Δp ji(n) =αδjp(n) yip(n) +βΔp ji(n-1) (4) δjp(n) =tjp−yip(n)f'(uip(n)) (5) (b)入力層Aと中間層Bとの間の重みWjhの修正量Δ
p jh(n) を下式(6)、(7)により求める。なお、
δipは中間層Bのユニットi における誤差の後向き伝播
量である。
Δ p W ji (n) = α δ jp (n) y ip (n) + β Δ p W ji (n-1) (4) δ jp (n) = t jp −y ip (n) f '( u ip (n)) (5) (b) Correction amount Δ of weight W jh between input layer A and intermediate layer B
p W jh (n) is calculated by the following equations (6) and (7). In addition,
δ ip is the amount of backward propagation of the error in the unit i of the hidden layer B.

【0023】 Δp ih(n) =αδip(n) yhp(n) +βΔp ih(n-1) (6) Δp W ih (n) = αδ ip (n) y hp (n) + β Δp W ih (n-1) (6)

【0024】[0024]

【数3】 [Equation 3]

【0025】重み値の修正量の計算式の内、第2項はエ
ラーの振動を減らし、収束を早くするために加えられ
る。また、αは学習定数、βは学習速度定数と呼ばれ
る。以上のアルゴリズムにより望ましい出力パターンを
出すような方向にニューラルネットの重み値の修正が行
われる。なお、上記数式の計算順序は、出力層C→中間
層B→入力層Aのように逆方向に進むので、バックプロ
パゲーション法と呼ばれている。
The second term in the formula for calculating the modification amount of the weight value is added in order to reduce the error oscillation and accelerate the convergence. Further, α is called a learning constant, and β is called a learning rate constant. The algorithm described above corrects the weight value of the neural network in the direction in which the desired output pattern is output. Note that the calculation order of the above mathematical formulas is called the back-propagation method because it proceeds in the reverse direction from the output layer C to the intermediate layer B to the input layer A.

【0026】また、ニューラルネットを学習させること
は、適用したい問題についての知識があれば、誰でも可
能であり、ニューラルネットの専門家である必要はな
い。以上のように、ニューラルネットの入力にアルファ
ベット文字表記の固有名詞を与えるとともに、教師信号
として入力信号に対応した中国語漢字の固有名詞を与え
て、ニューラルネットを学習させたのち、ニューラルネ
ットの入力より変換したいアルファベット文字表記の固
有名詞を与え、対応した中国語漢字に変換する。
Anyone can learn the neural net as long as he / she has knowledge of the problem to be applied, and it is not necessary to be an expert of the neural net. As described above, the neural network input is given a proper noun in alphabetical characters and the Chinese kanji proper noun corresponding to the input signal is given as a teacher signal to train the neural network and then input the neural network. Give the proper noun of the alphabetic character notation you want to convert, and convert it to the corresponding Chinese kanji.

【0027】図4は本発明の第1の実施例を示す図であ
り、同図は学習済のニューラルネットの入力層より男性
名である「Bridges」を入力して中国語漢字の
「布里奇斯」という固有名詞に変換する実施例を示して
いる。同図において、図2に示したものと同一のものに
は同一の符号が付されており、10は入力部、11は判
別部、Aは入力層、3−1は女性名に対応するユニッ
ト、3aないし3gはグループ、Bは中間層、Cは出力
層、12は出力部であり、また、ステップS1ないしS
8は変換する手順を示している。
FIG. 4 is a diagram showing a first embodiment of the present invention. In FIG. 4, the male name "Bridges" is input from the input layer of the learned neural network and the Chinese character "Nuri" is input. An example in which the proper noun "kiseki" is converted is shown. In the figure, the same components as those shown in FIG. 2 are designated by the same reference numerals, 10 is an input unit, 11 is a discrimination unit, A is an input layer, 3-1 is a unit corresponding to a female name. 3a to 3g are groups, B is an intermediate layer, C is an output layer, 12 is an output unit, and steps S1 to S are performed.
Reference numeral 8 indicates a conversion procedure.

【0028】同図において、文中より切り出された「B
ridges」というアルファベット表記の男性名の固
有名詞が入力部10より与えられると、判別部11にお
いて、女性名フラグが付されているか否か判別される。
本実施例の場合には、男性名であるので、女性名フラグ
が付されておらず、入力層Aの女性名に対応するユニッ
ト3−1には入力が与えられない。
In the figure, "B" cut out from the sentence
When a proper noun of a male name in alphabetical notation "ridges" is given from the input unit 10, the determination unit 11 determines whether or not the female name flag is attached.
In the case of the present embodiment, since it is a male name, the female name flag is not attached, and no input is given to the unit 3-1 corresponding to the female name of the input layer A.

【0029】ついで、同図のステップS1に示すよう
に、入力層Aの中央のグループ3dに「B」、グループ
3eに「r」、グループ3fに「i」、グループ3gに
「d」が入力される。ニューラルネットは上記入力に応
じて、中央のグループ3dに入力される「B」を「布」
に変換して出力部12より出力する。
Then, as shown in step S1 in the figure, "B" is input to the center group 3d of the input layer A, "r" is input to the group 3e, "i" is input to the group 3f, and "d" is input to the group 3g. To be done. The neural network responds to the above input by inputting "B" to the cloth "B" input to the central group 3d.
And is output from the output unit 12.

【0030】次に、同図ステップS2に示すように、
「Bridges」が1字左側にシフトし、グループ3
cに「B」、中央のグループ3dに「r」、グループ3
eに「i」、グループ3fに「d」、グループ3gに
「g」が入力される。この場合、中央のグループ3dに
入力される「r」は次の「i」とともに変換されるの
で、ニューラルネットはスキップ信号を出力部12より
出力する。
Next, as shown in step S2 of FIG.
"Bridgeges" shifts one character to the left, and Group 3
"B" for c, "r" for central group 3d, group 3
“I” is input to e, “d” is input to the group 3f, and “g” is input to the group 3g. In this case, the "r" input to the central group 3d is converted together with the next "i", so that the neural network outputs the skip signal from the output unit 12.

【0031】ステップS3において、再び、「Brid
ges」が1字左側にシフトし、グループ3bに
「B」、グループ3cに「r」、中央のグループ3dに
「i」、グループ3eに「d」、グループ3fに
「g」、グループ3gに「e」が入力される。ニューラ
ルネットは上記入力に応じて、グループ3cに入力され
る「r」、中央のグループ3dに入力される「i」を
「里」に変換して出力部12より出力する。
In step S3, again, "Brid
“Ges” shifts to the left by one character, “B” for group 3b, “r” for group 3c, “i” for central group 3d, “d” for group 3e, “g” for group 3f, group 3g. "E" is input. The neural network converts “r” input to the group 3c and “i” input to the central group 3d into “ri” according to the above input, and outputs it from the output unit 12.

【0032】以上のように、ステップS1からステップ
S8まで、入力されるアルファベット表記の固有名詞を
左側に一字づつシフトしながら中国語漢字に変換してい
き、ステップS8において、エンド・マーク「/」が中
央のグループ3dに入力されると変換を終了し、中国語
漢字の固有名詞「布里奇斯」を得る。図5は本発明の第
2の実施例を示す図であり、同図はニューラルネットの
入力層より女性名である「Bridget」を入力して
中国語漢字の女性名である「布麗奇特」という固有名詞
に変換する実施例を示している。
As described above, from step S1 to step S8, the input proper nouns in alphabetical notation are converted into Chinese characters by shifting leftward by one character, and in step S8, the end mark "/ When "" is input to the central group 3d, the conversion is completed, and the Chinese kanji proper noun "Furi Kiseki" is obtained. FIG. 5 is a diagram showing a second embodiment of the present invention, in which the female name "Bridged" is input from the input layer of the neural network to input the Chinese kanji female name "Nunrei-Kyote". It shows an example of converting into a proper noun.

【0033】同図において、図4に示したものと同一の
ものには同一の符号が付されており、また、ステップS
1ないしS8は図4と同様変換する手順を示している。
同図において、文中より切り出された「Bridge
t」というアルファベット表記の女性名の固有名詞が入
力部10より与えられると、判別部11において、女性
名フラグが付されているか否か判別される。本実施例の
場合には、女性名であるので、女性名フラグが付されて
おり、入力層Aの女性名に対応するユニット3−1に入
力が与えられる。
In the figure, the same components as those shown in FIG. 4 are designated by the same reference numerals, and step S
Reference numerals 1 to S8 indicate the same conversion procedure as in FIG.
In the figure, “Bridgege” cut out from the sentence
When the proper noun of the female name in alphabetical notation "t" is given from the input unit 10, the determination unit 11 determines whether or not the female name flag is attached. In the case of the present embodiment, since it is a female name, a female name flag is attached, and the input is given to the unit 3-1 corresponding to the female name of the input layer A.

【0034】ついで、図4に示したように、同図のステ
ップS1において、入力層Aの中央のグループ3dに
「B」、グループ3eに「r」、グループ3fに
「i」、グループ3gに「d」が入力される。ニューラ
ルネットは上記入力に応じて、中央のグループ3dに入
力される「B」を「布」に変換して出力部12より出力
する。
Then, as shown in FIG. 4, in step S1 of the figure, the group 3d at the center of the input layer A is "B", the group 3e is "r", the group 3f is "i", and the group 3g is. "D" is input. The neural network converts “B” input to the central group 3d into “cloth” according to the input, and outputs it from the output unit 12.

【0035】以下、図4に示した場合と同様に、ステッ
プS1からステップS8まで、入力されるアルファベッ
ト表記の固有名詞を左側に一字づつシフトしながら中国
語漢字に変換していくが、この場合には、女性名に対応
するユニット3−1に入力が与えられているので、「r
i」は女性名にふさわしい「麗」に変換され、また、
「dge」は「奇」に、「t」は「特」に変換されて、
中国語漢字の固有名詞「布麗奇特」を得る。
Similarly to the case shown in FIG. 4, the inputted proper nouns in the alphabetical notation are converted to Chinese characters by shifting them one character to the left from step S1 to step S8. In this case, since the input is given to the unit 3-1 corresponding to the female name, "r
"i" is converted into "Rei" suitable for the female name, and
"Dge" is converted to "odd" and "t" is converted to "special",
Obtained the proper noun "Chinese character" of Chinese kanji.

【0036】[0036]

【発明の効果】以上説明したことから明らかなように、
本発明においては,アルファベット文字を使用する言語
のテキスト処理システムにおいて、アルファベット文字
を使用する言語の固有名詞を、ニューラルネットを用い
て中国語漢字表記の固有名詞に変換するので、下記の効
果を得ることができる。 処理システムに未登録の固有名詞があっても自然な
中国語の固有名詞に変換することが可能となり、処理の
質を向上させることができる。 音節−漢字対訳辞書、例外発音規則などを作ること
なく、アルファベット文字で表記された固有名詞を適切
な中国語漢字表記の固有名詞に変換することができる。 ニューラルネットを学習データを用いて学習させる
ことにより、学習した固有名詞以外の固有名詞を入力し
ても、適切な中国語漢字表記の固有名詞に変換すること
が可能である。 ニューラルネットの入力層に女性名に反応するユニ
ットを設けることにより、女性名が入力された場合に
は、女性にふさわしい固有名詞に変換することが可能と
なる。
As is clear from the above description,
In the present invention, in a text processing system for a language that uses alphabetic characters, a proper noun of a language that uses alphabetical characters is converted into a proper noun of Chinese kanji notation using a neural network, so that the following effects are obtained. be able to. Even if there is an unregistered proper noun in the processing system, it can be converted into a natural Chinese proper noun, and the quality of processing can be improved. It is possible to convert proper nouns expressed in alphabetic characters into proper proper Chinese kanji notation without making a syllable-kanji bilingual dictionary or exceptional pronunciation rules. By learning a neural network using learning data, even if a proper noun other than the learned proper noun is input, it can be converted into an appropriate proper noun in Chinese-Kanji notation. By providing a unit that reacts to a female name in the input layer of the neural network, when a female name is input, it can be converted into a proper noun suitable for a female.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理図である。FIG. 1 is a principle diagram of the present invention.

【図2】本発明において用いられるニューラルネットの
構成を示す図である。
FIG. 2 is a diagram showing a configuration of a neural network used in the present invention.

【図3】学習データの一例を示した図である。FIG. 3 is a diagram showing an example of learning data.

【図4】本発明の第1の実施例を示す図である。FIG. 4 is a diagram showing a first embodiment of the present invention.

【図5】本発明の第2の実施例を示す図である。FIG. 5 is a diagram showing a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1−1〜1−378 出力層のユニット 2−1〜2−85 中間層のユニット 3−1〜3−197 入力層のユニット 3a〜3g 入力層のグループ 4,24 教師信号 5,25 比較手段 10,21 入力部 11 判別手段 12,23 出力部 22 固有名詞−中国語変換部 22a ニューラルネット 22b 女性名判別手段 A 入力層 B 中間層 C 出力層 1-1 to 1-378 Output Layer Units 2-1 to 2-85 Intermediate Layer Units 3-1 to 3-197 Input Layer Units 3a to 3g Input Layer Group 4,24 Teacher Signals 5,25 Comparing Means 10, 21 Input unit 11 Discrimination means 12, 23 Output unit 22 Proper noun-Chinese conversion unit 22a Neural network 22b Female name discrimination means A Input layer B Intermediate layer C Output layer

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 アルファベット文字を使用する言語を中
国語に変換するテキスト処理システムの固有名詞処理装
置において、 アルファベット文字で表記された固有名詞を入力する入
力部(21)と、 ニューラルネット(22a) より構成され、入力部(21)より
与えられるアルファベット文字表記の固有名詞を中国語
漢字の固有名詞に変換する固有名詞−中国語変換部(22)
と、 固有名詞−中国語変換部(22)の出力を受けて、中国語漢
字表記に変換された固有名詞を出力する出力部(23)とを
設け、 アルファベット文字を使用する言語の固有名詞を、対応
する中国語漢字の固有名詞に変換することを特徴とする
固有名詞処理装置。
1. A proper noun processing device of a text processing system for converting a language using alphabetic characters into Chinese, an input unit (21) for inputting proper nouns expressed by alphabetic characters, and a neural network (22a). A proper noun-Chinese conversion unit (22) configured to convert a proper noun in alphabetical character notation given from the input unit (21) into a proper noun of Chinese Kanji
And an output unit (23) that outputs the proper noun converted to Chinese-Kanji notation in response to the output of the proper noun-Chinese conversion unit (22), and the proper noun of the language that uses alphabetic characters is provided. , A proper noun processing device characterized by converting to a proper proper noun of Chinese kanji.
【請求項2】 アルファベット文字に対応する中国語漢
字表記の固有名詞を教師信号としてニューラルネット(2
2a) に与える手段(24)と、教師信号とニューラルネット
(22a) の出力を比較する手段(25)とを設け、 アルファベット文字に対応する中国語漢字表記の固有名
詞と教師信号を、固有名詞−中国語変換部(22)のニュー
ラルネット(22a) に与えて、ニューラルネット(22a) に
学習させたのち、アルファベット文字を使用する言語の
固有名詞を、対応する中国語漢字表記の固有名詞に変換
することを特徴とする請求項1の固有名詞処理装置。
2. A neural network (2) using a proper noun in Chinese-Kanji notation corresponding to an alphabet character as a teacher signal.
2a) means (24), teacher signal and neural network
A means (25) for comparing the output of (22a) is provided, and the proper nouns and teacher signals in Chinese kanji notation corresponding to the alphabetic characters are sent to the neural network (22a) of the proper noun-Chinese converter (22). The proper noun processing apparatus according to claim 1, wherein the proper nouns of a language using alphabetic characters are converted into corresponding proper nouns of Chinese kanji notation after being given and learned by the neural network (22a). ..
【請求項3】 入力された固有名詞が女性名であるか否
かを判別し、入力された固有名詞が女性名の場合に出力
を発生する判別手段(22b) と、 判別手段(22b) の出力に反応するユニットを入力層に設
けたニューラルネット(22a) とを設け、 入力された固有名詞が女性名の場合に、女性にふさわし
い中国語漢字表記の固有名詞に変換することを特徴とす
る請求項1または請求項2の固有名詞処理装置。
3. A discriminating means (22b) for discriminating whether or not the input proper noun is a female name and producing an output when the input proper noun is a female name, and a discriminating means (22b). A neural network (22a) with a unit that responds to output is provided in the input layer, and when the input proper noun is a female name, it is converted into a proper noun in Chinese Kanji notation suitable for a woman. The proper noun processing apparatus according to claim 1 or 2.
JP4126280A 1992-05-19 1992-05-19 Proper noun processor Withdrawn JPH05324718A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4126280A JPH05324718A (en) 1992-05-19 1992-05-19 Proper noun processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4126280A JPH05324718A (en) 1992-05-19 1992-05-19 Proper noun processor

Publications (1)

Publication Number Publication Date
JPH05324718A true JPH05324718A (en) 1993-12-07

Family

ID=14931309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4126280A Withdrawn JPH05324718A (en) 1992-05-19 1992-05-19 Proper noun processor

Country Status (1)

Country Link
JP (1) JPH05324718A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028848A (en) * 2016-08-19 2018-02-22 日本放送協会 Conversion processor, transliteration processor, and program
JP2021189429A (en) * 2020-05-28 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Voice recognition method and apparatus, electronic device, and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028848A (en) * 2016-08-19 2018-02-22 日本放送協会 Conversion processor, transliteration processor, and program
JP2021189429A (en) * 2020-05-28 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Voice recognition method and apparatus, electronic device, and recording medium
US11756529B2 (en) 2020-05-28 2023-09-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for speech recognition, and storage medium

Similar Documents

Publication Publication Date Title
Ellis et al. The early stages of reading: A longitudinal study
CN109086270B (en) Automatic poetry making system and method based on ancient poetry corpus vectorization
EP0574951A2 (en) Speech recognition system
Wheeler Mathematization matters
JPH05282476A (en) Neural network device
JP2637760B2 (en) Pattern learning and generation method
JPH05324718A (en) Proper noun processor
CN114625840A (en) Training method and device of natural language processing model
Holbrook An English Grammar
CN112528014B (en) Method and device for predicting word segmentation, part of speech and rhythm of language text
JPH04222014A (en) Automatic finger talking translating device using neural network and its translating method
JP3004753B2 (en) Spelling and phonetic symbol converter
JP3037381B2 (en) Spelling-phonetic symbol conversion processor
JPH09212197A (en) Neural network
Stern Grammar
JPH06274475A (en) Reading presuming device for non-registered word
JP2743418B2 (en) Learning method
Rager Self-correcting connectionist parsing
Bard et al. Accessibility, duration, and modeling the listener in spoken dialogue
JPH03118606A (en) Adaptive controller
Ahnell The concept of tonality in the operas of Jean-Philippe Rameau
JPH0226256B2 (en)
Lehtonen On factors affecting the pitch level of speech
Güvenir Drill and practice for Turkish grammar
JP3386520B2 (en) Kana-kanji conversion apparatus and method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990803