JPH11161651A - Phonetic symbol generator - Google Patents

Phonetic symbol generator

Info

Publication number
JPH11161651A
JPH11161651A JP9327751A JP32775197A JPH11161651A JP H11161651 A JPH11161651 A JP H11161651A JP 9327751 A JP9327751 A JP 9327751A JP 32775197 A JP32775197 A JP 32775197A JP H11161651 A JPH11161651 A JP H11161651A
Authority
JP
Japan
Prior art keywords
character string
symbol
string
conversion
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9327751A
Other languages
Japanese (ja)
Inventor
Katsuyoshi Yamagami
勝義 山上
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9327751A priority Critical patent/JPH11161651A/en
Publication of JPH11161651A publication Critical patent/JPH11161651A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To minimize a cost for producing a converting rule and to give the most natural reading of Japanese to an unknown character string in foreign language by automatically generating a decision tree to be a converting rule from a character string and corresponding data being its phonetic symbol string. SOLUTION: The decision tree to be the converting rule is generated from the character string and corresponding data being its phonetic symbol string. At this device, a decision tree generating part 105 generates the decision tree 106 to be the converting rule from an English character string 101 to a KATAKANA (one of two kinds of KANA script used for Japanese syllabary) character string 103 from the corresponding relation of an alphabet symbol and a KATAKANA symbol at correspondence data 104. The generated tree 106 for conversion constitutes the group of the questions of an YES/NO form for deciding a KANA (Japanese syllabary) character symbol equivalent to the alphabet symbol from the kind of alphabet symbols positioned within n-number of characters before/after the alphabet symbol concerning the alphabet symbol at a position in alphabets.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、日本語音声合成装
置において英文字列などの他国語文字列に対して日本語
の発音を与える方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for giving Japanese pronunciation to a foreign language character string such as an English character string in a Japanese speech synthesizer.

【0002】[0002]

【従来の技術】任意の文章をリアルタイムに読み上げる
ことができる規則音声合成技術は、すでに実用化されて
いる。日本語の規則音声合成技術についても、音声合成
読み上げソフトウェアなどの形で、パソコン上で日本語
テキストを読み上げるものが製品化されている。読み上
げるテキストの種類は様々なものが考えられるが、近
年、急速な普及が著しいインターネットや、CD−RO
Mなどの電子媒体を通じて、大量のテキストが容易に入
手可能になっている。これらの、テキストには、日本語
だけではなく英語など他国語の文字列が現れることも少
なくない。このような日本語テキストに含まれる他国語
文字列をうまく読みこなすことが、今後、ますます重要
な課題となっている。他国語の文字列をアルファベット
の羅列として読み上げるのではなく、その文字列の発音
で読み上げるのはもちろんであるが、他国語文字列をそ
の国の発音で読み上げたのでは、日本語の読み上げ音声
の中にあっては、その部分の発音が非常に聞き取りにく
いという問題がある。つまり、日本語らしく読み上げる
ために、他国語文字列に対しても日本語の発音を与える
ことが課題となっている。
2. Description of the Related Art A rule-based speech synthesis technique capable of reading an arbitrary sentence in real time has already been put to practical use. Regarding Japanese rule speech synthesis technology, products that read Japanese text on a personal computer in the form of speech synthesis reading software have been commercialized. There are various types of text to be read out, but in recent years the Internet and CD-RO, which have rapidly spread remarkably,
Large amounts of text are readily available through electronic media such as the M. In these texts, character strings in other languages such as English as well as Japanese often appear. It will become increasingly important in the future to successfully read foreign language character strings contained in such Japanese texts. Rather than reading a string in another language as a sequence of alphabets, it is of course to read it with the pronunciation of that string. There is a problem that the pronunciation of that part is very difficult to hear. In other words, in order to read aloud like Japanese, it is an issue to give Japanese pronunciation to a character string of another language.

【0003】これまでの日本語規則音声合成装置におい
ても、これら他国語文字列に対する日本語の発音記号を
与えるために、他国語の文字列に対する読み方の規則を
備えるなどの方法が採用されてきた。たとえば、英文字
列に対しては、英語の単語辞書を用いて英語の発音を決
定し、その英語の発音列を英語と日本語の発音の変換テ
ーブルに従って、日本語の発音記号列に変換するという
方法があった(方式1)。
[0003] In the conventional Japanese-language rule speech synthesizer, in order to give Japanese phonetic symbols to these foreign language character strings, a method of providing rules of how to read the foreign language character strings has been adopted. . For example, for English character strings, determine the pronunciation of English using an English word dictionary, and convert the English pronunciation string to a Japanese phonetic symbol string according to the English-Japanese pronunciation conversion table (Method 1).

【0004】また、ワードプロセッサなどでの応用分野
において、外来語のカタカナ文字列を入力する際に、外
来語をその綴りの通り入力して、カタカナ文字列へ変換
する方式が考えられている。英語を例に取れば、英文字
列を分割し、分割された各部分に対してカタカナ文字列
への変換規則を適用して、カタカナ文字列の候補を生成
したのち、カタカナ語辞書を参照して、候補の中から日
本語へ変換したあとの正しい候補を選択するという方法
である(方式2)。
In a field of application in a word processor or the like, when a katakana character string of a foreign word is input, a method of inputting a foreign word as spelled out and converting it into a katakana character string has been considered. Taking English as an example, split the English character string, apply the conversion rules to Katakana character strings to each of the divided parts, generate Katakana character string candidates, and then refer to the Katakana dictionary. Then, a correct candidate after conversion into Japanese is selected from the candidates (method 2).

【0005】[0005]

【発明が解決しようとする課題】しかし、方式1では、
英文字列の英語の発音記号列を得てから、発音記号1つ
づつに対して日本語の発音記号への変換規則を適用する
ため、得られた日本語の発音記号列が日本語的な発音を
得にくいという課題があった。
However, in the method 1,
After obtaining the English phonetic symbol string of the English character string, and applying the conversion rules to Japanese phonetic symbols for each phonetic symbol, the obtained Japanese phonetic symbol string There was a problem that it was difficult to obtain pronunciation.

【0006】また、方式2によれば、ワードプロセッサ
などの応用を考えているため、あらかじめ外来のカタカ
ナ語辞書を用意して、その辞書を用いて英文字列から生
成したカタカナ文字列の候補をチェックするという方式
をとっている。カタカナ辞書にない未知の外来語に対し
ては、英文字列から生成されたカタカナ語の候補に対し
て正しいものを決定できないという課題があった。
According to the method 2, since an application such as a word processor is considered, a foreign Katakana dictionary is prepared in advance, and a Katakana character string candidate generated from an English character string is checked using the dictionary. We take the method of doing. For unknown foreign words that are not in the Katakana dictionary, there was a problem that it was not possible to determine the correct candidate for Katakana words generated from English character strings.

【0007】さらに、方式1では、英語発音記号から日
本語発音記号への変換規則を、方式2では、英文字列か
らカタカナ文字列への変換規則を人手で作る必要があ
り、これらの変換規則を人手で作成するコストが大きく
無視できないという課題があった。
Further, in method 1, it is necessary to manually create a conversion rule from English pronunciation symbols to Japanese pronunciation symbols, and in method 2, it is necessary to manually create a conversion rule from English character strings to katakana character strings. However, there is a problem that the cost of manually creating the file cannot be ignored.

【0008】本発明は、これら課題を解決することを目
的とする。
An object of the present invention is to solve these problems.

【0009】[0009]

【課題を解決するための手段】これらの課題を解決する
ために、本発明の発音記号生成装置は、文字列とその発
音記号の対データから、変換規則となる決定木を自動的
に生成する変換規則生成部と、前期変換規則生成部から
生成された変換規則を保持する変換規則部と、前期変換
規則部を参照して入力された文字列を発音記号列に変換
する変換部を備えたものである。
In order to solve these problems, a phonetic symbol generation device of the present invention automatically generates a decision tree as a conversion rule from a pair of a character string and its phonetic symbols. A conversion rule generation unit, a conversion rule unit that holds the conversion rule generated from the first conversion rule generation unit, and a conversion unit that converts a character string input with reference to the first conversion rule unit to a phonetic symbol string. Things.

【0010】[0010]

【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。なお、本実施形態においては、変換しよう
とする文字列を英文字列とし、変換後の発音記号列を日
本語のカタカナ文字列として説明する。
Embodiments of the present invention will be described below. In this embodiment, the character string to be converted will be described as an English character string, and the converted phonetic symbol string will be described as a Japanese katakana character string.

【0011】図1は、本実施形態の構成を示す図であ
る。101は、入力の英語の文字列である。102は、
英文字列101をカタカナ文字列に変換する変換部であ
る。103は、変換部102によって英文字列101よ
り変換されたカタカナ文字列である。
FIG. 1 is a diagram showing the configuration of the present embodiment. 101 is an input English character string. 102 is
A conversion unit that converts the English character string 101 into a katakana character string. Reference numeral 103 denotes a katakana character string converted from the English character string 101 by the conversion unit 102.

【0012】104は、英文字列とカタカナ文字列の対
応例からなる対応データである。図2に、対応データ1
04の内容の例を示す。'/' で区切られた左側が英文字
列、右側がカタカナ文字列である。英文字列は、各アル
ファベット文字が1つの文字列シンボルである。カタカ
ナ文字列は、空白文字' 'によって区切られいる単位が
一つの仮名文字シンボルである。なお、'-' は、対応す
るシンボルがないことを示す。一番上の‘/take/
テーク-/’においては、t=テ、a=ー、k=ク、e
=-という対応関係を表している。
Reference numeral 104 denotes correspondence data comprising an example of correspondence between English character strings and katakana character strings. FIG. 2 shows the corresponding data 1
04 shows an example of the content. The left side separated by '/' is an English character string, and the right side is a katakana character string. In the English character string, each alphabetic character is a character string symbol. In the katakana character string, the unit delimited by the space character '' is a single kana character symbol. Note that '-' indicates that there is no corresponding symbol. The top '/ take /
In take- / ', t = te, a =-, k = q, e
=-Represents a corresponding relationship.

【0013】105は、決定木生成部であり、対応デー
タ104における英文字シンボルとカタカナ文字シンボ
ルの対応関係から、英文字列からカタカナ文字列への変
換規則となる決定木を生成する。
Reference numeral 105 denotes a decision tree generation unit which generates a decision tree as a conversion rule from an English character string to a katakana character string from the correspondence between the English character symbol and the katakana character symbol in the correspondence data 104.

【0014】106は、決定木生成部105が生成した
変換用決定木である。本実施形態での変換用決定木10
6は、英文字中のある位置にある英文字シンボルについ
て、その英文字シンボルに対応する仮名文字シンボル
を、英文字シンボルの前後n文字内に位置する英文字シ
ンボルの種類(以後、英文字コンテキストと呼ぶ)から
決定するためのYES/NO形式の質問の系列を構成する。よ
って、変換用決定木106は、aからzまでの英文字シ
ンボルにつき1つづつ生成された26個の決定木の集ま
りである。決定木の生成手順は、各英文字シンボルに対
して同一であるので、一つの英文字シンボルについての
み生成手順を説明する。
Reference numeral 106 denotes a conversion decision tree generated by the decision tree generation unit 105. Conversion decision tree 10 in the present embodiment
6 designates, for an English character symbol located at a certain position in the English character, a kana character symbol corresponding to the English character symbol by the type of the English character symbol located within n characters before and after the English character symbol (hereinafter referred to as English character context). ) To form a series of questions in YES / NO format to be determined from Therefore, the conversion decision tree 106 is a collection of 26 decision trees generated one by one for the English character symbols a to z. Since the procedure for generating the decision tree is the same for each English character symbol, the generation procedure will be described for only one English character symbol.

【0015】以下、決定木生成部105が、対応データ
104から変換用決定木106の 'a'の決定木を生成す
る手続きについて説明する。
Hereinafter, a procedure in which the decision tree generation unit 105 generates a decision tree of “a” of the conversion decision tree 106 from the correspondence data 104 will be described.

【0016】ステップ1:対応データ104に含まれる
データのうち‘a’を含むデータを取りだし、図3の3
01に示す英文字コンテキストという形式のデータを作
る。この英文字コンテキストとは、対応データの英文字
列の中で‘a’の現れる位置を0とし、その前3文字か
ら後3文字(3文字に満たない場合は‘#’を割り当て
る)を並べたものである。−nは、前n文字目の位置を
示し、+nは、後ろn文字目の位置を示す。英文字コン
テキスト301の左側にあるのは、カタカナ文字列30
2である。これは、各英文字コンテキストの0の位置に
ある‘a’が対応データ内で対応していた仮名文字シン
ボル、あるいは、仮名文字列である。
Step 1: Data containing "a" is taken out of the data contained in the corresponding data 104, and 3 in FIG.
01 is created in the form of an English character context. In this English character context, the position where 'a' appears in the English character string of the corresponding data is set to 0, and the first three characters and the last three characters (if less than three characters, '#' is assigned) are arranged. It is a thing. -N indicates the position of the first n characters, and + n indicates the position of the last n characters. On the left side of the English character context 301 is the katakana character string 30
2. This is a kana character symbol or a kana character string to which 'a' at the position of 0 of each English character context corresponds in the corresponding data.

【0017】ステップ2:次に、仮名文字列302が同
一であるものを一つのグループと考える。図3において
は、仮名文字列が‘/ー/’であるグループ1と、‘/-
ッ/’であるグループ2と、‘/イ/’であるグループ3
に分かれる。
Step 2: Next, those having the same kana character string 302 are considered as one group. In FIG. 3, group 1 in which the kana character string is “/ − /” and “/ −”
Group 2 which is tsu / 'and Group 3 which is' / a /'
Divided into

【0018】ステップ3:グループの中に含まれる英文
字コンテキストの数が多いものを選ぶ。そのグループ
と、それ以外のグループを区別する、英文字コンテキス
トの各位置にある英文字の種類を調べる(たとえば、グ
ループ1とグループ2、グループ3を区別するには、+
2の位置にある‘e’に注目する)。そのような位置i
と英文字cが見つかった場合は、決定木の分岐ノードを
生成しその分岐ノードでの分岐条件をi=cとし、その
条件を満たす分岐(Yes)に対して、そのグループの
カタカナ文字列を割り当てる。条件を満たさない分岐
(No)に対しては、残ったグループが2つ以上あれ
ば、その残りのグループに対してステップ3の手順を行
い生成される分岐ノードを割り当てる。残ったグループ
が一つだけであれば、そのグループのカタカナ文字列を
割り当てて終了する。グループを区別する文字位置と文
字の種類がみつからなかった場合は、これらのグループ
をステップ3の結果として終了する(前回のステップ3
の条件を満たさない分岐(No)に割り当てる)。
Step 3: A group having a large number of English character contexts included in the group is selected. Examine the type of alphabetic character at each position in the alphabetic context that distinguishes that group from the others (for example, to distinguish group 1 from group 2 or group 3, use +
Note the 'e' at position 2). Such a position i
And a letter c is found, a branch node of the decision tree is generated, the branch condition at the branch node is set to i = c, and for a branch (Yes) satisfying the condition, the katakana character string of the group is assign. If there are two or more remaining groups for the branch (No) that does not satisfy the condition, the branch node generated by performing the procedure of step 3 is assigned to the remaining groups. If there is only one group left, the katakana character string of that group is assigned and the process ends. If the character position and the character type for distinguishing the groups are not found, these groups are ended as a result of step 3 (the previous step 3
Is assigned to the branch (No) that does not satisfy the condition (1).

【0019】以上の手順に従って、図3の英文字コンテ
キスト301と仮名文字列302から得られた決定木
は、図4のようになる。401は、グループ1とグルー
プ2、グループ3を分割する分岐ノードである。402
は、グループ2とグループ3を分割する分岐ノードであ
る。
According to the above procedure, the decision tree obtained from the English character context 301 and the kana character string 302 in FIG. 3 is as shown in FIG. Reference numeral 401 denotes a branch node that divides group 1, group 2, and group 3. 402
Is a branch node that divides group 2 and group 3.

【0020】この手順に従って、他の英文字列について
も決定木を生成し、変換決定木106を構成する。
According to this procedure, a decision tree is generated for other English character strings, and the conversion decision tree 106 is constructed.

【0021】次に、変換部102が変換決定木106を
参照して英文字列をカタカナ文字列に変換する手順を説
明する。
Next, a procedure in which the conversion unit 102 converts an English character string into a katakana character string with reference to the conversion decision tree 106 will be described.

【0022】図5に英文字‘t’、‘p’、‘e’に対
する決定木を示す。今、これら決定木と図4の‘a’に
対する決定木が変換決定木106に含まれているものと
する。入力文字列101として‘tape’を与える。
変換部102は、入力の英文字列の前後に3つの‘#’
を追加する。‘#’を除く先頭の英文字シンボルから順
に、変換決定木106の対応する決定木を適用する。
FIG. 5 shows a decision tree for English letters 't', 'p', and 'e'. Now, it is assumed that these decision trees and the decision tree for “a” in FIG. 4 are included in the conversion decision tree 106. 'Tape' is given as the input character string 101.
The conversion unit 102 adds three '#' characters before and after the input English character string.
Add. The corresponding decision tree of the conversion decision tree 106 is applied in order from the leading English character symbol excluding '#'.

【0023】1番目の‘t’に対しては、‘t’の直後
の英文字は‘a’であるので分岐ノード501の条件を
満たさない。よって、Noに分岐し、分岐ノード502
に進む。分岐ノード502の条件も満たさないので、N
oを選択し、‘t’に対応するカタカナ文字は、‘テ’
となる。
With respect to the first 't', the letter immediately after the 't' is 'a', so that the condition of the branch node 501 is not satisfied. Therefore, branching to No, the branch node 502
Proceed to. Since the condition of the branch node 502 is not satisfied, N
o, and the katakana character corresponding to 't' is 'te'
Becomes

【0024】2番目の‘a’に対しては、分岐ノード4
01の条件を満たすので、Yesに分岐して、対応する
カタカナ文字列は、‘ー’となる。
For the second “a”, the branch node 4
Since the condition of 01 is satisfied, the flow branches to Yes, and the corresponding katakana character string becomes "-".

【0025】3番目の‘p’に対しては、分岐ノード5
03の条件を満たさないので、Noへと分岐し、対応す
るカタカナ文字‘プ’を得る。
For the third 'p', branch node 5
Since the condition of 03 is not satisfied, the process branches to No, and the corresponding katakana character 'P' is obtained.

【0026】4番目の‘e’に対しては、本実施形態で
の対応データには、‘-’との対応のみ現れてるので、
一意にダミーのカタカナ文字‘-’となる。
For the fourth "e", only the correspondence with "-" appears in the correspondence data in the present embodiment.
It becomes a dummy katakana character '-' uniquely.

【0027】以上のように、本実施形態の対応データ1
04の中に現れなかった英文字列‘tape’から‘テ
ープ’へと変換が行われる。
As described above, the correspondence data 1 of the present embodiment
Conversion is performed from the English character string “tape” that did not appear in 04 to “tape”.

【0028】本実施の形態では、英文字コンテキストの
幅を前後3文字としたが、これはこれより多い文字数を
コンテキストと考えてもよい。また、本実施形態におい
ては、発音記号列をカタカナ文字列としたが、ローマ字
表記のアルファベット列としてもよい。
In the present embodiment, the width of the English character context is set to three characters before and after the English character context. Further, in the present embodiment, the phonetic symbol string is a katakana character string, but may be an alphabet string in Roman notation.

【0029】[0029]

【発明の効果】以上の説明から明らかなように、本発明
によれば、文字列とその発音記号列である対応データか
ら自動的に変換規則となる決定木を生成することで、変
換規則を制作するコストを大幅に軽減できる。また、本
発明によれば、対応データにない英文字列にたいしても
決定木を参照することにより、発音記号列を求めること
が可能であるという特徴を有する。
As is apparent from the above description, according to the present invention, a conversion tree is automatically generated from a character string and its corresponding phonetic symbol string as a conversion rule, whereby the conversion rule is obtained. Production costs can be greatly reduced. Further, according to the present invention, it is possible to obtain a phonetic symbol string by referring to the decision tree even for an English character string not included in the corresponding data.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態である発音記号生成装置の
構成を示すブロック図
FIG. 1 is a block diagram showing a configuration of a phonetic symbol generation device according to an embodiment of the present invention.

【図2】本発明の一実施形態において英文字列とカタカ
ナ文字列の対応データの例を示す図
FIG. 2 is a diagram showing an example of correspondence data between English character strings and katakana character strings in one embodiment of the present invention.

【図3】本発明の一実施形態において、対応データから
‘a’に関して抜き出した英文字列コンテキストと対応
するカタカナ文字列の組、および、そのグループ分けを
示す図
FIG. 3 is a diagram showing a set of katakana character strings corresponding to an English character string context extracted from the corresponding data for 'a' and grouping of the katakana character strings according to the embodiment of the present invention;

【図4】本発明の一実施形態において‘a’に関して英
文字列コンテキストとカタカナ文字列から得られた決定
木の例を示す図
FIG. 4 is a diagram showing an example of a decision tree obtained from an English character string context and a katakana character string for 'a' in one embodiment of the present invention.

【図5】本発明の一実施形態における‘t’、‘p’、
‘e’に関する決定木の例を示す図
FIG. 5 illustrates 't', 'p',
Diagram showing an example of a decision tree for 'e'

【符号の説明】[Explanation of symbols]

101 英文字列 102 変換部 103 カタカナ文字列 104 対応データ 105 決定木生成部 106 変換用決定木 Reference Signs List 101 English character string 102 Conversion unit 103 Katakana character string 104 Corresponding data 105 Decision tree generation unit 106 Decision tree for conversion

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 ある言語の文字列を他の言語の発音記号
列に変換する変換部と、前記変換部が文字列から発音記
号列への変換方法を決定する変換規則部と、前記変換規
則を変換例データから生成する変換規則生成部を有する
ことを特徴とする発音記号生成装置。
A conversion unit configured to convert a character string in a certain language into a phonetic symbol string in another language; a conversion rule unit that determines a method of converting the character string into a phonetic symbol string; A conversion rule generation unit that generates a conversion symbol from conversion example data.
【請求項2】 変換規則生成部が、ある言語の文字列と
他の言語の発音記号列の対応データを学習用のデータと
し、ある文字列シンボルに関して、その文字列シンボル
がどの発音記号に対応するかを決定する規則となる、前
記文字列シンボルの前後数文字に位置する文字列シンボ
ルの種類を条件とする条件分岐の系列を表す決定木を自
動的に生成することを特徴とする請求項1記載の発音記
号生成装置。
2. A conversion rule generation unit sets learning data based on correspondence data between a character string in a certain language and a phonetic symbol string in another language, and for a certain character string symbol, the character string symbol corresponds to any phonetic symbol. A decision tree representing a sequence of conditional branches conditioned on the type of a character string symbol located at a few characters before and after the character string symbol, which is a rule for determining whether to perform the decision, is automatically generated. The phonetic symbol generation device according to 1.
【請求項3】 変換部が、入力文字列の各文字に対し
て、前後に位置する文字の種類について、変換規則保持
部にある決定木の条件分岐に従って発音記号を割り当て
ることを特徴とする請求項1記載の発音記号生成装置。
3. The method according to claim 1, wherein the conversion unit assigns phonetic symbols to each character of the input character string in accordance with a conditional branch of a decision tree stored in the conversion rule holding unit for types of characters located before and after. Item 1. The phonetic symbol generation device according to item 1.
JP9327751A 1997-11-28 1997-11-28 Phonetic symbol generator Pending JPH11161651A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9327751A JPH11161651A (en) 1997-11-28 1997-11-28 Phonetic symbol generator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9327751A JPH11161651A (en) 1997-11-28 1997-11-28 Phonetic symbol generator

Publications (1)

Publication Number Publication Date
JPH11161651A true JPH11161651A (en) 1999-06-18

Family

ID=18202586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9327751A Pending JPH11161651A (en) 1997-11-28 1997-11-28 Phonetic symbol generator

Country Status (1)

Country Link
JP (1) JPH11161651A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004510218A (en) * 2000-06-16 2004-04-02 ゼネラル・エレクトリック・カンパニイ System and method for generating a web usage process advisor application
JP2015026054A (en) * 2013-07-29 2015-02-05 韓國電子通信研究院Electronics and Telecommunications Research Institute Automatic interpretation device and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004510218A (en) * 2000-06-16 2004-04-02 ゼネラル・エレクトリック・カンパニイ System and method for generating a web usage process advisor application
JP2015026054A (en) * 2013-07-29 2015-02-05 韓國電子通信研究院Electronics and Telecommunications Research Institute Automatic interpretation device and method

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
Abdurakhmonova et al. Developing NLP tool for linguistic analysis of Turkic languages
JP5231698B2 (en) How to predict how to read Japanese ideograms
de Silva et al. Singlish to sinhala transliteration using rule-based approach
US20070011160A1 (en) Literacy automation software
Hajbi et al. Moroccan Arabizi-to-Arabic conversion using rule-based transliteration and weighted Levenshtein algorithm
Onyenwe Developing methods and resources for automated processing of the african language igbo
Athukorala et al. Swa bhasha: Message-based singlish to sinhala transliteration
JP6998017B2 (en) Speech synthesis data generator, speech synthesis data generation method and speech synthesis system
Chiruzzo et al. Findings of the AmericasNLP 2024 shared task on the creation of educational materials for indigenous languages
Bakar et al. NUWT: Jawi-specific buckwalter corpus for Malay word tokenization
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
Aranta et al. Utilization Of Hexadecimal Numbers In Optimization Of Balinese Transliteration String Replacement Method
JPH11161651A (en) Phonetic symbol generator
Aichaoui et al. SPIRAL: SP ell I ng e R ror Parallel Corpus for A rabic L anguage
JP2004206659A (en) Reading information determination method and apparatus and program
Debnath et al. A hybrid approach to design automatic spelling corrector and converter for transliterated Bangla words
KR100631086B1 (en) Method and apparatus for text normalization using WLML
Prathiba et al. Morphological Analyzer for Kannada Inflectional Words Using Hybrid Approach
Angle et al. Kannada morpheme segmentation using machine learning
US20240160839A1 (en) Language correction system, method therefor, and language correction model learning method of system
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
Anusha et al. iKan—A Kannada Transliteration Tool for Assisted Linguistic Learning
Ohm et al. Tokenization's Potential for Santhali Language Processing
Utka Towards the Development of Language Analysis Tools for the Written Latgalian