JPH09134345A - Yomigana generating device - Google Patents

Yomigana generating device

Info

Publication number
JPH09134345A
JPH09134345A JP7289462A JP28946295A JPH09134345A JP H09134345 A JPH09134345 A JP H09134345A JP 7289462 A JP7289462 A JP 7289462A JP 28946295 A JP28946295 A JP 28946295A JP H09134345 A JPH09134345 A JP H09134345A
Authority
JP
Japan
Prior art keywords
vowel
character
consonant
character string
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7289462A
Other languages
Japanese (ja)
Inventor
Tomoharu Yamaguchi
智治 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7289462A priority Critical patent/JPH09134345A/en
Publication of JPH09134345A publication Critical patent/JPH09134345A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To save a storage area for a dictionary for storing correspondence between foreign language notation and its YOMIGANA (Japanese pronunciation syllabary printed alongside foreign language characters) and to make it possible to generate YOMIGANA also for foreign language notation not recorded in the directionary. SOLUTION: A pointer is set up to the leading character of a character string expressed by foreign language notation (S10), whether the character pointed out by the pointer is a vowel or not is judged (S11), and when the character is not a vowel, whether the character is 'N' or not is judged (S12). When the character is 'N', the pointer is moved forward only for one character (S16), and when the character is not 'N', whether a character next to the pointed character is a vowel or not is judged (S13). When the succeeding character is a vowel, the pointer is moved forward only for one character (S16). When the character is not a vowel, a vowel is inserted into a space just before the pointed character (S14) and the pointer is moved to a character succeeding the inserted character (S16). When the pointer moved forward exceeds the final character of the character string or not is judged (S17), and when the pointer does not exceed, processing is repeated from the judgement (S11) and Roman characters are converted into KANA (square form of Japanese syllabary) characters (S18) to end the processing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】外国語のアルファベット表記
から、日本語のよみがなを生成するよみがな生成装置に
関し、特に未知の単語についてもよみがなを生成するこ
とのできるよみがな生成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese phonetic alphabet generating device for generating Japanese Japanese phonetic characters from an alphabetical representation of a foreign language, and more particularly to a Japanese word phonetic generating device capable of generating Japanese phonetic characters even for unknown words.

【0002】[0002]

【従来の技術】従来、外国語のアルファベット表記から
日本語のよみがなを生成する技術では、特定の単語につ
いて、あらかじめ外国語表記と日本語のよみがなの対応
を記録した辞書を用いて、記録されている外国語表記に
限って、日本語のよみがなに変換可能であった。その技
術の例として、EDR((株)日本電子化辞書研究所)
が作成する電子化辞書のように様々な環境や用途で利用
可能であるように著しく多数の語彙を収録した大規模な
辞書を構築することにより、外国語のアルファベット表
記から日本語のよみがなを生成することが可能である。
2. Description of the Related Art Conventionally, a technique for generating Japanese phonetic characters from a foreign language alphabetic notation has been used to record a specific word using a dictionary in which the correspondence between the foreign language notation and the Japanese phonetic characters is recorded in advance. Only the foreign language notation that existed could be converted into Japanese. As an example of such technology, EDR (Japan Electronic Dictionary Research Institute)
A Japanese dictionary is created from a foreign-language alphabet by constructing a large-scale dictionary containing a remarkably large number of vocabularies so that it can be used in various environments and applications like the electronic dictionary created by It is possible to

【0003】また、カナ英字辞書を用意して、カナ文字
列から英語の綴りを得る機能をもつ特開平3−2882
59号公報、仮名漢字変換処理装置などが知られてい
る。
Further, a Kana-English character dictionary is prepared, and it has a function of obtaining English spelling from a Kana character string.
No. 59, Kana-Kanji conversion processing device, etc. are known.

【0004】[0004]

【発明が解決しようとする課題】上述のように従来の技
術では、外国語表記とよみがなの対応を記録しておく辞
書のため、外国語表記を日本語のよみがなに対応させる
には大きな記憶領域を必要とする。また、辞書に記録さ
れていない外国語表記についてはよみがなが生成できな
いという問題があった。
As described above, in the prior art, since the dictionary records the correspondence between the foreign language notation and the Japanese pronunciation, a large storage area is required to correspond the foreign language notation to the Japanese pronunciation. Need. In addition, there is a problem in that readings cannot be generated for foreign language notations not recorded in the dictionary.

【0005】特に計算機システムに関しては、次々と新
しく開発される技術に関連する新語、特定の装置やソフ
トウェアの固有名詞に対応する必要があり、英語など外
国語表記や略称が多用される傾向がある。これらのすべ
てをあらかじめ登録しておくことは大規模な辞書をもっ
てしても不可能である。
Particularly in computer systems, it is necessary to deal with new words related to newly developed technology one after another, proper nouns of specific devices and software, and foreign language notations and abbreviations such as English tend to be frequently used. . It is impossible to register all of these in advance even with a large-scale dictionary.

【0006】本発明の目的は、上述の点に鑑み、辞書に
記録されていない外国語表記についてもよみがなを生成
することができ、かつ、辞書を記憶するための記憶領域
を削減できるよみがな生成装置を提供することにある。
In view of the above-mentioned point, an object of the present invention is to generate a phonetic alphabet for a foreign language notation not recorded in the dictionary and to reduce a storage area for storing the dictionary. To provide.

【0007】[0007]

【課題を解決するための手段】本発明、第1の発明は、
入力されたアルファベットによる外国語表記の文字列
を、日本語の読みに変換するよみがな生成装置におい
て、前記文字列を構成する文字が母音であるか子音であ
るかを判別した判別結果を出力する母音・子音判別手段
と、前記判別結果を入力し、前記文字列中で子音が連続
する部分を検出した子音連続判定結果を出力する子音連
続検出手段と、前記子音連続判定結果により、前記文字
列の連続する子音の間に母音を挿入し、前記外国語表記
の文字列に対応する日本語のよみがなを生成する母音挿
入手段とを備えることを特徴とする。
Means for Solving the Problems The present invention, the first invention,
A vowel that outputs a discrimination result that discriminates whether a character forming the character string is a vowel or a consonant in a Japanese character generation device that converts a character string of an input alphabet in a foreign language into Japanese reading. A consonant discrimination means, a consonant continuity detection means for inputting the discrimination result and outputting a consonant continuity determination result for detecting a portion where consonants are continuous in the character string; And a vowel inserting unit that inserts a vowel between consecutive consonants and generates a Japanese phonetic string corresponding to the character string in the foreign language notation.

【0008】また、本発明第2の発明は、入力されたア
ルファベットによる外国語表記の文字列を、日本語の読
みに変換するよみがな生成装置において、前記文字列に
含まれ、単語よりも短い文字列パターンについて、特定
の日本語の読みに対応付けて記録した読みパターン表を
有し、前記外国語表記の文字パターンが前記読みパター
ン表に記録された文字列パターンを含む場合には、前記
文字列パターンを前記読みパターン表を参照して日本語
の読みに置き換えた文字列を出力する読みパターン変換
手段と、前記文字列を入力し、前記文字列を構成する文
字が母音であるか子音であるかを判別した判別結果を出
力する母音・子音判別手段と、前記判別結果を入力し、
前記文字列中で子音が連続する部分を検出した子音連続
判定結果を出力する子音連続検出手段と、前記子音連続
判定結果により、前記文字列の連続する子音の間に母音
を挿入し、前記外国語表記の文字列に対応する日本語の
よみがなを生成する母音挿入手段とを備えることを特徴
とする。
A second aspect of the present invention is a device for converting a inputted character string in a foreign language written in an alphabet into a Japanese reading, and is a character included in the character string and shorter than a word. Regarding the column pattern, a reading pattern table recorded in association with a specific Japanese reading is included, and when the character pattern of the foreign language notation includes the character string pattern recorded in the reading pattern table, the character A reading pattern conversion means for outputting a character string in which a column pattern is replaced with a Japanese reading by referring to the reading pattern table, and the character string is input, and the characters constituting the character string are vowels or consonants. A vowel / consonant discrimination unit that outputs a discrimination result that discriminates whether or not there is input the discrimination result,
A consonant continuity detection unit that outputs a consonant continuity determination result that detects a consonant continuous portion in the character string, and inserts a vowel between consecutive consonants in the character string according to the consonant continuity determination result, It is characterized by comprising vowel insertion means for generating Japanese phonetic characters corresponding to a character string in word notation.

【0009】さらに、本発明の第3の発明は、第1、第
2の発明において、前記母音挿入手段が、母音の挿入位
置の直前の子音について“T”あるいは“D”であるか
を識別し、挿入位置の直前の子音が“T”あるいは
“D”であれば“O”を挿入し、“T”及び“D”以外
の子音では“U”を挿入することを特徴とする。
Further, in a third aspect of the present invention, in the first and second aspects, the vowel inserting means identifies whether the consonant immediately before the vowel insertion position is "T" or "D". If the consonant immediately before the insertion position is "T" or "D", "O" is inserted, and if the consonant other than "T" and "D", "U" is inserted.

【0010】さらに、本発明の第4の発明は、第1、第
2、第3の発明において、アルファベットの子音とその
後に挿入すべき母音の対応を記録した子音母音表を有
し、前記母音挿入手段が前記子音母音表を参照して挿入
すべき母音を決定することを特徴とする。
Further, a fourth invention of the present invention is, in the first, second and third inventions, having a consonant vowel table in which correspondences between alphabetic consonants and vowels to be inserted thereafter are recorded. The inserting means determines a vowel to be inserted by referring to the consonant vowel table.

【0011】[0011]

【発明の実施の形態】以下、図面を参照して本発明のよ
みがな生成装置の実施の形態について説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of a Japanese-orientation-gardening device of the present invention will be described below with reference to the drawings.

【0012】図1は本発明の第1の発明の一実施例にお
けるよみがな生成装置10の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of a Japanese-original generation device 10 according to an embodiment of the first aspect of the present invention.

【0013】母音挿入手段13は、文字列101が入力
されると、先頭の文字から順に母音・子音判別手段11
に文字102を渡す。母音・子音判別手段11は、母音
挿入手段13から渡された文字が母音であるか子音であ
るか判別し、判別結果103を子音連続検出手段12に
通知する。
When the character string 101 is inputted, the vowel inserting means 13 receives the character string 101 and sequentially detects the vowel and consonant sound 11 from the first character.
Pass the character 102 to. The vowel / consonant discrimination unit 11 discriminates whether the character passed from the vowel insertion unit 13 is a vowel or a consonant, and notifies the consonant continuous detection unit 12 of the discrimination result 103.

【0014】子音連続検出手段12は直前に母音・子音
判別手段11から受け取った判別結果を記憶しておき、
新たに母音・子音判別手段11から受け取った判別結果
と直前の判別結果の両方が子音であるか否かを表す子音
連続判定結果104を母音挿入手段13に通知する。
The consonant continuous detection means 12 stores the discrimination result received from the vowel / consonant discrimination means 11 immediately before,
The vowel insertion unit 13 is notified of a consonant continuous determination result 104 indicating whether both the discrimination result newly received from the vowel / consonant discrimination unit 11 and the immediately preceding discrimination result are consonants.

【0015】母音挿入手段13は、子音連続検出手段1
2からの子音連続判定結果104を受け、子音が連続し
ている場合には、その間に母音を挿入する。
The vowel inserting means 13 is a consonant continuity detecting means 1
When the consonant continuity determination result 104 from 2 is received and consonants are continuous, a vowel is inserted between them.

【0016】母音挿入手段13は、文字列101の文字
を最後まで母音・子音判別手段11に送り、子音連続検
出手段12からの通知を受け取ると、母音の挿入が必要
な場合には挿入を行い、ローマ字表記のよみがな105
を出力する。また、よみがなとしてローマ字表記を出力
するのではなく、母音挿入手段において、ローマ字表記
をカナに変換して出力してもかまわない。
The vowel inserting means 13 sends the characters of the character string 101 to the vowel / consonant discriminating means 11 to the end, and upon receiving the notification from the consonant continuity detecting means 12, inserts the vowel when it is necessary. , Romaji notation 105
Is output. Further, instead of outputting the romanized notation for reading, the vowel inserting means may convert the romanized notation into kana and output it.

【0017】次に、本発明の第1の発明の処理の流れを
説明する。図4は第1の発明の一実施例におけるよみが
な生成装置の処理の流れを示すフロー図である。
Next, the flow of processing according to the first aspect of the present invention will be described. FIG. 4 is a flow chart showing the flow of processing of the Japanese-speaking device in one embodiment of the first invention.

【0018】よみがなを生成しようとする外国語表記の
文字列を先頭から処理するために、まずポインタを先頭
の文字に設定する(ステップS10)。ポインタの指す
文字が母音であるか、母音・子音判別手段11により判
定する(ステップS11)。子音連続検出手段12で
は、母音・子音判別手段11の判定結果が母音であれ
ば、子音の連続はない、と母音挿入手段13に通知し、
母音挿入手段13は、そのままポインタを一文字分進め
る(ステップS16)。母音・子音判別手段11の判定
結果が母音でなければ、その文字が“N”であるか判定
し(ステップS12)、“N”であれば子音連続検出手
段12は、子音の連続はない、と母音挿入手段13に通
知し、母音挿入手段13は、そのままポインタを一文字
分進める(ステップS16)。“N”でなければポイン
タが指す次の文字が母音であるか判定し(ステップS1
3)、母音であれば、子音の連続はない、と子音連続検
出手段12は母音挿入手段13に通知し、母音挿入手段
13は、そのままポインタを一文字分進める(ステップ
S16)。
In order to process the character string in the foreign language notation from which the calligraphy is to be generated from the beginning, the pointer is first set to the beginning character (step S10). The vowel / consonant discrimination unit 11 determines whether the character pointed by the pointer is a vowel (step S11). The consonant continuity detecting means 12 notifies the vowel inserting means 13 that the consonant is not continuous if the determination result of the vowel / consonant determining means 11 is a vowel,
The vowel inserting means 13 advances the pointer as it is by one character (step S16). If the determination result of the vowel / consonant discrimination means 11 is not a vowel, it is determined whether or not the character is "N" (step S12). If "N", the consonant continuity detection means 12 does not have a consonant continuity, Is notified to the vowel inserting means 13, and the vowel inserting means 13 advances the pointer as it is by one character (step S16). If it is not "N", it is determined whether the next character pointed by the pointer is a vowel (step S1).
3) If it is a vowel, the consonant continuous detection means 12 notifies the vowel insertion means 13 that there is no consonant continuation, and the vowel insertion means 13 advances the pointer as it is by one character (step S16).

【0019】母音でなければ、子音連続検出手段12
は、子音の連続がある、と母音挿入手段13に通知し、
母音挿入手段13は、ポインタの指す文字の後ろに母音
を挿入し(ステップS14)、ポインタを挿入した文字
の次の文字へ進める(ステップS15)。
If it is not a vowel, the consonant continuous detection means 12
Informs the vowel insertion means 13 that there is a consonant sequence,
The vowel inserting means 13 inserts a vowel after the character pointed by the pointer (step S14), and advances to the character next to the character into which the pointer is inserted (step S15).

【0020】ポインタを進めた結果が文字列の末尾を通
過したかどうか判定し(ステップS17)、通過してい
なければ母音の判定(ステップS11)から繰り返す。
通過していればアルファベットの文字列をローマ字読み
してカナに変換し(ステップS18)処理は終了する。
It is judged whether or not the result of advancing the pointer has passed the end of the character string (step S17), and if not passed, the vowel judgment (step S11) is repeated.
If it has passed, the alphabetic character string is read in Roman letters and converted into kana (step S18), and the process ends.

【0021】次に、本発明の第2の発明の実施の形態に
ついて説明する。図2は第2の発明の一実施例における
よみがな生成装置の構成を示すブロック図である。ま
た、図5は第2の発明の一実施例におけるよみがな生成
装置の処理を示すフロー図である。
Next, a second embodiment of the present invention will be described. FIG. 2 is a block diagram showing the configuration of a Japanese-speaking device according to an embodiment of the second invention. Further, FIG. 5 is a flow chart showing the processing of the paper-original generation device according to the embodiment of the second invention.

【0022】本実施例の形態においては、第1の発明の
構成に加え、読みパターン変換手段15と図8に示すよ
うにアルファベットによる外国語表記に含まれ、単語よ
りも短い文字列パターンで特定の日本語の読みに対応付
けられるものを外国語文字列パターン(82)とし、そ
の読みパターン(83)と対応付けて記録した読みパタ
ーン表(81)を備え、連続子音間への母音挿入に先立
って、読みパターン表(81)を参照して、ポインタが
指す文字を先頭とする文字列が読みパターン表に含まれ
る外国語文字列パターンと前方一致するかどうか調べ
(ステップS41)、前方一致する場合には、ポインタ
が指す文字列を先頭とする文字列のうち外国語文字列パ
ターンと一致する部分を読みパターンで置換する(ステ
ップS42)。
In the embodiment of the present invention, in addition to the configuration of the first invention, the reading pattern conversion means 15 and a foreign character written in alphabets as shown in FIG. 8 are specified by a character string pattern shorter than a word. The foreign language character string pattern (82) is associated with the Japanese reading of, and a reading pattern table (81) recorded in association with the reading pattern (83) is provided for inserting vowels between consecutive consonants. First, by referring to the reading pattern table (81), it is checked whether or not the character string starting with the character pointed by the pointer matches the foreign language character string pattern included in the reading pattern table (step S41). In this case, the portion of the character string having the character string pointed to by the pointer at the beginning as the foreign language character string pattern is replaced with the reading pattern (step S42).

【0023】例えば、アルファベットによる外国語表記
が“ACCENT”であり、ポインタが一つめの“C”
を指しているとする。図8の読みパターン表を参照し
て、ポインタが指す文字を先頭とする文字列“CCE”
が読みパターン表に含まれる外国語文字列パターン“C
CE”と一致するので、その読みパターン“KUSE”
でポインタが指す文字を先頭とする文字列“CCE”を
置換して処理を続行する。最終的に“AKUSENT
O”というローマ字文字列を得て、よみがな“アクセン
ト”を生成する。
For example, the foreign language notation in the alphabet is "ACCENT" and the pointer is the first "C".
And refers to. Referring to the reading pattern table of FIG. 8, the character string "CCE" starting with the character pointed by the pointer
Is a foreign language character string pattern "C
Since it matches with "CE", its reading pattern "KUSE"
Replaces the character string "CCE" starting with the character pointed by the pointer and continues the processing. Finally, "AKUSENT
The Roman character string "O" is obtained and a phonetic "accent" is generated.

【0024】同様に“EARDROP”は“IYADO
ROPU”となり、よみがな“イヤドロプ”を生成す
る。“SKETCH”は“SUKETTI”となり、よ
みがな“スケッチ”を生成する。“CHEEK”は“C
HI−KU”となり、よみがな“チーク”を生成する。
Similarly, "EARDROP" is "IYADO"
It becomes ROPU and produces a phonetic "eardrop". "SKETCH" produces "SUKETTI" and a phonetic "sketch". "CHEEK" produces "C"
HI-KU ", and produces" Cheek "which is a ghost.

【0025】次に、本発明の第3の発明の実施の形態に
ついて説明する。図6は、第3の発明の一実施例におけ
るよみがな生成装置の処理の流れを示すフロー図であ
る。
Next, a third embodiment of the present invention will be described. FIG. 6 is a flow chart showing the flow of processing of the Japanese-speaking device in one embodiment of the third invention.

【0026】本実施の形態においては、第1、第2の発
明の母音挿入手段13における母音の挿入に際して、ポ
インタが指す子音によって、“O”または“U”のいず
れの母音を挿入するか決定する。本実施の形態では、ポ
インタが指す文字が“T”または“D”であるか判定し
(ステップS21)、そのいずれかであればポインタの
指す文字の後ろに“O”を挿入し(ステップS22)、
いずれでもなければポインタの指す文字の後ろに“U”
を挿入する(ステップS23)。
In the present embodiment, when inserting a vowel in the vowel inserting means 13 of the first and second inventions, it is determined whether the vowel "O" or "U" is inserted by the consonant pointed by the pointer. To do. In the present embodiment, it is determined whether the character pointed to by the pointer is "T" or "D" (step S21), and in either case, "O" is inserted after the character pointed by the pointer (step S22). ),
If neither, "U" is added after the character pointed to by the pointer.
Is inserted (step S23).

【0027】例えば、“TEST”という文字列101
が母音挿入手段13に入力された場合、まず、先頭の文
字“T”にポインタが設定され、この文字は子音であ
り、次の文字が母音であるのでステップS13でNOと
なり、次の文字へポインタが進められ、その文字は
“E”であるので、ステップS11でYESとなり、ま
た次の文字へポインタが進められ、“S”は子音であ
り、次の文字“T”も子音であり、ポインタが設定され
ている文字“S”は“T”でも“D”でもないので、ス
テップS23で“S”の次に“U”が挿入され、ポイン
タは挿入した次の“T”へ進められる。“T”は子音で
あり、文字列の末尾なので次に母音はないのでステップ
S21の判定に進みYESとなって“T”の後ろに
“O”を挿入する。挿入した文字の次にポインタを進め
るが、文字列の末尾を越えているので処理は終了し、
“TESUTO”という文字列が得られる。これをロー
マ字読みすれば、“テスト”というカナ表記に変換でき
る。
For example, the character string 101 "TEST"
Is input to the vowel insertion means 13, first, the pointer is set to the first character "T", this character is a consonant, and the next character is a vowel, so NO is determined in step S13, and the next character is selected. Since the pointer is advanced and the character is "E", YES is obtained in step S11, the pointer is advanced to the next character, "S" is a consonant, and the next character "T" is also a consonant, Since the character "S" to which the pointer is set is neither "T" nor "D", "U" is inserted after "S" in step S23, and the pointer is advanced to the next "T" that is inserted. . Since "T" is a consonant and there is no vowel next to the end of the character string, the process proceeds to the determination in step S21 and becomes YES, and "O" is inserted after "T". The pointer is advanced to the inserted character, but since it is beyond the end of the character string, processing ends,
The character string "TESUTO" is obtained. If you read this in romaji, you can convert it into kana notation called "test".

【0028】次に、本発明の第4の発明の実施の形態に
ついて説明する。図3は第4の発明の一実施例における
よみがな生成装置の構成を示すブロック図である。ま
た、図7は第4の発明の一実施例におけるよみがな生成
装置の処理の流れを示すフロー図である。
Next, a fourth embodiment of the present invention will be described. FIG. 3 is a block diagram showing the configuration of a Japanese-speaking device according to an embodiment of the fourth invention. Further, FIG. 7 is a flow chart showing the flow of processing of the Japanese-speaking device in one embodiment of the fourth invention.

【0029】本実施の形態では、第1、第2の発明の構
成に加え、図9に示すように、連続する子音の第1文字
目の子音(92)と、その後ろに挿入する母音(93)
とを対応付けた子音母音表91を備え、母音挿入手段1
3において母音を挿入する際に、子音母音表91を参照
して決定される母音を挿入する(ステップS31)。
In the present embodiment, in addition to the configurations of the first and second inventions, as shown in FIG. 9, a consonant (92) of the first character of consecutive consonants and a vowel (93) inserted after it. )
The vowel insertion means 1 is provided with a consonant vowel table 91 in which
When the vowel is inserted in No. 3, the vowel determined by referring to the consonant vowel table 91 is inserted (step S31).

【0030】また、子音母音表91においては、第3の
発明と同じように、子音、“T”及び“D”の場合に挿
入する母音は“O”であり、“T”及び“D”以外の子
音の場合に挿入する母音は“U”である。
Further, in the consonant vowel table 91, the vowels to be inserted in the case of the consonants "T" and "D" are "O" and "T" and "D", as in the third invention. The vowel to be inserted in the case of a consonant other than is "U".

【0031】[0031]

【発明の効果】本発明によれば、外国語表記とよみがな
の対応を記録しておく辞書のための記憶領域を節約する
ことが可能である。
According to the present invention, it is possible to save a storage area for a dictionary in which correspondences between foreign language expressions and Japanese characters are recorded.

【0032】さらに、特に次々と新しく開発される技術
に関連する新語など、辞書に記録されていない外国語表
記についてもよみがなを生成することが可能なよみがな
生成装置を実現できる。
Furthermore, it is possible to realize a Japanese-speaking device capable of generating a Japanese-speaking phonetic notation even for foreign language notations not recorded in the dictionary, such as new words relating to newly developed technologies one after another.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の発明の一実施例におけるよみがな生成装
置の構成を示す図である。
FIG. 1 is a diagram showing a configuration of a Japanese-speaking device according to an embodiment of the first invention.

【図2】第2の発明の一実施例におけるよみがな生成装
置の構成を示す図である。
FIG. 2 is a diagram showing a configuration of a Japanese-speaking device according to an embodiment of the second invention.

【図3】第4の発明の一実施例におけるよみがな生成装
置の構成を示す図である。
FIG. 3 is a diagram showing a configuration of a Japanese-speaking device according to an embodiment of the fourth invention.

【図4】第1の発明の一実施例におけるよみがな生成装
置の処理を示すフロー図である。
FIG. 4 is a flowchart showing the processing of the Japanese-speaking device in one embodiment of the first invention.

【図5】第2の発明の一実施例におけるよみがな生成装
置の処理を示すフロー図である。
FIG. 5 is a flow chart showing a process of a Japanese-speaking device according to an embodiment of the second invention.

【図6】第3の発明の一実施例におけるよみがな生成装
置の処理を示すフロー図である。
FIG. 6 is a flowchart showing the processing of a Japanese-speaking device according to an embodiment of the third invention.

【図7】第4の発明の一実施例におけるよみがな生成装
置の処理を示すフロー図である。
FIG. 7 is a flowchart showing the processing of the Japanese-speaking device in one embodiment of the fourth invention.

【図8】読みパターン表の例を示す図である。FIG. 8 is a diagram showing an example of a reading pattern table.

【図9】子音母音表の例を示す図である。FIG. 9 is a diagram showing an example of a consonant vowel table.

【符号の説明】[Explanation of symbols]

10 よみがな生成装置 11 母音・子音判別手段 12 子音連続検出手段 13 母音挿入手段 15 読みパターン変換手段 81 読みパターン表 82 外国語文字列パターン 83 読みパターン 91 子音母音表 92 子音 93 挿入する母音 101 入力文字列 102 文字 103 母音・子音判別結果 104 子音連続判定結果 105 よみがな 106 読みパターン変換後の文字列 10 Phonetic Generator 11 Vowel / Consonant Discrimination Means 12 Consonant Continuous Detection Means 13 Vowel Insertion Means 15 Reading Pattern Converting Means 81 Reading Pattern Table 82 Foreign Language Character String Patterns 83 Reading Patterns 91 Consonant Vowel Tables 92 Consonants 93 Inserting Vowels 101 Input Characters Sequence 102 Characters 103 Vowel / consonant discrimination result 104 Consonant continuous determination result 105 Yomigan 106 Character string after reading pattern conversion

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】入力されたアルファベットによる外国語表
記の文字列を、日本語の読みに変換するよみがな生成装
置において、 前記文字列を構成する文字が母音であるか子音であるか
を判別した判別結果を出力する母音・子音判別手段と、 前記判別結果を入力し、前記文字列中で子音が連続する
部分を検出した子音連続判定結果を出力する子音連続検
出手段と、 前記子音連続判定結果により、前記文字列の連続する子
音の間に母音を挿入し、前記外国語表記の文字列に対応
する日本語のよみがなを生成する母音挿入手段とを備え
ることを特徴とするよみがな生成装置。
1. A determination device for determining whether a character that constitutes the character string is a vowel or a consonant in a phonetic character generator that converts an inputted character string in a foreign language written in an alphabet into a Japanese reading. A vowel / consonant discrimination unit that outputs a result, a consonant continuity detection unit that inputs the discrimination result and outputs a consonant continuation determination result that detects a portion where consonants are continuous in the character string, and a consonant continuation determination result. And a vowel insertion device that inserts a vowel between consonant contiguous characters of the character string and generates a Japanese phonetic character corresponding to the character string in the foreign language notation.
【請求項2】入力されたアルファベットによる外国語表
記の文字列を、日本語の読みに変換するよみがな生成装
置において、 前記文字列に含まれ、単語よりも短い文字列パターンに
ついて、特定の日本語の読みに対応付けて記録した読み
パターン表を有し、前記外国語表記の文字パターンが前
記読みパターン表に記録された文字列パターンを含む場
合には、前記文字列パターンを前記読みパターン表を参
照して日本語の読みに置き換えた文字列を出力する読み
パターン変換手段と、 前記文字列を入力し、前記文字列を構成する文字が母音
であるか子音であるかを判別した判別結果を出力する母
音・子音判別手段と、 前記判別結果を入力し、前記文字列中で子音が連続する
部分を検出した子音連続判定結果を出力する子音連続検
出手段と、 前記子音連続判定結果により、前記文字列の連続する子
音の間に母音を挿入し、前記外国語表記の文字列に対応
する日本語のよみがなを生成する母音挿入手段とを備え
ることを特徴とするよみがな生成装置。
2. A reading apparatus for converting an inputted character string in a foreign language written in alphabet into Japanese reading, wherein a specific Japanese character string included in the character string and shorter than a word is specified. The reading pattern table recorded in association with the reading, and when the character pattern of the foreign language notation includes the character string pattern recorded in the reading pattern table, the character string pattern is stored in the reading pattern table. A phonetic pattern conversion means for referring to and outputting a character string replaced with a Japanese reading, and inputting the character string, and a discrimination result for discriminating whether a character forming the character string is a vowel or a consonant. A vowel / consonant discrimination means for outputting; a consonant continuity detecting means for inputting the discrimination result and outputting a consonant continuity determination result for detecting a portion where consonants are continuous in the character string; A vowel inserting means for inserting a vowel between consecutive consonants of the character string and generating a Japanese phonetic string corresponding to the character string in the foreign language notation according to the result of the consonant determination. Phonetic generator.
【請求項3】前記母音挿入手段が、母音の挿入位置の直
前の子音について“T”あるいは“D”であるかを識別
し、挿入位置の直前の子音が“T”あるいは“D”であ
れば“O”を挿入し、“T”及び“D”以外の子音では
“U”を挿入することを特徴とする請求項1または2に
記載のよみがな生成装置。
3. The vowel inserting means identifies whether the consonant immediately before the vowel insertion position is "T" or "D", and the consonant immediately before the insertion position is "T" or "D". The device for generating a Japanese-orthogonal string according to claim 1 or 2, wherein "O" is inserted, and "U" is inserted for consonants other than "T" and "D".
【請求項4】アルファベットの子音とその後に挿入すべ
き母音の対応を記録した子音母音表を有し、 前記母音挿入手段が前記子音母音表を参照して挿入すべ
き母音を決定することを特徴とする請求項1、2または
3に記載のよみがな生成装置。
4. A consonant vowel table in which correspondences between alphabetic consonants and vowels to be inserted thereafter are recorded, and the vowel inserting means refers to the consonant vowel table to determine vowels to be inserted. The device for producing a calligraphy according to claim 1, 2 or 3.
JP7289462A 1995-11-08 1995-11-08 Yomigana generating device Pending JPH09134345A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7289462A JPH09134345A (en) 1995-11-08 1995-11-08 Yomigana generating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7289462A JPH09134345A (en) 1995-11-08 1995-11-08 Yomigana generating device

Publications (1)

Publication Number Publication Date
JPH09134345A true JPH09134345A (en) 1997-05-20

Family

ID=17743589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7289462A Pending JPH09134345A (en) 1995-11-08 1995-11-08 Yomigana generating device

Country Status (1)

Country Link
JP (1) JPH09134345A (en)

Similar Documents

Publication Publication Date Title
JP5997217B2 (en) A method to remove ambiguity of multiple readings in language conversion
JP4829901B2 (en) Method and apparatus for confirming manually entered indeterminate text input using speech input
KR101279676B1 (en) Method and apparatus for creating a language model and kana-kanji conversion
JPH03224055A (en) Method and device for input of translation text
JP2013117978A (en) Generating method for typing candidate for improvement in typing efficiency
US6587819B1 (en) Chinese character conversion apparatus using syntax information
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JP2002207728A (en) Phonogram generator, and recording medium recorded with program for realizing the same
JPH09134345A (en) Yomigana generating device
KR101777141B1 (en) Apparatus and method for inputting chinese and foreign languages based on hun min jeong eum using korean input keyboard
JPH09325787A (en) Voice synthesizing method, voice synthesizing device, method and device for incorporating voice command in sentence
JP2003178087A (en) Retrieval device and method for electronic foreign language dictionary
AlGahtani et al. Joint Arabic segmentation and part-of-speech tagging
CN1323004A (en) Automatic conversion method from Chinese braille to Chinese character
JP3234338B2 (en) Kanji conversion device
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JPS6037510B2 (en) Romaji-kanji conversion method
JPH0677252B2 (en) Japanese data input processor
JP3069532B2 (en) Kana-kanji conversion method and device, and computer-readable recording medium storing a program for causing a computer to execute the kana-kanji conversion method
JP3387421B2 (en) Word input support device and word input support method
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPH05282293A (en) Word processor
Bansal et al. Isolated-word Error Correction for Partially Phonemic Languages using Phonetic Cues
JP3791565B2 (en) Character input device
JPH07210571A (en) Device and method for word retrieval processing

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981013