JP2002123507A - Device and method for pronouncing chinese and converting chinese character - Google Patents

Device and method for pronouncing chinese and converting chinese character

Info

Publication number
JP2002123507A
JP2002123507A JP2001246449A JP2001246449A JP2002123507A JP 2002123507 A JP2002123507 A JP 2002123507A JP 2001246449 A JP2001246449 A JP 2001246449A JP 2001246449 A JP2001246449 A JP 2001246449A JP 2002123507 A JP2002123507 A JP 2002123507A
Authority
JP
Japan
Prior art keywords
kanji
sound code
code
sound
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001246449A
Other languages
Japanese (ja)
Inventor
Okikuni Naka
興国 仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2001246449A priority Critical patent/JP2002123507A/en
Publication of JP2002123507A publication Critical patent/JP2002123507A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain KANJI (Chinese character) candidates including desired KANJI even when no tune or a wrong tune is inputted. SOLUTION: Input data in Pin Yin pronunciation and input data in Zhu Yin pronunciation are converted into corresponding sound codes by using a Pin Yin/sound code conversion table 31 and a Zhu Yin/sound code conversion table 32 respectively. A dictionary 35 contains KANJI codes (corresponding to words) so that they correspond to sound code strings. A sound code string is generated from input data. The respective sound codes of the input sound code string and the sound codes of a sound code string in the dictionary 35 are compared with each other through a filter which masks specific bits of sound codes. Through this comparison, the KANJI code corresponding to the matching sound code string is read out of the dictionary 35 and the word (KANJI) corresponding to the KANJI code is displayed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【技術分野】この発明は,キーボードから入力された中
国語発音表記をそれに対応する漢字に変換して出力する
装置および方法に関し,とくに中国語用ワード・プロセ
ッサやワーク・ステーション等で好適に利用される装置
および方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a method for converting Chinese phonetic notation input from a keyboard into corresponding Chinese characters and outputting the converted Chinese kanji, and is suitably used particularly in a Chinese word processor or work station. Apparatus and method.

【0002】[0002]

【背景技術】中国語は漢字を用いて表現される。漢字の
発音を表記するためのいつくかの表記法がある。その代
表的なものに,中国政府が1958年に発布した
2. Description of the Related Art Chinese is expressed using Chinese characters. There are several notations for writing the pronunciation of kanji. A typical example was the Chinese government's promulgation in 1958.

【数1】 それ以前に使用され,現在でも台湾で使用されている(Equation 1) Used before and still in Taiwan

【数2】 がある。(Equation 2) There is.

【0003】中国漢字一字の発音は,子音に相当する声
母(Sheng Mu)と,母音に相当する韵母(Yun Mu)と,
抑揚を表わす四声(Si Sheng)または声調(Sheng Dia
o)とに分けることができる。韵母と声母とをあわせて
声韵(Sheng Yun )という。漢字の発音の中には抑揚の
ないものもある。一漢字の発音は1個以下(1個または
0個)の声母と1個の韵母と(必要に応じてさらに声調
を用いて)によって表わされる。
[0003] Each Chinese kanji character is pronounced by a vowel (Sheng Mu) corresponding to a consonant, a rhyme (Yun Mu) corresponding to a vowel,
Four tones (Si Sheng) or tone (Sheng Dia)
o) and can be divided into Shy Yun is a combination of a mother and a mother. Some kanji pronunciations have no intonation. The pronunciation of one kanji is represented by one or less (one or zero) initials and one rhyme (and further using the tone, if necessary).

【0004】声調は次の4種類である。 一声(Yi Shengまたは1Sheng ):高音で平坦。There are four types of tones. One voice (Yi Sheng or 1 Sheng): Treble and flat.

【数3】 二声(Er Shengまたは2Sheng ):低音から高音に上が
る。
(Equation 3) Two voices (Er Sheng or 2Sheng): rising from bass to treble.

【数4】 三声(Shan Shengまたは3Sheng ):高音から低音にな
り,再び高音になる。
(Equation 4) Three voices (Shan Sheng or 3Sheng): From high notes to low notes, again to high notes.

【数5】 四声(Si Shengまたは4Sheng ):高音から低音に下が
る。
(Equation 5) Four voices (Si Sheng or 4 Sheng): descending from treble to bass.

【数6】 (Equation 6)

【0005】たとえば,「中国」という漢字はPin Yin
法によると,
For example, the Chinese character "China" is Pin Yin
According to the law,

【数7】 と表記される。これらの中で,“Zh”および“G”が
声母,“ong”および“uo”が韵母である。また,
「日本」という漢字はPin Yin 法によると,
(Equation 7) Is written. Among these, "Zh" and "G" are the initials, and "ong" and "uo" are the rhymes. Also,
According to the Pin Yin method, the kanji "Japan"

【数8】 と表記される。“R”および“B”が声母,“i”およ
び“en”が韵母である。
(Equation 8) Is written. “R” and “B” are initials, and “i” and “en” are rhymes.

【0006】従来の中国語ワード・プロセッサではPin
Yin 法表記による入力のみが許されていた。Pin Yin 法
は比較的新しいので,Zhu Yin 法は知っているがPin Yi
n 法を知らない人々または世代がいる。したがって,よ
り多くの人々に中国語ワード・プロセッサを活用しても
らおうとするとZhu Yin 法による入力も許容するように
しなければならない。
In a conventional Chinese word processor, Pin
Only input in Yin notation was allowed. Because the Pin Yin method is relatively new, we know the Zhu Yin method but Pin Yi
n There are people or generations who do not know the law. Therefore, if you want more people to take advantage of the Chinese word processor, you must also allow Zhu Yin input.

【0007】また,Pin Yin 法表記は北京語を標準語と
して定められている。広大な中国においては北京語と声
調が異なる発音をもつ言語がある。地域によっては声韵
さえ北京語と異なる場合がある。したがって標準語とし
ての北京語を知らないまたは熟知していない人々にとっ
ては声韵と声調とを正しく入力することが困難となり,
入力誤りがしばしば生じる。北京語圏の人であっても,
声調の区別を意識しながら発音しているとは限らず,声
調を思い出しながらまたは考えながらワード・プロセッ
サへの入力作業を行なわなければならず,入力作業が煩
雑であるばかりでなく,正しい声調を入力できないとき
もある。
[0007] In addition, the Pin Yin method notation uses Mandarin as a standard language. In the vast China, there are languages that have different tones than Mandarin. Depending on the region, even the voice humor may be different from Mandarin. Therefore, it is difficult for people who do not know or are familiar with Mandarin as the standard language to input vocal rhythms and tones correctly.
Input errors often occur. Even in Mandarin-speaking people,
The pronunciation is not always conscious of tone distinction, and the input operation to the word processor must be performed while remembering or thinking about the tone. There are times when you can not enter.

【0008】従来の中国語ワード・プロセッサにおいて
は,声韵と声調が正しく入力された場合にのみそれに対
応する正しい漢字が出力され,入力誤りがあると正しい
漢字が得られない。
In the conventional Chinese word processor, the correct kanji corresponding to the vocal rhythm and tone is output only when the syllable and tone are correctly input, and a correct kanji cannot be obtained if there is an input error.

【0009】[0009]

【発明の開示】この発明の目的は,声調を入力しなくて
もまたは声調の入力に誤りがあっても所望の漢字を含む
候補漢字が得られるようにすることにある。
DISCLOSURE OF THE INVENTION An object of the present invention is to provide a candidate kanji including a desired kanji even if the tone is not input or the tone is incorrectly input.

【0010】この発明の他の目的は発音の少くとも一部
が正確であれば,その一部発音を含む発音に対応する漢
字の候補が得られるようにすることにある。
Another object of the present invention is to provide a kanji candidate corresponding to a pronunciation including a partial pronunciation if at least a part of the pronunciation is correct.

【0011】この発明による中国語の発音表記/漢字変
換装置は,入力された中国語発音を表わすデータを,そ
の発音に対応する音コードに変換する変換手段,音コー
ドと,その音コードによって表わされる発音をもつ漢字
を示す漢字コードとを相互に対応させて記憶した辞書,
音コードを構成する所定の一または複数ビットをマスク
するフィルタリング手段,上記変換手段から得られる音
コードと上記辞書の音コードとを上記フィルタリング手
段を用いてフィルタリングした上で相互に比較すること
により,上記変換手段から得られる音コードに一致する
音コードを上記辞書において検索し,一致する音コード
に対応する漢字コードを上記辞書から読み出す制御手段
を備えている。
A Chinese phonetic notation / kanji conversion device according to the present invention is a conversion means for converting data representing an input Chinese pronunciation into a sound code corresponding to the pronunciation, a sound code, and a sound code. A dictionary in which kanji codes indicating kanji having pronounced pronunciations are stored in association with each other,
Filtering means for masking one or more predetermined bits constituting the sound code, by comparing the sound code obtained from the conversion means with the sound code of the dictionary using the filtering means and comparing each other with each other, There is provided control means for searching the dictionary for a sound code that matches the sound code obtained from the conversion means, and reading a kanji code corresponding to the matching sound code from the dictionary.

【0012】上記音コードは,一実施態様においては,
声母を表わすビットと,韵母を表わすビットと,声調を
表わすビットとを含むように構成される。この場合,上
記フィルタリング手段は,声母を表わすビット,韵母を
表わすビットまたは声調を表わすビットをマスクするも
のとして構成される。
[0012] In one embodiment, the sound code is
It is configured to include a bit indicating a voice, a bit indicating a rhyme, and a bit indicating a tone. In this case, the filtering means is configured to mask a bit representing the initial, a bit representing the pronoun or a bit representing the tone.

【0013】上記フィルタリング手段は,音コードをそ
のまま通過させるものを含むと理解されたい。
It is to be understood that the filtering means includes a means for passing a sound code as it is.

【0014】フィルタリング手段の使用の有無,または
複数のフィルタリング手段のいずれかを選択する検索モ
ード選択手段が,必要に応じて,さらに設けられる。
A search mode selecting means for selecting whether or not the filtering means is used or selecting one of the plurality of filtering means is further provided as necessary.

【0015】上記変換手段は一実施態様では,音声入力
信号に基づいて発音を認識し,その発音に対応する音コ
ードを出力する音声認識手段である。
[0015] In one embodiment, the conversion means is a speech recognition means for recognizing pronunciation based on a speech input signal and outputting a sound code corresponding to the pronunciation.

【0016】より現実的なワード・プロセッサを実現す
るために,読み出された漢字コードを,その漢字コード
によって示される漢字を表わす表示データに変換する手
段,表示データに基づいて漢字を表示する装置,表示さ
れた漢字の候補の中からいずれか一つを指定する指定入
力手段,および指定された漢字を示す漢字コードを格納
するメモリが設けられよう。
Means for converting a read kanji code into display data representing a kanji represented by the kanji code to realize a more realistic word processor, and a device for displaying kanji based on the display data There will be provided a designation input means for designating any one of the displayed kanji candidates, and a memory for storing a kanji code indicating the designated kanji.

【0017】さらに,上記変換手段が一漢字について入
力データを音コードに変換するものとして構成されるの
に対して,上記辞書は,一漢字または複数の漢字からな
る単語について音コード列と漢字コードとを対応させて
記憶するものとして構成される。そして,一連の入力デ
ータが一漢字ごとに区切って音コードに変換され,変換
後の一または複数の音コードが単語単位に配列されて音
コード列が構成される。この音コード列に対応する漢字
コードが上記辞書において検索される。
Further, while the conversion means is configured to convert input data for one kanji into a sound code, the dictionary stores a sound code string and a kanji code for a word consisting of one kanji or a plurality of kanji. Are stored in association with each other. Then, a series of input data is converted into sound codes by dividing each input data into one kanji, and one or a plurality of converted sound codes are arranged in word units to form a sound code string. A kanji code corresponding to this sound code string is searched in the dictionary.

【0018】この発明によると,入力データを表わす音
コードと辞書における音コードとがともにフィルタリン
グされた後に比較される。一致,不一致を不問に付すべ
き音コードの部分(一または複数のビット)がフィルタ
によってマスクされるので,このマスクされた部分は比
較処理の対象にならない。
According to the present invention, the sound code representing the input data and the sound code in the dictionary are both filtered and then compared. Since a portion (one or a plurality of bits) of a sound code to which a match or a mismatch should be given is masked by the filter, the masked portion is not subjected to comparison processing.

【0019】したがって,声調を不問にしたい場合には
それに適したフィルタを用いることにより,声調の一
致,不一致に関係なく,または声調を入力しなくても,
その他の部分(声韵)で入力データに対応する音コード
と一致する音コードに対応する一または複数の漢字の候
補が得られることになる。このようにして,声調を入力
しなくても,または声調の入力に誤りがあっても所望の
漢字(単語)を含む漢字(単語)の候補が出力されるよ
うになる。
Therefore, when it is desired to make the tone unquestionable, a filter suitable for the tone can be used, regardless of whether the tone matches or does not match, or without inputting the tone.
One or more kanji candidates corresponding to the sound code corresponding to the sound code corresponding to the input data in the other part (voice rhythm) are obtained. In this way, even if the tone is not input or the tone is incorrectly input, the candidate of the kanji (word) including the desired kanji (word) is output.

【0020】フィルタの種類は任意に設定可能である。
したがって,声母のみの一致または韵母のみの一致とい
う条件下での漢字の検索も可能となる。すなわち,発音
の少くとも一部が正確であればその発音を含む発音に対
応する漢字(単語)の候補を得ることができるようにな
る。
The type of filter can be set arbitrarily.
Therefore, it is also possible to search for kanji under the condition that only the initials match or only the rhymes match. That is, if at least a part of the pronunciation is correct, a candidate for a kanji (word) corresponding to the pronunciation including the pronunciation can be obtained.

【0021】この発明はさらに上述した中国語の発音表
記/漢字変換装置に対応する中国語の発音表記/漢字変
換方法を提供している。
The present invention further provides a Chinese phonetic notation / kanji conversion method corresponding to the above-described Chinese phonetic notation / kanji conversion device.

【0022】中国語の発音表記/漢字変換方法は,音コ
ードと,その音コードによって表わされる発音をもつ漢
字を示す漢字コードとを相互に対応させて記憶した辞書
をあらかじめ用意しておき,入力された中国語発音を表
わすデータを,その発音に対応する音コードに変換し,
変換により得られた音コードと,上記辞書の音コードと
を,音コードを構成する所定の一または複数ビットをマ
スクすることによりフィルタリングした上で相互に比較
し,変換により得られた音コードに一致する音コードを
上記辞書において検索し,一致する音コードに対応する
漢字コードを上記辞書から読み出すものである。
In the Chinese phonetic notation / kanji conversion method, a dictionary is prepared in which sound codes and kanji codes indicating kanji having a pronunciation represented by the sound codes are stored in advance in correspondence with each other, and input is performed. The data representing the pronounced Chinese pronunciation into a sound code corresponding to the pronunciation,
The sound code obtained by the conversion and the sound code of the dictionary are filtered by masking one or more predetermined bits constituting the sound code, and are compared with each other. A matching sound code is searched in the dictionary, and a kanji code corresponding to the matching sound code is read from the dictionary.

【0023】この発明の他の特徴および利点は,以下に
示す図面を参照した実施例の説明において明らかになる
であろう。
Other features and advantages of the present invention will become apparent in the following description of embodiments with reference to the drawings.

【0024】[0024]

【実施例の説明】図1は中国語の発音表記/漢字変換装
置の構成を示している。この装置は,一般には,中国語
ワード・プロセッサ,ワーク・ステーション等の一部と
して実現されよう。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows the configuration of a Chinese phonetic transcription / kanji conversion device. The apparatus will generally be implemented as part of a Chinese word processor, work station, or the like.

【0025】中国語の発音表記/漢字変換装置は,中央
処理装置(CPU)を含むコンピュータ10,発音表記,
各種モード,その他の機能を入力するためのキーボード
20,辞書および各種変換テーブルを記憶したメモリ装置
30,ならびに変換された漢字,その他の情報またはデー
タを表示するための表示装置14およびその制御装置12か
ら構成されている。
The Chinese phonetic transcription / kanji conversion device includes a computer 10 including a central processing unit (CPU), a phonetic transcription,
Keyboard for entering various modes and other functions
20, a memory device that stores a dictionary and various conversion tables
30 and a display device 14 for displaying converted kanji characters, other information or data, and a control device 12 thereof.

【0026】コンピュータ10としては市販の汎用コンピ
ュータを用いることができる。このコンピュータ10は後
述する入力,編集処理および漢字検索処理を実行するよ
うにプログラムされている。
As the computer 10, a commercially available general-purpose computer can be used. The computer 10 is programmed to execute input, edit processing and kanji search processing, which will be described later.

【0027】この実施例では,入力可能な発音表記とし
てPin Yin 法とZhu Yin 法とがある。また,声調を含め
た完全な発音表記と,声調を除いた声韵のみで行う発音
表記とが許容される。
In this embodiment, there are a Pin Yin method and a Zhu Yin method as phonetic notations that can be input. In addition, a complete phonetic notation including the tone and a phonetic notation performed only in the vocal rhythm excluding the tone are allowed.

【0028】キーボード20には,Pin Yin 法で発音表記
を入力するためのPin Yin キー21,Zhu Yin 法で発音表
記を入力するためのZhu Yin キー22,入力する発音表記
がPin Yin 法によるものかZhu Yin 法によるものかを選
択するための入力モード・キー23,声調を含めた完全な
発音表記で漢字検索をしてほしい(これを第1モードと
いう)か,声調を除いた声韵のみによる発音表記で漢字
検索をしてほしい(これを第2モードという)かを選択
するための変換モード・キー,ならびに入力した発音表
記を漢字に変換すべきことを指令するための変換キー,
スペース・キー(必要な場合),その他の機能を入力す
るための機能キー25が設けられている。
The keyboard 20 has a Pin Yin key 21 for inputting phonetic notation by the Pin Yin method, a Zhu Yin key 22 for inputting phonetic notation by the Zhu Yin method, and a phonetic notation to be input by the Pin Yin method. Input mode key 23 for selecting whether to use the Khu or Zhu Yin method. I want you to search the kanji using the complete phonetic notation including the tone (this is called the first mode), or use only the voice rhythm without the tone. A conversion mode key for selecting whether to search for kanji using phonetic notation (this is referred to as a second mode), a conversion key for instructing that the entered phonetic notation be converted to kanji,
A space key (if necessary) and a function key 25 for inputting other functions are provided.

【0029】キーボード20から入力された発音表記を表
わすデータ(またはコード)は対応する音コード(Yin
Code)に変換される。このコード変換のためにPin Yin
/音コード変換テーブル31およびZhu Yin /音コード変
換テーブル32がメモリ装置30に設けられている。入力さ
れた発音表記をその発音表記または他の発音表記で表示
するために,一旦,音コードに変換されたものをPin Yi
n 表記またはZhu Yin表記を表わすデータ(またはコー
ド)に逆変換するために音コード/Pin Yin テーブル33
および音コード/Zhu Yin テーブル34がメモリ装置30に
設けられている。さらに,変換された音コードに基づい
てそれに対応する漢字を表わすコード(漢字コード)を
検索するために用いる辞書35,および変換後の漢字コー
ドを記憶するための変換後データ・エリア36がメモリ装
置30に設けられている。メモリ装置30は,半導体メモリ
(ROMやRAM),磁気メモリ(フロッピィ・ディス
クやハード・ディスク)またはこれらの組合せにより実
現される。たとえば,変換テーブル31〜34はROM,フ
ロッピィ・ディスクまたはハード・ディスクに格納さ
れ,辞書35はフロッピィ・ディスクまたはハード・ディ
スクに格納され,変換後データ・エリアはRAMに設定
される。
The data (or chord) representing the phonetic spelling input from the keyboard 20 corresponds to the corresponding sound code (Yin
Code). Pin Yin for this transcoding
A / sound code conversion table 31 and a Zhu Yin / sound code conversion table 32 are provided in the memory device 30. To display the entered phonetic transcription in its phonetic transcription or another phonetic transcription, once converted to a phonetic code, use Pin Yi
Sound code / Pin Yin table 33 for reverse conversion to data (or chord) representing n notation or Zhu Yin notation
And a sound code / Zhu Yin table 34 are provided in the memory device 30. Further, a dictionary 35 used for searching for a code (kanji code) representing a corresponding kanji based on the converted sound code, and a converted data area 36 for storing the converted kanji code are provided in a memory device. 30 are provided. The memory device 30 is realized by a semiconductor memory (ROM or RAM), a magnetic memory (floppy disk or hard disk), or a combination thereof. For example, the conversion tables 31 to 34 are stored in a ROM, a floppy disk or a hard disk, the dictionary 35 is stored in a floppy disk or a hard disk, and the converted data area is set in the RAM.

【0030】表示装置14としては,最も一般的には,C
RT表示装置が用いられるが,プラズマ・ディスプレイ
装置や液晶表示装置を利用することもできる。表示制御
装置12にはキャラクタ・ジェネレータ13が内蔵されてい
る。キャラクタ・ジェネレータ13は,Pin Yin またはZh
u Yin を表わすデータ,および漢字コードを表示データ
(ドット・データ)に変換するものである。
As the display device 14, most commonly, C
Although an RT display device is used, a plasma display device or a liquid crystal display device can also be used. The display control device 12 has a built-in character generator 13. Character generator 13 is Pin Yin or Zh
u Converts data representing Yin and kanji codes to display data (dot data).

【0031】図2は図1に示す構成をその機能および処
理の流れにしたがって配列したものである。切換回路1
5,編集処理装置16および漢字検索処理装置17は実質的
にはコンピュータ10によって実現される。または,発音
表記/漢字変換装置を図2に示されるハードウェア・ア
ーキテクチャをもつように構成することもできる。
FIG. 2 shows the arrangement shown in FIG. 1 arranged according to its function and processing flow. Switching circuit 1
5. The editing processing device 16 and the kanji search processing device 17 are substantially realized by the computer 10. Alternatively, the phonetic transcription / kanji conversion device may be configured to have the hardware architecture shown in FIG.

【0032】切換回路15は入力モード・キー23を通した
選択入力に応じてPin Yin キー21またはZhu Yin キー22
を選択する。Pin Yin キー21またはZhu Yin キー22を用
いて入力されたPin Yin またはZhu Yin 表記を表わすデ
ータは編集処理装置16に与えられる。切換回路15はPin
Yin キー入力かZhu Yin キー入力かを自動的に識別して
その入力を選択するようにしてもよい。
The switching circuit 15 is provided with a Pin Yin key 21 or a Zhu Yin key 22 according to a selection input through an input mode key 23.
Select Data representing the Pin Yin or Zhu Yin notation input using the Pin Yin key 21 or the Zhu Yin key 22 is provided to the editing processing device 16. Switching circuit 15 is Pin
It is also possible to automatically discriminate between a Yin key input and a Zhu Yin key input and select the input.

【0033】中国語の単語には漢字一字で構成されるも
のや複数(一般的には二または三字)の漢字で構成され
るものがある。編集処理装置16は入力されたPin Yin ま
たはZhu Yin 表記を表わすデータ列を漢字一字を表わす
データごとに区切り,区切られた各データを入力モード
・キー23によって選択された変換テーブル31または32を
参照して音コードに変換する。機能キー25に含まれる変
換キーからの入力があると,それまでに入力されたデー
タから作成された音コード列が編集処理装置16から漢字
検索処理装置17に与えられる。編集処理装置16は,入力
されたPin YinまたはZhu Yin 表記を表わすデータを表
示制御装置12に与えるので,表示装置14の画面上には入
力されたPin Yin またはZhu Yin 表記による文字が入力
された順序で順次表示されていく。この場合には逆変換
テーブル33,34は必要ない。編集処理装置16が入力デー
タを音コードに変換したのちにPin Yin またはZhu Yin
表記による表示を行う場合に,逆変換テーブル33,34が
用いられる。これらの逆変換テーブル33,34はとくに,
Pin Yin 法(またはZhu Yin 法)で入力されたデータを
Zhu Yin 表記(またはPin Yin 表記)で表示する場合に
有効に用いられる。これにより,Pin Yin 表記しか知ら
ないオペレータがZhu Yin 表記を,Zhu Yin表記しか知
らないオペレータがPin Yin 表記を知ることができるの
で便利である。
Some Chinese words are composed of one kanji, and some are composed of a plurality of (typically two or three) kanji. The editing processing unit 16 separates the input data string representing the Pin Yin or Zhu Yin notation into data representing one kanji character, and converts the separated data into the conversion table 31 or 32 selected by the input mode key 23. Refer to and convert to sound code. When there is an input from the conversion key included in the function key 25, the sound code string created from the data input up to that time is provided from the editing processing device 16 to the kanji search processing device 17. Since the edit processing device 16 supplies the data representing the input Pin Yin or Zhu Yin notation to the display control device 12, the input Pin Yin or Zhu Yin notation character is input on the screen of the display device 14. They are displayed in order. In this case, the reverse conversion tables 33 and 34 are not required. After the edit processing device 16 converts the input data into a sound code, it is changed to Pin Yin or Zhu Yin.
When performing notation display, the inverse conversion tables 33 and 34 are used. These reverse conversion tables 33 and 34 are, in particular,
Data input by the Pin Yin method (or Zhu Yin method)
It is used effectively when displaying in Zhu Yin notation (or Pin Yin notation). This is convenient because an operator who only knows Pin Yin notation can know Zhu Yin notation, and an operator who knows only Zhu Yin notation can know Pin Yin notation.

【0034】漢字検索処理装置17は与えられた音コード
列に基づいて,変換モード・キー24による選択に応じ
て,辞書35を検索し,音コード列によって表わされる発
音をもつ1または複数の漢字を表わす漢字コードを読み
出し,表示制御装置12に与える。表示制御装置12は与え
られた漢字コードによって表わされる漢字を表示するた
めの表示データをキャラクタ・ジェネレータ13から読み
出し,これに基づいて表示装置14の表示画面に1または
複数の漢字(漢字の候補)を表示する。オペレータがこ
の表示をみて,機能キー25を用いて,表示された漢字を
確認またはいずれかを選択すると,確認または選択され
た漢字を表わす漢字コードが変換後データ・エリア36に
格納される。
The kanji search processing device 17 searches the dictionary 35 in accordance with the selection by the conversion mode key 24 based on the given sound code string, and obtains one or more kanji having a pronunciation represented by the sound code string. Is read out and given to the display control device 12. The display control device 12 reads display data for displaying the kanji represented by the given kanji code from the character generator 13 and, based on the read data, displays one or more kanji (kanji candidates) on the display screen of the display device 14. Is displayed. When the operator checks the displayed kanji using the function keys 25 or selects any one of them, the kanji code representing the kanji confirmed or selected is stored in the converted data area 36.

【0035】図3はPin Yin /音コード変換テーブルの
一例を,図4はZhu Yin /音コード変換テーブルの一例
をそれぞれ示している。
FIG. 3 shows an example of the Pin Yin / sound code conversion table, and FIG. 4 shows an example of the Zhu Yin / sound code conversion table.

【0036】一種類の発音についてPin Yin 法やZhu Yi
n 法のように様々な発音表記法があるが,これらの表記
は必ず一種類の発音に対応している。一種類の発音に対
して一種類の音コード(Yin Code)が割当てられる。一
つのPin Yin 表記は必ず一つの音コードに対応し,一つ
のZhu Yin 表記は必ず一つの音コードに対応する。一つ
の発音を表わすPin Yin 表記とこれと同じ発音を表わす
Zhu Yin 表記は共通の一つの音コードに対応する。この
ようにして,発音の入力に用いられる発音表記法が複数
種類あったとしても,同一の発音は一つの音コードを用
いて表現されることになる。Pin Yin 法を用いて入力し
ても,Zhu Yin 法を用いて入力しても,同一の発音のも
のであれば一つの音コードに変換されるので,装置の内
部では音コードを唯一の発音を表わすコードとして統一
的に用いることができる。このため,Pin Yin 法用の辞
書およびZhu Yin 法用の辞書というように,発音表記法
ごとに辞書を用意する必要がなく,すべての表記法に共
通の音コードを用いて検索される辞書を用意すれば足り
る。
For one type of pronunciation, the Pin Yin method and Zhu Yi
There are various phonetic notations, such as the n method, but these notations always correspond to one type of pronunciation. One type of sound code (Yin Code) is assigned to one type of pronunciation. One Pin Yin notation always corresponds to one sound code, and one Zhu Yin notation always corresponds to one sound code. Pin Yin notation for one pronunciation and the same pronunciation
The Zhu Yin notation corresponds to one common chord. In this way, even if there are a plurality of types of pronunciation notations used for inputting pronunciations, the same pronunciation is expressed using one sound code. Regardless of the input using the Pin Yin method or the input using the Zhu Yin method, the same sound is converted to one sound code, so the sound code is the only sound code inside the device. Can be uniformly used as a code representing. For this reason, there is no need to prepare a dictionary for each phonetic notation, such as a dictionary for the Pin Yin method and a dictionary for the Zhu Yin method, and dictionaries that are searched using phonetic codes common to all notations are used. It is enough if you prepare.

【0037】たとえば図3第1行に示されたPin Yin 表
記による発音と,図4第1行のZhuYin 表記による発音
とは同一であるから,同じ音コード52f8(16進数表
現)に対応する。他の行の発音も同じである。図3およ
び図4においては,分りやすくするために,最も左側の
欄はPin Yin 表記およびZhu Yin 表記でそれぞれ表わさ
れているが,変換テーブル内においてはこれらの表記は
2進数データによって表わされるのはいうまでもない。
For example, the pronunciation in Pin Yin notation shown in the first line of FIG. 3 and the pronunciation in ZhuYin notation in the first line of FIG. 4 are the same, and thus correspond to the same sound code 52f8 (hexadecimal notation). The pronunciation of the other lines is the same. In FIGS. 3 and 4, the leftmost column is represented by Pin Yin notation and Zhu Yin notation, respectively, for the sake of clarity, but these notations are represented by binary data in the conversion table. Needless to say.

【0038】図5(A) は音コードのデータ・フォーマッ
トを示している。この実施例では音コードは2バイトで
構成される。上位1バイトは主に韵母を表わし,下位1
バイトは主に声母を表わす。上位1バイトにおける最上
位ビット(f)のデータ「0」および下位1バイトにお
ける最上位ビット(7)のデータ「1」は,一つの音コ
ードを構成する上位1バイトと下位1バイトを区別する
とともに,他のデータ(とくに音コード列における他の
音コード)と区別するために用いられる。
FIG. 5A shows the data format of a sound code. In this embodiment, the sound code is composed of 2 bytes. The upper 1 byte mainly indicates the mother, and the lower 1
The bytes mainly represent the initial. The data “0” of the most significant bit (f) in the upper one byte and the data “1” of the most significant bit (7) in the lower one byte distinguish the upper one byte and the lower one byte constituting one sound code. At the same time, it is used to distinguish it from other data (especially other sound codes in a sound code string).

【0039】上位1バイトの最下位ビット(第8ビッ
ト)は声調の有無を表わす。声調の無い発音もあるから
である。声調無しが「0」,声調有が「1」で表わされ
る。下位1バイトの下位2ビット(第0〜1ビット)は
声調を表わす。図5(B) に示すように,一声,二声,三
声,四声はそれぞれ「00」,「01」,「10」,
「11」で表わされる。
The least significant bit (eighth bit) of the upper one byte indicates the presence or absence of a tone. Some sounds have no tone. No tone is represented by "0", and tone presence is represented by "1". The lower 2 bits (0th to 1st bits) of the lower 1 byte represent a tone. As shown in FIG. 5 (B), one voice, two voices, three voices, and four voices are “00”, “01”, “10”,
It is represented by "11".

【0040】上位1バイトの中間の6ビット(第9〜e
ビット)が韵母を,下位1バイトの中間の5ビット(第
2〜6ビット)が声母をそれぞれ表わす。韵音は37種
類,声母は24種類であるからこの程度のビット数で充分
である。
The middle 6 bits of the upper 1 byte (9th to e
(Bit) represents the prim, and the middle 5 bits (2nd to 6th bits) of the lower 1 byte represent the initial. Since there are 37 types of rhymes and 24 types of vowels, this number of bits is sufficient.

【0041】後に示す漢字検索処理においてフィルタが
用いられる。このフィルタも2バイトで構成され,第0
ビット,第1ビットおよび第8ビットが「0」に,他の
ビットが「1」に設定されている。このフィルタを16進
数で表現すると「FEFC」となる。
A filter is used in the kanji search processing described later. This filter also consists of 2 bytes,
The bit, the first bit and the eighth bit are set to “0”, and the other bits are set to “1”. If this filter is expressed in hexadecimal, it becomes "FEFC".

【0042】図6はコンピュータ10による入力,編集処
理の手順,または編集処理装置16の動作を示している。
コンピュータ10または編集処理装置16には図7に示すよ
うにキー・データ・バッファおよび図8に示すように音
コード列バッファが設けられている。
FIG. 6 shows the procedure of input and editing processing by the computer 10 or the operation of the editing processing device 16.
The computer 10 or the editing processor 16 is provided with a key data buffer as shown in FIG. 7 and a sound code string buffer as shown in FIG.

【0043】まず,入力モード・キー23によってPin Yi
n 法またはZhu Yin 法のいずれのモードが設定されてい
るかが判定され(ステップ41),Pin Yin 法が選択され
ていればPin Yin /音コード変換テーブル31が選択され
(ステップ42),Zhu Yin 法が選択されていればZhu Yi
n /音コード変換テーブル32が選択される(ステップ4
3)。
First, Pin Yi is pressed by the input mode key 23.
It is determined whether the mode of the n method or the Zhu Yin method is set (step 41). If the Pin Yin method is selected, the Pin Yin / tone code conversion table 31 is selected (step 42), and the Zhu Yin Zhu Yi if law is selected
n / sound code conversion table 32 is selected (step 4
3).

【0044】続いて,変換モード・キー24によって第1
モードまたは第2モードのいずれが選択されているかが
判定される(ステップ44)。第1モードが選択されてい
る場合には何らの処理も不要であるが,第2モードが選
択されている場合にはフィルタ(レジスタまたはメモリ
・エリアにより実現される)に「FEFC」が設定され
る(ステップ45)。第1モードが選択されている場合
に,フィルタとして全ビット1からなるデータ「FFF
F」を設定してもよい。
Subsequently, the first key is pressed by the conversion mode key 24.
It is determined whether the mode or the second mode is selected (step 44). When the first mode is selected, no processing is required, but when the second mode is selected, “FEFC” is set in the filter (realized by a register or a memory area). (Step 45). When the first mode is selected, data “FFF” consisting of all bits 1 is used as a filter.
F "may be set.

【0045】Pin Yin キー21またはZhu Yin キー22から
発音表記を表わす文字または記号のデータが入力される
ごとに,これらのデータがキー・データ・バッファに格
納される(ステップ47)。図7に示すように,一文字が
入力されるとその文字の後段に終端記号データ「φ」が
格納される。これは発音表記を表わすデータは可変長デ
ータであり,そのデータの終端を明示しておくことが必
要であるからである。図7には,第2モードにしたがっ
て,Pin Yin 表記による「Zhong」という発音が入
力されていく様子が示されている。
Each time character or symbol data representing a phonetic notation is input from the Pin Yin key 21 or Zhu Yin key 22, these data are stored in the key data buffer (step 47). As shown in FIG. 7, when one character is input, terminal symbol data “φ” is stored at the subsequent stage of the character. This is because the data representing phonetic notation is variable length data, and it is necessary to specify the end of the data. FIG. 7 shows a state in which the pronunciation of “Zhong” in Pin Yin notation is being input according to the second mode.

【0046】一漢字分のキー・データが入力されたかど
うかが判定される(ステップ48)。この判定には様々な
方法がある。その1は,一漢字分のキー・データ入力終
了時にオペレータにスペース・キーを押させることであ
る。スペース・キーによる入力があると一漢字分入力終
了と判定される。その2は,第1モードの場合に有効な
もので,発音記号の入力ののちに声調をオペレータに
1,2,3,4の数字で入力させることである。たとえ
ば「Zhong」という発音で一声の抑揚をもつものに
ついては「Zhong1」と入力させる。数字キー入力
があれば一漢字分のデータの入力終了と判定される。そ
の3は音節分割による自動認識により判定することであ
る。Pin Yin 法による発音の記述には一定の法則がある
ので,この法則を利用すれば,入力されたキー・データ
列のどこで一漢字分の表記が終了するのかを判定するこ
とができる。Zhu Yin 法による表記にも同様に一定の法
則があるからこれを利用できる。
It is determined whether key data for one kanji has been input (step 48). There are various methods for this determination. The first is to make the operator press the space key at the end of key data input for one kanji. If there is an input using the space key, it is determined that the input for one kanji has been completed. The second is effective in the case of the first mode, in which the operator is required to input the tone using numbers 1, 2, 3, and 4 after inputting phonetic symbols. For example, a character having a pronunciation of “Zhong” and one voice inflection is input as “Zhong1”. If there is a numeric key input, it is determined that the input of one kanji data has been completed. The third is to make a determination by automatic recognition based on syllable division. Since there is a certain rule in the description of pronunciation by the Pin Yin method, by using this rule, it is possible to determine where in a key data sequence an expression of one kanji ends. Notation by the Zhu Yin method can be used because there are certain rules in the same way.

【0047】いずれにしても一漢字分のキー・データが
入力されると,先に選択されたPinYin /音コード変換
テーブル31またはZhu Yin /音コード変換テーブル32を
参照して,入力されたキー・データ(Pin Yin またはZh
u Yin 表記)がそれに対応する音コードに変換される。
この音コードは音コード列バッファに格納される(ステ
ップ49)。
In any case, when key data for one kanji is input, the input key is referred to by referring to the previously selected PinYin / sound code conversion table 31 or Zhu Yin / sound code conversion table 32.・ Data (Pin Yin or Zh
u Yin notation) is converted to the corresponding sound code.
This sound code is stored in the sound code string buffer (step 49).

【0048】上述したステップ47の処理は一漢字分のキ
ー・データ入力が終了するまで繰返し続行され(ステッ
プ48),ステップ47〜49の処理は変換キーが押されるま
で繰返し実行される(ステップ46)。そして,変換キー
入力があると,音コード列バッファに蓄えられていた音
コード列が,図9から始まる漢字検索処理に渡される
(ステップ50)。
The above-described processing of step 47 is repeated until the input of key data for one kanji is completed (step 48), and the processing of steps 47 to 49 is repeatedly executed until the conversion key is pressed (step 46). ). Then, when there is a conversion key input, the sound code string stored in the sound code string buffer is passed to the kanji search process starting from FIG. 9 (step 50).

【0049】たとえば,Pin Yin 法により第2モードで
「Zhong Guo」と入力された場合に,キー入力
データ「Zhong」が音コード「52f8」に,「G
uo」が音コード「66b4」にそれぞれ変換され,音
コード列「52f866b4」が得られることになる。
For example, when “Zhong Guo” is input in the second mode by the Pin Yin method, the key input data “Zhong” is converted to the sound code “52f8” and “G
“uo” is converted into a sound code “66b4”, and a sound code string “52f866b4” is obtained.

【0050】第2モードを指定した上で,声調を含めて
発音を入力してもよい。たとえば,「Zhong1 G
uo2」と入力することができる。この場合には「53
f867b5」という音コード列が生成される。第2モ
ードが指定されているのであるから,フィルタ「FEF
C」が設定されており(ステップ45),後に詳述する第
2モード検索が実行されることになる。
After designating the second mode, a pronunciation including a tone may be inputted. For example, "Zhong1 G
uo2 ". In this case, "53
A sound code string “f867b5” is generated. Since the second mode is specified, the filter “FEF”
"C" is set (step 45), and the second mode search described in detail later is executed.

【0051】図9から図11は,とくに第2モードにおけ
る漢字検索処理の手順を示している。この処理は,フィ
ルタを「FFFF」に設定することにより,第1モード
における漢字検索処理にもそのまま適用される。また,
この処理は図1に示すコンピュータ10または図2に示す
漢字検索処理装置17により実行されよう。
FIGS. 9 to 11 show the procedure of the kanji search processing particularly in the second mode. This processing is also applied to the kanji search processing in the first mode as it is by setting the filter to “FFFF”. Also,
This process may be executed by the computer 10 shown in FIG. 1 or the kanji search processing device 17 shown in FIG.

【0052】この漢字検索処理の説明に先だち,辞書35
の構造について図12および図13を参照して説明する。図
12に示すように,辞書35には,インデックスIテーブル
と,インデックスIIテーブルと,音コード列/漢字コー
ド対応テーブルとが設けられている。
Prior to the description of the kanji search processing, the dictionary 35
Will be described with reference to FIG. 12 and FIG. Figure
As shown in FIG. 12, the dictionary 35 is provided with an index I table, an index II table, and a sound code string / kanji code correspondence table.

【0053】図13に示すように,音コード列/漢字コー
ド対応テーブルは,音コード列とその音コード列によっ
て表わされる発音をもつ単語を構成する一または複数の
漢字を表わす漢字コードとを対応づけて記憶するもので
ある。図13には分りやすくするために,漢字コードの代
わりに漢字そのものが図示されているが,実際には2進
数で表わされるコードが格納されていると理解された
い。
As shown in FIG. 13, the sound code string / kanji code correspondence table stores a sound code string and a kanji code representing one or a plurality of kanjis constituting a word having a pronunciation represented by the sound code string. It is also stored. Although FIG. 13 shows the kanji itself instead of the kanji code for easy understanding, it should be understood that a code represented by a binary number is actually stored.

【0054】「中国人」という単語は三つの漢字から構
成されるので,音コード列は6バイトにより構成され
る。二つの漢字から構成される単語(たとえば「中
国」)には4バイトの音コード列が対応する。一つの漢
字には2バイトの音コード列が対応する。このように,
先頭の漢字(上記の例では「中」)が共通する単語は近
接して配列され,かつ単語を構成する音コード列のバイ
ト数の多いものの方が相対アドレスを示す値が小さくな
るように並べられている。図13において,音コード列の
最後には「0000」を表わす記号「φ」が必ず存在す
る。
Since the word "Chinese" is composed of three Chinese characters, the sound code string is composed of 6 bytes. A word consisting of two kanji characters (for example, "China") corresponds to a 4-byte sound code string. One kanji corresponds to a two-byte sound code string. in this way,
Words that share the first kanji ("middle" in the above example) are arranged close to each other, and arranged so that the sound code string that constitutes the word has a larger number of bytes than the value indicating the relative address. Have been. In FIG. 13, a symbol "φ" representing "0000" always exists at the end of the sound code string.

【0055】一の発音が二つ以上の漢字を表現すること
がある。たとえば,相対アドレス102および103の
音コード列はともに「53f8」であり,これは漢字
「中」,「忠」等に対応する。
One pronunciation may represent two or more Chinese characters. For example, the sound code strings of the relative addresses 102 and 103 are both "53f8", which correspond to the Chinese characters "chu", "chu", and the like.

【0056】音コード列/漢字コード対応テーブルの相
対アドレスをpで表わす。また,相対アドレスpの音コ
ード列をY0(p,1),Y0(p,2),…,φで表
現する。Y0(p,1),Y0(p,2)等を一般的に
Y0(p,C)(C=1,2,…)で表現する。相対ア
ドレスpの漢字コードをKA(p)(可変長)で表わ
す。
The relative address of the sound code string / kanji code correspondence table is represented by p. The sound code string at the relative address p is represented by Y0 (p, 1), Y0 (p, 2),. Y0 (p, 1), Y0 (p, 2) and the like are generally represented by Y0 (p, C) (C = 1, 2,...). The kanji code of the relative address p is represented by KA (p) (variable length).

【0057】音コード列/漢字コード対応テーブルに
は,できるだけ多くの(できれば,中国で用いられる殆
んどすべての)単語が格納される。これらの単語の配列
順序は,上述した規則を除いて自由である。したがっ
て,任意の記憶場所に任意の音コード列と漢字コードと
の対を配置することができる。音コード列/漢字コード
対応テーブルに配列された単語の数をMとする。
The sound code string / kanji code correspondence table stores as many words as possible (preferably, almost all words used in China). The order of arrangement of these words is free except for the rules described above. Therefore, a pair of an arbitrary sound code string and a kanji code can be arranged in an arbitrary storage location. Let M be the number of words arranged in the sound code string / kanji code correspondence table.

【0058】図12に戻って,インデックスIテーブルお
よびインデックスIIテーブルは,ランダムに配列された
音コード列/漢字コード対応テーブルの音コード列を,
音コード列の表わす数値の大きさの順に検索できるよう
にするためのものである。
Referring back to FIG. 12, the index I table and the index II table store the sound code strings of the randomly arranged sound code string / kanji code correspondence table.
This is for enabling a search in the order of the numerical values represented by the sound code strings.

【0059】インデックスIテーブルには,N個のIn
dexI(i)が一定の順序で配列されている。Ind
exI(i)はインデックスIIテーブルにおける対応す
る要素へのポインタ(インデックスIIテーブルの相対ア
ドレスを示す)である。Nは,音コード列/漢字コード
対応テーブルにおける異なる音コード列の個数である。
上述のように,一つの音コード列に二つ以上の単語が対
応することがありうるので,一般にN≦Mが成立する。
The index I table contains N In
dexI (i) is arranged in a certain order. Ind
exI (i) is a pointer to the corresponding element in the index II table (indicating the relative address of the index II table). N is the number of different sound code strings in the sound code string / kanji code correspondence table.
As described above, since two or more words can correspond to one sound code string, N ≦ M is generally satisfied.

【0060】インデックスIIテーブルにはM個の記憶場
所があり,各記憶場所に3種類の要素,F1(k),F
2(k),F3(k)が格納されている。F3(k)
は,音コード列/漢字コード対応テーブルにおける対応
する音コード列へのポインタ(対応テーブルの相対アド
レスを示す)である。F2(k)は,それと同一の記憶
場所にあるF3(k)がポイントする音コード列と同一
の音コード列をポイントするF3(k)をもつインデッ
クスIIテーブル内の他の記憶場所(の相対アドレス)を
示す。これにより音コード列53f8について単語
「中」と「忠」の両方の検索が可能となる。同一の音コ
ード列が他にない場合にはF2(k)=φと置かれる。
F1(k)は,それと同一の記憶場所にあるF3(k)
がポイントする音コード列と同一の音コード列を上位に
含む音コード列(すなわち,F3(k)がポイントする
音コード列よりも長い音コード列)をポイントするF3
(k)をもつインデックスIIテーブル内の他の記憶場所
(の相対アドレス)を示す。これにより「中国」を検索
したときに,「中国」を含みかつこれよりも漢字数の多
い「中国人」が自動的に検索されることになる。
The index II table has M storage locations, and each storage location has three types of elements, F1 (k) and F1 (k).
2 (k) and F3 (k) are stored. F3 (k)
Is a pointer to a corresponding sound code string in the sound code string / kanji code correspondence table (indicating a relative address of the correspondence table). F2 (k) is relative to another storage location in the index II table having F3 (k) pointing to the same sound code string as the sound code string pointed to by F3 (k) in the same storage location. Address). As a result, both the words “medium” and “chu” can be searched for the sound code string 53f8. If there is no other identical chord sequence, F2 (k) = φ is set.
F1 (k) is F3 (k) in the same storage location
F3 that points to a sound code string that includes the same sound code string as the sound code string to which F3 (k) points (ie, a sound code string that is longer than the sound code string to which F3 (k) points)
(K) Indicates another storage location (relative address) in the index II table. As a result, when "China" is searched, "Chinese" containing "China" and having more kanji characters will be automatically searched.

【0061】インデックスIテーブルにおけるInde
xI(i)は,音コード列/漢字コード対応テーブルに
おける音コード列の表わす数値の小さい順にあらかじめ
ソートされている。したがって,音コード列/漢字コー
ド対応テーブルにおける音コード列の配列がランダムで
あっても,インデックスIテーブルを通して見たとき
に,音コード列/漢字コード対応テーブルにおいてはあ
たかも音コード列がそれの表わす数値が小さい順に配列
されているかのように見えることになる。
Inde in index I table
xI (i) is sorted in advance in ascending order of the numerical value represented by the sound code string in the sound code string / kanji code correspondence table. Therefore, even if the arrangement of the sound code strings in the sound code string / kanji code correspondence table is random, when viewed through the index I table, in the sound code string / kanji code correspondence table, the sound code strings represent It looks as if the numbers are arranged in ascending order.

【0062】図9から図11に示す漢字検索処理では2分
検索(binary search またはdichotomizing )の手法が
用いられる。
In the kanji search processing shown in FIGS. 9 to 11, a binary search (binary search or dichotomizing) technique is used.

【0063】この漢字検索処理において,いくつかの変
数が用いられる。それらの変数はSTART,END,
find等である。変数STARTおよびENDはイン
デックスIテーブルをアクセスするために用いられる。
findは見つかった漢字コードを記憶する漢字コード
・バッファ(図14参照)の記憶場所を指し示すために用
いられる。これらの変数はレジスタまたはメモリ・エリ
アに記憶されるデータとして実現される。
Several variables are used in the kanji search processing. These variables are START, END,
find and the like. The variables START and END are used to access the index I table.
find is used to point to the storage location of the kanji code buffer (see FIG. 14) that stores the found kanji code. These variables are implemented as data stored in registers or memory areas.

【0064】入力,編集処理(図6)または編集処理装
置16から漢字検索処理または漢字検索処理装置17に与え
られる入力音コード列をx(1),x(2),x
(3),…,φで表わす。たとえば,Pin Yin 表記によ
って「Zhong1 Guo2」が入力されたときに
は,入力音コード列は「53f8 67b5 φ」とな
る。すなわち,x(1)=53f8,x(2)=67b
5である。入力音コード列を構成する各音コードが入力
音コード列の何番目に位置しているものかを表わすため
に音コード・カウンタCが用いられる。たとえば,x
(1)はx(C)(C=1)で表わされる。
Input / edit processing (FIG. 6) or input sound code strings given from the edit processing device 16 to the kanji search process or the kanji search processing device 17 are represented by x (1), x (2), x
(3), ..., φ. For example, when “Zhong1 Guo2” is input in Pin Yin notation, the input sound code string is “53f8 67b5 φ”. That is, x (1) = 53f8, x (2) = 67b
5 A sound code counter C is used to indicate the position of each sound code constituting the input sound code sequence in the input sound code sequence. For example, x
(1) is represented by x (C) (C = 1).

【0065】図9において,まず音コード・カウンタC
が1に初期化される(C=1,ステップ51)。これによ
り,入力音コード列の先頭にある音コードx(1)が指
定される。
In FIG. 9, first, a sound code counter C
Is initialized to 1 (C = 1, step 51). Thereby, the sound code x (1) at the head of the input sound code sequence is specified.

【0066】続いて,変数STARTが0に,ENDが
(N−1)に,findが0にそれぞれ初期化される
(ステップ52)。
Subsequently, the variable START is initialized to 0, END is initialized to (N-1), and find is initialized to 0 (step 52).

【0067】変数STARTとENDを用いてインデッ
クスIテーブルの相対アドレスが(START+EN
D)/2として算出され,これがiと置かれる(ステッ
プ54)。これは,インデックスIテーブルの相対アドレ
ス上の丁度中央に位置する相対アドレスを求める処理で
ある。2分探索法は,このように一連の相対アドレス
(一般的にいうと,一群の項目)を2つの部分に分け,
そのどちらかを選択し,選択した部分をさらに2つに分
けるというようにして目的の相対アドレス(項目)に到
達(見い出す)探索方法である。
Using the variables START and END, the relative address of the index I table is set to (START + EN).
D) / 2, which is set as i (step 54). This is a process for obtaining a relative address located just at the center of the relative address of the index I table. The binary search method thus divides a series of relative addresses (generally, a group of items) into two parts,
This is a search method that reaches (finds) a target relative address (item) by selecting one of them and further dividing the selected portion into two.

【0068】算出された相対アドレスiを用いてインデ
ックスIテーブルがアクセスされ,その相対アドレスi
をもつ記憶場所に記憶されているIndexI(i)が
読み出される。このIndexI(i)はkと置かれる
(ステップ55)。
The index I table is accessed using the calculated relative address i, and the relative address i is accessed.
Index I (i) stored in the storage location having the index is read. This Index I (i) is set as k (step 55).

【0069】続いてIndexI(i)=kを相対アド
レスとして用いてインデックスIIテーブルがアクセスさ
れ,その相対アドレスをもつ記憶場所に記憶されている
要素F1(k),F2(k),F3(k)が読み出さ
れ,これらがそれぞれp1,p2,p3と置かれる(ス
テップ56)。
Subsequently, the index II table is accessed using IndexI (i) = k as a relative address, and the elements F1 (k), F2 (k), F3 (k) stored in the storage location having the relative address. ) Are read, and these are respectively set as p1, p2, and p3 (step 56).

【0070】図10を参照して,インデックスIIテーブル
から読み出された第3番目の要素F3(k)=p3を相
対アドレスとして用いて音コード列/漢字コード対応テ
ーブルがアクセスされ,その相対アドレスをもつ記憶場
所に記憶されている音コードY0(p3,C)が読み出
される。第2モードが選択されている場合にはFILT
ER=FEFCが設定されている(図6,ステップ4
5)。このFILTERと読み出された音コードY0
(p3,C)とのAND論理演算が行なわれる。また,
入力音コード列の音コード・カウンタCによって指定さ
れる音コードx(C)とFILTERとのAND論理演
算が実行される。これらの2つのAND論理演算結果が
等しいかどうか,どちらが大きいかが比較される(ステ
ップ63,64)。
Referring to FIG. 10, the tone code string / kanji code correspondence table is accessed using the third element F3 (k) = p3 read from the index II table as a relative address, and the relative address is obtained. The sound code Y0 (p3, C) stored in the storage location having is read out. FILT when the second mode is selected
ER = FEFC is set (FIG. 6, step 4
Five). This FILTER and the read sound code Y0
An AND logic operation with (p3, C) is performed. Also,
An AND logic operation is performed between the sound code x (C) specified by the sound code counter C of the input sound code string and FILTER. It is compared whether these two AND logical operation results are equal or which is larger (steps 63 and 64).

【0071】上述したように,インデックスIテーブル
を通して音コード列/漢字コード対応テーブルを見る
と,音コード列/漢字コード対応テーブルにおいて音コ
ード列はそれの表わす数値が小さい順に配列されてい
る。したがって, FILTER AND x(C) < FILTER AND Y0(p3,C) 式1 が成立つということは,入力音コードx(C)の方が読
み出された音コードY0(p3,C)よりも小さい,す
なわち捜し出すべきx(C)はY0(p3,C)よりも
相対アドレスが小さい記憶場所に格納されているという
ことになる。x(C)により近づくために相対アドレス
のより小さい記憶場所にアクセスする必要がある。すな
わち,インデックスIテーブルの上半分をアクセスする
必要がある。そこで変数ENDにiが代入され(ステッ
プ67),ステップ53を経てステップ54に戻ることにな
る。
As described above, looking at the sound code string / kanji code correspondence table through the index I table, the sound code strings in the sound code string / kanji code correspondence table are arranged in ascending order of numerical values represented by them. Therefore, FILTER AND x (C) <FILTER AND Y0 (p3, C) Expression 1 holds that the input sound code x (C) is more than the read sound code Y0 (p3, C). This means that x (C) which is smaller, that is, to be searched for, is stored in a storage location whose relative address is smaller than Y0 (p3, C). To get closer to x (C), it is necessary to access a storage location with a smaller relative address. That is, it is necessary to access the upper half of the index I table. Then, i is substituted for the variable END (step 67), and the process returns to step 54 via step 53.

【0072】 FILTER AND x(C) > FILTER AND Y0(p3,C) 式2 の場合には,変数STARTにiが代入され(ステップ
68),同じようにステップ54に戻る。
FILTER AND x (C)> FILTER AND Y0 (p3, C) In the case of Expression 2, i is assigned to the variable START (step
68), and similarly returns to step 54.

【0073】このようにして,2分探索法にしたがっ
て,入力音コードx(C)と一致する音コードを音コー
ド列/漢字コード対応テーブルにおいて検索していくこ
とになる。
In this way, a sound code that matches the input sound code x (C) is searched in the sound code string / kanji code correspondence table according to the binary search method.

【0074】遂に, FILTER AND x(C) = FILTER AND Y0(p3,C) 式3 が成立すると,目的の音コードx(C)が格納されてい
る記憶場所が対応テーブルにおいて見付かったことにな
る。
Finally, when FILTER AND x (C) = FILTER AND Y0 (p3, C) Expression 3 is satisfied, the storage location where the target sound code x (C) is stored is found in the correspondence table. .

【0075】C=1であったとすると,次に2番目(C
=2)の入力音コードx(C)と対応テーブルにおける
音コード列の2番目の音コードY0(p3,C)とが一
致するかどうかをみるために,音カウンタCがインクレ
メントされる(ステップ66)。
If C = 1, then the second (C
= 2), the sound counter C is incremented in order to check whether the input sound code x (C) of the corresponding sound table matches the second sound code Y0 (p3, C) of the sound code string in the correspondence table. Step 66).

【0076】インクレメントされたCにおいて式3が成
立しなければ,式1または式2のいずれが成立するかに
応じて再び2分検索法にしたがって探索が行なわれてい
くことになる(ステップ64,67,68)。C=1において
式3が成立するということは,対応テーブルにおいて見
付かったY0(p3,C)の近傍に目的とする音コード
列が存在する筈であるから,わざわざ2分探索法を用い
ずに,その近傍を捜し出すようにしてもよい。また,後
述するように要素F1(k)を利用して探索を行なうこ
ともできる。
If Equation 3 is not satisfied in the incremented C, the search is performed again according to the binary search method according to which of Equations 1 and 2 is satisfied (Step 64). , 67, 68). Equation 3 holds when C = 1 means that the target sound code string must exist near Y0 (p3, C) found in the correspondence table, so that the binary search method is not used. , And its vicinity may be searched for. Further, a search can be performed using the element F1 (k) as described later.

【0077】式3が成立する音コードY0(p3,C)
を見付け出しながら音コード・カウンタCをインクレメ
ントしていった結果,入力音コード列のすべての音コー
ドについて探索が終了し,遂にx(C)=φとなったと
きには(ステップ61),対応テーブルにおける音コード
列の音コードにおいてもY0(p3,C)=φが成立す
るかどうかがチェックされる(ステップ69)。ここでY
ESとなれば,入力音コード列と一致する音コード列が
見付かったことになり,図11に示す処理に移る。音コー
ドY0(p3,C)がφでない場合には,その記憶場所
よりも相対アドレスの大きい位置に目的とする音コード
列が存在するのであるから,相対アドレスより大きい記
憶場所についてさらに検索を続けることになる(ステッ
プ70)。もっとも,入力音コード列をすべて含む音コー
ド列が見付かったのであるから,(「中国」を見付け出
そうとして「中国人」が見付かったような場合であ
る),そのすぐ近くに目的とする音コード列がある筈で
あるから,対応テーブルにおける相対アドレスを1つず
つインクレメントしていけば,すぐに目的とする音コー
ド列が見つかる筈である。
The sound code Y0 (p3, C) for which Expression 3 is satisfied
As a result of incrementing the sound code counter C while finding all the sound codes, the search for all the sound codes in the input sound code sequence is completed, and when x (C) = φ is finally reached (step 61), It is checked whether or not Y0 (p3, C) = φ holds also for the sound codes of the sound code string in the table (step 69). Where Y
If ES is reached, a sound code string that matches the input sound code string has been found, and the process proceeds to the processing shown in FIG. If the sound code Y0 (p3, C) is not φ, the target sound code string exists at a position having a larger relative address than the storage location, so that the search is further continued for a storage location larger than the relative address. (Step 70). However, since a sound code string including all the input sound code strings was found (this is a case in which “Chinese” was found in an attempt to find “China”), the target sound was found in the immediate vicinity. Since there should be a code string, if the relative address in the correspondence table is incremented one by one, a target sound code string should be found immediately.

【0078】さらに,x(C)がまだφとなっていない
のに読み出した音コードY0(p3,C)がφとなって
しまったときには(「中国」を捜しているのに対して
「中」が見付かったような場合)(ステップ62),相対
アドレスのより小さい記憶場所のサーチに移る(ステッ
プ65)。この場合にも,到達している記憶場所のすぐ近
くに目的とする文字コード列が存在する筈であるから,
対応テーブルの相対アドレスを1つずつデクレメントし
ていくことにより,迅速に目的とする文字コード列を見
付け出すことができよう。
Further, when the read sound code Y0 (p3, C) has become φ while x (C) has not yet become φ (while searching for “China”, Is found) (step 62), the process proceeds to search for a storage location with a smaller relative address (step 65). In this case, too, the target character code string must exist immediately near the memory location that has been reached.
By decrementing the relative address of the correspondence table one by one, a target character code string can be quickly found.

【0079】ここでFILTER=FEFCの意味につ
いて図15を参照して説明しておく。例えば,「Zhon
g」という声韵をもつ一声〜四声のいずれかの音コード
とFILTER=FEFCとのANDを演算すると,声
調を無視した声韵「Zhong」を表わす音コードに変
換される。したがって,第2モードの下で漢字検索を行
った場合には,声調に関係なく声韵が同一のすべての漢
字が見つかることになる。この様子が図16に示されてい
る。「Zhong1 Guo2」というように声調を含
めて入力しても,「Zhong Guo」というように
声調なしで入力しても,その入力音コードをフィルタを
通すことにより,「中国」という単語について式3が成
立し(C=1,C=2の両方において),この単語が見
付けられる。これがステップ63,64の処理におけるフィ
ルタを通す意味である。
Here, the meaning of FILTER = FEFC will be described with reference to FIG. For example, "Zhon
When the AND of FILTER = FEFC with any of the one to four voice codes having the vocal rhythm “g” is calculated, it is converted to a sound code representing the vocal rhythm “Zhong” ignoring the tone. Therefore, when a kanji search is performed in the second mode, all kanji characters having the same vocal rhythm are found regardless of the tone. This is shown in FIG. Regardless of whether the input includes a tone such as “Zhong1 Guo2” or the input without a tone such as “Zhong Guo”, the input sound code is filtered to obtain the expression “3” for the word “China”. Holds (at both C = 1 and C = 2), and this word is found. This means passing through the filters in the processing of steps 63 and 64.

【0080】第1モードにおいてはフィルタを必ずしも
使用する必要はなく,入力音コードと対応テーブルの音
コードとを直接に比較すればよいが,FILTER=F
FFFを用いれば,ステップ63,64,式1〜式3をその
まま利用することができる。
In the first mode, it is not necessary to use a filter, and it is sufficient to directly compare the input sound code with the sound code in the correspondence table, but FILTER = F
If FFF is used, steps 63 and 64, and equations 1 to 3 can be used as they are.

【0081】入力音コード列と一致する(フィルタを通
して)音コード列が見つかると(ステップ69),図11を
参照して,変数findがインクレメントされて漢字コ
ード・バッファの記憶場所が指定され,見つかった音コ
ード列に対応して格納されている漢字コードKA(p
3)が音コード列/漢字コード対応テーブルから読み出
され,漢字コード・バッファの変数findによって指
定された記憶場所に格納される(ステップ71)。
When a sound code string that matches the input sound code string (through a filter) is found (step 69), referring to FIG. 11, the variable find is incremented, and the storage location of the kanji code buffer is specified. The kanji code KA (p.
3) is read from the sound code string / kanji code correspondence table and stored in the storage location specified by the variable find in the kanji code buffer (step 71).

【0082】続いて,インデックスIIテーブルの第2番
目の要素F2(k)を利用して,同じ発音をもつ対応テ
ーブルの音コード列をポイントするインデックスIIテー
ブルの他の記憶場所の要素F3(k)に基づいて対応テ
ーブルをアクセスし,そこに記憶されている同じ発音を
もつ漢字コードを,変数findをインクレメントして
新しい記憶場所を指定した上で,漢字コード・バッファ
に格納する(ステップ73)。要素F2(k)によってリ
ンクされている同じ発音をもつ漢字コードが順次読み出
されて漢字コード・バッファに格納されていく(ステッ
プ73,74の繰返し)。これにより「中」に加えて「忠」
等が漢字の候補として見付け出されていくことになる。
Subsequently, using the second element F2 (k) of the index II table, the element F3 (k) of another storage location of the index II table that points to the sound code string of the corresponding table having the same pronunciation. ), The kanji code having the same pronunciation stored therein is stored in the kanji code buffer after specifying the new storage location by incrementing the variable find (step 73). ). The kanji codes having the same pronunciation linked by the element F2 (k) are sequentially read out and stored in the kanji code buffer (repeated steps 73 and 74). As a result, "chu"
Will be found as kanji candidates.

【0083】F2(k)=p2=φとなれば(ステップ
72),入力音コード列を含みかつこれよりも長い音コー
ド列が,要素F1(k)=p1を用いて検索される。要
素F1(k)によってポイントされるインデックスIIテ
ーブル内の他の(第2番目の)記憶場所に格納されてい
る要素F3(k)によってアクセスされる漢字コードが
対応テーブルから読み出され,変数findをインクレ
メントした上で,漢字コード・バッファに格納される
(ステップ76)。第2番目の記憶場所の要素F1(k)
によってリンクされるさらに他の記憶場所があれば,同
じようにして,上記のさらに他の記憶場所の要素F3
(k)によってアクセスされる漢字コードが読み出され
て漢字コード・バッファに格納される(ステップ75〜7
7)。F1(k)=p1=φであればすべての処理が終
る(ステップ75) 。
If F2 (k) = p2 = φ (step
72), a sound code string including and longer than the input sound code string is searched using the element F1 (k) = p1. The kanji code accessed by element F3 (k) stored in the other (second) storage location in the index II table pointed to by element F1 (k) is read from the correspondence table and the variable find Is incremented, and stored in the kanji code buffer (step 76). Element F1 (k) of second storage location
In the same way, if there are still other storage locations linked by
The kanji code accessed by (k) is read and stored in the kanji code buffer (steps 75 to 7).
7). If F1 (k) = p1 = φ, all the processing ends (step 75).

【0084】また,2分探索を繰返して遂にSTART
+1≧ENDになった場合には入力音コード列に該当す
る音コード列が見付からなかったとして漢字検索処理が
終了する(ステップ53)。
Further, by repeating the binary search,
If + 1 ≧ END, the kanji search process is terminated assuming that a sound code string corresponding to the input sound code string has not been found (step 53).

【0085】図17は上述した処理を実現するハードウェ
ア・アーキテクチャを示すものであり,漢字検索処理装
置17の構成例を示している。
FIG. 17 shows a hardware architecture for realizing the above-described processing, and shows a configuration example of the kanji search processing device 17.

【0086】音コード列/漢字コード対応テーブル81は
図12または図13に示すものと同じである。検索読出し回
路82は,この対応テーブルから順次,または入力音コー
ド列を参照して音コード列を読み出すものである。フィ
ルタ・レジスタ83AにはデータFFFFが,フィルタ・
レジスタ83BにはデータFEFCがそれぞれ格納されて
いる。変換モード・キー24による変換モード選択に応じ
て,マルチプレクサ84は,第1モードのときにはレジス
タ83Aを,第2モードのときにはレジスタ83Bをそれぞ
れ選択し,そこに格納されているフィルタ・データをA
ND回路85,86に与える。
The sound code string / kanji code correspondence table 81 is the same as that shown in FIG. 12 or FIG. The search / readout circuit 82 reads out a sound code sequence from the correspondence table sequentially or by referring to the input sound code sequence. Data FFFF is stored in the filter register 83A,
Data FEFC is stored in the register 83B. In response to the conversion mode selection by the conversion mode key 24, the multiplexer 84 selects the register 83A in the first mode and the register 83B in the second mode, and stores the filter data stored therein in A.
It is given to ND circuits 85 and 86.

【0087】AND回路85には入力音コード列が,AN
D回路86には対応テーブル81から読み出された音コード
列がそれぞれ与えられる。AND回路85,86において入
力音コード列,音コード列のフィルタリングがそれぞれ
行なわれ,それらの出力データは比較回路87において比
較される。比較回路87は2つの入力データが一致したと
きのみ一致信号を出力する。この一致信号によってゲー
ト88がイネーブルとされる。また,一致信号は検索読出
し回路82に与えられ,検索読出し回路82は一致した音コ
ードに対応するすべての漢字コードを対応テーブルから
読み出してゲート88に与えるので,この漢字コードはゲ
ート88を通って漢字コード・バッファ89に蓄えられるこ
とになる。
The input sound code string is stored in the AND circuit 85.
The D code 86 is provided with the sound code string read from the correspondence table 81, respectively. The input sound code string and the sound code string are filtered in the AND circuits 85 and 86, respectively, and their output data are compared in the comparison circuit 87. The comparison circuit 87 outputs a match signal only when the two input data match. The gate 88 is enabled by the coincidence signal. The match signal is supplied to the search / readout circuit 82. The search / readout circuit 82 reads out all the kanji codes corresponding to the matched sound codes from the correspondence table and supplies them to the gate 88. It will be stored in the kanji code buffer 89.

【0088】上記実施例においては,第1モードと第2
モードがあり,フィルタFFFFおよびFEFCを用い
て声調を含めた,および声調を無視した漢字検索が行な
われるようになっているが,さらに他のフィルタを用い
て他のモードの漢字検索を行うこともできる。たとえ
ば,16進数表現で00FCというフィルタを用いれば,
入力音コードと声母が一致する音コードをもつすべての
漢字の検索が可能となろう。
In the above embodiment, the first mode and the second mode
There is a mode, and the kanji search including the tone and ignoring the tone is performed using the filters FFFF and FEFC. However, the kanji search in other modes using the other filters may be performed. it can. For example, using a filter of 00FC in hexadecimal notation,
It will be possible to search for all kanji that have a phonetic code that matches the input voice code and the initial.

【0089】また,入力装置としてはキーボードに限ら
ず,発音そのものを入力するものでもよい。この場合に
は発音を表わす電気信号をそれに対応する音コードに変
換する音声認識装置が利用されよう。
The input device is not limited to a keyboard, but may be a device for inputting pronunciation itself. In this case, a speech recognition device that converts an electric signal representing pronunciation into a corresponding sound code will be used.

【図面の簡単な説明】[Brief description of the drawings]

【図1】中国語の発音表記/漢字変換装置の電気的構成
を示すブロック図である。
FIG. 1 is a block diagram showing an electrical configuration of a Chinese phonetic transcription / kanji conversion device.

【図2】中国語の発音表記/漢字変換装置の主要部分の
ハードウェア構成を示す,または機能的観点からみた構
成を示すブロック図である。
FIG. 2 is a block diagram illustrating a hardware configuration of a main part of a Chinese phonetic transcription / kanji conversion device or a configuration from a functional viewpoint.

【図3】Pin Yin /音コード変換テーブルの一例を示
す。
FIG. 3 shows an example of a Pin Yin / sound code conversion table.

【図4】Zhu Yin /音コード変換テーブルの一例を示
す。
FIG. 4 shows an example of a Zhu Yin / sound code conversion table.

【図5】(A) は音コードのデータ・フォーマットを示
し,(B) は声調を表わすコードを示す。
FIG. 5A shows a data format of a sound code, and FIG. 5B shows a code representing a tone.

【図6】入力,編集処理の手順を示すフロー・チャート
である。
FIG. 6 is a flowchart showing a procedure of input and edit processing.

【図7】キー・データ・バッファにキー入力データが格
納されていく様子を示す。
FIG. 7 shows how key input data is stored in a key data buffer.

【図8】音コード列バッファに音コードが格納されてい
く様子を示す。
FIG. 8 shows how sound codes are stored in a sound code string buffer.

【図9】漢字検索処理手順を示すフロー・チャートであ
る。
FIG. 9 is a flowchart illustrating a kanji search processing procedure.

【図10】漢字検索処理手順を示すフロー・チャートで
ある。
FIG. 10 is a flowchart showing a kanji search processing procedure.

【図11】漢字検索処理手順を示すフロー・チャートで
ある。
FIG. 11 is a flowchart showing a kanji search processing procedure.

【図12】辞書の構造を示す。FIG. 12 shows the structure of a dictionary.

【図13】音コード列/漢字コード対応テーブルの一例
を示す。
FIG. 13 shows an example of a sound code string / kanji code correspondence table.

【図14】漢字コード・バッファを示す。FIG. 14 shows a Kanji code buffer.

【図15】フィルタリングにより音コードが変換される
様子を示す。
FIG. 15 shows how a sound code is converted by filtering.

【図16】フィルタを利用した漢字検索の様子を示す。FIG. 16 shows a state of a kanji search using a filter.

【図17】漢字検索装置のハードウェア・アーキテクチ
ャを示す,または漢字検索処理の機能に着目して表わさ
れたブロック図である。
FIG. 17 is a block diagram showing a hardware architecture of a kanji search device or focusing on a function of a kanji search process.

【符号の説明】[Explanation of symbols]

10 コンピュータ 12 表示制御装置 13 キャラクタ・ジェネレータ 14 表示装置 15 切換回路 16 編集処理装置 17 漢字検索処理装置 20 キーボード 21 Pin Yin キー 22 Zhu Yin キー 23 入力モード・キー 24 変換モード・キー 25 その他の機能キー 30 メモリ装置 31 Pin Yin /音コード 32 Zhu Yin /音コード 33 音コード/Pin Yin 34 音コード/Zhu Yin 35 辞書 36 変換後データ 81 音コード列/漢字コード対応テーブル 82 検索読出し回路 83A,83B フィルタ・レジスタ 84 マルチプレクサ 85,86 AND回路 87 比較回路 88 ゲート 89 バッファ 10 Computer 12 Display controller 13 Character generator 14 Display device 15 Switching circuit 16 Editing processor 17 Kanji search processor 20 Keyboard 21 Pin Yin key 22 Zhu Yin key 23 Input mode key 24 Conversion mode key 25 Other function keys 30 Memory device 31 Pin Yin / Sound code 32 Zhu Yin / Sound code 33 Sound code / Pin Yin 34 Sound code / Zhu Yin 35 Dictionary 36 Data after conversion 81 Sound code string / Kanji code correspondence table 82 Search / read circuit 83A, 83B Filter • Register 84 Multiplexer 85, 86 AND circuit 87 Comparison circuit 88 Gate 89 Buffer

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 入力された中国語発音を表わすデータ
を,その発音に対応する音コードに変換する変換手段,
音コードと,その音コードによって表わされる発音をも
つ漢字を示す漢字コードとを相互に対応させて記憶した
辞書,音コードを構成する所定の一または複数ビットを
マスクするフィルタリング手段,上記変換手段から得ら
れる音コードと上記辞書の音コードとを上記フィルタリ
ング手段を用いてフィルタリングした上で相互に比較す
ることにより,上記変換手段から得られる音コードに一
致する音コードを上記辞書において検索し,一致する音
コードに対応する漢字コードを上記辞書から読み出す制
御手段,を備えた中国語の発音表記/漢字変換装置。
A converting means for converting input data representing Chinese pronunciation into a sound code corresponding to the pronunciation;
A dictionary in which a sound code and a kanji code indicating a kanji having a pronunciation represented by the sound code are stored in correspondence with each other, filtering means for masking one or more predetermined bits constituting the sound code, By filtering the obtained sound code and the sound code of the dictionary using the filtering means and comparing them with each other, a sound code matching the sound code obtained from the conversion means is searched in the dictionary, and And a control means for reading a kanji code corresponding to a sound code to be performed from the dictionary.
【請求項2】 上記音コードが,声母を表わすビット
と,韵母を表わすビットと,声調を表わすビットとを含
む,請求項1に記載の装置。
2. The apparatus according to claim 1, wherein said tone code includes a bit representing an initial, a bit representing a rhyme, and a bit representing a tone.
【請求項3】 上記フィルタリング手段が,声母を表わ
すビット,韵母を表わすビットまたは声調を表わすビッ
トをマスクするものである,請求項2に記載の装置。
3. The apparatus according to claim 2, wherein said filtering means masks a bit representing an initial, a bit representing a rhyme, or a bit representing a tone.
【請求項4】 上記フィルタリング手段が,音コードを
そのまま通過させるものを含む,請求項1に記載の装
置。
4. The apparatus according to claim 1, wherein said filtering means includes a means for passing a sound code as it is.
【請求項5】 上記変換手段は音声入力信号に基づいて
発音を認識し,その発音に対応する音コードを出力する
音声認識手段である,請求項1に記載の装置。
5. The apparatus according to claim 1, wherein said conversion means is a speech recognition means for recognizing a pronunciation based on a speech input signal and outputting a sound code corresponding to the pronunciation.
【請求項6】 フィルタリング手段の使用の有無,また
は複数のフィルタリング手段のいずれかを選択する検索
モード選択手段をさらに備えている,請求項1に記載の
装置。
6. The apparatus according to claim 1, further comprising a search mode selecting unit for selecting whether or not the filtering unit is used, or selecting one of the plurality of filtering units.
【請求項7】 読み出された漢字コードを,その漢字コ
ードによって示される漢字を表わす表示データに変換す
る手段,および表示データに基づいて漢字を表示する装
置,をさらに備えた請求項1に記載の装置。
7. The apparatus according to claim 1, further comprising: means for converting the read kanji code into display data representing a kanji indicated by the kanji code; and a device for displaying the kanji based on the display data. Equipment.
【請求項8】 表示された漢字の候補の中からいずれか
一つを指定する指定入力手段,および指定された漢字を
示す漢字コードを格納するメモリ,をさらに備えた請求
項7に記載の装置。
8. The apparatus according to claim 7, further comprising designation input means for designating any one of the displayed kanji candidates, and a memory for storing a kanji code indicating the designated kanji. .
【請求項9】 上記変換手段は一漢字について入力デー
タを音コードに変換するものであり,上記辞書は,一漢
字または複数の漢字からなる単語について音コード列と
漢字コードとを対応させて記憶するものであり,上記制
御手段は,入力データを一漢字ごとに区切って音コード
に変換するよう上記変換手段を制御し,変換後の音コー
ドを単語単位に配列して音コード列を作成し,この音コ
ード列に対応する漢字コードを上記辞書において検索す
るものである,請求項1に記載の装置。
9. The conversion means for converting input data of one kanji into a sound code, wherein the dictionary stores a sound code string and a kanji code corresponding to a word consisting of one kanji or a plurality of kanji. The control means controls the conversion means to convert the input data into sound codes by dividing the input data into one kanji, and arranges the converted sound codes in word units to generate a sound code sequence. 2. The apparatus according to claim 1, wherein a kanji code corresponding to the sound code string is searched in the dictionary.
【請求項10】 音コードと,その音コードによって表
わされる発音をもつ漢字を示す漢字コードとを相互に対
応させて記憶した辞書をあらかじめ用意しておき,入力
された中国語発音を表わすデータを,その発音に対応す
る音コードに変換し,変換により得られた音コードと,
上記辞書の音コードとを,音コードを構成する所定の一
または複数ビットをマスクすることによりフィルタリン
グした上で相互に比較し,変換により得られた音コード
に一致する音コードを上記辞書において検索し,一致す
る音コードに対応する漢字コードを上記辞書から読み出
す,中国語の発音表記/漢字変換方法。
10. A dictionary in which a sound code and a kanji code indicating a kanji having a pronunciation represented by the sound code are stored in association with each other in advance, and data representing an input Chinese pronunciation is stored. , Converted to a sound code corresponding to the pronunciation, and the sound code obtained by the conversion,
The sound code in the dictionary is filtered by masking one or more bits constituting the sound code, and compared with each other, and a sound code matching the sound code obtained by the conversion is searched in the dictionary. And a Chinese phonetic notation / kanji conversion method for reading a kanji code corresponding to a matching sound code from the dictionary.
JP2001246449A 1991-10-14 2001-08-15 Device and method for pronouncing chinese and converting chinese character Pending JP2002123507A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001246449A JP2002123507A (en) 1991-10-14 2001-08-15 Device and method for pronouncing chinese and converting chinese character

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3-291960 1991-10-14
JP29196091 1991-10-14
JP2001246449A JP2002123507A (en) 1991-10-14 2001-08-15 Device and method for pronouncing chinese and converting chinese character

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP4299136A Division JPH05216887A (en) 1991-10-14 1992-10-13 Device and method for chinese pronunciation notation/ chinese character conversion

Publications (1)

Publication Number Publication Date
JP2002123507A true JP2002123507A (en) 2002-04-26

Family

ID=26558776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001246449A Pending JP2002123507A (en) 1991-10-14 2001-08-15 Device and method for pronouncing chinese and converting chinese character

Country Status (1)

Country Link
JP (1) JP2002123507A (en)

Similar Documents

Publication Publication Date Title
US5319552A (en) Apparatus and method for selectively converting a phonetic transcription of Chinese into a Chinese character from a plurality of notations
EP0691023B1 (en) Text-to-waveform conversion
US5802482A (en) System and method for processing graphic language characters
JPH05216887A (en) Device and method for chinese pronunciation notation/ chinese character conversion
JP2002123507A (en) Device and method for pronouncing chinese and converting chinese character
JP2002207728A (en) Phonogram generator, and recording medium recorded with program for realizing the same
JP3002202B2 (en) Numeral reading device in rule speech synthesizer
JPH0969109A (en) Method and device for retrieving document
JPH0227423A (en) Method for rearranging japanese character data
Gafni A Universal System for Automatic Text-to-Phonetics Conversion
JP2000010579A (en) Speech synthesizer and computer readable recording medium
JP2024017326A (en) Retrieval device, retrieval method and program
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPS61265633A (en) Dictionary retrieval processing system by phonetic symbol
JP2976682B2 (en) Language playback device
JPS5848131A (en) Character processor
JP2744241B2 (en) Character processor
JPS6029823A (en) Adaptive type symbol string conversion system
JPS62154169A (en) Dictionary retrieving method for kana-to-kanji converting device
JPH10154141A (en) Kana-to-kanji (japanese syllabary-to-chinese character) conversion device
JPH0554145B2 (en)
JPS6342279B2 (en)
JPH05108647A (en) Kanji converter
JPH08314915A (en) Expression mode conversion device for information
JPH01233550A (en) Display system for chinese language

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040309