JP3266755B2

JP3266755B2 - 中国語情報処理装置

Info

Publication number: JP3266755B2
Application number: JP09569995A
Authority: JP
Inventors: 智史泉田
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1995-04-20
Filing date: 1995-04-20
Publication date: 2002-03-18
Anticipated expiration: 2017-03-18
Also published as: JPH08292941A; CN1140858A; CN1143231C

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、中国語の文章の入力或
いは編集を行なう、中国語のワードプロセッサ等の中国
語情報処理装置に関するものである。

【０００２】

【従来の技術】従来、中国語の文章の入力や編集に用い
られる中国語情報処理装置には、中国漢字を『ピンイ
ン』と呼ばれる、中国語の漢字表記の発音をアルファベ
ットで表したもので入力し、処理するようになっている
ものがある。特に、特開昭６２−９３７４４号公報、
特開平３−２８９６４号公報、特開平６−２０８５
６０号公報には、発音を示す表記記号から漢字への変換
の際に、発音表記の曖昧さを許容する変換入力を実現し
得る構成が開示されている。

【０００３】即ち、特開昭６２−９３７４４号公報にお
いては、ピンインによる中国語入力において、ピンイン
とそれに対応する単語とを対応させたピンイン変換辞書
の他に、ピンインとそれに類似したピンインに対応する
単語を対応させたピンイン曖昧変換辞書とを有し、ピン
イン−漢字変換の際に、ピンイン変換辞書を検索して必
要とする候補が見つからない場合、ピンイン曖昧辞書を
検索して候補を表示する構成が記載されている。

【０００４】また、特開平３−２８９６４号公報におい
ては、ピンインと四声とによる中国語入力において、ピ
ンイン及び四声とそれに対応する漢字とを対応させた辞
書手段を有し、入力されたピンイン及び四声に対応する
漢字候補がない場合、四声の相違に拘わらずピンインの
みが一致する漢字を検索して候補として表示する構成が
記載されている。

【０００５】また、特開平６−２０８５６０号公報に
は、字音記号による中国語入力において、字音記号とそ
れに対応する漢字列に変換する変換部の他に、字音記号
相互の曖昧関係を記述した曖昧辞書を具備し、中国語入
力の際に訛りのある発音に基づいた字音記号を入力して
も正しい中国語に変換できる構成が記載されている。

【０００６】つまり、これら各公報は、ピンインを用い
た中国語入力では、ユーザが発音を正しく区別すること
が困難であったり、区別を曖昧に覚えていて混同したり
することがあり、実用に役立ち難いといった欠点に鑑み
て成されたものである。

【０００７】一方、特開平４−１５６６６６号公報に
は、ある漢字を入力しようとする場合、既に入力されて
いる文章中から同じピンインの漢字を選択し、さらに四
声の情報を追加入力することで、ピンインと四声との情
報から漢字辞書を検索して候補を表示する構成が開示さ
れている。

【０００８】これは、ピンインを用いた中国語入力にお
ける、所望の漢字を表示させるのに、何度となくキーを
押下しなければならず、キー操作数が増大し、目的の漢
字を迅速に表示させることができないといった問題に鑑
みて成されたものである。これによれば、画面に表示さ
れている漢字から同音の漢字を選択及び声調を入力して
その候補群を表示させ、これらの候補群から所望の漢字
を選択して中国語を入力する構成を採用しているため、
簡単なキー操作によって中国語を迅速に入力することが
できる。

【０００９】

【発明が解決しようとする課題】確かに、上記した〜
の公報では、発音を示す表記記号から漢字への変換の
際に、発音表記の曖昧さを許容し得、また、の公報で
は、簡単なキー操作によって中国語を迅速に入力するこ
とができ、中国語情報処理装置においては、数々の改良
が成され、実用に供されるようになってきた。しかしな
がら、やはり、上記した〜の公報を含め、従来の中
国語情報処理装置においては、今だ充分に改良されたと
は言い難く、実際に使用するにあたり、数々の課題を有
しており、使用者からはさらなる操作性の向上が強く望
まれている。

【００１０】つまり、上記した〜の公報では、既に
記憶されている中国語の文字データを再びピンインに戻
し、ピンインで管理するといった技術的思想については
開示されておらず、中国語の文字データはすべて漢字コ
ードで管理されていた。しかしながら、中国語国家標準
に規定されたＧＢコードに基づいたデータの管理では、
第１級のクラスについてはピンイン順に管理できるが、
第２級のクラスの漢字についてはピンイン順に管理でき
ない。

【００１１】そのため、従来の中国語情報処理装置にお
いて、例えば複数の漢字文字列を並べ替える並べ替え処
理を実施すると、漢字コードの順に並べ替えられた結
果、漢字コードの第１級のクラスに属する漢字の文字列
はピンインの順に、第２級のクラスに属するものは、第
１級のクラスに属する漢字の文字列の後ろに部首の順に
といった状態で並べられてしまう。

【００１２】したがって、第１級のクラスの漢字と第２
級のクラスの漢字とが混在する漢字文字列を並べ替えよ
うとしたとき、完全なピンイン順の並べ替え結果を得る
ことができず、データ整理面で非常に不便であった。

【００１３】また、中国語においては、異字体、俗字、
簡体／繁体字、数字の漢字書き（大写）等、同一の意味
用法であるにもかかわらず、異なった文字を用いる状況
がしばしば発生する。一例としては、“渾沌”、“混
沌”は共に "hundun" と発音し、意味は全く同じであ
る。また、象声語などにおいては、その発音が重視され
るため、用いる漢字について多少の変化がある場合があ
り、一例を図５２に示す。

【００１４】ところが、従来の中国語情報処理装置にお
いては、漢字コードで管理し、漢字コードで検索を行な
うようになっている。したがって、上記の“渾沌”、
“混沌”は、読みも意味も同一であるにも係わらず、相
応する漢字コードが異なるため、同時に検索することが
できず、２度にわたる検索処理が必要であった。つま
り、従来の検索処理は、同一の意味用法であっても漢字
が相異なるといった中国語の文章を扱う場合に有効なも
のとは言えなかった。

【００１５】一方、の公報の構成には、既に入力され
ている文章中から同じピンインの漢字を選択し、さらに
四声の情報を追加入力して候補を表示するものである。
しかしながら、これにおいても文字を入力するために既
に入力されている文字データをピンインに戻すのであっ
て、既に記憶されている中国語の文字データをピンイン
で管理しようといったものではない。そのため、データ
の並べ替え処理や検索処理をピンインの基準で行なうこ
とは記載されておらす、中国語の文字データは漢字コー
ドで管理されており、並べ替え処理や検索処理におい
て、上記と同様の問題点がある。

【００１６】また、従来のペン式の中国語情報処理装置
によれば、操作者は入力したい文字列の正確な綴りを知
っておく必要がある。しかしながら、中国語の漢字には
発音が同一、或いは類似していて意味や用法も類似して
おり、紛らわしいものが多く存在している。したがっ
て、操作者は綴りがはっきりと思い出せない場合、辞書
を調べてそれを確かめる必要があった。

【００１７】そして、同様の不具合はの公報の構成に
おいても言え、これにおいては、四声の入力が不可欠
で、操作者は目的とする漢字の正確なピンインと四声と
を知っていなければ入力することができなかった。ま
た、この公報の構成では、既に入力されている文章中か
ら同じピンインを持つ漢字（変換元）を操作者が目視で
探し出さねばならず、操作者にとって負担となり、さら
に、既に入力されている文章が短い場合はこの方法では
入力できないといった問題点もある。

【００１８】但し、変換元の漢字を既に入力した文章の
中から目視で探しださねばならないといった問題は、目
的とする漢字を入力する位置の付近で変換元となる漢字
を入力することによって解決できるが、その場合は変換
元の漢字を入力したりせずに直接ピンインで目的とする
漢字の発音表記を入力すればよいのであり、この従来技
術の意義が失われることとなる。

【００１９】その他、従来の中国語情報処理装置を用い
て『氏名』や『住所』等の住所録情報を管理した場合に
も問題がある。上述したように、中国における漢字コー
ド規格であるＧＢコードの第１級はピンイン順に、第２
級は部首の順に配列してあるため、コード体系に従って
記述された人名、或いは住所の情報をピンインによって
管理、つまり、ピンイン順に情報を並べたり、ピンイン
コードによる検索を可能にしようとした場合、漢字で表
現された人名或いは住所の文字列とは別に、その文字列
の読みをピンインで入力しておく必要があった。

【００２０】また、欧米の地名或いは人名、或いは香港
を代表とする地域で多用されている広東語のアルファベ
ット表記等、英語で表記された氏名あるいは住所を同時
に管理したい場合があるが、このような場合も、従来の
中国語情報処理装置では、中国語のデータは漢字コード
で、英語のものはアルファベット文字列のコードで管理
していたので、中国語の文字データ、英語の文字データ
を一元的に管理することはできなかった。

【００２１】

【課題を解決するための手段】本発明の請求項１記載の
中国語情報処理装置は、上記の課題を解決するために、
中国語の漢字コードとそれに該当するピンインコードと
が対応して配列された漢字コード−ピンインコード変換
表を有し、この変換表を用いて漢字コードをピンインコ
ードへと逐一変換する漢字−ピンイン変換手段と、上記
漢字−ピンイン変換手段によって得られたピンインコー
ドに基づいて、情報処理を行う処理手段とを備え、上記
処理手段が、曖昧文字列変換手段であり、この曖昧文字
列変換手段は、入力手段から入力された当て字を含む文
字列からなる当て字データを漢字コード系列で記憶する
一時記憶手段と、上記一時記憶手段に記憶された当て字
データを、上記漢字−ピンイン変換手段を用いて、該漢
字コード系列が対応し得る複数のピンインコードのピン
インコード系列へと変換する漢字系列−ピンイン系列変
換手段と、この漢字系列−ピンイン系列変換手段によっ
て変換されたピンインコード系列のデータを、単語或い
は文字列の単位でピンインコードを漢字コードに変換す
る辞書を参照して漢字コード系列への変換を行なうピン
イン系列−漢字系列変換手段と、このピンイン系列−漢
字系列変換手段によって得られた複数の変換候補文字列
から一つを選択する変換候補選択手段とを備え、変換候
補選択手段にて選択された変換候補文字列の漢字コード
系列を、上記当て字データに替えて用いるようになって
いることを特徴としている。

【００２２】

【００２３】

【００２４】

【００２５】

【００２６】

【作用】上記請求項１の構成によれば、処理手段２が、
一時記憶手段１０と、漢字系列−ピンイン系列変換手段
１１と、ピンイン系列−漢字系列変換手段１２と、変換
候補選択手段１４とからなる曖昧文字列変換手段８であ
り、この曖昧文字列変換手段８は、入力手段９から入力
された当て字を含む文字列からなる当て字データを漢字
コード系列で一時記憶手段１０に記憶させ、この記憶さ
れた当て字データを、漢字系列−ピンイン系列変換手段
１１にて、上記漢字−ピンイン変換手段２を用いて、該
漢字コード系列が対応し得る複数のピンインコードのピ
ンインコード系列へと変換させる。次いで、ピンイン系
列−漢字系列変換手段１２にて、この漢字系列−ピンイ
ン系列変換手段１１によって変換されたピンインコード
系列のデータを、単語或いは文字列の単位でピンインコ
ードを漢字コードに変換する辞書１３を参照して漢字コ
ード系列へと変換させ、この複数の変換候補文字列から
変換候補選択手段１４にて候補を一つに絞り込み、その
変換候補文字列の漢字コード系列を、上記当て字データ
に替えて用いるようになっている。

【００２７】

【００２８】

【００２９】

【００３０】

【００３１】

【００３２】つまり、これは、中国語において、表記が
類似する漢字は往々にして発音も類似するといった特性
を利用したものである（その一例を示すと、“馬”（う
ま）と“罵”（ののしる）、そして“媽”（おかあさ
ん）のピンイン表記はいずれも“ｍａ”である）。

【００３３】これにより、この発明の構成を備えること
で、たとえ操作者が、ある漢字で構成された文字列を入
力したいが、その正しい綴りをはっきりと知らないとい
った場合でも、従来のように一々辞書等を用いて調べる
ことなく、入力すべき正しい漢字に類似した漢字を各種
の入力手段により当て字として入力させておき、次にそ
の当て字を含んで構成された漢字文字列を対象として変
換機能を起動し、その後目的とする正しい漢字を選択す
るだけで正しく綴られた文字列が得られる。

【００３４】また、文字を入力するにあたり、従来の
の公報にように、四声を入力する必要も、既に入力され
ている文章中から同じピンインを持つ漢字を操作者が目
視で探し出すといった作業も必要なく、さらには、既に
入力されている文章が短いと入力できないといった不具
合もない。その結果、文字入力が非常に簡単になり、中
国語情報処理装置における操作性の向上が図れる。

【００３５】

【００３６】

【００３７】

【００３８】

【００３９】

【００４０】

【００４１】

【実施例】

〔実施例１〕本発明の一実施例について、図６ないし図
２７に基づいて説明すれば、以下の通りである。尚、本
実施例においては、中国語情報処理装置を用いて住所録
管理を行なう場合を例示する。

【００４２】本実施例に係る中国語情報処理装置は、図
６に示すように、入力装置２１、データ記憶装置（主記
憶装置）２２、漢字コード−ピンインコード変換テーブ
ルメモリ２３、中央処理装置２４、作業用記憶装置２
５、表示用中国語漢字フォントＲＯＭ２６、表示装置２
７、及びアルファベット−ピンインコード変換テーブル
メモリ２８を備えている。

【００４３】入力装置２１は、キーボード及び電子ペン
入力装置からなり、操作者が住所録管理のための機能を
選択したり、或いは新たに人名や住所等のデータを入力
したりするのに使用するものであり、その他の指示やデ
ータ等もここから入力される。

【００４４】データ記憶装置２２は、例えばハードディ
スクの如き大容量の外部記憶装置からなり、本実施例で
は、住所録データがここに蓄積されている。このデータ
記憶装置２に蓄積されている住所録データの構造は、図
１２に示す通りであり、『氏名』、『住所』、『電
話』、『備考』の４つの情報を１件のデータとして、１
件ごとに管理番号（００１，００２，…ｎ）を付して管
理している。尚、データ記憶装置２２には、住所録デー
タだけでなく、その他の情報ももちろん蓄積されてい
る。

【００４５】漢字コード−ピンインコード変換テーブル
メモリ２３は、漢字コードをピンインコードに変換する
ための、漢字コード−ピンインコード変換テーブル（漢
字コード−ピンインコード変換表）を記憶しているもの
である。漢字コードとは、例えば中国における漢字コー
ド規格であるＧＢコードであり、図８にＧＢコード配列
を示す。また、ピンインとは、中国語の漢字表記の発音
をアルファベットで表したものであり、本実施例におい
ては、図９に示すように、ピンイン音節「ａ」にはピン
インコード「００１」、「ａｉ」には「００２」という
ように、「ａ」から「ｚｕｏ」まで「００１」から「４
６１」までのコードナンバーが割り当てられている。

【００４６】図７に、漢字コード−ピンインコード変換
テーブル５０を示す。これにおいては、個々の漢字コー
ドに該当するピンインコードの候補が、場合によっては
第４の候補まで対応して配列された構成となっている。
この漢字コード−ピンインコード変換テーブル５０にお
いて、ピンインコード＝０は、候補なしを示している。
漢字コード−ピンインコード変換テーブル５０は、一つ
の漢字コードに対して複数のピンインコードの候補があ
る場合は、それら各候補のうち、最も一般的に用いられ
るピンインが第１候補として用いられるように作成され
ている。また、この漢字コード−ピンインコード変換テ
ーブル５０は、漢字コード体系のクラスの相違によら
ず、すべての漢字コードに対してピンインコードが得ら
れるように作成されている。尚、図においては、漢字コ
ード−ピンインコード変換テーブル５０の欄外に、記載
されている個々の漢字コードに対応する漢字とピンイン
を併せて示している。

【００４７】中央処理装置２４は、上記入力装置２１よ
り選択された検索や入力、表示の機能の制御を行なうも
のであり、この中央処理装置２４と、上記漢字コード−
ピンインコード変換テーブル５０とで、本発明の漢字コ
ード−ピンインコード変換手段が構成されている。そし
て、この漢字コード−ピンインコード変換手段により、
中央処理装置２４は、データ記憶装置２２内の情報を、
漢字コードではなく、ピンインコードにて管理するよう
になっている。また、この中央処理装置２４の詳細な制
御内容については、フローチャート等を参照しながら後
述するが、この中央処理装置２４と作業用記憶装置２５
にて、本発明の検索手段が構成されている。

【００４８】作業用記憶装置２５は、検索、表示、入力
の各機能を処理する際に、一時的に用いられる一時記憶
装置であり、半導体メモリが用いられる。この作業用記
憶装置５には、検索キーを記憶するための前記一時記憶
領域Ｂ₁（図１０参照）、漢字コード系列をピンインコ
ード系列に変換するための作業領域Ｂ₂（図１１参
照）、検索結果を一時的に記憶するための表示用データ
バッファＢ₃（図１３参照）、データ記憶装置２へのポ
インタ、その他、引数バッファ１１０（図１４（ａ）参
照）、返り値バッファ１１１（図１４（ｂ）参照）も備
え、引数や返り値など入力・出力時に一時的に使用され
るデータがここに記憶されるようになっている。

【００４９】表示用中国語漢字フォントＲＯＭ２６は、
表示装置２７に漢字コードに基づいた漢字を表示するた
めに用いる漢字フォントを記憶する読み出し専用メモリ
である。表示装置２７は、中央処理装置２４の制御の下
に操作者に対して、各種のメッセージを表示し、検索の
結果を表示するための表示装置である。

【００５０】アルファベット−ピンインコード変換テー
ブルメモリ２８は、図１５に示すように、ピンインコー
ドとアルファベット文字列とが１：１に対応した、アル
ファベット−ピンインコード変換テーブル５２を記憶し
たものである。尚、このアルファベット−ピンインコー
ド変換テーブル５２は、ピンインコード側からアルファ
ベットに変換する場合は、ピンインコード−アルファベ
ット変換テーブルとなるものであり、これについては、
実施例２にて用いる。

【００５１】次に、上記中国語情報処理装置における、
住所管理システムの動作を説明する。まず、システム全
体動作を、図１６のフローチャートを参照して説明す
る。ステップ（以下、Ｓと略記する）１においては、中
央処理装置２４は、まず、表示装置２７に、“検索”、
“追加入力”、“終了”の何れかの処理を選択するよう
操作者に促す画面を表示する（この画面については図示
せず）。操作者により入力装置２１を用いて操作の選択
が行なわれると、選択に応じて、該当する検索処理（Ｓ
２）、或いは追加入力処理（Ｓ３）、又は終了処理（Ｓ
４）を実行する。ここで、Ｓ２の検索処理が実行された
場合は、検索結果を表示するために続けて検索結果表示
処理（Ｓ５）が実行される。そして、Ｓ３及びＳ５を終
了した後は再びＳ１に戻る。一方、Ｓ１において“終
了”が選択された場合は、Ｓ４の終了処理を実施して、
処理を終了する。

【００５２】次に、上記Ｓ２における検索処理、Ｓ５に
おける検索結果表示処理、Ｓ３における追加入力処理
を、図１７、図２４、図２５の各フローチャートを用い
てぞれぞれ説明する。

【００５３】まず、検索処理を図１７のフローチャート
を参照して説明する。Ｓ１１では、操作者に入力装置２
１より検索キー（検索データ）となる漢字文字列をアル
ファベット表記のピンインで入力させる。入力された検
索キーは、図２３に示す画面５１の５１ｂにて示す欄に
表示して操作者の確認用に供されると同時に、図１０に
示す、作業用記憶装置２５における検索キーを記憶する
ための一時記憶領域Ｂ₁の検索キーアルファベット用バ
ッファ１０１に格納される。ここで、検索キーとなる文
字列のピンインはアルファベット表記である。また、図
２３の画面５１ａ中、中国語文字列Ａは、日本語の『氏
名』に相当し、中国語文字列Ｂは日本語の『住所』に相
当し、中国語文字列Ｃは日本語の『備考』に相当し、中
国語文字列Ｄは日本語の『電話』に相当するものであ
る。

【００５４】Ｓ１２では、入力されたアルファベット文
字列をピンインコード系列に変換して、図１０に示す、
作業用記憶装置２５における上記一時記憶領域Ｂ₁の検
索キーピンイン用バッファ１０２に格納する。尚、この
動作の詳細な手順については、図１８のフローチャート
を参照して後述する。

【００５５】Ｓ１３では、図２３に示す画面５１の中の
５１ａに示す形式で選択項目を操作者が選択する。Ｓ１
４では、データ記憶装置２２から蓄積された情報を読み
出すために、読み出す情報を指定するポインタの内容を
蓄積情報の第１番目の組に設定する。このポインタは作
業用記憶装置２５の中に設定されており、データ記憶装
置２２に蓄積されているデータのうち最初から何件目か
を指定する。尚、データ記憶装置２２に蓄積されている
データの構造は、前述したように、図１２に示す通りで
ある。

【００５６】Ｓ１５では、作業用記憶装置２５におけ
る、検索結果を一時的に記憶するための表示用データバ
ッファＢ₃の初期設定を行なう。この表示用バッファＢ
₃の構造は、図１３に示す通りであり、『氏名』、『住
所』、『電話』、『備考』の４つの情報が１件のデータ
として記憶されるようになっている。また、表示用バッ
ファＢ₃の大きさは、蓄積されているデータの件数に応
じて変化するようになっている。

【００５７】Ｓ１６では、データ記憶装置２２における
ポインタが示す場所にデータが蓄積されているかどうか
を調べ、データがあればＳ１７でそれを読み出し、図１
１に示す、漢字コード系列−ピンインコード系列変換用
の作業領域Ｂ₂の元データバッファ領域１０３に複写す
る。

【００５８】Ｓ１８では、作業領域Ｂ₂の元データバッ
ファ領域１０３に転写されたデータの漢字コード系列の
各漢字コードをピンインコードに変換して、第１から第
４のピンインコード系列を作成して第１候補バッファ領
域１０４〜第４候補バッファ領域１０７までに書き込
む。尚、この動作の詳細な手順については、図１９のフ
ローチャートを参照して後述する。

【００５９】Ｓ１９では、図１０に示す一時記憶領域Ｂ
₁における検索キーピンイン用バッファ１０２のピンイ
ンコード系列が、図１１に示す第１候補バッファ領域１
０４〜第４候補バッファ領域１０７のうち、図２３に示
す画面５１の５１ａで選択された項目の中に含まれてい
るかどうかを調べ、含まれていなければ、Ｓ１６に戻
る。含まれているならば、Ｓ２０の処理を行なう。尚、
この動作の詳細な手順については、図２０のフローチャ
ートを参照して後述する。

【００６０】Ｓ２０では、図１１の作業領域Ｂ₂におけ
る元データバッファ領域１０３のデータを図１３に示す
表示用バッファＢ₃に追加した後、Ｓ１６に戻る。

【００６１】その後、Ｓ１６〜Ｓ２０までの処理を繰り
返し行なって、Ｓ１６において、データがなければ、デ
ータ記憶装置２２に蓄積されている情報に対する検索が
終了したと判断し、検索処理を終了して、図１６のＳ５
の検索結果表示処理を実施する。

【００６２】ここで、Ｓ５の検索結果表示処理、及びＳ
３の追加入力処理について説明する前に、上記図１７の
フローチャートにおけるＳ１２、Ｓ１８、Ｓ１９の処理
を説明する。

【００６３】まず、Ｓ１２のアルファベット文字列をピ
ンインコード系列に変換する処理手順を、図１８のフロ
ーチャートを用いて説明する。Ｓ２１では、図１０に示
す一時記憶領域Ｂ₁の検索キーアルファベット用バッフ
ァ１０１の先頭からのアルファベット文字列で、図１５
に示すアルファベット−ピンインコード変換テーブル５
２に含まれる最も字数の多いものを検索し、対応するピ
ンインコードを得る。Ｓ２２では、得られたピンインコ
ードを、一時記憶領域Ｂ₁の検索キーピンイン用バッフ
ァ１０２に転送する。

【００６４】Ｓ２３では、一時記憶領域Ｂ₁における検
索キーアルファベット用バッファ１０１のアルファベッ
ト文字列をすべてピンインコードに変換し終えたかどう
かを判断する。そして、すべて変換し終えたならば処理
を終了して、図１７のＳ１３に進み、まだすべて変換し
終わっていないならばＳ２１に戻り、Ｓ２１からＳ２３
を繰り返して変換し終わっていない部分を処理した後、
図１７のＳ１３に進む。

【００６５】続いて、図１７におけるＳ１８の取り出し
たデータの漢字コードをピンインコードに変換する処理
手順を、図１９のフローチャートを用いて説明する。Ｓ
３１では、図１１に示す、作業用記憶装置２５における
漢字コード系列−ピンインコード系列変換用の作業領域
Ｂ₂の第１候補バッファ領域１０４〜第４候補バッファ
領域１０７をデータなしの状態に初期化する。Ｓ３２で
は、元データバッファ領域１０３に書き込まれている変
換元（元データとも称する）の漢字コード系列のうち変
換すべき漢字１文字を指すポインタを初期設定して、１
文字目とする。Ｓ３３では、ポインタの値が変換元の漢
字コード系列の最終の漢字コードより後ろを指している
かどうかを調べ、後ろを指していないならばＳ３４に進
む。

【００６６】Ｓ３４では、ポインタが指す１文字の値が
０であるかどうかをみて、０でないなら漢字コードであ
ると見なしてＳ３５に進み、０ならば漢字コードなしと
見なしてＳ３７に進む。Ｓ３５では、ポインタが指す元
データである漢字コード系列を、漢字コードをピンイン
コードに変換する変換テーブル５０（図７参照）を用い
てピンインコードに変換する。尚、この動作の詳細な手
順については、図２１のフローチャートを参照して後述
する。

【００６７】Ｓ３６では、Ｓ３５で得られたピンインコ
ードを、作業領域Ｂ₂の第１候補バッファ領域１０４〜
第４候補バッファ領域１０７の該当する位置に格納す
る。Ｓ３７では、ポインタに１を加えてからＳ３３に戻
る。そして、漢字コード系列をすべて変換するまでＳ３
３〜Ｓ３７を繰り返し、Ｓ３３で、ポインタの値が変換
元の漢字コード系列の最終の漢字コードより後ろを指し
ていると判断したならば、漢字コード系列をすべてピン
インコードに変換したとして処理を終了し、図１７のＳ
１９に進む。

【００６８】続いてここで、図２１のフローチャートを
用いて、上記Ｓ３５のポインタが指す元データである漢
字コード系列をピンインコード系列に変換する処理手順
について説明する。また、作業用記憶装置２５における
引数バッファ１１０と、返り値バッファ１１１の各デー
タ形式を、図１４（ａ)(ｂ）にそれぞれ示す。引数バッ
ファ１１０、返り値バッファ１１１における候補の数用
領域１１１ａ、ピンインコードの第１候補用領域１１１
ｂ、ピンインコードの第２候補用領域１１１ｃ、ピンイ
ンコードの第３候補用領域１１１ｄ、ピンインコードの
第４候補用領域１１１ｅは、各々２バイトである。

【００６９】Ｓ４１では、図１４（ａ）に示す引数１１
０（つまり、ピンインコードに変換したい漢字コード）
をレジスタにセットする。Ｓ４２では、セットされたレ
ジスタの値を基にして、図７に示す漢字コード−ピンイ
ンコード変換テーブル５０へのアドレスを計算する。漢
字コード−ピンインコード変換テーブル５０の該当アド
レスを求める計算式は下記の通りである。該当アドレス＝漢字コード−ピンインコード変換テーブ
ルの先頭アドレス＋８＊ (漢字コード上位１バイト−２
０Ｈ）＊９４＋（漢字コード下位１バイト−２０Ｈ)Ｓ
４３では、返り値バッファ１１１を初期設定し、候補数
計数用のカウンタｎをクリアする。Ｓ４４では、図７の
漢字コード−ピンインコード変換テーブル５０より、該
当する第１候補が存在するかどうかを判断する。もしも
存在しなければＳ５６に進み、存在するならばＳ４５に
進む。Ｓ４５では、カウンタｎを＋１する。Ｓ４６で
は、漢字コード−ピンインコード変換テーブル５０より
第１候補のピンインコードを得てそれを返り値バッファ
１１０の第１候補用領域１１１ｂに転送する。

【００７０】Ｓ４７では、漢字コード−ピンインコード
変換テーブル５０より、該当する第２候補が存在するか
どうかを判断する。もしも存在しなければＳ５６に進
み、存在するならばＳ４８に進む。Ｓ４８ではカウンタ
ｎを＋１する。Ｓ４９では、漢字コード−ピンインコー
ド変換テーブル５０より、第２候補のピンインコードを
得てそれを返り値バッファ１１１の第２候補用領域１１
１ｃに転送する。

【００７１】Ｓ５０では、漢字コード−ピンインコード
変換テーブル５０より、該当する第３候補が存在するか
どうかを判断する。もしも存在しなければＳ５６に進
み、存在するならばＳ５１に進む。Ｓ５１ではカウンタ
ｎを＋１する。Ｓ５２では、漢字コード−ピンインコー
ド変換テーブル５０より、第３候補のピンインコードを
得てそれを返り値バッファ１１１の第３候補用領域１１
１ｄに転送する。

【００７２】Ｓ５３では、漢字コード−ピンインコード
変換テーブル５０より、該当する第４候補が存在するか
どうかを判断する。もしも存在しなければＳ５６に進
み、存在するならばＳ５４に進む。Ｓ５４ではカウンタ
ｎを＋１する。Ｓ５５では、漢字コード−ピンインコー
ド変換テーブル５０より第４候補のピンインコードを得
てそれを返り値バッファ１１１の第４候補用領域１１１
ｅに転送する。

【００７３】Ｓ５６では、カウンタｎの値を返り値バッ
ファ１１１の候補の数用領域１１１ａに転送して処理を
終了する。

【００７４】次いで、図１７におけるＳ１９の選択され
ている項目のデータのピンインコード系列中に検索キー
が含まれるかどうかを判断する処理手順について図２０
のフローチャートを用いて説明する。Ｓ６１では、『氏
名』が検索の対象に選択されているかどうかを判断す
る。選択されていればＳ６２に進み、選択されていなけ
ればＳ６４に進む。Ｓ６２では、詳細には後述する図２
２に示すＳ７０からＳ８０までの処理を行い、氏名のピ
ンインコード系列中に検索キーのピンインコード系列が
含まれているかどうかを調べる。Ｓ６３ではＳ６２の調
査結果から『氏名』の中に検索キーが含まれているかど
うかを判断し、含まれているならば、図１７のＳ２０に
進む。含まれていないならば、Ｓ６４に進む。

【００７５】同様にして『住所』のピンインコード系列
中に検索キーのピンインコード系列が含まれているかど
うかの判断をＳ６４〜Ｓ６６で行い、『備考』のピンイ
ンコード系列に検索キーのピンインコード系列が含まれ
ているかどうかの判断をＳ６７〜Ｓ６９で行なう。そし
て、Ｓ６６、Ｓ６９で含まれていると判断された場合
も、図１７のＳ２０に進む。

【００７６】ここで、上記Ｓ６２の『氏名』に検索キー
が含まれているかどうかを判定する処理を、図２２を用
いて説明する。尚、Ｓ６５、Ｓ６８の『住所』、『備
考』についてもこれと同様であり、説明の便宜上、ここ
ではこれらについての説明を省略する。

【００７７】Ｓ７０では作業領域Ｂ₂中の氏名データの
文字数をレジスタｍ₂にセットし、Ｓ７１ではポインタ
２を作業領域Ｂ₂の１番目の文字に設定する。Ｓ７２で
は検索キーのピンインコード数をレジスタｍ₁にセット
し、Ｓ７３ではポインタ１を検索キーの１番目のピンイ
ンコードに設定する。

【００７８】Ｓ７４では、レジスタｍ₁の値が０かどう
かを判断し、レジスタｍ₁が０でなければ、Ｓ７５に進
み、レジスタｍ₁の値とレジスタｍ₂の値とを比較す
る。レジスタｍ₂の値がレジスタｍ₁の値よりも大きけ
れば、Ｓ７６に進む。

【００７９】Ｓ７６では、ポインタ１の指すピンインコ
ードがポインタ２の指す文字に対応するピンインコード
に含まれているかどうかを判断し、含まれていない場合
は、Ｓ７７に進み、ポインタ２を一つ進めて、Ｓ７８に
てレジスタｍ₂の値を１減じた後、Ｓ７４に戻る。これ
にて、氏名データの次の文字についての調査が開始され
る。

【００８０】一方、ポインタ１の指すピンインコードが
ポインタ２の指す文字に対応するピンインコードに含ま
れている場合は、Ｓ７９にて進みポインタ１・２をそれ
ぞれ一つ先に進め、Ｓ８０にてレジスタｍ₁・ｍ₂の値
にそれぞれ１減じた後、Ｓ７４に戻る。これにて、氏名
データの次の文字、及び検索キーのピンインコード系列
の内の次のピンインコードについて調査が開始される。

【００８１】その後、Ｓ７４にて、レジスタｍ₁の値が
０となると、検索キーのピンインコードがすべて氏名の
文字列の中に含まれていたこととなり、検索キーが含ま
れるとしてＳ６３に進み、Ｓ６３からＳ２０に進む。

【００８２】一方、Ｓ７５にて、レジスタｍ₂の値がレ
ジスタｍ₁の値より小さくなると、つまり残りの文字に
ついて検索キーのピンインコードが含まれている可能性
がなくなるので、検索キーが含まれないとしてＳ６３に
進み、Ｓ６４に進む。このようにして、検索キーが含ま
れているかどうかを判断する。

【００８３】次に、検索処理の後に実施される、図１７
のＳ５の検査結果表示処理の手順を、図２４のフローチ
ャートを用いて説明する。

【００８４】Ｓ８１では、図２３に示す画面５１の検索
結果表示部分５１ｃを初期化する。Ｓ８２では、表示す
べき位置が何行目かを示すポインタｌを初期化する。Ｓ
８３では、画面に表示したデータの件数を計数するカウ
ンタＭを初期設定する。Ｓ８４では、図１３に示す作業
用記憶装置２５の表示用バッファＢ₃からデータを１件
取り出す。Ｓ８５では、Ｓ８４にてデータが取り出せた
かどうかを判断し、取り出せればＳ８６に進み、ポイン
タｌの値が画面５１の検索結果表示部分５１ｃの最終行
であるかを調べる。最終行ならＳ８７に進み、画面５１
の検索結果表示部分５１ｃを上に１行スクロールし、最
終行でないならばＳ８８に進み、ポインタｌに１を加え
る。

【００８５】Ｓ８９では、ポインタｌが指す行に取り出
したデータを表示する。Ｓ９０では、カウンタＭを＋１
する。Ｓ９１では、カウンタＭが検索結果表示部分５１
ｃの行数になったかどうかを調べ、まだなっていないな
ら、Ｓ８４に戻り、なったならＳ９２に進む。Ｓ９２で
は、操作者に次頁表示の指示を促し、次頁５１ｄが入力
装置２１にて指定されるまで表示処理を停止し、指定さ
れた後にＳ８３に戻る。そして、Ｓ８４からＳ９２まで
の処理を繰り返し、Ｓ８５において、８４でデータが取
り出せなかったと判断すると、表示用バッファＢ₃より
全てのデータを取り出したとして表示処理を終了し、図
１７のＳ１に進む。

【００８６】このような処理にて、図２３の画面５１の
検索結果表示部分５１ｃに示すように、検索結果が表示
される。この画面５１では、項目としては『住所』が選
択され、検索キーとしては「ｔｉａｎｊｎｓｈｉ」が入
力されており、天津市に住む人が、その氏名と電話番号
と共に、抽出され表示されている。

【００８７】次に、図１７のＳ３の追加入力の処理手順
について、図２５のフローチャートを用いて説明する。
まず、Ｓ１０１でデータ記憶装置２２に蓄積されている
データの総件数Ｘを求める。次いで、Ｓ１０２では、画
面の初期化と、図１１に示す作業領域Ｂ₂の初期設定を
行なう。Ｓ１０３では、図２６に示すように、追加入力
時の画面５４における管理番号の欄５４ａに、追加入力
するデータの管理番号を表示する。管理番号は、データ
記憶装置２に蓄積されているデータの総件数Ｘに１を加
えた数となる。尚、図２６の画面５４中、中国語文字列
Ｅが日本語の『管理番号』に相当し、画面５４において
管理番号は「００３」となっている。また、図２７に従
来の追加入力時の画面を参考のために示す。

【００８８】Ｓ１０４では、カーソルを画面５４におけ
る日本語の『氏名』に相当する中国語文字列Ａに続く氏
名入力欄５４ｂに表示し、氏名データの入力が可能な状
態であることを示す。Ｓ１０５では、データ入力あるい
は機能の指示を操作者に促す。このとき操作者は入力装
置２１を用いて『氏名』の入力を行なうことができる
し、“データの登録”、“入力する項目の選択”といっ
た機能を選択することもできる。

【００８９】Ｓ１０５にて、“データの登録”が選択さ
れたなら、Ｓ１０６に進み、データ登録処理が開始さ
れ、Ｓ１０９では、作業用記憶装置２５における作業領
域Ｂ₂の元データバッファ領域１０３に記憶されている
データをデータ記憶装置２２に追加登録する。その後、
Ｓ１１０ではデータの総件数Ｘを＋１し、Ｓ１０２に戻
る。

【００９０】一方、Ｓ１０５で、“入力する項目の選
択”が選択されたなら、Ｓ１０７に進み、入力する項目
の選択処理が開始され、Ｓ１１１では、カーソルを中国
語文字列Ａに続く氏名入力欄５４ｂ→中国語文字列Ｂに
続く住所入力欄５４ｃ→中国語文字列Ｄに続く電話番号
入力欄５４ｄ→中国語文字列Ｃに続く備考入力欄５４ｅ
→氏名入力欄５４ｂの順で１項目ずつ移動させて入力す
る項目を選択し、Ｓ１０５に戻る。

【００９１】Ｓ１０５で機能が選択されず、Ｓ１０８に
てデータが入力された場合は、Ｓ１１２では、入力され
たデータを画面のカーソルの位置に表示して、カーソル
位置を更新すると共に、作業用記憶装置２５における作
業領域Ｂ₂の元データバッファ領域１０３の該当する位
置に格納する。

【００９２】尚、Ｓ１０５にて“終了”が選択される
と、Ｓ１１３で終了処理が行なわれ、Ｓ１に戻る。この
ようにして、住所録データが追加される。

【００９３】以上にように、本実施例の中国語情報処理
装置においては、中央処理装置２４が、データ記憶装置
２２に記憶された住所録データを、漢字コード−ピンイ
ンコード変換テーブル５０を用いて漢字コードからピン
インコードに変換し、このピンインコードを基に、デー
タを管理して検索処理や検索結果の表示処理を行なうよ
うになっている。

【００９４】したがって、従来の中国語情報処理装置を
用いて、『氏名』や『住所』等の住所録情報を管理する
際、通常の中国語国家標準に規定されたＧＢコードに基
づいたデータの管理では、第１級のクラスについてはピ
ンイン順に管理できるが、第２級のクラスの漢字につい
てはピンイン順に管理できないため、住所録情報をピン
インで管理しようとした場合、漢字で表現された人名或
いは住所の文字列とは別にその文字列の読みをピンイン
で入力しておく必要があり、非常に手間であったが、こ
れにより、たとえデータ記憶装置２２に蓄積された住所
録データのうち、検索にて抽出されるべき漢字文字列
が、各漢字が漢字コード体系のどのクラスに該当してい
ても、ピンインを入力するだけで検索できる。しかも、
ピンインはコード化されているので、コード化されてい
ないピンインによる検索処理に比べ、データが圧縮され
た状態であるので、検索に要する時間が短縮され、操作
性だけでなく処理能力も格段に向上できる。

【００９５】また、本実施例においては、『氏名』や
『住所』等、指定の項目に対して検索を行なうようにな
っているので、不必要な項目まで同時に検索することが
ない。

【００９６】〔実施例２〕本発明の他の実施例につい
て、前述の実施例１の説明に用いた図面、及び図２８な
いし図３３に基づいて説明すれば、以下の通りである。
尚、説明の便宜上、前記の実施例にて示した部材と同一
の機能を有する部材には、同一の符号を付記し、その説
明を省略する。

【００９７】中国語での人名或いは住所情報を管理する
場合、英語で表記された人名あるいは住所を同時に管理
したい場合がある。欧米の地名或いは人名がその一例で
あり、また香港を代表とする地域で多用されている広東
語のアルファベット表記がもう１つの例である。本実施
例の中国語情報処理装置では、中国語のピンインが英語
のアルファベットで表記される点に着目し、中国語であ
るか英語であるかにかかわらず、人名あるいは住所の情
報のアルファベットによる一元的管理を可能とすること
を目的としている。

【００９８】本実施例の中国語情報処理装置は、前記の
実施例１の中国語情報処理装置とは、データの検索処理
が異なるもので、検索結果表示処理等については、前記
実施例１と同様である。

【００９９】本中国語情報処理装置は、図２８に示すよ
うに、入力装置２１、データ記憶装置２２、漢字コード
−ピンインコード変換テーブルメモリ２３、作業用記憶
装置２５、表示用中国語漢字フォントＲＯＭ２６、表示
装置２７、中央処理装置３０、及びピンイン−アルファ
ベット変換テーブルメモリ３１を備えている。このう
ち、入力装置２１、データ記憶装置２２、漢字コード−
ピンインコード変換テーブルメモリ２３、作業用記憶装
置２５、表示用中国語漢字フォントＲＯＭ２６、表示装
置２７については、実施例１の中国語情報処理装置と同
じものである。但し、入力装置２１は、『氏名』や住所
が漢字文字列のみならず、アルファベットによって記さ
れた文字列も入力し得るようになっており、図２９に、
入力装置２１によるデータ入力時の画面５５を示す。

【０１００】中央処理装置３０は、上記入力装置２１よ
り選択された検索や入力の機能の制御を行なうものであ
り、実施例１の中央処理装置２４では、データ記憶装置
２２内の情報をピンインコードに変換してこれで管理
し、図１７のフローチャートに示す処理手順で検索処理
を実施していたが、本実施例の中央処理装置３０におい
ては、詳細には後述するが、データ記憶装置２２内の情
報をピンインコードに変換したものを、さらにアルファ
ベットの文字コードにまで変換し、アルファベットの文
字コードでデータ管理し、検索処理を実施するようにな
っている。

【０１０１】ピンインコード−アルファベット変換テー
ブルメモリ３１は、ピンインコードをアルファベットの
文字列に変換するためのピンインコード−アルファベッ
ト変換テーブル５２を記憶しているものである。図１５
に示すように、このピンインコード−アルファベット変
換テーブル５２は、個々のピンインコードに該当するア
ルファベット文字列が、対応して配列された構成となっ
ている。

【０１０２】また、作業用記憶装置２５は、前記の実施
例１と同様に、検索、表示、入力の各機能を処理する際
に、一時的に用いられる記憶装置であり、半導体メモリ
が用いられるが、検索キーを記憶するための一時記憶領
域Ｂ₁（図１０参照）や、検索結果を一時的に記憶する
ための表示用データバッファＢ₃（図１３参照）、デー
タ記憶装置２へのポインタの他、引数バッファ及び返り
値バッファを備えていると共に、前記実施例１の漢字コ
ード系列−ピンインコード系列変換用の作業領域Ｂ
₂（図１１参照）に代えて、漢字コード系列−アルファ
ベット文字列変換用の作業領域Ｂ₄（図３１参照）を備
えている。

【０１０３】次に、図３０のフローチャートを用いて、
本実施例の中国語情報処理装置における住所管理システ
ムの検索処理の手順について説明する。

【０１０４】Ｓ１１１では、操作者に入力装置２１より
検索キーとなる文字列をアルファベット表記のピンイン
で入力させる。入力された検索キーは、図２３に示す画
面５１の５１ｂにて示す欄に表示して操作者の確認用に
供されると同時に、図１０に示す、作業用記憶装置２５
における一時記憶領域Ｂ₁の検索キーアルファベット用
バッファ１０１に格納される。

【０１０５】Ｓ１１２では、図２３に示す画面５１の中
の５１ａに示す形式で選択項目を操作者が選択する。Ｓ
１１３では、データ記憶装置２２から蓄積された情報を
読み出すために、読み出す情報を指定するポインタの内
容を蓄積情報の第１番目の組に設定する。このポインタ
は作業用記憶装置２５の中に設定されており、データ記
憶装置２２に蓄積されているデータのうち最初から何件
目かを指定する。

【０１０６】Ｓ１１４では、作業用記憶装置２５におけ
る、検索結果を一時的に記憶するための表示用データバ
ッファＢ₃の初期設定を行なう。Ｓ１１５では、ポイン
タが示す場所にデータが蓄積されているかどうかを調
べ、データがあればＳ１１６でそれを読み出し、図３１
に示す作業領域Ｂ₄の元データバッファ領域１１５に複
写する。

【０１０７】Ｓ１１７及びＳ１１８では、作業領域Ｂ₄
の元データバッファ領域１１５に転写されたデータの漢
字文字列の各漢字コードをピンインコードに変換する一
方、さらに各ピンインコードをアルファベットに変換し
て、第１から第４のアルファベット系列（アルファベッ
ト文字列）を作成して第１候補バッファ領域１１６〜第
４候補バッファ領域１１９までに書き込む。尚、これら
の動作で、Ｓ１１７は、前記の実施例１におけるＳ１８
の処理と同じであるので省略するが、Ｓ１１８について
は、詳細な手順を図３２に示し、これについては後述す
る。

【０１０８】Ｓ１１９では、図１０の一時記憶領域Ｂ₁
の検索キーアルファベット用バッファ１０１のアルファ
ベット文字列が、図３１に示す作業領域Ｂ₄の第１候補
バッファ領域１１６〜第４候補バッファ領域１１９のう
ち、図２３に示す画面５１の欄５１ａで選択された項目
の中に含まれているかどうかを調べ、含まれていなけれ
ばＳ１１５に戻る。含まれているならＳ１２０の処理を
行なう。Ｓ１２０では、図３１の元データバッファ領域
１１５のデータを図１３に示す表示用バッファＢ₃に追
加した後、Ｓ１１５に戻る。

【０１０９】その後、Ｓ１１５からＳ１２０の処理を繰
り返し、Ｓ１１５において、データがなければ、データ
記憶装置２２に蓄積されている情報に対する検索が終了
したと判断し、検索処理を終了して、図１６のＳ５に進
む。

【０１１０】続いて、図３２のフローチャートを用い
て、図３０におけるＳ１１８のピンインコード系列をア
ルファベット文字列に変換する処理手順について説明す
る。また、作業用記憶装置２５における引数バッファ１
１０と、返り値バッファ１１１の各データ形式を図３３
（ａ)(ｂ）にそれぞれ示す。

【０１１１】Ｓ１２１では、図３３（ｂ）に示す返り値
バッファ１１１を初期化する。Ｓ１２２では、引数よ
り、図１５に示すピンインコード−アルファベット文字
列変換テーブル５２へのアドレスを計算する。Ｓ１２３
では、アルファベットで記述した文字列（６文字）を返
り値バッファ１１１の各領域に複写する。Ｓ１２４で
は、アルファベット文字列の文字数を求め、返り値バッ
ファ１１１における文字列の文字数用領域１１１ａに格
納し、図３０のＳ１１９に進む。

【０１１２】以上にように、本実施例の中国語情報処理
装置においては、中央処理装置３０が、データ記憶装置
２２に記憶された住所録データを、漢字コード−ピンイ
ンコード変換テーブル５０を用いて漢字コードからピン
インコードに変換し、続いて、ピンインコード−アルフ
ァベット文字列変換テーブル５２を用いてピンインコー
ドさらにアルファベットの文字列に変換し、アルファベ
ットの文字コードを基に、データを管理して検索処理を
行なうようになっている。

【０１１３】したがって、中国語情報処理装置を用い
て、『氏名』や『住所』等の住所録データを管理する際
に、欧米の地名或いは人名、或いは香港を代表とする地
域で多用されている広東語のアルファベット表記等、英
語で表記された氏名あるいは住所が混在する場合、アル
ファベットの文字コードでの管理が可能となることで、
アルファベット表記のものまで同時に検索することがで
きる。この結果、例えば、中国語のデータのみならず、
アルファベット表記、ピンイン表記のデータが混在した
ものも一括に管理でき、住所録管理が格段に行い易くな
り、中国語情報処理装置における操作性の向上が図れ
る。

【０１１４】〔実施例３〕本発明の他の実施例につい
て、前記の実施例の説明に用いた図面、及び図３４ない
し図４２に基づいて説明すれば、以下の通りである。
尚、説明の便宜上、前記の実施例にて示した部材と同一
の機能を有する部材には、同一の符号を付記し、その説
明を省略する。

【０１１５】中国語の人名或いは住所をピンインで管理
した場合、ピンインの特性により、頻繁に文字列の先頭
に現れる文字（声母を表すピンインがこれにあたり、例
えば“ｚ”，“ｃ”，“ｓ”）と、まれにしか文字列の
先頭に現れない文字（韻母を表すピンインの一部がこれ
にあたり、例えば“ｉ”，“ｕ”，“ｖ”）とがある。
そのため、人名或いは住所情報を例えばそれぞれの文字
列の先頭のピンインを基にアルファベットのＡからＺの
２６のグループに分類したような場合、多くの情報が分
類されるグループと情報が殆ど分類されないグループと
が出てきて、管理や後の検索の場合に都合が悪い。

【０１１６】そこで、本実施例の中国語情報処理装置で
は、情報を文字列先頭のピンインによって分類するので
はなく、分類の結果各グループに蓄積される情報の数が
できるだけ均等になるように自動的にグループ分けを行
い、かつどのようにグループ分けを行なったかについて
情報を操作者に明示して管理を容易にすることを目的と
している。

【０１１７】本実施例に係る中国語情報処理装置は、検
索処理等は前記実施例１とは、検索したデータの表示処
理が異なる。

【０１１８】図３４に示すように、入力装置２１、デー
タ記憶装置２２、漢字コード−ピンインコード変換テー
ブルメモリ２３、作業用記憶装置２５、表示用中国語漢
字フォントＲＯＭ２６、表示装置２７、アルファベット
−ピンインコード変換テーブルメモリ２８、中央処理装
置３３を備えている。このうち、入力装置２１、データ
記憶装置２２、漢字コード−ピンインコード変換テーブ
ルメモリ２３、作業用記憶装置２５、表示用中国語漢字
フォントＲＯＭ２６、表示装置２７、アルファベット−
ピンインコード変換テーブルメモリ２８については、実
施例１の中国語情報処理装置と同じものである。

【０１１９】中央処理装置３３は、上記入力装置２１よ
り選択された検索や入力の機能の制御を行なうものであ
り、実施例１の中央処理装置２４では、図２４のフロー
チャートに示す処理手順でＳ５における検索結果表示処
理を実施していたが、本実施例の中央処理装置３３にお
いては、詳細には後述するが、図３５、図３６のフロー
チャートに示す処理手順にて検索結果表示処理を実施す
るようになっている。

【０１２０】作業用記憶装置２５は、前記の実施例１と
同様に、検索、表示、入力の各機能を処理する際に、一
時的に用いられる記憶装置であり、半導体メモリが用い
られるが、検索キーを記憶するための一時記憶領域Ｂ₁
（図１０参照）や、漢字コード系列−ピンインコード系
列変換用の作業領域Ｂ₂（図１１参照）、検索結果を一
時的に記憶するための表示用データバッファＢ₃（図１
３参照）、データ記憶装置２２へのポインタの他、引数
バッファ及び返り値バッファを備えており、さらに、後
述する分類表１・２を作成するためのバッファも備えて
いる。

【０１２１】次に、図３５、図３６のフローチャートを
用いて、上記住所管理システムにおける検索結果表示処
理の手順について説明する。

【０１２２】Ｓ１３１では、図３９に示すような分類表
１を作成する。これは表示用バッファＢ₃に格納されて
いるデータの件数を『氏名』の項目の第１番目の漢字の
ピンインコードによって分類して計数する処理であり、
この分類表１の作成する際の処理手順は、図４１を用い
て後述する。

【０１２３】Ｓ１３２では、分類表１を基にして図４０
のような分類表２を作成する。これは操作者が選択する
グループ毎に第１件目のデータの『氏名』の項目の第１
番目の漢字のピンインコードと該当するデータの件数を
得る処理であり、この分類表２を作成する処理手順は、
図４２を用いて後述する。

【０１２４】Ｓ１３３では、分類表２を参照し、図３７
に示す画面５５のように、分類した各ブループのインデ
ックス及びデータの件数を表示する。この画面５５中、
中国語文字列Ｆが日本語における『分類』に相当し、中
国語文字列Ｇが日本語における『件数』に相当し、中国
語文字列Ｈが日本語における『合計』に相当する。尚、
図３８に、従来の機械的に分類した場合の各グループの
インデックス及びデータの件数が表示された画面を参考
のために示す。

【０１２５】Ｓ１３４では、図３７の画面に従って操作
者にグループの１つを選択することを促す。グループ選
択の指示が入力された後にＳ１３５に進み、Ｓ１３５で
は、選択されたグループのデータの氏名の第１番目の漢
字のピンインコードの取る値の最小値と最大値とを求め
る。Ｓ１３６では、図２３に示す画面５１の検索結果表
示部分５１ｃを初期化する。Ｓ１３７では、表示すべき
位置が何行目かを示すポインタｌを初期化する。Ｓ１３
８では、画面５１に表示したデータの件数を計数するカ
ウンタＭを初期設定する。

【０１２６】Ｓ１３９では、図２９に示す表示用バッフ
ァＢ₃からデータを１件取り出す。Ｓ１４０で、表示用
バッファＢ₃からデータが取り出せればＳ１４１に進
む。Ｓ１４１では、Ｓ１３５で求めたピンインコードの
最大値と最小値を参照して、取り出したデータがこの範
囲に該当するかどうかを判断する。該当しない場合はＳ
１３８に戻り、該当するならばＳ１４２に進む。

【０１２７】Ｓ１４２では、ポインタｌの値が画面５１
の検索結果表示部分５１ｃの最終行であるかを調べる。
最終行ならＳ１４３に進み、画面５１の検索結果表示部
分５１ｃを上に１行スクロールし、最終行でないならば
Ｓ１４４に進み、ポインタｌに１を加える。Ｓ１４５で
は、ポインタｌが指す行に取り出したデータを表示す
る。Ｓ１４６では、カウンタＭを＋１する。Ｓ１４７で
は、カウンタＭが表示領域の行数になったかどうかを調
べ、まだなっていないなら、Ｓ１４９に戻り、なってい
るならＳ１４８に進む。

【０１２８】Ｓ１４８では、操作者に次頁表示の指示を
促し、画面５１における次頁５１ｄが入力装置２１を用
いて指定されるまで表示処理を停止し、指定された後に
Ｓ１３８に戻る。そして、Ｓ１４０にて、Ｓ１３９でデ
ータが取り出せなかったと判断すると、表示処理を終了
し、図１６におけるＳ１に進む。

【０１２９】ここで、図４１のフローチャートを用い
て、図３５におけるＳ１３１の分類表１（図３９参照）
を作成する処理手順について説明する。

【０１３０】Ｓ１５１では、分類表１作成用のバッファ
を初期化し、Ｓ１５２では、表示用バッファＢ₃よりデ
ータの１件目を取り出す。Ｓ１５３では、データが取り
出せたかどうかを判断し、取り出せた場合は、Ｓ１５４
に進む。Ｓ１５４では、取り出したデータのうち、『氏
名』の１文字目をピンインコードに変換し、Ｓ１５５で
は、分類表１における１文字目のピンインコードに対応
する欄の件数を＋１した後、再びＳ１５２に戻る。

【０１３１】Ｓ１５２からＳ１５５の処理を繰り返し表
示用バッファＢ₃に記憶されているデータを順に取り出
して、その『氏名』の一文字目のピンインコードに対応
する欄の件数を加算していき、その後、Ｓ１５３で、デ
ータが取り出せなかったと判断した場合は、表示用バッ
ファＢ₃からのデータの取り出しが終了したとして、Ｓ
１５６に進み、表示用バッファＢ₃から取り出すべきデ
ータを示すポインタを初期化した後、Ｓ１３２に進む。

【０１３２】続いて、図４２のフローチャートを用い
て、図３５におけるＳ１３２の分類表２（図４０参照）
を作成する処理手順について説明する。

【０１３３】Ｓ１６１では、グループ数のレジスタＧを
１０とし、グループ番号用のレジスタｇを１、ピンイン
コード用のレジスタａを１、累計件数用のレジスタｓを
０に各々設定する。グループ数の１０は、表示装置２７
の表示容量の大きさに合わせて設定されたものである。

【０１３４】Ｓ１６２では、検索され表示用バッファＢ
₃に蓄積されたデータの総件数Ｙを求める。Ｓ１６３で
は、分類表２のグループ番号用レジスタｇが示すグルー
プ番号のピンインコードをピンインコード用レジスタａ
が示す値にセットする。

【０１３５】Ｓ１６４では、累計件数用レジスタｓの値
が（Ｙ／Ｇ）＊ｇより大きいかどうかを判定し、小さい
場合は、Ｓ１６５に進み、累計件数用レジスタｓに分類
表１のピンインコード用レジスタａの示す値のピンイン
コードの件数を加えてＳ１６６に進む。そして、ピンイ
ンコード用レジスタａを＋１した後、Ｓ１６４にて等し
いか或いは大きいと判定されるまで、Ｓ１６４〜Ｓ１６
６の処理を繰り返す。

【０１３６】Ｓ１６４で、累計計数用レジスタｓの値が
（Ｙ／Ｇ）＊ｇと等しいか或いはこれより大きいと判定
されると、ステップ１６７に進み、分類表２のグループ
番号用レジスタｇの値のグループ番号のデータ件数を求
める。ここで用いられる式は以下の通りである。

【０１３７】

【数１】

【０１３８】Ｓ１６８では、グループ番号用レジスタｇ
の値をプラス１した後、Ｓ１６９では、グループ番号用
レジスタｇの値とグループ数Ｇとが等しくなったかどう
かを判断し、等しくなければＳ１６３に戻り、Ｓ１６３
〜Ｓ１６９までの処理を等しくなるまで繰り返し、等し
くなったならばＳ１７０に進む。

【０１３９】Ｓ１７０では、上記のＳ１６７と同じ計算
式にて分類表２のグループ番号用レジスタｇの値のグル
ープ番号のデータ件数を求めた後、図３５のＳ１３３に
進む。

【０１４０】以上のように、本実施例の中国語情報処理
装置では、入力装置２１により検索キーが入力された場
合、中央処理装置３５が、データ記憶装置２２に記憶さ
れた複数組の漢字文字列の該当する検索項目について漢
字コード−ピンインコード変換テーブル５０を参照しな
がらピンインコードへと変換し、その情報内に検索キー
と同じデータが含まれている場合は、対応する漢字文字
列を組の単位で得て、次にそれが合計何組あるかを求め
それを被除数とし、予め表示装置２７の表示容量の大き
さに合わせて設定されたグループの数を除数として除算
を実行し、１グループあたりの平均の組数を算出する。
この平均の組数を基準にして、検索で得られた文字列の
組をピンイン順で先頭から分割していく。そして、グル
ープ分けした後、どのような分割によってグループ分け
がなされたかについての情報を表示装置２７を用いて出
力する。そして、操作者によって選択されたグループに
属する複数組の文字列を表示装置２７に出力する。尚、
ここでの出力は、一組毎、あるいは特定の項目について
複数組毎に表示させてもよい。

【０１４１】尚、グループ分けの際には、必要に応じ
て、グループの数が２６（アルファベットのＡからＺま
での文字数）よりもかなり小さい場合（例えば５）に
は、それぞれの組の文字列の１文字目のアルファベット
（１文字目が漢字である場合にはその漢字をピンインコ
ードに変換し、さらにピンインコードを変換して得られ
たアルファベットの１文字目を採用する）が同一の組
は、２つ以上のグループに跨がって分類しないという処
理を加えることもできる。同様に、必要に応じて、記憶
手段に記憶されたそれぞれの組の文字列の１文字目のア
ルファベットが特定の先頭文字に集中しているような場
合には、１文字目と２文字目が同一の組は２つ以上のグ
ループに跨がって分割しないように処理することもでき
る。

【０１４２】〔実施例４〕本発明の他の実施例を、前記
実施例の説明に用いた図と、図４３ないし図４６に基づ
いて説明すれば、以下の通りである。尚、説明の便宜
上、前記実施例にて示した部材と同一の機能を有する部
材には、同一の符号を付記し、その説明を省略する。

【０１４３】従来の中国語の情報処理装置によれば、並
べ替え機能を実行すると漢字のコードの順に並べ替えら
れるため、例えばＧＢコードの場合、第１級のクラスに
属する漢字の文字列はピンインの順に並べられるが、第
２級のクラスに属するものは、第１級のクラスに属する
漢字の文字列の後ろに部首の順に並べられるという事態
が起こっていた。従って、第１級のクラスの漢字と第２
級のクラスの漢字とが混在する文字列の集合を並べ替え
ようとしたときに完全なるピンイン順の並べ替え結果を
得ることができなかった。

【０１４４】そこで、本実施例に係る中国語情報処理装
置は、並べ替え処理が指定された際、並べ変えるべきデ
ータを一旦ピンインコード系列に変換することで、完全
なるピンイン順の並べ替え結果を得ることを目的として
いる。

【０１４５】本実施例に係る中国語情報処理装置は、図
４３に示すように、入力装置２１、データ記憶装置２
２、漢字コード−ピンインコード変換テーブルメモリ２
３、作業用記憶装置２５、表示用中国語漢字フォントＲ
ＯＭ２６、表示装置２７、中央処理装置３５を備えてい
る。このうち、入力装置２１、データ記憶装置２２、漢
字コード−ピンインコード変換テーブルメモリ２３、作
業用記憶装置２５、表示用中国語漢字フォントＲＯＭ２
６、表示装置２７については、実施例１の中国語情報処
理装置と同じものである。

【０１４６】中央処理装置３５は、上記入力装置２１よ
りデータ並べ替え処理を指示されると、後述のようにデ
ータ記憶装置２２の情報に対してデータの並べ替えを行
なうようになっている。つまり、この中央処理装置３５
にて、本発明のデータ並べ替え手段が構成されている。

【０１４７】ここでデータ記憶装置２２には、元データ
２００として、図４４（ａ）に示す４つのデータ２００
ａ〜２００ｄが、２００ａ、２００ｂ、２００ｃ、２０
０ｄの順に記憶されているものとする。２００ａ〜２０
０ｄはそれぞれ管理用番号（１，２，３，４）と文字列
データとが組になって記憶されている。これらの管理用
番号は重複しないものとする。

【０１４８】上記構成の中国語情報処理装置において、
中央処理装置３５は入力装置２１からデータ並べ替え処
理の実施を促す指示により、以下の一連の制御を開始す
る。

【０１４９】まず、元データ２００の内容を１文字ずつ
すべて、漢字コード−ピンインコード変換テーブルメモ
リ２３の漢字コード−ピンインコード変換表５０（図７
参照）を用いることにより、ピンインコード系列に変換
する。ここで一つの漢字に複数のピンインコード候補が
得られた場合、常に第１番目の候補を採用するものとす
る。

【０１５０】図４５に、データ２００ａ〜２００ｄを構
成する各漢字のピンイン表記と、漢字コードにおけるク
ラスを示す。図中が付されているものは、第１級クラ
スに属するもので、が付されているものが、第２級ク
ラスに属するものである。

【０１５１】次に、これらピンインコード系列の各デー
タ２００ａ〜２００ｄを、ピンインコードの昇順に順序
を並べ替える。続いて、並べ替えられたピンインコード
系列と同じ順序に元データを並べ替え、図４４（ｂ）に
示す、並べ替えデータ２０１を得る。最後にこの並べ替
えデータ２０１を、表示用中国語漢字フォントＲＯＭ２
６を用いるこによって漢字フォントに変換し、表示装置
２７に表示させる。尚、ここで、データ並べ替え結果
を、データファイルの形態をもってデータ記憶装置２２
に保持してもよい。

【０１５２】これにより、従来のように元データ２００
を単に漢字コードの順に並べ替えると、図４６に示す並
べ替えデータ２０２のような、第２級クラスに属する漢
字コードを含んでいるデータ２００ａが、第１級クラス
の漢字コードからなるデータの後ろに並べられてしまう
が、図４４（ｂ）に示す並べ替えデータ２０１のよう
に、完全にピンイン順に並べ替えることができる。

【０１５３】〔実施例５〕本発明の他の実施例を、前記
実施例の説明に用いた図と、図４７ないし図４９に基づ
いて説明すれば以下の通りである。尚、説明の便宜上、
前記実施例１にて示した部材と同一の機能を有する部材
には、同一の符号を付記し、その説明を省略する。

【０１５４】従来の中国語の情報処理装置においては、
漢字コードを基準に検索を行なうようになっている。と
ころが、中国語においては、異字体、俗字、簡体／繁体
字、数字の漢字書き（大写）等、同一の意味用法である
にもかかわらず、異なった文字を用いる状況がしばしば
発生する。したがって、例えば図４８に示す中国語文字
Ｈと中国語文字Ｊとは、共にそのピンインは「ｓａｎｑ
ｉａｎｙｕａｎ」で、かつ意味も同一であるにも係わら
ず、相応する漢字コードが異なるため、両方を同時に検
索することはできなかった。

【０１５５】そこで、本実施例の中国語情報処理装置
は、検索処理時に、同じピンイン表記であるものは、漢
字文字列がたとえ異なっていようとも、一度の検索処理
の実施で検出することを可能とすることを目的としてい
る。

【０１５６】本実施例に係る中国語情報処理装置は、図
４７に示すように、入力装置２１、データ記憶装置２
２、漢字コード−ピンインコード変換テーブルメモリ２
３、作業用記憶装置２５、表示用中国語漢字フォントＲ
ＯＭ２６、表示装置２７、アルファベット−ピンインコ
ード変換テーブルメモリ２８、中央処理装置３７を備え
ている。このうち、入力装置２１、データ記憶装置２
２、漢字コード−ピンインコード変換テーブルメモリ２
３、作業用記憶装置２５、表示用中国語漢字フォントＲ
ＯＭ２６、アルファベット−ピンインコード変換テーブ
ルメモリ２８、表示装置２７については、実施例１の中
国語情報処理装置と同じものである。

【０１５７】中央処理装置３７は、上記入力装置２１よ
り検索処理が指示されると、後述のようにデータ記憶装
置２２の情報に対して検索を行なうようになっている。
つまり、この中央処理装置３７と、作業用記憶装置２５
により本発明の検索手段が構成されている。尚、検索処
理については、実施例１にて詳細に説明したので、ここ
では詳細な説明は省略する。

【０１５８】作業用記憶装置２５は、前記の実施例１と
同様に、検索、表示、入力の各機能を処理する際に、一
時的に用いられる記憶装置であり、半導体メモリが用い
られるが、検索キーを記憶するための一時記憶領域Ｂ₁
（図１０参照）や、検索結果を一時的に記憶するための
表示用データバッファＢ₃（図１３参照）、データ記憶
装置２２へのポインタの他、引数バッファ及び返り値バ
ッファを備えていると共に、前記実施例１の漢字コード
系列−ピンインコード系列変換用の作業領域Ｂ₂（図１
１参照）に代えて、図４９に示す漢字コード系列−ピン
インコード系列変換用の作業領域Ｂ₅を備えている。

【０１５９】また、ここでは仮に、データ記憶装置２２
に蓄積される元のデータの中には、図４８の中国語文字
列Ｋと中国語文字列Ｊが含まれているものとする。

【０１６０】上記構成の中国語情報処理装置において、
中央処理装置３７は入力装置２１からの検索処理の実施
を促す指示により、以下の一連の制御を開始する。ま
ず、操作者に検索キーの入力を促すメッセージを表示装
置２７に表示させる。次に操作者が入力装置２１より検
索キーとなるピンインをアルファベットで入力するまで
待つ。入力がなされたならば、そのアルファベット文字
列を検索キーを記憶するための一時記憶領域Ｂ₁（図１
０参照）の検索キーアルファベット用バッファ１０１に
書き込む。その後、アルファベット−ピンイン変換テー
ブル５０を用いながら、検索キーアルファベット用バッ
ファ１０１内のデータを先頭から逐一ピンインコードに
変換していき、検索キーピンイン用バッファ１０２に格
納する。

【０１６１】次にデータ記憶装置２２に記憶されたデー
タを１件ずつ先頭から読み出し、図４９に示す元データ
バッファ領域１２１に書き込む。それから漢字コード−
ピンインコード変換テーブル５０を利用しながら、元デ
ータバッファ領域１２１に書き込まれている漢字文字列
（漢字コード系列）を１文字ずつピンインコードに変換
し、第１候補バッファ領域１２２〜第４候補バッファ領
域１２５に書き込む。

【０１６２】その後、図１０の検索キーピンイン用バッ
ファ１０２に格納されたピンイン系列が第１候補バッフ
ァ領域１２２〜第４候補バッファ領域１２５に含まれる
かどうかを調べ、含まれるならば、元データバッファ領
域１０３内のデータを表示用中国語漢字フォントＲＯＭ
２６を用いることによって漢字フォントに変換し、表示
装置２７に表示させる。データ記憶装置２２に記憶され
たデータの最後の１件までこの処理を繰り返す。尚、こ
の場合、表示装置２７に表示させずに、データファイル
の形態をもってデータ記憶装置２２に保持してもよい。

【０１６３】このように、本実施例の中国語情報処理装
置においては、検索処理が指示された場合は、中央処理
装置３７は、入力装置２１から入力された検索キーをピ
ンインコードで作業用記憶装置２５における一時記憶領
域Ｂ₁の検索キーピンイン用バッファ１０２に記憶する
一方、データ記憶装置２２に記憶された情報を、漢字コ
ード−ピンインコード変換テーブル５０を用いて漢字コ
ードをピンインコードに変換し、このピンインコードの
データに対して、一記憶記憶領域Ｂ₁の検索キーピンイ
ン用バッファ１０２に記憶されているピンインコードが
含まれているかどうかを検索するようになっている。

【０１６４】したがって、データ記憶装置２２に蓄積さ
れる元のデータの中の、中国語文字列Ｋと中国語文字列
Ｊ（図４８参照）を同時に検索することができ、検索処
理に要する時間を短縮できる。

【０１６５】尚、本実施例では、検索キーを入力装置２
１を用いて操作者により入力されたものであったが、別
の処理装置によって設定されたものであってもよい。

【０１６６】〔実施例６〕本発明の他の実施例を、前記
実施例の説明に用いた図面、図５０及び図５１に基づい
て説明すれば以下の通りである。尚、説明の便宜上、前
記実施例にて示した部材と同一の機能を有する部材に
は、同一の符号を付記し、その説明を省略する。

【０１６７】従来のペン式の中国語情報処理装置によれ
ば、操作者は入力したい文字列の正確な綴りを知ってお
く必要がある。しかしながら、中国語の漢字には発音が
同一、或いは類似していて意味や用法も類似しており、
紛らわしいものが多く存在している。したがって、操作
者は綴りがはっきりと思い出せない場合、辞書を調べて
それを確かめる必要があった。

【０１６８】そこで、本実施例の中国語情報処理装置
は、中国語において、表記が類似する漢字は往々にして
発音も類似するといった特性を利用し、たとえ操作者に
曖昧な知識しかなくとも、また、全く四声を知らずと
も、一旦入力された文字列をピンインコード系列に変換
し、それに対してピンインから漢字単語への変換を行な
うことで、単語或いは句の単位で正確な綴りに変換する
ことで、文字列入力を可能とすることを目的としてい
る。

【０１６９】本実施例に係る中国語情報処理装置は、図
５０に示すように、入力装置２１、漢字コード−ピンイ
ンコード変換テーブルメモリ２３、作業用記憶装置２
５、表示用中国語漢字フォントＲＯＭ２６、表示装置２
７、ピンインコード−漢字コード系列変換辞書３９、中
央処理装置３８を備えている。このうち、入力装置２
１、漢字コード−ピンインコード変換テーブルメモリ２
３、作業用記憶装置２５、表示用中国語漢字フォントＲ
ＯＭ２６、表示装置２７については、実施例１の中国語
情報処理装置と同じものである。

【０１７０】中央処理装置３８は、上記入力装置２１よ
り曖昧な当て字を含む漢字文字列が入力された場合、画
面表示の制御及び漢字コードからピンインコードへの、
そしてピンインコード系列から漢字文字列への変換のた
めの制御を行なって、当て字を含む文字列を正しい綴り
となるように処理を実施するようになっている。つま
り、この中央処理装置３８が、本発明の曖昧文字列変換
手段の処理を行なうようになっている。

【０１７１】尚、ここでの漢字文字列の入力方法として
は、電子ペンによる手書き入力、部首や筆画による入
力、ピンインによる入力等が考えられるが、本実施例で
は、上記入力装置２１として、操作者が電子式のペンに
よって表示装置２７上に漢字を書き、中央処理装置３８
の制御の下にその筆跡を認識して漢字のコードを出力す
るものとする。また、この入力装置２１では、図５１
（ａ）に示すように、表示装置２７の画面５５上に表示
された認識キー５５ａと変換キー５５ｂが電子ペンで触
られたことを検知して信号を中央処理装置３８に送出す
るようになっている。

【０１７２】作業用記憶装置２５は、変換処理の際に一
時的に用いる記憶装置であり、半導体メモリが用いられ
る。図４９に示す形式の作業領域がここに確保されてい
る。

【０１７３】上記構成の中国語情報処理装置において、
中央処理装置３８の入力時の処理を説明する。

【０１７４】まず、中央処理装置３８は、表示装置２７
に図５１（ａ）に示すような画面を表示する。ここで５
５ｃは、変換結果を表示するための領域であり、５５ｄ
は電子ペンによって漢字を記入する領域である。また、
先にも述べた５５ａは記入された漢字を漢字コードに変
換する処理を起動する認識キー、５５ｂは、同図（ｂ）
に示すように、領域５５ｃに、認識結果５５ｅのよう
に、表示された漢字コード系列をピンインコード系列に
変換し、続いて単語或いは句の単位で漢字に再変換して
当て字を正規の漢字に修正する機能を起動する変換キー
である。

【０１７５】操作者は電子ペンによって５５ｄの領域に
入力したい漢字を記入する。ここでは仮に、“エジプ
ト”と言う意味の中国語“埃及（ａｉｊｉ）”を入力
したいとする。操作者はこの正しい綴りを記憶していな
いので、まず、知っている漢字でピンインが同じものを
当て字としてペンで記入する。図５１（ａ）は既に記入
が終わっており、“埃（ａｉ）”と“極（ｊｉ）”が記
入された状態である。

【０１７６】次に、同図（ｂ）の如く操作者が電子ペン
で５５ａに触れると、中央処理装置３８の制御の下に記
入された漢字の認識が成され、認識結果５５ｅが領域５
５ｃに表示される。認識結果５５ｅの下線は、これが電
子ペンによって記入された文字の認識の結果であること
を示している。

【０１７７】次に、同図（ｃ）の如く操作者が電子ペン
で５５ｂに触れると、中央処理装置３８はまず、下線部
の文字列を図４９に示す作業領域Ｂ₅の元データバッフ
ァ領域１２１に複写する。次に、漢字コード−ピンイン
コード変換テーブル５０を用いて、元データバッファ領
域１２１に書き込まれているデータをピンインコード系
列に変換し、第１候補バッファ領域１２２〜第４候補バ
ッファ領域１２５に得られたピンインコード系列を格納
する。

【０１７８】そして、本実施例では、中央処理装置３７
が、変換候補選択手段として機能し、漢字文字列への変
換後の候補数が増加するのを避けるために、このうち第
１候補バッファ１２２のみを使用し、第１候補バッファ
１２２のピンインコード系列を単語或いは句の単位で再
び漢字文字列に変換する。漢字文字列においては、ここ
で複数の漢字文字列が得られる場合は、第１番目の候補
のみを採用している。ピンインコード−漢字コード系列
変換辞書３９は、同一のピンイン系列に対しては変換候
補を使用頻度の高い順に配列してあるので、第１番目の
候補を複雑な処理を経ることなく得ることができる。こ
うして得られた漢字文字列を図５１（ｃ）の５５ｆのよ
うに画面５５に表示し、これで当て字から正しい綴りの
漢字が得られたことになる。尚、ここで、正しい綴りの
漢字を、データファイルの形態をもって図示しないデー
タ記憶装置に保存することもできる。

【０１７９】これにより、文字列入力時に、たとえ操作
者に曖昧な知識しかなくとも、また、全く四声を知らず
とも、一旦入力された文字列をピンインコード系列に変
換し、それに対してピンインから漢字単語への変換を行
なうことで、単語或いは句の単位で正確な綴りに変換し
て文字列の入力が可能となる。

【０１８０】尚、本実施例では、各過程で頻度に応じた
第１候補のみを候補として採用することで、中央処理装
置３７で変換候補選択手段を構成しているが、得られた
漢字文字列が複数個の場合、変換候補文字列についてそ
れらを画面に表示し、操作者にそのうちの一つの選択を
促し、正しい綴りの選択された候補の文字列を表示装置
２７の画面上に表示してもよい。

【０１８１】

【発明の効果】本発明の請求項１記載の中国語情報処理
装置は、以上のように、中国語の漢字コードとそれに該
当するピンインコードとが対応して配列された漢字コー
ド−ピンインコード変換表を有し、この変換表を用いて
漢字コードをピンインコードへと逐一変換する漢字−ピ
ンイン変換手段と、上記漢字−ピンイン変換手段によっ
て得られたピンインコードに基づいて、情報処理を行う
処理手段とを備え、上記処理手段が、曖昧文字列変換手
段であり、この曖昧文字列変換手段は、入力手段から入
力された当て字を含む文字列からなる当て字データを漢
字コード系列で記憶する一時記憶手段と、上記一時記憶
手段に記憶された当て字データを、上記漢字−ピンイン
変換手段を用いて、該漢字コード系列が対応し得る複数
のピンインコードのピンインコード系列へと変換する漢
字系列−ピンイン系列変換手段と、この漢字系列−ピン
イン系列変換手段によって変換されたピンインコード系
列のデータを、単語或いは文字列の単位でピンインコー
ドを漢字コードに変換する辞書を参照して漢字コード系
列への変換を行なうピンイン系列−漢字系列変換手段
と、このピンイン系列−漢字系列変換手段によって得ら
れた複数の変換候補文字列から一つを選択する変換候補
選択手段とを備え、変換候補選択手段にて選択された変
換候補文字列の漢字コード系列を、上記当て字データに
替えて用いるようになっている構成である。

【０１８２】

【０１８３】

【０１８４】

【０１８５】

【０１８６】

【０１８７】

【０１８８】請求項１の構成により、たとえ操作者が、
ある漢字で構成された文字列を入力したいが、その正し
い綴りをはっきりと知らないといった場合でも、従来の
ように一々辞書等を用いて調べることなく、入力すべき
正しい漢字に類似した漢字を各種の入力手段により当て
字として入力させておき、次にその当て字を含んで構成
された漢字文字列を対象として変換機能を起動し、その
後目的とする正しい漢字を選択するだけで正しく綴られ
た文字列が得られる。

【０１８９】

【０１９０】

【０１９１】

【０１９２】これらの結果、中国語情報処理装置におけ
る操作性を大きく向上できるといった効果を奏する。

【図面の簡単な説明】

【図１】本発明の構成を示すブロック図である。

【図２】本発明の構成を示すブロック図である。

【図３】本発明の構成を示すブロック図である。

【図４】本発明の構成を示すブロック図である。

【図５】本発明の構成を示すブロック図である。

【図６】本発明の一実施例を示すもので、中国語情報処
理装置の構成を示すブロック図である。

【図７】漢字コード−ピンインコード変換テーブルの構
成図である。

【図８】中国国家標準に規定された漢字コード（ＧＢコ
ード）の配列の説明図である。

【図９】ピンインコードの割り当て表を示す説明図であ
る。

【図１０】検索キーを記憶するための一時記憶領域を示
す説明図である。

【図１１】漢字コード系列をピンインコード系列に変換
するための作業領域のデータ構造を示す説明図である。

【図１２】主記憶装置に記憶されるデータ構造を示す説
明図である。

【図１３】検索して得られたデータを格納するための表
示用バッファの構造を示す説明図である。

【図１４】引数バッファ、返り値バッファに書き込まれ
た入力・出力のデータ形式を示す説明図である。

【図１５】ピンインコード−アルファベット変換テーブ
ル（アルファベット−ピンインコード変換テーブル）の
構成図である。

【図１６】住所録管理システムの、処理全体を示すフロ
ーチャートである。

【図１７】住所録管理システムの、検索処理を示すフロ
ーチャートである。

【図１８】アルファベット文字列をピンインコードに変
換する処理を示すフローチャートである。

【図１９】取り出したデータの漢字コードをピンインコ
ードに変換する処理を示すフローチャートである。

【図２０】取り出したデータをピンインコードに変換し
たものに、検索キーが含まれているかどうかを判定する
処理を示すフローチャートである。

【図２１】漢字コードをピンインコードに変換する処理
を示すフローチャートである。

【図２２】『氏名』の項に検索キーが含まれるかどうか
を判定する処理を示すフローチャートである。

【図２３】住所録管理システムの、データ検索時の画面
を示す説明図である。

【図２４】住所録管理システムの、検索結果表示処理を
示すフローチャートである。

【図２５】住所録管理システムの、追加入力処理を示す
フローチャートである。

【図２６】住所録管理システムの、データ入力時の画面
を示す説明図である。

【図２７】従来の住所録管理システムの、データ入力時
の画面を示す説明図である。

【図２８】本発明の他の実施例を示すもので、中国語情
報処理装置の構成を示すブロック図である。

【図２９】住所録管理システムの、データ入力時の画面
を示す説明図である。

【図３０】住所録管理システムの、検索処理を示すフロ
ーチャートである。

【図３１】データの漢字部分のピンインをアルファベッ
トで表記した文字列に変換する、漢字コード系列をアル
ファベットの文字列に変換するための作業領域のデータ
構造を示す説明図である。

【図３２】ピンインコード系列をアルファベット文字列
に変換する処理を示すフローチャートである。

【図３３】引数バッファ、返り値バッファに書き込まれ
た入力・出力のデータ形式を示す説明図である。

【図３４】本発明の他の実施例を示すもので、中国語情
報処理装置の構成を示すブロック図である。

【図３５】住所録管理システムの、検索結果表示処理を
示すフローチャートである。

【図３６】住所録管理システムの、検索結果表示処理を
示すフローチャートである。

【図３７】結果表示のグループ分けを示す画面の説明図
である。

【図３８】従来の結果表示のグループ分けを示す画面の
説明図である。

【図３９】作業領域に形成された分類表１を示す説明図
である。

【図４０】作業領域に形成された分類表２を示す説明図
である。

【図４１】分類表１を作成するための処理手順を示すフ
ローチャートである。

【図４２】分類表２を作成するための処理手順を示すフ
ローチャートである。

【図４３】本発明の他の実施例を示すもので、中国語情
報処理装置の構成を示すブロック図である。

【図４４】並べ替え処理を行う前と並べ替え処理を行っ
た後のデータ配列を示す説明図である。

【図４５】図４４に示す個々のデータの漢字表記、その
漢字コードのクラス、ピンイン表記を示す説明図であ
る。

【図４６】従来の並べ替え処理にて、並べ替えを行った
後のデータ配列を示す説明図である。

【図４７】本発明の他の実施例を示すもので、中国語情
報処理装置の構成を示すブロック図である。

【図４８】一つのピンインの検索キーで検索された２種
類の中国語文字列を示す説明図である。

【図４９】漢字コード系列をピンインコード系列に変換
するための作業領域のデータ構造を示す説明図である。

【図５０】本発明の他の実施例を示すもので、中国語情
報処理装置の構成を示すブロック図である。

【図５１】文字入力時の画面を示す説明図である。

【図５２】象声字の具体例を示す説明図である。

【符号の説明】

１漢字コード−ピンインコード変換表２漢字ピンイン変換手段３処理手段４データ並べ替え手段５主記憶手段６検索手段７一時記憶手段８曖昧文字列変換手段９入力手段１０一時記憶手段１１漢字系列−ピンイン系列変換手段１２ピンイン系列−漢字系列変換手段１３辞書１４変換候補選択手段１５ピンイン系列−アルファベット系列変換手段２１入力手段２２データ記憶装置（主記憶手段）２３漢字コード−ピンインコード変換テーブルメモ
リ２４中央処理装置（処理手段、検索手段、漢字−ピ
ンイン変換手段）２５作業用記憶装置（一時記憶手段）２７表示装置３０中央処理装置（処理手段・検索手段・漢字−ピ
ンイン変換手段）３３中央処理装置（処理手段）３５中央処理装置（処理手段・データ並べ替え手
段）３７中央処理装置（処理手段・検索手段）３８中央処理装置（処理手段・曖昧文字列変換手
段）５０漢字コード−ピンインコード変換テーブル（漢
字コード−ピンインコード変換表）５２アルファベット−ピンインコード変換テーブル

Claims

(57)【特許請求の範囲】

【請求項１】中国語の漢字コードとそれに該当するピ
ンインコードとが対応して配列された漢字コード−ピン
インコード変換表を有し、この変換表を用いて漢字コー
ドをピンインコードへと逐一変換する漢字−ピンイン変
換手段と、上記漢字−ピンイン変換手段によって得られたピンイン
コードに基づいて、情報処理を行う処理手段とを備え、上記処理手段が、曖昧文字列変換手段であり、この曖昧
文字列変換手段は、入力手段から入力された当て字を含
む文字列からなる当て字データを漢字コード系列で記憶
する一時記憶手段と、上記一時記憶手段に記憶された当て字データを、上記漢
字−ピンイン変換手段を用いて、該漢字コード系列が対
応し得る複数のピンインコードのピンインコード系列へ
と変換する漢字系列−ピンイン系列変換手段と、この漢字系列−ピンイン系列変換手段によって変換され
たピンインコード系列のデータを、単語或いは文字列の
単位でピンインコードを漢字コードに変換する辞書を参
照して漢字コード系列への変換を行なうピンイン系列−
漢字系列変換手段と、このピンイン系列−漢字系列変換手段によって得られた
複数の変換候補文字列から一つを選択する変換候補選択
手段とを備え、変換候補選択手段にて選択された変換候補文字列の漢字
コード系列を、上記当て字データに替えて用いるように
なっていることを特徴とする中国語情報処理装置。