JPH0227423A - 日本語文字データの並び換え方法 - Google Patents

日本語文字データの並び換え方法

Info

Publication number
JPH0227423A
JPH0227423A JP17714288A JP17714288A JPH0227423A JP H0227423 A JPH0227423 A JP H0227423A JP 17714288 A JP17714288 A JP 17714288A JP 17714288 A JP17714288 A JP 17714288A JP H0227423 A JPH0227423 A JP H0227423A
Authority
JP
Japan
Prior art keywords
code
character
japanese
word
character data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17714288A
Other languages
English (en)
Inventor
Tatsuko Hashimoto
橋本 龍子
Masakazu Nagase
永瀬 正和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP17714288A priority Critical patent/JPH0227423A/ja
Publication of JPH0227423A publication Critical patent/JPH0227423A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、コンピュータによって、平仮名と片仮名の混
在データよりなる日本語文字データを国語辞典における
と同様な五十音読み順に並び換えする日本語文字データ
の並び換え方法に関するものである。
(従来の技術) 従来、コンピュータを用いて平仮名と片仮名が混在の日
本語文字データを五十音読み順に並び換えする方式とし
ては、一般にはJ I 5XQ208で規定されている
文字コードを用いて語句の各文字をコード化して記憶し
た日本語文字データについて、コンピュータのソフトウ
ェア体系を構成しているソートユーティリティを使用し
、その各語句の上位の文字のコードを優先して、各語句
についてのコードの数値の順位に従って各語句のコード
を並び換える方式と、前記規定の文字コードに代えて五
十音読み順になるように数値換えした特別の文字コード
を使用し、従来からのソートユーティリティに変更を加
えて、同様に数値の順位に従って語句のコードを並び換
える方式とがある。
(発明が解決しようとする課題) しかしながら上記の前者の方式においては、語句の並び
順序が五十音読み順にならないので不自然であり、また
後者の方式においては、コンピュータシステムとして提
供されているソートユーティリティを変更することはソ
フトウェアの信頼性や移植性或は性能面において問題と
なる。
本発明の目的は、コンピュータシステムに提供されてい
るソートユーティリティに変更を加えずに、平仮名と片
仮名の混在データよりなる日本語文字データを五十音読
み順に並び換えする並び換え方法を提供することにある
(課題を解決するための手段) 本発明は前記問題点を解決するために、並び換えされる
語句の各文字について、平仮名と片仮名とを識別する一
方のビット列と、五十音の各文字或はその各派生音に固
有の他方のビット列との組よりなる規定のコードによっ
てコード化して記憶媒体に記憶したコンピュータによる
日本語文字データの並び換え方法において、並び換え順
位の上位側の数値をなす第1のビット列に各平仮名と片
仮名を各清音に直したときの読み単位に共通の五十音順
の文字のコードを割当て、下位側の数値をなす第2のビ
ット列に上位順に平仮名、片仮名、その清音或いは各派
生音相互の順位の数値をなし且つこれらを識別したコー
ドを割当てた変換用コードを予め記憶し、並び換えされ
る各語句について前記日本語文字データに対応の前記変
換用コードを検索し、前記変換用コードについてそれぞ
れ語句の文字の上位を優先させて語句の前記第1のビッ
ト列と語句の前記第2のビット列の各コードに分割し、
該各コードの組により語句のコードを作成し、前記語句
のコードをその数値の順位に従って並び換えする並び換
え方法とした。
(作 用) 本発明によれば、規定のコードを用いて適宜の並び順序
で記憶されている各語句の日本語文字データについて、
その各文字データに対応の変換用コードが順次検索され
て、その清音の読みによる五十音順の文字のコードが第
1のビット列に割当てられ、これら五十音順の文字につ
いて上位順に平仮名と片仮名とを識別するコードと、清
音或は各派生音を互いに識別するコードが第2のビット
列に割当てられ、各語句毎の、第1のビット列のコード
によるその文字列のコードと、第2のビット列のコード
による文字列のコードとの組によって語句のコードが作
成され、該語句のコードがその数値の順位に従って並び
換えされる。
(実施例) 第2図は本発明の一実施例を示す日本語文字データ並び
換え装置のブロック図である。
同図において、1は後記するJ I 5XO208のコ
ードを用いて各語句の日本語文字データを記憶している
入力用磁気テープである。2は変換テーブル記憶部で、
磁気テープ1から読出された日本語文字データを後記の
五十音コードによる日本語文字データに変換する各変換
用コードを記憶している。3はソート用ワークファイル
で、磁気テープ1から読出された各語句の日本語文字デ
ータ或はこれが変換された五十音コードによる日本語文
字データの数値の順位に従って各語句相互の順序の並び
換え等を行うためのソートユーティリティプログラムを
格納している。4は前記の変換された日本語文字データ
を前記の並び換えされた順に記憶する出力用磁気テープ
、5はこの日本語文字データ並び換え装置を統轄して制
御するコンピュータの中央処理装置であり、前記のJI
SXO208によるコードを五十音コードに変換するプ
ログラムも記憶している。
第3図はJ I 5X0208のコードにより磁気テー
プ1に記憶されている各語句の並び換え前の日本語文字
データ例を示す図である。
同図において、各文字の識別を示すコードはJI 5X
0208により、上位バイト(上位2桁の16進数)が
平仮名と片仮名とを識別するデータをなし、下位バイト
(下位2桁の16進数)が五十音の各文字或はその各派
生音の拗音と促音と濁音と半濁音或は長音に固有のデー
タをなしている。
その語句の配列は実際には適宜の順序になっているが、
同図においては説明の都合上、これらコード列が示す数
値の昇順に配列させている。同図はこのコードを用いて
ソート用ワークファイル3のソートプログラムにより語
句を並び換えた場合の配列を示したものであり、上位の
文字の上位バイトの数値が優先されて上位の文字の五十
音読み等が共通の語句毎に平仮名群と片仮名群とを生じ
ており、且つこれら各群内においても一般の国語辞典に
よる配列順序とは異なっていることを示している。
第4図は変換テーブル記憶部2に予め記憶されている平
仮名についての五十音コードによる変換用コードを示す
図であり、第5図は同様に記憶されている片仮名につい
ての五十音コードによる変換用コードを示す図である。
これら各図に示すように、各変換用コードの第1のビッ
ト列としての上位バイトには、その数値が平仮名と片仮
名を各清音に直したときの読み単位に共通の五十音順に
増大するコードを割当て、第2のビット列としての下位
バイトにはその数値が平仮名、片仮名、その拗音或は促
音、清音、長音の順に増大するコードを割当てている。
次に本発明による日本語文字データの並び換え動作を説
明する。
第1図は第2図の装置による日本語文字データ並び換え
の動作を示すフローチャート、第6図(A)、(B)、
(C)は第1図のフローチャー、トの各ステップの動作
によるコードの変換とその配列の並び換え過程を示す図
である。
中央処理装置5が磁気テープ1から読出した並び換え前
の日本語文字データ群が第3図に示すJISX020g
の各文字コードに示す語句番号1の文字列の最上位の文
字コードr2437Jを取出しくステップS L)、該
コードに対応の第4図或いは第5図に示す変換用コード
を検索する(S2)。
文字コードr2437Jは平仮名の「シ」の清音を表わ
しているものであるから、第4図の文字「シ」に対する
五十音コードの文字コード「0C01」が検索される。
そしてその上位ビット列のコード「OC」が出力バッフ
ァ(図示せず)の上位部にセットされ、下位ビット列の
コード「01」が下位部にセットされる(S3)。この
とき当該語句の全文字列が変換されていないときは(S
4)、次の文字コードr2428Jが取出されて、同様
にして文字コードr0401Jが検索されてセットされ
る(Sl 、  S2 、  S3)。このようにして
語句番号1の各文字コードについて出力バッファの上位
部にそれぞれrOcJ  r04J  r02Jがセッ
トされ、下位部にroll  rolJ  rolJが
セットされる(S5)。語句番号1の語句の文字列が全
て変換されると(S 4)、語句番号が更新される(S
5)。全語句の変換が終了していないならば(S O)
、これが終了するまで各ステップSl〜SBの動作が繰
返されて、全語句が第6図(A)の五十音コードによる
日本語データに変換される。
次に、ソート用ワークファイル3のソートユーティリテ
ィプログラムにより、第6図(A)の各語句の五十音コ
ードが示す各日本語データを相互に比較して昇順に並び
換えられる(S7)。この動作は、各語句について、文
字列の上位を優先して先ず上位ビット列における第1の
文字のデータの数値を比較し、これが同図の例のように
同一のデータであるときは第2、第3の文字のデータの
数値を比較して、語句番号をその昇順に並び換え、上位
ビット列のデータが同一の語句については更に下位ビッ
ト列のデータの数値を同様に順次比較して語句番号をそ
の昇順に並び換える。その結果、第6図(B)に示す配
列が得られる。
次に、第6図(B)のように並び換えされた五十音コー
ドを、その配列のままでJ I 5XO208の文字コ
ードに戻して磁気テープ4に記憶するために、第6図(
B)に示す語句番号1の文字列の最上位の文字コードr
Oc11Jを取出しくステップSa)、該コードに対応
のJ I 5X0208の文字コードを検索する(S9
)。その結果、文字コードr2537Jが検索され、出
力バッファにセットされる( S 10)。このとき当
該語句の全文字列が変換されていないときは(Sll)
、次の文字コードr0410Jが取出されて、同様にし
て文字コードr2527Jが検索されてセットされる(
S8 、  S9 、 5IO)。このようにして語句
番号1の語句の文字列が全て変換されると(S 11)
、語句番号が更新される( S 12)。全語句の変換
が終了していないならば(S13)、これが終了するま
で各ステップ88〜813の動作が繰返されて、全語句
が第6図(C)のJ lX50208の文字コードによ
る日本語データに変換される。そして該日本語データは
その配列をもって磁気テープ4に記憶される。
(発明の効果) 以上説明したように本発明によれば、従来の日本語文字
データを変換用コードを用いて変換して語句のコードを
作成し、その語句のコードが、その文字列の上位を優先
した上で各文字については清とに直したときの読の五十
音順を最優先し、次に平仮名を、そして片仮名を優先し
、次にこれらが清音或は各派生音であるかを識別してそ
の順位を示すように、これらが順位の数値をなしていて
、該語句のコードをその数値の大きさの順位によって並
び換えるようにしたので、従来のソートユーティリティ
プログラムを用いて、日本語文字データを一般の国語辞
典にならった五十音読み順の配列に並び換えすることが
可能になる。
【図面の簡単な説明】
第1図は本発明の日本語文字データ並び換えの動作を示
すフローチャート、第2図は本発明の日本語文字データ
並び換え装置のブロック図、第3図は並び換え前の日本
語文字データ例を示す図、第4図は平仮名の変換用コー
ドを示す図、第5図は片仮名の変換用コードを示す図、
第6図(A)。 (B)、(C)はその各ステップの動作によるコードの
変換とその配列の並び換え過程を示す図である。 1・・・入力用磁気テープ、2・・・変換テーブル記憶
部、3・・・ソート用ワークファイル、4・・・出力用
磁気テープ、5・・−中央処理装置。 特許出願人    沖電気工業株式会社代理人 弁理士
  吉 1)精 孝 本町す孔こよる日本語文字データ並び換え装置のプロ、
り口笛2図 第3面

Claims (1)

  1. 【特許請求の範囲】 並び換えされる語句の各文字について、平仮名と片仮名
    とを識別する一方のビット列と、五十音の各文字或はそ
    の各派生音に固有の他方のビット列との組よりなる規定
    のコードによってコード化して記憶媒体に記憶したコン
    ピュータによる日本語文字データの並び換え方法におい
    て、 並び換え順位の上位側の数値をなす第1のビット列に各
    平仮名と片仮名を各清音に直したときの読み単位に共通
    の五十音順の文字のコードを割当て、下位側の数値をな
    す第2のビット列に上位順に平仮名、片仮名、その清音
    或いは各派生音相互の順位の数値をなし且つこれらを識
    別したコードを割当てた変換用コードを予め記憶し、 並び換えされる各語句について前記日本語文字データに
    対応の前記変換用コードを検索し、前記変換用コードに
    ついてそれぞれ語句の文字の上位を優先させて語句の前
    記第1のビット列と語句の前記第2のビット列の各コー
    ドに分割し、該各コードの組により語句のコードを作成
    し、前記語句のコードをその数値の順位に従って並び換
    えする ことを特徴とする日本語文字データの並び換え方法。
JP17714288A 1988-07-18 1988-07-18 日本語文字データの並び換え方法 Pending JPH0227423A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17714288A JPH0227423A (ja) 1988-07-18 1988-07-18 日本語文字データの並び換え方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17714288A JPH0227423A (ja) 1988-07-18 1988-07-18 日本語文字データの並び換え方法

Publications (1)

Publication Number Publication Date
JPH0227423A true JPH0227423A (ja) 1990-01-30

Family

ID=16025919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17714288A Pending JPH0227423A (ja) 1988-07-18 1988-07-18 日本語文字データの並び換え方法

Country Status (1)

Country Link
JP (1) JPH0227423A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5077235A (en) * 1989-01-24 1991-12-31 Ricoh Comany, Ltd. Method of manufacturing a semiconductor integrated circuit device having SOI structure
JPH04115325A (ja) * 1990-09-06 1992-04-16 Hitachi Inf Syst Ltd 文字コードのソート方式
JPH08297658A (ja) * 1995-04-26 1996-11-12 Nec Software Ltd 日本語文字並び換え方法とその装置
JPH08328825A (ja) * 1995-05-30 1996-12-13 Nec Corp 日本語順列編成方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5077235A (en) * 1989-01-24 1991-12-31 Ricoh Comany, Ltd. Method of manufacturing a semiconductor integrated circuit device having SOI structure
JPH04115325A (ja) * 1990-09-06 1992-04-16 Hitachi Inf Syst Ltd 文字コードのソート方式
JPH08297658A (ja) * 1995-04-26 1996-11-12 Nec Software Ltd 日本語文字並び換え方法とその装置
JPH08328825A (ja) * 1995-05-30 1996-12-13 Nec Corp 日本語順列編成方法

Similar Documents

Publication Publication Date Title
US5047932A (en) Method for coding the input of Chinese characters from a keyboard according to the first phonetic symbols and tones thereof
US5297038A (en) Electronic dictionary and method of codifying words therefor
KR20000039018A (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JPH0227423A (ja) 日本語文字データの並び換え方法
JPH0140372B2 (ja)
JPS6057421A (ja) 文書作成装置
JPS6162163A (ja) 日本語ワ−ドプロセツサ装置
JPS62147565A (ja) 日本語文章入力装置
JPS61267824A (ja) 日本語デ−タ整列化処理方式
JPS61285573A (ja) 仮名漢字変換装置
JPH05216887A (ja) 中国語の発音表記/漢字変換装置および方法
JPS61265633A (ja) 発音記号による辞書検索処理方式
JP2976682B2 (ja) 言語再生装置
JPS62214468A (ja) かな漢字変換装置
JPH0583957B2 (ja)
JPH03282961A (ja) 相互変換辞書方式
JPH0554145B2 (ja)
JPH01304574A (ja) 目次索引作成装置
JPH0612550B2 (ja) デ−タ検索方式
JPS59167737A (ja) かな漢字変換装置
JPH01255065A (ja) 中国語文章作成装置
JPH01243171A (ja) データ処理装置
JPH10154141A (ja) かな漢字変換装置
JPH01106162A (ja) 文書編集装置
JPS61128367A (ja) カナ漢字変換装置