JP2002091757A

JP2002091757A - ソート処理方法

Info

Publication number: JP2002091757A
Application number: JP2000318619A
Authority: JP
Inventors: Takashi Sawayama; 隆司澤山
Original assignee: Individual
Current assignee: Individual
Priority date: 2000-09-11
Filing date: 2000-09-11
Publication date: 2002-03-29

Abstract

(57)【要約】【課題】ソート処理時間を短縮する。【解決手段】ソート対象データのデータを、その範囲
ごとにいくつかのグループに入れ替えをし、次にそのグ
ループごとにソートを行うことにより、少ない処理時間
で全てのデータのソートを行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、特に膨大なデータ
を持つファイルのソート処理に適した、ソート処理方法
に関する。

【０００２】

【従来の技術】従来の直接選択ソート処理方法では、ソ
ート対象データのデータ数をｎとした場合、ソート処理
に要する処理回数は、およそｎ^２÷２で計算される。仮
にｎを１，０００とした場合の処理回数は、およそ５０
０，０００回である。

【０００３】

【発明が解決しようとする課題】従来の直接選択ソート
処理方法では、ソート対象データのデータ数が膨大にな
ると処理に時間がかかるという問題があった。本発明
は、かかる問題点に鑑みて創案されたもので、グループ
分けの数を増やせば増やすほど、ソート処理に要する処
理時間を大幅に短縮させることができる。

【０００４】

【課題を解決するための手段】本発明は、ソート対象デ
ータのデータを、その範囲ごとにいくつかのグループに
入れ替えをし、次にそのグループごとにソートを行うこ
とにより、少ない処理時間で全てのデータのソートを行
うことができる。

【０００５】

【発明の実施の形態】従来の直接選択ソート処理方法で
は、ソート対象データのデータ数をｎとした場合、ソー
ト処理に要する処理回数は、およそｎ^２÷２で計算され
る。これは、データ数ｎを一辺とした、直角二等辺三角
形の面積に相当する（図３）。

【０００６】しかし、ソート対象データの範囲を例えば
０〜４９９までとした時、それぞれのデータを、例えば
０〜９９，１００〜１９９，２００〜２９９，３００〜
３９９，４００〜４９９の範囲ごとにグループ分けをし
（図１）、次に、それぞれのグループごとにソートを行
えば（図２）、まとめてソートを行う従来のソート処理
方法よりも少ない処理回数で全てのデータのソートを行
うことができる（図４）。

【０００７】しかも本発明は、グループ分けの数を増や
せば増やすほど、ソート処理に要する処理時間を短縮さ
せることができる。グループ分けの数が５個の場合は約
５分の１に。１０個の場合は約１０分の１に。１００個
の場合は、約１００分の１に短縮される。

【０００８】しかし本発明の効果を十分に発揮させるに
は、各グループごとにデータをなるべく均等に配分する
必要がある。そのためには、データの範囲が明らかであ
り、かつ、データの範囲がなるべく均等に散らばってい
ることが望ましい。この条件に該当しないデータファイ
ルの場合は、グループ分けを行う前に、データの傾向を
調査する処理が必要となる。

【０００９】図５は、データの傾向を調査するための処
理手順を示したものである。まずソート対象データの中
から、（グループ分けの数−１）×３個のデータを無作
為に取り出し（図５）、次に、そのデータを昇順（ま
たは降順）に取り出していき、３個取り出すごとにその
平均値を求める（図５）。こうして求めた値を、グル
ープ分けを行う際の基準値とすることにより（図５
）、範囲が不明確なデータファイル、もしくはデータ
の範囲に偏りのあるデータファイルの場合においても、
およそ均等にグループ分けを行うことができる。なお、
データを３個取り出してその平均値を求めるのは、基準
値の精度を上げるためである。

【００１０】図７は、グループ分けを行うアルゴリズム
を示したフローチャートである。まず、各グループごと
のデータ数を配列Ｍａｘ（ｎ）に求め（ステップ１）、
次に、それを基にそれぞれのグループごとのデータ格納
位置の上限と下限を、配列Ｍａｘ（ｎ）とＭｉｎ（ｎ）
に求める（ステップ２）。この時点で、配列Ｍａｘ
（ｎ）とＭｉｎ（ｎ）の指す位置は、図６のようにな
る。

【００１１】次に、先頭のグループの一番後ろからデー
タを１つ取り出す。この時、そのグループに属するデー
タがない場合は、次のグループの一番後ろからデータを
取り出す。（ステップ３）

【００１２】ステップ３において取得したデータから、
そのデータの属すべきグループ番号を算出して然るべき
場所へ格納し、あふれたデータを、新たな取得データと
する（ステップ４）（図８）。そしてもし最初にデータ
を取り出した位置でデータの入れ替えを行った場合は、
次のグループの一番後ろからデータを取り出し、新たな
取得データとする（ステップ５）。この手順を繰り返す
ことにより、ソート対象データファイルの中だけでデー
タの入れ替えを行うことによりグループ分けが完了す
る。従って、メモリ消費量も少なくて済む。

【００１３】最後に、続くソート処理に備え、ステップ
４の過程で変動した配列Ｍｉｎ（ｎ）の値を元に戻す
（ステップ６）。なお、ソート処理によっては、この処
理はぜひとも必要ではない。

【００１４】

【発明の効果】以上説明してきたように本発明は、少な
いメモリ消費量で、膨大なデータのソートに要する処理
時間を大幅に短縮させることができる。

【図面の簡単な説明】

【図１】グループ分け終了時のデータの状態を示す
図。

【図２】ソート終了時のデータの状態を示す図。

【図３】従来の直接選択ソート処理に要する処理量を
示す図。

【図４】本発明のソート処理に要する処理量を示す
図。

【図５】ソート対象データファイルのデータの傾向を
調査するための処理手順を示す図。

【図６】グループ分けの際に使用される、配列Ｍｉｎ
（ｎ）とＭａｘ（ｎ）の状態を示す図。

【図７】グループ分けを行うアルゴリズムを示す図。

【図８】グループ分けを行う処理手順を示す図。

Claims

【特許請求の範囲】

【請求項１】ソート対象データのデータを、その範囲
ごとにいくつかのグループに入れ替えをし、次にそのグ
ループごとにソートを行うことにより、少ない処理時間
で全てのデータのソートを行うことを特徴とするソート
処理方法。
【請求項２】グループ分けを行う際に、ソート対象デ
ータファイルの中だけでデータの入れ替えを行うことを
特徴とする請求項１記載のソート処理方法。
【請求項３】グループ分けを行う際に、グループ分け
をなるべく均等に行う必要があるため、データファイル
によっては、データの傾向を調査するための処理を必要
とする、請求項１記載のソート処理方法。