JPH0713810B2 - 分類計数装置 - Google Patents

分類計数装置

Info

Publication number
JPH0713810B2
JPH0713810B2 JP1025855A JP2585589A JPH0713810B2 JP H0713810 B2 JPH0713810 B2 JP H0713810B2 JP 1025855 A JP1025855 A JP 1025855A JP 2585589 A JP2585589 A JP 2585589A JP H0713810 B2 JPH0713810 B2 JP H0713810B2
Authority
JP
Japan
Prior art keywords
data
classification
boundary
boundary value
counting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1025855A
Other languages
English (en)
Other versions
JPH02206828A (ja
Inventor
治夫 速水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1025855A priority Critical patent/JPH0713810B2/ja
Publication of JPH02206828A publication Critical patent/JPH02206828A/ja
Publication of JPH0713810B2 publication Critical patent/JPH0713810B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、多数のデータを任意間隔の値の範囲に分類
し、各分類に含まれるデータ数を計数する分類計数装置
に関する。
(従来の技術) この種の分類計数装置は、例えばデータベース等のデー
タ群を操作するデータ処理の分野に使用される。第3図
はこの種の分類計数装置が使用される他の装置との接続
構成を示す図である。同図に示す分類計数装置1は、本
体装置6から指令された分類条件に基づいて、例えばデ
ータベース等のデータ群を格納している2次記憶装置5
からのデータを分類計数し、この分類集計した結果を本
体装置6に供給するようになっている。
第4図はこのような分類計数処理を行う従来の分類計数
装置の構成を示すブロック図である。同図に示す分類計
数装置は、上述したような2次記憶装置5から読み出し
たデータ群を入力バッファ11に格納し、この入力バッフ
ァ11に格納されたデータ群の中からキー抽出回路12によ
って分類の基準となるフィールドを抽出し、整列回路13
に入力可能なデータ属性に変換している。整列回路13は
このように変換されたデータ群を整列して、1データず
つラッチ14および比較回路15に供給する。比較回路15は
整列回路13から1つずつラッチ14に保持されたデータ、
すなわち1つ前のデータと整列回路13から出力される次
のデータとを比較し、この比較の結果、キーが同じもの
を計数回路16によって計数し、この分類計数した結果を
出力バッファ17に一時的に格納している。
更に具体的に、第5図(a)に示すデータ例を使用して
説明する。この例は、氏名、年齢、性別、年収等からな
る職員データベースであり、このデータベースを年齢と
年収の組合せで分類し、各分類のデータ数を求めるもの
である。
第4図の分類計数装置は、このようなデータベースを前
記2次記憶装置から読み出し、入力バッファ11に格納す
る。キー抽出回路12は、入力バッファ11に格納されたデ
ータから分類のキーとなるフィールドである年齢および
収入を抽出し、整列回路13の入力となる属性(符号無し
の2進数)で表現した年齢′および年収′に変換し、元
のデータとのリンク情報等の制御情報を付加して第5図
(b)に示す形式にする。ここで、データ属性を変換す
るのは、整列回路13の構成を容易にするために当業者に
おいてよく知られている技術である(すなわち、整列対
象データを単なるビット列として整列した結果が元のデ
ータの定義に基づく整列結果と等価になる)。
キー抽出回路12において、第5図(b)に示す形式に変
換されたデータは整列回路13に入力され、昇順に整列化
される。整列回路13において、すべてのデータの整列処
理が終了すると、整列化されたデータは整列回路13から
順次出力され、1データずつラッチ14に一時的に保持さ
れるとともに、比較回路15において比較される。すなわ
ち、ラッチ14に一時的に保持された1データは、比較回
路15において次の1データと比較され、同一であれば、
次のデータを破棄し、この破棄したデータ数を計数回路
16で計数する。また、同一でない場合には、ラッチ14に
保持されているデータに対して計数値、すなわち破棄し
たデータ数に1を加算した値を付加して出力バッファ17
に格納する。
すなわち、整列回路13において整列化されたデータにお
いてはキーが同一なものは連続しているため、このよう
な操作でキーの重複数が得られるのである。整列回路13
からの出力が終了し、ラッチ14に保持されている最後の
データを出力バッファ17に格納すると、全データの分類
と各分類に属していたデータ数、すなわち各キーの重複
数が求められるのである。
このような分類処理において、分類の対象となるフィー
ルドからキーを抽出する場合に、フィールドの全桁また
は2進数表示の場合には全ビットを対象とすれば、フィ
ールドの値そのものによる分類となり、またフィールド
の値の一定の範囲を分類したい場合には、フィールドの
下位桁を切り捨てて、上位桁のみでキーを作成すれば、
切り捨てた桁に応じて一定の順の範囲による分類が可能
となる。例えば、10進数で2桁切り捨てれば100毎の幅
による分類が可能となる。
(発明が解決しようとする課題) 上述した従来の分類計数装置では、一定の値の間隔での
分類計数、すなわち等間隔での分類計数しか行うことが
できないという問題があるとともに、また任意の値の間
隔での分類集計、例えば対象データの属性が10進数の場
合には50毎の間隔での分類計数を行うことができないと
いう問題がある。
本発明は、上記に鑑みてなされたもので、その目的とす
るところは、多数のデータを任意の非等間隔の値の範囲
で分類し、各分類に属するデータ数を計数する分類計数
装置を提供することにある。
[発明の構成] (課題を解決するための手段) 上記目的を達成するため、本発明の分類計数装置は、多
数のデータを任意間隔の値の範囲に分類し、各分類に含
まれるデータ数を計数する分類計数装置であって、前記
データを任意間隔の値の範囲で分類するための境界値を
設定する境界値設定手段と、前記データの各々に対して
第1の表示子を付加し、前記境界値に対して第2の表示
子を付加する表示子付加手段と、該表示子付加手段で第
1および第2の表示子をそれぞれ付加された前記データ
および境界値を同一の列に整列する整列手段と、該整列
手段で整列された前記データおよび境界値からなるデー
タ列において前記境界値を表すデータで区切られた分類
対象データの数を計数する計数手段とを有することを要
旨とする。
(作用) 本発明の分類計数装置では、データの各々および境界値
にそれぞれ第1および第2の表示子を付加し、これらを
同一のデータ列に整列し、このデータ列において境界値
を表すデータで区切られた分類対象データの数を計数し
ている。
(実施例) 以下、図面を用いて本発明の実施例を説明する。
第1図は本発明の一実施例に係わる分類計数装置の構成
を示すブロック図である。同図に示す分類計数装置は、
前述した第4図の分類計数装置においてキー抽出回路12
および比較回路15の代わりにそれぞれキー抽出・境界表
示付加回路22および境界検出回路23を設けるとともに、
境界値バッファ21を追加した点が異なるのみであり、そ
の他の同じ構成要素には同じ符号が付されている。な
お、境界値バッファ21はデータを任意間隔の値の範囲で
分類するための境界値を格納するバッファであり、キー
抽出・境界表示子付加回路22は入力バッファ11に格納さ
れたデータ群の中から分類のキーとなるフィールドを抽
出するとともに、抽出したデータに対して原データであ
ることを示す表示子「0」を付加し、また境界値バッフ
ァ21からの境界値データに対しては境界データであるこ
とを示す表示子「1」を付加する回路であり、また境界
検出回路23は整列回路13で整列されたデータ列の中から
前記表示子「1」を付加された境界値データを検出する
回路である。なお、第1図に示す分類計数装置も例えば
第3図のように2次記憶装置5および本体装置6に接続
され、本体装置6から指令された分類条件に基づいて2
次記憶装置5に記憶されているデータを抽出分類し、こ
の分類したデータを計数し、この分類計数した結果を本
体装置6に供給するようになっている。
以下、第2図に示すデータ例を参照して作用を説明す
る。このデータ例は、第5図(a)に示したように、氏
名、年齢、性別、年収等からなる職員データベースであ
り、このデータベースを年齢および年収の組合せで分類
し、各分類データの数を求めるものである。
本実施例では、任意の値の間隔で分類するために、分類
しようとする分類の境界値をすべて指定し、この分類の
境界値を前記境界値バッファ21に格納する。分類の境界
値は第2図(a)の形式により分類の基準となるフィー
ルドと同一属性の境界値の組、すなわち年齢と年収が指
定される。この境界値として、例えば4つの境界値、す
なわち境界値1〜4を指定した場合、対象とするデータ
群は以下のように分類され、各分類のデータ数が計数さ
れることになる。
(1)キーの値が境界値1以下のもの、 (2)キーの値が境界値1を越え、境界値2以下のも
の、 (3)キーの値が境界値2を越え、境界値3以下のも
の、 (4)キーの値が境界値3を越え、境界値4以下のも
の、 (5)キーの値が境界値4を越えるもの。
本実施例の分類計数装置は、前記境界値1〜4が指定さ
れ、これらの境界値を境界値バッファ21に格納すると、
分類対象データベースを前記2次記憶装置から読み出し
て入力バッファ11に格納する。キー抽出・境界表示子付
加回路22は入力バッファ11に格納されたデータ群から分
類のキーとなるフィールドである年齢と年収を抽出し、
整列回路13の入力となる属性(符号無しの2進数)で表
示した年齢′と年収′に変換し、これらの各々の後ろに
原データであることを表示する境界表示子「0」を付加
するとともに、更に原データとのリンク情報等の制御情
報を付加して、第2図(b)に示す形式に変換する。
また、キー抽出・境界表示子付加回路22は、境界値バッ
ファ21に格納されている第2図(a)に示す分類境界値
の年齢および年収の各々の後ろに境界データであること
を表示する境界表示子「1」を付加して、第2図(b)
に示す形式に変換する。そして、キー抽出・境界表示子
付加回路22は、第2図(b)に示す形式に変換されたデ
ータおよび境界値データを整列回路13に供給する。
整列回路13は、第2図(b)に示す形式に変換されたデ
ータおよび境界値データを昇順に整列化し、この整列化
したデータを順次1データずつ出力する。整列回路13か
ら出力されたデータは1データずつラッチ14に一時保持
され、その境界表示子が境界検出回路23によって判定さ
れる。境界表示子が「0」であれば、原データであるの
で、境界検出回路23はそのデータを破棄し、計数回路16
に対して計数信号を供給し、カウントアップさせる。す
なわち、境界表示子「0」の原データを検出する毎に計
数回路16はカウントアップし、境界表示子「0」のデー
タを計数するのである。また、境界表示子が「1」てあ
る場合には、境界値データであるので、計数回路16で計
数せずに、この境界値データにこれまで計数回路16で計
数した計数値を付加し、第2図(c)に示す計数のデー
タとして出力バッファ17に格納する。なお、各フィール
ド対応に原データに対しては境界表示子「0」かが付加
され、境界値データに対しては境界表示子「1」が付加
され、境界値データはキー値が同一のデータの中で最大
値となっているので、境界値データは各分類のデータの
中で整列回路13から最後に出力される。
このような処理を分類境界値1から4まで繰り返し行
い、分類境界値4までの計数が終了した後、分類境界値
4を越えるデータは最後のデータまでのデータ数を計数
し、最後のデータに計数値を付加して出力バッファ17に
格納する。
このような処理を行うことにより、上述した(1)〜
(5)に示した分類に対するデータ数の計数数が第2図
(c)に示す形式で出力バッファ17から得られるのであ
る。ここで、(1)〜(4)の分類に対する年齢および
年収にはそれぞれ境界値1〜4の値が入り、(5)の分
類に対する年齢および年収には原データの最大値が入
る。
上記実施例では、境界値データに対する境界表示子とし
て「1」を付加して、分類境界値を各範囲のデータ値の
最大として分類する例について説明したが、境界値を各
範囲のデータ値の最小値として分類する場合には、境界
表示子の値を上述と反対に原データに対しては境界表示
子「1」を付加し、境界値データに対しては境界表示子
「0」を付加すればよい。また、対象フィールドの数、
境界値の数はいずれも本実施例に限定されるものでな
い。更に、本実施例における整列回路の構成は本質的な
ものでなく、どのような整列回路の周辺に本発明の構成
要素を組み合わせても有効である。
[発明の効果] 以上説明したように、本発明によれば、データの各々お
よび境界値にそれぞれ第1および第2の表示子を付加
し、これらを同一のデータ列に整列し、このデータ列に
おいて境界値を表すデータで区切られた分類対象データ
の数を計数しているので、境界値を任意の非等間隔な値
に設定することができ、これにより任意の非等間隔な値
の範囲にデータを分類し、計数することができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる分類計数装置の構成
を示すブロック図、第2図は第1図の分類計数装置を説
明するために使用されるデータ例を示す図、第3図は分
類計数装置と他の装置との接続例を示すブロック図、第
4図は従来の分類計数装置の構成を示すブロック図、第
5図は第4図に示す従来の分類計数装置を説明するため
のデータ例を示す図である。 11……入力バッファ 13……整列回路 14……ラッチ 16……計数回路 21……境界値バッファ 22……キー抽出・境界表示子付加回路 23……境界検出回路

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】多数のデータを任意間隔の値の範囲に分類
    し、各分類に含まれるデータ数を計数する分類計数装置
    であって、前記データを任意間隔の値の範囲で分類する
    ための境界値を設定する境界値設定手段と、前記データ
    の各々に対して第1の表示子を付加し、前記境界値に対
    して第2の表示子を付加する表示子付加手段と、該表示
    子付加手段で第1および第2の表示子をそれぞれ付加さ
    れた前記データおよび境界値を同一の列に整列する整列
    手段と、該整列手段で整列された前記データおよび境界
    値からなるデータ列において前記境界値を表すデータで
    区切られた分類対象データの数を計数する計数手段とを
    有することを特徴とする分類計数装置。
JP1025855A 1989-02-06 1989-02-06 分類計数装置 Expired - Fee Related JPH0713810B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1025855A JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1025855A JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Publications (2)

Publication Number Publication Date
JPH02206828A JPH02206828A (ja) 1990-08-16
JPH0713810B2 true JPH0713810B2 (ja) 1995-02-15

Family

ID=12177439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1025855A Expired - Fee Related JPH0713810B2 (ja) 1989-02-06 1989-02-06 分類計数装置

Country Status (1)

Country Link
JP (1) JPH0713810B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184214A (zh) * 2011-05-04 2011-09-14 东南大学 一种数据分组快速查找定位法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184214A (zh) * 2011-05-04 2011-09-14 东南大学 一种数据分组快速查找定位法

Also Published As

Publication number Publication date
JPH02206828A (ja) 1990-08-16

Similar Documents

Publication Publication Date Title
JP3772704B2 (ja) データソート方法、データソート装置およびデータソートプログラム
JP2000163442A (ja) 記号辞書作成方法及び記号辞書検索方法
US7324109B2 (en) Method for superimposing statistical information on tubular data
US20030093416A1 (en) Searching apparatus and searching method using pattern of which sequence is considered
EP0782731B1 (en) Method and device for extracting information from a database
JPH087669B2 (ja) 符号化方法、符号化装置、及び復号化装置
CN113680046A (zh) 网格类数据的存储方法、装置、电子设备及存储介质
JPH05225238A (ja) データベース検索システム
JPH0713810B2 (ja) 分類計数装置
JPH11238073A (ja) 属性圧縮装置および方法
US20040212618A1 (en) Method for superimposing statistical information on tabular data
CN113268614B (zh) 标签体系更新方法、装置、电子设备及可读存储介质
Bautista et al. A cluster-based approach to means separation
JPS59121436A (ja) デ−タ群のソ−ト方法
JPH03123973A (ja) 文書検索方法
JPH02158871A (ja) 文書分類装置
JP3044718B2 (ja) 情報処理装置
WO2017175912A1 (ko) 아이디어 창출 지원 방법 및 이를 위한 지원 장치
JPH0636066A (ja) 文字認識装置の確認修正処理方式
JPH0477947B2 (ja)
JPS61182132A (ja) 情報検索方式
JPH07244663A (ja) 文書情報要旨部分の抽出方法とその装置
JP2755175B2 (ja) データ統計情報時系列管理システムおよびデータ統計情報集計演算方法
CN117033616A (zh) 一种诉讼案例检索报告生成系统
CN115422377A (zh) 一种基于知识图谱的搜索系统

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees