JP2001060164A - データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 - Google Patents

データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体

Info

Publication number
JP2001060164A
JP2001060164A JP2000052109A JP2000052109A JP2001060164A JP 2001060164 A JP2001060164 A JP 2001060164A JP 2000052109 A JP2000052109 A JP 2000052109A JP 2000052109 A JP2000052109 A JP 2000052109A JP 2001060164 A JP2001060164 A JP 2001060164A
Authority
JP
Japan
Prior art keywords
data
data processing
collation
processing
sorting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000052109A
Other languages
English (en)
Other versions
JP2001060164A5 (ja
Inventor
Taka Kobayashi
挙 小林
Yukio Nakano
幸生 中野
Nobuo Kawamura
信男 河村
Masashi Tsuchida
正士 土田
Shunichi Torii
俊一 鳥居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2000052109A priority Critical patent/JP2001060164A/ja
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to KR10-2000-0009714A priority patent/KR100372582B1/ko
Priority to SG200001142A priority patent/SG100613A1/en
Priority to CNB001038095A priority patent/CN1155906C/zh
Priority to EP00301740A priority patent/EP1128277A3/en
Publication of JP2001060164A publication Critical patent/JP2001060164A/ja
Priority to KR10-2002-0057508A priority patent/KR100372585B1/ko
Priority to KR10-2002-0057507A priority patent/KR100372584B1/ko
Priority to US10/438,815 priority patent/US20030217071A1/en
Publication of JP2001060164A5 publication Critical patent/JP2001060164A5/ja
Priority to US12/232,336 priority patent/US20090024384A1/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】種別の異なる複数のデータにアクセスするデー
タ処理システムにおいて、データの種別を区別した処理
を行えるようにすること。 【解決手段】アプリケーション102からデータ処理サ
ーバ104が管理するデータベース114へのアクセス
を管理するデータアクセス管理部103と、種別を区別
した処理の要求を含むアプリケーションからの要求を解
析する要求解析部110と、データ処理を行うデータ処
理サーバを種別によって選択する処理サーバ選択部11
1と、データ処理サーバにデータ処理を要求するデータ
処理要求部112と、データ処理サーバの処理結果を編
集する処理結果編集部113からなる。 【効果】データの種別を区別し、種別ごとに適切な処理
を行える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ処理技術に
関し、特に、データ処理システム内で取り扱う複数の種
別のデータにアクセスするのに好適なデータ処理技術に
関するものである。
【0002】
【従来の技術】コンピュータシステムでは、処理される
データは多様であり、様々な種別のデータを混在させて
扱うことが必要である。
【0003】例えば、多国籍企業において各国の拠点に
ある情報システムを統合する場合、各国拠点でそれぞれ
の地域の自然言語で記述された文書データを1つの中央
拠点のサーバで処理する必要がある。
【0004】あるいは、World Wide Webで世界中から情
報を集めて統合する場合、各国のWebサイトから提供さ
れる、各国の自然言語で記述されたHTML文書のファイル
を混在させる必要がある。
【0005】あるいは、言語を学習する場合、習得した
い言語の記述と、それを説明する母語あるいはすでに習
得している言語による記述を同時に扱う必要がある。
【0006】複数の言語を、統一した1つの形式に符号
化してデータ処理を可能にするには、Unicodeと呼ばれ
る符号化文字集合を用いる方法がある。Unicodeは、国
際標準化機構(ISO)とUnicodeコンソーシアムが共同で開
発した多言語文字セットであり、世界の主要な文字セッ
ト規格を1つの大きな文字セット規格に組み入れてい
る。ISOはこの文字セットの規格をISO 10646と名付けて
いる。
【0007】データベースシステムで複数の言語のデー
タを取り扱うときには、Unicodeを用いる方法がある。
その方法は例えば ORACLE 8 National Language Suppor
t, An Oracle Technical White Paper, 1997.6 に記載
されている。
【0008】この文献には、多国籍企業のローカルデー
タベースを1つのデータベースに統合する際に、Unicod
eをデータベースサーバの文字コードとすることが理想
的であると示されている。データベースサーバ内では、
文字列型のデータをUnicodeという1つのデータ形式で
統一して取り扱う。クライアントの文字コードとデータ
ベースサーバの文字コードが異なる場合は、データベー
スサーバのデータベース管理システムが自動的に文字コ
ードの変換を行う。
【0009】多言語文書データを扱うシステムとして
は、公開特許公報 特開平10-232869号に開示されている
多言語対応通信システムがある。このシステムでは、自
然言語で記述された文書データを文法的、意味的に解析
した結果として得られる中間形式文書データをサーバ装
置に記憶する。そして、クライアント装置から文書デー
タの検索の要求があると、指定された文字列を含む中間
形式文書データを記憶装置から検索し、検索した中間形
式文書データからクライアント装置が要求する自然言語
で記述された文書データを生成し、生成された文書デー
タをクライアント装置に送信する。サーバ装置には、シ
ステムで扱うすべての文書データを、1つの中間形式で
記憶する。
【0010】従来のデータベース言語SQLでは、ORDER B
Y句により処理結果をソートする様に問合せ要求行って
おり、その言語仕様は、日本工業規格JIS X 3005-1990
のデータベース言語SQLに規定されている。ソートのキ
ーには文字列を指定することが可能であり、その場合、
COLLATEによって照合順番を指定している。
【0011】同様の仕様が、“Understanding The New
SQL: a Complete Guide, Jim Melton, Morgan Kaufman
n, 1993”に記載されている。この文献には、次の様なS
QL文を用いる例が記載されている。
【0012】 SELECT movie_title, movie_type FROM movie_titles ORDER BY movie_title COLLATE FRENCH この例は、映画のタイトルをフランス語の慣例に従って
ソートする様に指定しており、ソートキーの文字列の文
字セットに適当な照合を明示的に指定するものである。
【0013】また、“ORACLE 8 National Language Sup
port, An Oracle Technical WhitePaper, 1997.6”に記
載されている例では、環境変数等で照合方法を指定して
いる。
【0014】図57は従来の環境変数等で指定した照合
方法の例を示す図である。図57では、照合方法の指定
と、SQL文による問合せ及びその処理結果の例を表し
ており、この例から判る様に、同じ文字の集合に対し
て、指定した言語によって異なるソートが行われること
を示している。
【0015】従来のデータベースを多言語対応として異
なる言語に対応させてソート処理を行った場合、ある文
字の集合を異なる言語の文字として異なる照合方法でソ
ート処理を行うと、照合方法によって異なる照合順番で
ソートが行われる為、前記の様に同じ文字の集合に対す
る処理であっても言語によってソート処理結果が異なる
ものになる。
【0016】また、特定の言語の照合を行う場合でも、
その言語によって様々な照合順番があり、言語を日本語
に絞った場合であっても、単純照合、読み・表記照合、
代表読み照合等の様に種々の照合方法でソート処理を行
うと、その処理結果はそれぞれ異なるものになる。
【0017】この様なそれぞれの言語の照合を行うもの
として、特開平8−508123号公報に言語認識照合
システムが開示されている。また、日本語文字列の照合
順番に関する規格が、日本工業規格JIS X 4061-1996に
制定されており、この規格では、単純照合、読み・表記
照合、代表読み照合の3つの照合順番が規定されてい
る。
【0018】前記の様に従来の照合処理方法において、
データベースを多言語対応としたり特定の言語に対して
複数の照合方法を用いるなどして、データベースの同一
の列値に対して異なる照合方法を適用する場合には、同
一の列値に対して照合方法毎に異なる照合キーを用いて
ソート処理を行うことになる為、それぞれの列値に対し
て照合方法に対応する照合キーを生成した後、生成した
照合キーのソートを行っている。
【0019】一方、データベースシステムにおいて、デ
ータベースに格納したデータをソートする方法として、
インデクスを利用する方法がある。その例として、特開
平8−255170号公報にソート付き検索処理装置が
開示されている。
【0020】オブジェクト・リレーショナルデータベー
ス管理システムにおいては、ユーザ定義型に対してイン
デクスを作成するときの、順序評価を行うユーザ関数を
定義することができる。その例は“Object-Relational
DBMSs, Michael Stonebraker, Morgan Kaufmann, 199
6”に記載されている。これによれば、ユーザ定義関数
による任意の順番に従ったB-treeインデクスを作成する
ことができる。
【0021】一般に文字列の照合を行うには、各照合段
階におけるさまざまな照合キーについて多次元的に解析
を行う必要がある。同様に多次元的なデータ解析により
検索を行うデータ処理方法の例として、特開平10−3
01937号公報に多次元ベクトル空間内の近傍検索方
法とそのプログラムの記録媒体が記載されている。この
方法では、色や形等の画像の特徴量を多次元データと
し、木構造のインデクスを用いることにより、ある画像
に類似した画像を高速に検索しており、各次元について
特徴量の検索範囲を限定して、類似した画像を検索する
ことにより、全ての画像との比較を行わずに範囲を限定
してデータ処理量を削減し、高速化を図っている。
【0022】表計算ソフトやデータベース管理システム
(DBMS)では、ユーザより登録要求されたデータの
蓄積管理を行い、取り出し要求によりデータを取り出し
てユーザに返却する処理を行っている。この様な処理で
は、何も条件を指定せずデータの取り出しを行うと、取
り出せるデータの順番は不定であり、決まった順序でデ
ータを取り出す為に、データの並び替え機能が提供され
ている。
【0023】前記の並び替え処理では、文字列の文字コ
ードの値による昇順または降順並び替えや、システムに
組み込まれている場合には日本語文字列に対する50音
順並び替え等が可能である。例えばデータベース言語SQ
Lでは、ORDER BY句により検索結果をソートする様に要
求できる。その言語仕様は日本工業規格 JIS X 3005-19
90 データベース言語SQLに規定されている。
【0024】表計算ソフトMicrosoft社Excel(登録商
標)では、データの並び替え機能を持っており、メニュ
ーより並び替えを選択することにより並び替えダイアロ
グボックスが表示され、並び替えを行うキーや昇順また
は降順指定ができる様になっている。更に、オプション
機能で並び替え順序の指定メニューより、ユーザ定義リ
ストパネルで登録した任意の文字列の並びを選択する
と、キーの値をその順番に並び替えることが可能である
(Excel5.0 for Windows 操作ハンドブック ISBN4-816
3-1671-X、データの並び替えに関する記述p478〜p481、
ユーザ定義に関する記述p214)。
【0025】一方、日本語文字列の照合順番に関する規
格が、日本工業規格 JIS X4061-1996 に制定されてい
る。この規格では、単純照合、読み・表記照合、代表読
み照合の3つの照合順番が規定されている。
【0026】単純照合は、与えられた1つの文字列をそ
のまま照合キーとして並び替えるもので、読み・表記照
合は並び替えを行う文字列とその読み列より、まず読み
列を照合キーによって並び替え、同順位になった場合、
文字列の方を照合キーとして並び替えを行うものであ
る。
【0027】代表読み照合には、基本代表読み照合と簡
易代表読み照合があり、基本代表読み照合は、それぞれ
代表読みが定めることが可能な様に分節された、読み列
及び表記列が与えられ、以下の(1)〜(4)手順によ
り得られた結果が照合結果となる。
【0028】(1)二つの表記列のそれぞれの先頭列
を、文字クラスの順番に従って評価する。
【0029】(2)(1)の段階で同順位になった場合
は、二つの表記列中の各文節に対して、文節がある限
り、次の(a)及び(b)の規則を順次適用する。一方
の表記列に照合すべき文節が無くなった場合は、無くな
った表記列の方を、前の順序とする。両方の表記列に照
合すべき文節が無くなった場合、この段階では同順位と
する。
【0030】(a)その文節の表記列及び読み列を用い
て代表読み辞書から代表読みを決め、その代表読みを照
合キーとして照合規則で評価する。
【0031】(b)(a)の段階で同順位になった場合
は、その文節の表記列を照合キーとして照合規則で評価
する。
【0032】(3)(2)の段階で同順位となった場
合、読み列を照合キーとして、照合規則で評価する。
【0033】(4)(3)の段階で同順位となった場合
は、表記列を照合キーとして、照合規則で評価する。
【0034】また、データベース管理システムにおい
て、格納したデータを並び替える方法としてインデクス
を利用する方法があり、その例として、特開平8-255170
号公報のソート付検索処理装置に開示されているものが
ある。インデクスを利用すると、並び替えを指定された
データ取り出し時に、データを並び替えることなく目的
の順番のデータが得られるので高速に処理を行うことが
できる。
【0035】
【発明が解決しようとする課題】前記の従来技術では、
複数の種別のデータをサーバで管理するときに、データ
の型やデータ形式を1つに統一しており、型やデータ形
式が同じデータに対しては、個々のデータをそれぞれの
種別を区別することについて配慮されておらず、データ
の種別ごとの特性に従った処理を行うことができないと
いう問題があった。
【0036】例えば、データベース管理システムでUnic
odeによって複数の言語(英語、日本語、ヘブライ語な
ど)の文字列データを1つの表に格納する場合、格納を
管理するサーバは、Unicodeでエンコードした文字デー
タとしてしか認識せず、どの言語であるかを区別しな
い。そのため、それぞれの言語に対応した全文検索処理
機能があっても、各言語のデータを選び出してそれぞれ
の言語特有の全文検索処理を適用するといったことがで
きない。例えば、全文検索において同義語や異表記の展
開などは言語によって異なり、また、日本語の場合は単
語の切り出しを行ったり、英語の場合は冠詞を除外する
など、それぞれ言語ごとの機能があるが、データの言語
を特定できなれけば、適切な機能を適用することができ
ない。
【0037】本発明の目的は、種別の異なる複数のデー
タにアクセスすることが可能なデータ処理システムにお
いて、データの種別ごとの特性に応じた処理を行うこと
を可能とすることにある。
【0038】
【課題を解決するための手段】本願において開示される
発明のうち代表的なものの概要を簡単に説明すれば、以
下のとおりである。
【0039】データ処理を行うデータ処理手段をデータ
の種別をもとに選択し、選択した前記データ処理手段で
データ処理を実行するデータ処理方法である。
【0040】データ種別をもとにデータ処理手段を選択
してデータ処理を実行することにより、複数の異なる種
別のデータにアクセスする場合に、データ種別ごとの特
有のデータ処理を行うことができる。
【0041】
【発明の実施の形態】以下、本発明の実施形態(実施
例)を図面を用いて詳細に説明する。
【0042】まず、図1を用いて本発明の原理を説明す
る。図1は、本発明の第1の実施形態のデータ処理シス
テムにおいて、複数の自然言語で記述された文書のデー
タを検索する処理の概要を示す概念図である。
【0043】このデータ処理システムは、複数の言語の
データを保持し、このシステムを利用するユーザからの
検索要求に応じて、複数の言語についてそれぞれ言語固
有の全文検索を行う。
【0044】図1に示すように、本実施形態のデータ処
理システム101は、アプリケーションプログラム(A
P)102と、データアクセス管理部103と、データ
処理サーバ104−1、104−2、…、104−n
と、それらを接続し互いに通信を行う経路となるネット
ワーク105からなる。
【0045】AP102は、データ処理システム101を
利用するユーザ106からの要求を表わすデータ処理要
求107をデータアクセス管理部103に送信し、その
要求に見合う処理結果108を受け取るプログラムであ
る。
【0046】ユーザ106は、複数の言語を表示、編集
するプログラム(図示していない)を用いて、AP102
で受け取ったデータを取り扱うことができるものとす
る。
【0047】データアクセス管理部103は、データ処
理システム101に保持しているデータに対するAP10
2からのアクセスを管理する。
【0048】データアクセス管理部103は、AP102
からのデータ処理要求107を受け付け、要求を解析
し、要求に見合った処理を行うのに適当なデータ処理サ
ーバ104−1、104−2、…、104−nへデータ
処理を要求し、データ処理サーバでの処理結果をAP10
2に返却する。
【0049】データアクセス管理部103は、実行制御
部109、要求解析部110、処理サーバ選択部11
1、データ処理要求部112、処理結果編集部113か
らなる。
【0050】実行制御部109は、データアクセス管理
部内で行う処理の実行制御を行う。データアクセス管理
部103で行う一連の処理の部分処理を、要求解析部1
10、処理サーバ選択部111、データ処理要求部11
2、処理結果編集部113で処理するよう制御する。
【0051】要求解析部110は、AP102からのデー
タ処理要求107を解析する。
【0052】処理サーバ選択部111は、AP102から
のデータ処理要求107に見合うデータ処理を行うデー
タ処理サーバ104−1、104−2、…、104−n
を選択する。
【0053】データ処理要求部112は、AP102から
のデータ処理要求107に見合うデータ処理を行うよう
データ処理サーバ104−1、104−2、…、104
−nに要求する。
【0054】処理結果編集部113は、データ処理サー
バ104−1、104−2、…、104−nの処理結果
を、AP102の要求する処理結果108の形式となるよ
うに編集する。
【0055】データ処理サーバ104−1、104−
2、…、104−nは、それぞれ、データベース114
−1、114−2、…、114−nに対するデータ11
5−1、115−2、…、115−nの登録および検索
を行う。一般的なデータベース管理システムで行われる
データ処理機能を提供するサーバである。
【0056】データアクセス管理部103がAP102か
らのデータアクセスを管理することに対し、データ処理
サーバ104−1、104−2、…、104−nは、AP
102のデータ処理要求に見合う実際のデータ処理を行
う。
【0057】データ処理サーバ104−1、104−
2、…、104−nは、それぞれ、ある言語に対応した
全文検索処理部116−1、116−2、…、116−
nを持つ。116−1は、英語の全文検索機能を提供す
る。116−2は、ギリシア語の全文検索機能を提供す
る。116−nは、ヘブライ語の全文検索機能を提供す
る。全文検索処理部116−1、116−2、…、11
6−nは、それぞれが各言語ごとの一般的な全文検索機
能を提供するプログラムモジュールで良い。
【0058】次に、データ処理システム101における
データ検索処理の概要を説明する。
【0059】まず、ユーザ106がAP102にデータ検
索要求を入力する。「聖書に関連する文献の中から、
『降誕』という語を含む文献を探せ」という要求とす
る。
【0060】この検索要求を、データベース言語SQL文
で以下のように記述する。
【0061】 SELECT * FROM 聖書 WHERE contents.contains('降誕') … 117 なお、この検索要求で、データ種別に従う扱い方、特に
言語の種別に従う扱い方に関して、以下のようにデータ
処理することを要求する。
【0062】検索対象とする言語種別は、英語とギリシ
ア語とする。つまり、原文が英語かギリシア語で記述さ
れた文献のみを検索対象とする。
【0063】検索文は、データとして扱う部分(SELECT
などの制御に用いられる部分や、表の名称などデータベ
ースのスキーマを構成する部分ではないもの)を、それ
ぞれの言語に翻訳する。つまり、「降誕」という文字列
の表記をそのまま検索処理に適用するのではなく、それ
ぞれの言語に翻訳した、「降誕」を意味することば(例
えば、英語ならば"Nativity"など)に置き換えて検索を
する。
【0064】なお、この検索要求117自体を記述する
言語の種別については、一般的なデータベースシステム
でデータベースサーバがアプリケーションプログラムか
らの要求の言語種別を認識するのと同様に、データアク
セス管理部103が認識するものとする。
【0065】検索結果108のデータは、データ処理シ
ステムに登録されているデータの原文、原語どおりとす
る。
【0066】これらを、それぞれSQLでの実行環境変数
(ISO Final Draft International Standard (FDIS) Da
tabase Language SQL -- Part 2: Foundation (SQL/Fou
ndation) <<Part 2>> ISO/IEC FDIS 9075-2:1999 (E),
March 1999 において sessioncharacteristics に相当
するようなもの)で以下のように指定する。
【0067】 SET TARGET_LANG English, Greek … 118 SET QUERY_LANG_TRANSLATION YES … 119 SET RESULT_LANG ORIGINAL … 120 AP102は、上記のユーザの検索要求に応じて、データ
アクセス管理部103にデータ処理要求を行う。
【0068】データアクセス管理部103では、実行制
御部109による制御のもとで、以下の処理を行う。
【0069】要求解析部110で、データ処理要求10
7の検索要求文117を解析する。一般的なデータベー
ス管理システムによるSQLの解析で良い。解析結果には
以下が含まれる。
【0070】データ検索要求であること、検索対象領域
が「聖書」であること、検索条件は「『降誕』を含む」
ということ。
【0071】また、データの種別に従う扱い関しては、
以下の3つを得る。
【0072】(1)検索対象とする言語種別は、英語と
ギリシア語とすること。なお、データの種別に従う処理
を指示する情報として、データ種別処理指示121を作
成する。データ種別処理指示121の対象種別として、
データ種別を識別する値として"English"、"Greek"を設
定する。
【0073】(2)検索文で、データとして扱う部分
は、それぞれの言語に翻訳すること。
【0074】(3)検索結果のデータは、登録されてい
るデータの原文、原語どおりとすること。
【0075】次に、処理サーバ選択部111が、検索要
求するデータ処理サーバ104−1、104−2、…、
104−nを選択する。要求解析部110で解析した結
果であるデータ種別処理指示121をもとに、データ種
別-データ処理サーバ対応表122を参照して、データ
処理サーバを選択する。
【0076】データ種別-データ処理サーバ対応表12
2は、データ種別の識別子とデータ処理サーバ情報の組
を保持する(詳細はのちに図7に示す)。
【0077】データ種別-データ処理サーバ対応表12
2を参照して、データ種別処理指示121の対象種別に
設定されたデータ種別の識別子"English"、"Greek"をキ
ーとして、それに対応するデータ処理サーバ情報123
−1、123−2を取得し、そのデータ処理サーバ情報
123−1、123−2が示すデータ処理サーバを選択
したとみなす。
【0078】データ処理サーバ情報123−1、123
−2は、それぞれ、データ処理サーバ104−1、10
4−2に処理要求する際に必要な、サーバ処理サーバを
識別するサーバ名、処理要求の仕方を示すプロトコルを
含む。
【0079】次に、データ処理要求部112は、データ
処理サーバ情報123−1、123−2をもとに、それ
ぞれのデータ処理サーバ104−1、104−2に検索
要求する。データ処理サーバ情報123−1、123−
2に含まれるプロトコルに従って、要求解析部110が
解析した内容をもとに検索要求文を作成して、データ処
理サーバ104−1、104−2に検索要求する。
【0080】データ処理サーバ104−1、104−2
は、検索要求に見合うデータ検索処理を行う。それぞれ
各言語ごとの一般的な全文検索処理機能を有するデータ
ベース管理システムで行われる検索処理で良い。
【0081】データ処理サーバ104−1、104−2
は、要求に従い「『降誕』を含む」という条件で全文検
索処理部により、各言語固有の全文検索を行う。
【0082】データ処理サーバ104−1、104−2
は、検索処理の処理結果をデータアクセス管理部103
に返す。
【0083】データアクセス管理部103は、処理結果
編集部113で、データ処理サーバ104−1、104
−2の処理結果を、AP102が要求する結果となるよう
編集する。
【0084】AP102からの結果に対する要求は「原文
のまま」である、という要求解析部110の解析結果に
従い、変換を加えずにそのままデータ処理サーバの処理
結果108をAP102に返却する。
【0085】AP102が英語のデータ124−1、ギリ
シア語のデータ124−2を処理結果108として受け
取り、検索処理が終了する。
【0086】この例に示したように、本実施例によれば
以下の効果がある。
【0087】データアクセス管理部103が、データ処
理を行うデータ処理サーバ104−1、104−2、
…、104−nをデータ種別に従って選択し、各データ
処理サーバでデータ処理を行うことから、データの種別
ごとの特有のデータ処理を行うことができる。
【0088】次に、本実施形態におけるハードウェアの
構成について説明する。
【0089】図2は、本実施形態(実施例)におけるハ
ードウェア構成を示す図である。
【0090】本実施形態として示すプログラムは、図2
に示すデータ処理装置の上で動作する。
【0091】データ処理装置201−1、201−2、
201−3は、それぞれ中央演算装置(CPU)202−
1、202−2、202−3、主記憶装置(メモリ)2
03−1、203−2、203−3、入出力(I/O)コン
トローラ204−1、204−2、204−3、通信コ
ントローラ205−1、205−2、205−3および
これらを接続するシステムバス206−1、206−
2、206−3などからなる。また、I/Oコントローラ
204−1、204−2、204−3には、キーボード
やマウスおよびディスプレイなどのようなデータ入出力
装置207−1、207−2、207−3、および、磁
気ディスク装置のようなデータ記憶装置208−1、2
08−2、208−3などが接続される。
【0092】データ処理装置201−1、201−2、
201−3は、通信コントローラ205−1、205−
2、205−3によりLAN(Local Area Network)などの
ネットワーク105に接続されており、ネットワーク1
05に接続されているほかのデータ処理装置と通信を行
なう。
【0093】図1およびこれ以降に示すデータ処理は、
CPU202−1、202−2、202−3がメモリ20
3−1、203−2、203−3に格納されたプログラ
ムを実行することにより実現される。AP102、データ
アクセス管理部103、データ処理サーバ104−1、
104−2、…、104−nの機能を実現するプログラ
ムは、メモリ205−1、205−2、205−3に格
納されてCPU202−1、202−2、202−3によ
り実行される。なお、AP102、データアクセス管理部
103、データ処理サーバ104、104−2、…、1
04−nはそれぞれソフトウェアの論理的な機能単位で
あり、それぞれが互いに物理的に異なるデータ処理装置
201−1、201−2、201−3上で動作しても良
いし、1つのデータ処理装置上でこれらの複数の機能の
プログラムが動作しても良い。また、データベース11
4−1、114−2、…、114−nなどは、データ記
憶装置208−1、208−2、208−3にデータを
格納することにより実現される。
【0094】以降、データ処理システム101における
データ処理の詳細について説明する。
【0095】図3は、データ処理システム101におけ
る基本的なデータ処理の流れを示すフローチャートであ
る。
【0096】まず、AP102がデータアクセス管理部1
03に対してデータ処理を要求する(301)。データ
処理要求107をデータアクセス管理部103に送信す
る。
【0097】次に、データアクセス管理部103の要求
解析部110がデータ処理要求107を解析する(30
2)。解析結果としてデータ処理解析結果308とデー
タ種別種別指示121を出力する。
【0098】次に、データアクセス管理部103の処理
サーバ選択部111がデータ処理サーバを選択する(3
03)。データ種別処理指示121の対象種別のデータ
種別識別子をキーとして、データ種別-データ処理サー
バ対応表122からデータ処理サーバ104を選択し、
選択したデータ処理サーバのデータ処理サーバ情報12
3を出力する。
【0099】次に、データアクセス管理部103のデー
タ処理要求部112がデータ処理サーバ104にデータ
処理を要求する(304)。データ処理解析結果308
をもとに、データ処理サーバ情報123にもとづいてデ
ータ処理サーバに見合ったデータ処理要求309を作成
し、データ処理サーバ104に送信する。
【0100】次に、データ処理サーバ104がデータ処
理要求309に応じたデータ処理を行い、その処理結果
310をデータアクセス管理部103に返す(30
5)。
【0101】次に、データアクセス管理部103の処理
結果編集部113がAP102の要求に応じて処理結果デ
ータを編集する(306)。データ処理サーバ104か
らのデータ処理結果310を編集し、その結果をデータ
処理結果311として出力する。
【0102】次に、データアクセス管理部103がデー
タ処理結果311をAP102に返し、処理を終了する
(307)。
【0103】この処理によれば、AP102からのデータ
処理要求を、データアクセス管理部103がデータの種
別によってそれぞれデータの種別に対応したデータ処理
サーバ104を選択しデータ処理要求を行うので、デー
タの種別に応じたデータ処理を行うことが可能になる。
【0104】次に、データ処理システム101における
データ検索処理を詳細に説明する。
【0105】データ検索処理の概要は図1で説明したと
おりで、基本的な処理の流れは図3に示した処理の流れ
に従う。以下に、データ検索処理における各部分処理に
ついて説明する。
【0106】図4は、データアクセス管理部103の要
求解析部110がデータ処理要求を解析する処理の詳細
を示すフローチャートである。図3のデータ処理フロー
におけるステップ302の詳細を示す。
【0107】まず、要求解析部110は、データ処理要
求文117を解析し、データ処理解析結果308を作成
する(401)。
【0108】図1のデータ処理要求文117の場合は、
検索対象の領域が「聖書」であることや、「降誕」を含
むという検索条件があることなどを解析し、その内容を
データ処理結果308に保持する。
【0109】次に、AP102からの処理対象のデータ種
別の指定を取得し、データ種別処理指示121を作成し
(402)、この要求解析処理を終了する。
【0110】処理対象のデータ種別の指定は、図1の1
18に示した実行環境変数TARGET_LANGのような形態で
ある。データ種別処理指示121の詳細については、の
ちの図5に説明する。
【0111】この処理によれば、AP102からのデータ
種別の指定から、処理対象とするデータの種別が解析さ
れる。これにより、処理対象とするデータの種別を区別
することができる。
【0112】図5は、データ検索要求のデータ処理要求
解析結果のデータ構造を示す図である。AP102からの
データ検索要求107を解析した結果を示す。
【0113】データ検索のデータ処理要求解析結果30
8は、処理種別501、対象領域502、検索条件50
3からなる。
【0114】処理種別501には、117のSQL文の解
析の結果、「検索」を示す値が設定される。
【0115】対象領域502には、117のSQL文のFRO
M句を解析した結果、「聖書」を示す値が設定される。
【0116】検索条件503には、117のSQL文のWHE
RE句を解析した結果、「『降誕』を含む」を示す値が設
定される。
【0117】また、データ種別処理指示121は、実行
環境変数の指定をもとに作成される。
【0118】実行環境変数の指定118を解析した結
果、 TARGET_LANG:English, Greek … 504 が取得され、対象種別として、"English"505、"Gree
k"506が設定される。
【0119】実行環境変数の指定119を解析した結
果、 QUERY_LANG_TRANSLATION: YES … 507 が取得され、問合せ変換として「変換する」508が設
定される。
【0120】実行環境変数の指定120を解析した結
果、 RESULT_LANG: ORIGINAL … 509 が取得され、結果返却種別として「原文」510が設定
される。
【0121】このような構成により、データ処理要求を
解析した内容を構造化して表現することができる。ま
た、処理対象のデータ種別、問合せ中のデータの種別に
対する扱い方、処理結果として返却するデータの種別を
示すなど、データの種別に従った処理の指示を表現する
ことができる。
【0122】図6は、データ登録処理でのデータ処理サ
ーバを選択する処理のフローチャートである。図3のデ
ータ処理でのステップ303の詳細を示す。
【0123】まず、処理サーバ選択部111は、データ
種別処理指示121の対象種別のデータ種別識別子50
5、506をキーとして、データ種別-データ処理サー
バ対応表122(図7で説明する)に登録されているレ
コードを検索する(601)。その結果として、データ
種別-データ処理サーバ対応レコード603を取得す
る。
【0124】次に、データ処理サーバ選択部111は、
データ種別-データ処理サーバ対応レコード603に含
まれるデータ処理サーバ情報123を出力し(60
2)、この処理を終了する。
【0125】この処理により、データ種別をもとに、そ
れぞれの種別に応じたデータ処理サーバを選択すること
ができる。
【0126】図7は、データ種別-データ処理サーバ対
応表122の構成を示す図である。
【0127】図6のデータ処理サーバを選択する処理6
01で参照する表である。
【0128】データ種別-データ処理サーバ対応表12
2は、データ種別識別子を保持する列701と、データ
処理サーバ情報を保持する列702からなる。
【0129】データ処理サーバ情報は、データ処理シス
テム101内で各データ処理サーバを一意に識別するサ
ーバ識別子と、データ処理サーバへのデータ処理要求の
規約を示すプロトコル情報などからなる。
【0130】703は、データ種別"English"とデータ
処理サーバの対応を示すレコードである。データ処理サ
ーバ情報には、英語に対応したデータ処理サーバのサー
バ識別子dbms_enを持ち、プロトコル情報には、SQLイン
タフェースであることを示す値SQLを持つ。
【0131】704は、データ種別"Greek"とデータ処
理サーバの対応を示すレコードである。データ処理サー
バ情報には、ギリシア語に対応したデータ処理サーバの
サーバ識別子dbms_elを持ち、プロトコル情報には、SQL
インタフェースであることを示す値SQLを持つ。
【0132】705は、データ種別"Hebrew"とデータ処
理サーバの対応を示すレコードである。データ処理サー
バ情報には、ヘブライ語に対応したデータ処理サーバの
サーバ識別子dbms_iwを持ち、プロトコル情報には、SQL
インタフェースであることを示す値SQLを持つ。
【0133】この表により、データ種別とそれに対応し
たデータ処理サーバとの関連を示すことができる。
【0134】図8は、データ処理要求部112によるデ
ータ処理サーバへの処理要求処理を示すフローチャート
である。図3のデータ処理でのステップ304の詳細を
示す。
【0135】まず、データ処理要求部112は、データ
処理要求解析結果308をもとに、対象領域502をデ
ータ処理サーバ上のデータベースのスキーマにマッピン
グし、データ処理要求309を作成する(801)(デ
ータ処理要求309の詳細は図9で説明する)。処理サ
ーバ選択部111が処理サーバ選択処理303で選択し
たデータ処理サーバ情報123をもとに、データベース
のスキーマへのマッピングを行う。
【0136】次に、作成したデータ処理要求をデータ処
理サーバに送信し(802)、この処理を終了する。
【0137】この処理により、データ種別によって選択
された各データ処理サーバに、それぞれに応じたデータ
処理要求を行うことができる。
【0138】図9は、データアクセス管理部103から
データ処理サーバ104へのデータ処理要求のデータ構
造を示す図である。
【0139】図3のステップ304(検索に関しては図
8のステップ801)で作成されるデータ処理要求30
9の詳細を示す。
【0140】なお、この例では、簡単のため、データ種
別"English"についてのデータ検索要求についてのみ示
す。データ種別"Greek"についても同様にしてギリシア
語のデータ処理サーバ用のデータ検索要求309が作成
される。
【0141】データ処理要求309の要求文901は、
以下を含む。
【0142】データ処理解析結果308の対象領域50
2「聖書」を、英語のデータ処理サーバ104−1のデ
ータベース114−1のスキーマにマッピングし、Scri
pturesという表を検索対象とする。
【0143】データ処理解析結果308の検索条件50
3内の「降誕」を、データ種別処理指示121の対象種
別"English"506と、問合せ変換「変換する」509
に従って、'Nativity'という文字列に変換し、全文検索
のキーとする。
【0144】この構造により、AP102からのデータ処
理要求107を、それぞれのデータ処理サーバに適した
形態で伝えることができる。
【0145】図10は、データ処理システム101での
処理結果編集の処理を示すフローチャートである。図3
のステップ306の詳細を示す。
【0146】まず、データアクセス管理部103の処理
結果編集部113は、データ種別処理指示121を参照
し、結果返却の種別指定があるかどうかを判定する(1
001)。
【0147】図1のデータ検索でのデータ処理要求10
7では、実行環境変数RESULT_LANG120で
指定され、データ種別処理指示121の結果返却種別
「原文」510が設定されている。
【0148】ステップ1001で、種別指定がある場合
は、データ処理サーバ104からの処理結果310を、
データ種別処理指定121に設定されたデータ種別に従
ってデータを変換し、その変換結果をデータアクセス管
理部103の処理結果311とする(1002)。
【0149】図1のデータ検索では、「原文」510と
指定されているので、変換せずに処理結果311とす
る。
【0150】ステップ1001で、種別指定がない場合
は、データ処理サーバ104からの処理結果310をそ
のままデータアクセス管理部103の処理結果311と
する(1003)。
【0151】この処理により、AP102からの要求さ
れたデータ種別のデータを返却することができる。
【0152】以上説明したように、データ種別に応じた
データ検索処理を行うことができる。
【0153】次に、データ処理システム101におけ
る、データ登録処理の詳細を説明する。
【0154】図11は、データ処理システム101にお
けるデータ登録処理の概要を示す概念図である。
【0155】基本的な構成は図1に示したものと同じで
あり、処理の流れは、図3に示したデータ処理の流れと
同じである。以下、データ登録の処理の流れに従って説
明する。
【0156】まず、AP102がユーザ106の要求に応
じてデータ登録要求を行う。ヘブライ語の文書データを
登録する要求であるとする。AP102はデータアクセス
管理部103にデータ登録の処理要求を行う。データ処
理要求107には、ヘブライ語の文書データ1101が
含まれる。
【0157】次に、データアクセス管理部103は、要
求解析部110で要求解析を行う。その結果としてデー
タ登録のデータ処理要求解析結果308とデータ種別処
理指示121を出力する。
【0158】データ処理要求解析結果308には、処理
対象データ1102が含まれる。
【0159】データ種別処理指示121には、対象種別
としてデータ種別識別子1103"Hebrew"が設定され
る。
【0160】次に、処理サーバ選択部111が、データ
種別処理指示121をもとに、データ処理サーバを選択
し、データ処理サーバ情報123−nを出力する。
【0161】次に、データ処理要求部112が、ヘブラ
イ語に対応したデータ処理サーバ104−nにデータ処
理要求を行う。
【0162】データ処理サーバ104−nは、ヘブライ
語のデータ402を、データベース114−nの中にヘ
ブライ語のデータ115−nとして格納する。また、ヘ
ブライ語に対応した全文検索処理部116−nが全文検
索インデクス1104−nに、データ115−1につい
てのインデクスエントリを登録する。
【0163】データ処理サーバ104−nでの登録処理
が完了すると、その結果がデータアクセス管理部103
に伝えられ、さらにAP102に登録処理が完了したこと
を伝えて、データ登録処理を終了する。
【0164】この処理によれば、データアクセス管理部
103が登録するデータ1101の種別によってデータ
登録処理を行うデータ処理サーバを選択することによ
り、データの種別に応じたデータ登録処理を行うことが
できる。
【0165】データ処理サーバは、対応する種別のデー
タのみを対象としてデータ登録処理を行うことができ
る。
【0166】図12は、データ登録処理要求の構成を示
すデータ構造図である。
【0167】データ登録のデータ処理要求107は、登
録するデータの言語種別を示す実行環境変数の指定12
01と、データ登録要求文1202と、登録するデータ
1101からなる。
【0168】1201では、実行環境変数INPUT_LANG
に、ヘブライ語を示すデータ種別の値"Hebrew"を設定し
ている。この実行環境変数INPUT_LANGにより、登録する
データがどの言語種別であるかを示す。値が"Hebrew"で
あることにより、登録するデータがヘブライ語であるこ
とを示す。
【0169】1202は、「聖書に関する文献の集まり
にデータを登録する」という要求を示すSQL文である。
登録するデータは、登録するデータ1101は、ヘブラ
イ語で記述されて文字列データである。SQL文1202
の変数:containsに関連付けられている。
【0170】このように、データ処理要求に処理対象と
するデータの種別を指定することにより、処理対象とす
るデータの種別を区別できるようにする。このデータ種
別の指定を、要求解析部110が図4のステップ402
で解析し、データの種別を区別することができる。
【0171】図13は、データ登録のデータ処理要求解
析結果308の構成を示す。
【0172】図4のデータ処理要求解析処理で出力され
る解析結果の詳細を示す。
【0173】データ登録のデータ処理要求解析結果30
8は、処理種別1301と、対象領域1302と、処理
対象データ1302からなる。
【0174】処理種別1301は、図12のデータ登録
のSQL文1202のINSERT文を解析した結果、「登録」
を示す値が設定されている。
【0175】対象領域1302は、図12のデータ登録
のSQL文1202のINSERT文でINTO句を解析した結果、
「聖書」を示す値が設定されている。
【0176】処理対象データ1102は、データ処理要
求107に含まれているデータ1101からなる。
【0177】データ種別処理指示121の対象種別に
は、図12のデータ登録要求でのデータ種別の指定12
01を解析して認識される実行環境変数1303をもと
に、ヘブライ語を示す値"Hebrew"1103が設定され
る。
【0178】このような構成により、データ処理要求を
解析した内容を構造化して表現することができる。ま
た、処理対象のデータ種別を示すなど、データの種別に
よって処理することの指示を表現することができる。
【0179】図14は、データアクセス管理部103か
らデータ処理サーバ104へのデータ登録処理要求のデ
ータ構造を示す図である。
【0180】図8のステップ801で作成されるデータ
処理要求である。
【0181】データ登録のデータ処理要求309は、登
録の要求文1401とデータ1402からなる。
【0182】図8のステップ801により、データ登録
の要求文1401において、登録対象領域は、ヘブライ
語のデータ処理サーバ104−nのデータベース114
−nのスキーマにマッピングされ、ヘブライ語のデータ
ベースの聖書の表となる。
【0183】また、登録する値の変数:contentsには、
登録するよう指定されたヘブライ語のデータ1402が
設定される。
【0184】この構造により、AP102からのデータ処
理要求107を、それぞれのデータ処理サーバに適した
形態で伝えることができる。
【0185】以上説明したように、データ種別に応じた
データ登録処理を行うことができる。
【0186】次に、AP102において、データの種別
を、データの変数の属性で指定する例を示す。図15
は、AP102からのデータ処理要求107のデータ構造
を示す図である。
【0187】データ登録要求文1501で、登録するデ
ータ1101を示す変数:contentsに対して、属性LANGU
AGE Hebrew1502を指定する。これにより、図12の
データ処理要求での、実行環境変数によるデータ種別の
指定1201と同等の指定を行う。
【0188】この指定を処理要求解析部110で解析す
ることにより、先に示したデータ登録処理と同様の処理
を行うことができる。
【0189】次に、本発明の第2の実施形態を用いて、
データ種別の異なる複数の部分データからなるデータを
処理する第1の例を説明する。
【0190】本実施形態は、基本的な構成は図1の構成
と同じである。以下に、AP102からのデータ処理要求
から順に処理の流れに従って説明する。
【0191】図16は、本実施形態での、AP102から
のデータ処理要求107のインタフェースの概要を示す
図である。
【0192】データ登録のデータ処理要求107に含ま
れる要求文1601は、表Scripturesの3つの列titl
e、author、contentsに、それぞれ、文字列データを挿
入する要求であることを示す。
【0193】ここで、各列値の変数に対する属性160
5、1606、1607は、それぞれ、表題の文字列デ
ータ1602のデータ種別が英語であること、著者の文
字列データ1603がギリシア語であること、内容の文
字列データ1604がヘブライ語であることを示してい
る。
【0194】このインタフェースにより、複数の種別の
異なる列値で1つの行値を構成することを指示すること
ができる。
【0195】図17は、図16に示したインタフェース
によるデータ処理要求の解析結果のデータ構造を示す図
である。
【0196】基本的は構成は、先の例で図13に示した
データ処理要求解析結果308と同じである。異なる部
分は、処理対象データ1102の中に、列title、autho
r、contentsに対応した部分データ1701、170
2、1703を持つことである。
【0197】部分データ1701、1702、1703
は、データ種別と値からなる。
【0198】列titleに対する部分データ1701は、
データ種別"English"1704と、表題の文字列データ
の値1705からなる。
【0199】列authorに対する部分データ1702は、
データ種別"Greek"1706と、著者の文字列データの
値1707からなる。
【0200】列contentsに対する部分データ1703
は、データ種別"Hebrew"1708と、内容の文字列デー
タの値1709からなる。
【0201】このデータ構成により、処理対象データの
部分データのそれぞれのデータ種別を表わすことができ
る。
【0202】図18は、図17のデータ処理要求解析結
果に従ってデータ登録する際の、データ処理サーバへの
データ処理要求を作成する処理のフローチャートであ
る。
【0203】これは、図8でのステップ801に相当す
る処理の詳細である。
【0204】まず、データ処理要求部112がデータ種
別処理指示121の対象種別からデータ種別識別子を取
り出す(1801)。データ種別識別子"English"など
がこれに相当する。
【0205】次に、処理対象データ1102から、ステ
ップ1801で取り出したデータ種別に属する部分デー
タを集め、データ処理サーバに登録するための登録用の
データ1806を作成する(1802)。データ種別識
別子を"English"とした場合、titileの部分データ17
05を構成要素として登録用データ1806を作成す
る。
【0206】次に、ステップ1802で作成した登録用
データにおいて、処理するデータ種別以外の部分データ
に、該当するデータが不明であることを示す情報unknow
nを設定する(1803)。データ種別識別子を"Englis
h"とした場合、author、contentsの部分をunknownとす
る。
【0207】次に、他に処理対象のデータ種別があるか
を判定する(1804)。
【0208】他にデータ種別がある場合は、ステップ1
801に戻って処理を繰り返す。1804までの処理を
繰り返すことにより、対象種別が複数の場合に、複数の
登録用データが作成される。つまり、ギリシア語とヘブ
ライ語の登録用データが作成される。
【0209】ステップ1804で、他にデータ種別がな
い場合は、次のステップに進む。
【0210】次に、データ処理システム101で一意と
なるデータ識別子を発行し、登録用データに設定する
(1805)。複数の登録用データを作成した場合は、
発行した1つの同じデータ識別子を、すべての登録用デ
ータに設定する。以上で登録用データを作成する処理を
終了する。
【0211】この処理により、複数の異なる種別の部分
データからなるデータの登録において、各データ種別ご
とに登録用データ1806を作成することができる。
【0212】図19は、図18の処理で作成される登録
用データの構成を示す図である。
【0213】図18に示した処理により、登録用データ
は、データ種別"English"、"Greek"、"Hebrew"のそれぞ
れに対して作成され、それぞれ1806−1、1806
−2、1806−nのような構造となる。
【0214】それぞれの登録用データ1806−1、1
806−2、1806−nは、同じシステム内データ識
別子1901を保持する。
【0215】データ種別"English"に対応して作成され
た登録用データ1806−1は、データ識別子1901
と、titleの部分データで表題の文字列データ1902
−1と、authorの部分データunknown1903−1と、c
ontentsの部分データunknown1904−1からなる。こ
の登録用データ1806−1が、英語のデータ処理サー
バ104−1に登録される。
【0216】データ種別"Greek"に対応して作成された
登録用データ1806−2は、データ識別子1901
と、titleの部分データunknown1902−2と、author
の部分データで著者の文字列データ1903−2と、co
ntentsの部分データunknown1904−2からなる。こ
の登録用データ1806−2が、ギリシア語のデータ処
理サーバ104−2に登録される。
【0217】データ種別"Hebrew"に対応して作成された
登録用データ1806−nは、データ識別子1901
と、titleの部分データunknown1902−nと、author
の部分データunknown1903−nと、contentsの部分
データで内容の文字列データ1904−nからなる。こ
の登録用データ1806−nが、ヘブライ語のデータ処
理サーバ104−nに登録される。
【0218】このような構成により、複数の種別の部分
データからなる処理対象データが、データ種別ごとの登
録用データとして表わされる。
【0219】図20は、図19の構成で登録されたデー
タを検索した結果を編集する際の、処理結果編集部11
3での処理を示すフローチャートである。
【0220】図10での処理結果編集処理での、ステッ
プ1001の前に行う処理である。
【0221】まず、処理結果編集部113は、データ処
理サーバから受け取ったデータの部分データから、unkn
ownではない実体データを取得して、処理結果データ3
11を作成する(2001)。
【0222】次に、処理結果のすべての部分データの実
体データが集まったかどうかを判定する(2002)。
【0223】集まっていない場合は、システム内データ
識別子をキーとして、unknownである部分データの実体
データを他のデータ処理サーバから取得し、処理結果デ
ータ311に設定する(2003)。すべての部分デー
タの実体データがそろったら処理を終了する。
【0224】この処理により、分割された部分データか
ら、もとの1つの処理対象データが作成される。
【0225】図21は、図20の処理で作成される処理
結果データの構成を示す図である。
【0226】titleの実体データ1902−1と、autho
rの実体データ1903−2と、contentsの実体データ
1904−nを集められて、それぞれを部分データ21
02、2103、2104とし、処理結果データ210
1が作成される。
【0227】次に、本実施形態において、データ種別の
異なる複数の部分データからなるデータを処理する第2
の例を説明する。
【0228】この例では、XML(eXtensible Markup Lang
uage)で記述された文書でタグを用いて部分データの言
語種別を指定する。
【0229】図22は、データ登録の処理対象データ4
02のインタフェースを概要を示す図である。
【0230】処理対象データ402は、XMLで記述され
た文書データである。
【0231】2201は、この文字列データがXMLで記
述されていることを示し、さらに、文字コードがUnicod
e UTF-8であることを示す。
【0232】タグtitle2202で囲まれた部分は、こ
の文書の表題を示す。また、タグlocaleの属性language
で"English"を指定することにより(2203)、タグl
ocaleで囲まれた部分が英語の文字列であることを示
す。
【0233】タグauthor2204で囲まれた部分は、こ
の文書の著者を示す。また、タグlocaleの属性language
で"Greek"を指定することにより(2205)、タグloc
aleで囲まれた部分がギリシア語の文字列であることを
示す。
【0234】タグabstract2206で囲まれた部分は、
この文書の要旨を示す。また、タグlocaleの属性langua
geで"Hebrew"を指定することにより(2207)、タグ
localeで囲まれた部分がヘブライ語の文字列であること
を示す。
【0235】このようなインタフェースにより、種別の
異なる複数の部分データからなるデータを表現すること
ができる。
【0236】図23は、図22のXMLデータをデータ処
理サーバに登録するときの登録用データの構成を示す図
である。
【0237】この例は、データ種別"English"に対応し
た登録用データ2301を示す。
【0238】図18に示した処理により、データ種別"E
nglish"の実体2302をそのまま保持し、その他のデ
ータ種別の部分文字列は、unknownを示すタグ230
3、2304に置き換えられる。
【0239】この構成により、各データ種別に対応した
データ処理サーバで適切なデータ処理が行える登録用デ
ータを表わすことができる。
【0240】次に、本発明の第3の実施形態を用いて、
より複雑なデータ種別を取り扱う例を説明する。
【0241】本実施形態は、基本的な構成は、第1の実
施形態と同じである。主に異なる点は、データ種別をよ
り複雑な構造の情報で示すことと、データ処理サーバの
選択において、取り扱うデータのデータ種別と一致しな
くても、データを変換してデータ処理サーバにデータ処
理要求を行うことである。
【0242】図24は、データ種別をロケール情報で示
したインタフェースの概要を示す図である。
【0243】先述の例ではデータ種別を英語、ギリシ
ア、ヘブライ語などの言語種別で表わしていたのに対し
て、この例では、さらに地域とエンコードの組合せによ
りデータの種別を示す。
【0244】言語と地域およびエンコードは、POSIX(Po
rtable Operating System Interface for UNIX)規格の
ロケール(locale)モデルに従い、"en_US.iso88591"のよ
うに、言語、地域、文字コードを示すこととする。
【0245】2401は、登録するデータのロケール
が"iw_IL.iso88598"であることを実行環境変数で指定し
ている。これにより、登録するデータの言語がヘブライ
語で、地域がイスラエル、エンコードがISO8859-8であ
ることが示される。
【0246】このようなインタフェースにより、複合的
な構成のデータ種別を表わすことができる。
【0247】図25は、図24の複合的な構成のデータ
種別のデータを登録する処理での、データ処理サーバを
選択する処理のフローチャートを示す図である。
【0248】基本的には、図6に示した処理サーバ選択
処理と同じである。違いは、ステップ601とステップ
602の間で、データ種別識別子に一致するレコードが
ないかどうかを判定し(2501)、ない場合はデータ
変換が可能なデータ種別のデータ処理サーバを検索する
(2502)処理を含んでいることである。
【0249】これにより、複雑で種別の数が多いデータ
種別のそれぞれに完全に対応するデータ処理サーバのす
べてが提供されていなくても、データ変換によりデータ
処理が可能な少数の種別に対応したデータ処理サーバで
データ処理を行うことができる。
【0250】図26は、データ処理サーバへデータを登
録するときのデータを変換する処理のフローチャートを
示す図である。
【0251】データ処理要求解析結果308に含まれる
処理対象データを、図25のステップ2502で検索さ
れたデータ変換可能なデータ種別に合わせてデータ変換
する(2601)。
【0252】これにより、複雑なデータ種別に完全に一
致するデータ処理サーバが提供されていなくても、デー
タを登録することができる。
【0253】図27は、図26の処理で作成される、デ
ータ変換したデータの構成を示す図である。
【0254】AP102からの処理要求では、登録するデ
ータ401のロケールはiw_IL.iso88598で、データ種別
識別子2701は"iw_IL.iso88598"としているとする。
データ種別-データ処理サーバ対応表122にはこのデ
ータ種別識別子に一致するレコードがなく、データ変換
可能なデータ種別識別子"iw_IL.utf8"2702のレコー
ドが検索結果として得られるとする。そのデータ種別識
別子2702に従い、図26に示した処理によりデータ
変換が行われ、登録用データ2703が作成される。
【0255】この構成により、複雑なデータ種別に完全
に一致するデータ処理サーバが提供されていなくても、
データを登録することができる。
【0256】次に、本発明の第4の実施形態を用いて、
アプリケーションプログラムがデータの種別を受け取る
例を説明する。
【0257】本実施形態は、基本的な構成は、第1の実
施形態および第2の実施形態と同じである。主に異なる
点は、AP102がデータの種別をアプリケーションプロ
グラミングインタフェースで受け取ることである。
【0258】図28は、データ検索において、AP102
が処理結果で受け取るデータの種別を受け取る要求のイ
ンタフェースの概要を示す図である。
【0259】データ検索のデータ処理要求107の要求
文2801で、結果として受け取るtitle、authorのそ
れぞれの言語を種別を、それぞれ標識子:sTLang280
2、:sAutLang2803で受け取るよう要求している。
【0260】このようなインタフェースにより、複数の
種別のデータを保持するデータベースかららデータを検
索結果として受け取る場合に、受け取ったそれぞれのデ
ータがどの種別であるかをAP102が知ることができ
る。
【0261】図29は、図28のようなインタフェース
で指定された検索要求で、標識子にデータ種別識別子を
返却する際のデータ構成の概要を示した図である。
【0262】データアクセス管理部103の処理結果編
集部113が、title、auhtorのそれぞれの部分データ
をデータ処理サーバ104−1、104−2から受け取
った際に、それぞれのデータ処理サーバのデータ種別識
別子"English"2901、"Greek"2902をもとに、処
理結果データ2903のtitleの標識子"English"290
4、authorの標識子"Greek"2905を設定する。
【0263】これにより、AP102は、処理結果で受け
取ったデータの種別を知ることができる。
【0264】次に、本発明の第5の実施形態を用いて、
ネットワーク経由でデータ処理サーバを探索してデータ
処理を行うデータ処理サーバを選択する例を説明する。
【0265】本実施形態は、基本的な構成は図1の構成
と同じである。主な違いは、データアクセス管理部10
3でデータ種別-データ処理サーバ対応表122を用い
ないことである。
【0266】図30は、データアクセス管理部103の
処理サーバ選択部111での、データ処理サーバを選択
する処理のフローチャートを示す図である。
【0267】この例では、ネットワーク105を経由し
てデータ処理サーバを探索し、データ処理種別指示12
1に含まれるデータ種別識別子に適合するデータ処理サ
ーバを選択して、そのデータ処理サーバの情報を返す
(3001)。
【0268】この処理により、データ処理システム10
1のデータ処理サーバの構成を固定的にせず、また、デ
ータ種別-データ処理サーバ対応表122を保持しなく
ても、データ処理を行うデータ処理サーバを選択するこ
とができる。
【0269】次に、本発明の第6の実施形態を用いて、
データ処理システムにデータ処理サーバを追加する例を
説明する。
【0270】本実施形態は、基本的な構成は図1の構成
と同じである。主な違いは、フランス語のデータ処理サ
ーバ114−fをデータ処理システム101に追加し、
データアクセス管理部103のデータ種別-データ処理
サーバ対応表122にフランス語のデータ処理サーバの
情報を追加することである。
【0271】図31は、データ処理サーバを追加したデ
ータ処理システムの構成を示す概要図である。
【0272】データ種別-データ処理サーバ対応表12
2に、フランス語に適切なデータ処理を行うデータ処理
サーバのレコード3101を追加している。
【0273】また、フランス語に適切なデータ処理を行
うデータ処理サーバ104−fをネットワーク105に
接続し、データ処理システム101の一部となるように
している。
【0274】このような構成で、先に説明したデータ登
録処理およびデータ検索処理を行うことにより、追加し
たフランス語のデータ処理サーバ104−fの機能をデ
ータ処理システム101で利用することができる。
【0275】データ種別-データ処理サーバ対応表12
2にレコード3101を追加するだけで、フランス語の
データ種別に対応し、データ処理サーバ104−fのデ
ータ処理を行うことができる。
【0276】なお、データ処理サーバ104−fは、デ
ータ処理システム101以外のアプリケーション310
2からも利用することができる。
【0277】また、すでにデータ処理システム101に
含まれているデータ処理サーバ104−1、104−
2、…、104−n自体に対しては何も変更を加える必
要はない。
【0278】次に、本発明の第7の実施形態を用いて、
データ処理サーバに保持するデータの形式をすべて統一
する例を説明する。
【0279】本実施形態は、基本的な構成は図1の構成
と同じである。主な違いは、データ処理システム101
を構成するデータ処理サーバ104−1、104−2、
…、104−nに保持するデータの形式をすべて同一に
することである。
【0280】図32は、データ処理サーバで取り扱うデ
ータのデータ形式をすべてUnicodeとした例を示す。デ
ータ処理サーバ104−1、104−2、…、104−
nに保持するデータ3201−1、3201−2、…、
3201−nのエンコードを、すべてUTF8としている。
【0281】このように、データ処理サーバ104−
1、104−2、…、104−nで取り扱うデータの形
式はすべて同じでも良く、データの型や形式によらず、
データの種別によってデータ処理サーバを区別すること
ができる。
【0282】なお、前述した例に示したように、本実施
例では以下のことが可能となる。
【0283】(1)複数の異なる種別のデータにアクセ
スするデータ処理システムにおいて、 (1−1)APで扱う種別に依存するデータをそのままデ
ータ処理サーバでデータ処理するので、それぞれの種別
に依存する情報が失われることがなく、データの種別ご
との特性に従った処理を行うことができる。
【0284】(1−2)部分データを種別によって分離
し、それぞれに応じたデータ処理サーバに登録し、検索
時にそれらの部分データを組合せて元のデータをAPに返
却するので、1つのデータ中に複数の種別のデータが混
在したデータを扱える。
【0285】(2)(1)の環境を構築することにおい
て、 (2−1)データ種別-データ処理サーバ対応表を編集
するだけで、データ処理サーバをデータ処理システムに
追加・削除することができるので、複数の異なる種別の
データにアクセスするデータ処理システムを容易に構築
することができる。
【0286】(2−2)データ種別-データ処理サーバ
対応表を編集するだけで、既存のデータ処理サーバをデ
ータ処理システムに追加・削除することができるので、
種別に依存した機能を提供する既存のモジュールを利用
することができる。
【0287】(2−3)種別ごとに対応したデータ処理
サーバを利用することにより、種別に依存した機能を提
供するモジュールを必要最小限に配置することができ
る。
【0288】これらのことが可能になることは、特に、
データベースシステムの多言語対応において有効であ
る。
【0289】なお、前述したフローチャートの処理は、
図2に示したようなデータ処理装置でプログラムを実行
することによって実現できる。また、そのプログラム
は、ハードディスク装置、フロッピーディスクなどのコ
ンピュータで読み書きができる記憶媒体に格納すること
ができ、ネットワークを通してプログラムにアクセスす
ることができる。
【0290】以下に列値に対応する複数の照合キーを多
次元データとして異なる照合方法で共有し、列値に対応
する照合キーの照合を行ってレコードをソートする一実
施形態の照合処理装置について説明する。
【0291】従来の照合処理方法において、データベー
スを多言語対応としたり特定の言語に対して複数の照合
方法を用いるなどして、データベースの同一の列値に対
して異なる照合方法を適用する場合には、照合が行われ
る列値に対して照合方法に対応した照合キーを生成した
後に、生成した照合キーを用いてソート処理を行う為、
ソート処理の処理速度が低下するという問題がある。
【0292】また、前記従来の照合処理方法では、ある
ソート処理の際に生成された照合キーはそのソート処理
のみで用いられる為、生成した照合キーが他の照合方法
で利用できる場合であってもその照合キーを他の照合方
法で利用しておらず、照合キーの利用効率が低下すると
いう問題がある。例えば、読み・表記照合によるソート
処理と、読み・表記照合及び代表読み照合を組み合わせ
たソート処理とを特定の列値に対して行う場合には読み
・表記照合の照合キーとして同じものが用いられるが、
従来の照合処理方法では、個々のソート処理でそれぞれ
照合キーを生成している為、照合キーの利用効率が低下
していた。
【0293】更に、前記従来の照合処理方法では、同一
の列値に対して行われる複数の照合方法の内容を変更し
た場合、生成する照合キーの内容を変更しなければなら
ない為、照合方法の変更・追加に容易に対応することが
できないという問題がある。
【0294】一方、従来のデータベースシステムでは、
データベースに格納したデータをソートする際にインデ
クスを利用する方法があるが、従来のインデクスを利用
する方法では照合される列値に対応させたインデクスを
用いる為、同一の列値に複数の照合キーが対応する場合
には、従来のインデクスをそのまま適用することは困難
となるという問題がある。
【0295】例えば、従来のデータベースシステムにお
いて、データベースに格納した文字列を、JIS X 4061に
規定されている照合方法に従ってソートする機能をサポ
ートすることを考え、一般的なリレーショナルデータベ
ースシステムで表の列に文字列を格納し、特開平8−2
55170号公報に開示されている方法を適用して、イ
ンデクスを用いてソート機能を提供すると、以下の様に
なる。
【0296】まず、文字列を格納した列に対して、読み
・表記照合方法に従ったソートをサポートする場合に
は、読み・表記照合方法に従って文字列の順序を決定
し、インデクスを構成する木構造をなすノードに、ソー
トのキー値とレコードを識別する情報を保持する。
【0297】しかし、この様な方法では、以下の問題が
ある。前記の文字列を格納した列に対して、更に代表読
み照合方法によるソートをサポートする場合に、前記の
読み・表記照合方法に従って作成したインデクスは、ノ
ード内部のレコードの順番が異なる為、利用することが
できない。この様に、B-tree等によってある順序に従っ
て作成したインデクスを他の照合方法に適用することは
できない為、複数の照合方法によるソートをサポートす
る場合には、それぞれの照合方法によるインデクスを複
数作成する方法や、インデクスを使わずに直接レコード
を照合評価してソートする方法等が考えられる。
【0298】複数のインデクスを作成する方法では、ま
ず、データベースシステム内で同じ列に対してそれぞれ
異なる順番評価による複数のインデクスを作成・管理す
る機能が必要になる。これは一般的なデータベース管理
システムには無い機能である。また、この機能を追加し
たとしても、サポートする複数の照合方法のそれぞれに
ついてインデクスを運用管理する必要があり、操作コス
トがかかることになる。また、それぞれのインデクスに
ついてインデクスデータを格納するファイル等のリソー
スが必要になる。更に、レコード登録・変更時のインデ
クスデータのメンテナンスのオーバヘッドが、インデク
スの数だけ大きくなる。
【0299】インデクスを使わずにレコードを直接照合
評価してソートする方法では、レコードを格納した領域
を全てアクセスする為、レコード全体のサイズが大きく
レコードの数が大量の場合、インデクスを利用してキー
値のみをアクセスする場合と比べて、高速に処理するこ
とはできない。
【0300】また、インデクスを作成していない場合
に、ソートを処理するときにインデクスを動的に作成
し、そのインデクスを用いてソートする方法が考えられ
る。しかし、この方法ではインデクス作成のオーバヘッ
ドがかかる為、既にインデクスが作成されている場合と
比べて、高速に処理することはできない。
【0301】更に、従来のデータベースシステムでは、
照合方法を部分的に変更・追加する様な場合に容易に対
応できないという問題がある。例えば、JIS X 4061で
は、漢字についての順番は、日本工業規格JIS X 0208の
情報交換用漢字符号に定義された区点番号の順番や、日
本工業規格JIS X 0221の国際符号化文字集合(UCS)
−第1部体系及び基本多言語面に定義された符号位置の
順番とする様に規定されている。ここで、NTTの電話
帳の様に、漢字の順番評価の部分について画数順とした
い場合には、JIS X 4061に従って作成したインデクスは
順番が異なる為に利用できず、専用の順番評価を行う機
能とインデクスを別途作成する等の対策が必要である。
【0302】前記従来の技術のユーザ定義関数による順
序評価でインデクスを作成する方法では、任意のある1
つの順序評価に基づいたインデクスを作成できるが、そ
のインデクスを他の順序評価に基づいたソートに適用す
ることはできない。
【0303】前記従来の技術の多次元ベクトル空間内の
近傍検索方法を適用し、文字列の照合キーを多次元的に
解析して文字列照合する方法が考えられる。しかし、こ
の方法は、ある条件を満たすデータの集まりを取得する
方法からなり、検索範囲を限定することに有効ではある
が、ある規則(照合方法)に基づいて順番にソートする
ことには有効ではない。特に、複数の照合方法に基づい
た順番にソートすることには適用できない。以上をまと
めると、次の問題が挙げられる。
【0304】(1)1つのインデクスは1つの照合方法
によるソートにしか対応できない。複数の照合方法によ
るソートについて配慮がされていない。複数の照合方法
に対してそれぞれインデクスを作成すると、それぞれの
インデクスについて、運用の操作コストがかかる。更
に、インデクスデータを格納するリソースが必要にな
る。また、レコード登録・変更時のインデクスメンテナ
ンスのオーバヘッドがかかる。
【0305】(2)照合方法を部分的に変更・追加する
様な場合に容易に対応できない。照合方法の変更につい
ての配慮がされていない。変更により順番が変わってし
まう場合には、元の照合方法の為に作成したインデクス
を利用できない。
【0306】本発明の目的は上記問題を解決し、複数の
照合方法によるソート処理の高速化及び多次元データの
利用効率の向上を行うことが可能な技術を提供すること
にある。
【0307】本発明は、列値に対応する照合キーの照合
を行ってレコードをソートする照合処理方法において、
列値に対応する照合キーを示す多次元データを複数の照
合方法で共有し、多次元データ中の照合キーを用いて異
なる複数の照合方法によるソート処理を行うものであ
る。
【0308】本発明においてアプリケーションプログラ
ムは、表データストアに格納された文字列に対して、さ
まざまな照合方法によってソートする様にデータベース
処理サーバに問合せ要求を行う。
【0309】データベース処理サーバは、アプリケーシ
ョンプログラムからの問合せ要求を受け取ると、その問
合わせ要求の解析を行い、インデクス管理部の処理を経
由して問合せ解析結果を照合モジュールに送って照合モ
ジュールにソート処理を要求する。
【0310】照合モジュールは、定義データストアに保
持されている各種データを参照し、ソート要求で指定さ
れた照合方法で評価対象となる列値について、その列値
に対応する照合キーの識別子を取得し、その識別子と共
に多次元データ処理モジュールに多次元データ解析要求
を行う。
【0311】多次元データ処理モジュールは、前記識別
子で示される照合キーを多次元データから読み出し、前
記列値が格納されたレコードを識別する為のレコード識
別子を前記照合キーを用いてソートし、前記列値に対応
するレコード識別子を前記照合方法に応じて順序付けて
レコード識別子のリストを生成する。
【0312】多次元データ処理モジュールは、このレコ
ード識別子のリストを多次元データ解析結果として照合
モジュールに返し、照合モジュールは、この多次元デー
タ解析結果を、ソート処理結果としてインデクス管理部
に渡す。データベース処理サーバは、インデクス管理部
でソート処理結果を受け取るとアプリケーションプログ
ラムに問合せ処理終了を返す。
【0313】前記の様に本発明によれば、複数の照合方
法に従ったソートをサポートする際に、多次元データを
複数の照合方法について共有し、その多次元データ中の
照合キーを用いて複数の照合方法のソート処理を行うの
で、それぞれの照合方法によるソート処理の高速化、多
次元データ利用効率の向上(リソース削減)及び運用操
作コストの削減を行うことが可能である。
【0314】また、照合方法の定義情報を参照してその
照合方法で用いられる照合キーの定義情報を追加・変更
するだけで照合方法の追加・変更に対応することができ
るので、多次元データの利用効率の向上(リソース削
減)及び運用操作の容易化を行うことが可能である。
【0315】以上の様に本発明の照合処理装置によれ
ば、列値に対応する照合キーを示す多次元データを複数
の照合方法で共有し、多次元データ中の照合キーを用い
て異なる複数の照合方法によるソート処理を行うので、
複数の照合方法によるソート処理の高速化及び多次元デ
ータの利用効率の向上を行うことが可能である。
【0316】図33は本実施形態の文字列ソート処理の
概要を示す図である。図33に示す様に本実施形態のデ
ータベースシステム10101は、照合モジュール10
106と、多次元データ処理モジュール10107とを
有している。
【0317】照合モジュール10106は、ソート要求
で指定された照合方法で評価対象となる列値に対応する
照合キーの次元識別子を取得し、その照合キーを用いた
ソート処理を要求する照合処理部である。多次元データ
処理モジュール10107は、照合モジュール1010
6で取得された次元識別子で示される照合キーを参照
し、表10115の列値が格納されたレコードを識別す
る為のレコード識別子10158を前記照合キーでソー
トし、前記列値に対応するレコード識別子10158を
前記指定された照合方法に応じて順序付けるソート処理
部である。
【0318】データベースシステム10101を照合モ
ジュール10106及び多次元データ処理モジュール1
0107として機能させる為のプログラムは、CD−R
OM等の記録媒体に記録され磁気ディスク等に格納され
た後、メモリにロードされて実行されるものとする。な
お前記プログラムを記録する記録媒体はCD−ROM以
外の他の記録媒体でも良い。
【0319】まず、システム構成の概略を説明する。本
実施形態の照合処理装置であるデータベースシステム1
0101は、アプリケーションプログラム10102
と、データベース処理サーバ10103と、定義データ
ストア10104と、表データストア10105と、照
合モジュール10106と、多次元データ処理モジュー
ル10107と、多次元データストア10108を備え
ている。
【0320】アプリケーションプログラム10102
は、ユーザからのデータベース問合せ要求をデータベー
ス処理サーバ10103に送信し、その処理結果を受け
取るプログラムである。
【0321】データベース処理サーバ10103は、一
般的なデータベース管理システムの機能を提供すると共
にインデクス管理部10109を含んでいる。インデク
ス管理部10109は、データベース処理サーバ101
03でのインデクスを利用したソート要求10151を
受けて、その結果としてレコード識別子のリスト101
57を返す。
【0322】定義データストア10104は、インデク
ス定義情報10110、インデクス−ドメイン対応デー
タ10112、照合方法−照合キー対応データ1011
3、照合キー−次元対応データ10114を保持してい
る。インデクス定義情報10110は、インデクスに対
応した照合モジュール10106を識別する照合モジュ
ール識別子10111を含んでいる。また表データスト
ア10105は表10115にレコードを保持してい
る。
【0323】多次元データ処理モジュール10107
は、“OLAP SOLUTIONS Building Multidimensional Inf
ormation Systems, Erik Thomsen, John Wiley & Sons,
1997”に記載されている様なデータ処理機能を提供す
るモジュールであり、特開平9−265479号公報の
「多次元データ処理方法」に開示されている様な方法に
従って実装されているモジュールである。多次元データ
ストア10108は、インデクスに対応した多次元デー
タドメイン10116を保持し、ここにレコードの照合
キーとなる部分をコード化した値及びそのレコードのレ
コード識別子10158を多次元データとして保持して
いる。
【0324】次に、このシステムにおけるソート要求1
0151を含む問合せ処理の概略を説明する。アプリケ
ーションプログラム10102は、表データストア10
105に格納された文字列に対して、さまざまな照合方
法によってソートする様にデータベース処理サーバ10
103に問合せ要求を行う(ソート要求10151)。
【0325】データベース処理サーバ10103は、ア
プリケーションプログラム10102からの問合せ要求
の解析を行い、問合せ解析結果10152を生成する。
この解析処理では、インデクス定義情報10110を探
索し、ソート処理にインデクスを利用するかどうかを判
定する。ソート対象に対応するインデクス定義情報10
110があれば、その情報に基づいてインデクスを利用
するデータベース処理を行うことを決定し、インデクス
を利用した結果、得られる順番をそのままソートした順
番とする。
【0326】問合せ解析結果10152の結果、インデ
クスを利用することを決定すると、データベース処理サ
ーバ10103はインデクス管理部10109にソート
する様に要求する(インデクスソート要求1015
3)。インデクス管理部10109は、インデクス定義
情報10110に含まれる照合モジュール識別子101
11に従って、照合モジュール10106にソート処理
を要求する。
【0327】照合モジュール10106は、定義データ
ストア10104に保持されているインデクス−ドメイ
ン対応データ10112、照合方法−照合キー対応デー
タ10113、及び照合キー−次元対応データ1011
4を参照し、照合−多次元データ解析変換10154を
行う。この変換で、インデクスに対応した多次元データ
処理のドメイン、適用する照合方法の照合キーと照合段
階に対応した多次元データドメイン10116での照合
キーを識別する次元識別子と当該照合キーの優先度の情
報を得る。これらを指定して、多次元データ処理モジュ
ール10107に、多次元データ解析要求10155を
行う。
【0328】多次元データ解析要求10155では、ア
プリケーションプログラム10102からのそれぞれの
ソート要求10151に適合する照合方法に従って、各
照合段階での照合キーの評価を、次元識別子及び優先度
に対応させ、それらを入力として指定する。出力とする
解析結果はレコード識別子のリスト10157とする。
【0329】多次元データ処理モジュール10107
は、各次元の照合キーについて優先度の指定の要求に従
って多次元データを解析してソート処理を行い、多次元
データ解析結果10156を返す。
【0330】照合モジュール10106は、この多次元
データ解析結果10156をソート処理結果としてイン
デクス管理部10109に渡す。インデクス管理部10
109は、これをソート処理結果のレコード識別子のリ
スト10157とする。データベース処理サーバ101
03は、インデクス管理部10109からのソート処理
終了を示す応答を受け取り、アプリケーションプログラ
ム10102に問合せ処理終了を返す。以上で問合せ処
理を終了する。
【0331】なお、このソートの問合せ処理の結果は、
一般的なSQLのFETCHにより取り出す。アプリケ
ーションプログラム10102からのフェッチ要求に応
じて、データベース処理サーバ10103はレコード識
別子のリスト10157から順次レコード識別子101
58を取り出し、それによって識別されるレコードを表
データストア10105から取り出して、アプリケーシ
ョンプログラム10102に返却する。
【0332】図34は本実施形態の照合処理装置の概略
構成を示す図である。本実施形態のデータベースシステ
ム10101は、一般的なデータ処理装置10201の
上で動作する。
【0333】データ処理装置10201は、CPU10
202、OS10203、通信コントローラ1020
4、メモリ10205、I/Oコントローラ10206
及びこれらを接続するシステムバス10207等を備え
ている。また、I/Oコントローラ10206には、キ
ーボードやマウス及びディスプレイ等の様なデータ入出
力装置10208、及び、磁気ディスク装置の様なデー
タ記憶装置10209等が接続される。
【0334】データ処理装置10201は、通信コント
ローラ10204によりLAN(Local Area
Network)等のネットワーク10210に接続さ
れており、ネットワーク10210に接続されている他
のデータ処理装置10201と通信を行なう。
【0335】図33及びこれ以降に示すプログラムの機
能は、OS10203の管理の下で、CPU10202
がメモリ10205に格納されたプログラムを実行する
ことにより実現される。また、定義データストア101
04、表データストア10105、多次元データストア
10108等は、データ記憶装置10209にデータを
格納することにより実現される。
【0336】図35は本実施形態の表10115の一例
を示す図である。図35では、データベースシステム1
0101においてレコードを格納する表10115の構
造を表している。
【0337】名簿である表10115は、氏名1030
1及びふりがな10302を表す列とその他の列を有し
ている。また、レコード識別子10303を各レコード
に割り当てている。ここで、氏名10301の列値はC
HAR型16文字以内の値とし、ふりがな10302の
列値は、CHAR型16文字以内の値とする。
【0338】レコード10304は、氏名10301の
値が「足立 修」、ふりがな10302の値が 「あだち
おさむ」であることを示しており、レコード識別子rid
1により、データベース処理サーバ10103はこのレ
コードを他のレコードと識別する。なおレコード103
05〜レコード10312も同様である。
【0339】図36は本実施形態のインデクス定義情報
10110の一例を示す図である。インデクス定義情報
10110は、インデクス識別子10401、表識別子
10402、列識別子10403、照合モジュール識別
子10404、照合要素種別10405から構成され
る。
【0340】インデクス識別子10401は、この定義
情報が示すインデクスを、他のインデクスと識別する識
別子である。表識別子10402は、インデクス設定対
象の表を識別する識別子である。列識別子10403
は、インデクス設定対象のキーとなる列を識別する識別
子である。
【0341】なお、レコード10406及び10407
の様な複数の定義情報により、複数の列の組合せがイン
デクスのキーであることを示しており、レコード104
06及び10407は、氏名10301とふりがな10
302の組合せが、このインデクス(名簿照合インデク
ス)のキーであることを示している。
【0342】照合モジュール識別子10404は、照合
モジュール10106を識別する識別子である。この定
義情報が示すインデクスで照合に関する処理を行うとき
に実行する照合モジュール10106を識別する。照合
要素種別10405は、列識別子10403に対応した
照合要素を示しており、レコード10406では、氏名
10301が表記による照合において照合要素となるこ
とを表している。
【0343】以上をまとめるとレコード10406及び
10407は、「名簿照合インデクス」で識別されるイ
ンデクスが設定されていることを示しており、名簿を示
す表10115の氏名10301及びふりがな1030
2の列を組にしてインデクスのキーとしている。このイ
ンデクスの照合に関する処理は、jisx4061で識別される
照合モジュール10106で実行される。照合での照合
要素は表記列及び読み列の組であり、それぞれ氏名10
301及びふりがな10302の列に対応する。
【0344】この様なインデクス定義情報10110
は、一般のデータベース管理システムが提供するインデ
クス定義機能を拡張することで作成できるものである。
【0345】図37は本実施形態の照合方法−照合キー
対応データ10113の一例を示す図である。照合方法
−照合キー対応データ10113は、照合方法識別子1
0501、照合キー識別子10502、照合段階105
03を有している。
【0346】レコード10504〜10508は、代表
読み照合方法の照合キー及びその照合段階を示してい
る。すなわち、代表読み照合方法での照合手順の第1段
階で、表記列の先頭字を文字クラスの順番に従って評価
すること、第2段階で第1分節の代表読みを照合キーと
して評価すること、第3段階で第1分節の表記列を照合
キーとして評価すること、第4段階で読み列を照合キー
として評価すること、第5段階で表記列を照合キーとし
て評価することをそれぞれ示している。
【0347】レコード10509は読み・表記照合方法
での照合手順の第1段階で、読み列を照合キーとして評
価することを示し、レコード10510は読み・表記照
合方法での照合手順の第2段階で、表記列を照合キーと
して評価することを示している。また、レコード105
11は単純照合方法での照合手順の第1段階で、表記列
を照合キーとして評価することを示している。
【0348】なお、例えばレコード10507とレコー
ド10509で照合キー識別子「読み列」を共通して設
定されていることから、読み列の照合キーが、代表読み
照合方法での照合手順の第4段階及び読み・表記照合方
法での照合手順の第1段階で共通に用いられることが判
る。
【0349】図38は本実施形態の照合キー−次元対応
データ10114の一例を示す図である。照合キー−次
元対応データ10114は、照合キー識別子1060
1、次元識別子10602を有している。
【0350】レコード10603は、「第1表記文字ク
ラス」で識別される照合キーが、多次元データドメイン
10116での「第1表記文字クラス」で識別される次
元と対応することを示しており、同様に、レコード10
604〜レコード10607の各照合キーは、多次元デ
ータドメイン10116での各次元と対応している。
【0351】なお、例えばレコード10507及び10
509で照合キー識別子「読み列」を共通して使用する
ことに対応して、多次元データ処理での次元「読み列」
も、複数の照合方法で共通に用いられる。
【0352】図39は本実施形態のインデクス−ドメイ
ン対応データ10112の一例を示す図である。データ
ベースシステム10101では、インデクス毎に多次元
データドメイン10116を持たせる。その対応関係を
インデクス−ドメイン対応データ10112を用いて示
している。
【0353】インデクス−ドメイン対応データ1011
2は、インデクス識別子10701、ドメイン識別子1
0702を有しており、レコード10703は、「名簿
照合インデクス」で識別されるインデクスが、多次元デ
ータ処理モジュール10107で、「名簿照合ドメイ
ン」で識別されるドメインと対応することを示してい
る。
【0354】次に、データベースシステム10101の
多次元データドメイン10116に多次元データのエン
トリを登録する一例として、レコードの挿入時に多次元
データのエントリ登録を行う例を示す。
【0355】図40は本実施形態のデータベースシステ
ム10101にレコードを挿入する処理の概要を示す図
である。本実施形態の多次元データ処理モジュール10
107は、レコードの挿入の際にその列値に対応する複
数の照合キーを多次元データとして多次元データドメイ
ン10116に保持し、多次元データ中の照合キーを異
なる照合方法で共有できる様にしている。
【0356】レコード挿入10853を要求するアプリ
ケーションプログラム10801が、名簿である表10
115にレコードを格納する様、データベース処理サー
バ10103に登録要求10851を行っており、例え
ば以下の様なSQL文で問合せ要求を行う。
【0357】INSERT INTO 名簿 VALUE
S (「足立 修」、「あだち おさむ」、...) データベース処理サーバ10103は、この問合せ要求
を受信し、問合せ解析10852を行い、データベース
処理手順を決定する。問合せ解析10852では、レコ
ード挿入要求であることを解析して、表データストア1
0105へのレコード挿入10853を行うことを決定
する。
【0358】更に、インデクス定義情報10110を参
照し、挿入するレコードについてインデクスをメンテナ
ンスするかどうかを判定する。例えば図36のレコード
10406及び10407を参照し、名簿照合インデク
スをメンテナンス対象とすることを決定する。
【0359】続いて、決定したデータベース処理手順に
従って、表データストア10105へのレコード挿入1
0853を行う。データベース処理サーバ10103
が、レコードの格納位置を決定し、表データストア10
105に格納する。そして、その格納位置の情報をレコ
ード識別子10854に符号化する。
【0360】次に、問合せ解析10852で決定したデ
ータベース処理手順に従って、インデクスメンテナンス
10855を行う。データベース処理サーバ10103
は、インデクス管理部10109にインデクスエントリ
登録を要求する。インデクス管理部10109では、イ
ンデクス定義情報10110から取得した照合モジュー
ル識別子10404(jisx4061)を用いて、照合モジュ
ール10106を特定し、照合モジュール10106に
エントリ登録要求する。この要求では、インデクス識別
子、照合モジュール識別子、インデクス設定対象の列
値、レコード識別子を指定する。
【0361】照合モジュール10106は、定義データ
ストア10104に保持されたインデクス定義情報10
110、照合モジュール−照合方法対応データ1080
2及び照合方法−照合キー対応データ10113に従
い、照合要素に対応させ、インデクスのキー値から照合
キー値を取得する。更に、照合キー−次元対応データ1
0114を参照して、照合キーを多次元データエントリ
に対応させる様に照合キー−多次元データエントリ変換
10856を行う。この変換によって得た多次元データ
エントリ変換結果10858を多次元データ処理モジュ
ール10107に登録要求する多次元データ登録要求1
0857を行う。なお、この照合モジュール10106
におけるエントリ登録処理については、後に図42で詳
細に説明する。
【0362】照合モジュール10106のエントリ登録
が終了したら、インデクス管理部10109のインデク
スメンテナンスを終了し、データベース処理サーバ10
103はレコード挿入処理終了を登録アプリケーション
プログラムに返信して終了する。以上により、レコード
挿入処理を終了する。
【0363】図41は本実施形態の照合モジュール−照
合方法対応データ10802の一例を示す図である。照
合モジュール−照合方法対応データ10802は、照合
モジュール識別子10901と、照合方法識別子109
02を有している。レコード10903〜10905
は、jisx4061で識別される照合モジュール10106
が、「代表読み照合方法」、「読み・表記照合方法」、
「単純照合方法」の3つの照合方法の識別子と対応して
いることを示している。
【0364】図42は本実施形態のエントリ登録時の照
合モジュール10106の処理手順を示すフローチャー
トである。図42では、図40のインデクス管理部10
109からのエントリ登録要求に応じて起動する処理を
表しており、この処理の入力は、インデクス識別子、照
合モジュール識別子、インデクス設定対象の列値、レコ
ード識別子である。
【0365】まず、インデクス定義情報10110を参
照し、列値を照合要素の値に変換する(ステップ110
01)。例えば図36のレコード10406及び104
07を参照し、挿入するレコードの列値「足立 修」を
表記列の値、列値「あだち おさむ」を読み列の値とす
る。
【0366】次に、照合モジュール−照合方法対応デー
タ10802を参照し、この照合モジュール10106
に対応した照合方法識別子を取得する(ステップ110
02)。例えば図41のレコード10903から、照合
方法識別子「代表読み照合方法」を得る。
【0367】次に、ステップ11002で取得した照合
方法識別子を基に、照合方法−照合キー対応データ10
113から、照合方法に対応した照合キーを取得する
(ステップ11003)。例えば照合方法識別子「代表
読み照合方法」を基に、図37のレコード10504か
ら照合キー識別子「第1表記文字クラス」を得る。
【0368】次に、ステップ11001で得た照合要素
の値から照合キー値を取得する(ステップ1100
4)。例えば、表記列「足立 修」の先頭字「足」を得
て、その文字クラス「漢字」を得る(照合モジュール1
0106が文字の辞書等を用いて取得する)。
【0369】次に、ステップ11004で得た照合キー
値をコード化する(ステップ11005)。コード化の
詳細については、後に図43で説明する。更に、これに
よって得た照合キー値コードをリスト形式で保持してお
く(ステップ11006)。
【0370】次に、ステップ11003で取得する照合
キーについて、他に該当する照合キーがあるかを判定す
る(ステップ11007)。該当する照合キーがあれ
ば、ステップ11003〜ステップ11006の処理を
繰り返す。例えば図37のレコード10505〜105
08等が該当し、これらについてステップ11003〜
ステップ11008の処理を繰り返す。
【0371】ステップ11007で該当する照合キーが
無くなった場合は、次のステップ11008に進む。ス
テップ11008では、ステップ11002で取得する
照合方法識別子について、他に該当する照合方法識別子
があるかを判定する。該当する照合キーがあれば、ステ
ップ11002〜ステップ11008の処理を繰り返
す。例えば図41のレコード10904及び10905
等が該当し、これらについてステップ11002〜ステ
ップ11008の処理を繰り返す。つまり、読み・表記
照合方法、単純照合方法についても照合キーを取得する
処理を繰り返す。
【0372】ステップ11008で該当する照合方法識
別子が無くなった場合は、次のステップ11009に進
む。ここまでの処理で、照合モジュール10106に関
する全ての照合方法の全ての照合キーについて、照合キ
ー値をコード化した値のリストを得ている。次に、イン
デクス−ドメイン対応データ10112を参照し、多次
元データ処理モジュール10107に登録要求するドメ
インの識別子を取得する(ステップ11009)。例え
ば図39のレコード10703を参照し、ドメイン識別
子「名簿照合ドメイン」を取得する。
【0373】次に、照合キー−次元対応データ1011
4を参照し、ステップ11006で作成した照合キー値
コードのリスト及びレコード識別子を、多次元データ処
理モジュール10107での次元に対応付ける(ステッ
プ11010)。例えば、図38のレコード10603
〜10607等を参照し、照合キー値コードを次元に対
応付ける。すなわち「足立 修」の第1表記文字クラス
「漢字」のコード値を、次元「第1表記文字クラス」に
対応付ける。また、レコード識別子rid1を次元「レコー
ド識別子」に対応付ける。
【0374】次に、多次元データ処理モジュール101
07にエントリ登録要求する(ステップ11011)。
この要求で、ステップ11009で取得したドメイン識
別子「名簿照合ドメイン」でドメインを指定し、ステッ
プ11010で作成した次元とコード値を指定する。多
次元データ処理モジュール10107でエントリ登録が
終了したら、この処理を終了する。この処理により、1
つのレコードについてのエントリ登録で、ソートに適用
する照合方法の全ての照合キーのコード値が、多次元デ
ータドメイン10116に登録される。
【0375】図43は本実施形態の照合キー値のコード
の一例を示す図である。図43では、図42の照合モジ
ュール10106のエントリ登録でのステップ1100
5で作成するコードの構成例を表している。
【0376】照合キー11101は、代表読み照合方法
の第1段階での照合キーであり、表記列第1文字の文字
クラスのコードを示している。なお、表記列「足立
修」の表記列第1文字「足」の文字クラスは「漢字」で
あり、JIS X 4061に規定されている文字クラスの番号
「11」と対応させて、照合キーのコードを「11」と
している。
【0377】照合キー11102は、代表読み照合方法
の第2段階での照合キーであり、代表読みのコードを示
している。なお、表記列「足立 修」、読み列「あだち
おさむ」の代表読みは「あし」であるので(照合モジュ
ール10106が代表読み辞書を用いる等して決定す
る)、JIS X 4061に規定されている以下の番号に対応さ
せてコード化している。
【0378】文字クラスの番号:仮名…「10」 文字クラス内での文字の順番:「あ」…「1」、「し」
…「12」 清濁属性番号:「あ」(清音)…「0」、「し」(清
音)…「0」 記号種別属性番号:「あ」(大文字)…「0」、「し」
(大文字)…「0」 仮名種別属性番号:「あ」(平仮名)…「0」、「し」
(平仮名)…「0」 同様にして、第1分節表記列、読み列、表記列等の全て
の照合キーについてコード化する。なお、これらのコー
ドは順番を数値化しており、数値の大小が、照合キーの
順序に対応している。従って、多次元データ解析でその
数値の大小で比較し、昇順に並べることにより、照合キ
ーの順番を示すソート処理結果が容易に得られる。
【0379】図44は本実施形態の多次元データドメイ
ン10116に保持する多次元データの一例を示す図で
ある。図42のエントリ登録の処理で示した様に、ソー
トに適用される全ての照合方法の全ての照合キーについ
て次元を作成する。
【0380】図44では、第1表記文字クラス1120
1、代表読み11202、第1分節表記列11203、
読み列11204、表記列11205、及びレコード識
別子11206のそれぞれの次元を作成しており、これ
らの次元について、図43で示した様な照合キーのコー
ド値を配置する。
【0381】ここで、読み列の次元は、代表読み照合方
法と読み・表記照合方法について共有され、また、表記
列の次元は、代表読み照合方法、読み・表記照合方法及
び単純照合方法で共有されている。
【0382】以上により、照合に関する全ての照合キー
のコード値が、対応する多次元データドメイン1011
6に保持される。
【0383】図45は本実施形態のソート要求1015
1を含む問合せ処理の処理手順を示すフローチャートで
ある。図45では、アプリケーションプログラム101
02が表データストア10105に格納された文字列の
ソートを要求したときの処理を表しており、例えばアプ
リケーションプログラム10102からは、名簿である
表10115に対して、氏名10301とふりがな10
302の組をキーとして(それぞれ照合要素の表記列、
読み列として)、代表読み照合方法に基づいてソートす
る様に要求する。
【0384】一般にアプリケーションプログラム101
02では、この様な処理の要求については問合せに対し
てカーソルを定義し、そのカーソルをオープンした後に
フェッチにより1件づつ問合せの結果を取得する。なお
図45では、アプリケーションプログラム10102か
らのカーソルオープン要求に対して、データベース処理
サーバ10103がソートした問合せ処理結果のリスト
を作成する処理を示している。
【0385】まず、データベース処理サーバ10103
は、アプリケーションプログラム10102からの問合
せ要求の解析を行なって解析結果を得る(図33の問合
せ解析結果10152に相当)。ここでは、一般的な解
析処理により、ソート要求10151を含む問合せ要求
であることを解析し、例えば名簿である表10115の
氏名10301及びふりがな10302の列の組につい
て、代表読み照合方法によるソート要求10151であ
ることを解析する(ステップ11301)。
【0386】次に、ソート処理に定義・設定済みのイン
デクスを利用するかどうかを判定する。この判定では、
名簿である表10115で、氏名10301及びふりが
な10302を対象としたインデクス定義情報1011
0を探索し(ステップ11302)、該当するインデク
ス定義情報10110があるかどうかを調べる(ステッ
プ11303)。
【0387】該当するインデクス定義情報10110が
ある場合は、設定済みのインデクスを利用するデータベ
ース処理手順とすることを決定する(ステップ1130
4)。続いて、該当するインデクス定義情報10110
を取得しておく(ステップ11305)。ここでは、該
当する図36のレコード10406及び10407の情
報を取得する。
【0388】ステップ11304で該当するインデクス
定義情報10110がない場合は、レコードから多次元
データを作成してソートするデータベース処理手順に決
定する(ステップ11306)。
【0389】続いて、問合せ解析10852で決定した
データベース処理手順に従って、データベース処理サー
バ10103はデータベース処理を実行する。データベ
ース処理サーバ10103は、インデクスを利用するデ
ータベース処理手順であるかどうか判定する(ステップ
11307)。
【0390】設定済みのインデクスを利用する場合は、
インデクス管理部10109にインデクスを用いたソー
トを行う様に要求する(図33のインデクスソート要求
10153に相当)。インデクス管理部10109は、
ステップ11305で取得したインデクス定義情報10
110を受け取り、ソート要求10151に応じた処理
を行う(ステップ11308)。この要求では、ソート
要求10151に指定されたインデクス識別子及び照合
方法識別子を指示する。インデクス管理部10109
は、インデクス定義情報10110の照合モジュール識
別子を基に、対応する照合モジュール10106にソー
ト処理を行う様に要求する。照合モジュール10106
は、多次元データ処理モジュール10107を用いて、
図42の処理で登録した多次元データの解析を行い、レ
コード識別子のリスト10157を取得し、処理結果と
して返す。ソート要求時の照合モジュール10106の
処理の詳細については、図46で説明する。インデクス
管理部10109は、この処理結果をソート結果のレコ
ード識別子のリスト10157とする。
【0391】ステップ11307で設定済みのインデク
スを利用しない(多次元データを作成してソートする)
データベース処理手順の場合は、データベース処理サー
バ10103は表データストア10105から全てのレ
コードを取得し、それらを多次元解析してソート処理す
る(ステップ11309)。この処理については図49
で説明する。この処理結果として照合順番に並んだレコ
ード識別子のリスト10157を作成する。
【0392】ステップ11308またはステップ113
09の処理が終了すると、データベース処理サーバ10
103は、アプリケーションプログラム10102に問
合せ処理終了を返信し(ステップ11310)、問合せ
処理を終了する。
【0393】図46は本実施形態のソート処理時の照合
モジュール10106の処理手順を示すフローチャート
である。図46では、照合モジュール10106がイン
デクス管理部10109からのソート要求10151に
応じて、図45のステップ11308で起動される処理
を表しており、この処理の入力はインデクス識別子と照
合方法識別子である。
【0394】照合モジュール10106は、ユーザのソ
ート要求10151に指定された照合方法識別子を基
に、照合方法−照合キー対応データ10113を参照し
て、照合キー識別子と照合段階10503を取得する
(ステップ11401)。例えば照合方法識別子「代表
読み照合方法」に従い、図37のレコード10504の
照合キー識別子「第1表記文字クラス」と照合段階10
503「1」等を得る。
【0395】次に、ステップ11401で取得した照合
キー識別子を基に、照合キー−次元対応データ1011
4から次元識別子を取得する。例えばステップ1140
1で取得した照合キー識別子「第1表記文字クラス」に
対応して、図38のレコード10603等から次元識別
子「第1表記文字クラス」等を取得する。
【0396】次に、ステップ11402で取得した次元
識別子と、ステップ11401で取得した照合段階10
503から、次元と優先度の組を作成する(ステップ1
1403)。例えば照合キー識別子「第1表記文字クラ
ス」の照合段階10503が「1」であることから、次
元識別子「第1表記文字クラス」で識別される次元の優
先度を「1」とする。
【0397】次に、ステップ11401で取得する照合
キーについて、他に該当する照合キーがあるかを判定す
る(ステップ11404)。他に該当する照合キーがあ
る場合は、ステップ11401からステップ11404
を繰り返す。他に該当する照合キーがない場合は次のス
テップ11405に進む。ここまでの処理で、次元識別
子「第1表記文字クラス」、「代表読み」、「第1分節
表記列」、「読み列」及び「表記列」について、それぞ
れ優先度「1」、「2」、「3」、「4」及び「5」が
対応付けられる。
【0398】ステップ11405では、インデクス管理
部10109から受け取ったインデクス識別子を基に、
インデクス−ドメイン対応データ10112を参照し
て、ドメイン識別子を取得する。図39のレコード10
703を参照し、ドメイン識別子「名簿照合ドメイン」
を得る。
【0399】次に、ステップ11403で作成した次元
識別子と優先度の組から、多次元データ解析要求する際
のパラメタを作成する(ステップ11406)。ここ
で、処理結果がレコード識別子のリスト10157とな
る様にパラメタを設定する。ここまでの処理が、図33
の照合−多次元データ解析変換10154に相当する。
【0400】次に、多次元データ処理モジュール101
07に多次元データ解析を要求する(ステップ1140
7)。これは図33の多次元データ解析要求10155
に相当する。多次元データ処理モジュール10107の
処理結果を受け取ったら、その結果のレコード識別子の
リスト10157をインデクス管理部10109に渡し
(ステップ11408)、この処理を終了する。以上に
より、アプリケーションプログラム10102からのソ
ート要求処理を実現する。
【0401】図47は本実施形態のソート処理結果の一
例を示す図である。多次元データ解析結果10156−
1は、代表読み照合方法によってソートした結果を示し
ている。第1表記文字クラス、代表読み、第1分節表記
列、読み列、表記列のそれぞれの次元をこの順に優先し
て、それぞれの値(照合キーのコード値)の昇順になる
様に多次元データ解析した結果である。これは、代表読
み照合方法の各照合段階10503での照合キーの評価
を行った場合と同等の結果となる。
【0402】この結果でレコード識別子のリストrid2、
rid3、rid1、rid5、rid4、rid7、rid6、rid8、rid
9、...が得られる。これは、代表読み照合方法で氏
名10301及びふりがな10302の列の値をソート
した場合のレコードのレコード識別子のリスト1015
7となる。
【0403】同様に、多次元データ解析結果10156
−2は読み・表記照合方法によってソートした結果を示
し、多次元データ解析結果10156−nは単純照合方
法によってソートした結果を示している。いずれもそれ
ぞれの照合方法で氏名10301及びふりがな1030
2の列の値をソートした場合のレコードのレコード識別
子のリスト10157が得られる。
【0404】図48は本実施形態の多次元データを作成
してソート処理するときの多次元データの一例を示す図
である。図48では、図45のステップ11309にお
いて、レコードから多次元データを作成してソート処理
を行うときの多次元データストア10108に保持する
多次元データを表している。
【0405】図45のステップ11309においては、
一時作業用多次元データドメイン101601にデータ
ストアからレコードについての照合キーのコード値を配
置し、図46に示した様な処理によりソートを行う。詳
細は図49に示す。
【0406】一時作業用多次元データドメイン1160
1には、ソートに適用する照合方法の照合キーに対応す
る第1表記文字クラス11602〜表記列11606
と、レコード識別子に対応するレコード識別子1160
7を作成する。これに、図43に示した様なコード値を
配置する。
【0407】図49は本実施形態の多次元データを作成
するソート処理の処理手順を示すフローチャートであ
る。図49では、図45のステップ11309におい
て、表データストア10105からレコードを取得して
多次元データを作成してソートを行う処理のフローチャ
ートを表している。
【0408】まず、データベース処理サーバ10103
は、照合モジュール−照合方法対応データ10802を
参照し、ソート要求10151で指定された照合方法に
対応する照合モジュール識別子を取得する(ステップ1
1701)。例えば、代表読み照合方法についての照合
モジュール識別子jisx4061を得る。
【0409】次に、照合方法−照合キー対応データ10
113を参照し、ソート要求10151で指定された照
合方法の照合キーと照合段階10503の情報を取得す
る(ステップ11702)。そして照合キー−次元対応
データ10114を参照し、照合キーから次元識別子を
取得する(ステップ11703)。ステップ11704
では、多次元データ処理の一時作業用多次元データドメ
イン11601を取得する。
【0410】次に、表データストア10105から、ソ
ート対象のレコードを取得する(ステップ1170
5)。ステップ11706では、照合キー値とレコード
識別子を多次元データの次元に対応付ける。ユーザから
の要求に従って、レコードの氏名の列値を照合要素の表
記列の値とし、ふりがなの列値を照合要素の読み列の値
とする。この値を基に、照合モジュール10106が、
照合キー値を作成し多次元データ解析での次元に対応付
ける。
【0411】次に、照合モジュール10106は、一時
作業用多次元データドメイン11601に、ステップ1
1706で作成した照合キー値を登録する(ステップ1
1707)(図42のエントリ登録の処理と同様に処理
を行う)。これにより図48に示した多次元データを作
成する。
【0412】次に、データベース処理サーバ10103
は、ステップ11705で取得したレコードについて、
他に該当するレコードがあるかを判定する(ステップ1
1708)。他に該当するレコードがある場合は、ステ
ップ11705からステップ11708を繰り返す。他
に該当するレコードがない場合は、次のステップ117
09に進む。ここまでの処理により、表データストア1
0105のソート対象となる全てのレコードについて、
一時作業用多次元データドメイン11601に照合キー
値の多次元データを登録する。
【0413】ステップ11709では、照合モジュール
10106が、照合方法−照合キー対応データ1011
3及び照合キー−次元対応データ10114を参照し、
次元識別子と優先度を組とした多次元データ解析のパラ
メタを作成する。例えば、代表読み照合方法では、第1
表記文字クラス、代表読み、第1分節表記列、読み列、
表記列の各次元を、この順で優先度をつけてパラメタを
作成する。
【0414】次に、照合モジュール10106が、ステ
ップ11709で作成したパラメタで多次元データ解析
要求を行い、多次元データ処理モジュール10107が
この要求に従って多次元データ解析を行う(ステップ1
1710)。データベース処理サーバ10103は、照
合モジュール10106の処理結果を受け取り、多次元
データ解析の処理結果をソート結果とし(ステップ11
711)、この処理を終了する。
【0415】以上により、設定済みのインデクスがない
場合でも、照合キーの多次元データを作成し、多次元デ
ータ解析することによりソート処理を行う。
【0416】次に本実施形態を適用し、照合方法を変更
した場合のソート処理を行う例を説明する。
【0417】図50は本実施形態の変更した照合方法定
義の一例を示す図である。図50では、変更を加えた照
合方法の定義データを表しており、この例では、前述の
JISX 4061の照合方法をサポートするデータベースシス
テム10101に、漢字の画数順による代表読み照合方
法、読み・表記照合方法、単純照合方法(それぞれ代表
読み画数照合方法、読み・表記画数照合方法、単純画数
照合方法と呼ぶ)を追加した場合の定義データを示して
いる。
【0418】照合方法−照合キー対応データ10113
において、レコード11801〜11805は、「代表
読み画数照合方法」の照合キーが「第1表記文字クラ
ス」、「代表読み」、「第1分節表記列」、「読み列」
及び「表記列画数」であり、それぞれ照合段階1050
3「1」、「2」、「3」、「4」及び「5」で評価す
ることを示している。同様に、レコード11806及び
11807は「読み・表記画数照合方法」の照合キー及
び照合段階10503を示し、レコード11808は
「単純画数照合方法」の照合キー及び照合段階1050
3を示している。
【0419】また、照合キー−次元対応データ1011
4において、レコード11809は、照合キー「表記列
画数」が次元「表記列画数」に対応することを示してお
り、照合モジュール−照合方法対応データ10802に
おいて、レコード11810〜11812は、それぞれ
代表読み画数照合方法、読み・表記画数照合方法、単純
画数照合方法が照合モジュールjisx4061と対応すること
を示している。
【0420】これらの定義データを基に、図42で説明
した多次元データエントリ登録処理、図46で説明した
多次元データ解析処理を行うことにより、前述のソート
処理が行われることと同様に、漢字の画数順による読み
・表記照合方法によるソート処理が行われる。但し、照
合モジュール10106で画数表記列をコード化する機
能を追加する必要がある。
【0421】図51は本実施形態の変更した照合方法定
義によるソート結果の一例を示す図である。図51で
は、図50に示した定義データを基にソートした結果を
表しており、多次元データ解析結果11901は、代表
読み画数照合方法によってソートした結果を示し、第1
表記文字クラス、代表読み、第1分節表記列、読み列、
表記列画数のそれぞれの次元をこの順に優先して、それ
ぞれの値(照合キーのコード値)の昇順になる様に多次
元データ解析した結果である。これは、代表読み画数照
合方法の各照合段階での照合キーの評価を行った場合と
同等の結果となる。
【0422】この結果でレコード識別子のリストrid2、
rid3、rid1、rid4、rid5、rid7、rid6、rid8、rid
9、...が得られる。これは、代表読み画数照合方法
で氏名10301及びふりがな10302の列の値をソ
ートした場合のレコードのレコード識別子のリスト10
157となる。
【0423】同様に、多次元データ解析結果11902
は、読み・表記画数照合方法によってソートした結果を
示し、多次元データ解析結果11903は、単純画数照
合方法によってソートした結果を示している。いずれも
それぞれの照合方法で氏名10301及びふりがな10
302の列の値をソートした場合のレコードのレコード
識別子のリスト10157が得られる。
【0424】ここで、多次元データ解析結果11901
〜11903をそれぞれ図47の代表読み照合方法、読
み・表記照合方法、単純照合方法のソート結果と比較す
ると、多次元データ解析結果11901及び11902
においては、レコード識別子rid4の「角田 正史」とレ
コード識別子rid5の「角田 雅志」のレコードの順番
が、JIS X 4061での漢字の順番と画数順の違いにより逆
になっている。また、多次元データ解析結果11903
においては、JIS X 4061での漢字の順番と画数順の違い
により順番が大きく異なっている。
【0425】この様に、本実施形態により、照合方法の
定義情報を変更するだけで、1つの多次元データ群を利
用して容易に他のソート機能をサポートすることができ
る。
【0426】図52は本実施形態の表記列、読み列の順
で評価する照合方法定義及びソート結果の一例を示す図
である。図52では、表記列、読み列の順で評価する照
合方法(表記・読み照合方法と呼ぶ)のソートをサポー
トした例を表しており、照合方法−照合キー対応データ
10113に、表記列、読み列の順で評価する表記・読
み照合方法を示すデータ12001及び12002を保
持している。
【0427】このデータを基に、図46に示した照合モ
ジュール10106によるソート処理を行うことによ
り、多次元データ解析結果12003を得る。表記・読
み照合方法で氏名10301及びふりがな10302の
列の値をソートした場合のレコードのレコード識別子の
リスト10157が得られる。
【0428】この様に本実施形態により、照合方法の定
義情報を変更するだけで、既存の多次元データを変更す
ることなくそのまま利用して、容易にソート機能をサポ
ートすることができる。
【0429】図53は従来のデータベースでのシステム
運用の概念を示す図である。従来の技術を適用したデー
タベースシステム12101では、1つのインデクスが
複数の照合方法に対応できない為、照合方法毎にインデ
クスを作成する。
【0430】表データストア12102に保持する表1
2103のインデクスキー列12104に対してインデ
クスを設定する。データベース処理サーバ12105に
対して、それぞれの照合方法に応じてインデクス格納領
域確保操作12106を行い、インデクスデータストア
12107を確保する。そして、インデクス定義操作1
2108を行い、定義データストア12109にインデ
クス定義情報12110を保持する。
【0431】図54は本実施形態のデータベースでのシ
ステム運用の概念を示す図である。本実施形態を適用し
たデータベースシステム10101では、1つの多次元
データ群で複数の照合方法に対応する為、1つの多次元
データドメイン10116を作成している。
【0432】データベース処理サーバ10103に対し
て、多次元データドメイン確保操作12201を行い、
多次元データストア10108に多次元データドメイン
10116を確保する。そして、インデクス定義操作1
2202を行い、定義データストア10104にインデ
クス定義情報10110を保持する。
【0433】複数の照合方法によるソートをサポートす
る場合、従来の技術を適用したシステムではそれぞれの
照合方法について複数回の運用操作が必要であったのに
対して、本実施形態を適用したシステムでは運用操作が
1回で良い。よって、複数の照合方法をサポートするシ
ステムの運用操作コストを削減することができる。
【0434】図55は従来のインデクスデータの概念を
示す図である。図53に示したデータベースシステム1
2101において、複数の照合方法のソートにそれぞれ
対応するインデクスデータストア12107に保持する
インデクスデータ12301は、キー値12302を含
んでいる。ここで、キー値はそれぞれのインデクスデー
タ内に同様の内容を重複して保持することになる。
【0435】図56は本実施形態の多次元データの概念
を示す図である。データベースシステム10101にお
いて、複数の照合方法のソートに対応する多次元データ
ストア10108に保持する多次元データドメイン10
116は、多次元データエントリ12401を含んでい
る。
【0436】複数の照合方法によるソートをサポートす
る場合、従来の技術を適用したシステムではそれぞれの
照合方法についてのインデクスにキー値を保持する必要
があったのに対して、本実施形態を適用したシステムで
は、多次元データドメイン10116に多次元データエ
ントリを1つ保持するだけで良い。よって、複数の照合
方法をサポートするシステムのリソースを削減すること
ができる。
【0437】なお、前述したフローチャートの処理は、
図34に示した様な一般的なデータ処理装置10201
でプログラムを実行することによって実現できる。ま
た、そのプログラムは、ハードディスク装置、フロッピ
ーディスク等のコンピュータで読み書きができる記録媒
体に格納することができ、ネットワークを通してプログ
ラムにアクセスすることができる。
【0438】前記の様に本実施形態によれば、複数の照
合方法に従ったソートをサポートする際に、多次元デー
タを複数の照合方法について共有し、その多次元データ
中の照合キーを用いて複数の照合方法のソート処理を行
うので、それぞれの照合方法でのソート処理の高速化、
多次元データ利用効率の向上(リソース削減)及び運用
操作コストの削減を行うことが可能である。
【0439】また、照合方法の定義情報を参照してその
照合方法で用いられる照合キーの定義情報を追加・変更
するだけで照合方法の追加・変更に対応することができ
るので、多次元データの利用効率の向上(リソース削
減)及び運用操作の容易化を行うことが可能である。
【0440】なお本実施形態では、名簿である表101
15に対して、氏名10301とふりがな10302の
組をキーとして代表読み照合方法に基づいてソートする
処理について説明したが、照合方法として他の言語を処
理する照合方法を用いることにより、多言語対応のソー
ト処理を行うことが可能である。
【0441】以上説明した様に本実施形態の照合処理装
置によれば、列値に対応する照合キーを示す多次元デー
タを複数の照合方法で共有し、多次元データ中の照合キ
ーを用いて異なる複数の照合方法によるソート処理を行
うので、複数の照合方法によるソート処理の高速化及び
多次元データの利用効率の向上を行うことが可能であ
る。
【0442】従来の並び替え処理では、単純照合や読み
・表記照合を評価することは可能であるが、文節毎の評
価が必要となる代表読み照合は実現不可能である為、表
計算ソフトでは並び替えを実現する様なマクロを作成し
たり、データベース管理システムではデータを取り出し
た後に独自に並び替え処理を行わなければならないとい
う問題がある。更に従来の並び替え処理では、並び替え
の為のインデクスを作成することができない為、並び替
え処理に時間がかかってしまう恐れがある。
【0443】本発明の目的は上記問題を解決し、ユーザ
独自のデータの並び替えを実行することが可能な技術を
提供することにある。
【0444】本発明の他の目的は並び替え処理で指定さ
れたルールによる並び替えを高速に実行することが可能
な技術を提供することにある。
【0445】本発明は、文字列を含む任意の要素より構
成されるデータの蓄積及び取り出しを行うデータ処理装
置において、指定されたルールに従ってデータの並び替
えを実行するものである。
【0446】本発明では、参照される列中の並び替えの
対象と並び替えの順番とを並び替えのルールとして定義
する。例えば、並び替えで評価する文字の文字列長、区
切り文字や評価除外文字と、昇順や降順の指示または文
字列の組み合わせによって並び替えの順番とを指定する
ことにより、並び替えを行う為のルールを登録して並び
替えのルールを定義する。
【0447】次に、並び替えで参照される列と当該参照
列の並び替えで使用するルールとを示す並び替え処理を
指定する。この並び替え処理の指定では、特定のルール
を第1条件として行った並び替えの結果が同順位となっ
た場合に、次に実行する並び替えの参照列及びルールを
第2条件、第3条件、..として指定しても良い。そし
て、前記指定された並び替え処理の内容に従って並び替
えを実行する。
【0448】前記の様に本発明では、予め定義されたル
ールに従って並び替えを行うので、並び替えの対象と順
番をユーザ独自に定義することにより、ユーザ独自のデ
ータの並び替えを実行することが可能になる。例えば、
前記ルールの定義の際に、並び替え対象となるデータの
バイト長と並び替えの順番を示すデータ列の組み合わせ
とを含む並び替えのルールを定義すれば、任意の言語で
用いられるデータ列を指定された順序で並び替えるルー
ルを定義することが可能であり、多言語対応の並び替え
を実行することができる。
【0449】また本発明において、並び替え処理に指定
されたルールで並び替えを行った結果のインデクスを作
成することにより、並び替え処理で並び替え実行要求さ
れた場合、インデクスを参照することにより並び替え結
果を得ることができ、並び替え処理を高速に行うことが
可能となる。
【0450】以上の様に本発明のデータ処理装置によれ
ば、並び替えを行う為のルールを予め登録しておき、指
定されたルールにより並び替えを実行するので、ユーザ
独自のデータの並び替えを実行することが可能である。
【0451】(実施形態201)以下に文字列を含む任
意の要素より構成されるデータの蓄積及び取り出しを行
う実施形態201のデータ処理装置について説明する。
【0452】図58は本実施形態のソート処理の処理概
要を示す図である。図58に示す様に本実施形態のデー
タ処理装置は、ソート処理部20100と、処理メニュ
ー表示部20101と、ルール定義部20102と、並
び替え処理登録部20103と、並び替え実行部201
04とを有している。
【0453】ソート処理部20100は、並び替え処理
全体を制御する処理部である。処理メニュー表示部20
101は、並び替えの処理メニューを表示する処理部で
ある。ルール定義部20102は、並び替えで参照され
る列中の並び替えの対象と並び替えの順番とを示す並び
替えのルールを定義する処理部である。
【0454】並び替え処理登録部20103は、並び替
えで参照される列と当該参照列の並び替えで使用するル
ールとを示す並び替え処理を指定する処理部である。並
び替え実行部20104は、前記指定された並び替え処
理の内容に従って並び替えを実行する処理部である。
【0455】データ処理装置をソート処理部2010
0、処理メニュー表示部20101、ルール定義部20
102、並び替え処理登録部20103及び並び替え実
行部20104として機能させる為のプログラムは、C
D−ROM等の記録媒体に記録され磁気ディスク等に格
納された後、メモリにロードされて実行されるものとす
る。なお前記プログラムを記録する記録媒体はCD−R
OM以外の他の記録媒体でも良い。
【0456】ソート処理部20100は、処理メニュー
表示部20101がルール定義要求20120、並び替
え処理登録要求20130、並び替え要求20140を
処理要求20150として受付けると、それぞれルール
定義部20102、並び替え処理登録部20103、並
び替え実行部20104で処理を行う。
【0457】ルール定義要求20120の際にはルール
名20121、並び替えルール20122が指定され、
並び替え処理登録要求20130の際には並び替え処理
名20131、並び替えルール名20132、対象列名
20133が指定され、並び替え要求20140の際に
は並び替えが行われる表20141と並び替えを行うル
ール名20142、対象列名20143又は又は並び替
え処理名20144を指定する。
【0458】ルール定義要求20120、並び替え処理
登録要求20130を受取ると、指定された情報をディ
スク装置20110内の並び替え登録データ20111
にルール情報20112、並び替え処理情報20113
にそれぞれ格納する。
【0459】図59は本実施形態のデータ処理装置の概
略構成を示す図である。データ処理装置20200は、
CPU20211、メモリ20213、I/O制御装置
20212を備えている。メモリ20213に格納され
たソート処理部20100をCPU20211が実行す
ることによりソート処理が行われ、I/O制御装置20
212によりディスク装置20110からのデータの読
み出し及び書き込み、モニタ20220への情報の表
示、キーボード20221、マウス20222からの情
報入力処理が行われる。
【0460】並び替えを行う為の表データ20231は
ディスク装置20110内に格納され、並び替え実行後
のソート結果表20232もディスク装置20110内
に格納される。ソート処理部20100はモニタ202
20にメニューを表示し、キーボード20221、マウ
ス20222による操作で情報を受取る。
【0461】図60は本実施形態の表20141の構成
例を示す図である。表20141は列名部20310と
データ部20320から構成され、表20141の一番
最初の行が列名部20310、それ以降がデータ部20
320となる。表20141は一つ以上の列20330
及び20340より構成されそれぞれの列に対して列
名、データが格納される。図の例では、列名として「氏
名」及び「ふりがな」が登録され、氏名列の列データと
して「鈴−木−一−郎」、「山−田−太−郎」、ふりが
な列の列データとして「すず−き−いち−ろう」、「や
ま−だ−た−ろう」が格納されている。
【0462】図61は本実施形態の処理メニュー表示部
20101の処理手順を示すフローチャートである。ソ
ート処理部20100を起動すると図61のフローの処
理メニュー表示部20101が実行される。以下図61
を用いて処理メニュー表示処理について説明する。
【0463】処理メニュー表示部20101は、ルール
定義、並び替え処理登録、並び替え要求のどれを実行す
るのかを選択する為のメニューを表示する(ステップ2
0410)。
【0464】ユーザよりルール定義が選択されると(ス
テップ20420)ルール定義部20102を実行して
ルール定義処理を行う(ステップ20421)。
【0465】並び替え処理登録が選択されると(ステッ
プ20430)並び替え処理登録部20103を実行し
て並び替え処理登録を行う(ステップ20431)。並
び替え実行が選択されると(ステップ20440)並び
替え実行部20104を実行して並び替え実行を行う
(ステップ20441)。
【0466】図62は本実施形態のルール定義部201
02の処理手順を示すフローチャートである。処理メニ
ュー表示よりルール定義が選択されると、ルール登録を
行う為のメニューを表示し、ユーザが項目の設定を行う
(ステップ20510)。
【0467】図63は本実施形態のルール定義メニュー
の一例を示す図である。メニュー内の各項目は、登録す
るルールの名称を入力するルール名20600、並び替
えを行う時に参照する列に関する情報設定部2060
2、並び替えの為のデータ設定部20650を表してい
る。
【0468】ルール名20600には今から登録するル
ールの名称を設定する。並び替えを行う時に参照する列
に関する情報設定部20602には、列参照時に全文字
列を対象にするか、n文字を対象にするか、区切り文字
までを対象にするかを選択する為のスイッチ20611
〜20613、n文字を対象にする場合の文字長206
14、区切り文字までを対象にする場合の区切り文字2
0615、並び替えを昇順または降順に行うことを指定
する為のスイッチ20616及び20617、並び替え
の評価対象にしない対象除外文字20618を設定す
る。
【0469】n文字列又は区切り文字列が選択されて評
価実施時に同順位になった場合に次の文節(n文字の場
合は次のn文字、区切り文字の場合は次の区切り文字が
出現するまでの文字)で再評価を行う指定の場合、次文
節評価20619をチェックする。
【0470】列20620以降の情報設定部20602
は、同時に複数列の文字に対して並び替え評価を行う場
合、参照する列数分同様に情報を設定する為のものであ
る。
【0471】並び替えの為のデータ設定部20650に
は、固定的に前に並べる項目である前方配置文字206
30、固定的に後ろに並べる項目である後方配置文字2
0640を設定する。
【0472】固定的に前に並べる項目は、昇順または降
順に関係なく並び替えの先頭に置きたい文字がある場
合、並べたい順番に文字を登録するものであり、対象と
なる文字列が格納された列の入力欄に文字を設定する。
【0473】例えば名簿を名前の順番で並び替える場合
に、ある特定の名前の人を最初に並べて、その他の人に
ついてふりがな順で並び替える様な場合、列1(206
10)に名前を割当て、前方配置文字20630の列1
(20631)の入力欄20634以降に前に並べたい
名前を入力することにより、入力した名前を並び替え結
果の前方に位置付けることができる。同様に固定的に後
ろに並べる項目は昇順または降順に関係なく並び替えの
最後に置きたい文字がある場合、並べたい順番に文字を
登録する。
【0474】列1、列2、列3と設定項目があるのは上
記列に関する情報設定部20602に設定した列情報の
どれに対応するかを示す為で、前方、後方配置を行う列
に対応する欄に情報の設定を行う。複数の列の組み合わ
せを指定させる場合、組み合わせたいそれぞれの列に対
応する欄に情報を設定する。
【0475】全項目設定後、OKボタン20603によ
りルール設定完了が通知されメニューに設定された定義
情報を受取り(ステップ20520)、ディスク装置2
0110内の並び替え登録データ20111のルール情
報20112に格納する(ステップ20530)。
【0476】図64は本実施形態のルール情報の詳細を
示す図である。ルール定義メニューに設定された情報
を、ルール名20800、列数20801、各列の対象
文字20802、各列のソート順指定20803、各列
の対象除外文字20804、前方固定データ有無208
10とデータ20811、後方固定データ有無2082
0とデータ20821として登録する。
【0477】図65は本実施形態の並び替え処理登録部
20103の処理手順を示すフローチャートである。次
に並び替え処理登録について図65を用いて説明する。
処理メニュー表示より並び替え処理登録が選択されると
並び替え処理登録を行う為のメニューを表示し、ユーザ
が項目の設定を行う(ステップ20910)。
【0478】図66は本実施形態の並び替え処理登録メ
ニューの一例を示す図である。メニュー内の各項目は、
登録する並び替え処理名21000、並び替えを適用す
るルール名21011とルールに指定された列2101
2〜21015に対応する列名21016〜21019
を指定する。並び替え結果が同順位の場合の処理を追加
する場合、第2条件21020、第3条件21030に
同様に並び替えを適用するルール名21021及びルー
ル名21031とルールに指定された列21022〜2
1025、列21032〜21035に対応する列名2
1026〜21029、列名21036〜21039を
指定する。
【0479】項目設定後、OKボタン21003により
入力完了が通知されメニューに設定された情報を受取り
(ステップ20920)、ディスク装置20110内の
並び替え登録データ20111の並び替え処理情報20
113に格納する(ステップ20930)。
【0480】図67は本実施形態の並び替え処理情報2
0113の詳細を示す図である。並び替え処理情報に設
定された情報を、並び替え処理名21100、条件数2
1101、条件毎のルール名21102、条件内のルー
ルに対応した列名21103として登録する。ルール名
は条件数だけ登録され、対応列名はルールに定義された
列数だけ登録される。
【0481】図68は本実施形態の並び替え実行部20
104の処理手順を示すフローチャートである。図69
は本実施形態の並び替え実行処理の続きを示す図であ
る。次に並び替え実行処理について図68及び図69を
用いて説明する。処理メニュー表示より並び替え実行が
選択されると、並び替え実行を行う為のメニューを表示
し、ユーザが項目の設定を行う。(ステップ2120
1)。
【0482】図70は本実施形態の並び替え処理実行メ
ニューの一例を示す図である。メニュー内の各項目は、
並び替えの対象となるデータが格納されたファイルの名
称が入力される並び替えファイル名21300、並び替
え実行結果が格納されるファイルの名称が入力される結
果格納ファイル名21301、並び替え処理の内容が入
力される並び替え処理指定欄21302、登録済みの並
び替え処理の名称が入力される並び替え処理名2130
5を表している。
【0483】並び替え処理の指定はルール名と列名を並
び替え処理指定欄21302に指定する方法と、並び替
え処理の名称を並び替え処理名21305に指定する方
法が選択可能で、ルールと列名を指定する場合、並び替
えを行うルール名21311とルールに指定された列2
1312〜21315に対応する列名21316〜21
319を指定する。
【0484】並び替え結果が同順位の場合の処理を追加
する場合、第2条件21320及び第3条件21330
以降に、並び替えルール名21321及びルール名21
331、ルールに指定された列21322〜21325
及び列21332〜21335に対応する列名2132
6〜21329及び列名21336〜21339を指定
する。
【0485】並び替え処理の名称を指定する場合、並び
替え処理登録で登録した並び替え処理の名称を並び替え
処理名21305に指定する。項目設定後、OKボタン
21303により完了が通知されると、設定された実行
用の情報を受取り(ステップ21202)、実際の並び
替え処理を実行する。並び替え実行用メニューに指定さ
れた、並び替えが実行されるファイルをディスク装置よ
り読み込み(ステップ21203)、ルールと列名が指
定されているか並び替え処理が指定されているかチェッ
クする(ステップ21204)。
【0486】ルールと列名が指定されている場合、指定
されているルールに対応する並び替え登録データ201
11のルール情報20112を取り出し(ステップ21
206)、取り出した情報に従って列の評価を行う。
【0487】対象文字が全文字列(ステップ2120
7)、n文字(ステップ21208)、区切り文字まで
(ステップ21210)が指定されているかチェック
し、全文字列が対象の場合は全文字列を並び替え対象と
し(ステップ21214)、n文字が指定されている場
合、指定された文字数の文字列を並び替え対象とし(ス
テップ21209)、区切り文字が指定された場合、指
定された区切り文字を文字列内よりサーチし(ステップ
21211)、区切り文字が有るかチェックし(ステッ
プ21212)、区切り文字があった場合、区切り文字
の前までの文字列を並び替えの対象とし(ステップ21
213)、区切り文字がなかった場合、全文字列を並び
替えの対象とする(ステップ21214)。
【0488】次に前方配置項目が指定されているかチェ
ックし(ステップ21215)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の前に位置
付ける(ステップ21216)。
【0489】次に後方配置項目が指定されているかチェ
ックし(ステップ21217)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の後に位置
付ける(ステップ21218)。
【0490】次に前方、後方に位置付けられなかった残
りの文字列に対して、昇順または降順指定をチェックし
(ステップ21219)、昇順指定されている場合昇順
に並び替えを行い(ステップ21220)、降順に指定
されている場合降順に並び替えを行う(ステップ212
21)。
【0491】指定された列に対するルールで評価結果が
同順位になり(ステップ21222)、次文節評価実行
指定されている場合(ステップ21223)、次の文節
の文字に関してステップ21208以降の処理を繰り返
す。次文節評価実行指定されておらず、次の列に対する
条件が指定されている場合(ステップ21224)、同
順位になった文字列に対して次の条件の実行を行う為に
ルール情報を取出し、ステップ21206以降の処理を
実行する。全ての並び替え処理の実行終了後、並び替え
実行結果を指定されたファイルに出力し(ステップ21
225)、処理を終了する。
【0492】並び替え処理が指定されていた場合、指定
されている並び替え処理名に対応する並び替え処理情報
20113を取り出し(ステップ21205)、処理情
報に指定されたルール名、列名を参照し、以下ルールと
列名が指定されている場合と同様の処理を実行する。
【0493】ルールに対応する並び替え登録データ20
111のルール情報20112を取り出し(ステップ2
1206)、取り出した情報に従って列の評価を行う。
対象文字が全文字列(ステップ21207)、n文字
(ステップ21208)、区切り文字まで(ステップ2
1210)が指定されているかチェックし、全文字列が
対象の場合は全文字列を並び替え対象とし(ステップ2
1214)、n文字が指定されている場合、指定された
文字数の文字列を並び替え対象とし(ステップ2120
9)、区切り文字が指定された場合、指定された区切り
文字を文字列内よりサーチし(ステップ21211)、
区切り文字が有るかチェックし(ステップ2121
2)、区切り文字があった場合、区切り文字の前までの
文字列を並び替えの対象とし(ステップ21213)、
区切り文字がなかった場合、全文字列を並び替えの対象
とする(ステップ21214)。
【0494】次に前方配置項目が指定されているかチェ
ックし(ステップ21215)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の前に位置
付ける(ステップ21216)。
【0495】次に後方配置項目が指定されているかチェ
ックし(ステップ21217)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の後に位置
付ける(ステップ21218)。
【0496】次に前方、後方に位置付けられなかった残
りの文字列に対して、昇順または降順指定をチェックし
(ステップ21219)、昇順指定されている場合昇順
に並び替えを行い(ステップ21220)、降順に指定
されている場合降順に並び替えを行う(ステップ212
21)。
【0497】指定された列に対するルールで評価結果が
同順位になり(ステップ21222)、次文節評価実行
指定されている場合(ステップ21223)、次の文節
の文字に関してステップ21208以降の処理を繰り返
す。次文節評価実行指定されておらず、次の列に対する
条件が指定されている場合(ステップ21224)、同
順位になった文字列に対して次の条件の実行を行う為に
ルール情報を取り出し、ステップ21206以降の処理
を実行する。全ての並び替え処理の実行終了後、並び替
え実行結果を指定されたファイルに出力し(ステップ2
1225)、処理を終了する。
【0498】本ソート処理部20100を、図60の名
簿データのふりがなを50音順に並び替える場合につい
て適用する。まず50音順に並び替えを行う為のルール
定義を行う。
【0499】図71は本実施形態の並び替え処理登録メ
ニューの指定例を示す図である。図71の様にルール名
20600を50音順(21401)で、列1(206
10)に対象文字列をn文字にチェックし(2141
0)、文字数を「1」(21411)にする。
【0500】対象除外文字に「−」(21412)を指
定し、次文節再評価も指定する(21413)。前方配
置文字20630の入力項目20631の列1の所に、
「あ」(21420)、「い」(21421)、「う」
(21422)、・・・「を」(21423)、「ん」
(21424)を登録する。
【0501】図72は本実施形態の並び替え処理実行メ
ニューの指定例を示す図である。並び替えの実行は、図
72の様に実行メニューで並び替え実行ファイル名に名
簿データ(21510)、実行結果ファイル名に名簿デ
ータ並び替え実行結果(21511)、第1条件213
10のルール名21311に登録したルール名「50音
順」(21520)を指定し、列1(21312)に列
名ふりがな(21521)を指定することにより、ふり
がな列の−を省いた文字列を1文字づつ、「あ」「い」
「う」・・・の順番に並び替えることができる。
【0502】図60の名簿データにはふりがなの列が存
在するが、ふりがな列が存在しない場合でも、名前列に
ついて、漢字の名前を読みの順番に登録したルールを登
録することにより、ふりがな列を必要とすることなく名
前の読み順に並び替えることも可能である。
【0503】同様に図60の名簿データを JIS X4061-1
996 に制定された照合方法の基本代表読み照合による並
び替えに適用する。基本代表読み照合は以下の5つの手
順により評価する。
【0504】(1)表記列の先頭文字を文字クラスの順
番に従って評価する。文字クラスは以下の様に分類され
る。
【0505】 1.スペース 2.記述記号 3.括弧記号 4.学術記号 5.一般記号 6.単位記号 7.アラビア数字 8.欧字記号 9.ラテンアルファベット 10.仮名 11.漢字 12.げた記号 (2)その文節の表記列、読み列より代表読みを決定
し、その代表読みを照合キーにして評価する。第2文節
以降についても評価することとする。
【0506】(3)その文節の表記列を照合キーとして
評価する。
【0507】(4)読み列を照合キーとして評価する。
【0508】(5)表記列を照合キーとして評価する。
【0509】図73は本実施形態の基本代表読み照合を
行う並び替えルールの情報設定部の設定例を示す図であ
る。まずルール定義で図73に示す様に(1)を評価す
る為に列1、(2)及び(3)を評価する為に列2及び
列3、(4)及び(5)を評価する為にそれぞれ列4及
び列5を割当てる。列1は先頭文字を文字クラスの順番
に並べるので、対象文字列をn文字にチェックし(21
611)、文字数を「1」にする(21612)。文字
クラスの順番を前方配置文字、後方配置文字の列1に対
応する欄に登録する。
【0510】図74は本実施形態の基本代表読み照合を
行う並び替えルールのデータ設定部の設定例を示す図で
ある。図74に示す通り、スペース(21701)、記
述記号(21702、21703)、括弧記号(217
04、21705)、学術記号(21706)、一般記
号(21707)の順番で登録し、順番で最後になる
「げた記号」を後方配置文字20640の方に登録する
(21731)。
【0511】次に列2及び列3で表記列及び読み列の文
節を取り出す為に、対象文字列の区切り文字をチェック
し(21621、21631)、区切り文字に「−」を
定義する(21622、21632)。(2)の代表読
みを照合キーにして行う評価と(3)の表記列を照合キ
ーとして行う評価結果の順で前方配置文字20630、
後方配置文字20640の列2及び列3の対応する欄に
文字の組み合わせを登録する。
【0512】図74の例で示す様に、列2と列3の文字
の組み合わせで「あ」又は「あん」と読む「安」(21
711)は、「あ」又は「あし」と読む「足」(217
12)より順位が高く、以下同様に安(あ、あん)<足
(あ、あし)<角(かく、かど)<足(そく)<角(つ
の)<安(やす、やすらか)といった様に設定する(2
1711〜21716)。
【0513】最後に、列4及び列5は読み列又は表記列
を照合キーとして評価するだけなので、それぞれ対象文
字列を全文字列にチェックし(21641、2165
1)、「−」を除外して(21643、21653)、
昇順並び替えを指定する(21642、21652)。
【0514】図75は本実施形態の並び替え処理登録メ
ニューの設定例を示す図である。並び替えの実行は、図
75に示す様に実行メニューで、第1条件21310の
ルール名に登録したルール名を指定し(21820)、
列1の列名に氏名(21821)、列2の列名に氏名
(21822)、列3の列名にふりがな(2182
3)、列4の列名にふりがな(21824)、列5の列
名に氏名(21825)を指定することにより、前記に
示した基本代表読み照合による並び替えを実行すること
ができる。以上によりユーザ指定の並び替え処理の登
録、実行を実現することができる。
【0515】以上説明した様に本実施形態のデータ処理
装置によれば、並び替えを行う為のルールを予め登録し
ておき、指定されたルールにより並び替えを実行するの
で、ユーザ独自のデータの並び替えを実行することが可
能である。
【0516】(実施形態202)以下に文字列を含む任
意の要素より構成されるデータの蓄積及び取り出しをデ
ータベースで行い、並び替えの実行結果を示すインデク
スを作成する実施形態202のデータ処理装置について
説明する。
【0517】図76は本実施形態のデータ処理装置22
000のシステム構成図を示す図である。情報処理装置
22030でDBアクセスアプリケーション2203
1、データ処理装置22000でDBMS22003が
稼動しており、これらデータ処理装置22000及び情
報処理装置22030はネットワーク22060に接続
され相互に通信を行うことができる。
【0518】DBアクセスアプリケーション22031
は、ネットワーク22060を介してデータ処理装置2
2000上のDBMS22003に問い合わせ実行要求
を行う。DBMS22003は、問い合わせ要求を受付
けるとデータ処理装置22000に接続されたディスク
装置22010に格納しているDBデータ22011を
アクセスすることにより問い合わせ要求に対応した処理
を実行する。
【0519】図77は本実施形態のデータ処理装置22
000及び情報処理装置22030の概略構成を示す図
である。図77に示す様にデータ処理装置22000
は、CPU2213、メモリ2214、I/O制御装置
2212、通信制御装置2211により構成される。メ
モリ2214に格納されたDBMS22003のプログ
ラムをCPU2213が実行することによりDBMS2
2003の処理が行われ、I/O制御装置2212によ
りディスク装置2210からデータの読み出し、書き込
みを行い、通信制御装置2211によりネットワーク2
2060で接続された他の情報処理装置22030とデ
ータの送受信を行う。
【0520】情報処理装置22030も同様の構成でメ
モリ2202にDBアクセスアプリケーション2203
1が格納され実行されている。DBアクセスアプリケー
ション22031がDBMS22003に問い合わせ実
行を行うと、情報処理装置22030の通信制御装置2
203よりデータ処理装置22000の通信制御装置2
211に要求が送信され、DBMS22003に問い合
わせが送られる。DBMS22003は、要求に応じた
処理の実行を行い、DBデータ22011へのアクセス
が必要な場合、I/O制御装置2212よりディスク装
置2210に格納されたDBデータ22011へのアク
セスを行う。処理結果を通信制御装置2211より情報
処理装置22030の通信制御装置2203に転送し、
要求元DBアクセスアプリケーション22031に返
す。
【0521】図78は本実施形態のDBMS22003
の処理概要を示す図である。図78に示す様に本実施形
態のデータ処理装置22000は、表定義部22101
と、挿入部22102と、検索部22103と、ルール
定義部22104と、並び替え処理登録部22105
と、処理要求受付部22106とを有している。
【0522】表定義部22101は、データベースの表
を定義する処理部である。挿入部22102は、データ
ベースにデータを挿入し、並び替えの実行結果を示す為
のインデクスを更新する処理部である。検索部2210
3は、データベースの検索結果を並び替える処理部であ
り、指定された並び替え処理の内容に従って並び替えを
実行する並び替え実行部の処理を行う処理部である。
【0523】ルール定義部22104は、並び替えで参
照される列中の並び替えの対象と並び替えの順番とを示
す並び替えのルールを定義する処理部である。並び替え
処理登録部22105は、並び替えで参照される列と当
該参照列の並び替えで使用するルールとを示す並び替え
処理を指定し、並び替えの対象となるデータについて、
並び替えの実行結果を示す為のインデクスを作成する処
理部である。処理要求受付部22106は、データベー
スへの処理要求22110を受付ける処理部である。
【0524】データ処理装置22000を表定義部22
101、挿入部22102、検索部22103、ルール
定義部22104、並び替え処理登録部22105及び
処理要求受付部22106として機能させる為のプログ
ラムは、CD−ROM等の記録媒体に記録され磁気ディ
スク等に格納された後、メモリにロードされて実行され
るものとする。なお前記プログラムを記録する記録媒体
はCD−ROM以外の他の記録媒体でも良い。
【0525】DBMS22003は、処理要求受付部2
2106により処理要求22110を受付けると、要求
の解析を行い、表定義部22101、挿入部2210
2、検索部22103、ルール定義部22104、並び
替え処理登録部22105の各操作を行う。
【0526】DBデータ22121には、DB情報22
122、表データ22123、インデクスデータ221
24が格納され、DB情報22122としては、表情報
22125、列情報22126、インデクス情報221
27、ルール情報22128、並び替え処理情報221
29等が格納される。
【0527】表情報22125は、表作成時に情報が追
加され、表名、構成列数等が設定される。列情報221
26にも同様に表作成時に情報が追加され、列を構成す
る表名、列名、列のデータ型情報等が設定される。イン
デクス情報22127にはインデクス作成時に情報が追
加され、インデクスを作成する表名、列名情報等が設定
される。ルール情報22128には、ルール定義部22
104によって並び替えルールに関する情報が追加さ
れ、並び替え処理情報22129には、並び替え処理登
録部22105によって並び替え処理が登録される表
名、列名、ルール名が追加される。
【0528】表データ22123に作成した各表のデー
タが格納される。検索部22103により列データを取
り出し、挿入部22102により行データを格納する。
インデクスデータ22124は、インデクス作成時に情
報が追加され、検索実行時にデータを高速に検索する為
に用いられる。
【0529】図79は本実施形態の表定義部22101
の処理手順を示すフローチャートである。図79以降を
用いて、本実施形態のデータベースシステムにおける並
び替え処理、並び替え用インデクスに関するDBMS2
2003の機能を機能毎に説明する。並び替え処理、並
び替え用インデクスに係る操作機能としては、表定義、
挿入、検索、ルール定義、並び替え処理定義等の機能が
ある。処理要求22110がDBMS22003に対し
て送られ、処理要求22110に対する操作機能の処理
が実行される。
【0530】図80は本実施形態の表定義処理の概要を
示す図である。まず、表定義処理について図80と図7
9を用いて説明する。処理要求22110が、作成する
表の表名22601、表を構成する列の列名2260
2、列のデータ型22603等と共にDBMS2200
3に送られる。DBMS22003では要求の解析を行
って表定義部22101を実行し、表名22611、列
数等をDB情報22122内の表情報22125に追加
し(ステップ22301)、表名22611、列名22
612及び22613、列データ型22614及び22
615をDB情報22122内の列情報22126に追
加する(ステップ22302)。
【0531】図81は本実施形態の挿入処理の概要を示
す図である。図82は本実施形態の挿入部22102の
処理手順を示すフローチャートである。次にデータ挿入
処理について図81と図82を用いて説明する。処理要
求22110が、データを挿入する表の表名2270
1、各列に挿入する列データ22702及び22703
等と共にDBMS22003に送られる。列のデータ型
には整数型や文字型等の型が有り、挿入データには各型
に対応したデータが指定される。
【0532】DBMS22003では要求の解析を行っ
て挿入部22102を実行し、表名22711に対応し
た表情報22125、列情報22126、インデクス情
報22127をDB情報22122より取得し(ステッ
プ22411)、列情報22126を参照して列データ
22712及び22713をDBデータ22121の対
応する表データ22123に格納する(ステップ224
12)。取得したインデクス情報22127を参照し、
挿入した表にインデクスが付加されている場合(ステッ
プ22415)、インデクスの更新を実行する(ステッ
プ22416)。
【0533】図83は本実施形態のルール定義処理の概
要を示す図である。図84は本実施形態のルール定義部
22104の処理手順を示すフローチャートである。次
にルール定義処理について図83と図84を用いて説明
する。処理要求22110が、登録する並び替えルール
のルール名23001と対象文字列情報23002、昇
順/降順情報23003、除外文字23004、次文節
評価フラグ23005等のルール情報と共にDBMS2
2003に送られる。
【0534】DBMS22003では要求の解析を行っ
てルール定義部22104を実行し、ルール名2301
1や対象文字列情報23012及び対象文字列情報23
022、昇順/降順情報23013及び昇順/降順情報
23023、除外文字23014及び除外文字2302
4、次文節評価フラグ23015及び次文節評価フラグ
23025等の情報をDB情報22122内のルール情
報22128に追加する(ステップ23201)。
【0535】図85は本実施形態の並び替え処理定義の
概要を示す図である。図86は本実施形態の並び替え処
理登録部22105の処理手順を示すフローチャートで
ある。
【0536】次に並び替え処理定義について図85と図
86を用いて説明する。処理要求22110が、登録す
る並び替え処理の処理名23101、並び替えを行う表
名23102、適用する並び替えルール名23103、
列名23104及び23105等と共にDBMS220
03に送られる。
【0537】DBMS22003では要求の解析を行っ
て並び替え処理登録部22105を実行し、処理名23
111、表名23112、ルール名23113及び23
123、列名23114、23115、23124及び
23125等をDB情報22122内の並び替え処理情
報22129に追加し(ステップ3310)、表名23
112、ルール名23113及び23123、列名23
114、23115、23124及び23125等をD
B情報22122内のインデクス情報22127に追加
する(ステップ3311)。ルール名23113及び2
3123に指定されたルール情報22128を取得し
(ステップ3312)、表名23112に指定された表
を参照し、並び替えの対象となるデータのインデクスを
作成する(ステップ3313)。
【0538】図87は本実施形態の表検索処理の概要を
示す図である。図88は本実施形態の検索部22103
の処理手順を示すフローチャートである。次にデータ検
索処理について図87、図88と図89を用いて説明す
る。処理要求22110が、取り出す表の表名2280
1、検索項目22802、並び替え指定22803と共
にDBMS22003に送られる。検索項目22802
には取り出す表の列名が指定される。
【0539】並び替え指定には、並び替えを行う為のル
ールと、ルールに対応させる列名を指定させる場合と、
並び替え処理登録により登録済みの並び替え処理名が指
定される場合がある。
【0540】DBMS22003では要求の解析を行っ
て検索部22103を実行し、表名22811に対応し
た表情報22125、検索項目22812及び2281
3に指定された列情報22126をDB情報22122
より取得し(ステップ22521)、並び替え指定22
814に関連するインデクス情報22127をDB情報
22122より取得する(ステップ22522)。並び
替え指定のチェックを行い(ステップ22523)、並
び替え指定の無い場合、表データ22123より列デー
タ22821及び22822を取り出し、その結果を返
却する(ステップ22525)。
【0541】図89は本実施形態のインデクスによる表
検索処理の概要を示す図である。並び替え指定されてい
た場合、指定が並び替えルールと、ルールに対応させる
列名の指定か並び替え処理名による指定かチェックし
(ステップ22530)、並び替えルールと、ルールに
対応させる列名の指定の場合、ルール情報の取得を行い
(ステップ22531)、指定された並び替えに使用可
能なインデクスの有無をチェックし(ステップ2253
2)、インデクスが無い場合、表データ22123より
列データ22821及び22822を取り出し(ステッ
プ22533)、ルールに従った並び替え実行し(ステ
ップ22830、ステップ22534)、その結果を返
却する(ステップ22525)。インデクスが有る場合
には、図89の通りインデクスデータ22124を参照
しそのインデクスの順番に表データ22123より列デ
ータ22921及び22922の取り出しを行い(ステ
ップ22930、ステップ22536)、その結果を返
却する(ステップ22525)。
【0542】並び替え処理名により並び替え指定されて
いた場合、並び替え処理情報22129、ルール情報2
2128の取得を行い(ステップ22535)、並び替
え処理に対応したインデクスデータ22124を参照し
そのインデクスの順番に表データ22123より列デー
タ22921及び22922の取り出しを行い(ステッ
プ22930、ステップ22536)、その結果を返却
する(ステップ22525)。
【0543】以上により、ユーザ指定の並び替え処理の
登録、実行、及び並び替えの為のインデクスの作成、イ
ンデクスを利用した並び替え結果の高速なアクセスが実
現される。
【0544】以上説明した様に本実施形態のデータ処理
装置によれば、並び替えを行う為のルールを予め登録し
ておき、指定されたルールにより並び替えを実行するの
で、ユーザ独自のデータの並び替えを実行することが可
能である。
【0545】また本実施形態のデータ処理装置によれ
ば、並び替え処理に指定されたルールで並び替えを行っ
た結果のインデクスを作成するので、並び替え処理で指
定されたルールによる並び替えを高速に実行することが
可能である。
【0546】
【発明の効果】本発明によれば、複数の種別のデータに
アクセスすることができるデータ処理システムにおい
て、種別ごとにデータ処理手段を選択し実行することが
できるので、種別による好適な処理を行うことができる
という効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例におけるデータ検索処理の概
要を示す概念図
【図2】本発明の一実施例におけるハードウェアの構成
【図3】データ処理システムでのデータ処理のフローチ
ャート
【図4】データ処理要求解析のフローチャート
【図5】データ検索処理要求の解析結果のデータ構造図
【図6】データ処理サーバ選択のフローチャート
【図7】データ種別-データ処理サーバ対応表の構成図
【図8】データ処理サーバへの処理要求のフローチャー
【図9】データ処理サーバへのデータ検索処理要求のデ
ータ構造図
【図10】データ処理結果編集のフローチャート
【図11】データ登録処理の概要を示す概念図
【図12】データ処理要求のインタフェースの概要図
【図13】データ登録処理要求の解析結果のデータ構造
【図14】データ処理サーバへのデータ登録処理要求の
データ構造図
【図15】データ登録処理要求のインタフェースの概要
【図16】データ登録処理要求のインタフェースの概要
【図17】データ登録処理要求の解析結果のデータ構造
【図18】データ登録処理でのデータ処理サーバへの処
理要求のフローチャート
【図19】データ処理サーバに登録するデータの構造図
【図20】データ検索処理でのデータ処理結果編集のフ
ローチャート
【図21】処理結果編集部で編集したデータの構造図
【図22】データ登録処理要求のインタフェースの概要
【図23】登録するデータの構造図
【図24】データ登録処理要求のインタフェースの概要
【図25】データ処理サーバ選択のフローチャート
【図26】データ処理サーバへ登録するデータの変換の
フローチャート
【図27】データ処理サーバへ登録するデータの変換の
概念図
【図28】データ検索処理要求のインタフェースの概要
【図29】データ検索処理結果のデータ構造図
【図30】データ処理サーバ選択のフローチャート
【図31】データ処理サーバを追加したデータ処理シス
テムの概念図
【図32】データ処理システムの概念図
【図33】本実施形態の文字列ソート処理の概要を示す
図である。
【図34】本実施形態の照合処理装置の概略構成を示す
図である。
【図35】本実施形態の表10115の一例を示す図で
ある。
【図36】本実施形態のインデクス定義情報10110
の一例を示す図である。
【図37】本実施形態の照合方法−照合キー対応データ
10113の一例を示す図である。
【図38】本実施形態の照合キー−次元対応データ10
114の一例を示す図である。
【図39】本実施形態のインデクス−ドメイン対応デー
タ10112の一例を示す図である。
【図40】本実施形態のデータベースシステム1010
1にレコードを挿入する処理の概要を示す図である。
【図41】本実施形態の照合モジュール−照合方法対応
データ10802の一例を示す図である。
【図42】本実施形態のエントリ登録時の照合モジュー
ル10106の処理手順を示すフローチャートである。
【図43】本実施形態の照合キー値のコードの一例を示
す図である。
【図44】本実施形態の多次元データドメイン1011
6に保持する多次元データの一例を示す図である。
【図45】本実施形態のソート要求10151を含む問
合せ処理の処理手順を示すフローチャートである。
【図46】本実施形態のソート処理時の照合モジュール
10106の処理手順を示すフローチャートである。
【図47】本実施形態のソート処理結果の一例を示す図
である。
【図48】本実施形態の多次元データを作成してソート
処理するときの多次元データの一例を示す図である。
【図49】本実施形態の多次元データを作成するソート
処理の処理手順を示すフローチャートである。
【図50】本実施形態の変更した照合方法定義の一例を
示す図である。
【図51】本実施形態の変更した照合方法定義によるソ
ート結果の一例を示す図である。
【図52】本実施形態の表記列、読み列の順で評価する
照合方法定義及びソート結果の一例を示す図である。
【図53】従来のデータベースでのシステム運用の概念
を示す図である。
【図54】本実施形態のデータベースでのシステム運用
の概念を示す図である。
【図55】従来のインデクスデータの概念を示す図であ
る。
【図56】本実施形態の多次元データの概念を示す図で
ある。
【図57】従来の環境変数等で指定した照合方法の例を
示す図である。
【図58】実施形態201のソート処理の処理概要を示
す図である。
【図59】実施形態201のデータ処理装置の概略構成
を示す図である。
【図60】実施形態201の表20141の構成例を示
す図である。
【図61】実施形態201の処理メニュー表示部201
01の処理手順を示すフローチャートである。
【図62】実施形態201のルール定義部20102の
処理手順を示すフローチャートである。
【図63】実施形態201のルール定義メニューの一例
を示す図である。
【図64】実施形態201のルール情報の詳細を示す図
である。
【図65】実施形態201の並び替え処理登録部201
03の処理手順を示すフローチャートである。
【図66】実施形態201の並び替え処理登録メニュー
の一例を示す図である。
【図67】実施形態201の並び替え処理情報2011
3の詳細を示す図である。
【図68】実施形態201の並び替え実行部20104
の処理手順を示すフローチャートである。
【図69】実施形態201の並び替え実行処理の続きを
示す図である。
【図70】実施形態201の並び替え処理実行メニュー
の一例を示す図である。
【図71】実施形態201の並び替え処理登録メニュー
の指定例を示す図である。
【図72】実施形態201の並び替え処理実行メニュー
の指定例を示す図である。
【図73】実施形態201の基本代表読み照合を行う並
び替えルールの情報設定部の設定例を示す図である。
【図74】実施形態201の基本代表読み照合を行う並
び替えルールのデータ設定部の設定例を示す図である。
【図75】実施形態201の並び替え処理登録メニュー
の設定例を示す図である。
【図76】実施形態202のデータ処理装置のシステム
構成図を示す図である。
【図77】実施形態202のデータ処理装置22000
及び情報処理装置22030の概略構成を示す図であ
る。
【図78】実施形態202のDBMS22003の処理
概要を示す図である。
【図79】実施形態202の表定義部22101の処理
手順を示すフローチャートである。
【図80】実施形態202の表定義処理の概要を示す図
である。
【図81】実施形態202の挿入処理の概要を示す図で
ある。
【図82】実施形態202の挿入部22102の処理手
順を示すフローチャートである。
【図83】実施形態202のルール定義処理の概要を示
す図である。
【図84】実施形態202のルール定義部22104の
処理手順を示すフローチャートである。
【図85】実施形態202の並び替え処理定義の概要を
示す図である。
【図86】実施形態202の並び替え処理登録部221
05の処理手順を示すフローチャートである。
【図87】実施形態202の表検索処理の概要を示す図
である。
【図88】実施形態202の検索部22103の処理手
順を示すフローチャートである。
【図89】実施形態202のインデクスによる表検索処
理の概要を示す図である。
【符号の説明】
103…データアクセス管理部、110…要求解析部、
111…処理サーバ選択部、112…データ処理要求
部、113…処理結果編集部、104−1、104−
2、…、104−n…データ処理サーバ、10101…
データベースシステム、10102…アプリケーション
プログラム、10103…データベース処理サーバ、1
0104…定義データストア、10105…表データス
トア、10108…多次元データストア、10109…
インデクス管理部、10110…インデクス定義情報、
10111…照合モジュール識別子、10112…イン
デクス−ドメイン対応データ、10113…照合方法−
照合キー対応データ、10114…照合キー−次元対応
データ、10115…表、10116…多次元データド
メイン、10151…ソート要求、10152…問合せ
解析結果、10153…インデクスソート要求、101
54…照合−多次元データ解析変換、10155…多次
元データ解析要求、10156…多次元データ解析結
果、10157…レコード識別子のリスト、10158
…レコード識別子、10106…照合モジュール、10
107…多次元データ処理モジュール、10201…デ
ータ処理装置、10202…CPU、10203…O
S、10204…通信コントローラ、10205…メモ
リ、10206…I/Oコントローラ、10207…シ
ステムバス、10208…データ入出力装置、1020
9…データ記憶装置、10210…ネットワーク、10
301…氏名、10302…ふりがな、10303…レ
コード識別子、10304〜10312…レコード、1
0401…インデクス識別子、10402…表識別子、
10403…列識別子、10404…照合モジュール識
別子、10405…照合要素種別、10406及び10
407…レコード、10501…照合方法識別子、10
502…照合キー識別子、10503…照合段階、10
504〜10511…レコード、10601…照合キー
識別子、10602…次元識別子、10603〜106
07…レコード、10701…インデクス識別子、10
702…ドメイン識別子、10703…レコード、10
801…アプリケーションプログラム、10802…照
合モジュール−照合方法対応データ、10851…登録
要求、10852…問合せ解析、10853…レコード
挿入、10854…レコード識別子、10855…イン
デクスメンテナンス、10856…照合キー−多次元デ
ータエントリ変換、10857…多次元データ登録要
求、10858…多次元データエントリ変換結果、10
901…照合モジュール識別子、10902…照合方法
識別子、10903〜10905…レコード、1110
1及び11102…照合キー、11201…表記文字ク
ラス、11202…代表読み、11203…第1分節表
記列、11204…読み列、11205…表記列、11
206…レコード識別子、11601…一時作業用多次
元データドメイン、11602…第1表記文字クラス、
11603…代表読み、11604…第1分節表記列、
11605…読み列、11606…表記列、11607
…レコード識別子、11801〜11812…レコー
ド、11901〜11903…多次元データ解析結果、
12001及び12002…データ、12003…多次
元データ解析結果、12101…データベースシステ
ム、12102…表データストア、12103…表、1
2104…インデクスキー列、12105…データベー
ス処理サーバ、12106…インデクス格納領域確保操
作、12107…インデクスデータストア、12108
…インデクス定義操作、12109…定義データスト
ア、12110…インデクス定義情報、12201…多
次元データドメイン確保操作、12202…インデクス
定義操作、12301…インデクスデータ、12302
…キー値、12401…多次元データエントリ、201
05…ソート結果表、20110…ディスク装置、20
111…並び替え登録データ、20112…ルール情
報、20113…並び替え処理情報、20120…ルー
ル定義要求、20121…ルール名、20122…並び
替えルール、20130…並び替え処理登録要求、20
131…並び替え処理名、20132…ルール名、20
133…対象列名、20140…並び替え要求、201
41…表、20142…ルール名、20143…対象列
名、20144…並び替え処理名、20150…処理要
求、20100…ソート処理部、20101…処理メニ
ュー表示部、20102…ルール定義部、20103…
並び替え処理登録部、20104…並び替え実行部、2
0200…データ処理装置、20211…CPU、20
212…I/O制御装置、20213…メモリ、202
20…モニタ、20221…キーボード、20222…
マウス、20231…表データ、20232…ソート結
果表、20310…列名部、20320…データ部、2
0330、20340及び20350…列、20600
…ルール名、20602…情報設定部、20603…O
Kボタン、20610…列、20611〜20613…
スイッチ、20614…文字長、20615…区切り文
字、20616及び20617…スイッチ、20618
…対象除外文字、20619…次文節評価、20620
…列、20621〜20623…スイッチ、20624
…文字長、20625…区切り文字、20626及び2
0627…スイッチ、20628…対象除外文字、20
630…前方配置文字、20631〜20633…入力
項目、20634〜20636…入力欄、20640…
後方配置文字、20641〜20643…入力項目、2
0644〜20646…入力欄、20650…データ設
定部、20800…ルール名、20801…列数、20
802…対象文字、20803…ソート順指定、208
04…対象除外文字、20810…前方固定データ有
無、20811…データ、20820…後方固定データ
有無、20821…データ、21000…並び替え処理
名、21003…OKボタン、21010…第1条件、
21011…ルール名、21012〜21015…列、
21016〜21019…列名、21020…第2条
件、21021…ルール名、21022〜21025…
列、21026〜21029…列名、21030…第3
条件、21031…ルール名、21032〜21035
…列、21036〜21039…列名、21100…並
び替え処理名、21101…条件数、21102…ルー
ル名、21103…列名、21300…並び替えファイ
ル名、21301…結果格納ファイル名、21302…
並び替え処理指定欄、21303…OKボタン、213
05…並び替え処理名、21310…第1条件、213
11…ルール名、21312〜21315…列、213
16〜21319…列名、21320…第2条件、21
321…ルール名、21322〜21325…列、21
326〜21329…列名、21330…第3条件、2
1331…ルール名、21332〜21335…列、2
1336〜21339…列名、22000…データ処理
装置、22003…DBMS、22010…ディスク装
置、22011…DBデータ、22030…情報処理装
置、22031…DBアクセスアプリケーション、22
060…ネットワーク、22201…CPU、2220
2…メモリ、22203…通信制御装置、22204…
I/O制御装置、22210…ディスク装置、2221
1…通信制御装置、22212…I/O制御装置、22
213…CPU、22214…メモリ、22110…処
理要求、22121…DBデータ、22122…DB情
報、22123…表データ、22124…インデクスデ
ータ、22125…表情報、22126…列情報、22
127…インデクス情報、22128…ルール情報、2
2129…並び替え処理情報、22101…表定義部、
22102…挿入部、22103…検索部、22104
…ルール定義部、22105…並び替え処理登録部、2
2106…処理要求受付部、22601…表名、226
02…列名、22603…データ型、22611…表
名、22612及び22613…列名、22614及び
22615…列データ型、22701…表名、2270
2及び22703…列データ、22711…表名、22
712及び22713…列データ、23001…ルール
名、23002…対象文字列情報、23003…昇順/
降順情報、23004…除外文字、23005…次文節
評価フラグ、23011…ルール名、23012…対象
文字列情報、23013…昇順/降順情報、23014
…除外文字、23015…次文節評価フラグ、2302
2…対象文字列情報、23023…昇順/降順情報、2
3024…除外文字、23025…次文節評価フラグ、
23101…処理名、23102…表名、23103…
ルール名、23104及び23105…列名、2311
1…処理名、23112…表名、23113及び231
23…ルール名、23114、23115、23124
及び23125…列名、22801…表名、22802
…検索項目、22803…指定、22811…表名、2
2812及び22813…検索項目、22814…指
定、22821及び22822…列データ、22921
及び22922…列データ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 河村 信男 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所システム開発本部内 (72)発明者 土田 正士 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所システム開発本部内 (72)発明者 鳥居 俊一 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所システム開発本部内 Fターム(参考) 5B075 KK02 ND03 NK02 NR03 NR20 PP23 PQ80 QP01 QP10 QS01 QT06 UU06 5B082 EA01 GA08

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】データの種別を区別し、種別の異なる複数
    のデータにアクセスすることが可能なデータ処理方法に
    おいて、 データ処理を行うデータ処理過程を、データの種別をも
    とに選択する第1の過程と、 第1の過程で選択した前記データ処理でデータ処理を実
    行する第2の過程とを含むことを特徴とするデータ処理
    方法。
  2. 【請求項2】請求項1に記載のデータ処理方法におい
    て、 前記第2の過程でのデータ処理において、前記データ処
    理手段が、前記データの種別に適切なデータ処理を行う
    第3の過程とを含むことを特徴とするデータ処理方法。
  3. 【請求項3】請求項1に記載のデータ処理方法におい
    て、 前記第1の過程において、ある限られた種別のみを処理
    対象として前記データ処理手段を選択する第4の過程と
    を含むことを特徴とするデータ処理方法。
  4. 【請求項4】請求項1に記載のデータ処理方法におい
    て、 前記第1の過程で選択した前記データ処理手段にデータ
    処理を要求する際に、前記データ処理手段で取り扱うデ
    ータの種別に合わせて要求を変換する第5の過程とを含
    むことを特徴とするデータ処理方法。
  5. 【請求項5】請求項1に記載のデータ処理方法におい
    て、 データを検索する方法であって、 前記第2の過程で前記データ処理手段がデータ処理を行
    なった処理結果データを編集し、データ検索処理の結果
    データを作成する第6の過程とを含むことを特徴とする
    データ処理方法。
  6. 【請求項6】請求項5に記載のデータ処理方法におい
    て、 前記第6の過程において、前記データ処理手段がデータ
    処理を行なった処理結果データを、あるデータの種別に
    変換して前記データ検索処理のデータ検索結果を作成す
    る第7の過程とを含むことを特徴とするデータ処理方
    法。
  7. 【請求項7】請求項1に記載のデータ処理方法におい
    て、 データを登録する処理であって、 登録対象のデータの種別で前記第1の過程でデータ処理
    手段を選択する第8の過程と、 前記第2の過程で、登録対象のデータを変換することな
    く前記選択したデータ処理手段でデータ登録を行う第9
    の過程とを含むことを特徴とするデータ処理方法。
  8. 【請求項8】請求項1に記載のデータ処理方法におい
    て、 部分データから構成されるデータを登録する方法であっ
    て、 部分データから、種別ごとにデータ処理手順に登録する
    ための登録用データを作成する第10の過程と、 システム内で一意となるデータ識別子を作成し、前記第
    10の過程で作成する登録用データに、該データ識別子
    を設定する第11の過程と、 前記登録用データをデータ処理手段で登録する第12の
    過程とを含むことを特徴とするデータ処理方法。
  9. 【請求項9】請求項1に記載のデータ処理方法におい
    て、 データを検索する方法であって、 前記第6の過程において、前記第11の過程で設定した
    データ識別子をもとに、同一のデータ識別子を持つデー
    タを構成する部分データから検索結果データを作成する
    第13の過程とを含むことを特徴とするデータ処理方
    法。
  10. 【請求項10】請求項1に記載のデータ処理方法におい
    て、 前記第1の過程において、データの種別と前記データ処
    理手段との対応を示す対応表を参照し、データの種別を
    キーとして前記データ処理手段を識別する情報を取得す
    ることによりデータ処理手段を選択する第14の過程と
    を含むことを特徴とするデータ処理方法。
  11. 【請求項11】請求項1に記載のデータ処理方法におい
    て、 前記第1の過程において、データ処理を実行することが
    可能なデータ処理手段を探索し、探索して検出したデー
    タ処理手段のデータ種別を取得し、取得したデータ種別
    によりデータ処理手段を選択する第15の過程とを含む
    ことを特徴とするデータ処理方法。
  12. 【請求項12】請求項1に記載のデータ処理方法におい
    て、 前記第1の過程において、処理対象のデータの第1の種
    別から種別の変換が可能な第2の種別に対応するデータ
    処理手段を選択する第16の過程と、 処理対象の第1の種別のデータを第2の種別のデータに
    変換する第17の過程とを含むことを特徴とするデータ
    処理方法。
  13. 【請求項13】英語や日本語といった自然言語の分類な
    どによってデータの種別を区別し、種別の異なる複数の
    データにアクセスすることが可能なデータ処理システム
    において、 登録や検索などのデータ処理を行うデータ処理手段をデ
    ータの種別をもとに選択する第1の手段と、 第1の手段で選択した前記データ処理手段にデータ処理
    を要求する第2の手段とを備えることを特徴とするデー
    タ処理システム。
  14. 【請求項14】請求項13に記載のデータ処理システム
    において、 該データ処理システムにおけるデータ処理の実行環境を
    示しデータ処理を制御するための実行環境変数を用い
    て、処理対象とするデータの種別を指定するアプリケー
    ションプログラミングインタフェースを備えることを特
    徴とするデータ処理システム。
  15. 【請求項15】請求項13に記載のデータ処理システム
    において、 処理対象とするデータを保持する変数の属性で種別を指
    定するアプリケーションプログラミングインタフェース
    を備えることを特徴とするデータ処理システム。
  16. 【請求項16】請求項15に記載のデータ処理システム
    において、 処理対象とするデータを構成する部分データを保持する
    変数の属性でデータの種別を指定するアプリケーション
    プログラミングインタフェースを備えることを特徴とす
    るデータ処理システム。
  17. 【請求項17】請求項13に記載のデータ処理システム
    において、 処理対象とするデータの内部に当該データの種別を指定
    するアプリケーションプログラミングインタフェースを
    備えることを特徴とするデータ処理システム。
  18. 【請求項18】請求項17に記載のデータ処理システム
    において、 処理対象とするデータの内部に当該データを構成する部
    分データの種別を指定するアプリケーションプログラミ
    ングインタフェースを備えることを特徴とするデータ処
    理システム。
  19. 【請求項19】請求項13に記載のデータ処理システム
    において、 言語、地域、エンコードからなるロケールなどのよう
    に、複数の要素から構成される種別によって、処理対象
    のデータの種別を指示するアプリケーションプログラミ
    ングインタフェースを備えることを特徴とするデータ処
    理システム。
  20. 【請求項20】請求項13に記載のデータ処理システム
    において、 処理結果のデータの種別を、標識子などの変数によって
    指示するアプリケーションプログラミングインタフェー
    スを備えることを特徴とするデータ処理システム。
  21. 【請求項21】請求項13に記載のデータ処理システム
    において、 データの種別と、当該データの種別に対してデータ処理
    を行うデータ処理手段を識別する情報の対応表を備える
    ことを特徴とするデータ処理システム。
  22. 【請求項22】請求項10に記載のデータ処理方法にお
    いて、 前記データの種別と前記データ処理手段との対応を示す
    対応表を編集する第18の過程を含むことを特徴とする
    データ処理方法。
  23. 【請求項23】英語や日本語といった自然言語の分類な
    どによってデータの種別を区別し、種別の異なる複数の
    データにアクセスすることが可能なデータ処理システム
    におけるプログラムおよびデータを格納する記憶媒体で
    あって、 登録や検索などのデータ処理を行うデータ処理手段をデ
    ータの種別をもとに選択する第1の手段と、 第1の手段で選択した前記データ処理手段にデータ処理
    を要求する第2の手段を備えるデータ処理システムのプ
    ログラムおよびデータを含むことを特徴とする記憶媒
    体。
  24. 【請求項24】列値に対応する照合キーの照合を行って
    レコードをソートする照合処理方法において、 ソート要求で指定された照合方法で評価対象となる列値
    に対応する照合キーの識別子を取得し、その照合キーを
    用いたソート処理を要求するステップと、 前記識別子で示される照合キーを参照し、前記列値が格
    納されたレコードを識別する為のレコード識別子を前記
    照合キーでソートし、前記列値に対応するレコード識別
    子を前記照合方法に応じて順序付けるステップとを有す
    ることを特徴とする照合処理方法。
  25. 【請求項25】列値に対応する複数の照合キーを多次元
    データとして保持し、多次元データ中の照合キーを異な
    る照合方法で共有することを特徴とする請求項24に記
    載された照合処理方法。
  26. 【請求項26】レコードを挿入する際にその列値に対応
    する照合キーを登録するステップを有することを特徴と
    する請求項24または請求項25のいずれかに記載され
    た照合処理方法。
  27. 【請求項27】指定された照合方法で列値の照合を行っ
    てレコードをソートする照合処理装置において、 ソート要求で指定された照合方法で評価対象となる列値
    に対応する照合キーの識別子を取得し、その照合キーを
    用いたソート処理を要求する照合処理部と、 前記識別子で示される照合キーを参照し、前記列値が格
    納されたレコードを識別する為のレコード識別子を前記
    照合キーでソートし、前記列値に対応するレコード識別
    子を前記照合方法に応じて順序付けるソート処理部とを
    備えることを特徴とする照合処理装置。
  28. 【請求項28】指定された照合方法で列値の照合を行っ
    てレコードをソートする照合処理装置としてコンピュー
    タを機能させる為のプログラムを記録したコンピュータ
    読み取り可能な記録媒体において、 ソート要求で指定された照合方法で評価対象となる列値
    に対応する照合キーの識別子を取得し、その照合キーを
    用いたソート処理を要求する照合処理部と、 前記識別子で示される照合キーを参照し、前記列値が格
    納されたレコードを識別する為のレコード識別子を前記
    照合キーでソートし、前記列値に対応するレコード識別
    子を前記照合方法に応じて順序付けるソート処理部とし
    てコンピュータを機能させる為のプログラムを記録した
    ことを特徴とする記録媒体。
  29. 【請求項29】文字列を含む任意の要素より構成される
    データの蓄積及び取り出しを行うデータ処理方法におい
    て、 並び替えで参照される列中の並び替えの対象と並び替え
    の順番とを示す並び替えのルールを定義するステップ
    と、並び替えで参照される列と当該参照列の並び替えで
    使用するルールとを示す並び替え処理を指定するステッ
    プと、前記指定された並び替え処理の内容に従って並び
    替えを実行するステップとを有することを特徴とするデ
    ータ処理方法。
  30. 【請求項30】並び替え対象のデータのバイト長と並び
    替えの順番を示すデータ列とを含む並び替えのルールを
    定義することを特徴とする請求項29に記載されたデー
    タ処理方法。
  31. 【請求項31】並び替えの実行結果を示す為のインデク
    スを作成するステップを有することを特徴とする請求項
    29または請求項30のいずれかに記載されたデータ処
    理方法。
  32. 【請求項32】文字列を含む任意の要素より構成される
    データの蓄積及び取り出しを行うデータ処理装置におい
    て、 並び替えで参照される列中の並び替えの対象と並び替え
    の順番とを示す並び替えのルールを定義するルール定義
    部と、並び替えで参照される列と当該参照列の並び替え
    で使用するルールとを示す並び替え処理を指定する並び
    替え処理登録部と、前記指定された並び替え処理の内容
    に従って並び替えを実行する並び替え実行部とを備える
    ことを特徴とするデータ処理装置。
  33. 【請求項33】文字列を含む任意の要素より構成される
    データの蓄積及び取り出しを行うデータ処理装置として
    コンピュータを機能させる為のプログラムを記録したコ
    ンピュータ読み取り可能な記録媒体において、 並び替えで参照される列中の並び替えの対象と並び替え
    の順番とを示す並び替えのルールを定義するルール定義
    部と、並び替えで参照される列と当該参照列の並び替え
    で使用するルールとを示す並び替え処理を指定する並び
    替え処理登録部と、前記指定された並び替え処理の内容
    に従って並び替えを実行する並び替え実行部としてコン
    ピュータを機能させる為のプログラムを記録したことを
    特徴とする記録媒体。
JP2000052109A 1999-05-18 2000-02-23 データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 Pending JP2001060164A (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP2000052109A JP2001060164A (ja) 1999-05-18 2000-02-23 データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体
KR10-2000-0009714A KR100372582B1 (ko) 2000-02-23 2000-02-28 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
SG200001142A SG100613A1 (en) 2000-02-23 2000-03-02 Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
CNB001038095A CN1155906C (zh) 2000-02-23 2000-03-03 数据处理方法、系统、处理程序及记录媒体
EP00301740A EP1128277A3 (en) 2000-02-23 2000-03-03 Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
KR10-2002-0057508A KR100372585B1 (ko) 2000-02-23 2002-09-23 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
KR10-2002-0057507A KR100372584B1 (ko) 2000-02-23 2002-09-23 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
US10/438,815 US20030217071A1 (en) 2000-02-23 2003-05-16 Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
US12/232,336 US20090024384A1 (en) 2000-02-23 2008-09-16 Data processing method and system, program for realizing the method, and computer readable storage medium storing the program

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP13656999 1999-05-18
JP11-172014 1999-06-18
JP17201499 1999-06-18
JP11-136569 1999-06-18
JP2000052109A JP2001060164A (ja) 1999-05-18 2000-02-23 データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001060164A true JP2001060164A (ja) 2001-03-06
JP2001060164A5 JP2001060164A5 (ja) 2005-05-19

Family

ID=27317301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000052109A Pending JP2001060164A (ja) 1999-05-18 2000-02-23 データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001060164A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140611A (ja) * 2005-11-14 2007-06-07 Fuji Electric Systems Co Ltd データ連携方式
JP2007293923A (ja) * 2007-08-02 2007-11-08 Sharp Corp データ処理装置
JP2010186225A (ja) * 2009-02-10 2010-08-26 Casio Hitachi Mobile Communications Co Ltd 電子機器及びプログラム
JP2014170539A (ja) * 2013-02-28 2014-09-18 Ricoh Co Ltd 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング
JP2018025859A (ja) * 2016-08-08 2018-02-15 日本電信電話株式会社 サービス提供システムおよびサービス提供方法
CN112487083A (zh) * 2016-07-20 2021-03-12 创新先进技术有限公司 一种数据校验方法和设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007140611A (ja) * 2005-11-14 2007-06-07 Fuji Electric Systems Co Ltd データ連携方式
JP2007293923A (ja) * 2007-08-02 2007-11-08 Sharp Corp データ処理装置
JP2010186225A (ja) * 2009-02-10 2010-08-26 Casio Hitachi Mobile Communications Co Ltd 電子機器及びプログラム
JP2014170539A (ja) * 2013-02-28 2014-09-18 Ricoh Co Ltd 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング
CN112487083A (zh) * 2016-07-20 2021-03-12 创新先进技术有限公司 一种数据校验方法和设备
CN112487083B (zh) * 2016-07-20 2024-03-12 创新先进技术有限公司 一种数据校验方法和设备
JP2018025859A (ja) * 2016-08-08 2018-02-15 日本電信電話株式会社 サービス提供システムおよびサービス提供方法

Similar Documents

Publication Publication Date Title
KR100372582B1 (ko) 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체
US6853992B2 (en) Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents
US6377946B1 (en) Document search method and apparatus and portable medium used therefor
JP3696745B2 (ja) 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
US5835912A (en) Method of efficiency and flexibility storing, retrieving, and modifying data in any language representation
US7293018B2 (en) Apparatus, method, and program for retrieving structured documents
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
JPH10240752A (ja) 構造化文書の登録方法,検索方法、およびそれに用いられる可搬型媒体
CN110795526B (zh) 一种用于检索系统的数学公式索引创建方法与系统
CN103440232A (zh) 一种科技论文标准化自动检测编辑方法
CN103440233A (zh) 一种科技论文标准化自动检测编辑系统
US7401071B2 (en) Structured data retrieval apparatus, method, and computer readable medium
CN112199960B (zh) 一种标准知识元粒度解析系统
JP2001060164A (ja) データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体
JP3617096B2 (ja) 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
CN101719162A (zh) 基于片段模式匹配的多版本开放式地理信息服务访问方法及系统
JP3786233B2 (ja) 情報検索方法および情報検索システム
CN114676258B (zh) 一种基于症状描述文本的非诊断为目的的疾病分类方法
JP2000003366A (ja) 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体
US8478732B1 (en) Database aliasing in information access system
JP2004118543A (ja) 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
Fujita et al. Institutional Repository Keyword Analysis with Web Crawler
EP0336579A2 (en) Relational databases
JPH1153400A (ja) 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体
JP2002297603A (ja) 情報抽出方法および構造化文書管理装置およびプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040713

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040713

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080925

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081016

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081107