JP2001060164A - データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 - Google Patents
データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体Info
- Publication number
- JP2001060164A JP2001060164A JP2000052109A JP2000052109A JP2001060164A JP 2001060164 A JP2001060164 A JP 2001060164A JP 2000052109 A JP2000052109 A JP 2000052109A JP 2000052109 A JP2000052109 A JP 2000052109A JP 2001060164 A JP2001060164 A JP 2001060164A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data processing
- collation
- processing
- sorting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
タ処理システムにおいて、データの種別を区別した処理
を行えるようにすること。 【解決手段】アプリケーション102からデータ処理サ
ーバ104が管理するデータベース114へのアクセス
を管理するデータアクセス管理部103と、種別を区別
した処理の要求を含むアプリケーションからの要求を解
析する要求解析部110と、データ処理を行うデータ処
理サーバを種別によって選択する処理サーバ選択部11
1と、データ処理サーバにデータ処理を要求するデータ
処理要求部112と、データ処理サーバの処理結果を編
集する処理結果編集部113からなる。 【効果】データの種別を区別し、種別ごとに適切な処理
を行える。
Description
関し、特に、データ処理システム内で取り扱う複数の種
別のデータにアクセスするのに好適なデータ処理技術に
関するものである。
データは多様であり、様々な種別のデータを混在させて
扱うことが必要である。
ある情報システムを統合する場合、各国拠点でそれぞれ
の地域の自然言語で記述された文書データを1つの中央
拠点のサーバで処理する必要がある。
報を集めて統合する場合、各国のWebサイトから提供さ
れる、各国の自然言語で記述されたHTML文書のファイル
を混在させる必要がある。
い言語の記述と、それを説明する母語あるいはすでに習
得している言語による記述を同時に扱う必要がある。
化してデータ処理を可能にするには、Unicodeと呼ばれ
る符号化文字集合を用いる方法がある。Unicodeは、国
際標準化機構(ISO)とUnicodeコンソーシアムが共同で開
発した多言語文字セットであり、世界の主要な文字セッ
ト規格を1つの大きな文字セット規格に組み入れてい
る。ISOはこの文字セットの規格をISO 10646と名付けて
いる。
タを取り扱うときには、Unicodeを用いる方法がある。
その方法は例えば ORACLE 8 National Language Suppor
t, An Oracle Technical White Paper, 1997.6 に記載
されている。
タベースを1つのデータベースに統合する際に、Unicod
eをデータベースサーバの文字コードとすることが理想
的であると示されている。データベースサーバ内では、
文字列型のデータをUnicodeという1つのデータ形式で
統一して取り扱う。クライアントの文字コードとデータ
ベースサーバの文字コードが異なる場合は、データベー
スサーバのデータベース管理システムが自動的に文字コ
ードの変換を行う。
は、公開特許公報 特開平10-232869号に開示されている
多言語対応通信システムがある。このシステムでは、自
然言語で記述された文書データを文法的、意味的に解析
した結果として得られる中間形式文書データをサーバ装
置に記憶する。そして、クライアント装置から文書デー
タの検索の要求があると、指定された文字列を含む中間
形式文書データを記憶装置から検索し、検索した中間形
式文書データからクライアント装置が要求する自然言語
で記述された文書データを生成し、生成された文書デー
タをクライアント装置に送信する。サーバ装置には、シ
ステムで扱うすべての文書データを、1つの中間形式で
記憶する。
Y句により処理結果をソートする様に問合せ要求行って
おり、その言語仕様は、日本工業規格JIS X 3005-1990
のデータベース言語SQLに規定されている。ソートのキ
ーには文字列を指定することが可能であり、その場合、
COLLATEによって照合順番を指定している。
SQL: a Complete Guide, Jim Melton, Morgan Kaufman
n, 1993”に記載されている。この文献には、次の様なS
QL文を用いる例が記載されている。
ソートする様に指定しており、ソートキーの文字列の文
字セットに適当な照合を明示的に指定するものである。
port, An Oracle Technical WhitePaper, 1997.6”に記
載されている例では、環境変数等で照合方法を指定して
いる。
方法の例を示す図である。図57では、照合方法の指定
と、SQL文による問合せ及びその処理結果の例を表し
ており、この例から判る様に、同じ文字の集合に対し
て、指定した言語によって異なるソートが行われること
を示している。
なる言語に対応させてソート処理を行った場合、ある文
字の集合を異なる言語の文字として異なる照合方法でソ
ート処理を行うと、照合方法によって異なる照合順番で
ソートが行われる為、前記の様に同じ文字の集合に対す
る処理であっても言語によってソート処理結果が異なる
ものになる。
その言語によって様々な照合順番があり、言語を日本語
に絞った場合であっても、単純照合、読み・表記照合、
代表読み照合等の様に種々の照合方法でソート処理を行
うと、その処理結果はそれぞれ異なるものになる。
として、特開平8−508123号公報に言語認識照合
システムが開示されている。また、日本語文字列の照合
順番に関する規格が、日本工業規格JIS X 4061-1996に
制定されており、この規格では、単純照合、読み・表記
照合、代表読み照合の3つの照合順番が規定されてい
る。
データベースを多言語対応としたり特定の言語に対して
複数の照合方法を用いるなどして、データベースの同一
の列値に対して異なる照合方法を適用する場合には、同
一の列値に対して照合方法毎に異なる照合キーを用いて
ソート処理を行うことになる為、それぞれの列値に対し
て照合方法に対応する照合キーを生成した後、生成した
照合キーのソートを行っている。
ータベースに格納したデータをソートする方法として、
インデクスを利用する方法がある。その例として、特開
平8−255170号公報にソート付き検索処理装置が
開示されている。
ス管理システムにおいては、ユーザ定義型に対してイン
デクスを作成するときの、順序評価を行うユーザ関数を
定義することができる。その例は“Object-Relational
DBMSs, Michael Stonebraker, Morgan Kaufmann, 199
6”に記載されている。これによれば、ユーザ定義関数
による任意の順番に従ったB-treeインデクスを作成する
ことができる。
階におけるさまざまな照合キーについて多次元的に解析
を行う必要がある。同様に多次元的なデータ解析により
検索を行うデータ処理方法の例として、特開平10−3
01937号公報に多次元ベクトル空間内の近傍検索方
法とそのプログラムの記録媒体が記載されている。この
方法では、色や形等の画像の特徴量を多次元データと
し、木構造のインデクスを用いることにより、ある画像
に類似した画像を高速に検索しており、各次元について
特徴量の検索範囲を限定して、類似した画像を検索する
ことにより、全ての画像との比較を行わずに範囲を限定
してデータ処理量を削減し、高速化を図っている。
(DBMS)では、ユーザより登録要求されたデータの
蓄積管理を行い、取り出し要求によりデータを取り出し
てユーザに返却する処理を行っている。この様な処理で
は、何も条件を指定せずデータの取り出しを行うと、取
り出せるデータの順番は不定であり、決まった順序でデ
ータを取り出す為に、データの並び替え機能が提供され
ている。
ードの値による昇順または降順並び替えや、システムに
組み込まれている場合には日本語文字列に対する50音
順並び替え等が可能である。例えばデータベース言語SQ
Lでは、ORDER BY句により検索結果をソートする様に要
求できる。その言語仕様は日本工業規格 JIS X 3005-19
90 データベース言語SQLに規定されている。
標)では、データの並び替え機能を持っており、メニュ
ーより並び替えを選択することにより並び替えダイアロ
グボックスが表示され、並び替えを行うキーや昇順また
は降順指定ができる様になっている。更に、オプション
機能で並び替え順序の指定メニューより、ユーザ定義リ
ストパネルで登録した任意の文字列の並びを選択する
と、キーの値をその順番に並び替えることが可能である
(Excel5.0 for Windows 操作ハンドブック ISBN4-816
3-1671-X、データの並び替えに関する記述p478〜p481、
ユーザ定義に関する記述p214)。
格が、日本工業規格 JIS X4061-1996 に制定されてい
る。この規格では、単純照合、読み・表記照合、代表読
み照合の3つの照合順番が規定されている。
のまま照合キーとして並び替えるもので、読み・表記照
合は並び替えを行う文字列とその読み列より、まず読み
列を照合キーによって並び替え、同順位になった場合、
文字列の方を照合キーとして並び替えを行うものであ
る。
易代表読み照合があり、基本代表読み照合は、それぞれ
代表読みが定めることが可能な様に分節された、読み列
及び表記列が与えられ、以下の(1)〜(4)手順によ
り得られた結果が照合結果となる。
を、文字クラスの順番に従って評価する。
は、二つの表記列中の各文節に対して、文節がある限
り、次の(a)及び(b)の規則を順次適用する。一方
の表記列に照合すべき文節が無くなった場合は、無くな
った表記列の方を、前の順序とする。両方の表記列に照
合すべき文節が無くなった場合、この段階では同順位と
する。
て代表読み辞書から代表読みを決め、その代表読みを照
合キーとして照合規則で評価する。
は、その文節の表記列を照合キーとして照合規則で評価
する。
合、読み列を照合キーとして、照合規則で評価する。
は、表記列を照合キーとして、照合規則で評価する。
て、格納したデータを並び替える方法としてインデクス
を利用する方法があり、その例として、特開平8-255170
号公報のソート付検索処理装置に開示されているものが
ある。インデクスを利用すると、並び替えを指定された
データ取り出し時に、データを並び替えることなく目的
の順番のデータが得られるので高速に処理を行うことが
できる。
複数の種別のデータをサーバで管理するときに、データ
の型やデータ形式を1つに統一しており、型やデータ形
式が同じデータに対しては、個々のデータをそれぞれの
種別を区別することについて配慮されておらず、データ
の種別ごとの特性に従った処理を行うことができないと
いう問題があった。
odeによって複数の言語(英語、日本語、ヘブライ語な
ど)の文字列データを1つの表に格納する場合、格納を
管理するサーバは、Unicodeでエンコードした文字デー
タとしてしか認識せず、どの言語であるかを区別しな
い。そのため、それぞれの言語に対応した全文検索処理
機能があっても、各言語のデータを選び出してそれぞれ
の言語特有の全文検索処理を適用するといったことがで
きない。例えば、全文検索において同義語や異表記の展
開などは言語によって異なり、また、日本語の場合は単
語の切り出しを行ったり、英語の場合は冠詞を除外する
など、それぞれ言語ごとの機能があるが、データの言語
を特定できなれけば、適切な機能を適用することができ
ない。
タにアクセスすることが可能なデータ処理システムにお
いて、データの種別ごとの特性に応じた処理を行うこと
を可能とすることにある。
発明のうち代表的なものの概要を簡単に説明すれば、以
下のとおりである。
の種別をもとに選択し、選択した前記データ処理手段で
データ処理を実行するデータ処理方法である。
してデータ処理を実行することにより、複数の異なる種
別のデータにアクセスする場合に、データ種別ごとの特
有のデータ処理を行うことができる。
例)を図面を用いて詳細に説明する。
る。図1は、本発明の第1の実施形態のデータ処理シス
テムにおいて、複数の自然言語で記述された文書のデー
タを検索する処理の概要を示す概念図である。
データを保持し、このシステムを利用するユーザからの
検索要求に応じて、複数の言語についてそれぞれ言語固
有の全文検索を行う。
理システム101は、アプリケーションプログラム(A
P)102と、データアクセス管理部103と、データ
処理サーバ104−1、104−2、…、104−n
と、それらを接続し互いに通信を行う経路となるネット
ワーク105からなる。
利用するユーザ106からの要求を表わすデータ処理要
求107をデータアクセス管理部103に送信し、その
要求に見合う処理結果108を受け取るプログラムであ
る。
するプログラム(図示していない)を用いて、AP102
で受け取ったデータを取り扱うことができるものとす
る。
理システム101に保持しているデータに対するAP10
2からのアクセスを管理する。
からのデータ処理要求107を受け付け、要求を解析
し、要求に見合った処理を行うのに適当なデータ処理サ
ーバ104−1、104−2、…、104−nへデータ
処理を要求し、データ処理サーバでの処理結果をAP10
2に返却する。
部109、要求解析部110、処理サーバ選択部11
1、データ処理要求部112、処理結果編集部113か
らなる。
部内で行う処理の実行制御を行う。データアクセス管理
部103で行う一連の処理の部分処理を、要求解析部1
10、処理サーバ選択部111、データ処理要求部11
2、処理結果編集部113で処理するよう制御する。
タ処理要求107を解析する。
のデータ処理要求107に見合うデータ処理を行うデー
タ処理サーバ104−1、104−2、…、104−n
を選択する。
のデータ処理要求107に見合うデータ処理を行うよう
データ処理サーバ104−1、104−2、…、104
−nに要求する。
バ104−1、104−2、…、104−nの処理結果
を、AP102の要求する処理結果108の形式となるよ
うに編集する。
2、…、104−nは、それぞれ、データベース114
−1、114−2、…、114−nに対するデータ11
5−1、115−2、…、115−nの登録および検索
を行う。一般的なデータベース管理システムで行われる
データ処理機能を提供するサーバである。
らのデータアクセスを管理することに対し、データ処理
サーバ104−1、104−2、…、104−nは、AP
102のデータ処理要求に見合う実際のデータ処理を行
う。
2、…、104−nは、それぞれ、ある言語に対応した
全文検索処理部116−1、116−2、…、116−
nを持つ。116−1は、英語の全文検索機能を提供す
る。116−2は、ギリシア語の全文検索機能を提供す
る。116−nは、ヘブライ語の全文検索機能を提供す
る。全文検索処理部116−1、116−2、…、11
6−nは、それぞれが各言語ごとの一般的な全文検索機
能を提供するプログラムモジュールで良い。
データ検索処理の概要を説明する。
索要求を入力する。「聖書に関連する文献の中から、
『降誕』という語を含む文献を探せ」という要求とす
る。
で以下のように記述する。
言語の種別に従う扱い方に関して、以下のようにデータ
処理することを要求する。
ア語とする。つまり、原文が英語かギリシア語で記述さ
れた文献のみを検索対象とする。
などの制御に用いられる部分や、表の名称などデータベ
ースのスキーマを構成する部分ではないもの)を、それ
ぞれの言語に翻訳する。つまり、「降誕」という文字列
の表記をそのまま検索処理に適用するのではなく、それ
ぞれの言語に翻訳した、「降誕」を意味することば(例
えば、英語ならば"Nativity"など)に置き換えて検索を
する。
言語の種別については、一般的なデータベースシステム
でデータベースサーバがアプリケーションプログラムか
らの要求の言語種別を認識するのと同様に、データアク
セス管理部103が認識するものとする。
ステムに登録されているデータの原文、原語どおりとす
る。
(ISO Final Draft International Standard (FDIS) Da
tabase Language SQL -- Part 2: Foundation (SQL/Fou
ndation) <<Part 2>> ISO/IEC FDIS 9075-2:1999 (E),
March 1999 において sessioncharacteristics に相当
するようなもの)で以下のように指定する。
アクセス管理部103にデータ処理要求を行う。
御部109による制御のもとで、以下の処理を行う。
7の検索要求文117を解析する。一般的なデータベー
ス管理システムによるSQLの解析で良い。解析結果には
以下が含まれる。
が「聖書」であること、検索条件は「『降誕』を含む」
ということ。
以下の3つを得る。
ギリシア語とすること。なお、データの種別に従う処理
を指示する情報として、データ種別処理指示121を作
成する。データ種別処理指示121の対象種別として、
データ種別を識別する値として"English"、"Greek"を設
定する。
は、それぞれの言語に翻訳すること。
るデータの原文、原語どおりとすること。
求するデータ処理サーバ104−1、104−2、…、
104−nを選択する。要求解析部110で解析した結
果であるデータ種別処理指示121をもとに、データ種
別-データ処理サーバ対応表122を参照して、データ
処理サーバを選択する。
2は、データ種別の識別子とデータ処理サーバ情報の組
を保持する(詳細はのちに図7に示す)。
2を参照して、データ種別処理指示121の対象種別に
設定されたデータ種別の識別子"English"、"Greek"をキ
ーとして、それに対応するデータ処理サーバ情報123
−1、123−2を取得し、そのデータ処理サーバ情報
123−1、123−2が示すデータ処理サーバを選択
したとみなす。
−2は、それぞれ、データ処理サーバ104−1、10
4−2に処理要求する際に必要な、サーバ処理サーバを
識別するサーバ名、処理要求の仕方を示すプロトコルを
含む。
処理サーバ情報123−1、123−2をもとに、それ
ぞれのデータ処理サーバ104−1、104−2に検索
要求する。データ処理サーバ情報123−1、123−
2に含まれるプロトコルに従って、要求解析部110が
解析した内容をもとに検索要求文を作成して、データ処
理サーバ104−1、104−2に検索要求する。
は、検索要求に見合うデータ検索処理を行う。それぞれ
各言語ごとの一般的な全文検索処理機能を有するデータ
ベース管理システムで行われる検索処理で良い。
は、要求に従い「『降誕』を含む」という条件で全文検
索処理部により、各言語固有の全文検索を行う。
は、検索処理の処理結果をデータアクセス管理部103
に返す。
編集部113で、データ処理サーバ104−1、104
−2の処理結果を、AP102が要求する結果となるよう
編集する。
のまま」である、という要求解析部110の解析結果に
従い、変換を加えずにそのままデータ処理サーバの処理
結果108をAP102に返却する。
シア語のデータ124−2を処理結果108として受け
取り、検索処理が終了する。
以下の効果がある。
理を行うデータ処理サーバ104−1、104−2、
…、104−nをデータ種別に従って選択し、各データ
処理サーバでデータ処理を行うことから、データの種別
ごとの特有のデータ処理を行うことができる。
構成について説明する。
ードウェア構成を示す図である。
に示すデータ処理装置の上で動作する。
201−3は、それぞれ中央演算装置(CPU)202−
1、202−2、202−3、主記憶装置(メモリ)2
03−1、203−2、203−3、入出力(I/O)コン
トローラ204−1、204−2、204−3、通信コ
ントローラ205−1、205−2、205−3および
これらを接続するシステムバス206−1、206−
2、206−3などからなる。また、I/Oコントローラ
204−1、204−2、204−3には、キーボード
やマウスおよびディスプレイなどのようなデータ入出力
装置207−1、207−2、207−3、および、磁
気ディスク装置のようなデータ記憶装置208−1、2
08−2、208−3などが接続される。
201−3は、通信コントローラ205−1、205−
2、205−3によりLAN(Local Area Network)などの
ネットワーク105に接続されており、ネットワーク1
05に接続されているほかのデータ処理装置と通信を行
なう。
CPU202−1、202−2、202−3がメモリ20
3−1、203−2、203−3に格納されたプログラ
ムを実行することにより実現される。AP102、データ
アクセス管理部103、データ処理サーバ104−1、
104−2、…、104−nの機能を実現するプログラ
ムは、メモリ205−1、205−2、205−3に格
納されてCPU202−1、202−2、202−3によ
り実行される。なお、AP102、データアクセス管理部
103、データ処理サーバ104、104−2、…、1
04−nはそれぞれソフトウェアの論理的な機能単位で
あり、それぞれが互いに物理的に異なるデータ処理装置
201−1、201−2、201−3上で動作しても良
いし、1つのデータ処理装置上でこれらの複数の機能の
プログラムが動作しても良い。また、データベース11
4−1、114−2、…、114−nなどは、データ記
憶装置208−1、208−2、208−3にデータを
格納することにより実現される。
データ処理の詳細について説明する。
る基本的なデータ処理の流れを示すフローチャートであ
る。
03に対してデータ処理を要求する(301)。データ
処理要求107をデータアクセス管理部103に送信す
る。
解析部110がデータ処理要求107を解析する(30
2)。解析結果としてデータ処理解析結果308とデー
タ種別種別指示121を出力する。
サーバ選択部111がデータ処理サーバを選択する(3
03)。データ種別処理指示121の対象種別のデータ
種別識別子をキーとして、データ種別-データ処理サー
バ対応表122からデータ処理サーバ104を選択し、
選択したデータ処理サーバのデータ処理サーバ情報12
3を出力する。
タ処理要求部112がデータ処理サーバ104にデータ
処理を要求する(304)。データ処理解析結果308
をもとに、データ処理サーバ情報123にもとづいてデ
ータ処理サーバに見合ったデータ処理要求309を作成
し、データ処理サーバ104に送信する。
理要求309に応じたデータ処理を行い、その処理結果
310をデータアクセス管理部103に返す(30
5)。
結果編集部113がAP102の要求に応じて処理結果デ
ータを編集する(306)。データ処理サーバ104か
らのデータ処理結果310を編集し、その結果をデータ
処理結果311として出力する。
タ処理結果311をAP102に返し、処理を終了する
(307)。
処理要求を、データアクセス管理部103がデータの種
別によってそれぞれデータの種別に対応したデータ処理
サーバ104を選択しデータ処理要求を行うので、デー
タの種別に応じたデータ処理を行うことが可能になる。
データ検索処理を詳細に説明する。
おりで、基本的な処理の流れは図3に示した処理の流れ
に従う。以下に、データ検索処理における各部分処理に
ついて説明する。
求解析部110がデータ処理要求を解析する処理の詳細
を示すフローチャートである。図3のデータ処理フロー
におけるステップ302の詳細を示す。
求文117を解析し、データ処理解析結果308を作成
する(401)。
検索対象の領域が「聖書」であることや、「降誕」を含
むという検索条件があることなどを解析し、その内容を
データ処理結果308に保持する。
別の指定を取得し、データ種別処理指示121を作成し
(402)、この要求解析処理を終了する。
18に示した実行環境変数TARGET_LANGのような形態で
ある。データ種別処理指示121の詳細については、の
ちの図5に説明する。
種別の指定から、処理対象とするデータの種別が解析さ
れる。これにより、処理対象とするデータの種別を区別
することができる。
解析結果のデータ構造を示す図である。AP102からの
データ検索要求107を解析した結果を示す。
8は、処理種別501、対象領域502、検索条件50
3からなる。
析の結果、「検索」を示す値が設定される。
M句を解析した結果、「聖書」を示す値が設定される。
RE句を解析した結果、「『降誕』を含む」を示す値が設
定される。
環境変数の指定をもとに作成される。
果、 TARGET_LANG:English, Greek … 504 が取得され、対象種別として、"English"505、"Gree
k"506が設定される。
果、 QUERY_LANG_TRANSLATION: YES … 507 が取得され、問合せ変換として「変換する」508が設
定される。
果、 RESULT_LANG: ORIGINAL … 509 が取得され、結果返却種別として「原文」510が設定
される。
解析した内容を構造化して表現することができる。ま
た、処理対象のデータ種別、問合せ中のデータの種別に
対する扱い方、処理結果として返却するデータの種別を
示すなど、データの種別に従った処理の指示を表現する
ことができる。
ーバを選択する処理のフローチャートである。図3のデ
ータ処理でのステップ303の詳細を示す。
種別処理指示121の対象種別のデータ種別識別子50
5、506をキーとして、データ種別-データ処理サー
バ対応表122(図7で説明する)に登録されているレ
コードを検索する(601)。その結果として、データ
種別-データ処理サーバ対応レコード603を取得す
る。
データ種別-データ処理サーバ対応レコード603に含
まれるデータ処理サーバ情報123を出力し(60
2)、この処理を終了する。
れぞれの種別に応じたデータ処理サーバを選択すること
ができる。
応表122の構成を示す図である。
01で参照する表である。
2は、データ種別識別子を保持する列701と、データ
処理サーバ情報を保持する列702からなる。
テム101内で各データ処理サーバを一意に識別するサ
ーバ識別子と、データ処理サーバへのデータ処理要求の
規約を示すプロトコル情報などからなる。
処理サーバの対応を示すレコードである。データ処理サ
ーバ情報には、英語に対応したデータ処理サーバのサー
バ識別子dbms_enを持ち、プロトコル情報には、SQLイン
タフェースであることを示す値SQLを持つ。
理サーバの対応を示すレコードである。データ処理サー
バ情報には、ギリシア語に対応したデータ処理サーバの
サーバ識別子dbms_elを持ち、プロトコル情報には、SQL
インタフェースであることを示す値SQLを持つ。
理サーバの対応を示すレコードである。データ処理サー
バ情報には、ヘブライ語に対応したデータ処理サーバの
サーバ識別子dbms_iwを持ち、プロトコル情報には、SQL
インタフェースであることを示す値SQLを持つ。
たデータ処理サーバとの関連を示すことができる。
ータ処理サーバへの処理要求処理を示すフローチャート
である。図3のデータ処理でのステップ304の詳細を
示す。
処理要求解析結果308をもとに、対象領域502をデ
ータ処理サーバ上のデータベースのスキーマにマッピン
グし、データ処理要求309を作成する(801)(デ
ータ処理要求309の詳細は図9で説明する)。処理サ
ーバ選択部111が処理サーバ選択処理303で選択し
たデータ処理サーバ情報123をもとに、データベース
のスキーマへのマッピングを行う。
理サーバに送信し(802)、この処理を終了する。
された各データ処理サーバに、それぞれに応じたデータ
処理要求を行うことができる。
データ処理サーバ104へのデータ処理要求のデータ構
造を示す図である。
8のステップ801)で作成されるデータ処理要求30
9の詳細を示す。
別"English"についてのデータ検索要求についてのみ示
す。データ種別"Greek"についても同様にしてギリシア
語のデータ処理サーバ用のデータ検索要求309が作成
される。
以下を含む。
2「聖書」を、英語のデータ処理サーバ104−1のデ
ータベース114−1のスキーマにマッピングし、Scri
pturesという表を検索対象とする。
3内の「降誕」を、データ種別処理指示121の対象種
別"English"506と、問合せ変換「変換する」509
に従って、'Nativity'という文字列に変換し、全文検索
のキーとする。
理要求107を、それぞれのデータ処理サーバに適した
形態で伝えることができる。
処理結果編集の処理を示すフローチャートである。図3
のステップ306の詳細を示す。
結果編集部113は、データ種別処理指示121を参照
し、結果返却の種別指定があるかどうかを判定する(1
001)。
7では、実行環境変数RESULT_LANG120で
指定され、データ種別処理指示121の結果返却種別
「原文」510が設定されている。
は、データ処理サーバ104からの処理結果310を、
データ種別処理指定121に設定されたデータ種別に従
ってデータを変換し、その変換結果をデータアクセス管
理部103の処理結果311とする(1002)。
指定されているので、変換せずに処理結果311とす
る。
は、データ処理サーバ104からの処理結果310をそ
のままデータアクセス管理部103の処理結果311と
する(1003)。
れたデータ種別のデータを返却することができる。
データ検索処理を行うことができる。
る、データ登録処理の詳細を説明する。
けるデータ登録処理の概要を示す概念図である。
あり、処理の流れは、図3に示したデータ処理の流れと
同じである。以下、データ登録の処理の流れに従って説
明する。
じてデータ登録要求を行う。ヘブライ語の文書データを
登録する要求であるとする。AP102はデータアクセス
管理部103にデータ登録の処理要求を行う。データ処
理要求107には、ヘブライ語の文書データ1101が
含まれる。
求解析部110で要求解析を行う。その結果としてデー
タ登録のデータ処理要求解析結果308とデータ種別処
理指示121を出力する。
対象データ1102が含まれる。
としてデータ種別識別子1103"Hebrew"が設定され
る。
種別処理指示121をもとに、データ処理サーバを選択
し、データ処理サーバ情報123−nを出力する。
イ語に対応したデータ処理サーバ104−nにデータ処
理要求を行う。
語のデータ402を、データベース114−nの中にヘ
ブライ語のデータ115−nとして格納する。また、ヘ
ブライ語に対応した全文検索処理部116−nが全文検
索インデクス1104−nに、データ115−1につい
てのインデクスエントリを登録する。
が完了すると、その結果がデータアクセス管理部103
に伝えられ、さらにAP102に登録処理が完了したこと
を伝えて、データ登録処理を終了する。
103が登録するデータ1101の種別によってデータ
登録処理を行うデータ処理サーバを選択することによ
り、データの種別に応じたデータ登録処理を行うことが
できる。
タのみを対象としてデータ登録処理を行うことができ
る。
すデータ構造図である。
録するデータの言語種別を示す実行環境変数の指定12
01と、データ登録要求文1202と、登録するデータ
1101からなる。
に、ヘブライ語を示すデータ種別の値"Hebrew"を設定し
ている。この実行環境変数INPUT_LANGにより、登録する
データがどの言語種別であるかを示す。値が"Hebrew"で
あることにより、登録するデータがヘブライ語であるこ
とを示す。
にデータを登録する」という要求を示すSQL文である。
登録するデータは、登録するデータ1101は、ヘブラ
イ語で記述されて文字列データである。SQL文1202
の変数:containsに関連付けられている。
するデータの種別を指定することにより、処理対象とす
るデータの種別を区別できるようにする。このデータ種
別の指定を、要求解析部110が図4のステップ402
で解析し、データの種別を区別することができる。
析結果308の構成を示す。
る解析結果の詳細を示す。
8は、処理種別1301と、対象領域1302と、処理
対象データ1302からなる。
のSQL文1202のINSERT文を解析した結果、「登録」
を示す値が設定されている。
のSQL文1202のINSERT文でINTO句を解析した結果、
「聖書」を示す値が設定されている。
求107に含まれているデータ1101からなる。
は、図12のデータ登録要求でのデータ種別の指定12
01を解析して認識される実行環境変数1303をもと
に、ヘブライ語を示す値"Hebrew"1103が設定され
る。
解析した内容を構造化して表現することができる。ま
た、処理対象のデータ種別を示すなど、データの種別に
よって処理することの指示を表現することができる。
らデータ処理サーバ104へのデータ登録処理要求のデ
ータ構造を示す図である。
処理要求である。
録の要求文1401とデータ1402からなる。
の要求文1401において、登録対象領域は、ヘブライ
語のデータ処理サーバ104−nのデータベース114
−nのスキーマにマッピングされ、ヘブライ語のデータ
ベースの聖書の表となる。
登録するよう指定されたヘブライ語のデータ1402が
設定される。
理要求107を、それぞれのデータ処理サーバに適した
形態で伝えることができる。
データ登録処理を行うことができる。
を、データの変数の属性で指定する例を示す。図15
は、AP102からのデータ処理要求107のデータ構造
を示す図である。
ータ1101を示す変数:contentsに対して、属性LANGU
AGE Hebrew1502を指定する。これにより、図12の
データ処理要求での、実行環境変数によるデータ種別の
指定1201と同等の指定を行う。
ることにより、先に示したデータ登録処理と同様の処理
を行うことができる。
データ種別の異なる複数の部分データからなるデータを
処理する第1の例を説明する。
と同じである。以下に、AP102からのデータ処理要求
から順に処理の流れに従って説明する。
のデータ処理要求107のインタフェースの概要を示す
図である。
れる要求文1601は、表Scripturesの3つの列titl
e、author、contentsに、それぞれ、文字列データを挿
入する要求であることを示す。
5、1606、1607は、それぞれ、表題の文字列デ
ータ1602のデータ種別が英語であること、著者の文
字列データ1603がギリシア語であること、内容の文
字列データ1604がヘブライ語であることを示してい
る。
異なる列値で1つの行値を構成することを指示すること
ができる。
によるデータ処理要求の解析結果のデータ構造を示す図
である。
データ処理要求解析結果308と同じである。異なる部
分は、処理対象データ1102の中に、列title、autho
r、contentsに対応した部分データ1701、170
2、1703を持つことである。
は、データ種別と値からなる。
データ種別"English"1704と、表題の文字列データ
の値1705からなる。
データ種別"Greek"1706と、著者の文字列データの
値1707からなる。
は、データ種別"Hebrew"1708と、内容の文字列デー
タの値1709からなる。
部分データのそれぞれのデータ種別を表わすことができ
る。
果に従ってデータ登録する際の、データ処理サーバへの
データ処理要求を作成する処理のフローチャートであ
る。
る処理の詳細である。
別処理指示121の対象種別からデータ種別識別子を取
り出す(1801)。データ種別識別子"English"など
がこれに相当する。
ップ1801で取り出したデータ種別に属する部分デー
タを集め、データ処理サーバに登録するための登録用の
データ1806を作成する(1802)。データ種別識
別子を"English"とした場合、titileの部分データ17
05を構成要素として登録用データ1806を作成す
る。
データにおいて、処理するデータ種別以外の部分データ
に、該当するデータが不明であることを示す情報unknow
nを設定する(1803)。データ種別識別子を"Englis
h"とした場合、author、contentsの部分をunknownとす
る。
を判定する(1804)。
801に戻って処理を繰り返す。1804までの処理を
繰り返すことにより、対象種別が複数の場合に、複数の
登録用データが作成される。つまり、ギリシア語とヘブ
ライ語の登録用データが作成される。
い場合は、次のステップに進む。
なるデータ識別子を発行し、登録用データに設定する
(1805)。複数の登録用データを作成した場合は、
発行した1つの同じデータ識別子を、すべての登録用デ
ータに設定する。以上で登録用データを作成する処理を
終了する。
データからなるデータの登録において、各データ種別ご
とに登録用データ1806を作成することができる。
用データの構成を示す図である。
は、データ種別"English"、"Greek"、"Hebrew"のそれぞ
れに対して作成され、それぞれ1806−1、1806
−2、1806−nのような構造となる。
806−2、1806−nは、同じシステム内データ識
別子1901を保持する。
た登録用データ1806−1は、データ識別子1901
と、titleの部分データで表題の文字列データ1902
−1と、authorの部分データunknown1903−1と、c
ontentsの部分データunknown1904−1からなる。こ
の登録用データ1806−1が、英語のデータ処理サー
バ104−1に登録される。
登録用データ1806−2は、データ識別子1901
と、titleの部分データunknown1902−2と、author
の部分データで著者の文字列データ1903−2と、co
ntentsの部分データunknown1904−2からなる。こ
の登録用データ1806−2が、ギリシア語のデータ処
理サーバ104−2に登録される。
登録用データ1806−nは、データ識別子1901
と、titleの部分データunknown1902−nと、author
の部分データunknown1903−nと、contentsの部分
データで内容の文字列データ1904−nからなる。こ
の登録用データ1806−nが、ヘブライ語のデータ処
理サーバ104−nに登録される。
データからなる処理対象データが、データ種別ごとの登
録用データとして表わされる。
タを検索した結果を編集する際の、処理結果編集部11
3での処理を示すフローチャートである。
プ1001の前に行う処理である。
理サーバから受け取ったデータの部分データから、unkn
ownではない実体データを取得して、処理結果データ3
11を作成する(2001)。
体データが集まったかどうかを判定する(2002)。
識別子をキーとして、unknownである部分データの実体
データを他のデータ処理サーバから取得し、処理結果デ
ータ311に設定する(2003)。すべての部分デー
タの実体データがそろったら処理を終了する。
ら、もとの1つの処理対象データが作成される。
結果データの構成を示す図である。
rの実体データ1903−2と、contentsの実体データ
1904−nを集められて、それぞれを部分データ21
02、2103、2104とし、処理結果データ210
1が作成される。
異なる複数の部分データからなるデータを処理する第2
の例を説明する。
uage)で記述された文書でタグを用いて部分データの言
語種別を指定する。
02のインタフェースを概要を示す図である。
た文書データである。
述されていることを示し、さらに、文字コードがUnicod
e UTF-8であることを示す。
の文書の表題を示す。また、タグlocaleの属性language
で"English"を指定することにより(2203)、タグl
ocaleで囲まれた部分が英語の文字列であることを示
す。
の文書の著者を示す。また、タグlocaleの属性language
で"Greek"を指定することにより(2205)、タグloc
aleで囲まれた部分がギリシア語の文字列であることを
示す。
この文書の要旨を示す。また、タグlocaleの属性langua
geで"Hebrew"を指定することにより(2207)、タグ
localeで囲まれた部分がヘブライ語の文字列であること
を示す。
異なる複数の部分データからなるデータを表現すること
ができる。
理サーバに登録するときの登録用データの構成を示す図
である。
た登録用データ2301を示す。
nglish"の実体2302をそのまま保持し、その他のデ
ータ種別の部分文字列は、unknownを示すタグ230
3、2304に置き換えられる。
データ処理サーバで適切なデータ処理が行える登録用デ
ータを表わすことができる。
より複雑なデータ種別を取り扱う例を説明する。
施形態と同じである。主に異なる点は、データ種別をよ
り複雑な構造の情報で示すことと、データ処理サーバの
選択において、取り扱うデータのデータ種別と一致しな
くても、データを変換してデータ処理サーバにデータ処
理要求を行うことである。
したインタフェースの概要を示す図である。
ア、ヘブライ語などの言語種別で表わしていたのに対し
て、この例では、さらに地域とエンコードの組合せによ
りデータの種別を示す。
rtable Operating System Interface for UNIX)規格の
ロケール(locale)モデルに従い、"en_US.iso88591"のよ
うに、言語、地域、文字コードを示すこととする。
が"iw_IL.iso88598"であることを実行環境変数で指定し
ている。これにより、登録するデータの言語がヘブライ
語で、地域がイスラエル、エンコードがISO8859-8であ
ることが示される。
な構成のデータ種別を表わすことができる。
種別のデータを登録する処理での、データ処理サーバを
選択する処理のフローチャートを示す図である。
処理と同じである。違いは、ステップ601とステップ
602の間で、データ種別識別子に一致するレコードが
ないかどうかを判定し(2501)、ない場合はデータ
変換が可能なデータ種別のデータ処理サーバを検索する
(2502)処理を含んでいることである。
種別のそれぞれに完全に対応するデータ処理サーバのす
べてが提供されていなくても、データ変換によりデータ
処理が可能な少数の種別に対応したデータ処理サーバで
データ処理を行うことができる。
録するときのデータを変換する処理のフローチャートを
示す図である。
処理対象データを、図25のステップ2502で検索さ
れたデータ変換可能なデータ種別に合わせてデータ変換
する(2601)。
致するデータ処理サーバが提供されていなくても、デー
タを登録することができる。
ータ変換したデータの構成を示す図である。
ータ401のロケールはiw_IL.iso88598で、データ種別
識別子2701は"iw_IL.iso88598"としているとする。
データ種別-データ処理サーバ対応表122にはこのデ
ータ種別識別子に一致するレコードがなく、データ変換
可能なデータ種別識別子"iw_IL.utf8"2702のレコー
ドが検索結果として得られるとする。そのデータ種別識
別子2702に従い、図26に示した処理によりデータ
変換が行われ、登録用データ2703が作成される。
に一致するデータ処理サーバが提供されていなくても、
データを登録することができる。
アプリケーションプログラムがデータの種別を受け取る
例を説明する。
施形態および第2の実施形態と同じである。主に異なる
点は、AP102がデータの種別をアプリケーションプロ
グラミングインタフェースで受け取ることである。
が処理結果で受け取るデータの種別を受け取る要求のイ
ンタフェースの概要を示す図である。
文2801で、結果として受け取るtitle、authorのそ
れぞれの言語を種別を、それぞれ標識子:sTLang280
2、:sAutLang2803で受け取るよう要求している。
種別のデータを保持するデータベースかららデータを検
索結果として受け取る場合に、受け取ったそれぞれのデ
ータがどの種別であるかをAP102が知ることができ
る。
で指定された検索要求で、標識子にデータ種別識別子を
返却する際のデータ構成の概要を示した図である。
集部113が、title、auhtorのそれぞれの部分データ
をデータ処理サーバ104−1、104−2から受け取
った際に、それぞれのデータ処理サーバのデータ種別識
別子"English"2901、"Greek"2902をもとに、処
理結果データ2903のtitleの標識子"English"290
4、authorの標識子"Greek"2905を設定する。
取ったデータの種別を知ることができる。
ネットワーク経由でデータ処理サーバを探索してデータ
処理を行うデータ処理サーバを選択する例を説明する。
と同じである。主な違いは、データアクセス管理部10
3でデータ種別-データ処理サーバ対応表122を用い
ないことである。
処理サーバ選択部111での、データ処理サーバを選択
する処理のフローチャートを示す図である。
てデータ処理サーバを探索し、データ処理種別指示12
1に含まれるデータ種別識別子に適合するデータ処理サ
ーバを選択して、そのデータ処理サーバの情報を返す
(3001)。
1のデータ処理サーバの構成を固定的にせず、また、デ
ータ種別-データ処理サーバ対応表122を保持しなく
ても、データ処理を行うデータ処理サーバを選択するこ
とができる。
データ処理システムにデータ処理サーバを追加する例を
説明する。
と同じである。主な違いは、フランス語のデータ処理サ
ーバ114−fをデータ処理システム101に追加し、
データアクセス管理部103のデータ種別-データ処理
サーバ対応表122にフランス語のデータ処理サーバの
情報を追加することである。
ータ処理システムの構成を示す概要図である。
2に、フランス語に適切なデータ処理を行うデータ処理
サーバのレコード3101を追加している。
うデータ処理サーバ104−fをネットワーク105に
接続し、データ処理システム101の一部となるように
している。
録処理およびデータ検索処理を行うことにより、追加し
たフランス語のデータ処理サーバ104−fの機能をデ
ータ処理システム101で利用することができる。
2にレコード3101を追加するだけで、フランス語の
データ種別に対応し、データ処理サーバ104−fのデ
ータ処理を行うことができる。
ータ処理システム101以外のアプリケーション310
2からも利用することができる。
含まれているデータ処理サーバ104−1、104−
2、…、104−n自体に対しては何も変更を加える必
要はない。
データ処理サーバに保持するデータの形式をすべて統一
する例を説明する。
と同じである。主な違いは、データ処理システム101
を構成するデータ処理サーバ104−1、104−2、
…、104−nに保持するデータの形式をすべて同一に
することである。
ータのデータ形式をすべてUnicodeとした例を示す。デ
ータ処理サーバ104−1、104−2、…、104−
nに保持するデータ3201−1、3201−2、…、
3201−nのエンコードを、すべてUTF8としている。
1、104−2、…、104−nで取り扱うデータの形
式はすべて同じでも良く、データの型や形式によらず、
データの種別によってデータ処理サーバを区別すること
ができる。
例では以下のことが可能となる。
スするデータ処理システムにおいて、 (1−1)APで扱う種別に依存するデータをそのままデ
ータ処理サーバでデータ処理するので、それぞれの種別
に依存する情報が失われることがなく、データの種別ご
との特性に従った処理を行うことができる。
し、それぞれに応じたデータ処理サーバに登録し、検索
時にそれらの部分データを組合せて元のデータをAPに返
却するので、1つのデータ中に複数の種別のデータが混
在したデータを扱える。
て、 (2−1)データ種別-データ処理サーバ対応表を編集
するだけで、データ処理サーバをデータ処理システムに
追加・削除することができるので、複数の異なる種別の
データにアクセスするデータ処理システムを容易に構築
することができる。
対応表を編集するだけで、既存のデータ処理サーバをデ
ータ処理システムに追加・削除することができるので、
種別に依存した機能を提供する既存のモジュールを利用
することができる。
サーバを利用することにより、種別に依存した機能を提
供するモジュールを必要最小限に配置することができ
る。
データベースシステムの多言語対応において有効であ
る。
図2に示したようなデータ処理装置でプログラムを実行
することによって実現できる。また、そのプログラム
は、ハードディスク装置、フロッピーディスクなどのコ
ンピュータで読み書きができる記憶媒体に格納すること
ができ、ネットワークを通してプログラムにアクセスす
ることができる。
次元データとして異なる照合方法で共有し、列値に対応
する照合キーの照合を行ってレコードをソートする一実
施形態の照合処理装置について説明する。
スを多言語対応としたり特定の言語に対して複数の照合
方法を用いるなどして、データベースの同一の列値に対
して異なる照合方法を適用する場合には、照合が行われ
る列値に対して照合方法に対応した照合キーを生成した
後に、生成した照合キーを用いてソート処理を行う為、
ソート処理の処理速度が低下するという問題がある。
ソート処理の際に生成された照合キーはそのソート処理
のみで用いられる為、生成した照合キーが他の照合方法
で利用できる場合であってもその照合キーを他の照合方
法で利用しておらず、照合キーの利用効率が低下すると
いう問題がある。例えば、読み・表記照合によるソート
処理と、読み・表記照合及び代表読み照合を組み合わせ
たソート処理とを特定の列値に対して行う場合には読み
・表記照合の照合キーとして同じものが用いられるが、
従来の照合処理方法では、個々のソート処理でそれぞれ
照合キーを生成している為、照合キーの利用効率が低下
していた。
の列値に対して行われる複数の照合方法の内容を変更し
た場合、生成する照合キーの内容を変更しなければなら
ない為、照合方法の変更・追加に容易に対応することが
できないという問題がある。
データベースに格納したデータをソートする際にインデ
クスを利用する方法があるが、従来のインデクスを利用
する方法では照合される列値に対応させたインデクスを
用いる為、同一の列値に複数の照合キーが対応する場合
には、従来のインデクスをそのまま適用することは困難
となるという問題がある。
いて、データベースに格納した文字列を、JIS X 4061に
規定されている照合方法に従ってソートする機能をサポ
ートすることを考え、一般的なリレーショナルデータベ
ースシステムで表の列に文字列を格納し、特開平8−2
55170号公報に開示されている方法を適用して、イ
ンデクスを用いてソート機能を提供すると、以下の様に
なる。
・表記照合方法に従ったソートをサポートする場合に
は、読み・表記照合方法に従って文字列の順序を決定
し、インデクスを構成する木構造をなすノードに、ソー
トのキー値とレコードを識別する情報を保持する。
ある。前記の文字列を格納した列に対して、更に代表読
み照合方法によるソートをサポートする場合に、前記の
読み・表記照合方法に従って作成したインデクスは、ノ
ード内部のレコードの順番が異なる為、利用することが
できない。この様に、B-tree等によってある順序に従っ
て作成したインデクスを他の照合方法に適用することは
できない為、複数の照合方法によるソートをサポートす
る場合には、それぞれの照合方法によるインデクスを複
数作成する方法や、インデクスを使わずに直接レコード
を照合評価してソートする方法等が考えられる。
ず、データベースシステム内で同じ列に対してそれぞれ
異なる順番評価による複数のインデクスを作成・管理す
る機能が必要になる。これは一般的なデータベース管理
システムには無い機能である。また、この機能を追加し
たとしても、サポートする複数の照合方法のそれぞれに
ついてインデクスを運用管理する必要があり、操作コス
トがかかることになる。また、それぞれのインデクスに
ついてインデクスデータを格納するファイル等のリソー
スが必要になる。更に、レコード登録・変更時のインデ
クスデータのメンテナンスのオーバヘッドが、インデク
スの数だけ大きくなる。
評価してソートする方法では、レコードを格納した領域
を全てアクセスする為、レコード全体のサイズが大きく
レコードの数が大量の場合、インデクスを利用してキー
値のみをアクセスする場合と比べて、高速に処理するこ
とはできない。
に、ソートを処理するときにインデクスを動的に作成
し、そのインデクスを用いてソートする方法が考えられ
る。しかし、この方法ではインデクス作成のオーバヘッ
ドがかかる為、既にインデクスが作成されている場合と
比べて、高速に処理することはできない。
照合方法を部分的に変更・追加する様な場合に容易に対
応できないという問題がある。例えば、JIS X 4061で
は、漢字についての順番は、日本工業規格JIS X 0208の
情報交換用漢字符号に定義された区点番号の順番や、日
本工業規格JIS X 0221の国際符号化文字集合(UCS)
−第1部体系及び基本多言語面に定義された符号位置の
順番とする様に規定されている。ここで、NTTの電話
帳の様に、漢字の順番評価の部分について画数順とした
い場合には、JIS X 4061に従って作成したインデクスは
順番が異なる為に利用できず、専用の順番評価を行う機
能とインデクスを別途作成する等の対策が必要である。
序評価でインデクスを作成する方法では、任意のある1
つの順序評価に基づいたインデクスを作成できるが、そ
のインデクスを他の順序評価に基づいたソートに適用す
ることはできない。
近傍検索方法を適用し、文字列の照合キーを多次元的に
解析して文字列照合する方法が考えられる。しかし、こ
の方法は、ある条件を満たすデータの集まりを取得する
方法からなり、検索範囲を限定することに有効ではある
が、ある規則(照合方法)に基づいて順番にソートする
ことには有効ではない。特に、複数の照合方法に基づい
た順番にソートすることには適用できない。以上をまと
めると、次の問題が挙げられる。
によるソートにしか対応できない。複数の照合方法によ
るソートについて配慮がされていない。複数の照合方法
に対してそれぞれインデクスを作成すると、それぞれの
インデクスについて、運用の操作コストがかかる。更
に、インデクスデータを格納するリソースが必要にな
る。また、レコード登録・変更時のインデクスメンテナ
ンスのオーバヘッドがかかる。
様な場合に容易に対応できない。照合方法の変更につい
ての配慮がされていない。変更により順番が変わってし
まう場合には、元の照合方法の為に作成したインデクス
を利用できない。
照合方法によるソート処理の高速化及び多次元データの
利用効率の向上を行うことが可能な技術を提供すること
にある。
を行ってレコードをソートする照合処理方法において、
列値に対応する照合キーを示す多次元データを複数の照
合方法で共有し、多次元データ中の照合キーを用いて異
なる複数の照合方法によるソート処理を行うものであ
る。
ムは、表データストアに格納された文字列に対して、さ
まざまな照合方法によってソートする様にデータベース
処理サーバに問合せ要求を行う。
ョンプログラムからの問合せ要求を受け取ると、その問
合わせ要求の解析を行い、インデクス管理部の処理を経
由して問合せ解析結果を照合モジュールに送って照合モ
ジュールにソート処理を要求する。
持されている各種データを参照し、ソート要求で指定さ
れた照合方法で評価対象となる列値について、その列値
に対応する照合キーの識別子を取得し、その識別子と共
に多次元データ処理モジュールに多次元データ解析要求
を行う。
子で示される照合キーを多次元データから読み出し、前
記列値が格納されたレコードを識別する為のレコード識
別子を前記照合キーを用いてソートし、前記列値に対応
するレコード識別子を前記照合方法に応じて順序付けて
レコード識別子のリストを生成する。
ード識別子のリストを多次元データ解析結果として照合
モジュールに返し、照合モジュールは、この多次元デー
タ解析結果を、ソート処理結果としてインデクス管理部
に渡す。データベース処理サーバは、インデクス管理部
でソート処理結果を受け取るとアプリケーションプログ
ラムに問合せ処理終了を返す。
法に従ったソートをサポートする際に、多次元データを
複数の照合方法について共有し、その多次元データ中の
照合キーを用いて複数の照合方法のソート処理を行うの
で、それぞれの照合方法によるソート処理の高速化、多
次元データ利用効率の向上(リソース削減)及び運用操
作コストの削減を行うことが可能である。
照合方法で用いられる照合キーの定義情報を追加・変更
するだけで照合方法の追加・変更に対応することができ
るので、多次元データの利用効率の向上(リソース削
減)及び運用操作の容易化を行うことが可能である。
ば、列値に対応する照合キーを示す多次元データを複数
の照合方法で共有し、多次元データ中の照合キーを用い
て異なる複数の照合方法によるソート処理を行うので、
複数の照合方法によるソート処理の高速化及び多次元デ
ータの利用効率の向上を行うことが可能である。
概要を示す図である。図33に示す様に本実施形態のデ
ータベースシステム10101は、照合モジュール10
106と、多次元データ処理モジュール10107とを
有している。
で指定された照合方法で評価対象となる列値に対応する
照合キーの次元識別子を取得し、その照合キーを用いた
ソート処理を要求する照合処理部である。多次元データ
処理モジュール10107は、照合モジュール1010
6で取得された次元識別子で示される照合キーを参照
し、表10115の列値が格納されたレコードを識別す
る為のレコード識別子10158を前記照合キーでソー
トし、前記列値に対応するレコード識別子10158を
前記指定された照合方法に応じて順序付けるソート処理
部である。
ジュール10106及び多次元データ処理モジュール1
0107として機能させる為のプログラムは、CD−R
OM等の記録媒体に記録され磁気ディスク等に格納され
た後、メモリにロードされて実行されるものとする。な
お前記プログラムを記録する記録媒体はCD−ROM以
外の他の記録媒体でも良い。
実施形態の照合処理装置であるデータベースシステム1
0101は、アプリケーションプログラム10102
と、データベース処理サーバ10103と、定義データ
ストア10104と、表データストア10105と、照
合モジュール10106と、多次元データ処理モジュー
ル10107と、多次元データストア10108を備え
ている。
は、ユーザからのデータベース問合せ要求をデータベー
ス処理サーバ10103に送信し、その処理結果を受け
取るプログラムである。
般的なデータベース管理システムの機能を提供すると共
にインデクス管理部10109を含んでいる。インデク
ス管理部10109は、データベース処理サーバ101
03でのインデクスを利用したソート要求10151を
受けて、その結果としてレコード識別子のリスト101
57を返す。
ス定義情報10110、インデクス−ドメイン対応デー
タ10112、照合方法−照合キー対応データ1011
3、照合キー−次元対応データ10114を保持してい
る。インデクス定義情報10110は、インデクスに対
応した照合モジュール10106を識別する照合モジュ
ール識別子10111を含んでいる。また表データスト
ア10105は表10115にレコードを保持してい
る。
は、“OLAP SOLUTIONS Building Multidimensional Inf
ormation Systems, Erik Thomsen, John Wiley & Sons,
1997”に記載されている様なデータ処理機能を提供す
るモジュールであり、特開平9−265479号公報の
「多次元データ処理方法」に開示されている様な方法に
従って実装されているモジュールである。多次元データ
ストア10108は、インデクスに対応した多次元デー
タドメイン10116を保持し、ここにレコードの照合
キーとなる部分をコード化した値及びそのレコードのレ
コード識別子10158を多次元データとして保持して
いる。
0151を含む問合せ処理の概略を説明する。アプリケ
ーションプログラム10102は、表データストア10
105に格納された文字列に対して、さまざまな照合方
法によってソートする様にデータベース処理サーバ10
103に問合せ要求を行う(ソート要求10151)。
プリケーションプログラム10102からの問合せ要求
の解析を行い、問合せ解析結果10152を生成する。
この解析処理では、インデクス定義情報10110を探
索し、ソート処理にインデクスを利用するかどうかを判
定する。ソート対象に対応するインデクス定義情報10
110があれば、その情報に基づいてインデクスを利用
するデータベース処理を行うことを決定し、インデクス
を利用した結果、得られる順番をそのままソートした順
番とする。
クスを利用することを決定すると、データベース処理サ
ーバ10103はインデクス管理部10109にソート
する様に要求する(インデクスソート要求1015
3)。インデクス管理部10109は、インデクス定義
情報10110に含まれる照合モジュール識別子101
11に従って、照合モジュール10106にソート処理
を要求する。
ストア10104に保持されているインデクス−ドメイ
ン対応データ10112、照合方法−照合キー対応デー
タ10113、及び照合キー−次元対応データ1011
4を参照し、照合−多次元データ解析変換10154を
行う。この変換で、インデクスに対応した多次元データ
処理のドメイン、適用する照合方法の照合キーと照合段
階に対応した多次元データドメイン10116での照合
キーを識別する次元識別子と当該照合キーの優先度の情
報を得る。これらを指定して、多次元データ処理モジュ
ール10107に、多次元データ解析要求10155を
行う。
プリケーションプログラム10102からのそれぞれの
ソート要求10151に適合する照合方法に従って、各
照合段階での照合キーの評価を、次元識別子及び優先度
に対応させ、それらを入力として指定する。出力とする
解析結果はレコード識別子のリスト10157とする。
は、各次元の照合キーについて優先度の指定の要求に従
って多次元データを解析してソート処理を行い、多次元
データ解析結果10156を返す。
データ解析結果10156をソート処理結果としてイン
デクス管理部10109に渡す。インデクス管理部10
109は、これをソート処理結果のレコード識別子のリ
スト10157とする。データベース処理サーバ101
03は、インデクス管理部10109からのソート処理
終了を示す応答を受け取り、アプリケーションプログラ
ム10102に問合せ処理終了を返す。以上で問合せ処
理を終了する。
一般的なSQLのFETCHにより取り出す。アプリケ
ーションプログラム10102からのフェッチ要求に応
じて、データベース処理サーバ10103はレコード識
別子のリスト10157から順次レコード識別子101
58を取り出し、それによって識別されるレコードを表
データストア10105から取り出して、アプリケーシ
ョンプログラム10102に返却する。
構成を示す図である。本実施形態のデータベースシステ
ム10101は、一般的なデータ処理装置10201の
上で動作する。
202、OS10203、通信コントローラ1020
4、メモリ10205、I/Oコントローラ10206
及びこれらを接続するシステムバス10207等を備え
ている。また、I/Oコントローラ10206には、キ
ーボードやマウス及びディスプレイ等の様なデータ入出
力装置10208、及び、磁気ディスク装置の様なデー
タ記憶装置10209等が接続される。
ローラ10204によりLAN(Local Area
Network)等のネットワーク10210に接続さ
れており、ネットワーク10210に接続されている他
のデータ処理装置10201と通信を行なう。
能は、OS10203の管理の下で、CPU10202
がメモリ10205に格納されたプログラムを実行する
ことにより実現される。また、定義データストア101
04、表データストア10105、多次元データストア
10108等は、データ記憶装置10209にデータを
格納することにより実現される。
を示す図である。図35では、データベースシステム1
0101においてレコードを格納する表10115の構
造を表している。
1及びふりがな10302を表す列とその他の列を有し
ている。また、レコード識別子10303を各レコード
に割り当てている。ここで、氏名10301の列値はC
HAR型16文字以内の値とし、ふりがな10302の
列値は、CHAR型16文字以内の値とする。
値が「足立 修」、ふりがな10302の値が 「あだち
おさむ」であることを示しており、レコード識別子rid
1により、データベース処理サーバ10103はこのレ
コードを他のレコードと識別する。なおレコード103
05〜レコード10312も同様である。
10110の一例を示す図である。インデクス定義情報
10110は、インデクス識別子10401、表識別子
10402、列識別子10403、照合モジュール識別
子10404、照合要素種別10405から構成され
る。
情報が示すインデクスを、他のインデクスと識別する識
別子である。表識別子10402は、インデクス設定対
象の表を識別する識別子である。列識別子10403
は、インデクス設定対象のキーとなる列を識別する識別
子である。
の様な複数の定義情報により、複数の列の組合せがイン
デクスのキーであることを示しており、レコード104
06及び10407は、氏名10301とふりがな10
302の組合せが、このインデクス(名簿照合インデク
ス)のキーであることを示している。
モジュール10106を識別する識別子である。この定
義情報が示すインデクスで照合に関する処理を行うとき
に実行する照合モジュール10106を識別する。照合
要素種別10405は、列識別子10403に対応した
照合要素を示しており、レコード10406では、氏名
10301が表記による照合において照合要素となるこ
とを表している。
10407は、「名簿照合インデクス」で識別されるイ
ンデクスが設定されていることを示しており、名簿を示
す表10115の氏名10301及びふりがな1030
2の列を組にしてインデクスのキーとしている。このイ
ンデクスの照合に関する処理は、jisx4061で識別される
照合モジュール10106で実行される。照合での照合
要素は表記列及び読み列の組であり、それぞれ氏名10
301及びふりがな10302の列に対応する。
は、一般のデータベース管理システムが提供するインデ
クス定義機能を拡張することで作成できるものである。
対応データ10113の一例を示す図である。照合方法
−照合キー対応データ10113は、照合方法識別子1
0501、照合キー識別子10502、照合段階105
03を有している。
読み照合方法の照合キー及びその照合段階を示してい
る。すなわち、代表読み照合方法での照合手順の第1段
階で、表記列の先頭字を文字クラスの順番に従って評価
すること、第2段階で第1分節の代表読みを照合キーと
して評価すること、第3段階で第1分節の表記列を照合
キーとして評価すること、第4段階で読み列を照合キー
として評価すること、第5段階で表記列を照合キーとし
て評価することをそれぞれ示している。
での照合手順の第1段階で、読み列を照合キーとして評
価することを示し、レコード10510は読み・表記照
合方法での照合手順の第2段階で、表記列を照合キーと
して評価することを示している。また、レコード105
11は単純照合方法での照合手順の第1段階で、表記列
を照合キーとして評価することを示している。
ド10509で照合キー識別子「読み列」を共通して設
定されていることから、読み列の照合キーが、代表読み
照合方法での照合手順の第4段階及び読み・表記照合方
法での照合手順の第1段階で共通に用いられることが判
る。
データ10114の一例を示す図である。照合キー−次
元対応データ10114は、照合キー識別子1060
1、次元識別子10602を有している。
ラス」で識別される照合キーが、多次元データドメイン
10116での「第1表記文字クラス」で識別される次
元と対応することを示しており、同様に、レコード10
604〜レコード10607の各照合キーは、多次元デ
ータドメイン10116での各次元と対応している。
509で照合キー識別子「読み列」を共通して使用する
ことに対応して、多次元データ処理での次元「読み列」
も、複数の照合方法で共通に用いられる。
ン対応データ10112の一例を示す図である。データ
ベースシステム10101では、インデクス毎に多次元
データドメイン10116を持たせる。その対応関係を
インデクス−ドメイン対応データ10112を用いて示
している。
2は、インデクス識別子10701、ドメイン識別子1
0702を有しており、レコード10703は、「名簿
照合インデクス」で識別されるインデクスが、多次元デ
ータ処理モジュール10107で、「名簿照合ドメイ
ン」で識別されるドメインと対応することを示してい
る。
多次元データドメイン10116に多次元データのエン
トリを登録する一例として、レコードの挿入時に多次元
データのエントリ登録を行う例を示す。
ム10101にレコードを挿入する処理の概要を示す図
である。本実施形態の多次元データ処理モジュール10
107は、レコードの挿入の際にその列値に対応する複
数の照合キーを多次元データとして多次元データドメイ
ン10116に保持し、多次元データ中の照合キーを異
なる照合方法で共有できる様にしている。
ケーションプログラム10801が、名簿である表10
115にレコードを格納する様、データベース処理サー
バ10103に登録要求10851を行っており、例え
ば以下の様なSQL文で問合せ要求を行う。
S (「足立 修」、「あだち おさむ」、...) データベース処理サーバ10103は、この問合せ要求
を受信し、問合せ解析10852を行い、データベース
処理手順を決定する。問合せ解析10852では、レコ
ード挿入要求であることを解析して、表データストア1
0105へのレコード挿入10853を行うことを決定
する。
照し、挿入するレコードについてインデクスをメンテナ
ンスするかどうかを判定する。例えば図36のレコード
10406及び10407を参照し、名簿照合インデク
スをメンテナンス対象とすることを決定する。
従って、表データストア10105へのレコード挿入1
0853を行う。データベース処理サーバ10103
が、レコードの格納位置を決定し、表データストア10
105に格納する。そして、その格納位置の情報をレコ
ード識別子10854に符号化する。
ータベース処理手順に従って、インデクスメンテナンス
10855を行う。データベース処理サーバ10103
は、インデクス管理部10109にインデクスエントリ
登録を要求する。インデクス管理部10109では、イ
ンデクス定義情報10110から取得した照合モジュー
ル識別子10404(jisx4061)を用いて、照合モジュ
ール10106を特定し、照合モジュール10106に
エントリ登録要求する。この要求では、インデクス識別
子、照合モジュール識別子、インデクス設定対象の列
値、レコード識別子を指定する。
ストア10104に保持されたインデクス定義情報10
110、照合モジュール−照合方法対応データ1080
2及び照合方法−照合キー対応データ10113に従
い、照合要素に対応させ、インデクスのキー値から照合
キー値を取得する。更に、照合キー−次元対応データ1
0114を参照して、照合キーを多次元データエントリ
に対応させる様に照合キー−多次元データエントリ変換
10856を行う。この変換によって得た多次元データ
エントリ変換結果10858を多次元データ処理モジュ
ール10107に登録要求する多次元データ登録要求1
0857を行う。なお、この照合モジュール10106
におけるエントリ登録処理については、後に図42で詳
細に説明する。
が終了したら、インデクス管理部10109のインデク
スメンテナンスを終了し、データベース処理サーバ10
103はレコード挿入処理終了を登録アプリケーション
プログラムに返信して終了する。以上により、レコード
挿入処理を終了する。
合方法対応データ10802の一例を示す図である。照
合モジュール−照合方法対応データ10802は、照合
モジュール識別子10901と、照合方法識別子109
02を有している。レコード10903〜10905
は、jisx4061で識別される照合モジュール10106
が、「代表読み照合方法」、「読み・表記照合方法」、
「単純照合方法」の3つの照合方法の識別子と対応して
いることを示している。
合モジュール10106の処理手順を示すフローチャー
トである。図42では、図40のインデクス管理部10
109からのエントリ登録要求に応じて起動する処理を
表しており、この処理の入力は、インデクス識別子、照
合モジュール識別子、インデクス設定対象の列値、レコ
ード識別子である。
照し、列値を照合要素の値に変換する(ステップ110
01)。例えば図36のレコード10406及び104
07を参照し、挿入するレコードの列値「足立 修」を
表記列の値、列値「あだち おさむ」を読み列の値とす
る。
タ10802を参照し、この照合モジュール10106
に対応した照合方法識別子を取得する(ステップ110
02)。例えば図41のレコード10903から、照合
方法識別子「代表読み照合方法」を得る。
方法識別子を基に、照合方法−照合キー対応データ10
113から、照合方法に対応した照合キーを取得する
(ステップ11003)。例えば照合方法識別子「代表
読み照合方法」を基に、図37のレコード10504か
ら照合キー識別子「第1表記文字クラス」を得る。
の値から照合キー値を取得する(ステップ1100
4)。例えば、表記列「足立 修」の先頭字「足」を得
て、その文字クラス「漢字」を得る(照合モジュール1
0106が文字の辞書等を用いて取得する)。
値をコード化する(ステップ11005)。コード化の
詳細については、後に図43で説明する。更に、これに
よって得た照合キー値コードをリスト形式で保持してお
く(ステップ11006)。
キーについて、他に該当する照合キーがあるかを判定す
る(ステップ11007)。該当する照合キーがあれ
ば、ステップ11003〜ステップ11006の処理を
繰り返す。例えば図37のレコード10505〜105
08等が該当し、これらについてステップ11003〜
ステップ11008の処理を繰り返す。
無くなった場合は、次のステップ11008に進む。ス
テップ11008では、ステップ11002で取得する
照合方法識別子について、他に該当する照合方法識別子
があるかを判定する。該当する照合キーがあれば、ステ
ップ11002〜ステップ11008の処理を繰り返
す。例えば図41のレコード10904及び10905
等が該当し、これらについてステップ11002〜ステ
ップ11008の処理を繰り返す。つまり、読み・表記
照合方法、単純照合方法についても照合キーを取得する
処理を繰り返す。
別子が無くなった場合は、次のステップ11009に進
む。ここまでの処理で、照合モジュール10106に関
する全ての照合方法の全ての照合キーについて、照合キ
ー値をコード化した値のリストを得ている。次に、イン
デクス−ドメイン対応データ10112を参照し、多次
元データ処理モジュール10107に登録要求するドメ
インの識別子を取得する(ステップ11009)。例え
ば図39のレコード10703を参照し、ドメイン識別
子「名簿照合ドメイン」を取得する。
4を参照し、ステップ11006で作成した照合キー値
コードのリスト及びレコード識別子を、多次元データ処
理モジュール10107での次元に対応付ける(ステッ
プ11010)。例えば、図38のレコード10603
〜10607等を参照し、照合キー値コードを次元に対
応付ける。すなわち「足立 修」の第1表記文字クラス
「漢字」のコード値を、次元「第1表記文字クラス」に
対応付ける。また、レコード識別子rid1を次元「レコー
ド識別子」に対応付ける。
07にエントリ登録要求する(ステップ11011)。
この要求で、ステップ11009で取得したドメイン識
別子「名簿照合ドメイン」でドメインを指定し、ステッ
プ11010で作成した次元とコード値を指定する。多
次元データ処理モジュール10107でエントリ登録が
終了したら、この処理を終了する。この処理により、1
つのレコードについてのエントリ登録で、ソートに適用
する照合方法の全ての照合キーのコード値が、多次元デ
ータドメイン10116に登録される。
の一例を示す図である。図43では、図42の照合モジ
ュール10106のエントリ登録でのステップ1100
5で作成するコードの構成例を表している。
の第1段階での照合キーであり、表記列第1文字の文字
クラスのコードを示している。なお、表記列「足立
修」の表記列第1文字「足」の文字クラスは「漢字」で
あり、JIS X 4061に規定されている文字クラスの番号
「11」と対応させて、照合キーのコードを「11」と
している。
の第2段階での照合キーであり、代表読みのコードを示
している。なお、表記列「足立 修」、読み列「あだち
おさむ」の代表読みは「あし」であるので(照合モジュ
ール10106が代表読み辞書を用いる等して決定す
る)、JIS X 4061に規定されている以下の番号に対応さ
せてコード化している。
…「12」 清濁属性番号:「あ」(清音)…「0」、「し」(清
音)…「0」 記号種別属性番号:「あ」(大文字)…「0」、「し」
(大文字)…「0」 仮名種別属性番号:「あ」(平仮名)…「0」、「し」
(平仮名)…「0」 同様にして、第1分節表記列、読み列、表記列等の全て
の照合キーについてコード化する。なお、これらのコー
ドは順番を数値化しており、数値の大小が、照合キーの
順序に対応している。従って、多次元データ解析でその
数値の大小で比較し、昇順に並べることにより、照合キ
ーの順番を示すソート処理結果が容易に得られる。
ン10116に保持する多次元データの一例を示す図で
ある。図42のエントリ登録の処理で示した様に、ソー
トに適用される全ての照合方法の全ての照合キーについ
て次元を作成する。
1、代表読み11202、第1分節表記列11203、
読み列11204、表記列11205、及びレコード識
別子11206のそれぞれの次元を作成しており、これ
らの次元について、図43で示した様な照合キーのコー
ド値を配置する。
法と読み・表記照合方法について共有され、また、表記
列の次元は、代表読み照合方法、読み・表記照合方法及
び単純照合方法で共有されている。
のコード値が、対応する多次元データドメイン1011
6に保持される。
1を含む問合せ処理の処理手順を示すフローチャートで
ある。図45では、アプリケーションプログラム101
02が表データストア10105に格納された文字列の
ソートを要求したときの処理を表しており、例えばアプ
リケーションプログラム10102からは、名簿である
表10115に対して、氏名10301とふりがな10
302の組をキーとして(それぞれ照合要素の表記列、
読み列として)、代表読み照合方法に基づいてソートす
る様に要求する。
02では、この様な処理の要求については問合せに対し
てカーソルを定義し、そのカーソルをオープンした後に
フェッチにより1件づつ問合せの結果を取得する。なお
図45では、アプリケーションプログラム10102か
らのカーソルオープン要求に対して、データベース処理
サーバ10103がソートした問合せ処理結果のリスト
を作成する処理を示している。
は、アプリケーションプログラム10102からの問合
せ要求の解析を行なって解析結果を得る(図33の問合
せ解析結果10152に相当)。ここでは、一般的な解
析処理により、ソート要求10151を含む問合せ要求
であることを解析し、例えば名簿である表10115の
氏名10301及びふりがな10302の列の組につい
て、代表読み照合方法によるソート要求10151であ
ることを解析する(ステップ11301)。
デクスを利用するかどうかを判定する。この判定では、
名簿である表10115で、氏名10301及びふりが
な10302を対象としたインデクス定義情報1011
0を探索し(ステップ11302)、該当するインデク
ス定義情報10110があるかどうかを調べる(ステッ
プ11303)。
ある場合は、設定済みのインデクスを利用するデータベ
ース処理手順とすることを決定する(ステップ1130
4)。続いて、該当するインデクス定義情報10110
を取得しておく(ステップ11305)。ここでは、該
当する図36のレコード10406及び10407の情
報を取得する。
定義情報10110がない場合は、レコードから多次元
データを作成してソートするデータベース処理手順に決
定する(ステップ11306)。
データベース処理手順に従って、データベース処理サー
バ10103はデータベース処理を実行する。データベ
ース処理サーバ10103は、インデクスを利用するデ
ータベース処理手順であるかどうか判定する(ステップ
11307)。
インデクス管理部10109にインデクスを用いたソー
トを行う様に要求する(図33のインデクスソート要求
10153に相当)。インデクス管理部10109は、
ステップ11305で取得したインデクス定義情報10
110を受け取り、ソート要求10151に応じた処理
を行う(ステップ11308)。この要求では、ソート
要求10151に指定されたインデクス識別子及び照合
方法識別子を指示する。インデクス管理部10109
は、インデクス定義情報10110の照合モジュール識
別子を基に、対応する照合モジュール10106にソー
ト処理を行う様に要求する。照合モジュール10106
は、多次元データ処理モジュール10107を用いて、
図42の処理で登録した多次元データの解析を行い、レ
コード識別子のリスト10157を取得し、処理結果と
して返す。ソート要求時の照合モジュール10106の
処理の詳細については、図46で説明する。インデクス
管理部10109は、この処理結果をソート結果のレコ
ード識別子のリスト10157とする。
スを利用しない(多次元データを作成してソートする)
データベース処理手順の場合は、データベース処理サー
バ10103は表データストア10105から全てのレ
コードを取得し、それらを多次元解析してソート処理す
る(ステップ11309)。この処理については図49
で説明する。この処理結果として照合順番に並んだレコ
ード識別子のリスト10157を作成する。
09の処理が終了すると、データベース処理サーバ10
103は、アプリケーションプログラム10102に問
合せ処理終了を返信し(ステップ11310)、問合せ
処理を終了する。
モジュール10106の処理手順を示すフローチャート
である。図46では、照合モジュール10106がイン
デクス管理部10109からのソート要求10151に
応じて、図45のステップ11308で起動される処理
を表しており、この処理の入力はインデクス識別子と照
合方法識別子である。
ート要求10151に指定された照合方法識別子を基
に、照合方法−照合キー対応データ10113を参照し
て、照合キー識別子と照合段階10503を取得する
(ステップ11401)。例えば照合方法識別子「代表
読み照合方法」に従い、図37のレコード10504の
照合キー識別子「第1表記文字クラス」と照合段階10
503「1」等を得る。
キー識別子を基に、照合キー−次元対応データ1011
4から次元識別子を取得する。例えばステップ1140
1で取得した照合キー識別子「第1表記文字クラス」に
対応して、図38のレコード10603等から次元識別
子「第1表記文字クラス」等を取得する。
識別子と、ステップ11401で取得した照合段階10
503から、次元と優先度の組を作成する(ステップ1
1403)。例えば照合キー識別子「第1表記文字クラ
ス」の照合段階10503が「1」であることから、次
元識別子「第1表記文字クラス」で識別される次元の優
先度を「1」とする。
キーについて、他に該当する照合キーがあるかを判定す
る(ステップ11404)。他に該当する照合キーがあ
る場合は、ステップ11401からステップ11404
を繰り返す。他に該当する照合キーがない場合は次のス
テップ11405に進む。ここまでの処理で、次元識別
子「第1表記文字クラス」、「代表読み」、「第1分節
表記列」、「読み列」及び「表記列」について、それぞ
れ優先度「1」、「2」、「3」、「4」及び「5」が
対応付けられる。
部10109から受け取ったインデクス識別子を基に、
インデクス−ドメイン対応データ10112を参照し
て、ドメイン識別子を取得する。図39のレコード10
703を参照し、ドメイン識別子「名簿照合ドメイン」
を得る。
識別子と優先度の組から、多次元データ解析要求する際
のパラメタを作成する(ステップ11406)。ここ
で、処理結果がレコード識別子のリスト10157とな
る様にパラメタを設定する。ここまでの処理が、図33
の照合−多次元データ解析変換10154に相当する。
07に多次元データ解析を要求する(ステップ1140
7)。これは図33の多次元データ解析要求10155
に相当する。多次元データ処理モジュール10107の
処理結果を受け取ったら、その結果のレコード識別子の
リスト10157をインデクス管理部10109に渡し
(ステップ11408)、この処理を終了する。以上に
より、アプリケーションプログラム10102からのソ
ート要求処理を実現する。
例を示す図である。多次元データ解析結果10156−
1は、代表読み照合方法によってソートした結果を示し
ている。第1表記文字クラス、代表読み、第1分節表記
列、読み列、表記列のそれぞれの次元をこの順に優先し
て、それぞれの値(照合キーのコード値)の昇順になる
様に多次元データ解析した結果である。これは、代表読
み照合方法の各照合段階10503での照合キーの評価
を行った場合と同等の結果となる。
rid3、rid1、rid5、rid4、rid7、rid6、rid8、rid
9、...が得られる。これは、代表読み照合方法で氏
名10301及びふりがな10302の列の値をソート
した場合のレコードのレコード識別子のリスト1015
7となる。
−2は読み・表記照合方法によってソートした結果を示
し、多次元データ解析結果10156−nは単純照合方
法によってソートした結果を示している。いずれもそれ
ぞれの照合方法で氏名10301及びふりがな1030
2の列の値をソートした場合のレコードのレコード識別
子のリスト10157が得られる。
してソート処理するときの多次元データの一例を示す図
である。図48では、図45のステップ11309にお
いて、レコードから多次元データを作成してソート処理
を行うときの多次元データストア10108に保持する
多次元データを表している。
一時作業用多次元データドメイン101601にデータ
ストアからレコードについての照合キーのコード値を配
置し、図46に示した様な処理によりソートを行う。詳
細は図49に示す。
1には、ソートに適用する照合方法の照合キーに対応す
る第1表記文字クラス11602〜表記列11606
と、レコード識別子に対応するレコード識別子1160
7を作成する。これに、図43に示した様なコード値を
配置する。
するソート処理の処理手順を示すフローチャートであ
る。図49では、図45のステップ11309におい
て、表データストア10105からレコードを取得して
多次元データを作成してソートを行う処理のフローチャ
ートを表している。
は、照合モジュール−照合方法対応データ10802を
参照し、ソート要求10151で指定された照合方法に
対応する照合モジュール識別子を取得する(ステップ1
1701)。例えば、代表読み照合方法についての照合
モジュール識別子jisx4061を得る。
113を参照し、ソート要求10151で指定された照
合方法の照合キーと照合段階10503の情報を取得す
る(ステップ11702)。そして照合キー−次元対応
データ10114を参照し、照合キーから次元識別子を
取得する(ステップ11703)。ステップ11704
では、多次元データ処理の一時作業用多次元データドメ
イン11601を取得する。
ート対象のレコードを取得する(ステップ1170
5)。ステップ11706では、照合キー値とレコード
識別子を多次元データの次元に対応付ける。ユーザから
の要求に従って、レコードの氏名の列値を照合要素の表
記列の値とし、ふりがなの列値を照合要素の読み列の値
とする。この値を基に、照合モジュール10106が、
照合キー値を作成し多次元データ解析での次元に対応付
ける。
作業用多次元データドメイン11601に、ステップ1
1706で作成した照合キー値を登録する(ステップ1
1707)(図42のエントリ登録の処理と同様に処理
を行う)。これにより図48に示した多次元データを作
成する。
は、ステップ11705で取得したレコードについて、
他に該当するレコードがあるかを判定する(ステップ1
1708)。他に該当するレコードがある場合は、ステ
ップ11705からステップ11708を繰り返す。他
に該当するレコードがない場合は、次のステップ117
09に進む。ここまでの処理により、表データストア1
0105のソート対象となる全てのレコードについて、
一時作業用多次元データドメイン11601に照合キー
値の多次元データを登録する。
10106が、照合方法−照合キー対応データ1011
3及び照合キー−次元対応データ10114を参照し、
次元識別子と優先度を組とした多次元データ解析のパラ
メタを作成する。例えば、代表読み照合方法では、第1
表記文字クラス、代表読み、第1分節表記列、読み列、
表記列の各次元を、この順で優先度をつけてパラメタを
作成する。
ップ11709で作成したパラメタで多次元データ解析
要求を行い、多次元データ処理モジュール10107が
この要求に従って多次元データ解析を行う(ステップ1
1710)。データベース処理サーバ10103は、照
合モジュール10106の処理結果を受け取り、多次元
データ解析の処理結果をソート結果とし(ステップ11
711)、この処理を終了する。
場合でも、照合キーの多次元データを作成し、多次元デ
ータ解析することによりソート処理を行う。
した場合のソート処理を行う例を説明する。
義の一例を示す図である。図50では、変更を加えた照
合方法の定義データを表しており、この例では、前述の
JISX 4061の照合方法をサポートするデータベースシス
テム10101に、漢字の画数順による代表読み照合方
法、読み・表記照合方法、単純照合方法(それぞれ代表
読み画数照合方法、読み・表記画数照合方法、単純画数
照合方法と呼ぶ)を追加した場合の定義データを示して
いる。
において、レコード11801〜11805は、「代表
読み画数照合方法」の照合キーが「第1表記文字クラ
ス」、「代表読み」、「第1分節表記列」、「読み列」
及び「表記列画数」であり、それぞれ照合段階1050
3「1」、「2」、「3」、「4」及び「5」で評価す
ることを示している。同様に、レコード11806及び
11807は「読み・表記画数照合方法」の照合キー及
び照合段階10503を示し、レコード11808は
「単純画数照合方法」の照合キー及び照合段階1050
3を示している。
4において、レコード11809は、照合キー「表記列
画数」が次元「表記列画数」に対応することを示してお
り、照合モジュール−照合方法対応データ10802に
おいて、レコード11810〜11812は、それぞれ
代表読み画数照合方法、読み・表記画数照合方法、単純
画数照合方法が照合モジュールjisx4061と対応すること
を示している。
した多次元データエントリ登録処理、図46で説明した
多次元データ解析処理を行うことにより、前述のソート
処理が行われることと同様に、漢字の画数順による読み
・表記照合方法によるソート処理が行われる。但し、照
合モジュール10106で画数表記列をコード化する機
能を追加する必要がある。
義によるソート結果の一例を示す図である。図51で
は、図50に示した定義データを基にソートした結果を
表しており、多次元データ解析結果11901は、代表
読み画数照合方法によってソートした結果を示し、第1
表記文字クラス、代表読み、第1分節表記列、読み列、
表記列画数のそれぞれの次元をこの順に優先して、それ
ぞれの値(照合キーのコード値)の昇順になる様に多次
元データ解析した結果である。これは、代表読み画数照
合方法の各照合段階での照合キーの評価を行った場合と
同等の結果となる。
rid3、rid1、rid4、rid5、rid7、rid6、rid8、rid
9、...が得られる。これは、代表読み画数照合方法
で氏名10301及びふりがな10302の列の値をソ
ートした場合のレコードのレコード識別子のリスト10
157となる。
は、読み・表記画数照合方法によってソートした結果を
示し、多次元データ解析結果11903は、単純画数照
合方法によってソートした結果を示している。いずれも
それぞれの照合方法で氏名10301及びふりがな10
302の列の値をソートした場合のレコードのレコード
識別子のリスト10157が得られる。
〜11903をそれぞれ図47の代表読み照合方法、読
み・表記照合方法、単純照合方法のソート結果と比較す
ると、多次元データ解析結果11901及び11902
においては、レコード識別子rid4の「角田 正史」とレ
コード識別子rid5の「角田 雅志」のレコードの順番
が、JIS X 4061での漢字の順番と画数順の違いにより逆
になっている。また、多次元データ解析結果11903
においては、JIS X 4061での漢字の順番と画数順の違い
により順番が大きく異なっている。
定義情報を変更するだけで、1つの多次元データ群を利
用して容易に他のソート機能をサポートすることができ
る。
で評価する照合方法定義及びソート結果の一例を示す図
である。図52では、表記列、読み列の順で評価する照
合方法(表記・読み照合方法と呼ぶ)のソートをサポー
トした例を表しており、照合方法−照合キー対応データ
10113に、表記列、読み列の順で評価する表記・読
み照合方法を示すデータ12001及び12002を保
持している。
ジュール10106によるソート処理を行うことによ
り、多次元データ解析結果12003を得る。表記・読
み照合方法で氏名10301及びふりがな10302の
列の値をソートした場合のレコードのレコード識別子の
リスト10157が得られる。
義情報を変更するだけで、既存の多次元データを変更す
ることなくそのまま利用して、容易にソート機能をサポ
ートすることができる。
運用の概念を示す図である。従来の技術を適用したデー
タベースシステム12101では、1つのインデクスが
複数の照合方法に対応できない為、照合方法毎にインデ
クスを作成する。
2103のインデクスキー列12104に対してインデ
クスを設定する。データベース処理サーバ12105に
対して、それぞれの照合方法に応じてインデクス格納領
域確保操作12106を行い、インデクスデータストア
12107を確保する。そして、インデクス定義操作1
2108を行い、定義データストア12109にインデ
クス定義情報12110を保持する。
ステム運用の概念を示す図である。本実施形態を適用し
たデータベースシステム10101では、1つの多次元
データ群で複数の照合方法に対応する為、1つの多次元
データドメイン10116を作成している。
て、多次元データドメイン確保操作12201を行い、
多次元データストア10108に多次元データドメイン
10116を確保する。そして、インデクス定義操作1
2202を行い、定義データストア10104にインデ
クス定義情報10110を保持する。
る場合、従来の技術を適用したシステムではそれぞれの
照合方法について複数回の運用操作が必要であったのに
対して、本実施形態を適用したシステムでは運用操作が
1回で良い。よって、複数の照合方法をサポートするシ
ステムの運用操作コストを削減することができる。
示す図である。図53に示したデータベースシステム1
2101において、複数の照合方法のソートにそれぞれ
対応するインデクスデータストア12107に保持する
インデクスデータ12301は、キー値12302を含
んでいる。ここで、キー値はそれぞれのインデクスデー
タ内に同様の内容を重複して保持することになる。
を示す図である。データベースシステム10101にお
いて、複数の照合方法のソートに対応する多次元データ
ストア10108に保持する多次元データドメイン10
116は、多次元データエントリ12401を含んでい
る。
る場合、従来の技術を適用したシステムではそれぞれの
照合方法についてのインデクスにキー値を保持する必要
があったのに対して、本実施形態を適用したシステムで
は、多次元データドメイン10116に多次元データエ
ントリを1つ保持するだけで良い。よって、複数の照合
方法をサポートするシステムのリソースを削減すること
ができる。
図34に示した様な一般的なデータ処理装置10201
でプログラムを実行することによって実現できる。ま
た、そのプログラムは、ハードディスク装置、フロッピ
ーディスク等のコンピュータで読み書きができる記録媒
体に格納することができ、ネットワークを通してプログ
ラムにアクセスすることができる。
合方法に従ったソートをサポートする際に、多次元デー
タを複数の照合方法について共有し、その多次元データ
中の照合キーを用いて複数の照合方法のソート処理を行
うので、それぞれの照合方法でのソート処理の高速化、
多次元データ利用効率の向上(リソース削減)及び運用
操作コストの削減を行うことが可能である。
照合方法で用いられる照合キーの定義情報を追加・変更
するだけで照合方法の追加・変更に対応することができ
るので、多次元データの利用効率の向上(リソース削
減)及び運用操作の容易化を行うことが可能である。
15に対して、氏名10301とふりがな10302の
組をキーとして代表読み照合方法に基づいてソートする
処理について説明したが、照合方法として他の言語を処
理する照合方法を用いることにより、多言語対応のソー
ト処理を行うことが可能である。
置によれば、列値に対応する照合キーを示す多次元デー
タを複数の照合方法で共有し、多次元データ中の照合キ
ーを用いて異なる複数の照合方法によるソート処理を行
うので、複数の照合方法によるソート処理の高速化及び
多次元データの利用効率の向上を行うことが可能であ
る。
・表記照合を評価することは可能であるが、文節毎の評
価が必要となる代表読み照合は実現不可能である為、表
計算ソフトでは並び替えを実現する様なマクロを作成し
たり、データベース管理システムではデータを取り出し
た後に独自に並び替え処理を行わなければならないとい
う問題がある。更に従来の並び替え処理では、並び替え
の為のインデクスを作成することができない為、並び替
え処理に時間がかかってしまう恐れがある。
独自のデータの並び替えを実行することが可能な技術を
提供することにある。
れたルールによる並び替えを高速に実行することが可能
な技術を提供することにある。
成されるデータの蓄積及び取り出しを行うデータ処理装
置において、指定されたルールに従ってデータの並び替
えを実行するものである。
対象と並び替えの順番とを並び替えのルールとして定義
する。例えば、並び替えで評価する文字の文字列長、区
切り文字や評価除外文字と、昇順や降順の指示または文
字列の組み合わせによって並び替えの順番とを指定する
ことにより、並び替えを行う為のルールを登録して並び
替えのルールを定義する。
列の並び替えで使用するルールとを示す並び替え処理を
指定する。この並び替え処理の指定では、特定のルール
を第1条件として行った並び替えの結果が同順位となっ
た場合に、次に実行する並び替えの参照列及びルールを
第2条件、第3条件、..として指定しても良い。そし
て、前記指定された並び替え処理の内容に従って並び替
えを実行する。
ールに従って並び替えを行うので、並び替えの対象と順
番をユーザ独自に定義することにより、ユーザ独自のデ
ータの並び替えを実行することが可能になる。例えば、
前記ルールの定義の際に、並び替え対象となるデータの
バイト長と並び替えの順番を示すデータ列の組み合わせ
とを含む並び替えのルールを定義すれば、任意の言語で
用いられるデータ列を指定された順序で並び替えるルー
ルを定義することが可能であり、多言語対応の並び替え
を実行することができる。
されたルールで並び替えを行った結果のインデクスを作
成することにより、並び替え処理で並び替え実行要求さ
れた場合、インデクスを参照することにより並び替え結
果を得ることができ、並び替え処理を高速に行うことが
可能となる。
ば、並び替えを行う為のルールを予め登録しておき、指
定されたルールにより並び替えを実行するので、ユーザ
独自のデータの並び替えを実行することが可能である。
意の要素より構成されるデータの蓄積及び取り出しを行
う実施形態201のデータ処理装置について説明する。
要を示す図である。図58に示す様に本実施形態のデー
タ処理装置は、ソート処理部20100と、処理メニュ
ー表示部20101と、ルール定義部20102と、並
び替え処理登録部20103と、並び替え実行部201
04とを有している。
全体を制御する処理部である。処理メニュー表示部20
101は、並び替えの処理メニューを表示する処理部で
ある。ルール定義部20102は、並び替えで参照され
る列中の並び替えの対象と並び替えの順番とを示す並び
替えのルールを定義する処理部である。
えで参照される列と当該参照列の並び替えで使用するル
ールとを示す並び替え処理を指定する処理部である。並
び替え実行部20104は、前記指定された並び替え処
理の内容に従って並び替えを実行する処理部である。
0、処理メニュー表示部20101、ルール定義部20
102、並び替え処理登録部20103及び並び替え実
行部20104として機能させる為のプログラムは、C
D−ROM等の記録媒体に記録され磁気ディスク等に格
納された後、メモリにロードされて実行されるものとす
る。なお前記プログラムを記録する記録媒体はCD−R
OM以外の他の記録媒体でも良い。
表示部20101がルール定義要求20120、並び替
え処理登録要求20130、並び替え要求20140を
処理要求20150として受付けると、それぞれルール
定義部20102、並び替え処理登録部20103、並
び替え実行部20104で処理を行う。
名20121、並び替えルール20122が指定され、
並び替え処理登録要求20130の際には並び替え処理
名20131、並び替えルール名20132、対象列名
20133が指定され、並び替え要求20140の際に
は並び替えが行われる表20141と並び替えを行うル
ール名20142、対象列名20143又は又は並び替
え処理名20144を指定する。
登録要求20130を受取ると、指定された情報をディ
スク装置20110内の並び替え登録データ20111
にルール情報20112、並び替え処理情報20113
にそれぞれ格納する。
略構成を示す図である。データ処理装置20200は、
CPU20211、メモリ20213、I/O制御装置
20212を備えている。メモリ20213に格納され
たソート処理部20100をCPU20211が実行す
ることによりソート処理が行われ、I/O制御装置20
212によりディスク装置20110からのデータの読
み出し及び書き込み、モニタ20220への情報の表
示、キーボード20221、マウス20222からの情
報入力処理が行われる。
ディスク装置20110内に格納され、並び替え実行後
のソート結果表20232もディスク装置20110内
に格納される。ソート処理部20100はモニタ202
20にメニューを表示し、キーボード20221、マウ
ス20222による操作で情報を受取る。
例を示す図である。表20141は列名部20310と
データ部20320から構成され、表20141の一番
最初の行が列名部20310、それ以降がデータ部20
320となる。表20141は一つ以上の列20330
及び20340より構成されそれぞれの列に対して列
名、データが格納される。図の例では、列名として「氏
名」及び「ふりがな」が登録され、氏名列の列データと
して「鈴−木−一−郎」、「山−田−太−郎」、ふりが
な列の列データとして「すず−き−いち−ろう」、「や
ま−だ−た−ろう」が格納されている。
20101の処理手順を示すフローチャートである。ソ
ート処理部20100を起動すると図61のフローの処
理メニュー表示部20101が実行される。以下図61
を用いて処理メニュー表示処理について説明する。
定義、並び替え処理登録、並び替え要求のどれを実行す
るのかを選択する為のメニューを表示する(ステップ2
0410)。
テップ20420)ルール定義部20102を実行して
ルール定義処理を行う(ステップ20421)。
プ20430)並び替え処理登録部20103を実行し
て並び替え処理登録を行う(ステップ20431)。並
び替え実行が選択されると(ステップ20440)並び
替え実行部20104を実行して並び替え実行を行う
(ステップ20441)。
02の処理手順を示すフローチャートである。処理メニ
ュー表示よりルール定義が選択されると、ルール登録を
行う為のメニューを表示し、ユーザが項目の設定を行う
(ステップ20510)。
の一例を示す図である。メニュー内の各項目は、登録す
るルールの名称を入力するルール名20600、並び替
えを行う時に参照する列に関する情報設定部2060
2、並び替えの為のデータ設定部20650を表してい
る。
ールの名称を設定する。並び替えを行う時に参照する列
に関する情報設定部20602には、列参照時に全文字
列を対象にするか、n文字を対象にするか、区切り文字
までを対象にするかを選択する為のスイッチ20611
〜20613、n文字を対象にする場合の文字長206
14、区切り文字までを対象にする場合の区切り文字2
0615、並び替えを昇順または降順に行うことを指定
する為のスイッチ20616及び20617、並び替え
の評価対象にしない対象除外文字20618を設定す
る。
価実施時に同順位になった場合に次の文節(n文字の場
合は次のn文字、区切り文字の場合は次の区切り文字が
出現するまでの文字)で再評価を行う指定の場合、次文
節評価20619をチェックする。
は、同時に複数列の文字に対して並び替え評価を行う場
合、参照する列数分同様に情報を設定する為のものであ
る。
は、固定的に前に並べる項目である前方配置文字206
30、固定的に後ろに並べる項目である後方配置文字2
0640を設定する。
順に関係なく並び替えの先頭に置きたい文字がある場
合、並べたい順番に文字を登録するものであり、対象と
なる文字列が格納された列の入力欄に文字を設定する。
に、ある特定の名前の人を最初に並べて、その他の人に
ついてふりがな順で並び替える様な場合、列1(206
10)に名前を割当て、前方配置文字20630の列1
(20631)の入力欄20634以降に前に並べたい
名前を入力することにより、入力した名前を並び替え結
果の前方に位置付けることができる。同様に固定的に後
ろに並べる項目は昇順または降順に関係なく並び替えの
最後に置きたい文字がある場合、並べたい順番に文字を
登録する。
記列に関する情報設定部20602に設定した列情報の
どれに対応するかを示す為で、前方、後方配置を行う列
に対応する欄に情報の設定を行う。複数の列の組み合わ
せを指定させる場合、組み合わせたいそれぞれの列に対
応する欄に情報を設定する。
りルール設定完了が通知されメニューに設定された定義
情報を受取り(ステップ20520)、ディスク装置2
0110内の並び替え登録データ20111のルール情
報20112に格納する(ステップ20530)。
示す図である。ルール定義メニューに設定された情報
を、ルール名20800、列数20801、各列の対象
文字20802、各列のソート順指定20803、各列
の対象除外文字20804、前方固定データ有無208
10とデータ20811、後方固定データ有無2082
0とデータ20821として登録する。
20103の処理手順を示すフローチャートである。次
に並び替え処理登録について図65を用いて説明する。
処理メニュー表示より並び替え処理登録が選択されると
並び替え処理登録を行う為のメニューを表示し、ユーザ
が項目の設定を行う(ステップ20910)。
ニューの一例を示す図である。メニュー内の各項目は、
登録する並び替え処理名21000、並び替えを適用す
るルール名21011とルールに指定された列2101
2〜21015に対応する列名21016〜21019
を指定する。並び替え結果が同順位の場合の処理を追加
する場合、第2条件21020、第3条件21030に
同様に並び替えを適用するルール名21021及びルー
ル名21031とルールに指定された列21022〜2
1025、列21032〜21035に対応する列名2
1026〜21029、列名21036〜21039を
指定する。
入力完了が通知されメニューに設定された情報を受取り
(ステップ20920)、ディスク装置20110内の
並び替え登録データ20111の並び替え処理情報20
113に格納する(ステップ20930)。
0113の詳細を示す図である。並び替え処理情報に設
定された情報を、並び替え処理名21100、条件数2
1101、条件毎のルール名21102、条件内のルー
ルに対応した列名21103として登録する。ルール名
は条件数だけ登録され、対応列名はルールに定義された
列数だけ登録される。
104の処理手順を示すフローチャートである。図69
は本実施形態の並び替え実行処理の続きを示す図であ
る。次に並び替え実行処理について図68及び図69を
用いて説明する。処理メニュー表示より並び替え実行が
選択されると、並び替え実行を行う為のメニューを表示
し、ユーザが項目の設定を行う。(ステップ2120
1)。
ニューの一例を示す図である。メニュー内の各項目は、
並び替えの対象となるデータが格納されたファイルの名
称が入力される並び替えファイル名21300、並び替
え実行結果が格納されるファイルの名称が入力される結
果格納ファイル名21301、並び替え処理の内容が入
力される並び替え処理指定欄21302、登録済みの並
び替え処理の名称が入力される並び替え処理名2130
5を表している。
び替え処理指定欄21302に指定する方法と、並び替
え処理の名称を並び替え処理名21305に指定する方
法が選択可能で、ルールと列名を指定する場合、並び替
えを行うルール名21311とルールに指定された列2
1312〜21315に対応する列名21316〜21
319を指定する。
する場合、第2条件21320及び第3条件21330
以降に、並び替えルール名21321及びルール名21
331、ルールに指定された列21322〜21325
及び列21332〜21335に対応する列名2132
6〜21329及び列名21336〜21339を指定
する。
替え処理登録で登録した並び替え処理の名称を並び替え
処理名21305に指定する。項目設定後、OKボタン
21303により完了が通知されると、設定された実行
用の情報を受取り(ステップ21202)、実際の並び
替え処理を実行する。並び替え実行用メニューに指定さ
れた、並び替えが実行されるファイルをディスク装置よ
り読み込み(ステップ21203)、ルールと列名が指
定されているか並び替え処理が指定されているかチェッ
クする(ステップ21204)。
されているルールに対応する並び替え登録データ201
11のルール情報20112を取り出し(ステップ21
206)、取り出した情報に従って列の評価を行う。
7)、n文字(ステップ21208)、区切り文字まで
(ステップ21210)が指定されているかチェック
し、全文字列が対象の場合は全文字列を並び替え対象と
し(ステップ21214)、n文字が指定されている場
合、指定された文字数の文字列を並び替え対象とし(ス
テップ21209)、区切り文字が指定された場合、指
定された区切り文字を文字列内よりサーチし(ステップ
21211)、区切り文字が有るかチェックし(ステッ
プ21212)、区切り文字があった場合、区切り文字
の前までの文字列を並び替えの対象とし(ステップ21
213)、区切り文字がなかった場合、全文字列を並び
替えの対象とする(ステップ21214)。
ックし(ステップ21215)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の前に位置
付ける(ステップ21216)。
ックし(ステップ21217)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の後に位置
付ける(ステップ21218)。
りの文字列に対して、昇順または降順指定をチェックし
(ステップ21219)、昇順指定されている場合昇順
に並び替えを行い(ステップ21220)、降順に指定
されている場合降順に並び替えを行う(ステップ212
21)。
同順位になり(ステップ21222)、次文節評価実行
指定されている場合(ステップ21223)、次の文節
の文字に関してステップ21208以降の処理を繰り返
す。次文節評価実行指定されておらず、次の列に対する
条件が指定されている場合(ステップ21224)、同
順位になった文字列に対して次の条件の実行を行う為に
ルール情報を取出し、ステップ21206以降の処理を
実行する。全ての並び替え処理の実行終了後、並び替え
実行結果を指定されたファイルに出力し(ステップ21
225)、処理を終了する。
されている並び替え処理名に対応する並び替え処理情報
20113を取り出し(ステップ21205)、処理情
報に指定されたルール名、列名を参照し、以下ルールと
列名が指定されている場合と同様の処理を実行する。
111のルール情報20112を取り出し(ステップ2
1206)、取り出した情報に従って列の評価を行う。
対象文字が全文字列(ステップ21207)、n文字
(ステップ21208)、区切り文字まで(ステップ2
1210)が指定されているかチェックし、全文字列が
対象の場合は全文字列を並び替え対象とし(ステップ2
1214)、n文字が指定されている場合、指定された
文字数の文字列を並び替え対象とし(ステップ2120
9)、区切り文字が指定された場合、指定された区切り
文字を文字列内よりサーチし(ステップ21211)、
区切り文字が有るかチェックし(ステップ2121
2)、区切り文字があった場合、区切り文字の前までの
文字列を並び替えの対象とし(ステップ21213)、
区切り文字がなかった場合、全文字列を並び替えの対象
とする(ステップ21214)。
ックし(ステップ21215)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の前に位置
付ける(ステップ21216)。
ックし(ステップ21217)、指定されている場合、
登録された文字列と、並び替え対象の文字列を参照し、
登録された文字列がある場合、並び替え結果の後に位置
付ける(ステップ21218)。
りの文字列に対して、昇順または降順指定をチェックし
(ステップ21219)、昇順指定されている場合昇順
に並び替えを行い(ステップ21220)、降順に指定
されている場合降順に並び替えを行う(ステップ212
21)。
同順位になり(ステップ21222)、次文節評価実行
指定されている場合(ステップ21223)、次の文節
の文字に関してステップ21208以降の処理を繰り返
す。次文節評価実行指定されておらず、次の列に対する
条件が指定されている場合(ステップ21224)、同
順位になった文字列に対して次の条件の実行を行う為に
ルール情報を取り出し、ステップ21206以降の処理
を実行する。全ての並び替え処理の実行終了後、並び替
え実行結果を指定されたファイルに出力し(ステップ2
1225)、処理を終了する。
簿データのふりがなを50音順に並び替える場合につい
て適用する。まず50音順に並び替えを行う為のルール
定義を行う。
ニューの指定例を示す図である。図71の様にルール名
20600を50音順(21401)で、列1(206
10)に対象文字列をn文字にチェックし(2141
0)、文字数を「1」(21411)にする。
定し、次文節再評価も指定する(21413)。前方配
置文字20630の入力項目20631の列1の所に、
「あ」(21420)、「い」(21421)、「う」
(21422)、・・・「を」(21423)、「ん」
(21424)を登録する。
ニューの指定例を示す図である。並び替えの実行は、図
72の様に実行メニューで並び替え実行ファイル名に名
簿データ(21510)、実行結果ファイル名に名簿デ
ータ並び替え実行結果(21511)、第1条件213
10のルール名21311に登録したルール名「50音
順」(21520)を指定し、列1(21312)に列
名ふりがな(21521)を指定することにより、ふり
がな列の−を省いた文字列を1文字づつ、「あ」「い」
「う」・・・の順番に並び替えることができる。
在するが、ふりがな列が存在しない場合でも、名前列に
ついて、漢字の名前を読みの順番に登録したルールを登
録することにより、ふりがな列を必要とすることなく名
前の読み順に並び替えることも可能である。
996 に制定された照合方法の基本代表読み照合による並
び替えに適用する。基本代表読み照合は以下の5つの手
順により評価する。
番に従って評価する。文字クラスは以下の様に分類され
る。
し、その代表読みを照合キーにして評価する。第2文節
以降についても評価することとする。
評価する。
行う並び替えルールの情報設定部の設定例を示す図であ
る。まずルール定義で図73に示す様に(1)を評価す
る為に列1、(2)及び(3)を評価する為に列2及び
列3、(4)及び(5)を評価する為にそれぞれ列4及
び列5を割当てる。列1は先頭文字を文字クラスの順番
に並べるので、対象文字列をn文字にチェックし(21
611)、文字数を「1」にする(21612)。文字
クラスの順番を前方配置文字、後方配置文字の列1に対
応する欄に登録する。
行う並び替えルールのデータ設定部の設定例を示す図で
ある。図74に示す通り、スペース(21701)、記
述記号(21702、21703)、括弧記号(217
04、21705)、学術記号(21706)、一般記
号(21707)の順番で登録し、順番で最後になる
「げた記号」を後方配置文字20640の方に登録する
(21731)。
節を取り出す為に、対象文字列の区切り文字をチェック
し(21621、21631)、区切り文字に「−」を
定義する(21622、21632)。(2)の代表読
みを照合キーにして行う評価と(3)の表記列を照合キ
ーとして行う評価結果の順で前方配置文字20630、
後方配置文字20640の列2及び列3の対応する欄に
文字の組み合わせを登録する。
の組み合わせで「あ」又は「あん」と読む「安」(21
711)は、「あ」又は「あし」と読む「足」(217
12)より順位が高く、以下同様に安(あ、あん)<足
(あ、あし)<角(かく、かど)<足(そく)<角(つ
の)<安(やす、やすらか)といった様に設定する(2
1711〜21716)。
を照合キーとして評価するだけなので、それぞれ対象文
字列を全文字列にチェックし(21641、2165
1)、「−」を除外して(21643、21653)、
昇順並び替えを指定する(21642、21652)。
ニューの設定例を示す図である。並び替えの実行は、図
75に示す様に実行メニューで、第1条件21310の
ルール名に登録したルール名を指定し(21820)、
列1の列名に氏名(21821)、列2の列名に氏名
(21822)、列3の列名にふりがな(2182
3)、列4の列名にふりがな(21824)、列5の列
名に氏名(21825)を指定することにより、前記に
示した基本代表読み照合による並び替えを実行すること
ができる。以上によりユーザ指定の並び替え処理の登
録、実行を実現することができる。
装置によれば、並び替えを行う為のルールを予め登録し
ておき、指定されたルールにより並び替えを実行するの
で、ユーザ独自のデータの並び替えを実行することが可
能である。
意の要素より構成されるデータの蓄積及び取り出しをデ
ータベースで行い、並び替えの実行結果を示すインデク
スを作成する実施形態202のデータ処理装置について
説明する。
000のシステム構成図を示す図である。情報処理装置
22030でDBアクセスアプリケーション2203
1、データ処理装置22000でDBMS22003が
稼動しており、これらデータ処理装置22000及び情
報処理装置22030はネットワーク22060に接続
され相互に通信を行うことができる。
は、ネットワーク22060を介してデータ処理装置2
2000上のDBMS22003に問い合わせ実行要求
を行う。DBMS22003は、問い合わせ要求を受付
けるとデータ処理装置22000に接続されたディスク
装置22010に格納しているDBデータ22011を
アクセスすることにより問い合わせ要求に対応した処理
を実行する。
000及び情報処理装置22030の概略構成を示す図
である。図77に示す様にデータ処理装置22000
は、CPU2213、メモリ2214、I/O制御装置
2212、通信制御装置2211により構成される。メ
モリ2214に格納されたDBMS22003のプログ
ラムをCPU2213が実行することによりDBMS2
2003の処理が行われ、I/O制御装置2212によ
りディスク装置2210からデータの読み出し、書き込
みを行い、通信制御装置2211によりネットワーク2
2060で接続された他の情報処理装置22030とデ
ータの送受信を行う。
モリ2202にDBアクセスアプリケーション2203
1が格納され実行されている。DBアクセスアプリケー
ション22031がDBMS22003に問い合わせ実
行を行うと、情報処理装置22030の通信制御装置2
203よりデータ処理装置22000の通信制御装置2
211に要求が送信され、DBMS22003に問い合
わせが送られる。DBMS22003は、要求に応じた
処理の実行を行い、DBデータ22011へのアクセス
が必要な場合、I/O制御装置2212よりディスク装
置2210に格納されたDBデータ22011へのアク
セスを行う。処理結果を通信制御装置2211より情報
処理装置22030の通信制御装置2203に転送し、
要求元DBアクセスアプリケーション22031に返
す。
の処理概要を示す図である。図78に示す様に本実施形
態のデータ処理装置22000は、表定義部22101
と、挿入部22102と、検索部22103と、ルール
定義部22104と、並び替え処理登録部22105
と、処理要求受付部22106とを有している。
を定義する処理部である。挿入部22102は、データ
ベースにデータを挿入し、並び替えの実行結果を示す為
のインデクスを更新する処理部である。検索部2210
3は、データベースの検索結果を並び替える処理部であ
り、指定された並び替え処理の内容に従って並び替えを
実行する並び替え実行部の処理を行う処理部である。
照される列中の並び替えの対象と並び替えの順番とを示
す並び替えのルールを定義する処理部である。並び替え
処理登録部22105は、並び替えで参照される列と当
該参照列の並び替えで使用するルールとを示す並び替え
処理を指定し、並び替えの対象となるデータについて、
並び替えの実行結果を示す為のインデクスを作成する処
理部である。処理要求受付部22106は、データベー
スへの処理要求22110を受付ける処理部である。
101、挿入部22102、検索部22103、ルール
定義部22104、並び替え処理登録部22105及び
処理要求受付部22106として機能させる為のプログ
ラムは、CD−ROM等の記録媒体に記録され磁気ディ
スク等に格納された後、メモリにロードされて実行され
るものとする。なお前記プログラムを記録する記録媒体
はCD−ROM以外の他の記録媒体でも良い。
2106により処理要求22110を受付けると、要求
の解析を行い、表定義部22101、挿入部2210
2、検索部22103、ルール定義部22104、並び
替え処理登録部22105の各操作を行う。
122、表データ22123、インデクスデータ221
24が格納され、DB情報22122としては、表情報
22125、列情報22126、インデクス情報221
27、ルール情報22128、並び替え処理情報221
29等が格納される。
加され、表名、構成列数等が設定される。列情報221
26にも同様に表作成時に情報が追加され、列を構成す
る表名、列名、列のデータ型情報等が設定される。イン
デクス情報22127にはインデクス作成時に情報が追
加され、インデクスを作成する表名、列名情報等が設定
される。ルール情報22128には、ルール定義部22
104によって並び替えルールに関する情報が追加さ
れ、並び替え処理情報22129には、並び替え処理登
録部22105によって並び替え処理が登録される表
名、列名、ルール名が追加される。
タが格納される。検索部22103により列データを取
り出し、挿入部22102により行データを格納する。
インデクスデータ22124は、インデクス作成時に情
報が追加され、検索実行時にデータを高速に検索する為
に用いられる。
の処理手順を示すフローチャートである。図79以降を
用いて、本実施形態のデータベースシステムにおける並
び替え処理、並び替え用インデクスに関するDBMS2
2003の機能を機能毎に説明する。並び替え処理、並
び替え用インデクスに係る操作機能としては、表定義、
挿入、検索、ルール定義、並び替え処理定義等の機能が
ある。処理要求22110がDBMS22003に対し
て送られ、処理要求22110に対する操作機能の処理
が実行される。
示す図である。まず、表定義処理について図80と図7
9を用いて説明する。処理要求22110が、作成する
表の表名22601、表を構成する列の列名2260
2、列のデータ型22603等と共にDBMS2200
3に送られる。DBMS22003では要求の解析を行
って表定義部22101を実行し、表名22611、列
数等をDB情報22122内の表情報22125に追加
し(ステップ22301)、表名22611、列名22
612及び22613、列データ型22614及び22
615をDB情報22122内の列情報22126に追
加する(ステップ22302)。
す図である。図82は本実施形態の挿入部22102の
処理手順を示すフローチャートである。次にデータ挿入
処理について図81と図82を用いて説明する。処理要
求22110が、データを挿入する表の表名2270
1、各列に挿入する列データ22702及び22703
等と共にDBMS22003に送られる。列のデータ型
には整数型や文字型等の型が有り、挿入データには各型
に対応したデータが指定される。
て挿入部22102を実行し、表名22711に対応し
た表情報22125、列情報22126、インデクス情
報22127をDB情報22122より取得し(ステッ
プ22411)、列情報22126を参照して列データ
22712及び22713をDBデータ22121の対
応する表データ22123に格納する(ステップ224
12)。取得したインデクス情報22127を参照し、
挿入した表にインデクスが付加されている場合(ステッ
プ22415)、インデクスの更新を実行する(ステッ
プ22416)。
要を示す図である。図84は本実施形態のルール定義部
22104の処理手順を示すフローチャートである。次
にルール定義処理について図83と図84を用いて説明
する。処理要求22110が、登録する並び替えルール
のルール名23001と対象文字列情報23002、昇
順/降順情報23003、除外文字23004、次文節
評価フラグ23005等のルール情報と共にDBMS2
2003に送られる。
てルール定義部22104を実行し、ルール名2301
1や対象文字列情報23012及び対象文字列情報23
022、昇順/降順情報23013及び昇順/降順情報
23023、除外文字23014及び除外文字2302
4、次文節評価フラグ23015及び次文節評価フラグ
23025等の情報をDB情報22122内のルール情
報22128に追加する(ステップ23201)。
概要を示す図である。図86は本実施形態の並び替え処
理登録部22105の処理手順を示すフローチャートで
ある。
86を用いて説明する。処理要求22110が、登録す
る並び替え処理の処理名23101、並び替えを行う表
名23102、適用する並び替えルール名23103、
列名23104及び23105等と共にDBMS220
03に送られる。
て並び替え処理登録部22105を実行し、処理名23
111、表名23112、ルール名23113及び23
123、列名23114、23115、23124及び
23125等をDB情報22122内の並び替え処理情
報22129に追加し(ステップ3310)、表名23
112、ルール名23113及び23123、列名23
114、23115、23124及び23125等をD
B情報22122内のインデクス情報22127に追加
する(ステップ3311)。ルール名23113及び2
3123に指定されたルール情報22128を取得し
(ステップ3312)、表名23112に指定された表
を参照し、並び替えの対象となるデータのインデクスを
作成する(ステップ3313)。
示す図である。図88は本実施形態の検索部22103
の処理手順を示すフローチャートである。次にデータ検
索処理について図87、図88と図89を用いて説明す
る。処理要求22110が、取り出す表の表名2280
1、検索項目22802、並び替え指定22803と共
にDBMS22003に送られる。検索項目22802
には取り出す表の列名が指定される。
ールと、ルールに対応させる列名を指定させる場合と、
並び替え処理登録により登録済みの並び替え処理名が指
定される場合がある。
て検索部22103を実行し、表名22811に対応し
た表情報22125、検索項目22812及び2281
3に指定された列情報22126をDB情報22122
より取得し(ステップ22521)、並び替え指定22
814に関連するインデクス情報22127をDB情報
22122より取得する(ステップ22522)。並び
替え指定のチェックを行い(ステップ22523)、並
び替え指定の無い場合、表データ22123より列デー
タ22821及び22822を取り出し、その結果を返
却する(ステップ22525)。
検索処理の概要を示す図である。並び替え指定されてい
た場合、指定が並び替えルールと、ルールに対応させる
列名の指定か並び替え処理名による指定かチェックし
(ステップ22530)、並び替えルールと、ルールに
対応させる列名の指定の場合、ルール情報の取得を行い
(ステップ22531)、指定された並び替えに使用可
能なインデクスの有無をチェックし(ステップ2253
2)、インデクスが無い場合、表データ22123より
列データ22821及び22822を取り出し(ステッ
プ22533)、ルールに従った並び替え実行し(ステ
ップ22830、ステップ22534)、その結果を返
却する(ステップ22525)。インデクスが有る場合
には、図89の通りインデクスデータ22124を参照
しそのインデクスの順番に表データ22123より列デ
ータ22921及び22922の取り出しを行い(ステ
ップ22930、ステップ22536)、その結果を返
却する(ステップ22525)。
いた場合、並び替え処理情報22129、ルール情報2
2128の取得を行い(ステップ22535)、並び替
え処理に対応したインデクスデータ22124を参照し
そのインデクスの順番に表データ22123より列デー
タ22921及び22922の取り出しを行い(ステッ
プ22930、ステップ22536)、その結果を返却
する(ステップ22525)。
登録、実行、及び並び替えの為のインデクスの作成、イ
ンデクスを利用した並び替え結果の高速なアクセスが実
現される。
装置によれば、並び替えを行う為のルールを予め登録し
ておき、指定されたルールにより並び替えを実行するの
で、ユーザ独自のデータの並び替えを実行することが可
能である。
ば、並び替え処理に指定されたルールで並び替えを行っ
た結果のインデクスを作成するので、並び替え処理で指
定されたルールによる並び替えを高速に実行することが
可能である。
アクセスすることができるデータ処理システムにおい
て、種別ごとにデータ処理手段を選択し実行することが
できるので、種別による好適な処理を行うことができる
という効果がある。
要を示す概念図
図
ャート
ト
ータ構造図
図
データ構造図
図
図
図
理要求のフローチャート
ローチャート
図
図
フローチャート
概念図
図
テムの概念図
図である。
図である。
ある。
の一例を示す図である。
10113の一例を示す図である。
114の一例を示す図である。
タ10112の一例を示す図である。
1にレコードを挿入する処理の概要を示す図である。
データ10802の一例を示す図である。
ル10106の処理手順を示すフローチャートである。
す図である。
6に保持する多次元データの一例を示す図である。
合せ処理の処理手順を示すフローチャートである。
10106の処理手順を示すフローチャートである。
である。
処理するときの多次元データの一例を示す図である。
処理の処理手順を示すフローチャートである。
示す図である。
ート結果の一例を示す図である。
照合方法定義及びソート結果の一例を示す図である。
を示す図である。
の概念を示す図である。
る。
ある。
示す図である。
す図である。
を示す図である。
す図である。
01の処理手順を示すフローチャートである。
処理手順を示すフローチャートである。
を示す図である。
である。
03の処理手順を示すフローチャートである。
の一例を示す図である。
3の詳細を示す図である。
の処理手順を示すフローチャートである。
示す図である。
の一例を示す図である。
の指定例を示す図である。
の指定例を示す図である。
び替えルールの情報設定部の設定例を示す図である。
び替えルールのデータ設定部の設定例を示す図である。
の設定例を示す図である。
構成図を示す図である。
及び情報処理装置22030の概略構成を示す図であ
る。
概要を示す図である。
手順を示すフローチャートである。
である。
ある。
順を示すフローチャートである。
す図である。
処理手順を示すフローチャートである。
示す図である。
05の処理手順を示すフローチャートである。
である。
順を示すフローチャートである。
理の概要を示す図である。
111…処理サーバ選択部、112…データ処理要求
部、113…処理結果編集部、104−1、104−
2、…、104−n…データ処理サーバ、10101…
データベースシステム、10102…アプリケーション
プログラム、10103…データベース処理サーバ、1
0104…定義データストア、10105…表データス
トア、10108…多次元データストア、10109…
インデクス管理部、10110…インデクス定義情報、
10111…照合モジュール識別子、10112…イン
デクス−ドメイン対応データ、10113…照合方法−
照合キー対応データ、10114…照合キー−次元対応
データ、10115…表、10116…多次元データド
メイン、10151…ソート要求、10152…問合せ
解析結果、10153…インデクスソート要求、101
54…照合−多次元データ解析変換、10155…多次
元データ解析要求、10156…多次元データ解析結
果、10157…レコード識別子のリスト、10158
…レコード識別子、10106…照合モジュール、10
107…多次元データ処理モジュール、10201…デ
ータ処理装置、10202…CPU、10203…O
S、10204…通信コントローラ、10205…メモ
リ、10206…I/Oコントローラ、10207…シ
ステムバス、10208…データ入出力装置、1020
9…データ記憶装置、10210…ネットワーク、10
301…氏名、10302…ふりがな、10303…レ
コード識別子、10304〜10312…レコード、1
0401…インデクス識別子、10402…表識別子、
10403…列識別子、10404…照合モジュール識
別子、10405…照合要素種別、10406及び10
407…レコード、10501…照合方法識別子、10
502…照合キー識別子、10503…照合段階、10
504〜10511…レコード、10601…照合キー
識別子、10602…次元識別子、10603〜106
07…レコード、10701…インデクス識別子、10
702…ドメイン識別子、10703…レコード、10
801…アプリケーションプログラム、10802…照
合モジュール−照合方法対応データ、10851…登録
要求、10852…問合せ解析、10853…レコード
挿入、10854…レコード識別子、10855…イン
デクスメンテナンス、10856…照合キー−多次元デ
ータエントリ変換、10857…多次元データ登録要
求、10858…多次元データエントリ変換結果、10
901…照合モジュール識別子、10902…照合方法
識別子、10903〜10905…レコード、1110
1及び11102…照合キー、11201…表記文字ク
ラス、11202…代表読み、11203…第1分節表
記列、11204…読み列、11205…表記列、11
206…レコード識別子、11601…一時作業用多次
元データドメイン、11602…第1表記文字クラス、
11603…代表読み、11604…第1分節表記列、
11605…読み列、11606…表記列、11607
…レコード識別子、11801〜11812…レコー
ド、11901〜11903…多次元データ解析結果、
12001及び12002…データ、12003…多次
元データ解析結果、12101…データベースシステ
ム、12102…表データストア、12103…表、1
2104…インデクスキー列、12105…データベー
ス処理サーバ、12106…インデクス格納領域確保操
作、12107…インデクスデータストア、12108
…インデクス定義操作、12109…定義データスト
ア、12110…インデクス定義情報、12201…多
次元データドメイン確保操作、12202…インデクス
定義操作、12301…インデクスデータ、12302
…キー値、12401…多次元データエントリ、201
05…ソート結果表、20110…ディスク装置、20
111…並び替え登録データ、20112…ルール情
報、20113…並び替え処理情報、20120…ルー
ル定義要求、20121…ルール名、20122…並び
替えルール、20130…並び替え処理登録要求、20
131…並び替え処理名、20132…ルール名、20
133…対象列名、20140…並び替え要求、201
41…表、20142…ルール名、20143…対象列
名、20144…並び替え処理名、20150…処理要
求、20100…ソート処理部、20101…処理メニ
ュー表示部、20102…ルール定義部、20103…
並び替え処理登録部、20104…並び替え実行部、2
0200…データ処理装置、20211…CPU、20
212…I/O制御装置、20213…メモリ、202
20…モニタ、20221…キーボード、20222…
マウス、20231…表データ、20232…ソート結
果表、20310…列名部、20320…データ部、2
0330、20340及び20350…列、20600
…ルール名、20602…情報設定部、20603…O
Kボタン、20610…列、20611〜20613…
スイッチ、20614…文字長、20615…区切り文
字、20616及び20617…スイッチ、20618
…対象除外文字、20619…次文節評価、20620
…列、20621〜20623…スイッチ、20624
…文字長、20625…区切り文字、20626及び2
0627…スイッチ、20628…対象除外文字、20
630…前方配置文字、20631〜20633…入力
項目、20634〜20636…入力欄、20640…
後方配置文字、20641〜20643…入力項目、2
0644〜20646…入力欄、20650…データ設
定部、20800…ルール名、20801…列数、20
802…対象文字、20803…ソート順指定、208
04…対象除外文字、20810…前方固定データ有
無、20811…データ、20820…後方固定データ
有無、20821…データ、21000…並び替え処理
名、21003…OKボタン、21010…第1条件、
21011…ルール名、21012〜21015…列、
21016〜21019…列名、21020…第2条
件、21021…ルール名、21022〜21025…
列、21026〜21029…列名、21030…第3
条件、21031…ルール名、21032〜21035
…列、21036〜21039…列名、21100…並
び替え処理名、21101…条件数、21102…ルー
ル名、21103…列名、21300…並び替えファイ
ル名、21301…結果格納ファイル名、21302…
並び替え処理指定欄、21303…OKボタン、213
05…並び替え処理名、21310…第1条件、213
11…ルール名、21312〜21315…列、213
16〜21319…列名、21320…第2条件、21
321…ルール名、21322〜21325…列、21
326〜21329…列名、21330…第3条件、2
1331…ルール名、21332〜21335…列、2
1336〜21339…列名、22000…データ処理
装置、22003…DBMS、22010…ディスク装
置、22011…DBデータ、22030…情報処理装
置、22031…DBアクセスアプリケーション、22
060…ネットワーク、22201…CPU、2220
2…メモリ、22203…通信制御装置、22204…
I/O制御装置、22210…ディスク装置、2221
1…通信制御装置、22212…I/O制御装置、22
213…CPU、22214…メモリ、22110…処
理要求、22121…DBデータ、22122…DB情
報、22123…表データ、22124…インデクスデ
ータ、22125…表情報、22126…列情報、22
127…インデクス情報、22128…ルール情報、2
2129…並び替え処理情報、22101…表定義部、
22102…挿入部、22103…検索部、22104
…ルール定義部、22105…並び替え処理登録部、2
2106…処理要求受付部、22601…表名、226
02…列名、22603…データ型、22611…表
名、22612及び22613…列名、22614及び
22615…列データ型、22701…表名、2270
2及び22703…列データ、22711…表名、22
712及び22713…列データ、23001…ルール
名、23002…対象文字列情報、23003…昇順/
降順情報、23004…除外文字、23005…次文節
評価フラグ、23011…ルール名、23012…対象
文字列情報、23013…昇順/降順情報、23014
…除外文字、23015…次文節評価フラグ、2302
2…対象文字列情報、23023…昇順/降順情報、2
3024…除外文字、23025…次文節評価フラグ、
23101…処理名、23102…表名、23103…
ルール名、23104及び23105…列名、2311
1…処理名、23112…表名、23113及び231
23…ルール名、23114、23115、23124
及び23125…列名、22801…表名、22802
…検索項目、22803…指定、22811…表名、2
2812及び22813…検索項目、22814…指
定、22821及び22822…列データ、22921
及び22922…列データ。
Claims (33)
- 【請求項1】データの種別を区別し、種別の異なる複数
のデータにアクセスすることが可能なデータ処理方法に
おいて、 データ処理を行うデータ処理過程を、データの種別をも
とに選択する第1の過程と、 第1の過程で選択した前記データ処理でデータ処理を実
行する第2の過程とを含むことを特徴とするデータ処理
方法。 - 【請求項2】請求項1に記載のデータ処理方法におい
て、 前記第2の過程でのデータ処理において、前記データ処
理手段が、前記データの種別に適切なデータ処理を行う
第3の過程とを含むことを特徴とするデータ処理方法。 - 【請求項3】請求項1に記載のデータ処理方法におい
て、 前記第1の過程において、ある限られた種別のみを処理
対象として前記データ処理手段を選択する第4の過程と
を含むことを特徴とするデータ処理方法。 - 【請求項4】請求項1に記載のデータ処理方法におい
て、 前記第1の過程で選択した前記データ処理手段にデータ
処理を要求する際に、前記データ処理手段で取り扱うデ
ータの種別に合わせて要求を変換する第5の過程とを含
むことを特徴とするデータ処理方法。 - 【請求項5】請求項1に記載のデータ処理方法におい
て、 データを検索する方法であって、 前記第2の過程で前記データ処理手段がデータ処理を行
なった処理結果データを編集し、データ検索処理の結果
データを作成する第6の過程とを含むことを特徴とする
データ処理方法。 - 【請求項6】請求項5に記載のデータ処理方法におい
て、 前記第6の過程において、前記データ処理手段がデータ
処理を行なった処理結果データを、あるデータの種別に
変換して前記データ検索処理のデータ検索結果を作成す
る第7の過程とを含むことを特徴とするデータ処理方
法。 - 【請求項7】請求項1に記載のデータ処理方法におい
て、 データを登録する処理であって、 登録対象のデータの種別で前記第1の過程でデータ処理
手段を選択する第8の過程と、 前記第2の過程で、登録対象のデータを変換することな
く前記選択したデータ処理手段でデータ登録を行う第9
の過程とを含むことを特徴とするデータ処理方法。 - 【請求項8】請求項1に記載のデータ処理方法におい
て、 部分データから構成されるデータを登録する方法であっ
て、 部分データから、種別ごとにデータ処理手順に登録する
ための登録用データを作成する第10の過程と、 システム内で一意となるデータ識別子を作成し、前記第
10の過程で作成する登録用データに、該データ識別子
を設定する第11の過程と、 前記登録用データをデータ処理手段で登録する第12の
過程とを含むことを特徴とするデータ処理方法。 - 【請求項9】請求項1に記載のデータ処理方法におい
て、 データを検索する方法であって、 前記第6の過程において、前記第11の過程で設定した
データ識別子をもとに、同一のデータ識別子を持つデー
タを構成する部分データから検索結果データを作成する
第13の過程とを含むことを特徴とするデータ処理方
法。 - 【請求項10】請求項1に記載のデータ処理方法におい
て、 前記第1の過程において、データの種別と前記データ処
理手段との対応を示す対応表を参照し、データの種別を
キーとして前記データ処理手段を識別する情報を取得す
ることによりデータ処理手段を選択する第14の過程と
を含むことを特徴とするデータ処理方法。 - 【請求項11】請求項1に記載のデータ処理方法におい
て、 前記第1の過程において、データ処理を実行することが
可能なデータ処理手段を探索し、探索して検出したデー
タ処理手段のデータ種別を取得し、取得したデータ種別
によりデータ処理手段を選択する第15の過程とを含む
ことを特徴とするデータ処理方法。 - 【請求項12】請求項1に記載のデータ処理方法におい
て、 前記第1の過程において、処理対象のデータの第1の種
別から種別の変換が可能な第2の種別に対応するデータ
処理手段を選択する第16の過程と、 処理対象の第1の種別のデータを第2の種別のデータに
変換する第17の過程とを含むことを特徴とするデータ
処理方法。 - 【請求項13】英語や日本語といった自然言語の分類な
どによってデータの種別を区別し、種別の異なる複数の
データにアクセスすることが可能なデータ処理システム
において、 登録や検索などのデータ処理を行うデータ処理手段をデ
ータの種別をもとに選択する第1の手段と、 第1の手段で選択した前記データ処理手段にデータ処理
を要求する第2の手段とを備えることを特徴とするデー
タ処理システム。 - 【請求項14】請求項13に記載のデータ処理システム
において、 該データ処理システムにおけるデータ処理の実行環境を
示しデータ処理を制御するための実行環境変数を用い
て、処理対象とするデータの種別を指定するアプリケー
ションプログラミングインタフェースを備えることを特
徴とするデータ処理システム。 - 【請求項15】請求項13に記載のデータ処理システム
において、 処理対象とするデータを保持する変数の属性で種別を指
定するアプリケーションプログラミングインタフェース
を備えることを特徴とするデータ処理システム。 - 【請求項16】請求項15に記載のデータ処理システム
において、 処理対象とするデータを構成する部分データを保持する
変数の属性でデータの種別を指定するアプリケーション
プログラミングインタフェースを備えることを特徴とす
るデータ処理システム。 - 【請求項17】請求項13に記載のデータ処理システム
において、 処理対象とするデータの内部に当該データの種別を指定
するアプリケーションプログラミングインタフェースを
備えることを特徴とするデータ処理システム。 - 【請求項18】請求項17に記載のデータ処理システム
において、 処理対象とするデータの内部に当該データを構成する部
分データの種別を指定するアプリケーションプログラミ
ングインタフェースを備えることを特徴とするデータ処
理システム。 - 【請求項19】請求項13に記載のデータ処理システム
において、 言語、地域、エンコードからなるロケールなどのよう
に、複数の要素から構成される種別によって、処理対象
のデータの種別を指示するアプリケーションプログラミ
ングインタフェースを備えることを特徴とするデータ処
理システム。 - 【請求項20】請求項13に記載のデータ処理システム
において、 処理結果のデータの種別を、標識子などの変数によって
指示するアプリケーションプログラミングインタフェー
スを備えることを特徴とするデータ処理システム。 - 【請求項21】請求項13に記載のデータ処理システム
において、 データの種別と、当該データの種別に対してデータ処理
を行うデータ処理手段を識別する情報の対応表を備える
ことを特徴とするデータ処理システム。 - 【請求項22】請求項10に記載のデータ処理方法にお
いて、 前記データの種別と前記データ処理手段との対応を示す
対応表を編集する第18の過程を含むことを特徴とする
データ処理方法。 - 【請求項23】英語や日本語といった自然言語の分類な
どによってデータの種別を区別し、種別の異なる複数の
データにアクセスすることが可能なデータ処理システム
におけるプログラムおよびデータを格納する記憶媒体で
あって、 登録や検索などのデータ処理を行うデータ処理手段をデ
ータの種別をもとに選択する第1の手段と、 第1の手段で選択した前記データ処理手段にデータ処理
を要求する第2の手段を備えるデータ処理システムのプ
ログラムおよびデータを含むことを特徴とする記憶媒
体。 - 【請求項24】列値に対応する照合キーの照合を行って
レコードをソートする照合処理方法において、 ソート要求で指定された照合方法で評価対象となる列値
に対応する照合キーの識別子を取得し、その照合キーを
用いたソート処理を要求するステップと、 前記識別子で示される照合キーを参照し、前記列値が格
納されたレコードを識別する為のレコード識別子を前記
照合キーでソートし、前記列値に対応するレコード識別
子を前記照合方法に応じて順序付けるステップとを有す
ることを特徴とする照合処理方法。 - 【請求項25】列値に対応する複数の照合キーを多次元
データとして保持し、多次元データ中の照合キーを異な
る照合方法で共有することを特徴とする請求項24に記
載された照合処理方法。 - 【請求項26】レコードを挿入する際にその列値に対応
する照合キーを登録するステップを有することを特徴と
する請求項24または請求項25のいずれかに記載され
た照合処理方法。 - 【請求項27】指定された照合方法で列値の照合を行っ
てレコードをソートする照合処理装置において、 ソート要求で指定された照合方法で評価対象となる列値
に対応する照合キーの識別子を取得し、その照合キーを
用いたソート処理を要求する照合処理部と、 前記識別子で示される照合キーを参照し、前記列値が格
納されたレコードを識別する為のレコード識別子を前記
照合キーでソートし、前記列値に対応するレコード識別
子を前記照合方法に応じて順序付けるソート処理部とを
備えることを特徴とする照合処理装置。 - 【請求項28】指定された照合方法で列値の照合を行っ
てレコードをソートする照合処理装置としてコンピュー
タを機能させる為のプログラムを記録したコンピュータ
読み取り可能な記録媒体において、 ソート要求で指定された照合方法で評価対象となる列値
に対応する照合キーの識別子を取得し、その照合キーを
用いたソート処理を要求する照合処理部と、 前記識別子で示される照合キーを参照し、前記列値が格
納されたレコードを識別する為のレコード識別子を前記
照合キーでソートし、前記列値に対応するレコード識別
子を前記照合方法に応じて順序付けるソート処理部とし
てコンピュータを機能させる為のプログラムを記録した
ことを特徴とする記録媒体。 - 【請求項29】文字列を含む任意の要素より構成される
データの蓄積及び取り出しを行うデータ処理方法におい
て、 並び替えで参照される列中の並び替えの対象と並び替え
の順番とを示す並び替えのルールを定義するステップ
と、並び替えで参照される列と当該参照列の並び替えで
使用するルールとを示す並び替え処理を指定するステッ
プと、前記指定された並び替え処理の内容に従って並び
替えを実行するステップとを有することを特徴とするデ
ータ処理方法。 - 【請求項30】並び替え対象のデータのバイト長と並び
替えの順番を示すデータ列とを含む並び替えのルールを
定義することを特徴とする請求項29に記載されたデー
タ処理方法。 - 【請求項31】並び替えの実行結果を示す為のインデク
スを作成するステップを有することを特徴とする請求項
29または請求項30のいずれかに記載されたデータ処
理方法。 - 【請求項32】文字列を含む任意の要素より構成される
データの蓄積及び取り出しを行うデータ処理装置におい
て、 並び替えで参照される列中の並び替えの対象と並び替え
の順番とを示す並び替えのルールを定義するルール定義
部と、並び替えで参照される列と当該参照列の並び替え
で使用するルールとを示す並び替え処理を指定する並び
替え処理登録部と、前記指定された並び替え処理の内容
に従って並び替えを実行する並び替え実行部とを備える
ことを特徴とするデータ処理装置。 - 【請求項33】文字列を含む任意の要素より構成される
データの蓄積及び取り出しを行うデータ処理装置として
コンピュータを機能させる為のプログラムを記録したコ
ンピュータ読み取り可能な記録媒体において、 並び替えで参照される列中の並び替えの対象と並び替え
の順番とを示す並び替えのルールを定義するルール定義
部と、並び替えで参照される列と当該参照列の並び替え
で使用するルールとを示す並び替え処理を指定する並び
替え処理登録部と、前記指定された並び替え処理の内容
に従って並び替えを実行する並び替え実行部としてコン
ピュータを機能させる為のプログラムを記録したことを
特徴とする記録媒体。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000052109A JP2001060164A (ja) | 1999-05-18 | 2000-02-23 | データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 |
KR10-2000-0009714A KR100372582B1 (ko) | 2000-02-23 | 2000-02-28 | 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체 |
SG200001142A SG100613A1 (en) | 2000-02-23 | 2000-03-02 | Data processing method and system, program for realizing the method, and computer readable storage medium storing the program |
CNB001038095A CN1155906C (zh) | 2000-02-23 | 2000-03-03 | 数据处理方法、系统、处理程序及记录媒体 |
EP00301740A EP1128277A3 (en) | 2000-02-23 | 2000-03-03 | Data processing method and system, program for realizing the method, and computer readable storage medium storing the program |
KR10-2002-0057508A KR100372585B1 (ko) | 2000-02-23 | 2002-09-23 | 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체 |
KR10-2002-0057507A KR100372584B1 (ko) | 2000-02-23 | 2002-09-23 | 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체 |
US10/438,815 US20030217071A1 (en) | 2000-02-23 | 2003-05-16 | Data processing method and system, program for realizing the method, and computer readable storage medium storing the program |
US12/232,336 US20090024384A1 (en) | 2000-02-23 | 2008-09-16 | Data processing method and system, program for realizing the method, and computer readable storage medium storing the program |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13656999 | 1999-05-18 | ||
JP11-172014 | 1999-06-18 | ||
JP17201499 | 1999-06-18 | ||
JP11-136569 | 1999-06-18 | ||
JP2000052109A JP2001060164A (ja) | 1999-05-18 | 2000-02-23 | データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001060164A true JP2001060164A (ja) | 2001-03-06 |
JP2001060164A5 JP2001060164A5 (ja) | 2005-05-19 |
Family
ID=27317301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000052109A Pending JP2001060164A (ja) | 1999-05-18 | 2000-02-23 | データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001060164A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007140611A (ja) * | 2005-11-14 | 2007-06-07 | Fuji Electric Systems Co Ltd | データ連携方式 |
JP2007293923A (ja) * | 2007-08-02 | 2007-11-08 | Sharp Corp | データ処理装置 |
JP2010186225A (ja) * | 2009-02-10 | 2010-08-26 | Casio Hitachi Mobile Communications Co Ltd | 電子機器及びプログラム |
JP2014170539A (ja) * | 2013-02-28 | 2014-09-18 | Ricoh Co Ltd | 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング |
JP2018025859A (ja) * | 2016-08-08 | 2018-02-15 | 日本電信電話株式会社 | サービス提供システムおよびサービス提供方法 |
CN112487083A (zh) * | 2016-07-20 | 2021-03-12 | 创新先进技术有限公司 | 一种数据校验方法和设备 |
-
2000
- 2000-02-23 JP JP2000052109A patent/JP2001060164A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007140611A (ja) * | 2005-11-14 | 2007-06-07 | Fuji Electric Systems Co Ltd | データ連携方式 |
JP2007293923A (ja) * | 2007-08-02 | 2007-11-08 | Sharp Corp | データ処理装置 |
JP2010186225A (ja) * | 2009-02-10 | 2010-08-26 | Casio Hitachi Mobile Communications Co Ltd | 電子機器及びプログラム |
JP2014170539A (ja) * | 2013-02-28 | 2014-09-18 | Ricoh Co Ltd | 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング |
CN112487083A (zh) * | 2016-07-20 | 2021-03-12 | 创新先进技术有限公司 | 一种数据校验方法和设备 |
CN112487083B (zh) * | 2016-07-20 | 2024-03-12 | 创新先进技术有限公司 | 一种数据校验方法和设备 |
JP2018025859A (ja) * | 2016-08-08 | 2018-02-15 | 日本電信電話株式会社 | サービス提供システムおよびサービス提供方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100372582B1 (ko) | 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체 | |
US6853992B2 (en) | Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents | |
US6377946B1 (en) | Document search method and apparatus and portable medium used therefor | |
JP3696745B2 (ja) | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US5835912A (en) | Method of efficiency and flexibility storing, retrieving, and modifying data in any language representation | |
US7293018B2 (en) | Apparatus, method, and program for retrieving structured documents | |
JP4141556B2 (ja) | 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体 | |
JPH10240752A (ja) | 構造化文書の登録方法,検索方法、およびそれに用いられる可搬型媒体 | |
CN110795526B (zh) | 一种用于检索系统的数学公式索引创建方法与系统 | |
CN103440232A (zh) | 一种科技论文标准化自动检测编辑方法 | |
CN103440233A (zh) | 一种科技论文标准化自动检测编辑系统 | |
US7401071B2 (en) | Structured data retrieval apparatus, method, and computer readable medium | |
CN112199960B (zh) | 一种标准知识元粒度解析系统 | |
JP2001060164A (ja) | データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体 | |
JP3617096B2 (ja) | 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法 | |
CN101719162A (zh) | 基于片段模式匹配的多版本开放式地理信息服务访问方法及系统 | |
JP3786233B2 (ja) | 情報検索方法および情報検索システム | |
CN114676258B (zh) | 一种基于症状描述文本的非诊断为目的的疾病分类方法 | |
JP2000003366A (ja) | 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体 | |
US8478732B1 (en) | Database aliasing in information access system | |
JP2004118543A (ja) | 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム | |
Fujita et al. | Institutional Repository Keyword Analysis with Web Crawler | |
EP0336579A2 (en) | Relational databases | |
JPH1153400A (ja) | 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
JP2002297603A (ja) | 情報抽出方法および構造化文書管理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040713 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040713 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080805 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080925 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081016 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20081107 |