CN1310422A - 数据处理方法、系统、处理程序及记录媒体 - Google Patents

数据处理方法、系统、处理程序及记录媒体 Download PDF

Info

Publication number
CN1310422A
CN1310422A CN00103809A CN00103809A CN1310422A CN 1310422 A CN1310422 A CN 1310422A CN 00103809 A CN00103809 A CN 00103809A CN 00103809 A CN00103809 A CN 00103809A CN 1310422 A CN1310422 A CN 1310422A
Authority
CN
China
Prior art keywords
data
data processing
contrast
mentioned
rearrangement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00103809A
Other languages
English (en)
Other versions
CN1155906C (zh
Inventor
小林挙
中野幸生
河村信男
土田正士
鸟居俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2000052109A external-priority patent/JP2001060164A/ja
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN1310422A publication Critical patent/CN1310422A/zh
Application granted granted Critical
Publication of CN1155906C publication Critical patent/CN1155906C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

本发明的数据库管理单元对按照数据的各个类型设置的多个数据处理服务器所管理的数据库的访问进行管理。请求分析单元对包含区分类型的处理请求的来自应用程序的请求进行分析。处理服务器选择单元根据类型选择进行数据处理的数据处理服务器。数据处理请求单元向数据处理服务器提出数据处理请求。处理结果编辑单元对数据处理服务器的处理结果进行编辑。

Description

数据处理方法、系统、处理程序及记录媒体
本发明一般涉及数据处理方法及数据处理系统以及媒体,特别涉及访问在根据英语及日语等所谓自然语言的分类区别数据类型的数据处理系统内处理的多种类型的数据的数据处理方法。
在计算机系统中处理的数据多种多样,必须处理不同类型数据混合存在的情况。
例如,在跨国公司统计位于各国分公司的信息的信息系统中,必须将在各国分公司中以各个地域的自然语言记录的文档数据在一个中央服务器上进行处理。
或者,在WWW上集中统一来自世界的信息的场合,必须使各国的Web站点所提供的以各国自然语言描述的HTML文档的文件混合存在。
或者,在学习语言的场合,必须同时处理欲学习的语言和对其进行说明的母语或已经掌握的语言的描述。
为了能够对多种语言以一种统一的形式编码而进行数据处理,存在一种利用称为Unicode(统一编码字符集)的编码字符集的方法。Unicode是ISO(国际标准化组织)和Unicode联合会共同开发的多语言字符集,将世界主要字符集标准组合到一个大字符集标准中。ISO将此字符集的标准命名为ISO 10646。
在数据库系统处理多种语言的数据的场合,有使用Unicode的方法。该方法,比如,在ORACLE 8 National Language Support,AnOracle Technical White Paper,1997,6中有描述。
在该文献中表明,在将跨国公司的本地数据库统一为一个数据库之际,最理想是以Unicode作为数据库服务器的文字编码。在数据库服务器内可将字符串型的数据以Unicode这种数据形式统一进行处理。在客户机的文字编码与数据库服务器的文字编码不同的场合,数据库服务器的数据库管理系统自动进行文字编码转换。
作为多语言文档数据处理系统有在日本专利特开平10-232869号公报中所公开的多语言通信系统。该系统中将对以自然语言描述的文档数据进行文法和意义上的分析而得到的中间形式文档数据存储于服务器装置中。所以,如果有来自客户机装置的对文档数据的检索请求,就从存储装置检索包含指定字符串的中间形式文档数据,由检索的中间形式文档数据生成以客户机所请求的自然语言描述的文档数据,并将所生成的文档数据发送到客户机装置。而在服务器装置中,以一种中间形式存储系统要处理的所有文档数据。
在现有的数据库语言SQL中,是利用ORDER BY语句对处理结果进行排序的方式提出查询请求,该语言的标准在日本工业标准JIS X 3005-1990的数据库语言SQL中规定。作为排序键(关键字)可以指定字符串,在该场合可利用COLLATE指定对照顺序。
同样的标准描述在“Understanding The New SQL:a CompleteGuide,Jim Melton,Morgan kaufman,1993”中。在该文献中,记载有使用如下的SQL语句的例子。
SELECT movie_title,movie_type
From movie_titles
ORDER BY movie_title COLLATE FRENCH
在此例中指定将影片的片名按照法语的惯例排序,明确指定与排序键的字符串的字符集进行适当的对照。
另外,在“ORACLE 8 National Language Support,An OracleTechnical White Paper,1997.6”中记载的例子中以环境变量等指定对照方法。
图57示出以现有的环境变量等指定对照方法的示例。在图57中,示出在指定对照方法时利用SQL语句的查询及其处理结果的示例。正如从此示例所了解的,对于同样的字符集,可根据指定的语言而进行不同的排序。
在使现有的数据库对应多种语言并且对应于不同的语言进行排序处理的场合,在将某一字符集合作为不同语言的字符以不同的对照方法进行排序处理时,由于根据对照方法以不同的对照顺序进行排序,所以即使是以上述方式对对应的字符集合进行处理,其排序处理结果也会因语言而不同。
另外,即使是进行特定语言的对照,由于该语言存在种种的对照顺序,即使语言集中在日语的场合,如以单纯对照,读法和表示对照以及及代表性读法对照等种种对照方法进行排序处理,其处理结果各自不同。
作为进行这种各自语言的对照技术,在日本专利特开平8-508123号公报中公开一种语言识别对照系统。另外,关于日语字符串的对照顺序的标准,制定有日本工业标准JIS X 4061-1996,该标准规定了单纯对照,读法和表示对照以及代表性读法对照三种对照顺序。
如上所述,在现有的对照处理方法中,在数据库与多语言对应或相对特定语言采用多种对照方法等等时,在相对数据库的同一列值使用不同对照方法的场合,由于对应于同一列值采用每一种对照方法各不相同的对照键进行排序处理,对于各个列值生成与对照方法相对应的对照键之后,对所生成的对照键进行排序。
另一方面,在数据库系统中,作为对存放在数据库中的数据进行排序的方法有利用索引的方法。其一个例子就是在日本专利特开平8-255170号公报中所公开的带有排序的检索处理装置。
在对象关系数据库管理系统中,相对用户定义型生成索引之时,可定义进行顺序评价的用户函数。该例子记载于“Object-Relational DBMSs,Michael Stpnebraker,Morgan Kaufman,1996”中。据此,可根据由用户定义函数确定的任意顺序生成B-树索引。
一般在进行字符串对照时必须针对各个对照阶段的种种对照键进行多维分析。作为根据同样多维数据分析进行检索的数据处理方法的例子在日本专利特开平10-301937号公报中公开有多维矢量空间内的邻域检索方法及其程序的记录媒体。在该方法中,以颜色和形状等图像的特征量作为多维数据,通过采用树形结构的索引可高速检索与某一图像类似的图像,通过对各维限定特征量的检索范围检索类似图像就可不必对整个图像进行比较而限定范围使数据处理量减小从而达到高速化。
在表计算软件及数据库管理系统(DBMS)中,对用户请求登录的数据的存储进行管理,根据取出请求进行将数据取出回送给用户的处理。在这种处理中,如任何条件都不指定而取出数据,取出的数据的顺序不定,所以为了以确定的顺序取出数据要提供数据重排功能,
上述的重排处理可按字符串的字符代码的值以升序或降序重排,并且在组合到系统中的场合,可以对日语字符串按50音序重排。例如,在数据库语言SQL中,可利用ORDER BY语句请求将检索结果重排。该语言的标准在日本工业标准JIS X 3005-1990数据库语言中规定。
表计算软件Microsoft Excel(注册商标)具有数据重排功能,通过菜单(选项单)选择重排来显示重排对话框就可以指定进行重排的键及升序或降序。此外,如利用选项功能由指定重排升序菜单选择在用户定义的表格画面中登录的任意字符串的排列,就可对键值按其顺序重排(在Excel 5.0 for Windows操作手册、ISBN4-8163-1671-X中关于数据重排的描述在p478~p481,关于用户定义的描述在p214中)。
另一方面,有关日语字符串的对照顺序的标准在日本工业标准JIS X 4061-1996中制定。在此标准中,规定了单纯对照,读法和表示对照以及代表性读法对照三种对照顺序。
单纯对照是以给定的一个字符串按原样作为键重排,读法和表示对照是根据进行重排的字符串及其读法列首先按照对照键对读法列进行重排,并在顺序位置相同的场合再按照对照键对字符串一方进行重排。
代表性读法对照分基本代表性读法对照和简易代表性读法对照。基本代表性读法对照是给出以可以确定各个代表性读法的方式进行划分的读法列及表示列并将按照以下的步骤所得到的结果作为对照结果。
(1)将两个表示列的各个起始列按照字符类的顺序进行评价。
(2)在阶段(1)中序位相同的场合,对两个表示列中的各分节,只要有分节,顺次应用下面的(a)及(b)规则。在一方的表示列中应该对照的分节没有了的场合,没有了的表示列一方就排在顺序的前方。当两方的表示列中都没有了应该对照的分节的场合,就算作在这一阶段序位相同。
(a)利用该分节的表示列及读法列从代表性读法字典确定代表性读法,以该代表性读法作为对照键根据对照规则进行评价。
(b)在(a)阶段中序位相同的场合,以该分节作为对照键根据对照规则进行评价。
(3)在(2)阶段中序位相同的场合,以读法列作为对照键根据对照规则进行评价。
(4)在(3)阶段中序位相同的场合,以表示列作为对照键根据对照规则进行评价。
另外,在数据库管理系统中,有利用索引重排所存放的数据的方法,作为其例子有在日本专利特开平8-255170号公报中所公开的带有排序的检索处理装置。如利用索引,则在取出指定重排的数据时,因为可以不重排数据而得到目标的顺序数据,所以可高速进行处理。
在上述的现有技术中,在服务器中对多个类型的数据进行管理时,将数据的类型与数据形式统一为一个,类型与数据形式相对于相同数据来说不能区别其各个类型来考虑各个数据,不能根据数据类型的特性进行处理。
比如,在数据库管理系统中,利用Unicode将多种语言(英语,日语,希伯来语等等)的字符串数据存放于一个表格之中的场合,管理存放的服务器不能识别以Unicode编码的文字数据,不能区别是何种语言。因此,即使有对应各语言的全文检索处理功能,也不能选出各语言的数据而应用各语言特有的全文检索处理。比如,在全文检索中,同义词及异义表示的展开等依语言而异,并且,虽然在日语的场合进行单词的分割,在英语的场合进行冠词的除外等等各语言功能都存在,但如果不能特别确定数据的语言,也不能应用适当的功能。
本发明的目的在于在可以访问类型不同的多种数据的数据处理系统中,可对应于各个数据类型特性进行处理。
另外,如前所述,在现有的对照方法中,在使数据库与多语言对应或对特定的语言采用多种对照方法等等对数据库的同一列值应用不同的对照方法的场合,对于进行对照的列值生成与对照方法相对应的对照键之后,由于是利用所生成的对照键进行排序处理,就存在排序处理的处理速度低下的问题。
另外,在上述现有的对照处理方法中,由于在某一排序处理之际生成的对照键仅仅在该排序处理中使用,即使所生成的对照键在其他的对照方法中可以利用的场合,该对照键也不在其他的对照方法中使用,所以就存在对照键利用效率低下的问题。比如,在对特定的列值实施根据读法和表示对照进行排序处理及将读法和表示对照代表性读法对照组合起来进行排序处理时,虽然可采用同一键作为读法和表示对照的对照键,但在现有的对照处理方法中,由于在各个排序处理中生成各对照键,对照键的利用效率低下。
此外,在上述现有的对照处理方法中,由于在对于同一列值的多个对照方法的内容进行改变的场合所生成的对照键的内容必须改变,就存在难以与对照方法的改变及添加对应的问题。
另一方面,在现有的数据库系统中,存在一种在对数据库中存放的数据进行排序之际利用索引的方法,但由于在现有的利用索引的方法中是利用与对照的列值相对应的索引,所以在同一列值对应有多个对照键的场合,存在难于将现有的索引按原样应用的问题。
比如,在现有的数据库系统中,如提供考虑支持对在数据库中所存放的字符串按照JIS X 4061规定的对照方法进行排序的功能,在一般的关系数据库系统中在表列(列)中存放字符串,应用日本专利特开平8-255170号公报中所公开的方法,利用索引进行排序,则其做法如下。
首先,对于存放字符串的列(列),在支持按照读法表示对照方法排序的场合,根据读法表示对照方法确定字符串的顺序,在组成构成索引的树形结构的结点中保持识别排序键和记录的信息。
然而,在这种方法中存在以下问题。对于存放上述字符串的列,在还根据代表性读法对照的排序的场合,依照上述读法表示对照方法生成的索引,由于结点内部的记录的顺序不同而无法利用。这样,由于依据B-树等的顺序生成的索引不能应用于其他的对照方法,所以在支持多种对照方法排序的场合,考虑生成依据各种对照方法的多个索引的方法及不使用使用直接对照评价记录的排序方法。
在生成多个索引的方法中,首先,在数据库系统内需要具有对于同一列依据各个不同的顺序评价生成和管理多个索引的功能。这是一般数据库管理系统没有的功能。并且,即使是添加此功能,也必须对支持多个对照方法的每一个进行运用和管理,需要运行成本。另外,对于各个索引还需要存放索引数据的文件等的资源。此外,记录登录和改变时的索引数据维护的系统开销会随索引数增加而加大。
在不使用索引直接对照评价记录而进行排序的方法中,由于访问存放记录的整个区域,在记录全体的大小很大记录数量很大的场合,与仅仅利用索引访问键的场合相比较,无法进行高速处理。
另外,在不生成索引的场合,可考虑在处理排序时动态地生成索引并利用该索引进行排序的方法。但是,由于在此方法中生成索引需要系统开销,与已经生成索引的场合相比较无法进行高速处理。
此外,在现有的数据库系统中还存在难于与部分改变和添加对照方法的场合相对应的问题。比如,在JIS X 4061中,汉字的顺序是由日本工业标准JIS X 0208的信息交换用汉字字符集定义的区号的顺序及日本工业标准JIS X 0221的国际编码字符集(UCS)-第一部体系及基本多语种平面定义的符号位置的顺序进行规定的。此处,如同NTT(日本电报电话公司)的电话号码簿一样,在汉字的顺序评价部分准备采用笔画数顺序的场合,由于按照JIS X 4061生成的索引的顺序不同而无法利用,必须采取进行专用的顺序评价的功能与采用其他途径生成索引等对策。
在上述现有技术的利用用户定义函数进行顺序评价中,虽然生成索引的方法可以生成基于任意一个顺序评价的索引,但该索引却不适用于基于其他顺序评价的排序。
前面提到过应用现有技术的多维矢量空间内的邻域检索方法对字符串的对照键进行多维分析的字符串对照方法。但是,这种方法是由得到满足一定条件的数据集合的方法所构成,在限定检索范围时有效,根据某一规则(对照方法)顺序进行排序则无效。特别是不适用于基于多种对照方法的顺序的排序。总而言之,存在如下的问题,
(1)不能使一种索引与利用一种对照方法的排序相对应。没有考虑利用多种对照方法的排序。如对于多种对照方法的排序分别生成索引,则对于各个索引需要耗费运行成本。另外,必须具有存放索引数据的资源。此外,还需要记录登录和改变时的索引数据维护的系统开销。
(2)难于与部分改变和添加对照方法的场合相对应。未能考虑对照方法的改变。在由于改变而使顺序改变的场合无法利用为原有的对照方法生成的索引。
本发明的目的就是要解决上述问题,提供一种可以利用多种对照方法进行高速排序处理及提高多维数据利用效率的技术。
另外,在现有的重排处理中,虽然可以评价单纯对照及读音和表示对照,但由于不可能实现需要对每个分节进行评价的代表性读法对照,所以存在无法在表计算软件中生成可实现重排的那种宏或在数据库管理系统中取出数据之后独自进行重排处理的问题。此外,在现有的重排处理中,由于不能生成用于重排的索引,大概还需要时间进行重排处理。
本发明的目的就是要解决上述问题,提供一种用户可以独自对数据进行重排的技术。
本发明的另一个目的是提供一种在重排处理中可以根据指定的规则进行高速重排的技术。
关于本发明的上述以及其他的目的和新特征由本说明书的叙述及附图可以明了。
在本申请书中所公开的发明中的代表性部分可简略说明如下。
本发明公开一种依据数据的类型选择进行数据处理的数据处理装置,并以所选择的上述数据处理装置实施数据处理的数据处理方法。
在通过依据数据的类型选择进行数据处理系统的装置数据处理而访问多种不同类型的数据的场合,可进行各数据类型特有的数据处理。
本发明,在对与列值对应的对照键进行对照而对记录进行排序的对照处理方法中,表示与列值对应的对照键多维数据为多种对照方法所共有,利用多维数据中的对照键可对多种不同的对照方法进行排序处理。
在本发明中,应用程序向数据库处理服务器提出查询请求对存放在表数据存储器中的字符串利用各种对照方法进行排序。
数据库处理服务器在接收到来自应用程序的查询请求时,就对该查询请求进行分析,经过索引管理单元的处理之后,将查询分析结果发送到对照模块并请求对照模块进行排序处理。
对照模块,参考保存在定义数据存储器中的各种数据,按照排序请求指定的对照方法,对成为评价对象的列值获得与该列值对应的对照键的标记符,与该标记符一起向多维数据处理模块提出多维数据分析请求。
多维数据处理模块,从多维数据中读出由上述标记符表示的对照键,利用上述对照键对用于识别存放上述列值的记录的记录标记符进行排序并根据上述对照方法对与上述列值对应的记录标记符赋予顺序而生成记录标记符列表。
多维数据处理模块,将此记录标记符列表作为多维数据分析结果送回对照模块,而对照模块将此多维数据分析结果作为排序处理结果转送给索引管理单元。数据库处理服务器在索引管理单元收到排序处理结果时就向应用程序返回查询处理结束信息。
如上所述,根据本发明,在支持根据多种对照方法进行对照之际,多维数据为多种对照方法所共有,因为利用该多维数据中的对照键进行多种对照方法的排序处理,所以可以使利用各个对照方法的排序处理高速化,可提高多维数据的利用效率(削减资源)并减少运行操作成本。
另外,因为可以参考对照方法的定义信息仅仅添加改变该对照方法所使用的对照键的定义信息就可以与对照方法的添加改变进行对应,所以可提高多维数据的利用效率(削减资源)并使运行操作易于进行。
如上所述,根据本发明,因为表示与列值对应的对照键对多维数据为多种对照方法所共有,利用多维数据中对照键进行根据多种不同对照方法的排序处理,所以可以利用多种对照方法进行高速排序处理及提高多维数据利用效率。
本发明用于在包含字符串的任意元素构成的数据进行存储及取出的数据处理装置中,依据指定的规则实施数据重排。
在本发明中,将参考列中的重排对象及重排顺序定义为重排规则。比如,通过利用重排评价的字符的字符串长度,分割字符及不评价字符和升序及降序的指示或字符串的组合指定重排顺序,登录重排规则而定义重排的规则。
其次,指定表示在重排中参考的列及在该参考列重排中使用的规则的重排处理。在指定此重排处理中,在以特定的规则作为第一条件进行的重排的结果具有相同顺序的场合,也可以指定其次实施的重排的参考列及规则作为第二条件,第三条件,....于是,就可以依照上述指定的重排处理内容实行重排。
如前所述,在本发明中,因为依照预先定义的规则进行重排,所以可通过由用户自己对重排的对象和顺序进行定义而对用户自己的数据实施重排。比如,在定义上述规则之际,如果定义包含表示重排对象的数据的字节长及重排顺序的数据列的组合的重排规则,就可能定义以任意语言对所使用的数据列依照指定的顺序进行重排的规则,并实施多语言对应重排。
另外,在本发明中,通过生成以针对重排处理指定的规则进行重排的结果的索引,在请求在重排处理中实行重排的场合,通过参考索引可得到重排结果,就可能对重排进行高速处理。
如上所述,根据本发明的数据处理装置,因为是预先登录用于进行重排的规则,利用指定的规则实施重排,所以可以对用户自己的数据实行重排。
图1为示出本发明的实施例的数据检索处理概略的概念图。
图2为示出本发明的实施例的硬件构成图。
图3为数据处理系统中的数据处理流程图。
图4为分析数据处理请求的流程图。
图5为数据检索处理请求的分析结果的数据结构图。
图6为数据处理服务器的选择流程图。
图7为数据种类与数据处理服务器对应表的构成图。
图8为向数据处理服务器发送处理请求的流程图。
图9为向数据处理服务器发送数据检索处理请求的数据结构图。
图10为编辑数据处理结果的流程图。
图11为数据登录处理概略流程图。
图12为数据处理请求的接口的概略图。
图13为数据登录处理请求的分析结果的数据结构图。
图14为向数据处理服务器发送登录处理请求的流程图。
图15为数据登录处理请求的接口的概略图。
图16为数据登录处理请求的接口的概略图。
图17为数据登录处理请求的分析结果的数据结构图。
图18为在数据登录处理中向数据处理服务器发送处理请求的流程图。
图19为向数据处理服务器登录的数据的结构图。
图20为在数据检索处理中向的编辑数据处理结果的流程图。
图21为在处理结果编辑单元中编辑的数据的结构图。
图22为数据登录处理请求的接口概略图。
图23为登录数据的结构图。
图24为数据登录处理请求的接口概略图。图25为数据处理服务器的选择流程图。
图26为向数据处理服务器登录的数据的变换流程图。
图27为向数据处理服务器登录的数据的变换概念图。
图28为数据检索处理请求的接口概略图。
图29为数据检索处理结果的数据结构图。
图30为数据处理服务器的选择流程图。
图31为添加数据处理服务器的数据处理系统的概念图。
图32为数据处理系统的概念图。
图33为示出本实施形态的字符串排序处理的概略图。
图34为示出本实施形态的对照处理装置的概略构成图。
图35为示出本实施形态的表10115的示例图。
图36为示出本实施形态的索引定义信息10110的示例图。
图37为示出本实施形态的对照方法与对照键的对应数据10113的示例图。
图38为示出本实施形态的对照键与一维对应数据10114的示例图。
图39为示出本实施形态的索引与域对应数据10112的示例图。
图40为示出本实施形态的数据库系统10101中插入记录的处理的概略图。
图41为示出本实施形态的对照模块与对照方法对应数据10802的示例图。
图42为示出本实施形态的条目登录时的对照模块101106的处理步骤的流程图。
图43为示出本实施形态的对照键值的编码的示例图。
图44为示出本实施形态的多维数据域10116中保持的多维数据的示例图。
图45为示出本实施形态的包含排序请求10151的查询处理步骤的流程图。
图46为示出本实施形态的排序处理时的对照模块10106的处理步骤的流程图。
图47为示出本实施形态的排序处理结果的示例图。
图48为示出本实施形态的生成多维数据的排序处理时的多维数据示例图。
图49为示出本实施形态的生成多维数据的排序处理步骤的示例图。
图50为示出本实施形态的经过改变的对照方法定义的示例图。
图51为示出本实施形态的经过改变的对照方法定义的排序结果示例图。
图52为示出本实施形态的按照表示列、读法列顺序进行评价的对照方法定义及排序结果的示例图。
图53为示出在现有的数据库中的系统运行的概念图。
图54为示出在本实施形态中的数据库中的系统运行的概念图。
图55为示出现有的索引数据的概念图。
图56为示出本实施形态的多维数据的概念图。
图57为示出以现有的环境变量等指定的对照方法的示例图。
图58为示出实施形态201的排序处理的处理概略的示例图。
图59为示出实施形态201的数据处理装置的概略构成的示例图。
图60为示出实施形态201的表20141的构成处的示例图。
图61为示出实施形态201的处理菜单显示单元20101的处理步骤的流程图。
图62为示出实施形态201的规则定义单元20102的处理步骤的流程图。
图63为示出实施形态201的规则定义菜单的示例图。
图64为示出实施形态201的规则信息的细节的示例图。
图65为示出实施形态201的重排处理登录单元20103的处理步骤的流程图。
图66为示出实施形态201的重排处理登录菜单的示例图。
图67为示出实施形态201的重排处理信息20113的细节的示例图。
图68为示出实施形态201的重排执行单元20104的处理步骤的流程图。
图69为示出实施形态201的重排执行处理接续图。
图70为示出实施形态201的重排处理执行菜单的示例图。
图71为示出实施形态201的重排处理登录菜单的指定例示意图。
图72为示出实施形态201的重排处理执行菜单的指定例示意图。
图73为示出实施形态201的进行基本代表性读法对照的重排处理规则的信息设定单元的设定例示意图。
图74为示出实施形态201的进行基本代表性读法对照的重排处理规则的数据设定单元的设定例示意图。
图75为示出实施形态201的重排处理登录菜单的设定例示意图。
图76为示出实施形态202的数据处理装置的系统构成图。
图77为示出实施形态202的数据处理装置22000及信息处理装置22030的概略构成图。
图78为示出实施形态202的DBMS 22033的处理概略图。
图79为示出实施形态202的表定义单元22101处理步骤的流程图。
图80为示出实施形态202的表定义处理的概略图。
图81为示出实施形态202的插入处理的概略图。
图82为示出实施形态202的插入单元22102处理步骤的流程图。
图83为示出实施形态202的规则定义处理的概略图。
图84为示出实施形态202的表定义单元22104处理步骤的流程图。
图85为示出实施形态202的重排定义处理的概略图。
图86为示出实施形态202的重排处理登录单元22105的处理步骤流程图。
图87为示出实施形态202的表检索处理的概略图。
图88为示出实施形态202的检索单元22103的处理步骤流程图。
图89为示出实施形态202的利用索引的表检索处理的概略图。
实施例描述
下面利用附图对本发明实施形态(实施例)进行详细说明。
首先,利用图1说明本发明的原理。图1为示出在本发明的第1实施形态的数据检索处理系统中对于以多种语自然言描述的文档的数据进行检索处理的概略的概念图。
此数据处理系统保持有多种语言的数据,可响应利用此系统的用户的检索请求对多种语言进行各语言固有的全文检索。
如图1所示,本实施形态的数据处理系统101的构成包括应用程序(AP)102,数据访问管理单元103,数据处理服务器104-1,104-2,...,104-n,以及作为使它们相互连接进行通信的通路的网络105。
应用程序102是将表示利用数据处理系统101的用户106发出的请求的数据处理请求107送往数据访问管理单元103并接受符合该请求的处理结果108的程序。
用户106可以利用显示编辑多种语言的程序(图中未示出)对利用应用程序102收到的数据进行处理。
数据访问管理单元103管理应用程序102对保存在数据处理系统101中的数据进行的访问。
数据访问管理单元103接受来自应用程序102的数据处理请求107,分析请求,请求适于进行符合请求的处理的数据处理服务器104-1,104-2,...,104-n对数据进行处理,并将数据处理服务器上的结果返送给应用程序102。
数据访问管理单元103的构成包括控制执行单元109,请求分析单元110,处理服务器选择单元111,数据处理请求单元112及处理结果编辑单元113。
控制执行单元109对数据访问管理单元103内进行的处理实行控制。对在数据访问管理单元103中进行的一系列处理的子处理实施控制而在请求分析单元110,处理服务器选择单元111,数据处理请求单元112及处理结果编辑单元113中进行处理。
请求分析单元110分析来自应用程序102的数据处理请求107。
处理服务器选择单元111选择进行符合来自应用程序102的数据处理请求107的数据处理的数据处理服务器104-1,104-2,...,104-n。
数据处理请求单元112向进行符合来自应用程序102的数据处理请求107的数据处理的数据处理服务器104-1,104-2,...,104-n提出请求。
处理结果编辑单元113将数据处理服务器104-1,104-2,...,104-n的处理结果以应用程序102所请求的处理结果108的形式进行编辑。
数据处理服务器104-1,104-2,...,104-n分别对数据库114-1,114-2,...,114-n进行数据115-1,115-2,...,115-n的登录及检索。是提供一般的数据库管理系统执行的数据处理功能的服务器。
与数据访问管理单元103对来自应用程序102的数据访问进行管理相对,数据处理服务器104-1,104-2,...,104-n进行符合来自应用程序102的数据处理请求的实际的数据处理。
数据处理服务器104-1,104-2,...,104-n分别保持有对与某一种语言相对应的全文检索处理单元116-1,116-2,...,116-n。116-1可提供英语的全文检索功能。116-2可提供希腊语全文检索功能,116-n可提供希伯来语全文检索功能。全文检索处理单元116-1,116-2,...,116-n可以是能够分别提供各语言的一般全文检索功能的程序模块。
其次,对数据处理系统101的数据检索处理的概略进行说明。
首先,用户106将数据检索请求输入到应用程序102。假设该请求为“查找与圣经相关的文献中包含“降生(圣诞)”一词的文献”。
这一检索请求可以以数据库语言SQL文句描述如下。
SELECT*FROM圣经WHERE contents.containts(‘降生’)…117
另外,在此检索请求中,关于依数据类别的处理方法,特别是依语言的种类的处理方法,请求按以下方式进行数据处理。
假设用作检索对象的语言是英语和希腊语。即仅仅以原文是以英语或希腊语描述的文献为检索对象。
将检索语句中作为数据进行处理的部分(在SELECT等的控制中使用的部分及不是构成表的名称等数据库的模式的部分)分别翻译成为各个语言。即“降生”这一字符串表示按原样不变是不适用于检索处理的,需要翻译成为各个语言,置换成为表示“降生”的词汇(例如,英语的“Nativity”等)进行检索。
此外,关于描述此检索请求117本身的语言的类型,与在一般数据库系统中数据库服务器识别来自应用程序的请求的语言类型一样,由数据访问管理单元103识别。
处理结果108的数据为登录于数据处理系统的数据的原文原词。
这些以各个SQL中的执行环境变量(在ISO Final DraftInternational Standard(FDIS)Database Language SQL--Part 2:Foundation(SQL/Foundation)《Part 2》ISO/IEC FDIS 9075-2:1999(E),March 1999之中相当于session characteristic)按如下方式指定。
SET TARGET_LANG English,Greek…118
SET QUERY_LANG_TRANSLATION YES…119
SET RESULT_LANG ORIGINAL…120
应用程序102根据上述的用户请求向数据访问管理单元103提出数据处理请求。
在数据访问管理单元103中,以控制执行单元109的控制为基础进行以下的处理。
在请求分析单元110中,分析数据处理请求107的检索请求语句117。可以是利用一般数据库管理系统的SQL的分析。分析结果中包含以下内容。
是数据检索请求,检索对象范围是“圣经”,检索条件为《包含“降生”》。
另外,关于按照数据种类进行处理可得出以下三点。
(1)作为检索对象的语言类型设为英语及希腊语。另外,生成数据类型处理指示121作为指示按照数据的类型进行处理的信息。作为数据类型处理指示121的对象类型,将“English”及“Greek”设定为识别数据类型的值。
(2)在检索语句中,作为数据处理的部分翻译为各个语言。
(3)检索结果数据为登录的数据的原文原词。
其次,处理服务器选择单元111选择数据处理服务器104-1,104-2,...,104-n。根据作为在请求分析单元110中分析的结果的数据类型处理指示121,参考数据类型-数据处理服务器对应表122,选择数据处理服务器。
数据类型-数据处理服务器对应表122保持有数据类型的标记符和数据处理服务器信息的组(详细情况参见后面的图7)。
假设参照参考数据类型-数据处理服务器对应表122,以数据类型处理指示121的对象类型设定的数据类型标记符“English”,“Greek”作为键,获得与其对应的数据处理服务器信息123-1,123-2,并选择该数据处理服务器信息123-1,123-2所示的数据处理服务器。
数据处理服务器信息123-1,123-2包含有表示在对各个数据处理服务器104-1,104-2,...,104-n提出处理请求之际所必需的识别数据处理服务器的服务器名称,处理请求的方法的协议,
其次,数据处理请求单元112在数据处理服务器信息123-1,123-2的基础上,根据数据处理服务器信息123-1、123-2所含的协议,将请求分析单元110所分析的内容生成检索请求语句,向各个数据处理服务器104-1,104-2提出检索请求。
数据处理服务器104-1,104-2进行符合检索请求的数据检索处理。可以是利用具有各个语言的一般全文检索功能的数据库管理系统进行的检索处理。
数据处理服务器104-1,104-2按照请求以“包含“降生””这一条件利用全文检索处理单元进行各语言固有的全文检索。
数据处理服务器104-1,104-2将检索处理的处理结果送回数据访问管理单元103。
数据访问管理单元103,在处理结果编辑单元113之中,将数据处理服务器104-1,104-2的处理结果编辑为应用程序102所请求的结果。
如果按照请求分析单元110对来自应用程序102的结果的请求的分析得到的结果“原文照录”,就可不经过任何变换将数据处理服务器的处理结果10送回应用程序102。
应用程序102接收到英语数据124-1、希腊语数据124-2作为处理结果108时检索处理就结束。
如此示例所示,根据本发明可得到如下的效果。
数据访问管理单元103按照数据类型选择数据处理服务器104-1,104-2,...,104-n,由于是利用各数据处理服务器进行数据处理,所以可以进行每个数据类型特有的数据处理。
下面对本实施形态的硬件构成进行说明。
图2为示出本发明的实施形态(实施例)的硬件构成图。
作为本发明实施形态示出的程序在图2所示的数据处理装置之上动作。
数据处理装置201-1,201-2,201-3的构成包括各个中央处理器202-1,202-2,202-3,主内存203-1,203-2,203-3,输入输出控制器204-1,204-2,204-3,通信控制器205-1,205-2,205-3及其连接系统总线206-1,206-2,206-3。另外,输入输出控制器204-1,204-2,204-3上连接有键盘和鼠标以及如磁盘装置的数据存储装置208-1,208-2,208-3等。
数据处理装置201-1,201-2,201-3通过通信控制器205-1,205-2,205-3连接到局域网等网络105,与连接到网络105上的其他数据处理装置进行通信。
图1及其后的附图中所示的数据处理是由中央处理器202-1,202-2,202-3执行存储于内存203-1,203-2,203-3中的程序而实现。实现应用程序102,数据访问管理单元103,数据处理服务器104-1,104-2,...,104-n的功能的程序存储于内存203-1,203-2,203-3并由中央处理器202-1,202-2,202-3执行。另外,应用程序102,数据访问管理单元103,数据处理服务器104-1,104-2,…,104-n是各个软件的逻辑功能单元,可以在各个物理上不同的数据处理装置201-1,201-2,201-3上动作,具有这些多种功能的程序也可在一个数据处理装置上动作。另外,数据库114-1,114-2,…,114-n等,可通过在数据存储装置208-1,208-2,208-3存放数据而实现。
以下详细说明数据处理系统101的数据处理。
图3为示出数据处理系统101中的基本数据处理流程的流程图。
首先,应用程序102对数据访问管理单元103提出数据处理请求(301)。数据处理请求107送往数据访问管理单元103。
其次,数据访问管理单元103的请求分析单元110分析数据处理请求107(302)。将数据处理分析结果308和数据类型处理指示121作为分析结果而输出。
其次,数据访问管理单元103的处理服务器选择单元111选择数据处理服务器(303)。以数据类型处理指示121的对象类型的数据类型标记符作为键,从参考数据类型-数据处理服务器对应表122中选择数据处理服务器104并输出所选择的数据处理服务器的数据处理服务器信息123。
其次,数据访问管理单元103的数据处理请求单元112向数据处理服务器104提出数据处理请求(304)。在数据处理分析结果308的基础上生成以数据处理服务器信息123为根据的符合数据处理服务器的数据处理请求309并送往数据处理服务器104。
其次,数据处理服务器104进行与数据处理请求309相应的数据处理,该处理结果310送回到数据访问管理单元103(305)。
其次,数据访问管理单元103的处理结果编辑单元113根据应用程序102的请求对处理结果数据进行编辑(306)。对来自数据处理服务器104的处理结果310进行编辑并将该经过作为数据处理结果311输出。
其次,数据访问管理单元103将数据处理结果311送回到应用程序102而结束处理(307)。
按照这种处理,因为应用程序102发出的数据处理请求是由数据访问管理单元103根据数据类型选择与各个数据的类型相对应的数据处理服务器104进行数据处理请求,所以可能进行与数据类型相对应的数据处理。
下面详细说明数据处理系统101的数据检索处理。
数据检索处理的概略如图1所说明,基本处理流程按图3所示的处理流程进行。下面说明数据检索处理的各部分的处理。
图4为示出数据访问管理单元103的请求分析单元110分析数据处理请求的处理细节的流程图。详细示出图3的数据处理流程的步骤302。
首先,请求分析单元110分析检索请求语句117并生成数据处理分析结果308(401)。
在图1的检索请求语句117的场合,分析检索对象的范围是“圣经”及包含“降生”这一检索条件等,其内容保持于数据处理分析结果308中。其次,从应用程序102取得处理对象的数据类型的指示,生成数据类型处理指示121(402)并结束此次请求的分析处理。
处理对象的数据类型的指示具有如图1的118所示的执行环境变量TARGET LANG那样的形态。数据类型处理指示121的详细情况在下面的图5中说明。
根据这一处理,可根据来自应用程序102的数据类型指示对作为处理对象的数据类型进行区分。
图5为示出数据检索处理请求的分析结果的数据结构图。其中示出对来自应用程序102的数据处理请求107的分析结果。
数据检索的数据处理分析结果308由处理类型501,对象范围502及检索条件503构成。
在处理类型501中设定117的SQL文句的分析结果及表示“检索”的值。
在对象范围502中设定117的SQL语句的FROM句的分析结果及表示“圣经”的值。
在对象范围503中设定117的SQL语句的WHERE句的分析结果及表示“包含“降生””的值。
另外,数据类型处理指示121是在指定执行环境变量的基础上生成。
对指定执行环境变量118的进行分析的结果,可得到
TARGET_LANG English,Greek…504
设定“English”505,“Greek”506作为对象类型。
对指定执行环境变量119进行分析的结果,可得到
QUERY_LANG_TRANSLATION YES…507
设定“变换”508作为查询变换。
对指定执行环境变量120的进行分析的结果,可得到
RESULT_LANG ORIGINAL…509
设定“原文”510作为结果返回类型。
通过这种构成方式,可将分析数据处理请求的内容结构化。另外,可以表示出处理对象的数据类型,对查询中的数据类型的处理方式,作为处理结果返回的数据的类型示出等等表达出按照数据类型进行处理的指示。
图6为在数据登录处理中数据处理服务器的选择流程图。详细示出图3数据处理的步骤303。
首先,处理服务器选择单元111以数据类型处理指示121的对象类型的数据类型标记符505,506作为键检索参考数据类型-数据处理服务器对应表122中登录的记录(601)。作为其结果取得参考数据类型-数据处理服务器对应记录603。
其次,处理服务器选择单元111将参考数据类型-数据处理服务器对应记录603中包含的数据处理服务器信息123输出(602)而结束此次处理。
通过这一处理,可在数据类型基础上选择与各个类型相应的数据处理服务器。
图7为示出数据类型-数据处理服务器对应表122的构成示意图。
是在图6的选择数据处理服务器的处理601中参照的表。
数据类型-数据处理服务器对应表122的构成包括保持数据类型标记符的列701和数据处理服务器信息的列702。
数据处理服务器信息的构成包括在数据处理系统101内的唯一识别各处理服务器的服务器标记符及表示向数据处理服务器发送的处理请求的规定的协议信息等等。
703是表示数据类型“English”和处理服务器的对应关系的记录。在数据处理服务器中保持与英语对应的数据处理服务器的服务器标记符dbms en,在协议信息中保持有表示是SQL接口的值SQL。
704是表示数据类型“Greek”和处理服务器的对应关系的记录。在数据处理服务器中保持与希腊语对应的数据处理服务器的服务器标记符dbms el,在协议信息中保持有表示是SQL接口的值SQL。
705是表示数据类型“Hebrew”和处理服务器的对应关系的记录。在数据处理服务器中保持与希伯来语对应的数据处理服务器的服务器标记符dbms iw,在协议信息中保持有表示是SQL接口的值SQL。
通过这个表可表示数据类型及与其对应的数据处理服务器的相关关系。
图8为示出向数据处理服务器发送数据处理请求单元112的处理请求的处理的流程图。详细示出图3的数据处理中的步骤304。
首先,数据处理请求单元112,根据数据处理分析结果308将对象范围502映射到数据处理服务器上的数据库的模式中而生成数据处理请求309(801)。(对数据处理请求309的详细说明见图9)。处理服务器选择单元111根据在处理服务器选择处理303中选择的数据处理服务器信息123进行数据库的模式映射。
其次,将生成的数据处理请求发送到数据处理服务器(802)而结束此次处理。
通过这一处理,可向用通过数据类型所选择的各数据处理服务器提出与其相应的数据处理请求。
图9为从数据访问管理单元103向数据处理服务器104发送数据检索处理请求的数据结构图。
在图3的步骤304中(关于检索为图8的步骤801)示出生成的数据处理请求309的详细情况。
另外,在此示例中,为简单起见,只示出关于数据类型“English”的数据检索请求。关于数据类型“Greek”同样可生成希腊语数据处理服务器用的数据检索请求309。
数据处理请求309的请求语句901包含以下内容。
将数据处理分析结果308的对象范围502“圣经”映射到英语的数据处理服务器104-1的数据库114-1的模式中并以Scriptures表为检索对象。
将数据处理分析结果308的检索条件503内的“降生”按照数据类型处理指示121的对象类型“English”506和查询变换“变换”509变换为字符串“Nativity”作为全文检索键。
利用这一结构,可将发自应用程序102的数据处理请求107转换为适合各个数据处理服务器的形态。
图10为示出数据处理系统101中的处理结果编辑处理的流程图。示出图3的步骤306详细内容。
首先,数据访问管理单元103的处理结果编辑单元113参照数据类型处理指示121判断是否指定了返回结果的类型(1001)。
通过在图1的数据检索中的数据处理请求107中以执行环境变量RESULT_LANG120的指定设定数据类型处理指示121的结果返回类型“原文”510。
在步骤1001中,在指定类型的场合,将来自数据处理服务器104的处理结果310按照由数据类型处理指示121设定的数据类型进行数据变换并将该变换结果作为数据访问管理单元103的数据处理结果311(1002)。
因为在图1的数据检索中指定了“原文”510,所以可以不经变换就当作数据处理结果311。
在步骤1001中,在没有指定类型的场合,就将来自数据处理服务器104的处理结果310按照原样不变作为数据访问管理单元103的数据处理结果311(1003)。
通过这种处理就可以将应用程序102所请求的数据类型的数据返回。
如上所述,可以进行相应于数据类型的数据检索处理。
下面详细说明数据处理系统101中的数据登录处理。
图11为示出数据处理系统101中的数据登录处理概略的概念图。
其基本构成与图1所示相同,处理流程与图3所示的数据处理流程相同。以下对数据登录处理流程进行说明。
首先,应用程序102应用户106的请求提出数据登录请求。假设请求登录希伯来语文档数据。应用程序102向数据访问管理单元103提出数据登录处理请求。在数据处理请求107中包含希伯来语文档数据1101。
其次,数据访问管理单元103在请求分析单元110中对请求进行分析。将数据登录的数据处理分析结果308和数据类型处理指示121作为其结果输出。
在数据处理分析结果308中包含处理对象数据1102。
在数据类型处理指示121中设定数据类型标记符1103“Hebrew”作为对象类型。
其次,处理服务器选择单元111,根据数据类型处理指示121选择数据处理服务器并将数据处理服务器信息123-n输出。
其次,数据处理请求单元112向对应于希伯来语的数据处理服务器104-n提出数据处理请求。
数据处理服务器104-n将希伯来语数据402作为希伯来语的数据115-n存放在数据库114-n中。另外,与希伯来语对应的全文检索处理单元116-n在全文检索索引1104-n中登录针对数据115-1的索引项。
如在数据处理服务器104-n中的登录结束,其结果传送到数据访问管理单元103,并且在传送在应用程序102上的登录处理结束的信息之后结束数据登录处理。
通过这一处理,可通过选择利用数据访问管理单元103登录的数据1101的类型进行数据登录处理的数据处理服务器进行相应于数据类型的数据登录处理。
数据处理服务器可只以对应类型的数据作为对象进行数据登录处理。
图12为示出数据登录处理请求的构成的数据结构图。
数据处理请求107的构成包括示出登录数据的语言类型的执行环境变量的指定1201,数据登录请求语句1202及登录数据1101。
在1201中,由执行环境变量INPUT_LANG设定示出希伯来语的数据类型的值“Hebrew”。利用此执行环境变量INPUT_LANG可显示出登录的数据是何种语言。通过值“Hebrew”可示出登录的数据为希伯来语。
1202为示出“将数据登录到关于圣经(圣经)的文献集合中”的请求的SQL语句。
登录数据1101是以希伯来语描述的字符串数据。与SQL语句1202的变量:contains相关联。
这样,通过指定作为数据处理请求中的处理对象的数据的类型就可以区别作为处理对象的数据的类型。请求分析单元110在图4中的步骤402中分析此数据类型的指定就可以区别数据的类型。
图13示出数据登录的数据处理请求的分析结果308的结构。
详细示出在图4的数据处理请求分析处理中输出的分析结果。
数据登录的数据处理请求的分析结果308的构成包括处理类型1301,对象范围1302及处理对象数据1102。
处理类型1301的值设定为示出图12的数据登录的SQL语句1202的INSERT语句的分析结果“登录”。
对象范围1302的值设定为示出图12的数据登录的SQL语句1202的INSERT语句中的IHTO语句的分析结果“圣经”。
处理对象数据1102由包含在数据处理请求107中的登录数据1101构成。
对数据类型处理指示121的对象类型,以对图12的数据登录请求中的数据类型的指定1201的分析而识别的执行环境变量1303为基础,设定为示出希伯来语的值“Hebrew”1103。
通过这种结构可将分析数据处理请求的内容结构化而表现。
图14为示出由数据访问管理单元103向数据处理服务器104发送的登录处理请求的数据结构图。
是在图8的步骤801中生成的数据处理请求。
数据登录的数据处理请求309由登录的请求语句1401和1402构成。
通过图8的步骤801,在数据登录请求语句1401中,登录对象范围映射到希伯来语的数据处理服务器104-n的数据库114-n的模式而成为希伯来语的数据库的圣经的表。
另外,在登录值的变量:contents中设定要登录的指定的希伯来语的数据1402。
利用这一结构,可以将应用程序102发出的数据处理请求107以适合各个数据处理服务器的形态进行传送。
如上所述,可以进行与数据类型相应的数据登录处理。
其次,在应用程序102中,示出以数据的变量属性指定的数据类型的示例。图15为示出来自应用程序102的数据处理请求107的数据结构图。
在数据登录请求语句1501中,对于示出登录数据1101的变量:contents,指定属性LANGUAGE Hebrew 1502。由此,可进行与利用执行环境变量的数据类型的指定1201同等的指定。
通过在请求分析单元110中对此指定进行分析可进行与前面示出的数据登录处理同样的处理。
其次,利用本发明的第二实施形态对由数据类型不同的多种子数据构成的数据进行处理的第一示例予以说明。
本发明的第二实施形态的基本构成与图1的构成相同。下面按照应用程序102发出的数据处理请求的处理流程顺序进行说明。
图16为本发明的第二实施形态,其中示出从应用程序102发出的数据处理请求107的接口的概略图。
数据登录的数据处理请求107中包含的请求语句1601示出要分别在表Scriptures的三个列title,author,contents中插入字符串数据的请求。
此处,与各列值的变量相对的属性1605,1606,1607分别表示标题的字符串数据1602的数据类型为英语,作者的字符串数据1603为希腊语,而内容的字符串数据1604为希伯来语。
利用这一接口,可以指示一个行值是由多个不同类型列值构成的。
图17为利用图16所示的接口对数据处理请求进行分析的结果的数据结构图。
基本构成与前面示例中的图13所示的数据处理分析结果308相同。不同的部分,在处理对象数据1102中保持与列title,author,contents对应的子数据1701,1702,1703。
子数据1701,1702,1703由数据类型及值构成。
与列title相对应的子数据1701由数据类型“English”1704和标题字符串数据值1705构成。
与列author相对应的子数据1702由数据类型“Greek”1706和作者字符串数据值1707构成。
与列contents相对应的子数据1703由数据类型“Hebrew”1708和内容字符串数据值1709构成。
利用此数据结构可表示处理对象数据的子数据的各个数据类型。
图18为按照图17的数据处理请求分析结果进行数据登录之际,生成向数据处理服务器发送的处理请求的流程图。
这是与图8的步骤801相对应的处理的细节。
首先,数据处理请求单元112从数据类型处理指示121的对象类型中取出数据类型标记符(1801)。数据类型标记符“English”等与此相当。
其次,将在步骤1801中从处理对象数据1102中取出的属于数据类型的子数据集中,生成用于登录到数据处理服务器的登录用数据1806(1802)。在数据类型标记符为“English”的场合,生成登录用数据1806作为构成title的子数据1705的构成要素。
其次,在步骤1802中生成的登录用数据中,在处理的数据类型以外的子数据中设定表示该数据不明的信息unknown(1803)。在数据类型标记符为“English”的场合,以author,contents的部分为unknown。
其次,判断另外是否有处理对象的数据类型存在(1804)。
在另外有数据类型存在的场合,返回步骤1801并反复进行处理。通过反复进行到步骤1804为止的处理,在对象类型为多种的场合,可生成多个登录用数据。即可生成希腊语和希伯来语的登录用数据。
在步骤1804中,在另外不存在数据类型的场合则转向其次的步骤。
其次,在数据处理系统101中分发唯一的数据标记符,并在登录用数据中设定(1805)。在生成多个登录用数据的场合,将分发的一个相同数据标记符在所有的登录用数据中设定。至此结束登录用数据的生成处理。
通过这一处理,在由多个不同类型的子数据构成的数据登录中可对各数据类型的每一种生成登录用数据1806。
图19为示出在图18的处理中生成的登录用数据的结构图。
通过图18所示的处理,登录用数据相对数据类型“English”,“Greek”,“Hebrew”分别生成,分别具有1806-1,1806-2,1806-n那样的结构。
各个登录用数据1806-1,1806-2,1806-n保持有同一系统内数据标记符1901。
与数据类型“English”对应生成的登录用数据1806-1的构成包括数据标记符1901,title的子数据的标题字符串数据1902-1,author的子数据unknown 1903-1及contents的子数据unknown 1904-1。此登录用数据1806-1登录到希腊的数据处理服务器104-1上。
与数据类型“Greek”对应生成的登录用数据1806-2的构成包括数据标记符1901,title的子数据的标题字符串数据1902-2,author的子数据unknown 1903-2及contents的子数据unknown 1904-2。此登录用数据1806-2登录到希腊的数据处理服务器104-2上。
与数据类型“Hebrew”对应生成的登录用数据1806-n的构成包括数据标记符1901,title的子数据的标题字符串数据1902-n,author的子数据unknown 1903-n及contents的子数据unknown 1904-n。此登录用数据1806-n登录到英语的数据处理服务器104-n上。
利用这样的结构,可以将由多种类型的子数据构成的处理对象数据表示成为各个类型的登录用数据。
图20为示出在对以图19的结构登录的数据执行检索的结果进行编辑之际,在处理结果编辑单元113中的处理的流程图。
是在图10中的处理结果编辑处理的步骤1001之前进行的处理。
首先,处理结果编辑单元113利用从数据处理服务器接受的数据的子数据中取得不是unknown的实体数据并生成数据处理结果311(2001)。
其次,判断是否将处理结果的所有的子数据的实体数据集中(2002)。
在不集中的场合,以系统内数据标记符作为键,从其他数据处理服务器取得是unknown的子数据的实体数据,在数据处理结果311中设定(2003)。在将所有的子数据的实体数据汇集后处理就结束。
通过这样的处理,可以由分割的子数据生成原来的一个处理对象数据。
图21为示出在图20的处理中生成的处理结果数据的结构图。
将title的实体数据1902-1,author的实体数据1903-2和contents的实体数据1904-n集中分别形成子数据2102,2103,2104而生成处理结果数据2101。
下面,对本发明的第二实施形态中由数据类型不同的多个子数据构成的数据进行处理的第二示例予以说明。
在此示例中,在以XML(扩展标记语言)描述的文档中利用标记指定子数据的语言类型。
图22为示出数据登录的处理对象数据402的接口概略图。
处理对象数据402为以XML描述的文档。
2201表示此字符串数据是以XML描述的,并且示出字符编码是Unicode UTF-8。
以标记title 2202包围的部分表示此文档的标题。另外,通过以标记locale的属性language指定“English”(2203)表示以标记locale包围的部分是英语的字符串。
以标记author 2204包围的部分表示此文档的作者。另外,通过以标记locale的属性language指定“Greek”(2205)表示以标记locale包围的部分是希腊语的字符串。
以标记abstract 2206包围的部分表示此文档的摘要。另外,通过以标记locale的属性language指定“Hebrew”(2207)表示以标记locale包围的部分是希伯来语的字符串。
利用这种接口可以表现由数据类型不同的多种子数据构成的数据。
图23为示出图22的XML数据登录到数据处理服务器上时的登录用数据的结构图。
此示例示出与数据类型“English”对应的登录用数据2301。
利用图18所示的处理,按原样保持数据类型“English”的实体2302,其他的数据类型的子字符串以表示unknown的标记2303,2304置换。
利用这一结构,可以表示可在对应各个数据类型的数据处理服务器中进行适当的数据处理的登录用数据。
下面利用本发明的第三实施形态对更为复杂的数据类型的处理示例予以说明。
本发明的第三实施形态的基本构成与第一实施形态相同。主要不同之处在于数据类型是以结构更为复杂的信息表示,以及在数据处理服务器的选择中即使与所处理数据的数据类型不一致,可通过数据变换向数据处理服务器提出数据处理请求。
图24为示出以现场信息表示数据类型的接口概略图。
与在前述示例中数据类型以英语,希腊语,希伯来语等语言类型表示的情况不同,在此示例中还以地域及编码的组合表示数据的类型。
语言和地域及编码,按照POSIX(UNIX可移植性操作系统接口)标准的现场模型,以“en_US.iso88591”的方式表示语言,地域及字符编码。
2401以执行环境变量指定登录数据的现场为“iw_IL.iso88598”。借此可以表示登录数据的语言是希伯来语,地域是以色列,而编码是IS08859-8。
通过这种接口,可表示复合结构的数据类型。
图25为示出图24的复合结构的数据类型的数据登录处理中数据处理服务器的选择处理流程图。
基本上与图6所示的处理服务器的选择处理相同。不同之处在于在步骤601和步骤602中判断是否存在与数据类型标记符一致的记录(2501),及在不存在的场合进行处理以检索可能实施数据变换的数据类型的数据处理服务器(2502)。
由此,即使未能对复杂且类型数量众多的数据类型分别提供所有的完全对应的数据处理服务器,也可以利用与少数类型对应的通过数据变换可进行数据处理的数据处理服务器进行数据处理。
图26为示出在向数据处理服务器登录数据时数据变换处理的流程图。
数据处理分析结果308中包含的处理对象数据可针对在图25的步骤2502中检索出的可能进行数据变换的数据类型进行数据变换(2601)。
由此,即使不能提供与复杂的数据类型完全一致的数据处理服务器,也可以登录数据。
图27为示出在图26中生成的经过数据变换的数据的结构概念图。
在来自应用程序102的处理请求中,登录数据的现场为“iw_IL.iso88598”,数据类型标记符2701就取为“iw_IL.iso88598”。假设在数据类型-数据处理服务器对应表122中没有与此数据类型标记符一致的记录,作为检索结果得到可进行数据变换的数据类型标记符“iw_IL.utf8”2702的记录。按照该数据类型标记符2702利用图26示出的处理进行数据变换而生成登录用数据2703。
利用这种结构,即使不能提供与复杂的数据类型完全一致的数据处理服务器,也可以登录数据。
下面利用本发明的第四实施形态对应用程序接受数据类型的示例予以说明。
本发明的第四实施形态的基本构成与第一实施形态及第二实施形态相同。主要不同之处在于应用程序102在应用程序接口接受数据类型。
图28为示出在数据检索中应用程序102在处理结果中接受的数据类型接受请求的接口概略图。
在数据检索的数据处理请求107的请求语句2801中请求将作为结果接受的title,author的各个语言类型分别以其各个识别符:sTLang2802,:sAutLang2803接受。
在利用这种接口从保持多种类型的数据的数据库接受数据作为检索结果的场合,所接受的各个数据是何种类型可由应用程序102了解。
图29为示出在由图28这种接口指定的检索请求中,在将数据类型标记符返回到识别符之际的数据结构概略图。
在数据访问管理单元103的处理结果编辑单元113从数据处理服务器104-1,104-2接受title,author的各个子数据之际,依据各个数据处理服务器的数据类型标记符“English”2901,“Greek”2902设定处理结果数据2903的title的识别符“English”2904,author的识别符“Greek”2905。
由此,应用程序102可了解处理结果之中接受的数据的类型。
下面利用本发明的第五实施形态对经由网络探索数据处理服务器来选择进行数据处理的数据处理服务器的示例予以说明。
本发明的第五实施形态的基本构成与图1的构成相同。主要不同之处在于在数据访问管理单元103中不使用数据类型-数据处理服务器对应表122。
图30为示出在数据访问管理单元103的处理服务器选择单元111中进行数据处理服务器的选择处理的流程图。
在此示例中,经由网络105探索数据处理服务器,选择适合在数据类型处理指示121中包含的数据类型标记符的数据处理服务器并返回该数据处理服务器的信息(3001)。
利用这种处理,不用固定数据处理系统101的数据处理服务器的结构,并且,即使不保持有数据类型-数据处理服务器对应表122,也可选择进行数据处理的数据处理服务器。
下面利用本发明的第六实施形态对向数据处理系统添加数据处理服务器的示例予以说明。
本发明的第六实施形态的基本构成与图1的构成相同。主要不同之处在于将法语的数据处理服务器114-f添加到数据处理系统101,在数据访问管理单元103的数据类型-数据处理服务器对应表122上添加法语的数据处理服务器的信息。
图31为示出添加数据处理服务器的数据处理系统的构成的概念图。
在数据类型-数据处理服务器对应表122中添加可进行适合法语的数据处理的数据处理服务器的记录3101。
另外,将可进行适合法语的数据处理的数据处理服务器104-f链接到网络使其成为数据处理系统101的一部分。
在这种结构中,通过进行前面说明过的数据登录处理及数据检索处理,就可以利用在数据处理系统101中利用添加的法语数据处理服务器104-f的功能。
只要在数据类型-数据处理服务器对应表122中添加记录3101就可以对应法语的数据类型进行数据处理服务器104-f的数据处理。
还有,数据处理服务器104-f也可为数据处理系统101以外的应用程序3102所利用。
另外,对已经包含在数据处理系统101中的数据处理服务器104-1,104-2,...,104-n本身不须要增加任何改变。
下面利用本发明的第七实施形态对在数据处理服务器中保持的数据形式全部进行统一的示例予以说明。
本发明的第七实施形态的基本构成与图1的构成相同。主要不同之处在于在构成数据处理系统101的数据处理服务器104-1,104-2,...,104-n中保持的数据形式全部都相同。
图32为示出在数据处理服务器中处理的数据的数据形式全部为Unicode的示例。在数据处理服务器104-1,104-2,...,104-n之中保持的数据3201-1,3201-2,...,3201-n的编码全部是UTF8。
这样,在数据处理服务器104-1,104-2,...,104-n中处理的数据形式也可以全部都相同,可以不依赖数据类型及形式根据数据类型区别数据处理服务器。
另外,如前述示例所示,本发明中可做到以下各点。
(1)在可以访问类型不同的多种数据的数据处理系统中,
(1-1)因为可将依赖于由应用程序处理的类型的数据原样不变地在数据处理服务器中进行数据处理,因此可以在不丢失依赖于各个类型的信息的情况下按照各个数据类型特性进行处理。
(1-2)将子数据依类型分离,分别登录到与其相应的数据处理服务器,因为在检索时可将这些子数据组合成为原来的数据返回到应用程序,所以可以处理在一个数据中混杂有多个类型数据的数据。
(2)在构造(1)的环境方面,
(2-1)因为只通过编辑数据类型-数据处理服务器对应表就可以在数据处理系统上添加或删除数据处理服务器,所以易于构造可以访问类型不同的多种数据的数据处理系统。
(2-2)因为只通过编辑数据类型-数据处理服务器对应表就可以在现有的数据处理系统上添加或删除数据处理服务器,所以可利用能够提供依赖类型的功能的现有的模块。
(2-3)通过利用与各个类型对应的数据处理服务器,可以以所需的最小限度配置提供依赖类型的功能的模块。
本发明可以做到上述各点,特别是在数据库系统的多语言对应中,是很有效的。
另外,上述的流程图处理可通过在图2所示的数据处理装置中执行程序而实现。另外,该程序可存放于硬盘装置,软盘装置等计算机可读写的存储媒体上,可通过网络对程序进行访问。
下面对与列值对应的对照键作为多维数据为不同对照方法所共有,利用与列值对应的对照键进行对照而对记录进行排序的实施形态的对照处理装置予以说明。
图33为示出本实施形态的字符串排序处理的概略图。如图33所示,本实施形态的数据库系统10101具有对照模块10106及多维数据处理模块10107。
对照模块10106是以排序请求指定的对照方法,取得与成为评价对象的列值对应的对照键的维标记符,请求利用该对照键进行处理的对照处理单元。多维数据处理模块10107是参照对照模块10106取得的维标记符所表示的对照键,对存放表10115的列值的记录进行识别用的记录标记符10158以上述对照键进行排序,对与上述列值对应的记录标记符10158按照上述指定的对照方法赋予顺序的排序处理单元。
用来使数据库系统10101发挥对照模块10106及多维数据处理模块10107的功能的程序,在记录于CD-ROM等记录媒体,存放于磁盘等上面之后,装载到内存中执行。另外,记录上述程序的记录媒体也可以是CD-ROM以外的其他记录媒体。
首先,说明系统构成的概略。作为本实施形态的对照处理装置的数据库系统10101的构成包括应用程序10102,数据库处理服务器10103,定义数据存储器10104,表数据存储器10105,对照模块10106,多维数据处理模块10107以及多维数据存储器10108。
应用程序10102是将来自用户的数据库查询请求发送到数据库处理服务器10103并接受其处理结果的程序。
数据库处理服务器10103在提供一般的数据库管理系统的功能之外还包含索引管理单元10109。索引管理单元10109接受利用在数据库处理服务器10103中的索引进行排序的请求并将记录标记符的表10157作为结果返回。
定义数据存储器10104保持有索引定义信息10110,索引-域对应数据10112,对照方法-对照键对应数据10113及对照键-维对应数据10114。索引定义信息10110包含识别与索引对应的对照模块10106的对照模块标记符10111。另外,表数据存储器10105在表10115中保持记录。
多维数据处理模块10107是一种可提供在“OLAP SOLUTIONSBuilding Multidimensional Information Systems,Erik Thomson,JohnWiley&Sons,1997”中所描述的那种数据处理功能的模块,是按照在日本专利特开平9-265497号公报中所公开的“多维数据处理方法”中的方法装配的模块。多维数据存储器10108保持有与索引对应的多维数据域10116,此处保持有成为记录对照键的部分的编码值及该记录的记录标记符10158作为多维数据。
下面对此系统中包含排序请求10151查询处理的概略予以说明。应用程序10102向数据库处理服务器10103提出对表数据存储器10105中存放的字符串按照各种对照方法进行排序的请求(排序请求10151)。
数据库处理服务器10103对来自应用程序10102的查询请求进行分析并生成查询分析结果10152。在此分析处理中,探索索引定义信息10110并判断对排序处理可否利用索引。如存在与排序对象对应的索引定义信息10110,可决定进行以该信息为基础利用索引的数据库处理,将利用索引的结果得出的顺序按原样不变作为排序的顺序。
查询分析结果10152的结果,如决定利用索引,数据库处理服务器10103请求索引管理单元10109进行排序(索引排序请求10153)。索引管理单元10109,按照包含在索引定义信息10110中的对照模块标记符10111请求对照模块10106进行排序处理。
对照模块10106参照在定义数据存储器10104保持的索引-域对应数据10112,对照方法-对照键对应数据10113及对照键-维对应数据10114进行对照-多维数据分析变换10154。在此变换中,可得到与索引对应的多维数据处理的域,适用的对照方法的对照键和对应于对照阶段的多维数据域10116中的对照键识别维标记符和该对照键的优先度的信息。通过对这些进行指定,向多维数据处理模块10107提出多维数据分析请求10155。
在多维数据分析请求10155中,根据适合从应用程序10102发出的各个排序请求10151的对照方法,使各对照阶段的对照键的评价与维标记符和优先度对应而将其指定为输入。作为输出的分析结果构成记录标记符列表10157。
多维数据处理模块10107根据对各维的对照键指定的优先度的请求分析多维数据而进行排序,并将多维数据分析结果10156送回。
对照模块10106将此多维数据分析结果10156作为排序处理结果转送到索引管理单元10109。索引管理单元10109将其作为排序处理结果的记录标记符的列表10157。数据库处理服务器10103从索引管理单元10109接收到表示排序处理结束的响应就向应用程序10102发回查询处理结束的信息。至此查询处理结束。
另外,这一排序的查询处理结果利用一般的SQL的FETCH取出。根据从应用程序10102发出的取出请求,数据库处理服务器10103从记录标记符列表10157中顺序取出记录标记符10158,将用其识别的记录从列表数据存储器10105中取出并发回到应用程序10102。
图34为示出本实施形态的对照处理装置的概略构成图。本实施形态的数据库系统10101在一般的数据处理装置10201上工作。
数据处理装置10201具有CPU 10202,OS 10203,通信控制器10204,内存10205,I/O控制器10206及连接这些单元的系统总线10207等。另外,在I/O控制器10206上连接有键盘和鼠标以及如显示器等数据输入输出装置10208以及像磁盘装置这样的数据存储装置10209等。
数据处理装置10201利用通信控制器10204链接到局域网等网络10210而与链接到网络10210的其他数据处理装置10201通信。
图33及其后附图中所示的程序功能是在OS管理之下执行存放在内存10205中的程序而实现。另外,定义数据存储器10104,列表数据存储器10105,多维数据存储器10108等通过将数据存放于数据存储装置10209而实现。
图35为示出本实施形态的列表10115的示例图。在图35中,在数据库系统10101中表示出存放记录的列表10115的结构。
作为名簿的列表10115包含表示姓名10301及读音假名10302的列及其他的列。另外,记录标记符10303分配到各个记录。其中,姓名10301的列值设为CHAR型16字符以内的值,读音假名10302的列值设为CHAR型16字符以内的值。
记录10304显示出姓名10301的值为“足立修”,读音假名10302的值为“ぁたち おさむ”,利用记录标记符rid1数据库处理服务器10103识别此记录及其他记录。另外,记录10305~记录10312的情况相同。
图36为示出本实施形态的索引定义信息10110的示例图。索引定义信息10110的构成包括索引标记符10401,列表标记符10402,列标记符10403,对照模块标记符10404及对照要素类型10405。
索引标记符10401是识别此定义信息表示的索引及其他索引的标记符。列表标记符10402是识别索引设定对象的列表的标记符。列标记符10403是识别成为设定对象的键的列的标记符。
另外,利用记录10406及10407这样的多个定义信息,表示多个列的组合是索引键,记录10406及10407表示姓名10301及读音假名10302的组合是此索引(名簿对照索引)的键。
对照模块标记符10404是识别对照模块10106的标记符。在以此定义信息表示的索引进行有关对照的处理时识别执行对照模块10106。对照要素类型10405表示与列标记符10403对应的对照要素,在记录10406中表示姓名10301在根据表示进行对照中是对照要素。
如上所述,记录10406及10407在“名簿对照索引”中表示识别的索引已经设定,将表示名簿的列表10115的姓名10301及读音假名10302的列组合起来作为索引键。关于此索引的对照的处理由jjsx4061识别的对照模块10106执行。对照中的对照要素是表示列记读法列的组,与各个姓名10301记读音假名10302相对应。
这样的索引定义信息10110可以通过将一般的数据库管理系统提供的索引定义功能进行扩展而生成。
图37为示出本实施形态的对照方法-对照键的对应数据10113的示例图。对照方法-对照键对应数据10113包括有对照方法标记符10501,对照键标记符10502及对照阶段10503。
记录10504~10508表示代表性读法对照方法的对照键及其对照阶段。即分别表示在代表性对照方法的对照步骤的第一阶段中按照字符类别的顺序评价表示列的起始字符,在第二阶段以第一分节的代表性读法作为对照键进行评价,在第三阶段以第一分节的表示列作为对照键进行评价,在第四阶段以第一分节的读法列作为对照键进行评价,而在第五阶段以第一分节的表示列作为对照键进行评价。
记录10509表示在读法·表示对照方法中的对照步骤的第一阶段中以读法列作为对照键进行评价,记录10510表示在读法·表示对照方法中的对照步骤的第二阶段中以表示列作为对照键进行评价。另外,记录10511表示在读法·表示在单纯对照方法的对照步骤的第一阶段中以表示列作为对照键进行评价。
此外,比如由于在记录10507及记录10509中对照键标记符“读法列”是共通设定的,可判断读法列的对照键在代表性读法对照方法的对照步骤的的四阶段及读法·表示对照方法的对照步骤的第一阶段可共通使用。
图38为示出本实施形态的对照键-维对应数据10114的示例图。对照键-维对应数据10114包含对照键-维对应数据10114及对照键标记符10601,维标记符10602。
记录10603表示以“第一表示字符类别”识别的对照键和在多维数据域10116中的以“第一表示字符类别”识别的维相对应,同样,记录10604~记录10607的各对照键和在多维数据域10116中的各维相对应。
此外,比如与记录10507~记录10509中的各对照键标记符“读法列”共通使用相对应,多维数据处理中的维“读法列”在多个对照方法中也通用。
图39为示出本实施形态的索引与域对应数据10112的示例图。在数据库系统10101中,使每个索引保有多维数据域10116。其对应关系利用索引-域对应数据10112表示。
索引-域对应数据10112包含索引标记符10701及域标记符10702,记录10703表示在“名簿对照索引”中识别的索引与在多维数据处理模块10107中以“名簿对照域”识别的域对应。
其次,作为在数据库系统10101的多维数据域10116上登录多维数据的条目的示例示出在记录插入时进行多维数据条目登录的示例。
图40为示出本实施形态的数据库系统10101中插入记录的处理的概略图。本实施形态的多维数据处理模块10107在插入记录之际将对应该列值的多个对照键作为多维数据保持于多维数据域10116中,多维数据中的对照键可为不同对照方法所共有。
请求记录插入10853的应用程序10801为了使在作为名簿的列表10115中存放记录,在数据库处理服务器10103上进行登录请求10851,比如可利用以下这样的SQL语句提出查询请求。
INSERT INTO名簿VALUES(“足立修”,“ぁだち おさむ”,…)
数据库处理服务器10103接收到这一查询请求,进行查询分析10852,决定数据库处理步骤。在查询分析10852中,分析是记录插入请求,就决定在列表数据存储器10105中进行记录插入10853。
另外,参照索引定义信息10110,判断插入的记录是否是维护索引。比如参照图36的记录10406及10407,可确定名簿对照索引是维护对象。
接着,按照数据库处理步骤进行向列表数据存储器10105的记录插入10853。数据库处理服务器10103决定记录的存放位置,并存放于列表数据存储器10105中。于是,将该存放位置的信息编码为记录标记符10854。
其次,按照在查询分析10852中决定的数据库处理步骤,进行索引维护10855。数据库处理服务器10103请求在索引管理单元10109上进行索引条目登录。索引管理单元10109利用从索引定义信息10110取得的对照模块标记符10404(jisx4061)确定对照模块10106,请求在对照模块10106进行条目登录。通过这一请求指定索引标记符,对照模块标记符,索引设定对象的列值及记录标记符。
对照模块10106根据在定义数据存储器10104中保持的索引定义信息10110,对照模块-对照方法对应数据10802及对照方法-对照键对应数据10113,对应对照要素由索引键值取得对照键值。另外,参照对照键-维对应数据10114,进行对照键-多维数据条目变换10856以使对照键与多维数据条目对应。将通过这一变换而得到的对照键-多维数据条目变换10856请求登录在多维数据处理模块10107上的多维数据登录请求10857予以执行。另外,关于此对照模块10106的条目登录处理在后面的图42中详细说明。
图41为示出本实施形态的对照模块-对照方法对应数据10802的示例图。对照模块-对照方法对应数据10802包含对照模块标记符10901及对照方法标记符10902。记录10903~10905表示以jisx4061识别的对照模块10106与“代表性对照方法”,“读法·表示对照方法”,“单纯对照方法”三种对照方法的标记符对应。
图42为示出本实施形态的条目登录时的对照模块101106的处理步骤的流程图。在图42中表示根据从索引管理单元10109发出的条目登录请求而启动的处理,此处理的输入是索引标记符,对照模块标记符,索引设定对象的列值及记录标记符。
首先,参照索引定义信息10110将列值变换为对照要素的值(步骤11001)。比如参照图36的记录10406及10407,以插入的记录的列值“足立修”为表示列的值,列值“ぁたち ぉさむ”为读法列的值。
其次,参照对照模块-对照方法对应数据10802,取得与此对照模块10106对应的对照方法标记符(步骤11002)。比如从图41的记录10903得到对照方法标记符“代表性对照方法”。
其次,在步骤11002中取得的对照方法标记符的基础上,从对照方法-对照键对应数据10113取得与对照方法对应的对照键(步骤11003)。比如以对照方法标记符“代表性读法对照方法”为基础从图37的记录10504中得到对照方法标记符“第一表示字符类别”。
其次,从在步骤11001中取得的对照要素的值取得对照键值(步骤11004)。比如得到表示列“足立修”的起始字符“足”而得到字符类别“汉字”(对照模块10106利用字符的字典取得)。
其次,将在步骤11004中取得的对照键值编码(步骤11005)。还有,由此得到的对照键值编码以列表形式保持(步骤11006)。
其次,对于在步骤11003中取得的对照键判断是否另外存在适用的对照键(步骤11007)。如存在适用的对照键,就反复进行步骤11003~步骤11006的处理。比如图37的记录10505~10508等适用,就针对这些记录反复进行步骤11003~11008的处理。
在步骤11007中没有适用的对照键的场合,就转向下一个步骤11008。在步骤11008中,针对在步骤11002中取得的对照标记符判断是否另外存在适用的对照方法标记符。如存在适用的对照键,就重复步骤11002~步骤11008的处理。比如图41的记录10904及10905等适用,就针对这些记录反复进行步骤11002~11008的处理。就是说也针对读法·表示对照方法,单纯对照方法反复进行取得对照键的处理。
在步骤11008中,没有适用的对照方法标记符的场合,就转向下一个步骤11009。在到此为止对处理中,针对关于对照模块10106的所有的对照方法得到对照键值编码值的列表。其次,参照索引-域对应数据10112,取得请求在多维数据处理模块10107上登录的域的标记符(步骤11009)。比如参照图39的记录10703取得域标记符“名簿对照域”。
其次,参照对照键-维对应数据10114,将在步骤11006中生成的对照键值编码的列表及记录标记符与多维数据处理模块10107中的维对应(步骤11010)。比如,参照图38的记录10603~10607等,将对照键值编码与维对应。就是将“足立修”的第一表示字符类别“汉字”的编码值与维“第一表示字符类别”对应。另外,将记录标记符rid1与维“记录标记符”对应。
其次,向多维数据处理模块10107提出条目登录请求(步骤11011)。在此请求中,在步骤11009中取得的域标记符“名簿对照域”中指定域,在步骤11010中指定生成的维和编码值。如在多维数据处理模块10107中条目登录结束,这一处理就结束。在针对一个记录的条目登录中,适用于排序的对照方法的全部对照键的编码值登录到多维数据域10116上。
图43为示出本实施形态的对照键值的编码的示例图。在图43中表示出在图42的对照模块10106的条目登录中的步骤11005中生成的编码的构成例。
对照键11101是代表性读法对照方法的第一阶段中的对照键,表示出表示列第一字符的字符类别的编码。另外,表示列“足立修”的表示列第一字符“足”的字符类别为“汉字”,与在JIS X 4061中规定的字符类别的编号“11”对应,就以“11”作为对照键的编码。
对照键11102是代表性读法对照方法的第二阶段中的对照键,表示出代表性读法的编码。另外,因为表示列“足立修”的读法列“ぁたち おさむ”的代表性读法为“ぁし”(对照模块10106利用代表性读法字典等确定),与由JIS X 4061规定的以下的编号相对应进行编码。
字符类别的编码:假名…“10”
字符类别内的字符的顺序:“ぁ”…“1”,“し”…“12”
清浊属性编号:“ぁ”(清音)…“0”,“し”(清音)…“0”
记号类型属性编号:“ぁ”(大字符)…“0”,“し”(大字符)…“0”
假名类型属性编号:“ぁ”(平假名)…“0”,“し”(平假名)…“0”
同样,对第一分节表示列,读法列,表示列等所有的对照键进行编码。另外,这些编码次序进行数值化,数值的大小与对照键的顺序相对应。因此,在多维数据分析时以其数值大小进行比较,通过以升序重排很容易得到表示对照键次序的排序处理结果。
图44为示出本实施形态的多维数据域10116中保持的多维数据的示例图。如图42的条目登录的处理中所示那样,针对适用于排序的全部对照方法的全部对照键生成维。
在图44中,分别生成第一表示字符类别11201,代表性读法11202,第一分节表示列11203,读法列11204,表示列11205以及记录标记符11206的维,对这些维配置如图43所示的对照键的编码值。
其中,读法列的维为代表性读法对照方法和读法·表示对照方法共有,另外,表示列的维为代表性读法对照方法,读法·表示对照方法及单纯对照方法所共有。
如上所述,关于对照的全部对照键的编码值保持于对应的多维数据域10116中。
图45为示出本实施形态的包含排序请求10151的查询处理步骤的流程图。在图45中,表示在应用程序10102请求对存放于列表数据存储器10105中的字符串进行排序时的处理,比如由应用程序10102请求对作为名簿的列表10115以姓名10301和读音假名10302的组作为键(作为各个对照要素的表示列,读法列)根据代表性读法对照方法进行排序。
一般在应用程序102中,针对这种处理的请求,对于查询定义一个临时表,打开该临时表之后,通过取出取得每一件查询的结果。另外,在图45中,示出对于应用程序10102发出的打开临时表的请求,数据库处理服务器10103生成经过排序的查询处理结果列表的处理。
首先,数据库处理服务器10103得到对应用程序10102发出的查询请求进行分析的分析结果(与图33的查询分析结果10152相当)。其中,通过一般的分析处理,对于是包含排序请求10151的查询请求这一点进行分析,比如针对作为名簿的列表10115的姓名10301及读音假名10302的列组,对于是根据代表性读法对照方法的排序请求10151这一点进行分析(步骤11301)。
其次,判断是否利用在排序处理中已经定义·设定的索引。在此判断中,在名簿列表10115中,探索以姓名10301及读音假名10302为对象的索引定义信息10110(步骤11302),了解是否存在适用的索引定义信息10110(步骤11303)。
在存在适用的索引定义信息10110的场合,就决定以已经设定的索引作为所使用的数据库处理步骤(步骤11304)。接着,取得适用的索引定义信息10110(步骤11305)。在此处取得适用的图36的记录10406及10407的信息。
在步骤11304中,在不存在适用的索引定义信息10110的场合,就决定从记录生成多维数据作为排序的数据库处理步骤(步骤11306)。
接着,数据库处理服务器10103按照在查询分析10852中决定的数据库处理步骤执行数据库处理。数据库处理服务器10103判断是否是利用索引的数据库处理步骤(步骤11307)。
在利用已经设定的索引的场合,向索引管理单元10109提出利用索引进行排序的请求。(与图33的排序请求10153相当)。索引管理单元10109接收在步骤11305中取得的索引定义信息10110,应排序请求10151进行处理(步骤11308)。在此请求中,指示在排序请求10151中指定的索引标记符及对照方法标记符。索引管理单元10109以索引定义信息10110的对照模块标记符为基础请求对照模块10106进行排序处理。对照模块10106利用多维数据处理模块10107对结果图42的登录处理的多维数据进行分析,取得记录标记符列表10157,作为处理结果送回。关于请求排序时对照模块10106的处理的详细情况在图46中说明。索引管理单元10109以此处理结果作为处理结果的记录标记符列表10157。
在不利用步骤11307中已经设定的索引(生成多维数据进行排序)的数据库处理步骤的场合,数据库处理服务器10103从列表数据存储器10105取得全部记录并对其进行多维分析排序处理(步骤11309)。关于这一处理在图49中说明。生成以对照次序重排的记录标记符列表10157作为其处理结果。
如步骤11308或步骤11309的处理结束,数据库处理服务器10103就向应用程序10102发出查询处理结束的信息(步骤11310)并结束查询处理。
图46为示出本实施形态的排序处理时的对照模块10106的处理步骤的流程图。在图46中,表示出对照模块10106应索引管理单元10109的排序请求10151在图45的步骤11308中启动的处理,该处理的输入为索引标记符和对照方法标记符。
对照模块10106,以用户的排序请求10151指定的对照方法标记符为基础,参照对照方法-对照键对应数据10113,取得对照键标记符和对照阶段10503(步骤11401)。比如按照对照方法标记符取得图37的记录10504的对照键标记符“第一表示字符类别”和对照阶段10503“1”等。
接着,以1401中取得的对照键标记符为基础,从对照键-维对应数据10114取得维标记符。比如对应于在步骤11401中取得的对照键标记符“第一表示字符类别”,从图38的记录10603等取得维标记符“第一表示字符类别”等。
其次,从在步骤11402中取得的维标记符和在步骤11401中取得的对照阶段10503生成维和优先度组(步骤11403)。比如由对照键标记符“第一表示字符类别”的对照阶段10503是“1”出发确定以维标记符“第一表示字符类别”识别的维的优先度为“1”。
其次,判断对于在步骤11401中取得的对照键,是否另外存在适用的对照键(步骤11404)。在另外存在适用的对照键的场合,就反复执行步骤11401到步骤11404的步骤。在另外不存在适用的对照键的场合,就转到下一个步骤11405。在到此为止的处理中,对维标记符“第一表示字符类别”,“代表性读法”,“第一分节表示列”,“读法列”及“表示列”分别赋予优先度“1”,“2”,“3”,“4”及“5”。
在步骤11405中,以从索引管理单元10109接受的索引标记符为基础,参照索引-域对应数据10112,取得域标记符。参照图39的记录10703可得到域标记符“名簿对照域”。
其次,从在步骤11403生成的维标记符和优先度的组生成请求对多维数据进行分析之际的参数(步骤11406)。在此处,参数的设定应使处理结果形成记录标记符列表10157。到此为止的处理相当于图33的对照-多维数据分析变换10154。
其次,向多维数据处理模块10107提出多维数据分析请求(步骤11407)。这相当于图33的多维数据分析请求10155。如取得多维数据处理模块10107的处理结果,将该结果的记录标记符列表10157转送到索引管理单元10109(步骤11408),此处理就结束。据此可实现应用程序10102的排序请求处理。
图47为示出本实施形态的排序处理结果的示例图。多维数据分析结果10156-1表示根据代表性读法对照方法排序的结果。第一表示字符类别,代表性读法,第一分节表示列,读法列及表示列各个维以该次序排定优先度,其各自的值(对照键编码值)是按升序排序的多维数据分析结果。这就成为与在代表性读法对照方法的各对照阶段10503中进行对照键评价的场合同等的结果。
以此结果可得到记录标记符列表rid2,rid3,rid4,rid5,rid6,rid7,rid8,rid9,…。这就成为在代表性读法对照方法中对姓名10301及读音假名10302的列值进行排序的场合的记录的记录标记符列表10157。
同样,多维数据分析结果10156-2表示根据读法·表示对照方法排序的结果,多维数据分析结果10156-n表示根据单纯对照方法排序的结果。从任何一个都可利用其对照方法在对姓名10301及读音假名10302的列值进行排序的场合得到记录的记录标记符列表10157。
图48为示出本实施形态的生成多维数据的排序处理时的多维数据示例图。在图48中,表示在图45的步骤11309中,在由记录生成多维数据进行排序处理时保持于多维数据存储器10108中的多维数据。
在图45的步骤11309中,在临时操作用多维数据域11601中配置针对取自数据存储器的记录的对照键的编码值,并利用图46所示的处理进行排序。详细情况示于图49。
在临时操作用多维数据域11601中,生成与适用于排序的对照方法的对照键相对应的第一表示字符类别11602~表示列11606和与记录标记符相对应的记录标记符11607。对其配置图43所示的那样的编码值。
图49为示出本实施形态的生成多维数据的排序处理步骤的示例图。在图49中,表示在图45的步骤11309中,在由取自列表数据存储器10105的记录生成多维数据进行排序处理时的流程图。
首先,数据库处理服务器10103参照对照模块-对照方法对应数据10802,取得在排序请求10151中指定的与对照方法相对应的对照模块标记符(步骤11701)。比如得到针对代表性读法对照方法的对照模块标记符jisx4061。
其次,参照对照方法-对照键对应数据10113,取得在排序请求10151中指定的对照方法对照键和对照阶段10503的信息(步骤11702)。于是参照对照键-维对应数据10114,从对照键取得维标记符(步骤11703)。在步骤11704中,取得多维数据处理的临时操作用多维数据域11601。
其次,从列表数据存储器10105取得排序对象的记录(步骤11705)。在步骤11706中,使对照键值和记录标记符与多维数据的维对应。根据用户的请求,以记录的姓名的列值作为对照要素的表示列的值,以读音假名的列值作为对照要素的读法列的值。以此值为基础,对照模块10106生成对照键值并与在多维数据分析中的维对应。
其次,对照模块10106在临时操作用多维数据域11601中登录在步骤11706中生成的对照键值(步骤11707)(与图42的条目登录处理相同)。由此而生成图48所示的多维数据。
其次,数据库处理服务器10103针对在步骤11705中取得的记录判断是否另外还存在适用的记录(步骤11708)。在另外还存在适用的记录的场合,就反复执行步骤11705到步骤11708的步骤。在另外不存在适用的记录的场合,就转到下一个步骤11709。通过到此为止的处理,针对成为列表数据存储器10105的排序对象的全部记录,将对照键值的多维数据登录到临时操作用多维数据域11601。
在步骤11709中,对照模块10106参照对照方法-对照键对应数据10113及对照键-维对应数据10114,生成作为维标记符和优先度的多维数据分析的参数。比如,在代表性读法对照方法中,对第一表示字符类别,代表性读法,第一分节表示列,读法列及表示列各维赋予以此为次序的优先度而生成参数。
其次,对照模块10106,利用在步骤11709中生成的参数提出多维数据分析请求,多维数据处理模块10107按照此请求对多维数据进行分析(步骤11710)。数据库处理服务器10103接受对照模块10106的处理结果,将多维数据分析的处理结果作为排序结果(步骤11711)并结束此处理。
利用以上的处理,即使在没有设定好的索引的场合,也可生成对照键的多维数据并利用多维数据分析进行排序处理。
图50为示出本实施形态的经过改变的对照方法定义的示例图。在图50中表示出增加改变的对照方法的定义数据,在此示例中示出在支持前述的JIS X 4061对照方法的数据库系统10101中添加根据汉字的笔画数顺序的代表性读法对照方法,读法·表示对照方法,单纯对照方法(分别称为代表性读法笔画数对照方法,读法·表示笔画数对照方法及单纯笔画数对照方法)的场合的定义数据。
在对照方法-对照键对应数据10113中,示出记录11801~11805“代表性读法笔画数对照方法”的对照键是“第一表示字符类别”,“代表性读法”,“第一分节表示列”,“读法列”及“表示列笔画数”,各个对照阶段10503以“1”,“2”,“3”,“4”及“5”评价。同样,记录11806及11807表示“读法·表示笔画数对照方法”的对照键及对照阶段10503,记录11808表示“单纯笔画数对照方法”的对照键及对照阶段10503。
另外,在对照键-维对应数据10114中,记录10809表示对照键“表示列笔画数”与维“表示列笔画数”对应,在对照模块-对照方法对应数据10802中记录11810~11812表示各个代表性读法笔画数对照方法,读法·表示笔画数对照方法,单纯笔画数对照方法与对照模块jisx4061对应。
基于这些定义,利用在图42中说明的多维数据条目登录处理及在图46中说明的多维数据分析处理,与上述的排序处理一样,可进行根据汉字笔画数的读法·表示对照方法的排序处理。但是,必须在对照模块10106中添加使笔画数表示列编码的功能。
图51为示出本实施形态的经过改变的对照方法定义的排序结果示例图。在图51中,表示在图50中示出的定义数据的基础上排序的结果,多维数据分析结果11901表示根据代表性读法笔画数对照方法排序的结果,对第一表示字符类别,代表性读法,第一分节表示列,读法列及表示列笔画数的各维赋予以此为次序的优先度,其各个值(对照键的编码值)按升序排列的多维数据分析结果。这与在代表性读法笔画数对照方法的各对照阶段中进行的对照键评价的场合的结果相同。
在此结果中可得到记录标记符rid2,rid3,rid1,rid4,rid5,rid7,rid6,rid8,rid9,…。这就成为在代表性读法笔画数对照方法中对姓名10301及读音假名10302的列值进行排序的场合的记录的记录标记符列表10157。
同样,多维数据分析结果11902表示根据读法·表示笔画数对照方法排序的结果,多维数据分析结果11903表示根据单纯笔画数对照方法排序的结果。从任何一个都可利用其对照方法在对姓名10301的列值进行排序的场合得到记录的记录标记符列表10157。
在此处,如果将多维数据分析结果11901~11903分别与图47的代表性读法对照方法,读法·表示对照方法及单纯对照方法的排序结果进行比较,在多维数据分析结果11901及11902中记录标记符rid4的“角田 正史”和记录标记符rid5的“角田 雅志”的记录次序由于与JIS X 4061中的汉字的次序和笔画数不同而相反。另外,在多维数据分析结果11903中,由于在JIS X 4061中的汉字的次序和笔画数不同其次序有很大差别。
这样,根据本发明,仅仅改变对照方法的定义信息就可以利用一个多维数据群来很容易地支持其他排序功能。
图52为示出本实施形态的按照表示列,读法列顺序进行评价的对照方法定义及排序结果的示例图。在图52中,表示支持按照表示列,读法列的顺序评价的对照方法(称为表示·读法对照方法)的排序的示例,在对照方法-对照键对应数据10113中保持的数据12001及12002示出按照表示列,读法列的顺序评价的表示·读法对照方法。
以此数据为基础,根据图46所示的对照模块10106进行的排序处理可得到多维数据分析结果12003。可得到在以表示·读法对照方法对姓名10301及读音假名10302的列值排序的场合的记录的记录标记符列表10157。
这样,根据本实施形态,仅仅改变对照方法的定义信息就可以不改变现有的多维数据而按原样利用来很容易地支持排序功能。
图53为示出在现有的数据库中的系统运行的概念图。在应用现有技术的数据库系统12101中,由于一个索引不能与多个对照方法相对应,对每一个对照方法都生成索引。
对于在列表数据存储器12102中保持的列表12103的索引键列12104设定索引。对于数据库处理服务器12105根据各个对照方法进行索引存放区域确保操作12106而确保索引数据存储器12107。于是,进行索引定义操作12108在定义数据存储器12109中保持索引定义信息12110。
图54为示出在本实施形态中的数据库中的系统运用的概念图。在应用于本实施形态的数据库系统10101中,由于以一个多维数据群对应多个对照方法,所以生成一个多维数据域10116。
对于数据库处理服务器10103进行多维数据域确保操作12201,在多维数据存储器10108中确保多维数据域10116。于是,进行索引定义操作12202在定义数据存储器10104中保持索引定义信息10110。
在支持多个对照方法的排序的场合,与在应用现有技术的系统中需要针对各个对照方法进行多次运用操作不同,在应用本实施形态的系统中可只进行一次运用操作。因此,可以减少支持多个对照方法的系统的运用操作成本。
图55为示出现有的索引数据的概念图。在图55中示出的数据库系统12101中,在与多个对照方法的排序分别对应的索引数据存储器12107中保持的索引存储器12301包含有键值12302。此处,键值是在各个索引存储器内重复同样的内容而保持。
图56为示出本实施形态的多维数据的概念图。在数据库系统10101中,在对应于多种对照方法的多维数据存储器10108中保持的多维数据域10116包含有多维数据条目12401。
在根据多种对照方法进行排序的场合,与在应用现有技术的系统中必须对各个对照方法保持索引键值不同,在应用本实施形态的系统中,只需要在多维数据域10116中保持一个多维数据条目。因此可以减少支持多种对照方法的系统的资源。
另外,前述的流程图处理可在图34所示的一般的数据处理装置10201中执行程序而实现。并且,该程序可存放于硬盘装置,软盘等计算机可读写的记录媒体上,可以通过网络访问程序。
按照上述方式,根据本实施形态,因为在按照多种对照方法支持排序之际,多维数据为多种对照方法所共有,利用该多维数据中的对照键可进行多种对照方法的排序处理,所以可以使利用各个对照方法的排序处理高速化,可提高多维数据的利用效率(削减资源)并减少运行操作成本。
另外,因为可以参考对照方法的定义信息仅仅添加改变该对照方法所使用的对照键的定义信息就可以与对照方法的添加改变进行对应,所以可提高多维数据的利用效率(削减资源)并使运用操作易于进行。
另外,在本实施形态中,对于作为名簿的列表10115是以姓名10301及读音假名10302的组作为键的代表性读法对照方法为基础对排序处理进行说明,但也可以通过利用处理其他语言的对照方法作为对照方法来进行对应多语言的排序处理。
如上所述,根据本实施形态的对照处理装置,因为表示与列值对应的对照键的多维数据为多种对照方法所共有,利用多维数据中对对照键进行根据多种不同对照方法的排序处理,所以可以利用多种对照方法进行高速排序处理及提高多维数据利用效率。
实施形态201
下面对于由包含字符串的任意要素构成的数据的存储及取出的实施形态201的数据处理装置予以说明。
图58为示出实施形态的排序处理的处理概略的示例图。如图58所示,本实施形态的数据处理装置的构成包括排序处理单元20100,处理菜单表示单元20101,规则定义单元20102,重排处理登录单元20103及重排执行单元20104。
排序处理单元20100是控制重排处理整体的处理单元。处理菜单表示单元20101是显示重排处理菜单的处理单元。规则定义单元20102是定义表示在重排中参照列中的重排对象和重排顺序的重排规则的处理单元。
重排处理登录单元20103是指定在重排中表示参照列和适用参照列的重排中所使用的规则的重排处理的处理单元。重排执行单元20104是按照上述重排处理的内容执行重排的处理单元。
用于使排序处理单元20100,处理菜单表示单元20101,规则定义单元20102,重排处理登录单元20103及重排执行单元20104执行其功能的程序是记录于CD-ROM等记录媒体上,在存放到磁盘等上面之后,装载到内存中执行。另外,记录上述程序的记录媒体也可以是CD-ROM以外的其他记录媒体。
排序处理单元20100的处理菜单表示单元20101在接受规则定义请求20120,重排处理登录请求20130,重排请求20140作为处理请求20150时,就分别由规则定义单元20102,重排处理登录单元20103及重排执行单元20104进行处理。
在提出规则定义请求20120之际,指定规则名20121,重排规则20122,在提出重排处理登录请求20130之际,指定重排处理名20131,重排规则名20132,对象列名20133,在提出重排请求20140之际,指定进行重排的列表20141及进行重排的规则名20142,对象列名20143或重排处理名20144。
在接收到规则定义请求20120,重排处理登录请求20130时,就将指定的信息存放在盘装置20110内的重排登录数据20111中分别成为规则信息20112,重排处理信息20113。
图59为示出实施形态201的数据处理装置的概略构成的示例图。数据处理装置20200包含CPU 20211,内存20213,I/O控制装置20212。通过由CPU 20211执行存放于内存20213中的排序处理单元20100进行排序处理,利用I/O控制装置20212从盘装置20110读出数据或对其写入数据,在监视器20220上显示信息,从键盘20221,鼠标20222进行信息输入处理。
用于进行重排的列表20231存放于盘装置20110中,执行重排后的排序结果20232也存放于盘装置20110中。排序处理单元20100在监视器20220上显示菜单,根据键盘20221,鼠标20222的操作接受信息。
图60为示出实施形态的列表20141的构成的示例图。列表20141由列名单元20310和数据单元20320构成,列表20141的最上面的行是列名单元20310,其下面部分构成数据单元20320。列表20141由一个以上的列20330及20340构成,在列中分别存放列名和数据。在图内的示例中,作为列名登录的是“姓名”及“读音假名”,作为姓名列的列数据存放的是“铃-木-一-郎”,“山-田-太-郎”,作为读音假名列的列数据存放的是“すず-き-ぃち-ろぅ”,“やま-た-た-ろぅ”。
图61为示出实施形态的处理菜单显示单元20101的处理步骤的流程图。如启动排序处理单元20100,就执行图61的流程的处理菜单表示单元20101。下面利用图61说明处理菜单显示处理。
处理菜单表示单元20101显示一个菜单用来选择执行规则定义,重排处理登录,重排请求中的哪一个(步骤20410)。
如用户选择规则定义(步骤20420),就执行规则定义单元20102进行规则定义处理(步骤20421)。
如选择重排处理登录(步骤20430),就执行重排处理登录单元20103进行重排处理登录(步骤20431)。如选择重排处理执行(步骤20440),就执行重排执行单元20104进行重排执行(步骤20441)。
图62为示出实施形态的规则定义单元20102的处理步骤的流程图。如从处理菜单显示选择规则定义,就显示用于进行规则登录的菜单,由用户进行项目设定(步骤20510。)。
图63为示出实施形态的规则定义菜单的示例图。菜单内的各项目表示输入登录规则的名称的规则名20600,关于在进行重排时参照列的信息设定单元20602,用于重排的数据设定单元20650。
在规则名20600中设定此后登录的规则名称。在关于在进行重排时参照列的信息设定单元20602中,设定用于选择在列参照时以全字符串为对象,以n字符为对象,还是以直到分割字符为对象而使用的开关20611~20613;以n字符为对象的场合的字符长度20614,以直到分割字符为对象的场合的分割字符20615,用于指定以升序或降序进行重排的开关20616及20617。
在指定在选择n字符串或分割字符串进行评价时,在相同一顺序的场合,以下一个分节(n字符的场合为下面的n字符,分割字符的场合为直到下面的分割字符出现的字符)进行再评价的场合,检查下面的分节评价20619。
列20620以下的信息设定单元20602在同时对多个列的字符进行重排评价的场合,参照列数部分同样系供设定之用。
在信息设定单元20602中,设定固定前置的项目前方配置字符20630及固定后置的项目后方配置字符20640。
固定前置项目是在存在与升序或降序无关要置于重排的前头的字符的场合要顺序排列进行字符登录,在存放对象字符串的列的输入栏设定字符。
比如在将名簿以名字的顺序重排的场合,在某一特定名字的人排列在前头,其他人按照读音假名顺序重排的场合,给列1(20610)分配的是名字,通过在前方配置字符20630的列1(20631)的输入栏20634下面将要排列在前头的名字输入,就可以将输入的名字置于重排结果的前方位置。同样,固定后置项目是在存在与升序或降序无关要置于重排的后头的字符的场合要顺序排列进行字符登录。
列1,列2,列3和设定项目的存在是为了表示在信息设定单元20602中设定的有关上述列的列信息与何者对应,在与前方,后方配置的列对应的栏中进行信息设定。在指定多个列的组合的场合,在与要组合的各列对应的栏中进行信息设定。
全部项目设定以后,利用OK按钮20603发出设定完成的通知并接受在菜单中设定的定义信息(步骤20520),存放于盘装置20110内的重排登录数据20111的规则信息20112中(步骤20530)。
图64为示出实施形态的规则信息的细节的示例图。在规则定义菜单上设定的信息作为规则名20800,列数20801,各列的对象字符20802,各列的排序顺序指定20803,各列对象以外字符20804,前方固定数据有无20810及数据20811,后方固定数据有无20820及数据20821。
图65为示出实施形态的重排处理登录单元20103的处理步骤的流程图。下面利用图65对重排处理登录予以说明。如由处理菜单显示进行选择重排处理登录,就显示用于重排处理登录的菜单,由用户进行项目设定(步骤20910)。
图66为示出实施形态的重排处理登录菜单的示例图。菜单内的各项目指定登录重排处理名21000,应用重排规则名21011和与规则指定的列21012~21015对应的列名21016~21019。在对重排结果为同一顺序的场合添加处理的场合,在第二条件21020,第三条件21030中同样指定应用重排的规则名21021及规则名21031和由规则指定的列21022~21025,与列21032~21035对应的列名21062~21029,列名21036~21039。
项目设定后,利用OK按钮21003发出输入完成的通知并接受在菜单中设定的定义信息(步骤20920),存放于盘装置20110内的重排登录数据20111的重排处理信息20113中(步骤20930)。
图67为示出实施形态的重排处理信息20113的细节的示例图。在重排处理信息中设定的信息作为重排处理名21110,条件数21101,各条件的规则名21102,与条件内规则对应的列名21103登录,对应列名与由规则定义的列数相一致登录。
图68为示出实施形态的重排执行单元20104的处理步骤的流程图。图69为示出实施形态的重排执行处理接续图。下面利用图68及图69对重排执行处理予以说明。如果由处理菜单显示选择重排执行处理,就显示用于执行重排的菜单,用户进行项目的设定(步骤20201)。
图70为示出实施形态的重排处理执行菜单的示例图。菜单内的各项目表示输入存放成为重排对象的数据的文件的名称的重排文件名21300,输入存放重排执行结果的文件名称的结果存放文件名21301,输入重排处理的内容的重排处理指定栏21302,输入登录完毕的重排处理的名称的重排处理名21305。
重排处理指定可以选择在重排处理指定栏21302中指定规则名和列名的方法和在重排处理名21305中指定重排处理名的方法,在指定规则名和列名的场合,指定进行重排的规则名21311和与规则指定的列21312~21315相对应的列名21316~21319。
在重排结果出现同一顺序的情况下进行追加处理时,指定第2条件21320及第3条件21330以后重排的规则名21321及规则名21331,由规则指定的列21322~21325及列21332~21335对应的列名21326~21329及列名21336~21339。
在指定重排处理的名称的场合,指定在重排处理登录中登录的重排处理的名称作为重排处理名21305。项目设定后,利用OK按钮21303发出完成的通知并接受设定的执行用的信息(步骤21202),执行实际的重排处理。在重排执行用菜单中指定的执行重排的文件从盘装置读入(步骤21203),检查是否指定规则和列名以及是否指定重排处理(步骤21204)。
在指定规则和列名的场合,取出与指定的规则对应的重排登录数据20111的规则信息20112(步骤21206),按照取出的信息进行列的评价。
检查指定对象字符是全字符串(步骤21207),n字符(步骤21208),还是直到分割字符(步骤21210),并在指定全字符串的场合以全字符串为重排对象(步骤21214),在指定n字符的场合以指定的字符数的字符串作为重排对象(步骤21209),在分割字符的场合以指定的分割字符从字符串内检索(步骤21211),检查是否有分割字符(步骤21212),在有分割字符的场合,就以直到分割字符前的字符串作为重排的对象(步骤21213),在没有分割字符的场合,就以全字符串作为重排的对象(步骤21214)。
其次检查是否指定前方配置项目(步骤21215),在指定的场合,就参考登录的字符串和重排对象的字符串,在登录的字符串存在的场合,置于重排结果之前的位置(步骤21216)。
其次检查是否指定后方配置项目(步骤21217),在指定的场合,就参考登录的字符串和重排对象的字符串,在登录的字符串存在的场合,置于重排结果之后的位置(步骤21218)。
其次对于未置于前方或后方的剩余字符串检查指定的是升序还是降序,在指定升序的场合按升序重排(步骤21220),在指定降序的场合按降序重排(步骤21221)。
按照针对指定列的规则评价结果为同一顺序的场合(步骤21222),在指定执行下一个分节评价的场合(步骤21223),对下一个分节的字符重复操作步骤21208以后的处理。在未指定执行下一个分节评价而对下一列指定条件的场合(步骤21224),则取出对同一顺序的字符串执行下一个条件的所用的规则信息,执行步骤21206以下的处理。在全部重排处理执行之后,将重排执行的结果输出到指定的文件(步骤21225)而结束处理。
在指定重排处理的场合,取出与指定的重排处理名相对应的重排处理信息20113(步骤21205),参照在处理信息中指定的规则名,列名,以下执行与指定规则名和列名的场合同样的处理。
取出与规则对应的重排登录数据20111的规则信息20112(步骤21206),按照取出的信息对列进行评价。检查指定对象字符是全字符串(步骤21207),是n字符(步骤21208),还是直到分割字符(步骤221210),并在全字符串是对象的场合以全字符串为重排对象(步骤21214),在指定n字符的场合以指定的字符数的字符串作为重排对象(步骤21209),在分割字符的场合以指定的分割字符从字符串内检索(步骤21211),检查是否有分割字符(步骤21212),在有分割字符的场合,就以直到分割字符前的字符串作为重排的对象(步骤21213),在没有分割字符的场合,就以全字符串作为重排的对象(步骤21214)。
其次检查是否指定前方配置项目(步骤21215),在指定的场合,就参考登录的字符串和重排对象的字符串,在登录的字符串存在的场合,置于重排结果之前的位置(步骤21216)。
其次检查是否指定后方配置项目(步骤21217),在指定的场合,就参考登录的字符串和重排对象的字符串,在登录的字符串存在的场合,置于重排结果之后的位置(步骤21218)。
其次对于未置于前方或后方的剩余字符串检查指定的是升序还是降序(步骤21219),在指定升序的场合按升序重排(步骤21220),在指定降序的场合按降序重排(步骤21221)。
按照针对指定列的规则评价结果为同一顺序的场合(步骤21222),在指定执行下一个分节评价的场合(步骤21223),对下一个分节的字符重复操作步骤21208以后的处理。在未指定执行下一个分节评价而对下一列指定条件的场合(步骤21224),则取出对同一顺序的字符串执行下一个条件的所用的规则信息,执行步骤21206以下的处理。在全部重排处理执行之后,将重排执行的结果输出到指定的文件(步骤21225)而结束处理。
本排序处理单元20100可应用于将图60的名簿数据的读音假名按50音序重排的场合。首先对用于按50音序重排的规则进行定义。
图71为示出实施形态的重排处理登录菜单的指定例示意图.如图71所示,规则名20600以50音序(21401)排列,在列1(20610)检查对象字符串是n字符(21410),字符数是“1”(21411)。
在对象除外字符中指定“-”(21412),也指定下一个分节再评价(21413)。在前方配置字符20630的输入项目20631的列1处登录“ぁ”(21420),“ぃ”(21421),“ぅ”(21422),…“を”(21423),“ん”(21424)。
图72为示出实施形态的重排处理执行菜单的指定例示意图。重排执行,如图72所示,通过在执行菜单上指定名簿数据为重排执行文件名(21510),名簿数据重排执行结果为执行结果文件名(21511),登录规则名“50音序”(21520)为第一条件21310的规则名21311,并通过指定列名读音假名(21521)为列1(21312),就可以将读音假名列的“-”省略的字符串以一个一个字符“ぁ”“ぃ”“ぅ”…的次序重排。
在图60的名簿数据中存在有读音假名列,即使在不存在的场合,对于名字列,通过将汉字的名字以读法的顺序登录的规则进行登录,也可以不需要读音假名列而按名字的读法顺序重排。
同样,图60的名簿数据可以应用于在JIS X 4061-1996中制定的对照方法的基本代表性读法对照的重排。基本代表性读法对照由下面的五个步骤评价。
(1)表示列的起始字符按照字符类别的顺序进行评价。字符类别分类如下。
1.空格
2.描述符号
3.括弧符号
4.学术符号
5.一般符号
6.单位符号
7.阿拉伯数字
8.西文符号
9.拉丁字母
10.假名
11.汉字
12.位符号
(2)由该分节的表示列,读法列决定代表性读法,以该代表性读法作为对照键进行评价。也可以对第二分节以下进行评价。
(3)以该分节的表示列作为对照键进行评价。
(4)以读法列作为对照键进行评价。
(5)以表示列作为对照键进行评价。
图73为示出进行实施形态的基本代表性读法对照的重排处理规则的信息设定单元的设定例示意图。首先按规则定义如图73所示,分配列1用于评价(1),列2及列3用于评价(2)及(3),列4及列5用于评价(4)及(5)。因为列1的起始字符是按字符类别顺序排列,对象字符串检查n字符(21611),字符数定为“1”(21612)。字符类别的顺序登录于与前方配置字符,后方配置字符的列1的对应栏中。
图74为示出实施形态进行基本代表性读法对照的重排处理规则的数据设定单元的设定例示意图。如图74所示,登录顺序为空格(21701),描述符号(21702,21703),括弧符号(21704,21705),学术符号(21706),一般符号(21707),顺序最后的“位符号”登录在后方配置字符20640中(21731)。
其次,在列2及列3为了取出表示列及读法列对对象字符串的分割字符进行检查(21621,21631),将“-‘定义为分割字符(21622,21632)。按照将(2)的代表性读法作为对照键进行评价和将(3)的表示列作为对照键进行评价的结果的顺序在前方配置字符20630和后方配置字符20640的列2及列3的对应栏中登录字符组合。
如图74所示,以列2和列3的字符组合读法为“ぁ”或“ぁん”的“安”(21711)序位比读法为“ぁ”或“ぁし”的“足”为高,下面同样以安(ぁ,ぁん)<足(ぁ,ぁし),<角(かく,かど),<足(そく),<角(つ の),<安(やす,やすらか)顺序设定(21711~21716)。
最后,列4及列5指定只以读法列或表示列作为对照键进行评价,将各对象字符串对全字符串进行检查(21641,21651),“-”除外(21643,21653),以升序重排(21642,21652)。
图75为示出实施形态的重排处理登录菜单的设定例示意图。重排的执行,如图75所示,在执行菜单中通过指定登录的规则名为第一条件21310的规则名(21820),指定姓名为列1的列名(21821),指定姓名为列2的列名(21822),指定读音假名为列3的列名(21823),指定读音假名为列4的列名(21824),指定姓名为列5的列名(21825)就可以执行前述的基本代表性读法对照重排。由此可以实现用户指定的重排处理的登录和执行。
如上所述,根据本实施形态的数据处理装置,因为预先登录用于进行重排的规则,利用指定的规则执行重排,用户就可以独自执行数据的重排。
实施形态202
下面对生成可显示在数据库中进行包含字符串的由任意要素构成的数据的存储及取出,重排的执行结果的索引的实施形态202的数据处理装置予以说明。
图76为示出实施形态的数据处理装置22000的系统构成图。在信息处理装置22030中DB(数据库)访问应用程序22031运行,在数据处理装置22000中DBMS 22003运行,这些数据处理装置22000及信息处理装置22030与网络22060链接而可以相互通信。
DB访问应用程序22031通过网络22060向数据处理装置22000上的DBMS 22003提出执行查询请求。如DBMS 22003接受查询请求,就通过访问与数据处理装置22000链接的盘装置22010中存放的DB数据22011执行与查询请求相对应的处理。
图77为示出实施形态的数据处理装置22000及信息处理装置22030的概略构成图。如图77所示,数据处理装置22000的构成包括CPU 2213,内存2214,I/O控制装置2212及通信控制装置2211。通过由CPU 2213执行存放在内存2214中的DBMS 22003的程序进行DBMS 22003的处理,利用I/O控制装置2212从盘装置2210读出数据或向其写入数据,利用通信控制装置2211与链接在网络22060上的其他信息处理装置22030交换数据。
信息处理装置22030的构成也一样,在内存2202中存放和执行DB访问应用程序22031。如DB访问应用程序22031执行对DBMS22003的查询,从信息处理装置22030的通信控制装置2203向数据处理装置22000的通信控制装置2211发出请求,向DBMS 22003发送查询。DBMS 22003执行响应请求的处理,在必须访问DB数据22011的场合,由I/O控制装置2212访问存放在盘装置2210中的DB数据22011。处理结果由通信控制装置2211转送信息处理装置22030的通信控制装置2203,返回给发出请求的原DB访问应用程序22031。
图78为示出实施形态的DBMS 22033的处理概略图。如图78所示,本实施形态的数据处理装置22000的构成包括列表定义单元22101,插入单元22102,检索单元22103,规则定义单元22104,重排处理登录单元22105和处理请求接受单元22106。
列表定义单元22101是定义数据库的列表的处理单元。插入单元22102是在数据库中插入数据,更新显示重排执行结果用的索引的处理单元。检索单元22103是数据库的检索结果的重排处理单元,是按照指定的重排处理的内容执行重排的进行重排执行单元的处理的处理单元。
规则定义单元22104是定义表示在重排中参照的列中的重排对象和重排次序的重排规则的处理单元。重排处理登录单元22105是指定表示在重排中参照的列和在适用参照列的重排中使用的规则的重排处理,对作为重排对象的数据生成显示重排的执行结果用的索引的处理单元。处理请求接受单元22106是接受数据库的处理请求22110的处理单元。
使数据处理装置22000获得列表定义单元22101,插入单元22102,检索单元22103,规则定义单元22104,重排处理登录单元22105及处理请求接受单元22106的功能的程序记录在CD-ROM等记录媒体上并存放在磁盘等上之后,装载到内存中执行。另外,记录上述程序的记录媒体也可以是CD-ROM以外的其他记录媒体。
如DBMS 22003通过处理请求接受单元22106接受数据库的处理请求22110时,就对请求进行分析,进行列表定义单元22101,插入单元22102,检索单元22103,规则定义单元22104,重排处理登录单元22105的各自的操作。
在DB数据22121中,存放DB信息22122,列表数据22123,索引信息22124,作为DB信息22122存放的是列表信息22125,列信息22126,索引信息22127,规则信息22128,重排处理信息22129等。
列表信息22125用于在列表生成时添加信息,设定列表名构成列数等。列信息22126也同样用于在列表生成时添加信息,设定构成列的列表名,列名,列的数据类型信息等。在索引信息22127中可在索引生成时添加信息,设定生成索引的列表名,列名信息等。规则信息22128用于通过规则定义单元22104添加有关重排规则的信息,重排处理信息22129用于通过重排处理登录单元22105添加重排处理登录的列表名,列名规则名。
在列表数据22123中存放生成的各列表的数据。利用检索单元22103取出列数据,利用插入单元22102存放行数据。索引信息22124用于在生成索引时添加信息和在执行检索时高速检索数据。
图79为示出实施形态的表定义单元22101处理步骤的流程图。利用图79以后的附图对本实施形态的数据库系统的重排处理,关于重排用的索引的DBMS 22003的功能按各功能进行说明。作为涉及重排处理,重排用索引的操作功能有列表定义,插入,检索,规则定义,重排处理定义等功能。处理请求22110发送到DBMS 22003,对处理请求22110执行操作功能的处理。
图80为示出实施形态的表定义处理的概略图。首先,利用图80和图79进行说明。处理请求22110与生成列表的列表名22601,构成列表的列的列名22602,列的数据类型22603等一起送往DBMS22003。在DBMS 22003中对请求进行分析,执行列表定义单元22101,在DB信息22122内的列表信息22125上添加列表名22611,列数等(步骤22301),在DB信息22122内的列信息22126中添加列表名22611,列名22612及22613,列数据类型22614及22615(步骤22302)。
图81为示出实施形态的插入处理的概略图。图82为示出实施形态的插入单元22102处理步骤的流程图。下面利用图81及图82对数据的插入处理予以说明。处理请求22110与插入数据的列表的列表名22701,插入各列的列数据22702及22703等一起发送到DBMS 22003。列的数据类型有整数型和字符型等类型,在插入数据中指定与各类型对应的数据。
在DBMS 22003中对请求进行分析而执行插入单元22102,从DB信息22122取得与列表名22711对应的列表信息22125,列信息22126,索引信息22127(步骤22411),参照列信息22126将列数据22712及22713存放于DB数据22121的对应的列表数据22123中(步骤22412)。参照所取得的索引信息22127,在插入列表中附加索引的场合(步骤22415)对索引进行更新(步骤22416)。
图83为示出实施形态的规则定义处理的概略图。图84为示出实施形态的表定义单元22104处理步骤的流程图。其次,利用图83和图84对规则定义处理予以说明。处理请求2211O与登录的重排规则的规则名23001和对象字符串信息23002,升序/降序信息23003,除外字符23004,下一个分节评价23005等规则信息一起发送到DBMS 22003。
在DBMS 22003中对请求进行分析,执行规则定义单元22104,在DB信息22122内的规则信息22128中添加规则名23011和对象字符串信息23012,升序/降序信息23013及升序/降序信息23023,除外字符23014及下一个分节评价23025等信息(步骤23201)。
图85为示出实施形态的重排定义处理的概略图。图86为示出实施形态的重排处理登录单元22105的处理步骤流程图。下面利用图85及图86对重排处理定义予以说明。处理请求22110与登录的重排处理的处理名23101和执行重排的列表名23102,适用的重排规则名23103,列名23104及23105等一起发送到DBMS 22003。
在DBMS 22003中对请求进行分析,执行重排处理登录单元22105,在DB信息22122内的规则信息22128中添加处理名23111,列表名23112,规则名23113及23123,列名23114,23115,23124及23125等信息(步骤3310),在DB信息22122内的索引信息22127中添加列表名23112,规则名23113及23123,列名23114,23115,23124及23125等信息(步骤3311)。取得由规则名23113及23123指定的规则信息22128(步骤3312),参照由列表名23112指定的列表生成作为重排对象的数据的索引(步骤3313)。
图87为示出实施形态的表检索处理的概略图。图88为示出实施形态的检索单元22103的处理步骤流程图。下面利用图87及图88,89对数据检索处理予以说明。处理请求22110与取出列表的列表名22801,检索项目22802,重排指定22803一起发送到DBMS22003。由检索项目22802指定取出列表的列名。
重排指定分为指定降序重排用的规则,与规则对应的列名的场合及指定通过重排处理登录登录完成的重排处理名的场合。
在DBMS 22003中对请求进行分析,执行检索单元22103,从DB信息22122取得与列表名22811对应的列表信息22125,由检索项目22812及22813指定的列信息22126(步骤22521),从DB信息22122取得与重排指定相关的索引信息22127(步骤22522)。执行重排指定的检查(步骤22523),在没有重排指定的场合从列表数据22123取出列数据22821及22822并将结果送回(步骤22525)。
图89为示出实施形态的利用索引的表检索处理的概略图。在指定重排的场合,指定将检查重排规则和与规则对应的列名的指定或利用重排处理名的指定(步骤22530),取得重排规则并在指定与规则对应的列名的场合取得规则信息(步骤22531),检查有没有指定的重排可能适用的索引(步骤22532),在没有索引的场合,从列表数据22123取出列数据22821及22822(步骤22533),执行根据规则的重排(步骤22830,步骤22534)并将结果送回(步骤22525)。在有索引的场合,如图89所示,参照索引数据22124,从该索引的顺序排列的列表数据22123取出列数据22921及22922(步骤22930,步骤22536),将结果送回(步骤22525)。
在利用重排处理名指定重排的场合,取得重排处理信息22129,规则信息22128(步骤22535),参照与重排处理对应的索引信息22124,从该索引的顺序排列的列表数据22123取出列数据22921及22922(步骤22930,步骤22536),将结果送回(步骤22525)。
利用上述方式,就可以实现用户指定的重排处理的登录,执行及用于重排的索引的生成,和利用索引的重排结果的高速访问。
如上所述,根据本实施形态的数据处理装置,因为预先登录用于进行重排的规则,利用指定的规则执行重排,用户就可以独自执行数据的重排。
另外,根据本实施形态的数据处理装置,因为通过生成以针对重排处理指定的规则进行重排的结果的索引,在重排处理中按照指定的规则进行的重排就可能得到高速执行。
根据本发明,在可以访问多种数据的数据处理系统中,因为可以按照类型选择数据处理装置,就具有可以提供根据类型进行区别处理的功能的效果。

Claims (33)

1.一种根据英语及日语等自然语言的分类对数据类型进行区分,可访问类型不同的多种数据的数据处理方法,其特征在于包括:
基于数据的类型选择进行数据登录及检索等的数据处理的数据处理装置的第一过程,以及
利用在第一过程中所选择的上述数据处理装置执行数据处理的第二过程。
2.如权利请求1所述的数据处理方法,其特征在于包括:
在上述第二过程的数据处理中,上述数据处理装置进行适合上述数据类型的数据处理的第三过程。
3.如权利请求1所述的数据处理方法,其特征在于包括:
在上述第一过程中,仅仅以某种有限的类型作为处理对象来选择上述数据处理装置的第四过程。
4.如权利请求1所述的数据处理方法,其特征在于包括:
在向在上述第一过程中所选择的上述数据处理装置提出处理请求之际,可依上述数据处理装置所处理的数据的类型变换请求的第五过程。
5.如权利请求1所述的数据处理方法,其特征在于包括:
作为一种数据检索方法,
对在上述第二过程中上述数据处理装置进行数据处理所得到的处理结果进行编辑而生成数据检索处理的结果数据的第六过程。
6.如权利请求5所述的数据处理方法,其特征在于包括:
将在上述第六过程中上述数据处理装置进行数据处理所得到的处理结果变换为某种数据类型而生成上述数据检索处理的数据检索结果的第七过程。
7.如权利请求1所述的数据处理方法,其特征在于包括:
作为一种数据登录处理,
依登录对象的数据类型在上述第一过程中选择数据处理装置的第八过程,以及
在上述第二过程中,登录对象的数据不经过变换由上述所选择的数据处理装置进行数据登录的第九过程。
8.如权利请求1所述的数据处理方法,其特征在于:
作为由子数据过程的数据的登录方法包括,
从子数据依类型按照数据处理步骤生成登录用数据的第十过程,
在系统内生成单一的数据标记符,在上述第十过程中生成的登录数据中设定该数据标记符的第十一过程,以及
数据处理装置登录上述登录用数据的第十二过程。
9.如权利请求1所述的数据处理方法,其特征在于:
作为一种数据检索方法,包括
在上述第六过程中,以在上述第十一过程中设定的数据标记符为基础由构成保持有同一数据标记符的数据的子数据生成检索结果数据的第十三过程。
10.如权利请求1所述的数据处理方法,其特征在于:
在上述第一过程中,包括参照表示数据类型和上述数据处理装置的对应关系的对应表,通过以数据类型作为键取得识别上述数据处理装置的信息来选择数据处理装置的第十四过程。
11.如权利请求1所述的数据处理方法,其特征在于:
在上述第一过程中,探索可执行数据处理的数据处理装置,取得探索检出的数据处理装置,根据取得的数据类型选择数据处理装置的第十五过程。
12.如权利请求1所述的数据处理方法,其特征在于:
在上述第一过程中,从处理对象的数据的第一类型选择与类型可变换的第二类型相对应的数据处理装置的第十六过程,以及
将处理对象的第一类型的数据变换为第二类型的数据的第十七过程。
13.一种根据英语及日语等自然语言的分类对数据类型进行区分,可访问类型不同的多种数据的数据处理系统,其特征在于包括:
基于数据的类型选择进行数据登录及检索等的数据处理的数据处理装置的第一装置,以及
利用在第一装置中所选择上述数据处理装置执行数据处理的第二装置。
14.如权利请求13所述的数据处理系统,其特征在于包括:
利用用于表示该数据处理系统的数据处理的执行环境及控制数据处理用的执行环境变量,指定作为处理对象的数据的类型的应用程序编程接口。
15.如权利请求13所述的数据处理系统,其特征在于包括:
以保持作为处理对象的数据的变量的属性指定类型的应用程序编程接口。
16.如权利请求15所述的数据处理系统,其特征在于包括:
以保持构成作为处理对象的子数据的变量的属性指定类型的应用程序编程接口。
17.如权利请求13所述的数据处理系统,其特征在于包括:
指定在作为处理对象的数据的内部的相应的数据的类型的应用程序编程接口。
18.如权利请求17所述的数据处理系统,其特征在于包括:
指定在作为处理对象的数据的内部的构成适用的数据的子数据的类型的应用程序编程接口。
19.如权利请求11所述的数据处理系统,其特征在于包括:
根据由多种要素,如语言,地域,编码组成的现场等,构成的类型指示处理对象的数据类型的应用程序编程接口。
20.如权利请求11所述的数据处理系统,其特征在于包括:
根据识别符等变量指示处理结果的数据类型的应用程序编程接口。
21.如权利请求11所述的数据处理系统,其特征在于包括:
识别对数据类型和适用的数据的类型进行数据处理的数据处理装置的识别信息对应表。
22.如权利请求10所述的数据处理方法,其特征在于包括:
对表示上述数据类型和上述数据处理装置的对应关系的对应表进行编辑的第十八过程。
23.一种根据英语及日语等自然语言的分类对数据类型进行区分,可访问类型不同的多种数据的数据处理系统中的程序及存放数据的存储媒体,其特征在于包括:
基于数据的类型选择进行数据登录及检索等的数据处理的数据处理装置的第一装置,以及
具有请求由第一装置所选择的上述数据处理装置执行数据处理的第二装置的数据处理装置的程序及数据。
24.一种通过执行与列值对应的对照键的对照对记录进行排序的对照处理方法,其特征在于包括的步骤有:
以排序请求指定的对照方法取得与作为评价对象的列值对应的对照键的标记符,并利用该对照键进行排序处理的请求,
参照以上述标记符表示的对照键,对识别存放上述列值的记录用的记录标记符以上述对照键进行排序,对与上述列值对应的记录标记符依上述对照方法顺序排列。
25.如权利请求24所述的对照处理方法,其特征在于将与列值对应的多个对照键作为多维数据保持,多维数据中的对照键为不同对照方法所共有。
26.如权利请求24或25中任何一项所述的对照处理方法,其特征在于包括在插入记录之际登录与该列值对应的对照键的步骤。
27.一种按照指定的对照方法进行列值对照而对记录进行排序的对照处理装置,其特征在于包括:
以排序请求指定的对照方法取得与作为评价对象的列值对应的对照键的标记符,并利用该对照键请求进行排序处理的对照处理单元,
参照以上述标记符表示的对照键,对识别存放上述列值的记录用的记录标记符以上述对照键进行排序,对与上述列值对应的记录标记符依上述对照方法顺序排列的排序处理单元。
28.一种将可以使计算机作为一种按照指定的对照方法进行列值对照而对记录进行排序的对照处理装置工作的程序进行记录的计算机可读存储媒体,其特征在于包括:
以排序请求指定的对照方法取得与作为评价对象的列值对应的对照键的标记符,并利用该对照键进行排序处理的请求的对照处理单元,
参照以上述标记符表示的对照键,对识别存放上述列值的记录用的记录标记符以上述对照键进行排序,对与上述列值对应的记录标记符依上述对照方法顺序排列的排序处理单元。
29.一种对由包含字符串的由任意要素构成的数据进行存储及取出的数据处理方法,其特征在于包括:
对表示在重排中参照列中的重排对象和重排的顺序的重排规则进行定义的步骤,表示在重排中的参照列和适用的参照列的重排中使用的规则的重排处理进行指定的步骤,以及按照上述指定的重排处理的内容执行重排的步骤。
30.如权利请求29所述的数据处理方法,其特征在于对包含表示重排对象的数据的字节长度和重排的顺序的数据列的重排规则进行定义。
31.如权利请求29或30任何一项所述的数据处理方法,其特征在于包括生成用于表示重排执行结果的索引的步骤。
32.一种对由包含字符串的任意要素构成的数据进行存储及取出的数据处理装置,其特征在于包括:
对表示在重排中参照列中的重排对象和重排的顺序的重排规则进行定义的规则定义单元,对表示在重排中的参照列和适用的参照列的重排中使用的规则的重排处理进行指定的重排处理登录单元,以及按照上述指定的重排处理的内容执行重排的重排执行单元。
33.一种将可以使计算机作为一种对由包含字符串的任意要素构成的数据进行存储及取出的数据处理装置工作的程序进行记录的计算机可读存储媒体,其特征在于包括:
对表示在重排中参照列中的重排对象和重排的顺序的重排规则进行定义的规则定义单元,对表示在重排中的参照列和适用的参照列的重排中使用的规则的重排处理进行指定的重排处理登录单元,以及按照上述指定的重排处理的内容执行重排的重排执行单元。
CNB001038095A 2000-02-23 2000-03-03 数据处理方法、系统、处理程序及记录媒体 Expired - Fee Related CN1155906C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP052109/2000 2000-02-23
JP2000052109A JP2001060164A (ja) 1999-05-18 2000-02-23 データ処理方法およびデータ処理システム並びにその実施装置及びその処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
CN1310422A true CN1310422A (zh) 2001-08-29
CN1155906C CN1155906C (zh) 2004-06-30

Family

ID=18573677

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001038095A Expired - Fee Related CN1155906C (zh) 2000-02-23 2000-03-03 数据处理方法、系统、处理程序及记录媒体

Country Status (5)

Country Link
US (2) US20030217071A1 (zh)
EP (1) EP1128277A3 (zh)
KR (3) KR100372582B1 (zh)
CN (1) CN1155906C (zh)
SG (1) SG100613A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445928A (zh) * 2015-08-04 2017-02-22 广州华多网络科技有限公司 基于分类模型的信息处理方法及分类模型
CN109413192A (zh) * 2018-11-08 2019-03-01 内蒙古伊泰煤炭股份有限公司 数据处理方法、装置、服务器及可读存储介质
CN110401843A (zh) * 2019-08-06 2019-11-01 广州虎牙科技有限公司 直播平台中的榜单数据更新方法、装置、设备和介质

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7797149B2 (en) * 2002-06-20 2010-09-14 Siebel Systems, Inc. Integrating related data from incompatible systems for enhanced business functionality
JP2005011042A (ja) * 2003-06-18 2005-01-13 Shinfuoomu:Kk データ検索方法、データ検索装置、データ検索プログラムおよびコンピュータで読み取り可能な記録媒体
US7398304B2 (en) 2003-06-23 2008-07-08 Microsoft Corporation General dependency model for invalidating cache entries
US7962576B2 (en) * 2004-07-22 2011-06-14 Sap Ag Quantity conversion interface for external program calls
US20060212449A1 (en) * 2005-03-21 2006-09-21 Novy Alon R J Method and apparatus for generating relevance-sensitive collation keys
US8892780B2 (en) 2007-03-08 2014-11-18 Oracle International Corporation Management of shared storage I/O resources
US7953591B2 (en) * 2007-07-26 2011-05-31 International Business Machines Corporation Automatically identifying unique language independent keys correlated with appropriate text strings of various locales by key search
US7949515B2 (en) * 2007-07-26 2011-05-24 International Business Machines Corporation Automatically identifying unique language independent keys correlated with appropriate text strings of various locales by value and key searches
JP5286876B2 (ja) * 2008-03-28 2013-09-11 富士通株式会社 紐付け支援プログラム、紐付け支援装置、紐付け支援方法
US9772798B2 (en) * 2008-09-19 2017-09-26 Oracle International Corporation Method and system for implementing workload management by monitoring disk utilizations
US8868831B2 (en) 2009-09-14 2014-10-21 Oracle International Corporation Caching data between a database server and a storage system
EP2350875A1 (en) 2008-09-19 2011-08-03 Oracle International Corporation Storage-side storage request management
US8204892B2 (en) * 2009-10-26 2012-06-19 Oracle International Corporation Performance boost for sort operations
US8682644B1 (en) * 2011-06-30 2014-03-25 Google Inc. Multi-language sorting index
US9509757B2 (en) 2011-06-30 2016-11-29 Google Inc. Parallel sorting key generation
US10546057B2 (en) * 2011-10-28 2020-01-28 Microsoft Technology Licensing, Llc Spreadsheet program-based data classification for source target mapping
US9449031B2 (en) * 2013-02-28 2016-09-20 Ricoh Company, Ltd. Sorting and filtering a table with image data and symbolic data in a single cell
US10152500B2 (en) 2013-03-14 2018-12-11 Oracle International Corporation Read mostly instances
US9767178B2 (en) 2013-10-30 2017-09-19 Oracle International Corporation Multi-instance redo apply
JP6285733B2 (ja) * 2014-01-31 2018-02-28 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム
US9015165B1 (en) * 2014-03-03 2015-04-21 Michael L. Hamm Text-SQL relational database
US20160342646A1 (en) * 2015-05-20 2016-11-24 International Business Machines Corporation Database query cursor management
US10678788B2 (en) 2015-10-22 2020-06-09 Oracle International Corporation Columnar caching in tiered storage
US10747752B2 (en) 2015-10-23 2020-08-18 Oracle International Corporation Space management for transactional consistency of in-memory objects on a standby database
US11657037B2 (en) 2015-10-23 2023-05-23 Oracle International Corporation Query execution against an in-memory standby database
US10698771B2 (en) 2016-09-15 2020-06-30 Oracle International Corporation Zero-data-loss with asynchronous redo shipping to a standby database
US10891291B2 (en) 2016-10-31 2021-01-12 Oracle International Corporation Facilitating operations on pluggable databases using separate logical timestamp services
US11475006B2 (en) 2016-12-02 2022-10-18 Oracle International Corporation Query and change propagation scheduling for heterogeneous database systems
US10691722B2 (en) 2017-05-31 2020-06-23 Oracle International Corporation Consistent query execution for big data analytics in a hybrid database
US11074235B2 (en) * 2017-08-10 2021-07-27 Io-Tahoe Llc Inclusion dependency determination in a large database for establishing primary key-foreign key relationships
US10878036B2 (en) 2018-01-17 2020-12-29 Actian Corporation Maintaining character set compatibility in database systems
US11170002B2 (en) 2018-10-19 2021-11-09 Oracle International Corporation Integrating Kafka data-in-motion with data-at-rest tables
CN110203249B (zh) * 2019-06-12 2020-09-04 中国神华能源股份有限公司 列车修程的处理方法、装置及存储介质

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPS58192167A (ja) * 1982-05-06 1983-11-09 Toshiba Corp 自動取引装置
US4688195A (en) * 1983-01-28 1987-08-18 Texas Instruments Incorporated Natural-language interface generating system
US5404506A (en) * 1985-03-27 1995-04-04 Hitachi, Ltd. Knowledge based information retrieval system
US4731735A (en) * 1985-09-30 1988-03-15 International Business Machines Corporation Multilingual processing for screen image build and command decode in a word processor, with full command, message and help support
US4837689A (en) * 1985-10-07 1989-06-06 Sharp Kabushiki Kaisha Inputting and editing system in a knowledge based inquiry and answer system
US4870610A (en) * 1987-08-25 1989-09-26 Bell Communications Research, Inc. Method of operating a computer system to provide customed I/O information including language translation
CA1280215C (en) * 1987-09-28 1991-02-12 Eddy Lee Multilingual ordered data retrieval system
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
WO1990016036A1 (en) * 1989-06-14 1990-12-27 Hitachi, Ltd. Hierarchical presearch-type document retrieval method, apparatus therefor, and magnetic disc device for this apparatus
US5999908A (en) * 1992-08-06 1999-12-07 Abelow; Daniel H. Customer-based product design module
US6760695B1 (en) * 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
JPH06250895A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 構造化データベースシステム
US5440482A (en) * 1993-03-25 1995-08-08 Taligent, Inc. Forward and reverse Boyer-Moore string searching of multilingual text having a defined collation order
US5485373A (en) * 1993-03-25 1996-01-16 Taligent, Inc. Language-sensitive text searching system with modified Boyer-Moore process
US6131085A (en) * 1993-05-21 2000-10-10 Rossides; Michael T Answer collection and retrieval system governed by a pay-off meter
CA2128828C (en) * 1993-08-24 2001-01-02 David Michael Silver Multilingual standard resources
JP3689954B2 (ja) * 1995-03-13 2005-08-31 富士ゼロックス株式会社 異種コード文字列転記装置および電子辞書
JP3333802B2 (ja) * 1995-07-07 2002-10-15 日本放送協会 属性とクラスの関係を一般化する装置
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5995921A (en) * 1996-04-23 1999-11-30 International Business Machines Corporation Natural language help interface
US5778213A (en) * 1996-07-12 1998-07-07 Microsoft Corporation Multilingual storage and retrieval
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
JP3434161B2 (ja) * 1997-02-18 2003-08-04 ブラザー工業株式会社 多言語対応通信システム
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
JPH10283129A (ja) * 1997-04-02 1998-10-23 Canon Inc 印刷制御装置及び印刷制御プログラムのインストール方法及び記憶媒体
EP0889626A1 (en) * 1997-07-04 1999-01-07 Octel Communications Corporation Unified messaging system with automatic language identifacation for text-to-speech conversion
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
US6250548B1 (en) * 1997-10-16 2001-06-26 Mcclure Neil Electronic voting system
JP3666005B2 (ja) * 1998-03-03 2005-06-29 マツダ株式会社 特許情報検索システム、特許情報検索装置、情報検索中継装置並びに特許情報検索方法
US6332139B1 (en) * 1998-11-09 2001-12-18 Mega Chips Corporation Information communication system
US6330530B1 (en) * 1999-10-18 2001-12-11 Sony Corporation Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures
US6778949B2 (en) * 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US20030041110A1 (en) * 2000-07-28 2003-02-27 Storymail, Inc. System, Method and Structure for generating and using a compressed digital certificate
JP2002082987A (ja) * 2000-09-06 2002-03-22 Seiko Epson Corp 文書情報閲読支援装置、ディジタルコンテンツ作成システム、ディジタルコンテンツ配信システム及び記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106445928A (zh) * 2015-08-04 2017-02-22 广州华多网络科技有限公司 基于分类模型的信息处理方法及分类模型
CN106445928B (zh) * 2015-08-04 2020-12-08 广州华多网络科技有限公司 基于分类模型的信息处理方法及分类模型
CN109413192A (zh) * 2018-11-08 2019-03-01 内蒙古伊泰煤炭股份有限公司 数据处理方法、装置、服务器及可读存储介质
CN110401843A (zh) * 2019-08-06 2019-11-01 广州虎牙科技有限公司 直播平台中的榜单数据更新方法、装置、设备和介质

Also Published As

Publication number Publication date
KR20010084563A (ko) 2001-09-06
EP1128277A3 (en) 2004-08-18
KR100372582B1 (ko) 2003-02-17
KR20030004150A (ko) 2003-01-14
KR100372584B1 (ko) 2003-02-15
EP1128277A2 (en) 2001-08-29
KR100372585B1 (ko) 2003-02-15
US20030217071A1 (en) 2003-11-20
US20090024384A1 (en) 2009-01-22
CN1155906C (zh) 2004-06-30
KR20030004151A (ko) 2003-01-14
SG100613A1 (en) 2003-12-26

Similar Documents

Publication Publication Date Title
CN1155906C (zh) 数据处理方法、系统、处理程序及记录媒体
CN1204515C (zh) 自由格式数据处理的方法和设备
CN1170240C (zh) 结构化文档检索显示方法和装置
CN1110757C (zh) 处理两种文字对照的数据库的方法与装置
CN1266624C (zh) 学习支持系统
CN1293500C (zh) 组织计算机网络中电子邮件文档的方法及电子邮件系统
CN1097795C (zh) 结构式文件处理方法和装置
CN1592905A (zh) 自动产生数据库查询的系统和方法
CN1604082A (zh) 用于任意数据模型的映射体系结构
CN1752963A (zh) 文档信息处理设备、文档信息处理方法及处理程序
CN1126053C (zh) 文件检索方法、文件检索发送方法及装置
CN1501285A (zh) 排版系统、排版程序和排版方法
CN1689022A (zh) 可扩展标记语言流化转换器
CN1761956A (zh) 基于片段的串行化系统与方法
CN1573759A (zh) 公共查询运行期系统以及应用编程接口
CN1866253A (zh) 把Web服务映射到本体
CN1609855A (zh) 查询优化系统和方法
CN1679026A (zh) Web服务设备和方法
CN1609856A (zh) 查询中间语言的方法和系统
CN1828517A (zh) 文档处理装置和文档处理方法
CN101079026A (zh) 文本相似度、词义相似度计算方法和系统及应用系统
CN1749999A (zh) .net数据类型和实例的持久存储
CN1551012A (zh) 编排系统、编排程序和编排方法
CN1567174A (zh) 对象表示和处理的方法及其装置
CN1447261A (zh) 特定要素、字符串向量生成及相似性计算的装置、方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1059990

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040630

Termination date: 20160303

CF01 Termination of patent right due to non-payment of annual fee