CN1492358A - 数据定位及数据转换方法及设备 - Google Patents

数据定位及数据转换方法及设备 Download PDF

Info

Publication number
CN1492358A
CN1492358A CNA021471509A CN02147150A CN1492358A CN 1492358 A CN1492358 A CN 1492358A CN A021471509 A CNA021471509 A CN A021471509A CN 02147150 A CN02147150 A CN 02147150A CN 1492358 A CN1492358 A CN 1492358A
Authority
CN
China
Prior art keywords
data
data cell
cell
setting element
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA021471509A
Other languages
English (en)
Other versions
CN100504849C (zh
Inventor
盛 叶
叶盛
孙伟
田忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CNB021471509A priority Critical patent/CN100504849C/zh
Priority to US10/689,186 priority patent/US8271874B2/en
Publication of CN1492358A publication Critical patent/CN1492358A/zh
Application granted granted Critical
Publication of CN100504849C publication Critical patent/CN100504849C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Abstract

本发明提供了对数据文件中的数据进行数据定位及数据转换的方法及设备。本发明的数据定位方法,包括步骤:确定数据文件中要进行定位的数据单元;为数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”;当数据单元的类型不是“文字”的时候,为数据单元选取另一个不同的数据单元作为其定位参照物;根据数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的定位描述,该描述包括数据单元的类型,用于定位该数据单元的一个或多个定位元件,定位元件包括“顶”、“底”、“左”和“右”,每个定位元件包括一个属性组合,以确定定位元件的位置。本发明可以根据数据二维空间区域进行数据位置定位。

Description

数据定位及数据转换方法及设备
技术领域
本发明涉及计算机数据处理,尤其涉及对数据文件中的数据进行数据定位及数据转换的方法及设备。
技术背景
随着信息技术的发展,越来越多的企业开始使用各种应用系统来管理自己的各种数据信息,从而形成了具有各种格式的数据文件。而且随着企业交往的日益密切,企业内部及不同的企业之间进行数据交换也日益频繁。因而将具有不同的数据格式的数据进行成功交换成为集成各种网络应用系统所必须解决的问题。
在现有技术中,为了在不同的应用系统之间实现数据交换,采用了为某个具体的应用系统专门定制开发出用于将其源数据转换为目标数据的数据转换工具。但是在这种数据转换技术中,如果该应用系统的数据格式发生了变化,则需要对其数据转换工具重新进行代码的修改和调试。这种数据转换技术是一个浪费时间和人力,并且效率低下的解决方案。
进而,为了实现数据交换功能,首先要对具有不同格式的源数据进行理解、分析和处理。现有的大多数的应用系统都利用生成和处理具有相对固定的格式和结构的数据文件的方法。因而基于对数据文件中的数据进行定位,截取并进而进行数据转换的数据转换方法和工具也应运而生。在此,所谓数据文件尤其指各种由可打印字符组成的文件,包括用于机器理解的文本格式,例如数据库的查询结果列表,EDI消息,表格处理系统中扫描图像进行文字识别后的结果ERP系统或其它应用系统生成的供阅读、传输或打印的通用报告等等。
在这些对数据文件中的数据进行定位和转换的现有技术中,包括,例如Unidex公司的XML Converter,它用于对具有简单分隔结构的数据文件进行数据转换,例如要求所处理的数据文件必须包含数据记录,每个记录由一系列数据域组成,数据记录和数据域要由分隔符分隔,没有分隔符标识的数据域必须具有固定的长度等等限制。
另外,还有利用数据文件的结构、语法、语义分析数据,进行数据转换的方法,例如美国专利USP4,965,763。该专利技术用于从大量的商业往来信件中抽取信息。
进而,还有通过使用关键字进行数据定位和截取的技术,例如美国专利USP5,664,109。该专利技术用于按照关键字从一个医疗记录仓库中自动检索文档。
在欧洲专利文献EP1016982中还公开了一种对结构化较好的数据库进行数据提取和输出的方法。
但是,上述涉及数据转换的现有技术都是针对特定的应用场景,只提供关键字匹配或语义处理方法,因而只适合处理具有简单格式的文本。
因此需要一种能够针对各种数据文件进行简便高效的数据转换的通用数据转换方法和工具,以解决上述问题。
发明内容
为了解决现有技术的上述问题,本发明的一个目的是提供一种基于文本标识匹配和二维空间坐标位置定位的数据定位设备和方法。
本发明的另一个目的是提供一种基于文本标识匹配和二维空间坐标位置定位的数据转换设备和方法。
本发明提供一种对数据文件中的数据进行定位的方法,包括步骤:
确定数据文件中要进行定位的数据单元;
为数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”;
当数据单元的类型不是“文字”的时候,
为数据单元选取另一个不同的数据单元作为其定位参照物;
根据数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的定位描述,该描述包括数据单元的类型,用于定位该数据单元的一个或多个定位元件,定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定定位元件的位置,属性包括
“定位基准单元”,它是另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作定位元件的定位基准位置;
“跳过”,用于表示定位元件相对于“起点”的偏移量。
根据本发明的对数据文件中的数据进行定位的方法,“定位基准单元”是一个“文字”类型的数据单元或者是已经确定了各定位元件的属性的任意一个数据单元。
根据本发明的对数据文件中的数据进行定位的方法,属性还包括:
“直到”,用于表示定位元件的偏移在一个标识处结束;
“之前”,用于表示定位元件的偏移在一个标识之前结束;
“之后”,用于表示定位元件的偏移在一个标识之后结束。
根据本发明的对数据文件中的数据进行定位的方法,其特征在于,“起点”为“定位基准单元”的起始位置或终止位置。
本发明还提供一种对数据文件中的数据进行定位的设备,包括:
数据单元确定装置,类型确定装置,定位参照物确定装置和数据单元定位描述生成装置,
数据单元确定装置确定数据文件中要进行定位的数据单元,
类型确定装置为数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”,
当数据单元的类型不是“文字”的时候,定位参照物确定装置为数据单元选取另一个不同的数据单元作为其定位参照物;
数据单元定位描述生成装置根据数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,
该描述包括数据单元的类型,用于定位该数据单元的一个或多个定位元件,
定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定定位元件的位置,属性包括
“定位基准单元”,它是另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作定位元件的定位基准位置,
“跳过”,用于表示定位元件相对于“起点”的偏移量。
本发明还提供一种数据转换方法,用于将第一格式的第一数据文件中的数据转换为第二格式的第二数据文件中的数据,该数据转换方法包括:
数据搜索步骤,对第一数据文件中的数据进行搜索,确定数据位置;
数据截取步骤,截取已经被确定位置的数据;以及
数据转换步骤,将截取的数据转换为第二数据文件中的数据,
其特征在于:
在数据搜索步骤之前,生成第一数据文件中要进行定位的一个或多个数据单元的定位描述,以及在数据单元与第二数据文件的第二格式之间建立起对应关系,
并且对于每个数据单元执行如下步骤:
为数据单元定义一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”;
当数据单元的类型不是“文字”的时候,
为数据单元选取另一个不同的数据单元作为其定位参照物;
根据数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,该描述包括数据单元的类型,用于定位该数据单元的一个或多个定位元件,定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定定位元件的位置,属性包括
“定位基准单元”,它是另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作定位元件的定位基准位置;
“跳过”,用于表示定位元件相对于“起点”的偏移量,
数据搜索步骤,根据一个或多个数据单元定位描述进行数据单元定位;
数据截取步骤,将被定位的一个或多个数据单元截取出来,
数据转换步骤,根据在一个或多个数据单元与第二格式之间建立起的对应关系,对第一数据文件,将被数据截取步骤截取的数据单元转换为具有第二格式的数据,从而生成相应的一个或多个第二数据文件中的数据。
本发明还提供一种数据转换设备,用于将第一格式的第一数据文件中的数据转换为第二格式的第二数据文件中的数据,该数据转换设备包括:
数据搜索装置,对第一数据文件中的数据进行搜索,确定其位置;
数据截取装置,截取已经被确定位置的数据;以及
数据转换装置,将截取的数据转换为第二数据文件中的数据,
其特征在于:
该数据转换设备还包括:
数据单元确定装置,类型确定装置,定位参照物确定装置,数据单元定位描述生成装置和格式映射装置,
数据单元确定装置确定数据文件中要进行定位的一个或多个数据单元,
并且对于每个数据单元执行如下步骤:
类型确定装置为数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”,
当数据单元的类型不是“文字”的时候,定位参照物确定装置为数据单元选取另一个不同的数据单元作为其定位参照物;
数据单元定位描述生成装置根据数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,
该描述包括数据单元的类型,用于定位该数据单元的一个或多个定位元件,
定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定定位元件的位置,属性包括
“定位基准单元”,它是另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作定位元件的定位基准位置,
“跳过”,用于表示定位元件相对于“起点”的偏移量,
格式映射装置,在一个或多个数据单元与第二数据文件的第二格式之间建立起对应关系,
数据搜索装置,根据数据单元定位描述进行数据单元搜索,确定其位置;
数据截取装置,将被确定位置的一个或多个数据单元截取出来,
数据转换装置,根据格式映射装置在一个或多个数据单元与第二格式之间建立起的对应关系,对第一数据文件,将被数据截取装置截取的数据单元转换为具有第二格式的数据,从而生成相应的一个或多个第二数据文件中的数据。
本发明的一个优点在于能够对各种结构的数据文件中的数据进行数据转换。
本发明的另一个优点在于,根据本发明,用户可以根据自己的需要对原始数据灵活地进行抽取规则设计及输出设计。
本发明的又一个优点在于,本发明不仅能够根据数据的起点和终点来定位数据位置,还提供了根据数据二维空间区域进行数据位置定位的方法,从而进一步增加了数据定位的灵活性。
本发明的又一个优点在于通过将数据定位和数据转换进行分离设计,从而提高了转换规则更改的灵活性和扩展性。
本发明尤其适用于具有确定格式并需要进行批量处理的数据转换工作。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
图1示出根据本发明的数据定位设备的方框图。
图2示出根据本发明的数据定位方法对数据进行定位的示意图。
图3示出根据本发明的数据定位方法的流程图。
图4示出使用根据本发明的数据定位设备和方法进行数据定位的显示画面。
图5示出根据本发明的数据转换设备的功能方框图。
图6示出根据本发明的数据转换方法将源数据文件中的数据转换为目标数据文件中的数据的流程图。
图7示出对多个源数据文件中的数据进行转换的流程图。
具体实施方式
现在将结合图1描述根据本发明的数据定位设备。图1示出根据本发明的数据定位设备的方框图。
根据本发明的数据定位设备包括数据单元确定装置101,类型确定装置102,定位参照物确定装置103和数据单元定位描述生成装置104。
根据本发明的数据定位设备,对于源数据文件中的数据,生成用于对其进行数据定位和截取的一个或多个数据单元定位描述。
数据单元确定装置101确定一个源数据文件中要进行定位的一个或多个数据单元,其中数据单元是本发明中进行数据定位基本单位。关于数据单元的确定将在后面详细描述。另外,为了方便,此处在描述数据定位设备的时候,是对一个源数据文件中的数据进行定位。但是本发明的数据定位设备同样适用于对多个源数据文件进行数据定位,这将在后面详细描述。
对于每个数据单元:
类型确定装置102为该数据单元定义一个类型;
定位参照物确定装置103为该数据单元选取另一个不同的数据单元作为其参照物;
数据单元定位描述生成装置104根据该数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述。
下面将结合图2至图4详细描述根据本发明的数据定位方法对一个数据文件中的数据进行数据定位的处理过程。
根据本发明,文本文件上的数据由预先定义的不同类型的数据单位以“数据单元”的形式标识。“数据单元”由定位元件定位,并且可以包括“子数据单元”。
如图2所示,“数据单元”主要由5种类型的数据单元组成,即“文字(Text)”,“单行(SingleLine)”,“多行(MultiLine)”,“块(Block)”和“循环列表(Iterator)”。但是本发明对数据单元的定义不限于上述5种类型的数据单元,可以根据需要灵活地扩展其它的用于进行数据定位的数据单元。
具体而言,“文字”用于表示可以被查找匹配的字符串,例如图2中的数据单元A被定义为“文字”数据单元。
“单行”用于表示被定义的数据单元在源数据文件中的排列方式表现为一行,例如图2中的数据单元B被定义为“单行”数据单元。
“多行”用于表示被定义的数据单元在源数据文件中的排列方式表现为由多个单行构成的多个行,“多行”数据单元中的多个单行的位置关系可能包括起始列的位置不完全相同的多个单行,结束列的位置不完全相同的多个单行,也可能包括起始列和结束列完全相同或不完全相同的多个单行,例如图2中的数据单元C被定义为“多行”数据单元。
“块”用于表示被定义的数据单元在源数据文件中的排列方式表现为在列的方向上紧密排列且列的起始位置和结束位置相同的多个单行构成的一个块,例如图2中的数据单元D被定义为“块”数据单元。因此当“多行”中多个单行的起始列和结束列的位置完全相同时,此多个单行既可以用“多行”进行定义,也可以用“块”进行定义。这些都可以由开发者根据自己的需要和喜好进行灵活设置。
“循环列表”用于表示被定义的数据单元在源数据文件中的排列方式表现为包括多个格式特征相同的子数据单元,这些子数据单元循环出现。例如图2中的数据单元E被定义为“循环列表”数据单元,在该数据单元中,包括循环出现的同种类型的子数据单元F,该子数据单元F包括两个“单行”子数据单元J和K。“循环列表”通常用来定义列表数据。
本领域的技术人员将能够理解,上述对数据单元的类型的定义不是唯一的,可以根据需要定义任意类型的数据单元。例如可以把“块”类型合并到“多行”数据单元中。例如,在决定由多个单行构成的数据单元是划分到“块”,“多行”还是“循环列表”中时,可以考虑这个数据单元的内容和/或目标数据文件的格式,从而确定把该数据单元定义为何种类型的数据单元。只要能够对源数据文件进行有效定位和抽取即可。这体现了本发明的一个优点,即定位的灵活性和扩展性。
另外,在按照上述数据单元对源数据文件进行定位时,可以进行数据单元的嵌套定位和抽取。例如在定位“多行”数据单元构成的数据单元C后,可以接着对该“多行”数据单元中的“单行”子数据单元G,H,I进行定位和抽取。至于嵌套定位到何种程度,只要能够将源数据文件中的数据内容转换到目标文件的相应区域中即可。因此,开发者可以根据需要灵活地在源数据文件中设置数据单元。
在设定了数据单元之后,还需要设定对数据单元进行定位的定位元件,这样才能够对数据单元进行正确的定位和截取。除了“文字”数据单元可以直接通过字符串匹配进行定义之外,其它四种数据单元均需要用定位元件进行位置确定。
根据本发明,使用如下的四种定位元件确定一个数据单元的位置。即“顶(Top)”,表示数据单元的最上方位置;“底(Bottom)”,表示数据单元的最下方位置;“左(Left)”,表示数据单元的最左方位置;“右(Right)”,表示数据单元的最右方位置。
其中每个定位元件又由多个基本属性来定义。包括:“定位基准单元(Base)”,它是一个数据单元,用作该定位元件的定位参照物;
“起点(From)”,它是“定位基准单元”中的一个位置,用作该定位元件的定位基准位置;
“跳过(Skip)”,用于表示该定位元件相对于所述“起点”的偏移量。
除了以上的基本属性之外,还可以使用如下的属性定义定位元件,例如“直到(Until)”,用于表示定位元件的终止位置;“之前(Before)”,用于表示定位元件的偏移在一个标识之前结束;“之后(After)”,用于表示定位元件的偏移在一个标识之后结束。
具体而言,属性“定位基准单元”的值可以是一个已定位了的“数据单元”的ID,例如一个“文字”类型的数据单元的ID,或者是“行的开始”(RB),“行的结束”(RE),“列的开始”(CB),“列的结束”(CE)。其中“行的开始”(RB),“行的结束”(RE),“列的开始”(CB),“列的结束”(CE)都是针对当前的定位基准单元所在的行或列而言。当然,该“定位基准单元”也可以是一个绝对坐标中的原点。
“起点”可以是定位元件相对于“定位基准单元”的相对起始位置(START)或终止位置(END)。
“直到”可以指定一个字符串或符号作为定位元件的终止位置。
“之前”可以是定位元件的偏移在终止标识的前一列/行结束。
“之后”可以是定位元件的偏移在终止标识的后一列/行结束。
正偏移“+N”表示向下/右移动N列/行;负偏移“-N”表示向上/左移动N列/行。
在对一个数据文件中的数据单元的定位元件进行属性描述的时候,所有定位元件中的属性“定位基准单元”可以是相同的一个确定的数据单元,例如,某一个“文字”数据单元;也可以是任意一个已经确定的数据单元。当然也可以是通过数据单元的绝对坐标进行定位。
如图2所示,数据单元A可以由一个“文字”数据单元通过字符串匹配定义。数据单元B,C和D可以由相对于数据单元A的位置和一些基本定位元件,如“行开始”,“行结束”,“列开始”,“列结束”等来确定。例如数据单元B的定位元件“左”可以通过如下属性来定义,“定位基准单元”=A,“起点”=“终止(End)”,“跳过”=+m列;数据单元D的定位元件“底”可以由下列属性定义,“定位基准单元”=A,“起点”=“终止(End)”,“跳过”=+u行。其它定位元件的属性定义依次类推。
如果使用XML语句,利用定位元件的基本属性来描述数据单元B,可以表述如下:
<SingleLineSpan>
<Top BASE=“A”,from=“Start”/>
<Left BASE=“A”,from=“End”,SKIP=“+m”>
<Right BASE=“RE”,from=“Start”,SKIP=“-n”>
</SingleLineSpan>
还可以使用基本属性以外的其它的属性来描述上述数据单元B的定位元件。例如,假设上述数据单元B中左边缘第一个字符是“#”,则上述用XML语句描述的左边缘的定位的语句可以改写为:<Left BASE=“A”,from=“End”,SKIP=“”,UNTIL=“#”>
本领域的技术人员将能够理解,可以灵活地使用上述定义的属性对数据单元的定位元件进行描述。
另外,在上述例子中,数据单元B和D的“左”和“底”定位元件的属性采用的是以确定的数据单元A为“定位基准单元”的描述方式。当然,对数据单元B和D的“左”和“底”定位元件的属性还可以采用以任意的数据单元例如C为“定位基准单元”的描述方式,其前提是任何一个数据单元的定位元件所参考的“定位基准单元”是已经被确定并且已经被定位的数据单元。
根据本发明对数据单元进行定位的方法至少包括以下几种方式,一种是直接通过字符串进行数据单元定位,一种是通过数据单元之间的相对坐标进行定位,还有一种是通过数据单元的绝对坐标进行定位。开发者可以根据需要灵活地使用这三种定位方法或它们的任意组合来定义数据单元的定位元件属性。这体现了本发明的另一个优点,即定位和截取设计的灵活性。
通过以上确定的数据单元,数据单元的定位元件,定位元件的属性,可以对任何一种数据文件中的数据进行定位。开发者可以根据目标文件的格式特点和/或源数据文件的格式和/或内容特点灵活地定位数据单元。
本领域技术人员将能够理解,可以根据需要对本发明的数据单元,数据单元的定位元件,定位元件的属性进行扩充,修改,以进一步丰富基于本发明基于文本标识匹配和二维空间坐标位置的定位方法。
图3示出根据本发明的数据定位方法的流程图。
如图3所示,在步骤S301,数据单元确定装置101确定数据文件中要进行定位的一个数据单元。
在步骤S302,类型确定装置102为该数据单元确定一个类型。
在步骤S303,判断该数据单元的类型是否为“文字”。
当判断为该类型不是“文字”的时候,前进到步骤S304,由定位参照物确定装置103为所述数据单元选取另一个不同的数据单元作为其参照物;在步骤S305,数据单元定位描述生成装置104根据所述数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述。
该描述包括所述数据单元的类型,用于定位该数据单元的一个或多个定位元件,
定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定所述定位元件的位置,属性包括
“定位基准单元”,它是所述另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作所述定位元件的定位基准位置,
“跳过”,用于表示所述定位元件相对于所述“起点”的偏移量。
通过上述各步骤生成了要进行定位的非文字型数据单元的定位描述。
在步骤S303,当判断为该类型为“文字”的时候,则前进到步骤S306,采用文字匹配进行定位处理。
对数据文件中其它的要进行定位的数据单元进行定位的过程和图3的处理相同。
本领域的技术人员将能够理解,当某个数据单元包括子数据单元时,也就是说需要对一个数据单元进行嵌套定位时,上述处理过程同样适用于子数据单元的定位。
本领域技术人员将能够理解,可以采用任何软件或/和硬件的形式实现对本发明的数据单元,数据单元的定位元件,定位元件的属性进行确定的各装置,程序,以及记录该程序的记录介质等。
下面将举例说明根据本发明的数据定位设备和方法进行数据定位的处理过程。
图4示出使用根据本发明的数据定位设备和方法进行数据定位的显示画面。
在该显示画面的左上窗口中显示出要进行定位描述的一个数据源。该数据源由用户加载到根据本发明的数据定位设备的显示单元(未示出)中,并由该显示单元以显示画面的形式展示给用户。该显示单元例如是计算机的显示器。
在该左上窗口的左面有一个工具栏,供用户使用来确定数据单元的类型。其中L表示“文字”,S表示“单行”,B表示“块”,M表示“多行”,I表示“循环列表”
当用户例如需要从该数据源中定位“Currency:”数据单元时,该用户首先利用未图示的一个指点设备,例如鼠标,键盘等,通过在字符串“Currency:”前定点并移动至该字符串结束为止的操作来标识该数据单元。由数据单元确定装置101确定该数据单元,并为该“Currency:”数据单元分配一个识别号ID,以被其他数据单元做定位引用。
然后用户用指点设备点击工具栏中的L,从工具栏中选择一个“文字”数据单元确定工具,由类型确定装置102将该数据单元类型确定为“文字”。
接着,根据本发明的数据单元定位描述生成装置104确定该数据单元的定位单元,即“顶”、“底”、“左”、“右”。由于“Currency:”是一个位于数据文件中的常量,因此数据单元定位描述生成装置104可以通过现有技术中字符串匹配等方法很容易地计算出“Currency:”的定位单元的位置(坐标)。
这样就定位了一个“Currency:”文字数据单元。
以下说明对非文字数据单元,例如“Currency:”后的包括“USD”的单行数据串进行定位的过程。该字符串与“Currency:”字符串的类型不同,因为该字符串是可变的,例如在其它数据文件中,该字符串可能是用另一个货币符号,例如“RM”,“DM”等结束的。
用户利用指点设备,通过在字符串“Currency:”后定点并移动至包括“USD”的该字符串结束为止的操作来标识该数据单元。由数据单元确定装置101确认该数据单元,并为该数据单元分配一个识别号ID,以被其他数据单元做定位引用。在图4中该数据单元被加深高亮显示以提示用户他当前所选的数据单元。
然后该用户使用指点设备点击工具栏中的S,从工具栏中选择一个“单行”数据单元确定工具,由类型确定装置102将该数据单元类型确定为“单行”。
由于该数据单元不是“文字”类型的数据单元,因此定位参照物确定装置103提示用户利用指点设备选择一个定位参照物。在上述例子中,用户使用指点设备选择“Currency:”文字数据单元作为该数据单元的定位参照物。
数据单元定位描述生成装置104根据该数据单元的类型,即“单行”,以及该数据单元与该“Currency:”文字数据单元的位置关系,确定用“顶”(Top)、“底”(Left)、“右”(Right)这三个定位元件来确定它们与“Currency:”的相对位置,即确定这些定位元件的位置。在本例中,由于包括“USD”的该单行字符串与“Currency:”在数据文件中的位置已经确定,因此,包括“USD”的该单行字符串的“顶”(Top)、“底”(Left)、“右”(Right)就能相对于定位参照物“Currency:”确定下来。
在图4所示的例子中,该数据单元定位描述生成装置104生成的用XML语言描述的该包括“USD”的单行字符串数据单元的定位描述为:
<SingleLineSpan>
<Top BASE=“Currency:”,from=“Start”,Skip=“”/>
<Left BASE=“Currency:”,from=“End”/>
<Right BASE=“RE”,from=“Start”/>
</SingleLineSpan>
其中,当Skip=“”时,表示跳过零行/列,因此可以省略其描述。另外“RE”指定位参照物的本行结尾。
在上述定位描述中,每个定位元件包括一个属性组合,例如定位元件“顶(Top)”包含属性“BASE(定位基准单元)”、属性“from(起点)”、属性“skip(跳过)”这样一个属性组合。该属性组合确定了定位元件“顶”的位置,即以“Currency:”的顶作为其起点,跳过零行。
定位元件“左(Left)”包含属性“BASE(定位基准单元)”、属性“from(起点)”、属性“skip(跳过)”这样一个属性组合。该属性组合确定了定位元件“左”的位置,即以“Currency:”的列的终止位置作为其起点,跳过零行。
定位元件“右(Right)”包含属性“BASE(定位基准单元)”、属性“from(起点)”、属性“skip(跳过)”这样一个属性组合。该属性组合确定了定位元件“右”的位置,即以“Currency:”所在行的本行结尾位置作为其起点,跳过零行。
属性BASE的值也可以是一个标识符,例如上例中可写成BASE=“ID1”,其中ID1是为“Currency:”分配的一个标识符。
本领域的技术人员将能够理解,数据单元定位描述生成装置104在确定该数据单元与该“Currency:”文字数据单元的位置关系的时候,可以通过已有的图形识别,坐标位置定位等来进行。
在上述定位元件的位置被描述清楚之后,包括“USD”的单行字符串数据单元的位置就被描述清楚了。
通过上述图4所描述的操作,可以对其他类型的数据单元进行定位描述的生成。
可以将通过上述操作过程为数据源生成的数据单元定位描述存储起来,并可以由本发明未图示的显示单元将进行样本操作的结果显示出来。图4的左下窗口中示出了使用数据单元定位描述对图4的右上窗口中的样本进行数据定位和截取的结果。
另外,可以通过根据本发明的一个未示出的定位描述调整装置,对由数据单元定位描述生成装置104所生成的定位描述进行调整。例如,当包括“USD”的单行字符串数据单元的BASE改变的时候,各定位元件的属性也要相应改变,这时可以使用定位描述调整装置来调整属性。
下面将描述根据本发明的数据定位方法进行数据转换的设备和方法。
图5示出根据本发明的数据转换设备的功能方框图。
该数据转换设备通过使用图1中的数据定位设备将具有第一格式的一个或多个源数据文件1101-110N中的数据转换为具有第二格式的一个或多个目标数据文件1201-20M中的数据。
如图5所示,该数据转换装置包括数据定位设备401,格式映射装置402,数据搜索装置403,数据截取装置404和数据转换装置405。
数据定位设备401的功能已经结合图1至图4进行了描述,它用于生成对数据文件中的数据进行定位的数据单元定位描述;格式映射装置402,在数据单元与第二格式之间建立起对应关系;数据搜索装置403,对源数据文件中的数据进行搜索,确定其位置;数据截取装置404,对已经确定了位置的数据进行截取;数据转换装置405,将截取的数据转换为目标数据文件中的数据。
具体而言,该数据定位设备401按照图3所示的处理过程对样本文件110s中需要被转换的多个数据单元生成定位描述。另外,本领域的技术人员将能够理解,也可以不使用样本文件110s,而直接对需要从多个源数据文件1101-110N定位的数据进行数据单元定位描述的生成。使用样本文件进行数据单元定位描述生成的技术解决方案尤其适用于对大批量的具有相同的固定结构的数据文件中的数据进行转换的情况。
关于一个或多个源数据文件1101-110N,它们可以是一批具有相同的格式特征(在平面坐标上具有共同的定位特点)的数据文件,也可以是各种不同的数据文件,但是通过从各个文件中定位出所需要的数据,并将所定位的数据截取出来并输出到同一个新的目标文件中,从而生成新的目标文件的那些源数据文件。本发明适用于任何可以进行数据定位的源数据文件中。
根据本发明的一个实施例,可以从具有相同的格式特征的源数据文件1101-110N中任意选取一个样本文件110s(1≤S≤N),生成适用于对所有源数据文件1101-110N进行数据定位的数据单元定位描述,该实施例尤其适用于进行批处理文件的数据定位和截取的情况。
根据本发明的另一个实施例,可以根据多个不同类型的源数据文件1101-110N中那些需要被转换到目标文件的相应的位置区域上的数据的定位特性,生成所有需要从源数据文件1101-110N进行数据定位的数据单元定位描述。该实施例尤其适用于从多个不同的源数据文件中抽取不同的数据,从而生成一个目标数据文件中的数据的情况。
然后,所生成的数据单元定位描述可以被数据搜索装置403和数据截取装置404应用到所有的源数据文件1101-110N中,以对源数据文件1101-110N进行数据单元定位和截取,从中定位和截取出要转换为目标数据文件中的数据的各数据单元。
该格式映射装置402,在由数据定位设备401所定位的数据单元与目标数据文件的格式之间建立起对应关系。
在对源数据文件中的数据生成要进行定位的数据单元定位描述的同时,还要根据目标数据文件的格式特点将每一个被确定要进行定位的数据单元与目标数据文件的相应格式(相应区域)对应起来,这样才能最终将源数据文件中的数据转换为目标数据文件中的数据。因此要在要进行定位的数据单元与目标数据文件的格式之间建立起对应关系。
这里需要强调的是,所谓目标文件的格式,可以是任意特定的文本格式,也可以是网络上统一的数据格式,例如XML等,根据用户的需要而定。
另外,在这里需要强调的是,根据输出的文本格式要求,通过格式映射建立起的对应关系可以是包括针对多种输出文本格式的多组格式映射对应关系,其中每组对应关系都定义了要进行定位的数据单元与某个特定的目标文件的格式的对应关系。于是,根据本发明,可以根据需要产生多种格式的输出。
数据转换装置405,根据格式映射装置402在要进行定位的数据单元与目标数据文件的特定格式之间建立起的对应关系,将被数据截取装置404所截取的数据单元转换为具有特定格式的目标数据文件中的数据或输出到目标数据文件的相应区域。
本领域技术人员将能够理解,可以采用任何软件或/和硬件的形式实现本发明的数据转换设备中的各装置的功能。例如可以采用周知的计算机,WEB服务器,网络和/或运行在这些设施中的软件来实现本发明。
这里需要指出的是,本发明还可以包括一个数据单元定位描述存储装置和格式映射对应关系存储装置,来存储由数据定位设备和格式映射装置所产生的数据单元定位描述以及各对应关系,以备以后进行数据转换时使用。这些存储装置可以采用任何已知的硬件来实现,例如硬盘,软盘,存储器等等。本领域的技术人员将能够理解,上述存储装置也可以用软件的形式实现,例如可以存储在数据库,数据文件等中。  另外,本领域技术人员当然能够理解,可以将这两个存储装置合并起来实现。
本发明的数据定位设备和数据转换设备采用基于文本表示匹配和二维空间坐标位置定位的数据定位方法,该方法和现有技术中基于关键字或语义的数据定位和截取方法相比有着很大的优点,主要表现在数据定位和截取的灵活性和扩展性得到的改善。
图5示出根据本发明的数据转换方法将源数据文件中的数据转换为目标数据文件中的数据的流程图。
其中在步骤S501,对源数据文件1101-110N中的数据进行定位,为源数据文件中要进行定位的一个或多个数据单元生成数据定位描述,  关于该定位步骤的详细描述可以参看图3。
在步骤S502,在要被定位的数据和目标文件的特定格式之间建立起对应关系,即在要被定位的数据单元与目标数据文件的特定格式之间建立起对应关系。
在步骤S503,对源数据文件1101-110N,进行数据定位,即根据该一个或多个数据单元定位描述,对源数据文件进行数据单元定位。
在步骤S504,对源数据文件1101-110N,将被定位的数据单元截取出来。
在步骤S505,将截取的数据转换为目标数据文件中的数据,其中根据在步骤S502中在要被定位的一个或多个数据单元与目标数据文件的特定格式之间建立起的对应关系,对源数据文件,将被步骤S504截取出的数据单元转换为目标数据文件中的数据。
图6示出在由数据定位设备对多个源数据文件进行数据定位之后,根据本发明的数据转换设备对该多个源数据文件中的数据进行转换的流程图。
在步骤S601,确定一个要处理的源数据文件。
在步骤S605,根据由数据定位设备401所生成的一个数据单元定位描述,由数据搜索装置403和数据截取装置404从源数据文件中定位和截取一个数据单元。
在步骤S610,根据格式映射装置402为该定义的数据单元所建立的对应关系,将截取出的数据单元,输出到目标数据文件的相应区域。
在步骤S615,判断是否还有需要处理的数据单元。当判定结果是还有数据单元需要处理的数据单元时,返回到步骤S605继续进行处理。否则前进到步骤S620。
在步骤S620,最终将源数据文件中的数据转换为目标数据文件中的数据。
在步骤S625,判断是否还有需要处理的源数据文件。当判定结果是还有需要处理的源数据文件时,返回到步骤S601继续进行处理。否则处理结束。
本领域技术人员将能够理解,当源数据文件中某些要进行定位的数据单元或其与目标数据文件的格式之间的对应关系发生变化的时候,仅需由数据定位设备401或格式映射装置对变化的数据单元的定位或对应关系重新设置即可。而数据搜索装置403,数据截取装置404和数据转换装置405的操作不需进行任何改变。从而提供了数据单元定位和对应关系更改的灵活性。尤其是在进行批处理数据转换的情形下,可以仅进行一次数据单元定位描述生成处理和对应关系设定处理,并将其应用到数据转换处理中;而在以后仅仅对变化的数据单元生成定位描述和重新设定对应关系,从而大大减轻了工作量。
另外,现有的各种应用系统,都可以采用本发明的数据定位方法来将自己的数据文件中的数据转换为目标文件中的数据;另外由于不需要重新定制专门适用自己的应用系统的专用数据转换工具,因而可以降低其开发成本。
由于本发明采用了基于文本标识匹配和二维空间坐标位置定位的数据定位和转换方法,因而它可以应用于采用任何类型的源文件中。
本领域技术人员将能够理解,可以采用任何软件或/和硬件的形式,以及记录该程序的记录介质等记录实现本发明的数据转换方法的操作过程。
应该注意的是,上面所描述的实施方式只是用于说明本发明,并不构成对本发明的限制。
虽然结合附图详细描述了本发明的实施例,但是对于本领域的技术人员来说,仍可以对上述实施方式作出各种修改和变更而不偏离本发明的实质和范围。因此,本发明的范围仅由所附权利要求书限定。

Claims (16)

1.一种对数据文件中的数据进行定位的方法,包括步骤:
确定所述数据文件中要进行定位的数据单元;
为所述数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”;
当所述数据单元的类型不是“文字”的时候,
为所述数据单元选取另一个不同的数据单元作为其定位参照物;
根据所述数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的定位描述,该描述包括所述数据单元的类型,用于定位该数据单元的一个或多个定位元件,定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定所述定位元件的位置,属性包括
“定位基准单元”,它是所述另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作所述定位元件的定位基准位置;
“跳过”,用于表示所述定位元件相对于所述“起点”的偏移量。
2.根据权利要求1所述的对数据文件中的数据进行定位的方法,其特征在于,所述“定位基准单元”是一个“文字”类型的数据单元或者是已经确定了各定位元件的属性的任意一个数据单元。
3.根据权利要求1或2所述的对数据文件中的数据进行定位的方法,其特征在于,所述属性还包括:
“直到”,用于表示所述定位元件的偏移在一个标识处结束;
“之前”,用于表示所述定位元件的偏移在一个标识之前结束;
“之后”,用于表示所述定位元件的偏移在一个标识之后结束。
4.根据权利要求1或2所述的对数据文件中的数据进行定位的方法,其特征在于,所述“起点”为所述“定位基准单元”的起始位置或终止位置。
5.一种对数据文件中的数据进行定位的设备,包括:
数据单元确定装置,类型确定装置,定位参照物确定装置和数据单元定位描述生成装置,
所述数据单元确定装置确定所述数据文件中要进行定位的数据单元,
所述类型确定装置为所述数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”,
当所述数据单元的类型不是“文字”的时候,所述定位参照物确定装置为所述数据单元选取另一个不同的数据单元作为其定位参照物;
所述数据单元定位描述生成装置根据所述数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,
该描述包括所述数据单元的类型,用于定位该数据单元的一个或多个定位元件,
定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定所述定位元件的位置,属性包括
“定位基准单元”,它是所述另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作所述定位元件的定位基准位置,
“跳过”,用于表示所述定位元件相对于所述“起点”的偏移量。
6.根据权利要求5所述的对数据文件中的数据进行定位的设备,其特征在于,所述“定位基准单元”是一个“文字”类型的数据单元或者是已经确定了各定位元件的属性的任意一个数据单元。
7.根据权利要求5或6所述的对数据文件中的数据进行定位的设备,其特征在于,所述属性还包括:
“直到”,用于表示所述定位元件的偏移在一个标识处结束;
“之前”,用于表示所述定位元件的偏移在一个标识之前结束;
“之后”,用于表示所述定位元件的偏移在一个标识之后结束。
8.根据权利要求5或6所述的对数据文件中的数据进行定位的设备,其特征在于,所述“起点”为所述“定位基准单元”的起始位置或终止位置。
9.一种数据转换方法,用于将第一格式的第一数据文件中的数据转换为第二格式的第二数据文件中的数据,该数据转换方法包括:
数据搜索步骤,对第一数据文件中的数据进行搜索,确定数据位置;
数据截取步骤,截取已经被确定位置的数据;以及
数据转换步骤,将截取的数据转换为第二数据文件中的数据,
其特征在于:
在所述数据搜索步骤之前,生成所述第一数据文件中要进行定位的一个或多个数据单元的定位描述,以及在所述数据单元与所述第二数据文件的所述第二格式之间建立起对应关系,
并且对于每个所述数据单元执行如下步骤:
为所述数据单元定义一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”;
当所述数据单元的类型不是“文字”的时候,
为所述数据单元选取另一个不同的数据单元作为其定位参照物;
根据所述数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,该描述包括所述数据单元的类型,用于定位该数据单元的一个或多个定位元件,定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定所述定位元件的位置,属性包括
“定位基准单元”,它是所述另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作所述定位元件的定位基准位置;
“跳过”,用于表示所述定位元件相对于所述“起点”的偏移量,
所述数据搜索步骤,根据所述一个或多个数据单元定位描述进行数据单元定位;
所述数据截取步骤,将被定位的一个或多个数据单元截取出来,
所述数据转换步骤,根据在所述一个或多个数据单元与所述第二格式之间建立起的对应关系,对所述第一数据文件,将被所述数据截取步骤截取的数据单元转换为具有第二格式的数据,从而生成相应的一个或多个第二数据文件中的数据。
10.根据权利要求9所述的数据转换方法,其特征在于,所述“定位基准单元”是一个“文字”类型的数据单元或者是已经确定了各定位元件的属性的任意一个数据单元。
11.根据权利要求9或10所述的数据转换方法,其特征在于,所述属性还包括:
“直到”,用于表示所述定位元件的偏移在一个标识处结束;
“之前”,用于表示所述定位元件的偏移在一个标识之前结束;
“之后”,用于表示所述定位元件的偏移在一个标识之后结束。
12.根据权利要求9或10所述的数据转换方法,其特征在于,所述“起点”为所述“定位基准单元”的起始位置或终止位置。
13.一种数据转换设备,用于将第一格式的第一数据文件中的数据转换为第二格式的第二数据文件中的数据,该数据转换设备包括:
数据搜索装置,对第一数据文件中的数据进行搜索,确定其位置;
数据截取装置,截取已经被确定位置的数据;以及
数据转换装置,将截取的数据转换为第二数据文件中的数据,
其特征在于:
该数据转换设备还包括:
数据单元确定装置,类型确定装置,定位参照物确定装置,数据单元定位描述生成装置和格式映射装置,
所述数据单元确定装置确定所述数据文件中要进行定位的一个或多个数据单元,
并且对于每个所述数据单元执行如下步骤:
所述类型确定装置为所述数据单元确定一个类型,类型包括“文字”、“单行”、“多行”、“块”和“循环列表”,
当所述数据单元的类型不是“文字”的时候,所述定位参照物确定装置为所述数据单元选取另一个不同的数据单元作为其定位参照物;
所述数据单元定位描述生成装置根据所述数据单元的类型以及该数据单元与该另一个不同的数据单元的位置关系,生成该数据单元的位置的描述,
该描述包括所述数据单元的类型,用于定位该数据单元的一个或多个定位元件,
定位元件包括“顶”、“底”、“左”、和“右”,
每个定位元件包括一个属性组合,以确定所述定位元件的位置,属性包括
“定位基准单元”,它是所述另一个不同的数据单元,
“起点”,它是“定位基准单元”中的一个位置,用作所述定位元件的定位基准位置,
“跳过”,用于表示所述定位元件相对于所述“起点”的偏移量,
所述格式映射装置,在所述一个或多个数据单元与所述第二数据文件的所述第二格式之间建立起对应关系,
所述数据搜索装置,根据所述数据单元定位描述进行数据单元搜索,确定其位置;
所述数据截取装置,将被确定位置的一个或多个数据单元截取出来,
所述数据转换装置,根据所述格式映射装置在所述一个或多个数据单元与所述第二格式之间建立起的对应关系,对所述第一数据文件,将被所述数据截取装置截取的数据单元转换为具有第二格式的数据,从而生成相应的一个或多个第二数据文件中的数据。
14.根据权利要求13所述的数据转换设备,其特征在于,所述“定位基准单元”是一个“文字”类型的数据单元或者是已经确定了各定位元件的属性的任意一个数据单元。
15.根据权利要求13或14所述的数据转换设备,其特征在于,所述属性还包括:
“直到”,用于表示所述定位元件的偏移在一个标识处结束;
“之前”,用于表示所述定位元件的偏移在一个标识之前结束;
“之后”,用于表示所述定位元件的偏移在一个标识之后结束。
16.根据权利要求13或14所述的数据转换设备,其特征在于,所述“起点”为所述“定位基准单元”的起始位置或终止位置。
CNB021471509A 2002-10-24 2002-10-24 数据转换方法及设备 Expired - Fee Related CN100504849C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNB021471509A CN100504849C (zh) 2002-10-24 2002-10-24 数据转换方法及设备
US10/689,186 US8271874B2 (en) 2002-10-24 2003-10-20 Method and apparatus for locating and transforming data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021471509A CN100504849C (zh) 2002-10-24 2002-10-24 数据转换方法及设备

Publications (2)

Publication Number Publication Date
CN1492358A true CN1492358A (zh) 2004-04-28
CN100504849C CN100504849C (zh) 2009-06-24

Family

ID=32098109

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021471509A Expired - Fee Related CN100504849C (zh) 2002-10-24 2002-10-24 数据转换方法及设备

Country Status (2)

Country Link
US (1) US8271874B2 (zh)
CN (1) CN100504849C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354746A (zh) * 2015-07-13 2017-01-25 富士通株式会社 搜索方法和搜索设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050177788A1 (en) * 2004-02-11 2005-08-11 John Snyder Text to XML transformer and method
US8515946B2 (en) * 2008-02-28 2013-08-20 Microsoft Corporation Location description for federation and discoverability
US10089697B2 (en) * 2013-01-25 2018-10-02 Capital One Services, Llc Systems and methods for extracting information from a transaction description

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965763A (en) 1987-03-03 1990-10-23 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
US5664109A (en) 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US5913214A (en) 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
CN1205092A (zh) * 1996-08-16 1999-01-13 株式会社Pfu 原稿文本生成装置及其程序存储媒体
US6339795B1 (en) 1998-09-24 2002-01-15 Egrabber, Inc. Automatic transfer of address/schedule/program data between disparate data hosts
EP1016982A1 (en) * 1998-12-30 2000-07-05 LION Bioscience AG Method and apparatus of processing semistructured textual data
US6732331B1 (en) * 2000-02-15 2004-05-04 Vlad Alexander System and process for managing content organized in a tag-delimited template using metadata
US20020013790A1 (en) 2000-07-07 2002-01-31 X-Aware, Inc. System and method for converting data in a first hierarchical data scheme into a second hierarchical data scheme
US7024633B1 (en) * 2001-03-16 2006-04-04 Sun Microsystems, Inc. Methods and apparatus for creating and transforming graphical constructs
US6963878B2 (en) * 2001-09-24 2005-11-08 Microsoft Corporation Generating a focused data set from an original data set
CN1217269C (zh) * 2001-11-07 2005-08-31 无锡永中科技有限公司 数据对象存贮库与电子表格单元链接的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354746A (zh) * 2015-07-13 2017-01-25 富士通株式会社 搜索方法和搜索设备

Also Published As

Publication number Publication date
US20040083242A1 (en) 2004-04-29
US8271874B2 (en) 2012-09-18
CN100504849C (zh) 2009-06-24

Similar Documents

Publication Publication Date Title
CN1209725C (zh) 文件编辑处理方法和文件编辑处理设备
CN1218265C (zh) 数据库检索装置及方法
CN1287310C (zh) 组成多媒体文件的方法和装置
CN1314226C (zh) 多媒体文件共享方法和装置
CN1293465C (zh) Gui显示装置及光标或gui组件动画显示处理方法
CN101048773A (zh) 文件分析系统、以及文件适应系统
CN1858786A (zh) 一种电子文档格式化批注系统与方法
CN1945599A (zh) 图像处理装置,图像处理方法和计算机程序产品
CN1174319C (zh) 数据结构管理装置、数据结构管理系统和方法
CN1315017A (zh) 包含内部引用的两种版本数据表格之间的差别提取
CN1328668A (zh) 用于指定网络上的位置的系统和处理
CN101038534A (zh) 信息处理设备及其控制方法
CN1680942A (zh) 文档组分析设备、文档组分析方法及文档组分析系统
CN1379346A (zh) 数字内容作成系统以及数字内容作成程序
CN101034414A (zh) 信息处理设备和方法以及程序
CN101039366A (zh) 扫描解决方案系统
CN1920825A (zh) 在流设计工具中显示性能约束的方法和系统
CN1591425A (zh) 用于产生网站导航的方法
CN1533149A (zh) 图像处理系统
CN1519753A (zh) 程序、字符输入编辑方法、装置及记录媒体
CN1828606A (zh) 信息提供方法以及门户站点系统
CN1959678A (zh) 信息处理方法及其设备
CN1870028A (zh) 工作流程系统、工作流程处理方法和工作流程处理程序
CN1633638A (zh) 在外貌特征模式中带有总功能特性的连接实体
CN1601543A (zh) 工作流管理设备及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090624

Termination date: 20201024