CN100461173C - 电子归档系统和电子归档方法 - Google Patents
电子归档系统和电子归档方法 Download PDFInfo
- Publication number
- CN100461173C CN100461173C CNB2005101095300A CN200510109530A CN100461173C CN 100461173 C CN100461173 C CN 100461173C CN B2005101095300 A CNB2005101095300 A CN B2005101095300A CN 200510109530 A CN200510109530 A CN 200510109530A CN 100461173 C CN100461173 C CN 100461173C
- Authority
- CN
- China
- Prior art keywords
- document
- style sheet
- input
- data
- sheet data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种电子归档系统和电子归档方法。该电子归档系统用于注册和管理文档,包括:样式表设置单元,用于在存储单位中设置样式表数据;输入单元,用于输入要注册的文档;样式表获取单元,用于从在注册有输入文档的存储单位中设置的样式表数据中获取样式表数据;以及转换单元,用于使用由样式表获取单元获取的样式表数据来转换输入文档。该电子归档系统还包括:缩小图像生成单元,用于从由转换单元转换过的文档生成缩小图像;以及注册单元,用来将由缩小图像生成单元生成的缩小图像链接到输入文档。
Description
技术领域
本发明涉及用于管理和存储电子文档的电子归档系统。尤其涉及一种用于生成要管理的电子文档的缩小图像的装置、方法、以及程序。
背景技术
已知一种电子归档装置(文档管理装置),其将文档管理信息链接到通过使用扫描仪读取文档而产生的文档图像数据,以存储所链接的文档管理信息和文档图像数据,以便能基于所链接的文档管理信息来搜索所存储的文档图像,并进行显示和打印。这些电子归档装置将文档管理信息(文档名称、页数、注册日期、关键字等)链接到文档,以注册所链接的文档管理信息和文档。例如,当显示文档列表和搜索结果列表时,这些文档管理信息项作为用于识别文档的信息进行显示。
然而,对用户来说,仅通过乍一看这些文档管理信息很难识别文档的概要。为了克服该困难,还提出了一种电子归档装置,用于生成和注册电子文档的缩小图像(缩略图),并在文档列表和搜索结果列表中显示该缩小图像(参见日本特开平10-240724号公报)。
图10是示出用于在文档列表和搜索结果列表中显示缩小图像的典型电子归档装置的示例功能结构的框图。参考图10,该电子归档装置包括,例如:文档读取部分1000、缩小图像生成部分1001、文档存储部分1002、以及显示控制部分1003。文档读取部分1000读取文件系统中的文件数据和从图中未示出的装置或通过网络接收到的文档数据。缩小图像生成部分1001生成当在屏幕上显示文档读取部分1000所读取的文档数据时输出的绘图数据,并生成通过例如点抽选(dot decimation)从绘图数据缩小到适当大小的图像数据。文档存储部分1002将由文档读取部分1000读取的文档数据链接到由缩小图像生成部分1001生成的该文档的缩小图像数据,并存储所链接的数据。显示控制部分1003控制存储在文档存储部分1002中的文档数据和缩小图像的显示,并基于例如图11所示的缩小图像来显示文档列表。
在很多情况下,这时生成的缩小图像主要与作为首页输出的页面有关。
另一方面,美国2002-0007367 A1(外国优先权:日本特开2002-32364号公报)说明了一种技术,该技术用来过滤文档元素并按照重要性的顺序从页面顶部开始排列过滤后的元素以打印(或显示)该页。美国2002-0007367 A1旨在当打印或显示文档时,允许用户高效率地识别由多个元素组成的文档的内容。
然而,在上述已知的技术中,即使可以从文档的缩小图像(缩略图)识别文档的概要,例如整个文档的布局,也难以从缩小图像识别出包含在文档中的字符。因此,很难基于上述缩小图像识别具有相似布局的文档或缺乏特征的(characterless)布局的文档(即,缺少区别性特征的布局),例如没有大的字符或图形的文档。
尤其是当从包含基本相同大小的字符的文本文档数据例如XML文档生成缩小图像时,该困难更显著。图12所示的XML文档数据是典型的例子。附图标记1200表示要输入并存储到电子归档系统中的原始文档数据,附图标记1201表示从文档数据1200生成的缩小图像。对于已知的电子归档系统的用户来说,很难从该缩小图像1201了解文档1200的内容。
根据上述US2002-0007367 A1,分析文档的结构以按照重要性的顺序来排列元素。在这种情况下,基于重要性来选择要显示的元素。然而,因为US2002-0007367 A1没有考虑到缩小图像(缩略图)的生成,当文档(例如,不包括大的字符或图形的文档)以缩小图像表示时,会产生同样的问题。而且,因为按照重要性的顺序来排列元素,文档的原始布局被完全忽略。因此,即使存在一些以相同格式描述的文档,也不能基于布局来比较这些文档。这产生了难以从视觉上判定一个文档是否与另一个文档相似的问题。
发明内容
根据本发明的一个方面,一种用于注册文档的电子归档系统包括:样式表设置单元,用于设置与多个存储单位中的各存储单位相对应的多个样式表数据;输入单元,用于将要注册的文档输入所述多个存储单位中的一个存储单位中;样式表获取单元,用于当由所述输入单元将输入文档输入一个存储单位时,获取与由所述输入单元将所述输入文档输入其中的所述存储单位相对应的样式表数据;转换单元,用于使用由所述样式表获取单元获取的样式表数据来转换输入文档;缩小图像生成单元,用于从由所述转换单元使用所述样式表数据转换过的文档生成缩小图像;以及注册单元,用于将由所述缩小图像生成单元生成的缩小图像链接到所述输入文档。
根据本发明的另一方面,一种用于控制注册文档用的系统的电子归档方法包括:样式表设置步骤,用于设置与多个存储单位中的各存储单位相对应的多个样式表数据;输入步骤,用于将要注册的文档输入所述多个存储单位中的一个存储单位中;样式表获取步骤,用于当在所述输入步骤中将输入文档输入一个存储单位时,获取与在所述输入步骤中将所述输入文档输入其中的所述存储单位相对应的样式表数据;转换步骤,用于使用在所述样式表获取步骤中获取的样式表数据来转换输入文档;缩小图像生成步骤,用于从在所述转换步骤中使用所述样式表数据转换过的文档生成缩小图像;以及注册步骤,用于将在所述缩小图像生成步骤中生成的所述缩小图像链接到所述输入文档。
根据本发明的又一方面,一种计算机程序包括用于控制计算机注册和管理文档的程序代码,该程序代码执行上述电子归档方法。
根据本发明的又一方面,一种计算机可读取的记录介质存储上述计算机程序。
根据本发明,即使从基本上只包含文本的文档数据例如XML文档生成缩小图像,也能强调文档中重要的字符串和部分,以便可以识别该重要的字符串和部分。因此,即使对于具有相似布局或缺乏特征的布局的文档,例如没有大的字符或图形的文档,仍可以列出文档生成的缩小图像,以便用户可以容易地识别该文档的内容。
而且,因为强调了具有相同文档格式的文档的相同部分,所以通过视觉比较其各自的缩小图像,可以将具有相同布局的文档识别为具有相同格式的文档。
文档的被强调部分不通过字(word)的自动转换来指定,或者通过文档的句法分析或语义分析来判定;而是允许用户自己基于例如半结构化文档的结构和结构定义,来指定要强调的部分以及如何进行强调。这便于正确指定要强调的部分,基本防止了对要强调部分的错误识别。
此外,因为对每个存储单位(例如,文件夹)可以指定不同的强调方法、格式、以及样式,所以能定义与文档分类密切相关的部分。
通过以下参考附图对典型实施例的说明,本发明的其它特征是显而易见的。
附图说明
包含在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并与说明书一起用来解释本发明的原理。
图1是根据本发明第一实施例的框图;
图2A和2B是根据本发明第一实施例的流程图;
图3示出根据本发明第一实施例的数据转换的一个例子;
图4是根据本发明第一实施例的具体应用的例子;
图5是根据本发明第二实施例的流程图;
图6是根据本发明第三实施例的流程图;
图7是根据本发明第四实施例的流程图;
图8是根据本发明第四实施例的框图;
图9示出用于生成在本发明中使用的XSLT的GUI的一个例子;
图10是示出已知电子归档装置的示例功能结构的框图;
图11示出采用已知方法以缩小图像的形式显示的文档列表的例子;
图12示出XML数据和已知的由该XML数据生成的缩小图像。
具体实施方式
第一实施例
现在参考附图来说明根据本发明的第一实施例。
图1示出了根据第一实施例的一个示例结构。
XML格式判定部分0100判定所输入的文档数据是否为可扩展标记语言(eXtensible Markup Language,XML)数据。当将XML数据输入到文档归档系统(文档管理系统)时,文档输入控制部分0101指定要输入的XML数据,并指定存储该XML文档数据的存储文件夹。样式表(style-sheet)取出部分0102取出注册在存储单位(unit)(例如,作为文档注册地点的文件夹、存储柜(cabinet)、或目录)中的样式表。样式表应用部分0103将从存储单位获取的样式表应用到输入XML数据,并且执行数据转换以生成中间数据。缩小图像生成部分0104从所生成的中间数据生成缩小图像(缩略图)。DB(数据库)存储部分0105将所生成的缩小图像链接到输入文档数据,并在文档归档系统的数据库中存储所链接的缩小图像和文档数据。样式表注册部分0106在存储单位(存储部分)例如文件夹中注册样式表。样式表注册部分0106可在每个存储单位(例如,文件夹)中注册独有的样式表。
图2A和2B是示出根据具有上述结构的第一实施例生成缩小图像的程序和装置的流程图。图2A中的流程图示出了在文档存储单位(例如,文件夹)中注册样式表的程序,图2B中的流程图示出了当在文档归档系统的数据库中存储XML数据文档时,生成缩小图像的程序。
图3示出根据第一实施例的数据转换和根据已知方法的数据转换的一个例子。还图3参考说明第一实施例。
对图2B中的流程图进行说明。首先,当在步骤0205将文档数据0300输入到文档归档系统以存储时,在步骤0206,XML格式判定部分0100检查所输入的文档数据是否为XML数据。如果判定所指定的数据为XML,则在步骤0207,样式表取出部分0102获取注册在存储文档数据的文件夹中的样式表(这里通过XML样式表语言转换(XML Stylesheet Language Transformation,XSLT)来描述)。假定存储文档数据的文件夹已由用户指定或已由归档系统自动确定。
接着,在步骤0208,样式表应用部分0103使用在步骤0207中获得的XSLT数据来转换所输入的XML文档数据0300,并生成中间数据0301。在步骤0209,缩小图像生成部分0104从所生成的中间数据0301生成缩小图像0303。最后,在步骤0210,DB存储部分0105将缩小图像0303链接到所输入的XML文档数据0300,并且在数据库(DB)中存储所链接的缩小图像0303和XML文档数据0300。在该第一实施例中,如果在步骤0206判定所指定的数据不是XML数据,则象使用已知技术那样,以输入文档的小型化版本的形式生成缩小图像,然后将其存储在数据库中。
另一方面,如果使用已知技术缩小图3中所示的XML数据0300,则基于作为文本数据的图像的中间数据0302来生成缩小图像0304。如图3所示,与根据已知技术生成的缩小图像0304相比,更容易从根据本发明生成的缩小图像0303识别文档。
通过执行图2A中XML流程图的每个步骤来注册在上述步骤0207中获得的XSLT数据。首先,在步骤0201,用户指定要注册到存储单位(例如,文件夹)中的XSLT数据。接着,在步骤0202,样式表注册部分0106可在每个所指定的存储单位(例如,每个文件夹)或多个存储单位(例如,由多个文件夹组成的父文件夹)中注册所指定的XSLT数据。
利用这种可以在每个存储单位或多个存储单位中注册样式表的特征,可以生成输入文档数据的缩小图像,以便强调存储在由用户建立的文件夹中的文档的最有用部分。图4是示出该特征的具体例子的图:情况1,文件夹结构0403根据类别进行分类;情况2,文件夹结构0406根据公司进行分类。尽管是相同的输入XML数据0400,但根据不同的文件夹结构例如情况1和情况2,用户可能希望在XML数据0400的缩小图像中强调不同的部分。在情况1中,因为文件夹根据类别来分类(也就是说,能通过已注册的文件夹来识别类别),所以在每个文件夹中注册的文档的缩小图像中,希望识别的是公司而不是类别。因此,在文件夹中注册XSLT数据,该XSLT数据不强调对应于类别的值“Stock”,而强调对应于公司的值“XXX Company”,以便使用XSLT数据将XML数据0400转换为中间数据1(0401)以生成缩小图像0402。另一方面,在情况2中,因为文件夹根据公司来分类(也就是说,能通过已注册的文件夹来识别公司),所以在每个文件夹中注册的文档的缩小图像中,希望识别的是类别而不是公司。因此,在情况2的文件夹中注册XSLT数据,该XSLT数据不强调对应于公司的值,而强调对应于类别的值“Stock”,以便使用XSLT数据将XML数据0400转换为中间数据0404以生成缩小图像0405。
根据该实施例,即使从基本上只包含文本的文档数据例如XML文档生成缩小图像,仍可以强调文档中的重要字符串和部分,以便能够识别该重要字符串和部分。因此,即使文档具有相似的布局或缺乏特征的布局,例如没有大的字符或图形的文档,仍能够列出文档的所生成的缩小图像,以允许用户容易地识别出文档内容。
此外,因为对于每个存储单位可以指定不同的强调方法、格式、以及样式,因此可以定义与文档分类密切相关的部分。
尽管在该实施例中使用XML格式的文档作为例子,但其它格式的结构化文档也是可接受的。如果是这种情况,则使用用于转换文档格式的样式表来转换文档的格式,以生成文档的缩小图像。
第二实施例
在第一实施例中,如果在步骤0206判定输入文档是结构化文档(例如,XML文档),则执行步骤0207的处理以及随后的处理。本发明还能如图5的流程图所示来实现。即,如果在步骤0206判定指定的文档不是XML数据,则流程进入步骤0500,在该步骤将输入数据转换为XML,然后如第一实施例所述,执行步骤0207的处理以及随后的处理。为了转换为XML,通过执行例如布局分析、句法分析、以及语义分析来放置适当的标签,以结构化输入文档(将输入文档转换为XML数据)。
根据本实施例,即使输入数据不是XML数据,仍可以强调文档中的重要字符串和部分以便识别它们。因此,即使文档具有类似的布局或缺乏特征的布局,例如没有大的字符或图形的文档,仍能够列出从该文档生成的缩小图像,以允许用户容易地识别出文档内容。
此外,因为对于每个存储单位可以指定不同的强调方法、格式、以及样式,因此可以定义与文档分类密切相关的部分。
第三实施例
在第一和第二实施例中,使用XSLT数据执行格式转换,其中注册在单个存储文件夹中的XSLT数据仅是一项。在该第三实施例中,当注册XSLT数据时,还能注册相应的模式(schema)信息以允许在一个文件夹中注册多个XSLT数据项。如图6的流程图所示,当在步骤0206判定输入数据为XML数据之后(或当在步骤0500将输入数据转换为XML数据之后),检查输入XML数据的模式。然后,判定相应于所检查的模式的XSLT数据是否被注册在文件夹中(基于该XML文档模式来判定是否适于处理输入XML文档)。如果判定注册了相应于所检查的模式的XSLT数据,则在步骤0207使用对应于该模式的XSLT数据进行转换。另一方面,如果判定没有注册相应于所检查的模式的XSLT数据,则流程进入步骤0602,在该步骤执行其它的处理,例如用已知的方法生成缩小图像(或者拒绝文档注册)。
根据该第三实施例,可以在文件夹中注册多个XSLT数据项,并根据输入XML的模式自动选择相应的样式表。因此,即使当将对应于多个模式的数据输入到一个文件夹中时,也能生成强调了适当部分以进行显示的缩小图像。
第四实施例
在第三实施例中,需要准备和注册对应于用户输入的文档的模式的样式表。在第四实施例中,如果所输入的XML数据不是适合于所注册的模式的XML数据,则这时通过允许用户指定要强调的部分的UI来自动生成XSLT。
图7是示出根据本实施例生成缩小图像的程序和装置的流程图。图8示出根据第四实施例的结构的一个例子。
在文档输入控制部分0101接收到XML数据之后,模式取得部分0800获取在被指定为注册输入文档的存储单位的文件夹中注册的模式,以在步骤0600检查XML的模式。如果在步骤0601判定该输入XML数据适合于所注册的模式,则以与上述第三实施例相同的方式使用相应的XSLT数据来执行步骤0207的处理以及随后的处理。另一方面,如果在步骤0601判定输入XML数据不适合所注册的模式,则流程进入步骤0700。在步骤0700,由新模式成分(component)抽出部分0802从输入XML数据的模式中抽出构成该数据的元素(XML的元素、属性),以由模式成分显示部分0803执行列表显示。图9是从假定要输入的XML数据及其模式抽出成分、并在对话框中执行列表显示的例子。通过该GUI,用户可以指定应将何种格式转换(例如,字符着色、改变字体类型、以及改变大小)应用到哪个成分上。作为响应,格式指定部分0804在步骤0701中执行该处理。响应于在步骤0701中的输入,在步骤0702,样式表生成部分0805生成样式表。在步骤0703,通过样式表注册部分0106在存储文件夹中注册所生成的样式表。
根据该实施例,即使当输入与注册在文件夹中的XSLT数据不对应的XML数据时,也可以生成所需要的对应的XSLT数据。因此,当用户输入数据时,不论对应的XSLT是否被注册,都可以输入数据,并生成容易识别的缩小图像。
第五实施例
第三和第四实施例假定只有一个XSLT数据项对应于一个模式。可选地,在一个模式中可以注册多个XSLT数据项。在这种情况下,当输入XML数据时,用户需要能从注册在通过模式检查判定为适合的模式中的XSLT中进行选择。
根据本实施例,能灵活地实现使存储在相同文件夹下的特定文档具有不同强调部分的要求的要求。
第六实施例
在上述实施例中,根据存储文件夹来切换所使用的XSLT数据。在第六实施例中,还根据数据类型来切换所使用的XSLT数据。更具体地,根据输入源文档的数据类型来切换所使用的XSLT数据:例如,将样式表A应用到通过将BMP数据转换为XML所抽出的数据,将样式表B应用到通过将TIFF数据转换为XML所抽出的数据。
根据本实施例,根据输入文档的数据类型可以自动选择相应的样式表。因此,可以生成根据数据类型强调用来显示的适当部分的缩小图像。
第七实施例
根据第七实施例,除了在前述实施例中说明的情况以外,根据输入数据和生成缩小图像的用户或账号信息来切换所取得的XSLT数据。
通过该结构,可以根据用户来切换所生成的缩小图像数据,因此,可以从缩小图像来判定输入有问题的数据的用户。
第八实施例
在上述实施例中,在相同模式、相同文件夹、相同用户以及相同账号的情况下,所应用的XSLT数据是相同的。根据第八实施例,可以在文件夹或XSLT数据中注册XPath表达式,以根据是否满足该XPath表达式来切换所应用的XSLT数据。例如,当输入新文档A和B时,可以区分文档A和文档B,以便如果文档A中的文章是旧的,则不强调文档A的文章标题;如果文档B中的文章是新的,则强调文档B的文章标题。
根据该实施例,可以根据输入数据的内容来改变要强调的部分。
第九实施例
在上述实施例中,假定用户指定了存储文件夹。可选地,当将文档输入到自判定(self-determining)的文件夹时,可以根据输入文档的模式自动判定存储文件夹。
例如,在自判定文件夹中注册一组模式数据、相应的XSLT数据、以及存储文件夹名称。当将某个XML数据输入到该文件夹时,检查该XML数据的模式。使用判定为适当的XSLT数据来转换XML数据以生成缩小图像。当注册该数据时,该数据被自动分配到注册为与模式相关联的存储文件夹中。
根据该实施例,用户无需在输入文档之前指定存储文件夹,并且具有相同模式的文档被收集在相同文件夹中。这允许更具体地选择样式表中要强调的部分,从而提高整个系统中的目标文档的可访问性。
其他实施例
根据第一到第九实施例的本发明能以例如系统、装置、方法、程序、或者存储介质的形式来实现。更具体地,本发明可应用于包括多个装置的系统或包括单个装置的装置。
此外,本发明可这样实现:直接或远程向系统或装置提供实现上述实施例的功能的程序代码(对应于实施例中的流程图的程序),然后使系统或装置的计算机来读取并执行所提供的程序代码。
因此,安装在计算机上以通过计算机来实现本发明的功能处理的程序代码本身构成本发明的一个方面。总之,用来实现本发明的功能处理的计算机程序本身包括在本发明的范围内。
在这种情况下,只要用作程序,任何形式的程序都是可以接受的,包括作为目标代码或由解释程序执行的程序、以及提供给OS(操作系统)的脚本数据。
该程序可以这样提供:通过计算机的浏览器来访问因特网上的主页,然后将根据本发明的计算机程序本身或包含自动安装功能的该程序的压缩文件从主页下载到记录介质例如硬盘上。而且,本发明还可通过将构成根据本发明的程序的程序代码分为多个文件,并从不同主页上下载每个文件来实现。换句话说,允许多个用户将实现本发明的功能处理的程序文件下载到计算机上的服务器也包括在本发明的范围内。
此外,本发明也可以这样实现:通过向用户提供存储有根据本发明的程序的加密版本的记录介质例如CD-ROM,只允许满足预定条件的用户通过因特网从主页下载用于解密该加密程序的密匙信息,并使用该密钥信息来执行加密的程序,从而将程序安装在计算机中。
如上所述,通过执行由计算机读取的程序代码来实现上述实施例的功能。此外,上述实施例的功能还可以这样实现:例如,由运行在计算机上的OS根据程序代码的命令执行全部或部分处理。
而且,上述实施例的功能还可以这样实现:将从存储介质读取的程序代码写入设在计算机中的扩展卡或与计算机连接的扩展单元的存储器中,然后,例如扩展卡或扩展单元上的CPU基于程序代码中的命令执行全部或部分处理。
尽管参考典型实施例说明了本发明,但应当理解,本发明不局限于所公开的典型实施例。以下权利要求的范围符合最宽的解释,以覆盖所有修改、等同结构和功能。
Claims (15)
1.一种电子归档系统,用于注册文档,该电子归档系统包括:
样式表设置单元,用于设置与多个存储单位中的各存储单位相对应的多个样式表数据;
输入单元,用于将要注册的文档输入所述多个存储单位中的一个存储单位中;
样式表获取单元,用于当由所述输入单元将输入文档输入一个存储单位时,获取与由所述输入单元将所述输入文档输入其中的所述存储单位相对应的样式表数据;
转换单元,用于使用由所述样式表获取单元获取的样式表数据来转换输入文档;
缩小图像生成单元,用于从由所述转换单元使用所述样式表数据转换过的文档生成缩小图像;以及
注册单元,用于将由所述缩小图像生成单元生成的缩小图像链接到所述输入文档。
2.根据权利要求1所述的电子归档系统,其特征在于,所述电子归档系统的该存储单位是文件夹、存储柜或目录。
3.根据权利要求1所述的电子归档系统,其特征在于,由所述转换单元转换的输入文档是XML文档,样式表数据是XSLT数据。
4.根据权利要求1所述的电子归档系统,其特征在于,由所述转换单元转换的输入文档是结构化文档。
5.根据权利要求1所述的电子归档系统,其特征在于,由所述样式表设置单元设置在所述各存储单位中的样式表数据是用户所指定的样式表。
6.根据权利要求1所述的电子归档系统,其特征在于,还包括:
判定单元,用于判定由所述输入单元输入的文档是否是结构化文档;以及
结构化单元,如果判定单元判定由所述输入单元输入的文档不是结构化文档,则将其结构化为结构化文档,其中
转换单元使用由所述样式表获取单元获取的样式表数据来转换由所述结构化单元结构化的结构化文档。
7.根据权利要求1所述的电子归档系统,其特征在于,所述样式表设置单元在所述各存储单位中设置样式表数据和模式信息;以及其中
所述样式表获取单元从设置在由所述输入单元将输入文档输入其中的存储单位中的样式表数据,获取与所述输入文档的模式信息对应的样式表数据。
8.根据权利要求1所述的电子归档系统,其特征在于,如果判定与文档的模式信息对应的样式表数据没有设置在由所述输入单元将所述输入文档输入其中的存储单位中,则生成与所述文档的模式对应的新的样式表数据,并由所述样式表获取单元获取新生成的样式表数据。
9.根据权利要求8所述的电子归档系统,其特征在于,对模式成分进行列表以进行显示,显示用于允许用户输入关于格式信息的指令的GUI,以基于用户所指示的信息通过该GUI生成新的样式表数据。
10.根据权利要求1所述的电子归档系统,其特征在于,所述样式表设置单元允许将多个样式表数据链接到一项模式信息,以在存储单位中设置多个样式表数据;以及
所述样式表获取单元允许用户指定从多个样式表数据中获取的与文档的模式信息对应的样式表数据。
11.根据权利要求1所述的电子归档系统,其特征在于,所述样式表获取单元基于所述输入文档的数据类型以及设置在由所述输入单元将所述输入文档输入其中的存储单位中的所述样式表数据,来获取样式表数据。
12.根据权利要求1所述的电子归档系统,其特征在于,所述样式表获取单元基于账号信息以及设置在由所述输入单元将所述输入文档输入其中的存储单位中的所述样式表数据,获取样式表数据。
13.根据权利要求1所述的电子归档系统,其特征在于,所述样式表设置单元使用结构化文档的一部分设置判别式,以及
所述样式表获取单元基于该判别式获取对应的样式表数据。
14.根据权利要求1所述的电子归档系统,其特征在于,所述样式表设置单元在预定的存储单位中设置模式信息、样式表数据和注册有输入文档的存储单位;
样式表获取单元获取与文档的模式信息对应的样式表数据;以及
注册单元将由缩小图像生成单元生成的缩小图像链接到文档,以在与该文档的模式信息对应的存储单位中注册文档。
15.一种电子归档方法,用于控制注册文档用的系统,该方法包括:
样式表设置步骤,用于设置与多个存储单位中的各存储单位相对应的多个样式表数据;
输入步骤,用于将要注册的文档输入所述多个存储单位中的一个存储单位中;
样式表获取步骤,用于当在所述输入步骤中将输入文档输入一个存储单位时,获取与在所述输入步骤中将所述输入文档输入其中的所述存储单位相对应的样式表数据;
转换步骤,用于使用在所述样式表获取步骤中获取的样式表数据来转换输入文档;
缩小图像生成步骤,用于从在所述转换步骤中使用所述样式表数据转换过的文档生成缩小图像;以及
注册步骤,用于将在所述缩小图像生成步骤中生成的所述缩小图像链接到所述输入文档。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004307160A JP4666996B2 (ja) | 2004-10-21 | 2004-10-21 | 電子ファイリングシステム、電子ファイリング方法 |
JPJP2004307160 | 2004-10-21 | ||
JP2004307160 | 2004-10-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1763748A CN1763748A (zh) | 2006-04-26 |
CN100461173C true CN100461173C (zh) | 2009-02-11 |
Family
ID=35762548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005101095300A Expired - Fee Related CN100461173C (zh) | 2004-10-21 | 2005-10-21 | 电子归档系统和电子归档方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8332745B2 (zh) |
EP (1) | EP1650682A3 (zh) |
JP (1) | JP4666996B2 (zh) |
KR (1) | KR100834196B1 (zh) |
CN (1) | CN100461173C (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007133511A (ja) * | 2005-11-08 | 2007-05-31 | Ricoh Co Ltd | 文書管理装置、文書管理プログラム及び記録媒体 |
US7814425B1 (en) * | 2005-12-30 | 2010-10-12 | Aol Inc. | Thumbnail image previews |
US8271542B1 (en) * | 2006-01-03 | 2012-09-18 | Robert V London | Metadata producer |
JP2007200235A (ja) * | 2006-01-30 | 2007-08-09 | Brother Ind Ltd | リムーバブルメディア装置、リムーバブルメディア装置制御プログラムおよびネット機器制御プログラム |
CN101201909A (zh) * | 2006-12-15 | 2008-06-18 | 鸿富锦精密工业(深圳)有限公司 | 专利电子送件回执文件的管理系统及方法 |
JP2008225932A (ja) * | 2007-03-14 | 2008-09-25 | Just Syst Corp | データ処理装置及びデータ処理方法 |
JP4591467B2 (ja) * | 2007-03-28 | 2010-12-01 | ブラザー工業株式会社 | 印刷装置と印刷方法 |
JP4924281B2 (ja) | 2007-08-15 | 2012-04-25 | ブラザー工業株式会社 | 画像処理装置及びプログラム |
JP5440004B2 (ja) * | 2008-10-20 | 2014-03-12 | セイコーエプソン株式会社 | 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム |
JP5293086B2 (ja) | 2008-10-28 | 2013-09-18 | セイコーエプソン株式会社 | 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム |
KR20100053186A (ko) | 2008-11-12 | 2010-05-20 | 삼성전자주식회사 | 썸네일 생성 방법 및 화상형성장치 |
CN106649436A (zh) * | 2016-09-08 | 2017-05-10 | 东软集团股份有限公司 | 数据归档方法与装置 |
US11086829B2 (en) * | 2020-01-02 | 2021-08-10 | International Business Machines Corporation | Comparing schema definitions using sampling |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1235305A (zh) * | 1997-11-19 | 1999-11-17 | 国际商业机器公司 | 用于归档和访问电子报文的数据处理系统和方法 |
US20020147847A1 (en) * | 2001-04-09 | 2002-10-10 | Sun Microsystems, Inc. | System and method for remotely collecting and displaying data |
EP1437885A1 (en) * | 2001-09-10 | 2004-07-14 | Nikon Technologies, Inc. | DIGITAL CAMERA SYSTEM, IMAGE STORAGE APPARATUS, AND DIGITAL CAMERA |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717940A (en) | 1995-04-28 | 1998-02-10 | Ricoh Company, Ltd. | Method of selecting a target document using features of an example page |
US5751287A (en) * | 1995-11-06 | 1998-05-12 | Documagix, Inc. | System for organizing document icons with suggestions, folders, drawers, and cabinets |
JPH10240724A (ja) | 1997-02-28 | 1998-09-11 | Canon Inc | 文書管理装置及びシステム及び方法 |
US7100106B1 (en) * | 1998-12-14 | 2006-08-29 | Microsoft Corporation | Mirroring operations performed on linked files and folders |
WO2000046033A1 (fr) * | 1999-02-04 | 2000-08-10 | Matsushita Electric Industrial Co., Ltd. | Detecteur d'objet a imprimer et procede de detection d'impression |
JP2000259640A (ja) * | 1999-03-04 | 2000-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書カスタマイズ表示方法及びシステム及びサーバ装置及びクライアント装置構造化文書カスタマイズ表示プログラムを格納した記憶媒体 |
US6826597B1 (en) | 1999-03-17 | 2004-11-30 | Oracle International Corporation | Providing clients with services that retrieve data from data sources that do not necessarily support the format required by the clients |
US6356908B1 (en) * | 1999-07-30 | 2002-03-12 | International Business Machines Corporation | Automatic web page thumbnail generation |
EP1074925B8 (en) | 1999-08-06 | 2011-09-14 | Ricoh Company, Ltd. | Document management system, information processing apparatus, document management method and computer-readable recording medium |
AU4513401A (en) * | 1999-11-30 | 2001-06-18 | Broadvision Inc. | Customization of output content based on device type |
JP2002032364A (ja) | 2000-07-14 | 2002-01-31 | Ricoh Co Ltd | 文書情報処理方法、文書情報処理装置及び記録媒体 |
JP4358464B2 (ja) * | 2000-08-09 | 2009-11-04 | 三菱重工業株式会社 | 電子ファイル装置とそのシステム作成方法及び書類データの選択方法 |
US6822663B2 (en) * | 2000-09-12 | 2004-11-23 | Adaptview, Inc. | Transform rule generator for web-based markup languages |
US6964025B2 (en) * | 2001-03-20 | 2005-11-08 | Microsoft Corporation | Auto thumbnail gallery |
JP2002312401A (ja) * | 2001-04-11 | 2002-10-25 | Canon Inc | 電子ファイリング装置及びその制御方法、記憶媒体並びにプログラム |
US6883138B2 (en) * | 2001-08-08 | 2005-04-19 | Xerox Corporation | Methods and systems for generating enhanced thumbnails usable for document navigation |
US6999972B2 (en) | 2001-09-08 | 2006-02-14 | Siemens Medical Systems Health Services Inc. | System for processing objects for storage in a document or other storage system |
JP2003131930A (ja) | 2001-10-26 | 2003-05-09 | Nec Corp | コンテンツ変換処理装置、スタイルシート自動選択方法、およびそのプログラム |
US6996781B1 (en) * | 2001-10-31 | 2006-02-07 | Qcorps Residential, Inc. | System and method for generating XSL transformation documents |
JP2003150586A (ja) * | 2001-11-12 | 2003-05-23 | Ntt Docomo Inc | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7480856B2 (en) * | 2002-05-02 | 2009-01-20 | Intel Corporation | System and method for transformation of XML documents using stylesheets |
JP2004307160A (ja) | 2003-04-08 | 2004-11-04 | Sekisui Chem Co Ltd | 成形ロール |
US7620889B2 (en) * | 2004-12-20 | 2009-11-17 | Microsoft Corporation | Method and system for linking data ranges of a computer-generated document with associated extensible markup language elements |
JP5383234B2 (ja) * | 2009-02-03 | 2014-01-08 | キヤノン株式会社 | 情報処理装置及び印刷制御方法 |
-
2004
- 2004-10-21 JP JP2004307160A patent/JP4666996B2/ja not_active Expired - Fee Related
-
2005
- 2005-10-20 US US11/256,023 patent/US8332745B2/en not_active Expired - Fee Related
- 2005-10-21 KR KR1020050099499A patent/KR100834196B1/ko not_active IP Right Cessation
- 2005-10-21 CN CNB2005101095300A patent/CN100461173C/zh not_active Expired - Fee Related
- 2005-10-21 EP EP20050256534 patent/EP1650682A3/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1235305A (zh) * | 1997-11-19 | 1999-11-17 | 国际商业机器公司 | 用于归档和访问电子报文的数据处理系统和方法 |
US20020147847A1 (en) * | 2001-04-09 | 2002-10-10 | Sun Microsystems, Inc. | System and method for remotely collecting and displaying data |
EP1437885A1 (en) * | 2001-09-10 | 2004-07-14 | Nikon Technologies, Inc. | DIGITAL CAMERA SYSTEM, IMAGE STORAGE APPARATUS, AND DIGITAL CAMERA |
Non-Patent Citations (2)
Title |
---|
Document Transformation System from Papers toXMLDataBased on Privot XML Document Method. Yasuto ISHITANI,KomukaiToshiba-cho,Saiwai-ku,Dawasaki.Proceedings of Seventh International Conference on Document Analysis and Recognition. 2003 |
Document Transformation System from Papers toXMLDataBased on Privot XML Document Method. Yasuto ISHITANI,KomukaiToshiba-cho,Saiwai-ku,Dawasaki.Proceedings of Seventh International Conference on Document Analysis and Recognition. 2003 * |
Also Published As
Publication number | Publication date |
---|---|
EP1650682A3 (en) | 2006-11-22 |
US20060087668A1 (en) | 2006-04-27 |
CN1763748A (zh) | 2006-04-26 |
KR20060049116A (ko) | 2006-05-18 |
JP2006119915A (ja) | 2006-05-11 |
US8332745B2 (en) | 2012-12-11 |
KR100834196B1 (ko) | 2008-05-30 |
JP4666996B2 (ja) | 2011-04-06 |
EP1650682A2 (en) | 2006-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100461173C (zh) | 电子归档系统和电子归档方法 | |
CN101361063B (zh) | 支持基于规则的文档内容挖掘的系统与方法 | |
CN101361059B (zh) | 支持在便携设备上显示内容的系统和方法 | |
US8869023B2 (en) | Conversion of a collection of data to a structured, printable and navigable format | |
RU2358311C2 (ru) | Документ текстовой обработки, хранящийся в едином файле xml, которым могут манипулировать приложения, понимающие язык xml | |
EP1376408B1 (en) | Extraction of information from structured documents | |
CN100367299C (zh) | 图像处理装置和图像处理方法 | |
US20200175268A1 (en) | Systems and methods for extracting and implementing document text according to predetermined formats | |
JP2001014303A (ja) | 文書管理装置 | |
KR20120051419A (ko) | 종속형 스타일 시트 규칙 추출 장치 및 방법 | |
JP4042830B2 (ja) | コンテンツ属性情報正規化方法、情報収集・サービス提供システム、並びにプログラム格納記録媒体 | |
JP4185175B2 (ja) | 構造化文書の表示方法 | |
CN109325217B (zh) | 一种文件转换方法、系统、装置及计算机可读存储介质 | |
US20060210171A1 (en) | Image processing apparatus | |
JP4934181B2 (ja) | 付加画像処理システム、画像形成装置及び付加画像追加方法 | |
JP2006065467A5 (zh) | ||
CN101231574A (zh) | 编辑和打印系统、编辑系统和方法 | |
Alarte et al. | Site-level web template extraction based on DOM analysis | |
CN101346715B (zh) | 处理标记文档的方法和设备 | |
Seki et al. | Information management system using structure analysis of paper/electronic documents and its applications | |
Salminen et al. | Usability evaluation of a structured document archive | |
JP3937944B2 (ja) | 構造化文書からの情報抽出方法及び装置及び情報抽出プログラム及びコンピュータ読み取り可能な記録媒体 | |
KR100673333B1 (ko) | Html 전자문서 변형기법을 기반으로 하는 북마크 자동형성방법 및 시스템 | |
Rehm | Language-independent text parsing of arbitrary html-documents. towards a foundation for web genre identification | |
Archer et al. | Capturing and reusing human attention in corporate decision making |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090211 Termination date: 20181021 |