CN116719839B - 会计档案的数据查询方法、装置和电子设备 - Google Patents
会计档案的数据查询方法、装置和电子设备 Download PDFInfo
- Publication number
- CN116719839B CN116719839B CN202311000920.9A CN202311000920A CN116719839B CN 116719839 B CN116719839 B CN 116719839B CN 202311000920 A CN202311000920 A CN 202311000920A CN 116719839 B CN116719839 B CN 116719839B
- Authority
- CN
- China
- Prior art keywords
- data
- dynamic field
- queried
- target
- basic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013507 mapping Methods 0.000 claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000011218 segmentation Effects 0.000 claims description 39
- 230000008520 organization Effects 0.000 claims description 29
- 238000001914 filtration Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013499 data model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种会计档案的数据查询方法、装置和电子设备,涉及数据处理的技术领域,包括:接收查询条件,并基于查询条件获取待查询动态字段的标签信息和基本信息;基于基本信息和标签信息在分布式搜索服务器中进行全文检索,得到与待查询动态字段相匹配的文档ID列表;分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系;根据文档ID列表在预设关系型数据库中检索待查询动态字段,得到待查询动态字段对应的目标业务数据。本发明方法采用分布式搜索服务器作为数据存储和检索引擎,缓解了直接在关系型数据库中查询动态字段所存在的效率低下的技术问题,提高了会计档案数据查询效率。
Description
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种会计档案的数据查询方法、装置和电子设备。
背景技术
会计档案系统平台通常需要接入各类第三方电子会计档案数据,如记账凭证、原始单据、银行电子回单、增值税发票等信息。一般一家企业的不同类型的电子会计档案数据一个会计期间有十几万到几十万条,整个会计年的数据量可能达到几百万甚至上千万条。
随着业务的发展,各种自定义的动态字段在业务组织中越来越常见,这些动态字段的数据存储方式一般采用关系型数据库,如MySQL等。然而,由于动态字段的数据结构不确定,所以查询时无法建立高效索引,导致会计档案数据查询效率低下,给业务组织带来了极大的困扰。
发明内容
本发明的目的在于提供一种会计档案的数据查询方法、装置和电子设备,以缓解直接在关系型数据库中查询动态字段所存在的效率低下的技术问题,提高了会计档案数据查询效率。
第一方面,本发明提供一种会计档案的数据查询方法,包括:接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息;其中,所述标签信息包括:所述待查询动态字段所属的业务组织信息和索引类别信息,所述基本信息包括:所述待查询动态字段的名称、取值和数据类型;基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,得到与所述待查询动态字段相匹配的文档ID列表;其中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,所述映射关系是动态字段的基本信息和其所属文档ID之间的映射;根据所述文档ID列表在预设关系型数据库中检索所述待查询动态字段,得到所述待查询动态字段对应的目标业务数据;其中,所述预设关系型数据库中预存有多个业务组织的业务数据。
在可选的实施方式中,所述基于所述查询条件获取待查询动态字段的标签信息和基本信息,包括:基于所述查询条件在所述关系型数据库中进行查询,得到待查询动态字段的标签信息和基本信息。
在可选的实施方式中,在基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索之前,所述方法还包括:将所述预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据;其中,所述目标业务组织表示所述多个业务组织中的任一业务组织;所述动态字段数据包括:动态字段的基本信息和其所属文档ID;基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,并将所述映射关系存入分布式搜索服务器;其中,所述目标索引类别表示所述多个索引类别中的任一索引类别。
在可选的实施方式中,基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,包括:对所述第一目标数据进行字符过滤处理,得到字符过滤后的第二目标数据;对所述第二目标数据的进行分词处理,得到分词后的第二目标数据;对所述分词后的第二目标数据进行词语过滤处理,得到词语过滤后的第三目标数据;基于所述第三目标数据创建目标索引类别下动态字段数据的映射关系。
在可选的实施方式中,基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,包括:基于所述待查询动态字段的标签信息从所述分布式搜索服务器中预存的多个映射关系中筛选出相应的目标映射关系;对所述待查询动态字段的基本信息进行分词处理,得到待查询的词语集合;基于所述词语集合在所述目标映射关系中进行检索,得到与所述待查询动态字段相匹配的文档ID列表。
在可选的实施方式中,所述键值对形式包括:JSON格式。
第二方面,本发明提供一种会计档案的数据查询装置,包括:接收和获取模块,用于接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息;其中,所述标签信息包括:所述待查询动态字段所属的业务组织信息和索引类别信息,所述基本信息包括:所述待查询动态字段的名称、取值和数据类型;第一检索模块,用于基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,得到与所述待查询动态字段相匹配的文档ID列表;其中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,所述映射关系是动态字段的基本信息和其所属文档ID之间的映射;第二检索模块,用于根据所述文档ID列表在预设关系型数据库中检索所述待查询动态字段,得到所述待查询动态字段对应的目标业务数据;其中,所述预设关系型数据库中预存有多个业务组织的业务数据。
在可选的实施方式中,所述装置还包括:转换模块,用于将所述预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据;其中,所述目标业务组织表示所述多个业务组织中的任一业务组织;所述动态字段数据包括:动态字段的基本信息和其所属文档ID;创建模块,用于基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,并将所述映射关系存入分布式搜索服务器;其中,所述目标索引类别表示所述多个索引类别中的任一索引类别。
在可选的实施方式中,所述创建模块具体用于:对所述第一目标数据进行字符过滤处理,得到字符过滤后的第二目标数据;对所述第二目标数据的进行分词处理,得到分词后的第二目标数据;对所述分词后的第二目标数据进行词语过滤处理,得到词语过滤后的第三目标数据;基于所述第三目标数据创建目标索引类别下动态字段数据的映射关系。
第三方面,本发明提供一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述实施方式中任一项所述的会计档案的数据查询方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现前述实施方式中任一项所述的会计档案的数据查询方法。
本发明提供了一种会计档案的数据查询方法,该方法将多个业务组织在多个索引类别下的动态字段数据的映射关系存入分布式搜索服务器中,且映射关系是动态字段的基本信息和其所属文档ID之间的映射,因此,在获取到待查询动态字段的标签信息和基本信息之后,首先利用分布式搜索服务器的全文检索功能进行查询,得到与其相匹配的文档ID列表,然后根据文档ID列表在预设关系型数据库中检索待查询动态字段,即可快速得到待查询动态字段对应的目标业务数据。本发明方法采用分布式搜索服务器作为数据存储和检索引擎,缓解了直接在关系型数据库中查询动态字段所存在的效率低下的技术问题,提高了会计档案数据查询效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种会计档案的数据查询方法的流程图;
图2为本发明实施例提供的一种基于第一目标数据创建目标索引类别下动态字段数据的映射关系的流程图;
图3为本发明实施例提供的一种会计档案的数据查询装置的功能模块图;
图4为本发明实施例提供的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
实施例一
图1为本发明实施例提供的一种会计档案的数据查询方法的流程图,如图1所示,该方法具体包括如下步骤:
步骤S102,接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息。
具体的,本发明实施例所提供的方法应用于会计档案平台,已知该平台中接入了多个业务组织的大量业务数据,大量业务数据存储在多个文档中,且属于每个业务组织的每条业务数据均对应一种索引类别,索引类别例如记账凭证、原始单据、银行电子回单、增值税发票等。因此,为了能够快速且准确的根据动态字段查询到所需要的目标业务数据,用户应提供待查询动态字段的标签信息和基本信息。其中,标签信息包括:待查询动态字段所属的业务组织信息和索引类别信息,基本信息包括:待查询动态字段的名称、取值和数据类型。
在一些实施例中,可以基于查询条件在关系型数据库中进行查询,得到待查询动态字段的标签信息和基本信息。
其中,这里的查询条件可以是关键字也可以是其他的用户输入的信息。由于针对动态字段的查询,查询条件可能也是不规整的,所以可以下先对查询条件进行一些特征提取,基于提取到的特征,确定待查询动态字段的标签信息和基本信息。
具体的,可以对查询条件进行字符过滤,得到第一特征数据,这里的字符过滤可以包括字符转换、删除标点以及编码等等,得到指定格式的第一特征数据,这里的指定格式可以根据实际需要确定。
对于第一特征数据,可以进行分词处理,基于分词结果进行特征丰富,得到第二特征数据。这里的分词处理可以是将第一特征数据按照预设的分词规则划分为多个数据段,对于每个数据段,可以提取该数据段的值、该数据段的属性等等作为该数据段对应的第二特征数据。
其中,在可以预设多种的分词规则,在进行分词处理之前,可以先基于第一特征数据进行匹配确定目标分词规则,然后基于目标分词规则对所述第一特征数据进行分词。这里的基于第一特征数据进行匹配可以包括先基于初始的第一分词规则进行第一次分词处理,得到第一分词结果,基于第一分词结果在关系型数据库中确定第一标签信息以及第一基本信息,基于第一标签信息以及第一基本信息确定目标分词规则,基于目标分词规则对所述第一特征数据进行第二次分词处理,得到第二分词结果,基于第二分词结果在关系型数据库中进行查询,得到待查询动态字段的标签信息和基本信息。
这里的基于分词结果在关系型数据库中进行查询,可以指进行特征丰富后再进行查询。
步骤S104,基于基本信息和标签信息在分布式搜索服务器中进行全文检索,得到与待查询动态字段相匹配的文档ID列表。
在本发明实施例中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,映射关系是动态字段的基本信息和其所属文档ID之间的映射。因此,获取到待查询动态字段的标签信息和基本信息之后,利用上述信息在分布式搜索服务器中进行全文检索,根据映射关系与基本信息和标签信息的匹配,即可查询到与待查询动态字段相匹配的文档ID列表。上述全文检索的功能可以通过分布式搜索服务器的Search API来实现。另外,还可以配置动态字段的查询条件,例如可以使用分布式搜索服务器的Nested查询或者Parent-Child查询。
步骤S106,根据文档ID列表在预设关系型数据库中检索待查询动态字段,得到待查询动态字段对应的目标业务数据。
在得到文档ID列表之后,就已经成功地将数据检索范围了进行了有效地缩小,因此,在预设关系型数据库(例如MySQL)中,按照确定的文档ID列表查找对应的文档,并从中检索待查询动态字段,将其合并到业务数据中返回,即可得到待查询动态字段对应的目标业务数据,其中,预设关系型数据库中预存有多个业务组织的业务数据。在本发明实施例中,每个业务组织将所有业务数据均存储到关系型数据库中,包括业务组织的基本信息和所有动态字段数据,每个业务组织都有相应的数据模型。因此本发明方法能够在提高查询效率的同时,还能保证查询结果的准确性和完整性。
为了便于理解,下面举例说明,某电商平台要在会计档案平台中存储发票信息,电商平台的基本信息即为上述业务组织信息,发票即为索引类型,发票信息中可以有各种自定义的动态属性,如名称、纳税人识别号、地址、电话、开户行及账号等等。电商平台可以将发票信息存储在关系型数据库的指定文档中,其中包括电商平台的基本信息和发票的所有动态属性的名称和值(也即,动态字段数据)。
本发明实施例提供了一种会计档案的数据查询方法,该方法将多个业务组织在多个索引类别下的动态字段数据的映射关系存入分布式搜索服务器中,且映射关系是动态字段的基本信息和其所属文档ID之间的映射,因此,在获取到待查询动态字段的标签信息和基本信息之后,首先利用分布式搜索服务器的全文检索功能进行查询,得到与其相匹配的文档ID列表,然后根据文档ID列表在预设关系型数据库中检索待查询动态字段,即可快速得到待查询动态字段对应的目标业务数据。本发明方法采用分布式搜索服务器作为数据存储和检索引擎,缓解了直接在关系型数据库中查询动态字段所存在的效率低下的技术问题,提高了会计档案数据查询效率。
在一个可选的实施方式中,在基于基本信息和标签信息在分布式搜索服务器中进行全文检索之前,本发明方法还包括如下步骤:
步骤S201,将预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据。
其中,目标业务组织表示多个业务组织中的任一业务组织;动态字段数据包括:动态字段的基本信息和其所属文档ID。
为了在分布式搜索服务器中构建动态字段数据的映射关系,本发明实施例首先将预设关系型数据库中属于目标业务组织的所有动态字段数据(包括每个字段的名称、取值、数据类型、所属文档ID等信息)提取出来,然后将其转换为键值对形式的第一目标数据,转换为键值对形式的目的是避免传统关系型数据库中需要为每个动态字段都新建一个字段的复杂性,提高数据存储的灵活性和可扩展性。
可选地,键值对形式包括:JSON格式,如果预设关系型数据库为MySQL,那么步骤S201可以使用MySQL的JSON_EXTRACT函数提取动态字段数据,从而将所有动态字段数据以JSON格式存储到分布式搜索服务器中。
步骤S202,基于第一目标数据创建目标索引类别下动态字段数据的映射关系,并将映射关系存入分布式搜索服务器。
其中,目标索引类别表示多个索引类别中的任一索引类别。
在得到第一目标数据之后,根据目标索引类别的条件设定以及映射关系所使用的数据内容,即可基于第一目标数据创建出目标索引类别下动态字段数据的映射关系。具体的,可选择使用分布式搜索服务器的Mapping API来创建目标索引类别下动态字段数据的映射关系,然后使用分布式搜索服务器的API将上述映射关系写入分布式搜索服务器中。在本发明实施例中,映射关系中需要定义每个动态字段的基本信息、其所属文档ID以及所属索引类型。
在一个可选的实施方式中,如图2所示,上述步骤S202,基于第一目标数据创建目标索引类别下动态字段数据的映射关系,具体包括如下步骤:
步骤S2021,对第一目标数据进行字符过滤处理,得到字符过滤后的第二目标数据。
具体的,为了节省存储空间和提高搜索效率,在利用第一目标数据构建映射关系时,还需要依次对其进行字符过滤和词语过滤处理。具体的,分布式搜索服务器提供了多种字符过滤器(Character Filter),例如HTML Strip、Mapping、Pattern Replace等,因此,在本发明实施例中,可以使用分布式搜索服务器的字符过滤器对键值对形式的第一目标数据进行字符过滤处理,例如,转换字符编码、删除标点符号等,从而得到字符过滤后的第二目标数据。
步骤S2022,对第二目标数据的进行分词处理,得到分词后的第二目标数据。
本发明实施例不对分词处理时所使用的分词器类型进行具体限定,可以预置多种类型的分词器,然后根据具体的业务场景来进行自适应选择。例如,对于商品名称可以使用中文分词器,对于颜色属性可以使用keyword类型不分词。
步骤S2023,对分词后的第二目标数据进行词语过滤处理,得到词语过滤后的第三目标数据。
在得到分词后的第二目标数据之后,本发明实施例进一步使用词语过滤器对其进行词语过滤处理,例如将单词转换为同义词、对单词进行大小写转换、删除停用词、对单词进行还原(stemming)等,从而得到词语过滤后的第三目标数据。
步骤S2024,基于第三目标数据创建目标索引类别下动态字段数据的映射关系。
参照上述方法对每个业务组织的业务数据进行处理,即可得到多个业务组织在多个索引类别下的动态字段数据的映射关系,然后存入分布式搜索服务器中。本发明实施例采用了分布式搜索服务器的分词算法分词建立索引,有效地提高了数据检索效率,可以根据用户的查询条件实现快速查阅。
在一个可选的实施方式中,上述步骤S104,基于基本信息和标签信息在分布式搜索服务器中进行全文检索,具体包括如下步骤:
步骤S1041,基于待查询动态字段的标签信息从分布式搜索服务器中预存的多个映射关系中筛选出相应的目标映射关系。
步骤S1042,对待查询动态字段的基本信息进行分词处理,得到待查询的词语集合。
步骤S1043,基于词语集合在目标映射关系中进行检索,得到与待查询动态字段相匹配的文档ID列表。
具体的,在使用分布式搜索服务器进行检索时,首先可利用待查询动态字段的标签信息,将检索范围从所有业务组织在多个索引类别下的映射关系,缩小至待查询动态字段的标签信息所指向的业务组织的指定索引类别下的目标映射关系。
为了实现更高效以及更准确地匹配,可以根据待查询动态字段的具体业务场景选择合适的分词器,并利用分词器对待查询动态字段的基本信息进行分词处理,从而得到待查询的词语集合。然后利用词语集合在目标映射关系中进行检索,即可得到与待查询动态字段相匹配的文档ID列表。
本发明实施例所提供的方法采用分布式搜索服务器作为数据存储和检索引擎,并通过其分词算法进行分词建立索引,大大提高了动态字段的检索效率。同时,采用分布式搜索服务器的搜索功能进行查询,避免了使用MySQL查询语句,进一步提高了查询效率。当业务组织中新增动态字段时,只需要在分布式搜索服务器中新增相应的字段,然后重新建立索引即可,不需要对原有系统进行修改,具有良好的可扩展性,且有效减少了系统维护所需的工作量。通过本发明实施例所提供的方法,用户可以更加快速、准确地检索业务组织中的动态字段,提高了用户的使用体验。
实施例二
本发明实施例还提供了一种会计档案的数据查询装置,该装置主要用于执行上述实施例一所提供的会计档案的数据查询方法,以下对本发明实施例提供的会计档案的数据查询装置做具体介绍。
图3是本发明实施例提供的一种会计档案的数据查询装置的功能模块图,如图3所示,该装置主要包括:接收和获取模块10,第一检索模块20,第二检索模块30,其中:
接收和获取模块10,用于接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息;其中,标签信息包括:待查询动态字段所属的业务组织信息和索引类别信息,基本信息包括:待查询动态字段的名称、取值和数据类型。
第一检索模块20,用于基于基本信息和标签信息在分布式搜索服务器中进行全文检索,得到与待查询动态字段相匹配的文档ID列表;其中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,映射关系是动态字段的基本信息和其所属文档ID之间的映射。
第二检索模块30,用于根据文档ID列表在预设关系型数据库中检索待查询动态字段,得到待查询动态字段对应的目标业务数据;其中,预设关系型数据库中预存有多个业务组织的业务数据。
本发明实施例提供了一种会计档案的数据查询装置,该装置将多个业务组织在多个索引类别下的动态字段数据的映射关系存入分布式搜索服务器中,且映射关系是动态字段的基本信息和其所属文档ID之间的映射,因此,在获取到待查询动态字段的标签信息和基本信息之后,首先利用分布式搜索服务器的全文检索功能进行查询,得到与其相匹配的文档ID列表,然后根据文档ID列表在预设关系型数据库中检索待查询动态字段,即可快速得到待查询动态字段对应的目标业务数据。本发明装置采用分布式搜索服务器作为数据存储和检索引擎,缓解了直接在关系型数据库中查询动态字段所存在的效率低下的技术问题,提高了会计档案数据查询效率。
可选地,接收和获取模块10具体用于:基于查询条件在关系型数据库中进行查询,得到待查询动态字段的标签信息和基本信息。
可选地,装置还包括:
转换模块,用于将预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据;其中,目标业务组织表示多个业务组织中的任一业务组织;动态字段数据包括:动态字段的基本信息和其所属文档ID。
创建模块,用于基于第一目标数据创建目标索引类别下动态字段数据的映射关系,并将映射关系存入分布式搜索服务器;其中,目标索引类别表示多个索引类别中的任一索引类别。
可选地,创建模块具体用于:
对第一目标数据进行字符过滤处理,得到字符过滤后的第二目标数据。
对第二目标数据的进行分词处理,得到分词后的第二目标数据。
对分词后的第二目标数据进行词语过滤处理,得到词语过滤后的第三目标数据。
基于第三目标数据创建目标索引类别下动态字段数据的映射关系。
可选地,所述第一检索模块20具体用于:
基于待查询动态字段的标签信息从分布式搜索服务器中预存的多个映射关系中筛选出相应的目标映射关系。
对待查询动态字段的基本信息进行分词处理,得到待查询的词语集合。
基于词语集合在目标映射关系中进行检索,得到与待查询动态字段相匹配的文档ID列表。
可选地,键值对形式包括:JSON格式。
实施例三
参见图4,本发明实施例提供了一种电子设备,该电子设备包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的一种会计档案的数据查询方法、装置和电子设备的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
此外,术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (7)
1.一种会计档案的数据查询方法,其特征在于,包括:
接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息;其中,所述标签信息包括:所述待查询动态字段所属的业务组织信息和索引类别信息,所述基本信息包括:所述待查询动态字段的名称、取值和数据类型;所述索引类别包括以下其中一种:记账凭证,原始单据,银行电子回单,增值税发票;
基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,得到与所述待查询动态字段相匹配的文档ID列表;其中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,所述映射关系是动态字段的基本信息和其所属文档ID之间的映射;
根据所述文档ID列表在预设关系型数据库中检索所述待查询动态字段,得到所述待查询动态字段对应的目标业务数据;其中,所述预设关系型数据库中预存有多个业务组织的业务数据;
其中,基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,包括:
基于所述待查询动态字段的标签信息从所述分布式搜索服务器中预存的多个映射关系中筛选出相应的目标映射关系;
对所述待查询动态字段的基本信息进行分词处理,得到待查询的词语集合;
基于所述词语集合在所述目标映射关系中进行检索,得到与所述待查询动态字段相匹配的文档ID列表;
其中,在基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索之前,所述方法还包括:
将所述预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据;其中,所述目标业务组织表示所述多个业务组织中的任一业务组织;所述动态字段数据包括:动态字段的基本信息和其所属文档ID;
基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,并将所述映射关系存入分布式搜索服务器;其中,所述目标索引类别表示所述多个索引类别中的任一索引类别。
2.根据权利要求1所述的会计档案的数据查询方法,其特征在于,所述基于所述查询条件获取待查询动态字段的标签信息和基本信息,包括:
基于所述查询条件在所述关系型数据库中进行查询,得到待查询动态字段的标签信息和基本信息。
3.根据权利要求1所述的会计档案的数据查询方法,其特征在于,基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,包括:
对所述第一目标数据进行字符过滤处理,得到字符过滤后的第二目标数据;
对所述第二目标数据的进行分词处理,得到分词后的第二目标数据;
对所述分词后的第二目标数据进行词语过滤处理,得到词语过滤后的第三目标数据;
基于所述第三目标数据创建目标索引类别下动态字段数据的映射关系。
4.根据权利要求3所述的会计档案的数据查询方法,其特征在于,所述键值对形式包括:JSON格式。
5.一种会计档案的数据查询装置,其特征在于,包括:
接收和获取模块,用于接收查询条件,并基于所述查询条件获取待查询动态字段的标签信息和基本信息;其中,所述标签信息包括:所述待查询动态字段所属的业务组织信息和索引类别信息,所述基本信息包括:所述待查询动态字段的名称、取值和数据类型;所述索引类别包括以下其中一种:记账凭证,原始单据,银行电子回单,增值税发票;
第一检索模块,用于基于所述基本信息和所述标签信息在分布式搜索服务器中进行全文检索,得到与所述待查询动态字段相匹配的文档ID列表;其中,分布式搜索服务器中预存有多个业务组织在多个索引类别下的动态字段数据的映射关系,所述映射关系是动态字段的基本信息和其所属文档ID之间的映射;
第二检索模块,用于根据所述文档ID列表在预设关系型数据库中检索所述待查询动态字段,得到所述待查询动态字段对应的目标业务数据;其中,所述预设关系型数据库中预存有多个业务组织的业务数据;
其中,所述第一检索模块具体用于:
基于所述待查询动态字段的标签信息从所述分布式搜索服务器中预存的多个映射关系中筛选出相应的目标映射关系;
对所述待查询动态字段的基本信息进行分词处理,得到待查询的词语集合;
基于所述词语集合在所述目标映射关系中进行检索,得到与所述待查询动态字段相匹配的文档ID列表;
其中,所述装置还包括:
转换模块,用于将所述预设关系型数据库中属于目标业务组织的所有动态字段数据转换为键值对形式的第一目标数据;其中,所述目标业务组织表示所述多个业务组织中的任一业务组织;所述动态字段数据包括:动态字段的基本信息和其所属文档ID;
创建模块,用于基于所述第一目标数据创建目标索引类别下动态字段数据的映射关系,并将所述映射关系存入分布式搜索服务器;其中,所述目标索引类别表示所述多个索引类别中的任一索引类别。
6.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的会计档案的数据查询方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现权利要求1至4中任一项所述的会计档案的数据查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311000920.9A CN116719839B (zh) | 2023-08-10 | 2023-08-10 | 会计档案的数据查询方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311000920.9A CN116719839B (zh) | 2023-08-10 | 2023-08-10 | 会计档案的数据查询方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116719839A CN116719839A (zh) | 2023-09-08 |
CN116719839B true CN116719839B (zh) | 2024-01-26 |
Family
ID=87872004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311000920.9A Active CN116719839B (zh) | 2023-08-10 | 2023-08-10 | 会计档案的数据查询方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116719839B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365914A (zh) * | 2012-04-10 | 2013-10-23 | 北京易盟天地信息技术有限公司 | 基于搜索引擎的数据库查询系统和方法 |
CN106294695A (zh) * | 2016-08-08 | 2017-01-04 | 深圳市网安计算机安全检测技术有限公司 | 一种面向实时大数据搜索引擎的实现方法 |
CN108228743A (zh) * | 2017-12-18 | 2018-06-29 | 深圳供电局有限公司 | 一种实时大数据搜索引擎系统 |
CN111026710A (zh) * | 2019-12-11 | 2020-04-17 | 华南师范大学 | 一种数据集的检索方法及系统 |
CN111104437A (zh) * | 2018-10-09 | 2020-05-05 | 哈尔滨工业大学 | 基于对象模型的试验数据统一检索方法和系统 |
CN112163207A (zh) * | 2020-10-30 | 2021-01-01 | 平安数字信息科技(深圳)有限公司 | 基于动态权限的业务数据查询方法及相关设备 |
CN114064851A (zh) * | 2021-10-19 | 2022-02-18 | 中国人民解放军31511部队 | 一种政府办公文档多机检索方法及系统 |
CN114138830A (zh) * | 2021-11-15 | 2022-03-04 | 紫金诚征信有限公司 | 一种大数据海量数据秒级查询方法、装置及计算机介质 |
US11561948B1 (en) * | 2021-03-01 | 2023-01-24 | Era Software, Inc. | Database indexing using structure-preserving dimensionality reduction to accelerate database operations |
CN115757517A (zh) * | 2022-11-18 | 2023-03-07 | 中国建设银行股份有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7836083B2 (en) * | 2004-02-20 | 2010-11-16 | Factiva, Inc. | Intelligent search and retrieval system and method |
-
2023
- 2023-08-10 CN CN202311000920.9A patent/CN116719839B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365914A (zh) * | 2012-04-10 | 2013-10-23 | 北京易盟天地信息技术有限公司 | 基于搜索引擎的数据库查询系统和方法 |
CN106294695A (zh) * | 2016-08-08 | 2017-01-04 | 深圳市网安计算机安全检测技术有限公司 | 一种面向实时大数据搜索引擎的实现方法 |
CN108228743A (zh) * | 2017-12-18 | 2018-06-29 | 深圳供电局有限公司 | 一种实时大数据搜索引擎系统 |
CN111104437A (zh) * | 2018-10-09 | 2020-05-05 | 哈尔滨工业大学 | 基于对象模型的试验数据统一检索方法和系统 |
CN111026710A (zh) * | 2019-12-11 | 2020-04-17 | 华南师范大学 | 一种数据集的检索方法及系统 |
CN112163207A (zh) * | 2020-10-30 | 2021-01-01 | 平安数字信息科技(深圳)有限公司 | 基于动态权限的业务数据查询方法及相关设备 |
US11561948B1 (en) * | 2021-03-01 | 2023-01-24 | Era Software, Inc. | Database indexing using structure-preserving dimensionality reduction to accelerate database operations |
CN114064851A (zh) * | 2021-10-19 | 2022-02-18 | 中国人民解放军31511部队 | 一种政府办公文档多机检索方法及系统 |
CN114138830A (zh) * | 2021-11-15 | 2022-03-04 | 紫金诚征信有限公司 | 一种大数据海量数据秒级查询方法、装置及计算机介质 |
CN115757517A (zh) * | 2022-11-18 | 2023-03-07 | 中国建设银行股份有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116719839A (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49576E1 (en) | Standard exact clause detection | |
US10614528B2 (en) | System and method for automatic generation of reports based on electronic documents | |
CN110765770B (zh) | 一种合同自动生成方法及装置 | |
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
CN111352907A (zh) | 流水文件解析方法、装置、计算机设备和存储介质 | |
CN111209411B (zh) | 一种文档分析的方法及装置 | |
CN112149387A (zh) | 财务数据的可视化方法、装置、计算机设备及存储介质 | |
CN116189215A (zh) | 自动审核方法、装置、电子设备及存储介质 | |
CN116719839B (zh) | 会计档案的数据查询方法、装置和电子设备 | |
CN111694928A (zh) | 数据指标推荐方法、装置、计算机设备及可读存储介质 | |
CN115294586A (zh) | 一种识别发票的方法、装置、存储介质及电子设备 | |
JP2020502687A (ja) | 特許クレームにおける参照を特定するためのシステム及び方法 | |
US11482027B2 (en) | Automated extraction of performance segments and metadata values associated with the performance segments from contract documents | |
US9251253B2 (en) | Expeditious citation indexing | |
CN111178072A (zh) | 一种法律条文的确定方法、装置及存储介质 | |
CN111125225A (zh) | 账单数据解析方法、装置及服务器 | |
CN118312531B (zh) | 查询语言生成方法、系统、电子设备及存储介质 | |
CN111061863B (zh) | 期刊目录展示方法、装置及设备 | |
CN115878879A (zh) | 搜索引擎数据处理方法及装置 | |
CN118585540A (zh) | 数据结算方法、装置、设备、存储介质及产品 | |
CN115375479A (zh) | 交易类型的确定方法、装置及服务器 | |
CN118093513A (zh) | 一种车辆档案集成管理方法、装置、设备及介质 | |
CN117668075A (zh) | 一种数据元生成方法、装置、设备及存储介质 | |
CN116932781A (zh) | 一种基于ac自动机的企业信息匹配方法与系统 | |
CN114676245A (zh) | 上位政策提取方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |