CN111784490A - 具备界面检索及人机交互的财务数据处理系统 - Google Patents

具备界面检索及人机交互的财务数据处理系统 Download PDF

Info

Publication number
CN111784490A
CN111784490A CN202010610103.5A CN202010610103A CN111784490A CN 111784490 A CN111784490 A CN 111784490A CN 202010610103 A CN202010610103 A CN 202010610103A CN 111784490 A CN111784490 A CN 111784490A
Authority
CN
China
Prior art keywords
retrieval
data
financial
module
management database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010610103.5A
Other languages
English (en)
Inventor
郑斌斌
牛伟山
焦伟红
马宪超
朱兵
杨奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Polytechnic Institute
Original Assignee
Henan Polytechnic Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Polytechnic Institute filed Critical Henan Polytechnic Institute
Priority to CN202010610103.5A priority Critical patent/CN111784490A/zh
Publication of CN111784490A publication Critical patent/CN111784490A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种具备界面检索及人机交互的财务数据处理系统,涉及财务数据处理技术领域。本发明通过中央处理单元对各种财务数据库中的数据信息进行处理,实现工资管理数据、报表管理数据、出纳管理数据、审计管理数据、业务管理数据以及账务管理数据等多种数据库的数据处理,使得大量的账务管理数据信息能够在几秒的时间快速实现数据处理,输出较为准确度的目标数据库;本发明通过在LCD显示屏上应用了检索算法,提高了检索时间,并通过采用人脸识别单元、语音识别单元和手势识别单元等多信息人机交互,实现财务数据的快速检索、查询和应用。

Description

具备界面检索及人机交互的财务数据处理系统
技术领域
本发明涉及财务数据处理技术领域,且更具体地涉及一种具备界面检索及人机交互的财务数据处理系统。
背景技术
会计数据处理系统是完成会计数据的收集、存储、传输和加工处理,最终输出会计信息,最终由设备、人员、会计方法、会计制度和会计程序等构成有机整体。该系统以会计数据作为输入,经过若干加工处理的环节之后,能够使用户快捷地获取相关财务数据信息。由于现有技术中的财务数据量繁多,在用户进行数据检索时,大多通过常规的鼠标、键盘等方式进行输出,随着人机交互技术水平的发展,传统的人机交互技术水平已经很难满足现有财务系统的发展。人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。在现有技术中,在进行财务数据检索和人机交互方面比较滞后,难以满足现有技术的发展需要。
发明内容
针对现有技术的不足,本发明公开一种具备界面检索及人机交互的财务数据处理系统及方法,能够实现不同种类财务大数据的处理,并通过多种方式实现财务数据的人机交互和界面检索。
本发明采用以下技术方案:
一种具备界面检索及人机交互的财务数据处理系统,其中所述系统包括:
中央处理单元,其内设置有处理器,用于采集、存储、计算并传递财务数据;所述处理器为云端处理器或计算机处理器,所述云端处理器的硬件配置为Intel XeonE3-1220v53.0GHz,内核为四核,内存为8GDDR4,硬盘为1*Intel企业级SSD,1*SATA 1T,网卡为2*千兆网口;工作机节点的硬件CPU型号为Intel Xeon E53.0GHZ,所述工作机节点的内存为8GB,硬盘容量为1TB,所述计算机处理器的型号为Intel(R)Core(TM)i7-3770CPU@3.40GHz,内存为160GB;
存储单元,用于存储各种类型的财务数据,其内设置有各种财务数据库,所述财务数据库包括工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库,其中所述工资管理数据库用于存储员工工资信息,报表管理数据库用于存储业务报表,出纳管理数据库用于存储现金、银行日记账、资金日报表或支票管理,审计管理数据库用于存储账务业务的数据信息,业务管理数据库用于存储客户档案、仓库统计信息或者核算信息,账务管理数据库用于存储凭证数据信息、账薄数据信息、期末数据信息、数据金额信息或者外币核算信息,其中数据类型为DB2数据库、oracle数据库、Informix数据库、Sybase数据库、SQL Server数据库、PostgreSQL数据库或者MySQL数据库;
人机交互单元,其连接有显示屏,并且所述人机交互单元还设置有无线通信接口,其中所述无线通信接口包括RS485通信接口、RS232通信接口、红外通信接口、载波通信接口、TCP/IP通信接口、ZigBee无线通信接口、GPRS通信接口、CDMA无线通讯或蓝牙通信接口;所述显示屏为触摸式LCD显示屏;
数据检索模块,其设置有检索引擎,所述检索引擎至少包括全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,所述检索引擎还包括文本检索引擎、关键词检索引擎和信息特征检索引擎;所述数据检索模块外壳设置有USB接口、RS232接口和Interne网络接口;
数据处理模块;用于将各种财务数据进行数据处理,所述数据处理模型包括分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块,将各种复杂财务数据简易化处理;
其中所述中央处理单元分别与存储单元、人机交互单元、数据检索模块和数据处理模块连接,所述存储单元将数据库的输出端与数据处理模块的输入端连接,所述存储单元与所述人机交互单元双向连接,所述人机交互单元的输出端与所述数据检索模块的输入端连接,所述数据处理模块的输出端与所述数据检索模块的输入端连接,通过所述数据检索模块和人机交互单元,实现财务数据的检索。
进一步地,所述人机交互单元还包括CPU处理单元和与所述CPU处理单元连接的人脸识别单元、语音识别单元和手势识别单元。
进一步地,所述数据检索模块包括检索条件输入模块和检索结果生成模块,其中所述检索条件输入模块的输出端与所述检索结果生成模块的输入端连接。
本发明还提供以下技术方案:
一种具备界面检索及人机交互的财务数据处理方法,其中所述方法包括:
(1)数据获取:通过数据库获取工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库的数据信息;
(2)数据处理、计算:对获取的各种财务数据进行处理,通过数据的计算和处理,实现复杂数据的简易化处理,在进行数据处理时,利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块实现数据的计算和处理,以实现各种复杂财务数据的简易处理,降低大数据的信息纬度,以便进行数据查询;
(3)数据检索:通过数据检索模块发出检索请求,请求的内容为全文检索、关键词检索、全文检索、信息特征检索、信息垂直搜索检索、目录检索、数据关联性检索、数据相互性检索、数据分类检索、故障数据检索、一级分类或者二级分类检索或数据融合检索,检索条件输入模块输入检索信息,通过检索结果生成模块输出检索请求,进而快速从多种财务数据库信息检索出目标数据信息;
(4)数据交互:通过人机交互单元实现数据信息的交互。
进一步地,所述数据检索的方法为:
(1)接收中央处理单元发出的检索请求,执行检索命令;
(2)根据检索请求执行财务大数据计算方法,通过数据处理模块对财务大数据进行计算和处理;数据处理模块输出结果为利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块输出的不同类型的数据;
(3)转换检索请求语言,使得数据检索模块能够快速地识别转换后的检索请求语言,以简易化检索条件,其中包括分词处理、语义解析或关键词拆分;
(4)执行检索命令,通过人机交互单元执行检索命令,并通过显示屏显示检索结果。
进一步地,所述检索条件包括独立工作或者互相配合工作的第一检索条件、第二检索条件和第三检索条件,其中互相配合的方法为第一检索条件配合第二检索条件进行工作、第二检索条件配合第三检索条件进行工作或者第一检索条件配合第三检索条件进行工作。
进一步地,所述第一检索条件的检索方法为:启动分类算法模块,对财务大数据进行分类,将分类结果按照本文标签进行标注,检索时,对本文标签的关键词进行分词处理,获取不同的检索关键词,其中分类算法模型的工作方法包括以下步骤:
(1)从多个财务数据库中选择k个对象作为初始聚类中心,数据集合为X={xm|m=1,2,...,M},假设财务数据库中存在d个不同分类属性,则有A1,A2,...,Ad个不同的维度;
(2)计算每个聚类对象到聚类中心的距离来划分分类属性,如果数据xi和数据xj之间的相似度通过距离公式来计算,xi和xj之间的距离越小,样本xi和xj越相似,xi和xj之间的距离越大,样本xi和xj相差越远;所述距离公式为:
Figure BDA0002560692360000051
(3)再次计算每个聚类中心,通过反复计算,将每个聚类中的样本均值作为新的聚类中心,重复步骤(2);
(4)输出分类结果,其中每一种分类结果用一种文本标签进行标注。
进一步地,所述第二检索条件的检索方法为:启动关联算法模型,对财务大数据之间的关系进行计算,每种计算结果输出的数据关系利用分割符隔开,在检索时,通过分隔符检索财务大数据之间存在关联的数据;其中关联算法模型的工作方法为:
假设待划分属性的财务大数据集为d,假设将工资管理数据库类型的属性类别划分为集合C,其中C={c1,c2,...,cm},其中第i分类属性满足这样的条件:1≤i≤m,对于待分类的研发人员工资数据类型集合d,其输出的最大类别为P(ci/d),则有:
Figure BDA0002560692360000052
其中C、D表示为随机变量,则待分类的研发人员工资数据d的贝叶斯分类公式为:
Figure BDA0002560692360000053
然后按照公式(1)和(2)依次对报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库中的数据信息进行分类,每种类别用分割符隔开,在检索时,利用分割符检索规则进行检索。
进一步地,所述第三检索条件的检索方法为正向最大匹配法、逆向最大匹配法或双向最大匹配法,最终将标注报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库信息的文本信息输出不同的词组,通过词组实现不同财务数据的检索。
进一步地,人机交互单元工作的方法为:所述中央处理单元将数据处理模块最后输出的数据信息传递到数据检索模块和人机交互单元,所述人机交互单元通过语音识别单元实现语音识别,通过语音人机交互,通过手势识别单元通过人体肢体语言实现肢体解读,通过肢体交互。
积极有益效果:
1、本发明通过中央处理单元对各种财务数据库中的数据信息进行处理,实现工资管理数据、报表管理数据、出纳管理数据、审计管理数据、业务管理数据以及账务管理数据等多种数据库的数据处理,使得大量的账务管理数据信息能够在几秒的时间快速实现数据处理,输出较为准确度的目标数据库;
2、本发明通过在LCD显示屏上应用了检索算法,通过搜索算法,实现了目标数据的最快检索,检索时间仅仅为几秒的时间;
3、本发明在采用人机交互时,其采用的方案为人脸识别单元、语音识别单元和手势识别单元等多种识别方案,通过不同的方式实现多信息人机交互。
4、本发明将数据融合算法、检索算法和人机交互方法融入到了财务数据处理系统中,实现了财务数据的快速检索、查询和应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种具备界面检索及人机交互的财务数据处理系统的架构示意图;
图2为本发明一种具备界面检索及人机交互的财务数据处理系统中人机交互单元的架构示意图;
图3为本发明一种具备界面检索及人机交互的财务数据处理方法的流程示意图;
图4为本发明一种具备界面检索及人机交互的财务数据处理方法中检索算法的流程示意图;
图5为本发明一种具备界面检索及人机交互的财务数据处理方法中聚类算法的流程示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例(1)系统
如图1-图2所示,一种具备界面检索及人机交互的财务数据处理系统,其中所述系统包括:
中央处理单元,其内设置有处理器,用于采集、存储、计算并传递财务数据;所述处理器为云端处理器或计算机处理器,所述云端处理器的硬件配置为Intel Xeon E3-1220v53.0GHz,内核为四核,内存为8GDDR4,硬盘为1*Intel企业级SSD,1*SATA 1T,网卡为2*千兆网口;工作机节点的硬件CPU型号为Intel Xeon E53.0GHZ,所述工作机节点的内存为8GB,硬盘容量为1TB,所述计算机处理器的型号为Intel(R)Core(TM)i7-3770CPU@3.40GHz,内存为160GB;
存储单元,用于存储各种类型的财务数据,其内设置有各种财务数据库,所述财务数据库包括工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库,其中所述工资管理数据库用于存储员工工资信息,报表管理数据库用于存储业务报表,出纳管理数据库用于存储现金、银行日记账、资金日报表或支票管理,审计管理数据库用于存储账务业务的数据信息,业务管理数据库用于存储客户档案、仓库统计信息或者核算信息,账务管理数据库用于存储凭证数据信息、账薄数据信息、期末数据信息、数据金额信息或者外币核算信息,其中数据类型为DB2数据库、oracle数据库、Informix数据库、Sybase数据库、SQL Server数据库、PostgreSQL数据库或者MySQL数据库;
人机交互单元,其连接有显示屏,并且所述人机交互单元还设置有无线通信接口,其中所述无线通信接口包括RS485通信接口、RS232通信接口、红外通信接口、载波通信接口、TCP/IP通信接口、ZigBee无线通信接口、GPRS通信接口、CDMA无线通讯或蓝牙通信接口;所述显示屏为触摸式LCD显示屏;
数据检索模块,其设置有检索引擎,所述检索引擎至少包括全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,所述检索引擎还包括文本检索引擎、关键词检索引擎和信息特征检索引擎;所述数据检索模块外壳设置有USB接口、RS232接口和Interne网络接口;
数据处理模块;用于将各种财务数据进行数据处理,所述数据处理模型包括分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块,将各种复杂财务数据简易化处理;
其中所述中央处理单元分别与存储单元、人机交互单元、数据检索模块和数据处理模块连接,所述存储单元将数据库的输出端与数据处理模块的输入端连接,所述存储单元与所述人机交互单元双向连接,所述人机交互单元的输出端与所述数据检索模块的输入端连接,所述数据处理模块的输出端与所述数据检索模块的输入端连接,通过所述数据检索模块和人机交互单元,实现财务数据的检索。
实施例(2)方法
如图3-图5所示,一种具备界面检索及人机交互的财务数据处理方法,其中所述方法包括:
(1)数据获取:通过数据库获取工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库的数据信息;
(2)数据处理、计算:对获取的各种财务数据进行处理,通过数据的计算和处理,实现复杂数据的简易化处理,在进行数据处理时,利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块实现数据的计算和处理,以实现各种复杂财务数据的简易处理,降低大数据的信息纬度,以便进行数据查询;
(3)数据检索:通过数据检索模块发出检索请求,请求的内容为全文检索、关键词检索、全文检索、信息特征检索、信息垂直搜索检索、目录检索、数据关联性检索、数据相互性检索、数据分类检索、故障数据检索、一级分类或者二级分类检索或数据融合检索,检索条件输入模块输入检索信息,通过检索结果生成模块输出检索请求,进而快速从多种财务数据库信息检索出目标数据信息;
(4)数据交互:通过人机交互单元实现数据信息的交互。
在本发明进一步的实施例中,所述数据检索的方法为:
(1)接收中央处理单元发出的检索请求,执行检索命令;
(2)根据检索请求执行财务大数据计算方法,通过数据处理模块对财务大数据进行计算和处理;数据处理模块输出结果为利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块输出的不同类型的数据;
(3)转换检索请求语言,使得数据检索模块能够快速地识别转换后的检索请求语言,以简易化检索条件,其中包括分词处理、语义解析或关键词拆分;
(4)执行检索命令,通过人机交互单元执行检索命令,并通过显示屏显示检索结果。
在本发明进一步的实施例中,所述检索条件包括独立工作或者互相配合工作的第一检索条件、第二检索条件和第三检索条件,其中互相配合的方法为第一检索条件配合第二检索条件进行工作、第二检索条件配合第三检索条件进行工作或者第一检索条件配合第三检索条件进行工作。
在本发明进一步的实施例中,所述第一检索条件的检索方法为:启动分类算法模块,对财务大数据进行分类,将分类结果按照本文标签进行标注,检索时,对本文标签的关键词进行分词处理,获取不同的检索关键词,其中分类算法模型的工作方法包括以下步骤:
(1)从多个财务数据库中选择k个对象作为初始聚类中心,数据集合为X={xm|m=1,2,...,M},假设财务数据库中存在d个不同分类属性,则有A1,A2,...,Ad个不同的维度;
(2)计算每个聚类对象到聚类中心的距离来划分分类属性,如果数据xi和数据xj之间的相似度通过距离公式来计算,xi和xj之间的距离越小,样本xi和xj越相似,xi和xj之间的距离越大,样本xi和xj相差越远;所述距离公式为:
Figure BDA0002560692360000101
(3)再次计算每个聚类中心,通过反复计算,将每个聚类中的样本均值作为新的聚类中心,重复步骤(2);
(4)输出分类结果,其中每一种分类结果用一种文本标签进行标注。
第一检索条件的应用范围比较宽,也可以采用直接对决策树或者随机森林算法输出的数据进行计算,决策树是一种基本的分类方法,也可以用于回归,当出现的数据信息计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理逻辑回归等不能解决的非线性特征数据,这需要进行特征选择,在执行该操作时,选取对训练数据具有分类能力的特征。这样可以提高决策树学习的效率,如果利用一个特征进行分类的结果与随机分类的结果没有很大差别,则称这个特征是没有分类能力的。随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。利用相同的训练数搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。
在本发明进一步的实施例中,所述第二检索条件的检索方法为:启动关联算法模型,对财务大数据之间的关系进行计算,每种计算结果输出的数据关系利用分割符隔开,在检索时,通过分隔符检索财务大数据之间存在关联的数据;其中关联算法模型的工作方法为:
假设待划分属性的财务大数据集为d,假设将工资管理数据库类型的属性类别划分为集合C,其中C={c1,c2,...,cm},其中第i分类属性满足这样的条件:1≤i≤m,对于待分类的研发人员工资数据类型集合d,其输出的最大类别为P(ci/d),则有:
Figure BDA0002560692360000111
其中C、D表示为随机变量,则待分类的研发人员工资数据d的贝叶斯分类公式为:
Figure BDA0002560692360000112
然后按照公式(1)和(2)依次对报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库中的数据信息进行分类,每种类别用分割符隔开,在检索时,利用分割符检索规则进行检索。在进行分隔符使用,为了让搜索引擎能够正确识别以英文形式命名的URL中的关键字,需要使用相应的符号对词组之间的单词进行分隔,常见的分隔符包括:空格″″、横杠″-″、下划线″″、逗号″,″及加号″+″等。除了使用特定的个、符号作为分隔符外,还可以使用其他的方式来表达单词间的分隔意义,如将每个单词的第一个字母设为大写。但这种方式只方便普通用户识别,对于搜索引擎来说却是无效的,因为搜索引擎并不区分单词间的字母大小写。在进行导出成文本文件时,将网格中单元格的格串导出到文本文件中,列间的分隔符是tab键,行间的分隔符为换行符。导出文本文件分隔符、tab键、换行符等。
在本发明进一步的实施例中,所述第三检索条件的检索方法为正向最大匹配法、逆向最大匹配法或双向最大匹配法,最终将标注报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库信息的文本信息输出不同的词组,通过词组实现不同财务数据的检索。
其中在应用正向最大匹配算法时,从左到右将待分词文本中的几个连续字符与词表匹配,如果匹配上,则切分出一个词。但这里有一个问题:要做到最大匹配,并不是第一次匹配到就可以切分的。在进行使用时,正向即从前往后取词,从7->1,每次减一个字,直到词典命中或剩下1个单字。逆向即从后往前取词,其他逻辑和正向相同
双向最大匹配法就是在正向最大匹配算法、逆向最大匹配法两种算法都切一遍,然后根据大颗粒度词越多越好,非词典词和单字词越少越好的原则,选取其中一种分词结果输出。
在一种实施例中:″我们在一楼财务室工作″
正向最大匹配法,最终切分结果为:″我们/在一/楼财/室/工/作″,其中,两字词3个,单字字典词为2,非词典词为1。
逆向最大匹配法,最终切分结果为:″我们/在/一楼财务室/工作″,其中,五字词1个,两字词1个,单字字典词为2,非词典词为0。
非字典词:正向(1)>逆向(0)(越少越好)
单字字典词:正向(2)=逆向(2)(越少越好)
总词数:正向(6)>逆向(4)(越少越好)
因此最终输出为逆向结果。
在本发明进一步的实施例中,人机交互单元工作的方法为:所述中央处理单元将数据处理模块最后输出的数据信息传递到数据检索模块和人机交互单元,所述人机交互单元通过语音识别单元实现语音识别,通过语音人机交互,通过手势识别单元通过人体肢体语言实现肢体解读,通过肢体交互。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

Claims (10)

1.一种具备界面检索及人机交互的财务数据处理系统,其特征在于:所述系统包括:
中央处理单元,其内设置有处理器,用于采集、存储、计算并传递财务数据;所述处理器为云端处理器或计算机处理器,所述云端处理器的硬件配置为Intel XeonE3-1220v53.0GHz,内核为四核,内存为8GDDR4,硬盘为1*Intel企业级SSD,1*SATA 1T,网卡为2*千兆网口;工作机节点的硬件CPU型号为Intel Xeon E53.0GHZ,所述工作机节点的内存为8GB,硬盘容量为1TB,所述计算机处理器的型号为Intel(R)Core(TM)i7-3770CPU@3.40GHz,内存为160GB;
存储单元,用于存储各种类型的财务数据,其内设置有各种财务数据库,所述财务数据库包括工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库,其中所述工资管理数据库用于存储员工工资信息,报表管理数据库用于存储业务报表,出纳管理数据库用于存储现金、银行日记账、资金日报表或支票管理,审计管理数据库用于存储账务业务的数据信息,业务管理数据库用于存储客户档案、仓库统计信息或者核算信息,账务管理数据库用于存储凭证数据信息、账薄数据信息、期末数据信息、数据金额信息或者外币核算信息,其中数据类型为DB2数据库、oracle数据库、Informix数据库、Sybase数据库、SQL Server数据库、PostgreSQL数据库或者MySQL数据库;
人机交互单元,其连接有显示屏,并且所述人机交互单元还设置有无线通信接口,其中所述无线通信接口包括RS485通信接口、RS232通信接口、红外通信接口、载波通信接口、TCP/IP通信接口、ZigBee无线通信接口、GPRS通信接口、CDMA无线通讯或蓝牙通信接口;所述显示屏为触摸式LCD显示屏;
数据检索模块,其设置有检索引擎,所述检索引擎至少包括全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎,所述检索引擎还包括文本检索引擎、关键词检索引擎和信息特征检索引擎;所述数据检索模块外壳设置有USB接口、RS232接口和Interne网络接口;
数据处理模块;用于将各种财务数据进行数据处理,所述数据处理模型包括分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块,将各种复杂财务数据简易化处理;
其中所述中央处理单元分别与存储单元、人机交互单元、数据检索模块和数据处理模块连接,所述存储单元将数据库的输出端与数据处理模块的输入端连接,所述存储单元与所述人机交互单元双向连接,所述人机交互单元的输出端与所述数据检索模块的输入端连接,所述数据处理模块的输出端与所述数据检索模块的输入端连接,通过所述数据检索模块和人机交互单元,实现财务数据的检索。
2.根据权利要求1所述的一种具备界面检索及人机交互的财务数据处理系统,其特征在于:所述人机交互单元还包括CPU处理单元和与所述CPU处理单元连接的人脸识别单元、语音识别单元和手势识别单元。
3.根据权利要求1所述的一种具备界面检索及人机交互的财务数据处理系统,其特征在于:所述数据检索模块包括检索条件输入模块和检索结果生成模块,其中所述检索条件输入模块的输出端与所述检索结果生成模块的输入端连接。
4.一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述方法包括:
(1)数据获取:通过数据库获取工资管理数据库、报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库的数据信息;
(2)数据处理、计算:对获取的各种财务数据进行处理,通过数据的计算和处理,实现复杂数据的简易化处理,在进行数据处理时,利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块实现数据的计算和处理,以实现各种复杂财务数据的简易处理,降低大数据的信息纬度,以便进行数据查询;
(3)数据检索:通过数据检索模块发出检索请求,请求的内容为全文检索、关键词检索、全文检索、信息特征检索、信息垂直搜索检索、目录检索、数据关联性检索、数据相互性检索、数据分类检索、故障数据检索、一级分类或者二级分类检索或数据融合检索,检索条件输入模块输入检索信息,通过检索结果生成模块输出检索请求,进而快速从多种财务数据库信息检索出目标数据信息;
(4)数据交互:通过人机交互单元实现数据信息的交互。
5.根据权利要求4所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述数据检索的方法为:
(1)接收中央处理单元发出的检索请求,执行检索命令;
(2)根据检索请求执行财务大数据计算方法,通过数据处理模块对财务大数据进行计算和处理;数据处理模块输出结果为利用分类算法模块、关联算法模块、故障处理算法模块、BP神经网络算法模块、KNN算法模块、数据融合算法模块或者AdaBoost算法模块输出的不同类型的数据;
(3)转换检索请求语言,使得数据检索模块能够快速地识别转换后的检索请求语言,以简易化检索条件,其中包括分词处理、语义解析或关键词拆分;
(4)执行检索命令,通过人机交互单元执行检索命令,并通过显示屏显示检索结果。
6.根据权利要求4所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述检索条件包括独立工作或者互相配合工作的第一检索条件、第二检索条件和第三检索条件,其中互相配合的方法为第一检索条件配合第二检索条件进行工作、第二检索条件配合第三检索条件进行工作或者第一检索条件配合第三检索条件进行工作。
7.根据权利要求6所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述第一检索条件的检索方法为:启动分类算法模块,对财务大数据进行分类,将分类结果按照本文标签进行标注,检索时,对本文标签的关键词进行分词处理,获职不同的检索关键词,其中分类算法模型的工作方法包括以下步骤:
(1)从多个财务数据库中选择k个对象作为初始聚类中心,数据集合为X={xm|m=1,2,...,M},假设财务数据库中存在d个不同分类属性,则有A1,A2,...,Ad个不同的维度;
(2)计算每个聚类对象到聚类中心的距离来划分分类属性,如果数据xi和数据xj之间的相似度通过距离公式来计算,xi和xj之间的距离越小,样本xi和xj越相似,xi和xj之间的距离越大,样本xi和xj相差越远;所述距离公式为:
Figure FDA0002560692350000041
(3)再次计算每个聚类中心,通过反复计算,将每个聚类中的样本均值作为新的聚类中心,重复步骤(2);
(4)输出分类结果,其中每一种分类结果用一种文本标签进行标注。
8.根据权利要求6所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述第二检索条件的检索方法为:启动关联算法模型,对财务大数据之间的关系进行计算,每种计算结果输出的数据关系利用分割符隔开,在检索时,通过分隔符检索财务大数据之间存在关联的数据;其中关联算法模型的工作方法为:
假设待划分属性的财务大数据集为d,假设将工资管理数据库类型的属性类别划分为集合C,其中C={c1,c2,...,cm},其中第i分类属性满足这样的条件:1≤i≤m,对于待分类的研发人员工资数据类型集合d,其输出的最大类别为P(ci/d),则有:
Figure FDA0002560692350000042
其中C、D表示为随机变量,则待分类的研发人员工资数据d的贝叶斯分类公式为:
Figure FDA0002560692350000051
然后按照公式(1)和(2)依次对报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库中的数据信息进行分类,每种类别用分割符隔开,在检索时,利用分割符检索规则进行检索。
9.根据权利要求6所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:所述第三检索条件的检索方法为正向最大匹配法、逆向最大匹配法或双向最大匹配法,最终将标注报表管理数据库、出纳管理数据库、审计管理数据库、业务管理数据库或者账务管理数据库信息的文本信息输出不同的词组,通过词组实现不同财务数据的检索。
10.根据权利要求4所述的一种具备界面检索及人机交互的财务数据处理方法,其特征在于:人机交互单元工作的方法为:所述中央处理单元将数据处理模块最后输出的数据信息传递到数据检索模块和人机交互单元,所述人机交互单元通过语音识别单元实现语音识别,通过语音人机交互,通过手势识别单元通过人体肢体语言实现肢体解读,通过肢体交互。
CN202010610103.5A 2020-06-29 2020-06-29 具备界面检索及人机交互的财务数据处理系统 Withdrawn CN111784490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010610103.5A CN111784490A (zh) 2020-06-29 2020-06-29 具备界面检索及人机交互的财务数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010610103.5A CN111784490A (zh) 2020-06-29 2020-06-29 具备界面检索及人机交互的财务数据处理系统

Publications (1)

Publication Number Publication Date
CN111784490A true CN111784490A (zh) 2020-10-16

Family

ID=72760366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010610103.5A Withdrawn CN111784490A (zh) 2020-06-29 2020-06-29 具备界面检索及人机交互的财务数据处理系统

Country Status (1)

Country Link
CN (1) CN111784490A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506959A (zh) * 2020-11-30 2021-03-16 智慧航海(青岛)科技有限公司 智能船舶数据库检索的数据调度方法、装置和检索系统
CN112765311A (zh) * 2020-12-29 2021-05-07 长春市把手科技有限公司 一种裁判文书的搜索方法
CN112860815A (zh) * 2021-02-23 2021-05-28 南京启用宝信息科技有限公司 一种基于大数据的财税信息化数据处理系统
CN113297299A (zh) * 2021-06-23 2021-08-24 南宁学院 财务数据模糊查询方法
CN115881096A (zh) * 2023-02-22 2023-03-31 翌飞锐特电子商务(北京)有限公司 一种智能对账方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506959A (zh) * 2020-11-30 2021-03-16 智慧航海(青岛)科技有限公司 智能船舶数据库检索的数据调度方法、装置和检索系统
CN112506959B (zh) * 2020-11-30 2022-11-08 智慧航海(青岛)科技有限公司 智能船舶数据库检索的数据调度方法、装置和检索系统
CN112765311A (zh) * 2020-12-29 2021-05-07 长春市把手科技有限公司 一种裁判文书的搜索方法
CN112860815A (zh) * 2021-02-23 2021-05-28 南京启用宝信息科技有限公司 一种基于大数据的财税信息化数据处理系统
CN113297299A (zh) * 2021-06-23 2021-08-24 南宁学院 财务数据模糊查询方法
CN115881096A (zh) * 2023-02-22 2023-03-31 翌飞锐特电子商务(北京)有限公司 一种智能对账方法及系统

Similar Documents

Publication Publication Date Title
US10303999B2 (en) Machine learning-based relationship association and related discovery and search engines
CN111784490A (zh) 具备界面检索及人机交互的财务数据处理系统
CN108573045B (zh) 一种基于多阶指纹的比对矩阵相似度检索方法
Feng et al. Enhanced sentiment labeling and implicit aspect identification by integration of deep convolution neural network and sequential algorithm
WO2022227165A1 (zh) 机器阅读理解的问答方法、装置、计算机设备及存储介质
WO2022095892A1 (zh) 推送信息的生成方法、装置
CN111914087A (zh) 一种舆情分析方法
CN113962293A (zh) 一种基于LightGBM分类与表示学习的姓名消歧方法和系统
KR20160149050A (ko) 텍스트 마이닝을 활용한 순수 기업 선정 장치 및 방법
AU2019200371A1 (en) Utilizing artificial intelligence to integrate data from multiple diverse sources into a data structure
Yang et al. Leveraging global and local topic popularities for LDA-based document clustering
CN115248839A (zh) 一种基于知识体系的长文本检索方法以及装置
Rahman et al. Unfolding the structure of a document using deep learning
Rajman et al. From text to knowledge: Document processing and visualization: A text mining approach
Chin et al. Automatic discovery of concepts from text
Zhang et al. Text information classification method based on secondly fuzzy clustering algorithm
Zhang et al. Job opportunity finding by text classification
Harshvardhan et al. Topic modelling Twitterati sentiments using Latent Dirichlet allocation during demonetization
Akhgari et al. Sem-TED: semantic twitter event detection and adapting with news stories
Zandieh et al. Clustering data text based on semantic
CN112860815A (zh) 一种基于大数据的财税信息化数据处理系统
Zhuang et al. A novel method for open relation extraction from public announcements of chinese listed companies
Xu et al. A new SVM Chinese text of classification algorithm based on the semantic kernel
Zhu et al. Short Text Topic Discovery Based on BTM Topic Model
Costa et al. Legal Information Retrieval Based on a Concept-Frequency Representation and Thesaurus.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201016