CN108229902A - 一种基于智能云台服务的财务档案信息录入系统 - Google Patents
一种基于智能云台服务的财务档案信息录入系统 Download PDFInfo
- Publication number
- CN108229902A CN108229902A CN201611157476.1A CN201611157476A CN108229902A CN 108229902 A CN108229902 A CN 108229902A CN 201611157476 A CN201611157476 A CN 201611157476A CN 108229902 A CN108229902 A CN 108229902A
- Authority
- CN
- China
- Prior art keywords
- financial
- information
- typing
- financial information
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000005516 engineering process Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 15
- 239000000463 material Substances 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 9
- 238000013145 classification model Methods 0.000 claims description 6
- 238000005538 encapsulation Methods 0.000 claims description 6
- 238000012905 input function Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 4
- 241000533950 Leucojum Species 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 208000024891 symptom Diseases 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000002955 isolation Methods 0.000 claims description 2
- 241000894007 species Species 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 abstract description 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种基于智能云台服务的财务档案信息录入系统,其具体操作流程如下:(1)授权人员上传电子财务信息资料到后台业务管理模块;(2)后台业务管理模块自动扫描并批量处理电子财务信息资料;(3)智能财务信息录入模块自动从服务器端下载生成好的财务关键技术数据财务信息数据库;(4)企业财务用户通过手动触发智能财务信息录入客户端的功能键,将当前录入的信息送至财务安全智能判断系统进行预处理。本发明在对财务档案信息进行信息提取形成的财务信息数据库基础上,实现企业财务用户在最小的语境内,选择最高准确度的词进行财务信息快捷录入,改善了使用效果。
Description
技术领域
本发明涉及一种基于智能云台服务的财务档案信息录入系统,属于智能财务信息管理技术领域。
背景技术
目前,企业财务管理中,经常需要针对各种各样的财务信息进行管理,一般的产品中,存在以下几点不足:1)没有完整专业的财务信息语境财务关键技术数据作为录入的依据,会计人员需要较多的点击、选择才能完成录入工作;2)不能根据已经录入的内容切换更精确的语境;3)不能将已经录入的内容结合历史数据有效地预测下文;4)没有基于历史财务信息数据的智能辅助判断功能。对此,需要采用合适的方式予以改进。
发明内容
本发明的目的在于提供一种基于智能云台服务的财务档案信息录入系统,通过对财务档案信息进行信息提取,形成智能财务信息录入平台所需的财务关键技术数据财务信息数据库,以及智能辅助判断所需的财务数据财务信息数据库,在此基础上,实现财务信息快捷录入和智能辅助判断;智能辅助判断功能的目的是方便会计人员参考历史财务信息知识,迅速做出判断,加速财务信息录入。
为了实现上述目的,本发明的技术方案如下。
一种基于智能云台服务的财务档案信息录入系统,采用C/S架构,并扩展至云计算架构,通过对财务档案信息进行信息提取,形成智能财务信息录入所需的数据,其具体操作流程如下:
(1)授权人员上传电子财务信息资料到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子财务信息资料,从电子财务信息资料中提取出字、词、短语、短句以及财务数据实例并入库,同时训练出拼音分类、语境识别、录入预测和智能辅助判断四大模型;
(3)智能财务信息录入模块自动从服务器端下载生成好的财务关键技术数据财务信息数据库,通过纠错算法、语境识别算法以及预测算法为企业财务用户提供高准确度的候选项;对于企业财务用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)企业财务用户通过手动触发智能财务信息录入客户端的功能键,将当前录入的信息送至财务安全智能判断系统进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助判断机器模型,为企业财务用户推荐可能的判断、对策、缩紧预算及处理方法信息;企业财务用户在辅助判断信息的基础上,能够加快财务信息的录入。
上述基于智能云台服务的财务档案信息录入系统由智能财务信息录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及财务信息数据库五部分组成。
进一步地,所述智能财务信息录入模块功能为:本模块实现一种在历史财务信息数据库基础上的智能财务信息录入功能,尤其适用于财务管理会计电子财务信息资料的录入;本录入功能,基于拼音输入法,根据企业财务用户所在会计科目、专业及所录入的文本信息,智能识别语境,优先在精确的历史财务信息财务关键技术数据库中,为企业财务用户提供高准确度的候选项;智能财务信息录入模块包括以下六大子模块:企业财务用户注册登录模块、输入输出模块、算法模块、词库模块、辅助判断模块、升级管理模块,其中,(a)企业财务用户注册登录模块支持未注册企业财务用户注册、注册企业财务用户登录,根据所在会计科目或权限,平台优先选择相关危险财务信息数据作为候选项;(b)输入输出模块用于企业财务用户录入和向企业财务用户系统输出财务信息;对于输入部分,根据企业财务用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台优先选择危险财务信息数据作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法。如果不在危险财务信息数据中的字或词,则通过录入模块的基础码表及词典实现。对于输出部分,企业财务用户通过点击鼠标或者敲击键盘,完成从候选项到企业财务用户系统的文字输出。(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的财务关键技术数据库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音错误模型识别诸如平/卷舌,f/h基础错误,接着调用拼音机器分类模型,优先在历史财务信息财务关键技术数据库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过企业财务用户录入的最近四个词汇,根据这三个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-财务信息块;当企业财务用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录企业财务用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型,预测医学单位、短语、短句。(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及企业财务用户的临时词库。当企业财务用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史财务信息词汇和基础词汇共同构成。当企业财务用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成。(e)辅助判断模块主要是将当前录入环境中企业财务用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台管理模块,并将后台返回的结果在录入客户端上显示。(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示。
进一步地,所述统一接口模块功能为:本模块实现智能财务信息录入客户端同服务器端的统一通信适配、收发及调度功能。包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息。(b)消息发送和管理模块:管理、封装和转发消息。(c)调度中心:实现消息同步或者异步调用。
进一步地,所述后台业务管理模块功能为:本模块实现智能财务信息录入平台的服务器端。统一管理企业财务用户,提取历史财务信息以及计算财务信息知识相关性以辅助判断。本模块包括四个子模块:企业财务用户管理、升级及同步管理、智能辅助判断、财务信息管理及信息提取。(a)企业财务用户管理:企业财务用户基本信息管理,权限管理。(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断。(c)智能辅助判断:本模块对应客户端的辅助判断模块,包括智能辅助判断模型,通过对客户端输入的企业症状信息,匹配财务数据库中的相关案例,计算各个特征的相关性,给企业财务用户在判断、对策、检查企业经营异常处理以及处理方法方面的提示信息。(d)财务信息管理及信息提取:本模块集中处理历史财务信息文本,并将上传的财务信息进行信息抽取入财务关键技术数据库及财务数据数据库。
进一步地,所述信息抽取流程为:
(01)企业财务用户指定若干份财务信息作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注财务关键技术数据库,并提供交互式界面进行人工核对。
(02)人工校验修改完毕后,采用机器学习算法对财务信息进行信息标注,再结合句法规则库提取财务信息。
(03)接着将所提取的财务关键技术数据库按照会计科目、财务信息块来计算词频,形成转移矩阵,生成拼音分类、语境识别、录入预测三个模型;所提取的企业用户事实数据被入库为智能辅助判断提供数据源,生成智能辅助判断模型。拼音分类、语境识别、录入预测和智能辅助判断四大模型的基本功能为:拼音分类模型,该模型以历史财务信息提取的字和词,加上基础词汇为样本,用拼音为特征进行归类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模。根据输入的拼音,输出最优可能的候选字或者词。语境识别模型,该模型以历史财务信息提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从财务信息中提取出会计科目与高频词汇的概率模型,会计科目财务信息块与高频词汇的概率模型。从而实现根据企业财务用户最近录入的若干词汇,准确识别企业财务用户当前可能在录入的财务信息块环境。输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数。录入预测模型,该模型是在拼音分类模型的基础上,融合从财务信息中提出的上下文模式规则以及平台预定义的录入模式规则,利用有限自动机原理,实现录入预测。输入拼音,输出若干候选项集。
进一步地,所述统一数据库访问模块功能为:本模块实现对数据库的统一访问管理。实现业务层与数据层的隔离。包括适配管理、索引管理、封装器、元数据管理四大子模块。(a)适配管理:自动适配各类数据库。(b)索引管理:对数据库进行统一索引。(c)封装器:封装数据库访问原语,统一数据库访问。(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句。
进一步地,所述财务信息数据库功能为:本模块存储企业财务用户信息、历史财务信息、财务关键技术数据等信息,为智能录入和辅助判断提供数据支持。主要包括以下几大类数据:企业财务用户数据库、基础词库、财务信息词库、规则库及财务数据库。(a)企业财务用户数据库:存储企业财务用户基本数据、权限数据。(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库等数据。(c)财务信息词库:存储从历史财务信息中提出的财务信息中出现的字、词及短句,字频、词频、短句频率,以及全局的二元转移矩阵,会计科目及财务信息块下的三元转移关系。(d)规则词库:存储基础的上下文语义关系,机器从财务信息中学习到的语义关系,句法规则,单位使用规则。(e)财务数据库:以企业编号、财务异常数据为线索,按雪花模型存储企业的财务档案数据、企业经营异常信息、财务管理会计信息、企业经营异常处理信息、判断信息等从历史财务信息中提取的信息。
该发明的有益效果在于:本发明在对财务档案信息进行信息提取形成的财务信息数据库基础上,实现企业财务用户在最小的语境内,选择最高准确度的词进行财务信息快捷录入,并且结合历史财务信息知识,给企业财务用户在录入过程中辅助判断信息提示的功能,改善了使用效果,方便根据需要使用。
具体实施方式
下面结合实施例对本发明的具体实施方式进行描述,以便更好的理解本发明。
实施例
本实施例中的基于智能云台服务的财务档案信息录入系统,采用C/S架构,并扩展至云计算架构,通过对财务档案信息进行信息提取,形成智能财务信息录入所需的数据,其具体操作流程如下:
(1)授权人员上传电子财务信息资料到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子财务信息资料,从电子财务信息资料中提取出字、词、短语、短句以及财务数据实例并入库,同时训练出拼音分类、语境识别、录入预测和智能辅助判断四大模型;
(3)智能财务信息录入模块自动从服务器端下载生成好的财务关键技术数据财务信息数据库,通过纠错算法、语境识别算法以及预测算法为企业财务用户提供高准确度的候选项;对于企业财务用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)企业财务用户通过手动触发智能财务信息录入客户端的功能键,将当前录入的信息送至财务安全智能判断系统进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助判断机器模型,为企业财务用户推荐可能的判断、对策、缩紧预算及处理方法等信息;企业财务用户在辅助判断信息的基础上,能够加快财务信息的录入。
上述基于智能云台服务的财务档案信息录入系统由智能财务信息录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及财务信息数据库五部分组成,各部分模块功能如下:
(1)智能财务信息录入模块:本模块实现一种在历史财务信息数据库基础上的智能财务信息录入功能,尤其适用于财务管理会计电子财务信息资料的录入;本录入功能,基于拼音输入法,根据企业财务用户所在会计科目、专业及所录入的文本信息,智能识别语境,优先在精确的历史财务信息财务关键技术数据库中,为企业财务用户提供高准确度的候选项;智能财务信息录入模块包括以下六大子模块:企业财务用户注册登录模块、输入输出模块、算法模块、词库模块、辅助判断模块、升级管理模块,其中,(a)企业财务用户注册登录模块支持未注册企业财务用户注册、注册企业财务用户登录,根据所在会计科目或权限,平台优先选择相关危险财务信息数据作为候选项;(b)输入输出模块用于企业财务用户录入和向企业财务用户系统输出财务信息;对于输入部分,根据企业财务用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台优先选择危险财务信息数据作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法。如果不在危险财务信息数据中的字或词,则通过录入模块的基础码表及词典实现。对于输出部分,企业财务用户通过点击鼠标或者敲击键盘,完成从候选项到企业财务用户系统的文字输出。(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的财务关键技术数据库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音错误模型识别诸如平/卷舌,f/h等基础错误,接着调用拼音机器分类模型,优先在历史财务信息财务关键技术数据库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过企业财务用户录入的最近四个词汇,根据这三个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-财务信息块;当企业财务用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录企业财务用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型,预测医学单位、短语、短句。(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及企业财务用户的临时词库。当企业财务用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史财务信息词汇和基础词汇共同构成。当企业财务用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成。(e)辅助判断模块主要是将当前录入环境中企业财务用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台管理模块,并将后台返回的结果在录入客户端上显示。(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示。
(2)统一接口模块:本模块实现智能财务信息录入客户端同服务器端的统一通信适配、收发及调度功能。包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息。(b)消息发送和管理模块:管理、封装和转发消息。(c)调度中心:实现消息同步或者异步调用。
(3)后台业务管理模块:本模块实现智能财务信息录入平台的服务器端。统一管理企业财务用户,提取历史财务信息以及计算财务信息知识相关性以辅助判断。本模块包括四个子模块:企业财务用户管理、升级及同步管理、智能辅助判断、财务信息管理及信息提取。(a)企业财务用户管理:企业财务用户基本信息管理,权限管理。(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断。(c)智能辅助判断:本模块对应客户端的辅助判断模块,包括智能辅助判断模型,通过对客户端输入的企业症状等信息,匹配财务数据库中的相关案例,计算各个特征的相关性,给企业财务用户在判断、对策、检查企业经营异常处理以及处理方法等方面的提示信息。(d)财务信息管理及信息提取:本模块集中处理历史财务信息文本,并将上传的财务信息进行信息抽取入财务关键技术数据库及财务数据数据库。信息抽取流程为:
(01)企业财务用户指定若干份财务信息作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注财务关键技术数据库,并提供交互式界面进行人工核对。
(02)人工校验修改完毕后,采用机器学习算法对财务信息进行信息标注,再结合句法规则库提取财务信息。
(03)接着将所提取的财务关键技术数据库按照会计科目、财务信息块来计算词频,形成转移矩阵,生成拼音分类、语境识别、录入预测三个模型;所提取的企业用户事实数据被入库为智能辅助判断提供数据源,生成智能辅助判断模型。拼音分类、语境识别、录入预测和智能辅助判断四大模型的基本功能为:拼音分类模型,该模型以历史财务信息提取的字和词,加上基础词汇为样本,用拼音为特征进行归类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模。根据输入的拼音,输出最优可能的候选字或者词。语境识别模型,该模型以历史财务信息提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从财务信息中提取出会计科目与高频词汇的概率模型,会计科目财务信息块与高频词汇的概率模型。从而实现根据企业财务用户最近录入的若干词汇,准确识别企业财务用户当前可能在录入的财务信息块环境。输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数。录入预测模型,该模型是在拼音分类模型的基础上,融合从财务信息中提出的上下文模式规则以及平台预定义的录入模式规则,利用有限自动机原理,实现录入预测。输入拼音,输出若干候选项集。
(4)统一数据库访问模块:本模块实现对数据库的统一访问管理。实现业务层与数据层的隔离。包括适配管理、索引管理、封装器、元数据管理四大子模块。(a)适配管理:自动适配各类数据库。(b)索引管理:对数据库进行统一索引。(c)封装器:封装数据库访问原语,统一数据库访问。(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句。
(5)财务信息数据库:本模块存储企业财务用户信息、历史财务信息、财务关键技术数据等信息,为智能录入和辅助判断提供数据支持。主要包括以下几大类数据:企业财务用户数据库、基础词库、财务信息词库、规则库及财务数据库。(a)企业财务用户数据库:存储企业财务用户基本数据、权限数据。(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库等数据。(c)财务信息词库:存储从历史财务信息中提出的财务信息中出现的字、词及短句,字频、词频、短句频率,以及全局的二元转移矩阵,会计科目及财务信息块下的三元转移关系。(d)规则词库:存储基础的上下文语义关系,机器从财务信息中学习到的语义关系,句法规则,单位使用规则。(e)财务数据库:以企业编号、财务异常数据为线索,按雪花模型存储企业的财务档案数据、企业经营异常信息、财务管理会计信息、企业经营异常处理信息、判断信息等从历史财务信息中提取的信息。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (7)
1.一种基于智能云台服务的财务档案信息录入系统,其特征在于:采用C/S架构,并扩展至云计算架构,通过对财务档案信息进行信息提取,形成智能财务信息录入所需的数据,其具体操作流程如下:
(1)授权人员上传电子财务信息资料到后台业务管理模块;
(2)后台业务管理模块自动扫描并批量处理电子财务信息资料,从电子财务信息资料中提取出字、词、短语、短句以及财务数据实例并入库,同时训练出拼音分类、语境识别、录入预测和智能辅助判断四大模型;
(3)智能财务信息录入模块自动从服务器端下载生成好的财务关键技术数据财务信息数据库,通过纠错算法、语境识别算法以及预测算法为企业财务用户提供高准确度的候选项;对于企业财务用户自定义的或不在全部词库中的词汇,通过对本地临时词库的管理,自动与服务器端同步,作为服务器词库的扩展;
(4)企业财务用户通过手动触发智能财务信息录入客户端的功能键,将当前录入的信息送至财务安全智能判断系统进行预处理,再通过消息接口送至后台业务管理模块,调用智能辅助判断机器模型,为企业财务用户推荐可能的判断、对策、缩紧预算及处理方法信息;企业财务用户在辅助判断信息的基础上,能够加快财务信息的录入;
上述基于智能云台服务的财务档案信息录入系统由智能财务信息录入模块、统一接口模块、后台业务管理模块、统一数据库访问模块以及财务信息数据库五部分组成。
2.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述智能财务信息录入模块的功能为:本模块实现一种在历史财务信息数据库基础上的智能财务信息录入功能,尤其适用于财务管理会计电子财务信息资料的录入;本录入功能,基于拼音输入法,根据企业财务用户所在会计科目、专业及所录入的文本信息,智能识别语境,优先在精确的历史财务信息财务关键技术数据库中,为企业财务用户提供高准确度的候选项;智能财务信息录入模块包括以下六大子模块:企业财务用户注册登录模块、输入输出模块、算法模块、词库模块、辅助判断模块、升级管理模块,其中,(a)企业财务用户注册登录模块支持未注册企业财务用户注册、注册企业财务用户登录,根据所在会计科目或权限,平台优先选择相关危险财务信息数据作为候选项;(b)输入输出模块用于企业财务用户录入和向企业财务用户系统输出财务信息;对于输入部分,根据企业财务用户输入的拼音,通过拼音模式匹配判断是否需要调用纠错算法,如果拼写错误,则平台会自动纠正,给出正确的发音;接着,根据正确的录入,平台优先选择危险财务信息数据作为候选项,再通过点击空格或者触发系统热键,调用录入预测算法;如果不在危险财务信息数据中的字或词,则通过录入模块的基础码表及词典实现;对于输出部分,企业财务用户通过点击鼠标或者敲击键盘,完成从候选项到企业财务用户系统的文字输出;(c)算法模块包括三大部分算法及其对应的三大机器学习模型,分别是用于拼写检查的纠错算法、用于切换录入依赖的财务关键技术数据库的语境识别算法、用于生成候选项的录入预测算法,其中,纠错算法是通过获取录入的拼音,调用基础拼音错误模型识别诸如平/卷舌,f/h基础错误,接着调用拼音机器分类模型,优先在历史财务信息财务关键技术数据库中筛选最相似的拼音及对应的字、词或者短语;如果可能存在录入错误,平台提供的候选项由一个纠错后的词汇加若干可匹配词汇构成;语境识别算法是通过企业财务用户录入的最近四个词汇,根据这三个词汇的词性以及构词类型,实时调用语境识别模型,将候选项的选择范围逐步缩小到平台定义的最小类别-财务信息块;当企业财务用户录入完句号或者回车符后,语境识别算法将当前语境重新初始化;录入预测算法,是通过记录企业财务用户最近录入的四个词汇,及其词性和构词类型,实时调用录入预测模型,预测医学单位、短语、短句;(d)词库模块包括输入法依赖的基础码表、词汇表、专业词汇表,以及企业财务用户的临时词库;当企业财务用户录入拼音后,平台会优先调用录入预测算法,此时,候选项由历史财务信息词汇和基础词汇共同构成;当企业财务用户录入的拼音,得不到或者得到空的录入预测算法的返回结果,此时,候选项仅由基础词库的词汇构成;(e)辅助判断模块主要是将当前录入环境中企业财务用户已经录入的词汇及其构词类型进行封装通过统一接口模块发送至后台管理模块,并将后台返回的结果在录入客户端上显示;(f)升级管理模块负责定时向统一接口模块发送软件升级、词库升级查询指令,并将返回的信息进行展示。
3.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述统一接口模块的功能为:本模块实现智能财务信息录入客户端同服务器端的统一通信适配、收发及调度功能;包括以下三大子模块:消息适配器、消息发送和管理模块以及调度中心:(a)消息适配器:消息模板管理,通过命令字适配并实例化各类消息;(b)消息发送和管理模块:管理、封装和转发消息;(c)调度中心:实现消息同步或者异步调用。
4.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述后台业务管理模块功能为:本模块实现智能财务信息录入平台的服务器端;统一管理企业财务用户,提取历史财务信息以及计算财务信息知识相关性以辅助判断;本模块包括四个子模块:企业财务用户管理、升级及同步管理、智能辅助判断、财务信息管理及信息提取;(a)企业财务用户管理:企业财务用户基本信息管理,权限管理;(b)升级及同步管理:对应客户端的升级管理模块,实现升级业务逻辑的判断;(c)智能辅助判断:本模块对应客户端的辅助判断模块,包括智能辅助判断模型,通过对客户端输入的企业症状信息,匹配财务数据库中的相关案例,计算各个特征的相关性,给企业财务用户在判断、对策、检查企业经营异常处理以及处理方法方面的提示信息;(d)财务信息管理及信息提取:本模块集中处理历史财务信息文本,并将上传的财务信息进行信息抽取入财务关键技术数据库及财务数据数据库。
5.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述统一数据库访问模块功能为:本模块实现对数据库的统一访问管理;实现业务层与数据层的隔离;包括适配管理、索引管理、封装器、元数据管理四大子模块;(a)适配管理:自动适配各类数据库;(b)索引管理:对数据库进行统一索引;(c)封装器:封装数据库访问原语,统一数据库访问;(d)元数据管理:存储数据库元数据,统一生成各类SQL操作语句。
6.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述财务信息数据库功能为:本模块存储企业财务用户信息、历史财务信息、财务关键技术数据等信息,为智能录入和辅助判断提供数据支持;主要包括以下几大类数据:企业财务用户数据库、基础词库、财务信息词库、规则库及财务数据库;(a)企业财务用户数据库:存储企业财务用户基本数据、权限数据;(b)基础词库:存储拼音输入法依赖的基础码表、词库、专业词库等数据;(c)财务信息词库:存储从历史财务信息中提出的财务信息中出现的字、词及短句,字频、词频、短句频率,以及全局的二元转移矩阵,会计科目及财务信息块下的三元转移关系;(d)规则词库:存储基础的上下文语义关系,机器从财务信息中学习到的语义关系,句法规则,单位使用规则;(e)财务数据库:以企业编号、财务异常数据为线索,按雪花模型存储企业的财务档案数据、企业经营异常信息、财务管理会计信息、企业经营异常处理信息、判断信息等从历史财务信息中提取的信息。
7.根据权利要求1所述的基于智能云台服务的财务档案信息录入系统,其特征在于:所述信息抽取流程为:
(01)企业财务用户指定若干份财务信息作为机器学习的训练集,平台依据基础数据库,采用高精度反向最大匹配算法自动标注财务关键技术数据库,并提供交互式界面进行人工核对;
(02)人工校验修改完毕后,采用机器学习算法对财务信息进行信息标注,再结合句法规则库提取财务信息;
(03)接着将所提取的财务关键技术数据库按照会计科目、财务信息块来计算词频,形成转移矩阵,生成拼音分类、语境识别、录入预测三个模型;所提取的企业用户事实数据被入库为智能辅助判断提供数据源,生成智能辅助判断模型;拼音分类、语境识别、录入预测和智能辅助判断四大模型的基本功能为:拼音分类模型,该模型以历史财务信息提取的字和词,加上基础词汇为样本,用拼音为特征进行归类,每个拼音类别中将字、词汇按词频由高到低排序,通过短文本相似度计算算法以及机器学习中基于监督的分类模型进行建模;根据输入的拼音,输出最优可能的候选字或者词;语境识别模型,该模型以历史财务信息提取的词及其词性和构成类型为基础,通过非监督的机器学习算法,自动从财务信息中提取出会计科目与高频词汇的概率模型,会计科目财务信息块与高频词汇的概率模型;从而实现根据企业财务用户最近录入的若干词汇,准确识别企业财务用户当前可能在录入的财务信息块环境;输入最近录入的若干词及其词性和构词类别,输出语境标识,并设置录入预测模型的语境参数;录入预测模型,该模型是在拼音分类模型的基础上,融合从财务信息中提出的上下文模式规则以及平台预定义的录入模式规则,利用有限自动机原理,实现录入预测;输入拼音,输出若干候选项集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611157476.1A CN108229902A (zh) | 2016-12-14 | 2016-12-14 | 一种基于智能云台服务的财务档案信息录入系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611157476.1A CN108229902A (zh) | 2016-12-14 | 2016-12-14 | 一种基于智能云台服务的财务档案信息录入系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108229902A true CN108229902A (zh) | 2018-06-29 |
Family
ID=62651179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611157476.1A Withdrawn CN108229902A (zh) | 2016-12-14 | 2016-12-14 | 一种基于智能云台服务的财务档案信息录入系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108229902A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408698A (zh) * | 2018-10-31 | 2019-03-01 | 辽宁工程技术大学 | 基于数据挖掘技术的智能化财务报告支持系统及使用方法 |
CN109902998A (zh) * | 2019-03-04 | 2019-06-18 | 宁波火箭数据科技有限公司 | 单一窗口输单系统 |
CN110046241A (zh) * | 2019-04-18 | 2019-07-23 | 武汉大学 | 基于自动对比文章相似度辅助法律文书检错方法及系统 |
CN110085308A (zh) * | 2019-04-23 | 2019-08-02 | 挂号网(杭州)科技有限公司 | 一种基于融合深度学习的诊疗科室分类方法 |
CN110196711A (zh) * | 2019-04-10 | 2019-09-03 | 杭州实在智能科技有限公司 | 基于人工智能的插件式工单辅助决策方法及其系统 |
CN110457262A (zh) * | 2019-08-06 | 2019-11-15 | 合肥泓泉档案信息科技有限公司 | 一种基于大数据的档案管理系统 |
CN111583004A (zh) * | 2020-05-11 | 2020-08-25 | 南京迪巴戈软件科技有限公司 | 一种基于云架构的智能财务管理工具 |
CN112214657A (zh) * | 2020-09-30 | 2021-01-12 | 人保再保险股份有限公司 | 一种财务档案管理方法、系统及电子设备 |
CN112487053A (zh) * | 2020-11-27 | 2021-03-12 | 重庆医药高等专科学校 | 海量财务数据异常控制提取工作方法 |
CN113094416A (zh) * | 2019-12-23 | 2021-07-09 | 合肥天源迪科信息技术有限公司 | 企业资产数据管理系统 |
CN117235186A (zh) * | 2023-11-10 | 2023-12-15 | 深圳市度申科技有限公司 | 一种历史信息同步方法 |
CN117290420A (zh) * | 2023-09-19 | 2023-12-26 | 深圳市维嵩科技有限公司 | 一种用于财务数据提取的企业财务管理方法及系统 |
-
2016
- 2016-12-14 CN CN201611157476.1A patent/CN108229902A/zh not_active Withdrawn
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408698B (zh) * | 2018-10-31 | 2022-01-14 | 辽宁工程技术大学 | 基于数据挖掘技术的智能化财务报告支持系统及使用方法 |
CN109408698A (zh) * | 2018-10-31 | 2019-03-01 | 辽宁工程技术大学 | 基于数据挖掘技术的智能化财务报告支持系统及使用方法 |
CN109902998A (zh) * | 2019-03-04 | 2019-06-18 | 宁波火箭数据科技有限公司 | 单一窗口输单系统 |
CN109902998B (zh) * | 2019-03-04 | 2023-04-18 | 宁波火箭数据科技有限公司 | 单一窗口输单系统 |
CN110196711B (zh) * | 2019-04-10 | 2023-02-28 | 杭州实在智能科技有限公司 | 基于人工智能的插件式工单辅助决策方法及其系统 |
CN110196711A (zh) * | 2019-04-10 | 2019-09-03 | 杭州实在智能科技有限公司 | 基于人工智能的插件式工单辅助决策方法及其系统 |
CN110046241B (zh) * | 2019-04-18 | 2022-12-16 | 武汉大学 | 基于自动对比文章相似度辅助法律文书检错方法及系统 |
CN110046241A (zh) * | 2019-04-18 | 2019-07-23 | 武汉大学 | 基于自动对比文章相似度辅助法律文书检错方法及系统 |
CN110085308B (zh) * | 2019-04-23 | 2022-02-25 | 挂号网(杭州)科技有限公司 | 一种基于融合深度学习的诊疗科室分类方法 |
CN110085308A (zh) * | 2019-04-23 | 2019-08-02 | 挂号网(杭州)科技有限公司 | 一种基于融合深度学习的诊疗科室分类方法 |
CN110457262A (zh) * | 2019-08-06 | 2019-11-15 | 合肥泓泉档案信息科技有限公司 | 一种基于大数据的档案管理系统 |
CN113094416A (zh) * | 2019-12-23 | 2021-07-09 | 合肥天源迪科信息技术有限公司 | 企业资产数据管理系统 |
CN111583004A (zh) * | 2020-05-11 | 2020-08-25 | 南京迪巴戈软件科技有限公司 | 一种基于云架构的智能财务管理工具 |
CN112214657A (zh) * | 2020-09-30 | 2021-01-12 | 人保再保险股份有限公司 | 一种财务档案管理方法、系统及电子设备 |
CN112214657B (zh) * | 2020-09-30 | 2023-11-28 | 人保再保险股份有限公司 | 一种财务档案管理方法、系统及电子设备 |
CN112487053A (zh) * | 2020-11-27 | 2021-03-12 | 重庆医药高等专科学校 | 海量财务数据异常控制提取工作方法 |
CN117290420A (zh) * | 2023-09-19 | 2023-12-26 | 深圳市维嵩科技有限公司 | 一种用于财务数据提取的企业财务管理方法及系统 |
CN117235186A (zh) * | 2023-11-10 | 2023-12-15 | 深圳市度申科技有限公司 | 一种历史信息同步方法 |
CN117235186B (zh) * | 2023-11-10 | 2024-02-27 | 深圳市度申科技有限公司 | 一种历史信息同步方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229902A (zh) | 一种基于智能云台服务的财务档案信息录入系统 | |
CN105468900B (zh) | 一种基于知识库的智能病历录入平台 | |
CN110502361B (zh) | 面向bug报告的细粒度缺陷定位方法 | |
Yang et al. | Joint relational embeddings for knowledge-based question answering | |
CN112487140B (zh) | 问答对话评测方法、装置、设备及存储介质 | |
CN110895559B (zh) | 模型训练、文本处理方法、装置以及设备 | |
CN108874774B (zh) | 一种基于意图理解的服务调用方法和系统 | |
CN107870901A (zh) | 从翻译源原文生成相似文的方法、程序、装置以及系统 | |
JPWO2014033799A1 (ja) | 単語意味関係抽出装置 | |
CN113761218A (zh) | 一种实体链接的方法、装置、设备及存储介质 | |
TWI743623B (zh) | 基於人工智慧的商務智慧系統及其分析方法 | |
CN112231451A (zh) | 指代词恢复方法、装置、对话机器人及存储介质 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
WO2016156995A1 (en) | Methods, systems and computer program products for machine based processing of natural language input | |
Gao et al. | End-to-end task-oriented dialog modeling with semi-structured knowledge management | |
CN113297251A (zh) | 多源数据检索方法、装置、设备及存储介质 | |
CN111460114A (zh) | 检索方法、装置、设备及计算机可读存储介质 | |
Hua et al. | Using two formal strategies to eliminate ambiguity in poetry text | |
CN108959275B (zh) | 基于在线语言翻译的人机对练系统 | |
CN108897888B (zh) | 语音客服培训场景下的人机对练方法 | |
Arshia et al. | PeQA: A Massive Persian Question-Answering and Chatbot Dataset | |
Farrah et al. | An hybrid approach to improve part of speech tagging system | |
Sampath et al. | Hybrid Tamil spell checker with combined character splitting | |
CN112925961A (zh) | 一种基于企业实体的智能问答方法及装置 | |
Lokhacheva et al. | Designing of Information System for Semantic Analysis and Classification of Issues in Service Desk System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180629 |
|
WW01 | Invention patent application withdrawn after publication |