CN113971389A - 一种对现券交易文本进行处理的系统 - Google Patents

一种对现券交易文本进行处理的系统 Download PDF

Info

Publication number
CN113971389A
CN113971389A CN202111314664.1A CN202111314664A CN113971389A CN 113971389 A CN113971389 A CN 113971389A CN 202111314664 A CN202111314664 A CN 202111314664A CN 113971389 A CN113971389 A CN 113971389A
Authority
CN
China
Prior art keywords
text
data
transaction
module
chat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111314664.1A
Other languages
English (en)
Inventor
戚梦芸
周靖宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuaique Information Technology Co ltd
Original Assignee
Beijing Kuaique Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuaique Information Technology Co ltd filed Critical Beijing Kuaique Information Technology Co ltd
Priority to CN202111314664.1A priority Critical patent/CN113971389A/zh
Publication of CN113971389A publication Critical patent/CN113971389A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种对现券交易文本进行处理的系统,该系统包括:IM数据获取模块,用于IM提供的用户聊天数据;解析识别模块,用于对IM聊天数据的文本意图进行解析识别、要素提取、要素结构化及标准化处理后,生成解析后的现券交易文本数据;展示模块,用于根据解析后的现券交易文本数据,构建表格结构数据,将表格数据展示在前端交互界面;修改确认模块,用于获取用户在前端交互界面上对表格数据的修改指令,根据修改指令对表格数据进行修改,生成目标交易文本。本发明实施例由系统解析、人工验证保障了金融业对结果的高可靠性要求,结合“自然语言处理”算法和“金融逻辑规则”提高了整套系统的准确率;而且提升了交易人员的工作效率。

Description

一种对现券交易文本进行处理的系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种对现券交易文本进行处理的系统。
背景技术
债券市场是发行和买卖债券的场所,它是金融市场的一个重要组成部分。虽然当前有电子化程度比较高的各种交易系统,但是我国大部分的银行间的市场交易主要还是通过“即时沟通工具(IM)”进行询价和成交汇总。由于交易对手众多,在询价沟通上,使用IM进行文本的沟通存在过程冗长繁琐的问题,在手动录入提交交易订单时也存在文字错漏的情况。
因此,如何将聊天框里的非结构的聊天对话文本,解析识别为结构化的信息,对于帮助交易员更好罗列、筛选、甄别有价值的询价信息,提高信息录入效率和准确率是一个关键的技术需求。
首先,目前并没有一套完整的系统,解决从聊天对话到现券自动解析识别的统一系统;聊天工具如QQ、微信等是独立的系统。针对现券交易文本的语义理解又是一套独立的系统,并没有形成一套整体。
其次,针对现券交易的解析识别,由于金融领域的专业性,通用领域的解析识别模型并不能很好的处理现券交易业务的文本。针对金融交易文本,并不能靠单一的文本分类或信息抽取等模型能够完成整个流程的工作,需要结合业务流程,融合多个模型和规则才能完成整个流程。
再次,针对具体的现券交易业务,不仅需要解析识别出其中的核心要素,还需要考虑各种复杂的场景,例如涉及合拆单、多交易方向、债券远期交易、债券多方交易(超三方)等较为复杂的业务场景,解析正确率相对较低。
由于以上的各种问题,以及在交易过程中的多方参与,现券交易文本中的要素众多,关系错综复杂;现有技术中无法实现从聊天对话对现券交易文本进行自动解析,需要通过人工进行信息提取,容易出现信息错误。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明提供了一种对现券交易文本进行处理的系统,旨在解决现有技术中需要人工从聊天对话对现券交易文本进行自动解析,容易出现信息错误的问题。
本发明的技术方案如下:
本发明实施例提供了一种对现券交易文本进行处理的系统,所述系统包括:
IM数据获取模块,用于IM提供的用户聊天数据;
解析识别模块,用于对IM聊天数据的文本意图进行解析识别、要素提取、要素结构化及标准化处理后,生成解析后的现券交易文本数据;
展示模块,用于根据解析后的现券交易文本数据,构建表格结构数据,将表格数据展示在前端交互界面;
修改确认模块,用于获取用户在前端交互界面上对表格数据的修改指令,根据修改指令对表格数据进行修改,生成目标交易文本。
进一步地,所述IM数据获取模块具体用于,接收IM提供的用户聊天数据对应的文本信息,并将文本信息进行标准化整理,统一成预设的数据输出格式后,生成标准聊天文本;其中所述文本信息的内容包括发送人、接收人、内容文本及发送时间。
进一步地,所述解析识别服务模块包括:
文本意图获取单元,用于对标准聊天文本进行分类判断,获取标准聊天文本的文本意图;
要素提取单元,用于对标准聊天文本的交易要素进行解析识别;
要素结构化单元,用于基于交易要素将标准聊天文本处理为若干条的订单信息;
要素标准化处理单元,用于对每一条订单信息进行标准化处理,生成解析后的现券交易文本数据。
进一步地,所述文本意图获取单元具体用于基于深度神经网络,构建分类算法模型,根据算法模型对标准聊天文本进行分类判断,获取标准聊天文本的文本意图。
进一步地,所述要素提取单元具体用于构建基于深度学习的信息提取模型,根据信息提取模型对标准聊天文本的交易要求进行提取。
进一步地,所述解析识别服务模块还包括:
订单类型获取单元,用于根据交易要素获取当前的标准聊天文本对应的订单类型,若订单类型为单一订单类型,则将标准聊天文本发送至要素标准化处理单元;
若订单类型为非单一订单类型,则对标准聊天文本进行切割、聚合后,形成逐条的单一订单后,再将逐条的单一订单发送至要素标准化处理单元。
进一步地,所述订单类型获取单元还包括订单聚合子单元,
所述订单聚合子单元,用于采用金融业务逻辑索引,对标准聊天文本进行切割、聚合,形成逐条的订单信息。
进一步地,所述要素标准化处理单元具体用于构建要素标准化库,根据要素标准化库对每一条订单信息中的要素进行逐一标准化处理,生成解析后的现券交易文本数据。
进一步地,所述系统还包括:
交易方向及交易对手处理模块,用于基于硬编码的方式构建出机构的逻辑索引,根据索引对交易对手和交易方向进行识别。
进一步地,所述系统还包括:
存储模块,用于接收用户修改后的最终交易订单,并提供下行服务接口,将解析后最终的标准结果下行至交易系统。
有益效果:本发明实施例结合“前端交互、后端解析”的整套系统,由系统解析、人工验证保障了金融业对结果的高可靠性要求,结合“自然语言处理”算法和“金融逻辑规则”能够弥补纯算法模型的不足,提高了整套系统的准确率;而且能够极大的提升交易人员的工作效率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种对现券交易文本进行处理的系统较佳实施例的功能原理框图;
图2为本发明一种对现券交易文本进行处理的系统的具体应用实施例的业务框架示意图;
图3为本发明一种对现券交易文本进行处理的系统的具体应用实施例的交易对手及交易方向识别示意图;
图4为本发明一种对现券交易文本进行处理的系统的具体应用实施例的参与方解析示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合附图对本发明实施例进行介绍。
本发明实施例提供了一种对现券交易文本进行处理的系统,请参阅图1,图1为本发明一种对现券交易文本进行处理的系统的较佳实施例的功能框图。如图1所示,系统包括:
IM数据获取模块11,用于IM提供的用户聊天数据;
解析识别模块12,用于对IM聊天数据的文本意图进行解析识别、要素提取、要素结构化及标准化处理后,生成解析后的现券交易文本数据;
展示模块13,用于根据解析后的现券交易文本数据,构建表格结构数据,将表格数据展示在前端交互界面;
修改确认模块14,用于获取用户在前端交互界面上对表格数据的修改指令,根据修改指令对表格数据进行修改,生成目标交易文本。
具体实施时,如图2所示,本发明实施例整套方案提供完整的IM数据下行、解析识别服务、结果展示、人工确认等功能,自动化完成整个业务的解析识别。首先开发标准的数据下行服务接口,接收IM(Instant Messaging,即时聊天)提供的用户聊天对话。其次基于NLP的意图识别、信息抽取等算法模型,提供对文本意图的解析识别,要素提取、要素结构化、标准化等服务。再次开发数据库服务保存解析结果,并且发送到前端交互界面。前段构建表格结构数据展示模块,提供解析结果展示、修改服务。由此实现用户通过IM聊天,自动化将聊天数据下行到解析分析系统,将解析结果发送到交互界面,用户简单确认后即可完成整个业务的自动解析识别。IM是目前Internet上最为流行的通讯方式,各种各样的即时通讯软件也层出不穷;服务提供商也提供了越来越丰富的通讯服务功能。不容置疑,Internet已经成为真正的信息高速公路。从实际工程应用角度出发,以计算机网络原理为指导,结合当前网络中的一些常用技术,编程实现基于C/S架构的网络聊天工具是切实可行的。IM包括但不限于QQ、微信等社交工具。
进一步地,IM数据获取模块具体用于,接收IM提供的用户聊天数据对应的文本信息,并将文本信息进行标准化整理,统一成预设的数据输出格式后,生成标准聊天文本;其中所述文本信息的内容包括发送人、接收人、内容文本及发送时间。
具体实施时,IM数据获取模块构建出数据上行服务接口,接收IM聊天提供的文本信息,包括“发送人、接收人、内容文本、发送时间”等信息。同时将信息进行标准化整理,统一成标准的数据输出格式,提供给下游任务。
进一步地,解析识别服务模块包括:
文本意图获取单元,用于对标准聊天文本进行分类判断,获取标准聊天文本的文本意图;
要素提取单元,用于对标准聊天文本的交易要素进行解析识别;
要素结构化单元,用于基于交易要素将标准聊天文本处理为若干条的订单信息;
要素标准化处理单元,用于对每一条订单信息进行标准化处理,生成解析后的现券交易文本数据。
具体实施时,解析识别服务模块主要是基于NLP的意图识别、信息抽取等算法模型,提供对文本意图的解析识别,要素提取、要素结构化、标准化等服务。其中NLP是神经语言程序学(Neuro-Linguistic Programming)的英文缩写。在香港,也有意译为身心语法程式学的。N(Neuro)指的是神经系统,包括大脑和思维过程。L(Linguistic)是指语言,更准确点说,是指从感觉信号的输入到构成意思的过程。P(Programming)是指为产生某种后果而要执行的一套具体指令。即指我们思维上及行为上的习惯,就如同电脑中的程序,可以透过更新软件而改变。故此,NLP被解释为研究我们的大脑如何工作的学问。也因此,NLP译为身心语法程式学或神经语言程序学。
进一步地,文本意图获取单元具体用于基于深度神经网络,构建分类算法模型,根据算法模型对标准聊天文本进行分类判断,获取标准聊天文本的文本意图。
具体实施时,基于深度神经网络算法,构建出分类算法模型,本方案采用基于Bert+softmax预训练的分类模型(包括但不限于此),对聊天对话文本进行分类判断,判断聊天对话为“询价、成交、闲聊”等意图。
进一步地,要素提取单元具体用于构建基于深度学习的信息提取模型,根据信息提取模型对标准聊天文本的交易要求进行提取。
具体实施时,套基于深度学习的信息抽取算法,对现券交易文本中的关键要素进行解析识别。本方案采用经典的Bert+LSTM+CRF(包括但不限于此)的信息抽取模型,抽取文本中的“债券代码、债券名称、交易量、期限、价格、利率、机构名”等等交易要素。
进一步地,解析识别服务模块还包括:
订单类型获取单元,用于根据交易要素获取当前的标准聊天文本对应的订单类型,若订单类型为单一订单类型,则将标准聊天文本发送至要素标准化处理单元;
若订单类型为非单一订单类型,则对标准聊天文本进行切割、聚合后,形成逐条的单一订单后,再将逐条的单一订单发送至要素标准化处理单元。
具体实施时,针对不同的对话文本,提供的核心要素的不同,本方案将文本划分为“单一订单”、“多个订单”两种类型,进行分别处理。其中单一订单进行直接标准化处理,多个订单则进入“结构聚合模块”进行切割、聚合处理,形成逐条的“单一订单”再进行标准化处理。
进一步地,订单类型获取单元还包括订单聚合子单元,
所述订单聚合子单元,用于采用金融业务逻辑索引,对标准聊天文本进行切割、聚合,形成逐条的订单信息。
具体实施时,采用金融业务逻辑索引,对文本区域进行切割。本方案以“债券名、债券代码”作为“订单”切割的核心。对多个债券交易的信息进行切割,形成多个逐条的订单信息。
进一步地,要素标准化处理单元具体用于构建要素标准化库,根据要素标准化库对每一条订单信息中的要素进行逐一标准化处理,生成解析后的现券交易文本数据。
具体地,依次对每一条订单的要素进行标准化处理。具体方案是构建出一系列的要素标准化库,针对每个要素进行逐一标准化。如时间“7月8日”标准化为“XXXX-07-08”,交易量“3kw”标准化为“3000万”。
进一步地,系统还包括:
交易方向及交易对手处理模块,用于基于硬编码的方式构建出机构的逻辑索引,根据索引对交易对手和交易方向进行识别。
具体实施时,由于文本中提供的只是机构名和交易方向信息,在业务中需要判断是卖方机构还是买方机构,而基于信息抽取的算法模型,并不能解决“机构”方向判断问题。由此本方案通过硬编码的方式构建出“机构”判断的逻辑索引,判断交易对手和交易方向。
如图3所示,首先基于信息抽取模型提取的要素,判断“每一个订单”中存在多少个“机构名”信息,针对不同数量,构建不同的硬编码逻辑。其流程如下如所示。
其次针对每种数量的机构名构建不同的硬编码逻辑。本方案针对每一种工况,构建对应的逻辑判断库:针对参与方的数量为1的情况,其逻辑如图3所示;
针对各种情况,均构建出相应的执行逻辑库;由此本方案解决对“机构名”是“过桥机构”、“本方机构”还是“对手机构”的判断。
本发明的系统还包括构建服务封装模块,将所有的逻辑封装成统一的服务接口,提供标准的文本解析服务。输入“发送方、接收方、文本信息”输出结构化后标准解析结果。
如图4所示,本发明实施例的系统还可以构建后端执行模块,获取的IM对话信息,调度服务封装模型模块,获取解析结果,同时将解析结果发送到前段交互面板,提供给用户确认。
本发明实施例的前端交互模块包括两大模块,一是聊天对话模块,提供IM的聊天对话交互。二是解析结果展示修改模块。将标准的对话结果展示成表格形式。同时提供结果编辑修改功能。例如,前端交互设计图中左边为IM聊天功能,右边展示解析的表格结果。
进一步地,系统还包括:
存储模块,用于接收用户修改后的最终交易订单,并提供下行服务接口,将解析后最终的标准结果下行至交易系统。
具体实施时,接收用户修改后的最终交易订单;并且提供数据下行服务接口,将解析后最终的标准结果下行到交易系统。
本发明实施例针对的是债券交易业务,但也不限于债券业务;可拓展到任意银行间市场交易的品种。
本发明实施例能够极大的提升交易人员的工作效率;
结合“自然语言处理”算法和“金融逻辑规则”能够弥补纯算法模型的不足,提高了整套系统的准确率;
结合“前端交互、后端解析”的整套系统,由系统解析、人工验证保障了金融业对结果的高可靠性要求;
整套全链路的系统方案达到了商用的标准,可进行生产落地。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分的方法。
除了其他之外,诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解,否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。因此,这样的条件语言一般地还旨在暗示特征、元件和/或操作对于一个或多个实施方式无论如何都是需要的或者一个或多个实施方式必须包括用于在有或没有输入或提示的情况下判定这些特征、元件和/或操作是否被包括或者将在任何特定实施方式中被执行的逻辑。
已经在本文中在本说明书和附图中描述的内容包括能够提供同业存单的展示方法及装置的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。

Claims (10)

1.一种对现券交易文本进行处理的系统,其特征在于,所述系统包括:
IM数据获取模块,用于IM提供的用户聊天数据;
解析识别模块,用于对IM聊天数据的文本意图进行解析识别、要素提取、要素结构化及标准化处理后,生成解析后的现券交易文本数据;
展示模块,用于根据解析后的现券交易文本数据,构建表格结构数据,将表格数据展示在前端交互界面;
修改确认模块,用于获取用户在前端交互界面上对表格数据的修改指令,根据修改指令对表格数据进行修改,生成目标交易文本。
2.根据权利要求1所述的系统,其特征在于,所述IM数据获取模块具体用于,接收IM提供的用户聊天数据对应的文本信息,并将文本信息进行标准化整理,统一成预设的数据输出格式后,生成标准聊天文本;其中所述文本信息的内容包括发送人、接收人、内容文本及发送时间。
3.根据权利要求2所述的系统,其特征在于,所述解析识别服务模块包括:
文本意图获取单元,用于对标准聊天文本进行分类判断,获取标准聊天文本的文本意图;
要素提取单元,用于对标准聊天文本的交易要素进行解析识别;
要素结构化单元,用于基于交易要素将标准聊天文本处理为若干条的订单信息;
要素标准化处理单元,用于对每一条订单信息进行标准化处理,生成解析后的现券交易文本数据。
4.根据权利要求3所述的系统,其特征在于,所述文本意图获取单元具体用于基于深度神经网络,构建分类算法模型,根据算法模型对标准聊天文本进行分类判断,获取标准聊天文本的文本意图。
5.根据权利要求4所述的系统,其特征在于,所述要素提取单元具体用于构建基于深度学习的信息提取模型,根据信息提取模型对标准聊天文本的交易要求进行提取。
6.根据权利要求5所述的系统,其特征在于,所述解析识别服务模块还包括:
订单类型获取单元,用于根据交易要素获取当前的标准聊天文本对应的订单类型,若订单类型为单一订单类型,则将标准聊天文本发送至要素标准化处理单元;
若订单类型为非单一订单类型,则对标准聊天文本进行切割、聚合后,形成逐条的单一订单后,再将逐条的单一订单发送至要素标准化处理单元。
7.根据权利要求6所述的系统,其特征在于,所述订单类型获取单元还包括订单聚合子单元,
所述订单聚合子单元,用于采用金融业务逻辑索引,对标准聊天文本进行切割、聚合,形成逐条的订单信息。
8.根据权利要求7所述的系统,其特征在于,所述要素标准化处理单元具体用于构建要素标准化库,根据要素标准化库对每一条订单信息中的要素进行逐一标准化处理,生成解析后的现券交易文本数据。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
交易方向及交易对手处理模块,用于基于硬编码的方式构建出机构的逻辑索引,根据索引对交易对手和交易方向进行识别。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括:
存储模块,用于接收用户修改后的最终交易订单,并提供下行服务接口,将解析后最终的标准结果下行至交易系统。
CN202111314664.1A 2021-11-08 2021-11-08 一种对现券交易文本进行处理的系统 Pending CN113971389A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111314664.1A CN113971389A (zh) 2021-11-08 2021-11-08 一种对现券交易文本进行处理的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111314664.1A CN113971389A (zh) 2021-11-08 2021-11-08 一种对现券交易文本进行处理的系统

Publications (1)

Publication Number Publication Date
CN113971389A true CN113971389A (zh) 2022-01-25

Family

ID=79589584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111314664.1A Pending CN113971389A (zh) 2021-11-08 2021-11-08 一种对现券交易文本进行处理的系统

Country Status (1)

Country Link
CN (1) CN113971389A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976313A (zh) * 2023-09-18 2023-10-31 中信证券股份有限公司 场外交易指令文本的解析方法、装置和计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976313A (zh) * 2023-09-18 2023-10-31 中信证券股份有限公司 场外交易指令文本的解析方法、装置和计算机可读介质
CN116976313B (zh) * 2023-09-18 2024-01-02 中信证券股份有限公司 场外交易指令文本的解析方法、装置和计算机可读介质

Similar Documents

Publication Publication Date Title
US20220292465A1 (en) Multi-service business platform system having payments systems and methods
CN108108387B (zh) 基于模版的结构化文档分类和提取
CN112099768B (zh) 业务流程处理方法、装置及计算机可读存储介质
US20220343250A1 (en) Multi-service business platform system having custom workflow actions systems and methods
US9563904B2 (en) Extracting product purchase information from electronic messages
US9875486B2 (en) Extracting product purchase information from electronic messages
US9710829B1 (en) Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
EP2727009A2 (en) Automatic classification of electronic content into projects
CN109741118A (zh) 发票开具方法、装置、设备及计算机可读存储介质
CN108845986A (zh) 一种情感分析方法、设备及系统、计算机可读存储介质
CN114202755A (zh) 基于ocr和nlp技术的交易背景真实性审核方法和系统
US11914663B2 (en) Generating diverse electronic summary documents for a landing page
CN105786961A (zh) 一种基于金融资讯的数据分类处理方法
CN114549241A (zh) 合同审查方法、装置、系统与计算机可读存储介质
CN113343637A (zh) 非结构化文本的处理方法、装置、电子设备及介质
CN111782793A (zh) 智能客服处理方法和系统及设备
CN107507052B (zh) 一种报价信息获取方法及装置
CN113051380A (zh) 信息生成方法、装置、电子设备和存储介质
CN113971389A (zh) 一种对现券交易文本进行处理的系统
CN115455151A (zh) 一种ai情绪可视化识别方法、系统及云平台
WO2016064679A1 (en) Extracting product purchase information from electronic messages
Mahmud et al. Comparison of machine learning algorithms for sentiment classification on fake news detection
US11880394B2 (en) System and method for machine learning architecture for interdependence detection
CN113239188A (zh) 一种一套金融交易对话信息分析技术方案
US20230134796A1 (en) Named entity recognition system for sentiment labeling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination