CN109241271B - 一种汇票交易机器人识别自然语言中汇票到期日的方法 - Google Patents

一种汇票交易机器人识别自然语言中汇票到期日的方法 Download PDF

Info

Publication number
CN109241271B
CN109241271B CN201811003331.5A CN201811003331A CN109241271B CN 109241271 B CN109241271 B CN 109241271B CN 201811003331 A CN201811003331 A CN 201811003331A CN 109241271 B CN109241271 B CN 109241271B
Authority
CN
China
Prior art keywords
date
character
month
day
money order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811003331.5A
Other languages
English (en)
Other versions
CN109241271A (zh
Inventor
张壳
赵璟寰
田标
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zuopiaojun Robot Technology Co ltd
Original Assignee
Tianjin Zuopiaojun Robot Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zuopiaojun Robot Technology Co ltd filed Critical Tianjin Zuopiaojun Robot Technology Co ltd
Priority to CN201811003331.5A priority Critical patent/CN109241271B/zh
Publication of CN109241271A publication Critical patent/CN109241271A/zh
Application granted granted Critical
Publication of CN109241271B publication Critical patent/CN109241271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种汇票交易机器人识别自然语言中汇票到期日的方法,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免了发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。

Description

一种汇票交易机器人识别自然语言中汇票到期日的方法
技术领域
本发明属于人工智能自然语言处理的技术领域,尤其涉及一种应用于金融行业银行承兑汇票交易的汇票交易机器人识别自然语言中汇票到期日的方法。
背景技术
根据统计局有关统计数据显示,我国现有企业中80%—90%的企业都是中小型企业,这些企业在供应链中处于末端地位,而有些上游企业在付款上,会采用汇票的形式,但是一张100万的汇票,变现可能只有95万左右,甚至有些中小型企业的汇票,根本无法流通或激活。而在传统交易模式下,交易双方一般通过电话、微信进行一对一的窗口询价,速度慢、费时费力,很难打开询价覆盖面。除此之外,传统交易模式下,交易对手的安全大数据存在每个人大脑,没有一个共享的安全数据,即使找到较好的价格也不敢交易。而随着人工智能技术发展,汇票电子化市场也迎来转型浪潮,汇票市场具备“互联网+”的改造可能,也就是对汇票进行联网信息撮合,能够帮助这些中小型企业找出更高价格的单位,从而帮助中小型企业贴回更多的资金,以达到降低社会汇票融资成本的目的。
而目前汇票联网交易信息撮合主要在微信、qq等即时通讯软件上进行。汇票交易商(买卖方)通过交换各自的汇票库存和汇票利率表,计算各自的卖出价格,协商交易方式,实现汇票交易。由于汇票价格计算中需要计算计息天数,因此提取并识别出在聊天记录中产生涉及自然语言的汇票到期日信息就至关重要了,如果采用人工识别的方法,需要先通过人工对交易双方的聊天记录进行到期日信息识别,然后转换为标准格式,通过构建汇票到期日和交易价格构成的大数据数据库,为其他交易方提供询价和计算功能,此过程费时费力,效率极低,而且人工处理存在准确度较低的问题,一旦发生识别错误,错误地确定实际汇票到期日,将会在为客户提供询价服务时提供错误的贴现额,将会给市场经纪人和投资者产生较大的经济损失和信用风险。
发明内容
针对以上现有存在的问题,本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
本发明的技术方案在于:
本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,1、包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
进一步地,所述人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
进一步地,所述日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
进一步地,所述日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
本发明由于采用了上述技术,使之与现有技术相比具体的积极有益效果为:
1、本发明主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成。
2、本发明通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
3、本发明通过准确识别出交易双方聊天记录中的汇票到期日信息,以便于通过构建汇票到期日和交易价格构建的大数据数据库,便于为其他交易方的询价提供支撑。
附图说明
图1是本发明的算法框图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
实施例1,如附图1所示,本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
通过采用上述技术方案,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
以上对本发明的一个实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。

Claims (4)

1.一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
2.根据权利要求1所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
3.根据权利要求1或2所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
4.根据权利要求3所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
CN201811003331.5A 2018-08-30 2018-08-30 一种汇票交易机器人识别自然语言中汇票到期日的方法 Active CN109241271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811003331.5A CN109241271B (zh) 2018-08-30 2018-08-30 一种汇票交易机器人识别自然语言中汇票到期日的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811003331.5A CN109241271B (zh) 2018-08-30 2018-08-30 一种汇票交易机器人识别自然语言中汇票到期日的方法

Publications (2)

Publication Number Publication Date
CN109241271A CN109241271A (zh) 2019-01-18
CN109241271B true CN109241271B (zh) 2021-09-17

Family

ID=65067900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811003331.5A Active CN109241271B (zh) 2018-08-30 2018-08-30 一种汇票交易机器人识别自然语言中汇票到期日的方法

Country Status (1)

Country Link
CN (1) CN109241271B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008127708A2 (en) * 2007-04-12 2008-10-23 Cognika Corporation Apparatus and method for learning and reasoning for systems with temporal and non-temporal variables
CN104584010A (zh) * 2012-09-19 2015-04-29 苹果公司 基于语音的媒体搜索
US9472185B1 (en) * 2011-01-05 2016-10-18 Interactions Llc Automated recognition system for natural language understanding
US9565154B1 (en) * 2016-01-14 2017-02-07 International Business Machines Corporation Message management method
CN106409295A (zh) * 2015-07-31 2017-02-15 腾讯科技(深圳)有限公司 从自然语音信息中识别时间信息的方法和装置
CN106528599A (zh) * 2016-09-23 2017-03-22 深圳凡豆信息科技有限公司 一种海量音频数据中的字符串快速模糊匹配算法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
CN107862608A (zh) * 2017-11-27 2018-03-30 田标 一种基于人工智能的汇票撮合交易机器人
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008127708A2 (en) * 2007-04-12 2008-10-23 Cognika Corporation Apparatus and method for learning and reasoning for systems with temporal and non-temporal variables
US9472185B1 (en) * 2011-01-05 2016-10-18 Interactions Llc Automated recognition system for natural language understanding
CN104584010A (zh) * 2012-09-19 2015-04-29 苹果公司 基于语音的媒体搜索
CN106409295A (zh) * 2015-07-31 2017-02-15 腾讯科技(深圳)有限公司 从自然语音信息中识别时间信息的方法和装置
US9565154B1 (en) * 2016-01-14 2017-02-07 International Business Machines Corporation Message management method
CN106528599A (zh) * 2016-09-23 2017-03-22 深圳凡豆信息科技有限公司 一种海量音频数据中的字符串快速模糊匹配算法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并发票据识别系统与方法
CN107862608A (zh) * 2017-11-27 2018-03-30 田标 一种基于人工智能的汇票撮合交易机器人
CN108446621A (zh) * 2018-03-14 2018-08-24 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质

Also Published As

Publication number Publication date
CN109241271A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
WO2018217891A1 (en) System and method for identification of missing data elements in electronic documents
US11138372B2 (en) System and method for reporting based on electronic documents
Maranzato et al. Fraud detection in reputation systems in e-markets using logistic regression and stepwise optimization
Prier et al. Analysing the European Union's tenders electronic daily: Possibilities and pitfalls
Omura et al. The quantile dependence of commodity futures markets on news sentiment
Kumaraswamy et al. Trade credit management and firm profitability of Saudi manufacturing firms
JP5922089B2 (ja) 為替明細情報を利用した与信管理システムおよび方法
Fahlevi et al. Blockchain security and corporate governance
CN109241271B (zh) 一种汇票交易机器人识别自然语言中汇票到期日的方法
CN113449010A (zh) 投资机构收益信息挖掘方法、装置、电子设备和存储介质
CN111161068B (zh) 交易要素核对方法以及装置
Özkan et al. Is the letter of credit losing its significance? A new payment method in international trade BPO/Bank Payment Obligation
CN109189928B (zh) 一种汇票交易机器人的授信信息识别方法
CN112862526A (zh) 一种大数据金融资产实时估值方法、装置及可读介质
CN110929155B (zh) 产品信息推荐方法、装置、电子设备及存储介质
CN112199360A (zh) 一种数据的处理方法、装置、设备和介质
CN112053237A (zh) 一种银行对公客户的工商信息识别方法、装置及设备
CN109146641A (zh) 一种汇票交易机器人的网上拼团交易方法
US20170169519A1 (en) System and method for automatically verifying transactions based on electronic documents
EP3494496A1 (en) System and method for reporting based on electronic documents
KR102308098B1 (ko) 매출 채권과 입출금 정보간 자동화된 매칭 서비스에 기초한 사용자 인터페이스 제공 방법 및 그 장치
CN109154949A (zh) 基于未结构化电子文档而实时提供分析
CN114020895A (zh) 一种数据录入方法、装置、电子设备及存储介质
CN117011049A (zh) 一种基金交易系统中批量交易的方法
Subathra et al. The macroeconomic determinants of Nifty-a quantitative approach based on causal factoring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant