CN109241271A - 一种汇票交易机器人识别自然语言中汇票到期日的方法 - Google Patents
一种汇票交易机器人识别自然语言中汇票到期日的方法 Download PDFInfo
- Publication number
- CN109241271A CN109241271A CN201811003331.5A CN201811003331A CN109241271A CN 109241271 A CN109241271 A CN 109241271A CN 201811003331 A CN201811003331 A CN 201811003331A CN 109241271 A CN109241271 A CN 109241271A
- Authority
- CN
- China
- Prior art keywords
- date
- character
- month
- character string
- bill
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种汇票交易机器人识别自然语言中汇票到期日的方法,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免了发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
Description
技术领域
本发明属于人工智能自然语言处理的技术领域,尤其涉及一种应用于金融行业银行承兑汇票交易的汇票交易机器人识别自然语言中汇票到期日的方法。
背景技术
根据统计局有关统计数据显示,我国现有企业中80%—90%的企业都是中小型企业,这些企业在供应链中处于末端地位,而有些上游企业在付款上,会采用汇票的形式,但是一张100万的汇票,变现可能只有95万左右,甚至有些中小型企业的汇票,根本无法流通或激活。而在传统交易模式下,交易双方一般通过电话、微信进行一对一的窗口询价,速度慢、费时费力,很难打开询价覆盖面。除此之外,传统交易模式下,交易对手的安全大数据存在每个人大脑,没有一个共享的安全数据,即使找到较好的价格也不敢交易。而随着人工智能技术发展,汇票电子化市场也迎来转型浪潮,汇票市场具备“互联网+”的改造可能,也就是对汇票进行联网信息撮合,能够帮助这些中小型企业找出更高价格的单位,从而帮助中小型企业贴回更多的资金,以达到降低社会汇票融资成本的目的。
而目前汇票联网交易信息撮合主要在微信、qq等即时通讯软件上进行。汇票交易商(买卖方)通过交换各自的汇票库存和汇票利率表,计算各自的卖出价格,协商交易方式,实现汇票交易。由于汇票价格计算中需要计算计息天数,因此提取并识别出在聊天记录中产生涉及自然语言的汇票到期日信息就至关重要了,如果采用人工识别的方法,需要先通过人工对交易双方的聊天记录进行到期日信息识别,然后转换为标准格式,通过构建汇票到期日和交易价格构成的大数据数据库,为其他交易方提供询价和计算功能,此过程费时费力,效率极低,而且人工处理存在准确度较低的问题,一旦发生识别错误,错误地确定实际汇票到期日,将会在为客户提供询价服务时提供错误的贴现额,将会给市场经纪人和投资者产生较大的经济损失和信用风险。
发明内容
针对以上现有存在的问题,本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
本发明的技术方案在于:
本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,1、包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
进一步地,所述人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
进一步地,所述日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
进一步地,所述日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
本发明由于采用了上述技术,使之与现有技术相比具体的积极有益效果为:
1、本发明主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成。
2、本发明通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
3、本发明通过准确识别出交易双方聊天记录中的汇票到期日信息,以便于通过构建汇票到期日和交易价格构建的大数据数据库,便于为其他交易方的询价提供支撑。
附图说明
图1是本发明的算法框图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
实施例1,如附图1所示,本发明提供一种汇票交易机器人识别自然语言中汇票到期日的方法,包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
通过采用上述技术方案,主要分为两个步骤,即日期提取和日期清洗,也就是在交易双方的聊天记录中自然语言转换为文本信息后,从文本信息中提取一个字符串,首先对该字符串判定是否存在日期相关的关键词,如果存在相关关键词,则围绕关键词,提取关键词前后十几个字符进行清洗,清洗的同时将日期转换为标准的格式,最后存入相应的存储格式中等待其他程序调用,直至将所有文本信息中的字符串全部处理完成,也就是通过对聊天记录的文本信息进行全覆盖式的日期处理,准确确定汇票到期日,避免发生识别错误而错过实际汇票到期日,也就避免使得市场经纪人和投资者产生较大的经济损失和信用风险,提高了汇票交易安全性。
以上对本发明的一个实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。
Claims (4)
1.一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:包括:
S1,从交易双方聊天记录的文本信息中提取出一个字符串,然后从该字符串的左端开始,将整个字符串逐个字符进行判断;
S2,在字符串中对某一个字符进行判断时,先判断该字符所在位置前后7个字符长度内是否含有日期信息,也就是将这15个字符与日期信息关键词库进行比对,如果未含有日期信息关键词,则对字符串中该字符的下一个字符进行判断,如果含有日期信息关键词,将日期信息关键词周围20个字符进行日期提取出来,然后将从这21个字符中逐个字符与日期信息关键词库进行逐一比对,完成日期清洗,也就是提取出符合日期信息关键词库内一定日期格式的汇票到期日;
S3,接着再通过人工抽检方法判断清洗结果是否符合预期,未通过人工抽检方法判断清洗结果的数据默认符合预期,如果不符合预期,则将从字符串中该字符之后的第14个字符开始下一步的字符判断,如果符合预期,将该汇票到期日匹配到日期信息关键词库内获取最大相似的日期格式进行转换,转换为标准的日期格式:XXXX年XX月XX日,并从该21个字符中的最后一个字符的开始下一步字符判断;
S4,在字符进行判断,直至到达字符串的最末尾,完成该字符串的处理。
2.根据权利要求1所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述人工抽检方法为两种方法:一是每天随机选择一百条数据进行人工检测;二是根据到期日、承兑人、金额条件的不同组合,以此进行信息筛选,将筛选后的结果按照每十万扣的售卖价进行排序,对排序后的前一百条数据进行人工检测。
3.根据权利要求1或2所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述日期信息关键词库内所述日期信息关键词按范围包括范围型、以上型、以下型、准确型和特殊型,按表述方式包括时长表达方式、时刻表达方式和特殊型。
4.根据权利要求3所述的一种汇票交易机器人识别自然语言中汇票到期日的方法,其特征在于:所述日期信息关键词库内所述日期信息关键词包括:“一年内”、“一年期”、“半年以上”、“半年以内”、“半年期”、“xx个月-xx个月”、“x个月以上”、“x个月以内”、“x个月”、“xx天-yy天”、“xxx天以上”、“xx天以内”、“xx月yy日-zz月aa日”、“xx月yy日之前到期”、“xx月yy日之后到期”、“xx月份-yy月份”、“xx月份之后”、“x月初到期”、“x月份之内”、“xx月底前到期”、“不限时间”、“x季度”、“本季度/季度内”、“年前到期”、“年后到期”、“xxxx年到期”和“xxxx年xx月xx日”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811003331.5A CN109241271B (zh) | 2018-08-30 | 2018-08-30 | 一种汇票交易机器人识别自然语言中汇票到期日的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811003331.5A CN109241271B (zh) | 2018-08-30 | 2018-08-30 | 一种汇票交易机器人识别自然语言中汇票到期日的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241271A true CN109241271A (zh) | 2019-01-18 |
CN109241271B CN109241271B (zh) | 2021-09-17 |
Family
ID=65067900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811003331.5A Active CN109241271B (zh) | 2018-08-30 | 2018-08-30 | 一种汇票交易机器人识别自然语言中汇票到期日的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241271B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127708A2 (en) * | 2007-04-12 | 2008-10-23 | Cognika Corporation | Apparatus and method for learning and reasoning for systems with temporal and non-temporal variables |
CN104584010A (zh) * | 2012-09-19 | 2015-04-29 | 苹果公司 | 基于语音的媒体搜索 |
US9472185B1 (en) * | 2011-01-05 | 2016-10-18 | Interactions Llc | Automated recognition system for natural language understanding |
US9565154B1 (en) * | 2016-01-14 | 2017-02-07 | International Business Machines Corporation | Message management method |
CN106409295A (zh) * | 2015-07-31 | 2017-02-15 | 腾讯科技(深圳)有限公司 | 从自然语音信息中识别时间信息的方法和装置 |
CN106528599A (zh) * | 2016-09-23 | 2017-03-22 | 深圳凡豆信息科技有限公司 | 一种海量音频数据中的字符串快速模糊匹配算法 |
CN107480681A (zh) * | 2017-08-02 | 2017-12-15 | 四川长虹电器股份有限公司 | 基于深度学习的高并发票据识别系统与方法 |
CN107862608A (zh) * | 2017-11-27 | 2018-03-30 | 田标 | 一种基于人工智能的汇票撮合交易机器人 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
-
2018
- 2018-08-30 CN CN201811003331.5A patent/CN109241271B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127708A2 (en) * | 2007-04-12 | 2008-10-23 | Cognika Corporation | Apparatus and method for learning and reasoning for systems with temporal and non-temporal variables |
US9472185B1 (en) * | 2011-01-05 | 2016-10-18 | Interactions Llc | Automated recognition system for natural language understanding |
CN104584010A (zh) * | 2012-09-19 | 2015-04-29 | 苹果公司 | 基于语音的媒体搜索 |
CN106409295A (zh) * | 2015-07-31 | 2017-02-15 | 腾讯科技(深圳)有限公司 | 从自然语音信息中识别时间信息的方法和装置 |
US9565154B1 (en) * | 2016-01-14 | 2017-02-07 | International Business Machines Corporation | Message management method |
CN106528599A (zh) * | 2016-09-23 | 2017-03-22 | 深圳凡豆信息科技有限公司 | 一种海量音频数据中的字符串快速模糊匹配算法 |
CN107480681A (zh) * | 2017-08-02 | 2017-12-15 | 四川长虹电器股份有限公司 | 基于深度学习的高并发票据识别系统与方法 |
CN107862608A (zh) * | 2017-11-27 | 2018-03-30 | 田标 | 一种基于人工智能的汇票撮合交易机器人 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109241271B (zh) | 2021-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Borges | Efficient market hypothesis in European stock markets | |
CN109559210A (zh) | 基于大数据与云计算的人工智能记账与自动报税方法 | |
Layfield | Turning carbon into gold: the financialisation of international climate policy | |
Peng | Analysis of investor sentiment and stock market volatility trend based on big data strategy | |
Sun et al. | Predicting futures market movement using deep neural networks | |
CN108764990A (zh) | 一种基于微信小程序发语音红包软件 | |
CN109241271A (zh) | 一种汇票交易机器人识别自然语言中汇票到期日的方法 | |
Zhang et al. | Modeling social attention for stock analysis: An influence propagation perspective | |
Handoko et al. | The impact of auditor communication and due professional care on client responses to inquiries for successful audit process | |
Pratika et al. | Self-Control Therapy: Daily Accounting and Focus Group Discussions Reduce Consumptive Behavior of E-Money Use in Millennials | |
CN109635289A (zh) | 词条分类方法及审计信息抽取方法 | |
Özkan et al. | Is the letter of credit losing its significance? A new payment method in international trade BPO/Bank Payment Obligation | |
Poulain | Notes on the quantification of post-medieval pottery in the Low Countries | |
Beverly et al. | Findings and implications from data mining the IMC review process | |
CN109146641A (zh) | 一种汇票交易机器人的网上拼团交易方法 | |
Chattupan et al. | Thai stock news sentiment classification using wordpair features | |
CN109189928B (zh) | 一种汇票交易机器人的授信信息识别方法 | |
Rosa et al. | Written communication of a large organization with mature consumers | |
Khan et al. | Empathy of Bank Employees and Its Influence on Service Quality of Banks: Evidence from the Knowledge Economy of Kerala in Digital India | |
Lu | Can profit targets improve the profitability of candlestick charting? | |
Ullah et al. | the Contagion Effects of Covid-19 Pandemic on Cryptocurrencies | |
CN107705204A (zh) | 一种用于票据交易的用户反馈管理方法及系统 | |
Masry et al. | The Impact of share repurchases on liquidity and return volatility in Egyptian Stock Exchange | |
Huang et al. | Social Network Sentiment and Markets: Evidence from the Wallstreetbets Forum | |
CN107392774A (zh) | 基于云端指标的自动平仓系统的实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |