CN107038185A - 一种交易信息处理的方法及装置 - Google Patents

一种交易信息处理的方法及装置 Download PDF

Info

Publication number
CN107038185A
CN107038185A CN201610902159.1A CN201610902159A CN107038185A CN 107038185 A CN107038185 A CN 107038185A CN 201610902159 A CN201610902159 A CN 201610902159A CN 107038185 A CN107038185 A CN 107038185A
Authority
CN
China
Prior art keywords
transaction
participle
information
database
transaction information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610902159.1A
Other languages
English (en)
Inventor
张惠亮
刘胜
赵晓庆
吴锋海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Union Mobile Pay Co Ltd
Original Assignee
Union Mobile Pay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Union Mobile Pay Co Ltd filed Critical Union Mobile Pay Co Ltd
Priority to CN201610902159.1A priority Critical patent/CN107038185A/zh
Publication of CN107038185A publication Critical patent/CN107038185A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种交易信息处理的方法及装置,从终端接收的推送信息中确定交易信息;根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。本发明实施例提供的交易信息处理的方法及装置不需要匹配模板,而是根据数据库和预设的结束标识,获取待提取部分,并提取待提取部分提取的各交易数据项,提高了交易信息解析的准确性。

Description

一种交易信息处理的方法及装置
技术领域
本发明涉及金融领域,尤其涉及一种交易信息处理的方法及装置。
背景技术
随着银行服务意识的提升,当用户发生交易行为时,都会给用户及时推送交易信息,具体可以通过传统的短信渠道发送到用户手机上去,也可以通过手机APP(Application,应用程序)推送消息,或通过第三方应用平台站内消息的方式进行推送。而交易消息中蕴含着巨大的价值,一条交易信息中包含本次交易的时间、卡号、行为、目的、金额等信息。而银行为了推送自己的其它增值服务,一般会在交易信息中出现广告等信息,从而影响交易信息的准确提取。因此,需要对用户手机中的交易短信和推送通知进行分析,从中提取关键信息,并进行合理分类,帮助用户统计当月消费趋势及提供相应的消费建议,以满足用户的需求。
目前,对金融交易信息的处理方法为:首先对各个银行的交易信息结构进行规则总结,定义数据项对应的关键词,得到各个银行的交易信息模板;然后利用正则表达式结构化所需交易数据项,提取交易数据项信息。现有方法主要存在以下问题:
(1)每个银行的交易信息模板不尽相同,交易数据项在信息中出现的位置会经常发生变化,因此需要大量的人工维护,而且当交易信息结构发生变化而未及时修改模板时,会导致交易信息解析不准确;
(2)银行为了给用户提供更好的服务,通常会在交易信息中增加广告或者针对该用户的提醒通知,这类内容中通常会包含与交易相关的关键字,但是又不属于用户交易信息,从而影响了提取数据项的准确性。
综上所述,现有的交易信息直接通过匹配银行交易信息模板的方式进行处理,存在交易信息解析不准确的问题,导致用户需求匹配度较低。
发明内容
本发明提供一种交易信息处理的方法及装置,用以解决现有技术中交易信息直接通过匹配银行交易信息模板的方式进行处理,存在的交易信息解析不准确的问题。
本发明实施例提供一种交易信息处理的方法,包括:
从终端接收的推送信息中确定交易信息;
根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;
针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。
进一步地,所述从终端接收的推送信息中确定交易信息,包括:
针对每个推送信息,获取所述推送信息从首字符开始的预设数量的字符串,将所述字符串与第三数据库匹配,所述第三数据库中存储有交易信息对应的关键词;
将匹配成功的所述字符串对应的推送信息作为交易信息。
进一步地,所述根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,包括:
对所述待提取部分进行分词;
根据所述第二数据库中关键词,确定各分词对应的交易数据项。
进一步地,所述交易数据项至少包括交易行为、交易金额;
所述根据所述第二数据库中关键词,确定各分词对应的交易数据项,包括:
确定所述待提取部分的交易数据项为交易金额的分词;
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易账号、交易时间;
所述将距离所述交易金额的分词最近的交易行为确定为所述标准交易信息的交易行为,包括:
分别确定所述交易账号对应的分词、所述交易时间对应的分词、所述交易金额对应的分词;
从所述交易账号对应的分词或所述交易时间对应的分词与所述交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离所述交易金额的分词最近的交易行为对应的分词作为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易目的,所述将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为之后,还包括:
若存在既属于交易行为又属于交易目的的分词时,则确定所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
进一步地,所述第二数据库中存储有交易行为对应的各关键词的交易方向信息,所述根据所述第二数据库中关键词,确定各分词对应的交易数据项,包括:
根据确定的所述待提取部分的交易行为的分词,在所述第二数据库中提取所述分词对应的关键词的交易方向;
统计所述终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
本发明实施例还提供一种交易信息处理的装置,包括:
交易信息确定模块:用于从终端接收的推送信息中确定交易信息;
标准信息确定模块:用于根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;
交易数据项确定模块:针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。
进一步地,所述交易信息确定模块,具体用于:
针对每个推送信息,获取所述推送信息从首字符开始的预设数量的字符串,将所述字符串与第三数据库匹配,所述第三数据库中存储有交易信息对应的关键词;
将匹配成功的所述字符串对应的推送信息作为交易信息。
进一步地,所述交易数据项确定模块,具体用于:
对所述待提取部分进行分词;
根据所述第二数据库中关键词,确定各分词对应的交易数据项。
进一步地,所述交易数据项至少包括交易行为、交易金额;
所述交易数据项确定模块,还用于:
确定所述待提取部分的交易数据项为交易金额的分词;
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易账号、交易时间;
所述交易数据项确定模块,具体用于:
分别确定所述交易账号对应的分词、所述交易时间对应的分词、所述交易金额对应的分词;
从所述交易账号对应的分词或所述交易时间对应的分词与所述交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离所述交易金额的分词最近的交易行为对应的分词作为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易目的,所述交易数据项确定模块,还用于:
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为之后,若存在既属于交易行为又属于交易目的的分词时,则确定所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
进一步地,所述第二数据库中存储有交易行为对应的各关键词的交易方向信息,所述交易数据项确定模块,还用于:
根据确定的所述待提取部分的交易行为的分词,在所述第二数据库中提取所述分词对应的关键词的交易方向;
统计所述终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
本发明实施例提供的交易信息处理的方法及装置,从终端接收的推送信息中确定交易信息;根据第一数据库,从交易信息中确定出标准交易信息,针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分;根据第二数据库,从待提取部分提取标准交易信息的各交易数据项。本发明实施例提供的交易信息处理的方法及装置不需要匹配模板,而是通过数据库筛选的方式得到待提取部分,然后根据交易数据项分别对应的关键词确定待提取部分的各交易数据项。由于不需要匹配模板,节省了大量人工维护成本;此外,通过结束标识判断有效交易数据的位置,消除了交易信息中的广告部分的影响,提高了交易信息解析的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种交易信息处理的方法流程示意图;
图2为本发明实施例提供的一种交易信息处理的方法流程图;
图3为本发明实施例提供的一种交易信息处理的装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供一种交易信息处理的方法,应用于金融服务领域,例如,对银行推送给用户的消息进行解析。如图1所示,为本发明实施例提供的一种交易信息处理的方法流程示意图,包括:
步骤101:从终端接收的推送信息中确定交易信息;
步骤102:根据第一数据库,从交易信息中确定出标准交易信息。
其中,第一数据库中存储有非标准类关键词;
步骤103:针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分;根据第二数据库,从待提取部分提取标准交易信息的各交易数据项。
其中,第二数据库中存储有各交易数据项分别对应的关键词。
需要说明的是,银行推送给用户信息的方式可以为短信形式,也可以为APP推送消息形式及第三方应用平台站内消息的形式,但是不管采用何种形式,均需预先通过用户的授权许可。
此外,银行给用户发送的短信和推送信息有很多种类型,分别表示不同的应用场景。例如,当用户发送交易时发送交易提醒信息,当用户需要还款时会发送提醒还款信息,当用户生日或者银行促销活动时会推送相应的广告信息。
一般银行的交易信息都是为了将本次交易的相关信息推送给用户核实,因此语义和结构都很规范,以便用户快速理解,银行的交易信息主要有以下几类格式:
(1)尾号1234储蓄卡账户09:20通过ATM转出290元,余额200元。
(2)您账户5678于01月03日21:21发生网银快捷支付扣款31元。当月交易满100元送100积分。
(3)贵卡7619于2016年01月12日01:51收到外行汇款,入账人民币2000元。
(4)贵卡7619于2016年01月12日01:51汇款人民币2000元。
(5)贵卡3456于2016年01月12日01:51完成人民币2000元入账操作。
(6)电子银行交易送话费,即日起至1月2日受邀客户使用个人网银、手机银行,进行任意一笔金融交易,前1000名客户可获赠10元话费,每位客户仅可获赠一次。
(7)温馨提示,您的尾号为信用卡0310的卡本期账单截至2月3日欠款2000元,到期还款日2月20日。
(8)尾号6789卡1月4日分期付款提前还款已办理成功,本期应还金额3000元,总计手续费5元。
因此,首先要把交易信息从终端接收的所有推送信息中提取出来,本发明实施例中的终端接收到的推送消息不限于通过手机短信的方式,也包括终端应用程序APP推送方式和第三方应用平台站推送方式等。
具体地,步骤101中,首先针对每个推送信息,获取该推送信息从首字符开始的预设数量的字符串,然后将该字符串与第三数据库匹配,将匹配成功的字符串对应的推送信息作为交易信息。
其中,第三数据库中存储有交易信息对应的关键词。具体地,根据对交易信息格式的分析,预先储存通用的交易信息的开始字符串作为第三数据库,称为tradeBeginWordList。例如,“尾号”、“贵卡”、“您账户”、“信用卡”等词语。为了提高提取效率和准确率,预设数量可以根据第三数据库中的字符串长度设置为一个定值,如8,或者设置为从该推送信息开头第一个字符开始至出现的第一个数字。例如,针对上述8条推送消息(1)~(8),获取该从首字符开始的8个的字符串,然后将该字符串与第三数据库匹配,得到(1)、(2)、(3)、(4)、(5)、(8)匹配成功,(6)和(7)匹配失败,则将(1)、(2)、(3)、(4)、(5)、(8)作为交易信息,排除上述所列举的非交易信息(6)和(7)。
为了统计用户银行卡的金额变动,需要排除与金额变动无关的非标准类信息。预先存储非标准类关键字作为第三数据库,称为otherWordList,例如,“已办理成功”、“受理成功”、“放贷”等。若交易信息出现非标准类关键词,则将该交易信息排除,如上述推送消息中的(8)。从而得到上述推送消息(1)~(8)中,与用户银行卡的金额变动有关的消息(1)、(2)、(3)、(4)、(5)为标准交易信息。
进一步地,步骤103中,首先针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分。具体地,根据银行推送的交易信息的结构,广告类信息一般会用句号标识与用户的交易信息分隔开,因此可以设置结束标志为句号。针对一条标准交易信息,首先确定句号出现的位置,然后提取句号之前的内容作为待提取部分,这样可以有效降低广告信息的干扰。如推送信息(2)所示,虽然在句号后面的广告中还会出现金额100元,但由于该部分内容已经被排除所以并不影响交易特征的提取结果。
需要说明的是,若标准交易信息出现多次金额,由于通常首次出现的金额为与用户银行卡的金额变动有关,则将首次出现的金额及之前的内容作为待提取部分,例如推送消息(1),待提取部分为“尾号1234储蓄卡账户09:20通过ATM转出290元”。
因此,得到上述推送消息(1)至(5)的待提取部分分别为:“尾号1234储蓄卡账户09:20通过ATM转出290元”;“账户5678于01月03日21:21发生网银快捷支付扣款31元”;“贵卡7619于2016年01月12日01:51收到外行汇款,入账人民币2000元。”;“贵卡7619于2016年01月12日01:51汇款人民币2000元。”;“贵卡3456于2016年01月12日01:51完成人民币2000元入账操作”。
进一步地,步骤103前需预先存储各交易数据项分别对应的关键词作为第二数据库,交易数据项至少包括交易行为、交易金额,此外,根据交易信息格式的不同,交易数据项也可以包括交易账号、交易时间、交易目的等。
例如,交易时间对应的关键词可以包括:年、月、日、时、分、秒以及标点符号“:”等。交易金额对应的关键词可以包括:元、美元、人民币、符号“¥”等。交易行为对应的关键词称为tradeActionWordList,可以包括如下关键词:支出、存入、汇款等。交易目的对应的关键词称为tradePurposeWordList,可以包括如下关键词:汇款、理财、资金归集等。
需要说明的是,现有的定义数据项对应的关键词方式不够灵活,如将“还款”定义为交易行为对应的关键词,但是实际上很多时候“还款”是作为本次交易的目的,而交易行为可能是“入账”(例如:贵卡1111入账信用卡还款金额1000元),因此,由于现有技术中直接通过匹配银行交易信息模板的方式进程处理,因此按照固定的交易数据项与关键词的对应格式,会导致交易信息解析不准确。本发明实施例同一个词语可以属于两个不同的交易数项,例如,“汇款”既可以作为交易行为,也可以作为交易目的。其中,交易行为中每个词语会包含自己的方向属性,例如,支出为出账方向;存入为入账方向。
进一步地,步骤103中,提取了标准交易信息的待提取部分之后,首先对待提取部分进行分词,然后根据第二数据库中关键词,确定各分词对应的交易数据项。具体地,分别通过竖线对信息(1)至(5)的待提取部分的内容进行分词,得到以下格式:
尾号|1234①|储蓄卡账户|09:20②|通过|ATM|转出|290元③|
您账户|5678①|于|01月03日21:21②|发生|网银快捷支付|扣款|31元③|
贵卡|7619①|于|2016年01月12日01:51②|收到|外行|汇款|,|入账|人民币|2000元③|。
贵卡|7619①|于|2016年01月12日01:51②|汇款|人民币|2000元③|。
贵卡|3456①|于|2016年01月12日01:51②|完成|人民币|2000元③|入账|操作。
具体地,可以将信息中首次出现的数字序列设置为交易账号,然后根据第二数据库中各个交易数据项对应的关键词,确定每个分词对应的交易数据项,得到上述待提取部分中的①为交易账号,②为交易时间,③为交易金额。
对于银行的标准交易信息格式,应该符合以下的格式:
1.开始单词+①+②+A+P+③+广告(可选)
2.开始单词+①+②+P+A+③+广告(可选)
3.开始单词+①+②+A+③+广告(可选)
4.开始单词+①+②+③+A+广告(可选)
5.开始单词+①+②+③+A+P+广告(可选)
其中,上面格式中的①,②有时候会有缺失,但至少会出现一个。A为交易行为、O为交易方向、P为交易目的。
由于待提取部分可能包括多个交易行为A,因此确定待提取部分的交易数据项为交易金额的分词后,将距离交易金额的分词最近的交易行为A对应的分词确定为所述标准交易信息的交易行为A。
具体地,分别确定交易账号对应的分词、交易时间对应的分词以及交易金额对应的分词;从交易账号对应的分词或交易时间对应的分词与交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离交易金额的分词最近的交易行为对应的分词作为标准交易信息的交易行为。
例如,交易信息格式可能会出现以下两种异常情况:1)开始单词+①+②+P(可不出现)+③;2)开始单词+①+②+P(可不出现)+A+P(可不出现)+A+③
1)表示到金额前还未出现交易行为,如交易信息(5),此时将距离交易行为“汇款”最近的交易金额对应的分词“2000元”作为交易金额。
2)表示金额之前出现了多个交易行为A,同时在不同位置出现多个P,此时应该将离交易金额最近的交易行为A对应的分词作为标准交易信息的交易行为。若出现了多个交易目的P,则所出现的多个P对应的分词作为预选交易目的。
进一步地,确定了交易行为之后,还需要判断是否存在既属于交易行为又属于交易目的的分词时,若存在,则确定该既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
如推送信息(3),“汇款”和“入账”都为交易行为对应的分词,但是按照交易金额就近原则,同时考虑“汇款”为既属于交易行为又属于交易目的的分词时,所以将“入账”定义为消息(3)的交易行为,将“汇款”定义为消息(3)的交易目的。
进一步地,根据确定的待提取部分的交易行为的分词,在第二数据库中提取该分词对应的关键词的交易方向,并统计终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
具体地,根据确定的交易账号、交易时间,交易金额、交易行为及交易方向,可以统计出月(年、季度、周、日等)收入总额以及月(年、季度、周、日等)支出总额,并总结分析收支情况,通过资产管理类APP推送给用户。例如以下方式:
您本月有5笔交易
分属于3家银行
总共花了1000元
总共收入5000元
收大于入,很不错哦!
需要说明的是,本发明实施例不限于应用于资产管理类APP,也根据确定出的各交易数据项,优化推送信息的格式,以卡片式的方式推送给用户,例如:
交易时间:2016年1月1日12点19分
交易卡名称:信用卡
交易卡号:1122
交易金额:100元
交易行为:入账
交易目的:信用卡还款
本发明实施例提供的交易信息处理的方法,从终端接收的推送信息中确定交易信息;根据第一数据库,从交易信息中确定出标准交易信息,针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分;根据第二数据库,从待提取部分提取标准交易信息的各交易数据项。本发明实施例提供的交易信息处理的方法不需要匹配模板,而是通过数据库筛选的方式得到待提取部分,然后根据交易数据项分别对应的关键词确定待提取部分的各交易数据项。由于不需要匹配模板,节省了大量人工维护成本;此外,通过结束标识判断有效交易数据的位置,消除了交易信息中的广告部分的影响,提高了交易信息解析的准确性。
本发明实施例还提供一种交易信息处理的方法流程,如图2所示,为本发明实施例提供的交易信息处理的流程图,包括:
步骤201:从终端接收的推送信息中确定交易信息。
需要说明的是,银行推送给用户信息的方式可以为短信形式,也可以为APP推送消息形式及第三方应用平台站内消息的形式,但是不管采用何种形式,均需预先通过用户的授权许可。
具体地,在步骤201中,首先针对每个推送信息,获取该推送信息从首字符开始的预设数量的字符串,然后将该字符串与第三数据库匹配,将匹配成功的字符串对应的推送信息作为交易信息。
其中,第三数据库中存储有交易信息对应的关键词。具体地,根据对交易信息格式的分析,预先储存通用的交易信息的开始字符串作为第三数据库,称为tradeBeginWordList。例如,“尾号”、“贵卡”、“您账户”、“信用卡”等词语。为了提高提取效率和准确率,预设数量可以根据第三数据库中的字符串长度设置为一个定值,如8,或者设置为从该推送信息开头第一个字符开始至出现的第一个数字。例如,针对上述8条推送消息(1)~(8),获取该从首字符开始的8个的字符串,然后将该字符串与第三数据库匹配,得到(1)、(2)、(3)、(4)、(5)、(8)匹配成功,(6)和(7)匹配失败,则将(1)、(2)、(3)、(4)、(5)、(8)作为交易信息,排除上述所列举的非交易信息(6)和(7)。
步骤202:根据第一数据库,从交易信息中确定出标准交易信息。
其中,第一数据库中存储有非标准类关键词;
为了统计用户银行卡的金额变动,需要排除与金额变动无关的非标准类信息。预先存储非标准类关键字作为第三数据库,称为otherWordList,例如,“已办理成功”、“受理成功”、“放贷”等。若交易信息出现非标准类关键词,则将该交易信息排除,如上述推送消息中的(8)。从而得到上述推送消息(1)~(8)中,与用户银行卡的金额变动有关的消息(1)、(2)、(3)、(4)、(5)为标准交易信息。
步骤203:针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分。
具体地,根据银行推送的交易信息的结构,广告类信息一般会用句号标识与用户的交易信息分隔开,因此可以设置结束标志为句号。针对一条标准交易信息,首先确定句号出现的位置,然后提取句号之前的内容作为待提取部分,这样可以有效降低广告信息的干扰。如推送信息(2)所示,虽然在句号后面的广告中还会出现金额100元,但由于该部分内容已经被排除所以并不影响交易特征的提取结果。
需要说明的是,若标准交易信息出现多次金额,由于通常首次出现的金额为与用户银行卡的金额变动有关,则将首次出现的金额及之前的内容作为待提取部分,例如推送消息(1),待提取部分为“尾号1234储蓄卡账户09:20通过ATM转出290元”。
步骤204:对待提取部分进行分词,根据第二数据库中关键词确定各分词对应的交易数据项。
其中,第二数据库中存储有各交易数据项分别对应的关键词。
本步骤中,需预先存储各交易数据项分别对应的关键词作为第二数据库,交易数据项至少包括交易行为、交易金额,此外,根据交易信息格式的不同,交易数据项也可以包括交易账号、交易时间、交易目的等。
例如,交易时间对应的关键词可以包括:年、月、日、时、分、秒以及标点符号“:”等。交易金额对应的关键词可以包括:元、美元、人民币、符号“¥”等。交易行为对应的关键词称为tradeActionWordList,可以包括如下关键词:支出、存入、汇款等。交易目的对应的关键词称为tradePurposeWordList,可以包括如下关键词:汇款、理财、资金归集等。需要说明的是,同一个词语可以属于两个不同的交易数项,例如,“汇款”既可以作为交易行为,也可以作为交易目的。其中,交易行为中每个词语会包含自己的方向属性,例如,支出为出账方向;存入为入账方向。
具体地,分别通过竖线对信息(1)至(5)的待提取部分的内容进行分词,可以将信息中首次出现的数字序列设置为交易账号,然后根据第二数据库中各个交易数据项对应的关键词,确定每个分词对应的交易数据项。
步骤205:分别确定交易账号对应的分词、交易时间对应的分词以及交易金额对应的分词;
步骤206:判断待提取部分是否包括多个交易行为,若否,执行步骤207,若是执行步骤208。
具体地,根据银行交易信息的格式的不同,可能出现待提取部分存在多个交易行为的情况,如示例2),则需要从多个分词中确定该标准交易信息的交易行为对应的分词。
步骤207:将唯一的交易行为对应的分词作为标准交易信息的交易行为;继续执行步骤209。
步骤208:将距离交易金额的分词最近的交易行为对应的分词作为标准交易信息的交易行为,继续执行步骤209。
如示例2),则将第二个交易行为对应的分词作为2)的交易数据项中的交易行为。
步骤209:判断是否存在既属于交易行为又属于交易目的的分词,若存在,则执行步骤210,否则执行步骤211。
步骤210:将所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的,继续执行211。
如推送信息(3),“汇款”和“入账”都为交易行为对应的分词,但是按照交易金额就近原则,同时考虑“汇款”为既属于交易行为又属于交易目的的分词时,所以将“入账”定义为消息(3)的交易行为,将“汇款”定义为消息(3)的交易目的。
步骤211:根据确定的待提取部分的交易行为的分词,在第二数据库中提取该分词对应的关键词的交易方向,继续执行212。
步骤212:根据确定的交易账号、交易时间、交易金额、交易行为及交易方向,进行统计分析并输出统计结果。
具体地,根据确定的交易账号、交易时间,交易金额、交易行为及交易方向,可以统计出月(年、季度、周、日等)收入总额以及月(年、季度、周、日等)支出总额,并总结分析收支情况,通过资产管理类APP推送给用户。
基于同样的发明构思,本发明实施例还提供一种交易信息处理的装置,具体可以为资产管理类APP或消息推送前端处理装置。如图3所示,为本发明实施例提供的一种交易信息处理的装置结构示意图,包括:
交易信息确定模块301:用于从终端接收的推送信息中确定交易信息;
标准信息确定模块302:用于根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;
交易数据项确定模块303:针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。
进一步地,所述交易信息确定模块301,具体用于:
针对每个推送信息,获取所述推送信息从首字符开始的预设数量的字符串,将所述字符串与第三数据库匹配,所述第三数据库中存储有交易信息对应的关键词;
将匹配成功的所述字符串对应的推送信息作为交易信息。
进一步地,所述交易数据项确定模块303,还用于:
对所述待提取部分进行分词;
根据所述第二数据库中关键词,确定各分词对应的交易数据项。
进一步地,所述交易数据项至少包括交易行为、交易金额;
所述交易数据项确定模块303,还用于:
确定所述待提取部分的交易数据项为交易金额的分词;
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易账号、交易时间;
所述交易数据项确定模块303,具体用于:
分别确定所述交易账号对应的分词、所述交易时间对应的分词、所述交易金额对应的分词;
从所述交易账号对应的分词或所述交易时间对应的分词与所述交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离所述交易金额的分词最近的交易行为对应的分词作为所述标准交易信息的交易行为。
进一步地,所述交易数据项还包括交易目的,所述交易数据项确定模块303,还用于:
若存在既属于交易行为又属于交易目的的分词时,则确定所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
进一步地,所述第二数据库中存储有交易行为对应的各关键词的交易方向信息,所述交易数据项确定模块303,还用于:
根据确定的所述待提取部分的交易行为的分词,在所述第二数据库中提取所述分词对应的关键词的交易方向;
统计所述终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
本发明实施例提供的交易信息处理的装置,从终端接收的推送信息中确定交易信息;根据第一数据库,从交易信息中确定出标准交易信息,针对每个标准交易信息,根据预设的结束标识,确定标准交易信息中待提取部分;根据第二数据库,从待提取部分提取标准交易信息的各交易数据项。本发明实施例提供的交易信息处理的装置不需要匹配模板,而是通过数据库筛选的方式得到待提取部分,然后根据交易数据项分别对应的关键词确定待提取部分的各交易数据项。由于不需要匹配模板,节省了大量人工维护成本;此外,通过结束标识判断有效交易数据的位置,消除了交易信息中的广告部分的影响,提高了交易信息解析的准确性。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种交易信息处理的方法,其特征在于,包括:
从终端接收的推送信息中确定交易信息;
根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;
针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。
2.如权利要求1所述的方法,其特征在于,所述从终端接收的推送信息中确定交易信息,包括:
针对每个推送信息,获取所述推送信息从首字符开始的预设数量的字符串,将所述字符串与第三数据库匹配,所述第三数据库中存储有交易信息对应的关键词;
将匹配成功的所述字符串对应的推送信息作为交易信息。
3.如权利要求1所述的方法,其特征在于,所述根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,包括:
对所述待提取部分进行分词;
根据所述第二数据库中关键词,确定各分词对应的交易数据项。
4.如权利要求3所述的方法,其特征在于,所述交易数据项至少包括交易行为、交易金额;
所述根据所述第二数据库中关键词,确定各分词对应的交易数据项,包括:
确定所述待提取部分的交易数据项为交易金额的分词;
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为。
5.如权利要求4所述的方法,其特征在于,所述交易数据项还包括交易账号、交易时间;
所述将距离所述交易金额的分词最近的交易行为确定为所述标准交易信息的交易行为,包括:
分别确定所述交易账号对应的分词、所述交易时间对应的分词、所述交易金额对应的分词;
从所述交易账号对应的分词或所述交易时间对应的分词与所述交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离所述交易金额的分词最近的交易行为对应的分词作为所述标准交易信息的交易行为。
6.如权利要求4所述的方法,其特征在于,所述交易数据项还包括交易目的,所述将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为之后,还包括:
若存在既属于交易行为又属于交易目的的分词时,则确定所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
7.如权利要求4所述的方法,其特征在于,所述第二数据库中存储有交易行为对应的各关键词的交易方向信息,所述根据所述第二数据库中关键词,确定各分词对应的交易数据项,包括:
根据确定的所述待提取部分的交易行为的分词,在所述第二数据库中提取所述分词对应的关键词的交易方向;
统计所述终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
8.一种交易信息处理的装置,其特征在于,包括:
交易信息确定模块:用于从终端接收的推送信息中确定交易信息;
标准信息确定模块:用于根据第一数据库,从所述交易信息中确定出标准交易信息,所述第一数据库中存储有非标准类关键词;
交易数据项确定模块:针对每个标准交易信息,根据预设的结束标识,确定所述标准交易信息中待提取部分;根据第二数据库,从所述待提取部分提取所述标准交易信息的各交易数据项,所述第二数据库中存储有各交易数据项分别对应的关键词。
9.如权利要求8所述的装置,其特征在于,所述交易信息确定模块,具体用于:
针对每个推送信息,获取所述推送信息从首字符开始的预设数量的字符串,将所述字符串与第三数据库匹配,所述第三数据库中存储有交易信息对应的关键词;
将匹配成功的所述字符串对应的推送信息作为交易信息。
10.如权利要求8所述的装置,其特征在于,所述交易数据项确定模块,具体用于:
对所述待提取部分进行分词;
根据所述第二数据库中关键词,确定各分词对应的交易数据项。
11.如权利要求10所述的装置,其特征在于,所述交易数据项至少包括交易行为、交易金额;
所述交易数据项确定模块,还用于:
确定所述待提取部分的交易数据项为交易金额的分词;
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为。
12.如权利要求11所述的装置,其特征在于,所述交易数据项还包括交易账号、交易时间;
所述交易数据项确定模块,具体用于:
分别确定所述交易账号对应的分词、所述交易时间对应的分词、所述交易金额对应的分词;
从所述交易账号对应的分词或所述交易时间对应的分词与所述交易金额对应的分词之间的分词中确定是否存在交易行为对应的分词,若存在则将距离所述交易金额的分词最近的交易行为对应的分词作为所述标准交易信息的交易行为。
13.如权利要求11所述的装置,其特征在于,所述交易数据项还包括交易目的,所述交易数据项确定模块,还用于:
将距离所述交易金额的分词最近的交易行为对应的分词确定为所述标准交易信息的交易行为之后,若存在既属于交易行为又属于交易目的的分词时,则确定所述既属于交易行为又属于交易目的的分词对应的交易数据项为交易目的。
14.如权利要求11所述的装置,其特征在于,所述第二数据库中存储有交易行为对应的各关键词的交易方向信息,所述交易数据项确定模块,还用于:
根据确定的所述待提取部分的交易行为的分词,在所述第二数据库中提取所述分词对应的关键词的交易方向;
统计所述终端中具有相同交易方向的标准交易信息,并输出统计后的结果。
CN201610902159.1A 2016-10-17 2016-10-17 一种交易信息处理的方法及装置 Pending CN107038185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610902159.1A CN107038185A (zh) 2016-10-17 2016-10-17 一种交易信息处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610902159.1A CN107038185A (zh) 2016-10-17 2016-10-17 一种交易信息处理的方法及装置

Publications (1)

Publication Number Publication Date
CN107038185A true CN107038185A (zh) 2017-08-11

Family

ID=59533141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610902159.1A Pending CN107038185A (zh) 2016-10-17 2016-10-17 一种交易信息处理的方法及装置

Country Status (1)

Country Link
CN (1) CN107038185A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985933A (zh) * 2018-06-29 2018-12-11 联动优势科技有限公司 一种记账方法及装置
CN109189928A (zh) * 2018-08-30 2019-01-11 天津做票君机器人科技有限公司 一种汇票交易机器人的授信信息识别方法
CN111310423A (zh) * 2020-02-28 2020-06-19 中科鼎富(北京)科技发展有限公司 一种文本信息生成方法及装置
CN111985922A (zh) * 2020-08-26 2020-11-24 冒炜 基于区块链离线支付的信息分配方法及数字金融服务平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070288454A1 (en) * 2006-06-09 2007-12-13 Ebay Inc. System and method for keyword extraction and contextual advertisement generation
CN101807273A (zh) * 2010-03-25 2010-08-18 上海合合信息科技发展有限公司 提取信用卡短信中的消费信息进行财务管理的方法及系统
CN102142127A (zh) * 2010-07-30 2011-08-03 华为技术有限公司 对用户的消费明细进行管理的方法和装置
CN103530771A (zh) * 2013-10-09 2014-01-22 北京奇虎科技有限公司 金融卡信息提示方法及装置
CN105303430A (zh) * 2015-11-10 2016-02-03 中国建设银行股份有限公司 一种交易指标采集方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070288454A1 (en) * 2006-06-09 2007-12-13 Ebay Inc. System and method for keyword extraction and contextual advertisement generation
CN101807273A (zh) * 2010-03-25 2010-08-18 上海合合信息科技发展有限公司 提取信用卡短信中的消费信息进行财务管理的方法及系统
CN102142127A (zh) * 2010-07-30 2011-08-03 华为技术有限公司 对用户的消费明细进行管理的方法和装置
CN103530771A (zh) * 2013-10-09 2014-01-22 北京奇虎科技有限公司 金融卡信息提示方法及装置
CN105303430A (zh) * 2015-11-10 2016-02-03 中国建设银行股份有限公司 一种交易指标采集方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985933A (zh) * 2018-06-29 2018-12-11 联动优势科技有限公司 一种记账方法及装置
CN109189928A (zh) * 2018-08-30 2019-01-11 天津做票君机器人科技有限公司 一种汇票交易机器人的授信信息识别方法
CN111310423A (zh) * 2020-02-28 2020-06-19 中科鼎富(北京)科技发展有限公司 一种文本信息生成方法及装置
CN111310423B (zh) * 2020-02-28 2023-11-03 鼎富智能科技有限公司 一种文本信息生成方法及装置
CN111985922A (zh) * 2020-08-26 2020-11-24 冒炜 基于区块链离线支付的信息分配方法及数字金融服务平台

Similar Documents

Publication Publication Date Title
US7092905B2 (en) Systems and methods for the processing of financial transactions
CN111428599B (zh) 票据识别方法、装置和设备
CN106803168A (zh) 一种异常转账侦测方法和装置
US20150120426A1 (en) Consolidating and Leveraging Features of a Loyalty Program
US20080091538A1 (en) Discount-instrument methods and systems
CN110428322A (zh) 一种业务数据的适配方法及装置
CN107038185A (zh) 一种交易信息处理的方法及装置
CN108932585A (zh) 一种商户运营管理方法及其设备、存储介质、电子设备
US20170161745A1 (en) Payment account fraud detection using social media heat maps
CN107798515A (zh) 一种数据库自动生成会计凭证的方法
CN105744070A (zh) 账单短信的处理方法及装置
CN104103008A (zh) 一种基于短消息的记账方法及系统
CN109840851A (zh) 一种理财数据的综合管理方法、装置及设备
US20020120514A1 (en) Method, computer system and computer program product for processing customer loyalty data
JP2012027615A (ja) 現金自動取引装置の取引方法及び取引プログラム
CN106096046A (zh) 一种移动终端的信息智能显示方法及系统
CN106095972A (zh) 一种信息分类方法及装置
US8788413B2 (en) System and method for managing related accounts
CN109670896A (zh) 投资产品推荐方法、装置、设备及存储介质
US7801779B2 (en) Cash under and cash over adjustments to receipt totals for bank deposits
CN106503045A (zh) 一种更新模板库的方法及装置
JP2005070935A (ja) 推定口座残高参照システム、推定口座残高参照方法及びそのプログラム
CN107633006B (zh) 一种词典格式生成方法及电子设备
TWM641470U (zh) 用於定期定額金融產品的客戶融資系統
CN110189116A (zh) 商品结算方法、装置和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170811