CN117575602A - 交易行为的识别方法、装置、电子设备及存储介质 - Google Patents

交易行为的识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117575602A
CN117575602A CN202311558262.5A CN202311558262A CN117575602A CN 117575602 A CN117575602 A CN 117575602A CN 202311558262 A CN202311558262 A CN 202311558262A CN 117575602 A CN117575602 A CN 117575602A
Authority
CN
China
Prior art keywords
prompt
instruction
information
large model
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311558262.5A
Other languages
English (en)
Inventor
李犇
张�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongguancun Kejin Technology Co Ltd
Original Assignee
Beijing Zhongguancun Kejin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongguancun Kejin Technology Co Ltd filed Critical Beijing Zhongguancun Kejin Technology Co Ltd
Priority to CN202311558262.5A priority Critical patent/CN117575602A/zh
Publication of CN117575602A publication Critical patent/CN117575602A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供一种交易行为的识别方法、装置、电子设备及存储介质,该方法包括:基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;根据所述记录文本生成至少一个提示指令;基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。

Description

交易行为的识别方法、装置、电子设备及存储介质
技术领域
本申请涉及大模型技术领域,尤其涉及一种交易行为的识别方法、装置、电子设备及存储介质。
背景技术
随着通信技术的发展,越来越多的用户使用到了网上支付,而网上支付容易出现异常交易行为,例如电信诈骗。电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人打款或转账的犯罪行为。目前,对于异常交易行为的案件情况一般通过人工进行识别和分析,导致出现了异常交易行为识别效率较低的问题。
发明内容
本申请实施例提供一种交易行为的识别方法、装置、电子设备及存储介质,以解决现有技术中异常交易行为识别效率较低的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种交易行为的识别方法。该方法包括:
基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
根据所述记录文本生成至少一个提示指令;
基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
可选的,所述根据所述记录文本生成至少一个提示指令,包括:
获取目标提示词,所述目标提示词包括类型提示词、流程提示词和信息提示词中的至少一项;
根据所述类型提示词生成类型提示指令;
根据所述流程提示词生成流程提示指令;
根据所述信息提示词生成所述信息提示指令。
可选的,所述获取目标提示词之后,所述方法还包括:
获取提示指令模版;
所述根据所述类型提示词生成类型提示指令,包括:
将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令;
所述根据所述流程提示词生成流程提示指令,包括:
将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令;
所述根据所述信息提示词生成所述信息提示指令,包括:
将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型之前,所述方法还包括:
获取领域语料,所述领域语料包括历史异常交易行为的文本数据;
根据所述领域语料对第一大模型进行领域微调,得到所述预训练的大模型,所述第一大模型为大型语言模型。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型,包括:
根据所述类型提示指令、所述流程提示指令和所述信息提示指令生成领域提示指令语料;
基于所述领域提示指令语料对所述预训练的大模型进行指令调整,得到所述目标大模型。
可选的,所述将所述记录文本输入到所述目标大模型中,输出识别结果之后,所述方法还包括:
获取历史异常交易行为的数据信息,所述数据信息用于指示历史异常交易行为的类型、流程和信息;
基于所述识别结果和历史异常交易行为的数据信息生成分析结果,所述分析结果用于指示异常交易行为的发展趋势。
可选的,所述基于异常交易行为生成记录文本,包括:
获取异常交易行为所对应的记录信息;
将所述记录信息输入到光学字符识别OCR模型中进行格式转换,得到所述记录文本。
第二方面,本申请实施例还提供一种交易行为的识别装置。该装置包括:
第一生成模块,用于基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
第二生成模块,用于根据所述记录文本生成至少一个提示指令;
调整模块,用于基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
输出模块,用于将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
第三方面,本申请实施例还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的交易行为的识别方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的交易行为的识别方法的步骤。
本申请提供一种交易行为的识别方法、装置、电子设备及存储介质,该方法包括:基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;根据所述记录文本生成至少一个提示指令;基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的交易行为的识别方法的流程图;
图2是本申请实施例提供的模型训练结构示意图;
图3是本申请实施例提供的交易行为的识别装置的结构图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种交易行为的识别方法。参见图1,图1是本申请实施例提供的交易行为的识别方法的流程图,如图1所示,包括以下步骤:
步骤101、基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程。
在本实施例中,异常交易行为一般为电信诈骗等行为,在本实施例中,在用户发生异常交易行为之后,一般会生成笔录内容,从而便于工作人员进行分析该异常交易行为的类型、流程和信息。其中,类型为网页诈骗、软件诈骗、链接诈骗、图片诈骗等等。流程为用户受骗的流程,例如用户点击了诈骗份子所发送的链接,从而导致用户的手机中毒,进而导致用户的银行卡被盗刷。信息为用户的相关特征,例如受骗金额、用户年龄、用户职业、用户收入等等。
通过异常交易行为生成记录文本,具体地,该记录文本详细记录了异常交易行为的事件流程。
步骤102、根据所述记录文本生成至少一个提示指令。
在本实施例中,提示指令可以帮助大语言模型(Large Language Models,LLM)简称大模型更好地理解用户意图,并输出更加准确、有意义的内容,使得大模型更加符合用户的需求。
具体地,根据记录文本生成一个或者多个提示指令(prompt),一个或者多个提示指令对大模型进行指令微调,使得大模型能够对于记录文本的识别效果更好。
步骤103、基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型。
在本实施例中,将不同任务的提示指令输入到预训练的大模型进行指令微调,其中,预训练的大模型为进过初步训练的大模型,具备一定的识别功能。通过指令微调的方式对预训练的大模型进行迭代训练,直到大模型收敛到最终效果,从而最终得到目标大模型。
步骤104、将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
在本实施例中,通过将记录文本输入到目标大模型中,输出识别结果,根据提示指令的数量,生成每个诈骗案件的类型,诈骗手法流程、以及受害人信息特征等结构化数据,从而准确地对异常交易行为进行分析。
本申请提供一种交易行为的识别方法,该方法包括:基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;根据所述记录文本生成至少一个提示指令;基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。
在一些可行的实施方式中,可选的,所述根据所述记录文本生成至少一个提示指令,包括:
获取目标提示词,所述目标提示词包括类型提示词、流程提示词和信息提示词中的至少一项;
根据所述类型提示词生成类型提示指令;
根据所述流程提示词生成流程提示指令;
根据所述信息提示词生成所述信息提示指令。
在本实施例中,根据所述记录文本生成至少一个提示指令,其中,提示指令可以包括类型提示词、流程提示词和信息提示词中的至少一项,在本实施例中通过一项或多项提示指令对预训练的大模型进行指令微调,使得预训练的大模型达到效果,需要进行说明的是,在提示指令越多的情况下,预训练的大模型更加符合要求。
具体地,在本实施例中以类型提示词、流程提示词和信息提示词分别生成类型提示指令、流程提示指令和信息提示指令为例进行说明。
示例性的,诈骗案件类型指令(prompt):{“Record”:“案件笔录”,“prompt”:“请根据受害人的笔录数据进行分析,判断诈骗案件的类型,按照以json格式输出结果:”},
诈骗手法流程提取指令(prompt):{“Record”:“案件笔录”,“prompt”:“请根据受害人的笔录数据进行分析,判断并归纳总结出诈骗流程,按照以json格式输出结果:”}
诈骗受害人信息抽取指令(prompt):{“Record”:“案件笔录”,“prompt”:“请根据受害人的笔录数据进行分析,提取受害人特征,按照以json格式输出结果:”}。
可选的,所述获取目标提示词之后,所述方法还包括:
获取提示指令模版;
所述根据所述类型提示词生成类型提示指令,包括:
将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令;
所述根据所述流程提示词生成流程提示指令,包括:
将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令;
所述根据所述信息提示词生成所述信息提示指令,包括:
将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
在本实施例中,如图2所示,本实施例中,提示指令模版中填入了相关指令之后,可以生成不同的提示指令,例如将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令,将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令,以及将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型之前,所述方法还包括:
获取领域语料,所述领域语料包括历史异常交易行为的文本数据;
根据所述领域语料对第一大模型进行领域微调,得到所述预训练的大模型,所述第一大模型为大型语言模型。
在本实施例中,领域语料包括语言+资源,语言指的是资源的限定域,资源=资+源,是资料的来源或者汇总,加在一起,也就形成了这样一种界定:任何语言单位形成的集合,都可以称为语言资源。语言资源是自然语言处理任务中的一个必不可少的组成部分,一方面语言资源是相关语言处理任务的支撑,为语言处理任务提供先验知识进行辅助,另一方面,语言处理任务也为语言资源提出了需求,并能够对语言资源的搭建、扩充起到技术性的支持作用。
本实施例中的领域语料包括了历史异常交易行为的文本数据,其中,历史异常交易行为可以为多种和多个异常交易行为生成的文本,通过领域语料对第一大模型进行领域微调,可以使得第一大模型能够清楚了解到在异常交易领域的相关专业名词、内容、信息等等,从而得到预训练的大模型,其中,预训练的大模型能够准确识别该领域内的相关信息。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型,包括:
根据所述类型提示指令、所述流程提示指令和所述信息提示指令生成领域提示指令语料;
基于所述领域提示指令语料对所述预训练的大模型进行指令调整,得到所述目标大模型。
在本实施例中,通过将类型提示指令、流程提示指令和信息提示指令进行结合,生成领域提示指令语料,并根据领域提示指令语料对所述预训练的大模型进行指令调整,从而得到目标大模型。
需要进行说明的是,上述实施方式中通过领域语料对第一大模型进行领域微调,而本实施方式能够通过领域提示指令语料对预训练的大模型进行指令调整,两者区别之处在于领域微调和指令微调。指令微调和特定领域数据里的微调的区别在于,指令微调通常是在基础模型中进行的微调,即微调一些参数,以适应某个任务,而特定领域数据里的微调更注重于在特定领域内寻找合适的模型来提高数据的准确性。
可选的,所述将所述记录文本输入到所述目标大模型中,输出识别结果之后,所述方法还包括:
获取历史异常交易行为的数据信息,所述数据信息用于指示历史异常交易行为的类型、流程和信息;
基于所述识别结果和历史异常交易行为的数据信息生成分析结果,所述分析结果用于指示异常交易行为的发展趋势。
在本实施例中,通过历史异常交易行为的数据信息和当前异常交易行为的识别结果进行分析,分析诈骗案件进行趋势分析和研判,例如判断目前电信诈骗的犯罪率是否上升,或者判断当前电信诈骗是否出现了新型诈骗类型等等。
可选的,所述基于异常交易行为生成记录文本,包括:
获取异常交易行为所对应的记录信息;
将所述记录信息输入到光学字符识别OCR模型中进行格式转换,得到所述记录文本。
在本实施例中,异常交易行为所对应的记录信息为一般为受害人的报案笔录。光学字符识别(Optical Character Recognition,OCR)模型是指对图片中的文字进行查找、提取、识别的一种技术,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。通过将报案笔录利用OCR模型转换成笔录文本,从而得到记录文本。
本申请提供一种交易行为的识别方法,该方法包括:基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;根据所述记录文本生成至少一个提示指令;基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。
参见图3,图3是本申请实施例提供的交易行为的识别装置的结构图。如图3所示,交易行为的识别装置300包括:
第一生成模块310,用于基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
第二生成模块320,用于根据所述记录文本生成至少一个提示指令;
调整模块330,用于基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
输出模块340,用于将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
可选的,第二生成模块320,包括:
第一获取子模块,用于获取目标提示词,所述目标提示词包括类型提示词、流程提示词和信息提示词中的至少一项;
第一生成子模块,用于根据所述类型提示词生成类型提示指令;
第二生成子模块,用于根据所述流程提示词生成流程提示指令;
第三生成子模块,用于根据所述信息提示词生成所述信息提示指令。
可选的,还包括:
第二获取子模块,用于获取提示指令模版;
第一生成子模块,包括:第一生成单元,用于将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令;
第二生成子模块,包括:第二生成单元,用于将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令;
第三生成子模块,包括:第三生成单元,用于将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
可选的,还包括:
语料获取模块,用于获取领域语料,所述领域语料包括历史异常交易行为的文本数据;
领域微调模块,用于根据所述领域语料对第一大模型进行领域微调,得到所述预训练的大模型,所述第一大模型为大型语言模型。
可选的,调整模块330,包括:
第四生成子模块,用于根据所述类型提示指令、所述流程提示指令和所述信息提示指令生成领域提示指令语料;
调整子模块,用于基于所述领域提示指令语料对所述预训练的大模型进行指令调整,得到所述目标大模型。
可选的,还包括:
历史信息获取模块,用于获取历史异常交易行为的数据信息,所述数据信息用于指示历史异常交易行为的类型、流程和信息;
历史信息分析模块,用于基于所述识别结果和历史异常交易行为的数据信息生成分析结果,所述分析结果用于指示异常交易行为的发展趋势。
可选的,第一生成模块310,包括:
信息获取子模块,用于获取异常交易行为所对应的记录信息;
格式转换子模块,用于将所述记录信息输入到光学字符识别OCR模型中进行格式转换,得到所述记录文本。
本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。
本申请实施例还提供一种电子设备。请参见图4,电子设备可以包括处理器401、存储器402及存储在存储器402上并可在处理器401上运行的程序4021。
程序4021被处理器401执行时可实现图1对应的方法实施例中的任意步骤:
基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
根据所述记录文本生成至少一个提示指令;
基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
可选的,所述根据所述记录文本生成至少一个提示指令,包括:
获取目标提示词,所述目标提示词包括类型提示词、流程提示词和信息提示词中的至少一项;
根据所述类型提示词生成类型提示指令;
根据所述流程提示词生成流程提示指令;
根据所述信息提示词生成所述信息提示指令。
可选的,所述获取目标提示词之后,所述方法还包括:
获取提示指令模版;
所述根据所述类型提示词生成类型提示指令,包括:
将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令;
所述根据所述流程提示词生成流程提示指令,包括:
将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令;
所述根据所述信息提示词生成所述信息提示指令,包括:
将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型之前,所述方法还包括:
获取领域语料,所述领域语料包括历史异常交易行为的文本数据;
根据所述领域语料对第一大模型进行领域微调,得到所述预训练的大模型,所述第一大模型为大型语言模型。
可选的,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型,包括:
根据所述类型提示指令、所述流程提示指令和所述信息提示指令生成领域提示指令语料;
基于所述领域提示指令语料对所述预训练的大模型进行指令调整,得到所述目标大模型。
可选的,所述将所述记录文本输入到所述目标大模型中,输出识别结果之后,所述方法还包括:
获取历史异常交易行为的数据信息,所述数据信息用于指示历史异常交易行为的类型、流程和信息;
基于所述识别结果和历史异常交易行为的数据信息生成分析结果,所述分析结果用于指示异常交易行为的发展趋势。
可选的,所述基于异常交易行为生成记录文本,包括:
获取异常交易行为所对应的记录信息;
将所述记录信息输入到光学字符识别OCR模型中进行格式转换,得到所述记录文本。
本申请通过将异常交易行为的记录文本确定提示指令,并通过提示指令对预训练的大模型进行指令调整,使得大模型能够输出该异常交易行为的类型、流程和信息,提高了异常交易行为识别效率较低的问题。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述交易行为的识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种交易行为的识别方法,其特征在于,所述方法包括:
基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
根据所述记录文本生成至少一个提示指令;
基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
2.根据权利要求1所述的方法,其特征在于,所述根据所述记录文本生成至少一个提示指令,包括:
获取目标提示词,所述目标提示词包括类型提示词、流程提示词和信息提示词中的至少一项;
根据所述类型提示词生成类型提示指令;
根据所述流程提示词生成流程提示指令;
根据所述信息提示词生成所述信息提示指令。
3.根据权利要求2所述的方法,其特征在于,所述获取目标提示词之后,所述方法还包括:
获取提示指令模版;
所述根据所述类型提示词生成类型提示指令,包括:
将所述类型提示词和所述记录文本填入所述提示指令模版中,生成类型提示指令;
所述根据所述流程提示词生成流程提示指令,包括:
将所述流程提示词和所述记录文本填入提示指令模版中,生成流程提示指令;
所述根据所述信息提示词生成所述信息提示指令,包括:
将所述信息提示词和所述记录文本填入所述提示指令模版中,生成信息提示指令。
4.根据权利要求3所述的方法,其特征在于,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型之前,所述方法还包括:
获取领域语料,所述领域语料包括历史异常交易行为的文本数据;
根据所述领域语料对第一大模型进行领域微调,得到所述预训练的大模型,所述第一大模型为大型语言模型。
5.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型,包括:
根据所述类型提示指令、所述流程提示指令和所述信息提示指令生成领域提示指令语料;
基于所述领域提示指令语料对所述预训练的大模型进行指令调整,得到所述目标大模型。
6.根据权利要求1所述的方法,其特征在于,所述将所述记录文本输入到所述目标大模型中,输出识别结果之后,所述方法还包括:
获取历史异常交易行为的数据信息,所述数据信息用于指示历史异常交易行为的类型、流程和信息;
基于所述识别结果和历史异常交易行为的数据信息生成分析结果,所述分析结果用于指示异常交易行为的发展趋势。
7.根据权利要求1所述的方法,其特征在于,所述基于异常交易行为生成记录文本,包括:
获取异常交易行为所对应的记录信息;
将所述记录信息输入到光学字符识别OCR模型中进行格式转换,得到所述记录文本。
8.一种交易行为的识别装置,其特征在于,包括:
第一生成模块,用于基于异常交易行为生成记录文本,所述记录文本包括异常交易行为的事件流程;
第二生成模块,用于根据所述记录文本生成至少一个提示指令;
调整模块,用于基于所述至少一个提示指令对预训练的大模型进行指令调整,得到目标大模型;
输出模块,用于将所述记录文本输入到所述目标大模型中,输出识别结果,所述识别结果用于指示所述异常交易行为的类型、流程和信息中的一项或多项。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的交易行为的识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的交易行为的识别方法的步骤。
CN202311558262.5A 2023-11-21 2023-11-21 交易行为的识别方法、装置、电子设备及存储介质 Pending CN117575602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311558262.5A CN117575602A (zh) 2023-11-21 2023-11-21 交易行为的识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311558262.5A CN117575602A (zh) 2023-11-21 2023-11-21 交易行为的识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117575602A true CN117575602A (zh) 2024-02-20

Family

ID=89860222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311558262.5A Pending CN117575602A (zh) 2023-11-21 2023-11-21 交易行为的识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117575602A (zh)

Similar Documents

Publication Publication Date Title
CN108021934B (zh) 多要素识别的方法及装置
CN110597952A (zh) 信息处理方法、服务器及计算机存储介质
CN108447471A (zh) 语音识别方法及语音识别装置
CN111669757B (zh) 一种基于通话文本词向量的终端诈骗电话识别方法
CN111883140A (zh) 基于知识图谱和声纹识别的认证方法、装置、设备及介质
CN112235470B (zh) 基于语音识别的来电客户跟进方法、装置及设备
CN111753090A (zh) 基于rpa及ai的文档审核方法、装置、设备及介质
CN113903363B (zh) 基于人工智能的违规行为检测方法、装置、设备及介质
CN104183238A (zh) 一种基于提问应答的老年人声纹识别方法
CN114399379A (zh) 基于人工智能的催收行为识别方法、装置、设备及介质
CN111177307A (zh) 一种基于语义理解相似度阀值配置的测试方案及系统
CN110933225A (zh) 通话信息获取方法、装置、存储介质及电子设备
CN113240510A (zh) 异常用户预测方法、装置、设备及存储介质
CN113450147A (zh) 基于决策树的产品匹配方法、装置、设备及存储介质
CN110288468B (zh) 数据特征挖掘方法、装置、电子设备及存储介质
CN117251547A (zh) 用户提问应答方法及其装置、设备、介质
CN107766498A (zh) 用于生成信息的方法和装置
CN112396079A (zh) 号码识别模型训练方法、号码识别方法及装置
CN113051384A (zh) 基于对话的用户画像抽取方法及相关装置
CN111309882B (zh) 用于实现智能客服问答的方法和装置
CN110047473B (zh) 一种人机协作交互方法及系统
KR20130073709A (ko) 영상 및 음성 정보를 이용한 명함 인식 방법 및 장치
CN117575602A (zh) 交易行为的识别方法、装置、电子设备及存储介质
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN108717851A (zh) 一种语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination