CN117520483A - 基于大模型的信息校验方法及装置 - Google Patents

基于大模型的信息校验方法及装置 Download PDF

Info

Publication number
CN117520483A
CN117520483A CN202410011523.XA CN202410011523A CN117520483A CN 117520483 A CN117520483 A CN 117520483A CN 202410011523 A CN202410011523 A CN 202410011523A CN 117520483 A CN117520483 A CN 117520483A
Authority
CN
China
Prior art keywords
information
attribute
tuple
large model
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410011523.XA
Other languages
English (en)
Inventor
张向征
刘红宇
魏其学
林伟家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN202410011523.XA priority Critical patent/CN117520483A/zh
Publication of CN117520483A publication Critical patent/CN117520483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及信息校验技术领域,公开了一种基于大模型的信息校验方法及装置,该方法包括:响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;基于所述属性元组通过所述大模型确定参考信息;基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。本发明通过大模型生成参考信息,从而根据参考信息对待校验信息进行校验,解决了信息校验效果差导致信息准确性低的技术问题,可以校验信息的准确性,提高信息可信度以及利用率。

Description

基于大模型的信息校验方法及装置
技术领域
本发明涉及信息校验技术领域,尤其涉及一种基于大模型的信息校验方法及装置。
背景技术
随着信息传播的快速发展,人们对于信息的准确性和可信度要求越来越高,错误的信息会给人们的生活带来困扰,也会对社会的发展产生极大的负面影响,然而,当前的信息校验效果差导致信息准确性低。
发明内容
本发明的主要目的在于提供一种基于大模型的信息校验方法及装置,旨在解决现有技术信息校验效果差导致信息准确性低的技术问题。
为实现上述目的,本发明提供了一种基于大模型的信息校验方法,所述方法包括以下步骤:
响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
基于所述属性元组通过所述大模型确定参考信息;
基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
可选地,所述响应于用户输入的待校验信息,基于所述待校验信息通过大模型生成属性元组,包括:
响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
可选地,所述基于所述属性元组通过所述大模型确定参考信息,包括:
基于所述属性元组确定查询集合;
基于所述查询集合中的查询文本进行搜索,得到搜索结果;
基于所述搜索结果确定语句集合;
基于所述语句集合通过所述大模型确定参考信息。
可选地,所述基于所述属性元组确定查询集合,包括:
按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;
基于所述多个筛选后的属性组合得到查询集合。
可选地,所述基于所述查询集合中的查询语句进行搜索,得到搜索结果,包括:
基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;
基于所述搜索结果序列确定搜索结果。
可选地,所述基于所述搜索结果确定语句集合,包括:
将所述搜索结果根据预设分句规则进行分句,得到多个分句;
基于所述多个分句中包含查询文本的分句确定语句集合。
可选地,所述基于所述语句集合通过所述大模型确定参考信息,包括:
基于所述语句集合通过所述大模型确定参考属性元组;
基于待校验信息的属性元组对所述参考属性元组进行过滤,得到过滤后的参考属性元组;
根据所过滤后的参考属性元组确定属性集合;
基于所述属性集合确定参考信息。
可选地,所述基于所述语句集合通过所述大模型确定参考属性元组,包括:
将所述语句集合中的各分句分别填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的各分句中的属性元组,得到参考属性元组。
可选地,所述基于所述属性集合确定参考信息,包括:
获取所述属性集合中各个属性元组的出现频率;
根据所述各个属性元组的出现频率确定目标属性元组;
基于所述目标属性元组确定参考信息。
可选地,所述根据所过滤后的参考属性元组确定属性集合之后,还包括:
判断所述查询集合中的查询文本是否遍历完成;
若所述查询集合中的查询文本未遍历完成,则执行所述基于所述查询集合中的查询语句进行搜索,得到搜索结果的步骤。
可选地,所述基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果,包括:
将所述参考信息的属性元组中的属性和属性值和所述校验信息的属性元组中的属性和属性值进行匹配,得到匹配结果;
基于所述匹配结果确定信息校验结果。
可选地,所述基于所述匹配结果确定信息校验结果,包括:
在所述匹配结果为匹配一致时,将信息校验结果设置为校验通过且用户输入的待校验信息准确可信;
在所述匹配结果为匹配不一致时,将信息校验结果设置为校验不通过且用户输入的待校验信息不可信。
此外,为实现上述目的,本发明还提出一种基于大模型的信息校验装置,所述基于大模型的信息校验装置包括:
生成模块,用于响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
确定模块,用于基于所述属性元组通过所述大模型确定参考信息;
校验模块,用于基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
可选地,所述生成模块,还用于响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
可选地,所述确定模块,还用于基于所述属性元组确定查询集合;
基于所述查询集合中的查询文本进行搜索,得到搜索结果;
基于所述搜索结果确定语句集合;
基于所述语句集合通过所述大模型确定参考信息。
可选地,所述确定模块,还用于按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;
基于所述多个筛选后的属性组合得到查询集合。
可选地,所述确定模块,还用于基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;
基于所述搜索结果序列确定搜索结果。
可选地,所述确定模块,还用于将所述搜索结果根据预设分句规则进行分句,得到多个分句;
基于所述多个分句中包含查询文本的分句确定语句集合。
此外,为实现上述目的,本发明还提出一种基于大模型的信息校验设备,所述基于大模型的信息校验设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大模型的信息校验程序,所述基于大模型的信息校验程序配置为实现如上文所述的基于大模型的信息校验方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于大模型的信息校验程序,所述基于大模型的信息校验程序被处理器执行时实现如上文所述的基于大模型的信息校验方法的步骤。
本发明通过响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;基于所述属性元组通过所述大模型确定参考信息;基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。通过上述方式,通过大模型生成参考信息,从而根据参考信息对待校验信息进行校验,解决了信息校验效果差导致信息准确性低的技术问题,可以校验信息的准确性,提高信息可信度以及利用率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于大模型的信息校验设备的结构示意图;
图2为本发明基于大模型的信息校验方法第一实施例的流程示意图;
图3为本发明基于大模型的信息校验方法第二实施例的流程示意图;
图4为本发明基于大模型的信息校验方法一实施例的整体流程图;
图5为本发明基于大模型的信息校验装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于大模型的信息校验设备结构示意图。
如图1所示,该基于大模型的信息校验设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于大模型的信息校验设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于大模型的信息校验程序。
在图1所示的基于大模型的信息校验设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于大模型的信息校验设备中的处理器1001、存储器1005可以设置在基于大模型的信息校验设备中,所述基于大模型的信息校验设备通过处理器1001调用存储器1005中存储的基于大模型的信息校验程序,并执行本发明实施例提供的基于大模型的信息校验方法。
本发明实施例提供了一种基于大模型的信息校验方法,参照图2,图2为本发明基于大模型的信息校验方法第一实施例的流程示意图。
本实施例中,所述基于大模型的信息校验方法包括以下步骤:
步骤S10:响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组。
需要说明的是,本实施例的执行主体为基于大模型的信息校验设备,还可以为其他实现相同或相似功能的设备,本实施例对此不作具体限制,本实施例以基于大模型的信息校验设备为例进行说明。
可以理解的是,待校验信息是指由用户指定并输入的待验证的信息,例如,“XXX在XXXX年XX月出版了《XXX自传》”。基于待验证信息抽取属性元组为:{'作者': 'XXX', '出版时间': 'XXXX年XX月', '书名': 'XXX自传'},其中,作者、出版时间、书名为属性名。
值得说明的是,大模型指的是在机器学习和深度学习领域中参数规模庞大、能够处理大量数据的模型,例如,GPT、BERT以及其他常见大模型等,本实施例对此不作具体限制。
进一步地,为了准确地从待校验信息中提取属性元组,所述响应于用户输入的待校验信息,基于所述待校验信息通过大模型生成属性元组,包括:响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
需要说明的是,预设属性元组抽取模板指的是Prompt模板,Prompt模板指的是一种预定义的文本结构,其中包含占位符或变量,以便根据实际输入进行填充。在自然语言处理任务中,Prompt模板通常用于构建向模型提问的查询或请求。
可以理解的是,属性元组是从文本中提取的结构化信息,其中包括实体和相关的属性。通过将用户输入的待验证信息填充到预置的属性元组抽取Prompt模板中,可以实现对信息的结构化,生成的填充后的Prompt模板具有一定的格式,使得从中提取关键信息更加方便。
在具体实现中,用户输入一条待验证的信息,将待验证信息填充到预置的属性元组抽取模板中,将填充后的Prompt输入至大模型,抽取待验证信息的属性元组。
值得说明的是,将填充后的属性元组抽取模板输入至大模型,利用大模型的语言理解和生成能力,从而获取更丰富、准确的属性元组信息。
步骤S20:基于所述属性元组通过所述大模型确定参考信息。
需要说明的是,属性元组是指从文本中提取的包含实体和相关属性的结构化信息,在自然语言处理(NLP)和信息抽取的上下文中,属性元组用于表示文本中的关键信息,以便更容易地理解和处理。
可以理解的是,通过大模型确定参考信息根据属性元组中的属性即可确定参考信息,即相对权威信息。
步骤S30:基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
需要说明的是,将参考信息和待校验信息进行比对,以实现信息准确性校验,根据信息校验结果确定待校验信息是否准确可信。
进一步地,为了提高校验结果的准确性,所述基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果,包括:将所述参考信息的属性元组中的属性和属性值和所述校验信息的属性元组中的属性和属性值进行匹配,得到匹配结果;基于所述匹配结果确定信息校验结果。
需要说明的是,通过相对权威信息和用户输入信息做校验,将参考信息的属性元组中的属性和属性值和校验信息的属性元组中的属性和属性值进行匹配,判断不同属性元组中每个属性和属性值是否一致,若一致,则匹配结果为匹配一致,若不一致,则匹配结果为匹配不一致。
进一步地,所述基于所述匹配结果确定信息校验结果,包括:在所述匹配结果为匹配一致时,将信息校验结果设置为校验通过且用户输入的待校验信息准确可信;在所述匹配结果为匹配不一致时,将信息校验结果设置为校验不通过且用户输入的待校验信息不可信。
需要说明的是,在信息校验结果为校验不通过且用户输入的待校验信息不可信时,输出相对权威信息作为参考。
本实施例通过响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;基于所述属性元组通过所述大模型确定参考信息;基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。通过上述方式,通过大模型生成参考信息,从而根据参考信息对待校验信息进行校验,解决了信息校验效果差导致信息准确性低的技术问题,可以校验信息的准确性,提高信息可信度以及利用率。
参考图3,图3为本发明基于大模型的信息校验方法第二实施例的流程示意图。
基于上述第一实施例,本实施例基于大模型的信息校验方法中所述步骤S20,包括:
步骤S201:基于所述属性元组确定查询集合。
需要说明的是,查询集合即QUERY_SET集合,由多个QUERY(查询)文本构成,查询集合是通过对属性元组进行处理得到的。
进一步地,所述基于所述属性元组确定查询集合,包括:按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;基于所述多个筛选后的属性组合得到查询集合。
在具体实现中,按照属性在待校验信息中出现顺序,依次去掉其中一个属性,使用剩余其他属性组合作为QUERY,得到QUERY_SET集合。
步骤S202:基于所述查询集合中的查询文本进行搜索,得到搜索结果。
需要说明的是,使用搜索引擎或其他信息检索系统执行查询,然后获取相关的搜索结果,本实施例中,以使用搜索引擎执行查询为例进行说明,搜索引擎可以为常见的搜索引擎,本实施例对此不作具体限制。
进一步地,为了获得更准确的搜索结果,所述基于所述查询集合中的查询语句进行搜索,得到搜索结果,包括:基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;基于所述搜索结果序列确定搜索结果。
在具体实现中,使用QUERY_SET集合中的Query文本分别请求搜索,得到搜索结果序列,将搜索结果序列中TopN的结果作为搜索结果。
步骤S203:基于所述搜索结果确定语句集合。
需要说明的是,语句集合即SENTENCE_SET集合,由包含QUERY文本的语句构成。
进一步地,所述基于所述搜索结果确定语句集合,包括:将所述搜索结果根据预设分句规则进行分句,得到多个分句;基于所述多个分句中包含查询文本的分句确定语句集合。
需要说明的是,语句集合SENTENCE_SET是一个集合(Set)数据结构,用来存储符合条件的句子的集合,即用于存储包含特定查询文本的句子。
可以理解的是,预设分句规则是指按照标点符号,如句号、问号、感叹号等进行分句。当将自然语言文本按照标点符号分句时,一般是根据标点符号的位置进行划分,将文本分成多个句子,有助于进行文本处理和分析。
在具体实现中,将搜索结果按照标点符号,如句号、问号,感叹号等分句,将句子中包含QUERY文本的句子添加到初始集合,得到SENTENCE_SET集合。例如,当检索q=“XXXX年XX月 XXX自传”, 则将包含q文本的句子添加到初始集合,得到SENTENCE_SET集合。
步骤S204:基于所述语句集合通过所述大模型确定参考信息。
需要说明的是,参考信息是指相对权威信息,即具有较高可信度和权威性的信息,参考信息是通过对属性元组进行处理后输入至大模型,由大模型进行反馈得到的。
进一步地,为了提高参考信息的准确性,所述基于所述语句集合通过所述大模型确定参考信息,包括:基于所述语句集合通过所述大模型确定参考属性元组;基于待校验信息的属性元组对所述参考属性元组进行过滤,得到过滤后的参考属性元组;根据所过滤后的参考属性元组确定属性集合;基于所述属性集合确定参考信息。
需要说明的是,通过使用大模型进行查询,可以更全面地理解语句集合中的信息,提高获取参考属性元组的准确性。大模型自动处理语句集合,过滤参考属性元组,确定属性集合,可以提高信息提取的效率。
在具体实现中,根据待校验的信息的属性元组,对抽取的参考属性元组中的属性进行过滤,得到符合待校验信息的过滤后的参考属性元组,将过滤后的属性元组添加到ATTIRBUTE_SET中。参考属性元组进行过滤,例如,假定待校验的信息的属性元组为:{'作者': 'XXX', '出版时间': 'XXXX年XX月', '书名': 'XXX自传'}, 则将抽取的参考属性元组中,包含‘作者’、‘出版时间’、‘书名’三个属性名的属性元组过滤出来,添加到ATTIRBUTE_SET中。
值得说明的是,过滤参考属性元组时,基于待校验信息的属性元组进行过滤可以帮助排除与待校验信息不相关的信息,有助于更全面地了解待校验信息。由于过滤和属性集合的确定是根据待校验信息的属性元组进行的,具有较强的任务适应性。
进一步地,为了提高获取参考属性元组的准确性,所述基于所述语句集合通过所述大模型确定参考属性元组,包括:将所述语句集合中的各分句分别填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的各分句中的属性元组,得到参考属性元组。
需要说明的是,对语句集合中的每个语句使用大模型进行查询,获取模型生成的输出,从中提取关键信息,形成参考属性元组,更全面地理解语句集合中的信息,提高获取参考属性元组的准确性。
在具体实现中,将SENTENCE_SET集合中每句话分别填充到预置的属性元组抽取Prompt模板中,将填充后的Prompt模板输入给大模型,抽取SENTENCE_SET中每个句子的属性元组,即可得到参考属性元组。
进一步地,为了提高参考信息的准确性,所述基于所述属性集合确定参考信息,包括:获取所述属性集合中各个属性元组的出现频率;根据所述各个属性元组的出现频率确定目标属性元组;基于所述目标属性元组确定参考信息。
在具体实现中,统计ATTIRBUTE_SET集合中属性元组信息,选择出现频率最高的属性元组信息,作为参考信息即相对权威信息。
进一步地,为了提高信息处理效率,所述根据所过滤后的参考属性元组确定属性集合之后,还包括:判断所述查询集合中的查询文本是否遍历完成;若所述查询集合中的查询文本未遍历完成,则执行所述基于所述查询集合中的查询语句进行搜索,得到搜索结果的步骤。
需要说明的是,遍历并处理QUERY_SET集合,判断是否处理完成全部Query文本,若处理完成,则统计ATTIRBUTE_SET集合中属性元组信息,选择出现频率最高的属性元组信息,作为相对权威信息;若未处理完成,则继续进行处理,对查询集合中的查询语句进行搜索,得到搜索结果。
如图4所示,图4为本实施例基于大模型的信息校验方法的整体流程图,用户输入一条待校验的信息;将信息填充到预置的属性元组抽取Prompt模板中;将填充后的Prompt输入给大模型,抽取输入信息的属性元组;依次按照校验信息中属性值出现顺序去掉其中一个属性,用剩余另外属性作为QUERY,得到QUERY_SET集合;遍历并处理QUERY_SET, 判断是否处理完全部QUERY。若未完成,则用QUERY请求搜索结果,拿到TopN搜索结果;将搜索结果文本按标点符号分句,将包含QUERY文本的句子,添加到SENTENCE_SET集合;将SENTENCE_SET集合中每句话分别填充到预置的属性元组抽取Prompt模板中;将填充后的Prompt输入给大模型,抽取每句话中的属性元组;根据待校验的信息抽取的属性,在抽取的属性元组中过滤出相关的属性元组;将过滤后的属性元组加入到ATTIRBUTE_SET集合中。若完成,则统计ATTIRBUTE_SET集合中属性元组,选择出现频率最高的属性元组,作为相对权威信息;用相对权威信息和用户输入信息做校验,判断每个属性以及属性信息是否一致;若一致,则判定用户输入信息准确可信;若不一致,则判定用户输入信息不可信,输出相对权威信息作为参考。
本实施例通过基于所述属性元组确定查询集合;基于所述查询集合中的查询文本进行搜索,得到搜索结果;基于所述搜索结果确定语句集合;基于所述语句集合通过所述大模型确定参考信息。通过上述方式 ,通过对查询文本搜索的结果确定语句集合,从而通过大模型确定参考信息,提高了信息准确性。
参照图5,图5为本发明基于大模型的信息校验装置第一实施例的结构框图。
如图5所示,本发明实施例提出的基于大模型的信息校验装置包括:
生成模块10,用于响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组。
确定模块20,用于基于所述属性元组通过所述大模型确定参考信息。
校验模块30,用于基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
本实施例通过响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;基于所述属性元组通过所述大模型确定参考信息;基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。通过上述方式,通过大模型生成参考信息,从而根据参考信息对待校验信息进行校验,解决了信息校验效果差导致信息准确性低的技术问题,可以校验信息的准确性,提高信息可信度以及利用率。
在一实施例中,所述生成模块10,还用于响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
在一实施例中,所述确定模块20,还用于基于所述属性元组确定查询集合;基于所述查询集合中的查询文本进行搜索,得到搜索结果;基于所述搜索结果确定语句集合;基于所述语句集合通过所述大模型确定参考信息。
在一实施例中,所述确定模块20,还用于按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;基于所述多个筛选后的属性组合得到查询集合。
在一实施例中,所述确定模块20,还用于基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;基于所述搜索结果序列确定搜索结果。
在一实施例中,所述确定模块20,还用于将所述搜索结果根据预设分句规则进行分句,得到多个分句;基于所述多个分句中包含查询文本的分句确定语句集合。
在一实施例中,所述确定模块20,还用于基于所述语句集合通过所述大模型确定参考属性元组;基于待校验信息的属性元组对所述参考属性元组进行过滤,得到过滤后的参考属性元组;根据所过滤后的参考属性元组确定属性集合;基于所述属性集合确定参考信息。
在一实施例中,所述确定模块20,还用于将所述语句集合中的各分句分别填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的各分句中的属性元组,得到参考属性元组。
在一实施例中,所述确定模块20,还用于获取所述属性集合中各个属性元组的出现频率;根据所述各个属性元组的出现频率确定目标属性元组;基于所述目标属性元组确定参考信息。
在一实施例中,所述确定模块20,还用于判断所述查询集合中的查询文本是否遍历完成;若所述查询集合中的查询文本未遍历完成,则执行所述基于所述查询集合中的查询语句进行搜索,得到搜索结果的步骤。
在一实施例中,所述校验模块30,还用于将所述参考信息的属性元组中的属性和属性值和所述校验信息的属性元组中的属性和属性值进行匹配,得到匹配结果;基于所述匹配结果确定信息校验结果。
在一实施例中,所述校验模块30,还用于在所述匹配结果为匹配一致时,将信息校验结果设置为校验通过且用户输入的待校验信息准确可信;在所述匹配结果为匹配不一致时,将信息校验结果设置为校验不通过且用户输入的待校验信息不可信。
此外,为实现上述目的,本发明还提出一种基于大模型的信息校验设备,所述基于大模型的信息校验设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大模型的信息校验程序,所述基于大模型的信息校验程序配置为实现如上文所述的基于大模型的信息校验方法的步骤。
由于本基于大模型的信息校验设备采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于大模型的信息校验程序,所述基于大模型的信息校验程序被处理器执行时实现如上文所述的基于大模型的信息校验方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于大模型的信息校验方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
本发明公开了A1、一种基于大模型的信息校验方法,所述方法包括:
响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
基于所述属性元组通过所述大模型确定参考信息;
基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
A2、如A1所述的方法,所述响应于用户输入的待校验信息,基于所述待校验信息通过大模型生成属性元组,包括:
响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
A3、如A1所述的方法,所述基于所述属性元组通过所述大模型确定参考信息,包括:
基于所述属性元组确定查询集合;
基于所述查询集合中的查询文本进行搜索,得到搜索结果;
基于所述搜索结果确定语句集合;
基于所述语句集合通过所述大模型确定参考信息。
A4、如A3所述的方法,所述基于所述属性元组确定查询集合,包括:
按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;
基于所述多个筛选后的属性组合得到查询集合。
A5、如A3所述的方法,所述基于所述查询集合中的查询语句进行搜索,得到搜索结果,包括:
基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;
基于所述搜索结果序列确定搜索结果。
A6、如A3所述的方法,所述基于所述搜索结果确定语句集合,包括:
将所述搜索结果根据预设分句规则进行分句,得到多个分句;
基于所述多个分句中包含查询文本的分句确定语句集合。
A7、如A3所述的方法,所述基于所述语句集合通过所述大模型确定参考信息,包括:
基于所述语句集合通过所述大模型确定参考属性元组;
基于待校验信息的属性元组对所述参考属性元组进行过滤,得到过滤后的参考属性元组;
根据所过滤后的参考属性元组确定属性集合;
基于所述属性集合确定参考信息。
A8、如A7所述的方法,所述基于所述语句集合通过所述大模型确定参考属性元组,包括:
将所述语句集合中的各分句分别填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的各分句中的属性元组,得到参考属性元组。
A9、如A7所述的方法,所述基于所述属性集合确定参考信息,包括:
获取所述属性集合中各个属性元组的出现频率;
根据所述各个属性元组的出现频率确定目标属性元组;
基于所述目标属性元组确定参考信息。
A10、如A7所述的方法,所述根据所过滤后的参考属性元组确定属性集合之后,还包括:
判断所述查询集合中的查询文本是否遍历完成;
若所述查询集合中的查询文本未遍历完成,则执行所述基于所述查询集合中的查询语句进行搜索,得到搜索结果的步骤。
A11、如A1所述的方法,所述基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果,包括:
将所述参考信息的属性元组中的属性和属性值和所述校验信息的属性元组中的属性和属性值进行匹配,得到匹配结果;
基于所述匹配结果确定信息校验结果。
A12、如A11所述的方法,所述基于所述匹配结果确定信息校验结果,包括:
在所述匹配结果为匹配一致时,将信息校验结果设置为校验通过且用户输入的待校验信息准确可信;
在所述匹配结果为匹配不一致时,将信息校验结果设置为校验不通过且用户输入的待校验信息不可信。
本发明还公开了B13、一种基于大模型的信息校验装置,所述基于大模型的信息校验装置包括:
生成模块,用于响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
确定模块,用于基于所述属性元组通过所述大模型确定参考信息;
校验模块,用于基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
B14、如B13所述的装置,所述生成模块,还用于响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
B15、如B13所述的装置,所述确定模块,还用于基于所述属性元组确定查询集合;
基于所述查询集合中的查询文本进行搜索,得到搜索结果;
基于所述搜索结果确定语句集合;
基于所述语句集合通过所述大模型确定参考信息。
B16、如B15所述的装置,所述确定模块,还用于按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;
基于所述多个筛选后的属性组合得到查询集合。
B17、如B15所述的装置,所述确定模块,还用于基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;
基于所述搜索结果序列确定搜索结果。
B18、如B15所述的装置,所述确定模块,还用于将所述搜索结果根据预设分句规则进行分句,得到多个分句;
基于所述多个分句中包含查询文本的分句确定语句集合。
本发明还公开了C19、一种基于大模型的信息校验设备,所述基于大模型的信息校验设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大模型的信息校验程序,所述基于大模型的信息校验程序配置为实现如上所述的基于大模型的信息校验方法。
本发明还公开了D20、一种存储介质,所述存储介质上存储有基于大模型的信息校验程序,所述基于大模型的信息校验程序被处理器执行时实现如上所述的基于大模型的信息校验方法。

Claims (10)

1.一种基于大模型的信息校验方法,其特征在于,所述方法包括:
响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
基于所述属性元组通过所述大模型确定参考信息;
基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
2.如权利要求1所述的方法,其特征在于,所述响应于用户输入的待校验信息,基于所述待校验信息通过大模型生成属性元组,包括:
响应于用户输入的待校验信息,将所述待校验信息填充至预设属性元组抽取模板,得到填充后的属性元组抽取模板;
将所述填充后的属性元组抽取模板输入至大模型,并接收所述大模型反馈的所述待校验信息的属性元组。
3.如权利要求1所述的方法,其特征在于,所述基于所述属性元组通过所述大模型确定参考信息,包括:
基于所述属性元组确定查询集合;
基于所述查询集合中的查询文本进行搜索,得到搜索结果;
基于所述搜索结果确定语句集合;
基于所述语句集合通过所述大模型确定参考信息。
4.如权利要求3所述的方法,其特征在于,所述基于所述属性元组确定查询集合,包括:
按照属性在所述待校验信息中出现顺序对所述属性元组进行筛选,得到多个筛选后的属性组合;
基于所述多个筛选后的属性组合得到查询集合。
5.如权利要求3所述的方法,其特征在于,所述基于所述查询集合中的查询语句进行搜索,得到搜索结果,包括:
基于所述查询集合中的查询文本进行搜索,得到搜索结果序列;
基于所述搜索结果序列确定搜索结果。
6.如权利要求3所述的方法,其特征在于,所述基于所述搜索结果确定语句集合,包括:
将所述搜索结果根据预设分句规则进行分句,得到多个分句;
基于所述多个分句中包含查询文本的分句确定语句集合。
7.如权利要求3所述的方法,其特征在于,所述基于所述语句集合通过所述大模型确定参考信息,包括:
基于所述语句集合通过所述大模型确定参考属性元组;
基于待校验信息的属性元组对所述参考属性元组进行过滤,得到过滤后的参考属性元组;
根据所过滤后的参考属性元组确定属性集合;
基于所述属性集合确定参考信息。
8.如权利要求1所述的方法,其特征在于,所述基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果,包括:
将所述参考信息的属性元组中的属性和属性值和所述校验信息的属性元组中的属性和属性值进行匹配,得到匹配结果;
基于所述匹配结果确定信息校验结果。
9.如权利要求8所述的方法,其特征在于,所述基于所述匹配结果确定信息校验结果,包括:
在所述匹配结果为匹配一致时,将信息校验结果设置为校验通过且用户输入的待校验信息准确可信;
在所述匹配结果为匹配不一致时,将信息校验结果设置为校验不通过且用户输入的待校验信息不可信。
10.一种基于大模型的信息校验装置,其特征在于,所述基于大模型的信息校验装置包括:
生成模块,用于响应于接收到的待校验信息,基于所述待校验信息通过大模型生成属性元组;
确定模块,用于基于所述属性元组通过所述大模型确定参考信息;
校验模块,用于基于所述参考信息对所述待校验信息进行信息校验,得到信息校验结果。
CN202410011523.XA 2024-01-04 2024-01-04 基于大模型的信息校验方法及装置 Pending CN117520483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410011523.XA CN117520483A (zh) 2024-01-04 2024-01-04 基于大模型的信息校验方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410011523.XA CN117520483A (zh) 2024-01-04 2024-01-04 基于大模型的信息校验方法及装置

Publications (1)

Publication Number Publication Date
CN117520483A true CN117520483A (zh) 2024-02-06

Family

ID=89751660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410011523.XA Pending CN117520483A (zh) 2024-01-04 2024-01-04 基于大模型的信息校验方法及装置

Country Status (1)

Country Link
CN (1) CN117520483A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268216A (zh) * 2014-09-24 2015-01-07 江苏名通信息科技有限公司 一种基于互联网信息的数据清洗系统
CN109408381A (zh) * 2018-10-10 2019-03-01 四川新网银行股份有限公司 一种基于数据校验模板的产品数据自动校验平台及方法
CN111143394A (zh) * 2019-11-20 2020-05-12 泰康保险集团股份有限公司 知识数据处理方法、装置、介质及电子设备
CN111291192A (zh) * 2020-01-15 2020-06-16 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111782763A (zh) * 2020-05-22 2020-10-16 平安科技(深圳)有限公司 基于语音语义的信息检索方法、及其相关设备
CN112926296A (zh) * 2021-03-30 2021-06-08 平安科技(深圳)有限公司 数据校验方法、装置、电子设备及存储介质
CN113312501A (zh) * 2021-06-29 2021-08-27 中新国际联合研究院 基于知识图谱的安全知识自助查询系统的构建方法及装置
WO2022052639A1 (zh) * 2020-09-10 2022-03-17 北京达佳互联信息技术有限公司 数据查询方法及装置
CN114860852A (zh) * 2022-04-18 2022-08-05 北京计算机技术及应用研究所 一种面向军事领域的知识图谱构建方法
CN116976321A (zh) * 2023-04-28 2023-10-31 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备、存储介质和程序产品

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268216A (zh) * 2014-09-24 2015-01-07 江苏名通信息科技有限公司 一种基于互联网信息的数据清洗系统
CN109408381A (zh) * 2018-10-10 2019-03-01 四川新网银行股份有限公司 一种基于数据校验模板的产品数据自动校验平台及方法
CN111143394A (zh) * 2019-11-20 2020-05-12 泰康保险集团股份有限公司 知识数据处理方法、装置、介质及电子设备
CN111291192A (zh) * 2020-01-15 2020-06-16 北京百度网讯科技有限公司 知识图谱中三元组置信度计算方法和装置
CN111782763A (zh) * 2020-05-22 2020-10-16 平安科技(深圳)有限公司 基于语音语义的信息检索方法、及其相关设备
WO2022052639A1 (zh) * 2020-09-10 2022-03-17 北京达佳互联信息技术有限公司 数据查询方法及装置
CN112926296A (zh) * 2021-03-30 2021-06-08 平安科技(深圳)有限公司 数据校验方法、装置、电子设备及存储介质
CN113312501A (zh) * 2021-06-29 2021-08-27 中新国际联合研究院 基于知识图谱的安全知识自助查询系统的构建方法及装置
CN114860852A (zh) * 2022-04-18 2022-08-05 北京计算机技术及应用研究所 一种面向军事领域的知识图谱构建方法
CN116976321A (zh) * 2023-04-28 2023-10-31 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备、存储介质和程序产品

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈晓颖;胡熠;陆汝占;: "实体关系模板的获取技术", 计算机工程, no. 21, 5 November 2007 (2007-11-05) *

Similar Documents

Publication Publication Date Title
CN109582799B (zh) 知识样本数据集的确定方法、装置及电子设备
US11657061B2 (en) Application programming interface using digital templates to extract information from multiple data sources
CN108984155B (zh) 数据处理流程设定方法和装置
WO2019169725A1 (zh) 测试数据生成方法、装置、设备以及计算机可读存储介质
US9910870B2 (en) System and method for creating data models from complex raw log files
CN112131295A (zh) 基于Elasticsearch的数据处理方法及设备
CN110297880B (zh) 语料产品的推荐方法、装置、设备及存储介质
CN111145051A (zh) 一种仲裁电子文书的生成方法及装置
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN114610845A (zh) 基于多系统的智能问答方法、装置和设备
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
CN110704635B (zh) 一种知识图谱中三元组数据的转换方法及装置
CN112966076A (zh) 智能问答问题的生成方法、装置、计算机设备及存储介质
CN117076727A (zh) 一种查询语句解析方法、装置、设备和存储介质
CN116860957A (zh) 一种基于大语言模型的企业筛选方法、装置及介质
CN117520483A (zh) 基于大模型的信息校验方法及装置
CN107273293B (zh) 大数据系统性能测试方法、装置及电子设备
CN116226108A (zh) 可实现不同治理程度的数据治理方法及系统
CN115033436A (zh) 页面测试方法及装置、电子设备、存储介质
CN114676133A (zh) 索引创建方法、装置、设备及存储介质
CN117891531B (zh) 用于saas软件的系统参数配置方法、系统、介质及电子设备
CN117235236B (zh) 对话方法、装置、计算机设备和存储介质
CN112799638B (zh) 无侵入式快速开发方法、平台、终端及存储介质
CN115982137B (zh) 一种数据名称和数据库建表生成方法及系统
CN114090721B (zh) 基于自然语言数据进行查询、数据更新的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination