CN112836061A - 智能推荐的方法、装置以及计算机设备 - Google Patents

智能推荐的方法、装置以及计算机设备 Download PDF

Info

Publication number
CN112836061A
CN112836061A CN202110037509.3A CN202110037509A CN112836061A CN 112836061 A CN112836061 A CN 112836061A CN 202110037509 A CN202110037509 A CN 202110037509A CN 112836061 A CN112836061 A CN 112836061A
Authority
CN
China
Prior art keywords
target
retrieval
weight
model
association degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110037509.3A
Other languages
English (en)
Inventor
王雍富
孙燕
贺春艳
梁丽娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110037509.3A priority Critical patent/CN112836061A/zh
Priority to PCT/CN2021/084537 priority patent/WO2022151594A1/zh
Publication of CN112836061A publication Critical patent/CN112836061A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能推荐的方法、装置以及计算机设备,其中,方法包括:获取客户输入的表格检索信息;对所述表格检索信息进行预处理,得到处理后的目标问题;通过意图识别模型识别所述目标问题,得到目标意图;提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;从多个检索模型中选取所述目标类别对应的目标检索模型;基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;将所述第一表格和所述第二表格推荐给所述客户。本发明的有益效果:通过目标检索模型实现了对表格检索信息的精确检索,提高了检索的精确度。

Description

智能推荐的方法、装置以及计算机设备
技术领域
本发明涉及数据库检索领域,特别涉及一种智能推荐的方法、装置以及计算机设备。
背景技术
传统的数据检索,都是基于关键词在数据库中进行检索,但是所有的表格检索信息都是通过一个检索模型进行处理,当数据库中的数据比较多时,该检索模型对应的检索数据较多,且各个类别的逻辑也大相径庭,若对表格检索信息进行充分检索,则耗费的时间较长,而且检索的结果不一定精确,因此,亟需一种智能推荐的方法。
发明内容
本发明的主要目的为提供一种智能推荐的方法、装置以及计算机设备,旨在解决只有一个检索模型导致的检索不一定精确的问题。
本发明提供了一种智能推荐的方法,包括:
获取客户输入的表格检索信息;
对所述表格检索信息进行预处理,得到处理后的目标问题;
通过意图识别模型识别所述目标问题,得到目标意图;
提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
从多个检索模型中选取所述目标类别对应的目标检索模型;
基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
将所述第一表格和所述第二表格推荐给所述客户。
进一步地,所述将所述第一表格和所述第二表格推荐给所述客户的步骤之后,还包括:
获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
判断所述浏览时间是否超过了预设时间;
若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
进一步地,所述对所述表格检索信息进行预处理,得到处理后的目标问题的步骤,包括:
将所述表格检索信息统一语种,剔除标点符号,得到标准化信息;
将所述标准化信息输入至BERT训练模型中,得到所述标准化信息中每个词对应的词向量,其中所述BERT训练模型基于预设关键词库中的关键词训练而成;
将所述词向量依次排列,得到所述目标问题。
进一步地,所述从多个检索模型中选取所述目标类别对应的目标检索模型的步骤之前,还包括:
获取待训练检索模型的目标类别;
从预设权重表中,获取属于所述目标类别的目标表格的第一权重,以及获取不属于所述目标类别的表格的第二权重;其中,所述第一权重大于所述第二权重;
将所述目标表格与所述第一权重,以及所述不属于所述目标类别的表格与所述第二权重依次输入至所述待训练检索模型中进行训练,训练完成后得到所述检索模型。
进一步地,所述将不属于所述目标类别的其他表格赋予第二权重的步骤,包括:
计算所述其他表格与所述目标表格的关联度;
将所述关联度进行归一化处理,得到对应关联度的归一化值;
根据权重对应公式
Figure BDA0002894852340000021
计算得到所述第二权重;其中,所述n12表示所述归一化值,所述w1表示第一权重,所述w2表示第二权重,R2表示所述其他表格对应的预设基础权重值,所述权重对应公式预存于所述预设权重表中。
进一步地,所述基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格的步骤之前,包括:
获取执行各个预存表格的任务脚本;其中,所述预存表格包括所述第一表格和所述第二表格;
基于所述任务脚本中的SQL语句获取各所述预存表格之间的关联度;
将所述关联度保存在所述关联图谱中。
本发明还提供了一种智能推荐的装置,包括:
获取模块,用于获取客户输入的表格检索信息;
预处理模块,用于对所述表格检索信息进行预处理,得到处理后的目标问题;
识别模块,用于通过意图识别模型识别所述目标问题,得到目标意图;
分析模块,用于提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
选取模块,用于从多个检索模型中选取所述目标类别对应的目标检索模型;
搜索模块,用于基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
推荐模块,用于将所述第一表格和所述第二表格推荐给所述客户。
进一步地,所述智能推荐的装置,还包括:
浏览时间获取模块,用于获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
判断模块,用于判断所述浏览时间是否超过了预设时间;
训练数据生成模块,用于若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本发明的有益效果:通过识别出表格检索信息的目标类别,从多个检索模型中选取与目标类别相对应的目标检索模型在数据库中检索,从而得到对应的第一表格,以及与第一表格关联度大于设定关联度的第二表格一并推荐给客户,通过目标检索模型实现了对表格检索信息的精确检索,提高了检索的精确度,并且将第一表格关联度大于设定关联度的第二表格一并推荐给客户,也可以进一步地提高精确度,另外,由于目标检索模型主要检索的是同类别的数据,一般只需要在目标类别对应的存储点进行寻找,减小了耗费的时间。
附图说明
图1是本发明一实施例的一种智能推荐的方法的流程示意图;
图2是本发明一实施例的一种智能推荐的装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变,所述的连接可以是直接连接,也可以是间接连接。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参照图1,本发明提出一种智能推荐的方法,包括:
S1:获取客户输入的表格检索信息;
S2:对所述表格检索信息进行预处理,得到处理后的目标问题;
S3:通过意图识别模型识别所述目标问题,得到目标意图;
S4:提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
S5:从多个检索模型中选取所述目标类别对应的目标检索模型;
S6:基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
S7:将所述第一表格和所述第二表格推荐给所述客户。
如上述步骤S1所述,获取客户输入的表格检索信息。其中,客户的表格检索信息为客户在网页上所输入的信息,获取的方式为通过互联网进行获取,即通过服务器接收到客户所输入的表格检索信息。
如上述步骤S2所述,对所述表格检索信息进行预处理,得到处理后的目标问题。其中,预处理的方式为对表格检索信息进行错别字转化,拼音转化为中文语句、对词句中的词语进行转换、对重复的问题和词语进行去重、对同义词进行替换、对未完整的语句按照句意进行补充等。另外,预处理还可以包括将表格检索信息进行向量化,得到由向量构成的目标问题,以便于输入至意图识别模型中,向量化的步骤后续有详细说明,此处不再赘述。当然也可以直接将由文字构成的目标问题,输入至意图识别模型中,这取决于意图识别模型的所需要的输入数据所决定,根据实际情况选择对应的意图识别模型。
如上述步骤S3所述,通过意图识别模型识别所述目标问题,得到目标意图。其中,意图识别模型采用深度学习的方法,将不同的表格检索信息及其对应的检索答案作为训练数据进行训练,意图识别模型可以采用albert模型+crf模型的结构对意图和属性进行联合训练,使训练后的综合模型能够准确识别表格检索信息的意图。
如上述步骤S4所述,提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别,分析的方式为将代表这目标意图的关键词进行语义识别,判断其属于事先划分的类别中的哪一类,识别的方式可以是事先为每个类别构建一个类别词库,然后判断关键词属于哪一个类别词库中,从而得到对应的目标类别,也可以是将关键词进行向量化,计算与各个类别之间的余弦相似度,再根据计算的余弦相似度确定对应的目标类别。
如上述步骤S5所述,从多个检索模型中选取所述目标类别对应的目标检索模型。每个所述检索模型与多个类别的表格具有关联关系,各所述检索模型与对应的目标类别的表格的关联关系,强于其他非目标类别的表格的关联关系。即每个检索模型主要是基于所对应类别的表格进行训练的,训练的方式可以是将对应类别表格分配一个较大的权重进行训练,对其他表格分配一个较小的权重进行训练,从而使检索模型主要基于对应类别的表格训练而成,在检索对应类别的表格时,具有更高的精确度。
如上述步骤S6所述,基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格。由于用户输入的表格检索信息不一定可以表达出用户想要的信息,因此在检索到最相对应的第一表格时,还可以基于关联图谱找出与第一表格关联度大于设定关联度的第二表格,其中第二表格可以包括多个,各个表格之间的关联度事先存储在数据库中,其根据数据库所执行的SQL语句进行耦连,即表格之间的关联度由对应一起执行的SLQ语句的数量所决定。
如上述步骤S7所述,将第一表格和第二表格推荐给客户。以供客户进行选择,从而为客户提供了多个选项,使客户基于各个选项选取所需要的表格信息,提高了为客户提供答案的准确性。
在一个实施例中,所述将所述第一表格和所述第二表格推荐给所述客户的步骤S7之后,还包括:
S801:获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
S802:判断所述浏览时间是否超过了预设时间;
S803:若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
如上述步骤S801-S803所述,实现了对检索模型的再次训练。即当客户浏览第一表格和/或第二表格的浏览时间超过了预设时间时,即可以认为该第一表格和/或第二表格是与对应的表格检索信息相对应的,可以将该表格检索信息与第一表格和/或第二表格作为新的训练数据对目标检索模型进行训练,从而实现了在检索过程中,对目标检索模型的不断优化,使目标检索模型无限贴近于当前的热点信息,进一步提升客户的体验。
在一个实施例中,所述对所述表格检索信息进行预处理,得到处理后的目标问题的步骤S2,包括:
S201:将所述表格检索信息统一语种,剔除标点符号,,得到标准化信息;
S202:将所述标准化信息输入至BERT训练模型中,以构建所述标准化信息中每个词对应的词向量,其中所述BERT训练模型基于预设关键词库中的关键词训练而成;
S203:将所述词向量依次排列,得到所述目标问题。
如上述步骤S201-S203所述,实现了对表格检索信息的预处理。即先将表格检索信息进行标准化处理,即统一语种和根据特殊字符标识库剔除表格检索信息中的标点符号,其中统一语种为将拼音,汉语,英语,等不同的语种转换为同一种语种。特殊字符标识库中事先存储着不同的特殊字符或标识所对应的网络释义,以对表格检索信息进行更好的识别,提高识别的准确度。将其输入至BERT训练模型中,以构建所述标准化信息中每个词对应的词向量,其中所述BERT训练模型基于预设关键词库中的关键词训练而成。即通过BERT预训练模型先读取数据集的文本数据,训练模型,然后根据训练结果调整模型参数,得到BERT训练模型。基于各个词向量在表格检索信息中的顺序进行排列,得到目标问题,当然,由于检索模型参照的是每个关键词,与词序之间并没有任何关系,因此,各个词向量之间也可以是任意的排列方式。
在一个实施例中,所述从多个检索模型中选取所述目标类别对应的目标检索模型的步骤S5之前,还包括:
S401:获取待训练检索模型的目标类别;
S402:从预设权重表中,获取属于所述目标类别的目标表格的第一权重,以及获取不属于所述目标类别的表格的第二权重;其中,所述第一权重大于所述第二权重;
S403:将所述目标表格与所述第一权重,以及所述不属于所述目标类别的表格与所述第二权重依次输入至所述待训练检索模型中进行训练,训练完成后得到所述检索模型。
如上述步骤S401-S403所述,实现了对检索模型的训练。即获取到待训练检索模型的类别,将数据库中属于该目标类别的目标表格赋予第一权重,将不属于目标类别的表格赋予第二权重,即通过权重参数调整检索模型中的参数,使最终训练得到的检索模型向目标类别靠拢,使检索模型对该目标类别数据进行更加精确的训练,当然为了使检索模型可以反馈数据,其他表格也应该在训练计划中,以免类别识别模型判断错误而导致无法反馈数据。其中,预设权重表中事先存储了各目标表格的第一权重,第二权重可以是一个设定值,也可以是基于第一权重所对应的值,预设权重表中可以存储第一权重和第二权重的权重对应公式,具体的权重对应公式后续有详细说明,此处不再赘述。
在一个实施例中,所述将不属于所述目标类别的其他表格赋予第二权重的步骤S403,包括:
S4031:计算所述其他表格与所述目标表格的关联度;
S4032:将所述关联度进行归一化处理,得到对应关联度的归一化值;
S4033:根据权重对应公式
Figure BDA0002894852340000091
计算得到所述第二权重;其中,所述n12表示所述归一化值,所述w1表示第一权重,所述w2表示第二权重,R2表示所述其他表格对应的预设基础权重值,所述权重对应公式预存于所述预设权重表中。
如上述步骤S4031-S4033所述,实现了对第二权重的赋值,即先计算其他表格与目标表格的关联度,计算关联度的方式具体为,先获取数据库中执行的任务脚本,解析任务脚本并建立工作栈,其中,建立工作栈的方式可以是通过建立抽象语法树,将目标任务脚本中的条件判断结合设定抽象语法树的节点,然后根据任务脚本的执行步骤,反向推导抽象语法树的结果,即各个业务报表被调用的先后顺序,从而得到表格间的耦连关系,其中该耦连关系也是通过数值来进行确定的,当两个表格参与同一任务脚本的次数越多,其耦连关系也就越强,即得到的关联度也就越大,即关联度是根据耦连关系所得到的,将计算得到的关联度进行归一化处理,其中归一化的方式可以通过现有技术的任意一种实现,此处不再赘述,将归一化值作为权重,输入至权重对应公式
Figure BDA0002894852340000092
得到第二权重,所述n12表示所述归一化值,所述w1表示第一权重,所述w2表示第二权重,R2表示所述其他表格对应的预设基础权重值。从而完成对第二权重的设定,另外,根据公式可以使与第一表格关联度越高的,其对应的归一化值也越大,故而根据公式计算的第二权重也就越高,完成对其他表格的第二权重的设定。
在一个实施例中,所述基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格的步骤S6之前,包括:
S501:获取执行各个预存表格的任务脚本;其中,所述预存表格包括所述第一表格和所述第二表格;
S502:基于所述任务脚本中的SQL语句获取各所述预存表格之间的关联度;
S503:将所述关联度保存在所述关联图谱中。
如上述步骤S501-S503所述,实现了对关联度的计算,即先获取执行各个预存表格的任务脚本,其中,预存表格为数据库中所有的表格,然后基于任务脚本中的SQL语句获取各个预存表格之间的关联度,计算关联度的方式具体为,先获取数据库中执行的任务脚本,解析任务脚本并建立工作栈,其中,建立工作栈的方式可以是通过建立抽象语法树,将目标任务脚本中的条件判断结合设定抽象语法树的节点,然后根据任务脚本的执行步骤,反向推导抽象语法树的结果,即各个业务报表被调用的先后顺序,从而得到表格间的耦连关系,根据耦连关系得到对应的关联度,再将关联度保存在所述关联图谱中,使后续可以直接根据关联图谱,检索到第一表格与其他表格之间的关联度,从而找到第二表格,实现了基于关联度对第二表格的检索。
本发明的有益效果:通过识别出表格检索信息的目标类别,从多个检索模型中选取与目标类别相对应的目标检索模型在数据库中检索,从而得到对应的第一表格,以及与第一表格关联度大于设定关联度的第二表格一并推荐给客户,通过目标检索模型实现了对表格检索信息的精确检索,提高了检索的精确度,并且将第一表格关联度大于设定关联度的第二表格一并推荐给客户,也可以进一步地提高精确度,另外,由于目标检索模型主要检索的是同类别的数据,一般只需要在目标类别对应的存储点进行寻找,减小了耗费的时间。
参照图2,本发明还提供了一种智能推荐的装置,包括:
获取模块10,用于获取客户输入的表格检索信息;
预处理模块20,用于对所述表格检索信息进行预处理,得到处理后的目标问题;
识别模块30,用于通过意图识别模型识别所述目标问题,得到目标意图;
分析模块40,用于提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
选取模块50,用于从多个检索模型中选取所述目标类别对应的目标检索模型;
搜索模块60,用于基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
推荐模块70,用于将所述第一表格和所述第二表格推荐给所述客户。
在一个实施例中,智能推荐的装置,还包括:
浏览时间获取模块,用于获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
判断模块,用于判断所述浏览时间是否超过了预设时间;
训练数据生成模块,用于若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
在本实施例中,上述智能推荐的装置实施例中各个模块的具体实现,请参照上述方法实施例中所述,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种预存表格等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的智能推荐的方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一实施例所述的智能推荐的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种智能推荐的方法,其特征在于,包括:
获取客户输入的表格检索信息;
对所述表格检索信息进行预处理,得到处理后的目标问题;
通过意图识别模型识别所述目标问题,得到目标意图;
提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
从多个检索模型中选取所述目标类别对应的目标检索模型;
基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
将所述第一表格和所述第二表格推荐给所述客户。
2.如权利要求1所述的智能推荐的方法,其特征在于,所述将所述第一表格和所述第二表格推荐给所述客户的步骤之后,还包括:
获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
判断所述浏览时间是否超过了预设时间;
若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
3.如权利要求1所述的智能推荐的方法,其特征在于,所述对所述表格检索信息进行预处理,得到处理后的目标问题的步骤,包括:
将所述表格检索信息统一语种,剔除标点符号,得到标准化信息;
将所述标准化信息输入至BERT训练模型中,得到所述标准化信息中每个词对应的词向量,其中所述BERT训练模型基于预设关键词库中的关键词训练而成;
将所述词向量依次排列,得到所述目标问题。
4.如权利要求1所述的智能推荐的方法,其特征在于,所述从多个检索模型中选取所述目标类别对应的目标检索模型的步骤之前,还包括:
获取待训练检索模型的目标类别;
从预设权重表中,获取属于所述目标类别的目标表格的第一权重,以及获取不属于所述目标类别的表格的第二权重;其中,所述第一权重大于所述第二权重;
将所述目标表格与所述第一权重,以及所述不属于所述目标类别的表格与所述第二权重依次输入至所述待训练检索模型中进行训练,训练完成后得到所述检索模型。
5.如权利要求4所述的智能推荐的方法,其特征在于,所述将不属于所述目标类别的表格赋予第二权重的步骤,包括:
计算所述表格与所述目标表格的关联度;
将所述关联度进行归一化处理,得到对应关联度的归一化值;
根据权重对应公式
Figure FDA0002894852330000021
计算得到所述第二权重;其中,所述n12表示所述归一化值,所述w1表示第一权重,所述w2表示第二权重,R2表示所述其他表格对应的预设基础权重值,所述权重对应公式预存于所述预设权重表中。
6.如权利要求1所述的智能推荐的方法,其特征在于,所述基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格的步骤之前,包括:
获取执行各个预存表格的任务脚本;其中,所述预存表格包括所述第一表格和所述第二表格;
基于所述任务脚本中的SQL语句获取各所述预存表格之间的关联度;
将所述关联度保存在所述关联图谱中。
7.一种智能推荐的装置,其特征在于,包括:
获取模块,用于获取客户输入的表格检索信息;
预处理模块,用于对所述表格检索信息进行预处理,得到处理后的目标问题;
识别模块,用于通过意图识别模型识别所述目标问题,得到目标意图;
分析模块,用于提取所述目标意图的关键词,并基于所述关键词得到所述目标意图所属的目标类别;
选取模块,用于从多个检索模型中选取所述目标类别对应的目标检索模型;
搜索模块,用于基于所述目标检索模型搜索与所述目标问题相对应的第一表格,并基于关联图谱找出与所述第一表格关联度大于设定关联度的第二表格;
推荐模块,用于将所述第一表格和所述第二表格推荐给所述客户。
8.如权利要求7所述的智能推荐的装置,其特征在于,还包括:
浏览时间获取模块,用于获取所述客户浏览所述第一表格和/或所述第二表格的浏览时间;
判断模块,用于判断所述浏览时间是否超过了预设时间;
训练数据生成模块,用于若超过了所述预设时间,则将所述表格检索信息和所述第一表格和/或所述第二表格作为训练数据,以训练所述目标检索模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202110037509.3A 2021-01-12 2021-01-12 智能推荐的方法、装置以及计算机设备 Pending CN112836061A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110037509.3A CN112836061A (zh) 2021-01-12 2021-01-12 智能推荐的方法、装置以及计算机设备
PCT/CN2021/084537 WO2022151594A1 (zh) 2021-01-12 2021-03-31 智能推荐的方法、装置以及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110037509.3A CN112836061A (zh) 2021-01-12 2021-01-12 智能推荐的方法、装置以及计算机设备

Publications (1)

Publication Number Publication Date
CN112836061A true CN112836061A (zh) 2021-05-25

Family

ID=75927891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110037509.3A Pending CN112836061A (zh) 2021-01-12 2021-01-12 智能推荐的方法、装置以及计算机设备

Country Status (2)

Country Link
CN (1) CN112836061A (zh)
WO (1) WO2022151594A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743981A (zh) * 2021-08-03 2021-12-03 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质
CN115983237A (zh) * 2023-03-21 2023-04-18 北京亚信数据有限公司 表格类型识别模型训练、预测及表格数据推荐方法和装置
CN117540062A (zh) * 2024-01-10 2024-02-09 广东省电信规划设计院有限公司 基于知识图谱的检索模型推荐方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质
US20190294731A1 (en) * 2018-03-26 2019-09-26 Microsoft Technology Licensing, Llc Search query dispatcher using machine learning
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN111368093A (zh) * 2020-02-26 2020-07-03 京东方科技集团股份有限公司 信息获取方法、装置、电子设备及计算机可读存储介质
CN112015878A (zh) * 2020-09-02 2020-12-01 中国平安财产保险股份有限公司 处理智慧客服未回答问题的方法、装置及计算机设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951458B (zh) * 2014-03-26 2019-03-01 华为技术有限公司 基于语义识别的帮助处理方法及设备
CN111368049B (zh) * 2020-02-26 2024-04-26 京东方科技集团股份有限公司 信息获取方法、装置、电子设备及计算机可读存储介质
CN111506719B (zh) * 2020-04-20 2023-09-12 深圳追一科技有限公司 一种关联问句推荐方法、装置、设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190294731A1 (en) * 2018-03-26 2019-09-26 Microsoft Technology Licensing, Llc Search query dispatcher using machine learning
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN111368093A (zh) * 2020-02-26 2020-07-03 京东方科技集团股份有限公司 信息获取方法、装置、电子设备及计算机可读存储介质
CN112015878A (zh) * 2020-09-02 2020-12-01 中国平安财产保险股份有限公司 处理智慧客服未回答问题的方法、装置及计算机设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743981A (zh) * 2021-08-03 2021-12-03 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质
CN113743981B (zh) * 2021-08-03 2023-11-28 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质
CN115983237A (zh) * 2023-03-21 2023-04-18 北京亚信数据有限公司 表格类型识别模型训练、预测及表格数据推荐方法和装置
CN117540062A (zh) * 2024-01-10 2024-02-09 广东省电信规划设计院有限公司 基于知识图谱的检索模型推荐方法及装置
CN117540062B (zh) * 2024-01-10 2024-04-12 广东省电信规划设计院有限公司 基于知识图谱的检索模型推荐方法及装置

Also Published As

Publication number Publication date
WO2022151594A1 (zh) 2022-07-21

Similar Documents

Publication Publication Date Title
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CN112836061A (zh) 智能推荐的方法、装置以及计算机设备
US20190005029A1 (en) Systems and methods for natural language processing of structured documents
US20180232204A1 (en) Intelligent data extraction
CN109800307B (zh) 产品评价的分析方法、装置、计算机设备及存储介质
CN112347310A (zh) 事件处理信息的查询方法、装置、计算机设备和存储介质
CN108920677A (zh) 问卷调查方法、调查系统及电子设备
CN111309881A (zh) 智能问答中未知问题处理方法、装置、计算机设备和介质
CN111814482A (zh) 文本关键数据的提取方法、系统和计算机设备
CN113688221A (zh) 基于模型的话术推荐方法、装置、计算机设备和存储介质
CN116402630B (zh) 一种基于表征学习的财务风险预测方法及系统
CN111400340B (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN113204968A (zh) 医学实体的概念识别方法、装置、设备及存储介质
CN109685576A (zh) 一种工程材料自动配价方法、装置、终端设备及存储介质
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
CN112347254A (zh) 新闻文本的分类方法、装置、计算机设备和存储介质
CN110502620B (zh) 导诊相似问题对生成方法、系统及计算机设备
CN112989829B (zh) 一种命名实体识别方法、装置、设备及存储介质
CN113177109A (zh) 文本的弱标注方法、装置、设备以及存储介质
CN113434763A (zh) 搜索结果的推荐理由生成方法、装置、设备及存储介质
CN113821608A (zh) 服务搜索方法、装置和计算机设备以及存储介质
CN113051372A (zh) 材料数据的处理方法、装置、计算机设备和存储介质
AU2022204425B2 (en) Extracting key value pairs using positional coordinates
Kiyavitskaya et al. Requirements model generation to support requirements elicitation: the Secure Tropos experience
CN113064997B (zh) 基于bert模型的意图分析方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40046362

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination