CN115115432A

CN115115432A - 基于人工智能的产品信息推荐方法及装置

Info

Publication number: CN115115432A
Application number: CN202210846102.XA
Authority: CN
Inventors: 姜鹏
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-07-19
Filing date: 2022-07-19
Publication date: 2022-09-27
Anticipated expiration: 2042-07-19
Also published as: CN115115432B

Abstract

本发明公开了一种基于人工智能的产品信息推荐方法及装置，涉及自然语言处理技术领域，主要目的在于解决现有产品信息推荐准确性较差的问题。包括：当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义；确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路；通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出。

Description

基于人工智能的产品信息推荐方法及装置

技术领域

本发明涉及一种自然语言处理技术领域，特别是涉及一种基于人工智能的产品信息推荐方法及装置。

背景技术

随着自然语言处理技术(NLP，Natural Language Processing)的快速发展，基于深度学习模型已经成为对不同场景中对文本内容进行进行语义识别分析的主要技术手段。其中，针对深度学习过程中数据不足的场景，通常采用数据增强(Data Augmentation,DA)来进行数据补充，以提高深度学习模型的识别精度，尤其是在对不同互联网产品进行相关信息推荐中语义识别场景。

目前，现有在对文本进行语义识别分析过程中，通过直接引入一些噪音文本，如随机生成噪音词语进行插入，或替换原有文本词语，完成数据增强后对深度学习模型进行训练，以基于完成训练的模型进行语义识别。但是，由于引入噪声文本方式扩充语料进行训练，使得训练数据数据质量较低，进而导致基于训练好的深度学习模型进行语义识别准确性较差，从而降低了在产品推荐中进行语义识别的有效性。

发明内容

有鉴于此，本发明提供一种基于人工智能的产品信息推荐方法及装置，主要目的在于解决现有产品信息推荐准确性较差的问题。

依据本发明一个方面，提供了一种基于人工智能的产品信息推荐方法，包括：

当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；

基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；

确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；

通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出。

依据本发明另一个方面，提供了一种基于人工智能的产品信息推荐装置，包括：

进一步地，所述基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义之前，所述方法还包括：

获取原始语义训练样本数据，所述原始语义训练样本数据包括多个文本语句；

确定序列标注任务，并按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据，所述序列标注任务中配置有至少三个用于数据增强的标签；

构建语义识别网络，并基于所述原始语义训练样本数据与所述语义转换训练样本数据构建的数据增强训练样本集对所述语义识别网络进行模型训练，得到已完成模型训练的语义识别模型。

进一步地，所述按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据包括：

基于所述语义标注模型中的编码器对所述原始语义训练样本进行文本编码，得到编码后的各文本语句，并解析所述序列标注任务中的标签；

基于所述语义标注模型中的标注器，将所述标签依次标记于所述文本语句的词语上，得到带有所述标签的文本语句；

基于所述语义标注模型中的指针器对带有所述标签的所述文本语句进行语义排序，得到语义转换训练样本数据。

进一步地，所述标签包括删除标签、插入标签、不变标签，所述基于所述语义标注模型中的编码器对所述原始语义训练样本进行文本编码，得到编码后的各文本语句，并解析所述序列标注任务中的标签之前，所述方法还包括：

获取标签训练样本集，所述标签训练样本集中包含有分别被标记有删除标签、插入标签、不变标签词语的语句；

构建包含编码器、标注器、指针器的语义标注模型，并基于所述标签训练样本集对所述语义标注模型进行训练，得到完成训练的语义标注模型，所述插入标签匹配预置插入目标词。

进一步地，所述基于所述语义标注模型中的标注器，将所述标签依次标记于所述文本语句的词语上，得到带有所述标签的文本语句包括：

若标记于所述词语上的标签为插入标签，则获取预置插入目标词，并添加至所述文本语句中；

若标记于所述词语上的标签为删除标签，则从所述文本语句中删除所述词语。

进一步地，所述确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路包括：

解析触发所述产品搜索指令的用户搜索权限，并在所述用户搜索权限所对应的多个目标数据库中查找与所述搜索语义匹配的产品领域信息；

基于预设领域链路对应关系查找与所述产品领域信息匹配的数据库链路，所述预设领域链路对应关系中存储有不同产品领域信息与不同数据库链路之间的绑定关系。

进一步地，所述通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出之前，所述方法还包括：

基于时间触发条件、用户搜索权限确定锁定的目标数据库链路，并锁定所述目标数据库链路；

所述通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出包括：

若所述数据库链路未被锁定，则基于所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出；

若所述数据库链路被锁定，则输出与所述搜索语义匹配的预置推荐信息。

获取模块，用于当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；

识别模块，用于基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；

调取模块，用于确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；

输出模块，用于通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出。

进一步地，所述装置还包括：序列标注模块、模型训练模块，

所述获取模块，还用于获取原始语义训练样本数据，所述原始语义训练样本数据包括多个文本语句；

所述序列标注模块，用于确定序列标注任务，并按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据，所述序列标注任务中配置有至少三个用于数据增强的标签；

所述模型训练模块，用于构建语义识别网络，并基于所述原始语义训练样本数据与所述语义转换训练样本数据构建的数据增强训练样本集对所述语义识别网络进行模型训练，得到已完成模型训练的语义识别模型。

进一步地，所述序列标注模块，具体用于基于所述语义标注模型中的编码器对所述原始语义训练样本进行文本编码，得到编码后的各文本语句，并解析所述序列标注任务中的标签；基于所述语义标注模型中的标注器，将所述标签依次标记于所述文本语句的词语上，得到带有所述标签的文本语句；基于所述语义标注模型中的指针器对带有所述标签的所述文本语句进行语义排序，得到语义转换训练样本数据。

进一步地，所述序列标注模块，具体还用于获取标签训练样本集，所述标签训练样本集中包含有分别被标记有删除标签、插入标签、不变标签词语的语句；构建包含编码器、标注器、指针器的语义标注模型，并基于所述标签训练样本集对所述语义标注模型进行训练，得到完成训练的语义标注模型，所述插入标签匹配预置插入目标词。

进一步地，所述序列标注模块，具体还用于若标记于所述词语上的标签为插入标签，则获取预置插入目标词，并添加至所述文本语句中；若标记于所述词语上的标签为删除标签，则从所述文本语句中删除所述词语。

进一步地，所述调取模块具体用于解析触发所述产品搜索指令的用户搜索权限，并在所述用户搜索权限所对应的多个目标数据库中查找与所述搜索语义匹配的产品领域信息；基于预设领域链路对应关系查找与所述产品领域信息匹配的数据库链路，所述预设领域链路对应关系中存储有不同产品领域信息与不同数据库链路之间的绑定关系。

进一步地，所述装置还包括：

锁定模块，用于基于时间触发条件、用户搜索权限确定锁定的目标数据库链路，并锁定所述目标数据库链路。

进一步地，所述输出模块，具体用于若所述数据库链路未被锁定，则基于所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出；若所述数据库链路被锁定，则输出与所述搜索语义匹配的预置推荐信息。根据本发明的又一方面，提供了一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如上述基于人工智能的产品信息推荐方法对应的操作。

根据本发明的再一方面，提供了一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述基于人工智能的产品信息推荐方法对应的操作。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明提供了一种基于人工智能的产品信息推荐方法及装置，与现有技术相比，本发明实施例通过当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出，实现了基于原始语义训练样本数据扩展得到语义转换训练样本数据，并根据这两部分训练样本数据组合的增强训练样本数据进行模型训练得到语义识别模型，提升了语义识别模型的准确性，因此使得基于语义识别模型识别的搜索语义具有更高的准确性，进而提升了针对搜索语义推荐相匹配的产品信息的准确性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种基于人工智能的产品信息推荐方法流程图；

图2示出了本发明实施例提供的另一种基于人工智能的产品信息推荐方法流程图；

图3示出了本发明实施例提供的基于语义标注模型的语义转换训练样本数据生成方法流程图；

图4示出了本发明实施例提供的又一种基于人工智能的产品信息推荐方法流程图；

图5示出了本发明实施例提供的一种基于人工智能的产品信息推荐装置组成框图；

图6示出了本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

针对现有在对文本进行语义识别分析过程中，通过直接引入一些噪音文本，如随机生成噪音词语进行插入，或替换原有文本词语，完成数据增强后对深度学习模型进行训练，以基于完成训练的模型进行语义识别。但是，由于引入噪声文本方式扩充语料进行训练，使得训练数据数据质量较低，进而导致基于训练好的深度学习模型进行语义识别准确性较差，从而降低了在产品推荐中进行语义识别的有效性的问题，本发明实施例提供了一种基于人工智能的产品信息推荐方法，如图1所示，该方法包括：

101、当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本。

本发明实施例中，执行主体为作为对产品信息进行推荐的服务端，与为用户提供查询服务的终端设备组成产品信息推荐系统，执行主体可以接收用户通过终端设备触发的产品搜索指令，进而对产品搜索指令进行解析得到相应的待识别文本，其中，产品搜索指令为用户在终端设备中输入文字或语音时生成并发送的，例如用户在应用程序“智慧家园”中的输查询窗口内输入“50岁以上女性保险产品”并点击预设查询按钮，并可触发生成产品搜索指令并发送至服务端。

当执行主体在接收到产品搜索指令，为了能够基于产品搜索指令推荐相应的产品，需要对产品搜索指令进行解析，得到与用户输入的搜索内容相对应的文本，以基于得到的待识别文本进行产品信息推荐。其中，待识别文本包括但不限于中文待识别文本、英文待识别文本、缩略字符待识别文本。而在本申请实施例中服务端对产品搜索指令进行解析得到待识别文本的方式可以为现有技术中的指令解析方式，本申请实施例对此不做具体限定。

102、基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义。

其中，搜索语义可以为用于表征用户输入搜索内容的关键词。通常情况下，用户输入的搜索内容中可能包含有语气词、副词等不影响语义的文本内容，如执行主体根据用户在终端设备中输出语音数据获取到的待识别文本为“哎呀我想查一下我现在六十了还能买什么保险产品啊”，则待识别文本中包含有多个诸如“哎呀”“我”“查一下”“买什么”等不影响产品推荐准确性的文本内容；还可能因为使用方言、多义词、简写等使得输入的搜索内容缺少表征搜索内容语义的必要成分，如执行主体获取到的待识别文本为“儿童磕碰赔偿”，其中“磕碰”为非标准化文本，则需要对其进行解析替换等以得到语义不变的、可准确识别的标准化文本内容。因此在本申请实施例中在执行主体获取到与用户输入的查询内容对应的待识别文本之后，先基于预先训练的语义识别模型对待识别文本进行语义识别，得到相应的搜索语义，以便根据搜索语义进行产品的查询与推荐。

进一步地，在本申请实施例中，为了提升语义识别模型的准确性，在利用样本数据对机器学习模型进行训练之前，首先基于初始样本数据进行样本数据扩展处理，如对初始样本数据进行序列标注以得到语义转换样本数据，进而根据原始样本数据和语义转换样本数据组合生成用于训练模型得到语义识别模型的数据增强训练样本集。需要说明的是，在基于原始语义训练样本数据进行序列标注得到的语义训练样本数据，其对应的搜索语义可以与原始语义训练样本数据相同，也可以为与原始语义训练样本数据不同，本申请实施例对此不做具体限定。

在本申请实施例中，原始语义训练样本数据进行扩展，由于原始语义训练样本数据可靠，因此基于原始语义训练样本数据进行扩展，得到的语义转换训练样本数据具有较高数据质量，进而利用原始语义训练样本数据和语义转换训练样本数据作为数据增强训练样本集对模型进行训练，得到的语义识别模型准确性较高，提升了语义识别的准确性，进而提升了产品信息推荐的准确性。

103、确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路。

所述不同的产品领域信息对应相应具有搜索权限的目标数据库。

需要说明的是，数据库链路用于表征调用数据库中数据的数据提取路径，如对于数据库A中的数据可以直接从第一应用程序跳转至第二应用程序后，并可以基于第二应用程序中的预设接口1获取数据库A中的数据，还可以为在微服务应用程序M中基于预设接口2获取数据库A中的数据，但不限于此。由于网络数据数据量庞大，因此在具体实践过程中数据按照不同的分类规则保存在相应的数据库中，在本申请实施例中，不同产品领域信息对应不同的目标数据库，而各个目标数据库的数据还可以按照不同用户搜索权限进行划分，以便更有针对性的获取与待推荐产品对应的产品数据。

此外，产品领域信息和数据库链路之间的关系可以预先在产品信息推荐系统中进行配置，且产品领域信息和数据库链路之间可以为一一对应关系，也可以为一对多或者多对一的关系。此外产品领域信息和数据库链路之间的关系可以为基于链路关联图形式存储，也可以为映射关系列表形式存储，本申请实施例对此不做具体限定。

104、通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出

需要说明的是，当在步骤103中调取与搜索语义中包含的产品信息所对应的数据库链路之后，若数据库链路为多条链路，则可以基于不同的使用场景生成数据库链路访问优先级，如基于用户身份对应的访问权限生成的数据库链路顺序、基于网络连接类型生成的数据库链路顺序等，本申请实施例对此不做限定。此外，产品信息包括但不限于产品图片信息、产品文字信息、产品音视频信息、产品购买信息。

本申请实施例中，执行主体在基于用户输入的搜索内容识别其搜索语义，以及根据搜索语义中包含的产品信息确定目标数据库之后，从目标数据库中查找符合当前用户搜索权限的产品信息，进而将产品信息输出并展示。

在另一个本发明实施例中，为了进一步限定及说明，如图2所示，步骤102基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义之前，所述方法还包括：

201、获取原始语义训练样本数据；

202、确定序列标注任务，并按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据

203、构建语义识别网络，并基于所述原始语义训练样本数据与所述语义转换训练样本数据构建的数据增强训练样本集对所述语义识别网络进行模型训练，得到已完成模型训练的语义识别模型。

本申请实施例中，原始语义训练样本数据为语义清晰、语句完整的文本语句，而所述文本语句包括但不限于中文语句，中文以外的外文语句，如文本语句“There are 12transformer encoder blocks in the architecture of BERT”和“这本书适合6岁至10岁儿童”。

需要说明的是，为了根据原始语义训练样本数据生成语义转换训练样本数据，需要对原始语义训练样本数据中的各文本语句的进行分词，以便确认在原始文本语句在转成成语义转换文本语句时的原始文本语句保留分词、删除分词、待完善分词等，因此在步骤202中需要基于预先配置的用于数据增强的标签确定序列标注任务，即确定文本语句中各分词所对应的标签，而用户数据增强的标签包括但不限于分别用于表征原始文本语句保留内容、删除内容、待插入内容的保留标签、删除标签和插入标签。此外，对文本语句的分词方式可以为现有技术中如基于分词词典、语言模型等进行分词的方法，本申请实施例对此不做具体限定。

示例性的，对文本语句“菠萝和凤梨之间的区别是什么”，为了将该文本语句进行转换得到相应的语义转换语句，则需要首先对该文本语句进行分词，可以得到分词后的文本语句为“菠萝/和/凤梨/之间的/区别/是/什么”，而后再基于分词结果确定序列标注任务，即确定各分词分别对应的标签，若预先配置的用于数据增强的标签分别为“删除标签”、“保留标签”“插入标签”，那么确定的序列标注任务可以为：分词“菠萝”、“和”“凤梨”、“区别”和“什么”对应的标签为“保留标签”；分词“之间的”、“是”对应的标签为“删除标签”；分词“什么”前面配置有“插入标签”，从而该文本语句基于已完成训练的语义标注模型进行序列标注而得到的语义转换文本语句为“菠萝和凤梨有什么区别”，但不限于此。

此外，在本申请实施例中，语义识别网络可以包括但不限于全连接神经网络DNN(Deep Neural Networks)、卷积神经网络CNN(Convolutional Neural Networks)等，本发明实施例不做具体限定。

在另一个本发明实施例中，为了进一步限定及说明，步骤按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据包括：

在本申请实施例中，执行主体根据用户输入的搜索内容并基于预先训练的语义识别模型识别与用户输入的搜索内容相对应的搜索语义，再根据搜索语义提取并输入推荐产品信息，由于在得到该语义识别模型时，需要扩充原始样本数据集以得到语料准确且充足的样本数据集，而语义标注模型即为用于根据原始样本数据集获取数据增强的语义样本训练数据集。

具体地，本申请实施例中的语义标注模型至少包含有编码器、标注器和指针器三层网络结构。其中，编码器用于对原始语义训练样本中的文本语句进行文本编码，如12层的Bert-base模型对文本语句进行编码，但不限于此。编码器可以理解原始语义训练样本中各文本语句各分词的上下文，并输出每个分词的嵌入向量，进而根据得到的文本语句中每个分词的上下文嵌入向量表示，并将其输入到Bert-base模型中即可得到编码后的文本语句。编码器输出的编码后的文本语句作为标注器的输入，在标注层根据解析得到的序列标注任务中的标签对文本语句进行标注，如解析得到的标签包含有“删除标签-D”、“保留标签-K”和“插入标签-I”，那么在标注层便可以预先监督学习而执行相应的标注操作：当源文本语句中的分词在输出中存在时则将该分词标记为“K”；当源文本语句中的分词在输出中不存在时则将该分词标记为“D”；当源文本语句中不存在的分词却在输出中存在的分词则标记为“I”，但仅作为示例，本申请实施例对标注器的实施方式不做具体限定。

进一步地，为了根据携带有标签的文本数据生成语义准确标注的语义转换文本数据，需要将标注器输出的文本语句中分词顺序进行调整，即通过标注模型中的指针器进行语义排序。在本申请实施例中，通过指针器对对文本语句进行语义排序，使得序列标注过程中确保输入序列在全局范围内做较大改变而在局部范围内改变较小，可以避免仅借助于删除和插入的方式调整语序造成的文本语句处理效率交底的问题，从而提升了语义标注效率及语义识别效率，进而提升了产品信息推荐的效率。

示例性的，结合图3对基于语义标注模型根据原始语义训练样本数据生成语义转换训练样本数据过程进行说明，其中，原始语义训练样本数据为“There are 12transformer encoder blocks in the architecture of BERT”，该原始语义训练样本数据首先输入到标注模型的编码器中进行编码，得到编码后的文本语句后输入到标注器中，以使得在标注器中按照序列标注任务中的标签对编码后的文本语句进行标注，如将标签“K”标注在文本语句中的“12、transformer、encoder、blocks、the”上，将标签“D”标注在文本语句中的“There、are、in、architecture、of”，而将标签“I”标注在文本语句中的“BERT”上，而后将带有标签的文本语句输入标注模型的指针器中，以使得指针器进行语义排序，并最终输出原始语义训练样本数据对应的语义转换训练样本数据：“The BERT has 12transformer encoder blocks”，但不限于此。

在另一个本发明实施例中，为了进一步限定及说明，步骤基于所述语义标注模型中的编码器对所述原始语义训练样本进行文本编码，得到编码后的各文本语句，并解析所述序列标注任务中的标签之前，所述方法还包括：

获取标签训练样本集；

构建包含编码器、标注器、指针器的语义标注模型，并基于所述标签训练样本集对所述语义标注模型进行训练，得到完成训练的语义标注模型，

其中，所述标签训练样本集中包含有分别被标记有删除标签、插入标签、不变标签词语的语句，所述插入标签匹配预置插入目标词。同样的，语义标注模型可以包括但不限于全连接神经网络模型DNN(Deep Neural Networks)、卷积神经网络模型CNN(ConvolutionalNeural Networks)等。在训练语义标注模型之前，首先对数据进行标注作为训练语料，具体地，通过在原始文本语句中对各个分词分别添加相应的删除标签、插入标签、不变标签，在构建语义标注模型后基于标签训练样本集通过监督学习的方式，获取能够执行序列标注任务的语义标注模型。

在另一个本发明实施例中，为了进一步限定及说明，步骤基于所述语义标注模型中的标注器，将所述标签依次标记于所述文本语句的词语上，得到带有所述标签的文本语句包括：

根据上述内容可知，编码器层解析得到序列标注任务对应的标签，进而在标注器层根据标签对文本语句的各个分词进行标注。在本申请实施例中，用于标注文本语句中各分词的标签包括删除标签、插入标签、不变标签，而当标签为删除标签时，表明在在源原文语句中存在的分词在输出中将不再存在，因此标注器在识别到某分词标签为“删除标签”时，便可将“删除标签”对应的分词从源文本语句中删除。而当源文本语句中某分词的标签为插入标签时，表明在该分词位置处需要插入用于补足语句语义的内容，因此在标注器识别到插入标签后进一步获取待插入内容并将待插入内容插入到与携带有插入标签分词相对应的位置处。此外，不难理解携带有插入标签的分词具有分词前和分词后两个位置，因此为了确保语义转换的准确性，在获取待插入内容之后还可以对插入位置进行识别，以便将待插入内容与携带有插入标签的分词准确融合。

在另一个本发明实施例中，为了进一步限定及说明，如图4所示，步骤确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路包括：

301、解析触发所述产品搜索指令的用户搜索权限，并在所述用户搜索权限所对应的多个目标数据库中查找与所述搜索语义匹配的产品领域信息；

302、基于预设领域链路对应关系查找与所述产品领域信息匹配的数据库链路，所述预设领域链路对应关系中存储有不同产品领域信息与不同数据库链路之间的绑定关系。

其中，用户搜索权限可以设定为与用户身份、用户等级、用户所述地理位置等相关，如对于视频类应用程序，用户搜索权限可以为根据用户是否为当前视频应用程序的会员、会员等级等进行限定，但不限于此。在本申请实施例中首先确定搜索权限并依据确定的搜索权限搜索目标数据库，以便在与用户权限匹配的目标数据库内提取产品信息并进行推荐，避免了全量目标数据库搜索时数据处理量较大而造成的数据处理效率交底的问题，从而提升了产品信息推荐的效率。

此外，由于待推荐的产品信息对应存储在相应具有搜索权限的目标数据库中，在执行主体基于用户搜索内容识别得到搜索语义进而确定与搜索语义匹配的产品领域信息之后，基于存储有不同产品领域信息与不同数据库链路之间的绑定关系的预设领域链路对应关系，查到找与产品领域信息匹配的数据库链路，以便按照数据库链路访问目标数据库。而当目标数据库的访问链路可以为多条访问链路时，可以按照预设链路访问原则设定数据库链路优先级，以便根据数据库链路优先级逐级通过数据库链路访问目标数据库，但不限于此。

在另一个本发明实施例中，为了进一步限定及说明，步骤通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出之前，所述方法还包括：

其中，时间触发条件可以为用于限定用户搜索指令生成时间与访问目标数据库时间之间的时间差，还可以为用于限定数据库访问时间，具体可以根据不同应用场景进行设置，本申请实施例对此不做具体限定。通过时间触发条件、用户搜索权限对不符合时间触发条件的，和/或不匹配用户搜索权限的目标数据库进行锁定，则标识基于当前产品搜索指令无法从被锁定的目标数据中提取产品信息，从而确保目标数据库中产品信息数据的安全性。

本发明实时提供了一种基于人工智能的产品信息推荐方法，与现有技术相比，本发明实施例通过当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出，实现了基于原始语义训练样本数据扩展得到语义转换训练样本数据，并根据这两部分训练样本数据组合的增强训练样本数据进行模型训练得到语义识别模型，提升了语义识别模型的准确性，因此使得基于语义识别模型识别的搜索语义具有更高的准确性，进而提升了针对搜索语义推荐相匹配的产品信息的准确性。

进一步的，作为对上述图1所示方法的实现，本发明实施例提供了一种基于人工智能的产品信息推荐装置，如图5所示，该装置包括：

获取模块41，用于当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；

识别模块42，用于基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；

调取模块43，用于确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；

输出模块44，用于通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出。

进一步地，所述装置还包括：

进一步地，所述输出模块，具体用于若所述数据库链路未被锁定，则基于所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出；若所述数据库链路被锁定，则输出与所述搜索语义匹配的预置推荐信息。

本发明实施例提供了一种基于人工智能的产品信息推荐装置，与现有技术相比，本发明实施例通过当触发产品搜索指令时，获取与所述产品搜索指令对应的待识别文本；基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义，所述语义识别模型为通过构建的数据增强训练样本集进行训练的，所述数据增强训练样本集中包括原始语义训练样本数据以及基于所述原始语义训练样本数据进行序列标注得到语义转换训练样本数据；确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路，所述不同的产品领域信息对应相应具有搜索权限的目标数据库；通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出，实现了基于原始语义训练样本数据扩展得到语义转换训练样本数据，并根据这两部分训练样本数据组合的增强训练样本数据进行模型训练得到语义识别模型，提升了语义识别模型的准确性，因此使得基于语义识别模型识别的搜索语义具有更高的准确性，进而提升了针对搜索语义推荐相匹配的产品信息的准确性。

根据本发明一个实施例提供了一种存储介质，所述存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于人工智能的产品信息推荐方法。

图6示出了根据本发明一个实施例提供的一种计算机设备的结构示意图，本发明具体实施例并不对计算机设备的具体实现做限定。

如图6所示，该计算机设备可以包括：处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中：处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器502，用于执行程序510，具体可以执行上述基于人工智能的产品信息推荐方法实施例中的相关步骤。

具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器506，用于存放程序510。存储器506可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行以下操作：

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种基于人工智能的产品信息推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于已完成模型训练的语义识别模型对所述待识别文本进行语义识别，得到所述待识别文本的搜索语义之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述按照所述序列标注任务，通过已完成训练的语义标注模型对所述原始语义训练样本中的各文本语句进行序列标注，得到语义转换训练样本数据包括：

4.根据权利要求3所述的方法，其特征在于，所述标签包括删除标签、插入标签、不变标签，所述基于所述语义标注模型中的编码器对所述原始语义训练样本进行文本编码，得到编码后的各文本语句，并解析所述序列标注任务中的标签之前，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述语义标注模型中的标注器，将所述标签依次标记于所述文本语句的词语上，得到带有所述标签的文本语句包括：

6.根据权利要求1-5任一项所述的方法，其特征在于，所述确定与所述搜索语义匹配的产品领域信息，并调取与所述产品领域信息匹配的数据库链路包括：

7.根据权利要求6所述的方法，其特征在于，所述通过所述数据库链路从所述目标数据库中查找与所述搜索语义匹配的产品信息，并进行输出之前，所述方法还包括：

8.一种基于人工智能的产品信息推荐装置，其特征在于，包括：

9.一种存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于人工智能的产品信息推荐方法对应的操作。

10.一种计算机设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于人工智能的产品信息推荐方法对应的操作。