CN111259131B - 信息处理方法、介质、装置和计算设备 - Google Patents

信息处理方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN111259131B
CN111259131B CN202010022763.1A CN202010022763A CN111259131B CN 111259131 B CN111259131 B CN 111259131B CN 202010022763 A CN202010022763 A CN 202010022763A CN 111259131 B CN111259131 B CN 111259131B
Authority
CN
China
Prior art keywords
attribute
information
search
user
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010022763.1A
Other languages
English (en)
Other versions
CN111259131A (zh
Inventor
纪志伟
沈燕
杨杰
罗晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Zaigu Technology Co Ltd
Original Assignee
Hangzhou Netease Zaigu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Zaigu Technology Co Ltd filed Critical Hangzhou Netease Zaigu Technology Co Ltd
Priority to CN202010022763.1A priority Critical patent/CN111259131B/zh
Publication of CN111259131A publication Critical patent/CN111259131A/zh
Application granted granted Critical
Publication of CN111259131B publication Critical patent/CN111259131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施方式提供了一种信息处理方法、计算机可读介质、信息处理装置和计算设备。该方法包括:获取用户搜索信息以及与所述用户搜索信息相对应的用户行为序列;对所述用户搜索信息进行语义识别以得到命名实体信息;根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别;根据所述命名实体信息更新所述对象类别的类别属性信息。该方法利用用户搜索信息结合用户行为序列对对象类别的类别属性信息进行补充完善,不仅可以提高用户的搜索效率,而且可以提高搜索结果的准确性,快速且准确地向用户返回更加符合用户预期的搜索结果,优化用户的搜索体验。

Description

信息处理方法、介质、装置和计算设备
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着网络和计算机技术的发展,人们可以方便地通过手机或者电脑从互联网上获取网络资源。以网络购物为例,用户在电商平台上通过搜索希望购买的商品的商品信息可以获得电商平台返回的与该商品信息相关的商品数据列表,然后再从商品数据列表中选取心仪的商品并进行购买。
根据用户搜索信息从数据库中提取符合用户预期的数据并向用户进行呈现是达成网络交易或者满足其他用户需求的重要前提。然而,由于网络资源数据庞大,而用户需求也多种多样,用户在搜索网络资源时,往往需要花费很多的时间和精力对搜索结果进行比较和筛选,用户体验不佳。因此,如何根据用户搜索信息挖掘用户需求并进行准确的数据定位是目前亟待解决的问题。
发明内容
本发明的目的在于提供一种信息处理方法、计算机可读介质、信息处理装置和计算设备,至少在一定程度上解决相关技术中存在的搜索效率低、准确性差等技术问题。
根据本发明的第一方面,提供一种信息处理方法,该方法包括:
获取用户搜索信息以及与所述用户搜索信息相对应的用户行为序列;
对所述用户搜索信息进行语义识别以得到命名实体信息;
根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别;
根据所述命名实体信息更新所述对象类别的类别属性信息。
在本发明的一些示例性实施方式中,基于以上技术方案,所述根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别,包括:
根据所述用户行为序列确定多个搜索对象以及针对每个所述搜索对象的用户行为信息;
根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度;
分别确定与每个所述搜索对象相关联的对象类别,并根据所述对象关联度确定每个所述对象类别与所述用户搜索信息的类别关联度;
将所述类别关联度最高的对象类别确定为与所述用户搜索信息相匹配的对象类别。
在本发明的一些示例性实施方式中,基于以上技术方案,所述根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度,包括:
根据所述用户行为信息确定针对每个所述搜索对象的用户行为类型和用户行为次数;
获取与所述用户行为类型相对应的行为权重;
根据所述用户行为次数和所述行为权重确定每个所述搜索对象与所述用户搜索信息的对象关联度。
在本发明的一些示例性实施方式中,基于以上技术方案,所述用户行为类型包括针对搜索对象的查看行为、预获取行为和获取行为中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上技术方案,所述类别属性信息包括对象名称和对象属性,所述根据所述命名实体信息更新所述对象类别的类别属性信息,包括:
获取所述命名实体信息中的实体名称信息和实体属性信息;
根据所述实体名称信息更新所述对象类别的对象名称;
根据所述实体属性信息更新所述对象类别的对象属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述对象属性包括对象属性名和对象属性值中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上技术方案,所述根据所述实体属性信息更新所述对象类别的对象属性,包括:
确定与所述对象类别相关联的至少一个典型对象;
获取与所述实体属性信息相对应的所述典型对象的标准属性;
确定所述实体属性信息与所述标准属性的属性相似度;
若所述属性相似度大于相似度阈值,则将所述实体属性信息确定为所述对象类别的同义对象属性;
若所述属性相似度小于或等于相似度阈值,则从所述实体属性信息中选取一个或者多个高频属性,并将所述高频属性确定为所述对象类别的新增对象属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述确定与所述对象类别相关联的至少一个典型对象,包括:
确定与所述对象类别相关联的多个搜索对象,并获取各个所述搜索对象与所述用户搜索信息的对象关联度;
将所述对象关联度最高的预设数量的搜索对象确定为与所述对象类别相关联的典型对象。
在本发明的一些示例性实施方式中,基于以上技术方案,所述确定所述实体属性信息与所述标准属性的属性相似度,包括:
根据所述实体属性信息与所述标准属性的编辑距离确定编辑距离相似度;
根据所述实体属性信息与所述标准属性中相同字符的数量确定字共现相似度;
根据所述实体属性信息与所述标准属性的词向量确定语义相似度。
根据所述编辑距离相似度、所述字共现相似度以及所述语义相似度确定所述实体属性信息与所述标准属性的属性相似度。
在本发明的一些示例性实施方式中,基于以上技术方案,所述从所述实体属性信息中选取一个或者多个高频属性,包括:
对所述实体属性信息进行聚类处理以得到一个或者多个属性集合;
从每个所述属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述对所述实体属性信息进行聚类处理以得到一个或者多个属性集合,包括:
分别获取任意两个实体属性信息的属性相似度;
根据所述属性相似度对所述实体属性信息进行聚类处理以得到一个或者多个属性集合。
根据本发明的一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如以上技术方案中任一项所述的信息处理方法。
根据本发明的一个方面,提供一种信息处理装置,该装置包括:
信息获取模块,被配置为获取用户搜索信息以及与所述用户搜索信息相对应的用户行为序列;
语义识别模块,被配置为对所述用户搜索信息进行语义识别以得到命名实体信息;
信息匹配模块,被配置为根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别;
信息更新模块,被配置为根据所述命名实体信息更新所述对象类别的类别属性信息。
在本发明的一些示例性实施方式中,基于以上技术方案,所述信息匹配模块包括:
搜索对象确定单元,被配置为根据所述用户行为序列确定多个搜索对象以及针对每个所述搜索对象的用户行为信息;
对象关联度确定单元,被配置为根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度;
类别关联度确定单元,被配置为分别确定与每个所述搜索对象相关联的对象类别,并根据所述对象关联度确定每个所述对象类别与所述用户搜索信息的类别关联度;
对象类别确定单元,被配置为将所述类别关联度最高的对象类别确定为与所述用户搜索信息相匹配的对象类别。
在本发明的一些示例性实施方式中,基于以上技术方案,所述对象关联度确定单元包括:
用户行为确定子单元,被配置为根据所述用户行为信息确定针对每个所述搜索对象的用户行为类型和用户行为次数;
行为权重获取子单元,被配置为获取与所述用户行为类型相对应的行为权重;
对象关联度确定子单元,被配置为根据所述用户行为次数和所述行为权重确定每个所述搜索对象与所述用户搜索信息的对象关联度。
在本发明的一些示例性实施方式中,基于以上技术方案,所述用户行为类型包括针对搜索对象的查看行为、预获取行为和获取行为中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上技术方案,所述类别属性信息包括对象名称和对象属性,所述信息更新模块包括:
实体信息获取单元,被配置为获取所述命名实体信息中的实体名称信息和实体属性信息;
对象名称更新单元,被配置为根据所述实体名称信息更新所述对象类别的对象名称;
对象属性更新单元,被配置为根据所述实体属性信息更新所述对象类别的对象属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述对象属性包括对象属性名和对象属性值中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上技术方案,所述对象属性更新单元包括:
典型对象确定子单元,被配置为确定与所述对象类别相关联的至少一个典型对象;
标准属性获取子单元,被配置为获取与所述实体属性信息相对应的所述典型对象的标准属性;
属性相似度确定子单元,被配置为确定所述实体属性信息与所述标准属性的属性相似度;
同义对象属性更新子单元,被配置为若所述属性相似度大于相似度阈值,则将所述实体属性信息确定为所述对象类别的同义对象属性;
新增对象属性更新子单元,被配置为若所述属性相似度小于或等于相似度阈值,则从所述实体属性信息中选取一个或者多个高频属性,并将所述高频属性确定为所述对象类别的新增对象属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述典型对象确定子单元包括:
对象关联度获取子单元,被配置为确定与所述对象类别相关联的多个搜索对象,并获取各个所述搜索对象与所述用户搜索信息的对象关联度;
对象关联度排序子单元,被配置为将所述对象关联度最高的预设数量的搜索对象确定为与所述对象类别相关联的典型对象。
在本发明的一些示例性实施方式中,基于以上技术方案,所述属性相似度确定子单元包括:
编辑距离相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性的编辑距离确定编辑距离相似度;
字共现相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性中相同字符的数量确定字共现相似度;
语义相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性的词向量确定语义相似度。
属性相似度计算子单元,被配置为根据所述编辑距离相似度、所述字共现相似度以及所述语义相似度确定所述实体属性信息与所述标准属性的属性相似度。
在本发明的一些示例性实施方式中,基于以上技术方案,所述新增对象属性更新子单元包括:
属性聚类子单元,被配置为对所述实体属性信息进行聚类处理以得到一个或者多个属性集合;
高频属性选取子单元,被配置为从每个所述属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
在本发明的一些示例性实施方式中,基于以上技术方案,所述属性聚类子单元包括:
属性相似度获取子单元,被配置为分别获取任意两个实体属性信息的属性相似度;
属性集合确定子单元,被配置为根据所述属性相似度对所述实体属性信息进行聚类处理以得到一个或者多个属性集合。
根据本发明的一个方面,提供一种计算设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行如以上技术方案中任一项所述的信息处理方法。
在本发明提供的技术方案中,通过对用户搜索信息进行语义识别可以初步得到用户的搜索需求,再根据用户行为序列确定搜索结果中涉及的对象类别与用户搜索信息的匹配程度,从而根据匹配程度进一步获取精确的用户搜索需求。与用户搜索信息匹配的对象类别即为符合用户搜索需求的对象类别,根据语义识别得到的命名实体信息可以对该对象类别的类别属性信息进行更新。利用用户搜索信息结合用户行为序列对对象类别的类别属性信息进行补充完善,不仅可以提高用户的搜索效率,而且可以提高搜索结果的准确性,快速且准确地向用户返回更加符合用户预期的搜索结果,优化用户的搜索体验。除此之外,在电子商务领域,通过用户行为序列辅助用户搜索信息可以进行商品知识的深度挖掘,丰富商品知识库。无论是在商品的搜索与购买环节还是在人工客服或者智能客服的客户服务环节,都可以利用内容丰富且信息详实的商品知识库准确定位用户的真实需求,提升客服的沟通准确率,提高客服的沟通质量,更好地为用户解答关于商品的疑问。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示出了应用本发明示例性实施方式的系统架构示意图。
图2示出了本发明一些示例性实施方式中信息处理方法的步骤流程图。
图3示出了本发明一些示例性实施方式中确定对象类别匹配关系的步骤流程图。
图4示出了本发明一些示例性实施方式中更新对象属性的步骤流程图。
图5示出了本发明一些示例性实施方式中确定属性相似度的步骤流程图。
图6示意性地示出了层次化聚类算法的原理图。
图7示出了本发明一些示例性实施方式中信息处理装置的结构框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
本发明中涉及的技术术语解释如下:
商品知识库:在电商领域中,用户的很多问题是关于商品的本身的属性的,比如询问商品的属性名(材质、颜色等),商品的属性值(纯棉、红色等)。商品知识库中维护着各种商品本身的商品属性,包含商品名的同义词,商品属性名的同义词以及商品属性值的同义词等等。
命名实体识别:命名实体识别是自然语言处理中的一类常见的任务,即识别句子的词的成分。常见的比如人名、地名、时间等。在电商领域中,主要关注三类命名实体:商品实体词、属性名和属性值。举例来说,“这条裤子的颜色是红色的吗?”,“裤子”是商品实体词,“颜色”是属性名,“红色”是属性值。命名实体识别的作用是从句子中解析出这三类词。
搜索信息和行为序列:用户在电商平台上进行搜索时,会输入一个搜索信息,比如“红色裤子”。之后会返回一系列相关的商品,用户会对这些商品产生浏览、收藏、加入购物车、购买等行为。用户的一系列行为称为是用户的行为序列。
本发明主要以电商领域中的商品搜索场景为例对技术方案进行说明。需要注意的是,本发明除了应用在商品搜索场景以外,也可以应用于视频搜索、音乐搜索、图片搜索、论文检索、专利检索等各种涉及网络资源搜索或检索的应用场景中,另外还可以应用于智能客服、聊天机器人等各种与用户输入信息进行交互的应用场景中。
此外,本发明中涉及的相关元素数量仅用于示例而非限制,以及相关元素的命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,在电商领域中维护商品知识时,需要对现有的商品知识补充同义词用于对用户问句的解析,包括商品的实体词(比如“拖鞋”),商品的属性名(“材质”),商品的属性值(“纯棉”)。同时需要及时发现用户关心的一些商品高频属性,在商品知识库中进行配置更新,方便解答用户的问题。一种可选的配置方式是利用训练好的词向量模型(比如word2vec)在向量中心中寻找与中心词较近的词作为同义词。商品属性的补充需要人为发现并进行配置。然而,词向量模型找到的同义词强依赖于训练的语料,并且在句子中位置越相似的词相似度越高,找到的同义词的准确率和召回率都不高。而人为发现新增的商品属性,会导致实时性差,而且增加了人工成本。
针对以上相关技术中存在的问题,本发明提供了一种基于用户行为的信息处理方法,该方法将用户的搜索信息与用户之后的行为序列联系起来,基于用户的行为序列将搜索信息与搜索结果中的对象类别(如商品类别)进行匹配并建立映射关系,从而根据用户搜索信息对匹配程度高的对象类别进行信息补充和完善以丰富商品知识库,为用户带来更好的购物体验。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
需要注意的是,下述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图1示出了应用本发明示例性实施方式的系统架构示意图。如图1所示,系统架构100可以包括客户端110、网络120和服务端130。客户端110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种终端设备。服务端130可以包括网络服务器、应用服务器、数据库服务器等各种服务器设备,服务端130可以为客户端110提供网络资源和数据服务。网络120可以是能够在客户端110和服务端130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
根据实现需要,本发明示例性实施方式的系统架构可以具有任意数目的客户端、网络和服务端。例如,服务端130可以是由多个服务器设备组成的服务器群组。本发明示例性实施方式提供的信息处理方法可以应用于客户端110,也可以应用于服务端130,或者也可以由客户端110和服务端130共同实施,本发明对此不做特殊限定。
举例而言,用户可以通过客户端110登录电商平台,在输入关于商品的搜索信息后,客户端110可以将搜索信息发送至服务端130。服务端130根据搜索信息在商品知识库中进行商品匹配,然后根据匹配结果向客户端110返回作为搜索结果的商品列表。用户在客户端110上可以对商品列表中的各个商品进行点击查看、加入购物车、收藏、购买等各种处理行为。服务端130可以实时地采集并记录用户的在输入搜索信息后的行为序列,基于该行为序列可以判断商品列表中各个商品与用户输入的搜索信息之间的匹配程度,进而确定匹配程度高的商品类别。根据各个商品与搜索信息的匹配关系,可以根据搜索信息为匹配程度高的商品类别进行信息补充,丰富商品知识库。如此一来,当用户再次输入类似的搜索信息时,可以优先向用户返回匹配程度高的商品类别,从而提高搜索效率,优化用户体验。
示例性方法
下面结合上述的应用场景,参考图2至图6来描述根据本发明示例性实施方式的信息处理方法。
图2示出了本发明一些示例性实施方式中信息处理方法的步骤流程图。如图2所示,该方法主要可以包括以下步骤:
步骤S210.获取用户搜索信息以及与用户搜索信息相对应的用户行为序列。
在电商平台或者其他涉及对象搜索的应用平台上,用户可以通过文本输入或者语音输入等方式输入与搜索对象相关的用户搜索信息。其中,用户搜索信息可以是与搜索对象的名称、品类或者属性描述等相关的信息。例如,当搜索对象为商品时,用户搜索信息可以是与商品的名称、品类和属性描述等相关的信息,如“秋冬羊毛大衣”、“28寸行李箱”等等。当用户输入搜索信息后,相关网络平台会向用户返回包括若干数量搜索条目的搜索结果。用户可以浏览查看每个搜索条目对应的搜索对象,并且可以进一步地实施收藏、加入购物车或者购买等行为。在用户输入搜索信息之后连续产生的用户行为即组成与用户搜索信息相对应的用户行为序列。
步骤S220.对用户搜索信息进行语义识别以得到命名实体信息。
用户搜索信息一般可以是文本形式的信息,本步骤可以对其进行语义识别以得到其中包含的命名实体信息。如果用户搜索信息为语音形式的信息,那么本步骤也可以先对其进行语音识别以转化为相应的文本信息,然后再对识别到的文本信息进行语义识别。本步骤可以利用预先训练的语义识别模型对用户搜索信息进行命名实体标注以得到命名实体信息,语义识别模型可以选用基于Transformer的双向编码器表征模型(BidirectionalEncoder Representations from Transformer,简称BERT)加上微调的训练方式构建的序列标注模型,另外也可以选用条件随机场模型(Conditional Random Field,简称CRF)、隐马尔柯夫模型(Hidden Markov Model,简称HMM)或者最大熵马尔柯夫模型(MaximumEntropy Markov Model,简称MEMM)等其他类型的命名实体识别模型。表1示意性地示出了在一应用场景中根据用户搜索信息识别得到的命名实体信息。
表1命名实体信息对应关系表
用户搜索信息 实体名称 实体属性名 实体属性值
秋冬羊毛大衣 大衣 秋冬、羊毛
28寸行李箱 行李箱 28寸
材质纯棉的四件套 四件套 材质 纯棉
材质纯棉的裤子 裤子 材质 纯棉
以用户搜索信息“材质纯棉的裤子”为例,经过语义识别可以得到其中包含的实体名称、实体属性名和实体属性值。其中,实体名称用于描述用户想要购买的商品类别,如“裤子”;实体属性名用于描述用户关注的商品属性,如“材质”;实体属性值用于描述用户关注的商品的属性取值,如“纯棉”。
步骤S230.根据用户行为序列确定与用户搜索信息相匹配的对象类别。
在向用户呈现包括若干搜索条目的搜索结果后,用户可以根据自身的搜索需求有选择地浏览查看各项搜索条目,并且可以对各个搜索条目对应的搜索对象实施不同的处理行为。例如,当用户搜索商品时,可以浏览电商平台返回的商品搜索结果,从中选择部分商品实施查看、收藏、加入购物车或者购买等行为。不同的行为类型能够反映搜索对象与用户搜索信息之间的匹配程度,进而可以确定对应于搜索对象的对象类别与用户搜索信息之间的匹配程度,并根据该匹配程度确定与用户搜索信息相匹配的对象类别。
步骤S240.根据命名实体信息更新对象类别的类别属性信息。
在确定与用户搜索信息相匹配的对象类别后,本步骤可以根据步骤S220中获得的命名实体信息对该对象类别的类别属性信息进行更新,更新的方式主要可以是将命名实体信息作为补充内容添加至对象类别的类别属性信息中。举例而言,某一商品类别的类别名称为“旅行箱”,基于语义识别得到的命名实体信息中包括有“行李箱”,那么本步骤可以将“行李箱”作为“旅行箱”的同义词添加至该商品类别的类别名称中。当再次接收到与“行李箱”相关的搜索信息时,便可以直接将“旅行箱”相关的商品作为搜索结果呈现给用户。
在本发明示意性实施方式提供的信息处理方法中,通过对用户搜索信息进行语义识别可以初步得到用户的搜索需求,再根据用户行为序列确定搜索结果中涉及的对象类别与用户搜索信息的匹配程度,从而根据匹配程度进一步获取精确的用户搜索需求。与用户搜索信息匹配的对象类别即为符合用户搜索需求的对象类别,根据语义识别得到的命名实体信息可以对该对象类别的类别属性信息进行更新。利用用户搜索信息结合用户行为序列对对象类别的类别属性信息进行补充完善,不仅可以提高用户的搜索效率,而且可以提高搜索结果的准确性,快速且准确地向用户返回更加符合用户预期的搜索结果,优化用户的搜索体验。尤其是在电子商务领域,基于补充完善的关于商品的类别属性信息,可以获得商品内容更加丰富且商品信息更加详实的商品知识库,为人工客服或者智能客服提供更好的数据支持,帮助客服准确定位用户的真实需求,更好地为用户提供问题解答等服务。
利用用户行为序列可以深度挖掘用户需求,从而准确地定位与用户搜索信息相匹配的对象类别。图3示出了本发明一些示例性实施方式中确定对象类别匹配关系的步骤流程图。如图3所示,在以上各实施方式的基础上,步骤S230.根据用户行为序列确定与用户搜索信息相匹配的对象类别,可以包括以下步骤:
步骤S310.根据用户行为序列确定多个搜索对象以及针对每个搜索对象的用户行为信息。
根据用户搜索信息可以向用户展示包括多个搜索对象的搜索结果,用户对搜索结果中的部分或者全部的搜索对象实施各种类型的处理行为即形成用户行为序列。本步骤根据用户行为序列可以确定被用户实施处理行为的多个搜索对象,同时可以确定每个搜索对象对应的用户行为信息。用户行为信息可以包括用户行为类型和用户行为次数等信息。
步骤S320.根据用户行为信息确定每个搜索对象与用户搜索信息的对象关联度。
不同的用户行为类型和用户行为次数反映了每个搜索对象与用户搜索信息的关联程度的高低。例如,用户点击查看了商品A和商品B,并且购买了商品A,而没有购买商品B,那么可以认为用户搜索信息与商品A的关联程度高于商品B。基于这一原则,本步骤可以首先根据用户行为信息确定针对每个搜索对象的用户行为类型和用户行为次数,然后获取与用户行为类型相对应的行为权重,再根据用户行为次数和行为权重确定每个搜索对象与用户搜索信息的对象关联度。在一些可选的实施方式中,用户行为类型可以包括针对搜索对象的查看行为(例如点击进入商品的详情页面)、预获取行为(例如将商品加入购物车)和获取行为(例如购买商品)中的一种或者多种。举例而言,本步骤可以通过公式S=a*X+b*Y+c*Z来计算一个搜索对象与用户搜索信息的对象关联度S。其中,X、Y和Z分别为查看行为、预获取行为和获取行为的行为次数,a、b和c分别为查看行为、预获取行为和获取行为的行为权重。行为权重反映了不同行为类型对对象关联度的影响程度,例如,购买行为的行为权重可以为10,加入购物车行为的行为权重可以为8,点击查看行为的行为权重可以为5。
步骤S330.分别确定与每个搜索对象相关联的对象类别,并根据对象关联度确定每个对象类别与用户搜索信息的类别关联度。
每个搜索对象可以确定一个与之相关联的对象类别,例如该对象类别可以是一个商品对应的商品类别。多个搜索对象可以关联于同一对象类别,根据关联至同一对象类别的各个搜索对象与用户搜索信息的对象关联度可以计算得到该对象类别与用户搜索信息的类别关联度。例如可以将与一个对象类别相关联的多个搜索对象的对象关联度求和得到该对象类别的类别关联度。
步骤S340.将类别关联度最高的对象类别确定为与用户搜索信息相匹配的对象类别。
通过确定各个对象类别与用户搜索信息的类别关联度,本步骤可以从中选取类别关联度最高的对象类别作为与用户搜索信息相匹配的对象类别,后续即可对匹配的对象类别进行类别属性信息的更新。
一个对象类别的类别属性信息可以包括对象名称和对象属性,其中对象属性又可以包括对象属性名和对象属性值中的一种或者多种。在对类别属性信息进行更新时,可以首先确定对用户搜索信息进行语义识别得到的命名实体信息,并获取命名实体信息中的实体名称信息和实体属性信息,然后可以根据实体名称信息更新对象类别的对象名称,根据实体属性信息更新对象类别的对象属性。
举例而言,某一对象类别的对象名称为“女士毛呢”,而从用户搜索信息中识别得到的实体名称信息为“毛呢大衣”,在此基础上可以将“毛呢大衣”作为“女士毛呢”的同义词添加至该对象类别的对象名称中。
图4示出了本发明一些示例性实施方式中更新对象属性的步骤流程图。如图4所示,根据实体属性信息更新对象类别的对象属性,可以包括以下步骤:
步骤S410.确定与对象类别相关联的至少一个典型对象。
一个对象类别可以同时关联至多个搜索对象,本步骤可以从这些搜索对象中选取一个或者多个该对象类别的典型对象。具体可以先确定与对象类别相关联的多个搜索对象,并获取各个搜索对象与用户搜索信息的对象关联度。然后将对象关联度最高的预设数量的搜索对象确定为与对象类别相关联的典型对象。例如可以将关联至一个对象类别的对象关联度最高的五个搜索对象确定为典型对象。表2示意性地示出了在一应用场景中的用户搜索信息、对象类别以及典型对象之间的对应关系。
表2典型对象对应关系表
用户搜索信息 对象类别(对象名称) 典型商品(商品ID)
秋冬羊毛大衣 女式毛呢 item11、item12、item13…
28寸行李箱 PC箱 item21、item22、item23…
材质纯棉的四件套 床品套件 item31、item32、item33…
步骤S420.获取与实体属性信息相对应的典型对象的标准属性。
对象类别的对象属性具体体现为每个搜索对象的标准属性,在确定与对象类别相关联的典型对象后,可以获取每个典型对象的标准属性,该标准属性可以包括标准属性名和标准属性值。例如,标准属性名为“材质”,对应的标准属性值为“羊毛”、“驼绒”等等。
步骤S430.确定实体属性信息与标准属性的属性相似度。
本步骤可以将实体属性信息对应的字符串str1与标准属性对应的字符串str2进行词相似度量,并将字符串的词相似度作为实体属性信息与标准属性之间的属性相似度。
步骤S440.若属性相似度大于相似度阈值,则将实体属性信息确定为对象类别的同义对象属性。
例如将相似度阈值确定为0.8,如果一个实体属性信息与标准属性的属性相似度大于0.8,便可以认为该实体属性信息是标准属性的同义词,亦即可以将实体属性信息确定为对象类别的同义对象属性。表3示意性地示出了本发明在一应用场景中同义对象属性的对应关系表。
表3同义对象属性的对应关系表
Figure BDA0002361390410000161
Figure BDA0002361390410000171
步骤S450.若属性相似度小于或等于相似度阈值,则从实体属性信息中选取一个或者多个高频属性,并将高频属性确定为对象类别的新增对象属性。
对于属性相似度小于或等于相似度阈值的实体属性信息,可以从中选取高频属性作为对象类别的新增对象属性。例如,未能与标准商品属性匹配上的用户搜索信息解析到的属性名和属性值可以作为现有商品属性的补充。商品属性的补充以商品类别为粒度,汇总各个商品类别下的新增商品属性名和新增属性值。分别对新增商品属性名和新增商品属性值进行聚类,可以发现一些用户关注的高频商品属性,辅助进行高频商品属性的配置。表4示意性地示出了本发明在一应用场景中新增对象属性的对应关系表。
表4新增对象属性的对应关系表
Figure BDA0002361390410000172
在本发明的一些示例性实施方式中,可以通过将多种相似度计算方法进行结合的方式确定实体属性信息与标准属性的属性相似度。图5示出了本发明一些示例性实施方式中确定属性相似度的步骤流程图。如图5所示,确定实体属性信息与标准属性的属性相似度,可以包括以下步骤:
步骤S510.根据实体属性信息与标准属性的编辑距离确定编辑距离相似度。
实体属性信息对应的字符串str1至少需要经过m步编辑处理(如增加、删除、修改)才能变成标准属性对应的字符串str2。因此,基于编辑距离m,可以按照如下公式确定编辑距离相似度edit:
Figure BDA0002361390410000181
其中,len(str1)表示字符串str1的字符串长度,len(str2)表示字符串str2的字符串长度。
步骤S520.根据实体属性信息与标准属性中相同字符的数量确定字共现相似度。
基于相同字符的数量n,可以按照如下公式确定字共现相似度concurrence:
Figure BDA0002361390410000182
步骤S530.根据实体属性信息与标准属性的词向量确定语义相似度。
分别获取字符串str1和字符串str2的词向量,然后计算二者的余弦相似度。词向量的训练方法,可以借助于word2vec在电商语料上进行训练,获得预训练的词向量。
步骤S540.根据编辑距离相似度、字共现相似度以及语义相似度确定实体属性信息与标准属性的属性相似度。
基于以上三类相似度进行加权计算得到属性相似度,用以衡量str1和str2的相似程度。举例而言,语义相似度的权重可以配置为0.7,编辑距离相似度的权重可以配置为0.1,字共现相似度的权重可以配置为0.2。采用这三种相似度进行加权平均的好处在于:(1)如果仅采用词向量进行衡量,传统的词向量的训练原理大都基于句子结构,即词在句子中的位置。因此经常在同一位置出现的词的相似度就会很高。例如,“男”和“女”这两个词在向量空间的相似度就会很高,而在对象属性方面,二者是商品适用性别属性下的不同的取值,不能互为同义词。(2)同时选取两种字面的词相似度量方式可以起到互补的作用。编辑距离对词中字符的位置是敏感的,比如“棉麻”和“麻棉”,二者的编辑距离相似度是0,但是字共现相似度为1,因此两种相似度可以互相弥补各自的短处。结合三种相似度最终得到实体属性信息和标准属性之间的属性相似度,既可以融入语义上的相似,同时又引入字面上的相似,弥补词向量的不足。
针对与标准属性的属性相似度较低的实体属性信息,可以通过聚类处理获取其中的高频属性,从而确定对象类别的新增对象属性。在选取高频属性时,可以先对实体属性信息进行聚类处理以得到一个或者多个属性集合,然后从每个属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
在本发明的一些可选的实施方式中,可以通过层次化聚类对实体属性信息进行聚类处理。具体可以分别获取任意两个实体属性信息的属性相似度,然后根据属性相似度对实体属性信息进行聚类处理以得到一个或者多个属性集合。
层次化聚类是一种自底而上的聚类方法,不依赖于先验的知识,全局最优的算法,层次化聚类算法的时间复杂度为o(N3)。图6示意性地示出了层次化聚类算法的原理图。如图6所示,在层次化聚类时,每次合并最相近的两个实体属性信息,例如首先将属性相似度最接近的实体属性信息p5和实体属性信息p6合并成为信息p5p6。然后再将属性相似度最接近的p4和p5p6合并成为p4p5p6,如此向上合并,直至属性相似度超过预设阈值。例如,当把预设阈值设置为3时,可以得到三个属性集合p0p1p2、p3和p4p5p6。又例如,当把预设阈值设置为2时,可以得到五个属性集合p0、p1、p2、p3和p4p5p6。
在实际使用时,本发明可以对同一个对象类别下的所有实体属性信息进行聚类,并且聚类时忽略词频。因此参与聚类的词的个数是十分有限的(在1万个词以内),所以层次化聚类可以在有限的时间内完成。在完成聚类后,可以从每个属性集合中选取词频最高的词作为当前属性集合中的中心词,即高频属性。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的信息处理方法中的步骤。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图7对本发明示例性实施方式的信息处理装置进行说明。
图7示出了本发明一些示例性实施方式中信息处理装置的结构框图。如图7所示,信息处理装置700主要可以包括:
信息获取模块710,被配置为获取用户搜索信息以及与用户搜索信息相对应的用户行为序列。
语义识别模块720,被配置为对用户搜索信息进行语义识别以得到命名实体信息。
信息匹配模块730,被配置为根据用户行为序列确定与用户搜索信息相匹配的对象类别。
信息更新模块740,被配置为根据命名实体信息更新对象类别的类别属性信息。
在本发明的一些示例性实施方式中,基于以上各实施方式,信息匹配模块730可以进一步包括:
搜索对象确定单元731,被配置为根据用户行为序列确定多个搜索对象以及针对每个搜索对象的用户行为信息;
对象关联度确定单元732,被配置为根据用户行为信息确定每个搜索对象与用户搜索信息的对象关联度;
类别关联度确定单元733,被配置为分别确定与每个搜索对象相关联的对象类别,并根据对象关联度确定每个对象类别与用户搜索信息的类别关联度;
对象类别确定单元734,被配置为将类别关联度最高的对象类别确定为与用户搜索信息相匹配的对象类别。
在本发明的一些示例性实施方式中,基于以上各实施方式,对象关联度确定单元732可以进一步包括:
用户行为确定子单元,被配置为根据用户行为信息确定针对每个搜索对象的用户行为类型和用户行为次数;
行为权重获取子单元,被配置为获取与用户行为类型相对应的行为权重;
对象关联度确定子单元,被配置为根据用户行为次数和行为权重确定每个搜索对象与用户搜索信息的对象关联度。
在本发明的一些示例性实施方式中,基于以上各实施方式,用户行为类型包括针对搜索对象的查看行为、预获取行为和获取行为中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上各实施方式,类别属性信息包括对象名称和对象属性,信息更新模块740可以进一步包括:
实体信息获取单元741,被配置为获取命名实体信息中的实体名称信息和实体属性信息;
对象名称更新单元742,被配置为根据实体名称信息更新对象类别的对象名称;
对象属性更新单元743,被配置为根据实体属性信息更新对象类别的对象属性。
在本发明的一些示例性实施方式中,基于以上各实施方式,对象属性包括对象属性名和对象属性值中的一种或者多种。
在本发明的一些示例性实施方式中,基于以上各实施方式,对象属性更新单元743可以进一步包括:
典型对象确定子单元,被配置为确定与对象类别相关联的至少一个典型对象;
标准属性获取子单元,被配置为获取与实体属性信息相对应的典型对象的标准属性;
属性相似度确定子单元,被配置为确定实体属性信息与标准属性的属性相似度;
同义对象属性更新子单元,被配置为若属性相似度大于相似度阈值,则将实体属性信息确定为对象类别的同义对象属性;
新增对象属性更新子单元,被配置为若属性相似度小于或等于相似度阈值,则从实体属性信息中选取一个或者多个高频属性,并将高频属性确定为对象类别的新增对象属性。
在本发明的一些示例性实施方式中,基于以上各实施方式,典型对象确定子单元可以进一步包括:
对象关联度获取子单元,被配置为确定与对象类别相关联的多个搜索对象,并获取各个搜索对象与用户搜索信息的对象关联度;
对象关联度排序子单元,被配置为将对象关联度最高的预设数量的搜索对象确定为与对象类别相关联的典型对象。
在本发明的一些示例性实施方式中,基于以上各实施方式,属性相似度确定子单元可以进一步包括:
编辑距离相似度确定子单元,被配置为根据实体属性信息与标准属性的编辑距离确定编辑距离相似度;
字共现相似度确定子单元,被配置为根据实体属性信息与标准属性中相同字符的数量确定字共现相似度;
语义相似度确定子单元,被配置为根据实体属性信息与标准属性的词向量确定语义相似度。
属性相似度计算子单元,被配置为根据编辑距离相似度、字共现相似度以及语义相似度确定实体属性信息与标准属性的属性相似度。
在本发明的一些示例性实施方式中,基于以上各实施方式,新增对象属性更新子单元可以进一步包括:
属性聚类子单元,被配置为对实体属性信息进行聚类处理以得到一个或者多个属性集合;
高频属性选取子单元,被配置为从每个属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
在本发明的一些示例性实施方式中,基于以上各实施方式,属性聚类子单元可以进一步包括:
属性相似度获取子单元,被配置为分别获取任意两个实体属性信息的属性相似度;
属性集合确定子单元,被配置为根据属性相似度对实体属性信息进行聚类处理以得到一个或者多个属性集合。
以上各示例性实施方式中的信息处理装置的具体细节已在相应的示例性方法部分做出详细说明,因此此处不再赘述。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的信息处理方法中的步骤。
应当注意,尽管在上文详细描述中提及了信息处理装置的若干单元或子单元,但是这种划分仅仅是示例性的,并非是强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之,上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所发明的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (20)

1.一种信息处理方法,其特征在于,包括:
获取用户搜索信息以及与所述用户搜索信息相对应的用户行为序列;
对所述用户搜索信息进行语义识别以得到命名实体信息;
根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别;
根据所述命名实体信息更新所述对象类别的类别属性信息;
其中,所述类别属性信息包括对象名称和对象属性,所述根据所述命名实体信息更新所述对象类别的类别属性信息,包括:
获取所述命名实体信息中的实体名称信息和实体属性信息;
根据所述实体名称信息更新所述对象类别的对象名称;
根据所述实体属性信息更新所述对象类别的对象属性;
其中,所述根据所述实体属性信息更新所述对象类别的对象属性,包括:
确定与所述对象类别相关联的至少一个典型对象;
获取与所述实体属性信息相对应的所述典型对象的标准属性;
确定所述实体属性信息与所述标准属性的属性相似度;
若所述属性相似度大于相似度阈值,则将所述实体属性信息确定为所述对象类别的同义对象属性;
若所述属性相似度小于或等于相似度阈值,则从所述实体属性信息中选取一个或者多个高频属性,并将所述高频属性确定为所述对象类别的新增对象属性。
2.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别,包括:
根据所述用户行为序列确定多个搜索对象以及针对每个所述搜索对象的用户行为信息;
根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度;
分别确定与每个所述搜索对象相关联的对象类别,并根据所述对象关联度确定每个所述对象类别与所述用户搜索信息的类别关联度;
将所述类别关联度最高的对象类别确定为与所述用户搜索信息相匹配的对象类别。
3.根据权利要求2所述的信息处理方法,其特征在于,所述根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度,包括:
根据所述用户行为信息确定针对每个所述搜索对象的用户行为类型和用户行为次数;
获取与所述用户行为类型相对应的行为权重;
根据所述用户行为次数和所述行为权重确定每个所述搜索对象与所述用户搜索信息的对象关联度。
4.根据权利要求3所述的信息处理方法,其特征在于,所述用户行为类型包括针对搜索对象的查看行为、预获取行为和获取行为中的一种或者多种。
5.根据权利要求1所述的信息处理方法,其特征在于,所述对象属性包括对象属性名和对象属性值中的一种或者多种。
6.根据权利要求1所述的信息处理方法,其特征在于,所述确定与所述对象类别相关联的至少一个典型对象,包括:
确定与所述对象类别相关联的多个搜索对象,并获取各个所述搜索对象与所述用户搜索信息的对象关联度;
将所述对象关联度最高的预设数量的搜索对象确定为与所述对象类别相关联的典型对象。
7.根据权利要求1所述的信息处理方法,其特征在于,所述确定所述实体属性信息与所述标准属性的属性相似度,包括:
根据所述实体属性信息与所述标准属性的编辑距离确定编辑距离相似度;
根据所述实体属性信息与所述标准属性中相同字符的数量确定字共现相似度;
根据所述实体属性信息与所述标准属性的词向量确定语义相似度;
根据所述编辑距离相似度、所述字共现相似度以及所述语义相似度确定所述实体属性信息与所述标准属性的属性相似度。
8.根据权利要求1所述的信息处理方法,其特征在于,所述从所述实体属性信息中选取一个或者多个高频属性,包括:
对所述实体属性信息进行聚类处理以得到一个或者多个属性集合;
从每个所述属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
9.根据权利要求8所述的信息处理方法,其特征在于,所述对所述实体属性信息进行聚类处理以得到一个或者多个属性集合,包括:
分别获取任意两个实体属性信息的属性相似度;
根据所述属性相似度对所述实体属性信息进行聚类处理以得到一个或者多个属性集合。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的信息处理方法。
11.一种信息处理装置,其特征在于,包括:
信息获取模块,被配置为获取用户搜索信息以及与所述用户搜索信息相对应的用户行为序列;
语义识别模块,被配置为对所述用户搜索信息进行语义识别以得到命名实体信息;
信息匹配模块,被配置为根据所述用户行为序列确定与所述用户搜索信息相匹配的对象类别;
信息更新模块,被配置为根据所述命名实体信息更新所述对象类别的类别属性信息;
其中,所述类别属性信息包括对象名称和对象属性,所述信息更新模块包括:
实体信息获取单元,被配置为获取所述命名实体信息中的实体名称信息和实体属性信息;
对象名称更新单元,被配置为根据所述实体名称信息更新所述对象类别的对象名称;
对象属性更新单元,被配置为根据所述实体属性信息更新所述对象类别的对象属性;
其中,所述对象属性更新单元包括:
典型对象确定子单元,被配置为确定与所述对象类别相关联的至少一个典型对象;
标准属性获取子单元,被配置为获取与所述实体属性信息相对应的所述典型对象的标准属性;
属性相似度确定子单元,被配置为确定所述实体属性信息与所述标准属性的属性相似度;
同义对象属性更新子单元,被配置为若所述属性相似度大于相似度阈值,则将所述实体属性信息确定为所述对象类别的同义对象属性;
新增对象属性更新子单元,被配置为若所述属性相似度小于或等于相似度阈值,则从所述实体属性信息中选取一个或者多个高频属性,并将所述高频属性确定为所述对象类别的新增对象属性。
12.根据权利要求11所述的信息处理装置,其特征在于,所述信息匹配模块包括:
搜索对象确定单元,被配置为根据所述用户行为序列确定多个搜索对象以及针对每个所述搜索对象的用户行为信息;
对象关联度确定单元,被配置为根据所述用户行为信息确定每个所述搜索对象与所述用户搜索信息的对象关联度;
类别关联度确定单元,被配置为分别确定与每个所述搜索对象相关联的对象类别,并根据所述对象关联度确定每个所述对象类别与所述用户搜索信息的类别关联度;
对象类别确定单元,被配置为将所述类别关联度最高的对象类别确定为与所述用户搜索信息相匹配的对象类别。
13.根据权利要求12所述的信息处理装置,其特征在于,所述对象关联度确定单元包括:
用户行为确定子单元,被配置为根据所述用户行为信息确定针对每个所述搜索对象的用户行为类型和用户行为次数;
行为权重获取子单元,被配置为获取与所述用户行为类型相对应的行为权重;
对象关联度确定子单元,被配置为根据所述用户行为次数和所述行为权重确定每个所述搜索对象与所述用户搜索信息的对象关联度。
14.根据权利要求13所述的信息处理装置,其特征在于,所述用户行为类型包括针对搜索对象的查看行为、预获取行为和获取行为中的一种或者多种。
15.根据权利要求11所述的信息处理装置,其特征在于,所述对象属性包括对象属性名和对象属性值中的一种或者多种。
16.根据权利要求11所述的信息处理装置,其特征在于,所述典型对象确定子单元包括:
对象关联度获取子单元,被配置为确定与所述对象类别相关联的多个搜索对象,并获取各个所述搜索对象与所述用户搜索信息的对象关联度;
对象关联度排序子单元,被配置为将所述对象关联度最高的预设数量的搜索对象确定为与所述对象类别相关联的典型对象。
17.根据权利要求11所述的信息处理装置,其特征在于,所述属性相似度确定子单元包括:
编辑距离相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性的编辑距离确定编辑距离相似度;
字共现相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性中相同字符的数量确定字共现相似度;
语义相似度确定子单元,被配置为根据所述实体属性信息与所述标准属性的词向量确定语义相似度;
属性相似度计算子单元,被配置为根据所述编辑距离相似度、所述字共现相似度以及所述语义相似度确定所述实体属性信息与所述标准属性的属性相似度。
18.根据权利要求11所述的信息处理装置,其特征在于,所述新增对象属性更新子单元包括:
属性聚类子单元,被配置为对所述实体属性信息进行聚类处理以得到一个或者多个属性集合;
高频属性选取子单元,被配置为从每个所述属性集合中选取一个或者多个出现频率最高的实体属性信息作为高频属性。
19.根据权利要求18所述的信息处理装置,其特征在于,所述属性聚类子单元包括:
属性相似度获取子单元,被配置为分别获取任意两个实体属性信息的属性相似度;
属性集合确定子单元,被配置为根据所述属性相似度对所述实体属性信息进行聚类处理以得到一个或者多个属性集合。
20.一种计算设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9中任一项所述的信息处理方法。
CN202010022763.1A 2020-01-09 2020-01-09 信息处理方法、介质、装置和计算设备 Active CN111259131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010022763.1A CN111259131B (zh) 2020-01-09 2020-01-09 信息处理方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010022763.1A CN111259131B (zh) 2020-01-09 2020-01-09 信息处理方法、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN111259131A CN111259131A (zh) 2020-06-09
CN111259131B true CN111259131B (zh) 2023-05-05

Family

ID=70950397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010022763.1A Active CN111259131B (zh) 2020-01-09 2020-01-09 信息处理方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN111259131B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184323A (zh) * 2020-10-13 2021-01-05 上海风秩科技有限公司 评价标签生成方法和装置、存储介质及电子设备
CN113344098A (zh) * 2021-06-22 2021-09-03 北京三快在线科技有限公司 一种模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657514A (zh) * 2015-03-24 2015-05-27 成都知数科技有限公司 基于电商用户行为数据的近义词识别方法
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
CN105824833A (zh) * 2015-01-07 2016-08-03 苏宁云商集团股份有限公司 基于用户行为反馈的关键词推荐方法和系统
CN110322299A (zh) * 2018-03-28 2019-10-11 北京京东尚科信息技术有限公司 商品搜索方法及装置、电子设备、存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2735065C (en) * 2010-03-25 2015-08-11 Radicalogic Technologies, Inc. Systems and methods for creating a form for receiving data relating to a health care incident

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
CN105824833A (zh) * 2015-01-07 2016-08-03 苏宁云商集团股份有限公司 基于用户行为反馈的关键词推荐方法和系统
CN104657514A (zh) * 2015-03-24 2015-05-27 成都知数科技有限公司 基于电商用户行为数据的近义词识别方法
CN110322299A (zh) * 2018-03-28 2019-10-11 北京京东尚科信息技术有限公司 商品搜索方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN111259131A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN107609152B (zh) 用于扩展查询式的方法和装置
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US20130318101A1 (en) Product search method and system
KR20190108838A (ko) 미술 작품 추천 큐레이션 방법 및 시스템
CN107832338B (zh) 一种识别核心产品词的方法和系统
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN111046225B (zh) 音频资源处理方法、装置、设备及存储介质
CN110348920A (zh) 一种推荐产品的方法及装置
CN110069698A (zh) 信息推送方法和装置
CN111259131B (zh) 信息处理方法、介质、装置和计算设备
CN113806588B (zh) 搜索视频的方法和装置
CN111209351A (zh) 对象关系预测、对象推荐方法及装置、电子设备、介质
CN112330387A (zh) 一种应用于看房软件的虚拟经纪人
CN116662495A (zh) 问答处理方法、训练问答处理模型的方法及装置
CN113495991A (zh) 一种推荐方法和装置
CN111782850A (zh) 一种基于手绘图的物品搜索方法和装置
CN107169837B (zh) 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN110347922A (zh) 基于相似度的推荐方法、装置、设备和存储介质
CN115017385A (zh) 一种物品搜索方法、装置、设备和存储介质
CN114971767A (zh) 信息处理方法、装置、电子设备及存储介质
CN110110199B (zh) 信息输出方法和装置
CN113744011A (zh) 物品搭配方法和物品搭配装置
CN110826313A (zh) 一种信息提取方法、电子设备及计算机可读存储介质
CN112699672B (zh) 选择物品的方法和装置
EP4202818A1 (en) Systems and methods for creating listings for items for sale in an electronic marketplace

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant