CN112732923B

CN112732923B - 一种基于知识图谱的快件物流服务语义提取方法

Info

Publication number: CN112732923B
Application number: CN202011268012.4A
Authority: CN
Inventors: 孟凡超; 郑璇池; 孙山鑫
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2022-07-12
Anticipated expiration: 2040-11-13
Also published as: CN112732923A

Abstract

本发明涉及一种基于知识图谱的快件物流服务语义提取方法，包括以下步骤：S1：对用户输入的需求语句进行实体识别处理的步骤；S2：对实体识别后的语句进行转换拼接处理的步骤；S3：根据快件物流领域知识图谱，对转换拼接处理后的语句进行语义解读的步骤；S4：构建快件物流服务用户喜好模型的步骤；S5：向用户推荐个性化物流服务的步骤。

Description

一种基于知识图谱的快件物流服务语义提取方法

技术领域

本发明属于快件物流服务搜索领域，具体涉及一种基于知识图谱的快件物流服务语义提取方法。

背景技术

快件物流行业随着电子商务的兴起而快速发展，同时也出现了一些难以解决的问题，例如传统的物流企业为用户提供模板化的输入方式，但在现实情况中，用户需求具有较为明显的个性化和多变化的特征，用户个性化需求覆盖了功能、QoS等多方面内容，而传统的物流服务中假设用户所要求和所提供的服务是明确的，但这种假设在大部分场景下都是不成立的。

用户通过模板化的输入所体现的需求往往是宏观的、模糊的，物流公司也仅能获取这些需求，而用户的隐藏需求以及更多的需求诉求很难表达。需要根据用户需求以及服务资源的限制有差别的处理用户的请求，如何满足用户的个性化需求成为亟待解决的难题。

此外忽视对用户历史特征的挖掘。服务领域的一个典型特征是“先验性”，即过去使用服务所形成的历史记录隐含着未来使用服务的规律，当前很少有物流公司挖掘用户历史记录中隐含的个人特征，每次需求抵达时总是从起点为用户提供服务，缺乏足够的效率。如何根据领域知识和先验性来提高服务组合方案的构建效率和成功率，是另一个亟待解决的问题。

有鉴于此，本发明提供一种基于知识图谱的快件物流服务语义提取方法；以解决现有技术中存在的上述缺陷，是非常有必要的。

发明内容

本发明的目的在于，针对上述现有技术中存在的无法满足用户个性化需求的技术缺陷，提供设计一种基于知识图谱的快件物流服务语义提取方法，以解决上述技术问题。

为实现上述目的，本发明给出以下技术方案：

一种基于知识图谱的快件物流服务语义提取方法，包括以下步骤：

S1：对用户输入的需求语句进行实体识别处理的步骤；

S2：对实体识别后的语句进行转换拼接处理的步骤；

S3：根据快件物流领域知识图谱，对转换拼接处理后的语句进行语义解读的步骤；

S4：构建快件物流服务用户喜好模型的步骤；

S5：向用户推荐个性化物流服务的步骤。

所述步骤S1具体包括以下步骤：

将用户输入的需求语句信息进行分类处理，分为模板信息和需求信息；

其中，模板信息包括发货人信息，发货地址信息和发货人联系方式信息；以及收货人信息，收货地址信息和收货人联系方式信息；

需求信息包括用户对于所发物件信息表达的需求信息；例如“寄一个苹果手机，上门来取，最好用泡沫封装一下”这类需求。因为需求信息表达的不尽相同，没有统一的标准，所以如何从用户需求信息中提取关键信息是十分重要的。

使用中文分词工具Ansj来进行用户需求的分词，其具有良好的中文分词效果。但针对快件物流领域，会面临分词效果不佳的情况，从而导致后续操作的不准确。

根据快件物流领域知识图谱构建领域词典。结合快件物流领域词典，可以提高Ansj的分词质量。Ansj除了可以用户自定义词汇外，用户还可以对词汇进行自定义词汇标注。

基于知识图谱构建快件物流领域词典，结合领域词典进行命名实体识别；具体包括以下步骤：

第一步，针对物流服务，从知识图谱中抽取服务名称，由于用户可能对某些需求描述不完整，只使用部分词汇，所以要对服务名称先进行分词处理，并保存到领域词典中，该类词汇使用“lfw”来标识，若用户需求中存在该词汇，则会直接分割出来；

第二步，针对快件，在知识图谱中设置快件的标准名称和别名，需要将标准名称和别名添加到领域词典中，由于快件分词需要准确性，所以不再对快件名称和别名进行分词，防止出现歧义，快件词汇使用“lcp”进行标识；

第三步，来自于服务提供者名称的词汇，服务提供者名称使用“lqy”进行标识。

针对前面的用户需求“寄一个苹果手机，上门来取，最好用泡沫包装一下”，分词和命名实体识别结果如下：

寄:v/一个:m/苹果手机:lcp/，:w/上门:lfw/来:v/取:v/，:w/最:d/好:a/用:p/泡沫包装:lfw/一下:m。

所述步骤S2具体包括以下步骤：

在用户的需求中，包括用户的快件需求，服务需求和服务提供者需求，而这三部分在实际的表达中都存在着个人特点，需要进行需求转换。

针对用户的快件需求，利用别名属性来转换。正常情况下，不同用户在检索时所使用的快件词汇往往会因人而异，这样会导致不同的用户在寄送同一事物时，可能会使用不同的词汇，例如，用户想要运输“手机”，用户可能使用的词汇有“iPhone”、“小米手机”、“苹果手机”等，但是所关注的不是用户需要运输什么型号的“手机”，只需要知道用户需要运输“手机”即可，所以在知识图谱中对快件定义别名属性，使得不同表达的快件都能在知识图谱中找到对应，对于无法找到实体对应的快件，则需要询问用户，进而将可以进行转换的快件词汇转换到标准描述。对于一些含义可能模糊的词汇，则使用该词汇最原始的含义，例如用户输入了“小米”，则按照食品去处理，而不是“小米手机”。

针对用户的服务需求和服务提供者需求，利用领域词典进行转换。用户在服务需求表达上可能存在着表述不全的问题，不能在知识图谱中找到对应，同样需要对用户表达进行同义转换。以用户需求命名实体识别的结果为基础将分词处理后的词汇转换到标准的服务名称上。例如，用户想要快递员“上门取件”，用户可能使用的表达“上门”等，需要将“上门”这一词汇根据领域词典转换到标准服务名称“上门取件”，但是这部分的内容很难在一个邻域词典中穷尽，所以需要根据用户的需求动态的对领域词典进行更新。

经过对用户的需求进行命名实体识别和需求转换，得到系列的词汇，其中最重要的便是标识为“lcp”、“lfw”和“lqy”的词汇，然后对这些词汇进行抽取，同时也需要加上用户通过模板录入的信息等；具体步骤如下：

第一步：抽取关键词

将标识为“lcp”、“lfw”和“lqy”的词汇抽取出来，同时将其他词汇去除。“lcp”词汇为必需词汇，“lfw”和“lqy”词汇为非必需词汇，若用户没有输入需求或者用户需求中没有标识为“lcp”的词汇，则需要进一步询问用户，只有在获取到用户想要运输的快件信息后，才能进行后面的操作。将“lcp”词汇映射为快件信息，将“lfw”词汇映射为服务信息，将“lqy”词汇映射为服务提供者信息。

经过这一步操作，用户的需求变为：{快件：手机,服务：[上门取件，泡沫包装]}。

第二步：需求拼接

将模板信息和用户需求进行拼接，在模板信息中，影响后续搜索结果主要是寄件人和收件人的位置信息，这两个位置信息决定了运输服务的时间和价格，对于其他信息，如姓名、电话，不在需求中进行处理，保留到订单信息中即可。

经过这一步操作，用户的需求变为：{快件：手机,服务：[上门取件，泡沫包装]，寄件位置：某某省某某市，收件位置：某某省某某市}。

对用户的需求进行描述，如公式(1)所示：

N＝{P,f₁,…,f_m,A_start,A_end,C} (1)

其中，P代表用户想要运输的快件，为必需元素；f_1，...，f_m代表用户需要的服务流程，为非必需元素；A_start代表寄件位置，A_end代表收件位置，为必需元素；C为用户的服务提供者要求，为非必需元素。用户需求可以表示为：

N＝{P：“手机”，f₁：“上门取件”，f₂/泡沫封装”，A_start：“某某当某某市”，A_end：“某某当某某市”}

作为优选，所述步骤S3具体包括：

根据快件物流领域知识图谱，对用户需求进行语义分析，从语义层面理解用户的需求，并将检索结果返回给用户；语义分析包括本体-实体映射分析、服务搜索和扩展分析；

所述的本体-实体映射分析具体步骤如下：

本体-实体映射将得到的需求词汇映射到快件物流领域知识图谱的本体和实体上，以用户需求命名实体识别、转换和拼接为基础，采用直接映射和概念上升的方式。直接映射用于处理用户服务、快件和服务提供者，快件和服务提供者直接在知识图谱中找到相应的实体。用户服务还需要进行概念上升，在直接映射找到实体后进一步查找该服务对应的本体。

用户的快件为“手机”，可以直接映射到“手机”实体。用户的服务需求中有“上门取件”和“泡沫包装”，这两个属于服务的实体，可以直接映射；“上门取件”实体概念上升为“取件”本体，“泡沫包装”实体概念上升为“封装”本体。

所述的服务搜索和扩展分析的具体步骤如下：

语义扩展主要有两个作用，一是针对服务，快件物流运输是一个流程性工程，从用户寄件到用户收件往往会经历数个流程，而用户的需求可能仅仅提到了某一个流程，需要在满足用户特定流程需求的情形下，为用户提供一整套的服务流程；二是针对快件，在某些情况下需要对用户的快件进行适当的概念上升或者概念下降。

在知识图谱的基础上，根据用户的需求，得到满足用户需求的服务集合；然后通过下述的快件物流服务语义搜索算法进行语义搜索：

第一步：基于知识图谱，对用户需求进行直接映射和概念上升至实体或本体；

第二步：判断用户需求是否包括服务提供者需求，若包括，则根据快件实体以该服务提供者实体为基础搜索适用的待选服务，若不包括，则根据快件实体以所有服务提供者实体为粒度寻找适用的待选服务。

第三步：对找到的待选服务进行概念上升至本体并归类；

第四步：判断待选服务本体是否为空，若为空，跳转至第七步，若不为空，依次选择待选服务本体。

第五步：判断待选服务本体与用户服务需求本体是否相同，若成立，则跳转到第六步，若不成立，删除该待选服务本体，跳转到第四步。

第六步：判断待选服务本体下待选服务和用户服务需求是否相同，若相同，则将用户需求替换为该待选服务，将该待选服务放入结果集，跳转到第四步，若不相同，删除该待选服务本体，跳转到第四步。

第七步：返回结果集，算法结束。

作为优选，所述的步骤S4具备包括以下步骤：

在物流领域，通过调研，用户的关注点往往集中在价格、时间和评分三个部分。用户喜好分为历史喜好和瞬时喜好，历史喜好指的是用户过往的喜好情况，例如用户甲一直选择价格便宜的服务流程，而用户乙一直喜欢用时短的服务流程，那么当甲和乙输入了同样的检索条件，两人看到的服务推荐也是不一样的。而瞬时喜好指的是用户查找服务时的喜好情况，例如用户甲急需运送一批快件，这时就需要为甲推荐用时短的服务。

用户喜好模型可以在用户查询时为用户推荐个性化服务，提升用户的满意度。为标识用户的喜好情况，定义权重因子w，用户喜好函数定义公式(2)所示：

其中，K代表喜好集，k代表不同的喜好，在物流领域，k可简化为价格P、时间T和评分R。权重因子w_k初始值均设为1，当用户选择服务后，计算w_k，并更新w_k的值。w_k的计算公式如公式(3)所示：

其中s_k代表用户选择的服务该喜好的得分，L代表经过语义搜索得到的结果集，该公式在计算权重时考虑了所有结果中某个喜好所占的比重，比仅考虑单条服务的效果好。

除了正常用户的选择会影响到权重w外，还需要考虑到时间对用户喜好的影响，随着时间的推移，用户的喜好可能会发生变化，若一直按照旧的权重w为用户提供服务，某个权重因子w的值可能越来越大，导致其他参数难以对用户喜好产生影响，所以，设计了w的时间更新算法，每隔一段时间，对权重w进行适当的更新。

在这里，使用了记忆曲线来更新w，定义如公式(4)所示：

其中，t代表喜好从建立日期到当前日期的时间差，以天为单位，f＝7代表半衰期，表示f天后用户的喜好将遗忘一半，历史经验表明，当时，遗忘规律跟日常情况相符，此处可以简单设计为每隔7天，更新w为原值的一半。

用户的瞬时喜好在很大程度上影响着用户的选择，瞬时喜好的重要度要大于历史喜好，当用户的需求中出现价格、时间或评分要求时，将该要求对应的权重w的值设为最大值，使其他参数难以对喜好函数的值产生大的影响，当出现排序相同的服务时，再利用剩余参数计算其函数值；当用户的需求中出现服务提供者需求时，首先选出该服务提供者提供的服务，接下来再按喜好函数进行排序。

作为优选，所述步骤S5具体包括以下步骤：

最开始，因为不明确用户的喜好情况，所以向每位用户提供的服务都是基于最初的喜好函数，但是随着时间的推移和用户查询或选择服务次数增多，每位用户的喜好函数是不断变化的，并为用户提供不同的服务推荐。在特殊情况下，用户会直接表明需求，比如用户指定价格低等，在这种情况下，优先考虑用户需求，当出现同时符合用户需求的服务时，再按照喜好函数进行排序。基于步骤4的用户喜好模型设计快件物流服务个性化推荐算法，算法输入来自基于步骤3从知识图谱中查找的符合用户需求的服务集合，此外用户的登录状态和用户的特殊需求也影响着个性化推荐。

快件物流服务个性化推荐算法具体步骤如下：

第一步：对输入的服务集合中每一个服务的评分、时间和价格进行标准化处理和计算；

第二步：判断用户是否登录，若已经登录，获取用户喜好函数，若未登录，设置喜好函数权重值为1；

第三步：判断用户是否有特殊需求，若有，已登录和未登录的用户的用户需求对应的权重值*100，若没有，未登录用户根据喜好函数计算结果，已登录用户根据记忆曲线更新权重因子，并根据喜好函数计算结果；

第四步：根据结果对输入服务集合进行排序，推荐给用户；

第五步：用户选择后，更新喜好函数，算法结束。

本发明还提供一种基于知识图谱的快件物流服务语义提取方法的支撑工具。

支撑工具的功能模块主要为用户端、服务提供者端以及系统管理员端。

所述用户端负责处理用户所需服务的业务逻辑。基于知识图谱，用户可以进行服务查询、服务评分和服务选择，辅助功能为个人信息维护、登录和注册功能。

所述服务提供者端负责处理服务提供者的业务逻辑。服务提供者的主要功能为服务资源管理和订单管理功能，辅助功能为登录、注册和信息维护功能。

所述系统管理员端负责系统管理员的业务逻辑。主要功能为知识图谱管理、用户管理和服务提供者管理，其中知识图谱功能主要处理底层的知识图谱，包括模型和数据的录入、服务提供者申请的服务资源的审查和融合。

本发明的有益效果在于，通过更加人性化和个性化的方式向用户提供多样化的服务，人性化即用户可以使用自然语言表达自己的需求，不再完全局限于模板化的输入方式；个性化即本文会通过用户的过往使用记录，构建用户喜好函数和用户画像，从而达到即使同样的搜索条件，不同用户会得到不同顺序的服务推荐。通过对用户输入进行语义分析，获取用户的深层需求，与在知识图谱中对需求进行合理的匹配，根据不同用户的喜好为用户进行个性化服务推荐。

由此可见，本发明与现有技术相比，具有突出的实质性特点和显著地进步，其实施的有益效果也是显而易见的。

附图说明

图1是本发明提供的一种基于知识图谱的快件物流服务语义提取方法的流程图。

图2为本发明的基于知识图谱的语义搜索流程图。

图3为本发明的快件物流服务语义搜索算法流程图。

图4为本发明的快件物流服务个性化推荐算法流程图。

具体实施方式

下面结合附图并通过具体实施例对本发明进行详细阐述，以下实施例是对本发明的解释，而本发明并不局限于以下实施方式。

如图1-4所示，本实施例提供的一种基于知识图谱的快件物流服务语义提取方法，包括以下步骤：

S1：对用户输入的需求语句进行实体识别处理的步骤；

S2：对实体识别后的语句进行转换拼接处理的步骤；

S4：构建快件物流服务用户喜好模型的步骤；

S5：向用户推荐个性化物流服务的步骤。

所述步骤S1具体包括以下步骤：

所述步骤S2具体包括以下步骤：

第一步：抽取关键词

第二步：需求拼接

对用户的需求进行描述，如公式(1)所示：

N＝{P,f₁,…,f_m,A_start,A_end,C} (1)

其中，P代表用户想要运输的快件，为必需元素；f₁，...，f_m代表用户需要的服务流程，为非必需元素；A_start代表寄件位置，A_end

代表收件位置，为必需元素；C为用户的服务提供者要求，为非必需元素。用户需求可以表示为：

所述步骤S3具体包括：

所述的本体-实体映射分析具体步骤如下：

所述的服务搜索和扩展分析的具体步骤如下：

第三步：对找到的待选服务进行概念上升至本体并归类；

第七步：返回结果集，算法结束。

所述的步骤S4具备包括以下步骤：

在这里，使用了记忆曲线来更新w，定义如公式(4)所示：

其中，t代表喜好从建立日期到当前日期的时间差，以天为单位，f f＝7代表半衰期，表示f天后用户的喜好将遗忘一半，历史经验表明，当时，遗忘规律跟日常情况相符，此处可以简单设计为每隔7天，更新w为原值的一半。

所述步骤S5具体包括以下步骤：

快件物流服务个性化推荐算法具体步骤如下：

第四步：根据结果对输入服务集合进行排序，推荐给用户；

第五步：用户选择后，更新喜好函数，算法结束。

还提供一种基于知识图谱的快件物流服务语义提取方法的支撑工具。

以上公开的仅为本发明的优选实施方式，但本发明并非局限于此，任何本领域的技术人员能思之的没有创造性的变化，以及在不脱离本发明原理前提下所作的若干改进和润饰，都应落在本发明的保护范围内。

Claims

1.一种基于知识图谱的快件物流服务语义提取方法，其特征在于，包括以下步骤：

S1：对用户输入的需求语句进行实体识别处理的步骤；

需求信息包括用户对于所发物件信息表达的需求信息；

第一步，针对物流服务，从知识图谱中抽取服务名称，对服务名称先进行分词处理，并保存到领域词典中，该类词汇使用“lfw”来标识，若用户需求中存在该词汇，则会直接分割出来；

第二步，针对快件，在知识图谱中设置快件的标准名称和别名，需要将标准名称和别名添加到领域词典中，快件词汇使用“lcp”进行标识；

第三步，来自于服务提供者名称的词汇，服务提供者名称使用“lqy”进行标识；

S2：对实体识别后的语句进行转换拼接处理的步骤；

在用户的需求中，包括用户的快件需求，服务需求和服务提供者需求；

针对用户的快件需求，利用别名属性来转换，在知识图谱中对快件定义别名属性，使得不同表达的快件都能在知识图谱中找到对应，对于无法找到实体对应的快件，则需要询问用户，进而将可以进行转换的快件词汇转换到标准描述；

针对用户的服务需求和服务提供者需求，利用领域词典进行转换，以用户需求命名实体识别的结果为基础将分词处理后的词汇转换到标准的服务名称上，根据用户的需求动态的对领域词典进行更新；

S4：构建快件物流服务用户喜好模型的步骤；

S5：向用户推荐个性化物流服务的步骤。

2.根据权利要求1所述的一种基于知识图谱的快件物流服务语义提取方法，其特征在于，所述步骤S2中：

经过对用户的需求进行命名实体识别和需求转换，得到系列的词汇，然后对这些词汇进行抽取，具体步骤如下：

第一步：抽取关键词

将标识为“lcp”、“lfw”和“lqy”的词汇抽取出来，同时将其他词汇去除；“lcp”词汇为必需词汇，“lfw”和“lqy”词汇为非必需词汇，若用户没有输入需求或者用户需求中没有标识为“lcp”的词汇，则需要进一步询问用户，只有在获取到用户想要运输的快件信息后，才能进行后面的操作；将“lcp”词汇映射为快件信息，将“lfw”词汇映射为服务信息，将“lqy”词汇映射为服务提供者信息；

第二步：需求拼接

将模板信息和用户需求进行拼接，对用户的需求进行描述，如公式(1)所示：

N＝{P，f₁，...，f_m，A_start，A_end，C} (1)

其中，P代表用户想要运输的快件，为必需元素；f₁，...，f_m代表用户需要的服务流程，为非必需元素；A_start代表寄件位置，A_end代表收件位置，为必需元素；C为用户的服务提供者要求，为非必需元素。

3.根据权利要求2所述的一种基于知识图谱的快件物流服务语义提取方法，其特征在于，所述步骤S3中：

所述的本体-实体映射分析具体步骤如下：

本体-实体映射将得到的需求词汇映射到快件物流领域知识图谱的本体和实体上，以用户需求命名实体识别、转换和拼接为基础；直接映射用于处理用户服务、快件和服务提供者，快件和服务提供者直接在知识图谱中找到相应的实体；

所述的服务搜索和扩展分析的具体步骤如下：

第二步：判断用户需求是否包括服务提供者需求，若包括，则根据快件实体以该服务提供者实体为基础搜索适用的待选服务，若不包括，则根据快件实体以所有服务提供者实体为粒度寻找适用的待选服务；

第三步：对找到的待选服务进行概念上升至本体并归类；

第四步：判断待选服务本体是否为空，若为空，跳转至第七步，若不为空，依次选择待选服务本体；

第五步：判断待选服务本体与用户服务需求本体是否相同，若成立，则跳转到第六步，若不成立，删除该待选服务本体，跳转到第四步；

第六步：判断待选服务本体下待选服务和用户服务需求是否相同，若相同，则将用户需求替换为该待选服务，将该待选服务放入结果集，跳转到第四步，若不相同，删除该待选服务本体，跳转到第四步；

第七步：返回结果集，算法结束。

4.根据权利要求3所述的一种基于知识图谱的快件物流服务语义提取方法，其特征在于，所述的步骤S4具备包括以下步骤：

为标识用户的喜好情况，定义权重因子w，用户喜好函数定义公式(2)所示：

其中，K代表喜好集，k代表不同的喜好，在物流领域，k可简化为价格P、时间T和评分R；权重因子w_k初始值均设为1，当用户选择服务后，计算w_k，并更新w_k的值；w_k的计算公式如公式(3)所示：

其中s_k代表用户选择的服务该喜好的得分，L代表经过语义搜索得到的结果集，每隔一段时间，对权重w进行更新；

使用记忆曲线来更新w，定义如公式(4)所示：

其中，t代表喜好从建立日期到当前日期的时间差，以天为单位，f＝7代表半衰期，表示f天后用户的喜好将遗忘一半。

5.根据权利要求4所述的一种基于知识图谱的快件物流服务语义提取方法，其特征在于，所述步骤S5具体包括以下步骤：

第四步：根据结果对输入服务集合进行排序，推荐给用户；

第五步：用户选择后，更新喜好函数，算法结束。