CN114841233B - 路径解释方法、装置和计算机程序产品 - Google Patents

路径解释方法、装置和计算机程序产品 Download PDF

Info

Publication number
CN114841233B
CN114841233B CN202210289343.9A CN202210289343A CN114841233B CN 114841233 B CN114841233 B CN 114841233B CN 202210289343 A CN202210289343 A CN 202210289343A CN 114841233 B CN114841233 B CN 114841233B
Authority
CN
China
Prior art keywords
path
path sample
sample
model
interpreted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210289343.9A
Other languages
English (en)
Other versions
CN114841233A (zh
Inventor
王莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210289343.9A priority Critical patent/CN114841233B/zh
Publication of CN114841233A publication Critical patent/CN114841233A/zh
Application granted granted Critical
Publication of CN114841233B publication Critical patent/CN114841233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了路径解释方法、装置和计算机程序产品。路径解释方法包括:路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;利用第二模型对第一模型进行模型蒸馏,以获取表示路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取第二模型的系数,其中,第一模型是对路径样本集合中的路径样本进行预测的路径排序模型;进行加权计算以得到路径样本对中的特征的重要性得分;基于路径样本对中的特征的重要性得分,生成对待解释路径样本进行解释的解释信息,可以在一组召回的路径样本集合内构建样本对,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。

Description

路径解释方法、装置和计算机程序产品
技术领域
本公开涉及导航技术领域,具体涉及路径解释方法、装置和计算机程序产品。
背景技术
在用户使用例如导航app等具备地图导航功能的应用获得出行路径或者导航路径(简称路径)时,用户常常无法感知应用向其推荐某条路径的原因。因此,通过构建可解释模型,为用户提供用户可理解的路径推荐原因,成为导航领域需要解决的问题。
本公开发明人在对现有可解释模型进行分析时发现,目前的方案可以对单个样本进行解释,但无法比较不同样本的优势、劣势,而地图导航场景,通常推荐给用户的路径会有多条,需要比较不同路径,以获得相应路径的优势,因此,现有技术无法满足该场景的解释性需求。
发明内容
为了解决相关技术中的问题,本公开实施例提供路径解释方法、装置和计算机程序产品,可以基于路径样本对处理的方式去蒸馏路径样本排序模型,实现了基于路径对比的路径可解释性。
第一方面,本公开实施例中提供了一种路径解释方法,其中,所述方法包括:
通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;
利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;
基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;
基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
结合第一方面,本公开在第一方面的第一种实现方式中,所述路径样本被表示为包括路径信息、特征、作为所述第一模型对所述路径样本集合中的路径样本的预测结果的软目标和作为所述路径样本集合中的路径样本的原始标签的硬目标,
其中,所述方法还包括:
基于所述路径样本对中的待解释路径样本与另一路径样本的软目标和硬目标,并且基于所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,确定所述第二模型的模型损失以对所述第二模型进行优化。
结合第一方面,本公开在第一方面的第二种实现方式中,所述利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率并且获取所述第二模型的系数,包括:
通过所述第二模型的特征处理层对所述路径样本集合中的待解释路径样本的特征与另一路径样本的特征进行预设处理,以获取所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征;
通过所述第二模型的特征求差层对所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得所述路径样本对的特征差值;
通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果。
结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,包括:
通过预设预测处理方法对所述路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测,获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率。
结合第一方面的三种实现方式,本公开在第一方面的第四种实现方式中,所述基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:
基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率计算所述路径样本对的样本权重;
通过所述第二模型的系数乘以所述路径样本对的特征差值以获取所述路径样本对的特征的特征贡献值;
计算所述路径样本对的特征的特征贡献值的归一化因子;
基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分。
结合第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,所述基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:
对包括同一待解释路径样本与不同的另一路径样本的多个路径样本对中的特征的重要性得分进行求和以计算针对所述待解释路径样本的特征的重要性得分,
其中,所述基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,包括:
基于针对所述待解释路径样本的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
结合第一方面、第一方面的第二种实现方式至第五种实现方式任一项,本公开在第一方面的第六种实现方式中,所所述第二模型为逻辑回归模型或决策树模型。
结合第一方面、第一方面的第二种实现方式至第五种实现方式任一项,本公开在第一方面的第七种实现方式中,所述方法还包括:
从包括多个路径样本的路径样本集合中选择路径样本进行推荐;
将所推荐的路径样本作为待解释路径样本并且展示对所推荐的路径样本进行解释的解释信息。
第二方面,本公开实施例中提供了一种路径解释装置,其中,所述装置包括:
路径样本对获取模块,被配置为通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;
模型蒸馏模块,被配置为利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;
特征的重要性得分计算模块,被配置为基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;
解释信息生成模块,被配置为基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
本公开实施例提供的技术方案可以包括以下有益效果:
根据本公开实施例提供的技术方案,通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以在一组召回的路径样本集合内构建样本对,将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。因此,通过比较不同路径样本的优势、劣势,可以突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
根据本公开实施例提供的技术方案,通过所述路径样本被表示为包括路径信息、特征、作为所述第一模型对所述路径样本集合中的路径样本的预测结果的软目标和作为所述路径样本集合中的路径样本的原始标签的硬目标,其中,所述方法还包括:基于所述路径样本对中的待解释路径样本与另一路径样本的软目标和硬目标,并且基于所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,确定所述第二模型的模型损失以对所述第二模型进行优化,可以对用于构建基于路径对比的路径可解释性的第二模型进行优化,从而更准确地获得基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,通过所述利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率并且获取所述第二模型的系数,包括:通过所述第二模型的特征处理层对所述路径样本集合中的待解释路径样本的特征与另一路径样本的特征进行预设处理,以获取所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征;通过所述第二模型的特征求差层对所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得所述路径样本对的特征差值;通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,可以构建基于路径对比的路径可解释性的第二模型,从而更准确地获得基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,所述通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,包括:通过预设预测处理方法对所述路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测,获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,可以将待解释的路径样本与其他路径样本的差异进行对比,得到基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,通过所述基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率计算所述路径样本对的样本权重;通过所述第二模型的系数乘以所述路径样本对的特征差值以获取所述路径样本对的特征的特征贡献值;计算所述路径样本对的特征的特征贡献值的归一化因子;基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,可以将待解释的路径样本与其他路径样本的差异进行对比,得到基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,通过所述基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:对包括同一待解释路径样本与不同的另一路径样本的多个路径样本对中的特征的重要性得分进行求和以计算针对所述待解释路径样本的特征的重要性得分,其中,所述基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,包括:基于针对所述待解释路径样本的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,通过所述第二模型为逻辑回归模型或决策树模型,可以构建基于路径对比的路径可解释性的第二模型,从而更准确地获得基于路径对比的路径可解释性。
根据本公开实施例提供的技术方案,通过所述方法还包括:从包括多个路径样本的路径样本集合中选择路径样本进行推荐;将所推荐的路径样本作为待解释路径样本并且展示对所推荐的路径样本进行解释的解释信息,可以通过比较不同路径样本的优势、劣势,突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
根据本公开实施例提供的技术方案,通过路径样本对获取模块,被配置为通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;模型蒸馏模块,被配置为利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;特征的重要性得分计算模块,被配置为基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;解释信息生成模块,被配置为基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以在一组召回的路径样本集合内构建样本对,将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。因此,通过比较不同路径样本的优势、劣势,可以突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本公开一实施方式的路径解释方法的流程图;
图2示出根据本公开一实施方式的路径解释方法中构建示例性地第二模型并优化模型的示意图;
图3示出根据本公开一实施方式的路径解释方法进行路径解释的示例性示意图;
图4示出根据本公开一实施方式的路径解释装置的结构框图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的标签、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他标签、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的标签可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
在相关技术中,在进行路径可解释性分析时,目前可解释性分析方案都是对单个样本进行解释,无法比较不同样本的优势、劣势,因此无法突出在当前环境中所推荐的路径样本的优势,路径之间难以对比。
为了解决上述问题,本公开提出路径解释方法、装置和计算机程序产品。
图1示出根据本公开一实施方式的路径解释方法的流程图。如图1所示,路径解释方法包括步骤S101、S102、S103、S104。
在步骤S101中,通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对。
在步骤S102中,利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性。
在步骤S103中,基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分。
在步骤S104中,基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
在本公开的一个实施例中,路径规划召回处理指的是在对路径进行排序之前召回多个路径样本,召回的路径样本集合中任一路径样本可以作为待解释路径样本与另一路径样本组成路径样本对,以便于进行路径比对。
在本公开的一个实施例中,模型蒸馏指的是将复杂模型中的知识迁移到简单模型中去。其中,复杂模型可以被称作教师(teacher)模型,也就是本公开实施例中的第一模型,其为原始模型或集成模型等复杂的模型。其中,简单模型可以被称作学生(student)模型,也就是本公开实施例中的第二模型,其为结构相对简单的新模型。
在本公开的一个实施例中,第一模型指的是用于对所述路径样本集合中的路径样本进行预测的路径排序模型。由于本公开实施例的目的在于构建路径样本对,将待解释的路径与其他路径的差异进行对比,并将样本的对比结果进行融合,得到路径的解释性,因此,本公开实施例不对第一模型做出任何限制,任一种第一模型做出的排序结果均可以通过本公开实施例中提出的路径解释方法进行解释。
在本公开的一个实施例中,利用第二模型对第一模型进行模型蒸馏,以获取表示路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数。在本公开的一个实施例中,表示路径样本对中的待解释路径样本与另一路径样本的比较结果的概率指的是,在第二模型的输出得到的概率表示待解释路径样本好于另一路径样本的概率,其中当概率等于0.5时,表示两条路径一样好。在本公开的一个实施例中,第二模型对第一模型进行模型蒸馏的实现方式可以是使用逻辑回归模型去蒸馏线上的路径排序模型,得到的第二模型的模型系数代表第二模型的各个维度特征的重要性。
在本公开的一个实施例中,基于表示路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、第二模型的系数、以及路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分。这样进行的加权计算可以被认为是在得到可解释模型(第二模型)以及召回的样本对的比较结果概率后,进行的路径加权融合。路径加权融合的结果是计算出路径样本对中的特征的重要性得分。因此,在本公开的一个实施例中,可以基于路径样本对中的特征的重要性得分,生成对待解释路径样本进行解释的解释信息。例如,可以选择得分最高的特征作为解释路径的特征。在本公开的一个实施例中,路径样本的特征可以包括诸如eta(预计到达时间)、红绿灯、距离、高速等任何用户可以理解的特征。例如,选择得分最高的特征作为解释路径的特征可以是由于路径样本特征中eta的重要性得分相较于红绿灯、距离、高速的重要性得分高,因此将eta作为待解释路径的解释信息,即待解释路径相较于路径样本对中的其他路径eta较佳。
根据本公开实施例提供的技术方案,通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以在一组召回的路径样本集合内构建样本对,将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。因此,通过比较不同路径样本的优势、劣势,可以突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
在本公开的一个实施例中,所述路径样本被表示为包括路径信息、特征、作为所述第一模型对所述路径样本集合中的路径样本的预测结果的软目标(soft target)和作为所述路径样本集合中的路径样本的原始标签的硬目标(hard target),其中,所述方法还包括:基于所述路径样本对中的待解释路径样本与另一路径样本的软目标和硬目标,并且基于所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,确定所述第二模型的模型损失以对所述第二模型进行优化。
在本公开的一个实施例中,软目标(soft target)是指第一模型(路径排序模型)对路径样本集合中的路径样本进行预测的预测结果,例如,输出的得分。在本公开的一个实施例中,硬目标(hard target)是指路径样本集合中的路径样本的原始标签,例如,路径样本的实走覆盖率。实走覆盖率指的是实际出行路线覆盖路径样本的比率。
在本公开的一个实施例中,路径样本可以被表示为<route,feature,softtarget,hard target>的形式。其中,route指的是路径自身。feature指的是路径的特征,例如,eta、红绿灯、距离、高速等。soft target(软目标)的含义如上所述。hard targe(硬目标)的含义如上所述。
在本公开的一个实施例中,路径样本对<route_A,route_B>中的待解释路径样本route_A的soft target和hard target以及另一路径样本route_B的soft target和hardtarget被输入到第二模型的rank cost层,并且第二模型的预测结果也被输入到rank cost层,从而计算第二模型的模型损失,以优化第二模型。第二模型的损失函数可以使用ranknet loss。
根据本公开实施例提供的技术方案,通过所述路径样本被表示为包括路径信息、特征、作为所述第一模型对所述路径样本集合中的路径样本的预测结果的软目标和作为所述路径样本集合中的路径样本的原始标签的硬目标,其中,所述方法还包括:基于所述路径样本对中的待解释路径样本与另一路径样本的软目标和硬目标,并且基于所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,确定所述第二模型的模型损失以对所述第二模型进行优化,可以对用于构建基于路径对比的路径可解释性的第二模型进行优化,从而更准确地获得基于路径对比的路径可解释性。
在本公开的一个实施例中,步骤S102包括:通过所述第二模型的特征处理层对所述路径样本集合中的待解释路径样本的特征与另一路径样本的特征进行预设处理,以获取所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征;通过所述第二模型的特征求差层对所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得所述路径样本对的特征差值;通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果。
在本公开的一个实施例中,第二模型可以包括特征处理层、特征求差层和输出层。在本公开的一个实施例中,路径样本对<route_A,route_B>中的待解释路径样本route_A和另一路径样本route_B被输入到特征处理层以进行特征处理,即,预设处理。特征处理层可以对输入的路径样本的路径特征进行转化、截断、标准化等预设处理以获取到可以进行求差的经处理的特征。例如,在特征层面eta是以秒展示的,但是在实际使用的层面,用户看到的是分钟级别的eta。例如,route_A的eta是600秒,route_B的eta是610秒,但是用户在导航应用看到的eta都是10分钟。因此,需要进行对这样的特征进行特征转化。又例如,可以对route_A和route_B的高速距离/规划的距离进行标准化以便于后续处理进行特征的计算。又例如,如果为驾驶车辆的用户规划的路径的调头距离较短则会增加用户驾驶难度,但是如果调头距离在100m或者200m之外,则几乎没有驾驶难度,因此可以对调头距离特征进行截断。在本公开的一个实施例中,对路径特征进行的处理可以不限于以上处理,还可包括例如归一化之类的其他特征处理方式。
在本公开的一个实施例中,特征求差层构建路径样本对的样本特征的差值,例如,经处理的特征是标准化的特征有利于特征求差层进行路径特征的求差。
在本公开的一个实施例中,特征求差层求出的路径样本对的样本特征的差值可以作为输出层的输入。在本公开的一个实施例中,输出层可以是常用的简单线性模型。输出层的输出为路径样本对中的待解释路径样本与另一路径样本的比较结果。
根据本公开实施例提供的技术方案,通过所述利用第二模型对作为第一模型的用于对所述路径样本集合中的路径样本进行预测的路径排序模型进行模型蒸馏以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,包括:通过所述第二模型的特征处理层对所述路径样本集合中的待解释路径样本的特征与另一路径样本的特征进行预设处理,以获取所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征;通过所述第二模型的特征求差层对所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得所述路径样本对的特征差值;通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,可以构建基于路径对比的路径可解释性的第二模型,从而更准确地获得基于路径对比的路径可解释性。
在本公开的一个实施例中,所述通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,包括:通过预设预测处理方法对所述路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测,获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率。
在本公开的一个实施例中,第二模型还可以包括预测层,利用输出层输出的路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测。在本公开的一个实施例中,预测层可以采用sigmoid函数,输出0-1之间的值作为所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率。预测出概率表示路径样本对中的待解释路径样本好于另一路径样本的概率,其中当概率等于0.5时,表示两条路径一样好。在本公开的一个实施例中,预测层的功能可以包含在输出层中。
根据本公开实施例提供的技术方案,所述通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,包括:通过预设预测处理方法对所述路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测,获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,可以将待解释的路径样本与其他路径样本的差异进行对比,得到基于路径对比的路径可解释性。
以上对本公开实施例的路径解释方法做了初步描述,以下参照图2对第二模型的构建示例进行描述。
图2示出根据本公开一实施方式的路径解释方法中构建示例性地第二模型并优化模型的示意图。
如图2所示,路径样本对<route_A,route_B>中的待解释路径样本route_A和另一路径样本route_B被输入到特征处理层以进行特征处理,即,预设处理。特征处理层可以对输入的路径样本的路径特征进行转化、截断、标准化等预设处理以获取到可以进行求差的经处理的特征。特征求差层构建路径样本对的样本特征的差值,例如,经处理的特征是标准化的特征有利于特征求差层进行路径特征的求差。特征求差层求出的路径样本对的样本特征的差值可以作为输出层的输入。在本公开的一个实施例中,输出层可以是常用的简单线性模型。输出层的输出为路径样本对中的待解释路径样本与另一路径样本的比较结果。第二模型还可以包括预测层,利用输出层输出的路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测。在本公开的一个实施例中,预测层可以采用sigmoid函数,输出0-1之间的值作为所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率。预测出概率表示路径样本对中的待解释路径样本好于另一路径样本的概率,其中当概率等于0.5时,表示两条路径一样好。在本公开的一个实施例中,预测层的功能可以包含在输出层中。
如图2所示,路径样本对<route_A,route_B>中的待解释路径样本route_A的软目标和硬目标以及另一路径样本route_B的软目标和硬目标被输入到第二模型的rank cost层,并且第二模型的预测结果也被输入到rank cost层,从而计算第二模型的模型损失,以优化第二模型。第二模型的损失函数可以使用ranknet loss。在本公开的一个实施例中,使用第二模型去蒸馏线上的排序模型,得到的模型系数代表第二模型每个维度特征的重要性。
在本公开的一个实施例中,步骤S103包括:基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率计算所述路径样本对的样本权重;通过所述第二模型的系数乘以所述路径样本对的特征差值以获取所述路径样本对的特征的特征贡献值;计算所述路径样本对的特征的特征贡献值的归一化因子;基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分。
在本公开的一个实施例中,步骤S103就是路径加权融合的执行步骤。在执行路径加权融合时,需要计算路径样本对的样本权重、特征的特征贡献值、特征的特征贡献值的归一化因子,进而求得路径样本对的特征的重要性得分。
在本公开的一个实施例中,路径样本对的样本权重指的是为每个路径样本对定义一个权重s,该权重s与路径样本对中的待解释路径样本与另一路径样本的比较结果的概率p相关,其意义是,越难区分的样本对于可解释性而言越重要。例如,一个路径样本对i的样本权重s可以被定义为1-|[i-0.5]。pi为路径样本对i中的待解释路径样本与另一路径样本的比较结果的概率。
在本公开的一个实施例中,路径样本对的特征的特征贡献值指的是根据第二模型得到每个特征的贡献为w*x,其中w为例如逻辑回归模型的第二模型的系数,x表示路径样本对的特征差值。例如,路径样本对的特征差值可以是通过第二模型的特征求差层对待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得路径样本对的特征差值。
在本公开的一个实施例中,路径样本对的特征的特征贡献值的归一化因子用于保证路径样本对的特征的特征贡献值在不同召回路径样本之间的可加性。例如,路径样本对的特征的特征贡献值的归一化因子可以被定义为wi为例如逻辑回归模型的第二模型的系数,xji表示路径样本对i的特征j特征差值。
在本公开的一个实施例中,路径样本对的特征的重要性得分为路径样本对的样本权重、路径样本对的特征的特征贡献值和路径样本对的特征的特征贡献值的归一化因子相乘所得的值。路径样本对的多个特征中重要性得分最高的特征作为解释待解释路径的特征。
根据本公开实施例提供的技术方案,通过所述基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率计算所述路径样本对的样本权重;通过所述第二模型的系数乘以所述路径样本对的特征差值以获取所述路径样本对的特征的特征贡献值;计算所述路径样本对的特征的特征贡献值的归一化因子;基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,可以将待解释的路径样本与其他路径样本的差异进行对比,得到基于路径对比的路径可解释性。
在本公开的一个实施例中,所述基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:对包括同一待解释路径样本与不同的另一路径样本的多个路径样本对中的特征的重要性得分进行求和以计算针对所述待解释路径样本的特征的重要性得分,其中,所述基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,包括:基于针对所述待解释路径样本的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
在本公开的一个实施例中,在路径样本集合中获取包括待解释路径样本的路径样本对时,可以获取多个包括同一待解释路径样本的路径样本对,这些路径样本对包括同一解释路径样本和不同的其他路径样本。在计算待解释路径的可解释性时,可以对针对多个包括同一待解释路径样本的路径样本对计算出的特征的重要性得分进行加权计算以更准确地获取待解释路径样本的可解释性。
例如,在计算路径样本route_1(简写为r1)的可解释性(假设只包含eta、红绿灯、距离、高速4个特征)的时候,假如在路径样本集合中包括召回的4条路径:route_1(简写为r1)、route_2(简写为r2)、route_3(简写为r3)和route_4(简写为r4),则存在3个路径样本对<r1,r2>、<r1,r3>和<r1,r4>。为了计算r1的可解释性,首先根据3个路径样本对的样本权重、特征的特征贡献值和特征的特征贡献值的归一化因子可以得到每个路径样本对的eta重要性得分(红绿灯重要性得分、距离重要性得分、高速重要性得分)。接下来,将3个路径样本对的eta重要性得分进行求和,则得到eta的重要性得分,即,在该路径样本集合中r1的eta的重要性得分。基于类似的计算方式,可得到红绿灯重要性得分、距离重要性得分、高速重要性得分。对计算出的eta的重要性得分、红绿灯重要性得分、距离重要性得分、高速重要性得分进行比较,选取可解释性得分最高的特征(因素)作为路径样本r1的解释。
以下以表1为例描述对4个路径样本构成的3个路径样本对<r1,r2>、<r1,r3>和<r1,r4>进行特征的重要性得分计算的方式。
表1
从表1可见,每个路径样本对的eta的重要性得分等于该路径样本对的eta特征贡献值*eta样本权重*eta特征贡献值的归一化因子,并且在该路径样本集合中待解释路径样本r1的eta重要性得分为针对3个路径样本对<r1,r2>、<r1,r3>和<r1,r4>计算出的eta的重要性得分0.2、1.4和0.8的和2.4。
在以上示例中,还可以参照以上表1的方式,类似地基于3个路径样本对<r1,r2>、<r1,r3>和<r1,r4>计算出在该路径样本集合中待解释路径样本r1的红绿灯重要性得分、距离重要性得分、高速重要性得分。例如,如果计算出的待解释路径样本r1的红绿灯重要性得分为1.4,距离重要性得分为2.0,高速重要性得分为1.6,则可以选择eta的重要性得分2.4作为对待解释路径样本r1进行解释的解释因素。例如,可以基于eta的重要性得分2.4将路径样本r1解释为eta较短(用时短)。
根据本公开实施例提供的技术方案,通过所述基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:对包括同一待解释路径样本与不同的另一路径样本的多个路径样本对中的特征的重要性得分进行求和以计算针对所述待解释路径样本的特征的重要性得分,其中,所述基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,包括:基于针对所述待解释路径样本的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。
在本公开的一个实施例中,所述第二模型为逻辑回归模型或决策树模型。
根据本公开实施例提供的技术方案,通过所述第二模型为逻辑回归模型或决策树模型,可以构建基于路径对比的路径可解释性的第二模型,从而更准确地获得基于路径对比的路径可解释性。
在本公开的一个实施例中,路径解释方法还包括:从包括多个路径样本的路径样本集合中选择路径样本进行推荐;将所推荐的路径样本作为待解释路径样本并且展示对所推荐的路径样本进行解释的解释信息。
根据本公开实施例提供的技术方案,通过所述方法还包括:从包括多个路径样本的路径样本集合中选择路径样本进行推荐;将所推荐的路径样本作为待解释路径样本并且展示对所推荐的路径样本进行解释的解释信息,可以通过比较不同路径样本的优势、劣势,突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
以下参照图3描述在用户端展示对所推荐的路径样本进行解释的解释信息的示例性界面。
图3示出根据本公开一实施方式的路径解释方法进行路径解释的示例性示意图。
如图3所示,用户终端300上的导航应用界面300推荐了两条推荐路径320和330。在导航应用界面300的下端示出了两条推荐路径320和330各自的信息细节。其中,示出了路径320的解释信息部分321“用时短大路多”和路径330的解释信息部分331“拥堵少大路少”。从图3可见,路径320的解释信息部分321和路径330的解释信息部分331均包括两个特征的解释信息。即,本公开实施例中,对所推荐的路径样本进行解释的解释信息可以包括基于多个特征的解释信息,而不限于基于一个特征的解释信息。另外,路径320的解释信息部分321和路径330的解释信息部分331中的解释信息中所表现的路径320的特征和路径330的特征并不相同。因此,在同一路径样本集合中,将路径320作为待解释路径所得到的解释信息与将路径330作为待解释路径所得到的解释信息可以不同。
在在本公开的实施例中,路径样本对也可以被称为路径对样本,即,将两个路径构成一对作为一个样本,这区别于相关技术中对单个样本(例如单个路径作为样本)进行解释的方案。
本公开的实施例中,通过构建路径样本对进行比对的方式,在一组召回(路径样本集合)内构建路径样本对,将待解释的路径与其他路径的差异进行对比,并将样本的对比结果进行融合,得到待解释的路径的解释性。例如,在一组召回中包含4条路径A、B、C、D,且A为排在首条的路径,通过构建路径的路径样本对<A,B>,<A,C>,<A,D>,使用第二模型、并对3个路径样本对的结果进行融合,则得到路径A相比于路径B、C、D的优势特征,这就是路径A的解释性,从而解决了对路径对比进行解释的问题。
以下参照图4描述根据本公开一实施方式的路径解释装置。图4示出根据本公开一实施方式的路径解释装置400的结构框图。
如图4所示,路径解释装置400包括:
路径样本对获取模块401,被配置为通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;
模型蒸馏模块402,被配置为利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;
特征的重要性得分计算模块403,被配置为基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;
解释信息生成模块404,被配置为基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
根据本公开实施例提供的技术方案,通过路径样本对获取模块,被配置为通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;模型蒸馏模块,被配置为利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;特征的重要性得分计算模块,被配置为基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;解释信息生成模块,被配置为基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,可以在一组召回的路径样本集合内构建样本对,将待解释的路径样本与其他路径样本的差异进行对比,并将样本的对比结果进行融合,得到基于路径对比的路径可解释性。因此,通过比较不同路径样本的优势、劣势,可以突出在当前环境中的待解释的路径相较于其他路径的优势特征,解决了对路径对比进行解释的问题。
本领域技术人员可以理解,参照图4描述的技术方案的可以与参照图1至图3描述的实施例结合,从而具备参照图1至图3描述的实施例所实现的技术效果。具体内容可以参照以上根据图1至图3进行的描述,其具体内容在此不再赘述。
特别地,根据本公开的实施方式,上文参考附图描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现参照附图描述的方法。计算机程序产品包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行附图中的方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。例如,本公开的实施方式包括一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现用于执行附图中的方法的程序代码。
附图中的流程图和框图,图示了按照本公开各种实施方式的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述节点中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种路径解释方法,其中,所述方法包括:
通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对:
利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;
基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;
基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
2.根据权利要求1所述的方法,其中,所述路径样本被表示为包括路径信息、特征、作为所述第一模型对所述路径样本集合中的路径样本的预测结果的软目标和作为所述路径样本集合中的路径样本的原始标签的硬目标,
其中,所述方法还包括:
基于所述路径样本对中的待解释路径样本与另一路径样本的软目标和硬目标,并且基于所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,确定所述第二模型的模型损失以对所述第二模型进行优化。
3.根据权利要求1所述的方法,其中,所述利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率并且获取所述第二模型的系数,包括:
通过所述第二模型的特征处理层对所述路径样本集合中的待解释路径样本的特征与另一路径样本的特征进行预设处理,以获取所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征;
通过所述第二模型的特征求差层对所述待解释路径样本的经处理的特征与另一路径样本的经处理的特征求差以获得所述路径样本对的特征差值;
通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果。
4.根据权利要求3所述的方法,其中,所述通过所述第二模型的输出层接收所述路径样本对的特征差值作为输入,输出所述路径样本对中的待解释路径样本与另一路径样本的比较结果,包括:
通过预设预测处理方法对所述路径样本对中的待解释路径样本与另一路径样本的比较结果进行预测,获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率。
5.根据权利要求4所述的方法,其中,所述基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:
基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率计算所述路径样本对的样本权重;
通过所述第二模型的系数乘以所述路径样本对的特征差值以获取所述路径样本对的特征的特征贡献值;
计算所述路径样本对的特征的特征贡献值的归一化因子;
基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分。
6.根据权利要求5所述的方法,其中,所述基于所述路径样本对的样本权重、所述路径样本对的特征的特征贡献值和所述路径样本对的特征的特征贡献值的归一化因子,进行加权计算以得到所述路径样本对中的特征的重要性得分,包括:
对包括同一待解释路径样本与不同的另一路径样本的多个路径样本对中的特征的重要性得分进行求和以计算针对所述待解释路径样本的特征的重要性得分,
其中,所述基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息,包括:
基于针对所述待解释路径样本的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
7.根据权利要求1至6任一项所述的方法,其中,所述第二模型为逻辑回归模型或决策树模型。
8.根据权利要求1至6任一项所述的方法,其中,所述方法还包括:
从包括多个路径样本的路径样本集合中选择路径样本进行推荐;
将所推荐的路径样本作为待解释路径样本并且展示对所推荐的路径样本进行解释的解释信息。
9.一种路径解释装置,其中,所述装置包括:
路径样本对获取模块,被配置为通过路径规划召回处理,获取包括多个路径样本的路径样本集合,从而获取包括待解释路径样本的路径样本对;
模型蒸馏模块,被配置为利用第二模型对第一模型进行模型蒸馏,以获取表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率,并且获取所述第二模型的系数,其中,所述第一模型是对所述路径样本集合中的路径样本进行预测的路径排序模型,所述第二模型的系数表示所述第二模型的各个维度特征的重要性;
特征的重要性得分计算模块,被配置为基于表示所述路径样本对中的待解释路径样本与另一路径样本的比较结果的概率、所述第二模型的系数、以及所述路径样本对中的待解释路径样本与另一路径样本的特征,进行加权计算以得到所述路径样本对中的特征的重要性得分;
解释信息生成模块,被配置为基于所述路径样本对中的特征的重要性得分,生成对所述待解释路径样本进行解释的解释信息。
10.一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如权利要求1-8任一项所述的方法。
CN202210289343.9A 2022-03-22 2022-03-22 路径解释方法、装置和计算机程序产品 Active CN114841233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210289343.9A CN114841233B (zh) 2022-03-22 2022-03-22 路径解释方法、装置和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210289343.9A CN114841233B (zh) 2022-03-22 2022-03-22 路径解释方法、装置和计算机程序产品

Publications (2)

Publication Number Publication Date
CN114841233A CN114841233A (zh) 2022-08-02
CN114841233B true CN114841233B (zh) 2024-05-31

Family

ID=82561444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210289343.9A Active CN114841233B (zh) 2022-03-22 2022-03-22 路径解释方法、装置和计算机程序产品

Country Status (1)

Country Link
CN (1) CN114841233B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110139A (zh) * 2019-04-19 2019-08-09 北京奇艺世纪科技有限公司 一种对推荐结果进行解释的方法、装置及电子设备
WO2019223384A1 (zh) * 2018-05-21 2019-11-28 阿里巴巴集团控股有限公司 Gbdt模型的特征解释方法和装置
CN111753995A (zh) * 2020-06-23 2020-10-09 华东师范大学 一种基于梯度提升树的局部可解释方法
CN111931801A (zh) * 2020-05-28 2020-11-13 浙江大学 一种基于路径多样性与一致性的动态路由网络学习方法
CN112325899A (zh) * 2020-10-30 2021-02-05 腾讯科技(深圳)有限公司 一种路径展示方法和相关装置
CN112861933A (zh) * 2021-01-22 2021-05-28 中国科学院信息工程研究所 一种深度神经网络模型可视化解释方法及系统
CN112966744A (zh) * 2021-03-08 2021-06-15 北京百度网讯科技有限公司 模型训练方法、图像处理方法、装置和电子设备
CN113837308A (zh) * 2021-09-29 2021-12-24 北京百度网讯科技有限公司 基于知识蒸馏的模型训练方法、装置、电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11645523B2 (en) * 2020-02-20 2023-05-09 Adobe Inc. Generating explanatory paths for predicted column annotations
CA3128664A1 (en) * 2020-08-19 2022-02-19 Royal Bank Of Canada System and method for cascading decision trees for explainable reinforcement learning

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019223384A1 (zh) * 2018-05-21 2019-11-28 阿里巴巴集团控股有限公司 Gbdt模型的特征解释方法和装置
CN110110139A (zh) * 2019-04-19 2019-08-09 北京奇艺世纪科技有限公司 一种对推荐结果进行解释的方法、装置及电子设备
CN111931801A (zh) * 2020-05-28 2020-11-13 浙江大学 一种基于路径多样性与一致性的动态路由网络学习方法
CN111753995A (zh) * 2020-06-23 2020-10-09 华东师范大学 一种基于梯度提升树的局部可解释方法
CN112325899A (zh) * 2020-10-30 2021-02-05 腾讯科技(深圳)有限公司 一种路径展示方法和相关装置
CN112861933A (zh) * 2021-01-22 2021-05-28 中国科学院信息工程研究所 一种深度神经网络模型可视化解释方法及系统
CN112966744A (zh) * 2021-03-08 2021-06-15 北京百度网讯科技有限公司 模型训练方法、图像处理方法、装置和电子设备
CN113837308A (zh) * 2021-09-29 2021-12-24 北京百度网讯科技有限公司 基于知识蒸馏的模型训练方法、装置、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于解释图的概率多规划识别事故分析方法研究;朱珂;周科平;;中国安全生产科学技术;20161030(10);全文 *

Also Published As

Publication number Publication date
CN114841233A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN108665064B (zh) 神经网络模型训练、对象推荐方法及装置
CN111046275B (zh) 基于人工智能的用户标签确定方法及装置、存储介质
CN112766607A (zh) 出行路线的推荐方法、装置、电子设备及可读存储介质
CN111667693B (zh) 用于确定预计到达时间的方法、装置、设备及介质
CN111899061B (zh) 订单推荐方法、装置、设备及存储介质
CN111737826B (zh) 一种基于增强学习的轨道交通自动仿真建模方法及装置
CN112884235A (zh) 出行推荐方法、出行推荐模型的训练方法、装置
CN111159242B (zh) 一种基于边缘计算的客户端重排序方法及系统
CN112256957B (zh) 一种信息排序方法、装置、电子设备及存储介质
CN114841233B (zh) 路径解释方法、装置和计算机程序产品
CN115114329A (zh) 数据流异常检测的方法、装置、电子设备和存储介质
CN111782774B (zh) 一种问题推荐的方法及装置
CN113741459B (zh) 确定训练样本的方法和自动驾驶模型的训练方法、装置
CN114510629A (zh) 基于大数据挖掘的数字化医疗推送优化方法及医疗ai系统
CN114443986A (zh) 排序方法及装置,排序模型训练方法及装置,电子设备
Ajani et al. Dynamic path planning approaches based on artificial intelligence and machine learning
CN111489024B (zh) 出行方案推荐方法、装置、设备及存储介质
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品
CN115409168A (zh) 神经网络优化方法及其装置
CN111831927B (zh) 信息推送装置、方法、电子设备和计算机可读存储介质
US11651261B2 (en) Hyperdimensional simultaneous belief fusion using tensors
CN112100523B (zh) 基于环境信息的兴趣点排序方法及装置、电子设备和介质
CN115878894A (zh) 对象推荐属性确定方法、装置、电子设备及程序产品
CN117909740A (zh) 一种轨迹预测方法、装置、设备及存储介质
CN116738199A (zh) 特征的筛选方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant