CN113807681B - 轨道交通车辆用户需求匹配方法、计算机产品、存储介质 - Google Patents
轨道交通车辆用户需求匹配方法、计算机产品、存储介质 Download PDFInfo
- Publication number
- CN113807681B CN113807681B CN202111024410.6A CN202111024410A CN113807681B CN 113807681 B CN113807681 B CN 113807681B CN 202111024410 A CN202111024410 A CN 202111024410A CN 113807681 B CN113807681 B CN 113807681B
- Authority
- CN
- China
- Prior art keywords
- urban rail
- rail vehicle
- vehicles
- similarity
- rail vehicles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000003860 storage Methods 0.000 title claims abstract description 7
- 238000012163 sequencing technique Methods 0.000 claims abstract description 3
- 239000013598 vector Substances 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 abstract description 15
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种轨道交通车辆用户需求匹配方法、计算机产品、存储介质,计算当前用户需要的城轨车辆与已设计好的各个城轨车辆之间的相似度,将已设计好的城轨车辆按照相似度的大小排序,形成推荐列表。本发明的方法可以从城轨车辆用户需求书、城轨车辆招标书、城轨车辆产品设计说明书等文档中获取用户需求,并充分利用已有的产品设计资源,在已有产品设计方案与用户需求间进行匹配,向用户或设计人员提供建议的产品设计方案。
Description
技术领域
本发明涉及轨道交通技术领域,特别是一种轨道交通车辆用户需求匹配方法、计算机装置及产品、存储介质。
背景技术
城市轨道交通车辆相关产品的研发设计通常会受到应用地自然环境、使用条件、线路参数、供电制式、限界、载客能力、车辆型式、编组、三防要求、与各个系统接口等几十种因素的影响,整车及各个系统的设计过程相当复杂。而当前城轨车辆行业的用户需求分析,基本完全依赖于人工进行,易受设计人员工作经验、个人工作态度及专业知识精通程度等多重因素影响,通常会存在无法一次性准确理解用户产品需求等问题。例如,设计或选型出来的产品无法满足运营当地的温湿度等条件,导致需要增加与客户的交流频次,甚至车辆完成生产后需要进行大量设计变更,造成物料、人工的浪费,给企业带来经济损失和名声损害。
另一方面,当前轨道交通产品的设计与制造,呈现出“可见即可得”的信息化和“全寿命周期整套解决方案”的服务化两大趋势,由此衍生出产品与用户需求如何高效匹配的需求。用户对产品的功能、性能需求,需要在产品招标和设计联络过程中通过各种途径,以显式或者隐式的方式不断澄清和明确,由此将会产生海量的用户需求数据。因此,如何从这些数据中获取用户潜在需求,并充分利用已有的产品设计资源,为用户高质量地提供符合其显性和隐性需求的产品解决方案、提高用户满意度,是目前轨道交通领域亟待解决的关键问题。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种轨道交通车辆用户需求匹配方法、计算机产品、存储介质,实现城轨车辆的智能产品需求分析和推荐。
为解决上述技术问题,本发明所采用的技术方案是:一种轨道交通车辆用户需求匹配方法,包括以下步骤:计算当前用户需要的城轨车辆与已设计好的各个城轨车辆之间的相似度,将已设计好的城轨车辆按照相似度的大小排序,形成推荐列表。
本发明通过计算城轨车辆间的相似度,并根据相似度形成推荐列表,从而可以根据城轨车辆用户需求书、城轨车辆招标书、城轨车辆产品设计说明书等文档中用户对产品的功能、性能等需求,在已有产品设计方案与用户需求间进行匹配,向用户或设计人员提供建议的产品设计方案。
步骤S1中,利用下式计算两个城轨车辆SWi和SWj之间的相似度:
其中,α、β、γ和δ是满足等式α+β+γ+δ=1的权重系数;
vswi和vswj分别表示描述两个城轨车辆SWi和SWj的段落向量;
simp1(i,j)=Ci,j p1,T/max(Ci,i p1,T,Cj,j p1,T);
simp2(i,j)=Ci,j p2,A/max(Ci,i p2,A,Cj,j p2,A);
simp3(i,j)=Ci,j p3,D/max(Ci,i p3,D,Cj,j p3,D);
vi T和vj T分别是城轨车辆SWi和SWj在主要技术指标上的两个特征向量;(vj T)t是特征向量vj T的转置;vi A和vi D分别表示城轨车辆SWi与所涉及的使用条件之间的关系的特征向量、城轨车辆SWi与子部件对象之间的关系的特征向量;表示城轨车辆SWj与所涉及的使用条件之间的关系的特征向量、城轨车辆SWj与子部件对象之间的关系的特征向量。
本发明考虑城轨车辆的主要技术指标、使用条件、子部件对象等因素,为城轨车辆间相似度提供了准确的计算公式,可以客观、准确地计算出两个城轨车辆间的相似度,为用户需求匹配提供了客观的衡量标准。
对于实施中的数据准备过程,本发明描述两个城轨车辆SWi和SWj的段落向量vswi和vswj的获取过程包括:
1)将所有城轨车辆以及使用条件设置编号,并将城轨车辆或使用条件的编号和自然环境描述文本组成一行保存至语料文件;
2)对所述语料文件进行预处理;
3)将预处理后的语料文件作为词向量模型的输入,训练所述词向量模型,得到训练好的词向量模型;
4)将两个城轨车辆的任意两段文本输入训练好的词向量模型,得到这两段文本对应的段落向量vswi和vswj;其中,所述文本是指主要技术指标、使用条件和自然环境描述文本。
步骤2)的具体实现过程包括:去除语料文件中的非字母符号,并将字母符号统一为英文小写,得到第一预处理文件;对第一预处理文件进行分词,得到第二预处理文件;将第二预处理文件中自然环境描述文本中的动词时态转换成一般时态,名词转换为单数形式,得到第三预处理文件;去除第三预处理文件中的停用词,得到预处理后的语料文件。
对于实施中的用户需求分析与匹配过程,本发明提供了一种城轨车辆间的相似度计算方法,以提升匹配效果:
步骤S1中,两个城轨车辆SWi和SWj之间的相似度的计算过程包括以下步骤:
S11、构造城轨车辆的三个邻接矩阵;其中,
第一邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆的主要技术指标;
第二邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆使用条件;
第三邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆的子系统或子部件;
S12、利用所述三个邻接矩阵计算两个城轨车辆在元路径上的相似强度,利用所述相似强度计算两个城轨车辆相对于元路径的相似性;
其中,两个城轨车辆在元路径p1上的相似强度Ci,j p1,T的计算公式为:vi T和vj T别是城轨车辆SWi和SWj在主要技术指标上的两个特征向量;
两个城轨车辆在元路径p2上的相似强度Ci,j p2,A的计算公式为:vi A和vi D分别表示城轨车辆SWi与所涉及的使用条件之间的关系的特征向量、城轨车辆SWi与子部件对象之间的关系的特征向量;
两个城轨车辆在元路径p3上的相似强度Ci,j p3,D的计算公式为: 表示城轨车辆SWj与所涉及的使用条件之间的关系的特征向量、城轨车辆SWj与子部件之间的关系的特征向量;
城轨车辆SWi和SWj相对于元路径p1的相似性simp1(i,j)的表达式为:
simp1(i,j)=Ci,j p1,T/max(Ci,i p1,T,Cj,j p1,T);
城轨车辆SWi和SWj相对于元路径p2上的相似度simp2(i,j)的表达式为:
simp2(i,j)=Ci,j p2,A/max(Ci,i p2,A,Cj,j p2,A);
城轨车辆SWi和SWj相对于元路径p3上的相似度simp3(i,j)的表达式为:
simp3(i,j)=Ci,j p3,D/max(Ci,i p3,D,Cj,j p3,D);
元路径p1是指:若一个主要技术指标被两个城轨车辆sw1和sw2共享,则使用元路径swTsw,即:城轨车辆-主要技术指标-城轨车辆,表示sw1和sw2之间的关联;
元路径p2是指:若一个使用条件由两个城轨车辆sw1和sw2共享,则使用元路径swAsw,即:城轨车辆-使用条件-城轨车辆,表示sw1和sw2之间的关联;
元路径p3是指:若一个子系统或子部件由两个城轨车辆sw1和sw2共享,则使用元路径swDsw,即城轨车辆-子系统或子部件-城轨车辆,表示sw1和sw2之间的关联。
对于实施中的推荐列表,为了简化推荐结果,本发明选择相似度最高的设计好的城轨车辆作为推荐车辆;或者选择相似度值超过设定阈值对应的城轨车辆作为推荐车辆;或者选择相似度值最高的前K个值对应的城轨车辆作为推荐车辆。
作为同一发明构思,本发明还提供了一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本发明用户需求匹配方法的步骤。
作为同一发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明用户需求匹配方法的步骤。
作为同一发明构思,本发明还提供了一种计算机程序产品,包括计算机程序/指令;该计算机程序/指令被处理器执行时实现本发明用户需求匹配方法的步骤。
与现有技术相比,本发明所具有的有益效果为:本发明的方法可以从海量用户需求数据数据中获取用户潜在需求,并充分利用已有的产品设计资源,为用户提供符合其显性和隐性需求的产品解决方案、提高用户满意度。
附图说明
图1为本发明实施例城轨车辆基本描述结构图;
图2为本发明实施例基于城轨车辆表示的元路径示意图;
图3为本发明实施例城轨车辆间关系描述示例图;
图4为本发明实施例中城轨车辆主要技术指标描述数据的表示图例。
具体实施方式
以下先介绍本发明涉及的相关概念及定义。
定义1(基于异构信息网络的城轨车辆表示)城轨车辆可以被组织和表示为一个异构信息网络,它包含五种对象类型:城轨车辆(sw)、主要技术指标(T)、使用条件(A)、子系统或子部件(D)和自然环境(dsc)。每个城轨车辆都可以与一组主要技术指标、一组使用条件、一组子系统或子部件和一个自然环境描述相链接。
如图1所示,有五种类型的对象:城轨车辆(sw)、主要技术指标(T)、使用条件(A)、子系统或子部件(D)和自然环境(dsc)。此外,对象之间存在四种类型的链接来表示不同的关系:
(1)城轨车辆和自然环境之间的链接关系。(链接关系与特征向量vi T的确定方法相似,城轨车辆的所有相关自然环境数据可描述为一个集合,其中,某城轨车辆能适应的自然环境数据,则相应描述为1,反之为0;这些数据在车辆的需求说明书或使用说明书或配置表中均可获取,以下提到的链接关系获取过程类似)。
(2)城轨车辆和使用条件之间的链接关系。
(3)城轨车辆和主要技术指标之间的链接关系。这种链接关系是单向的,因为特定的主要技术指标属于特定的城轨车辆。
(4)城轨车辆和子系统或子部件之间的链接关系。这种链接关系是单向的,因为特定的子系统或子部件属于特定的城轨车辆。
定义2(元路径)基于城轨车辆的表示,可以构造四种类型的元路径,如图2所示:
(1)元路径p1:如果一个主要技术指标被两个城轨车辆sw1和sw2共享,我们可以使用元路径swTsw(城轨车辆-主要技术指标-城轨车辆)来表示sw1和sw2之间的关联。
(2)元路径p2:如果一个使用条件由两个城轨车辆sw1和sw2共享,我们可以使用元路径swAsw(城轨车辆-使用条件-城轨车辆)表示sw1和sw2之间的关联。
(3)元路径p3:如果一个子系统或子部件由两个城轨车辆sw1和sw2共享,我们可以使用元路径swDsw(城轨车辆-子系统或子部件-城轨车辆)来表示sw1和sw2之间的关联。
(4)元路径p4:如果一个自然环境描述由两个城轨车辆sw1和sw2共享,那么我们可以使用元路径swdscsw(城轨车辆-自然环境描述文本-城轨车辆)在描述上建立sw1和sw2之间的关联。
图1给出了基于城轨车辆表示的元路径示意,图2给出了两个城轨车辆(A型车、B型车)的表示及它们之间关系的表示示意。
在上述基本定义的基础上,本发明实施例提出一种城轨车辆间的相似度计算方法,主要包括以下步骤。
步骤1:在主要技术指标、使用条件和子系统或子部件对象上构造三个邻接矩阵。
根据城轨车辆中涉及的主要技术指标、使用条件和子系统或子部件对象,可以构造三个邻接矩阵,分别表示为SWT、SWA和SWD,其中邻接矩阵的一行对应于一个特定的城轨车辆。邻接矩阵SWT、SWA和SWD的一列分别对应于主要技术指标、使用条件和子系统或子部件对象。这三个邻接矩阵中的值可以是1或0,表示特定对象是否属于特定的城轨车辆。
此外,为了便于计算,本发明使用特征向量vi T来表示城轨车辆SWi与所有标签对象之间的关系,这些对象对应于相邻矩阵SWT中的一行。同样,本发明使用特征向量vi A和vi D来表示城轨车辆SWi与所涉及的使用条件和子城轨车辆对象之间的关系,它们分别对应于SWA和SWD的相邻矩阵中的一行。
步骤2:计算元路径上的相似性。
如前所述,存在四种类型的元路径。因此,元路径p1上SWi和SWj的相似强度可由下式计算:
在式(1)中,vi T和vj T别是城轨车辆SWi和SWj在主要技术指标上的两个特征向量。(vj T)t是特征向量vj T的转置。SWi和SWj之间的公共标签数量越大,vi T和(vj T)t的内积就越大,因此标签上SWi和SWj之间的相似性就越大。
特征向量vi T的确定方法及表示示例如下,由图4可知,城轨车辆的所有主要技术指标数据可描述为|T|,而一个特定的城轨车辆可能只具备其中的一些主要技术指标,对应的列描述上数据表示为1,而不具备的则在其对应的列描述上数据表示为0。
特征向量vi A和vi D的确定方法与特征向量vi T的确定方法类似。
同样,SWi和SWj在元路径p2和p3上的相似强度可分别通过式(2)和(3)获得,其中符号的含义与式(1)中的符号含义相似:
根据式(1),本发明还可以得到Ci,i p1,T和Cj,j p1,T的值。为了有效地规一化相似强度,我们利用Ci,j p1,T分别与Ci,i p1,T和Cj,j p1,T比值中的最大值来表示城轨车辆SWi和SWj相对于元路径p1的相似性,其描述如下公式(4):
simp1(i,j)=Ci,j p1,T/max(Ci,i p1,T,Cj,j p1,T) (4)
同样地,城轨车辆SWi和SWj元路径p2和p3上的相似度描述如下:
simp2(i,j)=Ci,j p2,A/max(Ci,i p2,A,Cj,j p2,A) (5)
simp3(i,j)=Ci,j p3,D/max(Ci,i p3,D,Cj,j p3,D) (6)
步骤3:计算主要技术指标、使用条件和自然环境描述文本的相似度值。
Doc2vec模型可以从可变长度文本中学习固定长度特征。因此,本发明利用Doc2vec模型,分别构造段落向量vswi和vswj来描述城轨车辆SWi和SWj。另外,vswi和vswj之间的规一化余弦相似度计算为城轨车辆SWi和SWj描述的相似值,其计算步骤与公式如下:
(1)构建语料库,提取所有主要技术指标、使用条件和自然环境描述文本用于构建语料库(由多个语料文件构成),我们将所有城轨车辆以及使用条件设置编号,并将城轨车辆或使用条件的编号和功能性描述文本组成一行保存至CSV文件(此文件用作语料文件)。
(2)去除语料文字中的非字母符号,并小写化字母符号。
(3)分词,将语料中的所有语句进行分词。
(4)词干化,将所有主要技术指标、使用条件和自然环境描述文本中的动词时态转换成一般时态,而名词则转换为单数形式。
(5)去停用词,将语料库中停用词去除,例如,“的、地、得”等。
(6)模型训练,将进行预处理后的语料(CSV文件)输入Doc2vec模型进行训练,我们可以得到训练好的Doc2vec模型以及主要技术指标、使用条件和自然环境描述文本相对应的段落向量。模型训练完毕后,我们将任意两段文本输入模型可以得到这两段文本对应的段落向量,然后使用余弦相似度可以计算得到两段文本的语义相似情况。
相似度计算公式如下:
步骤4:融合不同的相似度值,得到最终的相似度。
为了有效融合以上步骤得到的城轨车辆间的不同相似性,我们引入了权重机制,描述如下:
公式(8)中,α、β、γ和δ是满足α+β+γ+δ=1的权重系数。
以上步骤2和步骤3,执行顺序可以对换,也可以同步执行。
本发明实施例2还提供了一种轨道交通产品与用户需求匹配方法,主要包括四个步骤:
第一步:构造一个矩阵来表示可能来自某个城轨车辆库的城轨车辆之间的相似值。列表SW中的所有城轨车辆(已设计好的城轨车辆)都分别被组织为一个基于异构信息网络的城轨车辆表示,以用于相似性计算。(列表中的元素即城轨车辆,这些城轨车辆间的关系用实施例1构造的邻接矩阵分别进行描述)。
第二步:根据用户或设计人员要求中的文字描述,即:requirement.dscs,在列表SW中搜索并选择合适的城轨车辆,即计算当前用户需要的城轨车辆(即根据城轨车辆用户需求书、城轨车辆招标书、城轨车辆产品设计说明书等文档中用户对产品的功能、性能等需求确定用户需要的城轨车辆指标)与已设计好的各个城轨车辆之间的相似度,将已设计好的城轨车辆按照相似度的大小排序,推荐生成一个列表。
第二步中的相似度计算,用实施例1描述的计算方法与公式即可,即:推荐生成一个列表后,选择合适已设计好的城轨车辆推荐给用户。所谓合适,即相似度值超过一定的值(该值可以根据实际使用需要设定)对应的城轨车辆,或者相似度值最高的前K个值对应的城轨车辆,或者也可以直接选择相似度最高的值对应的城轨车辆。
Claims (6)
1.一种轨道交通车辆用户需求匹配方法,其特征在于,包括以下步骤:计算当前用户需要的城轨车辆与已设计好的各个城轨车辆之间的相似度,将已设计好的城轨车辆按照相似度的大小排序,形成推荐列表;
步骤S1中,利用下式计算两个城轨车辆SWi和SWj之间的相似度:
其中,α、β、γ和δ是满足等式α+β+γ+δ=1的权重系数;
vswi和vswj分别表示描述两个城轨车辆SWi和SWj的段落向量;
simp1(i,j)=Ci,j p1,T/max(Ci,i p1,T,Cj,j p1,T);
simp2(i,j)=Ci,j p2,A/max(Ci,i p2,A,Cj,j p2,A);
simp3(i,j)=Ci,j p3,D/max(Ci,i p3,D,Cj,j p3,D);
vi T和vj T分别是城轨车辆SWi和SWj在主要技术指标上的两个特征向量;(vj T)t是特征向量vj T的转置;vi A和vi D分别表示城轨车辆SWi与所涉及的使用条件之间的关系的特征向量、城轨车辆SWi与子部件对象之间的关系的特征向量;表示城轨车辆SWj与所涉及的使用条件之间的关系的特征向量、城轨车辆SWj与子部件对象之间的关系的特征向量;
步骤S1中,两个城轨车辆SWi和SWj之间的相似度的计算过程包括以下步骤:
S11、构造城轨车辆的三个邻接矩阵;其中,
第一邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆的主要技术指标;
第二邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆使用条件;
第三邻接矩阵的每一行对应一个城轨车辆,列对应城轨车辆的子系统或子部件;
S12、利用所述三个邻接矩阵计算两个城轨车辆在元路径上的相似强度,利用所述相似强度计算两个城轨车辆相对于元路径的相似性;
其中,两个城轨车辆在元路径p1上的相似强度Ci,j p1,T的计算公式为:
vi T和vj T别是城轨车辆SWi和SWj在主要技术指标上的两个特征向量;
两个城轨车辆在元路径p2上的相似强度Ci,j p2,A的计算公式为:
vi A和vi D分别表示城轨车辆SWi与所涉及的使用条件之间的关系的特征向量、城轨车辆SWi与子部件对象之间的关系的特征向量;两个城轨车辆在元路径p3上的相似强度Ci,j p3,D的计算公式为:
表示城轨车辆SWj与所涉及的使用条件之间的关系的特征向量、城轨车辆SWj与子部件之间的关系的特征向量;
城轨车辆SWi和SWj相对于元路径p1的相似性simp1(i,j)的表达式为:
simp1(i,j)=Ci,j p1,T/max(Ci,i p1,T,Cj,j p1,T);
城轨车辆SWi和SWj相对于元路径p2上的相似度simp2(i,j)的表达式为:
simp2(i,j)=Ci,j p2,A/max(Ci,i p2,A,Cj,j p2,A);
城轨车辆SWi和SWj相对于元路径p3上的相似度simp3(i,j)的表达式为:
simp3(i,j)=Ci,j p3,D/max(Ci,i p3,D,Cj,j p3,D);
元路径p1是指:若一个主要技术指标被两个城轨车辆sw1和sw2共享,则使用元路径swTsw,即:城轨车辆-主要技术指标-城轨车辆,表示sw1和sw2之间的关联;
元路径p2是指:若一个使用条件由两个城轨车辆sw1和sw2共享,则使用元路径swAsw,即:城轨车辆-使用条件-城轨车辆,表示sw1和sw2之间的关联;元路径p3是指:若一个子系统或子部件由两个城轨车辆sw1和sw2共享,则使用元路径swDsw,即城轨车辆-子系统或子部件-城轨车辆,表示sw1和sw2之间的关联。
2.根据权利要求1所述的轨道交通车辆用户需求匹配方法,其特征在于,描述两个城轨车辆SWi和SWj的段落向量vswi和vswj的获取过程包括:
1)将所有城轨车辆以及使用条件设置编号,并将城轨车辆或使用条件的编号和自然环境描述文本组成一行保存至语料文件;
2)对所述语料文件进行预处理;
3)将预处理后的语料文件作为词向量模型的输入,训练所述词向量模型,得到训练好的词向量模型;
4)将两个城轨车辆的任意两段文本输入训练好的词向量模型,得到这两段文本对应的段落向量vswi和vswj;其中,所述文本是指主要技术指标、使用条件和自然环境描述文本。
3.根据权利要求2所述的轨道交通车辆用户需求匹配方法,其特征在于,步骤2)的具体实现过程包括:去除语料文件中的非字母符号,并将字母符号统一为英文小写,得到第一预处理文件;对第一预处理文件进行分词,得到第二预处理文件;将第二预处理文件中自然环境描述文本中的动词时态转换成一般时态,名词转换为单数形式,得到第三预处理文件;去除第三预处理文件中的停用词,得到预处理后的语料文件。
4.据权利要求1所述的轨道交通车辆用户需求匹配方法,其特征在于,选择相似度最高的设计好的城轨车辆作为推荐车辆;或者选择相似度值超过设定阈值对应的城轨车辆作为推荐车辆;或者选择相似度值最高的前K个值对应的城轨车辆作为推荐车辆。
5.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~4之一所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~4之一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024410.6A CN113807681B (zh) | 2021-09-02 | 2021-09-02 | 轨道交通车辆用户需求匹配方法、计算机产品、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111024410.6A CN113807681B (zh) | 2021-09-02 | 2021-09-02 | 轨道交通车辆用户需求匹配方法、计算机产品、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807681A CN113807681A (zh) | 2021-12-17 |
CN113807681B true CN113807681B (zh) | 2024-01-05 |
Family
ID=78942140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111024410.6A Active CN113807681B (zh) | 2021-09-02 | 2021-09-02 | 轨道交通车辆用户需求匹配方法、计算机产品、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807681B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573915A (zh) * | 2014-12-10 | 2015-04-29 | 南车青岛四方机车车辆股份有限公司 | 高速列车产品结构树构建方法和装置 |
CN104850632A (zh) * | 2015-05-22 | 2015-08-19 | 东北师范大学 | 一种通用的基于异构信息网络的相似度计算方法与系统 |
CN107590638A (zh) * | 2017-07-28 | 2018-01-16 | 中车工业研究院有限公司 | 匹配用户需求的轨道交通产品模型的获取方法及相关设备 |
CN107657100A (zh) * | 2017-09-18 | 2018-02-02 | 中车工业研究院有限公司 | 轨道交通列车产品的生成方法及装置 |
CN108932644A (zh) * | 2017-05-26 | 2018-12-04 | 车伯乐(北京)信息科技有限公司 | 一种用户选车方法、装置、设备及计算机可读介质 |
CN110597949A (zh) * | 2019-08-01 | 2019-12-20 | 湖北工业大学 | 一种基于词向量和词频的法院相似案件推荐模型 |
CN112836119A (zh) * | 2021-01-26 | 2021-05-25 | 西安理工大学 | 一种基于加权异构信息网络的景点推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112018007491T5 (de) * | 2018-04-18 | 2020-12-31 | Ford Global Technologies, Llc | Gemischte fahrzeugauswahl und routenoptimierung |
-
2021
- 2021-09-02 CN CN202111024410.6A patent/CN113807681B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573915A (zh) * | 2014-12-10 | 2015-04-29 | 南车青岛四方机车车辆股份有限公司 | 高速列车产品结构树构建方法和装置 |
CN104850632A (zh) * | 2015-05-22 | 2015-08-19 | 东北师范大学 | 一种通用的基于异构信息网络的相似度计算方法与系统 |
CN108932644A (zh) * | 2017-05-26 | 2018-12-04 | 车伯乐(北京)信息科技有限公司 | 一种用户选车方法、装置、设备及计算机可读介质 |
CN107590638A (zh) * | 2017-07-28 | 2018-01-16 | 中车工业研究院有限公司 | 匹配用户需求的轨道交通产品模型的获取方法及相关设备 |
CN107657100A (zh) * | 2017-09-18 | 2018-02-02 | 中车工业研究院有限公司 | 轨道交通列车产品的生成方法及装置 |
CN110597949A (zh) * | 2019-08-01 | 2019-12-20 | 湖北工业大学 | 一种基于词向量和词频的法院相似案件推荐模型 |
CN112836119A (zh) * | 2021-01-26 | 2021-05-25 | 西安理工大学 | 一种基于加权异构信息网络的景点推荐方法 |
Non-Patent Citations (2)
Title |
---|
Parameter matching of induction motor for electric vehicle based on orthogonal design;Wang Wei 等;《2009 International Conference on Mechatronics and Automation》;全文 * |
微型纯电动汽车动力系统匹配及优化仿真研究;陈龙浩;《汽车实用技术》;第3-7,46页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113807681A (zh) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598203A (zh) | 一种结合词典的军事想定文书实体信息抽取方法及装置 | |
CN111767741A (zh) | 一种基于深度学习和tfidf算法的文本情感分析方法 | |
CN113535963B (zh) | 一种长文本事件抽取方法、装置、计算机设备及存储介质 | |
CN113505204B (zh) | 召回模型训练方法、搜索召回方法、装置和计算机设备 | |
CN112883193A (zh) | 一种文本分类模型的训练方法、装置、设备以及可读介质 | |
CN114357127A (zh) | 基于机器阅读理解及常用问题解答模型的智能问答方法 | |
CN111401065A (zh) | 实体识别方法、装置、设备及存储介质 | |
CN112052684A (zh) | 电力计量的命名实体识别方法、装置、设备和存储介质 | |
CN114020900B (zh) | 基于融合空间位置注意力机制的图表英语摘要生成方法 | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
CN112069320B (zh) | 一种基于跨度的细粒度情感分析方法 | |
CN115795018B (zh) | 一种面向电网领域的多策略智能搜索问答方法及系统 | |
CN110825843A (zh) | 适于金融领域的训练方法、问答方法、装置及存储介质 | |
CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
Sallam et al. | Improving collaborative filtering using lexicon-based sentiment analysis | |
CN111651569B (zh) | 一种电力领域的知识库问答方法及系统 | |
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN112463944A (zh) | 一种基于多模型融合的检索式智能问答方法及装置 | |
CN114255096A (zh) | 数据需求匹配方法和装置、电子设备、存储介质 | |
Fujihira et al. | Multilingual sentiment analysis for web text based on word to word translation | |
CN113901224A (zh) | 基于知识蒸馏的涉密文本识别模型训练方法、系统及装置 | |
CN112597273A (zh) | 一种基于nl2sql技术的配电自动化图表生成方法 | |
CN113807681B (zh) | 轨道交通车辆用户需求匹配方法、计算机产品、存储介质 | |
CN116932736A (zh) | 一种基于用户需求结合倒排表的专利推荐方法 | |
CN116597866A (zh) | 情绪识别的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |