CN108229728B - 一种货源信息的推荐方法及一种计算机设备 - Google Patents

一种货源信息的推荐方法及一种计算机设备 Download PDF

Info

Publication number
CN108229728B
CN108229728B CN201711368635.7A CN201711368635A CN108229728B CN 108229728 B CN108229728 B CN 108229728B CN 201711368635 A CN201711368635 A CN 201711368635A CN 108229728 B CN108229728 B CN 108229728B
Authority
CN
China
Prior art keywords
information
user
goods
preference
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711368635.7A
Other languages
English (en)
Other versions
CN108229728A (zh
Inventor
许毅刚
陈飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Fankonghui Network Technology Co ltd
Original Assignee
Chengdu Fankonghui Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Fankonghui Network Technology Co ltd filed Critical Chengdu Fankonghui Network Technology Co ltd
Priority to CN201711368635.7A priority Critical patent/CN108229728B/zh
Publication of CN108229728A publication Critical patent/CN108229728A/zh
Application granted granted Critical
Publication of CN108229728B publication Critical patent/CN108229728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0835Relationships between shipper or supplier and carriers
    • G06Q10/08355Routing methods

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种货源信息的推荐方法及计算机设备,该方法包括:从数据库中采集用户信息,对用户信息进行预处理并建立特征模型;基于特征模型,对用户的行为进行加权处理,并获取到用户偏好货物二维数组和用户偏好路线二维数组;根据用户货物偏好二维数组获取货物之间的第一相似度,根据第一相似度预测兴趣货物;根据用户路线偏好二维数组获取路线之间的第二相似度,根据第二相似度预测兴趣路线。通过对用户信息进行模型处理,融入算法预测兴趣货源信息,提高了用户配货的效率。

Description

一种货源信息的推荐方法及一种计算机设备
技术领域
本发明涉及物流货物运输、数据处理领域,尤其涉及一种货源信息的推 荐方法,同时还涉及一种计算机设备。
背景技术
在大宗物流货物运输领域,传统的货物匹配时,用户必须开车到货代现 场进行配货付款,在特定的时间、地点,被动地接受有限的资源。即使随着 互联网的兴起逐渐改变了这种传统、落后的方式,但传统的互联网模式,需 要用户在电脑网站平台上操作,而移动互联网虽然给用户带来丰富货源、简 单便捷,但海量的货源往往也让用户困惑,鉴于货车司机的年龄、文化水平 等因素,用户往往不知道自己如何更快捷的得到自己想要的货源信息,从海 量的货源中找到最适合用户路线的货源成为一件复杂的事。
综上,用户如何高效便捷配货成为亟需解决的技术问题。
发明内容
本发明所要的解决的技术问题是针对现有技术的缺陷,提供一种货源信 息的推荐方法及计算机设备。
本发明解决上述技术问题的技术方案如下:
一种货源信息的推荐方法,该方法包括:
对采集的用户数据进行预处理得到用户的属性信息;
分析所述属性信息,形成用户关联多个属性信息的特征模型;
从所述特征模型中,分析出用户偏好货物信息的第一二维数组和用户偏 好路线信息的第二二维数组;
根据所述第一二维数组获取多个货物信息之间的第一相似度信息,根据 所述第二二维数组获取多条路线信息之间的第二相似度信息;
根据所述第一相似度信息,输出相似度最高的货物信息;
根据所述相似度最高的货物信息和所述第二相似度信息,输出相似度最 高的路线信息;
将所述相似度最高的货物信息和所述相似度最高的路线信息进行处理, 生成相似度高的货源信息,并推荐给用户。
本发明的有益效果是:通过对用户信息进行分析、挖掘、构建数据模型, 基于数据模型进行计算,以预测用户对货源需求的未来行为,为用户筛选出 最合适的货源信息,大幅度提高了用户配货的效率。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,所述用户数据为用户基础数据、车辆基础数据、历史交易数 据和实时位置数据;
所述预处理的过程,包括:
对所述用户基础数据、所述车辆基础数据、所述历史交易数据和所述实 时位置数据进行特征提取、分类、去重和删除操作后获取用户的多个属性信 息;其中所述用户的多个属性信息包括和货源相关的行为信息、偏好信息、 交易信息和位置信息。
所述上述进一步技术特征的有益效果是:
通过用户基础数据、车辆基础数据、历史交易数据和实时位置数据,即 通过用户基本信息、以及结合用户日常运输路线、日常配货的特征分析用户 行为,并为用户筛选出最合适的货源信息,扩大了货源信息量。
进一步地,所述分析的过程包括:
将所述多个属性信息按照对应的用户,建立关联;
将关联后的每个用户及其相应的多个属性信息作为所述特征模型。
进一步地,所述特征模型包括实时位置模型、行为数据模型、偏好数据 模型和交易数据模型;
所述分析二维数组的过程中,包括:
基于所述特征模型中的所述行为信息、偏好信息、交易信息和位置信息 分析出用户对货物的喜好程度信息和用户对路线的喜好程度信息;
按照设定的规则,对所述货物的喜好程度信息进行加权处理,得到和货 源相关的用户偏好货源信息的所述第一二维数组,其中,所述第一二维数组 的两个维度分别为货物和用户,其数值为货物偏好数值;和,
按照设定的规则,对所述路线的喜好程度信息进行加权处理,得到和路 线相关的用户偏好路线信息的所述第二二维数组,其中,所述第二二维数组 的两个维度分别为路线和用户,其数值为路线偏好数值。
采用上述进一步技术特征的有益效果是:
通过对用户的行为进行划分,以及基于用户属性信息生成用户偏好货物 二维数组和用户偏好路线二维数组,数据化的处理分析用户信息。提高了预 测用户偏好货源的的喜好率。
进一步地,所述获取第一相似度的过程,包括:
在所述用户偏好货物信息的二维数组中取任意两个用户对任意两个货 物的四个货物偏好数值,将其中一个用户对应两个货物的两个货物偏好值作 为一个坐标点的两个坐标值,将另外一个用户对应另两个货物的两个货物偏 好值作为另一个坐标点的两个坐标值;
将两个坐标点的坐标值输入到距离算法中,获取到第一相似度信息。
进一步地,所述输出相似度最高的货物信息的过程中,包括:
根据所述第一相似度信息获取相似用户信息;
以所述相似用户偏好的货物信息输出所述相似度最高的货物信息。
进一步地,所述获取第二相似度信息的过程中,包括:
在所述用户偏好路线信息的二维数组中取任意两个用户对任意两个路 线的四个路线偏好数值,将其中两个用户对应一个路线的两个路线偏好值作 为一个坐标点的两个坐标值,将另外两个用户对应另两个路线的两个路线偏 好值作为另一个坐标点的两个坐标值;
将两个坐标点的坐标值输入到所述距离算法中,获取到第二相似度信 息。
进一步地,所述输出相似度最高的货物信息和输出相似度最高的路线信 息的过程中,包括:
根据所述交易数据模型获取到用户对货物的第一历史偏好程度信息,根 据所述第一历史偏好程度信息和所述第一相似度信息输出所述相似度最高 的货物信息;
根据所述交易数据模型获取到用户对路线的第二历史偏好程度信息,根 据第二历史偏好程度信息、所述相似度最高的货物信息和所述第二相似度信 息输出所述相似度最高的路线信息。
采用上述进一步技术方案的有益效果是:通过采用距离算法对用户数据 处理分析以及获取相似度,以及历史偏好程度,预测货源的兴趣路线和兴趣 货物,激发了用户配货的主动性,进而提高了工作效率。
进一步地,所述推荐给用户的过程中,包括:
在获取到所述相似度最高的货物信息和所述相似度最高的路线信息后, 从数据库中获取到相似度高的货源信息,生成初始货源推荐列表;
通过对所述初始货源推荐列表中的信息进行过滤和排名处理后,向用户 推荐货源信息。
采用上述进一步方案的有益效果是:通过将货源信息再次进行处理,并 展示给用户,方便了用户查阅自己喜爱的信息,提高了配货的积极性。
本发明解决上述技术问题的另一种技术方案如下:
一种计算机设备,其特征在于,包括处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,以实现上述技术方案所述的方 法。
本发明的有益效果是:通过计算机程序实现上述的方法,大幅度提高了 用户配货的效率。
附图说明
图1为本发明实施例一提供的一种货源信息的推荐流程示意图;
图2为本发明实施例一提供的一种建模流程示意图;
图3为本发明实施例一提供的一种特征模型示意图;
图4为本发明实施例一提供的一种获取二维数组流程示意图;
图5为本发明实施例一提供的一种获取第一相似度的流程示意图;
图6为本发明实施例一提供的一种相似度速发中的坐标系示意图;
图7为本发明实施例一提供的一种预测相似度最高的货物信息的流程示 意图;
图8为本发明实施例一提供的一种获取第二相似度的流程示意图;
图9为本发明实施例一提供的一种预测相似度最高的路线信息的流程示 意图;
图10为本发明实施例一提供的一种发布用户偏好货源信息的流程示意 图;
图11为本发明实施例二提供的一种货源信息推荐的系统的结构图;
图12为本发明实施例二提供的一种推荐系统的工作流程图;
图13为本发明实施例二提供的一种推荐系统的发布流程图;
图14为本发明实施例二提供的一种推荐引擎系统架构图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本 发明,并非用于限定本发明的范围。
图1为本发明实施例一提供的一种货源信息的推荐方法,该方法包括:
S101、对采集的用户数据进行预处理得到用户的属性信息;
S102、分析所述属性信息,形成用户关联多个属性信息的特征模型;
该实施例中,用户在本发明的网络平台上注册信息以及各种交易信息, 在用户操作后均被记录在数据库中,该数据库中含有平台所有注册用户的信 息、用户操作App(即在平台上进行的操作)的历史行为信息、用户关注的 路线和信息部的信息、用户历史抢单记录、用户历史交易记录以及用户当前 位置信息等等。
由于数据库中的用户信息并未进行整理,比较散乱,重复,从数据库中 采集用户信息后,需要对采集的用户信息进行预处理,该预处理过程主要是 对用户信息进行再整理,达到本发明采用软件系统可以直接使用数据(直接 调取)的目的。比如,将采集到的用户信息进行分类、去重,并对异常数据 进行去除处理,另外,对后续采集样本数据和关键信息进行补充、补全。
然后基于预处理后的信息生成特征模型,特征模型的构建是基于系统多 数据源(比如用户库、车辆库、交易运单库、GPS位置信息库及日志库等)实 现,具体地,该特征模型主要是通过对预处理的信息进行特征提取(即根据 不同的特征进行分类,并获取用户信息的类型、内容、性质以及数据间的联 系),并通过构建用户信息间得到的逻辑关系及通过推理出用户信息数据间 的制约和依存关系,以及数据动态变化的规则(比如用户的订阅货物信息以 及浏览类似货物信息)形成特征样本数据(即特征模型建立,或者称其为数 据模型,或者还可称其为关系数据模型)。
S103、从所述特征模型中,分析出用户偏好货物信息的第一二维数组和 用户偏好路线信息的第二二维数组;
S104、根据所述第一二维数组获取多个货物信息之间的第一相似度信 息,根据所述第二二维数组获取多条路线信息之间的第二相似度信息;
S105、根据所述第一相似度信息,输出相似度最高的货物信息;
S106、根据所述相似度最高的货物信息和所述第二相似度信息,输出相 似度最高的路线信息;
S107、将所述相似度最高的货物信息和所述相似度最高的路线信息进行 处理,生成相似度高的货源信息,并推荐给用户。
该实施例中,通过S101步骤中建立的特征模型,该特征模型可称为数 据模型,根据不同的推荐模型算法(如基于用户基本属性推荐、用户行为推 荐、交易记录推荐、位置信息推荐等等),并在基于内容推荐算法、协同过 滤算法和TOP-K算法等混合算法的推荐引擎的架构下,对模型进行计算。
具体地,特征模型中包含各种数据关系式等,在该模型计算时,首先通 过对用户的行为信息进行加权处理,本发明中采用将用户行为信息划分为偏 好行为信息和交易行为信息(仅仅是系统后台命名方式,其实就是将用户的 行为划分为两组),然后根据不同行为信息反映用户喜好的程度信息将其进 行加权处理,得到用户对于货物和路线的总体喜好信息,根据用户对于货物 和路线的总体喜好信息获取到第一二维数组和第二二维数组。
下面以协同过滤算法为例进行分析,在建立好的数据模型中,从中分析 并发现规律,比如,用户A通过投票系统对货物A、货物B和货物C依次 投票,用户A订阅了货物A和货物B,用户A对货物A进行收藏操作,用 户A将货物A的信息推送给用户B等等,分析出用户A偏爱货物A,然后 分析出,货物A和货物B同一类型,用户B和用户C均收藏了货物A以及 推送货物A给其他用户,可见,用户B、用户C、用户A有相同的偏好,次 之,发现用户B和用户C喜欢货物C,则可知货物C为用户A可能感兴趣 的货物。
然后针对用户A、用户B和用户C对货物A或者货物C的偏爱程度信 息,对用户偏爱货物的信息进行加权处理。得到用户与货物之间的总体喜好 信息,并生成各用户偏爱不同货物的二维数组(第一二维数组),如表1所 示,以表格形式展现出的一种第一二维数组。
货物A 货物B 货物C
用户A 0.5 0.2
用户B 0.6 0.3 0.7
用户C 0.5 0.2 0.7
用户D 0.1 0.9 0.2
用户E 0.2 0.8 0.2
表1
表中的数值表示用户对某货物的货源偏爱数值信息,通过分析表中数 值,可分析出,用户A、用户B和用户C都喜欢货物A和货物B,可见这 三个用户属于同一类型,即邻居用户,而用户B和用户C都喜欢货物C,系 统则向用户A推荐货物C。
然后在根据不同的推荐算法,对用户历史偏好货物的二维数组和用户历 史偏好路线的二维数组进行逻辑分析,以及计算等操作,可得出货物之间的 第一相似度(比如货物A、货物B和货物C之间的相似程度)和路线之间 的第二相似度(不同用户选择相同路线的情况)。最后根据所述第一相似度 预测兴趣货物以及根据所述第二相似度预测兴趣路线。
需要说明的是:用户的货源信息即兴趣货物以及兴趣路线。此处的第一 相似度和第二相似度可根据距离算法获取,本发明采用欧几里得距离算法进 行计算分析。
为了准确的计算的分析,也可以通过输入用户基础数据等参数作为辅助 作用。
比如输入用户A的车辆信息,对该车辆的历史行驶路线进行分析,获取 类似路线或者偏爱路线。
本发明的有益效果是:通过对用户信息进行分析、挖掘、构建数据模型, 基于数据模型进行计算,以预测用户对货源需求的未来行为,为用户筛选出 最合适的货源信息,大幅度提高了用户配货的效率,同时也调动了用户的积 极性。
优选地,所述用户数据为用户基础数据、车辆基础数据、历史交易数据 和实时位置数据;
所述预处理的过程,包括:
对所述用户基础数据、所述车辆基础数据、所述历史交易数据和所述实 时位置数据进行特征提取、分类、去重和删除操作后获取用户的多个属性信 息;其中所述用户的多个属性信息包括和货源相关的行为信息、偏好信息、 交易信息和位置信息。
优选地,如图2所示,所述分析的过程包括:
S1021、将所述多个属性信息按照对应的用户,建立关联;
S1022、将关联后的每个用户及其相应的多个属性信息作为所述特征模 型。
该实施例中,比如根据用户A的数据,分析出多个属性信息,该多个属 性信息为车辆D、货物B、路线C和路线E等等,然后将其关联就得到用户 A的特征模型,如图3所示。
优选地,所述特征模型包括实时位置模型、行为数据模型、偏好数据模 型和交易数据模型;每个模型用于处理相应内容与货物之间的用户数据,如 行为数据模型,至少用于记录用户的操作与相关货物的关联。
所述分析二维数组的过程中,如图4所示,包括:
S201、基于所述特征模型中的所述行为信息、偏好信息、交易信息和位 置信息分析出用户对货物的喜好程度信息和用户对路线的喜好程度信息;
S3011、按照设定的规则,对所述货物的喜好程度信息进行加权处理, 得到和货源相关的用户偏好货源信息的所述第一二维数组,其中,所述第一 二维数组的两个维度分别为货物和用户,其数值为货物偏好数值;和,
S3012、按照设定的规则,对所述路线的喜好程度信息进行加权处理, 得到和路线相关的用户偏好路线信息的所述第二二维数组,其中,所述第二 二维数组的两个维度分别为路线和用户,其数值为路线偏好数值。
该实施例中,信息预处理模块将用户属性、偏好行为、交易数据按规则 保存到各数据库表,以便于后台推荐系统计算使用。
样本关键点数据主要如下:
用户属性:姓名、性别、年龄、手机号、籍贯
车辆属性:车辆品牌、车牌归属地、车辆属性(车长、车型、荷载吨位)
用户行为:经常搜索路线、经常抢单线路
偏好信息:订阅路线、空车信息
交易信息:运单路线、货物类型、货物重量、运费金额
位置信息:当前位置经纬度、当前位置区域(省市区/县)、当前详细位 置、定位时间
需要说明的是:在本发明方案起主要作用的关键点数据为用户行为信 息、偏好信息、交易信息和位置信息,上述提及的用户属性、车辆属性等用 户基础信息可作为辅助参数,其增加或减少对本发明方案不造成影响。
通过对上述关键点数据进行分析生成实时位置模型、行为数据模型、偏 好数据模型和交易数据模型,具体构建模型的过程在上述步骤中已阐述,此 处不再赘述。每个模型中,可以根据用户的设置,加入相关的属性信息,例 如,在实时位置模型中,加入用户属性、车辆属性、用户行为属性等。
该实施例中,本发明采用将用户的行为划分为偏好行为和交易行为。基 于各个数据模型分别对这两种行为计算不同的用户对货源路线的相似度。
根据不同行为反映用户喜好的程度将其进行加权,得到用户对于货源信 息的总体喜好(货物或路线)。针对不同的行为,根据偏好行为获取其对应 的第一货源喜好程度信息,根据交易行为获取其对应的第二货源喜好程度信 息(货物或路线),一般来说,显式的用户反馈比隐式的权值大,比如相对 于“订阅”、“抢单成交”以及“发布空车”行为,用户浏览、搜索等行为反 映用户喜好的程度相对弱很多。而对于用户的浏览、点击、搜索等行为数据, 需要进行预处理,核心工作为减噪和归一化。
根据不同应用的行为分析方法,进行加权(或者分组)处理。比如,针 对用户的交易行为信息进行加权,例如,交易行为中,包括将货物加入订单 的行为定为第一行为,将加入订单中的货物进行结算的行为定为第二行为。 通过对同一货物的分析,第一行为的喜好程度值为0.8,第二行为的喜好程 度值为0.7,则加权后得到,(0.7+0.89)/2=0.75,则0.75即为用户对该货物 的货物偏好数值。
最后可得到用户偏好的二维数组(用户偏好货物二维数组和用户偏好路 线二维数组),其中二维数组中,一维是用户列表,另一维是货源列表(货 物或路线等),二维数组中的数值为用户对货源的偏好程度(即货物偏好数 值或路线偏好数值),比如[0,1]或者[-1,1]的浮点数值(即数值位于[0,1] 范围内或者[-1,1]范围内)。
优选地,所述获取第一相似度的过程,如图5所示,包括:
S301、在所述用户偏好货物信息的二维数组中取任意两个用户对任意两 个货物的四个货物偏好数值,将其中一个用户对应两个货物的两个货物偏好 值作为一个坐标点的两个坐标值,将另外一个用户对应另两个货物的两个货 物偏好值作为另一个坐标点的两个坐标值;
S302、将两个坐标点的坐标值输入到距离算法中,获取到第一相似度信 息。
该实施例中,得到用户偏好的二维数组之后,根据用户对货源的喜好程 度计算相似用户和货源,在用户偏好货物的第一二维数组中,本发明采用将 一个用户对所有货源的偏好作为第一向量来计算用户之间的相似度,进而求 取出第一相似度。
具体地,本发明主要采用欧几里得距离算法进行相似度的计算,公式如 下:
Figure BDA0001513345350000121
式中x,y(通过将二维数组中的数值转入坐标系中,获取到对应的x 值和y值)是代表数据模型中货源的评分值(即用户喜好程度值)。
具体坐标系建立为,在第一二维数组中取任意两个用户对任意两个货物 的四个货物偏好数值,将其中一个用户对应两个货物的两个货物偏好值作为 一个坐标点的两个坐标值,将另外一个用户对应另两个货物的两个货物偏好 值作为另一个坐标点的两个坐标值。比如表1中,取用户B和用户C分别 对应货物B和货C的四个数值,以用户B和用户C对应的货物A的偏好值 为X轴,以用户B和用户C对应的货物B的偏好值为Y轴,建立坐标系, 其中用户B在坐标系的位置坐标为(0.6,0.3),用户C为(0.5,0.2),再 比如取用户B和用户C分别对应货物B和货C的四个数值,其用户B坐标 为(0.6,0.7),用户C坐标为(0.5,0.7),如图6所示。假设表1中只有用 户B,用户C,货物A,货物B和货物C,用户B和用户C的距离就相当于 把上述四个坐标点代入距离公式中,该距离算法为现有技术,此处不再赘述。
为了更清楚的阐述,相似度还需用以下公式进行转换:
Figure BDA0001513345350000122
其中,当d(x,y)距离越小,相似度(sim(x,y))越大。
该实施例中,通过距离算法可求得相似用户,比如用户A和用户B距 离比用户A和用户B的距离小,则用户A和用户B相似等等。
优选地,所述输出相似度最高的货物信息的过程中,如图7所示,包括:
S401、根据所述第一相似度信息获取相似用户信息;
S402、以所述相似用户偏好的货物信息输出所述相似度最高的货物信 息。
该实施例中,得到第一相似度后,本发明采用基于相似用户(UserCF) 或者货源(ItemCF)等推荐引擎进行推荐计算,获取相似用户和相似货物, 最后根据相似用户偏好的货物和相似货物预测所述兴趣货物。
根据第一相似度的分析,发现具有货物推荐关系中存在的货物,认为用 户A和用户B都对同一类型货物感兴趣,即为相似用户。若用户B偏爱货 物C,则推测出用户A也偏爱货物C。
同样用户A喜欢货物D,而本发明的软件系统经过计算发现货物C和 货物D为同一类型,则推测出用户A也喜欢货物C。
根据上述情况分析,推测出用户A偏爱货物C,系统向用户推荐货物C。
需要说明的是,上述例子仅仅是本发明为了阐述本发明方案列举的例 子,若有其他情况发生也会有不同的结果,其均在本发明的保护范围之内。
优选地,所述获取第二相似度信息的过程中,如图8所示,包括:
S501、在所述用户偏好路线信息的二维数组中取任意两个用户对任意两 个路线的四个路线偏好数值,将其中两个用户对应一个路线的两个路线偏好 值作为一个坐标点的两个坐标值,将另外两个用户对应另两个路线的两个路 线偏好值作为另一个坐标点的两个坐标值;
S502、将两个坐标点的坐标值输入到所述距离算法中,获取到第二相似 度信息。
该实施例中,具体过程同S301、S302步骤中列举的方法,此处不再赘 述。
另外,经过上述方法提及的计算已经得到了相似用户和相似货物,接下 来通过协同过滤的推荐算法(基于物品的CF)进行相似路线的计算和推荐。
本发明采用基于ItemCF算法方式进行计算推荐。
基于用户对路线的偏好找到相似的货物,推荐相似的货源给用户。从计 算的角度看,本发明采用将所有用户对某个路线的偏好作为第二向量来计算 路线之间的相似度,进而获取第二相似度。如用户对于某类货物注重产地, 经常从A产地购买这类货物,也发现会从B产地购买同类货物。
作为辅助参数,还可根据用户的历史偏好进行路线的预测。
优选地,所述输出相似度最高的货物信息和输出相似度最高的路线信息 的过程中,如图9所示,包括:
S601、根据所述交易数据模型获取到用户对货物的第一历史偏好程度信 息,根据所述第一历史偏好程度信息和所述第一相似度信息输出所述相似度 最高的货物信息;
S602、根据所述交易数据模型获取到用户对路线的第二历史偏好程度信 息,根据第二历史偏好程度信息、所述相似度最高的货物信息和所述第二相 似度信息输出所述相似度最高的路线信息。
该实施例中,后台系统可根据对交易数据模型,进行运算分析模型中属 性信息的关联,其中包含了用户对货物或者路线的历史偏好信息,在第一相 似度信息的基础上,通过以货物的历史偏好程度信息为辅助参数,预测出所 述相似度最高的货物信息。比如在历史交易数据中,用户A偏爱货物A,货 物A的相似货物为货物C,系统根据第一相似度确定出用户B为用户A的 相似用户,用户B偏爱货物B和货物C,且用户B对货物C和货物B的偏 爱程度相同,由于用户A的偏爱货物中,存在相似货物C,与用户B的偏 爱货物C相同,此时可根据第一历史偏好程度信息输出相似度最高的货物C。 系统输出的相似的路线信息,仅仅是在得到相似的货物基础上进行的,其根 据第二历史偏好程度信息和第二相似度信息输出相似度最高的路线信息与 上述提及的输出相似度最高的货物信息的方法相同,此处不再赘述。
该实施例中,对数据进行加权过程中,核心工作还需减噪和归一化操作。 具体地:
减噪:用户行为数据是用户在使用应用过程中产生的,可能存在大量的 噪音和用户的误操作,系统通过经典的数据挖掘算法过滤掉行为数据中的噪 音,确保分析更加精确。
归一化:在计算用户对物品的喜好程度时,对不同的行为数据进行加权。 但因不同行为的数据取值可能相差很大,比如用户的查看数据必然比成功抢 单交易的数据大的多。通过归一化处理将各个行为的数据统一在一个相同的 取值范围中,从得加权求和得到的总体喜好更加精确。
本发明中的归一化处理,是将各类数据除以此类中的最大值,确保归一 化后的数据取值在[0,1]范围中。
优选地,所述推荐给用户的过程中,如图10所示,包括:
S701、在获取到所述相似度最高的货物信息和所述相似度最高的路线信 息后,从数据库中获取到相似度高的货源信息,生成初始货源推荐列表;
S702、通过对所述初始货源推荐列表中的信息进行过滤和排名处理后, 向用户推荐货源信息。
该实施例中,根据不同的相似度高的货源信息,生成一个初始货源推荐 列表,比如该初始推荐列表中,向某一位用户推荐了货源信息A、货源信息 B、货源信息C和货源信息D等等,经过软件系统的过滤、排名得出最终的 货源推荐列表,比如根据时间的先后进行过滤和排名,假设按照一个月以前 的货源信息为旧信息,则直接过滤掉,比如当前时间为2017年12月3日, 货源信息D是2017年11月1日推荐的,而货源信息A、货源信息B和货 源信息C是2017年12月3日推荐的,则过滤掉一个月之前的旧信息,再比 如,假设按照过去10分钟内,推荐货源信息的先后时间顺序进行排名,当 前时间为2017年12月3日15:45,货源信息A为2017年12月3日15:40 推荐的,货源信息B为2017年12月3日15:41推荐的,货源信息C为2017 年12月3日15:42推荐的,则经过排名后,第一名为货源信息A,第二名为 货源信息B,第三名为货源信息C。最后软件系统通过消息推送方式向客户 端推送推荐货源信息。
为了更清楚得的阐述本发明方案,本发明实施例二从具体的应用场景中 进行分析。
从推荐系统的角度看,可以划分为四层:业务层、推荐系统、核心数据 和模型计算。业务层主要是用户使用软件的业务交易行为数据,而在系统中 的用户行为也将产生交易日志和偏好数据,这些都会通过多个渠道和方式进 行采集、归类并存储到相应的核心数据,如图11所示为系统的结构图。
推荐系统模块是智能推荐系统的核心模块,从图11可以看出基本的业 务流程:智能推荐系统从系统核心数据库中抽取用户数据进行计算,通过系 统前端界面向用户推荐兴趣数据,而系统前端也根据用户使用和用户行为采 集数据,存入系统日志库,以作为后续行为特征分析,建立模型使用,如图 12为推荐系统模块的基本工作流程图。
推荐引擎的构建来源于不同的数据模型(属性模式、行为模式、交易模 型、位置模型等)、不同的推荐模型算法(如基于用户基本属性推荐、用户 行为推荐、交易记录推荐、位置信息推荐等等),推荐引擎的架构基于内容、 协同过滤和TOP-K等混合算法模型实现,不同的引擎采用不同的方式,最 后根据权重配比对各个引擎计算的结果进行评分选出初始推荐结果,再对结 果进行过滤、排名最终得到较为准确的推荐内容,图13为智能推荐系统的 工作流程图。
特征模型的构建是基于系统多数据源(用户库、车辆库、交易运单库、GPS位置信息库及日志库等)实现,构建了特征模型之后由推荐引擎系统计 算出兴趣数据,最后在系统货源库中抽取、过滤特征货源信息,图14为智 能推荐引擎系统架构图,该架构图包含了模块1、模块2和模块3。
模块1,本发明采用从用户库、车辆库、交易运单库、GPS位置信息库 及日志库等根据规则提取用户基础数据、车辆基础数据、历史交易数据和实 时位置数据,由信息预处理模块进行信息预处理,通过收集、梳理、整理、 归类等步骤将用户偏好数据、行为数据进行加工。
模块2,为推荐系统的核心实现。主要通过以下步骤完成:
1)收集用户偏好,建立数据模型
2)找到相似的货源路线
3)计算推荐
另外,模块1中的主要工作为模块2的推荐引擎提供基础数据,以建立 各种数据模型,而数据模型主要是从模块1中多个维度提取用户兴趣点线路 信息,因此数据模型的表现形式主要是用户、路线、评分等项目。例如交易 模型(在实施例一的基础上,该实施例中的模型直接将评分值融入模型中, 其并不对本发明方案造成影响,其可看作是更优化的方案之一。)内容样式 为:
张三 四川-乐山-夹江至河南-新乡 5
张三 四川-乐山-夹江至贵州-贵阳-清镇市 5
张三 四川-乐山至云南-曲靖-罗平县 4
其他模型格式与上述列举模型类似。
在模型2中,基于四种特征模型(实时位置模型、行为数据模型、偏好 数据模型和交易数据模型)以及辅助参数(用户属性、车辆属性和车辆归属 地),通过推荐算法(内容推荐算法和协同过滤算法)实现模型的计算,获 取到兴趣路线。
再从兴趣路线中结合归属地位置、当前位置及偏好行为和交易路线优选 出三个类型的推荐路线:归属地至推荐到达地(或兴趣到达地)、当前位置 至推荐到达地(或兴趣到达地)和系统计算的兴趣路线,得到相应的推荐货 源列表。
模块3,得到兴趣路线之后,软件系统会从货源库中取相似货物和相似 路线的交集,得到初始货源推荐信息,然后再经过软件系统的过滤、排名得 出最终的结果。系统通过消息推送方式向客户端推送推荐货源信息。
另外,本发明中上述具体实现过程中,根据上述的算法和建模可以根据 实际需求进行修改、调整,以达到最精准的推荐和投送。
本发明实施例三提供了一种计算机设备,包括处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,以实现实施例一至实施例二所述 的方法。
本发明的有益效果是:通过计算机程序实现上述的方法,大幅度提高了 用户配货的效率。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各 种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。 因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种货源信息的推荐方法,其特征在于,该方法包括:
对采集的用户数据进行预处理得到用户的属性信息;
分析所述属性信息,形成用户关联多个属性信息的特征模型;
从所述特征模型中,分析出用户偏好货物信息的第一二维数组和用户偏好路线信息的第二二维数组;
根据所述第一二维数组获取多个货物信息之间的第一相似度信息,根据所述第二二维数组获取多条路线信息之间的第二相似度信息;
根据所述第一相似度信息,输出相似度最高的货物信息;
根据所述相似度最高的货物信息和所述第二相似度信息,输出相似度最高的路线信息;
将所述相似度最高的货物信息和所述相似度最高的路线信息进行处理,生成相似度高的货源信息,并推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述用户数据为用户基础数据、车辆基础数据、历史交易数据和实时位置数据;
所述预处理的过程包括:
对所述用户基础数据、所述车辆基础数据、所述历史交易数据和所述实时位置数据进行特征提取、分类、去重和删除操作后获取用户的多个属性信息;其中所述用户的多个属性信息包括和货源相关的行为信息、偏好信息、交易信息和位置信息。
3.根据权利要求2所述的方法,其特征在于,所述分析的过程包括:
将所述多个属性信息按照对应的用户,建立关联;
将关联后的每个用户及其相应的多个属性信息作为所述特征模型。
4.根据权利要求1所述的方法,其特征在于,所述特征模型包括实时位置模型、行为数据模型、偏好数据模型和交易数据模型;
分析所述特征模型的过程中,包括:
基于所述特征模型中的行为信息、偏好信息、交易信息和位置信息分析出用户对货物的喜好程度信息和用户对路线的喜好程度信息;
按照设定的规则,对所述货物的喜好程度信息进行加权处理,得到和货源相关的用户偏好货源信息的所述第一二维数组,其中,所述第一二维数组的两个维度分别为货物和用户,其数值为货物偏好数值;和,
按照设定的规则,对所述路线的喜好程度信息进行加权处理,得到和路线相关的用户偏好路线信息的所述第二二维数组,其中,所述第二二维数组的两个维度分别为路线和用户,其数值为路线偏好数值。
5.根据权利要求1所述的方法,其特征在于,所述获取第一相似度的过程,包括:
在所述用户偏好货物信息的二维数组中取任意两个用户对任意两个货物的四个货物偏好数值,将其中一个用户对应两个货物的两个货物偏好值作为一个坐标点的两个坐标值,将另外一个用户对应所述两个货物的两个货物偏好值作为另一个坐标点的两个坐标值;
将两个坐标点的坐标值输入到距离算法中,获取到第一相似度信息。
6.根据权利要求5所述的方法,所述输出相似度最高的货物信息的过程中,包括:
根据所述第一相似度信息获取相似用户信息;
以所述相似用户偏好的货物信息输出所述相似度最高的货物信息。
7.根据权利要求5所述的方法,所述获取第二相似度信息的过程中,包括:
在所述用户偏好路线信息的二维数组中取任意两个用户对任意两个路线的四个路线偏好数值,将其中一个用户对应两个路线的两个路线偏好值作为一个坐标点的两个坐标值,将另外一个用户对应所述两个路线的两个路线偏好值作为另一个坐标点的两个坐标值;
将两个坐标点的坐标值输入到所述距离算法中,获取到第二相似度信息。
8.根据权利要求4所述的方法,其特征在于,所述输出相似度最高的货物信息和输出相似度最高的路线信息的过程中,包括:
根据所述交易数据模型获取到用户对货物的第一历史偏好程度信息,根据所述第一历史偏好程度信息和所述第一相似度信息输出所述相似度最高的货物信息;
根据所述交易数据模型获取到用户对路线的第二历史偏好程度信息,根据第二历史偏好程度信息、所述相似度最高的货物信息和所述第二相似度信息输出所述相似度最高的路线信息。
9.根据权利要求1所述的方法,其特征在于,所述推荐给用户的过程中,包括:
在获取到所述相似度最高的货物信息和所述相似度最高的路线信息后,从数据库中获取到相似度高的货源信息,生成初始货源推荐列表;
通过对所述初始货源推荐列表中的信息进行过滤和排名处理后,向用户推荐货源信息。
10.一种计算机设备,其特征在于,包括处理器和存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序,以实现权利要求1-9中任一项所述的方法。
CN201711368635.7A 2017-12-18 2017-12-18 一种货源信息的推荐方法及一种计算机设备 Active CN108229728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711368635.7A CN108229728B (zh) 2017-12-18 2017-12-18 一种货源信息的推荐方法及一种计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711368635.7A CN108229728B (zh) 2017-12-18 2017-12-18 一种货源信息的推荐方法及一种计算机设备

Publications (2)

Publication Number Publication Date
CN108229728A CN108229728A (zh) 2018-06-29
CN108229728B true CN108229728B (zh) 2022-02-18

Family

ID=62649763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711368635.7A Active CN108229728B (zh) 2017-12-18 2017-12-18 一种货源信息的推荐方法及一种计算机设备

Country Status (1)

Country Link
CN (1) CN108229728B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064099A (zh) * 2018-08-14 2018-12-21 惠龙易通国际物流股份有限公司 一种基于货物运输的推荐方法及装置
CN109658033B (zh) * 2018-12-26 2021-03-16 江苏满运物流信息有限公司 货源路线相似度计算方法、系统、设备及存储介质
CN110782215B (zh) * 2019-10-30 2022-10-14 江苏满运软件科技有限公司 货源确定方法、装置、设备及存储介质
CN110852684B (zh) * 2019-11-13 2022-09-20 贵阳山恩科技有限公司 货源偏好的确定方法、装置、设备及存储介质
CN110991969A (zh) * 2019-12-07 2020-04-10 武汉宝钢华中贸易有限公司 一种保持钢材板包性能一致性的拣货方法及装置
CN111126909B (zh) * 2019-12-20 2023-08-08 贵阳货车帮科技有限公司 货源路线的数据处理方法、装置、设备及存储介质
CN111340428B (zh) * 2020-03-04 2022-09-27 江苏满运软件科技有限公司 货物类型的特征表示方法、系统、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663627A (zh) * 2012-04-26 2012-09-12 焦点科技股份有限公司 个性化推荐方法
CN104778568A (zh) * 2015-04-09 2015-07-15 黎建军 一种物流配送管理方法
CN104866997A (zh) * 2015-06-10 2015-08-26 南京大学 一种用于车货在线配载的智能配对方法
CN105095987A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 一种购物导航方法及用于购物导航的服务器、客户端
CN106528812A (zh) * 2016-08-05 2017-03-22 浙江工业大学 一种基于usdr模型的云推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060020614A1 (en) * 1997-08-08 2006-01-26 Kolawa Adam K Method and apparatus for automated selection, organization, and recommendation of items based on user preference topography

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663627A (zh) * 2012-04-26 2012-09-12 焦点科技股份有限公司 个性化推荐方法
CN104778568A (zh) * 2015-04-09 2015-07-15 黎建军 一种物流配送管理方法
CN104866997A (zh) * 2015-06-10 2015-08-26 南京大学 一种用于车货在线配载的智能配对方法
CN105095987A (zh) * 2015-06-30 2015-11-25 北京奇虎科技有限公司 一种购物导航方法及用于购物导航的服务器、客户端
CN106528812A (zh) * 2016-08-05 2017-03-22 浙江工业大学 一种基于usdr模型的云推荐方法

Also Published As

Publication number Publication date
CN108229728A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN108229728B (zh) 一种货源信息的推荐方法及一种计算机设备
CN106407278B (zh) 一种大数据平台的架构设计系统
AU2022201654A1 (en) System and engine for seeded clustering of news events
US20100287014A1 (en) Contextualizing business intelligence reports based on context driven information
CN103186539A (zh) 一种确定用户群体、信息查询及推荐的方法及系统
US8805842B2 (en) Method for displaying search results
CN104933100A (zh) 关键词推荐方法和装置
Irudeen et al. Big data solution for Sri Lankan development: A case study from travel and tourism
US20110208715A1 (en) Automatically mining intents of a group of queries
CN101916294A (zh) 一种利用语义分析实现精确搜索的方法
Deshpande et al. Efficient reverse skyline retrieval with arbitrary non-metric similarity measures
CN103116582A (zh) 一种信息检索方法及相关系统和装置
CN110851729A (zh) 资源信息推荐方法、装置、设备及计算机存储介质
Yang et al. Analysis of data warehouse architectures: modeling and classification
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
CN106021626A (zh) 基于数据挖掘的数据搜索方法
CA2956627A1 (en) System and engine for seeded clustering of news events
US10803124B2 (en) Technological emergence scoring and analysis platform
CN103116619B (zh) 协同商业智能实现方法及装置
CN111078997B (zh) 一种资讯推荐方法及装置
CN105786810A (zh) 类目映射关系的建立方法与装置
Migliorini et al. A context-based approach for partitioning big data
CN116595262A (zh) 商旅方案推荐方法、装置、电子设备及计算机存储介质
EP4002151A1 (en) Data tagging and synchronisation system
Prokhorenkov et al. Notice of violation of IEEE publication principles: discovery of technology trends from patent data on the basis of predictive analytics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant