CN105931055A - 一种面向众包平台的服务商特征建模方法 - Google Patents
一种面向众包平台的服务商特征建模方法 Download PDFInfo
- Publication number
- CN105931055A CN105931055A CN201610216308.9A CN201610216308A CN105931055A CN 105931055 A CN105931055 A CN 105931055A CN 201610216308 A CN201610216308 A CN 201610216308A CN 105931055 A CN105931055 A CN 105931055A
- Authority
- CN
- China
- Prior art keywords
- service provider
- complete
- behavioral characteristics
- task
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
Landscapes
- Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种面向众包平台的服务商特征建模方法。本发明对众包平台进行数据爬取,对采集到的数据进行去重、去除冗余预处理并分类为服务商静态特征、服务商动态特征和服务商绩效评价,再根据服务商完成任务的种类进行分类为完成比稿任务的动态特征、完成招标任务的动态特征、完成比稿任务的绩效评价、完成招标任务的绩效评价,进行竞争学习方法,强化学习方法,完成质量、工作速度、服务态度、雇主评价、与同行业比较结果。本发明克服了过去造成平台用户缺失、影响平台搜索的专业性和准确性的缺陷。本发明从用户使用众包平台搜索服务商的角度,通过对服务商建模,从而帮助用户能够快速、准确地搜索到符合需求的服务商。
Description
技术领域
本发明属于软件搜索和推荐领域,特别涉及一种面向众包平台的服务商特征建模方法。
背景技术
由于互联网的快速发展,众包技术愈发成熟,相关的众包平台也被更多人使用。用户在使用平台的同时,会提出更高的要求,比如快速准确地搜索出能够完成需求的服务商,因此,平台搜索的准确度和专业性变得越发重要。在目前的大多数众包平台上,用户经常会通过简单的关键字形式来搜索服务商,这种方式虽然简单便利,但是往往满足不了用户的真正需求,无法推荐出精确的服务商;并且显示出的服务商的属性太过简单和不完整。主要原因是众包平台没有对服务商进行完善的特征建模,无法清楚、有效地显示出服务商的综合属性。
在本发明作出之前,现在推荐系统需要经过人物建模、项目匹配和推荐输出三个阶段,人物建模是获取和维护与人物兴趣、需求或习惯相关的知识的过程,其结果将产生一个表示人物特有背景知识或者属性和需求的人物模型。目前人物特征建模的相关技术主要有:(1)基于向量空间模型的建模,该建模方法能够反映不同概念在人物模型中的重要程度,而且方便了使用标准向量运算来行后续阶段的项目匹配任务。但是人物偏好通常比较复杂,仅用一组关键词无法充分捕捉;再加上词语表达本身固有的义性和语义分歧性,以及表示时没有考虑到词序或语境问题,使得基于这种建模方法所产生的推荐可能包含许多偏颇结果。无法快速准确地满足用户的需求,降低了用户使用平台的体验感,可能会对平台造成用户缺失的严重后果。(2)基于本体论的建模,引入本体来建立人物模型的最大好处在于能够实现知识的重用和共享,包括人物间本体类样本的共享以及与其他外部本体的知识交流与共享。但是这种建模方法遭遇了所有基于本体论的系统所具有的问题:即本体的设计问题。本体的设计在很大程度上依赖于研究人员的知识和经验,特别是当定义域很大时,本体设计的有效性更加难以保证。此方法虽然可以缓解知识共享的问题,但是本体设计的全面性和可靠性无法准确保障。仅仅依据研究人员的经验进行设计,会考虑不到用户的个性化需求,从而影响到平台搜索的专业性和准确性。
发明内容
本发明的目的就在于克服上述缺陷,研究一种面向众包平台的服务商特征建模方法。
本发明的技术方案是:
一种面向众包平台的服务商特征建模方法,其主要技术特征在于如下步骤:
(1)对众包平台进行数据爬取,对采集到的数据进行去重、去除冗余预处理;
(2)对预处理后的数据进行数据分类,分为三大类:服务商静态特征、服务商动态特征和服务商绩效评价;其中,服务商静态特征包括:姓名、年龄、地域、擅长领域、历史任务主题词、联系方式;
(3)再根据服务商完成任务的种类分别对服务商动态特征和服务商绩效评价进行分类,分为:完成比稿任务的动态特征、完成招标任务的动态特征、完成比稿任务的绩效评价、完成招标任务的绩效评价;
(4)对服务商动态特征分类后进行竞争学习方法,得到服务商的关键动态特征,完成比稿招标任务的动态特征包括:总交易量、最近三个月交易量、最近一个月交易量、服务领域、退款率、诚信度、纠纷率、受处罚数;对服务商绩效评价分类后进行强化学习方法,得到服务商的关键绩效评价,完成比稿招标任务的绩效评价数据包括:完成质量、工作速度、服务态度、雇主评价、与同行业比较结果;
(5)结合步骤(2)的静态特征和步骤(4)的学习结果,分别提取出服务商的三大特征数据,即服务商静态特征、服务商动态特征和服务商绩效评价数据,作为输出结果,从而建立起完整的服务商特征模型。
本发明的优点和效果在于从用户使用众包平台搜索服务商的角度,通过对服务商建模,从而帮助用户能够快速、准确地搜索到符合需求的服务商。主要有如下一些优点:
(1)目前的大多数众包平台,存在服务商恶意刷单的情况,所以向用户推荐出的服务商并不一定准确可行。我们的方法综合了服务商的三大特征进行建模,更加全面地对服务商进行特征分析,剔除服务商中的欺诈者,有效降低了刷单所带来的影响。
(2)本方法利用机器学习中的竞争学习和强化学习算法,能够准确化、丰富化服务商的特征数据,将更多的关键特征清楚地显示给用户,可作为用户选择服务商的评判标准。
(3)通过本方法,众包平台可以更加精确地向用户进行推荐,综合服务商模型对相关的服务商进行排序,也有助于服务商高效地完成自己擅长的任务。
附图说明
图1——本发明流程示意图。
图2——本发明静态特征模型示意图。
图3——本发明动态特征模型示意图。
图4——本发明服务商绩效评价模型示意图。
图5——本发明竞争学习过程示意图。
图6——本发明强化学习过程示意图。
具体实施方式
本发明的基本技术思路是:
本发明利用机器学习中的竞争学习和强化学习,高效地对众包平台的服务商的属性进行特征建模,主要是将服务商的特征从三个方面进行建模:静态特征、动态特征、绩效评价。将众包平台上的数据进行分类提取,去除重复和冗余的数据,筛选出高质量、可用性强的特征数据。对服务商特征进行建模,将结果导入数据库。通过该方法,众包平台可以更快速地为用户推荐出满足要求的服务商,并且清楚地向用户显示出该服务商的重要特征,从而增强了用户的体验感,进一步提高了平台的服务水平。
下面具体分析本发明。
如图1所示,本发明总体流程图显示如下步骤:
步骤(1).对众包平台数据进行数据爬取,通常得到的数据数量庞大并且没有具体分类,对采集到的数据进行去重、去除冗余、数据整理等预处理。
步骤(2).根据预处理后的平台数据,对其进行数据分类,分为三大类:服务商静态特征、服务商动态特征和服务商绩效评价。其中,服务商静态特征包括:姓名、年龄、地域、擅长领域、历史任务主题词、联系方式等(服务商静态特征模型示意图如图2)。例如:对一个众包平台的服务商特征数据进行分类,分为服务商静态特征、服务商动态特征和服务商绩效评价,其中,服务商静态特征为:姓名-颜麟设计,年龄-35,地域-上海,擅长领域-广告设计、包装设计,历史任务主题词-产品商标、酒店宣传广告,联系方式-1395272****。
步骤(3).再根据完成任务的种类分别对服务商动态特征和服务商绩效评价进行分类,分为:完成比稿任务的动态特征、完成招标任务的动态特征、完成比稿任务的绩效评价、完成招标任务的绩效评价。对服务商动态特征和服务商绩效评价进行再分类后,有助于平台对服务商特征进行更为清晰、准确的描述,有助于用户在查看服务商特征时,看到更为具体实际的内容,更好地选择能够满足其需求的服务商。例如:对服务商-颜麟设计的动态特征和绩效评价进行再分类,得到其完成比稿任务的动态特征、完成招标任务的动态特征、完成比稿任务的绩效评价、完成招标任务的绩效评价。
步骤(4).对服务商动态特征分类后进行竞争学习方法,完成比稿(招标)任务的动态特征包括:总交易量、最近三个月交易量、最近一个月交易量、服务领域、退款率、诚信度、纠纷率、受处罚数(动态特征模型示意图如图3);对服务商绩效评价分类后进行强化学习,完成比稿(招标)任务的绩效评价数据包括:完成质量、工作速度、服务态度、雇主评价、与同行业比较结果(服务商绩效评价模型示意图如图4)。通过两种学习方法,有助于平台对服务商进行客观、准确的综合评价。例如:对服务商-颜麟设计的动态特征进行竞争学习方法,得到关于每一个特定类型任务的动态特征,输出动态特征中各具体特征的属性值;对服务商-颜麟设计的绩效评价进行强化学习方法,得到关于每一个特定类型任务的绩效评价,输出服务商绩效评价中各具体特征的属性值。
具体数据如下表:
完成比稿任务的绩效评价 | 完成招标任务的绩效评价 | |
完成质量 | 4.87 | 4.78 |
工作速度 | 4.93 | 4.94 |
服务态度 | 5.00 | 5.00 |
雇主评价 | 中评 | 中评 |
与同行业比较结果 | 低0.51% | 低0.47% |
步骤(5).结合步骤(2)的服务商静态特征和步骤(4)的竞争学习方法、强化学习方法结果,分别提取出相关服务商的三大特征数据(即服务商静态特征、服务商动态特征和服务商绩效评价数据),作为输出结果,从而建立起完整的服务商特征模型。本发明能够有效地帮助平台建立起一个完整清晰的服务商特征模型,实现了对服务商特征的分类显示,为用户提供了相对客观、准确的服务商评价,有助于用户选择合适的服务商满足其需求。例如:对服务商-颜麟设计的三大特征数据进行提取汇总,作为输出结果。具体如下:
静态特征:姓名-颜麟设计,年龄-35,地域-上海,擅长领域-广告设计、包装设计,历史任务主题词-产品商标、酒店宣传广告,联系方式-1395272****。
动态特征:
绩效评价:
完成比稿任务的绩效评价 | 完成招标任务的绩效评价 | |
完成质量 | 4.87 | 4.78 |
工作速度 | 4.93 | 4.94 |
服务态度 | 5.00 | 5.00 |
雇主评价 | 中评 | 中评 |
与同行业比较结果 | 低0.51% | 低0.47% |
竞争学习方法中的胜者全拿算法,作用于一层结点中单个的结点,而这一结点对输入模式有强烈的反应。胜者全拿可被看成是一个网络结点集合中的竞争,竞争获胜者的输出信号为1。获胜者的权值向量将得到奖励:它的每一个分量都向输入向量靠近。服务商动态特征包括:总交易量、最近三个月交易量、最近一个月交易量、服务领域、退款率、诚信度、纠纷率、受处罚数等,可以使用这种竞争学习算法对动态特征进行学习,将动态特征作为输入向量值X=(x1,x2…),输入网络中包含结点A,B…N的网络层(竞争学习过程示意图如图5),从而提取出准确、关键的动态特征数据。
强化学习方法是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。通过强化学习,可以对服务商绩效评价数据进行评价处理,根据环境不同所带来的状态和回报的改变,智能体会产生一系列的相关行动(强化学习过程示意图如图6所示),从而可以针对完成质量、服务态度、工作速度等方面进行统计和预测。
Claims (1)
1.一种面向众包平台的服务商特征建模方法,其特征在于如下步骤:
(1)对众包平台进行数据爬取,对采集到的数据进行去重、去除冗余预处理;
(2)对预处理后的数据进行数据分类,分为三大类:服务商静态特征、服务商动态特征和服务商绩效评价;其中,服务商静态特征包括:姓名、年龄、地域、擅长领域、历史任务主题词、联系方式;
(3)再根据服务商完成任务的种类分别对服务商动态特征和服务商绩效评价进行分类,分为:完成比稿任务的动态特征、完成招标任务的动态特征、完成比稿任务的绩效评价、完成招标任务的绩效评价;
(4)对服务商动态特征分类后进行竞争学习方法,得到服务商的关键动态特征,完成比稿招标任务的动态特征包括:总交易量、最近三个月交易量、最近一个月交易量、服务领域、退款率、诚信度、纠纷率、受处罚数;对服务商绩效评价分类后进行强化学习方法,得到服务商的关键绩效评价,完成比稿招标任务的绩效评价数据包括:完成质量、工作速度、服务态度、雇主评价、与同行业比较结果;
(5)结合步骤(2)的静态特征和步骤(4)的学习结果,分别提取出服务商的三大特征数据,即服务商静态特征、服务商动态特征和服务商绩效评价数据,作为输出结果,从而建立起完整的服务商特征模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610216308.9A CN105931055A (zh) | 2016-04-05 | 2016-04-05 | 一种面向众包平台的服务商特征建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610216308.9A CN105931055A (zh) | 2016-04-05 | 2016-04-05 | 一种面向众包平台的服务商特征建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105931055A true CN105931055A (zh) | 2016-09-07 |
Family
ID=56840264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610216308.9A Pending CN105931055A (zh) | 2016-04-05 | 2016-04-05 | 一种面向众包平台的服务商特征建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105931055A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767058A (zh) * | 2017-10-26 | 2018-03-06 | 北京航空航天大学 | 一种众包软件开发者推荐方法 |
CN108428060A (zh) * | 2018-03-28 | 2018-08-21 | 施益斌 | 平台服务器以及建筑设计师评分系统 |
CN108564338A (zh) * | 2018-03-28 | 2018-09-21 | 施益斌 | 平台服务器以及建筑设计招投标服务系统 |
CN109064118A (zh) * | 2018-07-03 | 2018-12-21 | 酷客众包平台(深圳)有限公司 | 提供电子解决方案的方法及系统 |
CN113537731A (zh) * | 2021-06-25 | 2021-10-22 | 中国海洋大学 | 基于强化学习的设计资源能力评估方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090018847A1 (en) * | 2007-07-10 | 2009-01-15 | Accenture Global Services Gmbh | Modeling and forecasting service performance |
CN104346698A (zh) * | 2014-11-05 | 2015-02-11 | 无锡雅座在线科技发展有限公司 | 基于云计算和数据挖掘的餐饮会员大数据分析和考核系统 |
CN104794154A (zh) * | 2015-03-11 | 2015-07-22 | 南通天呈医流互联网技术有限公司 | 基于文本挖掘的医疗器械o2o服务质量评价模型 |
-
2016
- 2016-04-05 CN CN201610216308.9A patent/CN105931055A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090018847A1 (en) * | 2007-07-10 | 2009-01-15 | Accenture Global Services Gmbh | Modeling and forecasting service performance |
CN104346698A (zh) * | 2014-11-05 | 2015-02-11 | 无锡雅座在线科技发展有限公司 | 基于云计算和数据挖掘的餐饮会员大数据分析和考核系统 |
CN104794154A (zh) * | 2015-03-11 | 2015-07-22 | 南通天呈医流互联网技术有限公司 | 基于文本挖掘的医疗器械o2o服务质量评价模型 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767058A (zh) * | 2017-10-26 | 2018-03-06 | 北京航空航天大学 | 一种众包软件开发者推荐方法 |
CN107767058B (zh) * | 2017-10-26 | 2021-03-19 | 北京航空航天大学 | 一种众包软件开发者推荐方法 |
CN108428060A (zh) * | 2018-03-28 | 2018-08-21 | 施益斌 | 平台服务器以及建筑设计师评分系统 |
CN108564338A (zh) * | 2018-03-28 | 2018-09-21 | 施益斌 | 平台服务器以及建筑设计招投标服务系统 |
CN108428060B (zh) * | 2018-03-28 | 2021-09-28 | 施益斌 | 平台服务器以及建筑设计师评分系统 |
CN108564338B (zh) * | 2018-03-28 | 2021-10-01 | 施益斌 | 平台服务器以及建筑设计招投标服务系统 |
CN109064118A (zh) * | 2018-07-03 | 2018-12-21 | 酷客众包平台(深圳)有限公司 | 提供电子解决方案的方法及系统 |
CN113537731A (zh) * | 2021-06-25 | 2021-10-22 | 中国海洋大学 | 基于强化学习的设计资源能力评估方法 |
CN113537731B (zh) * | 2021-06-25 | 2023-10-27 | 中国海洋大学 | 基于强化学习的设计资源能力评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101895249B1 (ko) | 지능 문답 구현 방법, 시스템 및 저장 매체 | |
CN103336766B (zh) | 短文本垃圾识别以及建模方法和装置 | |
CN103761254B (zh) | 多领域服务主题匹配推荐方法 | |
KR102032091B1 (ko) | 인공지능 기반의 댓글 감성 분석 방법 및 그 시스템 | |
CN105931055A (zh) | 一种面向众包平台的服务商特征建模方法 | |
CN105843897A (zh) | 一种面向垂直领域的智能问答系统 | |
CN106649260A (zh) | 基于评论文本挖掘的产品特征结构树构建方法 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN107305539A (zh) | 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法 | |
CN105930469A (zh) | 基于Hadoop的个性化旅游推荐系统及方法 | |
CN103646088A (zh) | 基于CRFs和SVM的产品评论细粒度情感要素提取 | |
CN107832781A (zh) | 一种面向多源数据的软件缺陷表示学习方法 | |
CN106997341A (zh) | 一种创新方案匹配方法、装置、服务器及系统 | |
CN105069103A (zh) | App搜索引擎利用用户评论的方法及系统 | |
CN112199512B (zh) | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 | |
CN111209363A (zh) | 语料数据处理方法、装置、服务器和存储介质 | |
Yang et al. | A decision method for online purchases considering dynamic information preference based on sentiment orientation classification and discrete DIFWA operators | |
CN105787662A (zh) | 基于属性的移动应用软件性能预测方法 | |
Wu et al. | ECNU at SemEval-2017 task 3: Using traditional and deep learning methods to address community question answering task | |
CN107305545A (zh) | 一种基于文本倾向性分析的网络意见领袖的识别方法 | |
CN109345272A (zh) | 一种基于改进马尔科夫链的店铺信用风险预测方法 | |
CN107862037B (zh) | 一种基于实体连通图的事件模版构造方法 | |
CN108470035A (zh) | 一种基于判别混合模型的实体-引文相关性分类方法 | |
CN115730078A (zh) | 用于类案检索的事件知识图谱构建方法、装置及电子设备 | |
Sun et al. | Important attribute identification in knowledge graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160907 |
|
RJ01 | Rejection of invention patent application after publication |