CN110599052B - Ota酒店评价方法、系统、电子设备和介质 - Google Patents
Ota酒店评价方法、系统、电子设备和介质 Download PDFInfo
- Publication number
- CN110599052B CN110599052B CN201910884312.6A CN201910884312A CN110599052B CN 110599052 B CN110599052 B CN 110599052B CN 201910884312 A CN201910884312 A CN 201910884312A CN 110599052 B CN110599052 B CN 110599052B
- Authority
- CN
- China
- Prior art keywords
- value
- information
- comment
- evaluation
- ota hotel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 166
- 230000002238 attenuated effect Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims description 61
- 238000007781 pre-processing Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 16
- 238000013145 classification model Methods 0.000 claims description 10
- 238000013135 deep learning Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 238000007635 classification algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种OTA酒店评价方法、系统、电子设备和介质,其中OTA酒店评价方法,包括以下步骤:获取历史用户对OTA酒店的点评信息;根据点评信息的文本内容获取与点评信息对应的点评数值;根据点评信息的存在时间获取与点评信息对应的衰减系数,衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值;获取OTA酒店的评价值,评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。本发明通过对OTA酒店点评信息的分析,获取点评数值,并根据点评信息的存在时间对点评数值进行衰减,提高了对该OTA酒店的评价的准确度。
Description
技术领域
本发明属于OTA(Online Travel Agency,在线旅游)酒店评价技术领域,尤其涉及一种OTA酒店评价方法、系统、电子设备和介质。
背景技术
目前OTA行业中,酒店的数量庞大。用户在通过OTA平台选择酒店的过程中,常常需要了解酒店的评价信息。现有技术中个,往往需要人工对酒店进行评价打分,效率较低;而且,其对酒店的评价往往不够准确,对用户的参考价值大大降低。
发明内容
本发明要解决的技术问题是为了克服现有技术中对OTA酒店的评价的准确度低的缺陷,提供一种OTA酒店评价方法、系统、电子设备和介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种OTA酒店评价方法,包括以下步骤:
获取历史用户对OTA酒店的点评信息;
根据点评信息的文本内容获取与点评信息对应的点评数值;
根据点评信息的存在时间获取与点评信息对应的衰减系数,衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值;
获取OTA酒店的评价值,评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。
较佳地,设存在时间为t,设衰减系数为ca,则衰减系数ca=e-λt,λ为衰减因子。
较佳地,根据点评信息的文本内容获取与点评信息对应的点评数值的步骤包括:
S21、构建预训练集,预训练集包括文本语料信息和与文本语料信息向对应的标记,标记包括正向、负向;
S22、将预训练集划分为第一训练集和第二训练集;
S23、对第一训练集使用深度学习分类模型进行训练以得到第一模型;
S24、使用第二训练集对第一模型进行验证以得到第一模型的准确率,如果准确率小于预设阈值,则返回步骤S23,如果准确率大于等于预设阈值,则以第一模型作为目标模型;
S25、使用目标模型对点评信息的文本内容进行分类以得到点评信息对应的点评数值。
较佳地,OTA酒店评价方法还包括以下步骤:
对点评信息进行预处理,预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种;
则步骤S25包括使用目标模型对预处理后的点评信息的文本内容进行分类以得到点评数值。
较佳地,OTA酒店评价方法还包括:
获取OTA酒店的服务条款信息;
获取服务条款信息与目标标签的第一匹配数值;
获取OTA酒店的评价数值,评价数值为评价值与第一匹配数值的加权和;
判断评价数值是否达到预设基准值,如果达到预设基准值,则为OTA酒店添加目标标签。
较佳地,OTA酒店评价方法还包括:
获取OTA酒店的设施设备信息;
获取设施设备信息与目标标签的第二匹配数值;
则评价数值为评价值、第一匹配数值与第二匹配数值的加权和。
较佳地,OTA酒店评价方法还包括:
获取OTA酒店与目标POI(Point of Interest,兴趣点)的距离;
根据距离生成对应的第三匹配数值;
则评价数值为评价值、第一匹配数值、第二匹配数值与第三匹配数值的加权和。
本发明还提供一种OTA酒店评价系统,包括信息获取单元、点评数值获取单元、衰减系数获取单元、评价值获取单元;
信息获取单元用于获取历史用户对OTA酒店的点评信息;
点评数值获取单元用于根据点评信息的文本内容获取与点评信息对应的点评数值;
衰减系数获取单元用于根据点评信息的存在时间获取与点评信息对应的衰减系数,衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值;
评价值获取单元用于获取OTA酒店的评价值,评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。
较佳地,设存在时间为t,设衰减系数为ca,则衰减系数ca=e-λt,λ为衰减因子。
较佳地,点评数值获取单元还用于根据以下步骤获取与点评信息对应的点评数值:
S21、构建预训练集,预训练集包括文本语料信息和与文本语料信息向对应的标记,标记包括正向、负向;
S22、将预训练集划分为第一训练集和第二训练集;
S23、对第一训练集使用深度学习分类模型进行训练以得到第一模型;
S24、使用第二训练集对第一模型进行验证以得到第一模型的准确率,如果准确率小于预设阈值,则返回步骤S23,如果准确率大于等于预设阈值,则以第一模型作为目标模型;
S25、使用目标模型对点评信息的文本内容进行分类以得到点评信息对应的点评数值。
较佳地,OTA酒店评价系统还包括预处理单元;
预处理单元用于对点评信息进行预处理,预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种;
则点评数值获取单元还用于使用目标模型对预处理后的点评信息的文本内容进行分类以得到点评数值。
较佳地,OTA酒店评价系统还包括匹配值获取单元、评价数值获取单元、标签设置单元;
信息获取单元还用于获取OTA酒店的服务条款信息;
匹配值获取单元用于获取服务条款信息与目标标签的第一匹配数值;
评价数值获取单元用于获取OTA酒店的评价数值,评价数值为评价值与第一匹配数值的加权和;
标签设置单元判断评价数值是否达到预设基准值,如果达到预设基准值,则标签设置单元还用于为OTA酒店添加目标标签。
较佳地,信息获取单元还用于获取OTA酒店的设施设备信息;
匹配值获取单元还用于获取设施设备信息与目标标签的第二匹配数值;
则评价数值为评价值、第一匹配数值与第二匹配数值的加权和。
较佳地,信息获取单元还用于获取OTA酒店与目标POI的距离;
匹配值获取单元还用于根据距离生成对应的第三匹配数值;
则评价数值为评价值、第一匹配数值、第二匹配数值与第三匹配数值的加权和。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明的OTA酒店评价方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本发明的OTA酒店评价方法的步骤。
本发明的积极进步效果在于:本发明通过对OTA酒店点评信息的分析,获取点评数值,并根据点评信息的存在时间对点评数值进行衰减,提高了对该OTA酒店的评价的准确度。
附图说明
图1为本发明的实施例1的OTA酒店评价方法的流程图。
图2为本发明的实施例1的OTA酒店评价方法的步骤S12的流程图。
图3为本发明的实施例1的OTA酒店评价系统的结构示意图。
图4为本发明的实施例2的OTA酒店评价方法的流程图。
图5为本发明的实施例2的OTA酒店评价系统的结构示意图。
图6为本发明的实施例3的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种OTA酒店评价方法。参照图1,该OTA酒店评价方法包括以下步骤:
步骤S11、获取历史用户对OTA酒店的点评信息。历史用户对该OTA酒店的点评信息保存在OTA平台上。
步骤S12、根据点评信息的文本内容获取与点评信息对应的点评数值。
具体实施时,参照图2,根据点评信息的文本内容获取与点评信息对应的点评数值的步骤S12包括以下步骤:
步骤S21、构建预训练集。预训练集包括文本语料信息和与文本语料信息向对应的标记,标记包括正向、负向。作为一种可选的实施方式,预训练集的文本语料信息包括公开的开源的文本语料信息。在其他可选的实施方式中,预训练集的文本语料信息包括历史用户对OTA酒店的点评信息。预训练集中已经包括了与文本语料信息向对应的标记,标记包括正向、负向。如果该文本语料信息所表征的评价内容是正向的、积极的评价,则标记为“1”;如果该文本语料信息所表征的评价内容是负向的、消极的评价,则标记为“-1”。
步骤S22、将预训练集划分为第一训练集和第二训练集。具体划分时,按照预设的比例进行随机划分。
步骤S23、对第一训练集使用深度学习分类模型进行训练以得到第一模型。在一种可选的实施方式中,深度学习分类模型采用的分类算法为TextCNN(一种文本分类算法)。在其他可选的实施方式中,深度学习分类模型采用的分类算法为LSTM(Long Short-TermMemory,长短期记忆网络)或BiLSTM(Bi-directional Long Short-Term Memory,双向长短期记忆网络)等分类算法。
步骤S24、使用第二训练集对第一模型进行验证以得到第一模型的准确率。其中准确率为第一模型对第二训练集中的文本语料信息的分类正确(即分类结果与文本语料信息的标记一致)的文本预料信息占第二训练集中的文本语料信息的总量的比例。
步骤S25、判断准确率是否小于预设阈值,如果准确率小于预设阈值,则返回步骤S23,如果准确率大于等于预设阈值,则执行步骤S26。也即,不断训练第一模型,直到其准确率达到预设阈值,该预设阈值可以根据需求设置,通常越高越好。
步骤S26、以第一模型作为目标模型,并使用目标模型对点评信息的文本内容进行分类以得到点评信息对应的点评数值。也即,采用目标模型将OTA平台中关于该OTA酒店的历史点评信息逐条进行分类,得到其点评数值。在本实施例中,该点评数值为该点评信息对应的分类值,如果该点评信息表征的评价内容为正向的、积极的评价,则其分类值为“1”,如果该点评信息表征的评价内容为负向的、消极的评价,则其分类值为“-1”。
在其他可选的实施方式中,在步骤S11之后,该OTA酒店评价方法还包括以下步骤:对点评信息进行预处理,预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种。则在步骤S26中,以第一模型作为目标模型,并使用目标模型对预处理后的点评信息的文本内容进行分类以得到点评信息对应的点评数值。进行预处理,可以提高分类的准确率。
在步骤S12之后,本实施例的OTA酒店评价方法还包括以下步骤:
步骤S13、根据点评信息的存在时间获取与点评信息对应的衰减系数。衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值,也即,存在时间为该点评信息生成(被发布在OTA平台上)至对该OTA酒店进行评价之时该点评信息已经存在的时间长度。设存在时间为t,设衰减系数为ca,则衰减系数ca=e-λt,λ为衰减因子。也即,该评价信息生成的时间越早,距离当前时间越远,对应的衰减系数越小。衰减因子λ的较佳的取值范围为0.2至0.5。
步骤S14、获取OTA酒店的评价值。评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。其中,每一条点评信息的衰减后的分值com_di=comi×e-λt,i∈[1,n],comi为第i条点评信息对应的点评数值,其数值为“1”或“-1”,n为点评信息的总数量。也即,该评价信息生成的时间越早,距离当前时间越远,其对该OTA酒店的评价值的影响越小。OTA酒店的评价值i∈[1,n]。
OTA酒店的评价值可以作为历史用户对该OTA酒店的点评状况的参考值,供用户在选择OTA酒店时参考。
本实施例还提供一种OTA酒店评价系统。参照图3,该OTA酒店评价系统包括信息获取单元101、点评数值获取单元102、衰减系数获取单元103、评价值获取单元104。信息获取单元101用于获取历史用户对OTA酒店的点评信息;点评数值获取单元用于根据点评信息的文本内容获取与点评信息对应的点评数值;衰减系数获取单元用于根据点评信息的存在时间获取与点评信息对应的衰减系数,衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值;评价值获取单元用于获取OTA酒店的评价值,评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。
具体实施时,首先,信息获取单元101获取历史用户对OTA酒店的点评信息。历史用户对该OTA酒店的点评信息保存在OTA平台上。
然后,点评数值获取单元102根据点评信息的文本内容获取与点评信息对应的点评数值。
具体实施时,参照图2,点评数值获取单元102根据以下步骤获取与点评信息对应的点评数值:
步骤S21、构建预训练集。分值获取单元102先构建预训练集。预训练集包括文本语料信息和与文本语料信息向对应的标记,标记包括正向、负向。作为一种可选的实施方式,预训练集的文本语料信息包括公开的开源的文本语料信息。在其他可选的实施方式中,预训练集的文本语料信息包括历史用户对OTA酒店的点评信息。预训练集中已经包括了与文本语料信息向对应的标记,标记包括正向、负向。如果该文本语料信息所表征的评价内容是正向的、积极的评价,则标记为“1”;如果该文本语料信息所表征的评价内容是负向的、消极的评价,则标记为“-1”。
步骤S22、将预训练集划分为第一训练集和第二训练集。具体划分时,分值获取单元102按照预设的比例将预训练集随机划分为两个训练集。
步骤S23、对第一训练集使用深度学习分类模型进行训练以得到第一模型。在一种可选的实施方式中,深度学习分类模型采用的分类算法为TextCNN。在其他可选的实施方式中,深度学习分类模型采用的分类算法为LSTM或BiLSTM等分类算法。
步骤S24、使用第二训练集对第一模型进行验证以得到第一模型的准确率。其中准确率为第一模型对第二训练集中的文本语料信息的分类正确(即分类结果与文本语料信息的标记一致)的文本预料信息占第二训练集中的文本语料信息的总量的比例。
步骤S25、判断准确率是否小于预设阈值,如果准确率小于预设阈值,则返回步骤S23,如果准确率大于等于预设阈值,则执行步骤S26。也即,分值获取单元102不断训练第一模型,直到其准确率达到预设阈值,该预设阈值可以根据需求设置,通常越高越好。
步骤S26、以第一模型作为目标模型,并使用目标模型对点评信息的文本内容进行分类以得到点评信息对应的点评数值。也即,分值获取单元102采用目标模型将OTA平台中关于该OTA酒店的历史点评信息逐条进行分类,得到其点评数值。在本实施例中,该点评数值为该点评信息对应的分类值,如果该点评信息表征的评价内容为正向的、积极的评价,则其分类值为“1”,如果该点评信息表征的评价内容为负向的、消极的评价,则其分类值为“-1”。
在其他可选的实施方式中,该OTA酒店评价系统还包括预处理单元。预处理单元用于对点评信息进行预处理,预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种。则点评数值获取单元还用于使用目标模型对预处理后的点评信息的文本内容进行分类以得到点评数值。进行预处理,可以提高分类的准确率。
在获取与点评信息对应的点评数值之后,衰减系数获取单元103根据点评信息的存在时间获取与点评信息对应的衰减系数。衰减系数与存在时间负相关,存在时间为当前时间与点评信息的生成时间之间的差值,也即,存在时间为该点评信息生成(被发布在OTA平台上)至对该OTA酒店进行评价之时该点评信息已经存在的时间长度。设存在时间为t,设衰减系数为ca,则衰减系数ca=e-λt,λ为衰减因子。也即,该评价信息生成的时间越早,距离当前时间越远,对应的衰减系数越小。衰减因子λ的较佳的取值范围为0.2至0.5。
接下来,评价值获取单元104获取OTA酒店的评价值。评价值为所有点评信息的衰减后的分值的累加和,衰减后的分值为点评数值与衰减系数的乘积。其中,每一条点评信息的衰减后的分值com_di=comi×e-λt,i∈[1,n],comi为第i条点评信息对应的点评数值,其数值为“1”或“-1”,n为点评信息的总数量。也即,该评价信息生成的时间越早,距离当前时间越远,其对该OTA酒店的评价值的影响越小。OTA酒店的评价值i∈[1,n]。
OTA酒店的评价值可以作为历史用户对该OTA酒店的点评状况的参考值,供用户在选择OTA酒店时参考。
实施例2
本实施例提供一种OTA酒店评价方法。参照图4,本实施例的OTA酒店评价方法包括实施例1的OTA酒店评价方法的所有步骤,本实施例的OTA酒店评价方法还包括以下步骤:
步骤S15、获取OTA酒店的服务条款信息,获取服务条款信息与目标标签的第一匹配数值。例如,OTA酒店的服务条款信息包括是否允许携带儿童、是否允许携带宠物、是否允许加床,等。假设目标标签的需求为“允许加床”、“允许携带儿童”。如果该OTA酒店的服务条款信息包括允许携带儿童的条款,则该OTA酒店符合该目标标签的部分需求。作为一种通用的表达,该OTA酒店的第一匹配数值i∈[1,m],其中,poli(i∈[1,m])为OTA酒店的服务条款信息中的第i项服务条款信息与目标标签匹配的得分,如果匹配,则poli=5,否则,poli=0。m为OTA酒店的服务条款信息的总数量。
步骤S16、获取OTA酒店的设施设备信息,获取设施设备信息与目标标签的第二匹配数值。OTA酒店的设施设备信息包括“是否设置有游泳池”、“是否设置有儿童游乐设施”等,如果OTA酒店的设施设备信息所包含的某些项与目标标签的需求相匹配,则得到对应的分值。作为一种通用的表达,该OTA酒店的第二匹配数值i∈[1,j],其中,faci(i∈[1,j])为OTA酒店的服务条款信息中的第i项设施设备信息与目标标签匹配的得分,如果匹配,则faci=3,否则,faci=0。j为OTA酒店的设施设备信息的总数量。
步骤S17、获取OTA酒店与目标POI的距离,根据距离生成对应的第三匹配数值。具体为,根据该OTA酒店的经纬度与目标POI的经纬度计算得到OTA酒店与目标POI的距离。目标POI包括景点、博物馆、游乐场、游乐园、商场等。OTA酒店与目标POI的距离不大于预设距离范围,则认为该OTA酒店是该目标POI周边的酒店,并赋予向对应的分值。作为一种通用的表达,该OTA酒店的第三匹配数值i∈[1,k],其中,poii(i∈[1,k])为该OTA酒店与第i个目标POI匹配的得分,如果匹配(即该OTA酒店与第i个目标POI的距离不大于预设距离范围),则poii=3,否则,poii=0。k为OTA酒店的目标POI的总数量。
步骤S18、获取OTA酒店的评价数值。评价数值为评价值、第一匹配数值、第二匹配数值与第三匹配数值的加权和。具体为,评价数值a_score=ω1×pol_score+ω2×fac_score+ω3×poi_score+ω4×com_score。其中,ω1为OTA酒店的服务条款信息对应的第一匹配数值的权重系数,ω2为设施设备信息对应的第二匹配数值的权重系数,ω3为POI距离对应的第三匹配数值的权重系数,ω4为点评信息对应的评价值的权重系数。ω1、ω2、ω3和ω4的值可以根据需求合理设置。作为一种可选的实施方式,ω1=0.77,ω2=0.9,ω3=0.85,ω4=0.95。
步骤S19、判断评价数值是否达到预设基准值,如果达到预设基准值,则为OTA酒店添加目标标签。
添加标签后,可以方便用户在OTA平台上选择OTA酒店时进行识别,便于用户选择符合需求的OTA酒店。标签包括“亲子酒店”、“海滨风光”、“浪漫情侣”、“休闲度假”等。不同的标签分别具有对应的服务条款信息要求、设施设备信息要求、目标POI要求、评价值要求。
在一种可选的实施方式中,步骤S15、步骤S16、步骤S17的顺序可以根据需要排列,也可以同时进行。
在另一种可选的实施方式中,步骤S15、步骤S16、步骤S17中的一项或两项可以省略,则评价数值相应调整。
本实施例还提供一种OTA酒店评价系统。参照图5,本实施例的OTA酒店评价系统包括实施例1的OTA酒店评价系统的所有单元,本实施例的OTA酒店评价方法还包括匹配值获取单元105、评价数值获取单元106、标签设置单元107。
信息获取单元101获取OTA酒店的服务条款信息,匹配值获取单元105获取服务条款信息与目标标签的第一匹配数值。例如,OTA酒店的服务条款信息包括是否允许携带儿童、是否允许携带宠物、是否允许加床,等。假设目标标签的需求为“允许加床”、“允许携带儿童”。如果该OTA酒店的服务条款信息包括允许携带儿童的条款,则该OTA酒店符合该目标标签的部分需求。作为一种通用的表达,该OTA酒店的第一匹配数值i∈[1,m],其中,poli(i∈[1,m])为OTA酒店的服务条款信息中的第i项服务条款信息与目标标签匹配的得分,如果匹配,则poli=5,否则,poli=0。m为OTA酒店的服务条款信息的总数量。
信息获取单元101获取OTA酒店的设施设备信息,匹配值获取单元105获取设施设备信息与目标标签的第二匹配数值。OTA酒店的设施设备信息包括“是否设置有游泳池”、“是否设置有儿童游乐设施”等,如果OTA酒店的设施设备信息所包含的某些项与目标标签的需求相匹配,则得到对应的分值。作为一种通用的表达,该OTA酒店的第二匹配数值i∈[1,j],其中,faci(i∈[1,j])为OTA酒店的服务条款信息中的第i项设施设备信息与目标标签匹配的得分,如果匹配,则faci=3,否则,faci=0。j为OTA酒店的设施设备信息的总数量。
信息获取单元101获取OTA酒店与目标POI的距离,匹配值获取单元105根据距离生成对应的第三匹配数值。具体为,信息获取单元101根据该OTA酒店的经纬度与目标POI的经纬度计算得到OTA酒店与目标POI的距离。目标POI包括景点、博物馆、游乐场、游乐园、商场等。OTA酒店与目标POI的距离不大于预设距离范围,则认为该OTA酒店是该目标POI周边的酒店,并赋予向对应的分值。作为一种通用的表达,该OTA酒店的第三匹配数值i∈[1,k],其中,poii(i∈[1,k])为该OTA酒店与第i个目标POI匹配的得分,如果匹配(即该OTA酒店与第i个目标POI的距离不大于预设距离范围),则poii=3,否则,poii=0。k为OTA酒店的目标POI的总数量。
评价数值获取单元106获取OTA酒店的评价数值。评价数值为评价值、第一匹配数值、第二匹配数值与第三匹配数值的加权和。具体为,评价数值a_score=ω1×pol_score+ω2×fac_score+ω3×poi_score+ω4×com_score。其中,ω1为OTA酒店的服务条款信息对应的第一匹配数值的权重系数,ω2为设施设备信息对应的第二匹配数值的权重系数,ω3为POI距离对应的第三匹配数值的权重系数,ω4为点评信息对应的评价值的权重系数。ω1、ω2、ω3和ω4的值可以根据需求合理设置。作为一种可选的实施方式,ω1=0.77,ω2=0.9,ω3=0.85,ω4=0.95。
标签设置单元107判断评价数值是否达到预设基准值,如果达到预设基准值,则为OTA酒店添加目标标签。
添加标签后,可以方便用户在OTA平台上选择OTA酒店时进行识别,便于用户选择符合需求的OTA酒店。标签包括“亲子酒店”、“海滨风光”、“浪漫情侣”、“休闲度假”等。不同的标签分别具有对应的服务条款信息要求、设施设备信息要求、目标POI要求、评价值要求。
实施例3
图6为本实施例提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1或实施例2的OTA酒店评价方法。图6显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或实施例2的OTA酒店评价方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1或实施例2的OTA酒店评价方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1或实施例2的OTA酒店评价方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (14)
1.一种OTA酒店评价方法,其特征在于,包括以下步骤:
获取历史用户对所述OTA酒店的点评信息;
根据所述点评信息的文本内容获取与所述点评信息对应的点评数值;
根据所述点评信息的存在时间获取与所述点评信息对应的衰减系数,所述衰减系数与所述存在时间负相关,所述存在时间为当前时间与所述点评信息的生成时间之间的差值;
获取所述OTA酒店的评价值,所述评价值为所有所述点评信息的衰减后的分值的累加和,所述衰减后的分值为所述点评数值与所述衰减系数的乘积;
所述OTA酒店评价方法还包括:
获取所述OTA酒店的服务条款信息;
获取所述服务条款信息与目标标签的第一匹配数值;
获取所述OTA酒店的评价数值,所述评价数值为所述评价值与所述第一匹配数值的加权和;
判断所述评价数值是否达到预设基准值,如果达到所述预设基准值,则为所述OTA酒店添加所述目标标签。
2.如权利要求1所述的OTA酒店评价方法,其特征在于,设所述存在时间为t,设所述衰减系数为ca,则所述衰减系数ca=e-λt,λ为衰减因子。
3.如权利要求1所述的OTA酒店评价方法,其特征在于,所述根据所述点评信息的文本内容获取与所述点评信息对应的点评数值的步骤包括:
S21、构建预训练集,所述预训练集包括文本语料信息和与所述文本语料信息向对应的标记,所述标记包括正向、负向;
S22、将所述预训练集划分为第一训练集和第二训练集;
S23、对所述第一训练集使用深度学习分类模型进行训练以得到第一模型;
S24、使用所述第二训练集对所述第一模型进行验证以得到所述第一模型的准确率,如果所述准确率小于预设阈值,则返回步骤S23,如果所述准确率大于等于所述预设阈值,则以所述第一模型作为目标模型;
S25、使用所述目标模型对所述点评信息的文本内容进行分类以得到所述点评信息对应的点评数值。
4.如权利要求3所述的OTA酒店评价方法,其特征在于,所述OTA酒店评价方法还包括以下步骤:
对所述点评信息进行预处理,所述预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种;
则步骤S25包括使用所述目标模型对预处理后的所述点评信息的文本内容进行分类以得到所述点评数值。
5.如权利要求1所述的OTA酒店评价方法,其特征在于,所述OTA酒店评价方法还包括:
获取所述OTA酒店的设施设备信息;
获取所述设施设备信息与目标标签的第二匹配数值;
则所述评价数值为所述评价值、所述第一匹配数值与所述第二匹配数值的加权和。
6.如权利要求5所述的OTA酒店评价方法,其特征在于,所述OTA酒店评价方法还包括:
获取所述OTA酒店与目标POI的距离;
根据所述距离生成对应的第三匹配数值;
则所述评价数值为所述评价值、所述第一匹配数值、所述第二匹配数值与所述第三匹配数值的加权和。
7.一种OTA酒店评价系统,其特征在于,包括信息获取单元、点评数值获取单元、衰减系数获取单元、评价值获取单元;
所述信息获取单元用于获取历史用户对所述OTA酒店的点评信息;
所述点评数值获取单元用于根据所述点评信息的文本内容获取与所述点评信息对应的点评数值;
所述衰减系数获取单元用于根据所述点评信息的存在时间获取与所述点评信息对应的衰减系数,所述衰减系数与所述存在时间负相关,所述存在时间为当前时间与所述点评信息的生成时间之间的差值;
所述评价值获取单元用于获取所述OTA酒店的评价值,所述评价值为所有所述点评信息的衰减后的分值的累加和,所述衰减后的分值为所述点评数值与所述衰减系数的乘积;
所述OTA酒店评价系统还包括匹配值获取单元、评价数值获取单元、标签设置单元;
所述信息获取单元还用于获取所述OTA酒店的服务条款信息;
所述匹配值获取单元用于获取所述服务条款信息与目标标签的第一匹配数值;
所述评价数值获取单元用于获取所述OTA酒店的评价数值,所述评价数值为所述评价值与所述第一匹配数值的加权和;
所述标签设置单元判断所述评价数值是否达到预设基准值,如果达到所述预设基准值,则所述标签设置单元还用于为所述OTA酒店添加所述目标标签。
8.如权利要求7所述的OTA酒店评价系统,其特征在于,设所述存在时间为t,设所述衰减系数为ca,则所述衰减系数ca=e-λt,λ为衰减因子。
9.如权利要求7所述的OTA酒店评价系统,其特征在于,所述点评数值获取单元还用于根据以下步骤获取与所述点评信息对应的点评数值:
S21、构建预训练集,所述预训练集包括文本语料信息和与所述文本语料信息向对应的标记,所述标记包括正向、负向;
S22、将所述预训练集划分为第一训练集和第二训练集;
S23、对所述第一训练集使用深度学习分类模型进行训练以得到第一模型;
S24、使用所述第二训练集对所述第一模型进行验证以得到所述第一模型的准确率,如果所述准确率小于预设阈值,则返回步骤S23,如果所述准确率大于等于所述预设阈值,则以所述第一模型作为目标模型;
S25、使用所述目标模型对所述点评信息的文本内容进行分类以得到所述点评信息对应的点评数值。
10.如权利要求9所述的OTA酒店评价系统,其特征在于,所述OTA酒店评价系统还包括预处理单元;
所述预处理单元用于对所述点评信息进行预处理,所述预处理包括将繁体字转换为简体字、去除目标标点符号、将全角字符转换为半角字符中的至少一种;
则所述点评数值获取单元还用于使用所述目标模型对预处理后的所述点评信息的文本内容进行分类以得到所述点评数值。
11.如权利要求7所述的OTA酒店评价系统,其特征在于,所述信息获取单元还用于获取所述OTA酒店的设施设备信息;
所述匹配值获取单元还用于获取所述设施设备信息与目标标签的第二匹配数值;
则所述评价数值为所述评价值、所述第一匹配数值与所述第二匹配数值的加权和。
12.如权利要求11所述的OTA酒店评价系统,其特征在于,所述信息获取单元还用于获取所述OTA酒店与目标POI的距离;
所述匹配值获取单元还用于根据所述距离生成对应的第三匹配数值;
则所述评价数值为所述评价值、所述第一匹配数值、所述第二匹配数值与所述第三匹配数值的加权和。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的OTA酒店评价方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的OTA酒店评价方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910884312.6A CN110599052B (zh) | 2019-09-19 | 2019-09-19 | Ota酒店评价方法、系统、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910884312.6A CN110599052B (zh) | 2019-09-19 | 2019-09-19 | Ota酒店评价方法、系统、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110599052A CN110599052A (zh) | 2019-12-20 |
CN110599052B true CN110599052B (zh) | 2023-07-21 |
Family
ID=68861079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910884312.6A Active CN110599052B (zh) | 2019-09-19 | 2019-09-19 | Ota酒店评价方法、系统、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110599052B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077312A (zh) * | 2021-04-12 | 2021-07-06 | 上海华客信息科技有限公司 | 酒店推荐方法、系统、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002123619A (ja) * | 2000-10-16 | 2002-04-26 | Dainippon Printing Co Ltd | ホテルの情報管理および費用の精算システムとそれに使用する非接触icタグ |
CN107368907A (zh) * | 2017-07-25 | 2017-11-21 | 携程计算机技术(上海)有限公司 | 酒店信息展示方法及装置、电子设备、存储介质 |
CN108874832A (zh) * | 2017-05-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 目标评论确定方法及装置 |
CN109408665A (zh) * | 2018-12-29 | 2019-03-01 | 咪咕音乐有限公司 | 一种信息推荐方法及装置、存储介质 |
CN109740036A (zh) * | 2018-12-29 | 2019-05-10 | 北京创鑫旅程网络技术有限公司 | Ota平台酒店排序方法及装置 |
CN110245274A (zh) * | 2019-04-23 | 2019-09-17 | 五八有限公司 | 一种标签热度计算方法、装置、电子设备和存储介质 |
-
2019
- 2019-09-19 CN CN201910884312.6A patent/CN110599052B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002123619A (ja) * | 2000-10-16 | 2002-04-26 | Dainippon Printing Co Ltd | ホテルの情報管理および費用の精算システムとそれに使用する非接触icタグ |
CN108874832A (zh) * | 2017-05-15 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 目标评论确定方法及装置 |
CN107368907A (zh) * | 2017-07-25 | 2017-11-21 | 携程计算机技术(上海)有限公司 | 酒店信息展示方法及装置、电子设备、存储介质 |
CN109408665A (zh) * | 2018-12-29 | 2019-03-01 | 咪咕音乐有限公司 | 一种信息推荐方法及装置、存储介质 |
CN109740036A (zh) * | 2018-12-29 | 2019-05-10 | 北京创鑫旅程网络技术有限公司 | Ota平台酒店排序方法及装置 |
CN110245274A (zh) * | 2019-04-23 | 2019-09-17 | 五八有限公司 | 一种标签热度计算方法、装置、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于情感倾向的酒店评价分析与研究;胡译文;《基于情感倾向的酒店评价分析与研究》;20190215(第2期);I140-94 * |
Also Published As
Publication number | Publication date |
---|---|
CN110599052A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795543B (zh) | 基于深度学习的非结构化数据抽取方法、装置及存储介质 | |
US11151177B2 (en) | Search method and apparatus based on artificial intelligence | |
CN108629043B (zh) | 网页目标信息的提取方法、装置及存储介质 | |
CN112069302B (zh) | 会话意图识别模型的训练方法、会话意图识别方法及装置 | |
US10387430B2 (en) | Geometry-directed active question selection for question answering systems | |
CN110442856B (zh) | 一种地址信息标准化方法、装置、计算机设备及存储介质 | |
KR20180011221A (ko) | 비디오들에 대해 대표 비디오 프레임들 선택 | |
CN111611452B (zh) | 搜索文本的歧义识别方法、系统、设备及存储介质 | |
CN110362823A (zh) | 描述文本生成模型的训练方法和装置 | |
CN113378970B (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
CN110377902A (zh) | 描述文本生成模型的训练方法和装置 | |
CN110929524A (zh) | 数据筛选方法、装置、设备及计算机可读存储介质 | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN116662488A (zh) | 业务文档检索方法、装置、设备及存储介质 | |
CN115640394A (zh) | 文本分类方法、文本分类装置、计算机设备及存储介质 | |
CN114662484A (zh) | 语义识别方法、装置、电子设备及可读存储介质 | |
CN113705191A (zh) | 样本语句的生成方法、装置、设备及存储介质 | |
CN116956816A (zh) | 文本处理方法、模型训练方法、装置及电子设备 | |
CN110599052B (zh) | Ota酒店评价方法、系统、电子设备和介质 | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
CN111539207B (zh) | 文本识别方法、文本识别装置、存储介质和电子设备 | |
CN110633370B (zh) | Ota酒店标签的生成方法、系统、电子设备和介质 | |
CN111259115A (zh) | 内容真实性检测模型的训练方法、装置和计算设备 | |
CN114519397A (zh) | 基于对比学习的实体链接模型的训练方法、装置、设备 | |
CN111339423B (zh) | 基于用户的旅游城市推送方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |