CN109508370B - 评论抽取方法、设备和存储介质 - Google Patents
评论抽取方法、设备和存储介质 Download PDFInfo
- Publication number
- CN109508370B CN109508370B CN201811137736.8A CN201811137736A CN109508370B CN 109508370 B CN109508370 B CN 109508370B CN 201811137736 A CN201811137736 A CN 201811137736A CN 109508370 B CN109508370 B CN 109508370B
- Authority
- CN
- China
- Prior art keywords
- comment
- model
- extraction
- comment extraction
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 312
- 238000012549 training Methods 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000011156 evaluation Methods 0.000 claims description 61
- 238000004590 computer program Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 15
- 238000012552 review Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000012854 evaluation process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供一种评论抽取方法、设备和存储介质,该方法包括:在终端设备的应用程序中调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,接收服务器通过所述评论抽取接口返回的评论抽取结果;评论抽取结果是服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取待抽取的评论数据得到的,将评论抽取结果进行显示。对于不同用户的各种场景下的抽取需求,需求满足度高,各行业的多样评论都可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。
Description
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种评论抽取方法、设备和存储介质。
背景技术
评论观点抽取服务目前支持13个行业垂类的评论观点的抽取,但各行各业的实际产品评论和用户表述都具有自己的特点,通用的模型服务依然无法覆盖全部用户的需求。比如,汽车行业的平台,用户评论的维度很多,比如,『汽车的燃油经济性很出色』、『车的可改装性很大』等,这种评论用通用的服务是无法抽取出来其中的观点的。
目前市场上还没有合适能够根据用户的需求进行定制的评论观点抽取的技术方案。
发明内容
本申请实施例提供一种评论抽取方法、设备和存储介质,提供一种能够根据用户的需求进行定制的评论观点抽取的技术方案。
本申请第一方面提供一种评论抽取方法,包括:
调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取所述待抽取的评论数据得到的。
将所述评论抽取结果进行显示。
可选的,所述调用定制的评论抽取接口,向服务器发送评论抽取请求之前,所述方法还包括:
根据用户的操作启动所述应用程序,显示所述应用程序的操作界面;所述操作界面上包括评论抽取控件;
获取所述用户在所述评论抽取控件上的触控操作。
可选的,所述调用定制的评论抽取接口,向服务器发送评论抽取请求之前,所述方法还包括:
向所述服务器发送模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类。
可选的,所述方法还包括:
向所述服务器发送模型评估请求,所述模型评估请求中携带评估数据。
本申请第二方面提供一种评论抽取方法,包括:
接收终端设备通过评论抽取接口发送的评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
根据评论抽取模型对所述待抽取的评论数据进行抽取,得到所述评论抽取结果,所述评论抽取模型是根据用户自定义的关键词训练得到的抽取模型;
将所述评论抽取结果通过所述评论抽取接口返回所述终端设备。
可选的,所述接收终端设备通过评论抽取接口发送的评论抽取请求之前,所述方法还包括:
接收终端设备通过评论抽取定制接口发送的模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类;
根据所述模型训练请求,获取所述垂类对应的通用模型;
根据所述用户自定义的关键词以及所述通用模型,训练得到所述评论抽取模型。
可选的,所述方法还包括:
根据预先获取的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件;
若满足,则向所述终端设备发送模型评估结果。
可选的,所述根据预设的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件之前,所述方法还包括:
接收所述终端设备发送的模型评估请求,所述模型评估请求中携带评估数据。
可选的,所述方法还包括:
向所述终端设备发送评论抽取模型训练完成通知。
本申请第三方面提供一种终端设备,包括:
发送模块,用于调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
接收模块,用于接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取所述待抽取的评论数据得到的。
显示模块,用于将所述评论抽取结果进行显示。
可选的,所述显示模块还用于根据用户的操作启动所述应用程序,显示所述应用程序的操作界面;所述操作界面上包括评论抽取控件;
所述终端设备还包括:处理模块,用于获取所述用户在所述评论抽取控件上的触控操作。
可选的,所述发送模块还用于向所述服务器发送模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类。
可选的,所述发送模块还用于向所述服务器发送模型评估请求,所述模型评估请求中携带评估数据。
本申请第四方面提供一种服务器,包括:
接收模块,用于接收终端设备通过评论抽取接口发送的评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
处理模块,用于根据评论抽取模型对所述待抽取的评论数据进行抽取,得到所述评论抽取结果,所述评论抽取模型是根据用户自定义的关键词训练得到的抽取模型;
发送模块,用于将所述评论抽取结果通过所述评论抽取接口返回所述终端设备。
可选的,所述接收模块还用于接收终端设备通过评论抽取定制接口发送的模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类;
所述处理模块还用于:
根据所述模型训练请求,获取所述垂类对应的通用模型;
根据所述用户自定义的关键词以及所述通用模型,训练得到所述评论抽取模型。
可选的,所述处理模块还用于根据预先获取的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件;
若满足,则所述发送模块还用于向所述终端设备发送模型评估结果。
可选的,所述接收模块还用于接收所述终端设备发送的模型评估请求,所述模型评估请求中携带评估数据。
可选的,所述发送模块还用于向所述终端设备发送评论抽取模型训练完成通知。
本申请第五方面提供一种终端设备,包括:发送器、处理器、存储器、显示器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现第一方面任一项所述的评论抽取方法。
本申请第六方面提供一种服务器,包括:接收器、发送器、处理器、存储器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现第二方面任一项所述的评论抽取方法。
本申请第七方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现第一方面任一项所述的评论抽取方法。
本申请第八方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现第二方面任一项所述的评论抽取方法。
本申请实施例提供的评论抽取方法、设备和存储介质,在终端设备的应用程序中调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,接收服务器通过所述评论抽取接口返回的评论抽取结果;评论抽取结果是服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取待抽取的评论数据得到的,将评论抽取结果进行显示。对于不同用户的各种场景下的抽取需求,需求满足度高,各行业的多样评论都可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的评论抽取方法的一种应用场景示意图;
图2为本申请实施例提供的评论抽取方法实施例一的流程图;
图3为本申请实施例提供的评论抽取方法实施例二的流程图;
图4为本申请实施例提供的评论抽取方法实施例三的流程图;
图5为本申请实施例提供的评论抽取方法的技术实现架构图;
图6为本申请实施例提供的评论抽取方法中一评论定制界面示意图;
图7为本申请实施例提供的评论抽取方法中另一评论定制界面示意图
图8为本申请实施例提供的评论抽取方法中评论抽取结果示意图;
图9为本申请实施例提供的终端设备实施例一的结构示意图;
图10为本申请实施例提供的终端设备实施例二的结构示意图;
图11为本申请实施例提供的服务器实施例一的结构示意图;
图12为本申请实施例提供的终端设备实体的结构示意图;
图13为本申请实施例提供的服务器实体的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
随着越来越多的技术领域的应用程序的广泛推广,用户在应用程序中参考其他用户的评论的机会越来越多,但是各行各业的实际产品评论和用户表述都具有自己的特点,通用的评论抽取模型无法覆盖全部用户的需求。在本方案的技术出现之前,会有一些用户提出定制的需求,然而目前还没有合适的实现定制评论抽取的方案。
针对上述存在的问题,本申请提供一种评论抽取方法,可以根据用户自定义的关键词实现定制化的评论抽取的方案。
图1为本申请实施例提供的评论抽取方法的一种应用场景示意图,如图1所示,公开了一种实现该评论抽取方法的具体场景,其中涉及提供定制化评论抽取服务的服务器,也称为云端,或者云服务器等,还涉及安装了应用程序的终端设备,例如用户的手机、电脑、平板电脑等。该终端设备中可以安装多个应用程序,进行评论抽取定制化过程的应用程序和使用评论抽取功能的应用程序可以是同一个,也可以是不同的应用程序,对此本方案中不做限制,服务器通过提供评论抽取定制接口和评论抽取接口,实现定制化的评论抽取模型的训练和应用过程。如图中所示,后续以分别在两个应用程序中实现不同的功能为例,该终端设备中安装了用于提供评论定制功能的第一应用程序,以及需要进行评论抽取的第二应用程序。
图2为本申请实施例提供的评论抽取方法实施例一的流程图,如图2所示,在上述图1所示的应用场景中,本实施例提供的评论抽取方法具体包括以下步骤:
S101:调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,评论抽取请求中包括:待抽取的评论数据。
在本步骤中,用户根据自己对需要抽取出来的评论的特征的总结,得到相应的关键词之后,通过终端设备中提供评论抽取定制接口的应用程序,输入关键词以使服务器完成了评论抽取模型的训练过程。在相应的应用程序中使用该评论抽取功能,一般来说服务器在对应的要抽取评论的应用程序中提供专门的评论抽取接口,以便用户在需要进行评论抽取时候,调用该接口完成评论抽取过程。
在该方案中,用户点击应用程序中相应的控件,终端设备调用其中的评论抽取接口,向服务器发起评论抽取请求,该评论抽取请求中携带了所有待抽取的评论数据,该待抽取的评论数据可以是应用程序从应用程序的服务器获取到所有的评论,或者根据用户设置的时间区间之间的所有评论,也可以是用户在页面中选择的评论,或者输入的评论,对此本方案不做限制。
在该过程中,对于服务器来说,则接受终端设备通过评论抽取接口发送的携带了待抽取的评论数据的评论抽取请求,完成抽取过程,具体如下。
S102:根据评论抽取模型对待抽取的评论数据进行抽取,得到评论抽取结果,评论抽取模型是根据用户自定义的关键词训练得到的抽取模型。
在该方案中,应理解该评论抽取模型并不是通用的模型,而是用户根据自己需要抽取的评论的关键词,定制的模型,用户将自定义的关键词以及垂类发送至服务器中,服务器根据垂类调用对应领域的通用模型,然后结合用户输入的关键词列表中的一个或者多个关键词对该通用模型进行训练,得到该用户定制的评论抽取模型。
在本步骤中,服务器在接收到评论抽取请求之后,根据用户的终端设备的标识或者用户身份标识,确定该用户完成训练的评论抽取模型,然后对评论抽取请求中携带的评论数据进行抽取,即将该评论数据作为该评论抽取模型的输入,得到评论抽取结果。
S103:将评论抽取结果通过评论抽取接口返回终端设备。
本步骤中,针对终端设备来说,接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取所述待抽取的评论数据得到的。
服务器在使用用户自定义的关键词完成模型训练识货,根据终端设备发送的请求完成评论抽取过程,并将得到的评论抽取结果返回给终端设备。
S104:将评论抽取结果进行显示。
在本步骤中,终端设备在得到服务器返回的评论抽取结果之后,将该评论抽取结果进行推送,例如可以进行显示,语音播报,或者将评论抽取结果发送至别的设备上进行显示等,对此本方案不做限制。
一种比较常见的方式中,可以将该评论抽取结果直接在应用程序的界面上进行显示,以便用户能够查看抽取到的结果。
本申请实施例提供的评论抽取方法,终端设备上的应用程序中提供评论抽取接口,根据用户的触控操作终端设备向服务器发起评论抽取请求,其中携带待抽取的评论数据,服务器根据用户身份标识或者终端设备身份标识确定对应的评论抽取模型,对评论数据进行抽取得到评论抽取结果并将该结果返回给终端设备进行显示,通过用户自定义关键词,对评论抽取模型进行训练,对于不同用户的各种场景下的抽取需求,需求满足度高,各行业的多样评论都可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。
图3为本申请实施例提供的评论抽取方法实施例二的流程图,如图3所示,在上述图2所示的实施例的基础上,在步骤S101之前,该评论抽取方法还包括:
S201:根据用户的操作启动应用程序,显示应用程序的操作界面;操作界面上包括评论抽取控件。
在本步骤中,服务器或者云服务器提供了按照用户自定义关键词进行评论抽取的服务,然而需要开放该功能给用户进行使用,因此一种具体实现中可以在应用程序中设置响应的评论抽取接口,相应的,则需要在应用程序的操作界面上进行体现,评论抽取控件用来触发评论抽取接口的调用过程。该方案中,该评论抽取控件可以设置在应用程序的主界面上,例如用户在打开应用程序时候,可直接看到该评论抽取控件,根据需要进行操作。评论抽取控件也可以设置在用户选取了评论数据之后的其他页面上,可根据实际情况对此进行设置,本方案不做限制。
S202:获取用户在评论抽取控件上的触控操作。
在本步骤中,终端设备根据用户在评论抽取控件上的触摸或者按压、滑动等触控操作之后,触发执行实施例一的过程。后续的过程与实施例一中类似,可直接参考实施例一的技术方案。
本实施例提供的评论抽取方法,在应用程序的操作界面中提供可以触发评论抽取交互过程的控件,以便用户能够根据实际需要对选择的评论数据进行抽取,方便用户操作,并提高用户体验。
图4为本申请实施例提供的评论抽取方法实施例三的流程图,如图4所示,在实现上述两个实施例的技术方案之前,用户需要根据需要对提供关键词列表,对模型进行训练,可选的还可以对训练的模型进行评估,因此该评论抽取方法还包括以下步骤:
S301:向服务器发送模型训练请求;模型训练请求包括用户自定义的关键词以及垂类。
在本步骤中,用户想要实现对评论数据按照自定义的方式抽取时候,则需要出发服务器对模型进行训练,一般来说可以通过提供了该服务接口的第一应用程序中进行操作,选择需要定制的应用程序,即上述第二应用程序,同时选择相应的垂类,并上传自定义的一个或者多个关键词,优选的可以使用关键词列表的方式将多个关键词上传,即触发模型训练请求。对服务器来说则接收终端设备通过评论抽取定制接口发送的模型训练请求,所述模型训练请求包括用户自定义的关键词以及垂类。
S302:根据模型训练请求,获取垂类对应的通用模型。
S303:根据用户自定义的关键词以及所述通用模型,训练得到评论抽取模型。
在上述步骤中,服务器在接收到模型训练请求之后,根据用户选择的垂类从模型库中选择出该垂类对应的通用模型,然后根据用户上传的关键词列表中的关键词对模型进行训练,以使训练得到的评论抽取模型能够抽取原有需要抽取的内容之外,还可以抽取要用户想要的特定的关键词的信息。
可选的,还可以包括:S304:向终端设备发送评论抽取模型训练完成通知。
在上述方案的基础上,服务器在完成模型训练之后,可以向终端设备反馈训练通知,以通知用户模型训练完成,可以使用定制的评论抽取服务,也可以不向终端设备返回通知,对此本方案不做限制。
可选的,在完成模型训练之后还可以对得到的评论抽取模型进行评估,具体包括以下过程:
S305:向服务器发送模型评估请求,模型评估请求中携带评估数据。
在本步骤中,在用户确定服务器已经根据用户上传的关键词列表完成了模型训练之后,还可以对训练得到的模型进行评估,以确认该模型确实能够实现用户的需求,具体的用户可以基础在提供该定制服务的第一应用程序中进行操作,触发模型评估过程,对服务器来说则接收所述终端设备发送的模型评估请求,可选的,所述模型评估请求中携带评估数据。模型评估请求中可以携带评估数据,也可以是服务器从数据库中存储的数据中获取一些数据进行评估,对此本方案不做限制。
S306:根据预先获取的评估数据,对评论抽取模型进行评估,确定评论抽取模型是否满足预设的条件。
S307:若满足,则向终端设备发送模型评估结果。
在上述步骤中,可以设定评估数据对应的准确的抽取结果,以便评估过程中得到了抽取结果之后,能够进行对比,或者可以设定专门的条件进行判断,确认该评论抽取模型是否能够满足用户的需求,即能够满足预设的条件。
可选的,在评估确认该评论抽取模型能够满足预设条件之后,服务器也可以通过向终端设备反馈模型评估结果的方式,通知用户可以采用该服务进行评论抽取。
可选的,评估确认该评论抽取模型不满足预设条件时,可以根据用户上传的关键词列表重新进行训练,并重复上述步骤,或者提醒用户在此执行上述定制过程,对此本方案不做限制。
在上述几个实施例的基础上,可知道本方案提供的评论抽取方案,能够降低对用户定制化需求的支持成本,对于不同的用户的各种场景下的抽取需求,可以让用户自主上传关键词表,省去CASE粒度的跟进,用户自主权更大。下面通过一个具体实例对该方案进行说明。
图5为本申请实施例提供的评论抽取方法的技术实现架构图。如图5所示,图中包括几个功能部分,具体为odp服务、训练服务和评估服务。该方案中,用户通过在用户端的终端设备上进行操作,触发创建&请求模型的过程,根据用户选择的垂类从模型库中读取该垂类对应的通用模型。用户继续在终端设备上进行操作触发&请求训练,即触发模型训练过程,即图中左下角的模型训练服务,根据用户输入的关键词列表和前述获取到的通用模型,进行触发调度,状态更新等过程,完成模型训练,得到对应的评论抽取模型。
后续在模型训练完成之后向用户端进行通知,用户继续操作触发&请求评估过程,服务器根据输入的或者预先存储在评估库中的数据对训练得到的评论抽取模型进行评估,确定该评论抽取模型是否符合预设条件,评估结果可以在用户端进行通知。
对于该方案的应用,在目前百度云可以提供该模型训练和评估服务,百度云端,即云服务器实现模型的训练和后续的抽取过程的运算,用户通过百度云中的接口进行关键词列表的上传,实现评论抽取模型的训练,通过在其他的应用程序中设置相应的接口,实现该功能。
在用户层面,可以按照下面的方法实现。图6为本申请实施例提供的评论抽取方法中一评论定制界面示意图。图7为本申请实施例提供的评论抽取方法中另一评论定制界面示意图。如图6所示,用户通过百度云或者其他的第一应用程序上提供的该界面中的评论观点抽取定制控件,点击马上创建,跳转至图7所示界面,进入评论观点抽取定制过程,其中,应用名称:显示当前APP的名称;所属行业:从哪个垂类的【扩展】进入,字段就匹配相应垂类;文件导入:交互样式与词法分析定制保持一致;文件格式要求:扩展名要求txt,不超过2MB,编码仅支持GBK,词表行数上限为5000条选择评论相关的垂类等。
目前支持13个垂类,并上传自定义评论词表,按照系统界面提供的要求,上传自定义的关键词表,或者图中的评论词表,点击确定生效,完成定制,之后可以在应用程序中进行调用。图8为本申请实施例提供的评论抽取方法中评论抽取结果示意图。如图8所示,该方案中,对汽车行业的用户评论进行抽取,输入的评论数据为左侧的七条评论,通用的模型中可以抽取得到右侧上部方框中的结果。定制版评论观点抽取得到右侧下部方框中的结果。
本申请提供的评论抽取方法,能更好的满足需求,各行各业的多样评论均可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。用户定制行业的自定义词表后,尤其是完成多个垂类的定制后,会在用户的应用粒度生效。这样一来,各个垂类评论的泛化效果会更好,也更满足了电商平台多垂类的需求场景。比如,『海底捞的美甲不错』,在定制后,可以结合「丽人」行业的数据,精确抽取到「美甲不错」的字段,抽取的维度更丰富,精度也更高,泛化效果更好。增加「归一化标签」更贴合用户场景。增加了「归一化标签」的可定制,能够在定制用户评论抽取的基础上,帮用户完成相似评论观点的聚合,更贴合用户的评论处理场景。
图9为本申请实施例提供的终端设备实施例一的结构示意图,如图9所示,该终端设备10包括:
发送模块11,用于调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
接收模块12,用于接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据使用用户自定义关键词训练得到的评论抽取模型,抽取所述待抽取的评论数据得到的。
显示模块13,用于将所述评论抽取结果进行显示。
本实施例提供的终端设备,用于执行前述方法实施例中的终端设备侧的技术方案,通过在应用程序中提供评论抽取接口,与服务器进行交互,实现对于不同用户的各种场景下的抽取需求,需求满足度高,各行业的多样评论都可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。
图10为本申请实施例提供的终端设备实施例二的结构示意图,如图10所示,在上述实施例的基础上,所述终端设备10还包括:处理模块14。
所述显示模块13还用于根据用户的操作启动所述应用程序,显示所述应用程序的操作界面;所述操作界面上包括评论抽取控件;
处理模块14,用于获取所述用户在所述评论抽取控件上的触控操作。
在上述两个实施例的基础上,在一种具体实现方式中,所述发送模块11还用于向所述服务器发送模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类。
可选的,所述发送模块11还用于向所述服务器发送模型评估请求,所述模型评估请求中携带评估数据。
上述实施例提供的终端设备,用于执行前述方法实施例中的终端设备侧的技术方案,其实现原理和技术效果类似,在此不再赘述。
图11为本申请实施例提供的服务器实施例一的结构示意图,如图11所示,该服务器20包括:
接收模块21,用于接收终端设备通过评论抽取接口发送的评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据;
处理模块22,用于根据评论抽取模型对所述待抽取的评论数据进行抽取,得到所述评论抽取结果,所述评论抽取模型是根据用户自定义的关键词训练得到的抽取模型;
发送模块23,用于将所述评论抽取结果通过所述评论抽取接口返回所述终端设备。
本实施例提供的服务器,用于执行前述方法实施例中的服务器侧的技术方案,根据用户输入的关键词对评论抽取模型进行训练,并在终端设备的应用程序中提供评论抽取接口,与服务器进行交互,实现对于不同用户的各种场景下的抽取需求,需求满足度高,各行业的多样评论都可以通过定制来提升抽取维度和精度,更高效地满足用户提取评论观点的需求。
在上述实施例的基础上,所述接收模块21还用于接收终端设备通过评论抽取定制接口发送的模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类;
所述处理模块22还用于:
根据所述模型训练请求,获取所述垂类对应的通用模型;
根据所述用户自定义的关键词以及所述通用模型,训练得到所述评论抽取模型。
可选的,所述处理模块22还用于根据预先获取的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件;
若满足,则所述发送模块23还用于向所述终端设备发送模型评估结果。
可选的,所述接收模块21还用于接收所述终端设备发送的模型评估请求,所述模型评估请求中携带评估数据。
可选的,所述发送模块23还用于向所述终端设备发送评论抽取模型训练完成通知。
上述实施例提供的服务器,用于执行前述方法实施例中的服务器侧的技术方案,其实现原理和技术效果类似,在此不再赘述。
图12为本申请实施例提供的终端设备实体的结构示意图,如图12所示该终端设备,包括:发送器、处理器、存储器、显示器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现前述任一方法实施例中终端设备侧的评论抽取方法的技术方案。
可选的,还可以包括接收器。
图13为本申请实施例提供的服务器实体的结构示意图,如图13所示,服务器,包括:接收器、发送器、处理器、存储器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现前述任一方法实施例中服务器侧的评论抽取方法的技术方案。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现前述任一方法实施例中终端设备侧的评论抽取方法的技术方案。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现前述任一方法实施例中服务器侧的评论抽取方法的技术方案。
在上述终端设备和服务器的具体实现中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(英文:read-only memory,缩写:ROM)、RAM、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetictape)、软盘(英文:floppy disk)、光盘(英文:optical disc)及其任意组合。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (22)
1.一种评论抽取方法,其特征在于,包括:
调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据,所述待抽取的评论数据为所述应用程序从所述应用程序的服务器获取到所有的评论;
接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据评论抽取模型,抽取所述待抽取的评论数据得到的,所述评论抽取模型是所述服务器根据用户自定义的关键词以及通用模型训练得到的抽取模型,所述通用模型是根据用户自定义的垂类从模型库中选择出所述垂类对应的通用模型;
将所述评论抽取结果显示在所述应用程序的界面上。
2.根据权利要求1所述的方法,其特征在于,所述调用定制的评论抽取接口,向服务器发送评论抽取请求之前,所述方法还包括:
根据用户的操作启动所述应用程序,显示所述应用程序的操作界面;所述操作界面上包括评论抽取控件;
获取所述用户在所述评论抽取控件上的触控操作。
3.根据权利要求1或2所述的方法,其特征在于,所述调用定制的评论抽取接口,向服务器发送评论抽取请求之前,所述方法还包括:
向所述服务器发送模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
向所述服务器发送模型评估请求,所述模型评估请求中携带评估数据。
5.一种评论抽取方法,其特征在于,包括:
接收终端设备通过评论抽取接口发送的评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据,所述待抽取的评论数据为应用程序从所述应用程序的服务器获取到所有的评论;
根据评论抽取模型对所述待抽取的评论数据进行抽取,得到所述评论抽取结果,所述评论抽取模型是根据用户自定义的关键词和通用模型训练得到的抽取模型,所述通用模型是根据用户自定义的垂类从模型库中选择出所述垂类对应的通用模型;
将所述评论抽取结果通过所述评论抽取接口返回所述终端设备。
6.根据权利要求5所述的方法,其特征在于,所述接收终端设备通过评论抽取接口发送的评论抽取请求之前,所述方法还包括:
接收终端设备通过评论抽取定制接口发送的模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类;
根据所述模型训练请求,获取所述垂类对应的通用模型;
根据所述用户自定义的关键词以及所述通用模型,训练得到所述评论抽取模型。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据预先获取的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件;
若满足,则向所述终端设备发送模型评估结果。
8.根据权利要求7所述的方法,其特征在于,所述根据预设的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件之前,所述方法还包括:
接收所述终端设备发送的模型评估请求,所述模型评估请求中携带评估数据。
9.根据权利要求6至8任一项所述的方法,其特征在于,所述方法还包括:
向所述终端设备发送评论抽取模型训练完成通知。
10.一种终端设备,其特征在于,包括:
发送模块,用于调用应用程序中的评论抽取接口,向服务器发送评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据,所述待抽取的评论数据为所述应用程序从所述应用程序的服务器获取到所有的评论;
接收模块,用于接收所述服务器通过所述评论抽取接口返回的评论抽取结果;所述评论抽取结果是所述服务器根据评论抽取模型,抽取所述待抽取的评论数据得到的,所述评论抽取模型是所述服务器根据用户自定义的关键词以及通用模型训练得到的抽取模型,所述通用模型是根据用户自定义的垂类从模型库中选择出所述垂类对应的通用模型;
显示模块,用于将所述评论抽取结果显示在所述应用程序的界面上。
11.根据权利要求10所述的终端设备,其特征在于,所述显示模块还用于根据用户的操作启动所述应用程序,显示所述应用程序的操作界面;所述操作界面上包括评论抽取控件;
所述终端设备还包括:处理模块,用于获取所述用户在所述评论抽取控件上的触控操作。
12.根据权利要求10或11所述的终端设备,其特征在于,所述发送模块还用于向所述服务器发送模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类。
13.根据权利要求12所述的终端设备,其特征在于,所述发送模块还用于向所述服务器发送模型评估请求,所述模型评估请求中携带评估数据。
14.一种服务器,其特征在于,包括:
接收模块,用于接收终端设备通过评论抽取接口发送的评论抽取请求,所述评论抽取请求中包括:待抽取的评论数据,所述待抽取的评论数据为应用程序从所述应用程序的服务器获取到所有的评论;
处理模块,用于根据评论抽取模型对所述待抽取的评论数据进行抽取,得到所述评论抽取结果,所述评论抽取模型是根据用户自定义的关键词和通用模型训练得到的抽取模型,所述通用模型是根据用户自定义的垂类从模型库中选择出所述垂类对应的通用模型;
发送模块,用于将所述评论抽取结果通过所述评论抽取接口返回所述终端设备。
15.根据权利要求14所述的服务器,其特征在于,所述接收模块还用于接收终端设备通过评论抽取定制接口发送的模型训练请求;所述模型训练请求包括用户自定义的关键词以及垂类;
所述处理模块还用于:
根据所述模型训练请求,获取所述垂类对应的通用模型;
根据所述用户自定义的关键词以及所述通用模型,训练得到所述评论抽取模型。
16.根据权利要求15所述的服务器,其特征在于,所述处理模块还用于根据预先获取的评估数据,对所述评论抽取模型进行评估,确定所述评论抽取模型是否满足预设的条件;
若满足,则所述发送模块还用于向所述终端设备发送模型评估结果。
17.根据权利要求16所述的服务器,其特征在于,所述接收模块还用于接收所述终端设备发送的模型评估请求,所述模型评估请求中携带评估数据。
18.根据权利要求15至17任一项所述的服务器,其特征在于,所述发送模块还用于向所述终端设备发送评论抽取模型训练完成通知。
19.一种终端设备,其特征在于,包括:发送器、处理器、存储器、显示器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现权利要求1至4任一项所述的评论抽取方法。
20.一种服务器,其特征在于,包括:接收器、发送器、处理器、存储器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现权利要求5至9任一项所述的评论抽取方法。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现权利要求1至4任一项所述的评论抽取方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现权利要求5至9任一项所述的评论抽取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811137736.8A CN109508370B (zh) | 2018-09-28 | 2018-09-28 | 评论抽取方法、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811137736.8A CN109508370B (zh) | 2018-09-28 | 2018-09-28 | 评论抽取方法、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109508370A CN109508370A (zh) | 2019-03-22 |
CN109508370B true CN109508370B (zh) | 2022-07-08 |
Family
ID=65746388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811137736.8A Active CN109508370B (zh) | 2018-09-28 | 2018-09-28 | 评论抽取方法、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109508370B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559890B (zh) * | 2020-12-25 | 2024-02-09 | 深圳市富途网络科技有限公司 | 一种显示方法、服务器、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281606A (zh) * | 2013-07-08 | 2015-01-14 | 腾讯科技(北京)有限公司 | 一种展示微博评论的方法和装置 |
CN104462363A (zh) * | 2014-12-08 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 评论点的展现方法和装置 |
CN105069103A (zh) * | 2015-05-07 | 2015-11-18 | Tcl集团股份有限公司 | App搜索引擎利用用户评论的方法及系统 |
CN105447036A (zh) * | 2014-08-29 | 2016-03-30 | 华为技术有限公司 | 一种基于观点挖掘的社交媒体信息可信度评估方法及装置 |
JP2016218807A (ja) * | 2015-05-21 | 2016-12-22 | 日本電信電話株式会社 | モデル学習方法、説明文評価方法、及び装置 |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN107844992A (zh) * | 2017-10-31 | 2018-03-27 | 广东欧珀移动通信有限公司 | 评论信息处理方法、装置、终端设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699955B (zh) * | 2013-09-06 | 2017-06-13 | 科大讯飞股份有限公司 | 基于自定义分类规则的业务模型分析方法和装置 |
CN104123395A (zh) * | 2014-08-13 | 2014-10-29 | 北京赛科世纪数码科技有限公司 | 一种基于大数据的决策方法和系统 |
JP6235443B2 (ja) * | 2014-09-17 | 2017-11-22 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
CN104834435B (zh) * | 2015-05-05 | 2019-03-26 | 小米科技有限责任公司 | 音频评论的播放方法和装置 |
CN105574112A (zh) * | 2015-12-14 | 2016-05-11 | 北京奇虎科技有限公司 | 一种通信过程的评论信息处理方法及系统 |
CN107102993B (zh) * | 2016-02-19 | 2021-01-29 | 创新先进技术有限公司 | 一种用户诉求分析方法和装置 |
CN106097193A (zh) * | 2016-06-13 | 2016-11-09 | 律竹(北京)网络科技有限公司 | 一种律师评价数据处理方法 |
CN106446230A (zh) * | 2016-10-08 | 2017-02-22 | 国云科技股份有限公司 | 一种优化机器学习文本中词语分类的方法 |
CN108073703A (zh) * | 2017-12-14 | 2018-05-25 | 郑州云海信息技术有限公司 | 一种评论信息获取方法、装置、设备及存储介质 |
-
2018
- 2018-09-28 CN CN201811137736.8A patent/CN109508370B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281606A (zh) * | 2013-07-08 | 2015-01-14 | 腾讯科技(北京)有限公司 | 一种展示微博评论的方法和装置 |
CN105447036A (zh) * | 2014-08-29 | 2016-03-30 | 华为技术有限公司 | 一种基于观点挖掘的社交媒体信息可信度评估方法及装置 |
CN104462363A (zh) * | 2014-12-08 | 2015-03-25 | 百度在线网络技术(北京)有限公司 | 评论点的展现方法和装置 |
CN105069103A (zh) * | 2015-05-07 | 2015-11-18 | Tcl集团股份有限公司 | App搜索引擎利用用户评论的方法及系统 |
JP2016218807A (ja) * | 2015-05-21 | 2016-12-22 | 日本電信電話株式会社 | モデル学習方法、説明文評価方法、及び装置 |
CN107291780A (zh) * | 2016-04-12 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 一种用户评论信息展示方法和装置 |
CN107844992A (zh) * | 2017-10-31 | 2018-03-27 | 广东欧珀移动通信有限公司 | 评论信息处理方法、装置、终端设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
产品评论特征及观点抽取研究;郗亚辉;《情报学报》;20140331;第33卷(第03期);326-336 * |
Also Published As
Publication number | Publication date |
---|---|
CN109508370A (zh) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814089A (zh) | 一种页面渲染的方法、装置、渲染服务器和存储介质 | |
CN109684805B (zh) | 用于语音对话平台的语音技能分享方法及系统 | |
CN109492152B (zh) | 推送定制内容的方法、装置、计算机设备及存储介质 | |
CN102929599A (zh) | 移动终端浏览器界面的修改方法及装置、移动终端 | |
US20170277526A1 (en) | Software categorization method and electronic device | |
CN113505272B (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN109542878B (zh) | 一种列表创建方法及装置 | |
CN112330534A (zh) | 动物脸风格图像生成方法、模型训练方法、装置和设备 | |
CN112579891A (zh) | 一种云资源的推荐方法、装置、电子终端及存储介质 | |
CN104598571A (zh) | 一种多媒体资源的播放方法及装置 | |
CN109508370B (zh) | 评论抽取方法、设备和存储介质 | |
CN108241515B (zh) | 应用快捷方式建立方法及终端 | |
CN112000840B (zh) | 一种业务对象的展示方法和装置 | |
CN114491354A (zh) | 一种页面生成方法、装置及计算机可读存储介质 | |
WO2023071956A1 (zh) | 模型训练方法、装置及电子设备 | |
CN115062217A (zh) | 基于人工智能的设计师匹配方法、装置、设备及存储介质 | |
CN108875670A (zh) | 信息处理方法、装置和存储介质 | |
CN110472113B (zh) | 一种智能交互引擎优化方法、装置、设备 | |
CN111078215B (zh) | 软件产品应用方法及装置、存储介质及电子设备 | |
CN111158838A (zh) | 一种信息处理方法及装置 | |
CN111063340A (zh) | 终端的业务处理方法、装置、终端及计算机可读存储介质 | |
CN114554297B (zh) | 页面截图方法、装置、电子设备及存储介质 | |
CN117252730B (zh) | 服务订阅处理系统、服务订阅信息处理方法与装置 | |
CN113839790B (zh) | 数据处理的方法、电子设备及存储介质 | |
CN109271148B (zh) | 一种移动应用生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |