发明内容
本发明实施例通过提供一种文本解析规则的更新方法、装置、设备及可读存储介质,用于对包含口令的文本的解析规则进行自动化的更新。
为了解决上述问题,第一方面,本发明实施例提供了一种文本解析规则的更新方法,包括:监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;采用文本解析规则对第一文本进行解析;若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;将第一口令字符转换成第一统一码值;将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新。
可选地,文本解析规则的更新方法还包括:通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本;采用更新后的文本解析规则对第二文本进行解析;若从第二文本中识别到口令,确认更新后的文本解析规则正确。
可选地,若从第二文本中识别不到口令,获取第二文本中与预设的口令存在差异的第二口令字符;将第二口令字符转换成第二统一码值;将第二统一码值加入到文本解析规则中,以对文本解析规则进行更新。
可选地,从第一文本或第二文本中识别不到口令,包括:若从第一文本中识别不到产品ID,则确认从第一文本中识别不到口令;若从第二文本中识别不到产品ID,则确认从第二文本中识别不到口令。
可选地,在监测到相邻时段内文本解析的成功率差值超过预设阈值之前,文本解析规则的更新方法还包括:监测到用户在当前显示页面对第三文本进行预定操作时,采用文本解析规则对第三文本进行解析;若从第三文本中识别到口令,且从数据库中查找不到口令对应的第三产品信息,从特定应用程序中查找到口令对应的第三产品信息;向用户展示第三产品信息,并对本次第三文本解析的结果进行日志记录;若从第三文本中识别不到口令,停止对第三文本进行解析,并对本次第三文本解析的结果进行日志记录。
可选地,监测到相邻时段内文本解析的成功率差值超过预设阈值,包括:根据日志记录统计当前时段及上一个时段第三文本解析的成功率;若当前时段第三文本解析的成功率与上一个时段第三文本解析的成功率的差值超过预设阈值,则监测到相邻时段内文本解析的成功率差值超过预设阈值。
第二方面,本发明实施例提供了一种文本解析规则的更新装置,包括:监测单元,用于监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;第一解析单元,用于采用文本解析规则对第一文本进行解析;获取单元,用于若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;转换单元,用于将第一口令字符转换成第一统一码值;更新单元,用于将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新。
可选地,文本解析规则的更新装置还包括:生成单元,用于通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本;第二解析单元,用于采用更新后的文本解析规则对第二文本进行解析;确认单元,用于若从第二文本中识别到口令,确认更新后的文本解析规则正确。
第三方面,本发明实施例提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行如第一方面或第一方面任意实施方式中的文本解析规则的更新方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行如第一方面或第一方面任意实施方式中的文本解析规则的更新方法。
本发明实施例提供的文本解析规则的更新方法、装置、设备及可读存储介质,通过监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;采用文本解析规则对第一文本进行解析;若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;将第一口令字符转换成第一统一码值;将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新;从而可以在文本解析规则不能识别出包含口令的文本中的口令时,及时地、自动化地对文本解析规则进行更新。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种文本解析规则的更新方法,应用于移动终端,如图1所示,包括:
S101.监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本。
在本发明实施例中,移动终端可以为智能手机、平板电脑、台式电脑、笔记本电脑及可穿戴电子设备等用户设备。
在移动终端,当监测到用户在当前显示页面对第三文本进行预定操作时,可以采用文本解析规则对第三文本进行解析。预定操作可以包括但不限于长按操作、点击操作、大面积按压操作、复制操作或压力触控操作。例如,移动终端监测到用户在当前显示界面中针对第三文本的复制操作后,采用文本解析规则符第三文本进行解析。若从第三文本中识别到口令,且从数据库中查找不到口令对应的第三产品信息,从特定应用程序中查找到口令对应的第三产品信息;若从第三文本中识别到口令,且从数据库中查找到口令对应的第三产品信息;向用户展示第三产品信息,也即可在移动终端实现对该第三文本进行解析,获取第三文本中口令对应的第三产品信息,然后向用户展示第三产品信息,以供用户查看与第三文本中的口令对应的网页内容。产品基本信息包括但不限于产品名称、产品图片、产品店铺信息、产品网页链接。并且,通过预先在数据库中查到口令对应的第三产品信息,可以使得在数据库中存在口令对应的第三产品信息时,不需要再从特定应用程序中查找口令对应的第三产品信息,可以减少查找口令对应的第三产品信息的时间,提升用户体验。
具体地,从数据库中或从特定应用程序中查找到的第三产品信息可定制,包括但不限于产品基本信息,优惠券信息、转链信息。在向用户展示第三产品信息时,可以生成基于产品网页链接打开网页内容的第一入口组件和生成基于优惠券信息及转链信息打开网页内容的第二入口组件,然后向用户展示产品名称、产品图片、产品店铺信息、第一入口组件和第二入口组件。
在向用户展示第三产品信息之后,可以对本次第三文本解析的结果进行日志记录。对于另一种情况,若从第三文本中识别不到口令,则停止对第三文本进行解析,并对本次第三文本解析的结果进行日志记录。第三文本解析结果的日志记录包括但不限于第三文本的解析时间、是否解析成功。
由于每次对第三文本解析的结果都进行了记录,因此,可以对第三文本的结果的日志记录进行监测,当监测到相邻时段内文本解析的成功率差值超过预设阈值,进行报警提示,提示文本解析规则可能需要更新。相邻时段为当前时段与当前时段的上一个时段。时段的时长可以根据需要进行设置,可以为几小时、十几小时、一天、几天等。
当然,在本发明实施例中,还可以通过定时检测文本解析规则的方法,实现对文本解析规则更新。
在定时检测文本解析规则或根据第三文本的解析日志记录提示需要对文本解析规则更新时,首先需要获取最新的第一文本。也即通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本。至少一个第一产品信息可以随机选取。
当监测到用户在当前显示页面对第三文本进行预定操作时,移动终端还可以对第三文本中的关键词进行识别,根据关键词的类型,从特定程序中查找该关键词类型对应的信息,并可以根据用户的需求,对该关键词对应的信息进行整理,向用户展示整理后的关键词对应的信息。关键词的类型包括但不限定于热词、品牌、店铺、运营能力。
S102.采用文本解析规则对第一文本进行解析;具体地,文本解析规则为对包含口令的文本进行解析的正则。在获取最新的第一文本之后,可以采用当前的文本解析规则对第一文本进行解析。
S103.若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;具体地,当采用文本解析规则对第一文本进行解析时,若从第一文本中识别不到口令,说明包含口令的文本的生成规则发生了改变,此时可获取第一文本中与预设的口令存在差异的第一口令字符。若从第一文本中识别到口令,说明包含口令的文本的生成规则未发生改变,可以终止进程。
S104.将第一口令字符转换成第一统一码值;具体地,对于从第一文本中识别不到口令,则可以将第一口令字符进行统一码转换,将第一口令字符转换成第一统一码值。
S105.将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新。具体地,可以将第一统一码值加入到文本解析的正则表达式中,以对文本解析规则进行更新。
本发明实施例提供的文本解析规则的更新方法,通过监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;采用文本解析规则对第一文本进行解析;若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;将第一口令字符转换成第一统一码值;将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新;从而可以在文本解析规则不能识别出包含口令的文本中的口令时,及时地、自动化地对文本解析规则进行更新。
在一个可选的实施例中,步骤S101中,监测到相邻时段内文本解析的成功率差值超过预设阈值,包括:根据日志记录统计当前时段及上一个时段第三文本解析的成功率;若当前时段第三文本解析的成功率与上一个时段第三文本解析的成功率的差值超过预设阈值,则监测到相邻时段内文本解析的成功率差值超过预设阈值。
具体地,可以根据第三文本解析结果的日志记录中第三文本的解析时间、是否解析成功,统计当前时段及上一个时段第三文本解析的成功率。若当前时段第三文本解析的成功率与上一个时段第三文本解析的成功率的差值超过预设阈值,说明当前时段第三文本解析的成功率与上一个时段第三文本解析的成功率变化差异大,则说明包含口令的文本生成规则可以发生了变化,当前的文本解析规则已不再能够从新的文本中解析出口令,需要对当前的文本解析规则进行更新。
通过统计当前时段及上一个时段第三文本解析的成功率,并在当前时段及上一个时段第三文本解析的成功率差异较大的情况下,启动对文本解析规则的检测及更新,可以及时对文本解析规则进行更新,以便顺利的对第三文本进行解析,及时向用户展示第三产品信息,提升用户的体验。
在一个可选的实施例中,将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新之后,文本解析规则的更新方法还包括:通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本;采用更新后的文本解析规则对第二文本进行解析;若从第二文本中识别到口令,确认更新后的文本解析规则正确。
具体地,对文本解析规则进行更新之后,还需要对更新后的文本解析规则进行验证,则可以通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本。至少一个第二产品可以随机选择。然后采用更新后的文本解析规则对第二文本进行解析,如果成功,则说明更新后的文本解析规则正确,能够识别最新生成的第二文本。则可以将更新后的文本解析规则同步到正式的环境,即应用于用户在当前显示页面对第三文本进行预定操作时,对第三文本进行解析的过程中。
在一个可选的实施例中,若从第二文本中识别不到口令,获取第二文本中与预设的口令存在差异的第二口令字符;将第二口令字符转换成第二统一码值;将第二统一码值加入到文本解析规则中,以对文本解析规则进行更新。
具体地,如果采用更新后的文本解析规则对第二文本进行解析失败,则说明更新后的文本解析规则不正确,则进行第二文本的分析,此时可以获取第二文本中与预设的口令存在差异的第二口令字符,将第二口令字符转换成第二统一码值;将第二统一码值加入到文本解析规则中,以对文本解析规则进行更新,实现对文本解析规则的重新更新。
在一个可选的实施例中,从第一文本或第二文本中识别不到口令,包括:若从第一文本中识别不到产品ID,则确认从第一文本中识别不到口令;若从第二文本中识别不到产品ID,则确认从第二文本中识别不到口令。
具体地,由于包含口令的文本可以对应唯一的一个产品信息,对于能否从第一文本或第二文本中识别到口令,可以通过判断采用文本解析规则是否能从第一文本中识别到产品ID来确定是否能从第一文本中识别到口令;可通过判断采用更新后的文本解析规则能否从第二文本中识别到产品ID来确定是否能从第二文本中识别到产品ID。
本发明实施例还提供了一种文本解析规则的更新装置,如图2所示,包括:
监测单元21,用于监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;具体的实施方式详见上述方法实施例步骤S101的描述,在此不再赘述。
第一解析单元22,用于采用文本解析规则对第一文本进行解析;具体的实施方式详见上述方法实施例步骤S102的描述,在此不再赘述。
获取单元23,用于若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;具体的实施方式详见上述方法实施例步骤S103的描述,在此不再赘述。
转换单元24,用于将第一口令字符转换成第一统一码值;具体的实施方式详见上述方法实施例步骤S104的描述,在此不再赘述。
更新单元25,用于将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新。具体的实施方式详见上述方法实施例步骤S105的描述,在此不再赘述。
本发明实施例提供的文本解析规则的更新装置,通过监测到相邻时段内文本解析的成功率差值超过预设阈值或监测到文本解析规则自动化检测的定时信号时,通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第一产品信息生成对应的第一文本;采用文本解析规则对第一文本进行解析;若从第一文本中识别不到口令,获取第一文本中与预设的口令存在差异的第一口令字符;将第一口令字符转换成第一统一码值;将第一统一码值加入到文本解析规则中,以对文本解析规则进行更新;从而可以在文本解析规则不能识别出包含口令的文本中的口令时,及时地、自动化地对文本解析规则进行更新。
在一个可选的实施例中,文本解析规则的更新装置还包括:生成单元,用于通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本;第二解析单元,用于采用更新后的文本解析规则对第二文本进行解析;确认单元,用于若从第二文本中识别到口令,确认更新后的文本解析规则正确。
具体地,对文本解析规则进行更新之后,还需要对更新后的文本解析规则进行验证,则可以通过特定应用程序中的文本生成规则将特定应用程序中的至少一个第二产品信息生成对应的第二文本。至少一个第二产品可以随机选择。然后采用更新后的文本解析规则对第二文本进行解析,如果成功,则说明更新后的文本解析规则正确,能够识别最新生成的第二文本。则可以将更新后的文本解析规则同步到正式的环境,即应用于用户在当前显示页面对第三文本进行预定操作时,对第三文本进行解析的过程中。
基于与前述实施例中一种文本解析规则的更新方法同样的发明构思,本发明实施例还提供一种电子设备,如图3所示,包括:处理器31和存储器32,其中处理器31和存储器32可以通过总线或者其他方式连接,图3中以通过总线连接为例进行说明。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的文本解析规则的更新方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的文本解析规则的更新方法。
存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器31所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的一个或者多个模块存储在存储器32中,当被处理器31执行时,执行如图1所示实施例中的文本解析规则的更新方法。
上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器,使得通过计算机或其他可编程信息处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程信息处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。