CN113886748A - 网页内容的编辑信息生成、信息输出方法、装置及设备 - Google Patents

网页内容的编辑信息生成、信息输出方法、装置及设备 Download PDF

Info

Publication number
CN113886748A
CN113886748A CN202111166506.6A CN202111166506A CN113886748A CN 113886748 A CN113886748 A CN 113886748A CN 202111166506 A CN202111166506 A CN 202111166506A CN 113886748 A CN113886748 A CN 113886748A
Authority
CN
China
Prior art keywords
information
target
content
target information
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111166506.6A
Other languages
English (en)
Inventor
王延猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111166506.6A priority Critical patent/CN113886748A/zh
Publication of CN113886748A publication Critical patent/CN113886748A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种网页内容的编辑信息生成、信息输出方法、装置及设备,涉及互联网技术领域,尤其涉及信息处理技术领域。具体实现方案为:第一设备确定编辑操作在网页内容中操作的目标信息;根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。应用本公开实施例提供的方案生成网页内容的编辑信息,能够提高网页内容的编辑信息的准确性。

Description

网页内容的编辑信息生成、信息输出方法、装置及设备
技术领域
本公开涉及互联网技术领域,尤其涉及信息处理技术领域。
背景技术
如今互联网功能越来越强大,能够提供的网页内容也越来越丰富,一些场景下可能会需要对网页内容中的部分信息进行编辑,以突出显示这些信息。例如,对某一段落中的若干个字进行标红,为某一段中的若干个字增加批注等。为此需要针对上述编辑操作生成编辑信息,以便于在进行网页内容显示时,一并显示对网页内容的编辑结果。
发明内容
本公开提供了一种用于网页内容的编辑信息生成、信息输出的方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种网页内容的编辑信息生成方法,应用于第一设备,包括:
确定编辑操作在网页内容中操作的目标信息;
根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;
生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。
根据本公开的另一方面,提供了一种信息输出方法,应用于第二设备,包括:
获得网页内容的编辑信息,其中,所述编辑信息中包括:编辑操作的操作内容、所述编辑操作针对的目标信息在编码后的网页内容中的信息表示值,所述信息表示值是根据所述目标信息的类型对应的信息表示方式确定的信息;
根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息;
在显示所述网页内容时,输出基于所述操作内容对所述目标信息进行编辑操作产生的信息。
根据本公开的另一方面,提供了一种网页内容的编辑信息生成的装置,应用于第一设备,包括:
第一信息确定模块,用于确定编辑操作在网页内容中操作的目标信息;
表示值确定模块,用于根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;
信息生成模块,用于生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。
根据本公开的另一方面,提供了一种信息输出装置,应用于第二设备,包括:
信息获得模块,用于获得网页内容的编辑信息,其中,所述编辑信息中包括:编辑操作的操作内容、所述编辑操作针对的目标信息在编码后的网页内容中的信息表示值,所述信息表示值是根据所述目标信息的类型对应的信息表示方式确定的信息;
第二信息确定模块,用于根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息;
信息输出模块,用于在显示所述网页内容时,输出基于所述操作内容对所述目标信息进行编辑操作产生的信息。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的网页内容的编辑信息生成或信息输出方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述任一项所述的网页内容的编辑信息生成或信息输出方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述任一项所述的编辑信息生成或信息输出方法。
由以上可见,本公开实施例提供的方案中,确定编辑操作在网页内容中操作的目标信息后,按照目标信息的不同类型,采用不同的信息表示方式,确定目标信息在编码后的网页内容中的信息表示值,这样在所生成的编辑信息包括上述信息表示值的情况下,可以根据上述信息表示值确定目标信息在网页内容中的特定位置。再者编辑信息中还记录有编辑操作的操作内容,因此,根据编辑信息能够获知需要对目标信息执行的编辑操作。综上,应用本公开实施例提供的方案生成的网页内容的编辑信息能够准确的表达对网页内容中目标信息执行的编辑操作,提高了所生成编辑信息的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的第一种网页内容的编辑信息生成方法的流程示意图;
图2是本公开实施例提供的第二种网页内容的编辑信息生成方法的流程示意图;
图3是本公开实施例提供的第三种网页内容的编辑信息生成方法的流程示意图;
图4是本公开实施例提供的第四种网页内容的编辑信息生成方法的流程示意图;
图5是本公开实施例提供的第一种信息输出方法的流程示意图;
图6是本公开实施例提供的第二种信息输出方法的流程示意图;
图7是本公开实施例提供的第三种信息输出方法的流程示意图;
图8是本公开实施例提供的第四种信息输出方法的流程示意图;
图9是本公开实施例提供的一种网页内容的编辑信息生成、信息输出方法的流程示意图;
图10为本公开实施例提供的第一种网页内容的编辑信息生成装置的结构示意图;
图11为本公开实施例提供的第二种网页内容的编辑信息生成装置的结构示意图;
图12为本公开实施例提供的第一种信息输出装置的结构示意图;
图13为本公开实施例提供的第二种信息输出装置的结构示意图
图14是用来实现本公开实施例的网页内容的编辑信息生成方法的电子设备的框图;
图15用来实现本公开实施例的信息输出方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面先对本公开实施例的应用场景进行说明。
场景一:网页内容编辑场景
网页编辑对已有网页M进行编辑,以使得网页M中的部分网页内容被突出显示,这种情况下,需要针对网页编辑对网页M执行的编辑操作,生成编辑信息,以记录所编辑信息的位置以及编辑操作的内容,进而使得用户浏览编辑后的网页M时,能够在自身使用的设备上还原出被编辑后的网页M的网页内容。例如,上述编辑操作可以是对网页内容中第3段的"中秋"两个字标红;对第5段中的第二张图片附加一个标注;对第6段的内容加外边框并弹出气泡提示等等。
场景二:网页内容审核场景
用户在其设备上调整网页M的网页内容,将所调整内容记为网页内容N,在调整过程中或者调整结束后,上述设备向服务器发送网页内容N,服务器审核网页内容N中是否存在错误,若存在错误,服务器需要对网页内容N中存在错误的部分执行添加批注、显示小气泡、标注红线等编辑操作,以在网页内容N中添加错误提示信息。这种情况下,服务器需要针对所执行的编辑操作生成编辑信息,以记录编辑操作的位置以及编辑操作的内容,进而使得上述设备能够根据上述编辑信息在网页内容N上还原出上述错误提示信息,提示用户进行错误修改。
场景三:教师批改作业的场景
网上教学中,学生通过学生网页端提交作业,教师通过教师网页端对学生提交的作业进行批改,教师在批改学生作业过程中可能会在学生的作业中划线、增加批注等,教师增加的上述内容以及上述所增加内容在网页中的位置需要被发送给学生网页端,使学生网页端显示教师增加的上述内容,进而提示学生根据教师增加的内容订正作业。这种情况下,需要教师网页端针对教师批改作业的操作生成编辑信息。
场景四:播报网页内容中段落的场景
用户在自己的设备上执行段落选定这一编辑操作,进而选定网页内容中的某个或某些段落,希望设备对所选定的段落进行播报,这种情况下,上述设备需要从服务器获得所选段落的语音数据,为此需要针对上述所选定段落生成编辑信息。由于服务器中存储有上述网页内容,这样上述设备将编辑信息发送给服务器后,服务器可以根据编辑信息定位到用户所选定段落,进而为用户提供这些段落的语音数据。
下面对本公开实施例的执行主体进行说明:
本公开实施例的执行主体,可以是具有展示网页或编辑网页内容功能的通用计算机、专用计算机、以及其他可编程数据处理装置的处理器、控制器,本公开实施例并不对此进行限定。
下面通过具体实施例,对本公开实施例提供的网页内容的编辑信息生成方法以及信息输出方法进行详细说明。
本公开的一个实施例中,参见图1,提供了第一种网页内容的编辑信息生成方法的流程示意图,该方法应用于第一设备,具体的,上述方法包括以下步骤101-103。
步骤101:确定编辑操作在网页内容中操作的目标信息。
上述网页内容中可以包括文本信息,也可以包括图片和视频等非文本信息。
上述目标信息可以为网页内容中的部分文本信息和/或部分非文本信息。可以通过多种方式确定目标信息,具体确定方式在后续实施例中说明,这里暂不详述。
上述编辑操作可以是为目标信息添加批注、在目标信息处显示小气泡、改变目标信息的显示效果、更换目标信息对应的图片、段落选定等操作。
步骤102:根据目标信息的类型对应的信息表示方式,确定目标信息在编码后的网页内容中的信息表示值。
由于上述目标信息可以为文本信息,也可以为非文本信息,因此,可以认为目标信息的类型包括文本类型和非文本类型。
其中,文本类型的信息,如,中文字符、英文字符、数字等信息,在段落中的呈现形式具有长度固定的特点。
非文本类型的信息,如,图片、视频等信息,在段落中的呈现形式具有长度不固定的特点。如,图片可能是以嵌入段落的方式呈现于段落,也可能是以超链接的形式呈现于段落,显然图片的长度与超链接的长度不同。
由以上可见,文本类型的信息和非文本类型的信息具有不同的特点,进而可以针对信息的不同类型设置不同的信息表示方式。
目标信息的不同类型对应的信息表示方式,以及确定上述信息表示值的具体实现方式可以参见后续图2和图4所示实施例,这里暂不详述。
在生成网页内容后,可以采用预设的编码方式对网页内容进行编码。由于采用预设的编码方式对网页内容进行编码后,只要解析网页内容的设备支持上述编码方式,则网页内容不会再因设备的操作系统、硬件参数、解析网页内容所使用的计算机语言等因素而呈现不同的结果,也就是,在不同设备上表示相同内容所使用的编码后字节数是相同的,所以,即便在不同的设备上解析编码后的网页内容,所得到的解析结果也会是一致的。鉴于上述情况,本公开实施例中,在编码后的网页内容中确定目标信息的信息表示值。且这样确定出来的信息表示值具有较高的准确度。
其中,上述编码方式可以是GB2312、UTF-8等。
步骤103:生成包含编辑操作的操作内容和信息表示值的编辑信息。
具体的,编辑操作的操作内容中可以包括行为的标识,除此之外,上述操作内容中还可以包括行为的描述信息等信息。其中,行为的标识可以是行为的名称或者行为的ID,行为的描述信息可以包括行为的配置参数、行为的注释性信息等。
例如,在对目标信息进行标红操作时,行为的标识可以为:字体颜色,描述信息包括:配置参数:红色、注释性信息:此处错误,则编辑操作的操作内容为:“字体颜色,红色,此处错误”。
在对目标信息进行添加批注操作时,行为的标识可以为:批注,描述信息包括注释性信息:请对照课本中的公式进行修改,这种情况下,上述注释性信息也可称为批注内容,则编辑操作的操作内容为:“批注,请对照课本中的内容进行修改”。
另外,本步骤中所生成的编辑信息可以以字符串的形式表示,也可以以JSON(JavaScript Object Notation,JavaScript对象简谱)对象的形式表示。
本公开的一个实施例中,为了使得第一设备下一次显示上述网页内容时依然能够显示对目标信息执行编辑操作后的内容,可以将该编辑信息和网页内容的对应关系存储至服务器中的数据库,当然也可以将该编辑信息存储至第一设备的本地文件中。
在将上述编辑信息存储至数据库的情况下,可以使得其他设备显示上述网页内容时能够显示对目标信息执行编辑操作后的内容。
上述数据库可以是非关系型数据库,也可以是关系型数据库。
由以上可见,本公开实施例提供的方案中,确定编辑操作在网页内容中操作的目标信息后,按照目标信息的不同类型,采用不同的信息表示方式,确定目标信息在编码后的网页内容中的信息表示值,这样在所生成的编辑信息包括上述信息表示值的情况下,可以根据上述信息表示值确定目标信息在网页内容中的特定位置。再者编辑信息中还记录有编辑操作的操作内容,因此,根据编辑信息能够获知需要对目标信息执行的编辑操作。综上,应用本公开实施例提供的方案生成的网页内容的编辑信息能够准确的表达对网页内容中目标信息执行的编辑操作,提高了所生成编辑信息的准确性。
另外,应用本公开实施例提供的方案生成网页内容的编辑信息后,在其它设备已获得网页内容的情况下,需要输出编辑后的网页内容时,不需要服务器向其发送编辑后的网页内容,只需要服务器向上述其他设备提供编辑信息,即可让其它设备在已有网页内容的基础上准确确定目标信息,并还原出与第一设备一致的编辑操作,这样能够节省网络资源。又由于服务器向其它设备发送的是编辑信息而不是编辑后的网页内容,编辑信息的数据量远小于编辑后网页内容的数据量,因此,上述其他设备进行数据处理时,处理速度会更快,响应速度因此而得到提升。再者,由于网页内容和上述编辑信息可以不是一起被发送至上述其他设备的,所以,即便编辑信息被截获,在拦截者没有网页内容的情况下,其即使截获了编辑信息也是无法确定目标信息的,从而针对编辑操作生成编辑信息能够降低网页内容的安全风险。
下面介绍如何确定目标信息的类型是文本类型,还是非文本类型。
一种实现方式中,可以使用正则表达式对目标信息进行匹配,其中,正则表达式用于匹配非文本类型的HTML(Hyper Text Markup Language,超文本标记语言)标签,若匹配到非文本类型的HTML标签,则判定目标信息的类型是非文本类型,否则,判定目标信息的类型为文本类型。其中,上述非文本类型的HTML标签可以是<img>标签等。
另一种实现方式中,可以判断目标信息是否为网址,若是网址,可以认为目标信息可能是图片或者视频,所以,目标信息的类型为非文本类型,否则,确定目标信息的类型为文本类型。
下面通过图2和图4两个具体实施例,对确定不同类型的目标信息的信息表示值进行说明。
本公开的一个实施例中,在目标信息的类型为文本类型的情况下,参见图2,提供了第二种网页内容的编辑信息生成方法的流程示意图,与前述图1所示实施例相比,本实施例中,上述步骤102根据目标信息的类型对应的信息表示方式,确定目标信息在编码后的网页内容中的信息表示值时,可以通过以下步骤1021-1023实现。
步骤1021:在编码后的网页内容中,确定编辑操作针对的目标信息所处目标段落的段落标识。
由于文本类型的信息一般是以段落的形式呈现在网页内容中,因此,为了后续显示网页内容时准确的输出编辑操作对应的内容,可以在编码后的网页内容中,确定目标信息所处的段落,进而得到上述段落的段落标识。
上述段落标识可以是数字或者字母,如,003、a等,也可以是数字和字母的组合,如,puuid003等。
本公开的一个实施例中,可以在生成网页内容时指定段落标识,例如为每一段落的HTML标签增加一个表示段落标识的ID属性,并将该ID属性的取值设置为段落标识。这样在确定目标段落的段落标识时,可以在编码后的网页内容中先确定上述目标信息,从而可以获知目标信息所处的目标段落,这时可以通过读取目标段落的上述ID属性的取值,获得目标段落的段落标识。
步骤1022:在编码后的网页内容中,确定目标信息在目标段落中的段内位置。
其中,目标信息在目标段落中的段内位置,可以是目标信息的起始字符相对于目标段落的起始字符的位置。具体可以以字节数表示。
本公开的一个实施例中,上述段内位置包括:偏移字节数和上述目标信息的编码后长度,其中,偏移字节数为:在目标段落中目标信息的起始字符之前的网页内容的编码后字节数。
例如,在编码后的网页内容中,目标段落中目标信息的起始字符前有5个字节,则偏移字节数为:5,目标信息本身的编码后长度是2个字节,那么目标信息的段内位置可以表示为{start:5,length:2},其中,start表示目标信息的偏移字节数,length表示目标信息的编码后长度。
基于上述形式表示段内位置,在采用预设的编码方式对网页内容进行编码后,上述段内位置指向段内的唯一位置。又由于编码后偏移字节数和目标信息的长度都是确定的,因此,以上述信息表示段内位置提高了段内位置的准确性,进而提高了上述编辑信息的准确性。
另外,由于Emoji(视觉情感符号)表情是由多个字符组成的,并且可能含有特殊字符,在不同的终端使用全局匹配的方式匹配特定的Emoji表情时可能匹配错误,或者按照匹配规则进行匹配时,匹配到其他具有部分Emoji表情字符的网页内容。而在对网页内容进行编码后,Emoji表情所包括的字符的字节数长度是固定的,Emoji表情之前的段落内容的字节数也是固定的,这种情况下,使用编码后长度表示段内位置,在确定Emoji表情的位置时,可以准确获得Emoji表情的位置。
确定段内位置的其他方式可以参见下述图3所示实施例,这里暂不详述。
步骤1023:获得包含段落标识和段内位置的信息表示值。
这种情况下,上述信息表示值包含段落标识和段内位置两种信息。
基于此,前述步骤103生成的编辑信息中包括编辑操作的操作内容、段落标识以及段内位置。
假设,编辑操作是让目标信息高亮显示,并且颜色为红色,则操作内容中,行为的标识Action为:HL,配置参数Color为:red;
段落标识X为:puuid003,段内位置Y为:start:7,length:1;
这样在以字符串表示编辑信息的情况下,编辑信息可以表示如下:
“{Action:‘HL’,Color:’red’,X:puuid003,Y:{start:7,length:1}}”。
由以上可见,应用本公开实施例提供的方案,段落标识是根据编码后网页中的目标段落确定的,因此可以通过段落标识确定目标信息所在的段落;又因为编辑信息包括目标段落和段内位置,所以,可以根据编辑信息确定目标信息在网页中的特定位置,再者编辑信息中记录有编辑操作的操作内容,因此,根据编辑信息能够获知需要对目标信息执行的编辑操作,综上,应用本公开实施例提供的方案生成网页内容的编辑信息,提高了所生成编辑信息的准确性。
除了前述步骤1022处提及的确定段内位置的方式外,还可以通过如下图3所示方式确定。
本公开的一个实施例中,参见图3,提供了第三种网页内容的编辑信息生成方法的流程示意图,与前述图2所示实施例相比,本实施例中,上述步骤1022,包括以下步骤10221-10223。
步骤10221:在编码后的网页内容中,确定目标段落中目标信息之前是否存在非文本信息。若存在非文本信息,执行下述步骤10222;否则,执行下述步骤10223。
判断目标段落中目标信息之前是否存在非文本信息时,可以将目标段落中目标信息之前的信息作为待判断信息,采用前述确定目标信息的类型的方式,判断上述待判断信息是否为非文本信息,这里不再详述。
步骤10222:以预设字节数表示编码后的非文本信息长度的方式,在编码后的网页内容中,确定目标信息在目标段落中的段内位置。
预设字节数可以是1字节、3字节、10字节等。
一种情况下,目标段落中目标信息之前可能仅仅包含非文本信息,其中,非文本信息的数量可能是一个,也可能是多个,这种情况下,可以根据非文本信息的数量和预设字节数,确定目标信息在目标段落中的段内位置。例如,预设字节数为2字节,非文本信息的数量为2,则目标段落中目标信息之前有2x2=4个字节,段内位置记为4。
另一种情况下,目标段落中目标信息之前可能不仅包括非文本信息还包含文本信息,则可以采用非文本信息的数量和预设字节数计算非文本信息的第一长度,按照文本信息自身编码后所占的字节数计算文本信息的第二长度,然后计算第一长度和第二长度的和,得到目标信息在目标段落中的段内位置。例如,目标段落中目标信息之前包括:一张图片和5字节的文本信息,预设字节数为1字节,则第一长度为:1x1=1字节,第二长度为5字节,所以,目标段落中目标信息之前有1+5=6个字节,段内位置记为6。
步骤10223:按照编码后的文本信息所占字节数,在编码后的网页内容中,确定段内位置。
本公开的一个实施例中,上述段内位置包括:偏移字节数和目标信息的编码后长度,其中,偏移字节数为:在目标段落中目标信息的起始字符之前的网页内容的编码后字节数。
关于偏移字节数和目标信息的编码后长度等信息可以参见前述图2所示实施例中步骤1022处,这里不再赘述。
由以上可见,本实施例提供的方案中,以预设字节数表示编码后的非文本信息的长度,这样即便在目标段落中目标信息之前存在非文本信息,也不会出现因非文本信息的长度不确定而导致的目标信息在目标段落中的段内位置难以计算的情况。
本公开的一个实施例中,在目标信息的类型为非文本类型的情况下,参见图4,提供了第四种网页内容的编辑信息生成方法的流程示意图,与前述图1所示实施例相比,本实施例中,上述步骤102,包括以下步骤1024-1025。
步骤1024:在编码后的网页内容中,获得为目标信息设定的信息标识。
在生成网页内容时,可以为网页中的非文本类型的信息,也就是,非文本信息,设定信息标识。为保证网页内容中的不同非文本信息具有可识别性,可以为不同的非文本信息设定在本网页内容中具有唯一性的信息标识。
其中,上述信息标识可以是数字、字母或者两者的组合。
具体的,在为网页内容中的不同非文本信息设定信息标识时,可以使用随机数算法生成该信息标识,其中,随机数算法中涉及的随机数种子和具体算法在此不做限定。
鉴于上述情况,本公开的一个实施例中,可以在编码后的网页内容中确定为目标信息设定的信息标识,从获得目标信息的信息标识。
步骤1025:将信息标识确定为目标信息在编码后的网页内容中的信息表示值。
由于信息标识已经能够在网页内容中唯一表示上述目标信息,所以,可以直接将信息标识确定为上述信息表示值。
由以上可见,本实施例提供的方案中,通过对非文本类型的信息设定信息标识,使得能够通过信息标识在网页内容中确定非文本类型的信息,这样编辑信息中包括上述信息标识的情况下,非文本类型的信息也能够在网页内容中被精确定位到,从而提高了所生成编辑信息的准确性。
另外,当目标信息这一非文本类型的信息在网页内容中多处引用时,如在网页内容的不同位置处用超链接引用了同一张图片时,这多处的同一图片被同一信息标识表示,这样使用一个信息标识即可在网页内容中定位出多个位置处的图片,因此,能够提高网页内容编辑过程中对图片的处理操作效率,也就是,能够提高对非文本类型的信息的处理操作效率。
下面对上述步骤101中确定目标信息的具体实现方式进行说明。
一种实现方式中,根据用户在网页内容中的选择操作,确定编辑操作在网页内容中操作的目标信息。
具体的,可以监控用户在网页内容中的选择操作,确定用户执行上述选择操作时选择了网页内容中的哪些信息,则将哪些信息确定为目标信息。
例如,上述选择操作可以是通过键盘中的快捷键全选、拖动鼠标选择、通过触控笔在触摸屏上圈选等。
该实现方式中按照用户的需要指定目标信息,从而使得目标信息更加贴近用户的需求。
另一种实现方式中,采用基于人工智能的语义分析方式对网页内容进行语义分析,根据语义分析结果,确定编辑操作在网页内容中操作的目标信息。
具体的,采用基于人工智能的语义分析方式,对网页内容中的语法单元进行语义分析,得到语义分析结果,然后确定语义分析结果中与设定语义间相似度大于预设相似度阈值的语义分析结果,将所确定语义分析结果对应的语法单元作为目标信息。
其中,上述语法单元可以是句子、短语、词语、字等。
另外,还可以采用基于人工智能的语义分析方式对网页内容中单词的前缀、后缀等设定部分进行分析,得到分析结果,根据分析结果确定具有设定单词特征的单词,然后根据所确定的单词获得目标信息。
再者,还可以是采用基于人工智能的语义分析方式识别网页内容中句子的句法结构,根据识别得到的结构,分析句中的词汇和短语,并确定具有设定句法特征的句子,然后根据所确定的句子获得目标信息。
应用该实现方式确定目标信息,不仅可以实现目标信息的自动化,由于应用了基于人工智能的语义分析方式,还能够使得所得到的目标信息准确度较高。另外,这一实现方式在实现过程中减少了人工干预,节省了时间,提高了用户体验。
再一种实现方式中,基于预设的关键词匹配策略,从网页内容中确定编辑操作在网页内容中操作的目标信息。
具体的,上述关键词匹配策略可以是直接使用关键词在网页内容中逐句进行匹配的策略,还可以是基于使用针对关键词的正则表达,在网页内容上滑动的方式进行匹配的策略。
由于关键词匹配策略可以按照用户需求设定,这样应用本实现方式确定目标信息时,不仅可以实现目标信息的自动化,还能够兼顾用户的需求。另外,这一实现方式在实现过程中减少了人工干预,节省了时间,提高了用户体验。
与上述网页内容的编辑信息生成方法相对应,本公开实施例还提供了一种信息输出方法。
本公开的一个实施例中,参见图5,提供了第一种信息输出方法的流程示意图,该方法应用于第二设备。该第二设备与第一设备可以是同一设备,也可以是不同的设备。
具体的,上述信息输出方法包括以下步骤501-503。
步骤501:获得网页内容的编辑信息。
其中,编辑信息中包括:编辑操作的操作内容、编辑操作针对的目标信息在编码后的网页内容中的信息表示值。信息表示值是根据目标信息的类型对应的信息表示方式确定的信息。
上述编辑信息中涉及的各种信息以及编辑信息的生成方式均与前述生成编辑信息的实施例中提及的内容相同,这里不再赘述。
具体的,第二设备获得上述编辑信息,可以是用于存储编辑信息的数据库向第二设备发送的;还可以是第二设备从其本地存储文件中获得的。
步骤502:根据信息表示值,在编码后的网页内容中确定目标信息。
由于目标信息的类型不同的情况下,确定出的信息表示值也是各不相同的,后续在图6和图8所示实施例中给出了确定目标信息的不同具体实现方式,这里暂不详述。
步骤503:在显示网页内容时,输出基于操作内容对目标信息进行编辑操作产生的信息。
由于在上述步骤501的编辑信息中包含编辑操作的操作内容,因此在显示网页内容时,可以根据上述操作内容恢复出之前已经对网页内容执行的编辑操作,从而输出基于操作内容对目标信息进行编辑操作产生的信息。
例如,若操作内容是为目标信息添加批注,则输出的信息为在目标信息周围显示编辑信息中记录的批注内容;若操作内容是播报目标信息,则输出的信息为播报目标信息的语音信息。
由以上可见,应用本公开实施例提供的方案,获得已经生成的编辑信息后,可以通过编辑信息中的信息表示值,确定目标信息在编码后的网页内容中的位置。又由于上述编辑信息中包括对目标信息执行的编辑操作的操作内容,因此,第二设备能够根据上述操作内容恢复出对目标信息执行的编辑操作,从而在显示网页内容时,在确定的位置上输出基于操作内容对目标信息进行编辑操作产生的信息,这样可以提高了信息输出的准确性。
下面介绍如何确定信息表示值中包括的是段落标识和段内位置,还是包括的是信息标识。
从前面生成编辑信息的方法实施例中可以看到,不管是段落标识、段内位置,还是信息标识均可以通过相应的参数以及参数取值表示,因此,一种实现方式中,可以检测信息表示值中是否存在表示段落标识以及段内位置的参数,若存在,则判定信息表示值中包括段落标识和段内位置。例如,表示段落标识的参数可以是X,标识段内位置的参数可以是Y。
另一种实现方式中,还可以检测信息表示值中是否存在表示信息标识的参数,若存在,则判定信息表示值中包括信息标识。例如,标识信息标识的参数可以是ID等。
下面通过图6和图8两个具体实施例,说明如何在编码后的网页内容中确定目标信息。
本公开的一个实施例中,在信息表示值包括段落标识和段内位置的情况下,参见图6,提供了第二种信息输出方法的流程示意图,与前述图5所示实施例相比,本实施例中,上述步骤502中根据信息表示值,在编码后的网页内容中确定目标信息时,可以通过以下步骤5021-5022实现。
步骤5021:根据段落标识,在编码后的网页内容中,确定目标信息所处的目标段落。
具体的,可以将上述段落标识与编码后的网页内容中各段落的标识进行匹配,得到与上述段落标识匹配成功的网页内容中段落的标识,然后将所得标识对应的段落确定为目标段落。
步骤5022:在编码后的网页内容中,从目标段落的起始位置开始,按照段内位置以及预设字节计数方式,确定目标信息。
其中,上述预设字节计数方式包括:编码后的非文本信息按照预设字节数计数、且编码后的文本信息按照所占字节数计数。
从前面生成编辑信息的方法实施例中可以得知,在编码后的网页内容中,文本信息所占的字节数是固定的,所以,进行字节计数时,对于文本信息按照其所实际所占字节数计数即可。而非文本信息,例如,图片、视频等,其所占的字节数往往是不固定的,所以,以往进行字节计数时,难以对非文本信息进行计数。又由于网页内容中难以避免出现非文本信息,鉴于这种情况,本公开实施例中通过预设字节对非文本信息进行计数,从而使得变长的非文本信息也以固定字节数表示。这样在文本信息和非文本信息均以固定字节数计数的情况下,能够在目标段落中准确的确定目标信息。
具体的,在对一段网页内容进行计数时,可以遍历该段网页内容中的每一信息,并判断该段网页内容中每一信息是文本信息还是非文本信息,若是文本信息,则按照该文本信息实际占用的字节数计数,若是非文本信息,则按照预设字节数计数,并跳过该非文本信息,对下一信息进行计数。
例如,一段网页内容中依次包括:信息1、信息2、信息3和信息4。若段内位置表示在段内目标信息之前存在9个字节的信息,信息1和信息3是文本信息,各占用4个字节,信息2是非文本信息,预设字节数为1字节。这样从信息1开始进行字节计数时,遇到信息1,发现其为文本信息,计数4字节,然后遇到信息2,发现其为非文本信息,累计计数1字节,得到5字节,跳过整个信息2,遇到信息3,发现其为文本信息,累计计数4字节,得到9字节,与前述段内位置表示的字节数一致,这时可以认为信息3后面开始为目标信息,也就是,从信息4开始是目标信息。
本公开实施例仅以上述为例进行说明,还可以通过其他方式确定目标信息,具体可以参见后续图7所示实施例,这里暂不详述。
由以上可见,本实施例提供的方案中,根据段落标识确定目标段落后,在目标段落中确定目标信息时,考虑了编码后文本信息长度固定,而非文本信息长度不固定的特点,为了保证准确定位到目标信息,将非文本信息以固定长度计数,这样可以使得第二设备能够准确的还原已对网页内容执行的编辑操作,进一步提高信息输出的准确性。
除前面步骤502处提及的确定目标信息的方式外,还可以通过下述图7所示实施例提供的方式确定目标信息。
本公开的一个实施例中,参见图7,提供了第三种信息输出方法的流程示意图,与前述图6所示实施例相比,本实施例中,上述段内位置包括:偏移字节数和目标信息的编码后长度,其中,偏移字节数为:在目标段落中目标信息的起始字符之前的网页内容的编码后字节数,在此技术上,上述步骤5022中在编码后的网页内容中,从目标段落的起始位置开始,按照段内位置以及预设字节计数方式,确定目标信息时,可以按照以下步骤50221-50223实现。
步骤50221:在编码后的网页内容中,从目标段落的起始位置开始,按照偏移字节数以及预设字节计数方式,确定目标信息的起始字符。
具体的,因为获得的偏移字节数可以是通过计算目标段落中目标信息起始字符之前的网页内容的编码后字节数得到的,因此,在确定目标信息时,可以先从目标段落的起始位置开始,按照预设字节计数方式,对各信息进行计数,在得到的计数值与上述偏移字节数一致时,停止计数,最后一个参与计数的字符的下一字符可以被确定为目标信息的起始字符。
目标信息的起始字符是目标信息中的第一个字符。
例如,目标信息为“abcd”,则起始字符为“a”。若在网页内容的一个段落“1234abcd……”中查找目标信息“abcd”,假设,以预设编码方式对网页内容进行编码后,每一个英文字符和一个数字字符所占的字节数都是1,从编辑信息中获得了偏移字节数为4,则从“1”开始计数,计数4次,得到4字节,与偏移字节数一致,参与计数的字符为“1234”,最后一个参与计数的字符是“4”,“4”后的下一个字符“a”即目标信息的起始字符。
步骤50222:根据编码后长度,在编码后的网页内容中,从起始字符开始确定目标信息的终止字符。
具体的,在确定目标信息的起始字符后,可以以编码后长度可以作为从起始字符开始的偏移量,向后计数,当计数达到编码后长度后,将最后一个参与计数的字符确定为目标信息的终止字符。
例如,一段网页内容为“xyzm”,经确定目标信息的起始字符为“x”,上述编码后长度为4字节,则从“x”开始计算偏移量,每个字符占一个字节的情况下,到字符“m”处共计4个字节,与上述编码后长度一致,这样字符“m”即为目标信息的终止字符。
步骤50223:将从上述起始字符至上述终止字符的字符确定为目标信息。
由以上可见,本实施例提供的方案中,在编码后的网页中通过偏移字节数确定目标信息的起始字符,并根据目标信息的编码后长度确定目标信息的终止字符,能够在网页内容中准确确定目标信息,从而提高了信息输出的准确性。
本公开的一个实施例中,在信息表示值包括信息标识的情况下,参见图8,提供了第四种信息输出方法的流程示意图,与前述图5所示实施例相比,本实施例中,上述步骤502包括以下步骤5023。
步骤5023:在编码后的网页内容中,确定信息标识指示的信息,作为目标信息。
具体的,可以将上述信息标识与网页内容中包含的非文本信息的标识进行匹配,从而确定与上述信息标识匹配成功的非文本信息的标识,并将该标识对应的信息作为目标信息。
由以上可见,本实施例提供的方案中,对于难以使用预设字节计数的方式确定起始字符和终止字符的非文本信息,使用信息标识进行表示,这样在输出信息时,能够准确快速的定位目标信息,从而提高信息输出的准确性。
下面基于图9所示实施例对编辑信息生成以及信息输出的完整过程进行说明。
参见图9,提供了一种网页内容的编辑信息生成、信息输出方法的流程示意图。
第一设备对网页内容中的目标信息执行编辑操作的情况下,在编码后的网页内容中,先确定编辑操作编辑的目标信息所在目标段落的段落标识;然后根据图9所示的用户选择方式、语义分析方式以及关键词匹配方式这三种方式中的一种,在编码后的网页内容中,确定目标信息;确定目标信息后,依据目标信息的类型:文本类型或者非文本类型,生成目标信息在目标段落内的段内位置;根据编辑操作的操作内容、上述段落标识和上述段内位置生成网页内容的编辑信息;按照网页内容与上述编辑信息的对应关系,在数据库存储上述编辑信息。
当第二设备显示上述网页内容时,从数据库取出上述编辑信息,并根据编辑信息中记录的段落标识和段内位置,在编码后的网页内容中,确定目标信息,输出基于操作内容对目标信息进行编辑操作产生的信息。
与上述网页内容的编辑信息生成方法相对应,本公开实施例还提供了一种网页内容的编辑信息生成装置。
本公开的一个实施例中,参见图10,提供了第一种网页内容的编辑信息生成装置的结构示意图,应用于第一设备,所述装置包括:
第一信息确定模块1001,用于确定编辑操作在网页内容中操作的目标信息;
表示值确定模块1002,用于根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;
信息生成模块1003,用于生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。
由以上可见,本公开实施例提供的方案中,确定编辑操作在网页内容中操作的目标信息后,按照目标信息的不同类型,采用不同的信息表示方式,确定目标信息在编码后的网页内容中的信息表示值,这样在所生成的编辑信息包括上述信息表示值的情况下,可以根据上述信息表示值确定目标信息在网页内容中的特定位置。再者编辑信息中还记录有编辑操作的操作内容,因此,根据编辑信息能够获知需要对目标信息执行的编辑操作。综上,应用本公开实施例提供的方案生成的网页内容的编辑信息能够准确的表达对网页内容中目标信息执行的编辑操作,提高了所生成编辑信息的准确性。
本公开的一个实施例中,参见图11,提供了第二种网页内容的编辑信息生成装置的结构示意图,与前述图10所示实施例相比,本实施例中,若所述目标信息的类型为文本类型,所述表示值确定模块1002,包括:
段落标识确定单元10021,用于在编码后的网页内容中,确定编辑操作针对的目标信息所处目标段落的段落标识;
段内位置确定单元10022,用于在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;
表示值获得单元10023,用于获得包含所述段落标识和所述段内位置的信息表示值。
由以上可见,应用本公开实施例提供的方案,段落标识是根据编码后网页中的目标段落确定的,因此可以通过段落标识确定目标信息所在的段落;又因为编辑信息包括目标段落和段内位置,所以,可以根据编辑信息确定目标信息在网页中的特定位置,再者编辑信息中记录有编辑操作的操作内容,因此,根据编辑信息能够获知需要对目标信息执行的编辑操作,综上,应用本公开实施例提供的方案生成网页内容的编辑信息,提高了所生成编辑信息的准确性。
本公开的一个实施例中,所述段内位置确定单元10022,具体用于:在编码后的网页内容中,确定所述目标段落中所述目标信息之前是否存在非文本信息;若存在,以预设字节数表示编码后的非文本信息长度的方式,在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;否则,按照编码后的文本信息所占字节数,在编码后的网页内容中,确定所述段内位置。
由以上可见,本实施例提供的方案中,以预设字节数表示编码后的非文本信息的长度,这样即便在目标段落中目标信息之前存在非文本信息,也不会出现因非文本信息的长度不确定而导致的目标信息在目标段落中的段内位置难以计算的情况。
本公开的一个实施例中,所述段内位置包括:偏移字节数和所述目标信息的编码后长度,其中,所述偏移字节数为:在所述目标段落中所述目标信息的起始字符之前的网页内容的编码后字节数。
基于上述形式表示段内位置,在采用预设的编码方式对网页内容进行编码后,上述段内位置指向段内的唯一位置。又由于编码后偏移字节数和目标信息的长度都是确定的,因此,以上述信息表示段内位置提高了段内位置的准确性,进而提高了上述编辑信息的准确性。
本公开的一个实施例中,若所述目标信息的类型为非文本类型所述表示值确定模块1002,具体用于:在编码后的网页内容中,获得为所述目标信息设定的信息标识;将所述信息标识确定为所述目标信息在编码后的网页内容中的信息表示值。
由以上可见,本实施例提供的方案中,通过对非文本类型的信息设定信息标识,使得能够通过信息标识在网页内容中确定非文本类型的信息,这样编辑信息中包括上述信息标识的情况下,非文本类型的信息也能够在网页内容中被精确定位到,从而提高了所生成编辑信息的准确性。
本公开的一个实施例中,所述第一信息确定模块1001,具体用于:根据用户在所述网页内容中的选择操作,确定编辑操作在网页内容中操作的目标信息;或者
具体用于采用基于人工智能的语义分析方式对所述网页内容进行语义分析,根据语义分析结果,确定编辑操作在网页内容中操作的目标信息;或者
具体用于基于预设的关键词匹配策略,从所述网页内容中确定编辑操作在网页内容中操作的目标信息。
根据用户在所述网页内容中的选择操作,确定编辑操作在网页内容中操作的目标信息的方式,按照用户的需要指定目标信息,从而使得目标信息更加贴近用户的需求。
采用基于人工智能的语义分析方式对所述网页内容进行语义分析,根据语义分析结果,确定编辑操作在网页内容中操作的目标信息的方式,不仅可以实现目标信息的自动化,由于应用了基于人工智能的语义分析方式,还能够使得所得到的目标信息准确度较高。另外,这一实现方式在实现过程中减少了人工干预,节省了时间,提高了用户体验。
基于预设的关键词匹配策略,从所述网页内容中确定编辑操作在网页内容中操作的目标信息的方式,由于关键词匹配策略可以按照用户需求设定,这样应用本实现方式确定目标信息时,不仅可以实现目标信息的自动化,还能够兼顾用户的需求。
与上述信息输出方法相对应,本公开实施例还提供了一种信息输出装置。
本公开的一个实施例中,参见图12,提供了第一种信息输出装置的结构示意图,应用于第二设备,所述装置包括:
信息获得模块1201,用于获得网页内容的编辑信息,其中,所述编辑信息中包括:编辑操作的操作内容、所述编辑操作针对的目标信息在编码后的网页内容中的信息表示值,所述信息表示值是根据所述目标信息的类型对应的信息表示方式确定的信息;
第二信息确定模块1202,用于根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息;
信息输出模块1203,用于在显示所述网页内容时,输出基于所述操作内容对所述目标信息进行编辑操作产生的信息。
由以上可见,应用本公开实施例提供的方案,获得已经生成的编辑信息后,可以通过编辑信息中的信息表示值,确定目标信息在编码后的网页内容中的位置。又由于上述编辑信息中包括对目标信息执行的编辑操作的操作内容,因此,第二设备能够根据上述操作内容恢复出对目标信息执行的编辑操作,从而在显示网页内容时,在确定的位置上输出基于操作内容对目标信息进行编辑操作产生的信息,这样可以提高了信息输出的准确性。
本公开的一个实施例中,参见图13,提供了第二种信息输出装置的结构示意图,与前述图12所示实施例相比,本实施例中,若所述信息表示值包括段落标识和所述段内位置,所述第二信息确定模块1202,包括:
段落确定单元12021,用于根据所述段落标识,在编码后的所述网页内容中,确定所述目标信息所处的目标段落;
信息确定单元12022,用于在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述段内位置以及预设字节计数方式,确定所述目标信息,其中,所述预设字节计数方式包括:编码后的非文本信息按照预设字节数计数、且编码后的文本信息按照所占字节数计数。
由以上可见,本实施例提供的方案中,根据段落标识确定目标段落后,在目标段落中确定目标信息时,考虑了编码后文本信息长度固定,而非文本信息长度不固定的特点,为了保证准确定位到目标信息,将非文本信息以固定长度计数,这样可以使得第二设备能够准确的还原已对网页内容执行的编辑操作,进一步提高信息输出的准确性。
本公开的一个实施例中,所述段内位置包括:偏移字节数和所述目标信息的编码后长度,其中,所述偏移字节数为:在所述目标段落中所述目标信息的起始字符之前的网页内容的编码后字节数;
本公开的一个实施例中,其中,所述信息确定单元,具体用于在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述偏移字节数以及预设字节计数方式,确定所述目标信息的起始字符;根据所述编码后长度,在编码后的所述网页内容中,从所述起始字符开始确定所述目标信息的终止字符;将从所述起始字符至所述终止字符的字符确定为所述目标信息。
由以上可见,本实施例提供的方案中,在编码后的网页中通过偏移字节数确定目标信息的起始字符,并根据目标信息的编码后长度确定目标信息的终止字符,能够在网页内容中准确确定目标信息,从而提高了信息输出的准确性。
本公开的一个实施例中,若所述信息表示值包括信息标识,
所述第二信息确定模块1202,具体用于在编码后的网页内容中,确定所述信息标识指示的信息,作为所述目标信息。
由以上可见,本实施例提供的方案中,对于难以使用预设字节计数的方式确定起始字符和终止字符的非文本信息,使用信息标识进行表示,这样在输出信息时,能够准确快速的定位目标信息,从而提高信息输出的准确性。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
本公开的一个实施例中,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述方法实施例中所述的生成网页内容的编辑信息的方法、或者信息输出方法。
本公开的一个实施例中,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述方法实施例中所述的生成网页内容的编辑信息的方法、或者信息输出方法。
本公开的一个实施例中,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述方法实施例中所述的生成网页内容的编辑信息的方法、或者信息输出方法。
图14示出了可以用来实施本公开的实施例的示例电子设备1400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图14所示,设备1400包括计算单元1401,其可以根据存储在只读存储器(ROM)1402中的计算机程序或者从存储单元1408加载到随机访问存储器(RAM)1403中的计算机程序,来执行各种适当的动作和处理。在RAM1403中,还可存储设备1400操作所需的各种程序和数据。计算单元1401、ROM1402以及RAM1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
设备1400中的多个部件连接至I/O接口1405,包括:输入单元1406,例如键盘、鼠标等;输出单元1407,例如各种类型的显示器、扬声器等;存储单元1408,例如磁盘、光盘等;以及通信单元1409,例如网卡、调制解调器、无线通信收发机等。通信单元1409允许设备1400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1401执行上文所描述的各个方法和处理,例如方法网页内容的编辑信息生成。例如,在一些实施例中,方法网页内容的编辑信息生成可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1408。在一些实施例中,计算机程序的部分或者全部可以经由ROM1402和/或通信单元1409而被载入和/或安装到设备1400上。当计算机程序加载到RAM1403并由计算单元1401执行时,可以执行上文描述的方法网页内容的编辑信息生成的一个或多个步骤。备选地,在其他实施例中,计算单元1401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法网页内容的编辑信息生成。
图15示出了可以用来实施本公开的实施例的示例电子设备1500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图15所示,设备1500包括计算单元1501,其可以根据存储在只读存储器(ROM)1502中的计算机程序或者从存储单元1508加载到随机访问存储器(RAM)1503中的计算机程序,来执行各种适当的动作和处理。在RAM1503中,还可存储设备1500操作所需的各种程序和数据。计算单元1501、ROM1502以及RAM1503通过总线1504彼此相连。输入/输出(I/O)接口1505也连接至总线1504。
设备1500中的多个部件连接至I/O接口1505,包括:输入单元1506,例如键盘、鼠标等;输出单元1507,例如各种类型的显示器、扬声器等;存储单元1508,例如磁盘、光盘等;以及通信单元1509,例如网卡、调制解调器、无线通信收发机等。通信单元1509允许设备1500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1501执行上文所描述的各个方法和处理,例如方法信息输出。例如,在一些实施例中,方法信息输出可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1508。在一些实施例中,计算机程序的部分或者全部可以经由ROM1502和/或通信单元1509而被载入和/或安装到设备1500上。当计算机程序加载到RAM1503并由计算单元1501执行时,可以执行上文描述的方法信息输出的一个或多个步骤。备选地,在其他实施例中,计算单元1501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法信息输出。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (20)

1.一种网页内容的编辑信息生成方法,应用于第一设备,包括:
确定编辑操作在网页内容中操作的目标信息;
根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;
生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。
2.根据权利要求1所述的方法,其中,若所述目标信息的类型为文本类型,所述根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值,包括:
在编码后的网页内容中,确定编辑操作针对的目标信息所处目标段落的段落标识;
在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;
获得包含所述段落标识和所述段内位置的信息表示值。
3.根据权利要求2所述的方法,其中,所述在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置,包括:
在编码后的网页内容中,确定所述目标段落中所述目标信息之前是否存在非文本信息;
若存在,以预设字节数表示编码后的非文本信息长度的方式,在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;
否则,按照编码后的文本信息所占字节数,在编码后的网页内容中,确定所述段内位置。
4.根据权利要求3所述的方法,其中,
所述段内位置包括:偏移字节数和所述目标信息的编码后长度,其中,所述偏移字节数为:在所述目标段落中所述目标信息的起始字符之前的网页内容的编码后字节数。
5.根据权利要求1所述的方法,其中,若所述目标信息的类型为非文本类型,所述根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值,包括:
在编码后的网页内容中,获得为所述目标信息设定的信息标识;
将所述信息标识确定为所述目标信息在编码后的网页内容中的信息表示值。
6.根据权利要求1-5中任一项所述的方法,其中,所述确定编辑操作在网页内容中操作的目标信息,包括:
根据用户在所述网页内容中的选择操作,确定编辑操作在网页内容中操作的目标信息;或者
采用基于人工智能的语义分析方式对所述网页内容进行语义分析,根据语义分析结果,确定编辑操作在网页内容中操作的目标信息;或者
基于预设的关键词匹配策略,从所述网页内容中确定编辑操作在网页内容中操作的目标信息。
7.一种信息输出方法,应用于第二设备,包括:
获得网页内容的编辑信息,其中,所述编辑信息中包括:编辑操作的操作内容、所述编辑操作针对的目标信息在编码后的网页内容中的信息表示值,所述信息表示值是根据所述目标信息的类型对应的信息表示方式确定的信息;
根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息;
在显示所述网页内容时,输出基于所述操作内容对所述目标信息进行编辑操作产生的信息。
8.根据权利要求7所述的方法,其中,若所述信息表示值包括段落标识和所述段内位置,所述根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息,包括:
根据所述段落标识,在编码后的所述网页内容中,确定所述目标信息所处的目标段落;
在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述段内位置以及预设字节计数方式,确定所述目标信息,其中,所述预设字节计数方式包括:编码后的非文本信息按照预设字节数计数、且编码后的文本信息按照所占字节数计数。
9.根据权利要求8所述的方法,其中,所述段内位置包括:偏移字节数和所述目标信息的编码后长度,其中,所述偏移字节数为:在所述目标段落中所述目标信息的起始字符之前的网页内容的编码后字节数;
所述在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述段内位置以及预设字节计数方式,确定所述目标信息,包括:
在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述偏移字节数以及预设字节计数方式,确定所述目标信息的起始字符;
根据所述编码后长度,在编码后的所述网页内容中,从所述起始字符开始确定所述目标信息的终止字符;
将从所述起始字符至所述终止字符的字符确定为所述目标信息。
10.根据权利要求7所述的方法,其中,若所述信息表示值包括信息标识,所述根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息,包括:
在编码后的网页内容中,确定所述信息标识指示的信息,作为所述目标信息。
11.一种网页内容的编辑信息生成的装置,应用于第一设备,包括:
第一信息确定模块,用于确定编辑操作在网页内容中操作的目标信息;
表示值确定模块,用于根据所述目标信息的类型对应的信息表示方式,确定所述目标信息在编码后的网页内容中的信息表示值;
信息生成模块,用于生成包含所述编辑操作的操作内容和所述信息表示值的编辑信息。
12.根据权利要求11所述的装置,其中,若所述目标信息的类型为文本类型,所述表示值确定模块,包括:
段落标识确定单元,用于在编码后的网页内容中,确定编辑操作针对的目标信息所处目标段落的段落标识;
段内位置确定单元,用于在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;
表示值获得单元,用于获得包含所述段落标识和所述段内位置的信息表示值。
13.根据权利要求12所述的装置,其中,
所述段内位置确定单元,具体用于在编码后的网页内容中,确定所述目标段落中所述目标信息之前是否存在非文本信息;若存在,以预设字节数表示编码后的非文本信息长度的方式,在编码后的网页内容中,确定所述目标信息在所述目标段落中的段内位置;否则,按照编码后的文本信息所占字节数,在编码后的网页内容中,确定所述段内位置。
14.根据权利要求11所述的装置,其中,若所述目标信息的类型为非文本类型,
所述表示值确定模块,具体用于在编码后的网页内容中,获得为所述目标信息设定的信息标识;将所述信息标识确定为所述目标信息在编码后的网页内容中的信息表示值。
15.一种信息输出装置,应用于第二设备,包括:
信息获得模块,用于获得网页内容的编辑信息,其中,所述编辑信息中包括:编辑操作的操作内容、所述编辑操作针对的目标信息在编码后的网页内容中的信息表示值,所述信息表示值是根据所述目标信息的类型对应的信息表示方式确定的信息;
第二信息确定模块,用于根据所述信息表示值,在编码后的所述网页内容中确定所述目标信息;
信息输出模块,用于在显示所述网页内容时,输出基于所述操作内容对所述目标信息进行编辑操作产生的信息。
16.根据权利要求15所述的装置,其中,若所述信息表示值包括段落标识和所述段内位置,所述第二信息确定模块,包括:
段落确定单元,用于根据所述段落标识,在编码后的所述网页内容中,确定所述目标信息所处的目标段落;
信息确定单元,用于在编码后的网页内容中,从所述目标段落的起始位置开始,按照所述段内位置以及预设字节计数方式,确定所述目标信息,其中,所述预设字节计数方式包括:编码后的非文本信息按照预设字节数计数、且编码后的文本信息按照所占字节数计数。
17.根据权利要求15所述的装置,其中,若所述信息表示值包括信息标识,
所述第二信息确定模块,具体用于在编码后的网页内容中,确定所述信息标识指示的信息,作为所述目标信息。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6或7-10中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6或7-9中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6或7-9中任一项所述的方法。
CN202111166506.6A 2021-09-30 2021-09-30 网页内容的编辑信息生成、信息输出方法、装置及设备 Pending CN113886748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111166506.6A CN113886748A (zh) 2021-09-30 2021-09-30 网页内容的编辑信息生成、信息输出方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111166506.6A CN113886748A (zh) 2021-09-30 2021-09-30 网页内容的编辑信息生成、信息输出方法、装置及设备

Publications (1)

Publication Number Publication Date
CN113886748A true CN113886748A (zh) 2022-01-04

Family

ID=79005296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111166506.6A Pending CN113886748A (zh) 2021-09-30 2021-09-30 网页内容的编辑信息生成、信息输出方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113886748A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115454406A (zh) * 2022-09-29 2022-12-09 北京思明启创科技有限公司 一种操作界面交互方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115454406A (zh) * 2022-09-29 2022-12-09 北京思明启创科技有限公司 一种操作界面交互方法、装置、设备及存储介质
CN115454406B (zh) * 2022-09-29 2023-09-19 北京思明启创科技有限公司 一种操作界面交互方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113807098B (zh) 模型训练方法和装置、电子设备以及存储介质
US10853566B2 (en) Systems and methods for automatically creating tables using auto-generated templates
WO2019184217A1 (zh) 热点事件分类方法、装置及存储介质
CN108090043B (zh) 基于人工智能的纠错举报处理方法、装置及可读介质
CN108664471B (zh) 文字识别纠错方法、装置、设备及计算机可读存储介质
KR20210090576A (ko) 품질을 관리하는 방법, 장치, 기기, 저장매체 및 프로그램
KR20150000566A (ko) 텍스트 입력에 따른 실시간 이미지 출력 장치 및 방법
CN114036902A (zh) 医学实体预标注方法、装置、存储介质及电子设备
US8228215B1 (en) Identifying misrepresented characters in strings of text
CN113886748A (zh) 网页内容的编辑信息生成、信息输出方法、装置及设备
WO2020052060A1 (zh) 用于生成修正语句的方法和装置
KR20190090636A (ko) 문서 자동 편집 방법
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN112052647A (zh) 一种文档编辑方法、装置、电子设备和可读存储介质
CN116049370A (zh) 信息查询方法和信息生成模型的训练方法、装置
KR102531507B1 (ko) 정보 출력 방법, 장치, 기기 및 저장 매체
CN113553833B (zh) 文本纠错的方法、装置及电子设备
CN115098729A (zh) 视频处理方法、样本生成方法、模型训练方法及装置
CN114218431A (zh) 视频搜索方法、装置、电子设备以及存储介质
CN114490969A (zh) 基于表格的问答方法、装置以及电子设备
CN114238689A (zh) 视频生成方法、装置、电子设备、存储介质和程序产品
CN112989066A (zh) 数据处理方法和装置、电子设备、计算机可读介质
CN114281981B (zh) 新闻简报的生成方法、装置和电子设备
CN111259662B (zh) 处理文本的方法和装置
CN114492456B (zh) 文本生成方法、模型的训练方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination