CN107077509B - 一种改进浏览体验的方法、装置和设备 - Google Patents

一种改进浏览体验的方法、装置和设备 Download PDF

Info

Publication number
CN107077509B
CN107077509B CN201680002696.9A CN201680002696A CN107077509B CN 107077509 B CN107077509 B CN 107077509B CN 201680002696 A CN201680002696 A CN 201680002696A CN 107077509 B CN107077509 B CN 107077509B
Authority
CN
China
Prior art keywords
content
initial
server
replacement
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680002696.9A
Other languages
English (en)
Other versions
CN107077509A (zh
Inventor
高斌
蔡秉初
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhaida Yunyun Intelligent Technology Co ltd
Original Assignee
Shenzhen Qianhaida Yunyun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhaida Yunyun Intelligent Technology Co ltd filed Critical Shenzhen Qianhaida Yunyun Intelligent Technology Co ltd
Publication of CN107077509A publication Critical patent/CN107077509A/zh
Application granted granted Critical
Publication of CN107077509B publication Critical patent/CN107077509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机技术领域,提供了一种改进浏览体验的方法、装置和设备。所述方法包括:获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;根据初始的摘要内容的一个或者多个词条从本地词库或本地存储对象中获取第一替换内容;若获取第一替换内容失败,则将第一对象发送到服务器,并接收服务器返回的第二替换内容;根据第一替换内容或第二替换内容中包含的对应各属性信息的词条,更新所述第一对象。通过本发明实施例,改善了现有技术中因为第三方资源提供平台篡改原始对象,给用户浏览造成的影响。

Description

一种改进浏览体验的方法、装置和设备
【技术领域】
本发明涉及计算机技术领域,特别是涉及一种改进浏览体验的方法、装置和设备。
【背景技术】
现有技术中,越来越多的内容对象通过网络的方式传输和流转,而在流转的过程中,很多中转方会把主观意愿的信息加入到这些内容对象中。例如:所述内容对象具体为音乐时,作为中转方的搜狗音乐,则会把自己的APP名字放入到歌曲名中,如“搜狗音乐-百年经典-大陆歌曲-齐秦-往事随风”;而实际上该歌曲原始名是“往事随风-齐秦”。由于移动设备本身的屏幕限制,无法像电脑显示屏、电视一样那么大的屏幕,例如:MP3播放器的屏幕,由于显示屏幕仅能显示数行文字,并且每一行的文字不超过10个字符,那么由第三方调整后的歌曲名字“搜狗音乐-百年经典-大陆歌曲-齐秦-往事随风”在屏幕上显示成’搜狗音乐-百年经典…’,用户根本就看不到真正的歌曲的名字。如果用户不喜欢这首歌,需要等到歌曲想起来的时候,才可以切换到其它歌曲就会给用户的正常、快速浏览带来麻烦。类似的情况也会出现在电影名称、视频名称和文件名称中。
【发明内容】
本发明实施例要解决的技术问题之一是改善第三方在分享或者提供资源时,出于第三方自身目的在所述资源中新增摘要内容,使得原本精简的资源变得繁琐,最终影响了用户浏览效率和浏览体验的问题。
本发明采用如下技术方案:
第一方面,本发明实施例提供了一种改进浏览体验的方法,所述方法包括:
获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;其中,所述初始的摘要内容由一个或者多个词条构成;
根据所述初始的摘要内容的一个或者多个词条从本地词库或本地存储对象中获取第一替换内容;
若获取所述第一替换内容失败,则将所述第一对象发送到服务器,并接收服务器返回的第二替换内容;所述第二替换内容为所述服务器自身对象库中第三对象的摘要内容;所述第三对象的指纹与所述第一对象的指纹相匹配;所述第一对象的指纹由所述服务器根据所述第一对象生成;
根据所述第一替换内容或所述第二替换内容中包含的对应各属性信息的词条,更新所述第一对象。
可选的,所述根据所述初始的摘要内容的一个或者多个词条从本地词库中获取第一替换内容,具体包括:
匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成;
删除所述初始的摘要内容中匹配关键词成功的词条。
可选的,删除所述初始的摘要内容中匹配成功的词条之后,所述方法还包括:
根据预先设定的词条顺序重组初始的摘要内容中剩余的词条。
可选的,所述根据所述初始的摘要内容的一个或者多个词条从本地存储对象中获取第一替换内容,具体包括:
检索本地存储的与所述第一对象相同格式的一个或者多个对象;
从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象;
根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容。
可选的,所述相似度的由一个或者多个维度构成,所述维度包括:对象所在位置维度、对象间包含共同词条维度、对象大小维度、对象来源维度中的一项或者多项;在计算相似度时,根据所述一个或者多个维度加权求和得到。
第二方面,本发明实施例还提供了一种改进浏览体验的装置,所述装置包括:
获取模块,用于获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;其中,所述初始的摘要内容由一个或者多个词条构成;
替换内容生成模块,用于根据所述初始的摘要内容的一个或者多个词条从本地词库或本地存储对象中获取第一替换内容;若获取所述第一替换内容失败,则将所述第一对象发送到服务器,并接收服务器返回的第二替换内容;所述第二替换内容为所述服务器自身对象库中第三对象的摘要内容;所述第三对象的指纹与所述第一对象的指纹相匹配;所述第一对象的指纹由所述服务器根据所述第一对象生成;
更新模块,用于根据所述第一替换内容或所述第二替换内容中包含的对应各属性信息的词条,更新所述第一对象。
可选的,所述替换内容生成模块具体包括第一匹配单元、删除单元,
所述第一匹配单元,用于匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成;
所述删除单元,用于在匹配成功时,删除所述初始的摘要内容中成功完成匹配的词条;其中,在完成所述初始的摘要内容中各词条的匹配和/或删除后,得到所述替换内容。
可选的,所述替换内容生成模块还包括第一重组单元,
所述第一重组单元,用于根据预先设定的词条顺序重组初始的摘要内容中完成匹配和/或删除后剩余的词条,得到所述替换内容。
可选的,所述替换内容生成模块具体包括检索单元、第二匹配单元和第二重组单元,
所述检索单元,用于检索本地存储的与所述第一对象相同格式的一个或者多个对象;
所述第二匹配单元,用于从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象;
所述第二重组单元,用于根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容。
第三方面,本发明实施例还提供了一种电子设备,用于实现第一方面所述的改进浏览体验的方法,所述装置包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述存储器存储有可被所述至少一个处理器执行的指令程序,所述指令被程序设置为执行第一方面所述的改进浏览体验的方法。
第四方面,本发明实施例还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,用于完成第一方面所述的改进浏览体验的方法。
本发明实施例提供了一种改进浏览体验的方法,通过解析第一对象的初始的摘要内容,并进一步利用筛选策略整理所述初始的摘要内容得到替换内容,使用得到的替换内容更新第一对象。改善了现有技术中,因为第三方资源提供平台篡改原始对象,给用户浏览造成的影响。
【附图说明】
图1是本发明实施例提供的一种改进浏览体验的方法流程示意图;
图2是本发明实施例提供的一种浏览对象属性信息的效果示意图;
图3是本发明实施例提供的第一种筛选策略的方法流程示意图;
图4是本发明实施例提供的一种改进浏览体验的方法操作界面示意图;
图5是本发明实施例提供的另一种改进浏览体验的方法操作界面示意图;
图6是本发明实施例提供的第二种筛选策略的方法流程示意图;
图7是本发明实施例提供的第三种筛选策略的方法流程示意图;
图8是本发明实施例提供的第三种筛选策略的方法流程示意图;
图9是本发明实施例提供的另一种改进浏览体验的方法流程示意图;
图10是本发明实施例提供的一种改进浏览体验的装置结构示意图;
图11是本发明实施例提供的一种改进浏览体验的装置结构示意图;
图12是本发明实施例提供的一种改进浏览体验的装置结构示意图;
图13是本发明实施例提供的一种改进浏览体验的装置结构示意图;
图14是本发明实施例提供的一种改进浏览体验的装置结构示意图;
图15是本发明实施例提供的一种改进浏览体验的装置结构示意图。
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明的描述中,术语“内”、“外”、“纵向”、“横向”、“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不应当理解为对本发明的限制。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例1:
本发明实施例1提供了一种改进浏览体验的方法,所述方法可以适用于智能手机、个人电脑或者服务器,在不同的应用场合所述方法可以是以智能手机上运行的APP方式实现,也可以是个人电脑中的安装软件,还可以是所述智能手机、个人电脑或者服务器中的系统软件功能方式实现,如图1所示,所述方法包括:
在步骤201中,获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容。其中,所述初始的摘要内容由一个或者多个词条构成。
所述第一对象可以是音频文件、视频文件、文档或者其它形式的可在互联网中传播的载体。其中,所述第一对象的各属性信息包括:第一对象属性中的文件名、第一对象属性中的标题、第一对象属性中的主题、第一对象属性中的作者、第一对象属性中的版权等等。对于不同形式的第一对象,其所包含的各属性信息会有一定的差异,但是,文件名是各种形式的第一对象均拥有属性之一。如图2所示,为一典型的win7界面中,一word文档的属性界面示意图,图中常规栏中给出了较为常用的属性信息。本发明所述方法可以适用于包括但不局限Windows系统、linux系统、andriod系统以及ios系统。
所述解析第一对象得到初始的摘要内容,包括:读取第一对象属性中的文件名、第一对象属性中的标题、第一对象属性中的主题、第一对象属性中的作者、第一对象属性中的版权等属性中的一项或者多项,并按照预设的表格分门别类的导入得到所述初始的摘要内容,或者按照预设的文本格式组合所述一项或者多项属性,得到所述初始的摘要内容。例如:对于第一对象属性中的文件名为“往事如风”、第一对象属性中的标题为“专辑《97狼》”、第一对象属性中的主题为“音乐”和第一对象属性中的作者为“齐秦”,则在预设的文本格式为“文件名-标题-作者-主题”时,所述初始的摘要内容为“往事如风-专辑《97狼》-齐秦-音乐”。其中,“往事如风”、“专辑”、“《97狼》”等都属于词条的范畴。所述词条是指通过语义分析拆分出来的单元,第一对象的一条属性可以是由一个或者多个词条构成。
在步骤202中,根据预设的筛选策略整理所述初始的摘要内容中的一个或者多个词条,得到替换内容。
在本发明实施例中,提供了至少三种筛选策略用于整理所述初始的摘要内容,包括:
方式一、匹配所述初始的摘要内容和本地词库,根据匹配结果调整初始的摘要内容得到替换内容。
其中,本地词库可以是从网络中的服务器下载获得,也可以是用户通过自己历史上输入的关键词积累形成,还可以是结合上述两种方式形成的本地词库。所述本地词库包括一组或者多组黑名单(即关键词),其中,所述黑名单可以由APP名称构成,例如:“搜狗音乐”、“腾讯音乐”、“艾米音乐”等等;所述黑名单还可以由一个或者多个网站地址构成。其原理是将可能由第三方附加的内容,搜集起来作为关键词整合到所述词库中,从而能够通过匹配初始的摘要内容和本地词库,来确定初始的摘要内容中可以精简掉的内容,从而得到所述替换内容。
方式二、检索本地存储的与所述第一对象相同格式的一个或者多个对象,根据检索结果调整初始的摘要内容得到替换内容。
所述相同格式是指与第一对象的文件后缀名相同的,且经由本地存储的对象。方式二尤其适用于长期的,且从固定的一个或者多个第三方资源平台下载资源的情况。其特点是从第三方资源平台下载的对象之间的初始的摘要内容相似度较大,并且可以沿用历史上针对从同一资源平台下载的对象的摘要内容格式调整规则(即将初始摘要内容转换为替换内容的调整规则),生成所述第一对象的替换内容。
方式三、将所述第一对象发送到服务器,并由服务器校对后获得替换内容。
方式三适合于在方式一和方式二均未能成功获取替换内容的情况下执行,当然,方式三也可以作为本发明实施例筛选策略中单独实现的方式存在。其中,方式一和方式二均未能成功获取替换内容,通常是指第一对象中用于提取出初始的摘要内容的相关属性信息已经被删除或者修改的无法正常辨识。服务器的校对过程具体是指服务器根据所述第一对象生成能够标识所述第一对象的指纹,而服务器自身存储并维护有对象库和对象库中各对象的指纹,通过匹配所述第一对象的指纹和对象库中各对象的指纹。若匹配第三对象的指纹成功,则可以将第三对象的初始的摘要内容作为第一对象的替换内容,因为,对象库中第三对象的属性为参考标准属性,因此,第三对象的初始的摘要内容即可作为所述第一对象供参考更新的替换内容。
上述三种方式拥有各自的优势,方式一适合于本地实现(也适合于服务器侧实现),并且占用资源较少、执行效率较高、使用范围比较广,并且,在合理归类之后可以有效降低因为词库增长带来的匹配任务量的增加(实施例2中将展开来具体阐述)。方式二适合于本地实现(也可以在服务器侧实现),尤其针对工作方式较为规律的用户,其中,用户对于特定文件的下载集中于一个或者几个少数网站的情况,例如:下载歌曲会主要通过百度音乐、腾讯音乐和搜狗音乐来完成。此时,用方式二便能体现出其完成效率的优越性。方式三,适合于在方式一和方式二均未能成功获取替换内容的情况下执行,由于方式三涉及对第一对象包含内容(正文)的解析,因此,对于资源的占用较多,优选的是由服务器来完成。在具体实现本发明实施例时,可以根据具体的环境适应性的选择方式一、方式二和方式三中的一种或者多种组合的方式来实现。
在步骤203中,根据所述替换内容中包含的对应各属性信息的词条,更新所述第一对象。
其中,更新的方式之一便是将第一对象中用于生成初始的摘要内容的相关属性更改为所述替换内容中相对应的内容。
在具体实现时,所述更新操作可以是在监控到下载了所述第一对象后,自动完成的执行内容。可选的是,在执行所述更新操作时,跳出携带替换内容的提示框,以便在接收到确认更新的响应消息后,完成上述更新内容。
本发明实施例提供了一种改进浏览体验的方法,通过解析第一对象的初始的摘要内容,并进一步利用筛选策略整理所述初始的摘要内容得到替换内容,使用得到的替换内容更新第一对象。改善了现有技术中,因为第三方资源提供平台篡改原始对象,给用户浏览造成的影响。
实施例2:
本发明实施例针对实施例1中所述方式一,就如何根据本地词库完成替换内容获取,给予相关可实现方案细节的阐述。具体的,如图3所示,实施例1中步骤202,可以展开执行为以下步骤:
在步骤301中,匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成。
其中,匹配方式可以是利用本地词库中的黑名单(关键词)与初始的摘要内容中的词条一一比对的方式来完成。但是,实际实现过程中,这种匹配方式是耗时较长,而且低效的。并且,当第一对象包括多种文件类型时,逐一比对已经不适用于该场景。因此,在本发明实施例中针对上述复杂应用环境还提供了可选的匹配方式。
其中,本地词库中维护有多种文件类型的子词库,在解析所述第一对象的各属性信息得到初始的摘要内容过程中,包含了对所述第一对象文件类型的确定。因此,在匹配本地词库的时候,便可以将匹配范围限缩到与之类型相对应的子词库中完成上述匹配操作。另一方面,由于在实施例1中介绍了解析出的初始的摘要内容是具有预设的文本格式或者按照预设的表格分门别类导入的,因此,对于词库或者子词库内部的关键词,同样可以做类型的划分,从而可以在进行比对前实现一级或者两级的关键词提取,从而能够更加高效的完成所述匹配过程。
在具体实现过程中,以两级的关键词提取为例,阐述如下:首先根据解析出的所述第一对象的文件格式,确定用于与所述初始的摘要内容匹配的第一子词库;其次,根据当前比对的归属于初始的摘要内容中的第一词条的类型,提取所述第一子词库中与之类型相同的一组关键词,并完成比对过程。其中,所述关键词类型可以按照语义的划分,如:名词、定于、动词、形容词等;还可以按照公司名称、地区名称、网站名称等进行划分。
在步骤302中,删除所述初始的摘要内容中匹配关键词成功的词条,得到所述替换内容。
以初始的摘要内容为“有米音乐-www.youmi.com-往事如风-专辑《97狼》-齐秦-音乐”为例,若匹配网址关键词(属于黑名单)www.youmi.com成功,则删除所述初始的摘要内容中的“www.youmi.com”。
通常初始的摘要内容由多个词条构成,因此,在得到所述替换内容前需要对构成所述初始的摘要内容中各词条进行一轮匹配,并在匹配黑名单关键词成功后执行删除操作;若匹配不成功则保留该词条,作为构成替换内容的词条。在完成初始的摘要内容中各词条匹配和删除后,便得到所述替换内容。
结合本发明实施例,还存在一种可能情况,即第三方在所述第一对象中附加内容的时候,还调整了原始词条的顺序,此时,简单的删除匹配到的黑名单中的关键词不一定能达到用户对于第一对象中相关属性的调整要求,例如:对于属性中的文件名部分,可以是“有米音乐-www.youmi.com-往事如风-专辑《97狼》-齐秦”,也可能是“有米音乐-www.youmi.com-专辑《97狼》-往事如风-齐秦”,而用户所期望的文件名可能是“专辑《97狼》-往事如风-齐秦”。因此,结合本发明实施例存在一种可选的实现方式,用于解决上述问题。具体的,在删除所述初始的摘要内容中成功完成匹配的词条之后,所述方法还包括:
根据预先设定的词条顺序重组初始的摘要内容中完成匹配和/或删除后剩余的词条,得到所述替换内容。
其中,预先设定的词条顺序可以由用户预先设定的,例如:用户对于第一对象具体为音乐文件时,可以设定构成文件名属性的内容为“歌曲名+专辑名+歌手”的与设定的词条顺序,此时,在对初始的摘要内容完成步骤303中对于匹配黑名单中关键词,并删除相应匹配成功的词条后,再将初始的摘要内容中剩余词条中的文件名属性按照预设的词条顺序重组,便能得到用户所需的,可提高浏览效率的替代内容。本发明实施例还提供了一种用户预先设定的界面效果图,如图4所示,对于不同类型的对象,用户可以各自设定一套词条顺序,并且,除了图4中给出的设定方式外,还存在一些扩展方案,例如:图4中对于对象中词条的顺序设定还可以区分并细化到不同地址文件夹中,同一类型的对象之间的词条顺序也不相同,其实现的效果图如图5所示,可以在其中“适用地址”栏输入其上设定的“MP3命名”格式或者“视频命名”格式。若有多个地址需要设定,则图5中可以分别显示“第一MP3命名”,“第二MP3命名”,并分别配置一“适用地址”。
实施例3:
本发明实施例针对实施例1中所述方式二,就如何检索本地存储的与所述第一对象相同格式的一个或者多个对象,根据检索结果重组初始的摘要内容得到替换内容,给予相关可实现方案细节的阐述。具体的,如图6所示,实施例1中步骤202,可以展开执行为以下步骤:
在步骤401中,检索本地存储的与所述第一对象相同格式的一个或者多个对象。
其中,对象的格式是指对象的文件后缀名,用来标识该对象的文件内容的编码格式,例如:文档的后缀名为“.txt”,MP3文件的后缀名为“.mp3”,视频文件的后缀名为“.rmvb”等等。
在步骤402中,从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象。
所述相似度由一个或者多个维度构成,所述维度包括:对象所在位置维度、对象间包含共同词条维度、对象大小维度、对象来源维度中的一项或者多项;在计算相似度时,根据所述一个或者多个维度求和得到。
在步骤403中,根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容。
在具体实现时,会使用一记录文档,记录每一个文件夹中对象的摘要内容或者属性的修改方式(例如:用户可能通过手动的方式直接调整对象的某一条属性,或者用户可以通过本发明实施例所提供的在生成摘要内容后调整),并转化为摘要内容格式调整规则。
构成所述摘要内容格式调整规则的包括:替换摘要内容中指定位置的词条、删除摘要内容中指定位置的词条、更改摘要内容中制定位置的词条等等。则对于用户通过手动的方式直接调整对象的属性A的方式,在转化为摘要内容格式调整规则时,会根据所述调整的属性A在摘要内容中对应的位置,生成上述摘要内容格式调整规则。
实施例4:
本发明实施例针对实施例1中所述方式三,就如何将所述第一对象发送到服务器,并由服务器校对后获得替换内容,给予相关可实现方案细节的阐述。具体的,如图7所示,实施例1中步骤202,可以展开执行为以下步骤:
在步骤501中,向服务器发送所述第一对象,以便服务器根据自身拥有的对象库校对所述第一对象。
由于,本实施例所提出的方案优先所要解决的问题是:在上述实施例二和实施例三基础上,仍然无法获得所述替换内容的情况下使用本发明实施例所提出的筛选策略方案。其中,校对过程涉及将第一对象中所包含内容(也称为正文)与对象库中各对象所包含内容的比对,所述对象包含的内容与之前所描述的对象的属性信息有些许不同,所述对象的属性信息通常是针对所述对象的描述信息,例如:对象文件大小、对象文件格式、对象文件编码类型、对象文件作者等等,而所述对象所包含内容除了可以包括上述属性外,特指包含对象文件的正文部分,例如:对于MP3来说,对象所包含内容还涉及音频内容;对于视频来说,对象所包含内容还涉及编码后的视频内容自身。
在步骤502中,接收服务器返回的替换内容,其中,所述替换内容由服务器在根据自身拥有的对象库校对,确认所述第一对象与对象库中第三对象匹配后生成。
其中,第三对象为服务器校对得到的,和所述第一对象拥有相同的正文部门,此时,服务器可以获取所述第三对象的摘要内容,并发送给智能终端;所述智能终端在接收到携带所述第三对象的摘要内容消息后,在步骤203中将所述第三对象的摘要内容作为第一对象的替换内容,并完成第一对象中各属性信息的更新。
本发明实施例利用了服务器强大的存储能力和分析能力,能够克服并解决由于第一对象中相关属性信息丢失或者被恶意篡改的情况下,还能够基于第一对象所包含的内容完成与服务器侧的对象库内各对象的校对,并根据结对结果反馈替换内容给智能终端,以便所述智能终端更新第一对象中的各属性信息。进一步弥补了实施例2和实施例3所无法解决的问题盲点。
在本发明实施例中,服务器根据自身拥有的对象库校对所述第一对象的方式,除了上述内容描述的校对第一对象所包含的内容和对象库中各对象所包含的内容以外,还可以具有实施例2和实施例3中描述的匹配本地词库和检索存储的对象的方式,即将原本在智能终端本地完成的执行方法转移到服务器侧来实现。
对于本发明实施例中所提到的服务器侧校对第一对象和对象库中各对象之间所包含的内容时,除了可以解码得到其包含的内容进行一一比对方式外,还存在一种可选的、高效的实现方式,如图8所示,具体阐述如下:
在步骤601中,服务器根据所述第一对象,生成第一对象的指纹。
其中,第一对象的指纹的生成规则尽量是能够唯一标识第一对象在网络资源中的身份,即便所涉及的指纹生成规则无法唯一标识第一对象在网络资源中的身份,也可以通过临时增加生成指纹的维度或者临时在已生成指纹基础上增加参考因素的方式实现。
在本实施例中,针对第一对象为音频文件(例如MP3)的情况下,所述第一对象的指纹可以是统计得到的所述音频文件中频谱的分布,还可以是提取出来的所述音频文件中指定时间区域的音频内容。针对第一对象为视频文件(例如rmvb)的情况下,所述第一对象的指纹可以是根据视频中指定帧图片中的一个或者多个目标内容生成。针对第一对象为文档文件(例如word)的情况下,所述第一对象的指纹可以是由文档中的落款、文档中的标题中的关键词等构成。
在步骤602中,根据所述第一对象的指纹匹配服务器存储的对象库中各对象的指纹。
以上述第一对象为音频文件,且第一对象指纹具体为统计得到的所述音频文件中频谱的分布为例,所述校对实现过程中表现为匹配第一对象和对象库中的对象指纹之间的相似度,以上述频谱分布图来说,即匹配两者频谱分布图之间的相似度,一旦相似度达到预设阈值,便可判定两者所包含的内容是相同的。
其中,统计得到的所述音频文件中频谱的分布还可以从多个维度校对,例如:分别从低于第一预设频率的频谱分布图和高于第二预设频率的频谱分布图两个维度进行与对象库中各对象的指纹的校对。上述基于频谱分布的多维度校对方法,对于校对整个音频文件的频谱分布来说,因为进一步做了一轮筛选,使得校对过程更加简便和高效,避免了大量分散的、各自占比较低的频段的校对,由于这类频段对于最终校对结果没有实质性影响,但是会占用校对时间,可以认为是校对过程中的噪音成分。
在步骤603中,若匹配所述第一对象的指纹和对象库中的第三对象的指纹成功,则获取所述第三对象的摘要内容;其中,所述第三对象的摘要内容作为所述替换内容。
相比较实施例2和实施例3,本发明实施例所提供的方法虽然会占用的额外的资源,并且会对执行效率有所影响,但是,作为本发明实施例所提出的实现方式,其鲁棒性较实施例2和实施例3更优,能够解决由于第三方恶意修改属性内容后,造成的无法根据初始的摘要内容直接获得替换内容的问题。
实施例5:
在通过实施例2-4分别阐述了本发明实施例1所提出的筛选策略中的三种方式后,本发明实施例将结合实施例3所述的方式,即实施例1在具体应用环境中给予详细的方案阐述。现实操作中,对于用户来说其习惯于将同一类型的文件放在一个文件夹中,而且倾向于将该文件夹中各文件按照统一的命名格式修改,本发明实施例为该现实操作场景而设计,解决现有技术中需要用户手动输入的效率低的问题。如图9所示,具体包括如下操作步骤:
在步骤701中,监控第一对象的下载和/或移动操作,获取第一对象的下载路径地址和/或移动路径目的地址。
其中,步骤701是在本实施例具体实现方案中新增的特征,为的是能够获取当前第一对象所处的位置信息,以便为所述第一对象动态生成对象库。
在步骤702中,获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容。其中,所述初始的摘要内容由一个或者多个词条构成。
由于步骤702和实施例3中的步骤401相同,相关实现描述可参考步骤401相关内容,在此不一一赘述。
在步骤703中,检索所述下载路径地址和/或移动路径目的地址中存储的,且与所述第一对象相同格式的一个或者多个对象。
其中,对象的格式是指对象的文件后缀名,用来标识该对象的文件内容的编码格式,例如:文档的后缀名为“.txt”,MP3文件的后缀名为“.mp3”,视频文件的后缀名为“.rmvb”等等。
在步骤704中,从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象。
其中,当所述下载路径地址或者移动路径目的地址中存储有一定量对象的情况下,以特定歌手的MP3格式歌曲为例,所述匹配出的第二对象很可能是跟第一对象同属于同一个歌手出的同一个专辑内的歌曲。
所述相似度由多个维度构成,所述维度包括:对象间包含共同词条维度、对象大小维度、对象来源维度。由于,在本发明实施例中,匹配的范围直接限定在所述第一对象存在的位置,因此,实施例3中的对象所在位置维度在此不做限定。
其中,第一项,对象间包含共同词条越多,则相应的两个对象的相似度会越高;而第二项,对象大小来说,对于同类型的文件,其文件大小在同一区间值内,则相应的两个兑现固定相似度会越高;第三项,对象来源是同一资源地址的话,其相似度也会越高。若将求和结果满分定位100的话,其中,第一项至少占60,第二项占20左右,第三项也占20左右。而对于第一项来说,匹配得到词条越多,其评分越接近60,例如:同一歌手的同一专辑中的两首歌,由于歌手名、专辑名都相同,因此,它们在第一项的评分就在50分左右。
在步骤705中,根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容。
其中,在使用实施例3中所述记录文档过程中,对于历史针对所述第二对象的操作记录中,涉及对初始的摘要内容的删除操作或者直接对第二对象属性信息修改的操作,则可以将相应删除掉的词条或者被替换掉的词条作为词库的一员进行管理(即作为所述词库中的关键词存在)。这样便可将方式二和方式一结合起来,给予方式一中词库的完善提供了有效的补充手段,而且,就方式一和方式二组合实现来说,可以先执行方式二,若方式二中判断当前下载路径地址和/或移动路径目的地址中不存在匹配相似度达标的第二对象的话,则启动方式一的筛选策略。例如:当用户所下载的歌曲是某一歌手的最新专辑时,则使用方式一的关键词匹配,删除和/或调整词条的方式则能很好的适用该情况。此时,若用方式二则会因为第一对象和第二对象之间相似度不够高,造成最终处理的精确度受到影响。
实施例6:
本发明实施例还提供了一种改进浏览体验的装置1,所述装置可用于实现实施例1-5任一所述的改进浏览体验的方法。如图10所示,在本发明实施例中,所述改进浏览体验的装置包括:
获取模块21,用于获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;其中,所述初始的摘要内容由一个或者多个词条构成。
替换内容生成模块22,用于根据预设的筛选策略整理所述初始的摘要内容中的一个或者多个词条,得到替换内容;
更新模块23,用于根据所述替换内容中包含的对应各属性信息的词条,更新所述第一对象。
本发明实施例提供了一种改进浏览体验的装置,通过装置中获取模块解析第一对象的初始的摘要内容,并进一步通过替换内容生成模块整理所述初始的摘要内容得到替换内容,使用得到的替换内容更新第一对象。改善了现有技术中,因为第三方资源提供平台篡改原始对象,给用户浏览造成的影响。
结合本发明实施例,存在一种可选的实现方案,如图11所示,所述替换内容生成模块具体包括第一匹配单元31、删除单元32,
所述第一匹配单元31,用于匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成;
所述删除单元32,用于在匹配成功时,删除所述初始的摘要内容中成功完成匹配的词条;其中,在完成所述初始的摘要内容中各词条的匹配和/或删除后,得到所述替换内容。
结合本发明实施例,存在一种可选的实现方案,如图12所示,所述替换内容生成模块还包括第一重组单元33,
所述第一重组单元33,用于根据预先设定的词条顺序重组初始的摘要内容中完成匹配和/或删除后剩余的词条,得到所述替换内容。
结合本发明实施例,存在一种可选的实现方案,如图13所示,所述替换内容生成模块具体包括检索单元41、第二匹配单元42和第二重组单元43,
所述检索单元41,用于检索本地存储的与所述第一对象相同格式的一个或者多个对象;
所述第二匹配单元42,用于从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象;
所述第二重组单元43,用于根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容。
结合本发明实施例,存在一种可选的实现方案,如图14所示,所述替换内容生成模块还包括发送单元51和接收单元52,
所述发送单元51,用于向服务器发送所述第一对象,以便服务器根据自身拥有的对象库校对所述第一对象;
所述接收单元52,用于接收服务器返回的替换内容,其中,所述替换内容由服务器在根据自身拥有的对象库校对,确认所述第一对象与对象库中第三对象匹配后生成。
值得说明的是,上述装置内的模块、单元之间的信息交互、执行过程和设计的目的和背景等内容,由于与本发明的处理方法实施例基于同一构思,具体内容可参见本发明方法实施例1-5中的叙述,此处不再赘述。
实施例7:
请参阅图15,是本发明第7实施例的一种电子设备的架构示意图。本实施例的电子设备包括一个或多个处理器61以及存储器62。其中,图15中以一个处理器61为例。
处理器61和存储器62可以通过总线或者其他方式连接,图15中以通过总线连接为例。
存储器62作为一种改进浏览体验的方法、装置和设备非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如第1-5实施例中的改进浏览体验的方法以及对应的程序指令/模块(例如,图10-14所示的各个模块)。处理器61通过运行存储在存储器62中的非易失性软件程序、指令以及模块,从而执行改进浏览体验的装置的各种功能应用以及数据处理,即实现第1-5实施例的改进浏览体验的方法以及第6实施例的各个模块、单元的功能。
存储器62可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器62可选包括相对于处理器61远程设置的存储器,这些远程存储器可以通过网络连接至处理器61。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述程序指令/模块存储在所述存储器62中,当被所述一个或者多个处理器61执行时,执行上述第1-5实施例中的改进浏览体验的方法,例如,执行以上描述的图1、3,6-9所示的各个步骤;也可实现图10-14所述的各个模块、单元。
本发明实施例的改进浏览体验的装置可以多种形式存在,在执行以上描述的图1、3,6-9所示的各个步骤;以及图10-14所述的各个模块、单元,该改进浏览体验的装置包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多对象手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放视频内容,一般也具备移动上网特性。该类设备包括:视频播放器,掌上游戏机,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有视频播放功能或连接互联网功能的电子设备。
本发明实施例还提供了一种改进浏览体验的方法、装置和设备非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图15中的一个处理器61,可使得上述一个或多个处理器可执行第1-5实施例中的改进浏览体验的方法,例如,执行以上描述的图1、3,6-9所示的各个步骤;也可实现图10-14所述的各个模块、单元。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种改进浏览体验的方法,其特征在于,应用于智能终端中,所述方法包括:
获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;其中,所述初始的摘要内容由一个或者多个词条构成;其中,所述第一对象为在互联网中传播的载体;监控第一对象的下载和/或移动操作,获取第一对象的下载路径地址和/或移动路径目的地址;
检索所述下载路径地址和/或移动路径目的地址中存储的,且与所述第一对象相同格式的一个或者多个对象的一个或者多个对象;
从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象;
根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容,得到第一替换内容;
若获取所述第一替换内容失败,则将所述第一对象发送到服务器,并接收服务器返回的第二替换内容;所述第二替换内容为所述服务器自身对象库中第三对象的摘要内容;所述第三对象的指纹与所述第一对象的指纹相匹配;所述第一对象的指纹由所述服务器根据所述第一对象生成;
根据所述第二替换内容中包含的对应各属性信息的词条,更新所述第一对象初始的摘要内容。
2.根据权利要求1所述的改进浏览体验的方法,其特征在于,所述根据所述初始的摘要内容的一个或者多个词条从本地词库中获取第一替换内容,具体包括:
匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成;
删除所述初始的摘要内容中匹配关键词成功的词条。
3.根据权利要求2所述的改进浏览体验的方法,其特征在于,删除所述初始的摘要内容中匹配成功的词条之后,所述方法还包括:
根据预先设定的词条顺序重组初始的摘要内容中剩余的词条。
4.根据权利要求1所述的改进浏览体验的方法,其特征在于,所述相似度的由一个或者多个维度构成,所述维度包括:对象所在位置维度、对象间包含共同词条维度、对象大小维度、对象来源维度中的一项或者多项;在计算相似度时,根据所述一个或者多个维度加权求和得到。
5.一种改进浏览体验的装置,其特征在于,应用于智能终端中,所述装置包括:
获取模块,用于获取第一对象,解析所述第一对象的各属性信息得到初始的摘要内容;其中,所述初始的摘要内容由一个或者多个词条构成;其中,所述第一对象为在互联网中传播的载体;
替换内容生成模块,用于监控第一对象的下载和/或移动操作,获取第一对象的下载路径地址和/或移动路径目的地址,其中,所述第一对象为可在互联网中传播的载体;检索所述下载路径地址和/或移动路径目的地址中存储的,且与所述第一对象相同格式的一个或者多个对象的一个或者多个对象;从检索到的对象中确定匹配相似度达到第一预设阈值的第二对象;根据所述第二对象的摘要内容格式调整规则,重组第一对象所对应的初始的摘要内容,得到第一替换内容;
若获取所述第一替换内容失败,则将所述第一对象发送到服务器,并接收服务器返回的第二替换内容;所述第二替换内容为所述服务器自身对象库中第三对象的摘要内容;所述第三对象的指纹与所述第一对象的指纹相匹配;所述第一对象的指纹由所述服务器根据所述第一对象生成;
更新模块,用于根据所述第一替换内容或所述第二替换内容中包含的对应各属性信息的词条,更新所述第一对象初始的摘要内容。
6.根据权利要求5所述的改进浏览体验的装置,其特征在于,所述替换内容生成模块具体包括第一匹配单元、删除单元,
所述第一匹配单元,用于匹配所述初始的摘要内容和本地词库,其中,所述本地词库由一个或者多个关键词构成;
所述删除单元,用于在匹配成功时,删除所述初始的摘要内容中成功完成匹配的词条;其中,在完成所述初始的摘要内容中各词条的匹配和/或删除后,得到所述替换内容。
7.根据权利要求6所述的改进浏览体验的装置,其特征在于,所述替换内容生成模块还包括第一重组单元,
所述第一重组单元,用于根据预先设定的词条顺序重组初始的摘要内容中完成匹配和/或删除后剩余的词条,得到所述替换内容。
8.一种电子设备,用于实现权利要求1-4任一所述的改进浏览体验的方法,所述电子设备包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述存储器存储有可被所述至少一个处理器执行的指令程序,所述指令被程序设置为执行权利要求1-4任一所述的改进浏览体验的方法。
9.一种非易失性计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,用于完成权利要求1-4任一所述的一种改进浏览体验的方法。
CN201680002696.9A 2016-11-25 2016-11-25 一种改进浏览体验的方法、装置和设备 Active CN107077509B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/107257 WO2018094689A1 (zh) 2016-11-25 2016-11-25 一种改进浏览体验的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN107077509A CN107077509A (zh) 2017-08-18
CN107077509B true CN107077509B (zh) 2021-03-16

Family

ID=59624124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680002696.9A Active CN107077509B (zh) 2016-11-25 2016-11-25 一种改进浏览体验的方法、装置和设备

Country Status (2)

Country Link
CN (1) CN107077509B (zh)
WO (1) WO2018094689A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334626B (zh) * 2018-02-12 2022-06-10 百度在线网络技术(北京)有限公司 新闻栏目的生成方法、装置和计算机设备
CN110888976B (zh) * 2019-11-14 2023-06-20 北京香侬慧语科技有限责任公司 一种文本摘要生成方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071422A (zh) * 2006-06-15 2007-11-14 腾讯科技(深圳)有限公司 一种音乐文件搜索处理系统及方法
CN103034657A (zh) * 2011-09-29 2013-04-10 日立(中国)研究开发有限公司 文档摘要生成方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7793220B1 (en) * 2000-08-29 2010-09-07 Citrix Systems, Inc. Scalable derivative services
US20050065912A1 (en) * 2003-09-02 2005-03-24 Digital Networks North America, Inc. Digital media system with request-based merging of metadata from multiple databases
CN105653540B (zh) * 2014-11-13 2019-12-17 深圳市腾讯计算机系统有限公司 文件属性信息的处理方法和装置
CN105786840A (zh) * 2014-12-22 2016-07-20 北京奇虎科技有限公司 一种音乐类网页的结构化摘要的显示方法和系统
CN105718575B (zh) * 2016-01-22 2019-01-29 华南理工大学 基于爬虫的贴音乐标签方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071422A (zh) * 2006-06-15 2007-11-14 腾讯科技(深圳)有限公司 一种音乐文件搜索处理系统及方法
CN103034657A (zh) * 2011-09-29 2013-04-10 日立(中国)研究开发有限公司 文档摘要生成方法和装置

Also Published As

Publication number Publication date
WO2018094689A1 (zh) 2018-05-31
CN107077509A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
US10515133B1 (en) Systems and methods for automatically suggesting metadata for media content
US8095547B2 (en) Method and apparatus for detecting spam user created content
US8392949B2 (en) Electronic-program-guide retrieval method and electronic-program-guide retrieval system
US20080071776A1 (en) Information retrieval method in mobile environment and clustering method and information retrieval system using personal search history
CN110222238B (zh) 字符串与识别符双向映射的查询方法和系统
CN108614837B (zh) 文件存储和检索的方法及装置
US9805119B2 (en) Subtitle processing method, device and system and storage medium
US20160292207A1 (en) Resolving outdated items within curated content
CN103049495A (zh) 用于提供与查询序列相对应的搜索建议的方法、装置与设备
CN111813900B (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN104778271A (zh) 一种视频数据的缓存方法及装置
CN112364126A (zh) 一种关键词的提示方法、装置、计算机设备和存储介质
US10394838B2 (en) App store searching
CN110909266B (zh) 深度分页的方法、装置及服务器
CN107077509B (zh) 一种改进浏览体验的方法、装置和设备
KR101683138B1 (ko) 정보검색장치 및 그 동작 방법
CN103226601A (zh) 一种图片搜索的方法和装置
US20160085795A1 (en) Grouping equivalent content items
CN111539206B (zh) 一种确定敏感信息的方法、装置、设备及存储介质
US8495025B2 (en) Foldering by stable query
CN116860825A (zh) 一种基于区块链的可验证检索方法及系统
US20140195561A1 (en) Search method and information managing apparatus
CN108920658B (zh) 一种移动设备桌面搬家方法、装置及电子设备
US20200081922A1 (en) Data analysis method and data analysis system thereof
US9418140B2 (en) Method of updating an inverted index, and a server implementing the method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant