CN102880633A - 基于特征词的内容推送方法 - Google Patents

基于特征词的内容推送方法 Download PDF

Info

Publication number
CN102880633A
CN102880633A CN2012102641275A CN201210264127A CN102880633A CN 102880633 A CN102880633 A CN 102880633A CN 2012102641275 A CN2012102641275 A CN 2012102641275A CN 201210264127 A CN201210264127 A CN 201210264127A CN 102880633 A CN102880633 A CN 102880633A
Authority
CN
China
Prior art keywords
feature words
information
feature
user
characteristic word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102641275A
Other languages
English (en)
Inventor
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN2012102641275A priority Critical patent/CN102880633A/zh
Publication of CN102880633A publication Critical patent/CN102880633A/zh
Pending legal-status Critical Current

Links

Abstract

本发明涉及基于特征词的内容推送方法,包括:a.在数据库中构建特征词库和与特征词库对应的信息库;b.从用户的指定内容或背景信息中提取出至少一个特征词;c.将步骤b提取的特征词在特征词库中进行检索,如果检索到匹配记录,往下继续执行;如果没有匹配记录则重新执行步骤b;d.将步骤c匹配后的特征词进行过滤,筛选出更符合用户的指定内容或背景信息的特征词;e.将步骤d过滤后的特征词在信息库中进行检索,将检索到的信息发送到客户端。本发明的方法,能够根据用户当前所关心的问题快速的进行网络检索,明显的提高了网络检索的针对性,减少了用户对大量信息的分辨时间,大幅度提高检索效率,并且有效改善了人机交互的体验。

Description

基于特征词的内容推送方法
技术领域
本发明涉及信息处理的方法,具体的讲是基于特征词的内容推送方法。 
背景技术
随着信息化建设的不断深入,各种智能设备层出不穷,例如智能手机、平板电脑、智能电视、互联网电视等,而且这些智能设备的运算能力也随之越来越强大。同时,各种信息特别是网络信息以指数级的惊人速度不断增长,种类也越来越多。但目前针对互联网的搜索都是根据用户输入的关键词将所有与之相关的内容全部检索出来,然后让用户去选择哪些是自己需要的。这样不但增加了搜索引擎的负荷,也容易让用户在众多的相关信息中难以快速找到真正需要的内容。如何有效地解决信息过载和信息迷失带来的种种问题,向用户提供适合的个性化信息,满足用户真正的需求,是当前IT行业面临的新课题。 
发明内容
针对上述的问题,本发明提供了一种基于特征词的内容推送方法,目的在于能根据用户当前所关心的问题自动进行系统检索,并推送相关的内容给用户,以提高用户的便利性,简化用户获取信息的复杂度,同时也减少用户对大量信息的分辨时间,提高检索效率。 
本发明基于特征词的内容推送方法,包括: 
a.在数据库中构建特征词库和与特征词库对应的信息库,其中所述的信息库中将特征词可对应的信息以键-值对的方式进行存储; 
b.从用户的指定内容或背景信息中提取出至少一个特征词; 
c.将步骤b提取的特征词在步骤a构建的特征词库中进行检索,如果检索到匹配记录,往下继续执行;如果没有匹配记录则重新执行步骤b; 
d.将步骤c匹配后的特征词进行过滤,筛选出更符合用户的指定内容或背景信息的特征词; 
e.将步骤d过滤后的特征词在步骤a构建的信息库中进行检索,将检索到的信息发送到客户端。 
其中用户指定的内容可以是和普通关键词类似的内容,背景信息是用户当前正在收听的音频或收看的视频、文字信息等各种内容。用户感兴趣的内容通常是与当前正在进行的事务有关的信息,因此根据背景信息或指定内容结合背景信息进行检索,可以挖掘出用户真实需要的信息。并且检索也不同于传统的搜索引擎直接在互联网上进行搜索,而是在服务器的数据库中进行特征词的匹配,然后对匹配后的特征词还要进行过滤,进一步筛选出更相关的特 征词以提高检索的准确性。用户可在任意时刻选择开启内容推送功能或关闭内容推送功能,使检索的方式更多样化,更灵活。 
具体的,构建步骤a中所述的特征词库包括系统录入和人工录入,其中系统录入为将至少包括公开出版的数字信息形式的辞海和辞源的所有索引词进行系统录入。 
具体的,步骤c中,当在特征词库中没有与步骤b的特征词对应的记录时,将所述的特征词通过搜索引擎在互联网上进行搜索,如果在互联网搜索到相关信息,则将所述相关信息自动录入到特征词库中;如果互联网上没有搜索到相关信息,再则重新执行步骤b。搜索引擎可以是目前互联网上已有的搜索引擎,如维基百科、百度百科、互动百科、中国大百科等,也可以是新开发的搜索引擎。通过互联网搜索对特征词库进行补充,能够使特征词库的适应面越来越广,以后可以只通过本地数据库检索就可以找到匹配的特征词记录,而不需要再进行互联网搜索,提高搜索的速度和效率。 
具体的,步骤d所述的对特征词进行过滤,至少包括以下其中一种方式: 
d1.名称优先;例如选择用户当前收听的歌曲名,或收看的影片名,图片中的人名等。 
d2.按特征词的热度进行选择,热度高的词优先选择。热度即特征词在特征词库或互联网上出现或被搜索的次数。热度统计的数据可以保存在本地数据库中。 
d3.与背景信息或特征词属性同一领域的特征词优先。例如用户在看体育新闻,如果获取到的特征词有“刘翔”和“张学友”,那么与“体育”同领域的“刘翔”特征词优先。 
这些过滤方式可以只用其中一种,也可以多种综合应用,还可以根据具体需要增加新的过滤方案。 
具体的,和特征词库出于类似的目的,步骤e所述在信息库中的检索还包括将特征词通过搜索引擎在互联网上进行搜索,并将搜索到的信息录入到信息库中保存,以对信息库进行扩充升级,丰富信息库中的内容,力求发展为只需本地数据库检索信息即可。 
在上述方法的基础上,可选的一种方案是步骤b中所述用户的指定内容或背景信息包括音/视频文件的文件名、源数据信息(如音视频的元数据有固定的标准格式,能准确获取到歌曲名、影片名等)、音频文件中的歌词文件(.lrc文件)、视频文件中的字幕文件(.srt文件或.idx文件+.sub文件)、人名信息、事件名称或事件类型中的至少一种。还可以根据具体的需要获取更丰富的背景信息,以更全面的获取用户的需求。 
具体的,步骤e所述的客户端为计算机系统或便携式终端。 
本发明的基于特征词的内容推送方法,能够根据用户当前所关心的问题自动进行系统检索,并将相关的内容发送给用户,大幅度的提高了生活的便利性,简化了用户获取信息的复杂度。用户不必进行网络检索,同时也减少了用户对大量信息的分辨时间,提高了检索效率, 并且有效改善了人机交互的体验。 
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。 
具体实施方式
本发明基于特征词的内容推送方法,包括: 
a.在数据库中构建特征词库和与特征词库对应的信息库,其中所述的信息库中将特征词可对应的信息以键-值对的方式进行存储。特征词库包括系统录入和人工录入,其中系统录入为将至少包括公开出版的数字信息形式的辞海和辞源的所有索引词进行系统录入。 
b.从用户的指定内容或背景信息中提取出至少一个特征词。其中用户指定的内容可以是和普通关键词类似的内容;背景信息包括音/视频文件的文件名、源数据信息(如音视频的元数据有固定的标准格式,能准确获取到歌曲名、影片名等)、音频文件中的歌词文件(.lrc文件)、视频文件中的字幕文件(.srt文件或.idx文件+.sub文件)、人名信息、事件名称或事件类型中的至少一种。还可以根据具体的需要获取更丰富的背景信息,以更全面的获取用户的需求。 
c.将步骤b提取的特征词在步骤a构建的特征词库中进行检索,当在特征词库中没有与步骤b的特征词对应的记录时,将所述的特征词通过搜索引擎在互联网上进行搜索,如果在互联网搜索到相关信息,则将所述相关信息自动录入到特征词库中;如果互联网上没有搜索到相关信息,再则重新执行步骤b。搜索引擎可以是目前互联网上已有的搜索引擎,如百度、谷歌、搜狐等,也可以是新开发的搜索引擎。通过互联网搜索对特征词库进行补充,能够使特征词库的适应面越来越广,以后可以只通过本地数据库检索就可以找到匹配的特征词记录,而不需要再进行互联网搜索,提高检索的速度和效率。为判断获取的特征词是否为正确的短语,判断方法有多种,其中一种可以是通过互联网进行搜索,如果在互联网上(如维基百科、百度百科、互动百科、中国大百科等)能够搜索到该短语,则认为是正确的。 
d.将步骤c匹配后的特征词进行过滤,筛选出更符合用户的指定内容或背景信息的特征词。对特征词进行过滤,至少包括以下其中一种方式: 
d1.名称优先;例如选择用户当前收听的歌曲名,或收看的影片名,图片中的人名等。 
d2.按特征词的热度进行选择,热度高的词优先选择。热度即特征词在特征词库或互联网上出现或被搜索的次数。热度统计的数据可以保存在本地数据库中。 
d3.与背景信息或特征词属性同一领域的特征词优先。例如用户在看体育新闻,如果获 取到的特征词有“刘翔”和“张学友”,那么与“体育”同领域的“刘翔”特征词优先。 
这些过滤方式可以只用其中一种,也可以多种综合应用,还可以根据具体需要增加新的过滤方案。 
e.将步骤d过滤后的特征词在步骤a构建的信息库中进行检索,如果在信息库中没有检索到对应的信息,则将特征词通过搜索引擎在互联网上进行搜索,并将搜索到的信息录入到信息库中保存,以对信息库进行扩充升级,丰富信息库中的内容,使以后的检索只需在本地数据库检索信息即可。最后将检索到的信息发送到计算机系统或便携式终端等形式的客户端进行显示。 
用户可在任意时刻选择开启内容推送功能或关闭内容推送功能,使检索的方式更多样化,更灵活。通过本实施例的方法,能够根据用户当前所关心的问题快速的进行网络检索,明显的提高了网络检索的针对性,减少了用户对大量信息的分辨时间,大幅度提高检索效率,并且有效改善了人机交互的体验。 

Claims (7)

1.基于特征词的内容推送方法,其特征包括:
a.在数据库中构建特征词库和与特征词库对应的信息库,其中所述的信息库中将特征词可对应的信息以键-值对的方式进行存储;
b.从用户的指定内容或背景信息中提取出至少一个特征词;
c.将步骤b提取的特征词在步骤a构建的特征词库中进行检索,如果检索到匹配记录,往下继续执行;如果没有匹配记录则重新执行步骤b;
d.将步骤c匹配后的特征词进行过滤,筛选出更符合用户的指定内容或背景信息的特征词;
e.将步骤d过滤后的特征词在步骤a构建的信息库中进行检索,将检索到的信息发送到客户端。
2.如权利要求1所述的基于特征词的内容推送方法,其特征为:构建步骤a中所述的特征词库包括系统录入和人工录入,其中系统录入为将至少包括公开出版的数字信息形式的辞海和辞源的所有索引词进行系统录入。
3.如权利要求1所述的基于特征词的内容推送方法,其特征为:步骤c中,当在特征词库中没有与步骤b的特征词对应的记录时,将所述的特征词通过搜索引擎在互联网上进行搜索,如果在互联网搜索到相关信息,则将所述相关信息自动录入到特征词库中;如果互联网上没有搜索到相关信息,再则重新执行步骤b。
4.如权利要求1所述的基于特征词的内容推送方法,其特征为:步骤d所述的对特征词进行过滤,至少包括以下其中一种方式:
d1.名称优先;
d2.按特征词的热度进行选择;
d3.与背景信息或特征词属性同一领域的特征词优先。
5.如权利要求1所述的基于特征词的内容推送方法,其特征为:步骤e所述在信息库中的检索还包括将特征词通过搜索引擎在互联网上进行搜索,并将搜索到的信息录入到信息库中保存。
6.如权利要求1至5之一所述的基于特征词的内容推送方法,其特征为:步骤b中所述用户的指定内容或背景信息包括音/视频文件的文件名、源数据信息、音频文件中的歌词文件、视频文件中的字幕文件、人名信息、事件名称或事件类型中的至少一种。
7.如权利要求1至5之一所述的基于特征词的内容推送方法,其特征为:步骤e所述的客户端为计算机系统或便携式终端。
CN2012102641275A 2012-07-27 2012-07-27 基于特征词的内容推送方法 Pending CN102880633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102641275A CN102880633A (zh) 2012-07-27 2012-07-27 基于特征词的内容推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102641275A CN102880633A (zh) 2012-07-27 2012-07-27 基于特征词的内容推送方法

Publications (1)

Publication Number Publication Date
CN102880633A true CN102880633A (zh) 2013-01-16

Family

ID=47481959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102641275A Pending CN102880633A (zh) 2012-07-27 2012-07-27 基于特征词的内容推送方法

Country Status (1)

Country Link
CN (1) CN102880633A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218458A (zh) * 2013-05-13 2013-07-24 百度在线网络技术(北京)有限公司 推荐方法及推荐服务器
CN105468601A (zh) * 2014-08-21 2016-04-06 富泰华工业(深圳)有限公司 信息处理装置和信息处理系统及其信息处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040199498A1 (en) * 2003-04-04 2004-10-07 Yahoo! Inc. Systems and methods for generating concept units from search queries
CN1851736A (zh) * 2005-10-17 2006-10-25 华为技术有限公司 用户业务行为特征采集的系统及方法
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
CN101145153A (zh) * 2006-09-13 2008-03-19 阿里巴巴公司 一种搜索信息的方法及系统
CN101364239A (zh) * 2008-10-13 2009-02-11 中国科学院计算技术研究所 一种分类目录自动构建方法及相关系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040199498A1 (en) * 2003-04-04 2004-10-07 Yahoo! Inc. Systems and methods for generating concept units from search queries
CN1851736A (zh) * 2005-10-17 2006-10-25 华为技术有限公司 用户业务行为特征采集的系统及方法
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
CN101145153A (zh) * 2006-09-13 2008-03-19 阿里巴巴公司 一种搜索信息的方法及系统
CN101364239A (zh) * 2008-10-13 2009-02-11 中国科学院计算技术研究所 一种分类目录自动构建方法及相关系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218458A (zh) * 2013-05-13 2013-07-24 百度在线网络技术(北京)有限公司 推荐方法及推荐服务器
CN105468601A (zh) * 2014-08-21 2016-04-06 富泰华工业(深圳)有限公司 信息处理装置和信息处理系统及其信息处理方法

Similar Documents

Publication Publication Date Title
US9947025B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
CN102265276B (zh) 基于上下文的推荐系统
WO2017028624A1 (zh) 一种资源的处理方法及装置
US8108407B2 (en) Informationn retrieval apparatus
JP2010067175A (ja) ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
CN104160712A (zh) 计算媒体节目之间的相似度
CA2952221A1 (en) System and method for providing related digital content
De Pessemier et al. Context aware recommendations for user-generated content on a social network site
CN103324757A (zh) 移动终端中应用程序的搜索方法和装置
CN105335414B (zh) 音乐推荐方法、装置及终端
US20140304247A1 (en) Method and System for Content Management
US20170242861A1 (en) Music Recommendation Method and Apparatus
CN102708135A (zh) 自动配置专辑并管理专辑的封面图像的设备和方法
US20150081690A1 (en) Network sourced enrichment and categorization of media content
CN104853251A (zh) 一种多媒体数据的在线收藏方法和装置
US20170366862A1 (en) Content recommendation user interface
US20100293158A1 (en) Information processing apparatus and information processing method
US20140229488A1 (en) Apparatus, Method, and Computer Program Product For Ranking Data Objects
CN102880633A (zh) 基于特征词的内容推送方法
WO2013190446A1 (en) Continuity of content
KR20120133387A (ko) 추정 장치, 추정 방법, 그리고 프로그램을 기록한 기록매체
JP5346991B2 (ja) コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム
KR101624172B1 (ko) 컨텐츠 정보 관리 장치 및 방법
CN103970812A (zh) 多媒体内容的搜寻方法与系统
US20170242923A1 (en) Device for internet search of music recordings or scores

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130116