CN101610393A - Iptv系统及其节目信息搜索系统与方法 - Google Patents
Iptv系统及其节目信息搜索系统与方法 Download PDFInfo
- Publication number
- CN101610393A CN101610393A CNA2009101087726A CN200910108772A CN101610393A CN 101610393 A CN101610393 A CN 101610393A CN A2009101087726 A CNA2009101087726 A CN A2009101087726A CN 200910108772 A CN200910108772 A CN 200910108772A CN 101610393 A CN101610393 A CN 101610393A
- Authority
- CN
- China
- Prior art keywords
- search
- program
- chinese character
- user
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种IPTV系统及其节目信息搜索系统与方法。其中,该节目信息搜索系统包括:数据库;数据采集单元,用于从IPTV系统中的流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;汉字转拼音单元,用于利用ASCII码表将节目特征信息的汉字转换为拼音;具有搜索引擎程序的搜索引擎单元,用于将节目特征信息对应的拼音索引为搜索引擎程序的数据,根据用户输入的搜索拼音启动搜索,将搜索结果返回给用户,并将用户根据搜索结果作出的用户选择请求转发至流媒体服务器以获取对应的节目。本发明考虑遥控器输入的限制,提供了一种用户使用遥控器输入拼音即可快速搜索和定位节目信息,从而方便了用户。
Description
技术领域
本发明涉及数字电视节目信息搜索方法,尤其是涉及一种在IPTV系统中基于拼音搜索定位节目的数字电视节目信息搜索方法和节目信息搜索系统。
背景技术
IPTV是以“电视机+机顶盒”为主要终端设备、通过IP数据网络向用户提供交互式电视和多媒体服务的数据增值业务。
由于IPTV有很强的与用户的交互能力,其为改善TV用户的业务体验提供了良好的基础。在这个基础上,衍生出各种丰富多彩的增值业务,改变了原有业务的提供模式,用户由原来的被动接收节目,变为可以主动点播自己想看的节目,可以自由支配节目播放的时间。
用户在使用IPTV业务时,可以通过在媒体服务器对节目源进行分类罗列,用户根据自己的喜好,可以逐层选择,在海量节目中浏览、查找节目片源。
现有的IPTV系统提供对节目标题、演员、导演、节目介绍等内容的搜索定位功能,但是由于用户需要通过遥控器输入搜索关键字,故媒体服务器将节目信息以目录方式提供定位搜索。当节目信息较多时,目录定位的方式难以适应用户的需求,用户需要多次翻页才能找到目标的节目。
因此,针对IPTV用户不能快速搜索到其感兴趣的节目信息,有必要为IPTV系统开发一种新的搜索方式来适用当前当前庞大的节目信息搜索。
发明内容
本发明提出一种在IPTV系统中基于拼音搜索定位节目的数字电视节目信息搜索方法和节目信息搜索系统,以解决当前IPTV系统采用节目目录定位搜索节目信息存在效率低和不便于用户使用的技术问题。
为解决本发明的技术问题,本发明公开一种IPTV系统中的节目信息搜索系统,其包括:
数据库;
数据采集单元,用于从IPTV系统中的流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;
汉字转拼音单元,用于利用ASCII码表将节目特征信息的汉字转换为拼音;
具有搜索引擎程序的搜索引擎单元,用于将节目特征信息对应的拼音索引为搜索引擎程序的数据,根据IPTV系统的用户输入的搜索拼音启动搜索,将搜索结果返回给用户,并将用户根据搜索结果作出的用户选择请求转发至流媒体服务器以获取对应的节目。
其中,所述汉字转拼音单元按多音字拼音组合规则、模糊音拼音组合规则和地区性习惯发音规则,将节目特征信息中的一个汉字或汉字词组转换成对应的多组拼音。
其中,所述IPTV系统中的节目信息搜索系统还包括:拼音选择单元,用于统计同一个汉字或汉字词组对应的多组拼音的搜索概率,将检索概率大的一组或几组拼音优先索引在搜索引擎单元的搜索引擎中。
其中,所述搜索结果通过超文本文档HTML文件的形式以超文本传输HTTP协议返回用户。
另外,本发明公开一种IPTV系统,包括用户终端设备和媒体服务器,为户终端设备对流媒体服务器中的节目信息提供基于拼音搜索的节目搜索系统;
该节目搜索系统包括:数据库;数据采集单元,用于从流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;汉字转拼音单元,用于利用ASCII码表将节目特征信息的汉字转换为拼音;具有搜索引擎程序的搜索引擎单元,用于将节目特征信息对应的拼音索引为搜索引擎程序的数据,根据用户终端设备输入的搜索拼音启动搜索,将搜索结果返回给用户终端设备,并将用户终端设备根据搜索结果作出的用户选择请求转发至流媒体服务器;
由流媒体服务器根据用户选择请求为用户终端设备提供对应的节目。
再者,本发明公开一种IPTV系统中的节目信息搜索方法,其包括:
从IPTV系统中的流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;
利用ASCII码表将节目特征信息的汉字转换为拼音并索引为搜索引擎单元中搜索引擎程序的数据;
由用户终端设备接收用户输入的搜索拼音,生成搜索请求发送给搜索引擎单元启动搜索;
搜索引擎单元将搜索结果返回给用户,并将用户根据搜索结果作出的用户选择请求转发至流媒体服务器;
由流媒体服务器根据用户选择请求为用户终端设备提供对应的节目。
与现有技术相比,本发明具有如下有益效果:
本发明考虑遥控器输入的限制,提供了一种用户使用遥控器输入拼音即可快速搜索节目信息,方便了用户搜索和定位节目。另外,本发明通过对多音字采取用户适应的策略处理,简便的解决了多音字的问题,通过对模糊音的处理,使得不同地域的用户可以得到更为精确的搜索结果。
附图说明
图1是本发明的结构示意图。
具体实施方式
为了使本发明实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。
本发明考虑遥控器输入的限制,提供了一种用户使用遥控器输入拼音即可快速搜索节目信息,其通过对多音字采取用户适应的策略处理,简便的解决了多音字的问题,通过对模糊音的处理,使得不同地域的用户可以得到更为精确的搜索结果,方便了用户搜索和定位节目。
如图1所示,本发明实施例的IPTV系统包括:多个接入的用户终端设备1;一个或多个流媒体服务器2;以及连接流媒体服务器2,且为户终端设备1对流媒体服务器2中的节目信息提供基于拼音搜索的节目搜索系统3。
其中,节目搜索系统3包括:数据库31和面向数据库31进行搜索的搜索模块32。搜索模块32包括:数据采集单元321、汉字转拼音单元322、拼音选择单元323、具有搜索引擎程序的搜索引擎单元324。
数据采集单元321通过采用网络爬虫程序从流媒体服务器2采集其提供的节目源的节目特征信息,将节目特征信息保存至数据库31,且该节目特征信息可以是节目名称、导演、演员,甚至节目介绍内容等信息。
汉字转拼音单元322先对节目特征信息进行分词处理,再利用ASCII码表将汉字转换为拼音。由于汉字在计算机系统中以ASCII码表示,只需要利用计算机系统中已有的或用户自己建立的每个拼音与每个ASCII码对应关系,即可实现将汉字转换成全拼。此转换处理由计算机程序实现,具体的程序代码可使用Java、C语言或C++等编程语言实现,且互联网上都有公开此类编程语言实现的汉字转换拼音的程序源代码,故在此不再详述。
汉字转拼音单元322在利用ASCII码表进行汉字转换为拼音时,由于汉字中存在多音字的情况,因此对同一个词组,可能会出现多组拼音结果,当词组里包含的多音字更多时,这个组合还会扩大。为了既能采取正确的拼音组合,又能照顾到用户的个人情况(对多音字的辨认能力),我们使用适应用户的方法。从用户的角度出发,我们认为一个词组的拼音发音,不但存在正确的发音,还存在用户的习惯性发音,这两者都可以被认为是有效的拼音组合,而正确的发音往往包含在用户的习惯性发音中,因此这种方法的描述如下:对一个存在多音字的词组的多种拼音组合,将其全部纳入搜索引擎单元324的搜索引擎的搜索范围;由拼音选择单元323在一定的时间内对同一词组的各种拼音组合的搜索频率进行统计,选取被用户搜索最为频繁的一个或几个拼音组合,丢弃其他的拼音组合。
以电影《和平战士》为例,电影名称信息“和平战士”存储在数据库31中,由汉字转拼音单元322将“和平战士”这三个字转换为“he ping zhan shi”和“huo ping zhan shi”两种拼音组合,然后索引在搜索引擎单元324的搜索引擎中。在一定的时间后,拼音选择单元323检查这两种拼音组合的搜索概率,将检索概率大的一项或者几项作为正确的拼音组合,索引在搜索引擎单元324的搜索引擎中,例如,假设在本例中为“he ping zhan shi”。
另外,汉字转拼音单元322还对汉字可以在多音字的处理阶段结束后进行模糊音的处理,由于在多音字处理阶段已经得到了正确的拼音组合,因此可以根据此拼音组合,以及南方模糊音的规则生成模糊音拼音组合。
对模糊音进行处理,针对模糊音ing=>in、zh=>z以及sh=>s的情况,在搜索引擎中添加“he pin zhan shi”、“he pin zan shi”、“he pin zan si”等8种组合。由于各地方言情况不同,因此由运营商来设定模糊音转换的规则,能有效的减少数据的冗余,提高搜索的准确度。
由搜索引擎单元324将转换为拼音的节目特征信息索引为搜索引擎的数据;用户终端设备1提供用户输入搜索拼音并生成搜索请求,用户终端设备1将搜索请求发送给搜索引擎单元324启动搜索,搜索引擎单元324可将搜索到相应的节目信息后,生成HTML文件通过HTTP协议返回给用户终端设备1;并将用户终端设备1对搜索结果的选择请求转发给流媒体服务器2,由流媒体服务器2向用户终端设备1提供对应的节目,用户终端设备1接收流媒体服务器2提供该节目的数据流进行播放处理。
综上,本发明考虑遥控器输入的限制,提供了一种用户使用遥控器输入拼音即可快速搜索节目信息,方便了用户搜索和定位节目。另外,本发明通过对多音字采取用户适应的策略处理,简便的解决了多音字的问题,通过对模糊音的处理,使得不同地域的用户可以得到更为精确的搜索结果。
Claims (10)
1、一种IPTV系统中的节目信息搜索系统,其特征在于,包括:
数据库;
数据采集单元,用于从IPTV系统中的流媒体服务器获取节目源的节目特征信息并保存至数据库;
汉字转拼音单元,用于利用ASCII码表将节目特征信息的汉字转换为拼音;
具有搜索引擎程序的搜索引擎单元,用于将节目特征信息对应的拼音索引为搜索引擎程序的数据,根据IPTV系统的用户输入的搜索拼音启动搜索,将搜索结果返回给用户,并将用户根据搜索结果作出的用户选择请求转发至流媒体服务器以获取对应的节目。
2、根据权利要求1所述IPTV系统中的节目信息搜索系统,其特征在于,所述汉字转换为拼音是按多音字拼音组合规则、模糊音拼音组合规则和地区性习惯发音规则,将节目特征信息中的一个汉字或汉字词组转换成对应的多组拼音。
3、根据权利要求2所述IPTV系统中的节目信息搜索系统,其特征在于,还包括:拼音选择单元,用于统计同一个汉字或汉字词组对应的多组拼音的搜索概率,将检索概率大的一组或几组拼音优先索引在搜索引擎单元的搜索引擎中。
4、根据权利要求1所述IPTV系统中的节目信息搜索系统,其特征在于,所述搜索结果通过超文本文档HTML文件的形式以超文本传输HTTP协议返回用户。
5、一种IPTV系统,包括用户终端设备和媒体服务器,其特征在于,还包括:为户终端设备对流媒体服务器中的节目信息提供基于拼音搜索的节目搜索系统;
该节目搜索系统包括:数据库;数据采集单元,用于从流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;汉字转拼音单元,用于利用ASCII码表将节目特征信息的汉字转换为拼音;具有搜索引擎程序的搜索引擎单元,用于将节目特征信息对应的拼音索引为搜索引擎程序的数据,根据用户终端设备输入的搜索拼音启动搜索,将搜索结果返回给用户终端设备,并将用户终端设备根据搜索结果作出的用户选择请求转发至流媒体服务器;
由流媒体服务器根据用户选择请求为用户终端设备提供对应的节目。
6、根据权利要求5所述IPTV系统,其特征在于,所述汉字转换为拼音是按多音字拼音组合规则、模糊音拼音组合规则和地区性习惯发音规则,将节目特征信息中的一个汉字或汉字词组转换成对应的多组拼音。
7、根据权利要求6所述IPTV系统,其特征在于,还包括:拼音选择单元,用于统计同一个汉字或汉字词组对应的多组拼音的搜索概率,将检索概率大的一组或几组拼音优先索引在搜索引擎单元的搜索引擎中。
8、一种IPTV系统中的节目信息搜索方法,其特征在于,包括:
从IPTV系统中的流媒体服务器采集其提供的节目源的节目特征信息并保存至数据库;
利用ASCII码表将节目特征信息的汉字转换为拼音并索引为搜索引擎单元中搜索引擎程序的数据;
由用户终端设备接收用户输入的搜索拼音,生成搜索请求发送给搜索引擎单元启动搜索;
搜索引擎单元将搜索结果返回给用户,并将用户根据搜索结果作出的用户选择请求转发至流媒体服务器;
由流媒体服务器根据用户选择请求为用户终端设备提供对应的节目。
9、根据权利要求8所述IPTV系统中的节目信息搜索方法,其特征在于,按多音字拼音组合规则、模糊音拼音组合规则和地区性习惯发音规则,将节目特征信息中的一个汉字或汉字词组转换成对应的多组拼音。
10、根据权利要求9所述IPTV系统中的节目信息搜索方法,其特征在于,统计同一个汉字或汉字词组对应的多组拼音的搜索概率,将检索概率大的一组或几组拼音优先索引在搜索引擎单元的搜索引擎中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101087726A CN101610393A (zh) | 2009-07-17 | 2009-07-17 | Iptv系统及其节目信息搜索系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101087726A CN101610393A (zh) | 2009-07-17 | 2009-07-17 | Iptv系统及其节目信息搜索系统与方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101610393A true CN101610393A (zh) | 2009-12-23 |
Family
ID=41483938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2009101087726A Pending CN101610393A (zh) | 2009-07-17 | 2009-07-17 | Iptv系统及其节目信息搜索系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101610393A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102455850A (zh) * | 2010-10-22 | 2012-05-16 | 联想(北京)有限公司 | 应用于滑盖式遥控器的搜索方法及滑盖式遥控器 |
CN103678674A (zh) * | 2013-12-25 | 2014-03-26 | 乐视网信息技术(北京)股份有限公司 | 通过拼音进行纠错搜索的方法、装置及系统 |
CN105243086A (zh) * | 2015-09-08 | 2016-01-13 | 北京北大千方科技有限公司 | 一种车辆信息查询方法和装置 |
CN101998151B (zh) * | 2010-09-21 | 2016-08-03 | 深圳创维数字技术有限公司 | 机顶盒、采用拼音输入实现机顶盒操作的方法 |
CN105912627A (zh) * | 2016-04-07 | 2016-08-31 | 上海斐讯数据通信技术有限公司 | 一种数据搜索系统及方法 |
CN112015856A (zh) * | 2020-08-26 | 2020-12-01 | 海看网络科技(山东)股份有限公司 | 一种IPTV中基于Elasticsearch实现拼音检索方法 |
-
2009
- 2009-07-17 CN CNA2009101087726A patent/CN101610393A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101998151B (zh) * | 2010-09-21 | 2016-08-03 | 深圳创维数字技术有限公司 | 机顶盒、采用拼音输入实现机顶盒操作的方法 |
CN102455850A (zh) * | 2010-10-22 | 2012-05-16 | 联想(北京)有限公司 | 应用于滑盖式遥控器的搜索方法及滑盖式遥控器 |
CN102455850B (zh) * | 2010-10-22 | 2016-08-17 | 联想(北京)有限公司 | 应用于滑盖式遥控器的搜索方法及滑盖式遥控器 |
CN103678674A (zh) * | 2013-12-25 | 2014-03-26 | 乐视网信息技术(北京)股份有限公司 | 通过拼音进行纠错搜索的方法、装置及系统 |
CN105243086A (zh) * | 2015-09-08 | 2016-01-13 | 北京北大千方科技有限公司 | 一种车辆信息查询方法和装置 |
CN105243086B (zh) * | 2015-09-08 | 2019-04-12 | 北京北大千方科技有限公司 | 一种车辆信息查询方法和装置 |
CN105912627A (zh) * | 2016-04-07 | 2016-08-31 | 上海斐讯数据通信技术有限公司 | 一种数据搜索系统及方法 |
CN112015856A (zh) * | 2020-08-26 | 2020-12-01 | 海看网络科技(山东)股份有限公司 | 一种IPTV中基于Elasticsearch实现拼音检索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101437039B (zh) | 一种移动搜索的方法、系统和设备 | |
US8661041B2 (en) | Apparatus and method for semantic-based search and semantic metadata providing server and method of operating the same | |
KR101708448B1 (ko) | 예측 쿼리 제안 캐싱 | |
US7542967B2 (en) | Searching an index of media content | |
US8577856B2 (en) | System and method for enabling search of content | |
US10504039B2 (en) | Short message classification for video delivery service and normalization | |
US20090094189A1 (en) | Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content | |
US20100005493A1 (en) | Iptv system, media server, and iptv program search and location method | |
CN101610393A (zh) | Iptv系统及其节目信息搜索系统与方法 | |
Lai et al. | A personalized mobile IPTV system with seamless video reconstruction algorithm in cloud networks | |
CN101409657A (zh) | 家庭网络系统及其搜索信息的方法 | |
WO2012151968A1 (zh) | 互联网信息发布方法和系统 | |
US20080059478A1 (en) | Methods, systems, and computer program products for organizing and sharing content | |
US20110225134A1 (en) | System and method for enhanced find-in-page functions in a web browser | |
US20100064321A1 (en) | System and method for processing electronic program guide based on really simple syndication feed | |
CN102436458B (zh) | 一种命令解析的方法及其系统 | |
CN104424362B (zh) | 额外丰富内容元数据生成器 | |
US9043320B2 (en) | Enhanced find-in-page functions in a web browser | |
CN101888470B (zh) | 提供通用节目指南的设备和方法及其终端设备和系统 | |
JP5185891B2 (ja) | コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム | |
CN101686376A (zh) | 电视机及其操作方法 | |
CN101777070B (zh) | 一种互动数字电视节目搜索方法及查询服务器 | |
CN104254003A (zh) | 一种智能终端设备的频道切换方法及装置 | |
JP2009295054A (ja) | 映像コンテンツ検索装置及びコンピュータプログラム | |
JP5114547B2 (ja) | Soapオペレーションを用いた問合せコンテンツサービス方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20091223 |