CN107203621A - 一种基于拼音首字母的查询方法 - Google Patents

一种基于拼音首字母的查询方法 Download PDF

Info

Publication number
CN107203621A
CN107203621A CN201710380876.7A CN201710380876A CN107203621A CN 107203621 A CN107203621 A CN 107203621A CN 201710380876 A CN201710380876 A CN 201710380876A CN 107203621 A CN107203621 A CN 107203621A
Authority
CN
China
Prior art keywords
multimedia programming
priority
initial
resource
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710380876.7A
Other languages
English (en)
Inventor
冯方方
孙健
刘斌
付强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universal Wisdom Technology Beijing Co Ltd
Original Assignee
Universal Wisdom Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universal Wisdom Technology Beijing Co Ltd filed Critical Universal Wisdom Technology Beijing Co Ltd
Priority to CN201710380876.7A priority Critical patent/CN107203621A/zh
Publication of CN107203621A publication Critical patent/CN107203621A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例涉及一种基于拼音首字母的查询方法,包括:服务器接收用户终端发送的待搜索多媒体节目资源的查询请求;在多媒体节目资源数据库中进行检索,得到相匹配的多媒体节目资源标题的首字母;获取相对应的多媒体节目资源标题;获取相对应的多媒体节目资源数据;设定多媒体节目资源数据的优先级;其中当多媒体节目资源标题的首字母与待搜索首字母完全匹配时,设定优先级为第一优先级;根据多媒体节目资源标题的首字母中待搜索首字母的出现位置设定优选级为第二优先级;根据多媒体节目资源数据的时间属性设定优选级为第三优先级;根据多媒体节目资源数据的分类属性设定优选级为第四优先级;生成多媒体节目资源显示列表数据,发送给用户终端。

Description

一种基于拼音首字母的查询方法
技术领域
本发明涉及数据处理领域,尤其涉及一种基于拼音首字母的查询方法。
背景技术
随着信息技术的发展,对于多媒体数据的管理主要依靠服务器完成,在管理中,经常需要对服务器中的多媒体数据进行查询操作,如何能够更方便快速的帮助用户实现多媒体数据的查找,成为服务器易用性的一个重要指标。
目前主要的视频网站主要是通过关键字进行查询。但由于输入关键字需要较多的键盘输入,在电脑和手机上并没有太大问题,但在智能电视或机顶盒上进行操作时,就非常不便。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种基于拼音首字母的查询方法,实现根据多媒体节目资源的标题拼音首字母进行快速搜索,并按一定的规则对搜索结果进行排序,大大地提高了用户体验。
有鉴于此,本发明实施例提供了一种基于拼音首字母的查询方法,包括:
服务器接收用户终端发送的待搜索多媒体节目资源的查询请求;其中,查询请求中携带有待搜索多媒体节目资源标题的待搜索首字母;
根据待搜索首字母在多媒体节目资源数据库中进行检索,得到相匹配的多媒体节目资源标题的首字母;
根据所述检索得到的首字母获取相对应的多媒体节目资源标题;
根据所述多媒体节目资源标题在多媒体节目资源数据库中获取相对应的多媒体节目资源数据;
设定所述多媒体节目资源数据的优先级;其中,当多媒体节目资源标题的首字母与所述待搜索首字母完全匹配时,设定优先级为第一优先级;根据多媒体节目资源标题的首字母中所述待搜索首字母的出现位置设定优选级为第二优先级;根据所述多媒体节目资源数据的时间属性设定优选级为第三优先级;根据所述多媒体节目资源数据的分类属性设定优选级为第四优先级;
根据所述优先级将所述多媒体节目资源数据生成多媒体节目资源显示列表数据;
将所述多媒体节目资源显示列表数据发送给所述用户终端。
优选的,在所述服务器接收用户终端发送的待搜索多媒体节目资源的查询请求之前,所述方法还包括:
所述服务器提取所述多媒体节目资源数据库中多媒体节目资源数据的多媒体节目资源标题;
建立所述多媒体节目资源标题和所述多媒体节目资源数据之间的关联关系,并储存在所述多媒体节目资源数据库中。
进一步优选的,在所述建立所述多媒体节目资源标题和所述多媒体节目资源数据之间的关联关系,并储存在所述多媒体节目资源数据库中之后,所述方法包括:
提取所述多媒体节目资源标题的首字母;
建立所述首字母与所述多媒体节目资源标题的关联关系,并储存在所述多媒体节目资源数据库中。
优选的,所述根据所述优先级将所述多媒体节目资源数据生成多媒体节目资源显示列表数据具体为:
根据所述第一优先级、第二优先级、第三优先级和第四优先级中的一个或多个优先级,将所述多媒体节目资源数据生成多媒体节目资源显示列表数据。
优选的,所述时间属性包括上映时间或添加时间。
本发明实施例提供的一种基于拼音首字母的查询方法,实现根据多媒体节目资源的标题拼音首字母进行快速搜索,并按一定的规则对搜索结果进行排序,大大地提高了用户体验。
附图说明
图1为本发明实施例提供的基于拼音首字母的查询方法流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例提供的基于拼音首字母的查询方法,主要应用于用户终端设备中,比如智能电视等。
图1为本发明实施例提供的基于拼音首字母的查询方法流程图,如图1所示,包括:
步骤101,服务器接收用户终端发送的待搜索多媒体节目资源的查询请求;
其中,用户终端可以是智能电视、智能手机等终端设备。
具体的,用户终端接收用户在搜索界面输入的待搜索多媒体节目资源标题的待搜索首字母,生成查询请求,发送给服务器。
待搜索多媒体节目资源标题是指用户要搜索的多媒体节目的名称,待搜索首字母是指待搜索多媒体节目资源标题拼音的首字母组合,比如,用户要搜索影片“欢乐颂”,其中,“欢乐颂”为待搜索多媒体节目资源标题,对应的待搜索首字母即为“hls”,因此用户在搜索时输入“hls”。
在步骤101之前,还需要对多媒体节目资源数据库中多媒体节目资源数据对应的首字母进行提取,具体包括如下过程。
服务器提取多媒体节目资源数据库中多媒体节目资源数据的多媒体节目资源标题;其中,多媒体节目资源数据库中包括多个多媒体节目资源数据,多媒体节目资源数据可以是电影、电视剧、综艺等视音频;每个多媒体节目资源数据对应一个多媒体节目资源标题,用于标示多媒体节目资源数据。
建立多媒体节目资源标题和多媒体节目资源数据之间的关联关系,并储存在多媒体节目资源数据库中,从而根据多媒体节目资源标题可以查询获取到相对应的多媒体节目资源数据。
提取多媒体节目资源标题的首字母;其中,提取多媒体节目资源标题的拼音和首字母有多种方法,可以通过GBK编码规范计算出汉字的拼音,也可以通过字典表来查询,本发明中优选采用了pinyin转换插件实现多媒体节目资源标题的首字母提取。
建立首字母与多媒体节目资源标题的关联关系,并储存在多媒体节目资源数据库中。具体的,本发明使用sphinx建立索引,在配置索引时需要将ngram_len和min_word_len配置项参数设置为1,以支持单个字母的查询。
在建立索引时,索引字段包括首字母、首字母长度、影片添加时间、影片分类级别等字段。其中首字母索引主要用来匹配,首字母长度、影片添加时间和影片分类级别则用来进行排序。
步骤102,根据待搜索首字母在多媒体节目资源数据库中进行检索,得到相匹配的多媒体节目资源标题的首字母;
其中,得到的相匹配的多媒体节目资源标题的首字母可以是与待搜索首字母完全相同的,也可以是包含待搜索首字母。也就是说在查询时是通过首字母长度的正序排列来实现的,原因是用户输入的字母序列,在数据库中进行首字母匹配时,只有两种情况会匹配上,一种是两者完全相同,即精确匹配;另外一种是影片库的首字母包含用户输入的字母序列,此时其首字母长度必然大于精确匹配的长度。因此采用首字母长度的正序排列,完全可以实现精确匹配的需求。
在一个具体的例子中,待搜索首字母为yw,根据搜索首字母yw得到相匹配的多媒体节目资源标题的首字母可以是一个或多个yw,这是因为不同的标题对应的首字母可能相同,比如,影片《欲望》与《叶问》对应的首字母都是yw;得到相匹配的首字母还可以是ywaq、byw等包含yw的首字母。
步骤103,根据检索得到的首字母获取相对应的多媒体节目资源标题;
具体的,在多媒体节目资源数据库中根据首字母与多媒体节目资源标题的关联关系,获取与检索得到的首字母相对应的多媒体节目资源标题。
步骤104,根据多媒体节目资源标题在多媒体节目资源数据库中获取相对应的多媒体节目资源数据;
其中,多媒体节目资源数据可以包括多媒体节目的标题、图片、更新日期、链接地址等信息。
具体的,在多媒体节目资源数据库中多媒体节目资源标题与多媒体节目资源数据的关联关系,获取与多媒体节目资源标题相对应的多媒体节目资源数据。
步骤105,设定多媒体节目资源数据的优先级;
其中,在本例中优先级可以包括第一优先级、第二优先级、第三优先级和第四优先级。
具体的,第一优先级的设定是根据当多媒体节目资源标题的首字母与待搜索首字母完全匹配时,设定对应的优先级为第一优先级。根据第一优先级可以对首字母匹配精度进行优化,得到完全匹配的数据。
第二优先级的设定是根据多媒体节目资源标题的首字母中待搜索首字母的出现位置。具体的,对用户输入的首字母在被匹配标题首字母中出现的位置进行计算,由于用户输入的字母序列组合很多,无法通过事先建立索引来实现,需要通过sphinx查询后再进行计算,本发明是通过sphinx返回的数据再比较出现的位置,从而实现了第二优先级的要求,出现的位置越靠前排序越靠前。
第三优先级的设定是根据多媒体节目资源数据的时间属性;其中时间属性可以是上映时间或添加时间,时间越晚排序越靠前。
第四优先级的设定是根据多媒体节目资源数据的分类属性;其中,分类属性可以为电影、电视剧、动漫、纪录片、综艺;分类属性的顺序可以是服务器预先设定的,也可以是用户设定的。
步骤106,根据优先级将多媒体节目资源数据生成多媒体节目资源显示列表数据;
具体的,可以根据第一优先级、第二优先级、第三优先级和第四优先级中的一个或多个优先级,将多媒体节目资源数据生成多媒体节目资源显示列表数据。其中,优先级的选择可以是服务器预设的,也可以是用户选择的。
也就是说,可以按照任意一个优先级将多媒体节目资源数据生成多媒体节目资源显示列表数据,也可以按照第一优先级、第三优先级和第四优先级或者第二优先级、第三优先级和第四优先级将多媒体节目资源数据生成多媒体节目资源显示列表数据。
步骤107,将多媒体节目资源显示列表数据发送给用户终端。
用户终端根据多媒体节目资源显示列表中优先级将多媒体节目资源数据的排列顺序对优先级将多媒体节目资源数据进行显示,从而为用户显示查询到的多媒体节目资源。
本发明实施例提供的一种基于拼音首字母的查询方法,实现根据多媒体节目资源的标题拼音首字母进行快速搜索,并按一定的规则对搜索结果进行排序,大大地提高了用户体验。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于拼音首字母的查询方法,其特征在于,所述方法包括:
服务器接收用户终端发送的待搜索多媒体节目资源的查询请求;其中,查询请求中携带有待搜索多媒体节目资源标题的待搜索首字母;
根据待搜索首字母在多媒体节目资源数据库中进行检索,得到相匹配的多媒体节目资源标题的首字母;
根据所述检索得到的首字母获取相对应的多媒体节目资源标题;
根据所述多媒体节目资源标题在多媒体节目资源数据库中获取相对应的多媒体节目资源数据;
设定所述多媒体节目资源数据的优先级;其中,当多媒体节目资源标题的首字母与所述待搜索首字母完全匹配时,设定优先级为第一优先级;根据多媒体节目资源标题的首字母中所述待搜索首字母的出现位置设定优选级为第二优先级;根据所述多媒体节目资源数据的时间属性设定优选级为第三优先级;根据所述多媒体节目资源数据的分类属性设定优选级为第四优先级;
根据所述优先级将所述多媒体节目资源数据生成多媒体节目资源显示列表数据;
将所述多媒体节目资源显示列表数据发送给所述用户终端。
2.根据权利要求1所述的基于拼音首字母的查询方法,其特征在于,在所述服务器接收用户终端发送的待搜索多媒体节目资源的查询请求之前,所述方法还包括:
所述服务器提取所述多媒体节目资源数据库中多媒体节目资源数据的多媒体节目资源标题;
建立所述多媒体节目资源标题和所述多媒体节目资源数据之间的关联关系,并储存在所述多媒体节目资源数据库中。
3.根据权利要求2所述的基于拼音首字母的查询方法,其特征在于,在所述建立所述多媒体节目资源标题和所述多媒体节目资源数据之间的关联关系,并储存在所述多媒体节目资源数据库中之后,所述方法包括:
提取所述多媒体节目资源标题的首字母;
建立所述首字母与所述多媒体节目资源标题的关联关系,并储存在所述多媒体节目资源数据库中。
4.根据权利要求1所述的基于拼音首字母的查询方法,其特征在于,所述根据所述优先级将所述多媒体节目资源数据生成多媒体节目资源显示列表数据具体为:
根据所述第一优先级、第二优先级、第三优先级和第四优先级中的一个或多个优先级,将所述多媒体节目资源数据生成多媒体节目资源显示列表数据。
5.根据权利要求1所述的基于拼音首字母的查询方法,其特征在于,所述时间属性包括上映时间或添加时间。
CN201710380876.7A 2017-05-25 2017-05-25 一种基于拼音首字母的查询方法 Pending CN107203621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710380876.7A CN107203621A (zh) 2017-05-25 2017-05-25 一种基于拼音首字母的查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710380876.7A CN107203621A (zh) 2017-05-25 2017-05-25 一种基于拼音首字母的查询方法

Publications (1)

Publication Number Publication Date
CN107203621A true CN107203621A (zh) 2017-09-26

Family

ID=59905427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710380876.7A Pending CN107203621A (zh) 2017-05-25 2017-05-25 一种基于拼音首字母的查询方法

Country Status (1)

Country Link
CN (1) CN107203621A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015856A (zh) * 2020-08-26 2020-12-01 海看网络科技(山东)股份有限公司 一种IPTV中基于Elasticsearch实现拼音检索方法
CN113542899A (zh) * 2020-04-22 2021-10-22 聚好看科技股份有限公司 信息展示方法、显示设备、服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250307A1 (en) * 2006-03-03 2007-10-25 Iq Technology Inc. System, method, and computer readable medium thereof for language learning and displaying possible terms
CN101601284A (zh) * 2006-12-07 2009-12-09 Lg电子株式会社 用于搜索电子节目指南的方法和装置
CN102968453A (zh) * 2012-10-24 2013-03-13 北京暴风科技股份有限公司 一种用于移动终端上的影视搜索方法
CN102999498A (zh) * 2011-09-08 2013-03-27 中兴通讯股份有限公司 多媒体节目的检索方法及装置
CN103051969A (zh) * 2012-12-31 2013-04-17 乐视网信息技术(北京)股份有限公司 一种节目搜索方法及具有节目搜索功能的电视

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250307A1 (en) * 2006-03-03 2007-10-25 Iq Technology Inc. System, method, and computer readable medium thereof for language learning and displaying possible terms
CN101601284A (zh) * 2006-12-07 2009-12-09 Lg电子株式会社 用于搜索电子节目指南的方法和装置
CN102999498A (zh) * 2011-09-08 2013-03-27 中兴通讯股份有限公司 多媒体节目的检索方法及装置
CN102968453A (zh) * 2012-10-24 2013-03-13 北京暴风科技股份有限公司 一种用于移动终端上的影视搜索方法
CN103051969A (zh) * 2012-12-31 2013-04-17 乐视网信息技术(北京)股份有限公司 一种节目搜索方法及具有节目搜索功能的电视

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542899A (zh) * 2020-04-22 2021-10-22 聚好看科技股份有限公司 信息展示方法、显示设备、服务器
CN112015856A (zh) * 2020-08-26 2020-12-01 海看网络科技(山东)股份有限公司 一种IPTV中基于Elasticsearch实现拼音检索方法

Similar Documents

Publication Publication Date Title
US9645787B1 (en) Tag-based electronic media playlist processing
US10552754B2 (en) Systems and methods for recognizing ambiguity in metadata
CN107992585B (zh) 通用标签挖掘方法、装置、服务器及介质
US9659278B2 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
CA2832909C (en) System and method for matching comment data to text data
WO2020248849A1 (zh) 一种网页语言的切换方法、装置及终端设备
CN105824923A (zh) 影视资源推荐方法及装置
WO2019000782A1 (zh) 一种搜索词推荐方法、机顶盒和存储介质
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
CN101477527B (zh) 一种检索多媒体资源的方法及装置
JP2013020411A (ja) 情報処理装置、情報処理方法及びプログラム
US20140379719A1 (en) System and method for tagging and searching documents
CN110515896B (zh) 模型资源管理方法、模型文件制作方法、装置和系统
CN107357812A (zh) 一种数据查询方法及装置
WO2022105119A1 (zh) 意图识别模型的训练语料生成方法及其相关设备
CN101631398A (zh) 一种移动终端电子书管理系统和方法
CN110222194A (zh) 基于自然语言处理的数据图表生成方法和相关装置
JP2011233162A (ja) 医療用語の曖昧性を判定するシステム、方法およびソフトウェア
US11010398B2 (en) Metadata extraction and management
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN108255963A (zh) 一种基于互联网的新闻信息检索的控制方法及装置
CN105335466A (zh) 一种音频数据的检索方法与装置
CN107203621A (zh) 一种基于拼音首字母的查询方法
CN106970758A (zh) 电子文档操作处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170926