CN106101748B - 节目处理方法和装置 - Google Patents
节目处理方法和装置 Download PDFInfo
- Publication number
- CN106101748B CN106101748B CN201610574786.7A CN201610574786A CN106101748B CN 106101748 B CN106101748 B CN 106101748B CN 201610574786 A CN201610574786 A CN 201610574786A CN 106101748 B CN106101748 B CN 106101748B
- Authority
- CN
- China
- Prior art keywords
- dimension
- information
- program
- content
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000005315 distribution function Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/232—Content retrieval operation locally within server, e.g. reading video streams from disk arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/432—Content retrieval operation from a local storage medium, e.g. hard-disk
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种节目处理方法和装置,该节目处理方法包括:获取每个节目的各个维度的信息;提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息。该方法能够实现计算机对全媒体节目的处理。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种节目处理方法和装置。
背景技术
随着视频网站、微博、微信等新媒体的出现,节目的表现形式越来越多种多样,包含的信息越来越多。全媒体节目是指融合了多种媒体资源的节目,例如,在电视台和网站同步播出的节目。由于全媒体节目是随着技术发展新出现的节目形式,需要解决如何让计算机识别、表示、保存全媒体节目的问题。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种节目处理方法,该方法可以实现计算机对全媒体节目的处理。
本申请的另一个目的在于提出一种节目处理装置。
为达到上述目的,本申请第一方面实施例提出的节目处理方法,包括:获取每个节目的各个维度的信息;提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息。
本申请第一方面实施例提出的节目处理方法,通过提取每个维度的信息中的关键信息及对应的特征信息,以及对上述提取得到的数据进行存储,可以解决全媒体节目的识别、表示和保存的问题。
为达到上述目的,本申请第二方面实施例提出的节目处理装置,包括:第一获取模块,用于获取每个节目的各个维度的信息;提取模块,用于提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;存储模块,用于将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息。
本申请第二方面实施例提出的节目处理装置,通过提取每个维度的信息中的关键信息及对应的特征信息,以及对上述提取得到的数据进行存储,可以解决全媒体节目的识别、表示和保存的问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提出的节目处理方法的流程示意图;
图2是本申请另一个实施例提出的节目处理方法的流程示意图;
图3是本申请一个实施例提出的节目处理装置的结构示意图;
图4是本申请另一个实施例提出的节目处理装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一个实施例提出的节目处理方法的流程示意图。
本实施例可以应用在对全媒体节目的处理场景下。
如图1所示,本实施例的流程包括:
S11:获取每个节目的各个维度的信息。
其中,可以通过数据收集的方式,收集与每个节目对应的海量信息。
进一步的,收集的信息可以分为一个或多个维度,以多个维度为例,各个维度的信息可以包括:主题、内容、人物与时间,这三个维度的信息。
S12:提取每个维度的信息中的关键信息及所述关键信息对应的特征信息。
其中,对应不同维度的信息,可以提取不同的参数作为关键信息,相应的,不同的关键信息可以提取不同的特征信息。
例如,当信息是主题或内容时,关键信息包括:主题或内容中包括的关键词,相应的,关键词对应的特征信息可以具体包括:关键词的词频-逆向文件频率(Term Frequency-Inverse Document Frequency,TF-IDF)值。
进一步的,在计算某个关键词的TF-IDF值时,该关键词所在的文件是指该关键词所在的主题,所有文件是指所有节目的主题。
例如,某一关键词的TF-IDF值=(该关键词的TF)*(该关键词的IDF);
在本实施例中,某一关键词的TF=该关键词在该关键词所在的主题中的出现次数/该关键词所在的主题中的总词数;
某一关键词的IDF=log(所有节目的主题的总数/包含该关键词的主题的数量)。
又例如,当信息是人物与时间时,关键信息包括:人物与时间中包括的人物信息,相应的,人物信息对应的特征信息可以具体包括:人物关联度。
其中,人物关联度满足一个人物关联度映射关系,所述人物关联度映射关系是关于时间(t)的衰减函数,例如是关于t的正态分布函数。
其中,A(t)表示该人物的人物关联度,t是时间变量,ti表示该人物在该节目中第i次出场时的出场时间,n是该人物在该节目中的出场总次数,f(t-ti)是关于t-ti的正态分布函数。
S13:将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息。
其中,在存储时,每个节目对应一组节目数据,一组节目数据可以包括多个维度的数据,每个维度的数据包括该维度的关键信息及对应的特征信息。
例如,一组节目数据包括:主题对应的数据、内容对应的数据、人物与时间对应的数据;其中,主题对应的数据包括:主题中包括的关键词及对应的TF-IDF值;内容对应的数据包括:内容中包括的关键词及对应的TF-IDF值;人物与时间对应的数据包括:人物及对应的人物关联度函数。
下面以一个具体示例对上述的节目数据进行说明。
假设对应一个节目,收集得到的各个维度的信息包括:
主题:奔跑吧兄弟
内容:大型户外竞技真人秀节目,每期节目有不同的主题,分为不同的队伍进行比赛,跑男团与嘉宾需要根据各种线索来破解最终的谜题,最后获胜一方将获得称号或奖品
人物与时间:第一集2014-10-10,主持:邓超、Angelababy(杨颖)、李晨、陈赫等,嘉宾:马苏、窦骁、金钟国
基于上述各个维度的信息,可以存储如下的节目数据:
该节目数据包括三个维度的数据,分别是主题维度的数据、内容维度的数据、人物与时间维度的数据。
其中,主题维度的数据包括:主题中包括的关键词,及每个关键词对应的TF-IDF值,具体如:奔跑0.9、兄弟0.7。
内容维度的数据包括:内容中包括的关键词及每个关键词对应的TF-IDF值。
进一步的,在计算关键词(主题或内容的关键词)的TF-IDF值后,还可以将TF-IDF值小于预设值的关键词剔除,仅存储TF-IDF值大于预设值的关键词及对应的TF-IDF值。
人物与时间维度的数据包括:邓超及邓超对应的人物关联度、Angelababy(杨颖)及Angelababy(杨颖)对应的人物关联度等上述的共7个人物及对应的人物关联度。在计算人物关联度时,可以依据上述的人物关联度映射关系A(t)进行计算,由于不同人物的出场情况可以不同,因此,上述的ti可以根据不同人物的出场情况确定,比如上述的第一集是第一次出场,则上述7个人物的第一次出场时的出场时间是2014-10-10。可以理解的是,当在其他节目中该人物也出场时,则可以根据其他节目的时间确定其他的出场时间,比如将第二集的时间确定为相应人物的第二次出场的出场时间,从而经过所有出场次数的累加后得到每个人物对应的关于t的人物关联度A(t)。
本实施例中,通过提取每个维度的信息中的关键信息及对应的特征信息,以及对上述提取得到的数据进行存储,可以解决全媒体节目的识别、表示和保存的问题。
图2是本申请另一个实施例提出的节目处理方法的流程示意图。
如上所示,可以将每个节目的节目数据进行存储,本实施例中,可以利用该已存储的节目数据,在用户需要检索一个节目时,可以根据检索内容和预先存储的节目数据,找到检索结果。
如图2所示,本实施例的流程包括:
S21:存储每个节目的节目数据,该节目数据包括多个维度的数据,且每个维度的数据包括关键信息和对应的特征信息。
其中,具体的得到每个节目的节目数据且存储的流程可以参见上一实施例,在此不再详细说明。
S22:接收检索内容,所述检索内容包括一个或多个维度的检索词。
例如,检索内容包括:跑男、邓超、2014年10月,则检索内容包括两个维度的检索词,分别是属于主题的“跑男”,以及,属于人物与时间的“邓超、2014年10月”。
进一步的,在识别检索内容中的检索词属于哪个维度时,可以根据用户的选择确定,例如,在检索界面中提供“主题”、“内容”、“人物与时间”的选择项,用户可以在“主题”这一选择项中输入需要的检索词“跑男”,在“人物与时间”这一选择项中输入需要的检索词“邓超、2014年10月”,从而可以根据用户的选择识别出“跑男”属于主题这一维度,“邓超、2014年10月”属于人物与时间这一维度。或者,
也可以对检索内容进行语义识别和语义分析等自然语言处理,区分出检索内容中的每个检索词属于的维度。
S23:对应每个维度的检索词,在预先存储的每个节目的对应维度的数据中,获取与所述维度的检索词匹配的关键信息,并获取所述匹配的关键信息对应的特征信息。
例如,对应主题这一维度的检索词“跑男”,则在预先存储的每个节目的主题这一维度的数据中,获取与“跑男”匹配的关键信息,并获取匹配的关键信息对应的特征信息。
又例如,对应人物与时间这一维度的检索词“邓超、2014年10月”,则在预先存储的每个节目的人物与时间这一维度的数据中,获取与“邓超、2014年10月”匹配的关键信息,并获取匹配的关键信息对应的特征信息。
进一步的,根据维度的不同,与检索词匹配的关键信息可以不同。
具体的,当检索词属于主题维度的检索词时,匹配的关键信息包括:预先存储的主题这一维度的数据中与该维度的检索词相同或相似的关键词。
例如,主题这一维度的检索词是“跑男”时,预先存储的主题的数据中包括“奔跑”和“兄弟”这两个关键词,则将这两个关键词“奔跑”和“兄弟”作为与主题这一维度的检索词“跑男”匹配的关键信息。
具体的,当检索词属于内容维度的检索词时,匹配的关键信息包括:预先存储的内容这一维度的数据中与该维度的检索词相同或相似的关键词。
其中,内容与主题类似,具体可以参见上述对主题的说明。
具体的,当检索词属于人物与时间维度的检索词时,匹配的关键信息包括:预先存储的人物与时间这一维度的数据中与该维度的检索词相同或相似的人物信息。
例如,当人物与时间这一维度的检索词是“邓超、2014年10月”时,预先存储的人物与时间这一维度的数据中包括“邓超”这一人物信息,则将“邓超”作为与人物与时间这一维度的检索词“邓超、2014年10月”匹配的关键信息。
在获取与每个维度的检索词匹配的关键信息后,由于关键信息与特征信息在存储时关联存储,因此,根据关联关系,可以获取每个匹配的关键信息对应的特征信息。
例如,对应主题这一维度,可以获取“奔跑”对应的TF-IDF值,以及“兄弟”对应的TF-IDF值。
又例如,对应人物与时间这一维度,可以获取“邓超”对应的人物关联度。
可以理解的是,如果对应某个节目的节目数据,不存在与某个维度的检索词匹配的关键信息,则可以将该节目的该维度获取的关键信息及对应的特征信息置为0。
S24:根据获取的特征信息,计算每个维度对应的匹配值。
当维度是主题或内容时,在获取到匹配的关键词对应的TF-IDF值后,可以将这些匹配的关键词对应的TF-IDF值相加,作为主题或内容这一维度的匹配值。
例如,对应主题这一维度,上述获取的匹配的关键词包括:“奔跑”和“兄弟”,而这两个关键词对应的TF-IDF值分别是0.9和0.7,则可以将0.9+0.7=1.6作为主题这一维度的匹配值。
内容这一维度可以对应主题这一维度参照执行。
当维度是人物与时间时,在获取到匹配的人物信息对应的人物关联度后,可以将人物与时间这一维度的检索词中包括的时间,或者,当前的检索时间替代人物关联度中的时间变量,计算得到人物与时间这一维度的匹配值。假设人物与时间这一维度的匹配值称为人物特征,则人物特征的计算公式为:
其中,Aj(t=t0)表示与检索词匹配的第j个人物信息的人物关联度,比如,检索词中包括邓超和李晨,则获取邓超对应的人物关联度和李晨对应的人物关联度,m是匹配的人物总数,且将该人物关联度中的变量取值为t=t0,具体的,如果检索词中包含时间,则t0=检索词中包含的时间,如果检索词中不包含时间,则可以将t0取为当前检索的时间。可以理解的是,t0也可以设置是其他的时间。M是当前匹配的节目包含的总人物,比如上述例子中的总人数M=7,α是设置的常数。
S25:根据每个维度对应的匹配值,计算所述检索内容与每个节目的匹配值。
其中,在得到每个维度对应的匹配值后,可以对每个维度对应的匹配值进行归一化处理,将归一化处理后的每个维度对应的匹配值作为相应维度的坐标值,并根据所述坐标值计算与坐标原点的距离值,将该距离值作为检索内容与每个节目的匹配值。
可以理解的是,上述运算方式只是一种示例,并不限于上述计算方式,还可以根据需要设置其他的计算方式。
S26:根据所述检索内容与每个节目的匹配值,确定作为检索结果的节目。
例如,将上述的距离值最大的节目确定为检索结果。
本实施例中,通过上述匹配处理,可以完成节目的检索。
图3是本申请一个实施例提出的节目处理装置的结构示意图。
参见图3,本实施例的装置30包括:第一获取模块31、提取模块32和存储模块33。
第一获取模块31,用于获取每个节目的各个维度的信息;
提取模块32,用于提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;
存储模块33,用于将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息。
一些实施例中,参见图4,本实施例的装置30还可以包括:
接收模块34,用于接收检索内容,所述检索内容包括一个或多个维度的检索词;
第二获取模块35,用于对应每个维度的检索词,在预先存储的每个节目的对应维度的数据中,获取与所述维度的检索词匹配的关键信息,并获取所述匹配的关键信息对应的特征信息;
第一计算模块36,用于根据获取的特征信息,计算每个维度对应的匹配值;
第二计算模块37,用于根据每个维度对应的匹配值,计算所述检索内容与每个节目的匹配值;
确定模块38,用于根据所述检索内容与每个节目的匹配值,确定作为检索结果的节目。
一些实施例中,所述各个维度的信息包括:主题、内容、人物与时间,所述提取模块具体用于:
当所述信息是主题或内容时,提取所述信息包括的关键词,并计算所述关键词的TF-IDF值,将所述关键词及对应的TF-IDF值作为所述关键信息及对应的特征信息;或者,
当所述信息是人物与时间时,提取所述信息包括的人物信息,并根据人物关联度映射关系计算所述人物信息对应的人物关联度,将所述人物信息及对应的人物关联度作为所述关键信息及对应的特征信息。
一些实施例中,所述人物关联度映射关系是关于时间的衰减函数。
一些实施例中,所述第二获取模块具体用于:
对应主题维度的检索词,在预先存储的主题维度的数据中,获取与所述主题维度的检索词相同或相似的关键词,作为与主题维度的检索词匹配的关键信息;或者,
对应内容维度的检索词,在预先存储的内容维度的数据中,获取与所述内容维度的检索词相同或相似的关键词,作为与内容维度的检索词匹配的关键信息;或者,
对应人物与时间维度的检索词,在预先存储的人物与时间维度的数据中,获取与所述人物与时间维度的检索词相同或相似的人物信息,作为与人物与时间维度的检索词匹配的关键信息。
一些实施例中,所述第一计算模块具体用于:
对应主题维度,将获取的与主题维度的检索词匹配的关键词对应的TF-IDF值之和,作为主题维度的匹配值;或者,
对应内容维度,将获取的与内容维度的检索词匹配的关键词对应的TF-IDF值之和,作为内容维度的匹配值;或者,
对应人物与时间维度,根据获取的与人物与时间维度的检索词匹配的人物信息对应的人物关联度、人物与时间维度的检索词中包括的时间或者当前检索时间、节目信息中包括的人物总数,计算人物与时间维度的匹配值。
一些实施例中,所述第二计算模块具体用于:
对应每个节目,对每个维度对应的匹配值进行归一化处理;
将归一化处理后的每个维度对应的匹配值作为相应维度的坐标值,根据所述坐标值计算与坐标原点的距离值,将所述距离值作为所述检索内容与所述节目的匹配值。
一些实施例中,所述确定模块具体用于:
将所述距离值最大的节目,确定为检索结果。
可以理解的是,本实施例的装置与上述方法实施例对应,具体内容可以参见方法实施例的相关描述,在此不再详细说明。
本实施例中,通过提取每个维度的信息中的关键信息及对应的特征信息,以及对上述提取得到的数据进行存储,可以解决全媒体节目的识别、表示和保存的问题。通过上述匹配处理,可以完成节目的检索。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种节目处理方法,其特征在于,包括:
获取每个节目的各个维度的信息;
提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;
将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息;
所述的方法,还包括:
接收检索内容,所述检索内容包括一个或多个维度的检索词;
对应每个维度的检索词,在预先存储的每个节目的对应维度的数据中,获取与所述维度的检索词匹配的关键信息,并获取所述匹配的关键信息对应的特征信息;
根据获取的特征信息,计算每个维度对应的匹配值;
根据每个维度对应的匹配值,计算所述检索内容与每个节目的匹配值;
根据所述检索内容与每个节目的匹配值,确定作为检索结果的节目;
所述提取每个维度的信息中的关键信息及所述关键信息对应的特征信息,包括:
当所述信息是主题或内容时,提取所述信息包括的关键词,并计算所述关键词的TF-IDF值,将所述关键词及对应的TF-IDF值作为所述关键信息及对应的特征信息;
当所述信息是人物与时间时,提取所述信息包括的人物信息,并根据人物关联度映射关系计算所述人物信息对应的人物关联度,将所述人物信息及对应的人物关联度作为所述关键信息及对应的特征信息;
所述根据获取的特征信息,计算每个维度对应的匹配值,包括:
对应主题维度,将获取的与主题维度的检索词匹配的关键词对应的TF-IDF值之和,作为主题维度的匹配值;或者,
对应内容维度,将获取的与内容维度的检索词匹配的关键词对应的TF-IDF值之和,作为内容维度的匹配值;或者,
对应人物与时间维度,根据获取的与人物与时间维度的检索词匹配的人物信息对应的人物关联度、人物与时间维度的检索词中包括的时间或者当前检索时间、节目信息中包括的人物总数,计算人物与时间维度的匹配值。
2.根据权利要求1所述的方法,其特征在于,所述各个维度的信息包括:主题、内容、人物与时间。
3.根据权利要求1所述的方法,其特征在于,所述人物关联度映射关系是关于时间的衰减函数。
4.根据权利要求1所述的方法,其特征在于,所述对应每个维度的检索词,在预先存储的每个节目的对应维度的数据中,获取与所述维度的检索词匹配的关键信息,包括:
对应主题维度的检索词,在预先存储的主题维度的数据中,获取与所述主题维度的检索词相同或相似的关键词,作为与主题维度的检索词匹配的关键信息;或者,
对应内容维度的检索词,在预先存储的内容维度的数据中,获取与所述内容维度的检索词相同或相似的关键词,作为与内容维度的检索词匹配的关键信息;或者,
对应人物与时间维度的检索词,在预先存储的人物与时间维度的数据中,获取与所述人物与时间维度的检索词相同或相似的人物信息,作为与人物与时间维度的检索词匹配的关键信息。
5.根据权利要求1所述的方法,其特征在于,所述根据每个维度对应的匹配值,计算所述检索内容与每个节目的匹配值,包括:
对应每个节目,对每个维度对应的匹配值进行归一化处理;
将归一化处理后的每个维度对应的匹配值作为相应维度的坐标值,根据所述坐标值计算与坐标原点的距离值,将所述距离值作为所述检索内容与所述节目的匹配值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述检索内容与每个节目的匹配值,确定作为检索结果的节目,包括:
将所述距离值最大的节目,确定为检索结果。
7.一种节目处理装置,其特征在于,包括:
第一获取模块,用于获取每个节目的各个维度的信息;
提取模块,用于提取每个维度的信息中的关键信息及所述关键信息对应的特征信息;
存储模块,用于将所述关键信息和特征信息作为所述节目的节目数据,并对应每个维度,关联存储所述关键信息和特征信息;
所述的装置,还包括:
接收模块,用于接收检索内容,所述检索内容包括一个或多个维度的检索词;
第二获取模块,用于对应每个维度的检索词,在预先存储的每个节目的对应维度的数据中,获取与所述维度的检索词匹配的关键信息,并获取所述匹配的关键信息对应的特征信息;
第一计算模块,用于根据获取的特征信息,计算每个维度对应的匹配值;
第二计算模块,用于根据每个维度对应的匹配值,计算所述检索内容与每个节目的匹配值;
确定模块,用于根据所述检索内容与每个节目的匹配值,确定作为检索结果的节目;
所述提取模块具体用于:
当所述信息是主题或内容时,提取所述信息包括的关键词,并计算所述关键词的TF-IDF值,将所述关键词及对应的TF-IDF值作为所述关键信息及对应的特征信息;
当所述信息是人物与时间时,提取所述信息包括的人物信息,并根据人物关联度映射关系计算所述人物信息对应的人物关联度,将所述人物信息及对应的人物关联度作为所述关键信息及对应的特征信息;
所述第一计算模块具体用于:
对应主题维度,将获取的与主题维度的检索词匹配的关键词对应的TF-IDF值之和,作为主题维度的匹配值;或者,
对应内容维度,将获取的与内容维度的检索词匹配的关键词对应的TF-IDF值之和,作为内容维度的匹配值;或者,
对应人物与时间维度,根据获取的与人物与时间维度的检索词匹配的人物信息对应的人物关联度、人物与时间维度的检索词中包括的时间或者当前检索时间、节目信息中包括的人物总数,计算人物与时间维度的匹配值。
8.根据权利要求7所述的装置,其特征在于,所述第二获取模块具体用于:
对应主题维度的检索词,在预先存储的主题维度的数据中,获取与所述主题维度的检索词相同或相似的关键词,作为与主题维度的检索词匹配的关键信息;或者,
对应内容维度的检索词,在预先存储的内容维度的数据中,获取与所述内容维度的检索词相同或相似的关键词,作为与内容维度的检索词匹配的关键信息;或者,
对应人物与时间维度的检索词,在预先存储的人物与时间维度的数据中,获取与所述人物与时间维度的检索词相同或相似的人物信息,作为与人物与时间维度的检索词匹配的关键信息。
9.根据权利要求7所述的装置,其特征在于,所述第二计算模块具体用于:
对应每个节目,对每个维度对应的匹配值进行归一化处理;
将归一化处理后的每个维度对应的匹配值作为相应维度的坐标值,根据所述坐标值计算与坐标原点的距离值,将所述距离值作为所述检索内容与所述节目的匹配值。
10.根据权利要求9所述的装置,其特征在于,所述确定模块具体用于:
将所述距离值最大的节目,确定为检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610574786.7A CN106101748B (zh) | 2016-07-20 | 2016-07-20 | 节目处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610574786.7A CN106101748B (zh) | 2016-07-20 | 2016-07-20 | 节目处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106101748A CN106101748A (zh) | 2016-11-09 |
CN106101748B true CN106101748B (zh) | 2020-04-28 |
Family
ID=57221199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610574786.7A Active CN106101748B (zh) | 2016-07-20 | 2016-07-20 | 节目处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106101748B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1206912A (zh) * | 1997-07-03 | 1999-02-03 | 松下电器产业株式会社 | 处理节目信息的系统 |
CN101365104A (zh) * | 2007-08-10 | 2009-02-11 | 株式会社东芝 | 节目搜索装置和节目搜索方法 |
CN101719167A (zh) * | 2010-01-15 | 2010-06-02 | 北京暴风网际科技有限公司 | 一种可互动的影视搜索方法 |
CN102214186A (zh) * | 2010-04-07 | 2011-10-12 | 腾讯科技(深圳)有限公司 | 展示对象关系的方法和系统 |
CN103886081A (zh) * | 2014-03-26 | 2014-06-25 | 海信集团有限公司 | 一种信息发送方法及系统 |
CN104750762A (zh) * | 2013-12-31 | 2015-07-01 | 华为技术有限公司 | 一种信息检索方法及装置 |
CN105005630A (zh) * | 2015-08-18 | 2015-10-28 | 瑞达昇科技(大连)有限公司 | 全媒体中多维检测特定目标的方法 |
CN105760544A (zh) * | 2016-03-16 | 2016-07-13 | 合网络技术(北京)有限公司 | 视频推荐方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100132375A (ko) * | 2009-06-09 | 2010-12-17 | 삼성전자주식회사 | Epg 컨텐츠의 디스플레이 방법 및 장치 |
-
2016
- 2016-07-20 CN CN201610574786.7A patent/CN106101748B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1206912A (zh) * | 1997-07-03 | 1999-02-03 | 松下电器产业株式会社 | 处理节目信息的系统 |
CN101365104A (zh) * | 2007-08-10 | 2009-02-11 | 株式会社东芝 | 节目搜索装置和节目搜索方法 |
CN101719167A (zh) * | 2010-01-15 | 2010-06-02 | 北京暴风网际科技有限公司 | 一种可互动的影视搜索方法 |
CN102214186A (zh) * | 2010-04-07 | 2011-10-12 | 腾讯科技(深圳)有限公司 | 展示对象关系的方法和系统 |
CN104750762A (zh) * | 2013-12-31 | 2015-07-01 | 华为技术有限公司 | 一种信息检索方法及装置 |
CN103886081A (zh) * | 2014-03-26 | 2014-06-25 | 海信集团有限公司 | 一种信息发送方法及系统 |
CN105005630A (zh) * | 2015-08-18 | 2015-10-28 | 瑞达昇科技(大连)有限公司 | 全媒体中多维检测特定目标的方法 |
CN105760544A (zh) * | 2016-03-16 | 2016-07-13 | 合网络技术(北京)有限公司 | 视频推荐方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106101748A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109376309B (zh) | 基于语义标签的文档推荐方法和装置 | |
CN102119385B (zh) | 用于在内容检索服务系统内检索媒体内容的方法和子系统 | |
US20190259070A1 (en) | Advertising information pushing method, device and system, server, and computer readable medium | |
CN109690529B (zh) | 按事件将文档编译到时间线中 | |
CN108334490B (zh) | 关键词提取方法以及关键词提取装置 | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
US9336485B2 (en) | Determining answers in a question/answer system when answer is not contained in corpus | |
CN103198057B (zh) | 一种自动给文档添加标签的方法和装置 | |
CN108846091B (zh) | 资讯推荐方法、装置及设备 | |
CN109558513B (zh) | 一种内容推荐方法、装置、终端及存储介质 | |
US9830391B1 (en) | Query modification based on non-textual resource context | |
CN103235818A (zh) | 一种基于网页情感倾向性的信息推送方法和装置 | |
JP4969554B2 (ja) | トピックグラフを利用したドキュメント検索サーバ及び方法 | |
CN110717038B (zh) | 对象分类方法及装置 | |
CN106777236B (zh) | 基于深度问答的查询结果的展现方法和装置 | |
US9015172B2 (en) | Method and subsystem for searching media content within a content-search service system | |
US8838580B2 (en) | Method and system for providing keyword ranking using common affix | |
CN113704507B (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
JP2004178123A (ja) | 情報処理装置、該情報処理装置を実現するためのプログラム | |
WO2021257178A1 (en) | Provide knowledge answers for knowledge-intention queries | |
KR101902460B1 (ko) | 문서 분류 장치 | |
CN109670080A (zh) | 一种影视标签的确定方法、装置、设备及存储介质 | |
CN112417210A (zh) | 健身视频的查询方法、装置、终端和存储介质 | |
CN108415959B (zh) | 一种文本分类方法及装置 | |
CN106101748B (zh) | 节目处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |