WO2014056369A1 - 一种用于对搜索的网络视频进行排序的方法和系统 - Google Patents

一种用于对搜索的网络视频进行排序的方法和系统 Download PDF

Info

Publication number
WO2014056369A1
WO2014056369A1 PCT/CN2013/082741 CN2013082741W WO2014056369A1 WO 2014056369 A1 WO2014056369 A1 WO 2014056369A1 CN 2013082741 W CN2013082741 W CN 2013082741W WO 2014056369 A1 WO2014056369 A1 WO 2014056369A1
Authority
WO
WIPO (PCT)
Prior art keywords
network video
weight value
network
play
sorting
Prior art date
Application number
PCT/CN2013/082741
Other languages
English (en)
French (fr)
Inventor
谭修光
姚键
尹玉宗
芦苇
潘柏宇
卢述奇
Original Assignee
合一网络技术(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 合一网络技术(北京)有限公司 filed Critical 合一网络技术(北京)有限公司
Priority to US14/420,889 priority Critical patent/US20150205580A1/en
Publication of WO2014056369A1 publication Critical patent/WO2014056369A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/36Combined merging and sorting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/743Browsing; Visualisation therefor a collection of video files or sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the present invention relates to the field of network video search, and more particularly to a method and system for ordering searched network video. Background technique
  • the search result is a series of ordered network videos.
  • the order of these network videos is calculated by the search engine according to its own formula. This sorting may not be in line with the interests of each user.
  • Patent application No. 201010200736.5 the applicant for the Chinese invention patent application of ZTE Corporation discloses a personalized meta-search method and its application terminal, extracts the usage log from the interest base according to the search keyword, and searches the search engine
  • the returned search result is preprocessed, and the used search result and the interest degree of the resource locator corresponding to the searched keyword in the interest database are calculated by using the usage log, and are sorted and displayed according to the calculation result.
  • the patent application obtains the final ranking result by calculation of an interest level.
  • the present invention provides another method and system for obtaining network video ordering.
  • the present invention and system can more accurately reflect the user's search result by calculating the weight values of different dimensions, and arrange the search results more necessary by the user in front. Improve the user experience. Summary of the invention
  • the calculating the network video publishing time weight value in the step (4) further includes: first converting the publishing time of the network video in the set V into an integer relative to the current time, in seconds, and obtaining a tl. T2, the set T of t3 to, respectively calculate the probability pl, p2, p3 of the set ⁇ less than 1 day, 7 days, 30 days from the current time, when released
  • the calculation of the play amount weight value of the network video in the step (4) further includes: calculating, for each network video play quantity V l, v 2, v3 — Vn in the set V, using the following formula: Standard deviation:
  • V is the average of the amount of play
  • weight of the last sort factor of the play amount is l/(a X v).
  • the calculating of the network video classification weight value in step (4) further comprises: recording, for a search term K, the number of times S it appears in all network video titles, and its classification A in the network video
  • the number of occurrences of the network video in C, C/S is the probability that the word belongs to category A, that is, the weight value of the category to which the network video belongs.
  • the calculating of j in step (4) further comprises: recording the number c of occurrences of the same network video in the set V, j being equal to the number c of occurrences of the same network video in the set divided by the network video of the set V Number, while de-duplicating the set V.
  • the present invention further provides a system for sorting searched network videos, the system comprising: [0011] a retrieval module, configured to retrieve a network video according to a search term input by a user;
  • a log system configured to collect a network video log selected by the user to click and view, and form a collection of a search term K and a corresponding click network video V thereof;
  • a calculation module calculating a network video release time weight value, a network video play amount weight value, a network video classification weight value, and a network video occurrence probability j in the set V;
  • the calculating, by the calculating module, the network video publishing time weight value further comprises: first converting the publishing time of the network video in the set V into an integer relative to the current time, in seconds, and obtaining a tl, t2, t3
  • the calculation module calculates the play amount weight value of the network video by: for each network video play quantity vl, v2, V 3 - Vn in the set V, the standard deviation of the play quantity is calculated by using the following formula:
  • the calculation module calculates a network video classification weight value by: for a search term K, records the number of times it appears in all network video titles, and its network in the category to which the network video belongs.
  • the number of occurrences of the video C, C/S is the probability that the word belongs to the classification A, that is, the weight value of the classification to which the network video belongs.
  • the calculation module calculates the j by: recording the number c of occurrences of the same network video in the set V, j being equal to the number c of occurrences of the same network video in the set divided by the number of network videos of the set V, At the same time, the set V is deduplicated.
  • the present invention has the following advantages: The present invention and the system can more accurately reflect the search results of the user by calculating the weight values of different dimensions, and arrange the search results more needed by the user in front, thereby improving the user experience.
  • DRAWINGS are the following advantages: The present invention and the system can more accurately reflect the search results of the user by calculating the weight values of different dimensions, and arrange the search results more needed by the user in front, thereby improving the user experience.
  • FIG. 2 is a block diagram of a system in accordance with the present invention. Specific form
  • the search result page presents the user with a lot of search results. Users will filter these search results according to their needs. After the screening is completed, the user will click on a web video to watch, and the system will send a log to the background to record the search term and the clicked web video. After the background log system receives this log, it will be recorded. When these logs are collected, they will be analyzed. Consider the effectiveness line, analyze it once a day. The analysis process is as follows: Since the log records a search term corresponding to a network video, first all the network videos corresponding to one search term are found in the analysis, and all the users click on the data collection, and then group according to the search words. This forms a collection of search terms ⁇ and their corresponding click-through network video V. For network video data in the V collection, from release time, playback volume, category, and same network video The four dimensions appearing within the V set are analyzed.
  • the publishing time is analyzed, and the publishing time of the network video in the set V is first converted into an integer relative to the current time, in seconds, to obtain a set T of tl, t2, t3, tn.
  • the weight of the last sort factor of the release time ⁇ ( 1/30 ⁇ ⁇ 1 + 1 / 7 ⁇ ⁇ 2 + ⁇ 3 ) / t (t is the average of the release time in the set T).
  • v is the average of the amount of play
  • the formula first calculates the amount of each network video played divided by the average of the play amount.
  • the weight of the last sort factor of the playback volume is l/(a X v).
  • the weight value of the classification of the network video to be sorted is the probability that the search term K belongs to the classification.
  • K record the number of times s it appears in all network video titles, and the number C of occurrences of the network video it belongs to in category A of the network video.
  • This C/S is the probability that the word belongs to category A.
  • the probability is the weight value of the classification to which the network video belongs.
  • a particular ranking result for different search terms is obtained based on the value of the ranking factor r.
  • the display content of the system includes: screenshots, duration, title, play volume of each network video, delete button (remove the corresponding network video from the playlist), play button (streaming the content in the playlist) .
  • the content displayed by this system is not a search result, but a supplement to the search results.
  • the position of the playlist is displayed in the upper right corner of the page, which does not affect the normal display of the current search engine results, but also makes full use of the blank part of the page.
  • the present invention also provides a system for sorting searched network videos, the system Includes:
  • a retrieval module configured to retrieve a network video according to a search term input by the user
  • a log system configured to collect a network video log selected by the user to click and view, and form a collection of the search term K and the corresponding click network video V;
  • a calculation module calculating a network video release time weight value, a network video play amount weight value, a network video classification weight value, and a network video occurrence probability j in the set V;
  • a display module configured to display the formed playlist onto the page.
  • the calculating module calculates the network video publishing time weight value further includes: first converting the publishing time of the network video in the set V into an integer relative to the current time, in seconds, and obtaining a tl, t2, t3, tn
  • the calculation module calculates the play amount weight value of the network video by: for each network video play quantity vl, v2, V 3 - Vn in the set V, the standard deviation of the play quantity is calculated by using the following formula:
  • V is the average of the play amount
  • the weight of the last sort factor of the play amount is l/(a X v).
  • the calculation module calculates a network video classification weight value by: for a search term K, records the number of times S it appears in all network video titles, and its network video appears in category A of the network video belongs to The number of times C, C/S is the probability that the word belongs to category A, that is, the weight value of the category to which the network video belongs.
  • the calculation module calculates the j by: recording the number c of occurrences of the same network video in the set V, j being equal to the number c of occurrences of the same network video in the set divided by the number of network videos of the set V, and simultaneously The set V is deduplicated.
  • the present invention has the following advantages: The present invention and the system can more accurately reflect the user's search results by calculating the weight values of different dimensions, and arrange the search results more needed by the user in front, thereby improving the user experience.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用于对搜索的网络视频进行排序的方法和系统,本发明和系统通过计算不同维度的权重值,包括计算网络视频发布时间权重值、网络视频的播放量权重值、网络视频分类权重值以及网络视频在集合V中的出现概率j以获得最后的排序因子,本发明能更准确的反映用户的搜索结果,将用户更需要的搜索结果排列在前面,提高了用户体验。

Description

说 明 书 一种用于对搜索的网络视频进行排序的方法和系统 技术领域
[0001] 本发明涉及网络视频搜索领域, 尤其是涉及一种用于对搜索的网络视频进行排序的 方法和系统。 背景技术
[0002] 用户在搜索网络视频时, 搜索结果是一系列有序的网络视频, 这些网络视频的排序 是搜索引擎根据自己的公式算出来的。这个排序可能并不能符合每个用户的兴趣。专利申请 号为 201010200736.5、申请人为中兴通讯股份有限公司的中国发明专利申请公开了一种个性 化元搜索的方法及其应用终端, 根据搜索关键词, 从兴趣库中提取使用日志, 并对搜索引擎 返回的搜索结果进行预处理,利用使用日志,对预处理后的搜索结果和兴趣库中对应所述被 搜索的关键词的资源定位符的兴趣度进行计算,根据计算结果排序并显示。该专利申请是通 过一个兴趣度的计算来获得最终的排序结果。本发明提供了另外的一种获得网络视频排序的 方法和系统, 本发明和系统通过计算不同维度的权重值, 能更准确的反映用户的搜索结果, 将用户更需要的搜索结果排列在前面, 提高了用户体验。 发明内容
[0003] 鉴于现有技术中存在的问题, 本发明的目的在于提供一种用于对搜索的网络视频进 行排序的方法, 其包括如下步骤: 步骤(1 )用户通过检索词检索网络视频; 步骤(2) 日志 系统收集用户选择点击观看的网络视频日志; 步骤(3 )形成了一个搜索词 K和其所对应的 点击网络视频 V的集合; 步骤(4)计算网络视频发布时间权重值、 网络视频的播放量权重 值、 网络视频分类权重值以及网络视频在集合 V中的出现概率 j ; 步骤 (5 ) 根据排序因子 r的值得到针对搜索词的不同网络视频的特定排序结果, 其中 r=网络视频的发布时间 X发 布时间权重值 +网络视频的播放量 X播放量权重值 +网络视频分类权重值 + j 。
[0004] 进一步, 步骤(4) 中所述计算网络视频发布时间权重值进一步包括: 将集合 V中网 络视频的发布时间首先转换为一个相对于当前时间的整数, 单位为秒, 得到一个 tl,t2,t3 to的集合 T, 分别计算集合 Τ中小于距当前时间 1天, 7天, 30天的概率 pl,p2,p3, 发布时 间所占最后排序因子的权重 p= ( 1/30χρ1+1/7χρ2+ρ3 ) /t, 其中 t是集合 T中发布时间的平均 值。
[0005] 进一步, 步骤 (4) 中所述网络视频的播放量权重值的计算进一步包括: 对于集合 V 中每一个网络视频播放量 Vl,v2,v3—Vn,采用下式计算播放量的标准差:
[0006]
Figure imgf000004_0001
[0007] 其中 V是播放量的平均数, 播放量所占最后排序因子的权重为 l/(a X v)。
[0008] 进一步, 步骤(4) 中所述网络视频分类权重值的计算进一步包括: 对于一个搜索词 K, 记录下它在所有网络视频标题中出现的次数 S, 和它在网络视频所属分类 A中的网络视 频出现的次数 C, C/S就是这个词属于分类 A的概率, 即为网络视频所属分类的权重值。
[0009] 进一步, 步骤 (4) 中所述 j的计算进一步包括: 记录相同网络视频在集合 V中出现 的次数 c, j等于相同网络视频在集合中出现的次数 c除以集合 V的网络视频数, 同时对集 合 V进行去重。
[0010] 此外, 本发明还提供了一种用于对搜索的网络视频进行排序的系统, 该系统包括: [0011] 检索模块, 用于根据用户输入的检索词检索网络视频;
[0012] 日志系统, 用于收集用户选择点击观看的网络视频日志, 并形成了一个搜索词 K和 其所对应的点击网络视频 V的集合;
[0013] 计算模块, 计算网络视频发布时间权重值、 网络视频的播放量权重值、 网络视频分 类权重值以及网络视频在集合 V中的出现概率 j;
[0014] 排序模块,根据排序因子 r的值得到针对搜索词的不同网络视频的特定排序结果,其 中 r=网络视频的发布时间 X发布时间权重值 +网络视频的播放量 X播放量权重值 +网络视频 分类权重值 + J 。
[0015] 进一步, 所述计算模块计算网络视频发布时间权重值进一步包括: 将集合 V中网络 视频的发布时间首先转换为一个相对于当前时间的整数, 单位为秒, 得到一个 tl,t2,t3, tn 的集合 T, 分别计算集合 Τ中小于距当前时间 1天, 7天, 30天的概率 pl,p2,p3, 发布时间 所占最后排序因子的权重 P= ( l/30xpl+l/7xp2+p3 ) /t,其中 t是集合 T中发布时间的平均值。
[0016] 进一步, 所述计算模块通过如下方式计算网络视频的播放量权重值: 对于集合 V中 每一个网络视频播放量 vl,v2,V3—Vn,采用下式计算播放量的标准差:
Figure imgf000005_0001
[0018] 其中 v是播放量的平均数, 播放量所占最后排序因子的权重为 l/(a X v)。
[0019] 进一步, 所述计算模块通过如下方式计算网络视频分类权重值: 对于一个搜索词 K, 记录下它在所有网络视频标题中出现的次数 S,和它在网络视频所属分类 Α中的网络视频出 现的次数 C, C/S就是这个词属于分类 A的概率, 即为网络视频所属分类的权重值。
[0020] 进一步, 计算模块通过如下方式来计算所述 j: 记录相同网络视频在集合 V中出现的 次数 c, j等于相同网络视频在集合中出现的次数 c除以集合 V的网络视频数,同时对集合 V 进行去重。
[0021] 本发明所述的具有以下优点: 本发明和系统通过计算不同维度的权重值, 能更准确 的反映用户的搜索结果, 将用户更需要的搜索结果排列在前面, 提高了用户体验。 附图说明
[0022] 图 1是本发明所述方法的流程图。
[0023] 图 2是根据本发明所述系统的结构图。 具体实 式
[0024] 为使本发明的上述目的、 特征和优点更加明显易懂, 下面结合附图和具体实施方式 对本发明作进一步详细的说明: 如图 1所示, 共分以下几个步骤。
[0025] 1.搜索词及其点击网络视频信息的收集
[0026] 用户在搜索引擎搜索一个关键词后, 搜索结果页面会呈现给用户很多搜索结果。 用 户会根据自己的需求在这些搜索结果中进行筛选。筛选完成后,用户就会点击一个网络视频 观看, 这时系统会向后台发送一条日志, 记录这个搜索词和点击的网络视频。后台的日志系 统收到这条日志后就会记录下来,当这些日志收集到一定数量后,就会对这些日志进行分析。 考虑到实效行, 分析一天做一次。分析的过程如下: 由于日志记录的是一个搜索词对应有一 个网络视频,分析时首先找到一个搜索词对应的所有网络视频,对所有的用户点击数据收集 后, 按照搜索词进行分组。 这样就形成了一个搜索词 κ和其所对应的点击网络视频 V的集 合。 针对 V集合内的网络视频数据, 从发布时间、 播放量、 所属分类、 以及相同网络视频 在 V集合内出现的次数四个维度进行分析。
[0027] 2.对收集的信息进行分析获得权重值
[0028] 1 ) 首先分析发布时间, 将集合 V中网络视频的发布时间首先转换为一个相对于当前 时间的整数, 单位为秒, 得到一个 tl,t2,t3, tn的集合 T。 分别计算集合 Τ中小于距当前时 间 1 天, 7 天, 30 天的概率 pl,p2,p3。 发布时间所占最后排序因子的权重 ρ= ( 1/30χρ1+1/7χρ2+ρ3 ) /t(t是集合 T中发布时间的平均值)。
[0029] 2) 分析播放量, 对于集合中每一个网络视频播放量 vl,V2,V3—Vn,采用下式计算播放
量的标准差:
Figure imgf000006_0001
[0030] 其中 v是播放量的平均数, 该公式首先计算每一个网络视频播放量除以播放量平均 数。 播放量所占最后排序因子的权重为 l/(a X v)。
[0031] 3 ) 网络视频分类, 网络视频所属分类在排序中的权重值为搜索词 K属于该分类的概 率1^。 对于一个词 K, 记录下它在所有网络视频标题中出现的次数 s, 和它在网络视频所属 分类 A中的网络视频出现的次数 C, 这 C/S就是这个词属于分类 A的概率, 该概率即为网 络视频所属分类的权重值。
[0032] 4) 相同网络视频在集合 V中出现的次数, 将这个次数转换为该网络视频出现的概率 j (j应该等于相同网络视频在集合中出现的次数 c除以集合 V的网络视频数), 同时对集合 V进行去重。
[0033] 根据 1 ), 2), 3 ), 4) 的计算结果, 对于搜索词 K的搜索结果 M进行重新排序, 最 后每个网络视频的排序因子 r的计算公式为: r=网络视频的发布时间 X发布时间权重值 +网 络视频的播放量 X播放量权重值 +网络视频所属分类权重值 + J 。
[0034] 根据排序因子 r的值得到针对不同搜索词的特定排序结果。
[0035] 3. 将形成的播放列表展现到页面上。
[0036] 此系统的展示内容包括: 每个网络视频的截图、 时长、 标题、 播放量, 删除按钮(将 对应的网络视频从播放列表中移除), 播放按钮(将播放列表中内容连播)。此系统展示的内 容并不是搜索结果, 仅是对搜索结果的一个补充。播放列表展现的位置在页面的右上角, 既 不影响目前搜索引擎结果的正常展示, 又能充分利用页面的空白部分。
[0037] 如图 2所示, 本发明还提供了一种用于对搜索的网络视频进行排序的系统, 该系统 包括:
[0038] 检索模块, 用于根据用户输入的检索词检索网络视频;
[0039] 日志系统, 用于收集用户选择点击观看的网络视频日志, 并形成了一个搜索词 K和 其所对应的点击网络视频 V的集合;
[0040] 计算模块, 计算网络视频发布时间权重值、 网络视频的播放量权重值、 网络视频分 类权重值以及网络视频在集合 V中的出现概率 j;
[0041] 排序模块,根据排序因子 r的值得到针对搜索词的不同网络视频的特定排序结果,其 中 r=网络视频的发布时间 X发布时间权重值 +网络视频的播放量 X播放量权重值 +网络视频 分类权重值 + J。
[0042] 显示模块, 用于将形成的播放列表展现到页面上。
[0043] 所述计算模块计算网络视频发布时间权重值进一步包括: 将集合 V中网络视频的发 布时间首先转换为一个相对于当前时间的整数, 单位为秒, 得到一个 tl,t2,t3, tn的集合 T, 分别计算集合 Τ中小于距当前时间 1天, 7天, 30天的概率 pl,p2,p3, 发布时间所占最后排 序因子的权重 ρ= ( 1/30χ ρ1+1/7χ ρ2+ρ3 ) /t, 其中 t是集合 T中发布时间的平均值。
[0044] 所述计算模块通过如下方式计算网络视频的播放量权重值: 对于集合 V中每一个网 络视频播放量 vl,v2,V3—Vn,采用下式计算播放量的标准差:
Figure imgf000007_0001
[0046] 其中 V是播放量的平均数, 播放量所占最后排序因子的权重为 l/(a X v)。
[0047] 所述计算模块通过如下方式计算网络视频分类权重值: 对于一个搜索词 K, 记录下 它在所有网络视频标题中出现的次数 S,和它在网络视频所属分类 A中的网络视频出现的次 数 C, C/S就是这个词属于分类 A的概率, 即为网络视频所属分类的权重值。
[0048] 计算模块通过如下方式来计算所述 j : 记录相同网络视频在集合 V中出现的次数 c, j 等于相同网络视频在集合中出现的次数 c除以集合 V的网络视频数, 同时对集合 V进行去 重。
[0049] 本发明所述的具有以下优点: 本发明和系统通过计算不同维度的权重值, 能更准确 的反映用户的搜索结果, 将用户更需要的搜索结果排列在前面, 提高了用户体验。
[0050] 以上是对本发明的优选实施例进行的详细描述, 但本领域的普通技术人员应该意识 到, 在本发明的范围内和精神指导下, 各种改进、添加和替换都是可能的。这些都在本发明 的权利要求所限定的保护范围内。

Claims

权 利 要 求 书
1. 一种用于对搜索的网络视频进行排序的方法, 其特征在于包括如下步骤: 步骤 (1 ) 用户通过检索词检索网络视频;
步骤 (2 ) 日志系统收集用户选择点击观看的网络视频日志;
步骤 (3 ) 形成了一个搜索词 K和其所对应的点击网络视频 V的集合;
步骤 (4 ) 计算网络视频发布时间权重值、 网络视频的播放量权重值、 网络视频分类权 重值以及网络视频在集合 V中的出现概率 j;
步骤 (5 ) 根据排序因子 r的值得到针对搜索词的不同网络视频的特定排序结果, 其中 r=网络视频的发布时间 X发布时间权重值 +网络视频的播放量 X播放量权重值 +网络视频分 类权重值 + j 。
2. 根据权利要求 1所述的方法, 其特征在于步骤(4) 中所述计算网络视频发布时间权 重值进一步包括: 将集合 V中网络视频的发布时间首先转换为一个相对于当前时间的整数, 单位为秒, 得到一个 tl,t2,t3, tn的集合 T, 分别计算集合 Τ中小于距当前时间 1天, 7天, 30天的概率 pl,p2,p3, 发布时间所占最后排序因子的权重 ρ= ( 1/30χρ1+1/7χρ2+ρ3 ) It, 其 中 t是集合 T中发布时间的平均值。
3. 根据权利要求 1所述的方法, 其特征在于步骤(4) 中所述网络视频的播放量权重值 的计算进一步包括: 对于集合 V中每一个网络视频播放量 vl,V2,V3—Vn,采用下式计算播放
量的标准差:
Figure imgf000009_0001
其中 V是播放量的平均数, 播放量所占最后排序因子的权重为 l/(a X v)。
4. 根据权利要求 1所述的方法, 其特征在于步骤(4) 中所述网络视频分类权重值的计 算进一步包括: 对于一个搜索词 K, 记录下它在所有网络视频标题中出现的次数 S, 和它在 网络视频所属分类 A中的网络视频出现的次数 C, C/S就是这个词属于分类 A的概率, 即 为网络视频所属分类的权重值。
5. 根据权利要求 1所述的方法, 其特征在于步骤 (4) 中所述 j的计算进一步包括: 记 录相同网络视频在集合 V中出现的次数 c, j等于相同网络视频在集合中出现的次数 c除以 集合 V的网络视频数, 同时对集合 V进行去重。
6. —种用于对搜索的网络视频进行排序的系统, 其特征在于该系统包括:
检索模块, 用于根据用户输入的检索词检索网络视频;
日志系统, 用于收集用户选择点击观看的网络视频日志, 并形成了一个搜索词 K和其 所对应的点击网络视频 V的集合;
计算模块, 计算网络视频发布时间权重值、 网络视频的播放量权重值、 网络视频分类权 重值以及网络视频在集合 V中的出现概率 j;
排序模块,根据排序因子 r的值得到针对搜索词的不同网络视频的特定排序结果,其中 r=网络视频的发布时间 X发布时间权重值 +网络视频的播放量 X播放量权重值 +网络视频分 类权重值 + j 。
7. 根据权利要求 6所述的系统, 其特征在于所述计算模块计算网络视频发布时间权重 值进一步包括: 将集合 V中网络视频的发布时间首先转换为一个相对于当前时间的整数, 单位为秒, 得到一个 tl,t2,t3, tn的集合 T, 分别计算集合 Τ中小于距当前时间 1天, 7天, 30天的概率 pl,p2,p3, 发布时间所占最后排序因子的权重 ρ= ( 1/30χρ1+1/7χρ2+ρ3 ) It, 其 中 t是集合 T中发布时间的平均值。
8. 根据权利要求 6所述的系统, 其特征在于所述计算模块通过如下方式计算网络视频 的播放量权重值: 对于集合 V中每一个网络视频播放量 vl,V2,V3—Vn,采用下式计算播放量
的标准差:
Figure imgf000010_0001
其中 v是播放量的平均数, 播放量所占最后排序因子的权重为 l/(a X v)。
9. 根据权利要求 6所述的系统, 其特征在于所述计算模块通过如下方式计算网络视频 分类权重值: 对于一个搜索词 K, 记录下它在所有网络视频标题中出现的次数 S, 和它在网 络视频所属分类 A中的网络视频出现的次数 C, C/S就是这个词属于分类 A的概率, 即为 网络视频所属分类的权重值。
10. 根据权利要求 6所述的系统, 其特征在于计算模块通过如下方式来计算所述 j : 记 录相同网络视频在集合 V中出现的次数 c, j等于相同网络视频在集合中出现的次数 c除以 集合 V的网络视频数, 同时对集合 V进行去重。
PCT/CN2013/082741 2012-10-08 2013-08-30 一种用于对搜索的网络视频进行排序的方法和系统 WO2014056369A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/420,889 US20150205580A1 (en) 2012-10-08 2013-08-30 Method and System for Sorting Online Videos of a Search

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210377497.X 2012-10-08
CN201210377497.XA CN102880712B (zh) 2012-10-08 2012-10-08 一种用于对搜索的网络视频进行排序的方法和系统

Publications (1)

Publication Number Publication Date
WO2014056369A1 true WO2014056369A1 (zh) 2014-04-17

Family

ID=47482038

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/082741 WO2014056369A1 (zh) 2012-10-08 2013-08-30 一种用于对搜索的网络视频进行排序的方法和系统

Country Status (3)

Country Link
US (1) US20150205580A1 (zh)
CN (1) CN102880712B (zh)
WO (1) WO2014056369A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107807964A (zh) * 2017-10-11 2018-03-16 咪咕互动娱乐有限公司 数字内容排序方法、装置和计算机可读存储介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880712B (zh) * 2012-10-08 2015-07-22 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统
CN104168303B (zh) * 2013-05-17 2016-09-28 腾讯科技(深圳)有限公司 一种展示网络直播间的方法和装置
US9686329B2 (en) 2013-05-17 2017-06-20 Tencent Technology (Shenzhen) Company Limited Method and apparatus for displaying webcast rooms
CN103500233A (zh) * 2013-10-25 2014-01-08 乐视网信息技术(北京)股份有限公司 一种多媒体文件推荐方法及装置
CN103744900A (zh) * 2013-12-26 2014-04-23 合一网络技术(北京)有限公司 一种结合视觉分辨难度的文本串权重计算方法及装置
CN105183776A (zh) * 2015-08-11 2015-12-23 上海幻电信息科技有限公司 一种在线排行榜推荐系统
CN105183897B (zh) * 2015-09-29 2018-09-11 北京奇艺世纪科技有限公司 一种视频搜索排序的方法和系统
CN105828181B (zh) * 2016-04-14 2019-06-25 聚好看科技股份有限公司 基于视频点播量的视频排序方法及装置
CN105868423A (zh) * 2016-06-20 2016-08-17 武汉斗鱼网络科技有限公司 一种基于视频网站的视频人气排名方法和系统
CN106951137A (zh) * 2017-03-02 2017-07-14 合网络技术(北京)有限公司 多媒体资源的分类方法及装置
CN107071510A (zh) * 2017-05-23 2017-08-18 深圳华云新创科技有限公司 一种视频接龙的方法、装置及系统
CN107155128A (zh) * 2017-05-23 2017-09-12 深圳华云新创科技有限公司 一种微视频生成的方法、装置及系统
CN108932245A (zh) * 2017-05-24 2018-12-04 合网络技术(北京)有限公司 视频搜索方法及装置
CN107368573A (zh) * 2017-07-14 2017-11-21 北京奇艺世纪科技有限公司 视频质量评估方法及装置
CN108304512B (zh) * 2018-01-19 2021-05-25 北京奇艺世纪科技有限公司 一种视频搜索引擎粗排序方法、装置及电子设备
CN108804647B (zh) * 2018-06-06 2021-07-30 北京奇艺世纪科技有限公司 一种视频排序的方法及装置
CN109446419B (zh) * 2018-10-17 2020-10-16 武汉斗鱼网络科技有限公司 一种推荐视频的方法以及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178728A (zh) * 2007-11-21 2008-05-14 北京搜狗科技发展有限公司 一种网址导航的方法和系统
CN102880712A (zh) * 2012-10-08 2013-01-16 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162475B2 (en) * 2002-04-17 2007-01-09 Ackerman David M Method for user verification and authentication and multimedia processing for interactive database management and method for viewing the multimedia
JP4717004B2 (ja) * 2004-10-13 2011-07-06 パナソニック株式会社 映像信号処理装置および画像処理装置
CA2615659A1 (en) * 2005-07-22 2007-05-10 Yogesh Chunilal Rathod Universal knowledge management and desktop search system
US8199009B2 (en) * 2007-06-08 2012-06-12 Bas Strategic Solutions, Inc. Method and system for administering remote area monitoring system
US9088808B1 (en) * 2008-02-08 2015-07-21 Google Inc. User interaction based related videos
AU2009257386A1 (en) * 2008-06-14 2009-12-17 Veoh Networks, Inc. Searching using patterns of usage
CN101320375B (zh) * 2008-07-04 2010-09-22 浙江大学 基于用户点击行为的数字图书搜索方法
CN101739419A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重视频排序系统
CN101739416A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重视频排序方法
US20130030875A1 (en) * 2011-07-29 2013-01-31 Panasonic Corporation System and method for site abnormality recording and notification
CN102682132B (zh) * 2012-05-18 2013-12-04 合一网络技术(北京)有限公司 一种基于词频、播放量和创建时间检索信息的方法及系统
CN102685565B (zh) * 2012-05-18 2014-07-16 合一网络技术(北京)有限公司 一种点击反馈式个性化推荐系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178728A (zh) * 2007-11-21 2008-05-14 北京搜狗科技发展有限公司 一种网址导航的方法和系统
CN102880712A (zh) * 2012-10-08 2013-01-16 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIE, BING: "Design and implementation of the TUDOU video search engine system", CHINESE MASTER'S THESES FULL-TEXT DATABASE INFORMATION SCIENCE AND TECHNOLOGY, no. 11, 15 November 2010 (2010-11-15), pages 1138 - 1314 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107807964A (zh) * 2017-10-11 2018-03-16 咪咕互动娱乐有限公司 数字内容排序方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
CN102880712B (zh) 2015-07-22
US20150205580A1 (en) 2015-07-23
CN102880712A (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
WO2014056369A1 (zh) 一种用于对搜索的网络视频进行排序的方法和系统
CN109189951B (zh) 一种多媒体资源推荐方法、设备及存储介质
CN104899302B (zh) 向用户推荐音乐的方法和装置
CN103473273B (zh) 信息搜索方法、装置和服务器
CN105183897B (zh) 一种视频搜索排序的方法和系统
US8856113B1 (en) Method and device for ranking video embeds
US8560533B1 (en) User interaction based related digital content items
US8566315B1 (en) Sequenced video segment mix
US9088808B1 (en) User interaction based related videos
CN109889891B (zh) 获取目标媒体文件的方法、装置及存储介质
US20070033229A1 (en) System and method for indexing structured and unstructured audio content
CN102929966B (zh) 一种用于提供个性化搜索列表的方法及系统
US7849070B2 (en) System and method for dynamically ranking items of audio content
CN104219575A (zh) 相关视频推荐方法及系统
CN103678668A (zh) 相关搜索结果的提示方法、服务器及系统
CA2777506A1 (en) System and method for grouping multiple streams of data
CN104021140B (zh) 一种网络视频的处理方法及装置
US9405803B2 (en) Ranking signals in mixed corpora environments
WO2018113673A1 (zh) 针对综艺类query的搜索结果的推送方法及装置
JP2011154467A (ja) 検索結果順位付け方法および検索結果順位付けシステム
CN104410906A (zh) 视频播放行为的检测方法和装置
US8005827B2 (en) System and method for accessing preferred provider of audio content
US10452710B2 (en) Selecting content items based on received term using topic model
JP2011154466A (ja) 検索結果順位付け方法および検索結果順位付けシステム
WO2014078181A2 (en) Ranking signals for sparse corpora

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13844939

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14420889

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13844939

Country of ref document: EP

Kind code of ref document: A1