WO2014075568A1 - 一种多媒体信息识别、训练的方法及装置 - Google Patents

一种多媒体信息识别、训练的方法及装置 Download PDF

Info

Publication number
WO2014075568A1
WO2014075568A1 PCT/CN2013/086509 CN2013086509W WO2014075568A1 WO 2014075568 A1 WO2014075568 A1 WO 2014075568A1 CN 2013086509 W CN2013086509 W CN 2013086509W WO 2014075568 A1 WO2014075568 A1 WO 2014075568A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
multimedia data
source information
multimedia
data source
Prior art date
Application number
PCT/CN2013/086509
Other languages
English (en)
French (fr)
Inventor
李鹏
孙熙
陆承恩
高鹏程
Original Assignee
十分(北京)信息科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 十分(北京)信息科技有限公司 filed Critical 十分(北京)信息科技有限公司
Publication of WO2014075568A1 publication Critical patent/WO2014075568A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion

Definitions

  • the present invention relates to the field of computer and Internet technologies, and in particular, to a method and device for multimedia information identification and training. Background technique
  • the website's recommendation system Relevant video/audio content that may be of interest to the user is also given for the user to select.
  • the user wants to acquire the video or audio program.
  • the related information of the program is difficult to generate, and naturally, it is impossible to input similar program information that the user may be interested in according to the user's information input for the user to judge.
  • Embodiments of the present invention provide a method and apparatus for multimedia information identification and training, which are used to obtain data source information faster.
  • a method for identifying multimedia data comprising the steps of: obtaining multimedia data by recording; determining data source information corresponding to the obtained multimedia data, wherein the data source marked by the data source information can provide the obtained multimedia data; outputting the determination to the user Data source information.
  • This embodiment can directly locate the data source capable of providing the data by the recorded data. Users no longer need to enter keywords to search.
  • the step of determining the data source information corresponding to the obtained multimedia data comprises: comparing the obtained multimedia data with the pre-stored multimedia data; determining the pre-stored multimedia data that is successfully matched; and pre-preserving the multimedia data and data according to the preset
  • the correspondence between the source information determines the data source information corresponding to the pre-stored multimedia data that is successfully matched.
  • the obtained multimedia data is identified by the existing multimedia data training model to locate the corresponding data source information, so that the positioning can be more accurate.
  • the step of comparing the obtained multimedia data with the pre-stored multimedia data comprises: comparing the obtained multimedia data with the pre-stored multimedia data according to a high-to-low order of attention of the pre-stored multimedia data.
  • the obtained multimedia data includes multimedia substantial data and noise data. Since a large number of users may record multimedia data in a similar scene, the noise data also has commonalities. Data source positioning with noise data can improve the accuracy of positioning.
  • the step of determining the data source information corresponding to the obtained multimedia data comprises: identifying noise from the obtained multimedia data by pre-stored noise data samples, determining multimedia substantive data; and comparing the multimedia substantive data with the pre-stored multimedia data. Determining the successfully stored pre-stored multimedia data; determining the data source information corresponding to the pre-stored multimedia data that is successfully matched according to the preset correspondence between the pre-stored multimedia data and the data source information. In this way, the identified data source can be improved The accuracy of the information.
  • the step of obtaining the multimedia data by using the recording method comprises: the mobile terminal obtaining the multimedia data by using the recording method, and sending the multimedia data to the server; and determining the data source information corresponding to the obtained multimedia data comprises: determining, by the server, the data corresponding to the obtained multimedia data Source information, and the determined data source information is sent to the mobile terminal; the step of outputting the determined data source information to the user comprises: the mobile terminal outputting the determined data source information to the user.
  • the above method can be implemented by the mobile terminal, but the performance of the mobile terminal is limited, so the process of determining the data source information is processed on the server side, which can improve the efficiency and accuracy of the processing.
  • the step of determining the data source information corresponding to the obtained multimedia data comprises: determining, by using the recording mode, the data source information corresponding to the multimedia data obtained in total when the multimedia data that meets the preset duration is obtained. This can accompany the entire recording process, continuously locate the data source information, and dynamically adjust, which can further improve the accuracy of positioning.
  • a method for training multimedia data comprising the steps of: obtaining multimedia data by recording, the multimedia data comprising noise data and multimedia substantive data; and adding the obtained multimedia data as a sample to the training model.
  • the recorded multimedia data is added as a sample to the training model, so that the training model can be trained, and the training model can be improved.
  • the accuracy of the recognition can be improved.
  • the method further includes the steps of: determining data source information corresponding to the obtained multimedia data, wherein the data source marked by the data source information can provide the obtained multimedia data; outputting the determined data source information to the user; receiving the user input Selecting an instruction, determining data source information selected by the user according to the selection instruction; establishing a correspondence between the obtained multimedia data and the selected data source information; and adding the established correspondence to the training model.
  • the correspondence between the more accurate multimedia data and the data source information can be established by the user's selection, and the correspondence relationship is added to the training model to train the training model, which can further improve the accuracy of the training model.
  • a device for identifying multimedia data comprising:
  • a recording module configured to obtain multimedia data by recording
  • a query module configured to determine data source information corresponding to the obtained multimedia data, where, the data The source of the source information tag can provide the obtained multimedia data;
  • An interface module configured to output the determined data source information to the user.
  • the query module compares the obtained multimedia data with the pre-stored multimedia data; determines the pre-stored multimedia data that is successfully matched; and determines the pre-stored success according to the preset correspondence between the pre-stored multimedia data and the data source information.
  • Data source information corresponding to the multimedia data.
  • the query module compares the obtained multimedia data with the pre-stored multimedia data according to the order of attention of the pre-stored multimedia data.
  • the obtained multimedia data includes multimedia substantial data and noise data.
  • the query module identifies the noise from the obtained multimedia data through the pre-stored noise data samples, determines the multimedia substantial data, compares the multimedia substantive data with the pre-stored multimedia data, and determines the pre-stored multimedia data that is successfully matched; The corresponding relationship between the pre-stored multimedia data and the data source information is determined, and the data source information corresponding to the pre-stored multimedia data that is successfully matched is determined.
  • the query module determines the data source information corresponding to the total obtained multimedia data.
  • An apparatus for training multimedia data comprising:
  • a recording module configured to obtain multimedia data by using a recording method, where the multimedia data includes noise data and multimedia substantive data;
  • the training module is configured to add the obtained multimedia data as a sample to the training model.
  • the device further includes:
  • a query module configured to determine data source information corresponding to the obtained multimedia data, where the data source marked by the data source information can provide the obtained multimedia data
  • An interface module configured to output the determined data source information to the user; receive a selection instruction input by the user, and determine, according to the selection instruction, the data source information selected by the user;
  • the training module is further configured to establish a correspondence between the obtained multimedia data and the selected data source information, and add the established correspondence to the training model.
  • FIG. 1 is a flowchart of a main method for identifying multimedia data according to an embodiment of the present invention
  • FIG. 2 is a flowchart of a method for identifying multimedia data by a mobile terminal according to an embodiment of the present invention
  • FIG. 3 is a flowchart of a method for identifying multimedia data by a server according to an embodiment of the present invention
  • FIG. 4 is a method for training multimedia data according to an embodiment of the present invention
  • FIG. 5 is a structural diagram of an apparatus for identifying multimedia data according to an embodiment of the present invention.
  • FIG. 6 is a main structural diagram of an apparatus for training multimedia data according to an embodiment of the present invention.
  • FIG. 7 is a detailed structural diagram of an apparatus for training multimedia data according to an embodiment of the present invention. detailed description
  • This embodiment can directly locate the data source capable of providing the data by the recorded data. Users no longer need to enter keywords to search.
  • the main method for identifying multimedia data in this embodiment is as follows:
  • Step 101 Obtain multimedia data by recording.
  • the multimedia data includes video data and audio data.
  • Step 102 Determine data source information corresponding to the obtained multimedia data.
  • the data source marked by the data source information can provide the obtained multimedia data.
  • the total is determined.
  • the data source information corresponding to the obtained multimedia data is determined.
  • Step 103 Output the determined data source information to the user.
  • the data source information may be specifically a channel link or other network media resource link.
  • the obtained data source information can be output to the user in a list form, and the user selects and links to the corresponding data source; or automatically links to the data source corresponding to the most matching data source information.
  • the step of determining the data source information corresponding to the obtained multimedia data comprises: comparing the obtained multimedia data with the pre-stored multimedia data; determining the pre-stored multimedia data that is successfully matched; according to the preset pre-stored multimedia data and The correspondence between the data source information determines the data source information corresponding to the pre-stored multimedia data that is successfully matched.
  • the step of comparing the obtained multimedia data with the pre-stored multimedia data comprises: obtaining the multimedia data and the pre-stored multimedia according to the order of attention of the pre-stored multimedia data from high to low.
  • the data is compared.
  • the degree of attention includes ratings, listening rates, and search frequency.
  • the multimedia data obtained in this embodiment includes multimedia substantial data and noise data.
  • the step of determining the data source information corresponding to the obtained multimedia data comprises: identifying the noise from the obtained multimedia data by using the pre-stored noise data samples, determining the multimedia substantial data; and comparing the multimedia substantive data with the pre-stored multimedia data; Determining the successfully stored pre-stored multimedia data; determining the data source information corresponding to the pre-stored multimedia data that is successfully matched according to the preset correspondence between the pre-stored multimedia data and the data source information.
  • the above methods can all be implemented by mobile terminals. Or: the mobile terminal obtains multimedia data by recording, and sends the data to the server; the server determines the data source information corresponding to the obtained multimedia data, and sends the determined data source information to the mobile terminal; the mobile terminal outputs the determined data source information to the user. .
  • Step 201 The mobile terminal obtains multimedia data that meets the preset duration by using a recording manner.
  • the preset duration includes 3 to 5 seconds.
  • step 201 Each time the multimedia data of the preset duration is obtained in step 201, the following steps are performed.
  • Step 202 The mobile terminal compares the total obtained multimedia data with the pre-stored multimedia data.
  • This step specifically uses fuzzy matching. Because many typical noises may appear in a large number of scenes for a large number of users, noise can be matched as part of the multimedia data with noise to improve the accuracy of the matching.
  • the pre-stored multimedia data also includes noise data. Typical noises such as: talking, walking, etc.
  • the pre-stored multimedia data is a sample of the training model, and the obtained multimedia data is specifically identified by the training model.
  • the multimedia data can be directly identified, or the fingerprint of the multimedia data can be obtained, and the fingerprint can be identified. Other recognition methods are also available, and the manner in which the multimedia data can be recognized is applicable to the present embodiment.
  • Step 203 The mobile terminal determines the pre-stored multimedia data that is successfully matched.
  • the matching success refers to the matching of multimedia data whose similarity exceeds the preset threshold (such as 60%).
  • Step 204 The mobile terminal determines data source information corresponding to the pre-stored multimedia data that is successfully matched according to the preset correspondence between the pre-stored multimedia data and the data source information.
  • Step 205 The mobile terminal outputs the determined data source information to the user.
  • Step 301 The mobile terminal obtains multimedia data that meets the preset duration by using a recording manner, and sends the data to the server.
  • the mobile terminal can transmit the multimedia data itself or send the fingerprint of the multimedia data.
  • Step 302 The server identifies the noise from the obtained multimedia data through the pre-stored noise data samples, and determines the multimedia substantial data.
  • Step 303 The server compares the multimedia substantive data with the pre-stored multimedia data.
  • the obtained multimedia data is compared with the pre-stored multimedia data in descending order of the pre-stored multimedia data.
  • Step 304 The server determines to match the successfully stored pre-stored multimedia data.
  • Step 305 The server determines the data source information (including the matching degree information) corresponding to the pre-stored multimedia data that is successfully matched according to the preset correspondence between the pre-stored multimedia data and the data source information, and sends the data source information (including the matching degree information) to the mobile terminal.
  • Step 306 The mobile terminal outputs data source information to the user in order of matching degree from high to low. Specifically, the mobile terminal may directly link to the data source according to the data source information with the highest matching degree, or link to the selected data source according to the user's selection of the data source information.
  • the technical solution of the present invention can be applied to a scenario for identifying a television program viewed by a user.
  • the mobile terminal acquires a piece of multimedia data by means of recording, and sends the multimedia data to a server, where the server performs matching, and the multimedia data is matched.
  • the server compares the multimedia data and the broadcast data of the television program broadcasted by each of the collected television stations, and calculates a matching ratio, for example, the server acquires the multimedia data, and the broadcasted by each television station.
  • the matching rate with the television station A is calculated to be 80%, the matching rate with the television station B is 70%, and the matching rate with the television station C is 60%.
  • the server may feed back the matching result to the mobile terminal, and display the identification information including the television station A, the television station B, and the television station C on the mobile terminal, as the plurality of optional data source information, and the user selects the accurate television station by himself.
  • the multimedia data recorded in this embodiment has two functions. First, the data source for providing the multimedia data is determined according to the second, and the training model is trained by using the multimedia data. The training process is described below.
  • the method for training multimedia data in this embodiment is as follows:
  • Step 401 Obtain multimedia data by using a recording method, where the multimedia data includes noise data and multimedia substantive data.
  • Step 402 Add the obtained multimedia data as a sample to the training model.
  • step 401 determining data source information corresponding to the obtained multimedia data, wherein the data source marked by the data source information can provide the obtained multimedia data; outputting the determined data source information to the user; receiving the user input selection An instruction, determining data source information selected by the user according to the selection instruction; establishing a correspondence between the obtained multimedia data and the selected data source information;
  • the established correspondence is added to the training model.
  • the correspondence between the multimedia data and the data source information can be established by the user's selection, and the correspondence relationship is added to the training model to train the training model, which can further improve the accuracy of the training model.
  • the apparatus for identifying multimedia data in this embodiment includes: a recording module 501, a query module 502, and an interface module 503.
  • the device may be specifically a mobile terminal.
  • the recording module 501 and the interface module 503 are located at the mobile terminal, and the query module 502 is located at the server, and the device constitutes a system.
  • the recording module 501 is used to obtain multimedia data by recording.
  • the query module 502 is configured to determine data source information corresponding to the obtained multimedia data, wherein the data source marked by the data source information can provide the obtained multimedia data.
  • the interface module 503 is configured to output the determined data source information to the user.
  • the query module 502 compares the obtained multimedia data with the pre-stored multimedia data; determines the pre-stored multimedia data that is successfully matched; and determines that the matching is successful according to the preset correspondence between the pre-stored multimedia data and the data source information.
  • the data source information corresponding to the pre-stored multimedia data.
  • the query module 502 compares the obtained multimedia data with the pre-stored multimedia data in descending order of attention of the pre-stored multimedia data.
  • the obtained multimedia data includes multimedia substantial data and noise data.
  • the query module 502 identifies the noise from the obtained multimedia data through the pre-stored noise data samples, determines the multimedia substantive data, compares the multimedia substantive data with the pre-stored multimedia data, and determines the pre-stored multimedia data that is successfully matched; The corresponding relationship between the pre-stored multimedia data and the data source information is determined, and the data source information corresponding to the pre-stored multimedia data that is successfully matched is determined.
  • the query module determines the data source information corresponding to the multimedia data obtained in total.
  • the interface module is further configured to receive a selection instruction input by the user, and determine data source information selected by the user according to the selection instruction.
  • the apparatus for training multimedia data in this embodiment includes: a recording module 601 and a training module 602.
  • the device may be specifically a mobile terminal.
  • the recording module 601 is located at the mobile terminal, and the training module 603 is located at the server, and the device constitutes a system.
  • the recording module 601 is used to obtain multimedia data by recording, and the multimedia data includes noise data and multimedia substantive data.
  • the training module 602 is configured to add the obtained multimedia data as a sample to the training model.
  • the apparatus further includes: a query module 603 and an interface module 604, as shown in FIG.
  • the query module 603 is configured to determine data source information corresponding to the obtained multimedia data, wherein the data source marked by the data source information can provide the obtained multimedia data.
  • the interface module 604 is configured to output the determined data source information to the user; receive a selection instruction input by the user, and determine the data source information selected by the user according to the selection instruction.
  • the training module 602 is further configured to establish a correspondence between the obtained multimedia data and the selected data source information, and add the established correspondence to the training model.
  • This embodiment can directly locate the data source capable of providing the data by the recorded data. Users no longer need to enter keywords to search. Moreover, the embodiment of the present invention further improves the accuracy of the multimedia data matching from the perspective of noise, thereby more accurately positioning the data source information. And, by prioritizing matching multimedia data with high degree of attention, the matching efficiency is improved. In addition, the embodiment of the present invention also uses the recorded multimedia data to perform model training, so as to more accurately identify the multimedia data by using the trained model.
  • embodiments of the present invention can be provided as a method, system, or computer program product. Accordingly, the present invention may take the form of an entirely hardware embodiment, an entirely software embodiment, or a combination of software and hardware. Moreover, the invention can be embodied in the form of one or more computer program products embodied on a computer usable storage medium (including but not limited to disk storage and optical storage, etc.) in which computer usable program code is embodied.
  • a computer usable storage medium including but not limited to disk storage and optical storage, etc.
  • the computer program instructions can also be stored in a computer readable memory that can direct a computer or other programmable data processing device to operate in a particular manner, such that the instructions stored in the computer readable memory produce an article of manufacture comprising the instruction device.
  • the apparatus implements the functions specified in one or more blocks of a flow or a flow and/or block diagram of the flowchart.

Abstract

本申请公开了一种多媒体信息识别、训练的方法,用于实现较快的获得数据源信息。所述方法包括:通过录制方式获得多媒体数据;确定获得的多媒体数据对应的数据源信息,其中,数据源信息标记的数据源能够提供获得的多媒体数据;向用户输出确定的数据源信息。本申请还公开了用于实现所述方法的装置。

Description

一种多媒体信息识别、 训练的方法及装置 本申请要求在 2012年 11月 19日提交中国专利局、申请号为 201210469520.8、 发明名称为"一种多媒体信息识别、训练的方法及装置 "的中国专利申请的优先 权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及计算机及互联网技术领域, 尤其涉及一种多媒体信息识别、 训练的方法及装置。 背景技术
互联网作为信息传播的新载体, 科技创新的新手段, 引发了前所未有的 信息革命和产业革命, 同时互联网的普及和发展深刻地改变了人类的生活和 生产方式, 给人们的日常生活和工作带来极大便利。
比如, 人们可以在网络上通过搜索引擎的拼写补全功能来找到自己感兴 趣的一类新闻或信息, 也可以在购物网站上输入自己感兴趣的商品后, 网站 的推荐系统会根据用户的购买商品的行为历史列出用户可能感兴趣的其他多 件相关商品。
具体到多媒体领域, 当用户在视频 /音频(表示视频、音频、视频和音频) 网站上通过搜索来收看 /收听 (表示收看、 收听、 收看和收听) 某部视频 /音 频时, 网站的推荐系统也会给出用户可能感兴趣的相关相近的视频 /音频内容 来供用户选择。 但是当用户面对偶然看到的视频或音频节目时, 由于用户对 播放的节目信息一无所知, 因而无法利用 "关键字" 搜索的方法上网搜索节 目的相关信息时, 用户想要获取该节目的相关信息就产生了困难, 自然也无 法根据用户的信息输入, 来给出用户可能感兴趣的相近的节目信息以供用户 判断。 因此, 本申请的发明人发现, 应当开发相关应用, 以解决用户无论何 时何地通过媒体设备观看 /收听视频 /音频节目时, 都不能及时地通过互联网 网络通讯技术获取该节目的相关信息及播放内容的问题。 发明内容
本发明实施例提供一种多媒体信息识别、 训练的方法及装置, 用于实现 较快的获得数据源信息。
一种识别多媒体数据的方法, 包括以下步骤: 通过录制方式获得多媒体 数据; 确定获得的多媒体数据对应的数据源信息, 其中, 数据源信息标记的 数据源能够提供获得的多媒体数据; 向用户输出确定的数据源信息。 本实施 例通过录得的数据可以直接定位到能够提供该数据的数据源。 不再需要用户 输入关键词进行搜索。
优选的, 确定获得的多媒体数据对应的数据源信息的步骤包括: 将获得 的多媒体数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体 数据; 根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成 功的预存的多媒体数据对应的数据源信息。 本实施例通过已有的多媒体数据 训练模型对获得的多媒体数据进行识别, 以定位到相应的数据源信息, 可使 定位较准确。
优选的, 将获得的多媒体数据与预存的多媒体数据进行比对的步骤包括: 按照预存的多媒体数据的关注度由高到低的顺序, 将获得的多媒体数据与预 存的多媒体数据进行比对。 关注度越高, 匹配成功的可能性越大, 因此可以 提高匹配成功的效率。
优选的, 获得的多媒体数据包括多媒体实质数据和噪声数据。 因为大量 的用户可能在类似的场景下录制多媒体数据, 所以噪声数据也具有共性。 带 着噪声数据进行数据源定位, 可提高定位的准确度。
优选的, 确定获得的多媒体数据对应的数据源信息的步骤包括: 通过预 存的噪声数据样本从获得的多媒体数据中识别出噪声, 确定多媒体实质数据; 将多媒体实质数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多 媒体数据; 根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹 配成功的预存的多媒体数据对应的数据源信息。 这样, 可提高确定的数据源 信息的准确度。
优选的, 通过录制方式获得多媒体数据的步骤包括: 移动终端通过录制 方式获得多媒体数据, 并发送给服务器; 确定获得的多媒体数据对应的数据 源信息的步骤包括: 服务器确定获得的多媒体数据对应的数据源信息, 并将 确定的数据源信息发送给移动终端; 向用户输出确定的数据源信息的步骤包 括:移动终端向用户输出确定的数据源信息。上述方法可以由移动终端实现, 但是移动终端的性能有限, 因此将确定数据源信息的过程放在服务器侧处理, 可提高处理的效率和准确度。
优选的, 确定获得的多媒体数据对应的数据源信息的步骤包括: 通过录 制方式, 每获得满足预设时长的多媒体数据时, 确定总共获得的多媒体数据 对应的数据源信息。 这样可伴随整个录制过程, 不断的进行数据源信息的定 位, 并动态调整, 可进一步提高定位的准确性。
一种训练多媒体数据的方法, 包括以下步骤: 通过录制方式获得多媒体 数据, 该多媒体数据包括噪声数据和多媒体实质数据; 将获得的多媒体数据 作为样本, 加入训练模型中。 本实施例将录制得到的多媒体数据作为样品加 入到训练模型中, 以便对训练模型进行训练, 可以使该训练模型更完善, 利 用该训练模式进行多媒体数据识别时可提高识别的准确度。
优选的, 所述方法还包括步骤: 确定获得的多媒体数据对应的数据源信 息, 其中, 数据源信息标记的数据源能够提供获得的多媒体数据; 向用户输 出确定的数据源信息; 接收用户输入的选择指令, 根据该选择指令确定用户 选择的数据源信息; 建立获得的多媒体数据与选择的数据源信息的对应关系; 将建立的对应关系加入训练模型中。 本实施例中通过用户的选择可建立较准 确的多媒体数据与数据源信息的对应关系, 将该对应关系加入训练模型, 以 便对训练模型进行训练, 可进一步提高训练模型的准确度。
一种识别多媒体数据的装置, 包括:
录制模块, 用于通过录制方式获得多媒体数据;
查询模块, 用于确定获得的多媒体数据对应的数据源信息, 其中, 数据 源信息标记的数据源能够提供获得的多媒体数据;
接口模块, 用于向用户输出确定的数据源信息。
优选的, 查询模块将获得的多媒体数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体数据; 根据预设的预存的多媒体数据与数据源 信息的对应关系, 确定匹配成功的预存的多媒体数据对应的数据源信息。
优选的, 查询模块按照预存的多媒体数据的关注度由高到低的顺序, 将 获得的多媒体数据与预存的多媒体数据进行比对。
优选的, 获得的多媒体数据包括多媒体实质数据和噪声数据。
优选的, 查询模块通过预存的噪声数据样本从获得的多媒体数据中识别 出噪声, 确定多媒体实质数据; 将多媒体实质数据与预存的多媒体数据进行 比对; 确定匹配成功的预存的多媒体数据; 根据预设的预存的多媒体数据与 数据源信息的对应关系, 确定匹配成功的预存的多媒体数据对应的数据源信 息。
优选的, 通过录制方式, 每获得满足预设时长的多媒体数据时, 查询模 块确定总共获得的多媒体数据对应的数据源信息。
一种训练多媒体数据的装置, 包括:
录制模块, 用于通过录制方式获得多媒体数据, 该多媒体数据包括噪声 数据和多媒体实质数据;
训练模块, 用于将获得的多媒体数据作为样本, 加入训练模型中。
优选的, 所述装置还包括:
查询模块, 用于确定获得的多媒体数据对应的数据源信息, 其中, 数据 源信息标记的数据源能够提供获得的多媒体数据;
接口模块, 用于向用户输出确定的数据源信息; 接收用户输入的选择指 令, 根据该选择指令确定用户选择的数据源信息;
训练模块还用于建立获得的多媒体数据与选择的数据源信息的对应关系 , 将建立的对应关系加入训练模型中。
本发明的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说 明书中变得显而易见, 或者通过实施本发明而了解。 本发明的目的和其他优 点可通过在所写的说明书、 权利要求书、 以及附图中所特别指出的结构来实 现和获得。
下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 附图说明
附图用来提供对本发明的进一步理解, 并且构成说明书的一部分, 与本 发明的实施例一起用于解释本发明, 并不构成对本发明的限制。 在附图中: 图 1为本发明实施例中识别多媒体数据的主要方法流程图;
图 2为本发明实施例中由移动终端识别多媒体数据的方法流程图; 图 3为本发明实施例中由服务器识别多媒体数据的方法流程图; 图 4为本发明实施例中训练多媒体数据的方法流程图;
图 5为本发明实施例中识别多媒体数据的装置结构图;
图 6为本发明实施例中训练多媒体数据的装置主要结构图;
图 7为本发明实施例中训练多媒体数据的装置详细结构图。 具体实施方式
以下结合附图对本发明的优选实施例进行说明, 应当理解, 此处所描述 的优选实施例仅用于说明和解释本发明, 并不用于限定本发明。
本实施例通过录得的数据可以直接定位到能够提供该数据的数据源。 不 再需要用户输入关键词进行搜索。
参见图 1 , 本实施例中识别多媒体数据的主要方法流程如下:
步骤 101 : 通过录制方式获得多媒体数据。 多媒体数据包括视频数据和音 频数据。
步骤 102: 确定获得的多媒体数据对应的数据源信息。 其中, 数据源信息 标记的数据源能够提供获得的多媒体数据。
较佳的, 通过录制方式, 每获得满足预设时长的多媒体数据时, 确定总 共获得的多媒体数据对应的数据源信息。
步骤 103: 向用户输出确定的数据源信息。
其中, 数据源信息可具体为频道链接或其它网络媒体资源链接等。 获得 的数据源信息可以以列表形式输出给用户, 由用户选择后链接到相应的数据 源; 或者自动链接到匹配程度最高的数据源信息对应的数据源。
较佳的, 确定获得的多媒体数据对应的数据源信息的步骤包括: 将获得 的多媒体数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体 数据; 根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成 功的预存的多媒体数据对应的数据源信息。
为了进一步提高匹配多媒体数据的效率, 将获得的多媒体数据与预存的 多媒体数据进行比对的步骤包括: 按照预存的多媒体数据的关注度由高到低 的顺序, 将获得的多媒体数据与预存的多媒体数据进行比对。 其中, 关注度 包括收视率、 收听率和搜索频率等。
本实施例中获得的多媒体数据包括多媒体实质数据和噪声数据。 则, 确 定获得的多媒体数据对应的数据源信息的步骤包括: 通过预存的噪声数据样 本从获得的多媒体数据中识别出噪声, 确定多媒体实质数据; 将多媒体实质 数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体数据; 根 据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功的预存 的多媒体数据对应的数据源信息。
以上方法可均有移动终端实现。 或者: 移动终端通过录制方式获得多媒 体数据,并发送给服务器;服务器确定获得的多媒体数据对应的数据源信息, 并将确定的数据源信息发送给移动终端; 移动终端向用户输出确定的数据源 信息。
另外, 在上述步骤 103之后, 可以进一步包括如下步骤:
接收用户输入的选择指令, 根据该选择指令确定用户选择的数据源信息。 下面通过两个典型实施例来详细介绍识别多媒体数据的过程。
参见图 2, 本实施例中由移动终端识别多媒体数据的方法流程如下: 步骤 201 :移动终端通过录制方式获得满足预设时长的多媒体数据。其中, 预设时长包括 3~5秒。
在步骤 201中每获得预设时长的多媒体数据, 就执行以下步骤。
步骤 202:移动终端将总共获得的多媒体数据与预存的多媒体数据进行比 对。 此步骤具体釆用模糊匹配的方式。 因为对于大量用户来说, 很多典型噪 声可能在大量场景出现, 所以可以将噪声作为多媒体数据的一部分, 带着噪 声进行匹配, 可提高匹配的准确度。 当然, 预存的多媒体数据也包括噪声数 据。 典型噪声如: 说话声、 走路声等。
预存的多媒体数据为训练模型的样品, 具体通过训练模型对获得的多媒 体数据进行识别。 可以直接对多媒体数据进行识别, 或者获得多媒体数据的 指紋, 并指紋进行识别。 还可以有其它识别方式, 能够识别多媒体数据的方 式均适用于本实施例。
步骤 203: 移动终端确定匹配成功的预存的多媒体数据。 这里的匹配成功 是指匹配相似度超过预设阔值(如 60% ) 的多媒体数据。
步骤 204:移动终端根据预设的预存的多媒体数据与数据源信息的对应关 系, 确定匹配成功的预存的多媒体数据对应的数据源信息。
步骤 205: 移动终端向用户输出确定的数据源信息。
参见图 3 , 本实施例中由服务器识别多媒体数据的方法流程如下: 步骤 301 : 移动终端通过录制方式获得满足预设时长的多媒体数据, 并发 送给服务器。 移动终端可以发送多媒体数据本身, 也可以发送多媒体数据的 指紋。
步骤 302:服务器通过预存的噪声数据样本从获得的多媒体数据中识别出 噪声, 确定多媒体实质数据。
步骤 303: 服务器将多媒体实质数据与预存的多媒体数据进行比对。较佳 的, 按照预存的多媒体数据的关注度由高到低的顺序, 将获得的多媒体数据 与预存的多媒体数据进行比对。
步骤 304: 服务器确定匹配成功的预存的多媒体数据。 步骤 305:服务器根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功的预存的多媒体数据对应的数据源信息 (包括匹配程度信息), 并发送给移动终端。
步骤 306:移动终端按照匹配程度由高到低的顺序向用户输出数据源信息。 具体的,移动终端可直接根据匹配度最高的数据源信息链接到数据源,或者, 根据用户对数据源信息的选择链接到选择的数据源。
具体的, 本发明的技术方案可以应用到对用户观看的电视节目进行识别 的场景中, 例如移动终端通过录制的方式获取一段多媒体数据, 将多媒体数 据发送给服务器, 由服务器进行匹配, 该多媒体数据可以为音频数据, 或视 频数据。 服务器在进行匹配过程中, 会根据上述多媒体数据, 以及釆集的各 电视台播出的电视节目广播流数据进行比对, 并计算匹配率, 例如服务器在 获取到多媒体数据, 以及各电视台播出的电视节目广播流数据进行比对后, 计算得到与电视台 A的匹配率为 80%, 与电视台 B的匹配率为 70%, 与电视 台 C的匹配率为 60%。 则服务器可以将上述的匹配结果反馈给到移动终端, 在移动终端上显示包括电视台 A、 电视台 B和电视台 C的识别信息, 作为多 个可选的数据源信息, 由用户自行选择准确的电视台。
本实施例中录制的多媒体数据有两个作用, 一是据此确定提供该多媒体 数据的数据源, 二是可利用该多媒体数据对训练模型进行训练。 下面对训练 过程进行介绍。
参见图 4, 本实施例中训练多媒体数据的方法流程如下:
步骤 401 : 通过录制方式获得多媒体数据, 该多媒体数据包括噪声数据和 多媒体实质数据。
步骤 402: 将获得的多媒体数据作为样本, 加入训练模型中。
较佳的, 在步骤 401 之后, 确定获得的多媒体数据对应的数据源信息, 其中, 数据源信息标记的数据源能够提供获得的多媒体数据; 向用户输出确 定的数据源信息; 接收用户输入的选择指令, 根据该选择指令确定用户选择 的数据源信息; 建立获得的多媒体数据与选择的数据源信息的对应关系; 将 建立的对应关系加入训练模型中。 本实施例中通过用户的选择可建立较准确 的多媒体数据与数据源信息的对应关系, 将该对应关系加入训练模型, 以便 对训练模型进行训练, 可进一步提高训练模型的准确度。
通过以上描述了解了识别和训练多媒体数据的实现过程, 该过程可由装 置实现, 下面对装置的内部结构和功能进行介绍。
参见图 5 , 本实施例中识别多媒体数据的装置包括: 录制模块 501、 查询 模块 502和接口模块 503。 所述装置可具体为移动终端。 或者, 录制模块 501 和接口模块 503位于移动终端, 查询模块 502位于服务器, 则所述装置构成 了一个系统。
录制模块 501用于通过录制方式获得多媒体数据。
查询模块 502用于确定获得的多媒体数据对应的数据源信息, 其中, 数 据源信息标记的数据源能够提供获得的多媒体数据。
接口模块 503用于向用户输出确定的数据源信息。
较佳的, 查询模块 502将获得的多媒体数据与预存的多媒体数据进行比 对; 确定匹配成功的预存的多媒体数据; 根据预设的预存的多媒体数据与数 据源信息的对应关系, 确定匹配成功的预存的多媒体数据对应的数据源信息。
查询模块 502按照预存的多媒体数据的关注度由高到低的顺序, 将获得 的多媒体数据与预存的多媒体数据进行比对。
获得的多媒体数据包括多媒体实质数据和噪声数据。 则, 查询模块 502 通过预存的噪声数据样本从获得的多媒体数据中识别出噪声, 确定多媒体实 质数据; 将多媒体实质数据与预存的多媒体数据进行比对; 确定匹配成功的 预存的多媒体数据; 根据预设的预存的多媒体数据与数据源信息的对应关系 , 确定匹配成功的预存的多媒体数据对应的数据源信息。
另外, 通过录制方式, 每获得满足预设时长的多媒体数据时, 查询模块 确定总共获得的多媒体数据对应的数据源信息。
另外, 上述的接口模块还用于接收用户输入的选择指令, 根据该选择指 令确定用户选择的数据源信息。 参见图 6, 本实施例中训练多媒体数据的装置包括: 录制模块 601和训练 模块 602。 所述装置可具体为移动终端。 或者, 录制模块 601位于移动终端, 训练模块 603位于服务器, 则所述装置构成了一个系统。
录制模块 601 用于通过录制方式获得多媒体数据, 该多媒体数据包括噪 声数据和多媒体实质数据。
训练模块 602用于将获得的多媒体数据作为样本, 加入训练模型中。 所述装置还包括: 查询模块 603和接口模块 604, 参见图 7所示。
查询模块 603 用于确定获得的多媒体数据对应的数据源信息, 其中, 数 据源信息标记的数据源能够提供获得的多媒体数据。
接口模块 604用于向用户输出确定的数据源信息; 接收用户输入的选择 指令, 根据该选择指令确定用户选择的数据源信息。
训练模块 602还用于建立获得的多媒体数据与选择的数据源信息的对应 关系, 将建立的对应关系加入训练模型中。
本实施例通过录得的数据可以直接定位到能够提供该数据的数据源。 不 再需要用户输入关键词进行搜索。 并且, 本发明实施例还从噪声角度进一步 提高了多媒体数据匹配的准确度, 进而更准确的定位数据源信息。 以及, 通 过优先匹配关注度高的多媒体数据, 提高了匹配效率。 另外, 本发明实施例 还利用录制得到的多媒体数据进行模型训练, 以便利用训练后的模型更准确 的识别多媒体数据。
本领域内的技术人员应明白, 本发明的实施例可提供为方法、 系统、 或 计算机程序产品。 因此, 本发明可釆用完全硬件实施例、 完全软件实施例、 或结合软件和硬件方面的实施例的形式。 而且, 本发明可釆用在一个或多个 其中包含有计算机可用程序代码的计算机可用存储介质 (包括但不限于磁盘 存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、 设备(系统)、 和计算机程序产 品的流程图和 /或方框图来描述的。 应理解可由计算机程序指令实现流程图 和 /或方框图中的每一流程和 /或方框、 以及流程图和 /或方框图中的流程 和 /或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、 嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器, 使得通 过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流 程图一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的 装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中, 使得存储在该计算机可读存储器 中的指令产生包括指令装置的制造品, 该指令装置实现在流程图一个流程或 多个流程和 /或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上, 使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的 处理, 从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图 一个流程或多个流程和 /或方框图一个方框或多个方框中指定的功能的步骤。 发明的精神和范围。 这样, 倘若本发明的这些修改和变型属于本发明权利要 求及其等同技术的范围之内, 则本发明也意图包含这些改动和变型在内。

Claims

权 利 要 求
1、 一种多媒体信息识别的方法, 其特征在于, 包括以下步骤: 通过录制方式获得多媒体数据;
确定获得的多媒体数据对应的数据源信息, 其中, 数据源信息标记的数 据源能够提供获得的多媒体数据;
向用户输出确定的数据源信息。
2、 如权利要求 1所述的方法, 其特征在于, 确定获得的多媒体数据对应 的数据源信息的步骤包括:
将获得的多媒体数据与预存的多媒体数据进行比对;
确定匹配成功的预存的多媒体数据;
根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功 的预存的多媒体数据对应的数据源信息。
3、 如权利要求 2所述的方法, 其特征在于, 将获得的多媒体数据与预存 的多媒体数据进行比对的步骤包括:
按照预存的多媒体数据的关注度由高到低的顺序, 将获得的多媒体数据 与预存的多媒体数据进行比对。
4、 如权利要求 1 、 2或 3所述的方法, 其特征在于, 获得的多媒体数据 包括多媒体实质数据和噪声数据。
5、 如权利要求 4所述的方法, 其特征在于, 确定获得的多媒体数据对应 的数据源信息的步骤包括:
通过预存的噪声数据样本从获得的多媒体数据中识别出噪声, 确定多媒 体实质数据;
将多媒体实质数据与预存的多媒体数据进行比对;
确定匹配成功的预存的多媒体数据;
根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功 的预存的多媒体数据对应的数据源信息。
6、 如权利要求 1所述的方法, 其特征在于, 通过录制方式获得多媒体数 据的步骤包括: 移动终端通过录制方式获得多媒体数据, 并发送给服务器; 确定获得的多媒体数据对应的数据源信息的步骤包括: 服务器确定获得 的多媒体数据对应的数据源信息, 并将确定的数据源信息发送给移动终端; 向用户输出确定的数据源信息的步骤包括: 移动终端向用户输出确定的 数据源信息。
7、 如权利要求 1所述的方法, 其特征在于, 确定获得的多媒体数据对应 的数据源信息的步骤包括:
通过录制方式, 每获得满足预设时长的多媒体数据时, 确定总共获得的 多媒体数据对应的数据源信息。
8、 如权利要求 1所述的方法, 其特征在于, 还包括如下步骤:
接收用户输入的选择指令, 根据该选择指令确定用户选择的数据源信息。
9、 一种训练多媒体数据的方法, 其特征在于, 包括以下步骤:
通过录制方式获得多媒体数据, 该多媒体数据包括噪声数据和多媒体实 质数据;
将获得的多媒体数据作为样本 , 加入训练模型中。
10、 如权利要求 9所述的方法, 其特征在于, 还包括步骤:
确定获得的多媒体数据对应的数据源信息, 其中, 数据源信息标记的数 据源能够提供获得的多媒体数据;
向用户输出确定的数据源信息;
接收用户输入的选择指令, 根据该选择指令确定用户选择的数据源信息; 建立获得的多媒体数据与选择的数据源信息的对应关系;
将建立的对应关系加入训练模型中。
11、 一种多媒体信息识别的装置, 其特征在于, 包括:
录制模块, 用于通过录制方式获得多媒体数据;
查询模块, 用于确定获得的多媒体数据对应的数据源信息, 其中, 数据 源信息标记的数据源能够提供获得的多媒体数据; 接口模块, 用于向用户输出确定的数据源信息。
12、 如权利要求 11所述的装置, 其特征在于, 查询模块将获得的多媒体 数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体数据; 根 据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功的预存 的多媒体数据对应的数据源信息。
13、 如权利要求 12所述的装置, 其特征在于, 查询模块按照预存的多媒 体数据的关注度由高到低的顺序, 将获得的多媒体数据与预存的多媒体数据 进行比对。
14、 如权利要求 11、 12或 13所述的装置, 其特征在于, 获得的多媒体 数据包括多媒体实质数据和噪声数据。
15、 如权利要求 14所述的装置, 其特征在于, 查询模块通过预存的噪声 数据样本从获得的多媒体数据中识别出噪声, 确定多媒体实质数据; 将多媒 体实质数据与预存的多媒体数据进行比对; 确定匹配成功的预存的多媒体数 据; 根据预设的预存的多媒体数据与数据源信息的对应关系, 确定匹配成功 的预存的多媒体数据对应的数据源信息。
16、 如权利要求 9 所述的装置, 其特征在于, 通过录制方式, 每获得满 足预设时长的多媒体数据时, 查询模块确定总共获得的多媒体数据对应的数 据源信息。
17、 如权利要求 9 所述的装置, 其特征在于, 所述接口模块还用于接收 用户输入的选择指令, 根据该选择指令确定用户选择的数据源信息。
18、 一种训练多媒体数据的装置, 其特征在于, 包括:
录制模块, 用于通过录制方式获得多媒体数据, 该多媒体数据包括噪声 数据和多媒体实质数据;
训练模块, 用于将获得的多媒体数据作为样本, 加入训练模型中。
19、 如权利要求 18所述的装置, 其特征在于, 还包括:
查询模块, 用于确定获得的多媒体数据对应的数据源信息, 其中, 数据 源信息标记的数据源能够提供获得的多媒体数据; 接口模块, 用于向用户输出确定的数据源信息; 接收用户输入的选择指 令, 根据该选择指令确定用户选择的数据源信息;
训练模块还用于建立获得的多媒体数据与选择的数据源信息的对应关系 , 将建立的对应关系加入训练模型中。
PCT/CN2013/086509 2012-11-19 2013-11-04 一种多媒体信息识别、训练的方法及装置 WO2014075568A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2012104695208A CN102970578A (zh) 2012-11-19 2012-11-19 一种多媒体信息识别、训练的方法及装置
CN201210469520.8 2012-11-19

Publications (1)

Publication Number Publication Date
WO2014075568A1 true WO2014075568A1 (zh) 2014-05-22

Family

ID=47800398

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/086509 WO2014075568A1 (zh) 2012-11-19 2013-11-04 一种多媒体信息识别、训练的方法及装置

Country Status (2)

Country Link
CN (1) CN102970578A (zh)
WO (1) WO2014075568A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10113007B2 (en) 2012-11-06 2018-10-30 Icm, Inc. Advanced cook technology

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970578A (zh) * 2012-11-19 2013-03-13 北京十分科技有限公司 一种多媒体信息识别、训练的方法及装置
CN103440330A (zh) * 2013-09-03 2013-12-11 网易(杭州)网络有限公司 一种音乐节目信息获取方法和设备
CN105450496B (zh) * 2014-07-30 2019-06-21 钉钉控股(开曼)有限公司 社交应用中扩展内容来源的方法及系统、客户端和服务器
CN116719911B (zh) * 2023-08-10 2023-10-31 成都不烦智能科技有限责任公司 自动化流程生成方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101834837A (zh) * 2009-12-18 2010-09-15 北京邮电大学 基于宽带网络的旅游景区景点在线景观视频主动信息服务系统
CN102043788A (zh) * 2009-10-21 2011-05-04 北京金石智博科技发展有限公司 基于内容比对的视频检索系统
CN102404607A (zh) * 2010-09-11 2012-04-04 刘芳荣 互联网视频点播系统
CN102970578A (zh) * 2012-11-19 2013-03-13 北京十分科技有限公司 一种多媒体信息识别、训练的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法
CN102411578A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 一种多媒体播放系统和方法
CN102650993A (zh) * 2011-02-25 2012-08-29 北大方正集团有限公司 音视频文件的索引建立和检索方法、装置及系统
CN102222227B (zh) * 2011-04-25 2013-07-31 中国华录集团有限公司 基于视频识别与提取影片图像的系统
CN102609548A (zh) * 2012-04-19 2012-07-25 李俊 一种基于运动目标的视频内容检索方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043788A (zh) * 2009-10-21 2011-05-04 北京金石智博科技发展有限公司 基于内容比对的视频检索系统
CN101834837A (zh) * 2009-12-18 2010-09-15 北京邮电大学 基于宽带网络的旅游景区景点在线景观视频主动信息服务系统
CN102404607A (zh) * 2010-09-11 2012-04-04 刘芳荣 互联网视频点播系统
CN102970578A (zh) * 2012-11-19 2013-03-13 北京十分科技有限公司 一种多媒体信息识别、训练的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10113007B2 (en) 2012-11-06 2018-10-30 Icm, Inc. Advanced cook technology

Also Published As

Publication number Publication date
CN102970578A (zh) 2013-03-13

Similar Documents

Publication Publication Date Title
CN107844586B (zh) 新闻推荐方法和装置
JP4298513B2 (ja) 高速ハッシュに基づくマルチメディアオブジェクトのメタデータ検索
US10354307B2 (en) Method, device, and system for obtaining information based on audio input
JP5828501B2 (ja) 番組コンテキストに基づくモバイルコンテンツの提示
US11880442B2 (en) Authentication of audio-based input signals
US9342576B2 (en) Information processing device, information processing terminal, information processing method, and program
WO2019134587A1 (zh) 视频数据处理方法、装置、电子设备和存储介质
US11132411B2 (en) Search information processing method and apparatus
WO2017096877A1 (zh) 一种推荐方法和装置
CN101517550B (zh) 大众传媒的社会性和交互式应用
US20150301718A1 (en) Methods, systems, and media for presenting music items relating to media content
WO2017028624A1 (zh) 一种资源的处理方法及装置
US20150046458A1 (en) Method for recommending users in social network and the system thereof
WO2014075568A1 (zh) 一种多媒体信息识别、训练的方法及装置
KR20150098655A (ko) 매칭된 멀티미디어 비디오 컨텐츠를 제공하기 위한 시스템 및 방법
US11062331B2 (en) Determining streaming content user consumption
US20160050457A1 (en) Method and system for tv channel content management and monetization based on content fingerprinting using a portable computing and communications device
JP2020009439A (ja) インタラクション方法および装置
WO2014043969A1 (zh) 一种信息传送的方法及装置
WO2017156934A1 (zh) 智能互联方法和智能终端
US10460698B2 (en) Method for rendering an electronic content on a rendering device
KR20090024016A (ko) 음악 인식 기능을 이용한 음악 방송 모니터링 장치 및 방법
WO2016187768A1 (zh) 一种视频信息推送方法及装置
WO2015078124A1 (zh) 一种网络数据处理方法及装置
KR20200042287A (ko) 영상 컨텐츠 관련 음악 정보 제공 방법 및 이를 지원하는 서비스 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13854290

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 27/08/2015)

122 Ep: pct application non-entry in european phase

Ref document number: 13854290

Country of ref document: EP

Kind code of ref document: A1