JP6336206B2 - 動画ファイルの識別子を処理する方法、装置、プログラム及び記録媒体 - Google Patents

動画ファイルの識別子を処理する方法、装置、プログラム及び記録媒体 Download PDF

Info

Publication number
JP6336206B2
JP6336206B2 JP2017521284A JP2017521284A JP6336206B2 JP 6336206 B2 JP6336206 B2 JP 6336206B2 JP 2017521284 A JP2017521284 A JP 2017521284A JP 2017521284 A JP2017521284 A JP 2017521284A JP 6336206 B2 JP6336206 B2 JP 6336206B2
Authority
JP
Japan
Prior art keywords
moving image
identifier
detection area
frame screen
image file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017521284A
Other languages
English (en)
Other versions
JP2017526316A (ja
Inventor
▲潔▼ ▲劉▼
▲潔▼ ▲劉▼
小勇 ▲呉▼
小勇 ▲呉▼
▲維▼ 王
▲維▼ 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2017526316A publication Critical patent/JP2017526316A/ja
Application granted granted Critical
Publication of JP6336206B2 publication Critical patent/JP6336206B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/437Interfacing the upstream path of the transmission network, e.g. for transmitting client requests to a VOD server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4542Blocking scenes or portions of the received content, e.g. censoring scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8352Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Library & Information Science (AREA)
  • Studio Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は出願番号が201510290508.4であって、出願日が2015年5月29日である中国特許出願に基づき、当該中国特許出願の優先権を主張し、当該中国特許出願の全ての内容を本願に援用する。
本発明はインターネット技術分野に関し、特に動画ファイルの識別子を処理する方法装置、プログラム及び記録媒体に関する。
スマートテレビの急速な発展に伴い、スマートテレビが提供した全面開放型プラットホームはユーザが普通のテレビ内容を観賞することができると同時に、各動画ウェブサイトが提供する動画ファイルも観賞できるようにした。関連技術において、動画ウェブサイトはそのウェブサイトを宣伝する目的で、提供する動画ファイルに動画識別子を追加し、該動画識別子を通じて宣伝の目的を実現する。しかしながら、ユーザが動画ファイルを観賞する時、動画識別子はユーザの視覚的な見た目を悪くする。
本発明は、関連技術に存在する問題を解決するために、動画ファイルの識別子を処理する方法装置、プログラム及び記録媒体を提供し、ユーザが動画ファイルを観賞する時の視覚的な見た目を向上させる。
本発明の実施例の第1の態様によれば、
動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定するステップと、
前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップと、
前記動画識別子が存在する場合、前記検出区域のエッジ画素点の画素値に基づいて、前記動画識別子を遮蔽するステップとを含む動画ファイルの識別子を処理する方法を提供する。
一つの実施例において、前記動画ファイルのフレーム画面においての検出区域を確定するステップは、
前記動画ファイルについて所定数のフレームを確定するステップと、
前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出するか、又は、
前記動画ファイルの関連情報をサーバに送信するステップと、
前記サーバからの、前記関連情報に基づいて確定した、前記動画ファイルのフレーム画面においての検出区域を受信するステップとを含むことができる。
一つの実施例において、前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出するステップは、
前記所定数のフレームの擬似区域を確定するステップと、
前記擬似区域内において、前記所定数のフレームに対しエッジ検出を行い、前記動画ファイルのフレーム画面においての検出区域を確定するステップとを含むことができる。
一つの実施例において、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップは、
前記動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定するステップと、
前記複数の識別子マスクをそれぞれ前記検出区域内の画像内容とマッチングし、前記所定数のマッチング結果を得るステップと、
前記所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定するステップと、
前記所定閾値より大きい場合、フレーム画面に動画識別子が存在することを確定するステップとを含むことができる。
一つの実施例において、前記検出区域のエッジ画素点の画素値に基づいて、前記動画識別子を遮蔽するステップは、
前記検出区域のエッジ方向に沿って、且つ前記所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の前記マスクの中心に位置する画素点の新たな画素値を確定するステップと、
前記新たな画素値に基づいて前記マスクの中心の画素点の元画素値を修正するステップと、
修正後の前記新たな画素値を前記フレーム画面において表示するステップとを含むことができる。
一つの実施例において、前記検出区域のエッジ方向に沿って、且つ前記所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の画素値を確定するステップにおいて、下記のような式を通じて前記検出区域のエッジ画素を確定し、
ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクBにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスクB内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表す。
一つの実施例において、前記方法は、
更に、前記動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで前記動画識別子を遮蔽するステップと、
前記検出区域が確定された後、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行するステップとを含むことができる。
本発明の実施例の第2の態様によれば、
動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定する第1確定モジュールと、
前記第1確定モジュールによって確定された前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出する検出モジュールと、
前記検出モジュールにおいて前記動画識別子が存在すると検出された場合、前記検出区域のエッジ画素点の画素値に基づいて、前記フレーム画面における前記動画識別子を遮蔽する第1遮蔽モジュールとを備えることを特徴とする動画ファイルの識別子を処理する装置を提供する。
一つの実施例において、前記第1確定モジュールは、
前記動画ファイルについて所定数のフレームを確定する第1確定サブモジュールと、
前記第1確定サブモジュールによって確定された前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出する第1検出サブモジュール、又は、
前記動画ファイルの関連情報をサーバに送信する送信サブモジュールと、
前記サーバからの、前記送信サブモジュールによって送信された前記関連情報に基づいて確定した、前記動画ファイルのフレーム画面においての検出区域を受信する受信サブモジュールとを有することができる。
一つの実施例において、前記第1検出サブモジュールは、
前記所定数のフレームの擬似区域を確定する第2確定サブモジュールと、
前記擬似区域内において、前記第2確定サブモジュールによって確定された前記所定数のフレームに対しエッジ検出を行い、これにより前記動画ファイルのフレーム画面においての検出区域を確定する第2検出サブモジュールとを有することができる。
一つの実施例において、前記検出モジュールは、
前記動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定する第3確定サブモジュールと、
前記第3確定モジュールによって確定されたそれぞれの前記複数の識別子マスクを前記検出区域内の画像内容とマッチングして、前記所定数のマッチング結果を得るマッチングサブモジュールと、
前記マッチングサブモジュールによって得られた前記所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定する第4確定サブモジュールと、
前記第4確定モジュールにおいて前記所定数のマッチング結果における最大値が所定閾値より大きいと確定された場合、フレーム画面に動画識別子が存在することを確定する第5確定サブモジュールとを有することができる。
一つの実施例において、前記第1遮蔽モジュールは、
前記検出区域のエッジ方向に沿って、且つ前記所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の前記マスクの中心に位置する画素点の新たな画素値を確定する画素確定サブモジュールと、
前記画素確定サブモジュールによって確定された前記新たな画素値に基づいて前記マスクの中心の画素点の元画素値を修正する画素修正サブモジュールと、
前記画素修正サブモジュールによって修正された前記新たな画素値を前記フレーム画面において表示する表示サブモジュールとを有することができる。
一つの実施例において、前記画素確定サブモジュールは下記のような式を通じて前記検出区域のエッジ画素を確定し、
ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクBにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスクB内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表す。
一つの実施例において、前記装置は、
更に、前記第1確定モジュールが前記動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで前記動画識別子を遮蔽する第2遮蔽モジュールを備え、
前記第1確定モジュールによって前記検出区域が確定された後、前記検出モジュールは、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行する。
本発明の実施例の第3の態様によれば、
プロセッサと、
プロセッサが実行可能なコマンドを記憶するためのメモリとを備え、
前記プロセッサは、
動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定し、
前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出し、
前記動画識別子が存在する場合、前記検出区域のエッジ画素点の画素値に基づいて、前記フレーム画面における前記動画識別子を遮蔽するように構成されることを特徴とする動画ファイルの識別子を処理する装置を提供する。
本発明の実施例の第4の態様によれば、プロセッサに実行されることにより、前記動画ファイルの識別子を処理する方法を実現する記録媒体に記録されたプログラムを提供する。
本発明の実施例の第5の態様によれば、前記プログラムが記録された記録媒体を提供する。
本発明の実施例が提供する技術案は下記のような有益な効果を含むことができる。
ユーザは動画ファイルを再生する必要がある時、動画ファイルのフレーム画面においての検出区域を確定することで、フレーム画面全体に対して検出することを避け、動画識別子に対する遮蔽がより高い対応性を持ち、検出区域において、再生必要のあるフレーム画面に動画識別子が存在することが検出された場合、検出区域内において動画ファイルのフレーム画面における動画識別子を遮蔽し、ユーザが動画ファイル観賞する時の視覚的な見た目を向上させることができる。
また、上記の一般的な説明及び以下の詳細な説明は単なる例示及び解釈に過ぎず、本発明を限定するものではないことを理解すべきである。
本願の図面は明細書に取り込まれて明細書の一部を構成し、本発明に合致する実施例を示し、また、明細書と共に本発明の原理の解釈に用いられる。
一つの例示的な実施例にかかる動画ファイルの識別子を処理する方法のフローチャートである。 一つの例示的な実施例1にかかる動画ファイル再生時の場面模式図である。 一つの例示的な実施例1にかかる動画ファイルの識別子を処理する方法のフローチャートである。 一つの例示的な実施例1にかかる識別子ピラミッドを確定する方法のフローチャートである。 一つの例示的な実施例1にかかる識別子ピラミッドの模式図である。 一つの例示的な実施例1にかかるステップS202のフローチャートである。 一つの例示的な実施例2にかかる動画ファイルの識別子を処理する方法のフローチャートである。 一つの例示的な実施例にかかる動画ファイルの識別子を処理する装置のブロック図である。 一つの例示的な実施例にかかる動画ファイルの識別子を処理する他の装置のブロック図である。 一つの例示的な実施例にかかる動画ファイルに適用される、識別子を処理する装置のブロック図である。
ここで例示的な実施例について詳細に説明を行うが、その例示は図面において示されている。以下の説明が図面に関する場合、特に示さない限り、異なる図面の中の同一の数字は同一又は類似の要素を表す。また、以下の例示的な実施例で説明する実施形態は、本発明と一致する全ての実施形態を代表するものではなく、これらは特許請求の範囲において詳述した、本発明の一部の態様と一致する装置及び方法の例に過ぎない。
図1Aは一つの例示的な実施例にかかる動画ファイルの識別子を処理する方法のフローチャートであり、図1Bは一つの例示的な実施例1にかかる動画ファイル再生時の場面模式図である。動画ファイルの識別子を処理する該方法は動画端末(例えばスマートフォン、タブレットPC、スマートテレビ等)に適用することができ、例えば図1Aに示すように、該動画ファイルの識別子を処理する方法は以下のステップS101−S103を含む。
ステップS101において、動画ファイルを再生する操作コマンドを検出した場合、動画ファイルのフレーム画面においての検出区域を確定する。
一つの実施例において、フレーム画面は動画ファイルを再生する時のフレームごとの画像画面である。一つの実施例において、ユーザが選択された動画ファイルに対し再生操作を行う時、動画端末において動画ファイルの当該画面においての検出区域を確定することができる。他の実施例において、動画ファイルの内容提供業者はサーバにおいて該内容提供業者が所有する動画ファイルにおいての識別子の位置を検出して、識別子が置する検出区域を記録することができ、ユーザが動画ファイルを再生する必要がある時、動画ファイルのフレーム画面においての検出区域をサーバから取得することができる。検出区域はフレーム画面の画素位置を基に確定することができる。例えば図1Bは動画端末10により再生された解像度が480×360であるフレーム画面を表示しており、該フレーム画面における動画識別子は点線枠11内の「ABC」であり、該動画ファイルの検出区域は例えば点線枠11によって限定された矩形区域のように、フレーム画面における画素点[50、30]から画素点[70、51]によって限定された矩形区域である。
ステップS102において、検出区域において、再生する必要があるフレーム画面に動画識別子が存在するか否かを検出する。
一つの実施例において、検出区域における画像内容と所定の動画識別子マスクをマッチングすることで、フレーム画面に動画識別子が存在するか否かを確定することができる。他の実施例においては、画像認識方法(image recognition)に基づいてフレーム画面における画像内容について特徴認識することで、さらにフレーム画面に動画識別子が存在するか否かを確定することができる。
ステップS103において、動画識別子が存在する場合、検出区域のエッジ(edge)画素点の画素値に基づいて、フレーム画面における動画識別子を遮蔽する。
一つの実施例において、動画識別子が位置する検出区域のエッジ画素点を参考に、動画識別子が位置する画素点の画素値を修正して、修正後の画素値を対応する画素点において表示することで、遮蔽された動画識別子を比較的に自然にフレーム画面にマージ(Merge)させることができる。
本実施例において、ユーザは動画ファイルを再生する必要がある時、動画ファイルのフレーム画面においての検出区域を確定することで、フレーム画面全体に対して検出することを避け、動画識別子に対する遮蔽がより高い対応性を持ち、検出区域において、再生必要のあるフレーム画面に動画識別子が存在することが検出された場合、検出区域内において、検出区域のエッジ画素点の画素値に基づいて動画ファイルのフレーム画面における動画識別子を遮蔽し、ユーザが動画ファイル観賞する時の視覚的な見た目を向上させることができる。
一つの実施例において、動画ファイルのフレーム画面においての検出区域を確定するステップは、
動画ファイルについて所定数のフレームを確定するステップと、
所定数のフレームに基づいて、動画ファイルのフレーム画面においての検出区域を検出し、又は、
動画ファイルの関連情報をサーバに送信するステップと、
サーバからの、関連情報に基づいて確定した、動画ファイルのフレーム画面においての検出区域を受信するステップとを含むことができる。
一つの実施例において、所定数のフレームに基づいて、動画ファイルのフレーム画面においての検出区域を検出するステップは、
所定数のフレームの擬似区域(suspected area)を確定するステップと、
擬似区域内において、所定数のフレームに対しエッジ検出を行い、動画ファイルのフレーム画面においての検出区域を確定するステップとを含むことができる。
一つの実施例において、検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップは、
動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定するステップと、
それぞれの複数の識別子マスクを検出区域内の画像内容とマッチングし、所定数のマッチング結果を得るステップと、
所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定するステップと、
所定閾値より大きい場合、フレーム画面に動画識別子が存在することを確定するステップとを含むことができる。
一つの実施例において、検出区域のエッジ画素点の画素値に基づいて、フレーム画面における動画識別子を遮蔽するステップは、
検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、検出区域内のマスクの中心に位置する画素点の新たな画素値を確定するステップと、
新たな画素値に基づいてマスクの中心の画素点の元画素値を修正するステップと、
修正後の新たな画素値をフレーム画面に表示するステップとを含むことができる。
一つの実施例において、検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、検出区域内のマスクの中心に位置する画素点の新たな画素値を確定するステップにおいて、下記のような式を通じて検出区域のエッジ画素を確定する。
ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクBにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスクB内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表す。
一つの実施例において、方法は、
動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックス(preset box)で動画識別子を遮蔽するステップと、
検出区域が確定された後、検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行するステップとを更に含むことができる。
具体的に、如何に動画ファイルにおける動画識別子を遮蔽するかについては、後続の実施例を参考できる。
これまで、本発明の実施例が提供する上述の方法は、フレーム画面全体に対して検出することを避けることができ、動画識別子に対する遮蔽がより高い対応性を持ち、ユーザが動画ファイルを観賞する時の視覚的な見た目を向上させることができる。
下記において具体的な実施例で本発明の実施例が提供する技術案を説明する。
図2Aは一つの例示的な実施例1にかかる動画ファイルの識別子を処理する方法のフローチャートであり、図2Bは一つの例示的な実施例1にかかるステップS202のフローチャートであり、図2Cは一つの例示的な実施例1にかかる識別子ピラミッドの模式図であり、図2Dは一つの例示的な実施例1にかかる識別子ピラミッドを確定する方法のフローチャートである。本実施例は本発明の実施例が提供する上述の方法を利用して、動画端末のローカルにおいてフレーム画面における検出区域を検出する、及び識別子ピラミッドを通じて動画識別子を検出することを例として例示的な説明を行う。図2Aに示すように、下記のようなステップを含む。
ステップS201において、動画ファイルを再生する操作コマンドを検出した場合、動画ファイルについて所定数のフレームを確定する。
一つの実施例において、所定数は動画端末の計算能力によって決まることができる。動画端末が比較的に高い計算能力を有する場合、所定数を更に大きく設定することができ、検出区域の位置をより正確にすることができる。
ステップS202において、所定数のフレームに基づいて、動画ファイルのフレーム画面においての検出区域を検出する。
ステップS202の説明は図2Bの説明を参照することができ、ここでは繰り返し説明しない。
ステップS203において、動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定する。
識別子ピラミッドの説明は図2Cを参照することができ、ステップS203における識別子ピラミッドを確定する説明は図2Dの説明を参照することができ、ここでは繰り返し説明しない。
ステップS204において、複数の識別子マスクをそれぞれ検出区域内の画像内容とマッチングし、所定数のマッチング結果を得る。
図2Cに示すように、識別子マスクは4個で、該4個の識別子マスクは、例えは解像度が小さい方から大きい方の順番で50×50、100×50、200×100、200×200である等のような異なる解像度の大きさの動画識別子「ABC」に対応する。図2Cに示される識別子マスクの解像度は、マスクの大きさが異なることを例示的に説明することに過ぎず、識別子マスクは動画ファイルのフレーム画面の解像度及び動画識別子の大きさにより確定することができることを当業者は理解すべきである。本発明は識別子マスクの大きさを限定しない。
例えば、上述の4個の識別子マスクと図1Bに示されるフレーム画面における動画識別子「ABC」をマッチングすることを通じて、4個のマッチング結果を得ることができる。
ステップS205において、所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定する。
一つの実施例において、所定閾値は動画識別子に対する検出精度により確定されることができ、精度が比較的に高い場合、所定閾値を比較的に大きく設定でき、本発明は所定閾値の大きさを限定しない。
ステップS206において、所定閾値より大きい場合、フレーム画面に動画識別子が存在することを確定し、フレーム画面における動画識別子を遮蔽する。
一つの実施例において、フレーム画面における動画識別子を遮蔽する説明は上述のステップS103の説明を参照することができ、ここでは繰り返し説明しない。
以下では図2B乃至図2Dと併せて、上述のステップS201乃至ステップS203について例示的な説明を行う。
上述のステップS202において、所定数がMであることを例として説明を行い、図2Bに示すように、下記のようなステップを含む。
ステップS211において、M枚のフレームをM枚のグレースケールイメージに処理する。
動画ファイルにおいて、動画ファイルのフレームは通常カラー方式でユーザに表示する。画像処理の計算量を低減させるために、本発明はまずM枚のフレームをM枚のグレースケールイメージ(Grayscale images)に処理することができる。
ステップS212において、M枚のフレームの擬似区域を確定する。
一つの実施例において、例えば「ABC」内容提供業者が提供した動画ファイルは、その動画識別子はフレーム画面の左上に位置し、「DEF」内容提供業者が提供した動画ファイルは、その動画識別子がフレーム画面の右下に位置する等などのように、動画端末に記憶された動画識別子ベースを通じて擬似区域を確定することができる。擬似区域を通じて、フレーム画面における動画識別子の大よその位置を確定することができ、これによりフレーム画面全体において動画識別子を検出することを避け、動画識別子を検出する計算量を低減させることができる。
ステップS213において、擬似区域において、M枚のグレースケールイメージに対してエッジ検出を行い且つ加重平均した後、強化されたグレースケールイメージが得られる。
ステップS214において、該強化されたグレースケールイメージに対し二値化処理を行う。
ステップS215において、擬似区域において、二値化処理されたグレースケールイメージについて検出を行い、検出区域を得る。
上述のステップS211乃至ステップS215の処理を通じて、擬似区域の画像内容に対してのみグレースケールイメージ処理、加重平均、二値化等の処理を行うことで、検出区域を確定する計算量を大幅に低減することができる。
図2Dに示すように、ステップS202は下記のようなステップを含むことができる。
ステップS221において、内容提供業者が提供した動画ファイルの動画識別子を確定する時、該動画識別子に対応する識別子ピラミッドのマルチスケール画像(Multi−scale image)を確定する。
一つの実施例において、識別子ピラミッドのマルチスケール画像は複数の異なる解像度のマスクを含むことができる。例えば「ABC」内容提供業者が提供した動画ファイルにおいて、動画識別子「ABC」に対応する識別子ピラミッドのマルチスケール画像は50×50、100×50、200×100、200×200等の解像度のマスクを含み、「DEF」内容提供業者が提供した動画ファイルにおいて、動画識別子「DEF」に対応する識別子ピラミッドのマルチスケール画像は25×25、50×50、100×50、200×100等の解像度のマスクを含む。これから分かるように、本発明における異なる動画識別子にとって、対応する識別子ピラミッドのマルチスケール画像の解像度の大きさは異なる可能性もあり、本発明はこれを限定しない。
ステップS222において、マルチスケール画像に基づいて該動画識別子をズーム処理(Zoom)させる。
ステップS223において、マルチスケールにズーム処理された動画識別子を膨張させて、該動画識別子に対応する識別子ピラミッドを得る。
例えば、マルチスケールにズーム処理された動画識別子上の有効画素点はその周囲の1個の画素点の距離範囲内に向けて膨張され、該動画識別子に対応する一組の膨張された識別子ピラミッドを得ることができる。
本実施例において、ユーザは動画ファイルを再生する必要がある時、動画ファイルのフレーム画面においての擬似区域について画像処理を行いた後、検出により検出区域が得られ、大雑把から細かへの検出プロセスを実現し、フレーム画面全体に対して検出することを避け、動画識別子に対する遮蔽がより高い対応性を持つようにし、検出区域において、再生必要のあるフレーム画面に動画識別子が存在することを検出した場合、検出区域内において動画ファイルのフレーム画面における動画識別子を遮蔽し、ユーザが動画ファイルを観賞する時の視覚的な見た目を向上させることができる。
図3は一つの例示的な実施例2にかかる動画ファイルの識別子を処理する方法のフローチャートである。本実施例は本発明の実施例が提供する上述の方法を利用して、サーバにおいてフレーム画面における検出区域の取得及び如何に動画識別子を遮蔽するかを例として説明を行う。図3に示すように、下記のようなステップを含む。
ステップS301において、動画ファイルを再生する操作コマンドを検出した場合、動画ファイルの関連情報をサーバに送信する。
ステップS302において、サーバからの、関連情報に基づいて確定した、動画ファイルのフレーム画面においての検出区域を受信する。
上述のステップS301及びステップS302において、スマートテレビのメーカーは、ユーザのため動画ファイルを提供することを確定した後、それぞれの動画ファイルにおける動画識別子の位置を検出し、該動画識別子の位置をスマートテレビのメーカーのクラウドサーバに記憶させて、これにより動画端末が動画ファイルを再生する時に動画識別子の位置を検出することを避け、動画端末の計算の複雑度を低下させることができる。
ユーザはテレビを観賞し該動画ファイルを再生する時、該動画ファイルの関連情報をサーバに送信することができ、サーバは関連情報に基づいて該動画ファイルに関連する検出区域を確定する。一つの実施例において、関連情報は動画ファイルの内容提供業者の名称(例えば、ABC内容提供業者)、動画ファイルの出処情報(例えば、どの動画ウェブサイトから来たか)等などであってもよい。
ステップS303において、検出区域において、再生する必要があるフレーム画面に動画識別子が存在するか否かを検出する。
ステップS303の説明は上述のステップS203の説明を参照することができ、ここでは繰り返し説明しない。
ステップS304において、動画識別子が存在する場合、検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、検出区域内のマスクの中心に位置する画素点の新たな画素値を確定する。
ステップS305において、新たな画素値に基づいてマスクの中心の画素点の元画素値を修正する。
ステップS306において、修正後の新たな画素値をフレーム画面に表示する。
上述のステップS304乃至ステップS306において、一つの実施例において、検出区域を確定した後、例えば、検出区域の解像度の大きさは100×100に、マスク(mask)の大きさは5×5に設定され、まず検出区域のエッジ方向に沿ってマスクを移動させた後、マスクを通じて検出区域のエッジ画素点の新たな画素値を確定し、エッジ画素点の新たな画素値が確定された後、さらに検出区域の98×98のエッジ画素点に沿って同じ方法で98×98のエッジ画素点の新たな画素値を確定する。このように、検出区域内の全ての画素点の新たな画素値が確定されるまで、この方法で類推し、且つ検出区域内の新たな画素値を検出区域内に表示する。例えば、検出区域のエッジ画素点の新たな画素値を確定し終わった後、検出区域内における新たな画素値の未確定区域を98×98に縮小し、98×98の検出区域に対して、上記と類似する方法で解像度の大きさが98×98であるエッジ画素点の画素値を確定する。即ち、検出区域のエッジ画素点の新たな画素値を確定し、且つ検出区域の中心に向けて96×96に内向きに推し進め、さらに94×94にする、等のように、一歩一歩内向きに推し進める方法で検出区域をさらに縮小させ、検出区域における画素点の画素値を新たな画素値に修正し、動画識別子に対する遮蔽を実現する。
一つの実施例において、ステップ304は下記のような式を通じて検出区域のエッジ画素を確定することができる。
ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクBにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスクB内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表す。一つの実施例において、w(p、q)はp画素点に対するマスクB内のそれぞれの画素点の貢献度の大きさを限定するために使うことができ、w(p、q)はp、q画素点の距離に基づいて設定することも、p、q画素点の距離、p点におけるqの法線、切線方法距離を総合的に考慮して設定することもでき、本発明はこれを限定しない。
本実施例において、動画ファイルのフレーム画面においての検出区域をサーバから取得することで、動画端末のリアルタイム検出を避けることができ、動画端末の検出計算量を低下させると同時に、素早く動画識別子を位置決めすることができ、動画識別子と隣接する画素点を参考に、動画識別子が位置する画素点の画素値を修正して、修正後の画素値を対応する画素において表示することで、遮蔽された動画識別子を比較的に自然にフレーム画面にマージさせることができる。
図4は一つの例示的な実施例にかかる動画ファイルの識別子を処理する装置のブロック図である。図4に示すように、動画ファイルの識別子を処理する装置は、
動画ファイルを再生する操作コマンドを検出した場合、動画ファイルのフレーム画面においての検出区域を確定する第1確定モジュール41と、
第1確定モジュール41によって確定された検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出する検出モジュール42と、
検出モジュール42において動画識別子が存在すると検出された場合、フレーム画面における動画識別子を遮蔽する第1遮蔽モジュール43とを備える。
図5は一つの例示的な実施例にかかる動画ファイルの識別子を処理する他の装置のブロック図である。図5に示すように、上述の図5に示された実施例を基に、第1確定モジュール41は、
動画ファイルについて所定数のフレームを確定する第1確定サブモジュール411と、
第1確定サブモジュール411によって確定された所定数のフレームに基づいて、動画ファイルのフレーム画面においての検出区域を検出する第1検出サブモジュール412、又は、
動画ファイルの関連情報をサーバに送信する送信サブモジュール413と、
サーバからの、送信サブモジュール413によって送信された関連情報に基づいて確定した、動画ファイルのフレーム画面においての検出区域を受信する受信サブモジュール414とを有することができる。
一つの実施例において、第1検出サブモジュール412は、
所定数のフレームの擬似区域を確定する第2確定サブモジュール4121と、
擬似区域内において、第2確定サブモジュール4121によって確定された所定数のフレームに対しエッジ検出を行い、動画ファイルのフレーム画面においての検出区域を確定する第2検出サブモジュール4122とを有することができる。
一つの実施例において、検出モジュール42は、
動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定する第3確定サブモジュール421と、
第3確定モジュール421によって確定された複数の識別子マスクをそれぞれ検出区域内の画像内容とマッチングして、所定数のマッチング結果を得るマッチングサブモジュール422と、
マッチングサブモジュール422によって得られた所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定する第4確定サブモジュール423と、
第4確定モジュール423おいて所定数のマッチング結果における最大値が所定閾値より大きいと確定された場合、フレーム画面に動画識別子が存在することを確定する第5確定サブモジュール424とを有することができる。
一つの実施例において、第1遮蔽モジュール43は、
検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、検出区域内のマスクの中心に位置する画素点の新たな画素値を確定する画素確定サブモジュール431と、
画素確定サブモジュール431によって確定された新たな画素値に基づいてマスクの中心の画素点の元画素値を修正する画素修正サブモジュール432と、
画素修正サブモジュール432によって修正された新たな画素値をフレーム画面において表示する表示サブモジュール433とを有することができる。
一つの実施例において、画素確定サブモジュール432は下記のような式を通じて検出区域のエッジ画素を確定する。
ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクBにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスクB内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表す。
一つの実施例において、装置は、更に
第1確定モジュール41が動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで動画識別子を遮蔽する第2遮蔽モジュール44を備えることができ、
第1確定モジュール41によって検出区域が確定された後、検出モジュール42は、検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行する。
上述の実施例における装置に関しては、それぞれのモジュールが操作を実行する具体的な方法は既に関連する実施例において詳細な説明を行っており、ここでは繰り返し説明しない。
図6は一つの例示的な実施例にかかる動画ファイルに適用される、識別子を処理する装置のブロック図である。例えば、装置600は、携帯電話、コンピューター、デジタル放送端末、メッセージ送受信デバイス、ゲームコンソール、タブレットデバイス、医療デバイス、フィットネス設備、パーソナルデジタルアシスタント等であってもよい。
図6を参照して、装置600は、プロセス部材602、メモリ604、電源部材606、マルチメディア部材608、オーディオ部材610、入出力(I/O)インターフェイス612、センサ部材614、及び通信部材616のような一つ以上の部材を含んでよい。
プロセス部材602は、一般的には装置600の全体の操作を制御するものであり、例えば、表示、電話呼び出し、データ通信、カメラ操作、及び記録操作と関連する操作を制御する。プロセス部材602は、一つ以上のプロセッサ620を含み、これらによって命令を実行することにより、上記の方法の全部、或いは一部のステップを実現するようにしてもよい。なお、プロセス部材602は、一つ以上のモジュールを含み、これらによってプロセス部材602と他の部材の間のインタラクションを容易にするようにしてもよい。例えば、プロセス部材602は、マルチメディアモジュールを含み、これらによってマルチメディア部材608とプロセス部材602の間のインタラクションを容易にするようにしてもよい。
メモリ604は、各種類のデータを記憶することにより装置600の操作を支援するように構成される。これらのデータの例は、装置600において操作されるいずれのアプリケーションプログラム又は方法の命令、連絡対象データ、電話帳データ、メッセージ、画像、ビデオ等を含む。メモリ604は、いずれの種類の揮発性、不揮発性記憶デバイスまたはそれらの組み合わせによって実現されてもよく、例えば、SRAM(Static Random Access Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、EPROM(Erasable Programmable ROM)、PROM(Programmable ROM)、ROM、磁気メモリ、フラッシュメモリ、磁気ディスク、或いは光ディスクである。
電源部材606は、装置600の多様な部材に電力を供給する。電源部材606は、電源管理システム、一つ以上の電源、及び装置600のための電力の生成、管理及び割り当てに関連する他の部材を含んでもよい。
マルチメディア部材608は、前記装置600とユーザの間に一つの出力インターフェイスを提供するスクリーンを含む。上記の実施例において、スクリーンは液晶モニター(LCD)とタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含むことにより、スクリーンはタッチスクリーンを実現することができ、ユーザからの入力信号を受信することができる。タッチパネルは一つ以上のタッチセンサを含んでおり、タッチ、スライド、及びタッチパネル上のジェスチャを検出することができる。前記タッチセンサは、タッチ、或いはスライドの動作の境界だけでなく、前記のタッチ、或いはスライド操作に係る継続時間及び圧力も検出できる。上記の実施例において、マルチメディア部材608は、一つのフロントカメラ、及び/又はリアカメラを含む。装置600が、例えば撮影モード、或いはビデオモード等の操作モードにある場合、フロントカメラ、及び/又はリアカメラは外部からマルチメディアデータを受信できる。フロントカメラとリアカメラのそれぞれは、一つの固定型の光レンズ系、或いは可変焦点距離と光学ズーム機能を有するものであってもよい。
オーディオ部材610は、オーディオ信号を入出力するように構成されてもよい。例えば、オーディオ部材610は、一つのマイク(MIC)を含み、装置600が、例えば呼出しモード、記録モード、及び音声認識モード等の操作モードにある場合、マイクは外部のオーディオ信号を受信することができる。受信されたオーディオ信号は、さらにメモリ604に記憶されたり、通信部材616を介して送信されたりされる。上記の実施例において、オーディオ部材610は、オーディオ信号を出力するための一つのスピーカーをさらに含む。
I/Oインターフェイス612は、プロセス部材602と周辺インターフェイスモジュールの間にインターフェイスを提供するものであり、上記周辺インターフェイスモジュールは、キーボード、クリックホイール、ボタン等であってもよい。これらのボタンは、ホームページボタン、ボリュームボタン、起動ボタン、ロッキングボタンを含んでもよいが、これらに限定されない。
センサ部材614は、装置600に各方面の状態に対する評価を提供するための一つ以上のセンサを含む。例えば、センサ部材614は、装置600のON/OFF状態、装置600のディスプレイと小さなキーパッドのような部材の相対的な位置決めを検出できる。また、例えば、センサ部材614は、装置600、或いは装置600の一つの部材の位置変更、ユーザと装置600とが接触しているか否か、装置600の方位、又は加速/減速、装置600の温度の変化を検出できる。センサ部材614は、何れの物理的接触がない状態にて付近の物体の存在を検出するための近接センサを含んでもよい。センサ部材614は、撮影アプリケーションに適用するため、CMOS、又はCCDイメージセンサのような光センサを含んでもよい。上記の実施例において、当該センサ部材614は、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ、及び温度センサをさらに含んでもよい。
通信部材616は、装置600と他の機器の間に有線、又は無線形態の通信を提供する。装置600は、例えばWiFi(登録商標)、2G、3G、或いはこれらの組み合わせのような、通信規格に基づいた無線ネットワークに接続されてもよい。一つの例示的な実施例において、通信部材616は、放送チャンネルを介して外部の放送管理システムからの放送信号、又は放送に関連する情報を受信する。一つの例示的な実施例において、前記通信部材616は、近距離無線通信(NFC)モジュールをさらに含むことにより、近距離通信を推進するようにする。例えば、NFCモジュールは、RFID(Radio Frequency Identification)技術、IrDA(Infrared Data Association)技術、UWB(Ultra WideBand)技術、BT(Bluetooth(登録商標))技術、他の技術に基づいて実現できる。
例示的な実施例において、装置600は、一つ以上のASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、DSPD(Digital Signal Processing Device)、PLD(Programmable Logic Device)、FPGA(Field-Programmable Gate Array)、コントローラ、マイクロコントローラ、マイクロプロセッサ、または他の電子部品によって実現されるものであり、上記方法を実行する。
例示的な実施例において、さらに、命令を含むコンピュータ読取り可能な非一時的な記録媒体、例えば命令を含むメモリ604を提供しており、装置600のプロセッサ620により上記命令を実行して上記方法を実現する。例えば、前記コンピュータ読取り可能な非一時的な記録媒体は、ROM、RAM、CD-ROM(登録商標)、磁気テープ、フロッピーディスク、光データ記憶デバイス等である。
当業者は明細書を検討し、ここで開示した発明を実践した後、本発明のその他の実施方案を容易に思いつくことができる。本願は本発明の全ての変更、用途又は適応性の変化を含む。これらの変更、用途又は適応性の変化は本発明の一般的な原理に基づいており、本発明に未開示の本技術分野における周知技術又は慣用技術手段を含む。明細書及び実施例は例示的なものに過ぎず、本発明の真の範囲及び主旨は以下の特許請求の範囲によって示される。
本発明は、上記で説明した、また図面において示した寸分違わぬ構成に限定されず、その範囲を逸脱しない前提のもとで種々の変更及び修正を行うことができることを理解すべきである。本発明の範囲は付された特許請求の範囲によってのみ限定される。

Claims (15)

  1. 動画端末に適用される、動画ファイルの識別子を処理する方法であって、
    動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定するステップと、
    前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップと、
    前記動画識別子が存在する場合、前記検出区域のエッジ画素点の画素値に基づいて、前記動画識別子を遮蔽するステップとを含み、
    更に、前記動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで前記動画識別子を遮蔽するステップと、
    前記検出区域が確定された後、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行するステップとを含むことを特徴とする動画ファイルの識別子を処理する方法。
  2. 前記動画ファイルのフレーム画面においての検出区域を確定するステップは、
    前記動画ファイルについて所定数のフレームを確定するステップと、
    前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出するか、又は、
    前記動画ファイルの関連情報をサーバに送信するステップと、
    前記サーバからの、前記関連情報に基づいて確定した、前記動画ファイルのフレーム画面においての検出区域を受信するステップとを含むことを特徴とする請求項1に記載の動画ファイルの識別子を処理する方法。
  3. 前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出するステップは、
    前記所定数のフレームの擬似区域を確定するステップと、
    前記擬似区域内において、前記所定数のフレームに対しエッジ検出を行い、前記動画ファイルのフレーム画面においての検出区域を確定するステップとを含むことを特徴とする請求項2に記載の動画ファイルの識別子を処理する方法。
  4. 前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップは、
    前記動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定するステップと、
    前記複数の識別子マスクをそれぞれ前記検出区域内の画像内容とマッチングし、所定数のマッチング結果を得るステップと、
    前記所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定するステップと、
    前記所定閾値より大きい場合、フレーム画面に動画識別子が存在することを確定するステップとを含むことを特徴とする請求項1に記載の動画ファイルの識別子を処理する方法。
  5. 前記検出区域のエッジ画素点の画素値に基づいて、前記動画識別子を遮蔽するステップは、
    前記検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の前記マスクの中心に位置する画素点の新たな画素値を確定するステップと、
    前記新たな画素値に基づいて前記マスクの中心の画素点の元画素値を修正するステップと、
    修正後の前記新たな画素値を前記フレーム画面において表示するステップとを含むことを特徴とする請求項1に記載の動画ファイルの識別子を処理する方法。
  6. 前記検出区域のエッジ方向に沿って、且つ前記所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の画素値を確定するステップにおいて、下記のような式を通じて前記検出区域のエッジ画素を確定し、
    ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスク内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表すことを特徴とする請求項5に記載の動画ファイルの識別子を処理する方法。
  7. 動画端末に適用される、動画ファイルの識別子を処理する装置であって、
    動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定する第1確定モジュールと、
    前記第1確定モジュールによって確定された前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出する検出モジュールと、
    前記検出モジュールにおいて前記動画識別子が存在すると検出された場合、前記検出区域のエッジ画素点の画素値に基づいて、前記フレーム画面における前記動画識別子を遮蔽する第1遮蔽モジュールとを備え、
    更に、前記第1確定モジュールが前記動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで前記動画識別子を遮蔽する第2遮蔽モジュールを備え、
    前記第1確定モジュールによって前記検出区域が確定された後、前記検出モジュールは、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行することを特徴とする動画ファイルの識別子を処理する装置。
  8. 前記第1確定モジュールは、
    前記動画ファイルについて所定数のフレームを確定する第1確定サブモジュールと、
    前記第1確定サブモジュールによって確定された前記所定数のフレームに基づいて、前記動画ファイルのフレーム画面においての検出区域を検出する第1検出サブモジュール、又は、
    前記動画ファイルの関連情報をサーバに送信する送信サブモジュールと、
    前記サーバからの、前記送信サブモジュールによって送信された前記関連情報に基づいて確定した、前記動画ファイルのフレーム画面においての検出区域を受信する受信サブモジュールとを有することを特徴とする請求項7に記載の動画ファイルの識別子を処理する装置。
  9. 前記第1検出サブモジュールは、
    前記所定数のフレームの擬似区域を確定する第2確定サブモジュールと、
    前記擬似区域内において、前記第2確定サブモジュールによって確定された前記所定数のフレームに対しエッジ検出を行い、これにより前記動画ファイルのフレーム画面においての検出区域を確定する第2検出サブモジュールとを有することを特徴とする請求項8に記載の動画ファイルの識別子を処理する装置。
  10. 前記検出モジュールは、
    前記動画ファイルの、複数の識別子マスクを含む識別子ピラミッドを確定する第3確定サブモジュールと、
    前記第3確定サブモジュールによって確定されたそれぞれの前記複数の識別子マスクを前記検出区域内の画像内容とマッチングして、所定数のマッチング結果を得るマッチングサブモジュールと、
    前記マッチングサブモジュールによって得られた前記所定数のマッチング結果における最大値が所定閾値より大きいか否かを確定する第4確定サブモジュールと、
    前記第4確定サブモジュールにおいて前記所定数のマッチング結果における最大値が所定閾値より大きいと確定された場合、フレーム画面に動画識別子が存在することを確定する第5確定サブモジュールとを有することを特徴とする請求項7に記載の動画ファイルの識別子を処理する装置。
  11. 前記第1遮蔽モジュールは、
    前記検出区域のエッジ方向に沿って、且つ所定大きさのマスクの中心方向に向けて、所定大きさのマスク内の既知画素値を基に、前記検出区域内の前記マスクの中心に位置する画素点の新たな画素値を確定する画素確定サブモジュールと、
    前記画素確定サブモジュールによって確定された前記新たな画素値に基づいて前記マスクの中心の画素点の元画素値を修正する画素修正サブモジュールと、
    前記画素修正サブモジュールによって修正された前記新たな画素値を前記フレーム画面において表示する表示サブモジュールとを有することを特徴とする請求項7に記載の動画ファイルの識別子を処理する装置。
  12. 前記画素確定サブモジュールは下記のような式を通じて前記検出区域のエッジ画素を確定し、

    ここで、pは画素値が修正される必要がある現在の画素点を表し、前記マスクの中心に位置し、qは前記所定大きさのマスクにおける既知画素点を表し、I(p)は前記現在の画素点に対応する修正後の画素値を表し、I(q)は前記マスク内の画素値既知の画素点の画素値を表し、w(p、q)は加重値を表し、▽I(q)は前記既知画素点の勾配値を表すことを特徴とする請求項11に記載の動画ファイルの識別子を処理する装置。
  13. プロセッサと、
    プロセッサが実行可能なコマンドを記憶するためのメモリとを備え、
    前記プロセッサは、
    動画ファイルを再生する操作コマンドを検出した場合、前記動画ファイルのフレーム画面においての検出区域を確定し、
    前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出し、
    前記動画識別子が存在する場合、前記検出区域のエッジ画素点の画素値に基づいて、前記フレーム画面における前記動画識別子を遮蔽するように構成されており、
    更に、前記動画ファイルのフレーム画面においての検出区域を確定できない場合、所定ボックスで前記動画識別子を遮蔽するステップと、
    前記検出区域が確定された後、前記検出区域において、再生必要のあるフレーム画面に動画識別子が存在するか否かを検出するステップを実行するように構成されることを特徴とする動画ファイルの識別子を処理する装置。
  14. プロセッサに実行されることにより、請求項1から請求項6のいずれかに記載の動画ファイルの識別子を処理する方法を実現する記録媒体に記録されたプログラム。
  15. 請求項14に記載のプログラムが記録された記録媒体。
JP2017521284A 2015-05-29 2015-11-20 動画ファイルの識別子を処理する方法、装置、プログラム及び記録媒体 Active JP6336206B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510290508.4 2015-05-29
CN201510290508.4A CN104918107B (zh) 2015-05-29 2015-05-29 视频文件的标识处理方法及装置
PCT/CN2015/095145 WO2016192325A1 (zh) 2015-05-29 2015-11-20 视频文件的标识处理方法及装置

Publications (2)

Publication Number Publication Date
JP2017526316A JP2017526316A (ja) 2017-09-07
JP6336206B2 true JP6336206B2 (ja) 2018-06-06

Family

ID=54086748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017521284A Active JP6336206B2 (ja) 2015-05-29 2015-11-20 動画ファイルの識別子を処理する方法、装置、プログラム及び記録媒体

Country Status (8)

Country Link
US (1) US9924226B2 (ja)
EP (1) EP3099075B1 (ja)
JP (1) JP6336206B2 (ja)
KR (1) KR101755412B1 (ja)
CN (1) CN104918107B (ja)
MX (1) MX358591B (ja)
RU (1) RU2625340C1 (ja)
WO (1) WO2016192325A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104918107B (zh) 2015-05-29 2018-11-02 小米科技有限责任公司 视频文件的标识处理方法及装置
WO2017088478A1 (zh) * 2015-11-24 2017-06-01 乐视控股(北京)有限公司 数字分离方法及装置
CN105611373B (zh) * 2015-12-23 2019-03-08 小米科技有限责任公司 视频图像处理方法及装置
CN105611386A (zh) * 2015-12-23 2016-05-25 小米科技有限责任公司 视频图像处理方法及装置
CN105611380A (zh) * 2015-12-23 2016-05-25 小米科技有限责任公司 视频图像处理方法及装置
CN105872591A (zh) * 2016-04-22 2016-08-17 北京小米移动软件有限公司 图标覆盖方法及装置
CN109429084B (zh) * 2017-08-24 2022-03-29 北京搜狗科技发展有限公司 视频处理方法和装置、用于视频处理的装置
CN110324704A (zh) * 2018-03-29 2019-10-11 优酷网络技术(北京)有限公司 视频处理方法及装置
CN108535287B (zh) * 2018-03-29 2020-09-15 多科智能装备(常熟)有限公司 基于X-Ray成像技术异物检测系统、方法以及装置
CN109670576B (zh) * 2018-11-29 2022-09-13 中山大学 一种多尺度视觉关注图像描述方法
CN111292227A (zh) * 2018-12-07 2020-06-16 北京字节跳动网络技术有限公司 图像处理方法和装置
CN111010606B (zh) * 2019-12-12 2022-02-15 北京金山云网络技术有限公司 视频处理方法和装置
CN111988672A (zh) * 2020-08-13 2020-11-24 北京达佳互联信息技术有限公司 视频处理方法、装置、电子设备和存储介质

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350095A (ja) * 1999-06-08 2000-12-15 Yamaha Corp 映像処理装置
JP4095336B2 (ja) * 2002-05-13 2008-06-04 日本放送協会 原画像復元装置、及び原画像復元プログラム
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
JP2006148263A (ja) * 2004-11-16 2006-06-08 Ntt Communications Kk テロップ消去方法、テロップ消去装置、及びテロップ消去プログラム
US7599558B2 (en) * 2005-08-24 2009-10-06 Mavs Lab. Inc. Logo processing methods and circuits
US8493510B2 (en) * 2006-12-12 2013-07-23 Time Warner Inc. Method and apparatus for concealing portions of a video screen
KR101460610B1 (ko) * 2008-07-30 2014-11-13 삼성전자주식회사 색수차 제거 방법 및 장치
CN101739561B (zh) * 2008-11-11 2012-06-13 中国科学院计算技术研究所 一种电视台标训练方法和识别方法
US8175413B1 (en) * 2009-03-05 2012-05-08 Google Inc. Video identification through detection of proprietary rights logos in media
EP2452310A1 (en) * 2009-07-06 2012-05-16 Koninklijke Philips Electronics N.V. Retargeting of image with overlay graphic
CN101950366A (zh) * 2010-09-10 2011-01-19 北京大学 一种台标检测和识别的方法
KR101214515B1 (ko) 2010-12-08 2013-01-09 주식회사 아이플래테아코리아 방송콘텐츠의 부가정보 제공 시스템 및 그 방법
KR101195978B1 (ko) * 2010-12-08 2012-10-30 서강대학교산학협력단 동영상에 포함된 오브젝트를 처리하는 방법 및 장치
US8396302B2 (en) * 2011-01-11 2013-03-12 Intel Corporation Method of detecting logos, titles, or sub-titles in video frames
JPWO2012176931A1 (ja) * 2011-06-23 2015-02-23 日本電気株式会社 映像処理システム、広告取得方法、映像処理装置、および、その制御方法
CN102281384A (zh) * 2011-07-11 2011-12-14 成都索贝数码科技股份有限公司 用于图像遗弃区域遮蔽方法、装置及视频处理方法、系统
RU2450342C1 (ru) * 2011-08-01 2012-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Южно-Российский государственный университет экономики и сервиса" (ФГБОУ ВПО "ЮРГУЭС") Устройство для восстановления изображений
CN102426647B (zh) * 2011-10-28 2014-03-12 Tcl集团股份有限公司 一种台标识别的方法、装置
US20130182184A1 (en) * 2012-01-13 2013-07-18 Turgay Senlet Video background inpainting
JP6193993B2 (ja) * 2012-07-16 2017-09-06 エルジー エレクトロニクス インコーポレイティド デジタルサービス信号処理方法及び装置
EP2709038A1 (en) * 2012-09-17 2014-03-19 Thomson Licensing Device and method for detecting the presence of a logo in a picture
JP5882883B2 (ja) * 2012-12-03 2016-03-09 日本電信電話株式会社 テロップ検出装置、テロップ検出方法及びテロップ検出プログラム
US9058522B2 (en) 2013-03-15 2015-06-16 Arris Technology, Inc. Logo presence detection based on blending characteristics
US9785852B2 (en) * 2013-11-06 2017-10-10 Xiaomi Inc. Method, TV set and system for recognizing TV station logo
CN103634652B (zh) * 2013-11-06 2017-06-16 小米科技有限责任公司 台标识别方法、装置、电视机和系统
US9552530B2 (en) * 2013-11-15 2017-01-24 Samsung Electronics Co., Ltd. Method and system to detect objects in multimedia using non-textural information within segmented region
KR101494874B1 (ko) * 2014-05-12 2015-02-23 김호 사용자 인증 방법, 이를 실행하는 장치 및 이를 저장한 기록 매체
CN104023249B (zh) * 2014-06-12 2015-10-21 腾讯科技(深圳)有限公司 电视频道识别方法和装置
CN104918107B (zh) * 2015-05-29 2018-11-02 小米科技有限责任公司 视频文件的标识处理方法及装置

Also Published As

Publication number Publication date
EP3099075B1 (en) 2019-12-04
JP2017526316A (ja) 2017-09-07
US9924226B2 (en) 2018-03-20
MX2016005071A (es) 2017-03-07
EP3099075A1 (en) 2016-11-30
KR101755412B1 (ko) 2017-07-26
MX358591B (es) 2018-08-24
RU2625340C1 (ru) 2017-07-13
WO2016192325A1 (zh) 2016-12-08
US20160353167A1 (en) 2016-12-01
CN104918107B (zh) 2018-11-02
CN104918107A (zh) 2015-09-16

Similar Documents

Publication Publication Date Title
JP6336206B2 (ja) 動画ファイルの識別子を処理する方法、装置、プログラム及び記録媒体
US9674395B2 (en) Methods and apparatuses for generating photograph
CN109784255B (zh) 神经网络训练方法及装置以及识别方法及装置
JP6134446B2 (ja) 画像分割方法、画像分割装置、画像分割デバイス、プログラム及び記録媒体
EP3179711B1 (en) Method and apparatus for preventing photograph from being shielded
JP6392991B2 (ja) 画像による空間パラメータ特定方法、装置、プログラム、記録媒体および端末機器
US20170178289A1 (en) Method, device and computer-readable storage medium for video display
CN107888984B (zh) 短视频播放方法及装置
US11216904B2 (en) Image processing method and apparatus, electronic device, and storage medium
JP6208379B2 (ja) 事項内容表示方法、装置、プログラム、及び記録媒体
EP2975574B1 (en) Method, apparatus and terminal for image retargeting
EP3147802B1 (en) Method and apparatus for processing information
US20180144546A1 (en) Method, device and terminal for processing live shows
CN106792255B (zh) 视频播放窗口框体显示方法及装置
CN108174269B (zh) 可视化音频播放方法及装置
CN107219989B (zh) 图标处理方法、装置及终端
US11600300B2 (en) Method and device for generating dynamic image
US9665925B2 (en) Method and terminal device for retargeting images
CN113660531A (zh) 视频处理方法及装置、电子设备和存储介质
US11410268B2 (en) Image processing methods and apparatuses, electronic devices, and storage media
CN114489549A (zh) 投屏图像处理方法、装置、电子设备及存储介质
CN109389547B (zh) 图像显示方法及装置
CN110876015B (zh) 确定图像分辨率的方法及装置、电子设备及存储介质
CN113626632B (zh) 影集素材的显示方法、装置及电子设备
CN110876013B (zh) 确定图像分辨率的方法及装置、电子设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180501

R150 Certificate of patent or registration of utility model

Ref document number: 6336206

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250