JP7331146B2

JP7331146B2 - サブタイトルのクロスボーダーの処理方法、装置及び電子装置

Info

Publication number: JP7331146B2
Application number: JP2021571922A
Authority: JP
Inventors: 永晨 ▲盧▼
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2019-06-06
Filing date: 2020-06-03
Publication date: 2023-08-22
Anticipated expiration: 2040-06-03
Also published as: CN110177295B; CN110177295A; US11924520B2; US20220248102A1; JP2022535549A; WO2020244553A1

Description

（関連出願への相互参照）
本願は、２０１９年０６月０６日に出願し、出願番号が２０１９１０４９３５４８．７であり、発明の名称が「サブタイトルのクロスボーダーの処理方法、装置及び電子装置」である中国特許出願の優先権を主張し、その出願の全文を本願に組み込む。

この発明の実施例は、画像処理の技術分野に属し、特に、サブタイトルのクロスボーダーの処理方法、装置及び電子装置に関するものである。

通信技術が発展することによりいろいろな端末装置、例えばスマートフォン、タブレット、ノートブックコンピューター等が現れている。そのような端末装置は我々の生活で重要な役割をしている。

従来の端末装置は娯楽機能を具備している。スマートフォン、タブレット等のような端末装置はマルチメディア・ファイル、例えばビデオ、オーディオ等を再生することができる。ビデオには通常、サブタイトルが設けられている。サブタイトルの位置は固定されていないので、サブタイトルをビデオ中のいずれかの位置に位置させることができる。ユーザが入手したビデオ画像を端末装置に送信して再生するとき、ビデオ画像のサイズと端末装置の表示パネルのサイズが合わないと、サブタイトルのクロスボーダーが生じることによりサブタイトルの一部分が表示パネルの外部に表示されるので、ビデオの鑑賞に影響を与えるおそれがある。図１に示すとおり、前記サブタイトルのクロスボーダーが生じる一例において、ビデオ画像には「我是中国人」というサブタイトルが表示されている。ビデオ画像のサイズが前記端末装置の表示パネルのサイズより大きい場合、サブタイトルの一部分は表示パネルの外部に表示されるが、端末装置はその状況を検出することができない。すなわち表示パネルには「我」の一部分のみが表示されているので、ビデオの鑑賞に影響を与え得る。従来の技術において、端末装置の表示パネルにサブタイトルのクロスボーダーが生じるかをユーザが判断する必要がある。サブタイトルのクロスボーダーが生じた場合、表示パネルの解像度を調節するか或いはサブタイトルのサイズまたはビデオのサイズを調節することにより前記問題を解決することができるが、使用上の利便性がよくないという欠点を有している。

本発明の実施例において下記サブタイトルのクロスボーダーの処理方法を提供する。前記サブタイトルのクロスボーダーの処理方法は、
端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップと、
前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップと、
前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップと、
前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップと、
前記合成フレームに文字が含まれているかを検出するステップと、
前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップとを含む。

前記サブタイトルのクロスボーダーの処理方法は、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させることを更に含む。

前記端末の表示装置のサイズ情報を獲得するステップは前記端末のディスプレイ属性を獲得することを含み、前記サイズ情報は前記表示装置のサイズを指し、前記ディスプレイ属性は表示装置の高さ及び幅を含む。

前記サイズ情報に従って安全区域を形成するステップは、第一パーセンテージにより前記安全区域の幅を計算することと／或いは第二パーセンテージにより前記安全区域の高さを計算することを含み、
前記安全区域は前記表示装置のサイズより小さいか或いは等しく、前記第一パーセンテージは前記安全区域の幅が前記表示装置の幅に占めるパーセンテージであり、前記第二パーセンテージは前記安全区域の高さが前記表示装置の高さに占めるパーセンテージである。

前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップは、前記端末が再生するビデオ画像において前記ビデオ画像中の少なくとも１個のビデオフレームをランダムに抽出するか或いは、前記ビデオ画像中の所定のビデオフレームを抽出することを含み、前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームである。

前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップは、
前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算することと、
前記インターセプト距離に従って前記ビデオフレームの幅方向と／或いは高さ方向においてフレームセグメントをインターセプトすることと、
前記幅方向のフレームセグメントを結合させることにより合成フレームを形成することと／或いは、
前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成することとを含む。

前記合成フレームに文字が含まれているかを検出するステップは、
前記合成フレームを文字判断モデルに入力することと、
前記文字判断モデルの出力により前記合成フレームに文字が含まれているかを判断することとを含む。

前記文字判断モデルは畳み込みニューラルネットワークのトレーニングにより獲得するものであり、分類標識がついているトレーニング・セットを前記畳み込みニューラルネットワークに入力し、前記畳み込みニューラルネットワークの出力結果を検出することにより前記畳み込みニューラルネットワークを前記文字判断モデルにトレーニングする。

前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップは、前記合成フレームに文字が含まれていると、前記ビデオ画像中のサブタイトルが前記ビデオ画像の幅方向と／或いは高さ方向の境界線を越えたと判断することを含む。

前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させるステップは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させるか或いは、前記ビデオ画像のサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させることを含む。

本発明の実施例において下記サブタイトルのクロスボーダーの処理装置を提供する。前記サブタイトルのクロスボーダーの処理装置は、
端末の表示装置のサイズ情報を獲得するサイズ獲得モジュールであって、前記サイズ情報は前記表示装置のサイズを指すサイズ獲得モジュールと、
前記サイズ情報に従って安全区域を形成する安全区域形成モジュールであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しい安全区域形成モジュールと、
前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するビデオフレーム抽出モジュールと、
前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するフレーム合成モジュールと、
前記合成フレームに文字が含まれているかを検出する文字検出モジュールと、
前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するクロスボーダー判断モジュールとを含む。

前記サブタイトルのクロスボーダーの処理装置はサイズ減少モジュールを更に含む。前記サイズ減少モジュールは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させることに用いられる。

前記サイズ獲得モジュールはディスプレイ属性獲得モジュールを更に含み、前記ディスプレイ属性獲得モジュールは前記端末のディスプレイ属性を獲得することに用いられる。前記ディスプレイ属性は表示装置の高さ及び幅を含む。

前記安全区域形成モジュールは、第一パーセンテージにより前記安全区域の幅を計算する安全区域幅計算モジュールと／或いは第二パーセンテージにより前記安全区域の高さを計算する安全区域高さ計算モジュールを更に含む。前記第一パーセンテージは前記安全区域の幅が前記表示装置の幅に占めるパーセンテージであり、前記第二パーセンテージは前記安全区域の高さが前記表示装置の高さに占めるパーセンテージである。

前記ビデオフレーム抽出モジュールは前記端末が再生するビデオ画像において前記ビデオ画像中の少なくとも１個のビデオフレームをランダムに抽出するか或いは、前記ビデオ画像中の所定のビデオフレームを抽出することに用いられる。前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームである。

前記フレーム合成モジュールは、
前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算するインターセプト距離計算モジュールと、
前記インターセプト距離に従って前記ビデオフレームの幅方向と／或いは高さ方向においてフレームセグメントをインターセプトするフレームセグメント・インターセプトモジュールと、
前記幅方向のフレームセグメントを結合させることにより合成フレームを形成することと／或いは前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成する合成モジュールとを更に含む。

前記文字検出モジュールは、前記合成フレームを文字判断モデルに入力する入力モジュールと、前記文字判断モデルの出力により前記合成フレームに文字が含まれているかを判断する判断モジュールとを更に含む。前記文字判断モデルは畳み込みニューラルネットワークのトレーニングにより獲得するものであり、分類標識がついているトレーニング・セットを前記畳み込みニューラルネットワークに入力し、前記畳み込みニューラルネットワークの出力結果を検出することにより前記畳み込みニューラルネットワークを前記文字判断モデルにトレーニングする。

前記クロスボーダー判断モジュールは、前記合成フレームに文字が含まれていると、前記ビデオ画像中のサブタイトルが前記ビデオ画像の幅方向と／或いは高さ方向の境界線を越えた（クロスボーダー）と判断するクロスボーダータイプ判断モジュールを更に含む。

前記サイズ減少モジュールは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させるか或いは、前記ビデオ画像のサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させることにも用いられる。

本発明の実施例において電子装置を提供する。その電子装置は記憶装置と処理装置を含む。前記記憶装置は非一時的コンピュータ読み取り可能命令を記憶することに用いられる。前記処理装置は前記記憶装置に記憶されている非一時的コンピュータ読み取り可能命令を実行することにより前記いずれか一項のサブタイトルのクロスボーダーの処理方法のステップを実施する。

本発明の実施例においてコンピュータ読み取り可能記憶媒体を提供する。前記コンピュータ読み取り可能記憶媒体には非一時的コンピュータ読み取り可能命令が記憶されており、前記非一時的コンピュータ読み取り可能命令がコンピュータに実行されることにより、前記コンピュータは前記いずれか一項のサブタイトルのクロスボーダーの処理方法を実施する。

本発明の実施例において、サブタイトルのクロスボーダーの処理方法、装置及び電子装置を提供する。前記サブタイトルのクロスボーダーの処理方法は、端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップと、前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップと、前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップと、前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップと、前記合成フレームに文字が含まれているかを検出するステップと、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップとを含む。本発明の実施例において、サブタイトルのクロスボーダーの処理方法は、安全区域を形成しかつ安全区域の境界線を越えたフレームセグメントに文字が含まれているかを判断することにより、従来の技術においてユーザがサブタイトルのクロスボーダーが生じたかを手動で検出する必要がある技術的問題を解決することができる。

以上、本発明の技術的事項の概要を説明してきたが、本発明の技術的特徴をより詳細に理解し、下記明細書により本発明の実施例を実施し、かつ本発明に係る技術的特徴、発明の効果及び目的をより詳細に理解してもらうため、以下、本発明の好適な実施例と図面により本発明を詳細に説明する。

従来の技術においてサブタイトルが表示パネルの境界線を越えていることを示す図である。本発明の実施例に係るサブタイトルのクロスボーダーの処理方法を示す流れ図である。本発明の実施例に係るフレームセグメントの計算に用いられるインターセプト距離を示す図である。本発明の実施例に係る合成フレームを示す図である。本発明の実施例に係るサブタイトルのクロスボーダーの処理方法を示す流れ図である。本発明の実施例に係るサブタイトルのクロスボーダーの処理装置の構造を示す図である。本発明の実施例に係る電子装置の構造を示す図である。

以下、具体的な実施例により本発明の技術的事項を詳細に説明する。この技術分野の技術者は下記実施例の内容により本発明の特徴と発明の効果を容易に理解することができる。下記実施例は、本発明の一部分の実施例にしか過ぎないものであり、本発明のすべての実施例を示すものでない。本発明は下記実施例以外の他の実施例により実施され、本発明の要旨を逸脱しない範囲内においてこの明細書中の各事項をいろいろな分野に用いることができる。また、本発明の要旨を逸脱しない範囲内においていろいろな設計の変更、改良等をすることができ、それらがあっても本発明に含まれることは勿論である。注意されたいことは、複数個の実施例及び複数の構成を含む場合、それらを適当に組み合わせることができる。本発明の実施例を参照することによりこの技術分野の技術者は創造的な研究をしなくても他の実施例を想到することができ、それらがあっても本発明に含まれることは勿論である。

以下、本願の特許請求の範囲に属する本発明の各実施例の事項を説明する。注意されたいことは、本発明の各事項はいろいろな実施形態により実施されることができ、下記段落において説明する特定の構造および／或いは機能は本発明の例示にしか過ぎないものである。本発明に複数の実施例が含まれているとき、この技術分野の技術者は本発明の各実施例をそれぞれ実施するか或いは２つまたは２つ以上の実施例を同時に説明することができる。例えば本発明の実施例に記載されているいずれかの事項により本発明の装置及び／或いは方法を実施することができる。また、本発明の実施例に記載されている事項またはその事項以外の他の特徴及び／或いは機能により本発明の装置及び／或いは方法を実施することもできる。

注意されたいことは、下記実施例に係る図面は発明の基本的構造を示す例示にしか過ぎないものである。下記図面に示されている部品は、実際の部品の数量、形状及びサイズに従って描いたものでない。本発明を実施するとき、本発明の要旨を逸脱しない範囲内において各部品の数量、形状及びサイズを適当に変化させることができ、それによりいろいろな配置形態を獲得することができる。

下記叙述において本発明の事項を詳細に説明することにより本発明の原理をより詳細に理解してもらうことができる。注意されたいことは、下記記述において本発明の一部分の事項を説明しなくても、この技術分野の技術者は下記叙述により本発明を実施することができる。

本発明の実施例において、サブタイトル（Subtitle）のクロスボーダー（Cross border）の処理方法を提供する。本発明の実施例に係るサブタイトルのクロスボーダーの処理方法はコンピュータにより実施されることができる。前記コンピュータはソフトウェアで構成されるか或いはソフトウェアとハードウェアの組合せで構成されることができる。前記コンピュータはサーバー、端末装置等に集積されることができる。図２に示すとおり、サブタイトルのクロスボーダーの処理方法は下記ステップＳ２０１～ステップＳ２０６を含む。

ステップＳ２０１において、端末の表示装置のサイズ情報を獲得し、前記サイズ情報は前記表示装置のサイズを指す。

この発明において、前記端末の表示装置のサイズ情報を獲得するステップは前記端末のディスプレイ属性（display attribute）を獲得することを含む。前記サイズ情報は前記表示装置のサイズを指し、前記ディスプレイ属性は表示装置の高さ及び幅を含む。具体的に、スマートフォンのシステム情報には通常、スクリーン対象属性が含まれている。前記属性は携帯電話のスクリーンの高さと幅を含み、その高さと幅の単位はいずれも画素である。一般の携帯電話またはタブレットパソコン等のような端末のスクリーンの解像度は変化しないので、前記スクリーン対象の属性を常数と見なすことができる。デスクトップ・コンピューター等のようなスクリーンの解像度を調節できる端末である場合、前記ディスプレイ属性はシステム情報に記憶されており、システム情報において前記ディスプレイ属性を読み出すことができるので、ここで再び説明しない。この実施例において獲得した表示装置のサイズ情報はＮ＊Ｍである。その式において、Ｎは表示装置の幅であり、Ｍは表示装置の高さであり、Ｎ≧１であり、Ｍ≧１である。

ステップＳ２０２において、前記サイズ情報に従って安全区域を形成し、前記安全区域は前記表示装置のサイズより小さいか或いは等しい。

この発明において、前記サイズ情報に従って安全区域を形成するステップは第一パーセンテージ（percentage）により前記安全区域の幅を計算するか或いは第二パーセンテージにより前記安全区域の高さを計算することを含む。前記安全区域は前記表示装置のサイズより小さいか或いは等しく、前記第一パーセンテージは前記安全区域の幅が前記表示装置の幅に占めるパーセンテージであり、前記第二パーセンテージは前記安全区域の高さが前記表示装置の高さに占めるパーセンテージである。具体的に、前記第一パーセンテージと第二パーセンテージを所定の記憶装置に予め設定するか或いは端末のヒューマン・コンピュータ・インタラクション（Human-computer interaction）によって受信したユーザの設定命令により随時に設定することができる。第一パーセンテージをａ％に設定し、第二パーセンテージをｂ％に設定することができる。０＜ａ≦１００でありかつ０＜ｂ≦１００であることにより、安全区域の幅ｎをｎ＝Ｎ×ａ％にし、安全区域の高さｍをｍ＝Ｍ×ｂ％にすることができる。そのステップにおいて、安全区域の幅または高さのみを計算することができる。安全区域の幅のみを計算するとき、前記安全区域の高さと前記サイズ情報中の高さを同一にすることができ、安全区域の高さのみを計算するとき、前記安全区域の幅と前記サイズ情報中の幅を同一にすることができる。

注意されたいことは、前記ステップにおいて他の方法により安全区域を形成することもできる。例えば、前記安全区域のサイズと表示装置のサイズを同一にするか或いは、安全区域を表示装置のサイズの変化範囲内に直接に形成することができる。前記安全区域がサブタイトルの表示区域を定義することにより、表示されるサブタイトルが表示装置の境界線を越えることを防止することができる。

ステップＳ２０３において、前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出する。

本実施例において、前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップは、前記端末が再生するビデオ画像において前記ビデオ画像中の少なくとも１個のビデオフレームをランダムに抽出するか或いは、前記ビデオ画像中の所定のビデオフレームを抽出することを含む。前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームである。前記ステップにおいて、前記ビデオ画像中のビデオフレームを抽出する方法はランダム抽出方法を含む。前記ランダム抽出方法は、連続的に配列されている複数個のフレームをランダムに抽出するか或いは固定の間隔を空けて複数個のフレームをランダムに抽出するか或いは順に配列されている複数個のフレームをランダムに抽出するものであることができる。本発明はそのランダム抽出方法を具体的に限定せず、いずれかのランダム抽出方法を本発明に用いることができる。前記ランダム抽出方法はビデオ画像中の所定のビデオフレームを抽出するものであることもできる。前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームであることができる。例えば文字認識、モデルによって検出されかつ文字を有しているビデオフレームであることができる。その場合、文字を有しているビデオフレームを、ビデオ画像において抽出することができる。

ステップＳ２０４において、前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプト（intercept）することにより合成フレームを形成する。

本実施例において、前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップは、前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算することと、前記インターセプト距離に従って前記ビデオフレームの幅方向と／或いは高さ方向においてフレームセグメント（Frame segment）をインターセプトすることと、前記幅方向のフレームセグメントを結合させることにより合成フレームを形成することと／或いは前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成することとを含む。前記ステップにおいて、前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算するステップは、前記ビデオフレームの幅から安全区域のサイズを直接に減ずるものであるか或いは前記ビデオフレームの高さから安全区域のサイズを直接に減ずるものであることができる。具体的に、図３に示すとおり、ビデオフレーム３０２のサイズが７００×１０８０であり、安全区域３０１のサイズが５４０×９６０である場合、幅方向のインターセプト距離３０３は（７００－５４０）／２＝８０であり、高さ方向のインターセプト距離３０４は（１０８０－９６０）／２＝６０であることができる。前記ビデオフレームのサイズと前記安全区域のサイズによりインターセプト距離を計算するステップは、前記ビデオフレームの幅から安全区域の幅を減じて得た結果の閾値によりインターセプト距離を計算するものであることもできる。図３の例において、８０は幅方向のインターセプト距離の最大値であり、６０は高さ方向のインターセプト距離の最大値であり、その２つの数値により幅方向のインターセプト距離と高さ方向のインターセプト距離を確定することができる。例えばインターセプト距離の最大値の５０％をインターセプト距離にする場合、幅方向のインターセプト距離は４０であり、高さ方向のインターセプト距離３０である。前記ステップによりインターセプト距離を獲得した後、前記インターセプト距離に従って前記ビデオフレームの幅方向と／或いは高さ方向においてフレームセグメントをインターセプトし、かつ前記幅方向のフレームセグメントを結合させることにより合成フレームを形成するか或いは前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成する。すなわち、幅方向においてインターセプトした２個のフレームセグメントを結合させることにより合成フレームを形成し、高さ方向においてインターセプトした２個のフレームセグメントを結合させることにより合成フレームを形成する。図４に示されている幅方向の合成フレームにおいて、左側のフレームセグメントには文字「我」が含まれており、右側のフレームセグメントには文字「人」が含まれている。図４には幅方向の合成フレームのみが示されているが、高さ方向の合成フレームの場合、上下方向の２個のフレームセグメントを結合させることにより合成フレームを形成することができ、本発明はそれを再び説明しない。図４の合成フレームには文字が含まれているが、他の実施例において獲得する合成フレームのフレームセグメントは文字を含まないこともある。合成フレームに文字が含まれていないことはサブタイトルのクロスボーダーが生じないことを意味し、本発明はそれを詳細に説明しない。

ステップＳ２０５において、前記合成フレームに文字が含まれているかを検出する。

本実施例において、前記合成フレームに文字が含まれているかを検出するステップは、前記合成フレームを文字判断モデルに入力することと、前記文字判断モデルの出力により前記合成フレームに文字が含まれているかを判断することとを含む。前記文字判断モデルは畳み込みニューラルネットワーク（Convolutional Neural Networks、ＣＮＮ）のトレーニングにより獲得するものであり、分類標識がついているトレーニング・セット（Training set）を前記畳み込みニューラルネットワークに入力し、前記畳み込みニューラルネットワークの出力結果を検出することにより前記畳み込みニューラルネットワークを前記文字判断モデルにトレーニングすることができる。前記ステップにおいて、トレーニングを予めした畳み込みニューラルネットワークにより前記合成フレームに文字が含まれているかを判断することができる。前記畳み込みニューラルネットワークはいずれかの畳み込みニューラルネットワークであることができ、本発明はそれを限定しない。前記モデルをトレーニングするとき、まずトレーニング・セットを形成する必要がある。前記トレーニング・セットは標識がついている合成フレーム画像の集合である。例えば図４に示されている複数の画像は文字が含まれている画像を指す。トレーニング・セット中の画像を前記畳み込みニューラルネットワークに入力した後sigmoid関数によりその結果を出力し、かつその出力結果と前記標識がついている合成フレーム画像を比較する。その２つが合うとき、前記畳み込みニューラルネットワークのパラメーターを保存し、その２つが合わないとき、その状況を前記畳み込みニューラルネットワークにフィードバックすることにより畳み込みニューラルネットワークがパラメーターを調節するようにし、かつ画像を入力するステップを反復する。トレーニング・セット中の各画像に適合するパラメーターが出るまでトレーニングを繰り返す。トレーニングが終わると、文字判断モデルが形成される。ステップＳ２０４において獲得する合成フレームを前記文字判断モデルに入力し、モデルの出力により前記合成フレームに文字が含まれているかを判断する。モデルの出力１は合成フレームに文字が含まれていることを意味し、モデルの出力０は合成フレームに文字が含まれていないことを意味する。

注意されたいことは、前記合成フレームに文字が含まれているかを検出する検出方法を例として説明してきたが、画像中に文字が含まれているかを検出できる検出方法であればいずれも、本発明に用いることができ、本発明はそれを限定しない。

ステップＳ２０６において、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断する。

本実施例において、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップは、前記合成フレームに文字が含まれていると、前記ビデオ画像中のサブタイトルが前記ビデオ画像の幅方向と／或いは高さ方向の境界線を越えた（クロスボーダー）と判断することを含む。ステップＳ２０５において、前記合成フレームに文字が含まれているという結果を獲得すると、前記ビデオ画像中のサブタイトルが境界線を越えた（クロスボーダー）と判断する。つぎに、前記合成フレームが幅方向の合成フレームであるか或いは高さ方向の合成フレームであるかを判断することにより、前記サブタイトルが前記ビデオ画像の幅方向の境界線を越えたか或いは高さ方向の境界線を越えたかを判断する。

本発明の実施例において、サブタイトルのクロスボーダーの処理方法、装置及び電子装置を提供する。前記サブタイトルのクロスボーダーの処理方法は、端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップと、前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップと、前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップと、前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップと、前記合成フレームに文字が含まれているかを検出するステップと、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップとを含む。本発明の実施例において、サブタイトルのクロスボーダーの処理方法は、安全区域を形成し、かつ安全区域の境界線を越えたフレームセグメントに文字が含まれているかを判断することにより、従来の技術においてユーザがサブタイトルのクロスボーダーが生じたかを手動で検出する必要がある技術的問題を解決することができる。

図５に示すとおり、前記サブタイトルのクロスボーダーの処理方法は下記ステップＳ５０１を更に含む。

ステップＳ５０１において、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させる。

具体的に、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させるステップは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させるか或いは、前記ビデオ画像のサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させることを含む。前記ステップはサブタイトルのクロスボーダーを検出した後自動に実施されるステップである。サブタイトルが境界線を越えるとき、サブタイトルが前記安全区域内に位置するまでサブタイトルのサイズを減少させる。サブタイトルのサイズを減少させる方法は下記２種がある。一つ目の方法はサブタイトルのサイズを直接減少させることである。通常、サブタイトルとビデオ画像はそれぞれ存在し、サブタイトルはビデオ画像上に付加されるものであるので、コンフィグレーションファイルによりサブタイトルの位置、字体のサイズ及びカラー等を調節することができる。安全区域の幅と高さは既知の事項であるので、安全区域の幅と高さに従ってコンフィグレーションファイル中のサブタイトルの表示位置と／或いは字体のサイズ等を調節することにより、サブタイトルを前記安全区域内に位置させることができる。二つ目の方法はビデオ画像のサイズを直接減少させることである。サブタイトルとビデオ画像が一体に形成される場合、サブタイトルはビデオ画像の一部分になっているので、サブタイトルのサイズのみを減少させることができない。そのとき、ビデオ画像のサイズが安全区域のサイズと同一になるようにビデオ画像のサイズを減少させる。それにより前記サブタイトルを安全区域内に位置させ、サブタイトルのクロスボーダーを解決することができる。

注意されたいことは、前記サブタイトルのサイズを減少させることにより前記サブタイトルを前記安全区域内に位置させる前記２つの方法は本発明の例示にしか過ぎないものである。サブタイトルのサイズを直接または間接的に減少させる方法であればいずれも本発明に用いることができる、本発明はそれを１つずつ説明しない。

以上、本発明の実施例に係るサブタイトルのクロスボーダーの処理方法中の各ステップを順に説明してきたが、この技術分野の技術者はサブタイトルのクロスボーダーの処理方法中の各ステップを前述の順序で実施しなくてもよい。すなわちサブタイトルのクロスボーダーの処理方法中の各ステップを逆の順序、並行、交差に実施してもよい。また、この技術分野の技術者は本発明のサブタイトルのクロスボーダーの処理方法に他のステップを更に増加させることもできる。そのような変形例または代替例は本発明の要旨を逸脱しない範囲内において実施されるものであるため、それらがあっても本発明に含まれることは勿論である。

以下、本発明の実施例に係るサブタイトルのクロスボーダーの処理装置を記述する。本発明の実施例に係るサブタイトルのクロスボーダーの処理装置により本発明の実施例に係るサブタイトルのクロスボーダーの処理方法中の各ステップを実施することができる。説明を簡単にするため、以下、サブタイトルのクロスボーダーの処理装置に係る事項のみを説明し、説明しない事項はサブタイトルのクロスボーダーの処理方法の説明を参照することができる。

本発明の実施例において、サブタイトルのクロスボーダーの処理装置を提供する。前記装置により本発明の実施例に係るサブタイトルのクロスボーダーの処理方法中のステップを実施することができる。図６に示すとおり、前記サブタイトルのクロスボーダーの処理装置６００は、サイズ獲得モジュール６０１、安全区域形成モジュール６０２、ビデオフレーム抽出モジュール６０３、フレーム合成モジュール６０４、文字検出モジュール６０５及びクロスボーダー判断モジュール６０６を含む。

サイズ獲得モジュール６０１は端末の表示装置のサイズ情報を獲得することに用いられる。前記サイズ情報は前記表示装置のサイズを指す。

安全区域形成モジュール６０２は前記サイズ情報に従って安全区域を形成することに用いられる。前記安全区域は前記表示装置のサイズより小さいか或いは等しい。

ビデオフレーム抽出モジュール６０３は前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出することに用いられる。

フレーム合成モジュール６０４は前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成することに用いられる。

文字検出モジュール６０５は前記合成フレームに文字が含まれているかを検出することに用いられる。

クロスボーダー判断モジュール６０６は、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断することに用いられる。

前記サブタイトルのクロスボーダーの処理装置６００はサイズ減少モジュールを更に含む。前記サイズ減少モジュールは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させることに用いられる。

前記サイズ獲得モジュール６０１はディスプレイ属性獲得モジュールを更に含む。前記ディスプレイ属性獲得モジュールは前記端末のディスプレイ属性を獲得することに用いられる。前記ディスプレイ属性は表示装置の高さ及び幅を含む。

前記安全区域形成モジュール６０２は、第一パーセンテージにより前記安全区域の幅を計算する安全区域幅計算モジュールと／或いは第二パーセンテージにより前記安全区域の高さを計算する安全区域高さ計算モジュールを更に含む。前記第一パーセンテージは前記安全区域の幅が前記表示装置の幅に占めるパーセンテージであり、前記第二パーセンテージは前記安全区域の高さが前記表示装置の高さに占めるパーセンテージである。

前記ビデオフレーム抽出モジュール６０３は前記端末が再生するビデオ画像において前記ビデオ画像中の少なくとも１個のビデオフレームをランダムに抽出するか或いは、前記ビデオ画像中の所定のビデオフレームを抽出することに用いられる。前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームである。

前記フレーム合成モジュール６０４は、
前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算するインターセプト距離計算モジュールと、
前記インターセプト距離に従って前記ビデオフレームの幅方向と／或いは高さ方向においてフレームセグメントをインターセプトするフレームセグメント・インターセプトモジュールと、
前記幅方向のフレームセグメントを結合させることにより合成フレームを形成することと／或いは前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成する合成モジュールとを更に含む。

前記文字検出モジュール６０５は、前記合成フレームを文字判断モデルに入力する入力モジュールと、前記文字判断モデルの出力により前記合成フレームに文字が含まれているかを判断する判断モジュールとを更に含む。前記文字判断モデルは畳み込みニューラルネットワークのトレーニングにより獲得するものであり、分類標識がついているトレーニング・セットを前記畳み込みニューラルネットワークに入力し、前記畳み込みニューラルネットワークの出力結果を検出することにより前記畳み込みニューラルネットワークを前記文字判断モデルにトレーニングする。

前記クロスボーダー判断モジュール６０６は、前記合成フレームに文字が含まれていると、前記ビデオ画像中のサブタイトルが前記ビデオ画像の幅方向と／或いは高さ方向の境界線を越えた（クロスボーダー）と判断するクロスボーダータイプ判断モジュールを更に含む。

図６に示される装置により図２と図５の実施例に示される方法を実施することができる。装置の実施例において説明しない部分は図２と図５の実施例に係る方法の記述を参照することができる。図６の装置を実施する過程と発明の効果は図２と図５の実施例に係る方法の記述を参照することができるので、ここで再び説明しない。

図７を参照すると、図７は本発明の実施例に係る電子装置７００の構造を示す図である。本発明の実施例に係る電子装置はいろいろな端末、例えば携帯電話、ノートブックコンピューター、デジタル放送受信機（Digital broadcasting receiver）、携帯情報端末（ＰＤＡ、Personal Digital Assistant）、タブレット（ＰＡＤ）、ポータブルメディアプレーヤー（ＰＭＰ、Portable Media Player）、車用端末装置（例えばナビゲーション）等の携帯式端末と、例えばデジタルＴＶ、デスクトップコンピュータ等の非携帯式端末とを含むことができるが、本発明はそれらにのみ限定されるものでない。図７に示される電子装置は、本発明の例示にしか過ぎないものであり、本発明の実施例の機能と使用の範囲を限定するものでない。

図７に示すとおり、電子装置７００は処理装置（例えば中央処理装置、画像処理装置等）７０１を含み、その処理装置７０１はリードオンリーメモリー（ＲＯＭ、Read-Only Memory）７０２に記憶されるプログラムまたは記憶装置７０８からランダムアクセスメモリ（ＲＡＭ、Random Access Memory）７０３に送信されるプログラムにより所定の作業と処理をすることができる。ＲＡＭ７０３には電子装置７００の操作に必要であるいろいろなプログラムとデータが更に記憶されている。処理装置７０１、ＲＯＭ７０２及びＲＡＭ７０３はバス７０４により互いに接続される。入力／出力（Ｉ／Ｏ、Input/Output）インターフェース７０５もバス７０４に接続される。

下記装置は入力／出力（Ｉ／Ｏ）インターフェース７０５に接続されることができる。その装置は、例えばタッチパネル、タッチ基板、キーボード、マウス、画像センサー、マイク、加速度計、ジャイロスコープ等を含む入力装置７０６と、液晶表示装置（ＬＣＤ、Liquid Crystal Display）、スピーカー、振動機等を含む出力装置７０７と、テープ、ハードディスク等を含む記憶装置７０８と、通信装置７０９とであることができる。通信装置７０９は電子装置７００と他の装置が無線または有線で通信をするようにサポートすることによりデータを交換することができる。図７にはいろいろな装置を具備する電子装置７００が示されているが、電子装置７００は前記いろいろな装置を全部具備するか或いは全部用いる必要はない。すなわち電子装置７００はより多いか或いはより少ない装置を具備するか或いは用いることができる。

特に、本発明の実施例において、前記流れ図に示されるステップはコンピュータソフトウェアプログラムにより実施されることができる。例えば、本発明の実施例はコンピュータプログラム製品を含み、そのコンピュータプログラム製品はコンピュータ読み取り可能な媒体に記憶されるコンピュータプログラムを含み、そのコンピュータプログラムは前記流れ図中の方法を実施するプログラムコードを含むことができる。その実施例において、通信装置７０９により前記コンピュータプログラムをネットワークからダウンロードするとともにインストールするか或いは、記憶装置７０８からダウンロードするとともにインストールするか或いは、ＲＯＭ７０２からダウンロードするとともにインストールすることができる。前記コンピュータプログラムが処理装置７０１により実行されるとき、前記実施例に係る方法中の所定の機能を実施することができる。

注意されたいことは、前記コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体、コンピュータ読み取り可能な記憶媒体またはその２つの組合せであることができる。コンピュータ読み取り可能な記憶媒体は、電気、磁性、光、電磁、赤外線であるか或いは、半導体のシステム、装置または部品であるか或いはそれらの任意の組合せであることができる。コンピュータ読み取り可能な記憶媒体の具体的な例として、１つまたは複数の導線により接続される携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ、Random Access Memory）、リードオンリーメモリー（ＲＯＭ、Read-Only Memory）、消去可能プログラム可能ＲＯＭ（ＥＰＲＯＭ、Erasable Programmable Read-Only Memory）、フラッシュメモリー、光ファイバー、シーディーロム（ＣＤ－ＲＯＭ、Compact Disc Read Only Memory）、光記憶部品、磁性記憶部品またはそれらの任意の組合せを含むことができるが、本発明はそれらにのみ限定されるものでない。本発明の実施例において、コンピュータ読み取り可能な記憶媒体はプログラムを含むか或いは記憶する実物型媒体であり、前記プログラムは、命令実行システム、装置またはそれらの組合せに用いられることができる。本発明の実施例において、コンピュータ読み取り可能な信号媒体はベースバンド（base band）またはキャリアの一部分により伝送されるデータ信号を含み、コンピュータ読み取り可能な信号媒体にはコンピュータ読み取り可能なプログラムコードが記憶される。その方法により伝送されるデータ信号は、いろいろな信号、例えば電磁信号、光信号またはそれらの組合せであることができるが、それらにのみ限定されるものでない。コンピュータ読み取り可能な信号媒体はコンピュータ読み取り可能な記憶媒体以外のいずれかのコンピュータ読み取り可能な媒体であることができる。前記コンピュータ読み取り可能な信号媒体は、命令実行システム、装置またはそれらの組合せに用いられるプログラムを送信、伝播または伝送することができる。コンピュータ読み取り可能な媒体に含まれるプログラムコードは適当な媒体、例えば電線、光ケーブル、ＲＦ（Radio Frequency）等により伝送されるか或いはそれらの組合せにより伝送されることができる。

前記コンピュータ読み取り可能な媒体は前記電子装置に設けられるか或いは前記電子装置に設けられず前記電子装置とそれぞれ存在するものであることができる。

前記コンピュータ読み取り可能な媒体には１つまたは複数のプログラムが記憶され、１つまたは複数のプログラムが前記電子装置により実行されるとき、前記電子装置は、端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップと、前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップと、前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップと、前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトすることにより合成フレームを形成するステップと、前記合成フレームに文字が含まれているかを検出するステップと、前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップとを実施する。

１つまたは複数のプログラミング言語（programming language）またはそれらの組合せにより本発明の実施例に係る方法を実施するコンピュータプログラムコードを作成することができる。前記プログラミング言語は対象に向くプログラミング言語、例えばJava、Smalltalk、Ｃ＋＋を含むか或いは常用する過程式プログラミング言語、例えば「Ｃ」プログラミング言語またはそれに類似しているプログラミング言語を更に含むことができる。プログラムコードはクライアントコンピュータにより実行されるか或いは、一部分がクライアントコンピュータにより実行されるか或いは、独立しているソフトウェアパッケージとして実行されるか或いは、一部分がクライアントコンピュータにより実行されかつ一部分がリモートコンピュータにより実行されか或いは、リモートコンピュータまたはサーバーにより実行されることができる。リモートコンピュータにより実行される場合、リモートコンピュータはいずれかのネットワーク、例えばローカルエリアネットワーク（ＬＡＮ、local area network）またはワイドエリアネットワーク（ＷＡＮ、Wide Area Network）によりクライアントコンピュータに接続されるか或いは外部のコンピュータに接続されることができる（例えばインターネットサービスプロバイダー（Internet Service Provider）が提供するインターネットにより外部のコンピュータに接続される）。

図面中の流れ図とブロックダイアグラム（block diagram）には本発明の実施例に係るシステム、方法及びコンピュータプログラムを実施することができるシステムの構造、機能及び操作方法が記載されている。流れ図とブロックダイアグラム中の各枠は、１つのモジュール、プログラムの一部分、コードの一部分を示し、前記モジュール、プログラムの一部分、コードの一部分は所定の機能を実現する実行可能な命令を含むことができる。注意されたいことは、他の実施例において、ブロックダイアグラムの各枠中の各ステップは図面に示される順番に実施されなくてもよい。例えば、隣接している各枠中のステップは通常、並行の順番に実施されるが、実現しようとする機能が異なることにより逆の順番に実施されることもできる。注意されたいことは、ブロックダイアグラムと／或いは流れ図中の各枠、ブロックダイアグラムと／或いは流れ図中の各枠の組合せは、所定の機能を獲得するか或いは所定の操作をすることができるハードウェアにより実施されるか或いは専用ハードウェアとコンピュータ命令の組合せにより実施されることができる。

本発明の実施例に係るユニットはソフトウェアにより実施されるか或いはハードウェアにより実施されることができる。特別な説明がない限り、ユニットの名称はそのユニットを限定するものでない。

以上、本発明の実施例とそれらに用いられる技術的事項を説明してきた。本技術分野の技術者が知っているように、本発明が公開する範囲は、前記技術的特徴の組合せによって構成される技術的事項にのみ限定されるものでなく、本発明の要旨を逸脱しない範囲において前記技術的特徴または類似の技術的特徴の組合せにより形成される他の技術的事項を更に含むこともできる。例えば、前記技術的特徴と本発明の実施例に公開される類似の技術的特徴（それにのみ限定されるものでない）により形成される技術的事項を更に含むこともできる。

Claims

端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップと、
前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップと、
前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップと、
前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトし、インターセプトした複数個のフレームセグメントを結合することにより合成フレームを形成するステップと、
前記合成フレームに文字が含まれているかを検出するステップと、
前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップとを含むことを特徴とするサブタイトルのクロスボーダーの処理方法。
前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させるステップを更に含むことを特徴とする請求項１に記載のサブタイトルのクロスボーダーの処理方法。
前記端末の表示装置のサイズ情報を獲得するステップであって、前記サイズ情報は前記表示装置のサイズを指すステップは、前記端末のディスプレイ属性を獲得することを含み、前記ディスプレイ属性は表示装置の高さ及び幅を含むことを特徴とする請求項１に記載のサブタイトルのクロスボーダーの処理方法。
前記サイズ情報に従って安全区域を形成するステップであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しいステップは、第一パーセンテージにより前記安全区域の幅を計算すること及び／または第二パーセンテージにより前記安全区域の高さを計算することを含み、
前記第一パーセンテージは前記安全区域の幅が前記表示装置の幅に占めるパーセンテージであり、前記第二パーセンテージは前記安全区域の高さが前記表示装置の高さに占めるパーセンテージであることを特徴とする請求項２に記載のサブタイトルのクロスボーダーの処理方法。
前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するステップは、前記端末が再生するビデオ画像において前記ビデオ画像中の少なくとも１個のビデオフレームをランダムに抽出するか或いは、前記ビデオ画像中の所定のビデオフレームを抽出することを含み、前記所定のビデオフレームは予め設定された方法によって抽出されかつ所定の特徴を有しているビデオフレームであることを特徴とする請求項１に記載のサブタイトルのクロスボーダーの処理方法。
前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトし、インターセプトした複数個のフレームセグメントを結合することにより合成フレームを形成するステップは、
前記ビデオフレームのサイズと前記安全区域のサイズに従ってインターセプト距離を計算することと、
前記インターセプト距離に従って前記ビデオフレームの幅方向及び／または高さ方向においてフレームセグメントをインターセプトすることと、
前記幅方向のフレームセグメントを結合させることにより合成フレームを形成すること及び／または、
前記高さ方向のフレームセグメントを結合させることにより合成フレームを形成することとを含むことを特徴とする請求項１に記載のサブタイトルのクロスボーダーの処理方法。
前記合成フレームに文字が含まれているかを検出するステップは、
前記合成フレームを文字判断モデルに入力することと、
前記文字判断モデルの出力により前記合成フレームに文字が含まれているかを判断することとを含むことを特徴とする請求項１に記載のサブタイトルのクロスボーダーの処理方法。
前記文字判断モデルは畳み込みニューラルネットワークのトレーニングにより獲得するものであり、分類標識がついているトレーニング・セットを前記畳み込みニューラルネットワークに入力し、前記畳み込みニューラルネットワークの出力結果を検出することにより前記畳み込みニューラルネットワークを前記文字判断モデルにトレーニングすることを特徴とする請求項７に記載のサブタイトルのクロスボーダーの処理方法。
前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するステップは、前記合成フレームに文字が含まれていると、前記ビデオ画像中のサブタイトルが前記ビデオ画像の幅方向及び／または高さ方向の境界線を越えたと判断することを含むことを特徴とする請求項６に記載のサブタイトルのクロスボーダーの処理方法。
前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることによりそれを前記安全区域内に位置させるステップは、前記ビデオ画像にサブタイトルのクロスボーダーが生じたことを検出すると、前記サブタイトルのサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させるか或いは、前記ビデオ画像のサイズを減少させることにより前記サブタイトル全体を前記安全区域内に位置させることを含むことを特徴とする請求項２に記載のサブタイトルのクロスボーダーの処理方法。
端末の表示装置のサイズ情報を獲得するサイズ獲得モジュールであって、前記サイズ情報は前記表示装置のサイズを指すサイズ獲得モジュールと、
前記サイズ情報に従って安全区域を形成する安全区域形成モジュールであって、前記安全区域は前記表示装置のサイズより小さいか或いは等しい安全区域形成モジュールと、
前記端末が再生するビデオ画像において前記ビデオ画像中のビデオフレームを抽出するビデオフレーム抽出モジュールと、
前記安全区域のサイズを上回っている前記ビデオフレームの局部をインターセプトし、インターセプトした複数個のフレームセグメントを結合することにより合成フレームを形成するフレーム合成モジュールと、
前記合成フレームに文字が含まれているかを検出する文字検出モジュールと、
前記合成フレームに文字が含まれていると、前記ビデオ画像にサブタイトルのクロスボーダーが生じたと判断するクロスボーダー判断モジュールとを含むことを特徴とするサブタイトルのクロスボーダーの処理装置。
コンピュータ読み取り可能命令を記憶する記憶装置と、
前記コンピュータ読み取り可能命令を実行することにより請求項１～１０のうちいずれか一項に記載のサブタイトルのクロスボーダーの処理方法を実施する処理装置とを含むことを特徴とする電子装置。
コンピュータ読み取り可能命令を記憶し、コンピュータが前記コンピュータ読み取り可能命令を実行することにより請求項１～１０のうちいずれか一項に記載のサブタイトルのクロスボーダーの処理方法を実施することを特徴とする非一時的コンピュータ読み取り可能記憶媒体。