TWI739377B - 字幕影像產生裝置及方法 - Google Patents

字幕影像產生裝置及方法 Download PDF

Info

Publication number
TWI739377B
TWI739377B TW109111816A TW109111816A TWI739377B TW I739377 B TWI739377 B TW I739377B TW 109111816 A TW109111816 A TW 109111816A TW 109111816 A TW109111816 A TW 109111816A TW I739377 B TWI739377 B TW I739377B
Authority
TW
Taiwan
Prior art keywords
circuit
image
data
delay
image data
Prior art date
Application number
TW109111816A
Other languages
English (en)
Other versions
TW202139178A (zh
Inventor
宋廉祥
Original Assignee
瑞昱半導體股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 瑞昱半導體股份有限公司 filed Critical 瑞昱半導體股份有限公司
Priority to TW109111816A priority Critical patent/TWI739377B/zh
Priority to US16/922,081 priority patent/US11032623B1/en
Application granted granted Critical
Publication of TWI739377B publication Critical patent/TWI739377B/zh
Publication of TW202139178A publication Critical patent/TW202139178A/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43074Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of additional data with content streams on the same device, e.g. of EPG data or interactive icon with a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Studio Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一種字幕影像產生裝置,包含:字幕產生電路、影像延遲電路以及疊加電路。字幕產生電路接收聲音資料以產生字幕圖像。影像延遲電路包含:第一與第二延遲路徑以及控制電路。第一延遲路徑包含延遲暫存電路。第二延遲路徑包含資料量降低電路、延遲暫存電路及資料量還原電路。控制電路在影像資料之資料量符合直接寫入條件時使影像資料經由第一延遲路徑進行延遲暫存,在資料量不符合直接寫入條件時使影像資料經由第二延遲路徑依序進行資料量降低、延遲暫存以及資料量還原。疊加電路將字幕圖像與時序相對應的影像資料進行疊加,產生輸出字幕影像。

Description

字幕影像產生裝置及方法
本發明是關於影像處理技術,尤其是關於一種字幕影像產生裝置及方法。
在多媒體影音技術愈來愈進步的現代,用以播放影像的裝置常常需要接收不同來源的影像並播放。舉例而言,液晶電視可從硬碟、DVD播放器或網路影音串流網站接收影像並進行播放。
然而,並不是每個影像源所提供的影像都有字幕,也並不是每個影像源所提供的字幕都對應到使用者能了解的語言。在這樣的情形下,自動產生具有所需語言的字幕的影像,成為影像播放裝置相當重要的功能。
鑑於先前技術的問題,本發明之一目的在於提供一種字幕影像產生裝置及方法,以改善先前技術。
本發明之一目的在於提供一種字幕影像產生裝置,其一實施例包含:字幕產生電路、影像延遲電路以及疊加電路。字幕產生電路配置以接收聲音資料,以根據聲音資料產生字幕圖像。影像延遲電路包含:第一延遲路徑、第二延遲路徑以及控制電路。第一延遲路徑包含延遲暫存電路。第二延遲路徑包含資料量降低電路、延遲暫存電路以及資料量還原電路。控制電路配置以在影像資料之資料量符合直接寫入條件時使影像資料經由第一延遲路徑進行延遲暫存,以及在資料量不符合直接寫入條件時使影像資料經由第二延遲路徑依序進行資料量降低、延遲暫存以及資料量還原。疊加電路配置以將字幕圖像與透過影像延遲電路延遲後時序相對應的影像資料進行疊加,以產生輸出字幕影像。
本發明之另一目的在於提供一種字幕影像產生方法,應用於一字幕影像產生裝置中,其一實施例包含:使字幕產生電路接收聲音資料,以根據聲音資料產生字幕圖像;由影像延遲電路的控制電路在影像資料之資料量符合直接寫入條件時,使影像資料經由影像延遲電路中,包含延遲暫存電路的第一延遲路徑進行延遲暫存;由控制電路在資料量不符合直接寫入條件時,使影像資料經由影像延遲電路中,包含資料量降低電路、延遲暫存電路以及資料量還原電路之第二延遲路徑依序進行資料量降低、延遲暫存以及資料量還原;以及使疊加電路將字幕圖像與透過影像延遲電路延遲後時序相對應的影像資料進行疊加,以產生輸出字幕影像。
有關本發明的特徵、實作與功效,茲配合圖式作較佳實施例詳細說明如下。
本發明之一目的在於提供一種字幕影像產生裝置及方法,可在聲音資料進行處理產生字幕時,將影像資料暫存以達到時序的同步。並且,字幕影像產生裝置及方法可在影像資料的資料量不符合直接寫入條件時,對影像資料ID的資料量進行調整,以對延遲暫存電路的儲存量進行更有彈性的運用。
請參照圖1。圖1顯示本發明之一實施例中,一種字幕影像產生裝置100的方塊圖。字幕影像產生裝置100包含:字幕產生電路110、影像延遲電路120以及疊加電路130。
字幕產生電路110配置以接收聲音資料AD,以根據聲音資料AD產生字幕圖像SI。於一實施例中,字幕產生電路110可例如,但不限於可運作語音辨識及/或翻譯的軟體的電路,或是可將聲音資料AD傳送至可進行語音辨識及/或翻譯的外部軟體或硬體的電路,以根據聲音資料AD產生所需的語言文字的字幕圖像SI。
影像延遲電路120包含:第一延遲路徑PA1、第二延遲路徑PA2以及控制電路140。其中,第一延遲路徑PA1包含延遲暫存電路150。第二延遲路徑PA2包含資料量降低電路160、延遲暫存電路150以及資料量還原電路170。
控制電路140配置以接收影像資料ID,以根據影像資料ID的資料量大小,選擇第一延遲路徑PA1以及第二延遲路徑PA2其中之一對影像資料ID進行處理。其中,影像資料ID可與聲音資料AD共同來自於例如,但不限於DVD光碟機、硬碟或是網路影音串流網站等影像源。
當控制電路140選擇第一延遲路徑PA1時,將使影像資料ID僅經過延遲暫存電路150的處理。其中,延遲暫存電路150配置以透過對輸入的影像資料ID進行暫存後,再輸出為影像資料IDD,以達到使影像資料ID的時序延遲的目的。
當控制電路140選擇第二延遲路徑PA2時,將使影像資料ID經過資料量降低電路160、延遲暫存電路150以及資料量還原電路170的處理。
其中資料量降低電路160配置以對輸入的影像資料ID進行資料量降低。於一實施例中,資料量降低電路160包含例如,但不限於編碼電路、壓縮電路、尺寸降低電路、影像捨棄電路或其組合,以影像編碼、影像壓縮、縮減影像尺寸、捨棄影像畫面其中之一或任兩者以上的組合,將輸入的影像資料ID的資料量降低以產生影像資料IDU。
進一步地,延遲暫存電路150配置以透過對輸入的影像資料IDU進行暫存後,再輸出為影像資料IDUD,以達到使影像資料IDU的時序延遲的目的。
資料量還原電路170配置以對輸入的影像資料IDUD進行資料量還原。於一實施例中,資料量還原電路170包含例如,但不限於與資料量降低電路160相對應的解碼電路、解壓縮電路、尺寸還原電路、影像插入電路或其組合,以影像解碼、影像解壓縮、放大以還原影像尺寸、插入影像畫面其中之一或任兩者以上的組合,將先前被降低資料量並延遲暫存的影像資料IDUD的資料量還原回影像資料IDOD。
於一實施例中,影像延遲電路120所輸出的影像資料IDD或IDOD,可傳送至播放的電路(未繪示)進行播放。
以下將對控制電路140的判斷與選擇機制進行更詳細的說明。
控制電路140配置以在影像資料ID之資料量符合直接寫入條件時,使影像資料ID經由第一延遲路徑PA1進行延遲暫存。並且,控制電路140配置以在資料量不符合直接寫入條件時,使影像資料ID經由第二延遲路徑PA2依序進行資料量降低、延遲暫存以及資料量還原。
於一實施例中,控制電路140配置以在判斷影像資料ID為已壓縮格式時判斷影像資料ID的資料量符合直接寫入條件。
舉例而言,當影像資料ID為例如,但不限於MPEG、H.264等已壓縮的格式時,控制電路140將認為影像資料ID的資料量已夠小,而選擇經由第一延遲路徑PA1直接將影像資料ID寫入延遲暫存電路150即可。
相對的,舉例而言,當影像資料ID不為已壓縮格式時,控制電路140將認為影像資料ID的資料量較大,而選擇經由第二延遲路徑PA2,先以資料量降低電路160對影像資料ID降低資料量後再寫入延遲暫存電路150,並隨後再由資料量還原電路170還原資料量。
於另一實施例中,控制電路140配置以在判斷影像資料ID的影像畫面尺寸小於門檻值時,判斷影像資料ID的資料量符合直接寫入條件。
舉例而言,當影像資料ID的畫面尺寸小於例如,但不限於1920×1080時,控制電路140將認為影像資料ID的資料量已夠小,而選擇經由第一延遲路徑PA1直接將影像資料ID寫入延遲暫存電路150即可。
相對的,當影像資料ID的畫面尺寸大於1920×1080時,控制電路140將認為影像資料ID的資料量較大,而選擇經由第二延遲路徑PA2,先以資料量降低電路160對影像資料ID降低資料量後再寫入延遲暫存電路150,並隨後再由資料量還原電路170還原資料量。
需注意的是,上述的影像壓縮格式以及畫面尺寸的門檻數值僅為一範例。於其他實施例中,亦可將其他的影像壓縮格式做為判斷的基準,亦或採用其他的門檻值做為判斷影像資料ID的資料量大小的基準。
於一實施例中,控制電路140亦可同時判斷影像資料ID是否為已壓縮格式以及影像畫面尺寸是否小於門檻值,以在兩種狀況至少其中之一發生時判斷影像資料ID的資料量符合直接寫入條件,並在兩種狀況都未發生時判斷影像資料ID的資料量不符合直接寫入條件。並且,於其他實施例中,控制電路140亦可根據影像資料ID的其他相關參數判斷影像資料ID是否符合直接寫入條件。本發明並不為上述實施例所限。
疊加電路130配置以將字幕圖像SI與透過影像延遲電路120延遲後時序相對應的影像資料IDD或是IDOD進行疊加,以產生輸出字幕影像OSI。於一實施例中,輸出字幕影像OSI可傳送至例如,但不限於顯示面板進行播放。
藉由上述的方式,本發明的字幕影像產生裝置可在聲音資料進行處理產生字幕時,將影像資料暫存以達到時序的同步。並且,本發明的字幕影像產生裝置可根據影像資料的資料量,決定是否對影像資料進行資料量的調整再進行延遲暫存,以對延遲暫存電路的儲存量進行更有彈性的運用。
於一實施例中,控制電路140配置以使字幕影像產生裝置100運作於字幕功能開啟模式或字幕功能關閉模式其中之一。舉例而言,控制電路140可受使用者的控制,例如但不限於接收使用者透過遙控傳送的控制訊號,以使字幕影像產生裝置100切換運作於字幕功能開啟模式或字幕功能關閉模式。
如圖1所示,在字幕功能開啟模式中,控制電路140配置以使影像資料ID以畫面寫入率輸入影像延遲電路120透過第一延遲路徑PA1或第二延遲路徑PA2處理,並以與畫面寫入率相等之畫面讀出率輸出影像資料IDD或IDOD。在一數值範例中,畫面寫入率為例如每秒60張畫面,而畫面讀出率亦為每秒60張畫面。
此外,在字幕功能關閉模式中,控制電路140配置以旁路影像延遲電路120,透過傳送路徑PA3以畫面讀出率直接輸出影像資料ID。
然而在字幕功能關閉模式切換至字幕功能開啟模式時,由於影像延遲電路120的起始運作,而容易造成後續的電路因為畫面的暫存而有斷續的播放結果。另一方面,在字幕功能關閉模式切換至字幕功能開啟模式,由於影像延遲電路120的停止運作,而容易造成後續的電路因為畫面不再暫存而有瞬間加速的播放效果。
請參照圖2。圖2顯示本發明一實施例中,對應字幕影像產生裝置100的有限狀態機200的示意圖。
如圖2所示,控制電路140配置以使字幕功能關閉模式210切換至字幕功能開啟模式220時,可存在有開啟轉換時間230。在開啟轉換時間230中,控制電路140使影像資料ID以畫面寫入率輸入影像延遲電路120處理,並以小於畫面寫入率之第一調整畫面讀出率輸出影像資料IDD或IDOD。
其中,在開啟轉換時間230中,當畫面寫入率為FIN,第一調整畫面讀出率為FOUT,延遲時間長度為DE秒,則開啟轉換時間的長度可以下式表示:(DE×FIN)/(FIN-FOUT)。
在一數值範例中,在開啟轉換時間230中,控制電路140使影像延遲電路120的畫面寫入率為例如每秒60張畫面,並使第一調整畫面讀出率為每秒58張畫面。如果要達到的延遲時間長度為1秒,則開啟轉換時間230的長度需要(1×60)/(60-58)=30秒。因此,在開啟轉換時間230中,總共累積60張畫面於影像延遲電路120中的延遲暫存電路150,以達到相對每秒60張畫面的畫面寫入率為1秒的延遲時間長度。
需注意的是,上述所需的延遲時間長度的數值僅為一範例,其實際上的大小,是由字幕產生電路110自接收到聲音資料AD至產生字幕圖像SI所需要的時間來決定。本發明並不為此所限。
另一方面,控制電路140配置以使字幕功能開啟模式220切換至字幕功能關閉模式210時,可存在有關閉轉換時間240。在關閉轉換時間240中,控制電路140使影像資料ID以畫面寫入率輸入影像延遲電路120處理並以大於畫面寫入率的第二調整畫面讀出率輸出影像資料IDD或IDOD。
由於切換至字幕功能關閉模式210後沒有需要滿足的特定時序,因此控制電路140可在釋放足夠數量的畫面後,即結束關閉轉換時間240,不必將延遲暫存電路150中暫存的所有畫面均清空。
在一數值範例中,在關閉轉換時間240中,控制電路140使影像延遲電路120的畫面寫入率為例如每秒60張畫面,並使第二調整畫面讀出率為每秒62張畫面。
藉由上述開啟轉換時間以及關閉轉換時間的配置,字幕影像產生裝置100將可使字幕功能關閉模式與字幕功能開啟模式以較平順的方式切換,避免因為影像延遲電路120的啟動與關閉造成播放的不流暢。
請參照圖3。圖3顯示本發明一實施例中,一種字幕影像產生方法300的流程圖。
除前述裝置外,本發明另揭露一種字幕影像產生方法300,應用於例如,但不限於圖1的字幕影像產生裝置100中。字幕影像產生方法300之一實施例如圖所示,包含下列步驟:
S310:使字幕產生電路110接收聲音資料AD,以根據聲音資料AD產生字幕圖像SI。
S320:使影像延遲電路120的控制電路140判斷影像資料ID之資料量是否符合直接寫入條件。
S330:當影像資料ID之資料量符合直接寫入條件時,由控制電路140使影像資料ID經由影像延遲電路120中,包含延遲暫存電路150的第一延遲路徑PA1進行延遲暫存。
S340:當影像資料ID之資料量不符合直接寫入條件時,由控制電路140使影像資料ID經由影像延遲電路120中,包含資料量降低電路160、延遲暫存電路150以及資料量還原電路170之第二延遲路徑PA2依序進行資料量降低、延遲暫存以及資料量還原。
S350:使疊加電路130將字幕圖像SI與透過影像延遲電路120,經由第一延遲路徑PA1或第二延遲路徑PA2延遲後時序相對應的影像資料IDD或IDOD進行疊加,以產生輸出字幕影像OSI。
需注意的是,上述的實施方式僅為一範例。於其他實施例中,本領域的通常知識者當可在不違背本發明的精神下進行更動。
綜合上述,本發明中的字幕影像產生裝置及方法可在聲音資料進行處理產生字幕時,將影像資料暫存以達到時序的同步。並且,字幕影像產生裝置及方法可在影像資料的資料量不符合直接寫入條件時,對影像資料ID的資料量進行調整,以對延遲暫存電路的儲存量進行更有彈性的運用。
雖然本發明之實施例如上所述,然而該些實施例並非用來限定本發明,本技術領域具有通常知識者可依據本發明之明示或隱含之內容對本發明之技術特徵施以變化,凡此種種變化均可能屬於本發明所尋求之專利保護範疇,換言之,本發明之專利保護範圍須視本說明書之申請專利範圍所界定者為準。
100:字幕影像產生裝置 110:字幕產生電路 120:影像延遲電路 130:疊加電路 140:控制電路 150:延遲暫存電路 160:資料量降低電路 170:資料量還原電路 200:有限狀態機 210:字幕功能關閉模式 220:字幕功能開啟模式 230:開啟轉換時間 240:關閉轉換時間 AD:聲音資料 ID:影像資料 IDD:影像資料 IDU:影像資料 IDOD:影像資料 IDUD:影像資料 OSI:輸出字幕影像 PA1:第一延遲路徑 PA2:第二延遲路徑 PA3:傳送路徑 SI:字幕圖像 300:字幕影像產生方法 S310~S350:步驟
[圖1]顯示本發明之一實施例中,一種字幕影像產生裝置的方塊圖; [圖2]顯示本發明之一實施例中,對應字幕影像產生裝置的有限狀態機的示意圖;以及 [圖3]顯示本發明之一實施例中,一種字幕影像產生方法的流程圖。
100:字幕影像產生裝置
110:字幕產生電路
120:影像延遲電路
130:疊加電路
140:控制電路
150:延遲暫存電路
160:資料量降低電路
170:資料量還原電路
AD:聲音資料
ID:影像資料
IDD:影像資料
IDU:影像資料
IDOD:影像資料
IDUD:影像資料
OSI:輸出字幕影像
PA1:第一延遲路徑
PA2:第二延遲路徑
PA3:傳送路徑
SI:字幕圖像

Claims (8)

  1. 一種字幕影像產生裝置,包含:一字幕產生電路,配置以接收一聲音資料,以根據該聲音資料產生一字幕圖像;一影像延遲電路,包含:一第一延遲路徑,包含一延遲暫存電路;一第二延遲路徑,包含一資料量降低電路、該延遲暫存電路以及一資料量還原電路;以及一控制電路,配置以在一影像資料之一資料量符合一直接寫入條件時使該影像資料經由該第一延遲路徑進行延遲暫存,以及在該資料量不符合該直接寫入條件時使該影像資料經由該第二延遲路徑依序進行資料量降低、延遲暫存以及資料量還原,其中該控制電路配置以在判斷該影像資料為一已壓縮格式或該影像資料的一影像畫面尺寸小於一門檻值時,判斷該影像資料的該資料量符合該直接寫入條件;以及一疊加電路,配置以將該字幕圖像與透過該影像延遲電路延遲後時序相對應的該影像資料進行疊加,以產生一輸出字幕影像。
  2. 如申請專利範圍第1項所述之字幕影像產生裝置,其中該資料量降低電路包含一編碼電路、一壓縮電路、一尺寸降低電路、一影像捨棄電路或其組合,該資料量還原電路包含與該資料量降低電路相應的一解碼電路、一解壓縮電路、一尺寸還原電路、一影像插入電路或其組合。
  3. 如申請專利範圍第1項所述之字幕影像產生裝置,其中該控制電路配置以在一字幕功能開啟模式中使該影像資料以一畫面寫入率輸入該影像延遲電路處理並以與該畫面寫入率相等之一畫面讀出率輸出,並在一字幕功能關閉模式中旁路該影像延遲電路以該畫面讀出率直接輸出該影像資料;其中該控制電路配置以在自該字幕功能關閉模式切換至該字幕功能開啟模式間的一開啟轉換時間中,使該影像資料以該畫面寫入率輸入該影像延遲電路處理並以小於該畫面寫入率之一第一調整畫面讀出率輸出該影像資料;該控制電路配置以在自該字幕功能開啟模式切換至該字幕功能關閉模式後的一關閉轉換時間中,使該影像資料以該畫面寫入率輸入該影像延遲電路處理並以大於該畫面寫入率的一第二調整畫面讀出率輸出該影像資料。
  4. 如申請專利範圍第3項所述之字幕影像產生裝置,其中在該開啟轉換時間中,該畫面寫入率為FIN,該第一調整畫面讀出率為FOUT,對應該字幕產生電路產生該字幕圖像的一所需延遲時間長度為DE秒,該開啟轉換時間的長度為(DE×FIN)/(FIN-FOUT)。
  5. 一種字幕影像產生方法,應用於一字幕影像產生裝置中,包含:使一字幕產生電路接收一聲音資料,以根據該聲音資料產生一字幕圖像;由一影像延遲電路的一控制電路在一影像資料之一資料量符合一直接寫入條件時,使該影像資料經由該影像延遲電路中,包含一延遲暫存電路的一第一延遲路徑進行延遲暫存; 由該控制電路在該資料量不符合該直接寫入條件時,使該影像資料經由該影像延遲電路中,包含一資料量降低電路、該延遲暫存電路以及一資料量還原電路之一第二延遲路徑依序進行資料量降低、延遲暫存以及資料量還原,其中該控制電路在判斷該影像資料為一已壓縮格式或該影像資料的一影像畫面尺寸小於一門檻值時,判斷該影像資料的該資料量符合該直接寫入條件;以及使一疊加電路將該字幕圖像與透過該影像延遲電路延遲後時序相對應的該影像資料進行疊加,以產生一輸出字幕影像。
  6. 如申請專利範圍第5項所述之字幕影像產生方法,其中該資料量降低電路包含一編碼電路、一壓縮電路、一尺寸降低電路、一影像捨棄電路或其組合,該資料量還原電路包含與該資料量降低電路相應的一解碼電路、一解壓縮電路、一尺寸還原電路、一影像插入電路或其組合。
  7. 如申請專利範圍第5項所述之字幕影像產生方法,其中該控制電路配置以在一字幕功能開啟模式中使該影像資料以一畫面寫入率輸入該影像延遲電路處理並以與該畫面寫入率相等之一畫面讀出率輸出,並在一字幕功能關閉模式中旁路該影像延遲電路以該畫面讀出率直接輸出該影像資料,該字幕影像產生方法更包含:使該控制電路在自該字幕功能關閉模式切換至該字幕功能開啟模式間的一開啟轉換時間中,使該影像資料以該畫面寫入率輸入該影像延遲電路處理並以小於該畫面寫入率之一第一調整畫面讀出率輸出該影像資料;以及 使該控制電路在自該字幕功能開啟模式切換至該字幕功能關閉模式後的一關閉轉換時間中,使該影像資料以該畫面寫入率輸入該影像延遲電路處理並以大於該畫面寫入率的一第二調整畫面讀出率輸出該影像資料。
  8. 如申請專利範圍第7項所述之字幕影像產生方法,其中在該開啟轉換時間中,該畫面寫入率為FIN,該第一調整畫面讀出率為FOUT,對應該字幕產生電路產生該字幕圖像的一所需延遲時間長度為DE秒,該開啟轉換時間的長度為(DE×FIN)/(FIN-FOUT)。
TW109111816A 2020-04-08 2020-04-08 字幕影像產生裝置及方法 TWI739377B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW109111816A TWI739377B (zh) 2020-04-08 2020-04-08 字幕影像產生裝置及方法
US16/922,081 US11032623B1 (en) 2020-04-08 2020-07-07 Subtitled image generation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109111816A TWI739377B (zh) 2020-04-08 2020-04-08 字幕影像產生裝置及方法

Publications (2)

Publication Number Publication Date
TWI739377B true TWI739377B (zh) 2021-09-11
TW202139178A TW202139178A (zh) 2021-10-16

Family

ID=76213345

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109111816A TWI739377B (zh) 2020-04-08 2020-04-08 字幕影像產生裝置及方法

Country Status (2)

Country Link
US (1) US11032623B1 (zh)
TW (1) TWI739377B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW259866B (zh) * 1993-12-30 1995-10-11 Yuen Henry C
US20070116036A1 (en) * 2005-02-01 2007-05-24 Moore James F Patient records using syndicated video feeds
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN108027834A (zh) * 2015-09-21 2018-05-11 高通股份有限公司 用于通过文本的视频搜索的语义多感官嵌入

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2411038A1 (en) * 2000-06-09 2001-12-13 British Broadcasting Corporation Generation subtitles or captions for moving pictures
FR2850821B1 (fr) * 2003-02-04 2005-04-29 France Telecom Systeme de sous-titrage dynamique de signaux de television et radiophoniques
KR101263522B1 (ko) * 2004-09-02 2013-05-13 소니 주식회사 콘텐츠 수신 장치, 비디오 오디오 출력 타이밍 제어 방법및 콘텐츠 제공 시스템
US8761568B2 (en) * 2005-12-20 2014-06-24 Vestel Elektronik Sanayi Ve Ticaret A.S. Method and apparatus for synchronizing subtitles with a video
JP4253327B2 (ja) * 2006-03-24 2009-04-08 株式会社東芝 字幕検出装置及び字幕検出方法ならびにプルダウン信号検出装置
US8272008B2 (en) * 2007-02-28 2012-09-18 At&T Intellectual Property I, L.P. Methods, systems, and products for retrieving audio signals
US20100265397A1 (en) * 2009-04-20 2010-10-21 Tandberg Television, Inc. Systems and methods for providing dynamically determined closed caption translations for vod content
US10462414B2 (en) * 2009-12-31 2019-10-29 Cable Television Laboratories, Inc. Method and system for generation of captions over stereoscopic 3D images
US10582268B2 (en) * 2015-04-03 2020-03-03 Philip T. McLaughlin System and method for synchronization of audio and closed captioning
US9959872B2 (en) * 2015-12-14 2018-05-01 International Business Machines Corporation Multimodal speech recognition for real-time video audio-based display indicia application
US11404041B2 (en) * 2017-05-24 2022-08-02 Nippon Hoso Kyokai Audio guidance generation device, audio guidance generation method, and broadcasting system
US20200007947A1 (en) * 2018-06-30 2020-01-02 Wipro Limited Method and device for generating real-time interpretation of a video

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW259866B (zh) * 1993-12-30 1995-10-11 Yuen Henry C
US20070116036A1 (en) * 2005-02-01 2007-05-24 Moore James F Patient records using syndicated video feeds
CN102209227A (zh) * 2010-03-30 2011-10-05 宝利通公司 在视频会议中增加翻译的方法和系统
CN108027834A (zh) * 2015-09-21 2018-05-11 高通股份有限公司 用于通过文本的视频搜索的语义多感官嵌入

Also Published As

Publication number Publication date
US11032623B1 (en) 2021-06-08
TW202139178A (zh) 2021-10-16

Similar Documents

Publication Publication Date Title
KR101287728B1 (ko) 디지털 서비스에 대응하는 데이터를 재생 및 전송하기 위한 장치 및 방법
JP4287068B2 (ja) 信号の誤りを隠蔽する方法
US8620134B2 (en) Video and audio reproducing apparatus and video and audio reproducing method for reproducing video images and sound based on video and audio streams
WO2020151398A1 (zh) 硬件解码动态分辨率无缝切换方法、装置及存储介质
WO2017166879A1 (zh) 教学录播用锁定画面的方法及装置
TWI739377B (zh) 字幕影像產生裝置及方法
JP4810424B2 (ja) トリックモード再生を行うためにマルチメディアコンテンツのストリームを修正する方法及びシステム
CN113596355B (zh) 字幕图像产生装置及方法
JP2001078185A (ja) 信号処理装置
JP2012151835A (ja) 映像変換装置
JP2006148679A (ja) データ処理装置
JPWO2005002224A1 (ja) 字幕等の情報を含むビデオ信号の処理回路
JPH11353804A (ja) 記録再生装置および方法、並びに提供媒体
US20070050063A1 (en) Apparatus for processing audio signal and method thereof
KR102709016B1 (ko) 비디오 데이터 및 오디오 데이터를 처리하는 멀티미디어 디바이스 및 그 제어 방법
US20210392239A1 (en) Content reproduction method, content reproduction apparatus, and display apparatus
JP2000287172A (ja) 画像データ処理装置
TWI617176B (zh) 應用於電視的電路及相關的影像顯示方法
JP5178680B2 (ja) 複数のプロセサを利用する映像装置および画像処理方法
JP5403784B2 (ja) 映像処理装置およびノイズ軽減方法
JP2008011337A (ja) 再生装置及び再生方法
JP3165661B2 (ja) 音声同期再生装置
TW202435048A (zh) 不固定幀速率的影像幀讀寫方法與系統
TW498688B (en) Method and device for resorting an image decode order using the pseudo-image pictures
JP2020145585A (ja) 同期化装置、同期化方法及びプログラム