TW201516716A - 瀏覽多媒體文件之系統及方法 - Google Patents

瀏覽多媒體文件之系統及方法 Download PDF

Info

Publication number
TW201516716A
TW201516716A TW102138411A TW102138411A TW201516716A TW 201516716 A TW201516716 A TW 201516716A TW 102138411 A TW102138411 A TW 102138411A TW 102138411 A TW102138411 A TW 102138411A TW 201516716 A TW201516716 A TW 201516716A
Authority
TW
Taiwan
Prior art keywords
file
image
time information
multimedia
text message
Prior art date
Application number
TW102138411A
Other languages
English (en)
Inventor
Chaucer Quan-Cheng Chiu
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to TW102138411A priority Critical patent/TW201516716A/zh
Publication of TW201516716A publication Critical patent/TW201516716A/zh

Links

Abstract

一種瀏覽多媒體文件之系統及方法,其透過具有將多媒體教學文件被播放時位於文字辨識區域中的內容轉換為影像文字訊息,並將多媒體教學文件中之聲音訊號轉換為聲音文字訊息後,產生包含影像文字訊息與相對應之影像時間資訊以及包含聲音文字訊息與相對應之聲音時間資訊的索引文件,並在由索引文件中讀取與被輸入之關鍵字詞對應的影像時間資訊及聲音時間資訊後,依據所讀出之影像時間資訊及聲音時間資訊播放多媒體教學檔案之技術手段,可以檢索多媒體教學文件的播放內容,並達成迅速開始觀看與被檢索之關鍵字詞相關之內容的技術功效。

Description

瀏覽多媒體文件之系統及方法
一種多媒體文件之播放系統及其方法,特別係指一種建立索引文件以瀏覽多媒體文件之系統及其方法。
隨著科技的進步以及網路的發展,許多的行為突破了空間的限制,例如,傳統的教學模式需要在預定時間於預定的地點進行,但若有學習者無法在預定的時間抵達預定的地點,則可以在預定的時間透過網路在其他的地點進行,學習者也可以在事後透過教學時所錄製的多媒體教學文件進行學習。
在學習者進行傳統的教學模式後,或學習者跟隨多媒體教學文件學習後,若覺得教學過程中的某個部分尚未理解,則學習者可以觀看多媒體教學文件再次學習。
但由於目前無法對多媒體檔案的播放內容進行檢索,且學習者通常不會記錄欲觀看的片段在多媒體教學文件中的起始播放時間,因此,學習者必須要持續拖動播放時間軸上的播放進度指針或是快轉多媒體教學文件,藉以在多媒體教學文件中搜尋欲觀看的片段,這明顯造成學習者的不便。
綜上所述,可知先前技術中長期以來一直存在無法對多媒體教學文件的播放內容進行搜索的問題,進而造成學習者的不便,因此有必要提出改進的技術手段,來解決此一問題。
有鑒於先前技術存在無法對多媒體教學文件的播放內容進行檢索的問題,本發明遂揭露一種瀏覽多媒體文件之系統及方法,其中:
本發明所揭露之瀏覽多媒體文件之系統,至少包含:辨識區 域設定模組,用以於多媒體教學文件中設定文字辨識區域,文字辨識區域顯示該多媒體教學文件中之影像資訊;影像文字轉換模組,用以將文字辨識區域中之影像資訊轉換為影像文字訊息,並記錄影像文字訊息對應多媒體教學文件之影像時間資訊;語音文字轉換模組,用以將多媒體教學文件中之聲音訊號轉換為聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件中之聲音時間資訊;索引文件產生模組,用以生成索引文件,索引文件包含影像文字訊息與相對應之影像時間資訊、及聲音文字訊息與相對應之聲音時間資訊之索引文件;輸入模組,用以提供輸入關鍵字詞;播放資料讀取模組,用以比對關鍵字詞及索引文件,並依據索引文件中與關鍵字詞對應之影像文字訊息及聲音文字訊息,讀取與影像文字訊息及聲音文字訊息對應之影像時間資訊與聲音時間資訊;文件播放模組,用以依據影像時間資訊與聲音時間資訊播放多媒體教學文件。
本發明所揭露之瀏覽多媒體文件之方法,其步驟至少包括: 於多媒體教學文件中設定文字辨識區域,文字辨識區域顯示多媒體教學文件的影像資訊;轉換文字辨識區域中的影像資訊為影像文字訊息,並記錄影像文字訊息對應多媒體教學文件之影像時間資訊;轉換多媒體教學文件中之聲音訊號為聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件之聲音時間資訊;生成索引文件,索引文件包含影像文字訊息與相對應之影像時間資訊、及聲音文字訊息與相對應之聲音時間資訊;輸入關鍵字詞;比對關鍵字詞與索引文件,並依據索引文件中與關鍵字詞對應之影像文字訊息及聲音文字訊息,讀取與影像文字訊息及聲音文字訊息對應之影像時間資訊與聲音時間資訊;依據影像時間資訊及聲音時間資訊播放多媒體教學文件。
本發明所揭露之系統與方法如上,與先前技術之間的差異在 於本發明透過將多媒體教學文件被播放時位於文字辨識區域中的內容轉換為影像文字訊息,並將多媒體教學文件中之聲音訊號轉換為聲音文字訊息後,產生包含影像文字訊息與相對應之影像時間資訊以及包含聲音文字訊息與相對應之聲音時間資訊的索引文件,並在由索引文件中讀取與被輸入 之關鍵字詞對應的影像時間資訊及聲音時間資訊後,依據所讀出之影像時間資訊及聲音時間資訊播放多媒體教學檔案,藉以解決先前技術所存在的問題,並可以達成迅速開始觀看與被檢索之關鍵字詞相關之內容的技術功效。
101‧‧‧儲存媒體
110‧‧‧文件載入模組
120‧‧‧辨識區域設定模組
140‧‧‧影像文字轉換模組
150‧‧‧語音文字轉換模組
160‧‧‧索引文件產生模組
170‧‧‧輸入模組
180‧‧‧播放資料讀取模組
190‧‧‧文件播放模組
300‧‧‧顯示區域
310‧‧‧黑板
320‧‧‧游標
330‧‧‧文字辨識區域
步驟202‧‧‧載入預先建立之多媒體教學文件
步驟210‧‧‧於多媒體教學文件中設定文字辨識區域,文字辨識區域顯示多媒體教學文件的影像資訊
步驟220‧‧‧轉換文字辨識區域中的影像資訊為影像文字訊息,並記錄影像文字訊息對應多媒體教學文件之影像時間資訊
步驟230‧‧‧轉換多媒體教學文件中之聲音訊號為聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件之聲音時間資訊
步驟250‧‧‧產生索引文件,索引文件包含影像文字訊息與對應之影像時間資訊及聲音文字訊息與對應之聲音時間資訊
步驟270‧‧‧輸入關鍵字詞
步驟280‧‧‧比對關鍵字詞與索引文件,並依據索引文件中與關鍵字詞對應的影像文字訊息及聲音文字資訊,讀取與影像文字訊息及聲音文字訊息對應之影像時間資訊與聲音時間資訊
步驟290‧‧‧依據影像時間資訊及聲音時間資訊播放多媒體教學文件
第1圖為本發明所提之瀏覽多媒體文件之系統架構圖。
第2圖為本發明所提之瀏覽多媒體文件之方法流程圖。
第3A圖為本發明實施例所提之顯示範圍示意圖。
第3B圖為本發明實施例所提之框選文字辨識區域之示意圖。
以下將配合圖式及實施例來詳細說明本發明之特徵與實施方式,內容足以使任何熟習相關技藝者能夠輕易地充分理解本發明解決技術問題所應用的技術手段並據以實施,藉此實現本發明可達成的功效。
本發明可以對多媒體教學文件被播放時所顯示的影像資訊與所輸出的聲音訊號進行辨識,並記錄與所辨識出之影像文字訊息及聲音文字訊息對應之影像時間資訊及聲音時間資訊,再依據影像文字訊息與聲音文字訊息以及相對應的影像時間資訊與聲音時間資訊產生索引文件,之後,當索引文件中包含使用者所輸入的關鍵字詞時,可以依據在索引文件中與關鍵字詞對應的影像時間資訊與聲音時間資訊播放多媒體教學文件。
以下先以「第1圖」本發明所提之瀏覽多媒體文件之系統架構圖來說明本發明的系統運作。如「第1圖」所示,本發明之系統含有文件載入模組110、辨識區域設定模組120、影像文字轉換模組140、語音文字轉換模組150、索引文件產生模組160、輸入模組170、播放資料讀取模組180、以及文件播放模組190。
文件載入模組110負責載入預先建立的多媒體教學文件。
文件載入模組110可以由執行本發明之裝置中的儲存媒體101中讀取多媒體教學文件,也可以由執行本發明之裝置外部的儲存裝置(圖中未示)中下載多媒體教學文件,但文件載入模組110載入多媒體教學文件之方式並不以上述為限。
辨識區域設定模組120負責在文件載入模組110所載入之多媒體教學文件中設定多媒體教學文件被播放時會顯示出包含文字之影像資訊的區域,例如,設定多媒體教學文件被播放時所顯示之黑/白板或字幕在多媒體教學文件之畫面中的位置,其中,辨識區域設定模組120所設定的區域在本發明中被稱為「文字辨識區域」。
辨識區域設定模組120可以提供在顯示多媒體教學文件之影像的顯示範圍中定義文字辨識區域,例如,提供使用滑鼠在顯示多媒體教學文件之影像的顯示範圍中進行拖曳,藉以將在顯示範圍中被框選出的區域設定為文字辨識區域;辨識區域設定模組120也可以對多媒體教學文件所包含的一個影格進行影像分析,藉以判斷黑/白板或字幕在多媒體教學文件之畫面中的區域,並將所判斷出的區域設定為文字辨識區域,或是比對多媒體教學文件所包含的多個影格,並將被比對之影格中所呈現出之畫面不同的區域設定為文字辨識區域等。
影像文字轉換模組140負責將在文件載入模組110所載入之多媒體教學文件被播放時所顯示的畫面中,於辨識區域設定模組120所設定之文字辨識區域之影像資訊進行影像文字轉換,藉以在進行轉換後取得一個或多個資料,在本發明中,影像文字轉換模組140在對影像進行轉換後所取得的資料被稱為「影像文字訊息」。
一般而言,影像文字轉換模組140可以使用文字辨識(Character Recognition)技術,由文件載入模組110所載入之多媒體教學文件所呈現出的畫面中辨識出影像文字訊息,也就是說,影像文字轉換模組140所轉換出之影像文字訊息為由文字或符號所組成的訊息。但影像文字轉換模組140轉換產生影像文字訊息的方式並不以此為限。
影像文字轉換模組140也負責判斷進行文字轉換後所取得之影像文字訊息對應到文件載入模組110所載入之多媒體教學文件的影像 時間資訊,並記錄影像文字訊息對應的影像時間資訊。影像文字轉換模組140所取得之每一個影像文字訊息都會具有至少一個相對應的影像時間資訊,其中,影像時間資訊可以包含從多媒體教學文件中轉換出相對應之影像文字訊息之畫面開始被播放的時間,這個時間在本發明中被稱為「起始播放時間」,影像時間資訊也可以包含在多媒體教學文件播放時持續顯示與被轉換出之影像文字訊息對應之畫面的時間,這個時間在本發明中被稱為「持續播放時間」,實際上,影像時間資訊也可以同時包含起始播放時間與持續播放時間,本發明並沒有特別的限制。
語音文字轉換模組150負責對文件載入模組110所載入之多媒體教學文件中的聲音訊號進行語音文字轉換,藉以在語音文字轉換後取得一個或多個資料,在本發明中,語音文字轉換模組150在轉換後所取得的資料被稱為「聲音文字訊息」。
一般而言,語音文字轉換模組150可以使用如語音轉文字(Speech-to-Text,STT)等語音辨識技術由文件載入模組110所載入之多媒體教學文件中辨識出聲音文字訊息,也就是說,語音文字轉換模組150所轉換出之聲音文字訊息為由文字或符號所組成的訊息。但語音文字轉換模組150轉換產生聲音文字訊息的方式並不此為限。
語音文字轉換模組150也負責判斷進行語音轉換後所取得之聲音文字訊息對應到文件載入模組110所載入之多媒體教學文件的聲音時間資訊,並記錄所判斷出之與聲音文字訊息對應的聲音時間資訊。與影像文字轉換模組140相似的,語音文字轉換模組150所取得之每一個聲音文字訊息都會具有至少一個相對應的聲音時間資訊,其中,聲音時間資訊可以包含相對應之聲音文字訊息在多媒體教學文件中開始被播放的時間,這個時間在本發明中同樣被稱為「起始播放時間」,聲音時間資訊也可以包含在多媒體教學文件播放時持續發出與被產生之聲音文字訊息對應之聲音所經過的時間,這個時間在本發明中也同樣被稱為「持續播放時間」,聲音時間資訊也可以同時包含起始播放時間與持續播放時間,本發明並沒有特別的限制。
索引文件產生模組160負責產生索引文件。索引文件產生模 組160所產生的索引文件可以是純文字的資料、也可以是資料庫中之資料表的資料,本發明沒有特別的限制,凡資料格式可以被用來對文件之內容進行查找的文件都可以做為本發明所提之索引文件。
索引文件產生模組160所產生的索引文件包含播放文字訊息以及與播放文字訊息對應的起始播放時間訊息。其中,播放文字訊息是由影像文字轉換模組140轉換產生的所有影像文字訊息以及語音文字轉換模組150轉換產生的所有聲音文字訊息組成,起始播放時間訊息則是由與影像文字轉換模組140轉換產生之影像文字訊息對應的影像時間資訊以及與語音文字轉換模組150轉換產生之聲音文字訊息相對應的聲音時間資訊組成。一般而言,索引文件產生模組160會將播放文字訊息以及相對應的起始播放時間訊息做為一筆資料寫入所產生的索引文件中。
輸入模組170負責輸入關鍵字詞。
播放資料讀取模組180負責比對輸入模組170所輸入之關鍵字詞以及索引文件產生模組160所產生之索引文件,並依據索引文件中與關鍵字詞對應的影像文字訊息,由索引文件中讀取與播放文字訊息對應的影像時間資訊,以及依據索引文件中與關鍵字詞對應的聲音文字訊息,由索引文件中讀取與聲音文字訊息對應的聲音時間資訊。其中,與關鍵字詞對應的影像文字訊息表示影像文字訊息包含關鍵字詞、或影像文字訊息與關鍵字詞完全相同或部分單字相同,但本發明並不以此為限。
在部分的實施例中,播放資料讀取模組180可以在索引文件產生模組160所產生之索引文件中搜尋與輸入模組170所提供輸入之關鍵字詞對應的影像文字訊息以及聲音文字訊息(在本發明中,也使用「播放文字訊息」表示影像文字訊息以及聲音文字訊息),例如,比對關鍵字詞與索引文件中所記錄的影像文字訊息以及聲音文字訊息,藉以搜尋包含關鍵字詞的播放文字訊息或與關鍵字詞相同的播放文字訊息,播放資料讀取模組180也可以在搜尋到與關鍵字詞對應的播放文字訊息後,讀取與關鍵字詞對應之播放文字訊息對應的影像時間資訊以及聲音時間資訊(在本發明中,也使用「播放時間資訊」表示影像時間資訊以及聲音時間資訊)。
文件播放模組190負責依據播放資料讀取模組180所讀取出 之播放時間資訊播放文件載入模組110所載入的多媒體教學文件。
在部分的實施例中,文件播放模組190可以由播放資料讀取模組180所讀取出之播放時間資訊中的起始播放時間開始播放多媒體教學文件,例如,起始播放時間為2分8秒,文件播放模組190便會由多媒體教學文件的2分8秒處開始播放多媒體教學文件,文件播放模組180也可以較起始播放時間更早的時間開始播放多媒體教學文件,例如,文件播放模組190可以向前7秒,也就是從多媒體教學文件的2分1秒處開始播放多媒體教學文件。
在部分的實施例中,文件播放模組190也可以依據播放資料讀取模組180所讀取出之播放時間資訊中的持續播放時間播放多媒體教學文件,例如,當持續播放時間為4分13秒,則當多媒體教學文件由2分1秒處開始播放時,當文件播放模組190播放到多媒體教學文件的6分14秒處便會停止播放多媒體教學文件。
接著以一個實施例來解說本發明的運作系統與方法,並請參照「第2圖」本發明所提之瀏覽多媒體文件之方法流程圖。
首先,文件載入模組110可以載入多媒體教學文件(步驟202)。在本發明中,假設多媒體教學文件被儲存於執行本發明的裝置中,則文件載入模組110會由執行本發明之裝置的儲存媒體101中載入多媒體教學文件。
在文件載入模組110載入多媒體教學文件(步驟202)後,辨識區域設定模組120可以設定文字辨識區域(步驟210)。在本實施例中,假設如「第3A圖」與「第3B圖」所示,辨識區域設定模組120提供使用者在顯示多媒體教學文件的顯示區域300中設定文字辨識區域330,使用者可以操作滑鼠控制游標320在顯示多媒體教學文件的顯示區域300中框選出包含文字之黑板310的範圍,如此,辨識區域設定模組120便會將使用者在顯示區域300中所框選出的範圍設定為文字辨識區域330。
在辨識區域設定模組120設定文字辨識區域(步驟210)後,影像文字轉換模組140可以將多媒體教學文件被播放時在文字辨識區域330中顯示的影像資訊轉換為影像文字訊息,並記錄影像文字訊息對應多媒體 教學文件之影像時間資訊(步驟220)。在本實施例中,假設影像文字轉換模組140會對文字辨識區域330中顯示的影像資訊進行文字辨識,並記錄進行文字辨識的時間為起始播放時間,若所辨識出的影像文字訊息其中之一為「電阻」,且影像文字訊息「電阻」在多媒體教學文件中的起始播放時間為13分4秒,同時,影像文字轉換模組140會也會記錄持續辨識出「電阻」的時間為播放時間,例如為14分3秒。
同樣在文件載入模組110載入多媒體教學文件(步驟202) 後,語音文字轉換模組150可以將多媒體教學文件中之聲音訊號轉換為聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件之聲音時間資訊(步驟230)。在本實施例中,語音文字轉換模組150會對多媒體教學文件進行語音辨識,並記錄辨識出聲音文字訊息的時間為起始播放時間,例如,所辨識出的聲音文字訊息其中之一為「電路」,且聲音文字訊息「電路」在多媒體教學文件中的起始播放時間為8分2秒。
在影像文字轉換模組140由多媒體教學文件中轉換產生影 像文字訊息,並記錄影像文字訊息對應多媒體教學文件的影像時間資訊(步驟220),且語音文字轉換模組150由多媒體教學文件中轉換產生聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件的聲音時間資訊(步驟230)後,索引文件產生模組160可以產生索引文件(步驟250)。在本實施例中,索引文件產生模組160所產生的索引文件包含影像文字訊息「電阻」以及相對應的影像時間訊息,也就是起始播放時間「13分4秒」與持續播放時間「14分3秒」,也包含聲音文字訊息「電路」以及相對應的聲音時間訊息,也就是起始播放時間8分2秒等兩筆資料。
在索引文件產生模組160產生索引文件(步驟250)後,輸 入模組170可以提供輸入介面給使用者,並輸入使用者所輸入的關鍵字詞(步驟270),接著,播放資料讀取模組180可以比對輸入模組170所輸入的關鍵字詞以及索引文件產生模組160所產生索引文件中所包含的播放文字訊息,並依據索引文件中與關鍵字詞對應的播放文字訊息(影像文字訊息與聲音時間資訊),讀取與播放文字訊息對應的播放時間資訊(影像時間資訊與聲音時間資訊)(步驟280),接著,文件播放模組190可以依據播放 資料讀取模組180所讀取的播放時間資訊,由儲存媒體101中讀取出多媒體教學文件,並播放所讀出之多媒體教學文件(步驟290)。
在本實施例中,若使用者透過輸入模組170所輸入的關鍵字 詞為「電阻」,則播放資料讀取模組180可以在索引文件產生模組160所產生的索引文件中搜尋到包含關鍵字詞或與關鍵字詞相同的播放文字訊息,並讀取出與被搜尋到之播放文字訊息對應的播放時間資訊,也就是起始播放時間「13分4秒」與持續播放時間「14分3秒」,接著,文件播放模組190便可以由多媒體教學文件的第13分4秒處開始播放多媒體教學文件,並在播放到多媒體教學文件的14分3秒時停止多媒體教學文件的播放,而若輸入模組170所輸入的關鍵字詞為「電路」,則播放資料讀取模組180也可以在索引文件中搜尋到包含關鍵字詞或與關鍵字詞相同的播放文字訊息,並讀取出相對應的播放時間資訊,也就是起始播放時間「8分2秒」,接著,文件播放模組190便可以由多媒體教學文件的第8分2秒處開始播放多媒體教學文件,直到多媒體教學文件播放完畢為止。
如此,透過本發明,使用者可以直接使用關鍵字詞對多媒體教學文件進行搜索,並可以瀏覽多媒體教學文件中與關鍵字詞相關的內容。
綜上所述,可知本發明與先前技術之間的差異在於具有將多媒體教學文件被播放時位於文字辨識區域中的內容轉換為影像文字訊息,並將多媒體教學文件中之聲音訊號轉換為聲音文字訊息後,產生包含影像文字訊息與相對應之影像時間資訊以及包含聲音文字訊息與相對應之聲音時間資訊的索引文件,並在由索引文件中讀取與被輸入之關鍵字詞對應的影像時間資訊及聲音時間資訊後,依據所讀出之影像時間資訊及聲音時間資訊播放多媒體教學檔案之技術手段,藉由此一技術手段可以解決先前技術所存在無法對多媒體教學文件的播放內容進行檢索的問題,進而達成迅速開始觀看與被檢索之關鍵字詞相關之內容的技術功效。
再者,本發明之建立索引文件以瀏覽多媒體文件中特定內容之方法,可實現於硬體、軟體或硬體與軟體之組合中,亦可在電腦系統中以集中方式實現或以不同元件散佈於若干互連之電腦系統的分散方式實現。
雖然本發明所揭露之實施方式如上,惟所述之內容並非用以直接限定本發明之專利保護範圍。任何本發明所屬技術領域中具有通常知識者,在不脫離本發明所揭露之精神和範圍的前提下,對本發明之實施的形式上及細節上作些許之更動潤飾,均屬於本發明之專利保護範圍。本發明之專利保護範圍,仍須以所附之申請專利範圍所界定者為準。
步驟202‧‧‧載入預先建立之多媒體教學文件
步驟210‧‧‧於多媒體教學文件中設定文字辨識區域,文字辨識區域顯示多媒體教學文件的影像資訊
步驟220‧‧‧轉換文字辨識區域中的影像資訊為影像文字訊息,並記錄影像文字訊息對應多媒體教學文件之影像時間資訊
步驟230‧‧‧轉換多媒體教學文件中之聲音訊號為聲音文字訊息,並記錄聲音文字訊息對應多媒體教學文件之聲音時間資訊
步驟250‧‧‧產生索引文件,索引文件包含影像文字訊息與對應之影像時間資訊及聲音文字訊息與對應之聲音時間資訊
步驟270‧‧‧輸入關鍵字詞
步驟280‧‧‧比對關鍵字詞與索引文件,並依據索引文件中與關鍵字詞對應的影像文字訊息及聲音文字資訊,讀取與影像文字訊息及該聲音文字訊息對應之影像時間資訊與聲音時間資訊
步驟290‧‧‧依據影像時間資訊及聲音時間資訊播放多媒體教學文件

Claims (10)

  1. 一種瀏覽多媒體文件之方法,該方法至少包含下列步驟:於一多媒體教學文件中設定一文字辨識區域,該文字辨識區域顯示該多媒體教學文件的一影像資訊;轉換該文字辨識區域中的該影像資訊為至少一影像文字訊息,並記錄各該影像文字訊息對應該多媒體教學文件之各影像時間資訊;轉換該多媒體教學文件中之聲音訊號為至少一聲音文字訊息,並記錄各該聲音文字訊息對應該多媒體教學文件之各聲音時間資訊;生成一索引文件,該索引文件包含各該影像文字訊息與相對應之各該影像時間資訊、及各該聲音文字訊息與相對應之各該聲音時間資訊;輸入一關鍵字詞;比對該關鍵字詞與該索引文件,並依據該索引文件中與該關鍵字詞對應的該影像文字訊息及該聲音文字訊息,讀取與該影像文字訊息及該聲音文字訊息對應之各該影像時間資訊與各該聲音時間資訊;及依據該些影像時間資訊及該些聲音時間資訊播放該多媒體教學文件。
  2. 如申請專利範圍第1項所述之瀏覽多媒體文件之方法,其中於該多媒體教學文件中設定該文字辨識區域之步驟更包含提供於該多媒體教學文件之播放區域中定義該文字辨識區域,或由該多媒體教學文件中判斷該文字辨識區域之步驟。
  3. 如申請專利範圍第1項所述之瀏覽多媒體文件之方法,其中依據該些影像時間資訊及該些聲音時間資訊播放該多媒體教學文件之步驟為由該些影像時間資訊或該些聲音時間資訊中所包含之一起始播放時間開 始播放該多媒體教學文件。
  4. 如申請專利範圍第1項所述之瀏覽多媒體文件之方法,其中依據該些影像時間資訊及該些聲音時間資訊播放該多媒體教學文件之步驟是依據該些影像時間資訊及該些聲音時間資訊中之一持續播放時間播放該多媒體教學文件。
  5. 如申請專利範圍第1項所述之瀏覽多媒體文件之方法,其中依據該索引文件中與該關鍵字詞對應的該影像文字訊息及該聲音文字訊息,讀取與該影像文字訊息及該聲音文字訊息對應之各該影像時間資訊與各該聲音時間資訊之步驟,為讀取與包含該關鍵字詞或與該關鍵字詞相同之該影像文字訊息及該聲音文字訊息對應的各該影像時間資訊與各該聲音時間資訊。
  6. 一種瀏覽多媒體文件之系統,該系統至少包含:一辨識區域設定模組,用以於一多媒體教學文件中設定一文字辨識區域,該文字辨識區域顯示該多媒體教學文件中之一影像資訊;一影像文字轉換模組,用以將該文字辨識區域中之該影像資訊轉換為至少一影像文字訊息,並記錄各該影像文字訊息對應該多媒體教學文件之各影像時間資訊;一語音文字轉換模組,用以將該多媒體教學文件中之聲音訊號轉換為至少一聲音文字訊息,並記錄各該聲音文字訊息對應該多媒體教學文件中之各聲音時間資訊;一索引文件產生模組,用以生成一索引文件,該索引文件包含各該影像文字訊息與相對應之各該影像時間資訊、及各該聲音文字訊息與相對應之各該聲音時間資訊;一輸入模組,用以提供輸入一關鍵字詞; 一播放資料讀取模組,用以比對該關鍵字詞及該索引文件,並依據該索引文件中與該關鍵字詞對應之該影像文字訊息及該聲音文字訊息,讀取與該影像文字訊息及該聲音文字訊息對應之各該影像時間資訊與各該聲音時間資訊;及一文件播放模組,用以依據該些影像時間資訊及該些聲音時間資訊播放該多媒體教學文件。
  7. 如申請專利範圍第6項所述之瀏覽多媒體文件之系統,其中該辨識區域設定模組是提供於該多媒體教學文件之播放區域中定義該文字辨識區域,或由該多媒體教學文件中判斷該文字辨識區域。
  8. 如申請專利範圍第6項所述之瀏覽多媒體文件之系統,其中該播放資料讀取模組是於該索引文件中比對包含該關鍵字詞或與該關鍵字詞相同之該影像文字訊息及該聲音文字訊息。
  9. 如申請專利範圍第6項所述之瀏覽多媒體文件之系統,其中各該影像時間資訊及各該聲音時間資訊包含一起始播放時間,該文件播放模組更用以由該起始播放時間開始播放該多媒體教學文件。
  10. 如申請專利範圍第6項所述之瀏覽多媒體文件之系統,其中各該影像時間資訊及各該聲音時間資訊包含一持續播放時間,該文件播放模組更用以依據該持續播放時間播放該多媒體教學文件。
TW102138411A 2013-10-24 2013-10-24 瀏覽多媒體文件之系統及方法 TW201516716A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW102138411A TW201516716A (zh) 2013-10-24 2013-10-24 瀏覽多媒體文件之系統及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102138411A TW201516716A (zh) 2013-10-24 2013-10-24 瀏覽多媒體文件之系統及方法

Publications (1)

Publication Number Publication Date
TW201516716A true TW201516716A (zh) 2015-05-01

Family

ID=53720349

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102138411A TW201516716A (zh) 2013-10-24 2013-10-24 瀏覽多媒體文件之系統及方法

Country Status (1)

Country Link
TW (1) TW201516716A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI767197B (zh) * 2020-03-10 2022-06-11 中華電信股份有限公司 提供語音互動教學的方法及伺服器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI767197B (zh) * 2020-03-10 2022-06-11 中華電信股份有限公司 提供語音互動教學的方法及伺服器

Similar Documents

Publication Publication Date Title
US9031493B2 (en) Custom narration of electronic books
US8168876B2 (en) Method of displaying music information in multimedia playback and related electronic device
US20090177674A1 (en) Content Display Apparatus
US10423716B2 (en) Creating multimedia content for animation drawings by synchronizing animation drawings to audio and textual data
US10014029B2 (en) Video processing apparatus and method
KR20070084421A (ko) 타임라인 파일들을 주해하는 방법
US7970263B1 (en) Seamless integration of video capture in demonstration applications
US20120089905A1 (en) Translatable annotated presentation of a computer program operation
US20160328104A1 (en) Techniques to automatically generate bookmarks for media files
CN104349173A (zh) 视频复读方法及装置
US20150128048A1 (en) Automated multimedia content editing
US20150111189A1 (en) System and method for browsing multimedia file
US20210064327A1 (en) Audio highlighter
US11081140B1 (en) Systems and methods for generating templates for short-form media content
JP5910222B2 (ja) 情報処理装置及び情報処理プログラム
TW201516716A (zh) 瀏覽多媒體文件之系統及方法
US11119727B1 (en) Digital tutorial generation system
TWI724518B (zh) 依據腳本模擬影音播放以產生多媒體履歷之系統及方法
KR102523746B1 (ko) 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
JP7288491B2 (ja) 情報処理装置、及び制御方法
KR100879667B1 (ko) 멀티미디어 처리 장치의 어학 학습 방법
TW201516717A (zh) 影像播放之系統及其方法
KR20180062005A (ko) 동영상 발췌 및 관리 시스템 및 방법
JP2009187462A (ja) 音声録音装置及び音声再生装置
TW201505432A (zh) 電子裝置及其註解影音檔案的方法