TWI709905B - 資料分析方法及資料分析系統 - Google Patents

資料分析方法及資料分析系統 Download PDF

Info

Publication number
TWI709905B
TWI709905B TW108104065A TW108104065A TWI709905B TW I709905 B TWI709905 B TW I709905B TW 108104065 A TW108104065 A TW 108104065A TW 108104065 A TW108104065 A TW 108104065A TW I709905 B TWI709905 B TW I709905B
Authority
TW
Taiwan
Prior art keywords
learning
data
server
sections
analysis
Prior art date
Application number
TW108104065A
Other languages
English (en)
Other versions
TW202011231A (zh
Inventor
實恭 李
詹詩涵
柯兆軒
藍國誠
Original Assignee
台達電子工業股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 台達電子工業股份有限公司 filed Critical 台達電子工業股份有限公司
Publication of TW202011231A publication Critical patent/TW202011231A/zh
Application granted granted Critical
Publication of TWI709905B publication Critical patent/TWI709905B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/437Administration of user profiles, e.g. generation, initialisation, adaptation, distribution

Abstract

本揭示內容係關於一種資料分析方法及其資料分析系統。資料分析方法係先接收第一學習資料,再於該第一學習資料中加入複數個分段標記,以在該第一學習資料上劃分出複數個第一學習區段。該些第一學習區段係依時間順序相互銜接。由每一第一學習區段中篩選出對應每一第一學習區段各自第一關鍵字串。接收分析指令,且針對分析指令與每一第一學習區段各自的第一關鍵字串進行分析,以得到分析指令與對應於每一第一學習區段的相似度。最後,篩選出具有最高相似度的第一學習區段。

Description

資料分析方法及資料分析系統
本揭示內容關於一種資料分析方法及資料分析系統,用以根據分析指令篩選出對應的學習資料。
線上學習平台是指一種將眾多學習資料儲存於伺服器中,讓使用者能透過網際網路連線至伺服器,以隨時瀏覽學習資料的網路服務。在現行的各類線上學習平台中,提供的學習資料類型包含影片、音訊、簡報、文件或論壇等等。
由於線上學習平台中儲存的學習資料數量龐大,因此,使用者需要根據自身需求輸入搜尋指令,方能從線上學習平台中調閱到相關的學習資料,而仍有改良空間。
本揭示內容之一態樣為一種資料分析方法。資料分析方法包含下列步驟:接收第一學習資料。在第一學習資料中加入複數個第一分段標記,以在第一學習資料上劃分出複數個第一學習區段。根據該些第一學習區段每一者,產生對應每一第一學習區段各自的第一關鍵字串。接收與使用者操作相關的分析指令。針對分析指令與每一第一學習區段各自的第一關鍵字串進行分析,以得到分析指令與對應每一第一學習區段的複數個第一相似度。由該些第一學習區段篩選出具有一最高相似度的其中一個第一學習區段。
本揭示內容之另一態樣為一種資料分析系統。資料分析系統包含第一伺服器、第二伺服器及儲存單元。第一伺服器用以接收第一學習資料。儲存單元用以從第一伺服器接收並儲存第一學習資料。第二伺服器用以在第一學習資料中加入複數個第一分段標記,以在第一學習資料上劃分出複數個第一學習區段。第二伺服器用以根據該些第一學習區段每一者,產生對應每一第一學習區段各自的第一關鍵字串。第二伺服器用以接收分析指令,並針對分析指令與每一第一學習區段各自的第一關鍵字串進行分析,以得到分析指令與對應每一第一學習區段的複數個第一相似度,且第二伺服器由該些第一學習區段篩選出具有一最高相似度的其中一個第一學習區段。
據此,由於資料分析系統能針對第一學習資料加入第一分段標記,並在區分出第一學習區段後,在每一第一學習區段上產生第一關鍵字串,因此,後續使用者登入至資料分析系統時,即可精確地檢索到第一學習資料的每個第一學習區段、或者資料分析系統可主動推薦適合的學習區段給使用者,以改善使用者的操作體驗。
以下將以圖式揭露本案之複數個實施方式,為明確說明起見,許多實務上的細節將在以下敘述中一併說明。然而,應瞭解到,這些實務上的細節不應用以限制本案。也就是說,在本揭示內容部分實施方式中,這些實務上的細節是非必要的。此外,為簡化圖式起見,一些習知慣用的結構與元件在圖式中將以簡單示意的方式繪示之。
於本文中,當一元件被稱為「連接」或「耦接」時,可指「電性連接」或「電性耦接」。「連接」或「耦接」亦可用以表示二或多個元件間相互搭配操作或互動。此外,雖然本文中使用「第一」、「第二」、…等用語描述不同元件,該用語僅是用以區別以相同技術用語描述的元件或操作。除非上下文清楚指明,否則該用語並非特別指稱或暗示次序或順位,亦非用以限定本發明。
現有的線上學習平台中,當使用者輸入搜尋指令時,伺服器僅會將搜尋指令與學習資料的檔案名稱、字幕內文或標記(如:留言)進行比對篩選。然而,若學習資料的內容龐大(例如:片長為兩小時的影片),則使用者仍然需要手動調整學習資料(如:調整播放時間至第45分鐘),方能找出與自身需求最相關的區段。亦即,現有線上學習平台的分析機制僅能搜尋名稱或是字幕,而無法根據需求進行精細的檢索。此外,除了透過主動搜尋,使用者將無法找出自己有興趣的學習資料。
第1圖為根據本揭示內容之部分實施例所繪示的資料分析系統的示意圖。請參閱第1圖,本揭示內容係關於一種資料分析系統。資料分析系統100包含第一伺服器110、第二伺服器120及儲存單元130。在本實施例中,第一伺服器110電性連接於第二伺服器120,而在其他實施例中,第一伺服器110及第二伺服器120間能透過網路建立連線,以進行資料傳輸。儲存單元130為一種資料儲存裝置,例如:快閃記憶體、記憶卡、硬碟等。在部分實施例中,儲存單元130儲存於獨立的伺服器中。在其他部分實施例中,儲存單元130可設於第一伺服器110或第二伺服器120中。在其他實施例中,第一伺服器110與第二伺服器120亦可整合為單一個伺服器。
在本實施例中,資料分析系統100係用以提供線上學習服務,例如,使用者可透過終端裝置200(如:個人電腦、筆記型電腦或智慧型手機)連線至第一伺服器110,以瀏覽線上學習介面。當使用者欲瀏覽學習內容時,第一伺服器110能透過其內的處理器由儲存單元130中取得對應的檔案。第二伺服器120則透過其內的處理器用以執行分類、管理與統計等功能。然而,本揭示內容的應用方式並不以此為限,資料分析系統100亦可應用於影音串流平台或網路討論論壇等。
第一伺服器110用以接收數個學習資料。在部分實施例中,第一伺服器110係透過網際網路,從終端裝置200處接收學習資料。學習資料可為影片、聲音、簡報或討論串。為便於說明,在本實施例中以將多個學習資料細分為第一學習資料131a、第二學習資料131b及第三學習資料131c進行說明。然而,本揭示內容並不以此為限,學習資料的數量係可任意調整。
在部分實施例中,當第一伺服器110從終端裝置200處接收第一學習資料131a後,第一伺服器110遂將第一學習資料131a上傳至儲存單元130,同時,第一伺服器110傳送一通知訊息至第二伺服器120。第二伺服器120連線至儲存單元130,以在第一學習資料131a中加入複數個第一分段標記,使第一學習資料131a能根據該些第一分段標記被劃分出複數個第一學習區段。在部份實施例中,該些第一學習區段係依照時間先後排列(例如:第一學習資料131a中預設的時間軸)相互銜接。
舉例而言,若第一學習資料131a為片長30分鐘的影片檔案,第二伺服器120能在影片時間為10分鐘、20分鐘處分別加入第一分段標記,以將影片檔案區分為三個第一學習區段。同理,若第一學習資料為10頁的簡報檔案,第二伺服器120能分別在第2、5、7頁處加入第一分段標記,以將簡報檔案分為四個學習區段。在其他部份實施例中,該些第一學習區段並不一定相互銜接,而僅具有先後順序。例如第一學習區段為影片第1~20分鐘的段落、第二學習區段為影片第30~45分鐘的段落。
在部分實施例中,分段標記為加入在第一學習資料131a中的一種識別用標籤(tag)或一種標示符(identifier),以供第一伺服器110或第二伺服器120能快速找到第一學習資料131a的特定部分內容,但分段標記的形式不以此為限。分段標記的產生方式將於後文詳述。
在第二伺服器120對第一學習資料131a加入第一分段標記後,第二伺服器120將從每一個第一學習區段中,分析出各自的第一關鍵字串(keyword string)。在部分實施例中,第一關鍵字串包含至少一個關鍵字。例如:對於一個被區分為三個第一學習區段的影片檔案而言,每個第一學習區段的關鍵字串可為「投影器、影像、原理」、「高頻訊號、銳化、增強」及「提升、清晰度」。在部份實施例中,第一關鍵字串可為每個第一學習區段中出現頻率高於設定值的文字內容。第一關鍵字串的分析方式將於後文詳述。
第二伺服器120用以將第一學習資料及對應的第一分段標記及第一關鍵字串儲存至儲存單元130中。在部分實施例中,第一伺服器110將第一學習資料131a儲存於儲存單元130內的課程資料庫131中。當第二伺服器120產生第一分段標記且產生第一關鍵字串後,第二伺服器120將第一分段標記、第一關鍵字串儲存於儲存單元130的分析資料庫132中。在其他部分實施例中,第二伺服器120還會在分析資料庫132中儲存對應於第一學習資料的第一辨識代碼,使第一分段標記、第一關鍵字串能根據第一辨識代碼,對應到課程資料庫131中的第一學習資料。
本揭示內容之資料分析系統100可根據與使用者操作相關的一分析指令,向使用者推薦適合的學習資料。在部份實施例中,第一伺服器110用以將分析指令傳送給第二伺服器120。接著,第二伺服器120將根據分析指令連線至儲存單元130,針對分析指令與每一第一學習區段各自的第一關鍵字串進行分析,以得到分析指令與對應每一個第一學習區段的各自第一關鍵字串的第一相似度。第二伺服器120會將該些第一學習區段中,篩選出具有最高相似度的第一學習區段,並將篩選出的第一學習區段整合成分析訊息,傳遞給終端裝置200,以在終端裝置200顯示出來(如:顯示出檢索畫面或推薦畫面)。
接下來,說明分析指令的產生方式與時機。在部分實施例中,分析指令可根據使用者的操作(如:檢索動作)而產生,且分析指令包含由終端裝置200傳來的第一搜尋指令。舉例而言,第一搜尋指令可為搜尋字串「投影器、原理」,而第一學習資料131a中三個第一學習區段的關鍵字串分別為「投影器、影像、原理」、「高頻訊號、銳化、增強」及「提升、清晰度」。經過分析處理(如:比對字串的相似程度),第一個學習區段的第一關鍵字串與搜尋字串最相似,因此,第二伺服器120能透過第一伺服器110將比對結果回傳給終端裝置200(如:在使用者界面上呈現出一個推薦結果),讓使用者得知第一學習資料131a的第一學習區段與搜尋指令最相似。在其他部分實施例中,第二伺服器120能將搜尋指令與所有學習資料131a~131c中每一學習區段的關鍵字串進行比對,以精確判斷出與搜尋指令最為相關的學習資料及對應的學習區段。
在其他部分實施例中,使用者透過終端裝置200輸入第一搜尋指令,且第一搜尋指令可為口語化(語意式)的一段文字內容,亦即第一搜尋指令可為一語意式的文字內容,例如:「投影機的增強原理是什麼」。第二伺服器120針對第一搜尋指令進行分析處理,以產生一搜尋字串。在部份實施例中,第二伺服器120係利用語意分析技術分析搜尋指令,例如:前述第一搜尋指令可被分析出「投影機」、「原理」、「什麼」等搜尋字。接著,再利用搜尋字串與每一第一學習區段的第一關鍵字串進行比對。本領域相關技術人士可理解語意分析之運作原理,故在此不另贅述。
在其他部分實施例中,分析指令可為資料分析系統100主動產生的一個推薦指令。亦即,第一伺服器110能根據使用者的操作產生分析指令。舉例而言,當第一伺服器110判斷終端裝置200連線至資料分析系統100時(例如:使用者登入至線上學習系統),第一伺服器110即產生分析指令,以透過第二伺服器120,主動分析使用者可能有興趣的檔案。或者,第一伺服器110能根據使用者的操作動作,在判斷使用者的操作符合預定條件時(如:使用者瀏覽學習資料達半小時、使用者對學習資料提問、留言或標記),再產生分析指令。
在其他部份實施例中,第一伺服器110在確認使用者的操作符合預定條件後,還會根據儲存單元130內儲存的行為資料而產生分析指令。舉例而言,資料分析系統100可根據儲存單元130中行為資料庫133內儲存的行為資料(如:使用者的使用記錄)來產生分析指令,行為資料的細節將於後文詳述。
此外,在部份實施例中,若第一伺服器110在確認使用者的操作符合預定條件,產生分析指令,且第二伺服器120據以篩選出與分析指令最相近的第一學習區段之後,第二伺服器120可先將篩選出的第一學習區段儲存到儲存單元130中的推薦資料庫134中。第一伺服器110可在預設的推薦時刻(如:使用者登入或登出線上學習系統時、使用者瀏覽完一部影片後),再將推薦資料庫134中儲存的第一學習區段傳送給終端裝置200。
據此,由於資料分析系統100在接收到第一學習資料131a後,會先將第一學習資料131a細分出多個第一學習區段,且使每一第一學習區段具有對應的第一關鍵字串。因此,後續當使用者登入至資料分析系統100後,資料分析系統100即可根據分析指令,精確地提供適合的學習資料給使用者。如前所述,本揭示內容至少包含兩種應用方式:第一,當使用者利用資料分析系統100進行檢索時,資料分析系統100除了找出與第一搜尋指令最相似的第一學習資料131a外,還能精確地找出第一學習資料131a的哪一個學習區段與第一搜尋指令最相似。第二,當使用者登入至資料分析系統100時,第一伺服器110能根據使用者的操作,在符合預設條件的時候產生分析指令(如:搜尋使用者的使用紀錄),並根據分析指令找到對應的第一學習區段,以推薦給使用者。據此,將能大幅提昇資料分析系統100在分析及搜尋上的精確度,並改善使用者的使用體驗。
接下來說明分段標記的產生方式,請同時參閱第1圖及第2A圖,第2A圖係根據本揭示內容之部分實施例所繪示的第一學習資料131a之文字檔案示意圖。。在部分實施例中,第一學習資料131a包含文字檔案A1(例如:字幕)。第二伺服器120接收到該第一學習資料131a後,將對文字檔案A1進行分析處理,例如:以語意分析方法以產生複數個特徵句。該些特徵句之間具有先後關係。接著,計算相鄰之特徵句之間的相似度,以產生第一分段標記。
舉例而言,文字檔案A1經分析後,產生的特徵句包含「投影機根據影像訊號調整發光單元」、「發光單元投射出的光線會被反射為影像畫面」、「在另一種類型的投影機中」。前述第一句特徵句及第二句特徵句皆具有相同的字詞「影像、發光」,相似度較高,而第二句特徵句與第三句特徵句的相似度則較低。因此,當第二伺服器120判斷相鄰之特徵句相似度低於預定值時(如:完全沒有相同字詞,或者其中一句為轉折語句,例如「在其他實施例中…」),第二伺服器120即會產生第一分段標記。以將文字檔案A1區分為多個第一學習區段A11~A14。
在前述實施例中,文字檔案A1可經由語意分析技術產生特徵句,且計算特徵句之間的相似度,但本揭示內容並不以此為限。在部份實施例中,第二伺服器120中的處理器亦可先將文字檔案A1進行二位化處理,再透過數據比對,判斷相似性,以建立特徵句或判斷特徵句之間的相似度。
前述實施例中之文字檔案係指影片的字幕或簡報的文字內容,而若是文字檔案為「網路論壇的討論內容」,則仍能以相同原理進行分段。相似地,若第一學習資料131a包含聲音檔案,則第二伺服器120可先透過語音辨識,產生文字檔案A1後,再進行語意分析,以產生多個特徵句。
在其他部分實施例中,請參閱第2B圖,第一學習資料131b包含影像檔案B1。影像檔案B1又包含複數個影像畫面B01~B04。影像畫面B01~B04可為影片檔案中依照時序銜接的多個幀畫面。第二伺服器120用以判斷相鄰該些影像畫面B01~B04的相似度,以產生第一分段標記。舉例而言,影像畫面B01~B02係用以顯示投影機的結構圖,而影像畫面B03~B04用以顯示光線投影的路徑圖。影像畫面B02、B03間的相似度較低,所以第二伺服器120能在影像畫面B02、B03間加入第一分段標記,以形成多個第一學習區段B11、B12。
請再次參閱第2A圖,在此說明資料分析系統100產生第一關鍵字串的方法如後。第二伺服器120對第一學習資料131a中的文字檔案A1進行分析處理(如:語意辨識分析),以產生多個特徵字。接著,在第二伺服器120以前述方式產生第一分段標記,使第一學習資料131a被劃分為多個第一學習區段A11~A14或B11~B12後,第二伺服器120將會判斷特徵字在每一個第一學習區段A11~A14或A21~A22中的數量,當數量大於門檻值時,即將其設定為第一關鍵字串。舉例而言,在文字檔案A1的一個第一學習區段A11中包含下列內容:「投影機根據影像訊號調整發光單元,發光單元投射出的光線會被反射為影像畫面」,其中,「影像」出現2次、「發光單元」出現2次、「投影機、光線」皆分別出現1次。第二伺服器120可將出現2次的特徵字「影像、發光單元」設定為第一關鍵字串。
在部分實施例中,若第二伺服器120根據分析指令(如:第一搜尋指令),找到多個相符的學習資料(例如:第一學習資料131a、第二學習資料131b皆具有「投影機」關鍵字),則第二伺服器120還能產生搜尋清單。在其他部分實施例中,第一伺服器110還用以提供管理介面。管理介面係供資料分析系統100的管理者或維護人員察看資料分析系統100的內部參數及回應資料,使管理者或維護人員能調整資料分析系統100內的參數(例如:門檻值、語意辨識參數等),優化資料分析系統100的性能。
此外,第二伺服器120可參照使用者的行為記錄,來排序搜尋清單中的學習資料。請參閱第1圖,在部分實施例中,儲存單元130內儲存有第一學習資料131a、第二學習資料131b及第三學習資料131c。第二學習資料131b能透過前述方式,根據複數個第二分段標記被劃分成複數個第二學習區段,且每個第二學習區段中包含各自的第二關鍵字串;同理,第三學習資料131c根據複數個第三分段標記被劃分成複數個第三學習區段,且每個第三學習區段中包含各自的第三關鍵字串。當第二伺服器120根據第一搜尋指令,篩選出相符的第一學習資料131a後,第二伺服器120透過第一伺服器110,將第一學習資料131a傳給終端裝置200,以供使用者瀏覽。同時,第一伺服器110或第二伺服器120還能據以產生行為資料,並將行為資料儲存於儲存單元130內的行為資料庫中。
行為資料係用以記錄使用者連線至資料分析系統100後的各項操作,例如:瀏覽特定的學習資料、傳送留言、標記為重要檔案等。資料分析系統100能根據行為資料來對搜尋清單進行排序。在部分實施例中,第一伺服器110用以根據行為資料產生分析指令,舉例而言,第一伺服器110可根據使用者最常瀏覽的學習資料,篩選出前述的搜尋字串(例如:最常出現的標題名稱),以計算第一相似度。據此,使用者即便不主動輸入第一搜尋指令,資料分析系統100仍能定期產生分析指令,並推薦適合的學習資料及其學習區段。
在部分實施例中,第一伺服器110還用以接收終端裝置200傳來的第二搜尋指令。第二伺服器120根據第二搜尋指令,由儲存單元130中篩選出多個學習資料,例如第二學習資料131b及第二學習資料131c。在部分實施例中,第二伺服器120比對第二搜尋指令與每一個學習資料131a~131c中的每個學習區段之關鍵字串的相似度,並將相似度高於預定值的學習區段篩選出來。舉例而言,第二搜尋指令為「影像增強」,而第二學習資料131b的其中一個第二學習區段中出現了3次「影像增強」,第三學習資料131c的其中一個第三學習區段中出現了5次「影像增強」,則第二伺服器120將這兩個學習區段皆列為搜尋清單中的項目。
承上,在第二伺服器120根據第二搜尋指令篩選出第二學習資料131b及第三學習資料131c後,由於使用者先前曾瀏覽過第一學習資料131a,因此,第二伺服器120將會進一步比對第一學習資料131a中各個第一關鍵字串與第二學習資料131b之第二關鍵字串以及第三學習資料131c中第三關鍵字串的第二相似度。接著,再根據第二相似度的高低,產生搜尋清單並排序第二學習資料131b及第三學習資料131c的順序。
舉例而言,使用者先前瀏覽過第一學習資料131a的第一學習區段的關鍵字串中,包含5個關鍵字。而第二伺服器120分析出的第二學習資料131b中的第二關鍵字串中包含「投影機」以及其他3個關鍵字;第二伺服器120篩選出的第三學習資料131c中的第三關鍵字串中包含「投影機」以及其他4個關鍵字。第一關鍵字串與第二關鍵字串的相似度為60%(例如:有三個關鍵字相同),而第一關鍵字串與第三關鍵字串的相似度為20%(例如:只有一個關鍵字相同),代表第二學習資料131b的內容比較相似於使用者先前瀏覽過的第一學習資料131a,因此,第二伺服器120會將篩選出的第二學習資料131b之第二學習區段排列在第三學習資料131c的第三學習區段之前。
在部分實施例中,資料分析系統100還能在多個學習區段間建立關連性。請參閱第1、2A及2B圖,為便於說明,在此將第2A圖的文字檔案A1及第2B圖的影像檔案B1視為不同學習資料的內容。其中,學習區段A13中設有一第一關連性標記T1,學習區段B11中的影像畫面B02中則設有一第二關連性標記T2。當第二伺服器120根據第一搜尋指令篩選出學習區段A13後,若判斷學習區段B11內具有第二關連性標記T2,則該第二伺服器120將根據學習區段B11產生推薦清單。舉例而言,學習區段A13是用以說明「投影機運作原理」的影片,學習區段B11則是用以說明「投影機結構」的簡報檔,則當使用者在瀏覽學習區段A13時,資料分析系統100將可推薦使用者一併瀏覽學習區段B11。
請參閱第3圖,係根據本揭示內容之部分實施例繪示的資料分析方法示意圖。資料分析方法係透過下列步驟S301~S311,對第一學習資料131a分段及產生第一關鍵字串。在步驟S301中,終端裝置200將第一學習資料131a傳送至第一伺服器110。在步驟S302中,第一伺服器110將第一學習資料131a上傳至儲存單元130。在步驟S303中,儲存單元130將第一學習資料131a儲存於課程資料庫131。在步驟S304中,儲存單元130通知第一伺服器110儲存動作完成。
在步驟S305中,第一伺服器110傳送分析訊息至第二伺服器120。在步驟S306及步驟S307中,第二伺服器120傳送要求訊息至儲存單元130,以儲存單元130處取得第一學習資料131a。第二伺服器120以前述方式加入第一分段標記,以及對每一個第一學習區段產生各自的第一關鍵字串。在步驟S308中,第二伺服器120將第一分段標記及對應的第一關鍵字串上傳至儲存單元130,使儲存單元130將第一分段標記及對應的第一關鍵字串儲存於分析資料庫132中。接著,儲存單元130傳送完成訊息至第二伺服器120,並透過第二伺服器120將完成訊息傳送給第一伺服器110,以在線上學習系統的介面上顯示「學習資料上傳建檔完成」的訊息給使用者。
請參閱第4圖,係根據本揭示內容之部分實施例繪示的資料分析方法示意圖。資料分析方法係透過下列步驟S401~S408,根據分析指令(如:第一搜尋指令)搜尋學習資料及學習區段。在步驟S401中,終端裝置200發送分析指令至第一伺服器110。在步驟S402及步驟S403中,第一伺服器110將分析指令中的第一搜尋指令傳送至第二伺服器120,且第二伺服器120根據第一搜尋指令,搜尋儲存單元130中的學習資料。在步驟S404中,第二伺服器120由儲存單元130處取得篩選出的學習資料。如果篩選出的學習資料為複數筆,例如第二學習資料131b及第三學習資料131c,則在步驟S405及步驟S406中,第二伺服器120從儲存單元130中的行為資料庫133中取得行為資料,以比對第二學習資料131b及第三學習資料131c與行為資料(如:第一關鍵字串)的相似度,以產生搜尋清單。最後,在步驟S407中,第二伺服器120將搜尋清單傳送給第一伺服器110,且在步驟S408中,第一伺服器110將搜尋清單顯示於線上學習系統的介面,以供使用者瀏覽或下載。
雖然本揭示內容已以實施方式揭露如上,然其並非用以限定本發明內容,任何熟習此技藝者,在不脫離本發明內容之精神和範圍內,當可作各種更動與潤飾,因此本發明內容之保護範圍當視後附之申請專利範圍所界定者為準。
100:資料分析系統110:第一伺服器120:第二伺服器130:儲存單元131:課程資料庫131a:第一學習資料131b:第二學習資料131c:第三學習資料132:分析資料庫133:行為資料庫134:推薦資料庫200:終端裝置A1:文字檔案A11:學習區段A12:學習區段A13:學習區段A14:學習區段A21:學習區段A22:學習區段B1:影像檔案B01:影像畫面B02:影像畫面B03:影像畫面B04:影像畫面B11:學習區段B12:學習區段T1:第一關連性標記T2:第二關連性標記S301~S311:步驟S401~S408:步驟
第1圖為根據本揭示內容之部分實施例所繪示的資料分析系統的示意圖。 第2A圖為根據本揭示內容之部分實施例所繪示的第一學習資料之文字檔案示意圖。 第2B圖為根據本揭示內容之部分實施例所繪示的第一學習資料之影像畫面示意圖。 第3圖為根據本揭示內容之部分實施例所繪示的資料分析方法的示意圖。 第4圖為根據本揭示內容之部分實施例所繪示的資料分析方法的示意圖。
100:資料分析系統
110:第一伺服器
120:第二伺服器
130:儲存單元
131:課程資料庫
131a:第一學習資料
131b:第二學習資料
131c:第三學習資料
132:分析資料庫
133:行為資料庫
134:推薦資料庫
200:終端裝置

Claims (16)

  1. 一種資料分析方法,包含:接收一第一學習資料;在該第一學習資料中加入複數個第一分段標記,以在該第一學習資料上劃分出複數個第一學習區段;根據該些第一學習區段中的每一者,產生對應每一第一學習區段各自的一第一關鍵字串;接收與使用者操作相關的一分析指令;對該分析指令與每一第一學習區段各自的該第一關鍵字串進行分析,以得到該分析指令與對應每一第一學習區段的複數個第一相似度;由該些第一學習區段篩選出具有一最高相似度的其中一個第一學習區段;以及將篩選出之該第一學習區段整合為一分析訊息,且將該分析訊息傳送至該終端裝置,使該終端裝置顯示該分析訊息。
  2. 如請求項1所述之資料分析方法,其中該第一學習資料包含一文字檔案,該分析方法還包含:對該文字檔案進行分析處理,以產生複數個特徵句,其中該些特徵句之間具有先後關係;以及判斷相鄰之該些特徵句的相似度,以產生該些第一分段標記。
  3. 如請求項1所述之資料分析方法,其中該第一學習資料包含複數個影像畫面,該分析方法還包含:判斷相鄰之該些影像畫面的相似度,以產生該些第一分段標記。
  4. 如請求項1所述之資料分析方法,其中該第一學習資料包含一文字檔案,該資料分析方法還包含:對該文字檔案進行分析處理,以產生複數個特徵字;在該第一學習資料上劃分出該些第一學習區段後,判斷該些特徵字於每一第一學習區段中的數量;以及將數量大於一門檻值的該些特徵字設定為該第一關鍵字串。
  5. 如請求項1所述之資料分析方法,其中該分析指令包含一第一搜尋指令,該資料分析方法還包含:對該第一搜尋指令進行分析處理,以產生一第一搜尋字串;以及利用該第一搜尋字串,計算該第一搜尋指令與對應每一第一學習區段的該些第一相似度。
  6. 如請求項5所述之資料分析方法,還包含:將具有該最高相似度的其中一個第一學習區段及對應的其中一個第一學習資料傳送至一終端裝置,且據以產生一行為資料。
  7. 如請求項6所述之資料分析方法,還包含:將該第一學習資料儲存至一儲存單元中,其中該儲存單元還儲存有一第二學習資料及一第三學習資料,該第二學習資料根據複數個第二分段標記被劃分為複數個第二學習區段,且每一第二學習區段各自包含一第二關鍵字串;該第三學習資料根據複數個第三分段標記被劃分為複數個第三學習區段,且每一第三學習區段各自包含一第三關鍵字串。
  8. 如請求項7所述之資料分析方法,還包含:接收一第二搜尋指令;根據該第二搜尋指令,由該儲存單元中篩選出該第二學習資料及該第三學習資料;根據該行為資料,計算該第一關鍵字串分別與該第二關鍵字串及該第三關鍵字串的複數個第二相似度;以及根據該些第二相似度,排序該第二學習資料及該第三學習資料,以產生一搜尋清單。
  9. 一種資料分析系統,包含:一第一伺服器,用以接收一第一學習資料;一儲存單元,用以從該第一伺服器接收並儲存該第一學習資料;以及一第二伺服器,用以在該第一學習資料中加入複數個第一分段標記,以在該第一學習資料上劃分出複數個第一學習 區段;該第二伺服器用以根據該些第一學習區段每一者,產生對應每一第一學習區段各自的一第一關鍵字串;該第二伺服器用以接收一分析指令,並對該分析指令與每一第一學習區段各自的該第一關鍵字串進行分析,以得到該分析指令與對應每一第一學習區段的複數個第一相似度,且該第二伺服器由該些第一學習區段篩選出具有一最高相似度的其中一個第一學習區段,該第二伺服器還用以將篩選出之該第一學習區段整合為一分析訊息,且將該分析訊息傳送至該終端裝置,使該終端裝置顯示該分析訊息。
  10. 如請求項9所述之資料分析系統,其中該第一學習資料包含一文字檔案,且第二伺服器用以對該文字檔案進行分析處理,以產生複數個特徵句,其中該些特徵句間具有先後關係;該第二伺服器還用以判斷相鄰之該些特徵句的相似度,以產生該些第一分段標記。
  11. 如請求項9所述之資料分析系統,其中該第一學習資料包含複數個影像畫面,該第二伺服器用以判斷相鄰之該些影像畫面的相似度,以產生該些第一分段標記
  12. 如請求項9所述之資料分析系統,其中該第一學習資料包含一文字檔案,該第二伺服器用以對該文字檔案進行分析處理,以產生複數個特徵字;在該第一學習資料上劃分出該些第一學習區段後,該第二伺服器用以判斷該些特 徵字於每一第一學習區段中的數量,且將數量大於一門檻值的該些特徵字設定為該第一關鍵字串。
  13. 如請求項9所述之資料分析系統,其中該分析指令包含一第一搜尋指令;該第二伺服器用以對該第一搜尋指令進行分析處理,以產生一第一搜尋字串,且利用該第一搜尋字串,計算該第一搜尋指令與對應每一第一學習區段的該些第一相似度。
  14. 如請求項13所述之資料分析系統,其中該第二伺服器用以將具有該最高相似度的其中一個第一學習區段及對應的其中一個第一學習資料傳送至一終端裝置,且據以產生一行為資料。
  15. 如請求項14所述之資料分析系統,其中該儲存單元中還儲存有一第二學習資料及一第三學習資料,該第二學習資料根據複數個第二分段標記被劃分為複數個第二學習區段,且每一第二學習區段各自包含一第二關鍵字串;該第三學習資料根據複數個第三分段標記被劃分為複數個第三學習區段,且每一第三學習區段各自包含一第三關鍵字串。
  16. 如請求項15所述之資料分析系統,其中該第二伺服器用以根據一第二搜尋指令,由該儲存單元中篩選出 該第二學習資料及該第三學習資料;該第二伺服器還用以根據該行為資料,計算該第一關鍵字串分別與該第二關鍵字串及該第三關鍵字串的複數個第二相似度,且根據該些第二相似度,排序該第二學習資料及該第三學習資料,以產生一搜尋清單。
TW108104065A 2018-09-07 2019-02-01 資料分析方法及資料分析系統 TWI709905B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862728082P 2018-09-07 2018-09-07
US62/728,082 2018-09-07

Publications (2)

Publication Number Publication Date
TW202011231A TW202011231A (zh) 2020-03-16
TWI709905B true TWI709905B (zh) 2020-11-11

Family

ID=69745778

Family Applications (5)

Application Number Title Priority Date Filing Date
TW108104097A TWI699663B (zh) 2018-09-07 2019-02-01 分段方法、分段系統及非暫態電腦可讀取媒體
TW108104107A TWI725375B (zh) 2018-09-07 2019-02-01 資料搜尋方法及其資料搜尋系統
TW108104065A TWI709905B (zh) 2018-09-07 2019-02-01 資料分析方法及資料分析系統
TW108104105A TWI700597B (zh) 2018-09-07 2019-02-01 分段方法、分段系統及非暫態電腦可讀取媒體
TW108111842A TWI696386B (zh) 2018-09-07 2019-04-03 多媒體資料推薦系統及多媒體資料推薦方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW108104097A TWI699663B (zh) 2018-09-07 2019-02-01 分段方法、分段系統及非暫態電腦可讀取媒體
TW108104107A TWI725375B (zh) 2018-09-07 2019-02-01 資料搜尋方法及其資料搜尋系統

Family Applications After (2)

Application Number Title Priority Date Filing Date
TW108104105A TWI700597B (zh) 2018-09-07 2019-02-01 分段方法、分段系統及非暫態電腦可讀取媒體
TW108111842A TWI696386B (zh) 2018-09-07 2019-04-03 多媒體資料推薦系統及多媒體資料推薦方法

Country Status (4)

Country Link
JP (3) JP6829740B2 (zh)
CN (5) CN110889034A (zh)
SG (5) SG10201905236WA (zh)
TW (5) TWI699663B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI756703B (zh) * 2020-06-03 2022-03-01 南開科技大學 數位學習系統及其方法
CN117351794A (zh) * 2023-10-13 2024-01-05 浙江上国教育科技有限公司 基于云平台的在线课程管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130055097A1 (en) * 2005-09-14 2013-02-28 Jumptap, Inc. Management of multiple advertising inventories using a monetization platform
TWI513286B (zh) * 2012-08-28 2015-12-11 Ind Tech Res Inst 影片續播方法及系統
TWI571756B (zh) * 2015-12-11 2017-02-21 財團法人工業技術研究院 用以分析瀏覽記錄及其文件之方法及其系統
CN107256262A (zh) * 2017-06-13 2017-10-17 西安电子科技大学 一种基于物体检测的图像检索方法

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311539A (ja) * 1994-05-17 1995-11-28 Hitachi Ltd 教材編集支援システム
KR100250540B1 (ko) * 1996-08-13 2000-04-01 김광수 캡션 비디오 cd 재생장치를 이용한 외국어 받아쓰기 학습방법
JP2002041823A (ja) * 2000-07-27 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> 情報配信装置、情報受信装置及び情報配信システム
JP3685733B2 (ja) * 2001-04-11 2005-08-24 株式会社ジェイ・フィット マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
JP2002341735A (ja) * 2001-05-16 2002-11-29 Alice Factory:Kk ブロードバンド・ディジタル・ラーニング・システム
CN1432932A (zh) * 2002-01-16 2003-07-30 陈雯瑄 英文测验及成绩评估方法及系统
TW200411462A (en) * 2002-12-20 2004-07-01 Hsiao-Lien Wang A method for matching information exchange on network
WO2004090752A1 (en) * 2003-04-14 2004-10-21 Koninklijke Philips Electronics N.V. Method and apparatus for summarizing a music video using content analysis
JP4471737B2 (ja) * 2003-10-06 2010-06-02 日本電信電話株式会社 グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム
JP4426894B2 (ja) * 2004-04-15 2010-03-03 株式会社日立製作所 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP2005321662A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 学習支援装置および方法
JP2006003670A (ja) * 2004-06-18 2006-01-05 Hitachi Ltd 教育コンテンツ提供システム
EP1866892A1 (en) * 2005-03-31 2007-12-19 Koninklijke Philips Electronics N.V. Augmenting lectures based on prior exams
WO2008023470A1 (fr) * 2006-08-21 2008-02-28 Kyoto University Procédé de recherche de phrase, moteur de recherche de phrase, programme informatique, support d'enregistrement et stockage de document
TW200825900A (en) * 2006-12-13 2008-06-16 Inst Information Industry System and method for generating wiki by sectional time of handout and recording medium thereof
JP5010292B2 (ja) * 2007-01-18 2012-08-29 株式会社東芝 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
JP5158766B2 (ja) * 2007-10-23 2013-03-06 シャープ株式会社 コンテンツ選択装置、テレビジョン、コンテンツ選択プログラム及び記憶媒体
TW200923860A (en) * 2007-11-19 2009-06-01 Univ Nat Taiwan Science Tech Interactive learning system
CN101382937B (zh) * 2008-07-01 2011-03-30 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
US8140544B2 (en) * 2008-09-03 2012-03-20 International Business Machines Corporation Interactive digital video library
CN101453649B (zh) * 2008-12-30 2011-01-05 浙江大学 压缩域视频流的关键帧提取方法
JP5366632B2 (ja) * 2009-04-21 2013-12-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 検索サポートキーワード提示装置、方法及びプログラム
JP5493515B2 (ja) * 2009-07-03 2014-05-14 富士通株式会社 携帯端末装置、情報検索方法および情報検索プログラム
WO2011088412A1 (en) * 2010-01-15 2011-07-21 Apollo Group, Inc. Dynamically recommending learning content
JP2012038239A (ja) * 2010-08-11 2012-02-23 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
US8839110B2 (en) * 2011-02-16 2014-09-16 Apple Inc. Rate conform operation for a media-editing application
CN102222227B (zh) * 2011-04-25 2013-07-31 中国华录集团有限公司 基于视频识别与提取影片图像的系统
CN102348049B (zh) * 2011-09-16 2013-09-18 央视国际网络有限公司 检测视频片断切点位置的方法及装置
CN102509007A (zh) * 2011-11-01 2012-06-20 北京瑞信在线系统技术有限公司 多媒体教学评估方法及系统、装置以及多媒体教学系统
JP5216922B1 (ja) * 2012-01-06 2013-06-19 Flens株式会社 学習支援サーバ、学習支援システム、及び学習支援プログラム
US9846696B2 (en) * 2012-02-29 2017-12-19 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and methods for indexing multimedia content
US20130263166A1 (en) * 2012-03-27 2013-10-03 Bluefin Labs, Inc. Social Networking System Targeted Message Synchronization
US9058385B2 (en) * 2012-06-26 2015-06-16 Aol Inc. Systems and methods for identifying electronic content using video graphs
CN102937972B (zh) * 2012-10-15 2016-06-22 上海外教社信息技术有限公司 一种视听字幕制作系统及方法
WO2014100893A1 (en) * 2012-12-28 2014-07-03 Jérémie Salvatore De Villiers System and method for the automated customization of audio and video media
JP6205767B2 (ja) * 2013-03-13 2017-10-04 カシオ計算機株式会社 学習支援装置、学習支援方法、学習支援プログラム、学習支援システム、およびサーバ装置
TWI549498B (zh) * 2013-06-24 2016-09-11 wu-xiong Chen Variable audio and video playback method
CN104572716A (zh) * 2013-10-18 2015-04-29 英业达科技有限公司 影音文件播放的系统及其方法
KR101537370B1 (ko) * 2013-11-06 2015-07-16 주식회사 시스트란인터내셔널 녹취된 음성 데이터에 대한 핵심어 추출 기반 발화 내용 파악 시스템과, 이 시스템을 이용한 인덱싱 방법 및 발화 내용 파악 방법
US20150206441A1 (en) * 2014-01-18 2015-07-23 Invent.ly LLC Personalized online learning management system and method
CN104123332B (zh) * 2014-01-24 2018-11-09 腾讯科技(深圳)有限公司 搜索结果的显示方法及装置
US9892194B2 (en) * 2014-04-04 2018-02-13 Fujitsu Limited Topic identification in lecture videos
US9253511B2 (en) * 2014-04-14 2016-02-02 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for performing multi-modal video datastream segmentation
JP6334431B2 (ja) * 2015-02-18 2018-05-30 株式会社日立製作所 データ分析装置、データ分析方法、およびデータ分析プログラム
US20160239155A1 (en) * 2015-02-18 2016-08-18 Google Inc. Adaptive media
CN105047203B (zh) * 2015-05-25 2019-09-10 广州酷狗计算机科技有限公司 一种音频处理方法、装置及终端
CN104978961B (zh) * 2015-05-25 2019-10-15 广州酷狗计算机科技有限公司 一种音频处理方法、装置及终端
CN105978800A (zh) * 2016-07-04 2016-09-28 广东小天才科技有限公司 一种向移动终端推送题目的方法、系统和服务器
CN106202453B (zh) * 2016-07-13 2020-08-04 网易(杭州)网络有限公司 一种多媒体资源推荐方法和装置
CN106231399A (zh) * 2016-08-01 2016-12-14 乐视控股(北京)有限公司 视频分割方法、设备以及系统
CN106331893B (zh) * 2016-08-31 2019-09-03 科大讯飞股份有限公司 实时字幕显示方法及系统
CN108122437A (zh) * 2016-11-28 2018-06-05 北大方正集团有限公司 自适应学习方法及装置
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130055097A1 (en) * 2005-09-14 2013-02-28 Jumptap, Inc. Management of multiple advertising inventories using a monetization platform
TWI513286B (zh) * 2012-08-28 2015-12-11 Ind Tech Res Inst 影片續播方法及系統
TWI571756B (zh) * 2015-12-11 2017-02-21 財團法人工業技術研究院 用以分析瀏覽記錄及其文件之方法及其系統
CN107256262A (zh) * 2017-06-13 2017-10-17 西安电子科技大学 一种基于物体检测的图像检索方法

Also Published As

Publication number Publication date
CN110888896B (zh) 2023-09-05
SG10201905236WA (en) 2020-04-29
SG10201906347QA (en) 2020-04-29
JP6829740B2 (ja) 2021-02-10
TWI696386B (zh) 2020-06-11
TW202011232A (zh) 2020-03-16
SG10201905523TA (en) 2020-04-29
TW202011221A (zh) 2020-03-16
CN110888994A (zh) 2020-03-17
CN110888896A (zh) 2020-03-17
TW202011749A (zh) 2020-03-16
CN110891202A (zh) 2020-03-17
SG10201907250TA (en) 2020-04-29
CN110891202B (zh) 2022-03-25
JP2020042770A (ja) 2020-03-19
TWI700597B (zh) 2020-08-01
TWI699663B (zh) 2020-07-21
TW202011231A (zh) 2020-03-16
TWI725375B (zh) 2021-04-21
CN110895654A (zh) 2020-03-20
SG10201905532QA (en) 2020-04-29
JP2020042777A (ja) 2020-03-19
CN110889034A (zh) 2020-03-17
JP2020042771A (ja) 2020-03-19
TW202011222A (zh) 2020-03-16

Similar Documents

Publication Publication Date Title
US9418375B1 (en) Product recommendation using sentiment and semantic analysis
US9734261B2 (en) Context aware query selection
US11734289B2 (en) Methods, systems, and media for providing a media search engine
WO2017005054A1 (zh) 视频推荐方法、服务器和存储介质
WO2017096877A1 (zh) 一种推荐方法和装置
CN109635155B (zh) 为用户推送视频的方法、装置、电子设备及存储介质
WO2018000575A1 (zh) 基于人工智能的搜索结果聚合方法、装置以及搜索引擎
CN111274442B (zh) 确定视频标签的方法、服务器及存储介质
US9529893B1 (en) Search engine analytics and optimization for media content in social networks
US11388244B1 (en) Method, device, and program product for managing computer system
TWI709905B (zh) 資料分析方法及資料分析系統
US9432477B2 (en) Identifying matching video content
US11386163B2 (en) Data search method and data search system thereof for generating and comparing strings
KR20190109628A (ko) 개인화된 기사 컨텐츠 제공 방법 및 장치
US11409804B2 (en) Data analysis method and data analysis system thereof for searching learning sections
US20190272330A1 (en) Method and device for categorizing multimedia resources
KR102262953B1 (ko) 스파스 토픽들을 위한 분류자 리콜 추정
US11595614B1 (en) Intelligent reframing
WO2015012720A1 (ru) Способ проверки веб-страниц на наличие в них мультимедийных потоков реального времени и компьютерно-реализуемая система для осуществления способа
KR20230144685A (ko) 미디어 컨텐츠 생성 방법
Pedro et al. Web‐Based Multimedia Information Extraction Based on Social Redundancy