TWM653967U

TWM653967U - 課室語言語料庫平台

Info

Publication number: TWM653967U
Application number: TW112211605U
Authority: TW
Inventors: 鍾鎮城; 林雅綺; 林慧君; 李舒蓉; 張雅玲; 楊岑萱; 張喬閔
Original assignee: 國立高雄師範大學
Filing date: 2023-10-26
Publication date: 2024-04-11

Abstract

一種運用於課室語言語料庫平台，包含有：影像製作系統、管理伺服器、教師管理端、影像資料庫以及語料編輯資料庫所構成；管理人員透過該管理伺服器進行所有教師管理端之人員管理；所有教師管理端則透過前述的影像製作系統上傳語言課程之影片資料；並且透過該語料編輯資料庫建立第一語言字幕或第二語言字幕之字幕資訊，能提供使用者快速分辨出影片資料中的語言類型，又該語料編輯資料庫能將字幕資訊進行語料查詢，以方便學員使用者查詢課堂語言資料，以及在應用前取得字幕資訊的文字稿，無須再分心謄寫。

Description

課室語言語料庫平台

本新型語料庫所運用的字幕平台設備，特別指一種課室語言語料庫平台；本新型的語料庫平台系統可運用在客語教學、英語教學、或者特定語言教學，能讓學習者透過線上學習以獲得課堂教學的語言意思、近似之發音方式，使學習可事半功倍，同時方便教學及研究人員編輯教材與編製課程。

多語言學習除能促進人們之間溝通互動的效率之外，在這過程中也會增進對於語言多樣性的理解。並且學習多種語言可提升自身智能、文化敏感度及人際間的社交能力。

近年來，線上學習成為許多人的選擇，但是線上學習大多要配合字幕，學習者才能得知老師講授之內容及課堂中其他學習者的語詞使用，故如何在課室語言中配上字幕是線上教學相當重要的一環。

以下將以本案創作人的客語課室為例，說明課堂中的字幕嵌入影片作法：

步驟一：教學老師利用影像錄製設備紀錄客語課室語言，錄製完成後將客語課室影像上傳到一影像資料庫。

步驟二：字幕編製人員從影像資料庫調出客語課室影像資料，進行字幕聽寫，進而建立出文字稿，再從文字稿建立字幕格式。

步驟三：將字幕配合客語課室語音時間點，嵌入字幕於客語課室影像中，提供給使用者。

但是，上述的客語課室經驗，所遇到的困擾大致有：

1.上課的過程除了使用客語外，也會夾雜國語，甚至是台語、英語；學習者在觀看線上課程時無法得知發言者(無論是老師、或者課堂中的學生)是以客語、國語、台語、或英語進行發言，有一些發言者可能會用一些民俗俚語，若字幕無法充分表達發言者所說的內容，對於學習者在理解客語時會產生相當大的困擾。

2.使用者只能從客語課室影像的字幕取得客語的相關資訊(例如發音、字彙解釋)，除非有聽寫能力，否則須要多次觀看影片內容；換言之即是使用者在觀看客語影片前，需要先取得文字稿，這樣才能對應客語課程的內容，減少學習者在學習的困擾。

3.目前線上學習大多會整合大數據資料庫，以客語而言就有分成多種腔調，字幕編製人員需要理解各種腔調發音的涵義，若能將常用在課堂上的客語資訊，藉由大數據資料庫進行整合，並將整合後的資料儲存於資料庫中，未來無論是由人工編製字幕、或者AI辨識語音內容進行字幕編製，相信都能提升字幕用字正確率、加快字幕編製等多重優點。

本新型主要目的，在提供一種課室語言語料庫平台，方便建立課堂語言使用之語料庫，提供語料的正確性及真實性。

本新型的次要目的，在提供一種課室語言語料庫平台，特別針對課堂教學的語言建立該種語言的語料，並在上課前提供學習者文字稿，進而讓學習者在上課時不需要額外分心，進而讓學習能夠有聽、說、讀的正確性；甚至透過文字稿讓學習者了解其他語言中的文化意涵。

緣此，本新型的結構，是用於產生語言課堂中的字幕資訊，其包含有：多個影像製作系統、多組教師管理端、至少一管理伺服器、至少一影像資料庫與至少一語料編輯資料庫所構成；該影像製作系統與該教師管理端連線，並受到該教師管理端控制錄製課程影片；前述的影像製作系統包含有一攝影裝置以及一收音裝置所構成，該攝影裝置用於錄製一語言課程之影像資訊，該收音裝置則是錄製語言課程之聲音資訊，又該影像製作系統將前述的影像資訊及聲音資訊彙整後整合成一影片資料；該教師管理端與前述影像製作系統連線，該教師管理端將該影像製作系統所錄製的語言課程之影片資料儲存於該影像資料庫；該管理伺服器用於建立與管理語言課程之教師身分、以及提供管理該影像資料庫內的語言課程之影片資料，且該管理伺服器會與前述的教師管理端、影像資料庫連接；該影像資料庫與該語料編輯資料庫連線，該影像資料庫儲存多筆該教師管理端所傳送的影片資料，該語料編輯資料庫用於儲存多筆對應語言課程之影片資料之字幕資訊，又該字幕資訊至少包含有一註記為主要第一語言字幕、一第二語言字幕，又前述的語料編輯資料庫提供字幕資訊的語料查詢，以及將該些字幕資訊匯出成文字稿之功能；據此，管理人員透過該管理伺服器進行各該教師管理端之人員管理；各該教師管理端則透過前述的影像製作系統上傳語言課程之影片資料到該影像資料庫；並且透過該語料編輯資料庫建立前述的第一語言字幕、第二語言字幕之字幕資訊，能提供學習者快速分辨出影片資料中的語言類型，又該語料編輯資料庫能將字幕資訊進行語料查詢，以及在上課前取得字幕資訊的文字稿，無須分心聽寫。

在本新型的實施例，其中，該字幕資訊是由字幕製作人員所建立，再將該字幕資訊上傳到該語料編輯資料庫。

在本新型的實施例，其中，該字幕資訊係透過該影像製作系統之聲音資訊進行語音辨識後，形成一文字稿資料，該文字稿資料提供至少一字幕製作人員進行校稿後，上傳至該語料編輯與分析資料庫。

在本新型的實施例，其中，該語料編輯資料庫根據該第一語言字幕與該第二語言字幕的顯示次數進行統計，並加以輸出成報表資料。

在本新型的實施例，其中，該語料編輯資料庫之字幕資訊更包含有一模糊語字幕，前述的模糊語字幕係用於顯示無法分辨出是第一語言、或者是第二語言時產生的字幕，又，該模糊語字幕用於數據的收集，根據模糊語出現的次數推得該模糊語的涵意，以及對模糊語進行辨識。

透過上述說明，本新型的特點與功效簡述如下：

1.本新型能提供字幕資訊輸出，在上課前學習者能從本新型的語料編輯資料庫取得文字稿，讓上課時能仔細聽課，避免因聽寫造成分心的情況發生。

2.本新型的字幕資訊可由字幕製作人員透過專用字幕軟體合成字幕於語言課程的影片資料內，也可透過語音辨識軟體，將影片資料中的聲音資訊進行辨識，並且生成文字稿，據此，字幕製作人員無須進行聽寫，能簡化編輯文字稿過程，增進工作效率。

3.本新型能提供語料查詢，使用者能透過本新型的系統取得不同語言發音，並且當語料編輯資料庫的數據收集越多時，能增進字幕資訊製作效率。

10:影像製作系統

11:攝影裝置

11A:影像資訊

12:收音裝置

12A:聲音資訊

13:影片資料

20:教師管理端

30:管理伺服器

40:影像資料庫

50:語料編輯資料庫

51:字幕資訊

511:第一語言字幕

512:第二語言字幕

513:模糊語字幕

52:語料查詢

53:文字稿

圖1：本新型的系統圖。

圖2：本新型進行錄製影片之流程圖。

圖3：本新型教師管理端的使用示意圖。

圖4：影片資料庫與語料編輯資料庫的使用示意圖。

圖5：語料編輯資料庫進行字幕資訊製作的流程圖。

圖6：語料編輯資料庫進行字幕資訊匯出與查詢的示意圖。

如圖1所示，本新型課室語言語料庫平台，包含有：二組影像製作系統10、二組教師管理端20、一管理伺服器30、一影像資料庫40與一語料編輯資料庫50所構成。

如圖1、圖2所示，各該影像製作系統10與該教師管理端20連線，並受到該教師管理端20控制錄製課程影片；前述的影像製作系統10包含有一攝影裝置11以及一收音裝置12所構成，該攝影裝置11用於錄製一語言課程之影像資訊11A，該收音裝置12則是錄製語言課程之聲音資訊12A，又該影像製作系統10將前述的影像資訊11A及聲音資訊12A彙整後整合成一影片資料13。

如圖1、圖3所示，各該教師管理端20與前述影像製作系統10連線，該教師管理端20將該影像製作系統10所錄製的語言課程之影片資料13儲存於該影像資料庫40，且該管理伺服器30會與前述的教師管理端20、影像資料庫40連接。

如圖1所示，該管理伺服器30用於建立與管理語言課程之教師身分、以及提供管理該影像資料庫40內的語言課程之影片資料13。

如圖1、圖4至圖6所示，該影像資料庫40與該語料編輯資料庫50連線，該影像資料庫40儲存多筆該教師管理端20所傳送的影片資料13，該語料編輯資料庫 50用於儲存多筆對應語言課程之影片資料13之字幕資訊51，又該字幕資訊51至少包含有一註記為主要第一語言字幕511、一第二語言字幕512，又前述的語料編輯資料庫50提供字幕資訊51的語料查詢52，以及將該些字幕資訊51匯出成文字稿53之功能。

在本新型的實施例中，該字幕資訊51是由字幕製作人員透過聲音資訊12A進行聽寫所建立，再將該字幕資訊51上傳到該語料編輯資料庫50；進一步，該字幕資訊51是透過語音辨識軟體如使用Microsoft365、或者Google文件、或者Open AI Whisper、或者Good Tape等進行語音辨識聽寫，並形成一文字稿53，該文字稿53資料提供字幕製作人員進行校稿後，上傳至該語料編輯資料庫50，如此一來能減輕字幕製作人員工作量，並提高字幕製作效率。

上述即是本新型的介紹，接著介紹本新型的實施方式以及可獲得之功效。

1.本新型的實施例以客語教學為例，但實際運用不侷限於此；首先，管理人員透過該管理伺服器30進行各該教師管理端20之人員管理。

2.各該教師管理端20之老師，透過影像製作系統10之攝影裝置11、收音裝置12進而製作客語課堂中的影片資料13，並將前述的影片資料13上傳到影像資料庫40。

3.可以透過字幕編輯人員、或者AI軟體系統，依據儲存於該影像資料庫40進行字幕的編輯，並從前述的客語課程中分析出第一語言字幕511(即是客語字幕)、第二語言字幕512(即是國語字幕)，甚至是課堂中使用的台語、英語或者其他語言經過編輯後，將字幕資訊51透過該語料編輯資料庫50嵌人影片資料13，以便線上學習者進行客語學習。

4.該語料編輯資料庫50能將字幕資訊51進行語料查詢52，以方便學習者查詢客語資料，以及在上課前取得字幕資訊51的文字稿53，無須分心聽寫。

5.另外，該語料編輯資料庫50根據該第一語言字幕511與該第二語言字幕512的顯示次數進行統計，並加以輸出成報表資料，因此，可提供管理伺服器30的管理人員、教師管理端20的教師、以及聽課的學習者得知該影片資料13的課程中有多少次使用客語、國語的次數，進一步的前述的資料更可提供大數據資料庫進行AI語音辨識訓練，若日後進行字幕資訊51內容編輯時，可根據常用的語音內容，快速找出對應的字彙內容資訊，提供字幕資訊51的正確率，以及字幕資訊51製作效率提高。

6.進一步的，該語料編輯資料庫50之字幕資訊51更包含有一模糊語字幕513，前述的模糊語字幕513係用於顯示無法分辨出是客語、或者是國語、或者發音不標準時產生的字幕，又，該模糊語字幕513用於數據的收集，根據模糊語出現的次數推得該模糊語的涵意，以及對模糊語進行辨識得知為國語、或者是台語、或者是因為發音不標準進而讓上課的教師調整課程內容，使得學習者能正確的說、聽、讀客語之功效。

綜上所述，本新型所提供的語料庫平台均未曾見於諸書刊或公開使用，誠符合新型專利申請要件，懇請鈞局明鑑，早日准予專利，至為感禱。

需陳明者，以上所述乃是本新型之具體實施例與所運用之技術原理，若依本新型之構想所作之改變，其所產生之功能仍未超出說明書及圖式所涵蓋之精神時，均應在本新型之範圍內，合予陳明。