TWI590240B - 會議記錄裝置及其自動生成會議記錄的方法 - Google Patents
會議記錄裝置及其自動生成會議記錄的方法 Download PDFInfo
- Publication number
- TWI590240B TWI590240B TW103146228A TW103146228A TWI590240B TW I590240 B TWI590240 B TW I590240B TW 103146228 A TW103146228 A TW 103146228A TW 103146228 A TW103146228 A TW 103146228A TW I590240 B TWI590240 B TW I590240B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- voice data
- text
- module
- conference
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 67
- 230000001915 proofreading effect Effects 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 5
- 239000012634 fragment Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 16
- 238000012937 correction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/109—Time management, e.g. calendars, reminders, meetings or time accounting
- G06Q10/1091—Recording time for administrative or management purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Document Processing Apparatus (AREA)
Description
本發明涉及一種會議記錄裝置及其自動生成會議記錄的方法。
現有的會議中報告及記錄的方法,通常是利用攝像機、麥克風、錄音筆等設備對會議過程中各人員的發言進行錄音及錄影。會後做會議記錄的人員可以查看、重播錄音及錄影以整理會議記錄。然而,通過人工對語音資料進行標注和提取,對用戶來說,費時且極為不便。
鑒於此,有必要提供一種會議記錄裝置及自動生成會議記錄的方法,能夠自動生成會議記錄,以解決上述問題。
本發明提供一種會議記錄裝置,包括記憶體和處理器。所述會議記錄裝置還包括由所述處理器控制的且存儲於所述記憶體中的如下模組:辨識模組,用於識別語音資料中的無聲片段;判斷模組,用於判斷所述無聲片段所歷經的時間是否大於一預設值;分割模組,用於以歷經的時間大於所述預設值的無聲片段為界,將所述語音資料或所述語音資料轉換得到的文字進行分割;及生成模組,用於根據所述語音資料或所述文字被分割的情況以及所述記憶體中存儲的會議記錄範本生成一原始會議記錄。
本發明還提供一種自動生成會議記錄的方法,運行於包括記憶體和處理器的至少一裝置中。所述方法包括由所述處理器控制所述記憶體中存儲的模組執行的如下步驟:識別步驟:識別語音資料中的無聲片段;判斷步驟:判斷所述無聲片段所歷經的時間是否大於一預設值;分割步驟:以歷經的時間大於所述預設值的無聲片段為界,將所述語音資料或所述語音資料轉換得到的文字進行分割;及生成步驟:根據所述語音資料或所述文字被分割的情況以及所述記憶體中存儲的會議記錄範本生成一原始會議記錄。
本發明所述的會議記錄裝置及其自動生成會議記錄的方法,可根據預設的會議記錄範本自動生成會議記錄,因而,相較於現有的方式更省時、方便及人性化。
100‧‧‧會議記錄裝置
200‧‧‧雲端裝置
1‧‧‧用戶
310‧‧‧原始會議記錄
320‧‧‧編輯後的會議記錄
400、500、600、700‧‧‧自動生成會議記錄的方法
10‧‧‧記憶體
11‧‧‧錄音模組
12‧‧‧轉換模組
13‧‧‧辨識模組
14‧‧‧判斷模組
15‧‧‧校對編輯模組
16‧‧‧生成模組
17‧‧‧發送模組
18‧‧‧分割模組
19‧‧‧控制模組
20‧‧‧語音輸入單元
30‧‧‧觸控式螢幕
40‧‧‧通訊單元
50‧‧‧定位模組
60‧‧‧處理器
S401-S407、S501-S508、S601-S607、S701-S707‧‧‧步驟
圖1為本發明一實施方式的會議記錄裝置的應用環境示意圖。
圖2為圖1所示的會議記錄裝置的一實施方式的功能模組圖。
圖3為本發明一實施方式中,生成的原始會議記錄及編輯後的會議記錄的示意圖。
圖4-圖7分別為本發明不同實施方式的自動生成會議記錄的方法的步驟流程圖。
請參閱圖1,其為本發明的一實施方式的會議記錄裝置100的應用環境示意圖。本實施方式中,會議記錄裝置100可與一雲端裝置200相連接。其中,會議記錄裝置100處於各用戶1的附近,可接收各用戶1在會議或報告上的語
音,即用戶1的發言。會議記錄裝置100和/或雲端裝置200具備根據會議記錄裝置100接收的語音自動生成會議記錄的功能。用戶1為會議或報告的參與者。為了描述方便,以下將會議或報告統一稱為會議。
在一實施方式中,會議記錄裝置100具有自動生成會議記錄的功能,即,可以自行生成會議記錄。且會議記錄裝置100不依賴雲端裝置200,而自行根據其接收的語音自動生成會議記錄。當多個用戶1舉行會議或報告時,會議記錄裝置100可自動記錄各用戶1的語音,並自動將識別各用戶的語音,並將識別到的語音轉換為文字後,按照預設的會議記錄範本自動生成會議記錄,並按照預設的方式自動發送至相關人員。相關人員包括各用戶1和/或其他會議相關人員,例如待辦事項負責人、相關主管等人員。從而實現自動記錄、生成及發送會議記錄的功能。
為說明方便,本段落中的以下括弧中的文字為其前面的文字的簡化的功能說明。具體的請參見如下的說明。會議記錄裝置100可以自動辨識接收的語音的各相應的用戶(辨識語音中的用戶),然後將接收的語音轉換為包括辨識出的用戶的用戶名的文字,或者,將接收的語音自動轉換為文字(語音轉換為文字),然後從文字中識別出各用戶1的用戶名(辨識文字中的用戶)。之後根據上述從語音和/或文字中識別出的用戶名對文字進行段落劃分(根據文字劃分段落)之後,再根據預設的會議記錄範本自動生成會議記錄(生成會議記錄)。會議記錄裝置100還可以根據接收的語音自動識別其中的無聲片段(根據語音辨識無聲片段),根據識別出的無聲片段將語音劃分為多個語音片段(根據語音劃分段落),然後分別將該多個語音片段轉換為對應的文字(語音轉換為文字),再根據預設的會議記錄範本自動生成會議記錄(生成會議記錄)。
會議記錄裝置100還可以自動辨識語音和/或文字資訊中多次重複出現的詞句,並
存儲於常用語資料庫中,因而在生成會議記錄的過程中,可以自動將文字記錄中的詞句校對成常用的詞句。
在另一實施方式中,會議記錄裝置100可以與雲端裝置200進行資料通訊,從而由會議記錄裝置100和雲端裝置200一起或由雲端裝置200單獨根據會議記錄裝置100接收的語音自動生成會議記錄。因而,本發明還可以是由會議記錄裝置100對會議進行錄音,並將所錄的語音轉換為語音信號,將轉換的到的語音信號和/或其他資料(例如根據語音信號轉換得到的文字等)傳輸至至雲端裝置200,而由會議記錄裝置100和/或及雲端裝置200分別執行在上一實施方式中全部由會議記錄裝置100執行的以下功能中的全部或一部分:語音轉換為文字、辨識語音和/或文字中的用戶、根據語音和/或文字識別無聲片段、根據語音和/或文字中劃分段落、生成會議記錄、辨識語音和/或文字中的常用詞句、存儲常用詞句於常用語資料庫,以及根據常用詞句自動校對/編輯文字或會議記錄。
請參閱圖2,其為本發明一實施方式的。需要說明的是,圖2所示僅僅是本發明的一實施方式中的會議記錄裝置100的功能模組圖,對應以上所描述的實現本發明的各實施方式,會議記錄裝置100還可以是只包括圖2中示出的一部分的功能單元/模組。而雲端裝置200則可以包括圖2所示的其他功能單元/模組。例如,在單獨由雲端裝置200執行自動生成會議記錄的功能的實施方式中,會議記錄裝置100可以包括圖2所示的語音輸入單元20、通訊單元40、處理器60,雲端裝置200可以包括相應的通訊單元、處理器以及記憶體10中存儲的模組12-19。以下在需要時將作相應的描述。
本實施方式中,會議記錄裝置100包括一記憶體10、語音輸入單元20、觸控式螢幕30、通訊單元40、定位模組50和處理器60。記憶體10、語音輸入單元20、觸控式螢幕30、通訊單元40通過信號線和資料線分別連接於處理
器60。會議記錄裝置100為一智慧手機,在其他實施方式中,會議記錄裝置100還可以是平板電腦、筆記型電腦、臺式電腦以及會議電話等裝置。
本實施方式中,會議記錄裝置100可獨立自動生成會議記錄。會議記錄裝置100自動根據其語音輸入單元20所接收到的參加會議的用戶1的語音,將接收的語音轉換為文字,之後再根據預設的會議記錄範本自動生成一會議記錄。具體的,會議記錄裝置100可以執行前述的將接收的語音自動轉換為文字、自動辨識接收的語音或轉換後的文字中的用戶、根據辨識出的用戶名對文字進行段落劃分,再根據預設的會議記錄範本自動生成會議記錄。會議記錄裝置100還可以根據接收的語音自動識別其中的無聲片段,根據識別出的無聲片段將語音劃分為多個語音片段,然後分別將該多個語音片段轉換為對應的文字,再根據預設的會議記錄範本自動生成會議記錄。會議記錄裝置100還可以自動辨識語音和/或文字資訊中多次重複出現的詞句,並存儲於常用語資料庫中,因而在生成會議記錄的過程中,可以自動將文字記錄中的詞句校對成常用的詞句。
會議記錄裝置100還可以將生成的會議記錄和/或待辦事項根據預設方式自動發送至相關人員的通訊位址。其中,該預設方式包括預設的發送格式、預設的發送時間等等。相關人員的通訊位址至少包括以下中的一種:電子郵寄地址、電話號碼、社交帳號(例如QQ號碼、微信帳號)等等。
記憶體10中存儲了一用戶語音特徵表,該語音特徵表記錄了多個用戶名及其語音特徵參數的一一對應關係。本實施方式中,用戶名可以是用戶的真實姓名,也可以是昵稱或代號等。該用戶語音特徵表可以預先訓練得到,即,在會議/報告開始之前的一時間內,對各用戶進行語音訓練、採集而得到。
記憶體10中還可以存儲由用戶或系統預設的會議記錄範本。記憶體10還可以用於存儲錄製的語音資料、語音文字轉換所需的語音文字資料庫等,以及常用語資料庫。其中,常用語資料庫是在會議記錄裝置100執行其自動生成會議記錄的
功能的過程中,累積、篩選存儲的,也可以是從一常用語資料庫中下載並存儲的。
本實施方式中,語音輸入單元20用於採集會議時各用戶的語音,並將採集到的語音轉換為語音信號。語音輸入單元20為一麥克風。通訊單元40用於回應處理器60的控制而與雲端裝置200進行資料通訊。定位模組50用於提供會議記錄裝置100的即時位置資訊,其可以是一GPS定位模組。
在一實施方式中,會議記錄裝置100還包括一觸控式螢幕30。
在本實施方式中,記憶體10中還存儲了多個功能模組,該多個功能模組被配置成由一個或多個處理器(本實施方式為一個處理器60)執行,以完成本發明。例如,參閱圖1所示,記憶體10中存儲了錄音模組11、轉換模組12、辨識模組13、判斷模組14、校對編輯模組15、生成模組16、發送模組17、分割模組18和控制模組19。在其他實施方式中,記憶體10中存儲的功能模組還可以根據實際需要作相應的變化,例如,當語音轉換為文字、自動辨識語音和/或文字中的常用詞句、存儲常用詞句於常用語資料庫,以及根據常用詞句自動校對文字等功能中的一或多個功能被設置為由雲端裝置200來執行時,會議記錄裝置100的記憶體10中可以不存儲執行該功能所需的功能模組。本發明所稱的模組是完成一特定功能的程式段,比程式更適合於描述軟體在處理器60中的執行過程。關於各模組的功能將在圖4-圖7的流程圖中具體描述。
需要說明的是,為說明方便,以下關於自動生成會議記錄的方法的介紹中,均是以該方法運行於一包括相應的單元和/或功能模組的會議記錄裝置(例如會議記錄裝置100)中來進行介紹的。根據前面的介紹可知,以下的各自動生成會議記錄的方法中,某些步驟還可以設置由一與會議記錄裝置連接的雲端裝置(例如雲端裝置200)來執行,因此,相應的,需要時,可以在下述的各自動生成會議記錄的方法的步驟中增加會議記錄裝置將語音信號/資料、文字
資料和/或其他資料傳輸至該雲端裝置,以及該雲端裝置接收信號/資料的步驟。
因該些為本領域技術人員可以根據本說明書所揭露的內容實施得到的一些技術手段,因此,為節約篇幅起見,將不在本說明書中一一具體詳細的描述。
如圖4所示,是本發明一實施方式的自動生成會議記錄的方法400的流程圖。自動生成會議記錄的方法400是在一會議記錄裝置(例如會議記錄裝置100)和/或雲端裝置(例如雲端裝置200)的會議記錄功能被開啟後,運行於該會議記錄裝置和/或雲端裝置的,其可以開始於步驟S401、步驟S402或步驟S403。
步驟S401,接收步驟:語音輸入單元20接收語音並將接收的語音轉換為相應的語音信號。本實施方式中,會議記錄裝置100設在會議的用戶1附近,語音輸入單元20為設置於會議記錄裝置100中的麥克風。
在另一實施方式中,還可以在本步驟S401同時或之前執行如下步驟:控制模組19控制開啟定位模組50以獲取一會議記錄裝置100的位置資訊及當前的會議時間資訊,並將獲取的位置資訊及時間資訊存儲於記憶體10中。在其他實施方式中,會議記錄裝置100還可以接收經由觸控式螢幕30輸入的當前會議的相關資訊並存儲,例如,會議日期、時間、地點以及參加會議的人員名等等。
步驟S402,錄音步驟:錄音模組11將所述語音信號錄製成語音資料,並將錄製好的語音資料存儲於記憶體10。在一實施方式中,回應用戶的選擇,本步驟也可以省略,而直接執行步驟S403。
步驟S403,辨識步驟:辨識模組13根據所述語音信號以及記憶體10中存儲的用戶語音特徵表,識別出所述語音信號對應的一或多個用戶。本實施方式中,辨識模組13根據所述語音信號分析得到一或多個語音特徵,並從所述語音特徵表中查詢到相同/最相近的語音特徵對應的一或多個用戶,從而得到語音資料中對應的一或多個用戶。會議或報告進行時,當有多個用戶發言/說話
的時候,辨識模組13即可根據所述語音信號及所述語音特徵表識別出所述語音資料中包含了哪個用戶的聲音。
在另一實施方式中,辨識模組13還給不同的用戶的語音片段加上不同的標籤,同一用戶的語音片段加上相同的標籤。
步驟S404,轉換步驟:轉換模組12將所述語音信號轉換為包含所述一或多個用戶的用戶名的文字。本實施方式中,轉換模組12根據所述語音信號以及記憶體10中存儲的語音文字資料庫,將所述語音信號轉換為文字,並在辨識模組13識別到的一或多個用戶的各用戶的語音信號對應的轉換得到的文字的一預設位置自動添加對應的用戶的用戶名,本實施方式中,預設位置為各用戶的語音信號對應的轉換得到的文字的最前端。
在另一實施方式中,在辨識模組13給不同的用戶的語音片段加上了些標籤時,轉換模組12轉換得到的所述文字還包括了該些標籤。
步驟S405,生成步驟:生成模組16根據轉換得到的所述文字以及記憶體10中存儲的會議記錄範本生成一原始會議記錄。請參閱圖3所示,其示出有一實施方式中,生成模組16生成的一原始會議記錄310。
在一實施方式中,生成模組16還將定位模組50所獲取的位置資訊及時間資訊自動添加到生成的原始會議記錄中。例如,將時間資訊添加到會議記錄範本中的會議日期/時間的欄位元中,將位置資訊添加到會議記錄範本中的會議地點的欄位中,等等。
生成模組16還可以將用戶通過觸控式螢幕30輸入的會議參加者/出席者自動添加到會議記錄範本中的出席者/與會者的欄位中。
在另一實施方式中,生成模組16還可以根據辨識模組13識別到的所述文字中包含的用戶名或辨識模組13根據語音信號辨識得到的發出所述語音
信號對應的語音的用戶的用戶名,自動將該些用戶名添加到會議記錄範本中的出席者/與會者的欄位中。
步驟S406,校對編輯步驟:校對編輯模組15根據預設的校對編輯規則對所述原始會議記錄進行校對和/或編輯,以得到一會議記錄。
本實施方式中,所述預設的校對編輯規則為從所述文字中的每一用戶名處對文字進行段落劃分。辨識模組13還從轉換得到的所述文字中辨識/識別出用戶的用戶名,校對編輯模組15則根據辨識模組13識別到的所述文字中包含的用戶名對所述原始會議記錄進行段落劃分。例如,校對編輯模組15以用戶名的第一個或最後一個字為界來劃分段落。當所述文字中包含用戶名為王大明時,校對編輯模組15則從以王大明這三個文字作為段落的段首。需要說明的是,本實施方式中,優選的,此處所說的用戶名均是由辨識模組13通過辨識語音而得到的用戶的用戶名。在另一實施方式中,該些用戶名還可以是辨識模組13根據記憶體10中原先存儲的用戶名,從所述文字中自動識別出來的。請參閱圖3所示,其示出有一實施方式中,校對編輯模組15對原始會議記錄310進行校對和/或編輯後得到的編輯後的會議記錄320。
在另一實施方式中,所述預設的校對編輯規則為根據辨識模組13給不同的用戶的語音片段加上的標籤,從每一語音片段起始處所對應的文字處對文字段落進行切分。
在再一實施方式中,校對編輯模組15還將校對編輯後的所述會議記錄存儲於所述記憶體10中。或者,發送模組17控制通過通訊單元40將校對編輯後的所述會議記錄發送至所述雲端裝置200,以控制將所述會議記錄存儲於所述雲端裝置200。
在其他實施方式中,校對編輯模組15還根據觸控式螢幕30生成的編輯信號對會議記錄進行編輯。例如,用戶可以通過觸控式螢幕30輸入對原始
會議記錄的編輯內容和/或編輯操作,從而提供了供用戶手動編輯原始會議記錄的功能。此外,所述預設的校對編輯規則還包括智慧識別校對文字等,具體請結合以下根據圖5進行的說明。
步驟S407,發送步驟:發送模組17根據預設的發送規則將經校對和/或編輯後的所述會議記錄自動發送至會議相關人員的通訊位址。本實施方式中,所述預設的發送規則可以為立即發送(即,會議記錄生成後即發送)至會議相關人員的通訊位址,也可以是在會議記錄生成後的一預設時間點發送至會議相關人員的通訊位址。所述會議相關人員可以包括以下人員中的一或多個:會議出席者、會議記錄中出現了其用戶名的用戶、會議記錄中涉及/提及的用戶(例如,待辦事項的用戶)、預設的主管、負責人、責任人等等。
在另一實施方式中,所述預設的發送規則還可以包括在待辦事項的預設到期日前的預設天數發送生成的所述會議記錄至待辦事項相關的人員的通訊位址,例如,可以包括待辦事項的直接責任人、相關主管及與該待辦事項相關的其他相關人員。
在其他實施方式中,還可以不設置本步驟S407,而由用戶直接手動發送會議記錄至會議相關人員的通訊位址;或者,在雲端裝置200接收並存儲了該會議記錄時,由雲端裝置200將該會議記錄發送至會議相關人員。
如圖5所示,是本發明一實施方式的自動生成會議記錄的方法500的流程圖。自動生成會議記錄的方法500是在一會議記錄裝置(例如會議記錄裝置100)的會議記錄功能被開啟後,運行於該會議記錄裝置的。需要說明的是,圖5所示的自動生成會議記錄的方法500與圖4所示的自動生成會議記錄的方法400中執行的步驟中,有一部分相同或相類似的,因此,上述對圖4中的自動生成會議記錄的方法400進行描述時,針對某步驟進行說明的一些替代的、可同時執行的其他實施方式也是適用於圖5中的自動生成會議記錄的方法500中相同或
相類似的步驟,在此就不再一一贅述。自動生成會議記錄的方法500可以開始於步驟S501。
步驟S501,接收步驟:語音輸入單元20接收語音並將接收的語音轉換為相應的語音信號。
步驟S502,錄音步驟:錄音模組11將所述語音信號錄製成語音資料,並將錄製好的語音資料存儲於記憶體10。在一實施方式中,回應用戶的選擇,本步驟也可以省略,而直接執行步驟S503。
步驟S503,辨識步驟:辨識模組13根據所述語音信號識別出所述語音資料中的無聲片段。本實施方式中,所述無聲片段即為所述語音資料中的為靜音資料的片段,即,為所述語音中為靜音的片段。例如,當所述語音信號中某部分對應的語音資料的語音片段的音量小於一預設的無聲臨界值時,辨識模組13即識別該語音片段為無聲片段。所述語音資料中可能包含了多個無聲片段。
在一實施方式中,當未包含步驟S502時,本步驟中,辨識模組13根據所述語音信號識別出所述語音中的無聲片段。
步驟S504,判斷步驟:判斷模組14判斷所述無聲片段所歷經的時間是否大於一預設值,如果是,則執行步驟S505,否則,流程結束。在一實施方式中,所述預設值為3秒。
步驟S505,分割步驟:分割模組18根據所述無聲片段將所述語音資料分割為多個語音資料片段。本實施方式中,分割模組18從所述無聲片段處對所述語音資料進行分割,當所述語音資料中包含歷經的時間均大於所述預設值的多個無聲片段時,分割模組18根據多個無聲片段將所述語音資料分割為多個語音資料片段。
步驟S506,辨識步驟:辨識模組13根據分割得到的多個語音資料片段對應的語音信號以及記憶體10中存儲的用戶語音特徵表,識別出所述多個語音資料片段中對應的一或多個用戶。在一實施方式中,本自動生成會議記錄的方法500還可以不包括本步驟。
步驟S507,轉換步驟:轉換模組12將分割得到的多個語音資料片段對應的語音信號轉換為包含多個段落的文字。本實施方式中,轉換模組12根據所述多個語音資料片段對應的語音信號、辨識模組13識別到的一或多個用戶以及記憶體10中存儲的語音文字資料庫,將所述多個語音資料片段對應的語音信號轉換為包含與各語音資料片段一一對應的多個段落的文字。
步驟S508,生成步驟:生成模組16根據轉換得到的所述包含多個段落的文字以及記憶體10中存儲的會議記錄範本生成一原始會議記錄。本步驟S509具體的方式與自動生成會議記錄的方法400可以相同,在此就不在贅述。
在本實施方式中,在本步驟S508之後還可以執行自動生成會議記錄的方法400中的步驟S406(校對編輯步驟)及步驟S407(發送步驟),在此就不再贅述。
如圖6所示,是本發明一實施方式的自動生成會議記錄的方法600的流程圖。自動生成會議記錄的方法600是在一會議記錄裝置(例如會議記錄裝置100)的會議記錄功能被開啟後,運行於該會議記錄裝置的。需要說明的是,圖6所示的自動生成會議記錄的方法600與圖5及圖4所示的自動生成會議記錄的方法中所執行的步驟中,有一部分是相同或相類似的,因此,上述對圖4中的自動生成會議記錄的方法400以及對圖5中的自動生成會議記錄的方法500進行描述時,針對某步驟進行說明的一些替代的、可同時執行的其他實施方式也是適用於圖6中的自動生成會議記錄的方法600中相同或相類似的步驟,在此也不再一一贅述。自動生成會議記錄的方法600可以開始於步驟S601。
步驟S601,接收步驟:語音輸入單元20接收語音並將接收的語音轉換為相應的語音信號。
步驟S602,錄音步驟:錄音模組11將所述語音信號錄製成包含錄音時間戳記的語音資料,並將錄製好的語音資料存儲於記憶體10。在一實施方式中,回應用戶的選擇,本步驟也可以省略,而直接執行步驟S603。
步驟S603,辨識步驟:辨識模組13根據所述語音信號以及記憶體10中存儲的用戶語音特徵表,識別出所述語音信號中對應的一或多個用戶。在一實施方式中,辨識模組13根據所述包含錄音時間戳記的語音資料以及記憶體10中存儲的用戶語音特徵表,識別出所述語音信號對應的一或多個用戶。在另一實施方式中,自動生成會議記錄的方法600也可以不包括本步驟。
步驟S604,轉換步驟:轉換模組12將所述語音信號轉換為包含所述錄音時間戳記及所述一或多個用戶的用戶名的文字。本實施方式中,轉換模組12將所述語音信號轉換為包含所述錄音時間戳記及所述一或多個用戶的用戶名的文字。轉換模組12根據所述語音信號、錄音模組11所錄製的包含了錄音時間戳記的語音資料、辨識模組13識別到的一或多個用戶以及記憶體10中存儲的語音文字資料庫,將所述語音信號轉換為包含了所述錄音時間戳記的文字,並在各用戶的語音信號轉換得到的文字的最前端自動添加對應的用戶的用戶名。
在另一實施方式中,轉換模組12根據所述語音信號、錄音模組11所錄製的包含了錄音時間戳記的語音資料以及記憶體10中存儲的語音文字資料庫,將所述語音信號轉換為包含了所述錄音時間戳記的文字。
步驟S605,判斷步驟:判斷模組14根據轉換後的所述文字,判斷是否有相鄰的文字對應的錄音時間戳記所記載的時間間隔達到一預設值,如果是,則執行步驟S606,否則,流程結束。在一實施方式中,所述預設值為3秒。
所述包含所述錄音時間戳記的相鄰的文字中可能包含有多個時間間隔達到該預設值的。
步驟S606,分割步驟:分割模組18將所述對應的錄音時間戳記所記載的時間間隔達到所述預設值的相鄰的文字為界劃分文字段落。本實施方式中,具體的,該相鄰的文字分別被劃分到前一個段落以及相鄰的後一個段落,直至所有的對應的錄音時間戳記所記載的時間間隔達到所述預設值的各相鄰的文字均被劃分到不同的段落。
步驟S607,生成步驟:生成模組16根據劃分段落後的所述文字以及記憶體10中存儲的會議記錄範本生成一原始會議記錄。本步驟S607具體的方式與自動生成會議記錄的方法500可以相同,在此就不在贅述。
如圖7所示,是本發明一實施方式的自動生成會議記錄的方法700的流程圖。自動生成會議記錄的方法700是在一會議記錄裝置(例如會議記錄裝置100)的會議記錄功能被開啟後,運行於該會議記錄裝置的。需要說明的是,圖7所示的自動生成會議記錄的方法700與圖5及圖4所示的自動生成會議記錄的方法中所執行的步驟中,有一部分是相同或相類似的,因此,上述對圖4中的自動生成會議記錄的方法400以及對圖5中的自動生成會議記錄的方法500進行描述時,針對某步驟進行說明的一些替代的、可同時執行的其他實施方式也是適用於圖7中的自動生成會議記錄的方法700中相同或相類似的步驟,在此也不再一一贅述。本自動生成會議記錄的方法700可以開始於步驟S701。
步驟S701,建庫步驟:控制模組19建立一包含常用語及其校正對象的常用語資料庫,並將所述常用語資料庫存儲於記憶體10中。本實施方式中,可以是當會議記錄裝置100為首次使用自動生成會議記錄的功能時,控制模組19自動建立所述常用語資料庫。所述常用語資料庫中包含至少一常用語及其校正對象的對應關係,每一常用語至少與一校正對象對應。所述常用語包括了以下
中的一或多種:常用字、常用詞、常用句子等,還可以是語音資料或文字資料。
每一常用語的校正對象可以是在用戶手動編輯、修改會議記錄過程中累積、記載下來的。校正對象包括以下語音資料和/或文字資料中的以下中的一或多種:字、詞、句子等。
在另一實施方式中,本自動生成會議記錄的方法700還可以不包括本步驟S701。而是在該會議記錄裝置中預先存儲有一常用語資料庫,常用語資料庫是在會議記錄裝置100執行其自動生成會議記錄的功能的過程中,累積、篩選存儲的,也可以是從一常用語資料庫中下載並存儲的。
步驟S702,接收步驟:語音輸入單元20接收語音並將接收的語音轉換為相應的語音信號。
步驟S703,轉換步驟:轉換模組12將所述語音信號轉換為文字。
在一實施方式中,還可以包括自動生成會議記錄的方法400、500及600中任一方法中所包含的接收步驟至轉換步驟之間的其他步驟。即,可以包含前面所描述的各種實施方式的將語音信號轉換為文字的步驟。
步驟S704,識別存儲常用詞步驟:判斷模組14在識別判斷出所述語音資料和/或所述文字中包含重複出現一預設次數的詞句時,將所述重複出現該預設次數的詞句作為常用語存儲於所述常用語資料庫中。本實施方式中,重複出現該預設次數的詞句可以為字、詞、句子等語音資料和/或文字資料。在一實施方式中,本步驟S704還可以省略。所述預設次數為20次。
步驟S705,判斷步驟:判斷模組14判斷轉換後的所述文字否包含一校正對象,如果是,則執行步驟S706,否則,流程結束。
步驟S706,校對步驟:校對編輯模組15根據所述常用語資料庫自動將所述文字包含的校正對象校正為對應的常用語。在一實施方中,本步驟S706還可以在步驟S707之後執行。
步驟S707,生成步驟:生成模組16根據校正後的所述文字以及記憶體10中存儲的會議記錄範本生成一原始會議記錄。本步驟S707具體的方式與自動生成會議記錄的方法500可以相同,在此就不在贅述。
本發明提供的上述會議記錄裝置100及其自動生成會議記錄的方法,可根據預設的會議記錄範本自動生成會議記錄,並可對會議記錄進行智慧的語音文字識別、內容格式化及編輯校對。而且,還可以根據預設的規則將會議記錄發送至相關人員。因而,相較於現有的方式更省時、方便及人性化。
本技術領域的普通技術人員應當認識到,以上的實施方式僅是用來說明本發明,而並非用作為對本發明的限定,只要在本發明的實質精神範圍之內,對以上實施例所作的適當改變和變化都落在本發明要求保護的範圍之內。
500‧‧‧自動生成會議記錄的方法
S501-S508‧‧‧步驟
Claims (10)
- 一種自動生成會議記錄的方法,運行於包括記憶體、處理器和GPS定位模組的至少一裝置中,其改良在於,所述方法包括由所述處理器控制所述記憶體中存儲的模組執行的如下步驟:控制開啟該GPS定位模組以獲取該裝置的位置資訊及當前的會議時間資訊,並將獲取的位置資訊及時間資訊存儲於記憶體中;識別步驟:識別語音資料中的無聲片段;判斷步驟:判斷所述無聲片段所歷經的時間是否大於一預設值;分割步驟:以歷經的時間大於所述預設值的無聲片段為界,將所述語音資料或所述語音資料轉換得到的文字進行分割;生成步驟:根據所述語音資料或所述文字被分割的情況以及所述記憶體中存儲的會議記錄範本生成一原始會議記錄,並將所獲取的位置資訊及時間資訊自動添加到生成的原始會議記錄中;及編輯步驟:根據預設的校對編輯規則對所述原始會議記錄進行編輯,以得到一會議記錄,其中,所述預設的校對編輯規則為從所述文字中的每一使用者名處對文字進行段落劃分。
- 如申請專利範圍第1項所述之方法,其中:所述識別步驟為:根據所述語音資料對應的語音信號識別出所述語音資料中的無聲片段;所述分割步驟為:在判斷所述無聲片段所歷經的時間大於一預設值時,根據所述無聲片段將所述語音資料分割為多個語音資料片段;在所述分割步驟之後還包括一轉換步驟:將分割得到的多個語音資料片段對應的語音信號轉換為包含多個段落的文字;所述生成步驟為:根據轉換得到的所述包含多個段落的文字以及所述 記憶體中存儲的會議記錄範本生成一原始會議記錄。
- 如申請專利範圍第2項所述之方法,其中,還包括一辨識步驟:根據分割得到的多個語音資料片段對應的語音信號以及所述記憶體中存儲的用戶語音特徵表,識別出所述多個語音資料片段中對應的一或多個用戶;及所述轉換步驟包括:根據所述多個語音資料片段對應的語音信號以及所述記憶體中存儲的語音文字資料庫,將所述多個語音資料片段對應的語音信號轉換為包含與各語音資料片段一一對應的多個段落的文字;及在所述一或多個用戶的語音信號對應的文字的一預設位置處自動添加對應的用戶的用戶名。
- 如申請專利範圍第2或3項所述之方法,其中:所述無聲片段為所述語音資料中為靜音資料的片段;所述方法還包括一錄製步驟:根據所述語音資料對應的語音信號錄製語音資料,並將錄製好的語音資料存儲於記憶體。
- 如申請專利範圍第1項所述之方法,其中,在所述識別步驟之前還包括:錄製步驟:根據所述語音資料對應的語音信號錄製語音資料;所述錄製的語音資料包含錄音時間戳記;轉換步驟:將所述語音信號轉換為包含所述錄音時間戳記的文字;所述判斷步驟為:根據轉換後的所述文字,判斷是否有相鄰的文字對應的錄音時間戳記所記載的時間間隔達到所述預設值;所述分割步驟為:在相鄰的文字對應的錄音時間戳記所記載的時間間隔達到所述預設值時,將所述對應的錄音時間戳記所記載的時間間隔達到 所述預設值的相鄰的文字為界劃分文字段落。
- 一種會議記錄裝置,包括記憶體、處理器和GPS定位模組,其改良在於,還包括由所述處理器控制的且存儲於所述記憶體中的如下模組:控制模組,控制開啟該GPS定位模組以獲取該裝置的位置資訊及當前的會議時間資訊,並將獲取的位置資訊及時間資訊存儲於記憶體中;辨識模組,用於識別語音資料中的無聲片段;判斷模組,用於判斷所述無聲片段所歷經的時間是否大於一預設值;分割模組,用於以歷經的時間大於所述預設值的無聲片段為界,將所述語音資料或所述語音資料轉換得到的文字進行分割;及生成模組,用於根據所述語音資料或所述文字被分割的情況以及所述記憶體中存儲的會議記錄範本生成一原始會議記錄,並將該定位模組所獲取的位置資訊及時間資訊自動添加到生成的原始會議記錄中;及校對編輯模組,用於根據預設的校對編輯規則對所述原始會議記錄進行編輯,以得到一會議記錄,其中,所述預設的校對編輯規則為從所述文字中的每一使用者名處對文字進行段落劃分。
- 如申請專利範圍第6項所述之會議記錄裝置,其中:所述辨識模組根據所述語音資料對應的語音信號識別出所述語音資料中的無聲片段;所述分割模組在判斷所述無聲片段所歷經的時間大於一預設值時,根據所述無聲片段將所述語音資料分割為多個語音資料片段;所述會議記錄裝置還包括一轉換模組,用於將分割得到的多個語音資料片段對應的語音信號轉換為包含多個段落的文字;所述生成模組根據轉換得到的所述包含多個段落的文字以及所述記憶 體中存儲的會議記錄範本生成一原始會議記錄。
- 如申請專利範圍第7項所述之會議記錄裝置,其中:所述辨識模組還用於根據分割得到的多個語音資料片段對應的語音信號以及所述記憶體中存儲的用戶語音特徵表,識別出所述多個語音資料片段中對應的一或多個用戶;所述轉換模組還用於:根據所述多個語音資料片段對應的語音信號以及所述記憶體中存儲的語音文字資料庫,將所述多個語音資料片段對應的語音信號轉換為包含與各語音資料片段一一對應的多個段落的文字;及在所述一或多個用戶的語音信號對應的文字的一預設位置處自動添加對應的用戶的用戶名。
- 如申請專利範圍第7或8項所述之會議記錄裝置,其中:所述無聲片段為所述語音資料中為靜音資料的片段;所述會議記錄裝置還包括一錄音模組,用於根據所述語音資料對應的語音信號錄製語音資料,並將錄製好的語音資料存儲於記憶體。
- 如申請專利範圍第6項所述之會議記錄裝置,其中,還包括一錄音模組和一轉換模組,其中:所述錄音模組用於根據所述語音資料對應的語音信號錄製語音資料;所述錄製的語音資料包含錄音時間戳記;所述轉換模組用於將所述語音信號轉換為包含所述錄音時間戳記的文字;所述判斷模組根據轉換後的所述文字,判斷是否有相鄰的文字對應的錄音時間戳記所記載的時間間隔達到所述預設值;所述分割模組在相鄰的文字對應的錄音時間戳記所記載的時間間隔達 到所述預設值時,將所述對應的錄音時間戳記所記載的時間間隔達到所述預設值的相鄰的文字為界劃分文字段落。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103146228A TWI590240B (zh) | 2014-12-30 | 2014-12-30 | 會議記錄裝置及其自動生成會議記錄的方法 |
US14/926,814 US20160189107A1 (en) | 2014-12-30 | 2015-10-29 | Apparatus and method for automatically creating and recording minutes of meeting |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103146228A TWI590240B (zh) | 2014-12-30 | 2014-12-30 | 會議記錄裝置及其自動生成會議記錄的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201624470A TW201624470A (zh) | 2016-07-01 |
TWI590240B true TWI590240B (zh) | 2017-07-01 |
Family
ID=56164634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103146228A TWI590240B (zh) | 2014-12-30 | 2014-12-30 | 會議記錄裝置及其自動生成會議記錄的方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20160189107A1 (zh) |
TW (1) | TWI590240B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016163028A1 (ja) * | 2015-04-10 | 2016-10-13 | 株式会社東芝 | 発言提示装置、発言提示方法およびプログラム |
US10121474B2 (en) * | 2016-02-17 | 2018-11-06 | Microsoft Technology Licensing, Llc | Contextual note taking |
CN110740692B (zh) | 2017-06-09 | 2023-07-14 | 希格纳姆外科有限公司 | 用于闭合组织中的开口的植入物 |
US10868684B2 (en) * | 2018-11-02 | 2020-12-15 | Microsoft Technology Licensing, Llc | Proactive suggestion for sharing of meeting content |
CN110365933A (zh) * | 2019-05-21 | 2019-10-22 | 武汉兴图新科电子股份有限公司 | 一种基于ai的视频会议会议纪要在线生成装置及方法 |
CN111583953A (zh) * | 2020-04-30 | 2020-08-25 | 厦门快商通科技股份有限公司 | 一种基于声纹特征的人声分离方法和装置以及设备 |
CN112804580B (zh) * | 2020-12-31 | 2023-01-20 | 支付宝(杭州)信息技术有限公司 | 一种视频打点的方法和装置 |
CN113011169B (zh) * | 2021-01-27 | 2022-11-11 | 北京字跳网络技术有限公司 | 一种会议纪要的处理方法、装置、设备及介质 |
DE202022101429U1 (de) | 2022-03-17 | 2022-04-06 | Waseem Ahmad | Intelligentes System zur Erstellung von Sitzungsprotokollen mit Hilfe von künstlicher Intelligenz und maschinellem Lernen |
CN116015996B (zh) * | 2023-03-28 | 2023-06-02 | 南昌航天广信科技有限责任公司 | 一种数字会议音频处理方法及系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1569450A (en) * | 1976-05-27 | 1980-06-18 | Nippon Electric Co | Speech recognition system |
US5369704A (en) * | 1993-03-24 | 1994-11-29 | Engate Incorporated | Down-line transcription system for manipulating real-time testimony |
US20040064322A1 (en) * | 2002-09-30 | 2004-04-01 | Intel Corporation | Automatic consolidation of voice enabled multi-user meeting minutes |
US20040249626A1 (en) * | 2003-06-03 | 2004-12-09 | Neal Richard S. | Method for modifying English language compositions to remove and replace objectionable sexist word forms |
CN1773536A (zh) * | 2004-11-11 | 2006-05-17 | 国际商业机器公司 | 生成话音纪要的方法、设备和系统 |
GB0426347D0 (en) * | 2004-12-01 | 2005-01-05 | Ibm | Methods, apparatus and computer programs for automatic speech recognition |
US20090124272A1 (en) * | 2006-04-05 | 2009-05-14 | Marc White | Filtering transcriptions of utterances |
US8050917B2 (en) * | 2007-09-27 | 2011-11-01 | Siemens Enterprise Communications, Inc. | Method and apparatus for identification of conference call participants |
US20100228825A1 (en) * | 2009-03-06 | 2010-09-09 | Microsoft Corporation | Smart meeting room |
US8380725B2 (en) * | 2010-08-03 | 2013-02-19 | Ganz | Message filter with replacement text |
US9009041B2 (en) * | 2011-07-26 | 2015-04-14 | Nuance Communications, Inc. | Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data |
JP6233798B2 (ja) * | 2013-09-11 | 2017-11-22 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | データを変換する装置及び方法 |
-
2014
- 2014-12-30 TW TW103146228A patent/TWI590240B/zh active
-
2015
- 2015-10-29 US US14/926,814 patent/US20160189107A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
TW201624470A (zh) | 2016-07-01 |
US20160189107A1 (en) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI590240B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
TWI616868B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
TWI619115B (zh) | 會議記錄裝置及其自動生成會議記錄的方法 | |
US12040908B2 (en) | Generating customized meeting insights based on user interactions and meeting media | |
US11699456B2 (en) | Automated transcript generation from multi-channel audio | |
US9070369B2 (en) | Real time generation of audio content summaries | |
US20220343918A1 (en) | Systems and methods for live broadcasting of context-aware transcription and/or other elements related to conversations and/or speeches | |
US20200090661A1 (en) | Systems and Methods for Improved Digital Transcript Creation Using Automated Speech Recognition | |
US11315569B1 (en) | Transcription and analysis of meeting recordings | |
US10613825B2 (en) | Providing electronic text recommendations to a user based on what is discussed during a meeting | |
JP4466564B2 (ja) | 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム | |
US9037461B2 (en) | Methods and systems for dictation and transcription | |
US20120245936A1 (en) | Device to Capture and Temporally Synchronize Aspects of a Conversation and Method and System Thereof | |
CN105810207A (zh) | 会议记录装置及其自动生成会议记录的方法 | |
US20080275700A1 (en) | Method of and System for Modifying Messages | |
US20040064322A1 (en) | Automatic consolidation of voice enabled multi-user meeting minutes | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
JP2006301223A (ja) | 音声認識システム及び音声認識プログラム | |
US20230245660A1 (en) | Systems and methods for processing and presenting conversations | |
CA3147813A1 (en) | Method and system of generating and transmitting a transcript of verbal communication | |
US20180293996A1 (en) | Electronic Communication Platform | |
JP2010060850A (ja) | 議事録作成支援装置、議事録作成支援方法、議事録作成支援用プログラム及び議事録作成支援システム | |
CN105810206A (zh) | 会议记录装置及其自动生成会议记录的方法 | |
CN105810208A (zh) | 会议记录装置及其自动生成会议记录的方法 | |
US20210280193A1 (en) | Electronic Speech to Text Court Reporting System Utilizing Numerous Microphones And Eliminating Bleeding Between the Numerous Microphones |