TWI730686B - 信息傳播系統以及其方法 - Google Patents
信息傳播系統以及其方法 Download PDFInfo
- Publication number
- TWI730686B TWI730686B TW109109772A TW109109772A TWI730686B TW I730686 B TWI730686 B TW I730686B TW 109109772 A TW109109772 A TW 109109772A TW 109109772 A TW109109772 A TW 109109772A TW I730686 B TWI730686 B TW I730686B
- Authority
- TW
- Taiwan
- Prior art keywords
- electronic device
- information
- router
- analysis result
- address
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 13
- 230000005236 sound signal Effects 0.000 claims abstract description 42
- 238000003058 natural language processing Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 28
- 230000005540 biological transmission Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本發明提供一種信息傳播系統,包括第一電子裝置以及路由器。第一電子裝置接收第一聲音信號,並依據語音辨識演算法來辨識第一聲音信號,以產生第一位址資訊以及第一編碼信息內容。路由器連接至區域網路,用以接收第一編碼信息內容並對第一編碼信息內容進行語意解析以產生解析結果。路由器並透過區域網路發送解析結果。路由器依據第一位址資訊以判斷第一位址資訊所指示的第一位址是否在區域網路中,以將解析結果發送至對應第一位址的至少一第二電子裝置。
Description
本發明是有關於一種信息傳播系統,且特別是有關於一種可在本地端進行語音辨識以及語意解析的信息傳播系統。
智慧音箱可以透過藍芽連線的方式將音樂平台的音樂從手機、平板或電腦以串流方式傳輸到智慧音箱來進行播放。智慧音箱也可以將使用者的音訊以串流方式即時地傳輸至雲端,以使音訊將在雲端依據自然語言處理(Natural Language Processing,NLP)被進行語意解析,藉此控制物聯網系統。舉例來說,使用者可以對一個距離較近的智慧音箱發出命令,以控制另一處的智慧音箱進行廣播。智慧音箱可以在接收使用者的音訊後,將音訊以串流(Streaming)方式傳輸至雲端(Cloud)。音訊在雲端被轉為文字檔案,文字檔案經過語意解析後再轉成音訊。最後,由前述另一處的智慧音箱從雲端以串流方式下載音訊以進行廣播。
由於使用者的音訊是在雲端轉為文字檔案後進行語意解析,因此音訊在雲端的處理時間較長。另外,由於串流技術是使
資料封包像流水一樣進行傳送,因此需要使用高速及線路穩定的網路來進行傳輸。並且,音訊的上傳以及下載會佔用較多的流量。也就是說,智慧音箱的使用效果受限於傳輸速度、雲端處理時間以及網路穩定性。
因此,有必要提出一個傳輸速度較快、雲端處理時間較短、對穩定網路的依存性較小的解決方案。
本發明提供一種信息傳播系統及其方法,具有傳輸速度較快、雲端處理時間較短,以及對穩定網路的依存性相對較小的優點。
本發明的信息傳播系統包括第一電子裝置以及路由器。第一電子裝置用以接收第一聲音信號,並依據語音辨識演算法來辨識第一聲音信號,以產生第一位址資訊以及第一編碼信息內容。路由器連接至區域網路,用以接收第一編碼信息內容並對第一編碼信息內容進行語意解析以產生解析結果。路由器並透過區域網路發送解析結果。其中路由器依據第一位址資訊以判斷第一位址資訊所指示的第一位址是否在區域網路中,以將解析結果發送至對應第一位址的至少一第二電子裝置。
本發明的信息傳播系統包括第一電子裝置以及路由器。第一電子裝置用以接收第一聲音信號,並依據語音辨識演算法來辨識第一聲音信號,以產生第一位址資訊以及第一編碼信息內
容。路由器用以接收第一編碼信息內容,並經由雲端系統發送第一編碼信息內容。路由器連接至區域網路,用以對第一編碼信息內容進行語意解析以產生解析結果。路由器並用以經由雲端系統發送解析結果。其中路由器依據第一位址資訊來判斷第一位址資訊所指示的第一位址是否超出區域網路的範圍,以將解析結果經由雲端系統發送至對應第一位址的至少一第二電子裝置。
本發明的信息傳播的方法包括:由連接區域網路的第一電子裝置接收第一聲音信號,並依據語音辨識演算法來辨識第一聲音信號,以產生第一位址資訊以及第一編碼信息內容;以及由連接區域網路的路由器接收第一編碼信息內容並對第一編碼信息內容進行語意解析以產生解析結果,並且由路由器透過區域網路發送解析結果。其中,由路由器依據第一位址資訊來判斷第一位址資訊所指示的第一位址是否在區域網路中。當路由器判斷第一位址資訊所指示的該第一位址在區域網路中時,將解析結果發送至對應第一位址的至少一第二電子裝置。
基於上述,本發明可以經由第一電子裝置以語音辨識演算法來辨識聲音信號以產生第一編碼信息內容,並將由路由器對第一編碼信息內容進行語意解析後,將解析結果傳輸至第二電子裝置。因此,本發明具有傳輸速度較快、雲端處理時間較短,以及對穩定網路的依存性較小的優點。
100、100’:信息傳播系統
101:聲音訊號
102:聲音訊號
103:合成語音
110、180:智慧型手持電子裝置
111:人機介面裝置
112:語音辨識電路
113:命令介面
120、160:路由器
130、130’、130”、170:智慧型音箱
131:處理器
1311:命令介面
1312:語音辨識電路
1313:語音合成電路
132:聲音播放晶片
133:揚聲器
134:麥克風陣列
140:物聯網設備
1411:命令介面
150:雲端
501:雲端
502、503:路由器
504:智慧空調
505:智慧電燈
506:智慧門鎖
507~511:智慧型音箱
601~604:使用者
S310~S350、S401~S408:步驟
圖1繪示為本發明一實施例的信息傳播系統的架構示意圖。
圖2繪示為本發明一實施例的信息傳播系統的架構示意圖。
圖3繪示為本發明一實施例的信息傳播的方法的步驟流程圖。
圖4繪示為本發明一實施例的信息傳播方法的步驟流程圖。
圖5繪示為本發明一實施例的信息傳播系統的使用情境圖。
本發明提供一種信息傳播系統及其方法。透過將語意解析等工作交由近端(或稱本地端)的邊緣裝置來執行,可以使本發明具有傳輸速度較快、雲端處理時間較短,以及對穩定網路的依存性相對較小的優點。
圖1繪示為本發明一實施例的信息傳播系統的架構示意圖。請見圖1,信息傳播系統100主要包含智慧型手持電子裝置110、路由器120、智慧型音箱130、130’與130”、物聯網設備140。在本實施例中,智慧型手持電子裝置110可以是智慧型手機、平板、筆記型電腦或桌上型電腦等具有運算能力的電子裝置。物聯網設備140可以是智慧家庭裝置,例如智慧門鎖、智慧電燈或智慧空調等等。
智慧型手持電子裝置110包括人機介面裝置(Human-machine Interface Device,HID)111、語音辨識電路112
以及命令介面113。使用者通過人機介面裝置111與系統交流以輸入聲音訊號101。語音辨識電路112可以依據語音辨識演算法(例如語音轉文字(Speech To Text,STT)識別)來辨識使用者的聲音訊號101,並將辨識結果透過命令介面113傳輸出去。詳細來說,語音辨識電路112可以在對聲音訊號101以梅爾頻率倒頻譜係數(Mel-Frequency Cepstral Coefficients,MFCC)進行切割以及特徵提取(Feature Extraction)。接著,透過動態時間校正(Dynamic Time Warping)來進行改善信號長度以及振幅不匹配的問題,並進行特徵比對(Pattern Comparison)。依據高斯混合模型(Gaussians Mixture Model,GMM)從語料庫查找對應的字詞,並依據概率語言模型(例如n元語法(N-gram))來預測可能接續在後的字詞。最後,以維特比演算法(Viterbi algorithm)來尋找最有可能的文字字串。
智慧型手持電子裝置110可以直接連線至路由器120,或是連線至雲端(未示出)以查找出位址資訊所對應的路由器120,以將辨識結果發送至此路由器120。其中,辨識結果可以包含文字形式的編碼信息內容以及對應目的端設備的位址資訊。
智慧型音箱130包括處理器131、聲音播放晶片132、揚聲器133以及麥克封陣列134。處理器131有包括命令介面1311、語音辨識電路1312以及語音合成電路1313。智慧型音箱130’與130’,的架構與智慧型音箱130相同,故不再贅述。路由器120用以接收編碼信息內容並對編碼信息內容進行語意解析(例如透過
自然語言處理(Natural Language Processing,NLP)演算法),以產生解析結果。更詳細來說,自然語言處理演算法可透過軟體和/或硬體的方式運行於路由器120。路由器120連接到一個區域網路(Local Area Network,LAN),以依據目的端設備的位址資訊(IP)經由區域網路將解析結果進行路由與轉送。在本實施例中,智慧型音箱130、130’與130”皆在前述區域網路的範圍內。
在本實施例中,路由器120可依據辨識結果中的位址資訊來判斷此位址資訊所指示的位址是否在區域網路中。若是,路由器120則將解析結果傳輸至對應前述位址的智慧型音箱(例如智慧型音箱130)。解析結果中的文字信息內容通過智慧型音箱130的處理器131的命令介面1311進入語音合成電路1313,以產生對應編碼信息內容的合成語音,即模擬人聲。其中,語音合成電路1313可以是文字轉語音(Text-To-Speech,TTS)系統。具體來說,語音合成電路1313可以進行文本預處理(Text Processing),然後對處理結果以統計模型(持續時間模型(Duration model)以及聲音模型(Acoustic model))來進行處理,最後產生合成音訊。接著,通過揚聲器133播放此合成語音103。然而本發明並不限制僅能由一個智慧型音箱進行廣播。在其他實施例中,解析結果可以包含對應多個智慧型音箱130、130’與130”的位址資訊,以使智慧型音箱130、130’與130”同時廣播此合成語音。
在另一實施例中,使用者可以透過智慧型手持電子裝置110命令智慧型音箱130播放特定的歌曲。智慧型手持電子裝置
110可以辨識使用者的聲音訊號並傳輸辨識結果至路由器120。其中針對聲音訊號的辨識結果可以包含對應前述聲音訊號內容的編碼信息內容以及對應的智慧型音箱130的位址資訊。路由器120對辨識結果進行語意解析並將解析結果傳輸至對應前述位址資訊的智慧型音箱130。智慧型音箱130接收解析結果並依據解析結果以在本地端尋找對應的音訊並播放之。例如,智慧型音箱130可以預先儲存各種歌曲,以供使用者進行點歌。
在另一實施例中,使用者可以對智慧型手持電子裝置110發出聲音訊號,以啟動物聯網設備140(如智慧電燈)。智慧型手持電子裝置110可以對聲音信號進行辨識並傳輸辨識結果至路由器120,其中辨識結果可以包含對應前述聲音訊號內容的編碼信息內容以及對應物聯網設備140的位址資訊。路由器120對辨識結果進行語意解析並將解析結果傳輸至對應前述位址資訊的物聯網設備140。物聯網設備140接收解析結果,並透過命令介面1411以依據解析結果來執行開啟的動作。使用者也可以使用類似的方法來開啟智慧門鎖、智慧空調等物聯網設備140。
上述實施例皆是以智慧型手持電子裝置110(例如智慧型手機)來對聲音訊號進行辨識。然而,本發明並不僅限於以智慧型手持電子裝置110進行辨識聲音訊號的工作。在其他實施例中,智慧型音箱130、130’或130”也可以進行辨識聲音訊號的工作。舉例來說,智慧型音箱130可以透過麥克風陣列134接收使用者的聲音訊號102。智慧型音箱130的語音辨識電路1312可以對聲音
訊號進行辨識,以產生相應的編碼信息內容以及目的端(例如智慧型音箱130”)的位址資訊。包含編碼信息內容以及目的端的位址資訊的辨識結果被發送至路由器120。路由器120對辨識結果進行語意解析並將解析結果傳輸至對應前述位址資訊的智慧型音箱130”。
圖2繪示為本發明一實施例的信息傳播系統的架構示意圖。請見圖2,信息傳播系統100’主要包括智慧型手持電子裝置110、路由器120、智慧型音箱130、130’與130”、物聯網設備140、雲端150、路由器160、智慧型音箱170以及智慧型手持電子裝置180。其中,智慧型手持電子裝置110、路由器120、智慧型音箱130、130’與130”,以及物聯網設備140的相關說明可以參考圖1的智慧型手持電子裝置110、路由器120、智慧型音箱130、130’與130”,以及物聯網設備140,於此不再贅述。
圖2所示實施例與圖1所示實施例的差別在於,圖1所示實施例中的信息發送端與目的端皆在路由器120負責的區域網路的範圍之內,而圖2所示實施例則是信息發送端與目的端分別位在不同的區域網路之內。
請見圖2,在一實施例中,智慧型電子裝置110、智慧型音箱130、130’以及130”皆可擔任辨識聲音訊號的工作。智慧型電子裝置110、智慧型音箱130、130’或130”可以接收並依據語音辨識演算法解析使用者的聲音訊號,以產生包含文字形式的編碼信息內容以及目的端設備的位址資訊在內的辨識結果。路由器120
進一步對辨識結果進行語意解析並將解析結果傳輸至對應前述位址資訊的目的端設備。路由器160連接至區域網路,並且路由器120依據前述目的端設備的位址資訊來判斷位址資訊所指示的目的端位址是否超出區域網路的範圍。若未超出區域網路的範圍,路由器120則同圖1所示實施例一般,將解析結果發送至位於區域網路內的目的端設備。若超出區域網路的範圍,路由器120則透過雲端150來將解析結果發送至位於另一區域網路的目的端設備,例如智慧型音箱170。
在另一實施例中,智慧型手持電子裝置180以及智慧型音箱170皆可擔任辨識聲音訊號的工作。智慧型電子裝置180或智慧型音箱170可以接收聲音訊號並依據語音辨識演算法辨識使用者的聲音訊號,以產生包含編碼信息內容以及目的端的位址資訊在內的辨識結果。在智慧型電子裝置180擔任辨識聲音訊號的例子中,智慧型手持電子裝置180可以先連線至雲端150,以查找前述位址資訊所對應的路由器,並將辨識結果發送至此路由器(例如路由器160)。路由器160進一步對辨識結果進行語意解析並將解析結果傳輸至對應前述位址資訊的目的端設備。路由器160可以判斷目的端的位址資訊是否在所屬的區域網路內。若是,路由器160則將解析結果發送至位於路由器160所屬的區域網路內的目的端。若否,路由器160則將解析結果經由雲端150發送至位於另一個區域網路的目的端,例如智慧型音箱130、130’、130”或物聯網設備140。
在圖2所示實施例中,智慧型手持電子裝置110、180、智慧型音箱130、130’、130”或170皆可擔任接收聲音訊號以及辨識聲音訊號的工作。類似地,發送解析結果的目的端設備可以是智慧型音箱130、130’、130”、170或物聯網設備140,以由目的端設備執行相應於解析結果的功能。在一實施例中,發送解析結果的目的端(例如智慧型音箱170)可以對解析結果進行合成語音處理以播放之。在一實施例中,發送解析結果的目的端可以是包含智慧型音箱170在內的多個智慧型音箱。前述多個智慧型音箱可以同時接收解析結果,並對解析結果中的文字信息進行合成語音處理以同時播放之。在一實施例中,發送解析結果的目的端(例如智慧型音箱170)可以依據解析結果在本地端或是透過雲端120尋找對應的音訊(例如特定歌曲)以播放之。在一實施例中,發送解析結果的目的端可以是物聯網設備140,以使物聯網設備140依據解析結果來進行相應的動作,例如開啟智慧電燈、智慧門鎖或智慧空調。上述多個實施例的實施細節可以參考圖1所示實施例的說明內容,於此不再贅述。
圖3繪示為本發明一實施例的信息傳播的方法的步驟流程圖。請見圖3,步驟S310~S340是在信息傳播系統的邊緣裝置(例如智慧型手持電子裝置或智慧型音箱)進行。步驟S310是由智慧型手持電子裝置或智慧型音箱來接收使用者的聲音訊號(音訊)。步驟S320與S330是由智慧型手持電子裝置或智慧型音箱以語音辨識演算法對音訊進行辨識,以將其轉為文字形式的編碼信
息內容。步驟S340是由路由器對編碼信息內容進行語意解析,以得到解析結果。步驟S350是由雲端接收並發送解析結果,以使至少一個音箱以合成語音來播放編碼信息內容,或是使至少一個音箱依據解析結果來播放對應的音訊,或是使物聯網設備依據解析結果執行特定功能。
圖4繪示為本發明一實施例的信息傳播方法的步驟流程圖。請見圖4,步驟S401是由信息傳播系統的邊緣裝置來接收聲音訊號。步驟S402與步驟S403是依據語音辨識演算法對聲音訊號進行辨識,以產生包含編碼信息內容及對應目的端設備的位址資訊在內的辨識結果。步驟S404是由路由器對編碼信息內容進行語意解析,以產生解析結果。步驟S405是由路由器來確認是否連接至區域網路。若是,則進一步確認目的端設備是否在區域網路所負責的範圍內(步驟S405)。若是,則將解析結果發送到區域網路內的對應的智慧型音箱(步驟S408)。若步驟S404或是步驟S405判定結果為否,則由雲端接收解析結果(步驟S406),並進一步透過負責另一個區域網路的路由器發送到位於前述另一個區域網路內的智慧型音箱(步驟S408)。
圖5繪示為本發明一實施例的信息傳播系統的使用情境圖。信息傳播系統可以包括雲端501、路由器502與503、智慧空調504、智慧電燈505、智慧門鎖506等物聯網設備以及智慧型音箱507~511。在一使用情境中,使用者601可以對智慧型音箱510說「我回來了,請開門」,以使智慧型音箱510在對該句話進行辨
識後,由路由器503進一步進行語意解析。路由器503並將解析結果傳輸至智慧門鎖506,以使智慧門鎖506開啟。進一步地,智慧型音箱506還可以開啟客廳的智慧電燈505,以及透過路由器503來控制智慧型音箱507~509廣播「有人進門了」,以讓使用者602與603知曉有人進來了。在一使用情境中,使用者604可以對智慧型音箱511說「請開二樓的空調」,以使智慧型音箱511在將該句話辨識為文字形式的編碼信息內容後,由路由器502進行語意解析,以使智慧空調504開啟。
在一使用情境中,可以透過智慧型手持電子裝置(圖未示)來對家中的智慧型音箱507~511以及物聯網設備(智慧空調504、智慧電燈505以及智慧門鎖506)進行控制。在一使用情境中,信息傳播系統可以應用於兩個家庭。例如,由使用者602通過智慧型音箱508、路由器503、雲端501、路由器502以及智慧型音箱511,向另一家庭的使用者604傳遞信息。需說明的是,上述使用情境皆是在信息傳播系統的邊緣裝置(如智慧型手持電子裝置以及智慧音箱)完成語音辨識並進行編碼。編碼信息內容將由路由器進行解析,以使目的端設備依據解析結果執行相應的動作或功能。
以上多個實施例皆是描述由路由器執行語意解析的工作,然而本發明並不以此為限制。在其他實施例中,邊緣裝置(智慧型手持電子裝置或智慧型音箱)除了可以辨識聲音訊號,也可以執行語意解析的工作。
綜上所述,本發明可以透過在信息傳播系統的邊緣裝置進行語音辨識,並透過路由器對辨識結果進行語意解析。解析結果經由路由器(或雲端)進行傳送。相較於現有技藝是將音訊以串流的方式上傳到雲端,並在雲端進行語音辨識以及語意解析,本發明具有傳輸速度快以及雲端處理時間短的優點。並且,關於對穩定網路的依存性,本發明相較於現有技藝為低。
100’:信息傳播系統
101:聲音訊號
102:聲音訊號
103:合成語音
110、180:智慧型手持電子裝置
111:人機介面裝置
112:語音辨識電路
113:命令介面
120、160:路由器
130、130’、130”、170:智慧型音箱
131:處理器
1311:命令介面
1312:語音辨識電路
1313:語音合成電路
132:聲音播放晶片
133:揚聲器
134:麥克風陣列
140:物聯網設備
1411:命令介面
150:雲端
Claims (18)
- 一種信息傳播系統,包括:一第一電子裝置,接收一第一聲音信號,並依據一語音辨識演算法來辨識該第一聲音信號,以產生一第一位址資訊以及一第一編碼信息內容;一路由器,連接至一區域網路,該路由器用以接收該第一編碼信息內容並對該第一編碼信息內容進行一語意解析以產生一解析結果,該路由器並透過該區域網路發送該解析結果,其中該路由器依據該第一位址資訊以判斷該第一位址資訊所指示的一第一位址是否在該區域網路中,以將該解析結果發送至對應該第一位址的至少一第二電子裝置,其中該路由器以一自然語言處理演算法來對該第一編碼信息內容進行該語意解析以產生該解析結果。
- 如申請專利範圍第1項所述的信息傳播系統,其中所述至少一第二電子裝置接收該解析結果,以對該解析結果中的一文字信息進行合成語音處理並撥放之。
- 如申請專利範圍第2項所述的信息傳播系統,其中該至少一第二電子裝置為複數個語音撥放裝置,該複數個語音撥放裝置同時接收該解析結果並同時撥放經合成語音處理的該文字信息。
- 如申請專利範圍第1項所述的信息傳播系統,其中該至少一第二電子裝置依據該解析結果來查找對應的一第二聲音信號並撥放之。
- 如申請專利範圍第1項所述的信息傳播系統,其中該至少一第二電子裝置依據該解析結果來執行對應的一第一功能。
- 如申請專利範圍第1項所述的信息傳播系統,其中該第一電子裝置更用以依據該語音辨識演算法來辨識該第一聲音信號,以產生一第二位址資訊,該路由器判斷該第二位址資訊所指示的一第二位址是否在該區域網路中,以將該解析結果發送至對應該第二位址的一第三電子裝置。
- 如申請專利範圍第1項所述的信息傳播系統,其中該第一電子裝置為一手持通訊裝置或是一聲音播放器。
- 如申請專利範圍第1項所述的信息傳播系統,其中該至少一第二電子裝置為一聲音播放器或一處理裝置。
- 一種信息傳播系統,包括:一第一電子裝置,接收一第一聲音信號,並依據一語音辨識演算法來辨識該第一聲音信號,以產生一第一位址資訊以及一第一編碼信息內容;以及一路由器,接收該第一編碼信息內容並對該第一編碼信息內容進行一語意解析以產生一解析結果,該路由器並經由一雲端系統發送該解析結果, 其中該路由器連接至一區域網路,並且該路由器依據該第一位址資訊以判斷該第一位址資訊所指示的一第一位址是否超出該區域網路的範圍,以將該解析結果經由該雲端系統發送至對應該第一位址的至少一第二電子裝置,其中該路由器以一自然語言處理演算法來對該第一編碼信息內容進行該語意解析以產生該解析結果。
- 如申請專利範圍第9項所述的信息傳播系統,其中該至少一第二電子裝置經由該雲端系統接收該解析結果,以對該解析結果中的文字信息進行合成語音處理並撥放之。
- 如申請專利範圍第10項所述的信息傳播系統,其中該至少一第二電子裝置為複數個語音撥放裝置,該複數個語音撥放裝置同時接收該解析結果並同時撥放經合成語音處理的該文字信息。
- 如申請專利範圍第9項所述的信息傳播系統,其中該至少一第二電子裝置依據該解析結果來查找對應的一第二聲音信號並撥放之。
- 如申請專利範圍第9項所述的信息傳播系統,其中該至少一第二電子裝置依據該解析結果來執行對應的一第一功能。
- 如申請專利範圍第9項所述的信息傳播系統,其中該第一電子裝置更用以依據該語音辨識演算法來辨識該第一聲音信號,以產生一第二位址資訊,該路由器依據該第二位址資訊以判斷該第二位址資訊所指示的一第二位址是否超出該區域網路的範 圍,以將該解析結果經由該雲端系統發送至對應該第二位址的一第三電子裝置。
- 如申請專利範圍第9項所述的信息傳播系統,其中該第一電子裝置為一手持通訊裝置或是一聲音播放器。
- 如申請專利範圍第9項所述的信息傳播系統,其中該至少一第二電子裝置為一聲音播放器或一處理裝置。
- 一種信息傳播的方法,包括:由連接一區域網路的一第一電子裝置接收一第一聲音信號,並依據一語音辨識演算法來辨識該第一聲音信號,以產生一第一位址資訊以及一第一編碼信息內容;以及由連接該區域網路的一路由器接收該第一編碼信息內容,並由該路由器以一自然語言處理演算法來對該第一編碼信息內容進行一語意解析以產生一解析結果,並且由該路由器透過該區域網路發送該解析結果;其中,由該路由器依據該第一位址資訊以判斷該第一位址資訊所指示的一第一位址是否在該區域網路中,其中,當該路由器判斷該第一位址資訊所指示的該第一位址在該區域網路中時,將該解析結果發送至對應該第一位址的至少一第二電子裝置。
- 如申請專利範圍第17項所述的信息傳播的方法,其中當該路由器判斷該第一位址資訊所指示的該第一位址超出該區域網 路的範圍時,將該解析結果經由一雲端系統發送至對應該第一位址的一第三電子裝置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109109772A TWI730686B (zh) | 2020-03-24 | 2020-03-24 | 信息傳播系統以及其方法 |
CN202010477292.3A CN111724792A (zh) | 2020-03-24 | 2020-05-29 | 信息传播系统以及其方法 |
US16/889,820 US11367446B2 (en) | 2020-03-24 | 2020-06-02 | Information dissemination system and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109109772A TWI730686B (zh) | 2020-03-24 | 2020-03-24 | 信息傳播系統以及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI730686B true TWI730686B (zh) | 2021-06-11 |
TW202137742A TW202137742A (zh) | 2021-10-01 |
Family
ID=72565592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109109772A TWI730686B (zh) | 2020-03-24 | 2020-03-24 | 信息傳播系統以及其方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11367446B2 (zh) |
CN (1) | CN111724792A (zh) |
TW (1) | TWI730686B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI669710B (zh) * | 2018-01-30 | 2019-08-21 | 大陸商出門問問信息科技有限公司 | 音箱的控制方法、控制裝置、存儲介質及電子設備 |
TWI684874B (zh) * | 2018-10-18 | 2020-02-11 | 瑞軒科技股份有限公司 | 智慧型音箱及其操作方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7113572B2 (en) * | 2001-10-03 | 2006-09-26 | Cingular Wireless Ii, Llc | System and method for recognition of and automatic connection using spoken address information received in voice mails and live telephone conversations |
US9546005B2 (en) * | 2015-04-07 | 2017-01-17 | Honeywell International Inc. | Voice router |
CN105611045A (zh) * | 2015-12-17 | 2016-05-25 | 小米科技有限责任公司 | 设备控制方法及装置 |
CN107800594A (zh) * | 2016-08-31 | 2018-03-13 | 深圳市轻生活科技有限公司 | 用于家庭语音控制中心的智能路由器及其信号传输方法 |
-
2020
- 2020-03-24 TW TW109109772A patent/TWI730686B/zh active
- 2020-05-29 CN CN202010477292.3A patent/CN111724792A/zh not_active Withdrawn
- 2020-06-02 US US16/889,820 patent/US11367446B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI669710B (zh) * | 2018-01-30 | 2019-08-21 | 大陸商出門問問信息科技有限公司 | 音箱的控制方法、控制裝置、存儲介質及電子設備 |
TWI684874B (zh) * | 2018-10-18 | 2020-02-11 | 瑞軒科技股份有限公司 | 智慧型音箱及其操作方法 |
Also Published As
Publication number | Publication date |
---|---|
US11367446B2 (en) | 2022-06-21 |
TW202137742A (zh) | 2021-10-01 |
US20210304748A1 (en) | 2021-09-30 |
CN111724792A (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11887604B1 (en) | Speech interface device with caching component | |
US11343611B2 (en) | Selection of master device for synchronized audio | |
US20210074291A1 (en) | Implicit target selection for multiple audio playback devices in an environment | |
US10431217B2 (en) | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point | |
CN109074806B (zh) | 控制分布式音频输出以实现语音输出 | |
US11138977B1 (en) | Determining device groups | |
US11563854B1 (en) | Selecting user device during communications session | |
US9672812B1 (en) | Qualifying trigger expressions in speech-based systems | |
WO2019199868A1 (en) | Device arbitration by multiple speech processing systems | |
CN111344780A (zh) | 基于上下文的设备仲裁 | |
US20070239453A1 (en) | Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances | |
US20070239454A1 (en) | Personalizing a context-free grammar using a dictation language model | |
WO2015017480A1 (en) | Method and apparatus using multiple simultaenous speech recognizers | |
JP2011008263A (ja) | 環境オーディオ分析を使用した音楽プレイヤの制御 | |
US20120144979A1 (en) | Free-space gesture musical instrument digital interface (midi) controller | |
WO2018152242A1 (en) | Selection of master device for synchronized audio | |
WO2023109129A1 (zh) | 语音数据的处理方法及装置 | |
US11348579B1 (en) | Volume initiated communications | |
TWI730686B (zh) | 信息傳播系統以及其方法 | |
US20220161131A1 (en) | Systems and devices for controlling network applications | |
US10832678B2 (en) | Filtering audio-based interference from voice commands using interference information | |
JP7055327B2 (ja) | 会話収集装置、会話収集システム及び会話収集方法 | |
US12010387B1 (en) | Content-based voice targeting of devices using slot and task data | |
US11410659B1 (en) | Dynamic skill endpoint | |
WO2023235029A1 (en) | Multichannel audio speech classification |