TW201503107A - 語音控制系統、電子裝置及語音控制方法 - Google Patents

語音控制系統、電子裝置及語音控制方法 Download PDF

Info

Publication number
TW201503107A
TW201503107A TW102116040A TW102116040A TW201503107A TW 201503107 A TW201503107 A TW 201503107A TW 102116040 A TW102116040 A TW 102116040A TW 102116040 A TW102116040 A TW 102116040A TW 201503107 A TW201503107 A TW 201503107A
Authority
TW
Taiwan
Prior art keywords
voice
user
sound
feedback sound
feature
Prior art date
Application number
TW102116040A
Other languages
English (en)
Other versions
TWI590228B (zh
Inventor
ren-wen Huang
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201503107A publication Critical patent/TW201503107A/zh
Application granted granted Critical
Publication of TWI590228B publication Critical patent/TWI590228B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本發明提供一種語音控制系統、電子裝置及語音控制方法。該方法包括:獲取用戶的語音信號;對獲取的語音信號進行辨識以及語義分析;確定與該分析出來的語義最匹配的回復結果;對獲取到的語音信號進行用戶聲音的物理特徵的分析;根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;根據所述回饋聲音的物理特徵播放所述回復結果。

Description

語音控制系統、電子裝置及語音控制方法
本發明涉及語音控制領域,尤其涉及一種語音控制系統、具有該語音控制系統的電子裝置以及語音控制方法。
電視、電腦、手機等終端設備的業務操作,對一些家庭用戶特別是老人或者孩子來說,手動操作方法複雜。通過語音控制終端設備的業務操作可以簡化操作方法,例如,用戶可以在手機上通過語音來發送資訊、查找電話和設定提醒事項等。此外,現有的具有語音控制功能的終端設備還可以根據用戶的語音提供相應的語音回饋,從而與用戶進行互動。然而,現有的終端設備不能根據用戶的不同語音相應改變回饋的方式,故,此類語音回饋方式過於單一,缺乏趣味性。
有鑒於此,有必要提供一種語音控制系統、電子裝置及其語音控制方法,能夠解決以上問題。
本發明提供一種語音控制系統,運行於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,該語音控制系統包括:
一獲取模組,用於獲取來自該語音輸入單元的語音信號;
一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
本發明還提供一種電子裝置,包括一語音輸入單元、一播放單元以及一處理器,該處理器包括:
一獲取模組,用於獲取來自該語音輸入單元的語音信號;
一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
本發明還提供一種語音控制方法,應用於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,該方法包括:
獲取來自該語音輸入單元的語音信號;
對該獲取模組獲取的語音信號進行辨識以及語義分析;
根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析;
根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
相較於現有技術,本發明根據用戶輸入的語音信號對應的物理特徵確定與之匹配的回饋聲音的物理特徵,然後以該回饋聲音的物理特徵播放回復結果,從而根據用戶不同語音相應地提供不同的回饋聲音,有利於提高語音回饋的趣味性。
1‧‧‧電子裝置
10‧‧‧語音輸入單元
20‧‧‧存儲單元
30‧‧‧處理器
40‧‧‧播放單元
100‧‧‧語音控制系統
101‧‧‧獲取模組
102‧‧‧語義分析模組
103‧‧‧特徵分析模組
104‧‧‧執行模組
圖1為本發明一較佳實施方式中的語音控制系統的硬體架構圖。
圖2為本發明一較佳實施方式中的語音控制方法的流程圖。
圖1為本發明一較佳實施例中的語音控制系統100的硬體架構圖,該語音控制系統100運行於一電子裝置1中,該電子裝置1可以是任一具有錄音功能以及語音播放功能的電子產品,如移動電話或平板電腦等。該電子裝置1包括用於錄音的一語音輸入單元10(如麥克風)、一存儲單元20、一處理器30(如中央處理器(Central Processing Unit,CPU)或微處理器(Microcontroller))、以及一播放單元40。在本實施方式中,該語音控制系統100存儲於該存儲單元20並由該處理器30運行。該處理器30用於執行該語音控制系統100的各個功能模組,從而根據用戶通過該語音輸入單元10輸入的語音信號對應的物理特徵確定與之匹配的回饋聲音的物理特徵,並通過該播放單元40以該回饋聲音的物理特徵播放回復結果。在其他實施方式中,該語音控制系統100的各個模組為固化於處理器30中的硬體單元。
在本實施方式中,該語音控制系統100包括一獲取模組101、一語義分析模組102、一特徵分析模組103以及一執行模組104。
該獲取模組101用於獲取用戶通過該語音輸入單元10向該電子裝置1輸入的語音信號。
該語義分析模組102用於對該獲取模組101獲取的語音信號進行辨識以及語義分析,然後在該存儲單元20中存儲的一對話資料庫中進行查找,以確定與所述分析出來的語義最匹配的回復結果。上述語義分析過程以及根據語義查找回復結果的過程可參考現有的語音回饋技術,例如,可結合上海贏思軟體技術有限公司於2004年8月13日提出的“一種聊天機器人系統”(專利申請號200410053749.9)。
該特徵分析模組103用於對該獲取模組101獲取到的語音信號進行用戶聲音的物理特徵分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵。在本實施方式中,所述用戶聲音的物理特徵包括其音高、音強和音長資訊。該特徵分析模組103根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵。
眾所周知,音高由用戶發聲時聲帶的振動頻率決定,頻率與音高成正比,如婦女和兒童的聲帶比較短且薄,聲音頻率高;男人和老人的聲帶比較長且厚,聲音頻率低,故,男人和老人的聲音較婦女和小孩的聲音來說要低沉;音強對應用戶聲音的強弱,由聲音的振幅決定;音長表現為說話時速度的快慢,決定於用戶發聲時聲帶振動的時間,從而,該特徵分析模組103可根據用戶聲音的振動頻率、振幅以及說話速度分別獲得用戶的性別年齡、情感狀態以及性格特徵。
具體的,在本實施方式中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。當然,所述對應關係並不局限於以上所示出的,還可以根據實際情況進行變更。
在另一實施方式中,所述用戶聲音的物理特徵還進一步包括其音色,取決於聲波振動的形式,由用戶聲音中分量突出的諧波成分,即共振峰的高度、位置以及數量決定。在這種情況下,該特徵分析模組103在確定了用戶聲音的音色資訊後,該特徵分析模組103還用於確定回饋聲音的音色為與該用戶聲音的音色相同的音色。
該執行模組104用於控制該播放單元40根據所述回饋聲音的物理特徵播放所述回復結果。在本實施方式中,該存儲單元20還用於預先存儲一標準回饋聲音,該標準回饋聲音具有一標準物理特徵(標準音高、標準音強、標準音長以及標準音色)的回饋聲音。該執行模組104根據特徵分析模組103確定的回饋聲音的物理特徵對該標準回饋聲音作變聲處理,而產生具有所述確定的物理特徵的回饋聲音,然後控制該播放單元40以該經過變聲處理後的標準回饋聲音,即該具有所述確定的物理特徵的回饋聲音播放所述回復結果。例如,對於音強對應用戶聲音的強弱,由聲音的振幅決定;由用戶聲音中分量突出的諧波成分,即共振峰的高度、位置以及數量決定。
圖2為本發明的語音控制方法的流程圖,該方法應用於上述電子裝置1中,包括如下步驟:
步驟S21:該獲取模組101獲取用戶通過該語音輸入單元10向該電子裝置1輸入的語音信號。
步驟S22:該語義分析模組102對該獲取模組101獲取的語音信號進行辨識以及語義分析,然後在該存儲單元20中存儲的一對話資料庫中進行查找,以獲取與所述分析出來的語義最匹配的回復結果。
步驟S23:該特徵分析模組103對該獲取模組101獲取到的語音信號進行用戶聲音的物理特徵的分析。
步驟S24:該特徵分析模組103根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵。
步驟S25:該執行模組104控制該播放單元40根據所述回饋聲音的物理特徵播放所述回復結果。
本技術領域的普通技術人員應當認識到,以上的實施方式僅是用來說明本發明,而並非用作為對本發明的限定,只要在本發明的實質精神範圍之內,對以上實施例所作的適當改變和變化都落在本發明要求保護的範圍之內。
1‧‧‧電子裝置
10‧‧‧語音輸入單元
20‧‧‧存儲單元
30‧‧‧處理器
40‧‧‧播放單元
100‧‧‧語音控制系統
101‧‧‧獲取模組
102‧‧‧語義分析模組
103‧‧‧特徵分析模組
104‧‧‧執行模組

Claims (10)

  1. 一種語音控制系統,運行於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,其改良在於,該語音控制系統包括:
    一獲取模組,用於獲取來自該語音輸入單元的語音信號;
    一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
    一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
    一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
  2. 如申請專利範圍第1項所述的語音控制系統,其中,所述特徵分析模組分析得到用戶聲音的物理特徵包括其音高、音強和音長資訊,該特徵分析模組還用於根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵。
  3. 如申請專利範圍第2項所述的語音控制系統,其中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。
  4. 如申請專利範圍第2項所述的語音控制系統,其中,所述特徵分析模組分析得到用戶聲音的物理特徵還進一步包括其音色,該特徵分析模組還用於在確定用戶聲音的音色資訊後,確定該回饋聲音具有相同音色。
  5. 如申請專利範圍第1項所述的語音控制系統,其中,所述執行模組還用於根據回饋聲音的物理特徵對一預存的標準回饋聲音作變聲處理而得到具有所述確定的對應物理特徵的回饋聲音,然後控制該播放單元以確定的對應物理特徵的回饋聲音播放所述回復結果。
  6. 一種電子裝置,包括一語音輸入單元、一播放單元以及一處理器,其改良在於,該處理器包括:
    一獲取模組,用於獲取來自該語音輸入單元的語音信號;
    一語義分析模組,用於對該獲取模組獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
    一特徵分析模組,用於對該獲取模組獲取到的語音信號進行用戶聲音的物理特徵的分析,還用於根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
    一執行模組,用於控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
  7. 如申請專利範圍第6項所述的電子裝置,其中,所述特徵分析模組分析得到用戶聲音的物理特徵包括其音高、音強和音長資訊,該特徵分析模組還用於根據用戶聲音的音高、音強和音長資訊分別確定用戶的性別年齡、情感狀態以及性格特徵,並根據一預設的對應關係確定與用戶的性別年齡、情感狀態以及性格特徵相匹配的回饋聲音所對應的性別年齡、情感狀態以及性格特徵,從而根據回饋聲音的性別年齡、情感狀態以及性格特徵分別確定該回饋聲音的包括音高、音強和音長資訊的物理特徵。
  8. 如申請專利範圍第7項所述的電子裝置,其中,該預設的對應關係為:回饋聲音的性別年齡為與用戶處於相同年齡段且不同性別、情感狀態為與用戶相同情感狀態、性格特徵為與用戶相同性格。
  9. 如申請專利範圍第6項所述的電子裝置,其中,所述執行模組還用於根據回饋聲音的物理特徵對一預存的標準回饋聲音作變聲處理而得到具有所述確定的對應物理特徵的回饋聲音,然後控制該播放單元以確定的對應物理特徵的回饋聲音播放所述回復結果。
  10. 一種語音控制方法,應用於一電子裝置中,該電子裝置包括一語音輸入單元以及一播放單元,其改良在於,該方法包括:
    獲取來自該語音輸入單元的語音信號;
    對獲取的語音信號進行辨識以及語義分析,然後根據一預存的對話資料庫確定與該分析出來的語義最匹配的回復結果;
    對獲取的語音信號進行用戶聲音的物理特徵的分析;
    根據用戶聲音的物理特徵確定用於回饋回復結果的回饋聲音的對應物理特徵;以及
    控制該播放單元根據所述回饋聲音的物理特徵播放所述回復結果。
TW102116040A 2013-04-29 2013-05-06 語音控制系統、電子裝置及語音控制方法 TWI590228B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310157926.7A CN104123938A (zh) 2013-04-29 2013-04-29 语音控制系统、电子装置及语音控制方法

Publications (2)

Publication Number Publication Date
TW201503107A true TW201503107A (zh) 2015-01-16
TWI590228B TWI590228B (zh) 2017-07-01

Family

ID=51769327

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102116040A TWI590228B (zh) 2013-04-29 2013-05-06 語音控制系統、電子裝置及語音控制方法

Country Status (3)

Country Link
US (1) US9437194B2 (zh)
CN (1) CN104123938A (zh)
TW (1) TWI590228B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10606547B2 (en) 2015-12-23 2020-03-31 Airoha Technology Corp. Electronic device

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106328144A (zh) * 2015-06-30 2017-01-11 芋头科技(杭州)有限公司 一种基于电话网络的远程语音控制系统
CN105632490A (zh) * 2015-12-18 2016-06-01 合肥寰景信息技术有限公司 一种网络社区的语音交流的语境模拟方法
CN107039050B (zh) * 2016-02-04 2020-12-04 阿里巴巴集团控股有限公司 对待测试语音识别系统的自动测试方法和装置
CN105719648B (zh) * 2016-04-22 2019-12-13 百度在线网络技术(北京)有限公司 个性化无人车交互方法及无人车
CN106228978A (zh) * 2016-08-04 2016-12-14 成都佳荣科技有限公司 一种语音识别方法
CN106504743B (zh) * 2016-11-14 2020-01-14 北京光年无限科技有限公司 一种用于智能机器人的语音交互输出方法及机器人
CN106648082A (zh) * 2016-12-09 2017-05-10 厦门快商通科技股份有限公司 一种模拟真人互动的智能服务设备及方法
CN106503275A (zh) * 2016-12-30 2017-03-15 首都师范大学 聊天机器人的音色配置方法及装置
CN107169113A (zh) * 2017-05-19 2017-09-15 网易(杭州)网络有限公司 用于基于用户性格实现人工智能对话的方法及设备
CN109002274A (zh) * 2017-06-07 2018-12-14 塞舌尔商元鼎音讯股份有限公司 可调整输出声音的电子装置及调整输出声音的方法
CN107545029A (zh) * 2017-07-17 2018-01-05 百度在线网络技术(北京)有限公司 智能设备的语音反馈方法、设备及可读介质
CN107492381A (zh) * 2017-08-29 2017-12-19 郑杰 一种聊天机器人的音色配置装置及其方法
CN107507620A (zh) * 2017-09-25 2017-12-22 广东小天才科技有限公司 一种语音播报声音设置方法、装置、移动终端及存储介质
CN107767869B (zh) * 2017-09-26 2021-03-12 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN107944542A (zh) * 2017-11-21 2018-04-20 北京光年无限科技有限公司 一种基于虚拟人的多模态交互输出方法及系统
CN108269570B (zh) * 2018-01-17 2020-09-11 深圳聚点互动科技有限公司 语音控制背景音乐主机的方法、装置、设备及存储介质
CN108469966A (zh) * 2018-03-21 2018-08-31 北京金山安全软件有限公司 语音播报控制方法、装置、智能设备及介质
CN109086448B (zh) * 2018-08-20 2021-04-30 广东小天才科技有限公司 一种基于性别特征信息的语音搜题方法及家教设备
CN111292737A (zh) * 2018-12-07 2020-06-16 阿里巴巴集团控股有限公司 语音交互及语音唤醒检测方法、装置、设备及存储介质
CN111416903A (zh) * 2019-01-08 2020-07-14 塞舌尔商元鼎音讯股份有限公司 声音播放系统及其调整输出声音的方法
CN110197659A (zh) * 2019-04-29 2019-09-03 华为技术有限公司 基于用户画像的反馈方法、装置及系统
CN110265021A (zh) * 2019-07-22 2019-09-20 深圳前海微众银行股份有限公司 个性化语音交互方法、机器人终端、装置及可读存储介质
CN111477224A (zh) * 2020-03-23 2020-07-31 一汽奔腾轿车有限公司 一种人车虚拟交互系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3838039B2 (ja) * 2001-03-09 2006-10-25 ヤマハ株式会社 音声合成装置
US7315821B2 (en) * 2002-01-31 2008-01-01 Sanyo Electric Co., Ltd. System and method for health care information processing based on acoustic features
KR20040058855A (ko) * 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
US7275032B2 (en) * 2003-04-25 2007-09-25 Bvoice Corporation Telephone call handling center where operators utilize synthesized voices generated or modified to exhibit or omit prescribed speech characteristics
US7725316B2 (en) * 2006-07-05 2010-05-25 General Motors Llc Applying speech recognition adaptation in an automated speech recognition system of a telematics-equipped vehicle
EP2045140B1 (en) * 2007-10-01 2010-01-27 Harman/Becker Automotive Systems GmbH Adjustment of vehicular elements by speech control
US8195460B2 (en) * 2008-06-17 2012-06-05 Voicesense Ltd. Speaker characterization through speech analysis
KR101625668B1 (ko) * 2009-04-20 2016-05-30 삼성전자 주식회사 전자기기 및 전자기기의 음성인식방법
US8335689B2 (en) * 2009-10-14 2012-12-18 Cogi, Inc. Method and system for efficient management of speech transcribers
CN102117614B (zh) * 2010-01-05 2013-01-02 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
CN102324241A (zh) * 2011-05-04 2012-01-18 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的电子装置及语音控制方法
EP2575064A1 (en) * 2011-09-30 2013-04-03 General Electric Company Telecare and/or telehealth communication method and system
WO2013187610A1 (en) * 2012-06-15 2013-12-19 Samsung Electronics Co., Ltd. Terminal apparatus and control method thereof
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10606547B2 (en) 2015-12-23 2020-03-31 Airoha Technology Corp. Electronic device

Also Published As

Publication number Publication date
US9437194B2 (en) 2016-09-06
CN104123938A (zh) 2014-10-29
US20140324425A1 (en) 2014-10-30
TWI590228B (zh) 2017-07-01

Similar Documents

Publication Publication Date Title
TWI590228B (zh) 語音控制系統、電子裝置及語音控制方法
US11289087B2 (en) Context-based device arbitration
US11138977B1 (en) Determining device groups
US11875820B1 (en) Context driven device arbitration
US20200365155A1 (en) Voice activated device for use with a voice-based digital assistant
US10068573B1 (en) Approaches for voice-activated audio commands
US11949818B1 (en) Selecting user device during communications session
US9837068B2 (en) Sound sample verification for generating sound detection model
US11355098B1 (en) Centralized feedback service for performance of virtual assistant
US11495235B2 (en) System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks
JP6812843B2 (ja) 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法
US10685664B1 (en) Analyzing noise levels to determine usability of microphones
CN111028845A (zh) 多音频识别方法、装置、设备及可读存储介质
US10854182B1 (en) Singing assisting system, singing assisting method, and non-transitory computer-readable medium comprising instructions for executing the same
CN112216294A (zh) 音频处理方法、装置、电子设备及存储介质
CN109994106A (zh) 一种语音处理方法及设备
US10629199B1 (en) Architectures and topologies for vehicle-based, voice-controlled devices
JP4906776B2 (ja) 音声制御装置
CN114446268B (zh) 一种音频数据处理方法、装置、电子设备、介质和程序产品
Biagetti et al. Distributed speech and speaker identification system for personalized domotic control
CN112823047A (zh) 用于控制网络应用程序的系统和设备
US12033632B2 (en) Context-based device arbitration
JP2014197072A (ja) 音声合成システム、及び音声合成方法
CN110289010B (zh) 一种声音采集的方法、装置、设备和计算机存储介质
WO2023236054A1 (zh) 一种生成音频的方法、装置及存储介质