TWI508057B - 語音辨識系統以及方法 - Google Patents

語音辨識系統以及方法 Download PDF

Info

Publication number
TWI508057B
TWI508057B TW102125241A TW102125241A TWI508057B TW I508057 B TWI508057 B TW I508057B TW 102125241 A TW102125241 A TW 102125241A TW 102125241 A TW102125241 A TW 102125241A TW I508057 B TWI508057 B TW I508057B
Authority
TW
Taiwan
Prior art keywords
voice recognition
user
voice
server
dictionary
Prior art date
Application number
TW102125241A
Other languages
English (en)
Other versions
TW201503105A (zh
Inventor
Guanliang Lee
Chihyin Chiang
Chewei Chang
Original Assignee
Chunghwa Picture Tubes Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Picture Tubes Ltd filed Critical Chunghwa Picture Tubes Ltd
Priority to TW102125241A priority Critical patent/TWI508057B/zh
Priority to US14/070,594 priority patent/US20150019221A1/en
Publication of TW201503105A publication Critical patent/TW201503105A/zh
Application granted granted Critical
Publication of TWI508057B publication Critical patent/TWI508057B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

語音辨識系統以及方法
本發明是有關於一種語音辨識系統以及方法。
語音識別技術係用以將人類的語音中的詞彙內容轉換為計算機可存取的輸入,例如按鍵、二進制編碼或者字元序列。目前一般常用規則模型或是統計模型,來進行語音辨識的搜尋和比對。規則模型會分析語音中的語言文法、結構等,來進行語音辨識。統計模型則會使用機率統計的方式,來搜尋語言單位內的資料。不管應用何者進行語音辨識,皆有一定的複雜度。
傳統的語音辨識系統中,常會將全部的系統實作在單一使用者裝置上。然而,此種作法多半需要耗費使用者裝置上較多的計算資源,才能夠達到即時的語音辨識且具有一定的辨識正確率。此外,此類的使用者裝置多半採用封閉系統架構,不方便使用者更新字典檔。
因此,如何降低使用者裝置進行語音辨識所需耗費之計算資源,實屬當前重要研發課題之一,亦成為當前相關領域亟需改進的目標。
因此,本發明之一態樣是在提供一種語音辨識系統,用以根據使用者對應之個人字典檔,進行語音辨識。語音辨識系統包含一伺服器、一資料傳輸界面以及一語音辨識裝置。語音辨識裝置透過資料傳輸界面與伺服器建立連結。語音辨識裝置包含一麥克風、一輸出元件以及一處理元件。處理元件電性連接麥克風以及輸出元件。處理元件包含一使用者資訊接收模組、一個人字典取得模組、一語音接收模組、一音訊轉換模組以及一搜尋模組。使用者資訊接收模組接收一使用者之一使用者資訊。個人字典取得模組透過資料傳輸界面,傳送使用者資訊至伺服器,以取得使用者資訊對應之一個人字典檔。語音接收模組透過麥克風接收使用者之一待辨識語音訊號。音訊轉換模組根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。搜尋模組根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並透過輸出元件,輸出語音辨識結果。
本發明之另一態樣是在提供一種語音辨識方法,其包含以下步驟:(a)由一語音辨識裝置,接收一使用者之一使用者資訊;(b)由語音辨識裝置傳送使用者資訊至一伺服器,以取得使用者資訊對應之一個人字典檔;(c)透過語音辨識裝置之一麥克風接收使用者之一待辨識語音訊號; (d)由語音辨識裝置根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔;以及(e)由語音辨識裝置根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並輸出語音辨識結果。
100‧‧‧伺服器
110‧‧‧更新模組
120‧‧‧相關字典提供模組
200‧‧‧資料傳輸界面
300‧‧‧語音辨識裝置
310‧‧‧麥克風
320‧‧‧輸出元件
330‧‧‧處理元件
331‧‧‧使用者資訊接收模組
332‧‧‧個人字典取得模組
333‧‧‧語音接收模組
334‧‧‧音訊轉換模組
335‧‧‧搜尋模組
336‧‧‧聲音辨識模組
337‧‧‧辨識錯誤判斷模組
400‧‧‧語音辨識方法
410-450‧‧‧步驟
第1圖繪示依照本發明一實施例的一種語音辨識系統之功能方塊圖。
第2圖為依照本發明一實施方式的一種語音辨識方法之流程圖。
以下將以圖式及詳細說明本發明之精神,任何所屬技術領域中具有通常知識者在瞭解本發明之較佳實施例後,當可由本發明所教示之技術加以改變及修飾,其並不脫離本發明之精神與範圍。
請參照第1圖,其繪示依照本發明一實施例的一種語音辨識系統之功能方塊圖。語音辨識系統根據使用者對應之個人字典檔,進行語音辨識。
語音辨識系統包含一伺服器100、一資料傳輸界面200以及一語音辨識裝置300。其中,伺服器100可由至少一個伺服器所提供。當伺服器100由多個伺服器所提供時,此些伺服器可包含至少一當地伺服器、至少一雲端伺服器 或其組合。其中,當地伺服器可儲存當地字典檔,以服務當地使用者;雲端伺服器則可儲存專業字典檔,服務所有使用者。
資料傳輸界面200可為有線或無線網路通訊協定。然而,在其他實施例中,資料傳輸界面200可為其他類型有線或無線之資料傳輸界面,並不限於本揭露書中。
語音辨識裝置300透過資料傳輸界面200與伺服器100建立連結。語音辨識裝置300包含一麥克風310、一輸出元件320以及一處理元件330。處理元件330電性連接麥克風310以及輸出元件320。
處理元件330包含一使用者資訊接收模組331、一個人字典取得模組332、一語音接收模組333、一音訊轉換模組334以及一搜尋模組335。使用者資訊接收模組331接收一使用者之一使用者資訊。在本發明之一些實施例中,使用者可透過鍵盤、滑鼠、圖形化使用者界面(Graphical User Interface,GUI)或其他類型之輸入界面,輸入其使用者資訊。在本發明之另一些實施例中,處理元件330之一聲音辨識模組336可透過麥克風310接收一使用者聲音訊號,根據使用者聲音訊號,判斷使用者為何,並對應產生使用者之使用者資訊,供使用者資訊接收模組331接收。其中,聲音辨識模組336可辨識出使用者對應之使用者識別資訊,作為其使用者資訊。此外,聲音辨識模組336可根據使用者聲音訊號,辨識出使用者之聲音類別(如語言、腔調或其他類型之聲音類別),作為其使用者資訊。
個人字典取得模組332透過資料傳輸界面200,傳送使用者資訊至伺服器100,以取得使用者資訊對應之一個人字典檔。其中,個人字典檔的產生可取決於使用者的語音辨識結果的歷史資料,以及他人近期使用的相關資料。舉例來說,個人字典取得模組332可取得收錄使用者常用字彙之個人字典檔。又例如說,個人字典取得模組332可根據使用者資訊中之語言、腔調或其他類型之聲音類別,取得相應之個人字典檔。
語音接收模組333透過麥克風310接收使用者之一待辨識語音訊號。音訊轉換模組334根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。如此一來,可避免因為使用者聲音特性不同,所造成的語音辨識正確率低落之缺點。此外,數位特徵檔的檔案大小將小於待辨識語音訊號,因此可縮短進一步語音辨識所需之時間。
搜尋模組335根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並透過輸出元件320,輸出語音辨識結果。在本發明之一些實施例中,輸出元件320可為一顯示元件,用以顯示語音辨識結果。在本發明之另一些實施例中,輸出元件320可為一喇叭,用以發出語音辨識結果對應之聲音。然而,在本發明之其他實施例中,輸出元件320可用其他輸出方式,輸出語音辨識結果,並不限於本揭露書。如此一來,語音辨識裝置300不須儲存大量之字典檔,即可提供精確的語音辨識功能。因此,可用處理元件 效能較差或儲存元件容量較小之電子裝置,作為語音辨識裝置300。
此外,在本發明之一些實施例中,使用者可透過語音辨識裝置300之鍵盤、滑鼠、圖形化使用者界面(Graphical User Interface,GUI)或其他類型之輸入界面,回饋語音辨識結果是否正確。在本發明之另一些實施例中,處理元件330更可包含一辨識錯誤判斷模組337。由於一般使用者在發覺辨識錯誤時,會重複其先前說出之字彙或句子,以進行重新辨識。因此,辨識錯誤判斷模組337可先判斷麥克風310所接收之訊號是否與先前之待辨識語音訊號相同。當麥克風310接收與待辨識語音訊號相同之一重複語音訊號時,辨識錯誤判斷模組337會判定語音辨識結果辨識錯誤。如此一來,當使用者在發覺辨識錯誤時,僅需重複發出相同聲音,即可使語音辨識裝置300判定辨識錯誤,重新修正其辨識結果,方便使用者操作。
另外,伺服器100之一更新模組110更可透過資料傳輸界面200,自語音辨識裝置300接收語音辨識結果是否正確之資訊,作為更新個人字典之依據。舉例來說,更新模組110可根據語音辨識結果之正確與否,調整對應詞彙之權重,進而提高辨識之正確率。
在本發明之一些實施例中,伺服器100更可包含一相關字典提供模組120。相關字典提供模組120透過資料傳輸界面200,接收語音辨識結果,並根據語音辨識結果,傳送一相關字典檔至語音辨識裝置300,供搜尋模組335搜 尋。舉例來說,當相關字典提供模組120判斷語音辨識結果相關於天氣,相關字典提供模組120傳送包含天氣相關詞彙之相關字典檔至語音辨識裝置300。如此一來,可提高語音辨識裝置300之辨識正確率。此外,亦可縮短因為辨識錯誤,而需修改辨識結果或重新傳送字典檔之額外時間。
在本發明之另一些實施例中,伺服器100若包含當地伺服器時,當地伺服器可儲存近期常用字典檔。由於同一個當地伺服器服務的使用者多半具有相近的語音內容或習慣用字,因而可減少當地伺服器所需儲存之字典檔的檔案大小。
請參照第2圖,其為依照本發明一實施方式的一種語音辨識方法之流程圖。語音辨識方法可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行語音辨識方法。電腦可讀取記錄媒體可為唯讀記憶體、快閃記憶體、軟碟、硬碟、光碟、隨身碟、磁帶、可由網路存取之資料庫或熟悉此技藝者可輕易思及具有相同功能之電腦可讀取記錄媒體。語音辨識方法400包含以下步驟:
在步驟410中,由一語音辨識裝置,接收一使用者之一使用者資訊。在本發明之一些實施例中,使用者可透過鍵盤、滑鼠、圖形化使用者界面或其他類型之輸入界面,輸入其使用者資訊。在本發明之另一些實施例中,可透過語音辨識裝置之麥克風接收一使用者聲音訊號。接下來,可根據使用者聲音訊號,判斷使用者為何,並對應產生使 用者之使用者資訊,供語音辨識裝置接收(步驟410)。其中,可辨識出使用者對應之使用者識別資訊,作為其使用者資訊。此外,亦可根據使用者聲音訊號,辨識出使用者之聲音類別(如語言、腔調或其他類型之聲音類別),作為其使用者資訊。
在步驟420中,由語音辨識裝置傳送使用者資訊至一伺服器,以取得使用者資訊對應之一個人字典檔。舉例來說,語音辨識裝置可取得收錄使用者常用字彙之個人字典檔。又例如說,可根據使用者資訊中之語言、腔調或其他類型之聲音類別,取得相應之個人字典檔。
在步驟430中,透過語音辨識裝置之一麥克風接收使用者之一待辨識語音訊號。
在步驟440中,由語音辨識裝置根據使用者對應之一聲紋檔案,將待辨識語音訊號轉換為一數位特徵檔。
在步驟450中,由語音辨識裝置根據數位特徵檔搜尋個人字典檔,以取得一語音辨識結果,並輸出語音辨識結果。在步驟450之一些實施例中,可透過顯示元件顯示(輸出)語音辨識結果。在步驟450之另一些實施例中,可發出(輸出)語音辨識結果對應之聲音。然而,在步驟450之其他實施例中,可用其他輸出方式,輸出語音辨識結果,並不限於本揭露書。如此一來,語音辨識裝置不須儲存大量之字典檔,即可即時提供精確的語音辨識功能。因此,可用處理元件效能較差或儲存元件容量較小之電子裝置,作為語音辨識裝置。
此外,在本發明之一些實施例中,由伺服器自語音辨識裝置,接收語音辨識結果是否正確之資訊,作為伺服器更新個人字典之依據。其中,語音辨識結果是否正確之資訊可透過鍵盤、滑鼠、圖形化使用者界面或其他類型之輸入界面接收。另外,亦可在語音辨識裝置之麥克風接收與待辨識語音訊號相同之一重複語音訊號時,判定語音辨識結果辨識錯誤。如此一來,使用者在發覺辨識錯誤時,僅需重複發出相同聲音,即可使語音辨識裝置判定辨識錯誤,重新修正其辨識結果,方便使用者操作。
另外,伺服器亦可進一步接收語音辨識結果。於是,可由伺服器根據收到之語音辨識結果,傳送一相關字典檔至語音辨識裝置,作為步驟450執行搜尋之依據。舉例來說,當判斷語音辨識結果相關於天氣,伺服器傳送包含天氣相關詞彙之相關字典檔至語音辨識裝置。如此一來,可提高語音辨識裝置之辨識正確率。此外,亦可縮短因為辨識錯誤,而需修改辨識結果或重新傳送字典檔之額外時間。
在本發明之一些實施例中,語音辨識裝置可儲存一預設字典檔。語音辨識方法400更可包含在語音辨識裝置無法辨識使用者之使用者資訊時,將預設字典檔視為個人字典檔。如此一來,在因使用者第一次登入或其他原因使得其使用者資訊無法被辨識時,仍可藉由預設字典檔提供基本的語音辨識功能。
在本發明之另一些實施例中,可記錄使用者之對話 或其歷史使用資料。於是,可根據使用者之對話內容以及歷史使用資料,產生一當前使用字典檔,以儲存於伺服器。伺服器可將當前使用字典檔設為使用者資訊對應之個人字典檔。
在本發明之另一些實施例中,伺服器可根據於本地端所提供之語音辨識服務,產生並儲存一近期常用字典檔。於是,近期常用字典檔將符合伺服器所服務之本地使用者之使用習慣。接下來,當將當前使用字典檔設為使用者資訊對應之個人字典檔之一辨識正確率小於一門檻值時,使用近期常用字典檔進行語音辨識。如此一來,使用者的使用習慣應與伺服器所服務之當地使用者相近,因此可作為改善語音辨識正確率之依據。
在本發明之另一些實施例中,可將使用者常用之至少一常用字詞儲存於伺服器中之一私人字典檔。於是,可根據使用者之私人字典檔,修改使用者之當前使用字典檔,以更符合使用者的使用習慣。
在本發明之又一些實施例中,伺服器更可儲存對應數個專業分類之數個專業字典檔。其中,專業字典檔可儲存於單一當地伺服器。此外,專業字典檔亦可儲存於至少一雲端伺服器,用以提供給當地伺服器查詢。語音辨識方法400更可包含取得至少一需修正類別。其中,可在特定專業類別的辨識錯誤率較高時,將其設為需修正類別。於是,可根據專業字典檔中需修正類別對應者,修改使用者資訊對應之個人字典檔。如此一來,可依據個人字典檔中 不同字詞所屬之專業類別進行修正,以提高整體辨識正確率。
雖然本發明已以實施方式揭露如上,然其並非用以限定本發明任何熟習此技藝者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100‧‧‧伺服器
110‧‧‧更新模組
120‧‧‧相關字典提供模組
200‧‧‧資料傳輸界面
300‧‧‧語音辨識裝置
310‧‧‧麥克風
320‧‧‧輸出元件
330‧‧‧處理元件
331‧‧‧使用者資訊接收模組
332‧‧‧個人字典取得模組
333‧‧‧語音接收模組
334‧‧‧音訊轉換模組
335‧‧‧搜尋模組
336‧‧‧聲音辨識模組
337‧‧‧辨識錯誤判斷模組

Claims (13)

  1. 一種語音辨識系統,包含:一伺服器;一資料傳輸界面;以及一語音辨識裝置,透過該資料傳輸界面與該伺服器建立連結,其中該語音辨識裝置包含:一麥克風;一輸出元件;以及一處理元件,電性連接該麥克風以及該輸出元件,其中該處理元件包含:一使用者資訊接收模組,接收一使用者之一使用者資訊;一個人字典取得模組,透過該資料傳輸界面,傳送該使用者資訊至該伺服器,以取得該使用者資訊對應之一個人字典檔;一語音接收模組,透過該麥克風接收該使用者之一待辨識語音訊號;一音訊轉換模組,根據該使用者對應之一聲紋檔案,將該待辨識語音訊號轉換為一數位特徵檔;一搜尋模組,根據該數位特徵檔搜尋該個人字典檔,以取得一語音辨識結果,並透過該輸出元件,輸出該語音辨識結果;以及一辨識錯誤判斷模組,當該麥克風接收與該待辨識語音訊號相同之一重複語音訊號時,判定該語音辨識結果辨識錯誤。
  2. 如請求項1所述之語音辨識系統,其中該處理元件更包含:一聲音辨識模組,透過該麥克風接收一使用者聲音訊號,根據該使用者聲音訊號,判斷該使用者為何,並對應產生該使用者之該使用者資訊。
  3. 如請求項1所述之語音辨識系統,其中該伺服器包含:一更新模組,透過該資料傳輸界面,自該語音辨識裝置接收該語音辨識結果是否正確之資訊,作為更新該個人字典之依據。
  4. 如請求項1所述之語音辨識系統,其中該伺服器包含:一相關字典提供模組,透過該資料傳輸界面,接收該語音辨識結果,並根據該語音辨識結果,傳送一相關字典檔至該語音辨識裝置,供該搜尋模組搜尋。
  5. 一種語音辨識方法,包含:(a)由一語音辨識裝置,接收一使用者之一使用者資訊;(b)由該語音辨識裝置傳送該使用者資訊至一伺服器,以取得該使用者資訊對應之一個人字典檔;(c)透過該語音辨識裝置之一麥克風接收該使用者之一待辨識語音訊號;(d)由該語音辨識裝置根據該使用者對應之一聲紋檔 案,將該待辨識語音訊號轉換為一數位特徵檔;(e)由該語音辨識裝置根據該數位特徵檔搜尋該個人字典檔,以取得一語音辨識結果,並輸出該語音辨識結果;以及在該語音辨識裝置之該麥克風接收與該待辨識語音訊號相同之一重複語音訊號時,判定該語音辨識結果辨識錯誤。
  6. 如請求項5所述之語音辨識方法,更包含:透過該語音辨識裝置之該麥克風接收一使用者聲音訊號;以及根據該使用者聲音訊號,判斷該使用者為何,並對應產生該使用者之該使用者資訊。
  7. 如請求項5所述之語音辨識方法,更包含:由該伺服器自該語音辨識裝置,接收該語音辨識結果是否正確之資訊,作為該伺服器更新該個人字典之依據。
  8. 如請求項5所述之語音辨識方法,其中更包含:由該伺服器接收該語音辨識結果;以及由該伺服器根據該語音辨識結果,傳送一相關字典檔至該語音辨識裝置。
  9. 如請求項5所述之語音辨識方法,其中該語音辨識裝置儲存一預設字典檔,該語音辨識方法更包含:在該語音辨識裝置無法辨識該使用者之該使用者資訊 時,將該預設字典檔視為該個人字典檔。
  10. 如請求項5所述之語音辨識方法,更包含:根據該使用者之一對話內容以及該使用者之一歷史使用資料,產生一當前使用字典檔,以儲存於該伺服器,其中該伺服器將該當前使用字典檔設為該使用者資訊對應之該個人字典檔。
  11. 如請求項10所述之語音辨識方法,其中該伺服器更儲存一近期常用字典檔,該近期常用字典檔根據該伺服器所提供之語音辨識服務而產生,該語音辨識方法更包含:當將該當前使用字典檔設為該使用者資訊對應之該個人字典檔之一辨識正確率小於一門檻值時,使用該近期常用字典檔進行語音辨識。
  12. 如請求項10所述之語音辨識方法,其中該伺服器更儲存該使用者之一私人字典檔,該私人字典檔儲存該使用者之至少一常用字詞,該語音辨識方法更包含:根據該使用者之該私人字典檔,修改該當前使用字典檔。
  13. 如請求項5所述之語音辨識方法,其中該伺服器更儲存對應複數個專業分類之複數個專業字典檔,該語音辨識方法更包含:取得至少一需修正類別;以及根據該些專業字典檔中該需修正類別對應者,修改該使 用者資訊對應之該個人字典檔。
TW102125241A 2013-07-15 2013-07-15 語音辨識系統以及方法 TWI508057B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW102125241A TWI508057B (zh) 2013-07-15 2013-07-15 語音辨識系統以及方法
US14/070,594 US20150019221A1 (en) 2013-07-15 2013-11-04 Speech recognition system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102125241A TWI508057B (zh) 2013-07-15 2013-07-15 語音辨識系統以及方法

Publications (2)

Publication Number Publication Date
TW201503105A TW201503105A (zh) 2015-01-16
TWI508057B true TWI508057B (zh) 2015-11-11

Family

ID=52277805

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102125241A TWI508057B (zh) 2013-07-15 2013-07-15 語音辨識系統以及方法

Country Status (2)

Country Link
US (1) US20150019221A1 (zh)
TW (1) TWI508057B (zh)

Families Citing this family (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9767803B1 (en) * 2013-12-16 2017-09-19 Aftershock Services, Inc. Dynamically selecting speech functionality on client devices
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) * 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN107104994B (zh) 2016-02-22 2021-07-20 华硕电脑股份有限公司 语音识别方法、电子装置及语音识别系统
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
CN106601254B (zh) * 2016-12-08 2020-11-06 阿里巴巴(中国)有限公司 信息输入方法和装置及计算设备
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
KR101883301B1 (ko) * 2017-01-11 2018-07-30 (주)파워보이스 인공 지능 자동 화자 식별 방법을 이용하는 개인 맞춤형 음성 인식 서비스 제공 방법 및 이에 사용되는 서비스 제공 서버
KR102068182B1 (ko) * 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
JP6883471B2 (ja) * 2017-05-11 2021-06-09 オリンパス株式会社 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN108021554A (zh) * 2017-11-14 2018-05-11 无锡小天鹅股份有限公司 语音识别方法、装置以及洗衣机
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11815936B2 (en) 2018-08-22 2023-11-14 Microstrategy Incorporated Providing contextually-relevant database content based on calendar data
US11238210B2 (en) 2018-08-22 2022-02-01 Microstrategy Incorporated Generating and presenting customized information cards
US11714955B2 (en) 2018-08-22 2023-08-01 Microstrategy Incorporated Dynamic document annotations
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
CN109582780B (zh) * 2018-12-20 2021-10-01 广东小天才科技有限公司 一种基于用户情绪的智能问答方法及装置
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11682390B2 (en) 2019-02-06 2023-06-20 Microstrategy Incorporated Interactive interface for analytics
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110265013A (zh) * 2019-06-20 2019-09-20 平安科技(深圳)有限公司 语音的识别方法及装置、计算机设备、存储介质
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11769509B2 (en) 2019-12-31 2023-09-26 Microstrategy Incorporated Speech-based contextual delivery of content
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
TWI809335B (zh) * 2020-12-11 2023-07-21 中華電信股份有限公司 個人化語音辨識方法及語音辨識系統
DE102021119682A1 (de) 2021-07-29 2023-02-02 Audi Aktiengesellschaft System und Verfahren zur Sprachkommunikation mit einem Kraftfahrzeug
US11790107B1 (en) 2022-11-03 2023-10-17 Vignet Incorporated Data sharing platform for researchers conducting clinical trials

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567189A (zh) * 2008-04-22 2009-10-28 株式会社Ntt都科摩 声音识别结果修正装置、方法以及系统
TW201021023A (en) * 2008-11-18 2010-06-01 Cyberon Corp Server and method for speech searching via a server
TW201142823A (en) * 2010-05-24 2011-12-01 Microsoft Corp Voice print identification
TW201142822A (en) * 2010-05-28 2011-12-01 Ind Tech Res Inst Speech recognition system and method with adjustable memory usage

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2607457B2 (ja) * 1984-09-17 1997-05-07 株式会社東芝 パターン認識装置
US5991720A (en) * 1996-05-06 1999-11-23 Matsushita Electric Industrial Co., Ltd. Speech recognition system employing multiple grammar networks
JP3556425B2 (ja) * 1997-03-18 2004-08-18 株式会社東芝 共有辞書更新方法および辞書サーバ
EP1021804A4 (en) * 1997-05-06 2002-03-20 Speechworks Int Inc SYSTEM AND METHOD FOR DEVELOPING INTERACTIVE LANGUAGE APPLICATIONS
JP3476007B2 (ja) * 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2001331799A (ja) * 2000-03-16 2001-11-30 Toshiba Corp 画像処理装置および画像処理方法
US6973427B2 (en) * 2000-12-26 2005-12-06 Microsoft Corporation Method for adding phonetic descriptions to a speech recognition lexicon
EP1233406A1 (en) * 2001-02-14 2002-08-21 Sony International (Europe) GmbH Speech recognition adapted for non-native speakers
JP4177598B2 (ja) * 2001-05-25 2008-11-05 株式会社東芝 顔画像記録装置、情報管理システム、顔画像記録方法、及び情報管理方法
TWI278782B (en) * 2001-08-24 2007-04-11 Toshiba Corp Personal recognition apparatus
US7124080B2 (en) * 2001-11-13 2006-10-17 Microsoft Corporation Method and apparatus for adapting a class entity dictionary used with language models
US7548863B2 (en) * 2002-08-06 2009-06-16 Apple Inc. Adaptive context sensitive analysis
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
WO2005027093A1 (en) * 2003-09-11 2005-03-24 Voice Signal Technologies, Inc. Generation of an alternative pronunciation
JP3944159B2 (ja) * 2003-12-25 2007-07-11 株式会社東芝 質問応答システムおよびプログラム
US7660715B1 (en) * 2004-01-12 2010-02-09 Avaya Inc. Transparent monitoring and intervention to improve automatic adaptation of speech models
US8972444B2 (en) * 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US20060020492A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based medical system for automatically generating healthcare billing codes from a patient encounter
US8463611B2 (en) * 2004-10-13 2013-06-11 Hewlett-Packard Development Company, L.P. Method and system for improving the fidelity of a dialog system
JP4267584B2 (ja) * 2005-02-28 2009-05-27 株式会社東芝 機器制御装置及びその方法
US20090066722A1 (en) * 2005-08-29 2009-03-12 Kriger Joshua F System, Device, and Method for Conveying Information Using Enhanced Rapid Serial Presentation
CA2624240A1 (en) * 2005-08-29 2007-03-08 Joshua F. Kriger System, device, and method for conveying information using a rapid serial presentation technique
US20070106685A1 (en) * 2005-11-09 2007-05-10 Podzinger Corp. Method and apparatus for updating speech recognition databases and reindexing audio and video content using the same
US20070124147A1 (en) * 2005-11-30 2007-05-31 International Business Machines Corporation Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems
JP4846734B2 (ja) * 2005-12-07 2011-12-28 三菱電機株式会社 音声認識装置
WO2007097176A1 (ja) * 2006-02-23 2007-08-30 Nec Corporation 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
US20070276651A1 (en) * 2006-05-23 2007-11-29 Motorola, Inc. Grammar adaptation through cooperative client and server based speech recognition
US20090204392A1 (en) * 2006-07-13 2009-08-13 Nec Corporation Communication terminal having speech recognition function, update support device for speech recognition dictionary thereof, and update method
WO2008072413A1 (ja) * 2006-12-15 2008-06-19 Mitsubishi Electric Corporation 音声認識装置
JP4867654B2 (ja) * 2006-12-28 2012-02-01 日産自動車株式会社 音声認識装置、および音声認識方法
US8135590B2 (en) * 2007-01-11 2012-03-13 Microsoft Corporation Position-dependent phonetic models for reliable pronunciation identification
JP2008197229A (ja) * 2007-02-09 2008-08-28 Konica Minolta Business Technologies Inc 音声認識辞書構築装置及びプログラム
US8949266B2 (en) * 2007-03-07 2015-02-03 Vlingo Corporation Multiple web-based content category searching in mobile search application
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US20090037171A1 (en) * 2007-08-03 2009-02-05 Mcfarland Tim J Real-time voice transcription system
US7983902B2 (en) * 2007-08-23 2011-07-19 Google Inc. Domain dictionary creation by detection of new topic words using divergence value comparison
US7827165B2 (en) * 2007-09-17 2010-11-02 International Business Machines Corporation Providing a social network aware input dictionary
JP2009229529A (ja) * 2008-03-19 2009-10-08 Toshiba Corp 音声認識装置及び音声認識方法
JP4609527B2 (ja) * 2008-06-03 2011-01-12 株式会社デンソー 自動車用情報提供システム
US8180641B2 (en) * 2008-09-29 2012-05-15 Microsoft Corporation Sequential speech recognition with two unequal ASR systems
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US9640175B2 (en) * 2011-10-07 2017-05-02 Microsoft Technology Licensing, Llc Pronunciation learning from user correction
US8909516B2 (en) * 2011-10-27 2014-12-09 Microsoft Corporation Functionality for normalizing linguistic items
US20130110511A1 (en) * 2011-10-31 2013-05-02 Telcordia Technologies, Inc. System, Method and Program for Customized Voice Communication
US8825481B2 (en) * 2012-01-20 2014-09-02 Microsoft Corporation Subword-based multi-level pronunciation adaptation for recognizing accented speech
US9734151B2 (en) * 2012-10-31 2017-08-15 Tivo Solutions Inc. Method and system for voice based media search

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567189A (zh) * 2008-04-22 2009-10-28 株式会社Ntt都科摩 声音识别结果修正装置、方法以及系统
TW201021023A (en) * 2008-11-18 2010-06-01 Cyberon Corp Server and method for speech searching via a server
TW201142823A (en) * 2010-05-24 2011-12-01 Microsoft Corp Voice print identification
TW201142822A (en) * 2010-05-28 2011-12-01 Ind Tech Res Inst Speech recognition system and method with adjustable memory usage

Also Published As

Publication number Publication date
US20150019221A1 (en) 2015-01-15
TW201503105A (zh) 2015-01-16

Similar Documents

Publication Publication Date Title
TWI508057B (zh) 語音辨識系統以及方法
US10614803B2 (en) Wake-on-voice method, terminal and storage medium
JP6820058B2 (ja) 音声認識方法、装置、デバイス、及び記憶媒体
US8972260B2 (en) Speech recognition using multiple language models
CN111739514B (zh) 一种语音识别方法、装置、设备及介质
US11494434B2 (en) Systems and methods for managing voice queries using pronunciation information
CN112115706A (zh) 文本处理方法、装置、电子设备及介质
US10170122B2 (en) Speech recognition method, electronic device and speech recognition system
US20200279565A1 (en) Caching Scheme For Voice Recognition Engines
CN106713111B (zh) 一种添加好友的处理方法、终端及服务器
US11151996B2 (en) Vocal recognition using generally available speech-to-text systems and user-defined vocal training
JP2018045001A (ja) 音声認識システム、情報処理装置、プログラム、音声認識方法
US20210034662A1 (en) Systems and methods for managing voice queries using pronunciation information
US20230317078A1 (en) Systems and methods for local interpretation of voice queries
US11170765B2 (en) Contextual multi-channel speech to text
CN111126084B (zh) 数据处理方法、装置、电子设备和存储介质
WO2021051564A1 (zh) 语音识别方法、装置、计算设备和存储介质
US11410656B2 (en) Systems and methods for managing voice queries using pronunciation information
CN110809796B (zh) 具有解耦唤醒短语的语音识别系统和方法
WO2022143349A1 (zh) 一种确定用户意图的方法及装置
CN103474063A (zh) 语音辨识系统以及方法
CN113724698B (zh) 语音识别模型的训练方法、装置、设备及存储介质
US6934364B1 (en) Handset identifier using support vector machines
JP6867939B2 (ja) 計算機、言語解析方法、及びプログラム
CN113948064A (zh) 语音合成和语音识别

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees