TWI506982B - 音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體 - Google Patents

音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體 Download PDF

Info

Publication number
TWI506982B
TWI506982B TW097113830A TW97113830A TWI506982B TW I506982 B TWI506982 B TW I506982B TW 097113830 A TW097113830 A TW 097113830A TW 97113830 A TW97113830 A TW 97113830A TW I506982 B TWI506982 B TW I506982B
Authority
TW
Taiwan
Prior art keywords
search
information
keyword
information processing
unit
Prior art date
Application number
TW097113830A
Other languages
English (en)
Other versions
TW200922223A (en
Inventor
Motoki Nakade
Hiroaki Ogawa
Hitoshi Honda
Yoshinori Kurata
Daisuke Ishizuka
Original Assignee
Sony Corp
So Net Entertainment Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2007325275A external-priority patent/JP5042799B2/ja
Priority claimed from JP2007325274A external-priority patent/JP4987682B2/ja
Application filed by Sony Corp, So Net Entertainment Corp filed Critical Sony Corp
Publication of TW200922223A publication Critical patent/TW200922223A/zh
Application granted granted Critical
Publication of TWI506982B publication Critical patent/TWI506982B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體
相關申請案之對照
本發明含有與2007年4月16日在日本專利局中所申請之日本專利申請案JP 2007-107319,2007年4月16日在日本專利局中所申請之日本專利申請案JP 2007-107324,2007年12月17日在日本專利局中所申請之日本專利申請案JP 2007-325274,及2007年12月17日在日本專利局中所申請之日本專利申請案JP 2007-325275相關連的標的物,該等申請案之全部內容將結合於本文中,以供參照。
本發明關於音訊聊天系統,資訊處理裝置,語音辨識方法,關鍵字偵測方法,及程式。
語音辨識已被研討多時,且關於所讀取之語音,語音辨識已呈現能提供相當高之準確性的辨識率。然而,仍難以在人與人之間的普通交談之辨識中提供高的性能。
近年來,在用以自語音來提取交談之主題的技術上,已執行重要的研究,該技術亦稱為標題偵測技術。當使用標題偵測技術時,用以自語音來提取本文資訊之語音辨識單元扮演著重要的角色。
做為用以自語音來提取關鍵字之方法,已知有僅注意 關鍵字而自語音來提取關鍵字之方法,以及使用大字彙的語音辨識來辨識語音,且然後自辨識結果來提取關鍵字的方法。特定地,前者之方法使用例如自可辨識順序之音素的晶格,亦即,音素晶格來提取字元順序的方法。另一方面,後者之方法使用LVCSR(大字彙的連續語音辨識)。若關鍵字的數目大時,後者之方法會因為其計算效率而有利。在該等方法的任一方法中,必須具有語文上的瞭解於即將被辨識的字彙上,且此可由即將被偵測的該等字彙之發生頻率上的資訊來加以解決。
語音辨識可分類成為辨識隔離之字元的隔離式字元辨識,及辨識由複數個字元所組成之字元順序的連續式字元辨識。該連續式字元辨識使用語言模型,亦即,〝儲存字元間之鍵接的可能性之資料庫〞,藉以防止〝具有相似的聲音但完全不同意義之字元順序〞被輸出以做為辨識結果。
然而,該語言模型僅描繪原始可辨識之字元(下文中稱為已知的字元)的資訊;因此,將難以適當地辨識稍後所暫存的字元(下文中稱為暫存的字元)。另一方面,在該隔離式字元辨識的情況中,一旦將字元暫存於辨識字元字典之中時,則在該暫存之後,可立即辨識該等字元。然而,在連續式字元辨識的情況中,僅字元之暫存並不足夠,而是須反映至語言模型之上。不幸地,反映至語言模型之上通常是困難的。
在此方面,相關技藝之實例的日本專利申請案(JP-A )第2004-252121號揭示一種方法,該方法將暫存的字元分類成為諸如〝人名〞及〝地名〞之類目,提供對應於該等類目的語言模型,以及使用該語言模型來使所暫存的字元與該等類目相互關連,藉以使新的字彙可由連續式語音辨識所辨識。
此時,所暫存的字元之選擇具有大的問題;尤其,專有名詞常係重要的關鍵字,因為專有名詞的辨識允許以有用的資訊來提供使用者。
在此方面,做為該相關技藝之實例,日本專利申請案第2002-216026號揭示一種方法,該方法自網際網路上之資訊來獲取關鍵字,且自所獲取之關鍵字來提取關鍵字。
然而,存在有許多專有名詞;因此,實際上會難以事先暫存使用者將談話之所有字元,以供語音辨識用。
針對該等理由,即使是日本專利申請案第2002-216026號中所揭示之方法仍會具有困難性於自音訊聊天期間之交談對話來高準確地辨識關鍵字相關連的最新標題之中。
本發明係鑑於上述情勢而想出。有需要來提供新的且改良的音訊聊天系統,資訊處理裝置,語音辨識方法,及程式,而可高準確地辨識存在於音訊聊天期間之交談對話中的關鍵字。
而且,有需要來提供新的且改良的資訊處理裝置,關 鍵字偵測方法,及程式,而可高準確地偵測存在於廣播資訊(節目資訊)中之在音訊聊天期間的交談之關鍵字。
依據本發明之一觀點,提供有一種音訊聊天系統,包含:複數個資訊處理裝置,用以當執行語音辨識時執行一音訊聊天;以及一搜尋伺服器,係經由一通訊網路而連接至該複數個資訊處理裝置,其中該搜尋伺服器揭示一搜尋關鍵字列表至該等資訊處理裝置之至少一資訊處理裝置,該搜尋關鍵字列表含有由該搜尋伺服器所搜尋的搜尋關鍵字,該至少一資訊處理裝置包含:一辨識字元字典產生單元,用以自該搜尋伺服器獲取該搜尋關鍵字列表,以產生辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一語音辨識單元,其藉由參照含有該辨識字元字典之一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,用於與至少一資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測單元,用以自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字。
依據本發明之另一觀點,提供有一種資訊處理裝置,其自一搜尋伺服器獲取搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天,該搜尋關鍵字列表含有由該搜尋伺服器所搜尋的搜尋關鍵字,該資訊處理裝置包含:一辨識字元字典產生單元,其自該搜尋伺服器獲取搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一語音辨識單元,其藉由參照含有 該辨識字典之一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,其與該其他資訊處理裝置執行音訊資料的通訊控制;以及一關鍵字偵測單元,其自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字。
該辨識字元字典可包含:一固定字元字典,其中係預暫存預定的字元;以及一可變字元字典,其中係視需要為基礎而更新暫存的字元,且該辨識字元字典產生單元可自搜尋關鍵字列表選擇將被暫存於該可變字元字典中之字元,以產生可變字元字典,該搜尋關鍵字列表含有搜尋伺服器之更高分級的搜尋關鍵字。
該辨識字元字典產生單元可根據由該關鍵字偵測單元所偵測之該等關鍵字的歷史資訊,以決定資訊處理裝置之使用者的偏好,且根據該偏好自搜尋關鍵字列表選擇字元。
該辨識字元字典產生單元使用搜尋伺服器搜尋自該搜尋關鍵字列表所選擇之該等字元,且自該搜尋所獲得的搜尋結果獲取與該等字元相關連之一子關鍵字,藉以以與該等字元之相互關連的方式將該子關鍵字暫存於可變字元字典之中。
該辨識字元字典產生單元可根據由該搜尋伺服器正在搜尋之該等字元的頻率所決定之搜尋分級資訊,而施加一權重至選擇自該搜尋關鍵字列表的該等個別字元。
該辨識字元字典產生單元可根據由該關鍵字偵測單元 所偵測之關鍵字的歷史資訊,而計算該等關鍵字的頻率,及改變暫存於可變字元字典中且對應於該等關鍵字之字元的權重。
依據本發明之又一觀點,提供有一種資訊處理裝置,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自辨識字元字典產生裝置獲取具有權重資訊被施加至該處之該等字元,且與其他資訊處理裝置執行一音訊聊天,該辨識字元字典產生裝置係用以施加權重資訊至所選擇之字元以供語音辨識中使用,該資訊處理裝置包含:一語音辨識單元,其藉由參照含有自該辨識字元字典產生裝置所獲取之字元的一辨識資料庫,在音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,其與該其他資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測單元,用以自語音辨識的結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字。
依據本發明之再一觀點,提供有一種語音辨識方法,係使用於一資訊處理裝置中,該資訊處理裝置自一搜尋伺服器獲取搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天,該搜尋關鍵字列表含有由搜尋伺服器所搜尋的搜尋關鍵字,該方法包含以下步驟:自搜尋伺服器獲取搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;在音訊聊天之期間自交談的內容獲得音訊資料;根據音訊資料的聲特徵來分析音訊 資料,且產生對應於該交談的內容之字元順序候選;以及藉由參照含有辨識字元字典之用於語音辨識中的一辨識資料庫,根據建構字元順序的該等字元之間的語文序連(linguistic concatenation)特徵,分析該產生之字元順序候選,藉以選擇一最可行的字元順序。
依據本發明之仍一觀點,提供有一種語音辨識方法,係使用於一資訊處理裝置中,該資訊處理裝置自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自一辨識字元字典產生裝置獲取具有權重資訊被施加至該處之字元,且與其他資訊處理裝置執行一音訊聊天,該辨識字元字典產生裝置係施加權重資訊至該等選擇之字元以供語音辨識中使用,該方法包含以下步驟:自辨識字元字典產生裝置獲取具有權重資訊被施加至該處的該等字元,且將該等字元儲存於一辨識資料庫中,以供語音辨識中使用;在音訊聊天之期間自交談的內容獲得音訊資料;根據音訊資料的聲特徵來分析音訊資料,且產生對應於交談的內容之字元順序候選;以及藉由參照該辨識資料庫,根據建構字元順序的該等字元之間的語文序連特徵,分析該產生之字元順序候選,藉以選擇一最可行的字元順序。
依據本發明之又另一觀點,提供有一種用於電腦之程式,用以控制資訊處理裝置,該資訊處理裝置一自搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天, 該程式允許電腦執行:一辨識字元字典產生功能,其自搜尋伺服器獲取搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;語音辨識功能,其藉由參照含有辨識字元字典之一辨識資料庫,在音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制功能,其與該其他資訊處理裝置執行音訊資料的通訊控制;以及一關鍵字偵測功能,其自該語音辨識之結果偵測與在該音訊聊天期間之交談的內容相關連的關鍵字。
依據上述之實施例,電腦程式係儲存於電腦的記憶體單元之中,且執行於當該電腦CPU讀取該程式時,藉以使該電腦作用成為資訊處理裝置。而且,可設置具有電腦程式被記錄於其中之可電腦讀取的記錄媒體,例如該記錄媒體可為磁碟、光碟、磁光碟、及快閃記憶體。該電腦程式可經由例如網路來加以分配,而無需使用記錄媒體。
依據本發明之再另一觀點,提供有一種用於電腦之程式,用以控制資訊處理裝置,該資訊處理裝置自搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自一辨識字元字典產生裝置獲取具有權重資訊被施加至該處之字元,及利用其他資訊處理裝置執行音訊聊天,該辨識字元字典產生裝置係施加權重資訊至該等選擇之字元以供語音辨識中使用,該程式允許電腦執行:一語音辨識功能,其藉由參照含有自辨識字元字典產生裝置所獲取之該等字元的一 辨識資料庫,在音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制功能,其與該其他資訊處理裝置執行音訊資料的通訊控制;以及一關鍵字偵測功能,其自語音辨識之結果偵測與在音訊聊天期間之交談的內容相關連的關鍵字。
依據本發明之仍另一觀點,提供有一種資訊處理裝置,包含:辨識字元字典產生單元,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋之搜尋關鍵字的搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語言辨識中使用;一廣播本文資訊接收單元,其接收來自廣播站所傳輸之廣播本文資訊;一關鍵字偵測單元,其藉由參照辨識字元字典而自廣播本文資訊偵測預定的關鍵字;以及一外部顯示裝置連接控制單元,其執行與一外部顯示裝置的連接控制,及輸出自該廣播本文資訊所偵測之關鍵字至該外部顯示裝置。
該廣播本文資訊接收單元可自連接至資訊處理裝置之該外部顯示裝置獲取接收頻道資訊及廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播本文資訊對應於該廣播頻道。選擇性地,該廣播本文資訊接收單元可自連接至資訊處理裝置之外部顯示裝置獲取接收頻道資訊,且自廣播站獲取廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播本文資訊對應於該廣播頻道。
該資訊處理裝置可儲存關鍵字之參照歷史於外部顯示 裝置中,以及其中該外部顯示裝置連接控制單元將外部顯示裝置所選擇之一關鍵字通知該搜尋伺服器。
依據本發明之又再一觀點,提供有一種資訊處理裝置包含:一辨識字元字典產生單元,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋之搜尋關鍵字的搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播聲頻資訊接收單元,其接收來自廣播站所傳輸之廣播聲頻資訊;一語音辨識單元,其藉由參照含有辨識字元字典之一辨識資料庫,而在該廣播聲頻資訊上,執行語音辨識;一關鍵字偵測單元,其自廣播聲頻資訊上之語音辨識的結果偵測預定的關鍵字;以及一外部顯示裝置連接控制單元,其執行與外部顯示裝置的連接控制,及輸出自該廣播聲頻資訊所偵測之關鍵字至該外部顯示裝置。
廣播聲頻資訊接收單元可自連接至資訊處理裝置之外部顯示裝置獲取接收頻道資訊及廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播聲頻資訊對應於該廣播頻道。選擇性地,該廣播聲頻資訊接收單元自連接至資訊處理裝置之外部顯示裝置獲取接收頻道資訊,且自廣播站獲取廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播聲頻資訊對應於該廣播頻道。
該資訊處理裝置可儲存關鍵字之參照歷史於外部顯示裝置中,且外部顯示裝置連接控制單元可將外部顯示裝置 所選擇之關鍵字通知搜尋引擎。
依據本發明之仍再一觀點,提供有一種關鍵字偵測方法,包含以下步驟:自搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;接收來自一廣播站所傳輸之廣播本文資訊;藉由參照辨識字元字典而自廣播本文資訊偵測預定的關鍵字;以及執行與一外部顯示裝置的連接控制,及輸出自廣播本文資訊所偵測之關鍵字至外部顯示裝置。
依據本發明之仍又一觀點,提供有一種關鍵字偵測方法,包含以下步驟:自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;接收來自一廣播站所傳輸之廣播聲頻資訊;藉由參照含有該辨識字元字典之一辨識資料庫,而在該廣播聲頻資訊上,執行語音辨識;自廣播聲頻資訊上之語音辨識的結果偵測預定的關鍵字;以及執行與一外部顯示裝置的連接控制,及輸出自廣播聲頻資訊所偵測之關鍵字至外部顯示裝置。
依據本發明之另又一觀點,提供有一種程式,用以允許電腦來實行:一辨識字元字典產生功能,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播本文資訊接收功能 ,其接收來自一廣播站所傳輸之廣播本文資訊;一關鍵字 偵測功能,其藉由參照辨識字元字典而自廣播本文資訊偵測預定的關鍵字;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,及輸出自該廣播本文資訊所偵測之關鍵字至外部顯示裝置。
依據上述之實施例,電腦程式係儲存於電腦的記憶體單元之中,且執行於當該電腦CPU讀取該程式時,藉以使該電腦作用成為資訊處理裝置。可設置具有電腦程式被記錄於其中之可電腦讀取的記錄媒體,例如該記錄媒體可為磁碟、光碟、磁光碟、及快閃記憶體。該電腦程式可經由例如網路來加以分配,而無需使用記錄媒體。
依據本發明之另再一觀點,提供有一種程式,用以允許電腦來實行:一辨識字元字典產生功能,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播聲頻資訊接收功能,其接收來自一廣播站所傳輸之廣播聲頻資訊;一語音辨識功能,其藉由參照含有該辨識字元字典之一辨識資料庫而在該廣播聲頻資訊上,執行語音辨識;一關鍵字偵測功能,其自廣播聲頻資訊上之該語音辨識的結果偵測預定的關鍵字;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,及輸出自該廣播聲頻資訊所偵測之該等關鍵字至外部顯示裝置。
依據上述之實施例,電腦程式係儲存於電腦的記憶體 單元之中,且執行於當該電腦的CPU讀取該程式時,藉以使該電腦作用成為資訊處理裝置。可設置具有電腦程式被記錄於其中之可電腦讀取的記錄媒體,例如該記錄媒體可為磁碟、光碟、磁光碟、及快閃記憶體。該電腦程式可經由例如網路來加以分配,而無需使用記錄媒體。
依據上述本發明之實施例,用於語音辨識之辨識字元字典係使用自搜尋伺服器所獲取之資料庫而產生,以及語音辨識係使用該辨識字元字典而執行。因此,可在音訊聊天之期間,高度準確地辨識存在於交談的對話中之關鍵字;此外,用於語音辨識的辨識字元字典係使用自搜尋伺服器所獲取之資料庫而產生,以及關鍵字偵測係使用該辨識字元字典而執行。因此,可高準確性地偵測存在於廣播資訊(節目資訊)中的關鍵字。
在下文中,將參照附圖來詳細敘述本發明之較佳實施例。注意的是,在此說明書及附圖中,具有實質相同的功能和結構之結構性元件係以相同的參照符號來表示,且該等結構性元件的重複說明將予以省略。
(第一實施例)
在下文中,將詳細敘述依據本發明第一實施例之音訊聊天系統。
第1圖係用以顯示依據第一實施例之音訊聊天系統的 說明圖式。音訊聊天系統10包含通訊網路12,搜尋伺服器14,以及資訊處理裝置20A及20B(在下文中,有時將統稱為資訊處理裝置或裝置20)。
通訊網路12係連接資訊處理裝置20與搜尋伺服器14,以致能雙向或單向通訊於其間通訊網路。例如,該通訊網路12可由諸如網際網路、電話網路、衛星通訊網路、或廣播通訊頻道之公眾網路、或諸如WAN(廣域網路)、LAN(區域網路)、IP-VPN(網際網路協定-虛擬專用網路)、乙太網路(註冊商標)、或無線LAN之專用網路所建構。該通訊網路12可為有線式或無線式。
搜尋伺服器14係使用者可使用關鍵字或類似物而透過網際網路來搜尋可用資訊的網站。在本實施例中,搜尋伺服器14可提供全文搜尋服務,而允許使用關鍵字來搜尋內儲中之資訊的全文;或其可為目錄服務,而允許搜尋由類目所分類之資訊。
資訊處理裝置20與經由通訊網路12而連接至該處的另一資訊處理裝置20藉由音訊來執行聊天(音訊聊天)。該資訊處理裝置20可請求經由通訊網路12而連接至該處的搜尋伺服器14來執行經由通訊網路12之資訊的搜尋。執行音訊聊天的另一資訊處理裝置20可經由通訊網路12而連接至該處,如圖式中所示。選擇性地,該另一資訊處理裝置20可直接地被連接,而非經由該通訊網路12地連接至USB(通用串聯匯流排)埠,諸如i.Link(i.鏈接)之IEEE1394埠,SCSI(小型電腦系統介面)埠, RS-232C埠,及其類似埠。
在圖式中所顯示的該實例中,資訊處理裝置20係桌上型個人電腦(desktop PC);然而,在本實施例中,資訊處理裝置20可為筆記型個人電腦(notebook PC)。在本實施例中,資訊處理裝置20並未受限於上述之實例,而是可由例如電視之機上盒,諸如家庭用遊戲機之資訊器具,行動電話,PDA(個人數位助理),及其類似物所建構,只要其係具有能經由網路而通訊之功能的裝置即可。 額外地,或選擇性地,該資訊處理裝置20可為由租得的使用者所攜帶之諸如可攜式遊戲機,PHS,或可攜式視頻/聲頻播放器的可攜式裝置。
在第1圖之中,僅連接兩個資訊處理裝置20至通訊網路12。然而,本實施例並未受限於該實例,而是可連接複數個資訊處理裝置20至該通訊網路12。
(資訊處理裝置20之硬體組態)
接著,將參照第2圖來簡潔地敘述依據本實施例之資訊處理裝置20的硬體組態。
第2圖係方塊圖,用以解說依據第一實施例之資訊處理裝置20的硬體組態。該資訊處理裝置20包含中央處理單元(CPU)201,唯讀記憶體(ROM)203,隨機存取記憶體(RAM)205,主匯流排207,橋接器209,外部匯流排211,介面213,輸入裝置215,輸出裝置217,儲存裝置219,驅動器221,及通訊裝置233。
CPU201作用為算術處理單元及控制單元。該CPU201依據ROM203,RAM205,儲存裝置219,或可卸取式記錄媒體16中所記錄之各式各樣的程式來控制資訊處理裝置20之全部的或部分的內部操作。該ROM203儲存由CPU201所使用之程式,算術參數,及其類似物。該RAM205暫時地儲存CPU201之執行中所使用的程式及CPU201之執行中所適當變化的參數。CPU201,ROM203,及RAM205係經由包含諸如CPU匯流排之內部匯流排的主匯流排207而彼此相互地連接。
主匯流排207係經由橋接器209而連接至諸如週邊組件互連(PCI)匯流排之外部匯流排211。
輸入裝置215包含諸如滑鼠,鍵盤,觸控面板,按鈕,開關,及搖桿之由使用者所操作的操作單元,以及諸如麥克風及頭戴式話機之音訊輸入單元。該輸入裝置215可為使用紅外線或其他的電子波之遙控單元(所謂遙控器),或可為諸如行動電話或PDA之對應於資訊處理裝置20之操作的外部連接之裝置。該輸入裝置215可為根據由使用者利用操作單元或音訊輸入單元所輸入之資訊而產生輸入信號,以及將所產生之輸入信號輸出至CPU201的輸入控制電路。該資訊處理裝置20的使用者可操作輸入裝置215以輸入各式各樣的資料至資訊處理裝置20,或指示該資訊處理裝置20來執行處理操作。
輸出裝置217可由例如可以以可見或可聽之方式來將所獲取的資訊通知使用者之諸如陰極射線管(CRT)顯示 單元,液晶顯示(液晶顯示器)單元,電漿顯示面板(PDP)單元,電致發光(EL)顯示單元,或燈之顯示單元;包含揚聲器及頭戴式耳機之聲頻輸出單元;以及諸如印表機,行動電話,或傳真機之裝置所建構。例如,該輸出裝置217輸出由搜尋伺服器所搜尋之各式各樣的資訊。特定地,該顯示單元顯示由搜尋伺服器所搜尋之針對各式各樣資訊的搜尋結果以成為本文或影像。同時,聲頻輸出單元轉換重放的音訊資料以成為音訊,而輸出該音訊。
儲存裝置219係資料儲存裝置,其係依據本發明之資訊處理裝置20的儲存單元之實例。例如,該儲存裝置219係由諸如硬碟驅動器(HDD)之磁性儲存單元,半導體儲存裝置,光學儲存裝置,磁光學儲存裝置,及其類似物所建構。儲存裝置219可儲存由CPU201所執行之程式或許許多多的資料,以及自外面所獲取之種種資料。
驅動器221係用於儲存媒體之讀取器-寫入器。該驅動器221係結合於資訊處理裝置20之中,或外部地附著至該資訊處理裝置20。該驅動器221讀出諸如磁碟,光碟,磁光碟,或半導體記憶體之可卸取式記錄媒體16中所記錄之資訊,而載入於驅動器221之中,且將所讀出之資訊輸出至RAM205。該驅動器221可將載入於驅動器221中之資訊記錄於諸如磁碟,光碟,磁光碟,或半導體記憶體的可卸取式記錄媒體16之中;例如,該可卸取式記錄媒體16可為DVD媒體,HD-DVD媒體,藍光媒體,小型快閃記憶體(CF),記憶棒,或安全數位(SD)記 憶卡。例如,該可卸取式記錄媒體16可為具有無接點型IC晶片被安裝於該處之上的電子裝置或積體電路(IC)卡。
通訊裝置223係由使用於連接至通訊網路12之通訊裝置所建構的通訊介面。例如,該通訊裝置223可為用於有線或無線區域網路(LAN)之通訊卡,藍芽或無線式USB (WUSB),用於光學通訊之路由器,用於非同步之數位用戶線(ADSL)的路由器,或用於各式各樣之通訊協定的調變解調變器。該通訊裝置223傳輸及接收種種資訊至/自網際網路或其他的通訊裝置,但伴隨著另一資訊處理裝置20而一起傳輸及接收與音訊聊天相關連的資訊。連接至通訊裝置223之通訊網路12可由諸如網際網路,家用LAN,紅外線通訊,或衛星通訊之以有線或無線之方式所連接的網路所建構。
具有上述之組態,資訊處理裝置20可與直接連接至該資訊處理裝置20之另一資訊處理裝置,或與經由通訊網路12而連接至該處之另一資訊處理裝置來執行音訊聊天,但經由通訊網路12而自連接至該處之搜尋伺服器14或其類似物來獲取種種資訊。此外,該資訊處理裝置20可使用可卸取式記錄媒體16來取出儲存於該資訊處理裝置20之中的資訊。
在上文中,已敘述可實行依據本實施例之資訊處理裝置20的功能之硬體組態。上述之該等組件可使用通用型元件而建構,或可由專用於個別組件之功能的特殊化硬體 所建構。因此,該硬體組態可依據實行本實施例時之技術水準來加以適當地修正。上述之硬體組態僅係用於描繪性之目的,且本發明並未受限於此;諸如主匯流排207,外部匯流排211,或介面213之一些組件可根據使用的形式而省略。
(資訊處理裝置20之組態)
接著,將詳細敘述依據本實施例之資訊處理裝置20的組態。在下文說明中,執行音訊聊天之兩個資訊處理裝置20將稱為第一資訊處理裝置20A及第二資訊處理裝置20B。該第一及第二資訊處理裝置20A及20B自該等資訊處理裝置之個別使用者的聲音來產生音訊資料,且傳輸該音訊資料至該音訊聊天之配對物的另一資訊處理裝置。第3圖係方塊圖,用以解說依據第一實施例之第一資訊處理裝置20A的組態。
在下文說明中,術語〝字元〞表示在語音辨識方法中可方便地被視為單一之字的單元。其無需與語文之字相同。例如〝夕口ウ君(發聲為tarou kun)〞可被視為一個字元,或可以以"tarou"及"kun"之形式而被視為兩個字元;進一步地,可將更大的單元〝 君(發聲為konnichiwa taroukun)〞視為一個字元。
此外,術語〝音素〞表示在聲頻的觀點中可方便地視為單一之單位的單元。其無需與發音上之音節或音素相同。例如,在字元〝東京(發聲為tou kyou)〞中,"tou "之部分可由三個音素符號"t/o/u",或"o"之拉長音的"to:"所表示。進一步地,"tou"之部分可由"t/o/o"所表示。此外,可採用代表無聲之符號。再者,可採用將無聲分類成為〝發聲前之無聲〞,〝插入於發聲之間之短的無聲〞,及〝對應於「(發聲為tsu)」之無聲〞的符號。
如第3圖中所示地,依據本實施例之第一資訊處理裝置20A包含音訊輸入單元251,語音辨識單元253,關鍵字偵測單元255,關鍵字管理單元257,音訊交談控制單元259,顯示單元261,音訊輸出單元263,通訊單元265,記憶體單元267,及辨識字元字典產生單元269。
該音訊輸入單元251係介面,其係將音訊聊天之期間由第一資訊處理裝置20A的使用者所發聲之語音的交談對話輸入至第一資訊處理裝置20A。例如,該音訊輸入單元251係由連接至第一資訊處理裝置20A之諸如麥克風或頭戴式話機的輸入裝置所建構。發聲至麥克風或頭戴式話機之使用者的語音係即時自動地輸入至第一資訊處理裝置20A,轉換成為電性信號之音訊信號,以及經由音訊輸入單元251而傳輸至語音辨識單元253。
語音辨識單元253係由例如CPU,ROM,或RAM所建構。該語音辨識單元253自音訊輸入單元251所獨立輸入且即時傳輸之使用者語音來產生音訊資料,且將該音訊資料傳輸至即將於稍後予以描述之音訊交談控制單元259,藉以根據所產生之音訊資料來執行語音辨識。該語音辨 識單元253產生對應於所產生之音訊資料的字元順序,以做為語音辨識的結果,且將所產生之字元順序傳輸至即將於稍後被描述的關鍵字偵測單元255。該語音辨識單元253可組構以傳輸所產生之字元順序至即將於稍後予以描述之顯示單元261。該語音辨識單元253的細節將於稍後加以描述。
關鍵字偵測單元255決定由關鍵字管理單元257所管理的關鍵字是否存在於來自語音辨識單元253所傳輸的字元順序之中,且若存在時,輸出對應於該關鍵字之字元而成為關鍵字。若複數個關鍵字存在於一字元順序之中時,該關鍵字偵測單元255可組構以偵測所對應的關鍵字。該關鍵字偵測單元255可組構以傳輸自該字元順序所偵測之關鍵字至即將於稍後被描述的顯示單元261。
例如,當〝刪除目前之結構性重訂〞的辨識結果係傳輸自語音辨識單元253時,且當〝結構性重訂〞之關鍵字存在於由關鍵字管理單元257所管理的關鍵字之中時,則該關鍵字偵測單元255輸出〝結構性重訂〞以做為關鍵字。
關鍵字管理單元257管理即將自語音辨識單元253所產生之字元順序所提取的關鍵字。該關鍵字管理單元257儲存搜尋歷史資訊或聊天歷史資訊於儲存單元267之中,該搜尋歷史資訊係第一資訊處理裝置20A之使用者利用搜尋伺服器14來執行搜尋的歷史,以及該聊天歷史資訊係使用者利用本實施例之音訊聊天系統的歷史。所管理的 關鍵字係根據歷史資訊中所包含之搜尋關鍵字或所偵測之關鍵字而選擇。由該關鍵字管理單元257所管理的關鍵字可隨意地由關鍵字偵測單元255所參照。該關鍵字管理單元257亦可提供所管理的關鍵字至語音辨識單元253,且該語音辨識單元253可依據關鍵字管理單元257所提供之關鍵字來更新即將於稍後予以描述之共振循環資料庫。
音訊交談控制單元259係由例如CPU,ROM,及RAM所建構,以及控制與經由通訊網路12所連接之第二資訊處理裝置20B之音訊聊天。該音訊交談控制單元259接收由語音辨識單元253所產生之音訊資料,且將該音訊資料經由通訊單元265而傳輸至第二資訊處理裝置20B。 該音訊交談控制單元259經由通訊單元265以接收來自第二資訊處理裝置20B所傳輸之音訊資料,且將該音訊資料傳輸至音訊輸出單元263。該音訊交談控制單元259可組構而以相互關連的方式來儲存每次當執行音訊聊天時之執行音訊聊天的日期,用以識別音訊聊天的識別號,以及用以識別音訊聊天之配對物的識別號於記憶體單元267之中,以做為聊天歷史資訊。
該音訊交談控制單元259可由專用於音訊交談控制之特殊化硬體所建構,且可設置以成為諸如音訊聊天程式之應用程式。
顯示單元261經由諸如第一資訊處理裝置20A之顯示器的顯示裝置來顯示傳輸自關鍵字偵測單元255之關鍵字至第一資訊處理裝置20A的使用者。該顯示單元261 可組構以顯示字元順序之本身,該字元順序係傳輸自語音辨識單元253之語音辨識的結果。
音訊輸出單元263係介面,其接收由第二資訊處理裝置20B之使用者所發聲之語音的音訊資料,且將所接收之音訊資料輸入至第一資訊處理裝置20A。該音訊輸出單元263係由例如揚聲器或耳機之連接至第一資訊處理裝置20A的輸出裝置所建構。
經由通訊單元265而自第二資訊處理裝置20B所接收的音訊資料係經由音訊輸出單元263而輸出至第一資訊處理裝置20A的使用者。
例如,通訊單元265係安裝於第一資訊處理裝置20A之中的通訊裝置。該通訊單元265經由第一資訊處理裝置20A(特定地,語音辨識單元253,關鍵字管理單元257,音訊交談控制單元259,及辨識字元字典產生單元269)與該第一資訊處理裝置20A的外部裝置(特定地,搜尋伺服器14,或第二資訊處理裝置20B)之間的通訊網路12來中繼資訊的通訊。此外,該通訊單元265可與直接連接至第一資訊處理裝置20A,而非經由通訊網路12所連接之其他的資訊處理裝置來通訊資訊。
記憶體單元267係安裝於例如第一資訊處理裝置20A中,且儲存諸如由關鍵字偵測單元255所偵測之關鍵字,或由關鍵字管理單元257所管理之關鍵字資訊的資料於該處之中的儲存裝置。除了該等資料之外,該記憶體單元267亦可儲存諸如由語音辨識單元253所產生之字元順序 或音訊資料的辨識結果,或許許多多的資料載於該處之中。該記憶體單元267可適當地儲存當第一資訊處理裝置20A執行一過程時需予以儲存之種種參數,及該過程之前進資訊於該處之中。當語音辨識單元253,關鍵字偵測單元255,關鍵字管理單元257,音訊交談控制單元259,辨識字元字典產生單元269,或其類似物針對記憶體單元267而執行讀取或寫入時,該記憶體單元267係可隨意存取的。
辨識字元字典產生單元269自搜尋伺服器14來獲取搜尋關鍵字列表及其類似物,且僅自所獲取之搜尋關鍵字列表來選擇合適的關鍵字,藉以產生辨識字元字典,以供語音辨識中使用。該辨識字元字典產生單元269不僅可自所獲取之搜尋關鍵字列表來選擇關鍵字,而且也可以添加該等關鍵字或與所選擇之關鍵字相關連的子關鍵字之屬性資訊,或辨識權值,以供語音辨識中使用。該辨識字元字典產生單元269的細節將在稍後描述。
<語音辨識單元253>
接著,將參照第4圖來詳細說明依據本實施例之語音辨識單元。第4圖係方塊圖,用以解說依據第一實施例之語音辨識單元253的組態。
如第4圖中所示,依據本實施例之語音辨識單元253包含AD轉換單元301,特徵參數提取單元303,匹配單元305,共用字典記憶體單元307,及辨識資料庫309。
AD轉換單元301取樣及量化音訊信號,該音訊信號係自音訊輸入單元251所傳輸之類比信號;且轉換該類比音訊信號成為音訊資料,該音訊資料係數位信號。當完成音訊資料的轉換之後,AD轉換單元301傳輸所產生之音訊資料至音訊交談控制單元259及特徵參數提取單元303。該AD轉換單元301可儲存所產生之音訊資料於記憶體單元267之中。
該特徵參數提取單元303自AD轉換單元301所產生之適用的音訊資料之各個音框來提取諸如美爾倒頻譜係數(MFCC)及其時間差參數,頻譜,功率線性預測係數,倒譜係數,以及線譜對之特徵參數。當完成該等特徵參數的提取之後,該特徵參數提取單元303傳輸所提取之特徵參數至匹配單元305(請容後描述)。該特徵參數提取單元303可將提取自音訊資料之各式各樣的特徵參數儲存於記憶體單元267之中。
該匹配單元305根據傳輸自特徵參數提取單元303之各式各樣的特徵參數,而由適當地參照辨識資料庫309及共用字典記憶體單元307來產生最接近於所輸入至音訊輸入單元251之語音(亦即,在音訊聊天期間之交談內容)的字元順序。該字元順序的產生方法請容後描述。當完成字元順序的產生之後,匹配單元305傳輸所產生之字元順序至關鍵字偵測單元255。該匹配單元305可將所產生之字元順序儲存於記憶體單元267之中。
該匹配單元305可使用根據束搜尋之維特比(Viterbi )解碼器或根據A*搜尋之堆疊解碼器來執行匹配。額外地或選擇性地,可使用所謂的關鍵字識別法(keyword spotting method)於該匹配法中。若添加稍後所描述之〝辨識權重〞資訊至該匹配單元305所參照之各式各樣的字元字典時,可將權重應用於稍後所述的語言評分,且可由加權之評分來將辨識結果分級。
共用字典記憶體單元307儲存共用字典,該共用字典係典型地使用於語音辨識中之字元的字典。在該共用字典記憶體單元307之中所儲存的共用字典中,暫存於該處之中的所有字元係以與發音資訊及類目資訊相互關連的方式來描繪。例如,當專有名詞〝 (人名)〞係暫存於該共用字典之中時,該專有名詞〝 〞係以與發音資訊(音素資訊)"ichiro"及類目〝_人名_〞相互關連的方式而暫存。該共用字典的細節將於稍後描述。
辨識資料庫309係資料庫,其儲存由匹配單元305所使用之各式各樣的模型或規則,用於字元順序的產生。該辨識資料庫309的細節將敘述於下文。
<辨識資料庫309>
接著,將參照第5圖來詳細敘述依據本實施例之辨識資料庫309。第5圖係說明圖式,用以顯示依據第一實施例的辨識資料庫309。
如第5圖中所示,依據本實施例之辨識資料庫309包含辨識字元字典記憶體單元401,聲頻模型記憶體單元 403,語言模型記憶體單元405,音素列表407,以及假名-音素轉換規則409。
辨識字元字典記憶體單元401儲存當產生字元順序時由匹配單元305所使用之辨識字元字典於該處之中。例如,該辨識字元字典包含固定字元字典,可變字元字典,及類目表。
在固定字元字典中,係說明諸如並未接受登錄及刪除之字元,亦即,事先建立於系統中之字元(下文中將稱為固定字元)的發音(音素順序),及描述該等音素之序連關係的模型之各式各樣的資訊。
在可變字元字典中,係說明諸如關鍵字字元的發音及描述該等音素之序連關係的模型之各式各樣的資訊。諸如關鍵字字元之登錄及刪除以及發音之改變的過程主要地係相對於固定字元字典中所暫存之字元而執行。該可變字元字典並不儲存任何資訊或資料於該處之中。
例如,在偵測與棒球相關連之關鍵字的情況中,共用字典記憶體單元307可將通常使用於日常交談中之字元暫存於該處之中(例如,描述於諸如日文字典之普通字典中的字元);在辨識字元字典記憶體單元401中之固定字元字典可將通常使用於棒球領域中之字元暫存於該處之中,例如〝打擊〞,〝雙殺〞,〝代打〞,或〝捕手〞。在辨識字元字典記憶體單元401中之可變字元字典可將諸如"ichiro"之在時間上變化的專有名詞暫存於該處之中。因為該可變字元字典係根據需要而更新,所以可執行包含與 棒球上之最新標題相關連的關鍵字之辨識。
接著,將參照第6及7圖來敘述依據本實施例之固定字元字典。第6及7圖係說明圖式,用以顯示依據第一實施例之固定字元字典的實例。
在第6圖中,〝符號〞係用以識別字元之字串,且可例如由日文的假名記法來表示。相同的符號可視為相同字元的登入。本實施例之語言模型係由符號所表示,〝轉錄〞表示字元的記法,以及輸出以做為辨識結果的字串係該轉錄。〝音素順序〞係例如由音素順序所表示之字元的發音。本實施例之固定字元字典不僅描繪如第6圖中所示之假名記法的符號,而且描繪如第7圖中所示之具有漢字及日文平假名之混合的字串。
第6及7圖中所描繪之〝<開始>〞及〝<結束>〞係特殊符號,分別表示〝發聲之前的無聲〞及〝發聲之後的無聲〞。因此,該等特殊的符號並不具有對應的記法於轉錄欄之中,且表示成為〝[]〞(空白)。
除了第6及7圖中所描繪的該等項目之外,本實施例之固定字元字典可包含〝屬性〞欄及〝辨識權重〞欄,該屬性欄描述諸如名詞或動詞之字元的語音部分或字元的類型,以及該辨識權重欄描述使用於稍後描述之語言評分的計算中之字元的權重資訊。
接著,將參照第8圖來敘述依據本實施例的可變字元字典。第8圖係說明圖式,用以顯示依據本實施例之可變字元字典的實例。
如第8圖中所示,本實施例的可變字元字典包含〝符號〞欄及〝假名發音〞。在第8圖中所示的實例中,係將〝_人名_〞及〝_地名_〞之兩個類目描繪成為〝符號〞;在〝_人名_〞類目中,〝 (發聲為ichiro)〞及〝 (發聲為sanitarou)〞之兩字元的發音係以假名發音來描述;以及在〝_地名_〞類目中,〝 (發聲為kitashinagawa)〞之字元的發音係以假名發音來描述。如第8圖中所示,本實施例之可變字元字典可描述特定的字元及類目。當描述除了如圖式中所示的類目之外的特定字元於可變字元字典之中時,個別的字元係描述於〝符號〞欄中,以及對應於該等字元的〝轉錄〞或〝音素順序〞將設置於該可變字元字典之中。
與該固定字元字典之情況相似地,本實施例之可變字元字典可包含〝屬性〞欄及〝辨識權重〞欄,該屬性欄描述諸如名詞或動詞之字元的語音部分或字元的類型,以及該辨識權重欄描述使用於稍後描述之語言評分的計算中之字元的權重資訊。因為描述於該可變字元字典中之該等字元主要係在時間上變化的字元,所以較佳的是,將〝辨識權重〞欄之中所描述的值設定為比在固定字元字典中所描繪之〝辨識權重〞更高。以此方式,將設定更高的〝辨識權重〞至該可變字元字典中所描述之字元。因此,在關於進行中之標題,其中使用者常交談的音訊聊天中,可以以優先之基礎來選擇特定的關鍵字或與該特定的關鍵字相關連之字元。從而,可高辨識率地執行語音辨識。
依據本實施例之可變字元字典的產生及更新方法之細節將在稍後描述。
在類目表之中,包含於語言模型記憶體單元405中之語言模型中所含的類目與該等類目中所包含之有關字元的資訊係以相互關連之方式來描述。該類目表可以以列表之形式或以表之形式來描述。若該語言模型並未包含任何類目時,則類目表並不儲存任何資訊或資料於該處之中。
該等類目可分類成為根據語意屬性之類別(例如,〝_人名_〞,〝_使用者名_〞,〝_地名_〞,〝_商店名_〞,及其類似物),或根據語音的部分之類別(例如,〝_名語_〞,〝_動詞_〞,〝_質詞_〞,及其類似物)。 在下文中,〝_…_〞之記法表示類目名稱。
第9圖顯示類目表的實例。在該類目表之中,係描述使用於稍後所述之語言模型中的類目種類以及有關屬於該類目之字元的資訊。例如,當使用〝_人名_〞及〝_地名_〞之二類目於語言模型之中時,則將該二類目,〝_人名_〞及〝_地名_〞,登入於類目表之中,如第9圖中所示。 當添加新的類目至類目表時,可將屬於所添加之新的類目之字元表示成為空白,且所屬之字元可隨著該語言模型之學習及適應性的進展而被添加至該處。在第9圖之中,屬於〝_人名_〞及〝_地名_〞之類目的字元係表示成為〝[]〞;此記法表示並不具有所屬的字元。
第10圖顯示辨識字元字典記憶體單元401之類目表的另一實例,其中登入有關字元的資訊。在第10圖中, 第一列上的登錄表示的是,〝 (發聲為ichiro)〞及〝 (發聲為sanitarou)〞之字元係屬於〝_人名_〞之類目。
聲頻模型記憶體單元403儲存聲頻類型於該處之中,該聲頻模型表示即將被辨識之語音的個別音素之聲頻特徵。此處,該聲頻模型係表示針對諸如母音或子音之各個發音符號的語音聲頻特徵之模型。該聲頻模型係使用於當以辨識候選字元來對照查勘輸入語音的音訊資料時,但注意到如聲音之相似處。做為該聲頻模型,例如可使用隱藏式馬可夫模型(HMM);然而,依據本實施例之聲頻模型並未受限於該HMM。
做為儲存於聲頻模型記憶體單元403中之聲頻模型,可設置二模型,一用於安靜的環境(能在安靜的環境下提供高辨識率之聲頻模型),以及另一用於雜訊的環境(能在雜訊的環境下提供有利之辨識率的聲頻模型),使得該等模型之任一模型均可根據環境而被引用。
語言模型記憶體單元405儲存語言模型於該處之中,該語言模型描述表示暫存於共用字典記憶體單元307及辨識字元字典記憶體單元401之各個字典中的字元如何序連(連接)之資訊(在下文中,將稱為序連資訊)。做為描述之方法,可使用統計之字元序連機率(n元語法或n類別語法),生成文法,有限狀態自動機(FSA),或其類似物。
包含於語言模型記憶體單元405中之語言模型含有自 特定之觀點所分類的字元類目之序連資訊,及字元的序連資訊。例如,當〝表示人名之字元所屬的類目〞係表示為符號〝_人名_〞,以及〝表示食物之字元所屬的類目〞係表示為符號〝_食物_〞時,則語言模型亦描述〝_人名_〞及〝_食物_〞的序連資訊。亦即,亦描述類目之間的序連以及類目與事先儲存於字典中的字元之間的序連。
因此,可獲取並未包含於語言模型中之字元的序連。 例如,當獲取〝 (發聲為ichiro)〞與〝(質詞,發聲為wa)〞之間的序連資訊時,即使〝 (發聲為ichiro)〞的序連資訊並未描述於該語言模型之中,但是若可知道該〝 (發聲為ichiro)〞屬於表示為符〝_人名_〞之類目時,則可由獲取〝_人名_〞與〝(質詞,發聲為wa)〞之間的序連資訊來獲取〝 (發聲為ichiro)〞與〝(質詞,發聲為wa)〞之間的序連資訊。
<語言模型>
接著,將參照第11圖來敘述依據本實施例之語言模型的特定實例。第11圖係說明圖式,用以顯示依據第一實施例之語言模型的實例。
在第11圖之中,係使用統計語言模型來做為語言模型。該統計語言模型係使用條件機率來描述字元之序連資訊的模型。在第11圖中所示的語言模型中,係使用表示連續三個字元1,2,及3之機率,亦即,三個序連之字 元的機率之三元語法來做為統計語言模型。
在第11圖中,〝P(字元3∣字元1字元2)〞表示在字元順序之中,〝字元3〞在連續的〝字元1〞及〝字元2〞之後發生的機率。在該圖式中所示的實例之中〝(發聲為wa)〞在連續的〝<開始>〞及〝_人名_〞之後出現的機率係"0.012"。此一機率可由分析描述大量聊天對話之本文而獲得。做為該語言模型,除了該三元語法之外,可依據需要而使用二元語法(兩個序連之機率)或一元語法(字元發生之機率)。
在第11圖之語言模型中,文法係使用類目以及字元來描述。亦即,在第11圖之中,〝_人名_〞及〝_地名_〞表示〝_人名_〞及〝_地名_〞之類目;因此,由使用該等類目來描述該三元語法,若表示人名或地名之字元係暫存於可變字元字典之中時,則表示人名或地名之字元可由語音辨識單元253來加以辨識。
音素列表407係使用於辨識資料庫309中之音素符號的列表。該音素列表407表示一音素(或對應者)為一符號,如第12圖中所示。例如,在第12圖之音素列表中,母音+冒號(例如,"a:")表示拉長的聲音,以及"N"表示〝(日文平假名,發聲為ng)。此外,"sp","silB","silE",及"q"均表示無聲,其分別表示〝發聲中之無聲〞,〝發聲前之無聲〞,〝發聲後之無聲〞,及〝對應於「(發聲為tsu)」〞。
假名-音素轉換規則409係用以轉換假名字串成為音 素順序的規則。在此方式中,藉由儲存該假名-音素轉換規則409,則共用字典記憶體單元307或辨識字元字典記憶體單元401可儲存與音素順序無關之假名字串於該處之中,以做為發音資訊。該假名-音素轉換規則409描繪自假名記法至音素的轉換規則,例如與該記法或所有可能之假名記法相互關連之音素的符號。依據第13圖中所示之假名-音素轉換規則409,可將〝 〞之假名字串轉換成為"i/ch/i/r/o:"的音素順序。
在上文中,已說明依據本實施例之第一資訊處理裝置20A的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
第二資訊處理裝置20B之組態係與第一資訊處理裝置20A實質地相同,且其說明將予以省略。
(語音辨識單元253之語音辨識方法)
接著,將參照第14圖來敘述依據本實施例之語音辨識單元253的語音辨識方法。第14圖係流程圖,用以解說依據第一實施例之語音辨識方法的實例。
稍後所描述之語音辨識方法係起始於當語音自第一資訊處理裝置20A的使用者而輸入至諸如麥克風之音訊輸入單元251時。
由音訊輸入單元251所產生的音訊信號係先由AD轉換單元301來轉換成為數位信號之音訊資料,且然後傳輸至特徵參數提取單元303(步驟S101)。此時,AD轉換單元301可儲存所產生之音訊資料於記憶體單元267之中。接著,具有音訊資料被傳輸至該處的特徵參數提取單元303自所傳輸之音訊資料來提取諸如美爾倒譜的特徵總量(步驟S103)。在該特徵參數的提取中,可使用例如倒譜分析,線性預測分析,根據聲頻濾波器而使用MFCC係數之分析的各式各樣之分析方法。該特徵參數提取單元303可將提取自音訊資料之許許多多的特徵參數儲存於記憶體單元267之中。
一旦該特徵總量由特徵參數提取單元303所提取時,該匹配單元305參照儲存於共用字典記憶體單元307中的共用字典,或儲存於辨識資料庫309中之辨識字元字典記憶體單元401中的固定字元字典及可變字元字典,且藉此,由連接在該等字典中表示為符號之該等字元的一些字元來產生字元順序(步驟S105)。然後,該匹配單元305根據儲存於該辨識資料庫309之聲頻模型記憶體單元403中的聲頻模型來計算所產生之字元順序的聲頻評分(步驟S105)。此處,該聲頻評分係表示就聲音而言(從聲頻的觀點而言),其係語音辨識結果之候選的字元順序如何密切地與輸入音訊相似的評分。高的聲頻評分意指所產生的字元順序係聲頻地接近於該輸入音訊。
一旦該聲音評分係根據該等特徵參數而計算時,則該 匹配單元305根據所計算的聲頻評分來選擇具有高的聲頻評分之預定數目的字元順序(步驟S107)。順便一提地,該匹配單元305可將所計算的聲頻評分或所選擇的字元順序儲存於記憶體單元267之中。
當完成該聲頻評分之計算時,匹配單元305可根據包含於辨識資料庫309之語言模型記憶體單元405中的語言模型來計算在步驟S107中所選擇之各個字元順序的語言評分(步驟S109)。例如,若使用文法或有限狀態自動機於語言模型記憶體單元405中所儲存的各式各樣語言模型之中時,當字元順序係可接受於該語言模型時,則該字元順序的語言評分為"1";當該字元順序無法接受於該語言模型時,則該字元順序的語言評分為"0"。
當所產生之字元順序係可接受於該語言模型時,則匹配單元305可將步驟S107中所選擇之字元順序留下。選擇性地,當所產生之字元順序係可接受以成為語言,但無法接受於語言模型時,則該匹配單元305可將步驟S107中所選擇之字元順序刪除。
當使用諸如n元語法或n類別語法之統計語言模型以做為語言模型時,則使用字元順序的生成機率來做為語言評分。計算語言評分的詳細方法係描述於由本發明申請人所申請之日本專利申請案第2001-382579號(對應於JP-A NO. 2003-186494)中。順便一提地,該匹配單元305可將所計算的語言評分儲存於記憶體單元267之中。
依據本實施例之語言模型使用儲存於共用字典記憶體 單元307中之共用字典,或儲存於辨識資料庫309中之辨識字元字典記憶體單元401中的固定字元字典及可變字元字典,來計算語言評分。因為在時間上變化的專有名詞係根據需要而以更新之方式來描述於可變字元字典中,所以可使頻繁地使用為音訊聊天期間之標題的字元接受語言評分計算。
當完成聲頻評分及語言評分的計算時,該匹配單元305合計步驟S105中所計算的聲頻評分及步驟S109中所計算的語言評分,且分類該等字元順序,藉以決定具有最大合計評分之字元順序來做為辨識結果(步驟S111)。 特定地,該匹配單元305決定的是,使獲取自聲頻模型之聲頻評分及獲取自語言模型之語言評分的乘積或對數和為最大的字元順序來做為辨識結果。當添加諸如字元之辨識權重的資訊至語言模型中所使用之字典時,則可使用具有辨識權重資訊被結合於其中的語言評分。
藉由此,可從聲頻及語文之觀點來決定最為可行的字元順序,以做為辨識結果。一旦決定最為可行的字元順序來做為辨識結果時,匹配單元305傳輸所決定的辨識結果至關鍵字偵測單元255(步驟S113)。順便一提地,該匹配單元305可將所決定之辨識結果的字元順序儲存於記憶體單元267之中。
以此方式,在依據本實施例之語音辨識方法中,當計算語言評分時,藉由參照描述與使用者可能在音訊聊天期間交談之最新標題(特定標題)相關連的字彙之可變字元 字典,可以以優先之基礎來辨識與最新標題相關連之字彙;因此,可改善難以在一般的語音辨識方法中予以辨識之最新關鍵字,或與該等關鍵字相關連之字彙,的辨識率。 顯示為辨識結果之資訊可高度地成為最新標題上的資訊,亦即,使用者所感興趣之資訊。因此,即使所顯示之資訊係不知何故地與音訊聊天中之使用者交談有所差異時(亦即,即使當存在有誤差於語音辨識結果之中時),音訊聊天的使用者亦能使交談變寬。藉由此,在語音辨識方法中的誤差可在各方面由執行音訊聊天的使用者所准許。
<語言評分的計算方法>
接著,將參照第15圖來敘述依據本實施例之語言評分的計算方法。第15圖係說明圖式,顯示依據第一實施例之用於語言評分的計算公式之實例。第15圖顯示第14圖之步驟中,當匹配單元305選擇〝<開始> (發聲為ichiro)(發聲為wa)何時(發聲為nanji)(發聲為ni)起 (發聲為okita)(發聲為no)<結束>〞之字元順序時之語言評分的計算公式。
〝評分(<開始> (發聲為ichiro)(發聲為wa)何時(發聲為nanji)(發聲為ni)起 (發聲為okita)(發聲為no)<結束>)〞之語言評分係〝<開始> (發聲為ichiro)(發聲為wa)何時(發聲為nanji)(發聲為ni)起 (發聲為okita)(發聲為no)<結束>)〞之字元順序的產生 機率,如公式(1)中所示。
〝評分(<開始>ichiro wa nanji ni okita no<結束>)〞之語言評分的恰當值係由〝P(<開始>)P(ichiro∣<開始>)P(wa∣<開始>ichiro)P(nanji∣<開始>ichiro)P(ni∣<開始>ichiro wa nanji)P(okita∣<開始>ichiro wa nanji ni)P(no∣<開始>ichiro wa nanji ni okita)P(<結束>ichiro wa nanji ni okita no)〞所計算,如公式(2)中所示。如第16圖中所示地,因為語言模型112使用三元語法,所以〝<開始>ichiro wa〞,〝<開始>ichiro wa nanji〞,〝<開始>ichiro wa nanji ni〞,〝<開始>ichiro wa nanji ni okita〞,及〝<開始>ichiro wa nanji ni okita no〞之條件項係由其中字元順序分別受限於直接在前的兩個字元,亦即,"ichiro wa","wa nanji","nanji ni","ni okita",及"okita no"的條件機率所概算(公式(3))。
該等條件機率係由參照如第11圖中所示之語言模型所獲得。然而,因為語言模型並未含有符號"ichiro",所以匹配單元305由參照儲存於辨識資料庫309中之辨識字元字典記憶體單元401中的類目表來辨識的是,由符號"ichiro"所表示之字元屬於〝_人名_〞之類目,因而將"ichiro"轉換成為〝_人名_〞。
特定地,如公式(4)中所示地,〝P(ichiro∣<開始>)〞係轉換成為〝P(_人名_∣<開始>)P(ichiro∣_人名_)〞,且然後,概算成為〝P(_人名_∣<開始>)/N 〞。此處,N係屬於類目表中的〝_人名_〞之類目的字元數目。
特定地,當機率係以P (X∣Y)的形式而描述時,若字元X屬於類目C時,則首先自語言模型來獲得P (C∣Y)的值,且然後將所獲得的值乘以P (X∣C)的值,該P (X∣C)係字元X自類目C之產生機率。假設屬於類目C之該等字元的產生機率係相同時,則若屬於類目C之字元的數目為N時,可將P (X∣C)之值概算成為1/N。
例如,僅存在一字元係由〝_人名_〞之類目中的符號"ichiro"所表示時,則N之值為"1"。因此,如公式(5)中所示地,〝P(wa∣<開始>ichiro)〞相等於〝P(wa∣<開始>_人名_)〞。此外,"P (nanji∣ichiro wa)"相等於〝P(nanji∣_人名_wa)〞,如公式(6)中所示。
藉由使用語言評分的計算方法,可計算含有可變字元之字元順序的語言評分。因而,可將可變字元輸出以做為辨識結果。
在上述實例中,在系統之作業開始時,共用字典記憶體單元307之共用字典並未包含任何資訊或資料於該處之中。然而,可事先將若干字元儲存於該共用字典之中。
第16圖顯示共用字典的實例,其中關鍵字"ichiro"係在系統之作業開始時被登錄於〝_人名_〞的類目中。在第16圖之實例中,因為片假名的發音〝 〞係在系統之作業開始時被登錄於〝_人名_〞的類目中,所以可 無需暫存該關鍵字地偵測該關鍵字。
在上述實例中,儲存於固定字元字典中之字元係描述於語言模型中,以及儲存於可變字元字典中之字元屬於至少一類目。屬於該類目之某些字元可儲存於固定字元字典之中。
第17圖顯示固定字元字典的實例,以及第18圖顯示作業開始時之類目表的實例。特定地,在第16圖之類目表中,係事先地暫存類目〝_人名_〞以及屬於類目〝_人名_〞之字元的符號〝 〞。在第17圖之固定字元字典131中,係事先地暫存符號〝 〞,由符號〝 〞所表示之字元的轉錄〝 〞,以及音素順序"i/ch/i/r/o:"。
在上述情況中,語音辨識方法係執行使得字元"ichiro"屬於〝_人名_〞之類目。也就是說,從開始時即將該字元"ichiro"處理成為人名。然而,因為字元"ichiro"係儲存於固定字元字典中,所以難以刪除或修正。
在此方式中,藉由事先儲存可行的字元於固定字元字典中,可辨識關鍵字而無需將關鍵字暫存於字典之中。
(辨識字元字典產生單元269)
接著,將參照第19圖來詳細說明依據本實施例之辨識字元字典產生單元269。第19圖係方塊圖,用以解說依據第一實施例之辨識字元字典產生單元。
如第19圖中所示地,依據本實施例之辨識字元字典產生單元269包含搜尋關鍵字列表獲取單元501,關鍵字選擇單元503,子關鍵字獲取單元505,及關鍵字資訊添加單元507。
搜尋關鍵字列表獲取單元501自經由通訊網路12而連接至該處的搜尋伺服器14來獲取含有由該搜尋伺服器所搜尋之更高分級搜尋關鍵字的更高分級搜尋關鍵字列表。所獲取之更高分級搜尋關鍵字可為搜尋伺服器14之更高分級搜尋關鍵字,或可為特定領域中之更高分級搜尋關鍵字。所獲取之更高分級搜尋關鍵字的數目係任意的。
當更高分級搜尋關鍵字列表係自特定的領域所獲取時,該搜尋關鍵字列表獲取單元501可由參照記憶體單元267中所儲存之音訊聊天的歷史資訊,或所辨識之關鍵字的歷史資訊,而決定第一資訊處理裝置20A之使用者的偏好,藉以僅獲取符合於使用者之偏好的更高分級搜尋關鍵字。例如,該搜尋關鍵字列表獲取單元501可使用機率潛性語意分析(PLSA)或其類似分析來變換音訊聊天的歷史資訊,及所辨識之關鍵字的歷史資訊成為具有預定尺寸之標題向量的形式。相似地,可使用PLSA及其類似者來將搜尋伺服器之更高分級搜尋關鍵字變換成為標題向量的形式。根據歷史資訊之標題向量可與根據更高分級搜尋關鍵字之標題向量相比較,藉以獲取具有與根據歷史資訊所產生的標題向量相似之向量的更高分級搜尋關鍵字。
搜尋關鍵字列表獲取單元501傳輸自搜尋伺服器14 所獲取之搜尋關鍵字列表至關鍵字選擇單元503。該搜尋關鍵字列表獲取單元501可儲存所獲取的搜尋關鍵字列表於記憶體單元267之中。
關鍵字選擇單元503自搜尋關鍵字列表獲取單元501已根據第一資訊處理裝置20A之使用者偏好而自搜尋伺服器14所獲取的搜尋關鍵字列表來選擇關鍵字。該等關鍵字之選擇可執行如下。由關鍵字偵測單元255所偵測之關鍵字的歷史資訊係使用PLSA或其類似者來變換成為具有預定尺寸之標題向量的形式。相似地,所獲取之關鍵字列表可使用PLSA或其類似者來變換成為標題向量的形式。根據歷史資訊之標題向量可與根據所獲取之關鍵字列表的標題向量相比較,藉以選擇具有與根據歷史資訊所產生之標題向量相似的向量之搜尋關鍵字。
當可自音訊聊天的配對物,亦即,第二資訊處理裝置20B來獲取該音訊聊天的歷史資訊或所辨識之關鍵字的歷史資訊時,則可執行關鍵字之選擇於當執行匹配過程於自第二資訊處理裝置20B所獲取的歷史資訊及儲存於第一資訊處理裝置20A中的歷史資訊之上時。在此情況中,該兩歷史資訊之間的匹配可採取聯合,整合,或該兩歷史資訊之XOR(斥或)。選擇性地,該匹配可針對第一或第二資訊處理裝置20A或20B之使用者偏好而使一致化。 當添加稍後所述的辨識權重資訊至所獲取之該等關鍵字時,則可使用辨識權重的最大值,最小值,或平均值以做為新的辨識權重資訊。
該關鍵字選擇單元503可自搜尋關鍵字列表獲取單元501已從搜尋伺服器14獲取之搜尋關鍵字列表來刪除並不適合於可變字元字典中之登錄的字元。此處,並不適合於可變字元字典中之登錄的字元可包含:(i)一般字元;(ii)從常識之觀點並非適當的字元;以及(iii)難以針對語音辨識而辨識之字元,例如僅具有一或二音素之字元。
當從獲取自搜尋伺服器14之搜尋關鍵字列表選擇關鍵字時,該關鍵字選擇單元503傳輸所選擇的關鍵字至子關鍵字獲取單元505及關鍵字資訊添加單元507,且儲存所選擇之關鍵字於辨識字元字典記憶體單元401中所儲存的可變字元字典之中。該關鍵字選擇單元503可儲存所選擇的關鍵字於記憶體單元267之中。
該子關鍵字獲取單元505使用搜尋伺服器14來搜尋由關鍵字選擇單元503所選擇之關鍵字,以獲取與由關鍵字選擇單元所選擇之該等關鍵字相關連的子關鍵字。當關鍵字係由搜尋伺服器14所搜尋時,將獲得複數個文件以做為搜尋結果。該子關鍵字獲取單元503使用諸如詞頻逆向文件頻率(TFIDF)的加權方法自所獲得的複數個文件來獲取子關鍵字。由搜尋伺服器14自搜尋結果來獲取子字元的方法並未受限於上述方法,而是可使用所有已知的方法。例如,若〝 日本代表(日本足球代表隊球員)〞之字元係傳輸自關鍵字選擇單元503以做為關鍵字時,則子關鍵字獲取單元505使用搜尋伺服器14以關鍵 字〝日本足球代表隊球員〞來執行搜尋,而自該搜尋所獲得的文件獲取諸如〝 (Osim)〞或〝中田(Nakata)〞之關鍵字。
一旦自搜尋伺服器14來完成子關鍵字的獲取時,該子關鍵字獲取單元505以與使用於搜尋中之關鍵字相互關連的方式來儲存所獲取之子關鍵字於辨識字元字典記憶體單元401中所儲存的可變字元字典之中。該關鍵字獲取單元505傳輸所獲取之子關鍵字至稍後所述之關鍵字資訊添加單元507。順便一提地,該子關鍵字獲取單元505可將所獲取之子關鍵字儲存於記憶體單元267之中。
關鍵字資訊添加單元507添加包含使用於語言評分之計算及語音的部分中的辨識權重資訊或關鍵字的種類之關鍵字資訊至該關鍵字選擇單元503所選擇之關鍵字,且以相互關連的方式來儲存所選擇的關鍵字及關鍵字資訊於可變字元字典之中。
該關鍵字資訊可以以與關鍵字相互關連的方式來添加至子關鍵字。
辨識權重資訊係描述辨識權重的資訊,該辨識權重係使用於語言評分之計算中的校正因子(權重因子);當該辨識權重具有更大的值時,語言評分的校正值會增加,且因此,具有更大的辨識權重之關鍵字會高度可能地被採用以成為辨識結果。例如,具有10之辨識權重的關鍵字將以比具有1之辨識權重的關鍵字(亦即,未加權之關鍵字)更高十倍的機率而被語音辨識。
關於該辨識權重的決定,可使用自搜尋伺服器14所獲取之搜尋關鍵字列表中之分級資訊,或語音辨識結果的輸出中的關鍵字的發生頻率。因為搜尋關鍵字列表係安置於搜尋伺服器14中之更高分級上的搜尋關鍵字之列表,所以可以以在搜尋中之關鍵字的發生頻率之下降順序來將該分級指明至該等關鍵字;預定的辨識權重係按分級之順序而決定。特定地,預定的係數係以在搜尋中之關鍵字的發生頻率之下降順序而指明至該等關鍵字,以及使常態化的關鍵字頻率與所指明之係數相乘,藉以獲得辨識權重。
關於該辨識權重的決定,可使用第一資訊處理裝置20A之使用者是否已使用搜尋伺服器14來執行所獲得以成為辨識結果之關鍵字的搜尋,或該第一資訊處理裝置20A之使用者的偏好上之資訊。
其係語音之部分或關鍵字之種類上的資訊之屬性資訊可由使用設置在網際網路上之公佈欄或網站中的說明內容,或使用語形分析工具來予以添加。選擇性地,可適當地使用網際網路之上可用的百科全書,維基百科,或日文字典。
關於搜尋關鍵字列表及子關鍵字的獲取,以及關鍵字資訊的添加,可使用經由通訊網路12而連接至該處之伺服器中所儲存的辭典,本體資料庫,百科全書,日文字典,或語形分析工具,以取代搜尋伺服器14。除了該辭典,本體資料庫,百科全書,日文字典,及語形分析工具之外,可使用該搜尋伺服器14。
<辨識字元字典產生/更新方法>
接著,將參照第20圖來詳細說明依據本實施例之辨識字元字典產生單元的操作。第20圖係說明圖式,顯示依據第一實施例之辨識字元字典產生/更新方法。
首先,辨識字元字典產生單元269之搜尋關鍵字列表獲取單元501自搜尋伺服器14來獲取搜尋關鍵字列表,該搜尋關鍵字列表描繪根據使用者之偏好的更高分級搜尋關鍵字。如第20圖中所示地,在搜尋關鍵字列表之中,係敘述〝 日本代表(日本足球代表隊球員)〞,〝 (世界棒球經典賽)〞,〝王監督(王貞治教練)〞,〝 (Zico)〞,〝歌詞(歌詞)〞,"27",〝 (提拉米蘇)〞〝万座 (萬座海濱)〞,〝飲会(下班後聚會)〞,〝 (射擊)〞,及〝卑猥(猥褻)〞。搜尋關鍵字列表獲取單元501儲存所獲取的關鍵字於記憶體單元267之中,且將所獲取的關鍵字傳輸至辨識字元字典產生單元269之關鍵字選擇單元503。
該關鍵字選擇單元503由參照所傳輸之搜尋關鍵字列表來刪除並非適用於登錄之字元。在上述實例中,可將諸如〝飲会(下班後聚會)〞,〝 (射擊)〞,〝歌詞(歌詞)〞,及"27"之一般字元,以及諸如〝卑猥(猥褻)〞之從常識來看並非適當的字元自搜尋關鍵字列表刪除。該關鍵字選擇單元503額外地敘述刪除該等字 元之搜尋關鍵字列表於可變字元字典中。關於該可變字元字典中之額外的敘述,關鍵字選擇單元503亦可添加敘述於諸如音素順序或轉錄之項目以及第20圖中所示的項目之上。
隨後,子關鍵字獲取單元505獲取額外地敘述於該可變字元字典中之該等關鍵字,且由使用搜尋伺服器14或其類似物來獲取與該等所獲取之關鍵字相關連的子關鍵字。例如,如第20圖中所示,做為根據〝 日本代表(日本足球代表隊球員)〞之關鍵字來搜尋該搜尋伺服器14的結果,可獲取〝 (Osim)〞,〝中田(Nakata)〞,〝卷(Maki)〞,及〝 (Zico)〞之子關鍵字;該等子關鍵字係以與〝 日本代表(日本足球代表隊球員)〞相互關連的方式而額外地描述於可變字元字典中。相似地,可獲取用於其他關鍵字之子關鍵字,且可以以與該等關鍵字相互關連的方式來額外地描述該等子關鍵字於該可變字元字典之中。
接著,關鍵字資訊添加單元507以在搜尋伺服器14之關鍵字搜尋分級的下降順序來指明預定之係數至已刪除不必要字元的該等搜尋關鍵字。例如,該關鍵字資訊添加單元507以搜尋關鍵字列表中之關鍵字分級的下降順序來指明係數10,9,8等至該等關鍵字,且將所指明之係數與藉由常態期望值來除各個關鍵字之頻率所獲得的值相乘,藉以計算辨識權重。例如,因而所獲得的辨識權重可乘以S型函數。該關鍵字資訊添加單元507可添加以上述方 式所計算之辨識權重資訊至個別的關鍵字,且將該等關鍵字額外地描述於可變字元字典之中。
該辨識權重資訊的計算方法係僅用於描繪之目的。依據本實施例之辨識權重資訊的計算方法並未受限於上述方法,而是可使用除了上述方法之外的其他方法於該辨識權重資訊的計算之中。
如第20圖中所示,在固定字元字典中,諸如〝食 (吃)〞,〝飲(喝)〞,〝 (打擊)〞,〝 (射擊)〞,〝選手(比賽者)〞,及〝飲会(下班後之聚會)〞之一般使用於日常交談的字元係事先地暫存。事先所暫存於固定字元字典中之字元係如上述之一般字元,且在優先的基礎上,極不可能被語音辨識;因此,做為辨識權重資訊,係暫存"1"以供該等字元用。
該關鍵字資訊添加單元507自使用語形分析工具所獲得的資訊,或來自搜尋伺服器14上之公佈欄的可用資訊,以獲取諸如語音之部分或個別字元之種類的屬性資訊,藉以將該等屬性資訊額外地描述於可變字元字典之中。例如,〝名詞:運動〞被添加至第20圖中所示之〝 日本代表(日本足球代表隊球員)〞的關鍵字,以做為屬性資訊。
藉由執行上述方法,該辨識字元字典產生單元269可視需要地執行該可變字元字典的產生及更新方法。當本實施例之第一資訊處理裝置20A係起始於第一時間時,會存在有其中並無資訊或資料被描述於可變字元字典之中的 情況。針對此理由,辨識字元字典產生單元269可依據上述方法來執行可變字元字典的產生。該可變字元字典的更新可以以任意方式來執行。例如,可變字元字典的更新可以以週期性之基礎而每預定週期地執行,或可依據來自第一資訊處理裝置20A之使用者的更新命令而執行。
關於可變字元字典的更新,當記錄成為子關鍵字之某些字元被高頻率地語音辨識時,可將高頻率地所辨識之該等子關鍵字嶄新地儲存於該可變字元字典中,以做為關鍵字。
當執行語音辨識方法時,匹配單元305根據儲存於辨識資料庫309之語言模型記憶體單元405中之統計語言模型或文法模型,而使用描述於各式各樣之字元字典中的內容以執行語言模型之計算。當計算可變字元字典中所儲存之字元的語言評分時,匹配單元305根據語言模型而使用普通方法來計算該語言評分,且將所計算之語言評分乘以添加至關鍵字之辨識權重,藉以獲得語言評分以供語音辨識中之實際使用。因為添加1或更大的辨識權重至可變字元字典之中所儲存的字元,如第20圖中所示,所以針對該等字元所計算的語言評分會相對地比儲存於共用字典或固定字元字典中之該等字元的語言評分更大。針對此理由,在該可變字元字典中所儲存的字元中,常出現於最新標題中之特定字元係以高的機率來辨識。
在上述方法中,使用普通方法所計算之語言評分係以辨識權重來相乘;因此,在某些情況中,所獲得以做為計 算結果的語言評分可為1或更大。然而,在語音辨識方法中,依照語言評分之個別關鍵字的相關分級係比語言評分的絕對值更為重要;因此,語言評分可具有1或更大的值。
如第21A圖中所示,辨識字元字典產生單元269可設置於執行音訊聊天之第一及第二資訊處理裝置20A及20B二者。如第21B圖中所示,該辨識字元字典產生單元269可不設置於執行音訊聊天之第一及第二資訊處理裝置20A及20B,而是設置於中繼該第一及第二資訊處理裝置20A及20B之間的通訊之伺服器18中。如第21B圖中所示之伺服器,當設置該辨識字元字典產生單元269於伺服器18之中時,第21B圖中所示之伺服器18作用成為辨識字元字典產生裝置,其自搜尋伺服器14來獲取搜尋關鍵字列表,使用上述方法而自所獲取之搜尋關鍵字列表來選擇關鍵字,以及添加上述之權重資訊至所選擇之關鍵字。
在伺服器18中之辨識字元字典產生單元183根據獲取自音訊交談控制單元181之音訊交談的內容,而自搜尋伺服器14來獲取搜尋關鍵字列表,且根據上述處理方法,使用所獲取之搜尋關鍵字列表以執字元的選擇及辨識權重資訊的添加,藉以產生可變字元字典。然後,在伺服器18中之辨識字元字典產生單元183傳輸所產生之可變字元字典至第一及第二資訊處理裝置20A及20B。該等資訊處理裝置可將所傳輸到之可變字元字典儲存於個別的辨識資料庫309之中;因此,可在語音辨識方法中使用該可變 字元字典。順便一提地,該第一及第二資訊處理裝置20A及20B可自伺服器18來獲取權重資訊已被添加至該處之字元的列表,且可根據所獲取之字元列表來產生可變字元字典。
在第21A及21B圖中所示的第一及第二資訊處理裝置20A及20B之中,僅描繪個別之資訊處理裝置的一些處理單元。無庸置疑地,除了所描繪的處理單元之外,在第3至5圖中所描繪之處理單元亦將包含於該等資訊處理裝置之中。
依據上述本實施例之音訊聊天系統,搜尋伺服器14之資料庫係使用於語音辨識中所使用之字典的產生中。因此,可使用常出現在最新標題中之關鍵字以做為該語音辨識的語文知識。此外,可使用庫藏或其類似物來將與標題之關鍵字相關連的字元設定為具有高的發生機率;因此,可使用相關連的關鍵字來執行語音辨識。藉由此,在依據本實施例之音訊聊天系統中,可以以優先之基礎來辨識與使用者可能交談之最新標題相關連的字彙,因此,可以改善辨識率。做為辨識結果所顯示之資訊可高度地變成最新標題之資訊,亦即,使用者所感興趣之資訊。因此,即使當所顯示之資訊係不知原因地與使用者之交談相異時,亦可提供使該音訊聊天之使用者可拓寬交談的優點。
(第二實施例)
在下文中,將詳細地敘述依據本發明之第二實施例的 關鍵字偵測系統。
第22圖係說明圖式,顯示依據本發明之第二實施例的關鍵字偵測系統之組態。如第22圖中所示,依據本實施例之關鍵字偵測系統11包含通訊網路12,搜尋伺服器14,及資訊處理裝置20A及20B(在下文中,有時候統稱為資訊處理裝置或裝置20)。該資訊處理裝置20A係在家庭網路19之內連接至外部顯示裝置70。資訊處理裝置20A及20B以及外部顯示裝置70可接收來自廣播站80所傳輸之廣播資訊。
通訊網路12及搜尋伺服器14具有相同的組態,且提供與依據第一實施例之通訊網路12及搜尋伺服器14實質相同的功效;因此,將省略其詳細說明。
資訊處理裝置20A與經由通訊網路12而連接至該處的另一資訊處理裝置20B藉由音訊來執行聊天(音訊聊天)。該等資訊處理裝置20A及20B可請求經由通訊網路12而連接至該處的搜尋伺服器14來執行經由通訊網路12之資料庫的參照或資料之搜尋。執行音訊聊天之另一資訊處理裝置20B可不經由通訊網路12地連接至資訊處理裝置20A,如圖式中所示。選擇性地,該另一資訊處理裝置20B可直接連接至資訊處理裝置20A,而非經由通訊網路12來連接至USB埠,諸如i.Link之IEEE 1394埠,SCSI埠,RS-232C埠,及其類似埠。
資訊處理裝置20係在家庭網路19內連接至稍後描述之外部顯示裝置70;因此,各式各樣的資料可在資訊處 理裝置20A與外部顯示裝置70之間通訊,該資訊處理裝置20A與外部顯示裝置70之間的連接可經由諸如HDMI-CEC(高清晰度多媒體介面-消費者電子裝置控制)之連接埠而執行。該資訊處理裝置20A可使用設置於該處之中的接收功能而接收來自稍後描述之廣播站80所傳輸之含有廣播資訊的廣播電波。
在圖式中所顯示的該實例中,資訊處理裝置20係桌上型PC;然而,在本實施例中,該資訊處理裝置20可為筆記型PC。在本實施例中,資訊處理裝置20並未受限於上述之實例,而是可由例如電視之機上盒,諸如家用遊戲機之資訊器具,行動電話,PDA,及其類似物所建構,只要其係具有能經由網路而通訊之功能的裝置即可。額外地,或選擇性地,該資訊處理裝置20可為由租得的使用者所攜帶之諸如可攜式遊戲機,PHS,或可攜式視頻/聲頻播放器的可攜式裝置。
外部顯示裝置70係顯示單元,例如CRT顯示單元,液晶顯示單元,電漿顯示面板單元,或電致發光(EL)顯示單元。該外部顯示裝置70接收來自稍後描述之廣播站80所傳輸之含有廣播資訊的廣播電波,且顯示該廣播資訊的內容於顯示單元的顯示區域之上。此處,自廣播站所傳輸之廣播資訊意指諸如廣播本文資訊,廣播聲頻資訊,或視頻資訊的資料,其係透過諸如一段式數位廣播或12分段式數位廣播(下文中稱為全分段式數位廣播)之地面數位廣播,有線廣播,或經由網路之網際網路廣播而 提供。含有廣播資訊之廣播電波意指諸如一段式數位廣播或全分段式數位廣播之地面數位廣播。該外部顯示裝置70可經由諸如HDMI-CEC之連接埠來傳輸所接收的廣播資訊至資訊處理裝置20。該外部顯示裝置70可接收來自資訊處理裝置20所傳輸之各式各樣的資料,及顯示對應於該資料之資訊。
在下文中,將藉由地面數位廣播之實例來敘述第二實施例。
廣播站80傳輸含有廣播資訊之廣播電波,該廣播資訊係由包含廣播本文資訊,廣播聲頻資訊,及視頻資訊的資料所構成。外部顯示裝置70接收來自廣播站80所傳輸之廣播電波,且根據該廣播電波之中所包含的廣播本文資訊來顯示主題資訊或輸出聲音。資訊處理裝置20可接收來自廣播站80所傳輸之廣播電波,以使用該廣播電波之內容於各式各樣的處理之中。
(資訊處理裝置20之組態)
接著,將詳細地敘述依據本實施例之資訊處理裝置20的組態。依據本實施例之資訊處理裝置20的硬體組態係與依據第一實施例之硬體組態實質地相同,且其詳細說明將予以省略。
第23圖係方塊圖,用以解說依據第二實施例之資訊處理裝置20的組態。如第23圖中所示,依據本實施例之資訊處理裝置20包含關鍵字管理單元257,顯示單元261 ,通訊單元265,記憶體單元267,辨識字元字典產生單 元269,廣播本文資訊接收單元271,關鍵字偵測單元273,及外部顯示裝置連接控制單元275。
該關鍵字管理單元257管理將從字元順序所提取之關鍵字,該字元順序係對應於由稍後描述之廣播本文資訊接收單元271所接收的廣播本文資訊。該關鍵字管理單元257儲存其係資訊處理裝置20之使用者利用搜尋伺服器14來執行搜尋歷史之搜尋歷史資訊於儲存單元267中,且根據包含於歷史資訊中之搜尋關鍵字或所偵測之關鍵字來選擇所管理的關鍵字。由關鍵字管理單元257所管理的關鍵字可由稍後描述之關鍵字偵測單元273所隨意地參照。該關鍵字管理單元257可提供所管理之關鍵字至稍後描述的辨識字元字典產生單元269,且該辨識字元字典產生單元269可使用由關鍵字管理單元257所提供之關鍵字,及自搜尋伺服器14所獲取之搜尋關鍵字列表,以執行辨識字元字典的產生或更新。
顯示單元261經由諸如資訊處理裝置20之顯示器的顯示裝置來顯示自關鍵字偵測單元273所傳輸之關鍵字至資訊處理裝置20的使用者。該顯示單元261可組構以顯示對應於由廣播本文資訊接收單元271所接收之廣播本文資訊的字元順序本身。
通訊單元265係安裝於資訊處理裝置20之中的通訊裝置。該通訊單元265經由通訊網路12而中繼資訊之通訊於資訊處理裝置20(特定地,關鍵字管理單元257及 辨識字元字典產生單元269)與資訊處理裝置20的外部裝置(特定地,搜尋伺服器14或另一資訊處理裝置20)之間。此外,該通訊單元265可不經由該通訊網路12地與直接連接至資訊處理裝置20的其他資訊處理裝置通訊資訊。
記憶體單元267係安裝於例如資訊處理裝置20之中的儲存裝置,且儲存諸如由關鍵字偵測單元273所偵測之關鍵字或由關鍵字管理單元257所管理之關鍵字資訊的資料於該處之中。除了該等資料之外,該記憶體單元267可儲存由廣播本文資訊接收單元271所接收之廣播本文資訊或各式各樣的資料庫於該處之中。該記憶體單元267可儲存當資訊處理裝置20執行方法時需予以儲存之種種參數及該方法之進展資訊於該處之中。當關鍵字管理單元257,顯示單元261,通訊單元265,辨識字元字典產生單元269,廣播本文資訊接收單元271,關鍵字偵測單元273,外部顯示裝置連接控制單元275,或其類似物執行對該記憶體單元267之讀取或寫入時,可隨意地存取該記憶體單元267。
辨識字元字典產生單元269自搜尋伺服器14來獲取搜尋關鍵字列表,且僅自所獲取之搜尋關鍵字列表來選擇合適的關鍵字,藉以產生辨識字元字典以供語音辨識中使用。該辨識字元字典產生單元269自所獲取之搜尋關鍵字列表來選擇關鍵字,且可添加關鍵字或與所選擇之關鍵字相關連之子關鍵字的屬性資訊或辨識權重,以供語音辨識 中使用。此外,該辨識字元字典產生單元269可使用關鍵字來執行辨識字元字典的產生或更新,該等關鍵字係來自關鍵字管理單元257所傳輸之關鍵字,或關鍵字偵測單元273已自稍後描述的廣播本文資訊接收單元271所接收之廣播本文資訊所偵測的關鍵字。依據本實施例之辨識字元字典產生單元269的詳細組態,或辨識字元字典的產生方法係與依據第一實施例之辨識字元字典產生單元269的組態,或產生方法實質地相同,且其詳細說明將予以省略。
廣播本文資訊接收單元271自外部顯示裝置70來獲取接收頻道資訊,該接收頻道資訊係關於該外部顯示裝置70目前正透過其而接收的廣播頻道。此處,接收頻道資訊意指表示廣播頻道的資訊,而該廣播頻道係外部顯示裝置70目前正透過其而接收的廣播頻道。該廣播本文資訊接收單元271可藉由從外部顯示裝置70來獲取接收頻道資訊,而使廣播本文資訊接收單元271的接收廣播頻道與外部顯示裝置70的接收廣播頻道同步。
該廣播本文資訊接收單元271根據所獲取之接收頻道資訊,而自廣播站80直接地接收對應於外部顯示裝置70之接收廣播頻道的廣播電波。此時,該廣播本文資訊接收單元271可組構以直接接收從廣播站80所傳輸的廣播電波之中的一段式廣播電波,且自所接收的電波來獲取本文資訊。該廣播本文資訊接收單元271可組構以直接接收從廣播站80所傳輸的全分段式廣播電波。
該廣播本文資訊接收單元271可組構以根據所獲取的 接收頻道資訊,而接收由外部顯示裝置70所接收且自外部顯示裝置70所傳輸至資訊處理裝置20的廣播本文資訊。
該廣播本文資訊接收單元271將所接收的廣播本文資訊輸出至稍後描述之關鍵字偵測單元273。該廣播本文資訊接收單元271可將所接收的廣播本文資訊記錄於記憶體單元267之中。
關鍵字偵測單元273決定的是,由該關鍵字管理單元257所管理的關鍵字是否存在於對應於自廣播本文資訊接收單元271所傳輸之廣播本文資訊的字元順序中,且若該關鍵字存在時,則將對應於該關鍵字的字元輸出以做為關鍵字。若複數個關鍵字存在於一字元順序之中時,則該關鍵字偵測單元273可組構以偵測所有對應的關鍵字。該關鍵字偵測單元273可組構以傳輸從字元順序所偵測的關鍵字至顯示單元261。
例如,當〝刪除目前之結構性重訂〞之辨識結果係自廣播本文資訊接收單元271所傳輸,且〝結構性重訂〞之關鍵字存在於由關鍵字管理單元257所管理的關鍵字之中時,則該關鍵字偵測單元273輸出〝結構性重訂〞以做為關鍵字。
外部顯示裝置連接控制單元275執行資訊處理裝置20與連接至該資訊處理裝置20的外部顯示裝置70之間的連接控制。該外部顯示裝置連接控制單元275傳輸由關鍵字偵測單元273所偵測之關鍵字或其類似物至外部顯示 裝置70。一旦由外部顯示裝置70所通知的是,該外部顯示裝置70的使用者已參照或選擇特定的關鍵字或與該關鍵字相關連的物件時,該外部顯示裝置連接控制單元275可記錄參照歷史或選擇歷史於記憶體單元267之中,且經由通訊單元265來通知搜尋伺服器14。該搜尋伺服器14可使用該參照歷史或選擇歷史於該搜尋伺服器14內所執行之許許多多的處理中。順便一提地,當傳輸對應於各式各樣之資訊的資料至外部顯示裝置70時,該外部顯示裝置連接控制單元275可變換即將被傳輸之資料的格式成為可由該外部顯示裝置70所顯示的格式。
在上文中,已說明依據本實施例之資訊處理裝置20的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
依據本實施例之資訊處理裝置20可進一步地包含依據第一實施例之資訊處理裝置20的語音辨識單元或音訊交談控制單元。該資訊處理裝置20可進一步包含儲存搜尋伺服器14中所記錄之搜尋關鍵字列表的內容之資料庫記憶體單元。藉由此,可將搜尋關鍵字列表的內容儲存於資訊處理裝置20中所設置之資料庫記憶體單元中。因此,可縮短資訊處理裝置20存取搜尋伺服器14之所需的時間。此外,藉由以週期性為基礎而更新資料庫記憶體單元 之內容,則資訊處理裝置20可獲取搜尋伺服器14中所記錄之最新的搜尋關鍵字列表之內容。
(外部顯示裝置70之組態)
接著,將參照第24及25圖來詳細說明依據本實施例之外部顯示裝置70的組態。第24圖係方塊圖,用以解說依據第二實施例之外部顯示裝置的組態。第25圖係說明圖式,用以顯示依據第二實施例之外部顯示裝置的資訊顯示螢幕。
依據本實施例之外部顯示裝置70的硬體包含諸如CRT,液晶顯示面板,電漿顯示面板,或EL面板之顯示元件,以及由CPU,ROM,及RAM所建構且使用以控制顯示元件的驅動之驅動控制電路。
如第24圖中所示,本實施例之外部顯示裝置70包含廣播接收單元701,連接埠控制單元703,廣播資訊顯示控制單元705,關鍵字資訊顯示控制單元707,及顯示單元709。
廣播接收單元701接收從廣播站80所傳輸之廣播電波,且輸出包含於該廣播電波中之諸如廣播本文資訊,廣播聲頻資訊,或視頻資訊的資料至稍後將予以描述的連接埠控制單元703及廣播資訊顯示控制單元705。該廣播接收單元701可組構以記錄所接收之資訊於外部顯示裝置70中所設置的記憶體單元(未顯示),或連接至外部顯示裝置70之外部附加的記憶體單元(未顯示)之中。
連接埠控制單元703控制能與資訊處理裝置20數位通訊之諸如HDMI-CEC的連接埠。該連接埠控制單元703經由如HDMI-CEC之連接埠以傳輸關於廣播接收單元701正透過其而接收之廣播頻道的接收頻道資訊至資訊處理裝置20。諸如廣播本文資訊,廣播聲頻資訊,及視頻資訊之由廣播接收單元701所接收之資料可經由連接埠控制單元703而輸出至資訊處理裝置20;自資訊處理裝置20所傳輸之各式各樣的資料係經由連接埠控制單元703而輸入至外部顯示裝置70;以及自資訊處理裝置20所傳輸之各式各樣的資料係傳輸至稍後描述之關鍵字資訊顯示控制單元707。
當顯示來自廣播接收單元701所傳輸之廣播本文資訊,廣播聲頻資訊,及視頻資訊於稍後描述的顯示單元709之上時,廣播資訊顯示控制單元705執行顯示控制。
當顯示來自資訊處理裝置20所傳輸之關鍵字資訊於稍後描述的顯示單元709之上時,關鍵字資訊顯示控制單元707執行顯示控制。此處,自資訊處理裝置20所傳輸之關鍵字資訊表示包含由該資訊處理裝置20所提取的關鍵字,針對所提取之關鍵字的搜尋結果,及與該等關鍵字相關連的物件之資訊。一旦自顯示單元709接收到用於詳細資訊之獲取的請求於外部顯示裝置70之使用者所選擇的資訊之上時,該關鍵字資訊顯示控制單元707經由連接埠控制單元703來傳輸該詳細資訊之獲取的請求至資訊處理裝置20,該資訊係由外部顯示裝置70之使用者藉由諸 如滑鼠,鍵盤,或遙控器的輸入裝置來選擇顯示單元709上所顯示之資訊而選擇的資訊。
顯示單元709顯示由廣播資訊顯示控制單元705所顯示控制的廣播本文資訊,廣播聲頻資訊,及視頻資訊,以及由關鍵字資訊顯示控制單元707所顯示控制的關鍵字資訊於外部顯示裝置70的資訊顯示螢幕之上。
該外部顯示裝置70之資訊顯示螢幕751通常包含顯示廣播本文資訊,廣播聲頻資訊,及視頻資訊於上的影像顯示區753。此處,當關鍵字資訊係傳輸自資訊處理裝置20時,該資訊顯示螢幕751的顯示區可分割,以產生可顯示關鍵字資訊於上的關鍵字資訊顯示區755。例如,該影像顯示區753係由廣播資訊顯示控制單元705所控制,以及例如,該關鍵字資訊顯示區755係由關鍵字資訊顯示控制單元707所控制。
該關鍵字資訊顯示區755的細節係與依據本發明第一實施例之資訊處理裝置的搜尋結果顯示螢幕50實質地相同;且因此,將省略其詳細說明。
在上文中,已說明依據本實施例之外部顯示裝置70的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
(關鍵字偵測方法)
接著,將參照第26圖來詳細說明由依據本實施例之資訊處理裝置20所執行的關鍵字偵測方法。第26圖係流程圖,用以解說依據第二實施例之關鍵字偵測方法。
首先,資訊處理裝置20之廣播本文資訊接收單元271根據獲取自外部顯示裝置70之接收頻道資訊,而接收來自外部顯示裝置70或廣播站80的廣播本文資訊,藉以獲取廣播主題的字串來做為本文資訊資料(步驟S201)。該廣播本文資訊接收單元271輸出所獲取之本文資訊資料至關鍵字偵測單元273。
接著,該關鍵字偵測單元273應用語形分析至所傳輸之本文資訊資料,以自該字串來提取字元,且將所提取之字元記錄於資訊處理裝置20的記憶體之上(步驟S203)。
其次,該關鍵字偵測單元273使用關鍵字管理單元257之內容來搜尋所提取的字元(步驟S205)。
隨後,該關鍵字偵測單元273決定所提取的字元是否存在於關鍵字管理單元257之中(步驟S207)。當所提取的字元存在於關鍵字管理單元257之中時,關鍵字偵測單元273記錄該存在之所提取的字元於記憶體之上,以做為廣播關鍵字資料(步驟S209)。當所提取的字元並不存在於關鍵字管理單元257之中時,該關鍵字偵測單元273執行稍後所述之步驟S211的過程。
接著,該關鍵字偵測單元273決定所提取但未發現於 關鍵字管理單元257中之該等字元是否存在於記憶體之上(步驟S211)。當並未發現之該等字元存在於記憶體之上時,則執行步驟S205之過程。當並未發現之該等字元亦不存在於該記憶體之中時,則該關鍵字偵測單元273將存在於該記憶體上之廣播關鍵字資料輸出以做為所提取的關鍵字(步驟S213)。
藉由使用上述之方法,則依據本實施例之資訊處理裝置20可自所接收之廣播本文資訊來提取關鍵字。
在依據本實施例的資訊處理裝置20之中,存在於關鍵字管理單元257中之該等字元(關鍵字)係從傳輸自廣播站80之廣播本文資訊來自動地提取。因此,可將所提取之關鍵字顯示至外部顯示裝置70。藉由使用此一功能,利用資訊處理裝置20或外部顯示裝置70來執行諸如聊天之雙向通訊的使用者可利用所提取之該等關鍵字,而做為該聊天或類似者之標題。
(依據第二實施例之資訊處理裝置的第一修正實例)
接著,將參照第27及28圖來詳細說明依據本實施例之資訊處理裝置20的第一修正實例。第27圖係方塊圖,用以解說該資訊處理裝置20之第一修正實例的組態。第28圖係流程圖,用以解說依據本修正實例之關鍵字偵測方法。依據本修正實例之資訊處理裝置20的硬體組態係與本發明之第二實施例的硬體組態實質地相同,且其詳細說明將予以省略。
如第27圖中所示地,依據本修正實例之資訊處理裝置20包含語音辨識單元253,關鍵字偵測單元255,關鍵字管理單元257,顯示單元261,通訊單元265,記憶體單元267,辨識字元字典產生單元269,廣播聲頻資訊接收單元277,及外部顯示裝置連接控制單元275。
依據本修正實例之關鍵字管理單元257,顯示單元261,通訊單元265,記憶體單元267,及外部顯示裝置連接控制單元275與該關鍵字管理單元257,顯示單元261,通訊單元265,記憶體單元267,及外部顯示裝置連接控制單元275具有實質相同的組態,且提供實質相同的功效;因此,將省略其詳細說明。
語音辨識單元253依據由稍後描述之廣播聲頻資訊接收單元277所接收之廣播聲頻資訊來執行語音辨識。該語音辨識單元253產生對應於廣播聲頻資訊之字元順序以做為語音辨識結果,且傳輸所產生之字元順序至稍後描述的關鍵字偵測單元。該語音辨識單元253可組構以傳輸所產生之字元順序至顯示單元261。該語音辨識單元253之詳細組態及語音辨識方法係與依據本發明第一實施例之語音辨識單元253的組態及語音辨識方法實質地相同,且其詳細說明將予以省略。
關鍵字偵測單元255決定的是,由關鍵字管理單元257所管理之關鍵字是否存在於對應於自語音辨識單元253所傳輸之廣播聲頻資訊的字元順序中,且若該關鍵字存在時,則輸出對應於該關鍵字的字元以做為關鍵字。若 複數個關鍵字存在於一字元順序之中時,則關鍵字偵測單元255可組構以偵測所有對應的關鍵字。該關鍵字偵測單元255可組構以傳輸從該字元順序所偵測的關鍵字至稍後描述之顯示單元261。
例如,當〝刪除目前之結構性重訂〞之辨識結果係自語音辨識單元253所傳輸時,且當〝結構性重訂〞之關鍵字存在於由關鍵字管理單元257所管理的關鍵字之中時,則該關鍵字偵測單元255輸出〝結構性重訂〞以做為關鍵字。
辨識字元字典產生單元269自搜尋伺服器14來獲取搜尋關鍵字列表,且僅自所獲取之搜尋關鍵字列表來選擇合適的關鍵字,藉以產生辨識字元字典以供語音辨識中使用。該辨識字元字典產生單元269自所獲取之搜尋關鍵字列表來選擇關鍵字,且可添加關鍵字或與所選擇之關鍵字相關連之子關鍵字的屬性資訊或辨識權重,以供語音辨識中使用。此外,該辨識字元字典產生單元269可使用關鍵字來執行辨識字元字典的產生或更新,該等關鍵字係來自關鍵字管理單元257所傳輸之關鍵字,或關鍵字偵測單元255已自稍後描述的廣播聲頻資訊接收單元277所接收之廣播聲頻資訊所偵測的關鍵字。依據本實施例之辨識字元字典產生單元269的詳細組態,或辨識字元字典的產生方法係與依據第一實施例之辨識字元字典產生單元269的組態,或產生方法實質地相同,且其詳細說明將予以省略。
廣播聲頻資訊接收單元277自外部顯示裝置70來獲 取接收頻道資訊,該接收頻道資訊係關於該外部顯示裝置目前正透過其而接收的廣播頻道。該廣播聲頻資訊接收單元277可藉由自外部顯示裝置70來獲取接收頻道資訊,而使廣播聲頻資訊接收單元277的接收廣播頻道與該外部顯示裝置70的接收廣播頻道同步。
該廣播聲頻資訊接收單元277根據所獲取之接收頻道資訊,而自廣播站80直接地接收對應於外部顯示裝置70之接收廣播頻道的廣播電波。此時,該廣播聲頻資訊接收單元277可組構以直接接收從廣播站80所傳輸的廣播電波之中的一段式廣播電波,且自所接收的電波來獲取聲頻資訊。該廣播聲頻資訊接收單元277可組構以直接接收從廣播站80所傳輸的全分段式廣播電波。
該廣播聲頻資訊接收單元277可組構以根據所獲取的接收頻道資訊,而接收由外部顯示裝置70所接收且自外部顯示裝置70所傳輸至資訊處理裝置20的廣播聲頻資訊。
該廣播聲頻資訊接收單元277將所接收的廣播聲頻資訊輸出至語音辨識單元253。該廣播聲頻資訊接收單元277可將所接收之廣播聲頻資訊記錄於記憶體單元267之中。
在上文中,已說明依據本修正實例之資訊處理裝置20的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物 所執行。因此,硬體組態可依據本實施修正實例時之技術水準來加以適當地修正。
依據本修正實例之資訊處理裝置20可進一步地包含依據第一實施例之資訊處理裝置20的語音辨識單元或音訊交談控制單元。該資訊處理裝置20可進一步包含儲存搜尋伺服器14中所記錄之搜尋關鍵字列表的內容之資料庫記憶體單元。藉由此,可將搜尋關鍵字列表的內容儲存於資訊處理裝置20中所設置之資料庫記憶體單元中。因此,可縮短資訊處理裝置20存取搜尋伺服器14之所需的時間。此外,藉由以週期性為基礎而更新資料庫記憶體單元之內容,則資訊處理裝置20可獲取搜尋伺服器14中所記錄之最新的搜尋關鍵字列表之內容。
(關鍵字偵測方法)
接著,將參照第28圖來詳細說明由依據本修正實例之資訊處理裝置20所執行的關鍵字偵測方法。
首先,資訊處理裝置20之廣播聲頻資訊接收單元277根據獲取自外部顯示裝置70之接收頻道資訊,而接收來自外部顯示裝置70或廣播站80的廣播聲頻資訊,且語音辨識單元253執行語音辨識於該廣播聲頻資訊之上,以決定語音辨識結果(步驟S301)。該語音辨識單元253輸出所決定的語音辨識結果至關鍵字偵測單元255。
接著,該關鍵字偵測單元255應用語形分析至該語音辨識結果,以自該語音辨識結果來提取字元,且將所提取 之字元記錄於資訊處理裝置20的記憶體之上(步驟S303)。
其次,該關鍵字偵測單元255使用關鍵字管理單元257之內容來搜尋所提取的字元(步驟S305)。
隨後,該關鍵字偵測單元255決定所提取的字元是否存在於關鍵字管理單元257之中(步驟S307)。當所提取的字元存在於關鍵字管理單元257之中時,關鍵字偵測單元255記錄該存在之所提取的字元於記憶體之上,以做為廣播關鍵字資料(步驟S309)。當所提取的字元並不存在於關鍵字管理單元257之中時,該關鍵字偵測單元255執行稍後所述之步驟S311的過程。
接著,該關鍵字偵測單元255決定所提取但未發現於關鍵字管理單元257中之該等字元是否存在於記憶體之上(步驟S311)。當並未發現之該等字元存在於該記憶體之上時,則執行步驟S305之過程。當並未發現之該等字元亦不存在於該記憶體之中時,則該關鍵字偵測單元255將存在於該記憶體上之廣播關鍵字資料輸出以做為所提取之關鍵字(步驟S313)。
藉由使用上述之方法,則依據本修正實例之資訊處理裝置20可自所接收之廣播聲頻資訊來提取關鍵字。
在依據本修正實例的資訊處理裝置20之中,存在於關鍵字管理單元257中之該等字元(關鍵字)係從傳輸自廣播站80之廣播聲頻資訊來自動地提取。因此,可將所提取之關鍵字顯示至外部顯示裝置70。藉由使用此一功 能,則使用資訊處理裝置20或外部顯示裝置70來執行諸如聊天之雙向通訊的使用者可使用所提取之該等關鍵字以做為該聊天或類似者之標題。
應由熟習於本項技藝之人士所理解的是,各式各樣的修正,結合,子結合,及改變可依據設計要求及其他之因 素而發生,只要它們係在附錄。請專利範圍或其等效範圍 的範疇之內即可。
例如,在上述該等實施例之中,該廣播站80傳輸地面數位廣播。然而,該廣播站80可提供電纜廣播或網際網路廣播。
在上述該等實施例之中,第27圖顯示其中廣播站80透過地面數位廣播來提取電視節目的情況。然而,使用者可私人地以提供AV內容之攝錄像機來捕獲及再生影像。
在上述該等實施例之中,用於語音辨識中之各式各樣的字元字典係儲存於共用字典記憶體單元307及辨識資料庫309中的辨識字元字典記憶體單元401之中。然而,用於語音辨識中之各式各樣的字元字典可儲存於該等記憶體單元之任一記憶體單元之中。
在上述該等實施例之中,係僅儲存一固定字元字典,一可變字元字典,及一類目表於該辨識字元字典記憶體單元401之中。然而,亦可將複數個固定字元字典,複數個可變字元字典,及/或複數個類目表儲存於辨識字元字典記憶體單元401之中。藉由儲存複數個字元字典,複數個可變字元字典,及/或複數個類目表於辨識字元字典記憶 體單元401之中,可產生被特殊化於特定領域中之複數個辨識字典。關於與特定之關鍵字高度關連的字元,可將發生之頻率或N元語法或N類別語法之機率設定為高,以便增加該特定之關鍵字的辨識率。
順便一提地,在此說明書中的該等步驟無需以文中所述之順序的時間序列而處理,且可並聯地或個別地來加以處理。
同時,隨著網際網路相關連之技術的發展,已變成可藉由個人電腦(PC)之間的音訊而執行聊天(該聊天之後稱為音訊聊天)。
若可使用PC中所安裝之音訊聊天應用以顯示與PC之顯示裝置上的內容相關連之資訊,則可改善聊天中之該等使用者的便利性。在此方面,做為相關技藝之實例的JP-B-3526101揭示一種系統,該系統執行語音辨識於音訊聊天的交談內容上,自交談內容提取關鍵字,自資料庫搜尋相關連的資訊,以及顯示搜尋結果於螢幕之上。
做為相同技藝之另一實例,一種同步系統係揭示用以使兩個PC同步,以致使同一螢幕顯示可由該兩PC之瀏覽器所顯示。然而,該同步系統與音訊聊天技術並無關連。
而且,在JP-B-3526101中所揭示的系統之中,使用者必須手動地傳輸螢幕上所顯示之資訊至音訊聊天之配對者,以便分享螢幕上所顯示之資訊;因此,並不適用於通訊。
在允許使用者觀看到該等PC瀏覽器之相同顯示的同步系統中,因為該系統並非組構與交談相關連,所以每次當交談之標題改變時,使用者必須手動地輸入資訊以搜尋與交談相關連的網站。因此,在實用上可能難以使交談的內容與所有揚聲器之終端機自動地及有效率地同步。
本發明係鑑於上述情勢而想出。存在有必要於新的且改良的音訊聊天系統,資訊處理裝置,及程式之提供,而可使得與音訊聊天期間之交談內容相關連的關鍵字自動地且有效率地同步。
而且,存在有必要於新的且改良的資訊處理裝置及程式,而可使包含於自廣播站所傳輸之廣播資訊中的關鍵字自動地且有效率地同步。
依據本發明之一觀點,提供有一種音訊聊天系統,包含:複數個資訊處理裝置,用以執行音訊聊天;關鍵字提取資料庫,用於當在該音訊聊天期間自交談的對話來提取關鍵字時,由該等資訊處理裝置所參照;以及搜尋引擎,用於當使用所提取之該等關鍵字來搜尋該等關鍵字及與該等關鍵字相關連的物件時,由該等資訊處理裝置所使用,其中至少一資訊處理裝置包含:參數提取單元,用以自音訊資料來提取參數,該音訊資料係產生自該對話,該參數表示該音訊資料的特徵;關鍵字提取單元,用以根據該參數及該關鍵字提取資料庫來辨識所產生的音訊資料,且自該音訊資料來提取該等關鍵字;資訊搜尋單元,用以使用該搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之 搜尋結果及與該等關鍵字相關連的物件;顯示單元,用以顯示與該等關鍵字之搜尋結果的位址資訊相互關連之關鍵字,及與該等關鍵字相關連的物件之位址資訊相互關連的物件;以及關鍵字同步化單元,用以傳輸所提取之關鍵字至其係該聊天之配對物的資訊處理裝置,且執行與該配對的資訊處理裝置之關鍵字同步化。
依據上述之實施例,在執行音訊聊天之資訊處理裝置中,參數提取單元自音訊資料來提取參數,該音訊資料係產生自該音訊聊天期間之交談的對話,及該參數表示該音訊資料的特徵;關鍵字提取單元根據該參數及關鍵字提取資料庫來辨識所產生的音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋單元使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;顯示單元以與該等關鍵字之搜尋結果的位址資訊及該等物件的位址資訊之相互關連的方式來顯示該等關鍵字及與該等關鍵字相關連的物件;以及關鍵字同步化單元傳輸所提取之關鍵字至其係該聊天之配對物的資訊處理裝置,且執行與該配對的資訊處理裝置之關鍵字同步化。在本發明之該等實施例的音訊聊天系統中,語音辨識係在音訊聊天之期間自動地執行於交談的內容上,以提取關鍵字;且該等關鍵字係自動地傳輸至該音訊聊天的配對物。因而,可改善音訊聊天中之使用者的便利性。
依據本發明之另一觀點,提供有一種資訊處理裝置,用於與其他資訊處理裝置來執行音訊聊天,該裝置包含: 參數提取單元,用以自音訊資料來提取參數,該音訊資料係產生自音訊聊天期間之交談的對話,且該參數表示該音訊資料的特徵;關鍵字提取單元,用以根據該參數及關鍵字提取資料庫來辨識所產生的音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋單元,用以使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及搜尋資訊累積單元,用於以與該等關鍵字之搜尋結果的位址資訊及該等物件的位址資訊之相互關連的方式,而分別累積該等關鍵字及該等物件。
依據上述之實施例,參數提取單元自音訊資料來提取參數,該音訊資料係產生自音訊聊天期間之交談的對話,及該參數表示該音訊資料的特徵;關鍵字提取單元根據關鍵字提取資料庫來辨識所產生的音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋單元使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及搜尋資訊累積單元以與該等關鍵字之搜尋結果的位址資訊及該等物件的位址資訊之相互關連的方式,而分別累積該等關鍵字及該等物件。該音訊資料之產生及搜尋資訊之獲取的該等過程係自動地執行;因此,資訊處理裝置的使用者無需執行任何額外的操作,且可自動地獲取能使用以做為該音訊聊天之標題的資訊。
該資訊處理裝置可進一步包含關鍵字同步化單元,用以傳輸所提取之關鍵字至其係該聊天之配對物的資訊處理裝置,且執行與該配對的資訊處理裝置之關鍵字同步化。 依據上述之實施例,關鍵字同步化單元傳輸所提取之關鍵字至其係聊天之配對物的資訊處理裝置,且執行關鍵字同步化。所提取之關鍵字係自動傳輸至聊天之配對的資訊處理裝置;因此,該音訊聊天的配對者可分享所提取的關鍵字而無需執行任何額外的操作。
該資訊處理裝置可進一步包含資料庫記憶體單元,用以儲存該關鍵字提取資料庫。依據上述之實施例,關鍵字提取資料庫係儲存於資訊處理裝置的資料庫記憶體單元之中,且因此,可縮短資訊處理裝置存取該關鍵字提取資料庫之所需的時間。結果,可縮短資訊處理裝置執行關鍵字偵測之所需的時間。
搜尋引擎可設置於資訊處理裝置之內。依據上述之實施例,搜尋引擎係設置於資訊處理裝置之中;因而,可縮短資訊處理裝置存取該搜尋引擎之所需的時間。結果,可縮短與該等關鍵字相關連之資訊搜尋的所需時間。
該資訊處理裝置可進一步包含顯示單元,用以顯示與該等關鍵字之搜尋結果的位址資訊相互關連的關鍵字,及與該等關鍵字相關連的物件之位址資訊相互關連的物件。 依據上述之實施例,關鍵字及與該關鍵字相關連之物件係以與該關鍵字之搜尋結果的位址資訊及該物件的位址資訊之相互關連的方式,而分別顯示於顯示單元之上。因為顯示該關鍵字及與該關鍵字相關連之物件二者,所以當所顯示的物件包含使用者所感興趣之資訊時,使用者可易於存取該資訊。
該資訊處理裝置可包含參照歷史記憶體單元,用以儲存該等關鍵字之參照歷史。依據上述之實施例,關鍵字之參照歷史係儲存於資訊處理裝置的參照歷史記憶體單元之中。當自音訊資料來提取關鍵字時,該資訊處理裝置可參照該參照歷史記憶體單元,藉以致能高效率之關鍵字偵測。
該參照歷史記憶體單元可以以與指定於個別之聊天及該聊天之配對物的識別號相互關連之方式來儲存所參照的關鍵字。依據上述之實施例,與所參照之關鍵字相關連的資訊係以與指定於個別之聊天及該聊天之配對物的識別號相互關連之方式,而儲存於參照歷史記憶體單元之中。因此,藉由使用該參照歷史記憶體單元的內容,可致能更高效率之關鍵字偵測。
關鍵字提取單元可以以優先之基礎來提取安置於更高分級的參照歷史處之關鍵字。選擇性地,該關鍵字提取單元可在優先的基礎上,來提取該搜尋引擎之更高分級的搜尋關鍵字。依據上述之實施例,安置於參照歷史之更高分級處的關鍵字或搜尋引擎之更高分級的搜尋關鍵字係由關鍵字提取單元以優先之基礎所提取。因為此一關鍵字可高度地使用以成為音訊聊天的標題,所以可改善語音辨識中之準確性。
依據本發明之進一步的實施例,提供有一種資訊處理裝置,用以執行與其他資訊處理裝置之音訊聊天,至少一資訊處理裝置包含:參數提取單元,用以自音訊資料來提 取參數,該音訊資料係產生自該音訊聊天期間之交談的對話,且該參數表示該音訊資料的特徵;關鍵字提取單元,用以根據該參數及關鍵字提取資料庫來辨識所產生的音訊,且自該音訊資料來提取關鍵字;資訊搜尋單元,用以使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及搜尋資訊累積單元,用於以與該等關鍵字之搜尋結果的位址資訊及該等物件的位址資訊相互關連之方式,而分別累積該等關鍵字及該等物件,其中該資訊處理裝置包含關鍵字同步化單元,用以接收來自該至少一資訊處理裝置所傳輸的該等關鍵字,且執行與對應之資訊處理裝置的關鍵字同步化。
依據上述之實施例,關鍵字同步化單元接收來自其係音訊聊天之配對物的至少一資訊處理裝置之關鍵字,該至少一資訊處理裝置具有參數提取單元,關鍵字提取單元,資訊搜尋單元,及搜尋資訊累積單元,且執行與資訊處理裝置之關鍵字同步化。因為給予大量處理負荷之語音辨識或關鍵字偵測係由其係音訊聊天之配對物的至少一資訊處理裝置所執行,所以可執行音訊聊天而不會給予使用者自己的資訊處理裝置額外的負荷。
依據本發明之又一觀點,提供有一種程式,用以使電腦實行:參數提取功能,用以自音訊資料來提取參數,該音訊資料係產生自音訊聊天期間之交談的對話,該參數表示該音訊資料的特徵;關鍵字提取功能,用以根據該參數及關鍵字提取資料庫來辨識所產生的音訊資料,且自該音 訊資料來提取關鍵字;資訊搜尋功能,用以使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及搜尋資訊儲存功能,用於以與該等關鍵字之搜尋結果的位址資訊及該等物件的位址資訊相互關連之方式,而分別儲存該等關鍵字及該等物件。
依據上述之實施例,該電腦程式係儲存於電腦的記憶體單元之中,且執行於當電腦的CPU讀取該程式時,藉以使電腦作用成為資訊處理裝置。可電腦讀取之記錄媒體可設置為已記錄該電腦程式於該處之中,該記錄媒體可為例如磁碟,光碟,磁光碟,及快閃記憶體。該電腦程式例如可經由網路來予以分配,而無需使用記錄媒體。
依據本發明之再一觀點,提供有一種程式,用以使電腦實行:關鍵字同步化功能,用以接收來自至少一資訊處理裝置所傳輸的關鍵字,且執行與對應之資訊處理裝置的關鍵字同步化。
依據上述之實施例,該電腦程式係儲存於電腦的記憶體單元之中,且執行於當電腦的CPU讀取該程式時,藉以使電腦作用成為資訊處理裝置。可電腦讀取之記錄媒體可設置為已記錄該電腦程式於該處之中,該記錄媒體可為例如磁碟,光碟,磁光碟,及快閃記憶體。該電腦程式例如可經由網路來予以分配,而無需使用記錄媒體。
依據本發明之再一觀點,提供有一種資訊處理裝置,包含:廣播本文資訊接收單元,用以接收來自廣播站所傳 輸之廣播本文資訊;關鍵字提取單元,用以根據關鍵字提取資料庫而自該廣播本文資訊來提取關鍵字;資訊搜尋單元,用以使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及外部顯示裝置連接控制單元,用以執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物體至該外部顯示裝置。
依據上述之實施例,廣播本文資訊接收單元接收來自廣播站所傳輸之廣播本文資訊;關鍵字提取單元根據關鍵字提取資料庫而自該廣播本文資訊來提取關鍵字;資訊搜尋單元使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及外部顯示裝置連接控制單元執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置。廣播本文資訊之接收及搜尋資訊之獲取的該等過程係自動地執行;因此,資訊處理裝置的使用者無需執行任何額外的操作,且所獲取的搜尋資訊可自動地顯示至外部顯示裝置。
廣播本文資訊接收單元自連接至資訊處理裝置之外部顯示裝置來獲取接數頻道資訊及廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之廣播頻道,以及該廣播本文資訊對應於該廣播頻道。選擇性地,該廣播本文資訊接收單元自連接至該資訊處理裝置之外部顯示裝置來獲取接收頻道資訊,且自廣播站來獲取該廣播本文資 訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之廣播頻道,以及該廣播本文資訊對應於該廣播頻道。
該資訊處理裝置可進一步包含參照歷史記憶體單元,該參照歷史記憶體單元儲存關鍵字之參照歷史於外部顯示裝置之中,以及外部顯示裝置連接控制單元將外部顯示裝置所選擇之關鍵字通知搜尋引擎。
該資訊處理裝置可進一步包含關鍵字同步化單元,該關鍵字同步化單元傳輸所提取之關鍵字到至少一資訊處理裝置,且執行與該至少一資訊處理裝置之關鍵字同步化。
依據本發明之仍一觀點,提供有一種資訊處理裝置,包含:廣播聲頻資訊接收單元,用以接收來自廣播站所傳輸之廣播聲頻資訊;參數提取單元,用以自該廣播聲頻資訊中所包含的音訊資料來提取參數,該參數表示該音訊資料的特徵;關鍵字提取單元,用以根據該參數及關鍵字提取資料庫來辨識該音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋單元,用以使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及外部顯示裝置連接控制單元,用以執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置。
依據上述之實施例,廣播聲頻資訊接收單元接收來自廣播站所傳輸之廣播聲頻資訊;參數提取單元自該廣播聲頻資訊中所包含的音訊資料來提取參數,該參數表示該音 訊資料的特徵;關鍵字提取單元根據該參數及關鍵字提取資料庫來辨識該音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋單元使用搜尋引擎來搜尋所提取之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及外部顯示裝置連接控制單元執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置。廣播聲頻資訊中所包含之音訊資料的接收及搜尋資訊的獲取之該等過程係自動地執行;因此,資訊處理裝置的便用者無需執行任何額外的操作,且所獲取的搜尋資訊可自動地顯示至外部顯示裝置。
廣播聲頻資訊接收單元自連接至資訊處理裝置之外部顯示裝置來獲取接收頻道資訊及廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之廣播頻道,以及該廣播聲頻資訊對應於該廣播頻道。選擇性地,該廣播聲頻資訊接收單元自連接至資訊處理裝置之外部顯示裝置來獲取接收頻道資訊,且自廣播站來獲取廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之廣播頻道,以及該廣播聲頻資訊對應於該廣播頻道。
該資訊處理裝置可進一步包含參照歷史記憶體單元,該參照歷史記憶體單元儲存關鍵字之參照歷史於外部顯示裝置之中,以及外部顯示裝置連接控制單元將外部顯示裝置所選擇之關鍵字通知搜尋引擎。
該資訊處理裝置可進一步包含關鍵字同步化單元,該 關鍵字同步化單元傳輸所提取之關鍵字到至少一資訊處理裝置,且執行與該至少一資訊處理裝置之關鍵字同步化。
依據本發明之另又一觀點,提供有一種程式,用以使電腦實行:廣播本文資訊接收功能,用以接收來自廣播站所傳輸之廣播本文資訊;關鍵字提取功能,用以根據關鍵字提取資料庫而自廣播本文資訊來提取關鍵字;資訊搜尋功能,用以使用搜尋引擎來搜尋所提取之關鍵字,及獲取與該等關鍵字相關連的物件;以及外部顯示裝置連接控制功能,用以執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至外部顯示裝置。
依據上述之實施例,該電腦程式係儲存於電腦的記憶體單元之中,且執行於當電腦的CPU讀取該程式時,藉以使電腦作用成為資訊處理裝置。可電腦讀取之記錄媒體可設置為已記錄該電腦程式於該處之中,該記錄媒體可為例如磁碟,光碟,磁光碟,及快閃記憶體。該電腦程式例如可經由網路來予以分配,而無需使用記錄媒體。
依據本發明之仍另一觀點,提供有一種程式,用以使電腦實行:廣播聲頻資訊接收功能,用以接收來自廣播站所傳輸之廣播聲頻資訊;參數提取功用,用以自該廣播聲頻資訊中所包含的音訊資料來提取參數,該參數表示該音訊資料的特徵;關鍵字提取功能,用以根據該參數及關鍵字提取資料庫來辨識該音訊資料,且自該音訊資料來提取關鍵字;資訊搜尋功能,用以使用搜尋引擎來搜尋所提取 之關鍵字,且獲取該等關鍵字之搜尋結果及與該等關鍵字相關連的物件;以及外部顯示裝置連接控制功能,用以執行與外部顯示裝置的連接控制,且輸出該等關鍵字,該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置。
依據上述之實施例,該電腦程式係儲存於電腦的記憶體單元之中,且執行於當電腦的CPU讀取該程式時,藉以使電腦作用成為資訊處理裝置。可電腦讀取之記錄媒體可設置為已記錄該電腦程式於該處之中,該記錄媒體可為例如磁碟,光碟,磁光碟,及快閃記憶體。該電腦程式例如可經由網路來予以分配,而無需使用記錄媒體。
在下文中,將參照附圖來詳細敘述本發明之較佳實施例。注意的是,在此說明書及附圖之中,具有實質相同的功能和結構之結構性元件係以相同的參照符號來表示,且該等結構性元件的重複說明將予以省略。
(第三實施例)
在下文中,將詳細敘述依據本發明之第三實施例的音訊聊天系統。
第29圖係顯示依據第三實施例之音訊聊天系統的說明圖式。該音訊聊天系統1010包含通訊網路1012,關鍵字提取資料庫1030,搜尋引擎1040,以及資訊處理裝置1020A及1020B(在下文中,有時候統稱為資訊處理裝置或裝置1020)。
該通訊網路1020係連接資訊處理裝置20,關鍵字提取資料庫1030,及搜尋引擎1040,以致能雙向或單向通訊於該處之間的通訊網路。例如,該通訊網路1012可由諸如網際網路,電話網路,衛星通訊網路,或廣播通道頻道之公眾網路,或諸如WAN(廣域網路),LAN(區域網路),IP-VPN(網際網路協定-虛擬專用網路),乙太網路(註冊商標),或無線LAN之專用網路所建構。該通訊網路1012可為有線式或無線式。
資訊處理裝置1020與經由通訊網路1012而連接至該處的另一資訊處理裝置1020藉由音訊來執行聊天(音訊聊天)。該資訊處理裝置1020可請求經由通訊網路1012而連接至該處的關鍵字提取資料庫1030和搜尋引擎1040來執行經由通訊網路1012之資料庫的參照或資訊的搜尋。
執行音訊聊天的另一資訊處理裝置1020可經由通訊網路1012而連接至該處,如圖式中所示。選擇性地,該另一資訊處理裝置1020可直接地被連接,而非經由該通訊網路1012地連接至USB(通用串聯匯流排)埠,諸如i.Link(i.鏈接)之IEEE 1394埠,SCSI(小型電腦系統介面)埠,RS-232C埠,及其類似埠。
在圖式中所顯示的該實例中,資訊處理裝置1020係桌上型個人電腦(desktop PC);然而,在本實施例中,資訊處理裝置1020可為筆記型個人電腦(notebook PC)。在本實施例中,資訊處理裝置1020並未受限於上述的 實例,而是可由例如電視之機上盒,諸如家庭用遊戲機之資訊器具,行動電話,PDA(個人數位助理),及其類似物所建構,只要其係具有能經由網路而通訊之功能的裝置即可。額外地,或選擇性地,該資訊處理裝置1020可為由租得的使用所攜帶之諸如可攜式遊戲機,PHS,或可攜式視頻/聲頻播放器的可攜式裝置。
在第29圖之中,僅連接兩個資訊處理裝置1020至通訊網路1012。然而,本實施例並未受限於該實例,而是可將複數個資訊處理裝置1020連接至通訊網路1012。
關鍵字提取資料庫1030係資訊處理裝置1020在音訊聊天期間自交談內容所獲得的音訊資料來提取關鍵字時,該資訊處理裝置1020所參照的資料庫。在該關鍵字提取資料庫1030中,描述各式各樣的資訊,例如用作關鍵字之字元的發音,音素,及音節之序連關係及關鍵字之類目。例如,在關鍵字提取資料庫1030中,係將搜尋引擎之更高分級的搜尋關鍵字或常使用以作為部落格中之標題的名詞描述成為關鍵字。該關鍵字提取資料庫1030可為動態資料庫,該動態資料庫係依據搜尋引擎(搜尋伺服器)之更高分級的搜尋關鍵字或常使用以作為部落格中之標題的名詞之改變而視需要地予以更新;選擇性地,該關鍵字提取資料庫1030可為靜態資料庫。在該關鍵字提取資料庫1030中所描述之關鍵字可以以機率潛性語意分析(PLSA)模型或其類似物來處理,且變換成為適用的標題向量之形式。此處,該標題向量屬於標題之向量空間表示 ,且係用以決定該標題之尋常性。此外,可將稍後描述之辨識權重資訊添加至該關鍵字提取資料庫1030中所描述之關鍵字。
用作關鍵字之字元的發音,音素,及字元的序連關係屬於表示所描述成為關鍵字提取資料庫1030中之關鍵字的字元如何依照其發音,音素,及音節而相互序連(連接)之關係。做為描述該序連關係之方法,可使用統計之字元序連機率(n元言法或n類別語法),生成文法,有限狀態自動機(FSA)或其類似物。
搜尋引擎1040係使用者可使用關鍵字或類似物而透過網際網路來搜尋可用的資訊之網站的資料庫。此處,該資訊可開放至公眾或關閉。在本實施例之中,該搜尋引擎1040可提供全文搜尋服務,而允許使用關鍵字來搜尋貯存中之資訊的全文;或可為目錄服務,而允許搜尋由類目所分類之資訊。
(資訊處理裝置20之組態)
接著,將參照第30圖來簡明地敘述依據本實施例之資訊處理裝置1020的組態。
在下文說明中,〝字元〞之術語表示可在語音辨識過程中被便利地處理成為單一之字的單元。此字元無需相同於語文之字。例如,〝 君(發聲為taroukun)〞可被視為一字元,或可以以"tarou"及"kun"之形式而被視為二字元。進一步地,〝 君(發聲為 konnichiwa taroukun)〞之更大的單元可被視為一字元。
此外,〝音素〞之術語表示在聲頻的觀點中可便利地視為單一之單位的單元。無需與發音上之音節或音素相同。例如,在〝東京(發聲為tou kyou)〞的字元中,"tou"之部分可由三個音素符號"t/o/u",或"o"之拉長音的"to:"所表示;進一步地,"tou"之部分可由"t/o/o"所表示。此外,可採用代表無聲之符號。再者,可採用將無聲分類成為〝發聲前之無聲〞,〝插入於發聲之間之短的無聲〞,及〝對應於「(發聲為tsu)」之無聲〞的符號。
第30圖係說明圖式,顯示依據本實施例之資訊處理裝置1020的硬體組態。該資訊處理裝置1020包含中央處理單元(CPU)1201,唯讀記憶體(ROM)1203,隨機存取記憶體(RAM)1205,主匯流排1207,橋接器1209,外部匯流排1211,介面1213,輸入裝置1215,輸出裝置1217,儲存裝置1219,驅動器1221,及通訊裝置1223。
CPU 1201作用為算術處理單元及控制單元。該CPU 1201依據ROM 1203,RAM 1205,儲存裝置1219,或可卸取式記錄媒體1014中所記錄之各式各樣的程式來控制資訊處理裝置1020之全部的或部分的內部操作。該ROM1203儲存由CPU1201所使用之程式,算術參數,及其類似物。該RAM 1205暫時地儲存CPU 1201之執行中所使用的程式及CPU 1201之執行中所適當變化的參數。 CPU 1201,ROM 1203,及RAM 1205係經由諸如CPU匯 流排之主匯流排1207而相互地連接。
主匯流排1207係經由橋接器1209而連接至諸如週邊組件互連(PCI)匯流排之外部匯流排1211。
輸入裝置1215包含諸如滑鼠,鍵盤,觸控面板,按鈕,開關,及搖桿之由使用者所操作的操作單元,以及諸如麥克風及頭戴式話機之音訊輸入單元。該輸入裝置1215可為使用紅外線或其他的電子波之遙控單元(所謂遙控器),或可為諸如行動電話或PDA之對應於資訊處理裝置1020之操作的外部連接之裝置。該輸入裝置1215可為根據由使用者利用操作單元或音訊輸入單元所輸入之資訊而產生輸入信號,以及將所產生之輸入信號輸出至CPU 1201。該資訊處理裝置1020的使用者操作該輸入裝置1215以輸入各式各樣的資料至資訊處理裝置1020,或指示該資訊處理裝置1020來執行處理操作。
輸出裝置1217可由例如可以以可見或可聽之方式來將所獲取的資訊通知使用者之諸如陰極射線管(CRT)顯示單元,液晶顯示(LCD)單元,電漿顯示面板(PDP)單元,電致發光(EL)顯示單元,或燈之顯示單元;包含揚聲器及頭戴式耳機之聲頻輸出單元;以及諸如印表機,行動電話,或傳真機之裝置所建構。例如,該輸出裝置1217輸出由搜尋伺服器所搜尋之各式各樣的資訊。特定地,顯示單元顯示由搜尋伺服器所搜尋之各式各樣資訊的搜尋結果以成為本文或影像。同時,聲頻輸出單元轉換重放的音訊資料以成為音訊,而輸出該音訊。
儲存裝置1219係資料儲存裝置,其係依據本發明之資訊處理裝置1020的儲存單元之實施。例如,該儲存裝置1219係由諸如硬碟驅動器(HDD)之磁性儲存單元,半導體儲存裝置,光學儲存裝置,磁光學儲存裝置,及其類似物所建構。該儲存裝置1219可儲存由CPU 1201所執行之程式或許許多多的資料,以及自外面所獲取之種種資料。
驅動器1221係用於儲存媒體之讀取器-寫入器。該驅動器1221係結合於資訊處理裝置1020之中,或外部地附著至該資訊處理裝置1020。該驅動器1221讀出諸如磁碟,光碟,磁光碟,或半導體記憶體之可卸取式儲存媒體1014中所記錄之資訊,而載入於驅動器1221之中,且將所讀出之資訊輸出至RAM 1205。該驅動器1221可將載入於驅動器1221中之資訊記錄於諸如磁碟,光碟,磁光碟,或半導體記憶體的可卸取式儲存媒體1014之中。例如,該可卸取式記錄媒體1014可為DVD媒體,HD-DVD媒體,藍光媒體,小型快閃記憶體(CF),記憶棒,或安全數位(SD)記憶卡。例如,該可卸取式記錄媒體1014可為具有無接點型IC晶片被安裝於該處之上的電子裝置或積體電路(IC)卡。
通訊裝置1223係由使用於連接至通訊網路1012之通訊裝置所建構的通訊介面。例如,該通訊裝置1223可為用於有線或無線區域網路(LAN)之通訊卡,藍芽或無線式USB (WUSB),用於光學通訊之路由器,用於非同步 之數位用戶線(ADSL)的路由器,或用於各式各樣之通訊協定的調變解調變器。該通訊裝置1223傳輸及接收種種資訊至/自網際網路或其他的通訊裝置,但伴隨著另一資訊處理裝置1020而一起傳輸及接收與音訊聊天相關連的資訊。連接至通訊裝置1223之通訊網路1012可由諸如網際網路,家用LAN,紅外線通訊,或衛星通訊之以有線或無線之方式所連接的網路所建構。
具有上述之組態,資訊處理裝置1020可與直接連接至該資訊處理裝置1020之另一資訊處理裝置,或與經由通訊網路1012而連接至該處之另一資訊處理裝置來執行音訊聊天,但經由通訊網路1012而自連接至該處之關鍵字提取資料庫1030,搜尋引擎1040,或其類似物來獲取種種資訊。此外,該資訊處理裝置1020可使用可卸取式記錄媒體1014來取出儲存於該資訊處理裝置1020之中的資訊。
在上文之中,已敘述可實行依據本實施例之資訊處理裝置1020的功能之硬體組態。上述之該等組件可使用通用型元件而建構,或可由專用於個別組件之功能的特殊化硬體所建構。因此,該硬體組態可依據實行本實施例時之技術水準來加以適當地修正。上述之硬體組態僅係用於描繪性之目的,且本發明絕不受限於此;諸如主匯流排1207,外部匯流排1211,或介面1213之一些組件可根據使用的形式而省略。
接著,將詳細敘述依據本實施例之資訊處理裝置 1020的組態。在下文說明中,執行音訊聊天之兩個資訊處理裝置1020將稱為第一資訊處理裝置1020A及第二資訊處理裝置1020B。該第一及第二資訊處理裝置1020A及1020B自該等資訊處理裝置之個別使用者的聲音來產生音訊資料,且傳輸該音訊資料至該音訊聊天之配對物的另一資訊處理裝置。第31圖係方塊圖,用以解說依據第三實施例之第一資訊處理裝置1020A的組態。
依據本實施例之第一資訊處理裝置1020A包含音訊輸入單元1231,語音辨識單元1233,音訊交談控制單元1239,音訊輸出單元1241,資訊搜尋單元1243,關鍵字同步化單元1245,顯示單元1247,通訊單元1249,及記憶體單元1251。
音訊輸入單元1231係介面,其係將音訊聊天之期間由第一資訊處理裝置20A的使用者所發聲之語音的交談對話輸入至第一資訊處理裝置1020A。例如,該音訊輸入單元1231係由連接至第一資訊處理裝置1020A之諸如麥克風或頭戴式話機的輸入裝置所建構。發聲至麥克風或頭戴式話機之使用者的語音係即時自動地輸入至第一資訊處理裝置1020A。輸入之類比信號係透過AD轉換而取樣及量化,且經由音訊輸入單元1231而傳輸至語音辨識單元1233,以成為數位信號之音訊資料。
語音辨識單元1233係由例如CPU,ROM,或RAM所建構。該語音辨識單元1233根據傳輸自音訊輸入單元1231之音訊資料來執行以即時為基礎的語音辨識。該語 音辨識單元1233進一步包含參數提取單元1235及關鍵字取單元1237。
參數提取單元1235自所產生之音訊資料的各個音框(在適當的時隔處)來提取諸如美爾倒頻譜係數(MFCC)及其時間差參數,音訊資料之頻譜,功率線性預測係數,倒譜係數,以及線譜對之特徵參數。
參數提取單元1235傳輸所提取之特徵參數至關鍵字提取單元1237。該參數提取單元1237可儲存所提取的特徵參數於記憶體單元1251之中。
關鍵字提取單元1237根據關鍵字提取資料庫1030以及由參數提取單元1235所產生及提取的特徵參數,自其係由第一資訊處理裝置1020A使用者所發聲的語音之數位信號的音訊資料來提取關鍵字。當關鍵字提取單元1237提取關鍵字時,該關鍵字提取單元1237可經由通訊單元1249來參照連接至通訊網路1012的關鍵字提取資料庫1030。
複數個關鍵字係包含於音訊聊天期間由使用者所發聲之語音的句子中。關鍵字提取單元1237自動地提取存在於該語音的句子中之所有關鍵字。該關鍵字提取單元1237將所提取的關鍵字傳輸至稍後描述之資訊搜尋單元1243。該關鍵字提取單元1237可將所提取之關鍵字儲存於記憶體單元1251之中。
該語音辨識單元1233辨識來自音訊輸入單元1231所傳輸之音訊,及自所辨識之音訊來提取關鍵字的方法將於 稍後加以敘述。
音訊交談控制單元1239係由例如CPU,ROM,及RAM所建構,以及控制與經由通訊網路1012所連接之第二資訊處理裝置1020B之音訊聊天。該音訊交談控制單元1239接收由音訊輸入單元1231所產生之音訊資料,且將該音訊資料經由通訊單元1249而傳輸至第二資訊處理裝置1020B。該音訊交談控制單元1239經由通訊單元1249以接收來自第二資訊處理裝置1020B所傳輸之音訊資料,且將該音訊資料傳輸至音訊輸出單元1241。音訊交談控制單元1239可組構而以相互關連的方式來儲存每次當執行音訊聊天時之執行音訊聊天的日期,用以識別音訊聊天的識別號,以及用以識別音訊聊天之配對物的識別號於記憶體單元1251之中。
該音訊交談控制單元1239可由專用於音訊交談控制之特殊化硬體所建構,且可設置以成為諸如音訊聊天程式之應用程式。
音訊輸出單元1241係介面,其接收由第二資訊處理裝置1020B之使用者所發聲之語音的音訊資料,且將所接收之音訊資料輸入至第一資訊處理裝置1020A。該音訊輸出單元1241係由例如揚聲器或耳機之連接至第一資訊處理裝置1020A的輸出裝置所建構。
經由通訊單元1240而自第二資訊處理裝置1020B所接收的音訊資料係經由音訊輸出單元1241而輸出第一資訊處理裝置1020A的使用者。
資訊搜尋單元1243以相互關連之方式來儲存來自關鍵字提取單元1237所傳輸的關鍵字,及該等關鍵字自關鍵字提取單元1237所傳輸的時間於記憶體單元1251之中。該資訊搜尋單元1243決定關鍵字同步化過程是否將執行於自關鍵字提取單元1237所傳輸的關鍵字之上。當所決定的是,應執行關鍵字同步化過程時,則該資訊搜尋單元1243傳輸該等關鍵字至關鍵字同步化單元1245,藉以請求該關鍵字同步化過程的執行。該資訊搜尋單元1243經由通訊單元1249來存取搜尋引擎1040,且執行來自關鍵字提取單元1237所傳輸之關鍵字的資訊搜尋,藉以獲取用於該等關鍵字及與該等關鍵字相關連之物件的搜尋結果。該資訊搜尋單元1243儲存所獲得的搜尋結果於記憶體單元1251的搜尋結果儲存單元1253之中,且傳輸該搜尋結果至顯示單元1247。此處,該資訊搜尋單元1243自搜尋引擎1040所獲取之搜尋結果包含關於該搜尋引擎1040中之搜尋關鍵字的資訊之題目或URL,及諸如資訊之式樣的資訊之元資料。
當由顯示單元1247所請求以便獲取關於特定之關鍵字或與該關鍵字相關連之物件的更詳細資訊時,則該資訊搜尋單元1243經由通訊單元1249來存取搜尋引擎1040以獲取更詳細的資訊,且儲存來自顯示單元1247所通知之特定的關鍵字於記憶體單元1251的參照歷史記憶體單元1255之中。
關鍵字同步化單元1245經由通訊單元1249來傳輸由 關鍵字提取單元1237自音訊資料所提取之關鍵字至第二資訊處理裝置1020B,藉以使第一及第二資訊處理裝置1020A及1020B同步。該關鍵字同步化過程不僅可以以下文方式來執行於自第一資訊處理裝置1020A至第二資訊處理裝置1020B的方向中,而且可以以下文方式來執行於第二資訊處理裝置1020B至第一資訊處理裝置1020A的方向中。也就是說,該第一資訊處理裝置1020A可回應於由第二資訊處理裝置1020B所初始之關鍵字同步化過程,使得來自第二資訊處理裝置1020B所傳輸之關鍵字被接收至第一資訊處理裝置1020A。
顯示單元1247經由例如瀏覽器應用而顯示來自資訊搜尋單元1243所傳輸之資訊搜尋結果至諸如顯示器或其類似物的輸出裝置,該輸出裝置係配置至第一資訊處理裝置1020A。該資訊搜尋單元1243自搜尋引擎1040所獲取之資訊含有搜尋引擎1040中之資訊或物件的URL或其類似物。因此,當第一資訊處理裝置1020A之使用者藉由連接至該第一資訊處理裝置1020A之諸如滑鼠或鍵盤的輸入裝置來選擇所顯示之資訊時,顯示單元1247請求該資訊搜尋單元1243,以獲取所選擇之資訊的細節。
通訊單元1249係安裝於例如第一資訊處理裝置1020A之中的通訊裝置。該通訊裝置1249經由第一資訊處理裝置1020A(特定地,關鍵字提取單元1237,音訊交談控制單元1239,資訊搜尋單元1243,及關鍵字同步化單元1245)與該第一資訊處理裝置1020A的外部裝置 (特定地,關鍵字提取資料庫1030,搜尋引擎1040,或第二資訊處理裝置1020B)之間的通訊網路1012來中繼資訊的通訊。此外,該通訊單元1249可與直接連接至第一資訊處理裝置1020A,而非經由通訊網路1012所連接之其他資訊處理裝置來通訊資訊。
記憶體單元1251係安裝於例如第一資訊處理裝置1020A之中,且儲存諸如由關鍵字提取單元1237所提取之關鍵字,或由資訊搜尋單元1243所獲取之搜尋資訊的資料於該處之中的儲存裝置。除了該等資料之外,該記憶體單元1251可儲存由音訊輸入單元1231所產生之音訊資料或許許多多的資料庫於該處之中。再者,記憶體單元1251可進一步地儲存當第一資訊處理裝置1020A執行一過程時需予以儲存之種種參數,及該過程之進展資訊於該處之中。當語音辨識單元1233,音訊交談控制單元1239,資訊搜尋單元1243,關鍵字同步化單元1245,或其類似物針對記憶體單元1251而自由地執行讀取或寫入時,該記憶體單元1251係可存取的。該記憶體單元1251進一步包含搜尋資訊累積單元1253及參照歷史記憶體單元1255。
該搜尋資訊累積單元1253以相互關連的方式來累積由資訊搜尋單元1243所獲取之搜尋資訊及資訊獲取資料。當企望於顯示曾經所獲取的搜尋資訊時,則可參照該搜尋資訊累積單元1253中所儲存之資訊,以顯示該曾經所獲取的搜尋資訊。
該參照歷史記憶體單元1255儲存顯示單元1247上所顯示的關鍵字或物件中之第一資訊處理裝置1020A的使用者已針對更詳細的資訊而參照過的關鍵字,以做為參照歷史。該參照歷史係資料,該資料包含所參照之關鍵字,所參照之關鍵字的權重資訊,已參照該等關鍵字之音訊聊天本身的識別號,以及該音訊聊天之配對物。該參照歷史記憶體單元1255中所儲存之參照歷史可使用於當關鍵字提取單元1237提取該等關鍵字的時候。
資訊搜尋單元1243,關鍵字同步化單元1245,及顯示單元1247可由專用於個別功能之特殊化硬體所建構,且可設置以成為諸如語音辨識程式之應用程式。
第二資訊處理裝置1020B的組態係與第一資訊處理裝置1020A實質地相同,且其說明將予以省略。
在上文中,已說明依據本發明之資訊處理裝置1020的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
(語音辨識方法及關鍵字提取方法)
下文中,將參照第32圖來簡明地敘述語音辨識單元1233執行語音辨識以自語音辨識結果來提取關鍵字之方法。由依據本實施例之語音辨識單元1233所使用的語音 辨識方法及關鍵字提取方法並未受限於下文所述之實例。 第32圖係流程圖,用以解說由依據本實施例之語音辨識單元1233所使用的語音辨識方法及關鍵字提取方法之實例。
音訊輸入單元1231自輸入至該處之第一資訊處理裝置1020A的使用者之語音來產生音訊資料。在音訊輸入單元1231之中,將其係類比信號之所輸入的使用者語音予以AD轉換以取樣及量化該語音,且將該類比語音信號轉換成為音訊資料,該音訊資料係數位信號(步驟S1101)。一旦完成音訊資料之轉換時,該音訊輸入單元1231傳輸所產生之音訊資料至語音辨識單元1233及音訊交談控制單元1239。
之後,參數提取單元1235自所產生之音訊資料的各音框(在適當的時隔處)來提取諸如美爾倒譜係數(MFCC)及其時間差參數,音訊資料之頻譜,功率線性預測係數,倒譜係數,以及線譜對之特徵參數(步驟S1103)。
關鍵字提取單元1237計算最接近於所輸入至該音訊輸入單元1231之語音(輸入音訊)的字元順序以做為辨識結果,且根據自參數提取單元1235所提取之特徵參數,例如由參照關鍵字提取資料庫1030,聲頻模型,語言模型,及使用於該聲頻模型或語言模型中之字典,而自該辨識結果來提取關鍵字。
此處,聲頻模型儲存表示即將被辨識之語音的個別之 音素,音節,或其類似物的聲頻特徵之模型於該處之中。 做為聲頻模型,例如可使用隱藏式馬可夫模型(HMM)。做為該聲頻模型,可設置二模型,一用於安靜的環境(能在安靜的環境下提供高辨識率之聲頻模型),以及另一用於雜訊的環境(能在雜訊的環境下提供有利之辨識率的聲頻模型),使得該等模型之任一模型均可根據環境而被引用。
語言模型儲存描述表示暫存於各個字典中之字元如何序連(連接)之資訊(序連資訊)的模型於該處之中。做為該語言模型,可使用統計之字元序連機率(n元語法或n類別語法),生成文法,有限狀態自動機(FSA),或其類似物。
該語言模型可儲存字元之類目的序連資訊及字元的序連資訊於該處之中。例如,當〝表示人名之字元所屬的類目〞係表示為符號〝_人名_〞,以及〝表示食物之字元所屬的類目〞係表示為符號〝_食物_〞時,則語言模型亦描述〝_人名_〞及〝_食物_〞的序連資訊;亦即,亦描述類目之間的序連以及類目與事先儲存於字典中的字元之間的序連。
因此,可獲取並未包含於語言模型中之字元的序連;例如,當獲取〝 (發聲為ichiro)〞與〝(質詞,發聲為wa)〞之間的序連資訊時,即使〝 (發聲為ichiro)〞的序連資訊並未描述於該語言模型之中,但是若可知道該〝 (發聲為ichiro)〞屬於 表示為符號〝_人名_〞之類目時,則可由獲取〝_人名_〞與〝(質詞,發聲為wa)〞之間的序連資訊而獲取〝 (發聲為ichiro)〞與〝(質詞,發聲為wa)〞之間的序連資訊。
當接收到來自音訊輸入單元1231之音訊資料時,關鍵字提取單元1237根據該聲頻模型,藉由依照字元的發音或音素來連接一些字元而產生字元順序。該關鍵字提取單元1237根據該聲頻模型來計算所產生之字元順序的聲頻評分(步驟S1105)。此處,該聲頻評分係數值,其表示就聲音而言(從聲頻之觀點),語音辨識之結果的字元順序如何密均地與輸入之音訊相似。該關鍵字提取單元1237根據所計算之聲頻評分來選擇具有更高聲頻評分之預定數目的字元順序。
該關鍵字提取單元1237可使用根據束搜尋之維持比解碼器或根據A*搜尋之堆疊解碼器來執行匹配。額外地或選擇性地,可使用所謂的關鍵字識別法(keyword spotting method)於該匹配法之中。若添加稍後所描述之〝辨識權重〞資訊至該關鍵字提取單元1237所參照之各式各樣的字元字典時,可將權重應用於稍後所述的語言評分,且可由加權之評分來將辨識結果分級。該辨識權重資訊係描述辨識權重的資訊,其係使用於語言評分之計算中的校正因子(權重因子);當該辨識權重具有更大的值時,語言評分的校正值會增加,且因此,具有更大的辨識權重之關鍵字會高度可能地被採用以形成為辨識結果。例如 ,具有10之辨識權重的關鍵字將以比具有1之辨識權重的關鍵字(亦即,未加權之關鍵字)更高十倍的機率而被語音辨識。
關於該辨識權重的決定,可使用自搜尋引擎1040所獲取之搜尋關鍵字列表中之分級資訊,或語音辨識結果的輸出中之關鍵字的發生頻率。因為搜尋關鍵字列表係安置於搜尋引擎1040中之更高分級上的搜尋關鍵字之列表,所以可以以在搜尋中之關鍵字的發生頻率之下降順序來將該分級指明至該等關鍵字;預定的辨識權重係按分級之順序而決定。
特定地,預定的係數係以在搜尋中之關鍵字的發生頻率之下降順序而指明至該等關鍵字,以及使常態化的關鍵字頻率與所指明之係數相乘,藉以獲得辨識權重。關於搜尋關鍵字列表及子關鍵字的獲取,以及關鍵字資訊的添加,可使用經由通訊網路1012而連接至該處之伺服器中所儲存的辭典,本體資料庫,百科全書,日文字典,或語形分析工具,以取代搜尋引擎1040。除了該辭典,本體資料庫,百科全書,日文字典,及語形分析工具之外,可使用該搜尋引擎1040。
關於該辨識權重的決定,可使用第一資訊處理裝置1020A之使用者是否已使用搜尋引擎1040來執行所獲得以成為語音辨識結果之關鍵字的搜尋,或該第一資訊處理裝置1020A之使用者的偏好上之資訊。
隨後,該關鍵字提取單元1237根據語言模型來計算 所選擇之各個字元順序的語言評分(步驟S1109)。此處,該語言評分係數值,用以決定所選擇之字元順序是否適用於語言模型。若使用文法或有限狀態自動機以做為該語言模型時,則該語言評分係指示該字元順序是否可接受於該語言模型之數值。若使用統計語言模型以做為該語言模型時,則該語言評分係該字元順序的生成機率。特定地,若使用文法或有限狀態自動機以做為語言模型時,當字元順序係可接受於該語言模型時,則該字元順序的語言評分為"1";當該字元順序無法接受於該語言模型時,則該字元順序的語言評分為"0"。當使用諸如n元語法或n類別語法之統計語言模型以做為語言模型時,則使用字元順序的生成機率來做為語言評分。計算語言評分的詳細方法,係描述於由本發明申請人所申請之日本專利申請案第2001-382579號(對應於JP-A NO.2003-186494)中。
之後,該關鍵字提取單元1237合計在先前步驟中所計算的聲頻評分及語言評分,且藉由該評分來分類及選擇字元順序(步驟S1111),藉以決定具有最大合計評分之字元順序來做為辨識結果(步驟S1113)。特定地,該關鍵字提取單元1237決定的是,使獲取自聲頻模型之聲頻評分及獲取自語言模型之語言評分的乘積或對數和為最大的字元順序來做為辨識結果。當添加諸如字元之辨識權重的資訊至語言模型中所使用之字典時,則可使用具有辨識權重資訊被結合於其中的語言評分。
藉由此,可從聲頻及語文之觀點來決定最為可行的字 元順序,以做為辨識結果。
然後,關鍵字提取單元1237經由通訊單元1249來存取關鍵字提取資料庫1030,以比較該語音辨識結果與關鍵字提取資料庫1030中所暫存的關鍵字(步驟S1115)。若暫存於該關鍵字提取資料庫1030中之字元係包含於該語音辨識結果之中時,則關鍵字提取單元1237決定的是,將提取該語音辨識結果中所包含之字元(步驟S1117)。
該關鍵字提取單元1237可組構以在存取該關鍵字提取資料庫1030之前,存取其係該音訊聊天之配對物的第二資訊處理裝置1020B,以便交換該音訊聊天的辨識結果。例如,藉由交換音訊資料或談話者之說話方式,可增加語音辨識的準確性。為了要確認該等資訊處理裝置的語音辨識結果,可交換該等語音辨識結果的標題向量。
藉由使用上述之語音辨識方法及關鍵字提取方法,不僅可適當地辨識音訊聊天期間之交談的內容,而且可自語音辨識結果來適當地提取關鍵字。
(關鍵字同步化方法)
接著,將參照第33圖來詳細敘述依據本實施例之音訊聊天系統中的關鍵字同步化方法。第33圖係流程圖,用以解說依據第三實施例之音訊聊天系統中的關鍵字同步化。第33圖顯示其中第一資訊處理裝置1020A的使用者發聲至第二資訊處理裝置1020B的情況。
當第一資訊處理裝置1020A的使用者朝向諸如麥克風或話機之連接至第一資訊處理裝置1020A的音訊輸入單元1231發聲時,該音訊輸入單元1231自使用者所發聲的聲音來產生音訊資料(步驟1201)。所產生之音訊資料傳輸至參數提取單元1235和音訊交談控制單元1239,該音訊交談控制單元1239經由通訊單元1249來傳輸所產生之音訊資料至第二資訊處理裝置1020B,使得音訊交談執行於第一與第二資訊處理裝置1020A與1020B之間(步驟S1203)。
該參數提取單元1235傳輸音訊資料及各式各樣之所提取的參數至關鍵字提取單元1237,以及該關鍵字提取單元1237執行語音辨識於音訊資料之上,以便自語音辨識結果來提取關鍵字。之後,該關鍵字提取單元1237經由通訊單元1249而與第二資訊處理裝置1020B交換語音辨識結果(步驟S1205),以便增加語音辨識結果的準確性。隨後,該關鍵字提取單元1237經由通訊單元1249以存取連接至通訊網路1012的關鍵字提取資料庫1030(步驟S1207)。該關鍵字提取資料庫1030發出參照准許至第一資訊處理裝置1020A,而允許參照暫存於該處之中的資料庫(步驟S1209)。該第一資訊處理裝置1020A的關鍵字提取單元1237藉由參照該關鍵字提取資料庫1030而提取關鍵字(步驟S1211)。
當提取該等關鍵字時,關鍵字提取單元1237可組構以存取搜尋引擎1040或其類似物,且以優先之基礎來提 取該搜尋引擎1040之更高分級的搜尋關鍵字,或常被使用做為部落格中之標題的用語。該音訊聊天的標題常係在該音訊聊天時為流行中之標題。因此,與該等標題相關連的關鍵字係高度地可能變搜尋引擎1040之更高分級的搜尋關鍵字,或常被使用做為部落格中之標題的用語。因此,藉由以優先之基礎來提取該等關鍵字,可更有效率地執行關鍵字提取。
然後,該關鍵字提取單元1237傳輸所提取之關鍵字至資訊搜尋單元1243,且該資訊搜尋單元1243以與傳輸時間相互關連之方式來儲存所傳輸的關鍵字於記憶體單元1251之中(步驟S1213)。之後,該資訊搜尋單元1243決定所傳輸之關鍵字是否為目前音訊聊天期間之前所提取之舊的關鍵字(步驟S1215)。若所傳輸之關鍵字係非以往所提取之新的關鍵字時,則該關鍵字提取單元1237會嶄新地暫存該等關鍵字(步驟S1219)。
若所傳輸之該等關鍵字係舊的關鍵字時,則資訊搜尋單元1243搜尋舊的關鍵字之傳輸時間,且決定在該傳輸時間之後的預定週期(例如,5分鐘)是否已期滿(步驟S1217)。使用於上述決定步驟之中的預定週期並未受限於此,而是可設定為任意週期。若在舊的該等關鍵字的傳輸時間之後的預定週期並未期滿時,資訊搜尋單元1243將拒絕所傳輸之關鍵字,且關鍵字提取過程結束;若在舊的該等關鍵字的傳輸時間之後的預定週期已期滿時,則該資訊搜尋單元1243更新新的關鍵字之傳輸時間,且嶄新
地暫存該等關鍵字(步驟S1219)。
當嶄新地暫存該等關鍵字時,該資訊搜尋單元1243傳輸所嶄新暫存之該等關鍵字至關鍵字同步化單元1245。一旦接收到該等關鍵字時,關鍵字同步化單元1245經由通訊單元1249而傳輸該等所傳輸之關鍵字至第二資訊處理裝置1020B(步驟S1221)。藉由此傳輸過程,可完成使第一資訊處理裝置1020A所提取之關鍵字與其係音訊聊天之配對物的第二資訊處理裝置1020B同步之同步的同步過程。此處,該同步過程僅包含關鍵字之交換。因此,無需製備同步區於資訊處理裝置的記憶體之上。
在其中暫存新的關鍵字之第一資訊處理裝置1020A之中,資訊搜尋單元1243經由通訊單元1249來存取連接至通訊網路1012之搜尋引擎1040(步驟S1223),且獲取新的關鍵字之搜尋結果及描述與該等關鍵字相關連之物件的URL及其類似物之元資料(步驟S1225)。隨後,資訊搜尋單元1243儲存所獲取的資訊於搜尋資訊累積單元1253之中,且傳輸所獲取的資訊至顯示單元1247。之後,顯示單元1246經由瀏覽器或其類似物來顯示所傳輸之資訊於顯示裝置之上(步驟S1227)。
在被傳輸關鍵字的第二資訊處理裝置1020B之中,係與第一資訊處理裝置1020A無關地執行該等關鍵字是否係舊的,且若係舊的時,預定之週期是否已期滿的決定。 若該等關鍵字並非舊的時,或雖然是舊的,但若是預定之週期已期滿時,則該第二資訊處理裝置1020B嶄新地暫存 該等所傳輸之關鍵字。
之後,第二資訊處理裝置1020B存取搜尋引擎1040(步驟S1229),且獲取描述該等所傳輸之關鍵字的URL或其類似物之元資料(步驟S1231)。與第一資訊處理裝置1020A之中相同地,該第二資訊處理裝置1020B儲存所獲取的資訊於搜尋資訊累積單元1253之中,且傳輸所獲取的資訊至顯示單元1247。然後,該顯示單元1247經由瀏覽器或其類似物來顯示所傳輸之資訊於顯示裝置之上(步驟S1233)。
從輸入音訊聊天之期間的交談內容至第一資訊處理裝置1020A之步驟,到使關鍵字同步化以顯示與關鍵字相關連之資訊的搜尋結果之步驟的過程步驟係由第一資訊處理裝置1020A自動地執行。因此,該第一資訊處理裝置1020A的使用者無需作成任何特殊之操作以供語音辨識,關鍵字偵測,及關鍵字同步化過程用。從而,該第一資訊處理裝置1020A的使用者可專注於音訊聊天。同時,在第二資訊處理裝置1020B之中,關鍵字同步化過程和資訊搜尋結果顯示過程亦係自動地執行。該第二資訊處理裝置1020B的使用者無需作成任何殊特之操作以供該等過程用,且可專注於該音訊聊天。
如上述地,第一資訊處理裝置1020A根據由第一資訊處理裝置1020A之使用者所發聲的聲音來執行關鍵字提取,且然後,執行相對於第二資訊處理裝置1020B之關鍵字同步化。結果,其中已完成關鍵字同步化之已執行關 鍵字提取的第一資訊處理裝置1020A及第二資訊處理裝置1020B使用搜尋引擎1040來執行搜尋,且以彼此相互獨立之方式來顯示搜尋結果。藉由此一過程,在第一及第二資訊處理裝置1020A及1020B之顯示裝置上,可以以對應於固有通訊延遲之小的時間落後而實質同時地顯示相同的關鍵字及與該等關鍵字相關連之相同的物件。因為亦顯示與該等關鍵字相關連的資訊,所以可自動地提供可使用以做為該音訊聊天之標題的資訊,且可因而使該音訊聊天的交談變得寬廣。
已針對其中第一資訊處理裝置1020A發聲至第二資訊處理裝置1020B之情況而描述。然而,上述過程可相似地執行於其中第二資訊處理裝置1020B發聲至第一資訊處理裝置1020A之情況。在此情況中,第二資訊處理裝置1020B執行音訊資料之產生及關鍵字之提取,獲得嶄新暫存之關鍵字,以及執行相對於第一資訊處理裝置1020A之關鍵字同步化過程。因而,關鍵字相關之資訊搜尋及搜尋結果的顯示係由第一及第二資訊處理裝置1020A及1020B以相似於上述方式之獨立且並聯之方式所執行。在此方式中,音訊聊天期間之交談的輸入(音訊資料的產生和關鍵字之提取係由個別之資訊處理裝置以獨立及並聯之方式所處理。
當第一與第二資訊處理裝置1020A及1020B之間的音訊聊天結束時,將該等資訊處理裝置1020A及1020B之中所暫存的關鍵字及與該等關鍵字相關連的暫存資訊予 以刪除,以及在稍後使用中,暫存新的關鍵字。
在上述說明中,關鍵字提取資料庫1030係獨立地連接至連接於第一資訊處理裝置1020A的通訊網路1012。 該關鍵字提取資料庫1030可設置於第一資訊處理裝置1020A之中。在此情況中,該關鍵字提取資料庫1030係儲存於例如該第一資訊處理裝置1020A之資料庫記憶體單元中。當該關鍵字提取資料庫1030係設置於第一資訊處理裝置1020A之中時,可排除關鍵字提取之期間的通訊時間落後。因此,該關鍵字提取可以以更短的週期而執行。資料庫記憶體單元可獨立地設置於第一資訊處理裝置1020A之中,或可設置於該第一資訊處理裝置1020A的記憶體單元1251之中。
在上述說明中,搜尋引擎1040係獨立地連接至連接於第一資訊處理裝置1020A的通訊網路1012。然而,該第一資訊處理裝置1020A可包含該搜尋引擎1040。當該搜尋引擎1040係設置於第一資訊處理裝置1020A之中時,可排除資訊搜尋之期間的通訊時間落後;因此,該資訊搜尋可以以更短的週期而執行。
(搜尋結果顯示螢幕)
接著,將參照第34圖來詳細敘述依據本實施例之資訊搜尋結果顯示螢幕的實例。第34圖係說明圖式,顯示由依據第三實施例之資訊處理裝置的搜尋資訊顯示之實例。
搜尋結果顯示螢幕1050以更新之方式來顯示音訊聊天期間所偵測的關鍵字於顯示螢幕之上。在該顯示螢幕之上,較新的關鍵字係安置於上方部分,以及較舊的關鍵字係安置於下方部分。可適當地設置可顯示於一螢幕上之最大數目的關鍵字。當關鍵字的數目超過最大數目時,將首先刪除螢幕上之最下方的關鍵字。
在第34圖之實例中,關鍵字係以欄1501中之以其登錄時間的順序所指明的索引號碼而顯示於欄1503之中。 較新的關鍵字,亦即,在欄1503中之具有較大索引號碼於欄1501之中的關鍵字係顯示於上方部分。除了索引號碼欄1501及關鍵字欄1503之外,該顯示螢幕包含接腳鎖定核取方塊欄1505及刪除核取方塊欄1507,該接腳鎖定核取方塊及刪除核取方塊係設置於個別的關鍵字。該接腳鎖定核取方塊係使用以鎖定關鍵字,使得所鎖定的關鍵字保留於螢幕上。該刪除核取方塊係使用於當更新所顯示之內容時,選擇將刪除之關鍵字。
在欄1503中之關鍵字係鏈接至其搜尋結果顯示螢幕,該搜尋結果顯示螢幕顯示當欄1503中的關鍵字係使用搜尋引擎1040而搜尋時之搜尋結果。當欄1503中之關鍵字係使用例如滑鼠指標器而點選時,使用者可看到藉由搜尋引擎1040之關鍵字的搜尋結果。
若核對該接腳鎖定核取方塊欄1505中之接腳鎖定核取方塊時,則被核對接腳鎖定核取方塊之關鍵字會移至最上方之部分且被鎖定。因此,即使當顯示新的關鍵字於螢
幕之上時,所鎖定的關鍵字並不會下移。若存在有複數個所鎖定之關鍵字時,則該等關鍵字可以以其登錄時間之順序而顯示。
在從音訊聊天期間之交談對話所提取之暫存的關鍵字之中,可能存在有無益於該音訊聊天中之資訊處理裝置的使用者之關鍵字;在此一情況中,藉由核對除了對應關鍵字之外的刪除核取方塊欄1507中之刪除核取方塊,則當更新所顯示之內容時,可將該關鍵字刪除。
關於欄1503中之一關鍵字,不僅顯示該關鍵字之表示,而且以小型畫像來顯示搜尋引擎1040中所描述之與欄1503中的關鍵字相關連的物件於欄1503中之對應關鍵字下方的欄1509之中。當使用者利用如滑鼠指標器而在欄1509中之物件上點選時,可將欄1509中之與該關鍵字相關連的物件鏈接至搜尋引擎1040中所描述之該等物件的全文。在欄1505中之接腳鎖定核取方塊及在欄1507中之刪除核取方塊亦設置於欄1509中的個別物件。可顯示於欄1509中與欄1503中的關鍵字相關連之物件的數目並未受限於圖式中所描繪之數目,而是可任意地設定。在搜尋結果顯示螢幕1050之欄1509中所顯示的該等物件可為常在搜尋引擎1040之中所參照的物件。
在第34圖中所示之顯示螢幕1050的實例中,〝 (人名,發聲為Cassim)〞,〝代表(代表人,發聲為daihyou)〞,〝(國名,葉門)〞,〝千葉(地名,Chiba)〞,〝牧(發聲為boku)〞之關鍵字, 係在音訊聊天期間以此順序而提取。因為核對〝(人名,發聲為Cassim)〞之關鍵字的接腳鎖定核取方塊,所以雖其係所暫存之關鍵字的最舊之關鍵字,但將其顯示於顯示螢幕1050的最上方部分。核對關鍵字〝代表(代表人,發聲為daihyou)〞及與關鍵字〝牧(發聲為boku)〞相關連之資訊〝新潟市牧支所(社會福利首頁之新潟市議會)〞。因此,當更新所顯示之內容時,將此一關鍵字與關鍵字相關之資訊刪除。
關於顯示於該顯示螢幕1050之欄1503中的關鍵字,將藉由安裝於資訊處理裝置1020中之關鍵字同步化單元1245而實質同時地顯示相同的關鍵字於該音訊聊天中之個別談話者的資訊處理裝置1020之螢幕上。然而,因為接腳鎖定核取方塊及刪除核取方塊的核對係由個別的談話者所獨立地操作,所以不同的內容會隨著音訊聊天的進行而顯示於資訊處理裝置1020之個別的顯示螢幕105之上。
(搜尋資訊之參照歷史資料)
接著,將參照第35圖來敘述依據本實施例之關鍵字提取期間的搜尋資訊之參照歷史的使用方法。第35圖係說明圖式,顯示依據第三實施例之搜尋資訊的參照歷史資料。
例如,如第35圖中所示地,在依據本實施例之資訊處理裝置1020中,由資訊處理裝置1020之使用者在搜尋 結果顯示螢幕1050上所選擇之欄1503中之關鍵字係以與資訊相互關連之方式來儲存於參照歷史記憶體單元1255中,以做為參照歷史資料。
如第35圖中所示地,該參照歷史資料包含:由使用者所選擇之欄1601中的關鍵字;表示欄1601中之關鍵字的選擇次數之欄1603中的權重資訊;欄1605中的期間ID資訊,其係識別號,用以識別其中選擇欄1601中之關鍵字的音訊聊天;以及表示被指明該期間ID之各個音訊聊天中的配對物之欄1607中的交談配對物資訊。
在欄1603中之權重資訊係表示本實施例的音訊聊天系統1010中之欄1601中的關鍵字之選擇次數的資訊。在第35圖中之參照歷史資訊中,(日本杯)〞之關鍵字係全部地選擇兩次;以及〞及〝牧〞之關鍵字係分別地選擇一次。
在依據本實施例之音訊聊天系統中,無論何時當執行音訊聊天時,將指明欄1605中之期間ID於各個音訊聊天期間,該欄1605中之期間ID包含音訊聊天的日期及在該日期之期間之音訊聊天的期間號碼。在第35圖中所示之參照歷史資料中,〝(日本杯)〞之關鍵字係選擇兩次:一次在期間ID "200609150001"的音訊聊天中;以及一次在期間ID "200609150002"的音訊聊天中。
在欄1607中之交談配對物資訊係表示其中選擇欄1601中之關鍵字的音訊聊天之配對物的資料。在第35圖 中所示之參照歷史資料中,〝(日本杯)〞之關鍵字係由兩個參與者來選擇兩次:一次由參與者"A"在期間ID "200609150001"之音訊聊天中;以及一次由參照者"B"在期間ID "200609150002"之音訊聊天中。
在依據本實施例之資訊處理裝置1020中,此參照歷史資料可使用於自音訊資料來提取關鍵字之中。藉由使用該參照歷史資料,可獲取諸如交談配對者在標題上之定向,或字元之間的關連性。藉由此資訊,可更有效率地執行語音辨識或關鍵字提取。在下文中,將簡明地敘述使用該參照歷史資訊的方式。
當執行語音辨識時,依據本實施例之關鍵字提取單元1237可參照其中儲存上述之參照歷史資料的參照歷史記憶體單元1255,而使用參照歷史資料中所包含之各式各樣的資訊,以做為語音辨識中所使用之參數資訊的其中之一。例如,當執行語音辨識時,關鍵字提取單元1237可由參照該參照歷史記憶體單元1255,而增加在該參照歷史資料之權重資訊欄1603中具有較大數目之關鍵字的語音辨識優先序。因而,可有效率地執行語音辨識。
當由關鍵字提取單元1237所辨識之關鍵字被暫存於參照歷史資料之中時,可增加具有與所暫存之關鍵字相同之期間ID的聊天期間中所選擇之另一關鍵字的語音辨識優先序。此係因為可預測的是,具有相同之期間ID的關鍵字係彼此強烈地相關連。
當由關鍵字提取單元1237所辨識之關鍵字被暫存於參照歷史資料之中時,可增加由與所暫存之關鍵字相同之交談配對物所選擇之另一關鍵字的語音辨識優先序。此係因為可預期的是,在音訊聊天期間由相同的交談配對者所選擇之關鍵字會依照該交談配對者在標題上之定向而相互一致。
如上述地,依據本實施例之資訊處理裝置1020,藉由有效地反饋該參照歷史資料,將變得可更有效率地執行語音辨識和關鍵字提取。
(資訊處理裝置之修正實例)
接著,將參照第36A至36D圖來簡明地敘述依據本實施例之資訊處理裝置1020的修正實例。第36A圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法。第36B圖至36D圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法之修正實例。
在第36A至36D圖中所示的資訊處理裝置1020A及1020B之中,僅描繪個別資訊處理裝置之一些處理單元。
不用說地,除了所描繪之該等處理單元外,第31圖中所描繪的處理單元亦包含於該等資訊處理裝置之中。
在依據本實施例之資訊處理裝置1020中,如第36A圖中所示,已針對其中執行音訊聊天之第一及第二資訊處理裝置1020A及1020B接收由對應的使用者所發聲的聲 音,而使語音辨識單元1233執行語音辨識以及使關鍵字同步化單元1245執行關鍵字同步化之過程的情況來予以敘述。然而,本實施例之資訊處理裝置可以以以下方式來加以修正。
(第一修正實例)
第36B圖之第一修正實例顯示其中執行音訊聊天之資訊處理裝置1020A及1020B照現狀地傳輸由其對應之使用者所發聲的聲音至其配對之資訊處理裝置,且執行語音辨識於所接收之由配對之資訊處理裝置的使用者所發聲的聲音上之情況。
特定地,由第一資訊處理裝置1020A之使用者所發聲的聲音係經由音訊交談控制單元1239和通訊單元1249而照現狀地傳輸至第二資訊處理裝置1020B,且由該第二資訊處理裝置1020B來予以語音辨識。同樣地,由第二資訊處理裝置1020B之使用者所發聲的聲音係經由音訊交談控制單元1239和通訊單元1249而照現狀地傳輸至第一資訊處理裝置1020A,且由該第一資訊處理裝置1020A來予以語音辨識。在此修正實例中,語音辨識,關鍵字提取,及關鍵字相關之資訊搜尋係執行於該第一及第二資訊處理裝置1020A及1020B二者。
(第二修正實例)
第36C圖之第二修正實例顯示其中語音辨識僅執行於 該等資訊處理裝置的其中之一中,以及關鍵字同步化及資訊搜尋係執行於另一資訊處理裝置中的情況。特定地,語音辨識係執行於第一資訊處理裝置1020A之中,以及關鍵字同步化過程係執行於第二資訊處理裝置1020B之中。 由第一資訊處理裝置1020A之使用者所發聲之聲音係由語音辨識單元1233所語音辨識及關鍵字提取,且係接著傳輸至第二資訊處理裝置1020B。然後,該第二資訊處理裝置1020B執行關鍵字同步化過程和關鍵字相關之資訊的搜尋。由第二資訊處理裝置1020B之使用者所發聲的聲音係照現狀地傳輸至第一資訊處理裝置1020A,且然後,由語音辨識單元1257所語音辨識及關鍵字提取。
在第36C圖之實例中,語音辨識係獨立地執行於第一資訊處理裝置1020A之中。然而,該語音辨識可獨立地執行於第二資訊處理裝置1020B之中。在第36C圖之實例中,兩個獨立的語音辨識單元係設置於第一資訊處理裝置1020A之中。然而,上述之語音辨識可僅由一個語音辨識單元所執行。本修正實例係有用於當一資訊處理裝置的處理能力比另一資訊處理裝置更優時,且反之亦然。
(第三修正實例)
第36D圖之第三修正實例顯示其中語音辨識很少執行於資訊處理裝置中,而是執行於中繼該等資訊處理裝置之間的連接之伺服器1016中,且該等裝置僅執行關鍵字同步化及資訊搜尋的情況。特定地,由第一資訊處理裝置
1020A之使用者所發聲的聲音係照現狀地傳輸至伺服器1016,且由該伺服器1016之語音辨識單元1163所語音辨識,以便傳輸至第二資訊處理裝置1020B。同時,由第二資訊處理裝置1020B之使用者所發聲的聲音係照現狀地傳輸至伺服器,且由該伺服器1016之語音辨識單元1163所語音辨識,以便傳輸至第一資訊處理裝置1020A。在第36D圖之實例中,係設置兩個獨立的語音辨識單元於該伺服器1016之中。然而,上述之語音辨識可僅由一個語音辨識單元來予以執行。
(第四實施例)
下文中,將詳細敘述依據本發明之第四實施例的關鍵字提取系統。
第37圖係說明圖式,顯示依據本發明第四實施例之關鍵字提取系統的組態。如第37圖中所示地,依據本實施例之關鍵字提取系統1011包含通訊網路1012,關鍵字提取資料庫1030,搜尋引擎1040,以及資訊處理裝置1020A及1020B(下文中,有時統稱為資訊處理裝置或裝置1020)。資訊處理裝置1020A係在家庭網路1018內連接至外部顯示裝置1070。該等資訊處理裝置1020A及1020B以及該外部顯示裝置1070可接收來自廣播站1080所傳輸之廣播資訊。
通訊網路1012,關鍵字提取資料庫1030,及搜尋引擎1040具有與依據第三實施例之通訊網路1012,關鍵字 提取資料庫1030,及搜尋引擎1040相同的組態,且實質地提供相同的功效,而其詳細說明將予以省略。
資訊處理裝置1020藉由音訊以與經由通訊網路1012而連接至該處之另一資訊處理裝置1020來執行聊天(音訊聊天)。該資訊處理裝置1020可請求經由該通訊網路1012而連接至該處的搜尋引擎1040來執行經由通訊網路1012之資料庫的參照或資訊的搜尋。
執行音訊聊天的另一資訊處理裝置1020可經由通訊網路1012而連接至資訊處理裝置1020。選擇性地,該另一資訊處理裝置1020可直接地連接至資訊處理裝置1020,而非經由該通訊網路1012地連接至USB埠,諸如i.Link(i.鏈接)之IEEE 1394埠,SCSI埠,RS-232C埠,及其類似埠。
資訊處理裝置1020係在家庭網路1018內連接至稍後描述之外部顯示裝置1070;因此,各式各樣的資料可在資訊處理裝置1020與外部顯示裝置1070之間通訊。該資訊處理裝置1020與外部顯示裝置1070之間的連接可經由諸如HDMI-CEC(高清晰度多媒體介面-消費者電子裝置控制)之連接埠而執行。該資訊處理裝置1020可使用設置於該處之中的接收功能而接收來自稍後描述之廣播站1080所傳輸之含有廣播資訊的廣播電波。
在圖式中所示的該實例中,資訊處理裝置1020係桌上型PC;然而,在本實施例中,該資訊處理裝置1020可為筆記型PC。
在本實施例中,資訊處理裝置1020並未受限於上述之實例,而是可由例如電視之機上盒,諸如家用遊戲機之資訊器具,行動電話,PDA,及其類似物所建構,只要其係具有能經由網路而通訊之功能的裝置即可。額外地,或選擇性地,該資訊處理裝置1020可為由租得的使用者所攜帶之諸如可攜式遊戲機,PHS,或可攜式視頻/聲頻播放器的可攜式裝置。
外部顯示裝置1070係顯示單元,例如CRT顯示單元,液晶顯示單元,電漿顯示面板單元,或電致發光(EL)顯示單元。該外部顯示裝置1070接收來自稍後描述之廣播站1080所傳輸之含有廣播資訊的廣播電波,且顯示該廣播資訊的內容於顯示單元的顯示區域之上。此處,自廣播站所傳輸之廣播資訊意指諸如廣播本文資訊,廣播聲頻資訊,或視頻資訊的資料,其係透過諸如一段式數位廣播或12分段式數位廣播(下文中稱為全分段式數位廣播)之地面數位廣播,電纜廣播,或經由網路之網際網路廣播而提供。含有廣播資訊之廣播電波意指諸如一段式數位廣播或全分段式數位廣播之地面數位廣播。該外部顯示裝置1070可經由諸如HDMI-CEC之連接埠來傳輸所接收的廣播資訊至資訊處理裝置1020。該外部顯示裝置1070可接收來自資訊處理裝置1020所傳輸之各式各樣的資料,及顯示對應於該資料之資訊。
在下文中,將藉由地面數位廣播之實例來敘述第四實施例。
廣播站1080傳輸含有廣播資訊之廣播電波,該廣播資訊係由包含廣播本文資訊,廣播聲頻資訊,及視頻資訊的資料所構成。外部顯示裝置1070接收來自廣播站1080所傳輸之廣播電波,且根據該廣播電波之中所包含的廣播本文資訊來顯示主題資訊或輸出聲音。資訊處理裝置1020可接收來自廣播站1080所傳輸之廣播電波,以使用該廣播電波之內容於各式各樣的處理之中。
(資訊處理裝置1020之組態)
接著,將詳細地敘述依據本實施例之資訊處理裝置1020的組態。依據本實施例之資訊處理裝置1020的硬體組態係與依據第三實施例之硬體組態實質地相同,且其詳細說明將予以省略。
第38圖係方塊圖,用以解說依據第四實施例之資訊處理裝置1020的組態。如第38圖中所示,依據本實施例之資訊處理裝置1020包含關鍵字同步化單元1245,顯示單元1247,通訊單元1249,記憶體單元1251,廣播本文資訊接收單元1261,關鍵字提取單元1263,資訊搜尋單元1265,及外部顯示裝置連接控制單元1267。
關鍵字同步化單元1245經由通訊單元1249來傳輸由關鍵字提取單元1263自音訊資料所提取之關鍵字至另一資訊處理裝置1020,藉以使第一及第二資訊處理裝置1020A及1020B同步。該關鍵字同步化過程不僅可以以下文方式來執行於自資訊處理裝置1020至另一資訊處理裝 置1020的方向中,而且可以以下文方式來執行於自該另一資訊處理裝置1020至該資訊處理裝置1020的方向中。 也就是說,該資訊處理裝置1020可回應於由該另一資訊處理裝置1020所初始之關鍵字同步化過程,使得來自該另一資訊處理裝置1020所傳輸之關鍵字被接收至該資訊處理裝置1020。
顯示單元1247經由例如瀏覽器應用而顯示來自資訊搜尋單元1265所傳輸之資訊搜尋結果至諸如顯示器或其類似物之配置至資訊處理裝置1020的輸出裝置。該資訊搜尋單元1265自搜尋引擎1040所獲取之資訊含有搜尋引擎1040中之資訊或物件的URL或其類似物。因此,當資訊處理裝置1020之使用者藉由連接至該資訊處理裝置1020之諸如滑鼠或鍵盤的輸入裝置來選擇所顯示之資訊時,顯示單元1247請求該資訊搜尋單元1265,以獲取所選擇之資訊的細節。
通訊單元1249係安裝於例如資訊處理裝置1020之中的通訊裝置。該通訊單元1249經由資訊處理裝置1020(特定地,該資訊處理裝置1020之資訊搜尋單元1265,關鍵字提取單元1263,及關鍵字同步化單元1245)與該資訊處理裝置1020的外部裝置(特定地,關鍵字提取資料庫1030,搜尋引擎1040,或另一資訊處理裝置1020)之間的通訊網路1012來中繼資訊的通訊。
此外,該通訊單元1249可與直接連接至該資訊處理裝置1020,而非經由通訊網路1012所連接之其他資訊處 理裝置來通訊資訊。
記憶體單元1251係安裝於例如資訊處理裝置1020之中,且儲存諸如由關鍵字提取單元1263所提取之關鍵字,或由資訊搜尋單元1265所獲取之搜尋資訊的資料於該處之中的儲存裝置。除了該等資料之外,該記憶體單元1251可儲存各式各樣的資料庫於該處之中。再者,該記憶體單元1251可進一步地儲存當資訊處理裝置1020執行一過程時需予以儲存之種種參數,及該過程之進展資訊於該處之中。當資訊搜尋單元1265,關鍵字同步化單元1245,或其類似物針對記憶體單元1251而自由地執行讀取或寫入時,該記憶體單元1251係可存取的。該記憶體單元1251進一步包含搜尋資訊累積單元1253及參照歷史記憶體單元1255。
該搜尋資訊累積單元1253以相互關連的方式來累積由資訊搜尋單元1265所獲取之搜尋資訊及資訊獲取資料。當企望於顯示曾經所獲取的搜尋資訊時,可參照該搜尋資訊累積單元1253中所儲存之資訊,以顯示該曾經所獲取的搜尋資訊。
該參照歷史記憶體單元1255儲存顯示單元1247上所顯示的關鍵字或物件中之資訊處理裝置1020的使用者已針對更詳細的資訊而參照過的關鍵字,以做為參照歷史。 該參照歷史係資料,該資料包含所參照之關鍵字,所參照之關鍵字的權重資訊,已參照該等關鍵字之音訊聊天本身的識別號,以及該音訊聊天之配對物。該音訊聊天記憶體 單元1255中所儲存之參照歷史可使用於當關鍵字提取單元1263提取該等關鍵字的時候。
資訊搜尋單元1265,關鍵字同步化單元1245,及顯示單元1247可由專用於個別功能之特殊化硬體所建構,且可設置以成為諸如語音辨識程式之應用程式。
廣播本文資訊接收單元1261自外部顯示裝置1070來獲取接收頻道資訊,該接收頻道資訊係關於該外部顯示裝置1070目前正透過其而接收的廣播頻道。此處,接收頻道資訊意指表示廣播頻道的資訊,而該廣播頻道係外部顯示裝置1070目前正透過其而接收的廣播頻道。該廣播本文資訊接收單元1261可藉由從外部顯示裝置1070來獲取接收頻道資訊,而使廣播本文資訊接收單元1261的接收廣播頻道與外部顯示裝置1070的接收廣播頻道同步。
該廣播本文資訊接收單元1261根據所獲取之接收頻道資訊,而自廣播站1080直接接收對應於外部顯示裝置1070之接收廣播頻道的廣播電波。此時,該廣播本文資訊接收單元1261可組構以直接接收來自廣播站1080所傳輸的廣播電波之中的一段式廣播電波,且自所接收的電波來獲取本文資訊。該廣播本文資訊接收單元1261可組構以直接接收從廣播站1080所傳輸的全分段式廣播電波。
廣播本文資訊接收單元1261可組構以根據所獲取的接收頻道資訊,而接收由外部顯示裝置1070所接收且自外部顯示裝置1070所傳輸至資訊處理裝置1020的廣播本文資訊。
該廣播本文資訊接收單元1261將所接收的廣播本文資訊輸出至稍後描述之關鍵字提取單元1263。該廣播本文資訊接收單元1261可將所接收的廣播本文資訊記錄於記憶體單元1251之中。
該關鍵字提取單元1263根據關鍵字提取資料庫1030而自該廣播本文資訊接收單元1261所接收之廣播本文資訊中所包含的字串來提取關鍵字。
當關鍵字提取單元1263提取關鍵字時,該關鍵字提取單元1263可經由通訊單元1249來參照連接至通訊網路1012之關鍵字提取資料庫1030。
複數個關鍵字係包含於表示廣播本文資訊的字串之中。該關鍵字提取單元1263自動地提取存在於該字串中之所有的關鍵字。該關鍵字提取單元1263傳輸所提取之關鍵字至稍後描述之資訊搜尋單元1265和外部顯示裝置連接控制單元1267。該關鍵字提取單元1263可儲存所提取之關鍵字於記憶體單元1251之中。
資訊搜尋單元1265以相互關連的方式來儲存自關鍵字提取單元1263所傳輸之關鍵字,及該等關鍵字自該關鍵字提取單元1263所傳輸之時間於記憶體單元1251中。 該資訊搜尋單元1265決定關鍵字同步化過程是否將執行於來自關鍵字提取單元1263所傳輸的關鍵字之上。當所決定的是應執行關鍵字同步化過程時,則該資訊搜尋單元1265將該等關鍵字傳輸至關鍵字同步化單元1245,藉以請求該關鍵字同步化過程之執行。該資訊搜尋單元1265
經由通訊單元1249來存取搜尋引擎1040,且執行來自關鍵字提取單元1263所傳輸之關鍵字的資訊搜尋,藉以獲取該等關鍵字及與該等關鍵字相關連的物件之搜尋結果;該資訊搜尋單元1265儲存所獲取的搜尋結果於記憶體單元1251之搜尋結果儲存單元1253中,且傳輸該搜尋結果至稍後描述之顯示單元1247和外部顯示裝置連接控制單元1267。此處,該資訊搜尋單元1265自搜尋引擎1040所獲取之搜尋結果包含關於該搜尋引擎1040中之搜尋關鍵字的資訊之題目或URL,及諸如資訊之式樣的資訊之元資料。
當由顯示單元1247或外部顯示裝置連接控制單元1267所請求以便獲取關於特定之關鍵字或與該關鍵字相關連之物件的更詳細資訊時,則該資訊搜尋單元1265經由通訊單元1249來存取搜尋引擎1040以獲取更詳細的資訊,且儲存來自顯示單元1247或外部顯示裝置連接控制單元1267所通知的關鍵字於記憶體單元1251的參照歷史記憶體單元1255之中。
該外部顯示裝置連接控制單元1267執行連接控制於資訊處理裝置1020與連接至該資訊處理裝置1020的外部顯示裝置1070之間。該外部顯示裝置連接控制單元1267傳輸由關鍵字提取單元1263所提取之關鍵字和資訊搜尋單元1265所獲取之關鍵字的搜尋結果至外部顯示裝置1070。當由外部顯示裝置1070所請求以便獲取關於特定之關鍵字或與該關鍵字相關連之物件的更詳細資訊時,該 外部顯示裝置連接控制單元1267可傳輸該請求至資訊搜尋單元1265。當資訊搜尋單元1265自搜尋引擎1040或其類似物來獲取更詳細的資訊以回應於該請求時,該外部顯示裝置連接控制單元1267輸出由該資訊搜尋單元1265所獲取之詳細資訊至外部顯示裝置1070。順便一提地,當傳輸對應於各式各樣之資訊的資料至外部顯示裝置1070時,該外部顯示裝置連接控制單元1267可變換將被傳輸之資料的格式成為可由外部顯示裝置1070所顯示的格式。
該外部顯示裝置連接控制單元1267可根據參照歷史記憶體單元1255中所記錄之內容來傳輸所選擇之關鍵字上的資訊至搜尋引擎1040。該搜尋引擎1040可使用來自外部顯示裝置連接控制單元1267所傳輸的資訊於該搜尋引擎1040之內所執行之各式各樣的處理。
在上文中,已說明依據本實施例之資訊處理裝置1020的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
依據本實施例之資訊處理裝置1020可進一步包含依據第三實施例之資訊處理裝置1020的語音辨識單元或音訊交談控制單元。該資訊處理裝置1020可進一步包含資料庫記憶體單元,其儲存關鍵字提取資料庫1030的內容 。藉由此,該關鍵字提取資料庫1030的內容可儲存於資訊處理裝置1020中所設置的資料庫記憶體單元之中。因此,可縮短資訊處理裝置1020存取關鍵字提取資料庫1030之所需的時間。因而,可縮短資訊處理裝置1020執行關鍵字提取之所需時間。此外,藉由以週期性之基礎而更新資料庫記憶體單元之內容,則該資訊處理裝置1020可獲取該關鍵字提取資料庫1030中所記錄之更新的資料庫之內容。
(外部顯示裝置1070之組態)
接著,將參照第39及40圖來詳細說明依據本實施例之外部顯示裝置1070的組態。第39圖係方塊圖,用以解說依據第四實施例之外部顯示裝置的組態。第40圖係說明圖式,用以顯示依據第四實施例之外部顯示裝置的資訊顯示螢幕。
依據本實施例之外部顯示裝置1070的硬體包含諸如CRT,液晶顯示面板,電漿顯示面板,或EL面板之顯示元件,以及由CPU,ROM,及RAM所建構且使用以控制顯示元件的驅動之驅動控制電路。
如第39圖中所示,本實施例之外部顯示裝置1070包含廣播接收單元1701,連接埠控制單元1703,廣播資訊顯示控制單元1705,關鍵字資訊顯示控制單元1707,及顯示單元1709。
廣播接收單元1701接收來自廣播站1080所傳輸之廣 播電波,且輸出包含於該廣播電波中之諸如廣播本文資訊,廣播聲頻資訊,或視頻資訊的資料至稍後描述之連接埠控制單元1703及廣播資訊顯示控制單元1705。該廣播接收單元1701可組構以記錄所接收之資訊於該外部顯示裝置1070中所設置的記憶體單元(未顯示),或連接至該外部顯示裝置1070之外部附加的記憶體單元(未顯示)之中。
連接埠控制單元1703控制能與資訊處理裝置1020數位通訊之諸如HDMI-CEC的連接埠。該連接埠控制單元1703經由諸如HDMI-CEC之連接埠以傳輸關於廣播接收單元1701正透過其而接收之廣播頻道的接收頻道資訊至資訊處理裝置1020。由廣播接收單元1701所接收之諸如廣播本文資訊,廣播聲頻資訊,及視頻資訊的資料可經由連接埠控制單元1703而輸出至資訊處理裝置1020。自資訊處理裝置1020所傳輸之各式各樣的資料係經由連接埠控制單元1703而輸入至外部顯示裝置1070。自資訊處理裝置1020所傳輸之各式各樣的資料係傳輸至稍後描述之關鍵字資訊顯示控制單元1707。
廣播資訊顯示控制單元1705執行顯示控制於當顯示來自廣播接收單元1701所傳輸之廣播本文資訊,廣播聲頻資訊,及視頻資訊於稍後描述的顯示單元1709之上時。
當顯示來自資訊處理裝置1020所傳輸之關鍵字資訊於稍後描述的顯示單元1709之上時,關鍵字資訊顯示控 制單元1707執行顯示控制。此處,自資訊處理裝置1020所傳輸之關鍵字資訊表示包含由該資訊處理裝置1020所提取的關鍵字,針對所提取之關鍵字的搜尋結果,及與該等關鍵字相關連的物件之資訊。一旦自顯示單元1709接收到用於詳細資訊之獲取的請求於外部顯示裝置1070之使用者所選擇的資訊之上時,該關鍵字資訊顯示控制單元1707經由連接埠控制單元1703來傳輸該詳細資訊之獲取的請求至資訊處理裝置1020,該資訊係由外部顯示裝置1070之使用者藉由諸如滑鼠,鍵盤,或遙控器的輸入裝置來選擇顯示單元1709上所顯示之資訊而選擇的資訊。
該顯示單元1709顯示由廣播資訊顯示控制單元1705所顯示控制的廣播本文資訊,廣播聲頻資訊,及視頻資訊,以及由關鍵字資訊顯示控制單元1707所顯示控制的關鍵字資訊於外部顯示裝置1070的資訊顯示螢幕之上。
該外部顯示裝置1070之資訊顯示螢幕1751通常包含顯示廣播本文資訊,廣播聲頻資訊,及視頻資訊於上的影像顯示區1753。此處,當關鍵字資訊係傳輸自資訊處理裝置1020時,該資訊顯示螢幕1751的顯示區可分割,以產生可顯示關鍵字資訊於上的關鍵字資訊顯示區1755。 例如,該影像顯示區1753係由廣播資訊顯示控制單元1705所控制,以及例如,該關鍵字資訊顯示區1755係由關鍵字資訊顯示控制單元1707所控制。
該關鍵字資訊顯示區1755的細節係與依據本發明第一實施例之資訊處理裝置的搜尋結果顯示螢幕1050實質 地相同;且因此,將省略其詳細說明。
在上文中,已說明依據本發明之外部顯示裝置1070的功能之實例。上述該等組件可使用通用型之元件或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。 (關鍵字提取方法)
接著,將參照第41圖來詳細說明由依據本實施例之資訊處理裝置1020所執行的關鍵字提取方法之實例。第41圖係流程圖,用以解說依據第四實施例之關鍵字提取方法。
首先,資訊處理裝置1020之廣播本文資訊接收單元1261根據獲取自外部顯示裝置1070之接收頻道資訊,而接收來自外部顯示裝置1070或廣播站1080的廣播本文資訊,藉以獲取廣播主題的字串來做為本文資訊資料(步驟S1301)。該廣播本文資訊接收單元1261輸出所獲取之本文資訊資料至關鍵字提取單元1263。
接著,關鍵字提取單元1263應用語形分析至所傳輸之本文資訊資料,以自該字串來提取字元,且將所提取之字元記錄於資訊處理裝置1020的記憶體之上(步驟S1303)。
其次,該關鍵字提取單元1263使用連接至通訊網路 1012之關鍵字提取資料庫1030的資訊,或該關鍵字提取資料庫1030之內容來搜尋所提取的字元(步驟S1305)。
隨後,該關鍵字提取單元1263決定提取的字元是否存在於關鍵字提取資料庫1030之中(步驟S1307)。當所提取的字元存在於該關鍵字提取資料庫1030之中時,該關鍵字提取單元1263記錄該存在之所提取的字元於記憶體之上,以做為廣播關鍵字資料(步驟S1309)。當所提取的字元並不存在於關鍵字提取資料庫1030之中時,該關鍵字提取單元1263執行稍後所述之步驟S1311的過程。
接著,該關鍵字提取單元1263決定所提取但未發現於關鍵字提取資料庫1030中之該等字元是否存在於記憶體之上(步驟S1311)。當並未發現之該等字元存在於該記憶體之中時,則執行步驟S1305之過程。當並未發現之該等字元亦不存在於該記憶體之中時,則該關鍵字提取單元1263將存在於該記憶體上之廣播關鍵字資料輸出以做為所提取的關鍵字(步驟S1313)。
藉由使用上述之方法,則依據本實施例之資訊處理裝置1020可自所接收之廣播本文資訊來提取關鍵字。
由依據本實施例之資訊處理裝置1020所執行的關鍵字同步化方法係與依據本發明第三實施例之資訊處理裝置1020所執行的關鍵字同步化方法實質地相同,且其詳細說明將予以省略。
在依據本實施例的資訊處理裝置1020之中,存在於關鍵字提取資料庫1030中之該等字元(關鍵字)係從傳輸自廣播站1080之廣播本文資訊來自動地提取。因此,可將所提取之關鍵字顯示至外部顯示裝置1070。藉由使用此一功能,利用資訊處理裝置1020或外部顯示裝置1070來執行諸如聊天之雙向通訊的使用者可利用所提取之該等關鍵字,而做為該聊天或類似者之標題。
(依據第四實施例之資訊處理裝置的第一修正實例)
接著,將參照第42及43圖來詳細說明依據本實施例之資訊處理裝置1020的第一修正實例。第42圖係方塊圖,用以解說依據本修正實例之資訊處理裝置1020的組態。第43圖係流程圖,用以解說依據本修正實例之關鍵字提取方法。依據本修正實例之資訊處理裝置1020的硬體組態係與本發明之第四實施例的硬體組態實質地相同,且其詳細說明將予以省略。
如第42圖中所示,依據本修正實例之資訊處理裝置1020包含關鍵字同步化單元1245,顯示單元1247,通訊單元1249,記憶體單元1251,廣播聲頻資訊接收單元1269,資訊搜尋單元1265,外部顯示裝置連接控制單元1267,參數提取單元1271,及關鍵字提取單元1273。
依據本修正實例之關鍵字同步化單元1245,顯示單元1247,通訊單元1249,記憶體單元1251,資訊搜尋單元1265,及外部顯示裝置連接控制單元1267與該關鍵字 同步化單元1245,顯示單元1247,通訊單元1249,記憶體單元1251,資訊搜尋單元1265,及外部顯示裝置連接控制單元1267具有實質相同的組態,且提供實質相同的功效;因此,將省略其詳細說明。
廣播聲頻資訊接收單元1269自外部顯示裝置1070來獲取接收頻道資訊,該接收頻道資訊係關於該外部顯示裝置1070目前正透過其而接收的廣播頻道。該廣播聲頻資訊接收單元1269可藉由從外部顯示裝置1070來獲取接收頻道資訊,而使廣播聲頻資訊接收單元1269的接收廣播頻道與外部顯示裝置1070的接收廣播頻道同步。
該廣播聲頻資訊接收單元1269根據所獲取之接收頻道資訊,而自廣播站1080直接接收對應於外部顯示裝置1070之接收廣播頻道的廣播電波。此時,該廣播聲頻資訊接收單元1269可直接接收來自廣播站1080所傳輸的廣播電波之中的一段式廣播電波,且自所接收的電波來獲取聲頻資訊。該廣播聲頻資訊接收單元1269可組構以直接接收從廣播站1080所傳輸的全分段式廣播電波。
該廣播聲頻資訊接收單元1269可組構以根據所獲取的接收頻道資訊,而接收由外部顯示裝置1070所接收且自外部顯示裝置1070所傳輸至資訊處理裝置1020的廣播聲頻資訊。
該廣播聲頻資訊接收單元1269將所接收的廣播聲頻資訊輸出至參數提取單元1271。該廣播聲頻資訊接收單元1269可將所接收的廣播聲頻資訊記錄於記憶體單元 1251之中。
參數提取單元1271及關鍵字提取單元1273係依據本修正實例的資訊處理裝置1020之語音辨識單元1233的處理單元。該參數提取單元1271自所產生之音訊資料的各個音框(以適當的時隔)來提取諸如美爾倒頻譜係數(MFCC)及其時間差參數,音訊資料的頻譜,功率線性預測係數,倒譜係數,以及線譜對之特徵參數。
該參數提取單元1271傳輸所提取之特徵參數至關鍵字提取單元1273。該參數提取單元1271可將所提取之特徵參數儲存於稍後描述的記憶體單元1251之中。
該關鍵字提取單元1273根據關鍵字提取資料庫1030及由該參數提取單元1271所產生及所提取的特徵參數,而自廣播聲頻資訊中所包含之音訊資料來提取關鍵字。當關鍵字提取單元1273提取該等關鍵字時,關鍵字提取單元1273可經由通訊單元1249來參照連接至通訊網路1012的關鍵字提取資料庫1030。
典型地,在廣播聲頻資訊中所包含的音訊資料之中,包含複數個關鍵字。該關鍵字提取單元1273自動地提取存在於音訊資料中的所有關鍵字。該關鍵字提取單元1273傳輸所提取之關鍵字至資訊搜尋單元1265。該關鍵字提取單元1273可儲存所提取之關鍵字於記憶體單元1251中。
在上文中,已說明依據本修正實例之資訊處理裝置1020的功能之實例。上述該等組件可使用通用型之元件 或電路來予以建構,或可由專用於個別組件之功能的特殊化硬體所建構。該等組件的全部功能可由CPU或其類似物所執行。因此,硬體組態可依據實施本實施例時之技術水準來加以適當地修正。
依據本修正實例之資訊處理裝置1020可進一步包含依據本發明之第三實施例之資訊處理裝置1020的音訊交談控制單元。該資訊處理裝置1020可進一步包含資料庫記憶體單元,其儲存關鍵字提取資料庫1030的內容。藉由此,該關鍵字提取資料庫1030的內容可儲存於資訊處理裝置1020中所設置的資料庫記憶體單元之中。因此,可縮短資訊處理裝置1020存取該關鍵字提取資料庫1030之所需的時間。因而,可縮短資訊處理裝置1020執行關鍵字提取之所需時間。
(關鍵字提取方法)
接著,將參照第43圖來詳細說明由依據本修正實例之資訊處理裝置1020所執行的關鍵字提取方法之實例。
首先,資訊處理裝置1020之廣播聲頻資訊接收單元1269根據獲取自外部顯示裝置1070之接收頻道資訊,而接收來自外部顯示裝置1070或廣播站1080的廣播聲頻資訊。參數提取單元1271及關鍵字提取單元1273執行語音辨識於音訊資料上,且決定語音辨識結果(步驟S1401)。
接著,關鍵字提取單元1273應用語形分析至該語音 辨識結果,以自該語音辨識結果來提取字元,且將所提取之字元記錄於資訊處理裝置1020的記憶體之上(步驟S1403)。
其次,該關鍵字提取單元1273使用連接至通訊網路1012之關鍵字提取資料庫1030的資訊,或該關鍵字提取資料庫1030之內容來搜尋所提取的字元(步驟S1405)。
隨後,該關鍵字提取單元1273決定所提取的字元是否存在於關鍵字提取資料庫1030之中(步驟S1407)。 當所提取的字元存在於該關鍵字提取資料庫1030之中時,該關鍵字提取單元1273記錄該存在之所提取的字元於記憶體之上,以做為廣播關鍵字資料(步驟S1409)。當所提取的字元並不存在於關鍵字提取資料庫1030之中時,該關鍵字提取單元1273執行稍後所述之步驟S1411的過程。
接著,該關鍵字提取單元1273決定所提取但未發現於關鍵字提取資料庫1030中之該等字元是否存在於記憶體之上(步驟S1411)。當並未發現之該等字元存在於該記憶體之中時,則執行步驟S1405之過程。當並未發現之該等字元亦不存在於該記憶體之中時,則關鍵字提取單元1273將存在於該記憶體之上之廣播關鍵字資料輸出以做為所提取的關鍵字(步驟S1413)。
藉由使用上述之方法,則依據本修正實例之資訊處理裝置1020可自所接收之廣播聲頻資訊來提取關鍵字。
由依據本修正實例之資訊處理裝置1020所執行的關鍵字同步化方法係與依據本發明第三實施例之資訊處理裝置1020所執行的關鍵字同步化方法實質地相同,且其詳細說明將予以省略。
在依據本修正實例的資訊處理裝置1020中,存在於關鍵字提取資料庫1030中之該等字元(關鍵字)係從傳輸自廣播站1080之廣播聲頻資訊來自動地提取。因此,可將所提取之關鍵字顯示至外部顯示裝置1070。藉由使用此一功能,利用資訊處理裝置1020或外部顯示裝置1070來執行諸如聊天之雙向通訊的使用者可利用所提取之該等關鍵字,而做為聊天或類似者之標題。
應由熟習於本項技藝之該等人士所瞭解的是,各式各樣的修正,結合,子結合,及改變可根據設計要求及其他因素而發生,只要它們係在所附錄之申請專利範圍或其等效範圍的範疇之內即可。
例如,在上述該等實施例之中,廣播站1080傳輸地面數位廣播;然而,該廣播站1080可提供有線廣播或網際網路廣播。
在上述該等實施例之中,第38圖顯示其中廣播站1080透過地面數位廣播來提供電視節目之情況。然而,AV內容可由使用者能個人地捕獲及再生影像之攝錄像機所提供。
在上述該等實施例之中,兩個資訊處理裝置執行音訊聊天。然而,在依據本實施例之音訊聊天系統中,該音訊 聊天可執行於複數個資訊處理裝置之中,且關鍵字同步化可執行於該等個別的資訊處理裝置之間。
如上述,依據本發明之實施例,可使得與音訊聊天期間之交談內容相關連的關鍵字自動地且有效率地同步;此外,亦可使得包含於廣播資訊中的關鍵字自動地且有效率地同步。
10,1010‧‧‧音訊聊天系統
12,1012‧‧‧通訊網路
14‧‧‧搜尋伺服器
1020,1020A,1020B,20,20A,20B‧‧‧資訊處理裝置
201,1201‧‧‧中央處理單元(CPU)
203,1203‧‧‧唯讀記憶體(ROM)
205,1205‧‧‧隨機存取記憶體(RAM)
207,1207‧‧‧主匯流排
209,1209‧‧‧橋接器
211,1211‧‧‧外部匯流排
213,1213‧‧‧介面
215,1215‧‧‧輸入裝置
217,1217‧‧‧輸出裝置
219,1219‧‧‧儲存裝置
221,1221‧‧‧驅動器
233,1233‧‧‧通訊裝置
251,1231‧‧‧音訊輸入單元
253,1233,1163‧‧‧語音辨識單元
255,273‧‧‧關鍵字偵測單元
257‧‧‧關鍵字管理單元
259,181,1239‧‧‧音訊交談控制單元
261,709,1247,1246,1709‧‧‧顯示單元
263,1241‧‧‧音訊輸出單元
265,1249‧‧‧通訊單元
267,1251‧‧‧記憶體單元
269,183‧‧‧辨識字元字典產生單元
301‧‧‧AD轉換單元
303‧‧‧特徵參數提取單元
305‧‧‧匹配單元
307‧‧‧共用字典記憶體單元
309‧‧‧辨識資訊庫
401‧‧‧辨識字元字典記憶體單元
403‧‧‧聲頻模型記憶體單元
405‧‧‧語言模型記憶體單元
407‧‧‧音素列表
409‧‧‧假名-音素轉換規則
112‧‧‧語言模型
501‧‧‧搜尋關鍵字列表獲取單元
503‧‧‧關鍵字選擇單元
505‧‧‧子關鍵字獲取單元
507‧‧‧關鍵字資訊添加單元
18‧‧‧伺服器
70,1070‧‧‧外部顯示裝置
80,1016,1080‧‧‧廣播站
19,1018‧‧‧家庭網路
11‧‧‧關鍵字偵測系統
271,1261‧‧‧廣播本文資訊接收單元
275,1267‧‧‧外部顯示裝置連接控制單元
701,1701‧‧‧廣播接收單元
703,1703‧‧‧連接埠控制單元
705,1705‧‧‧廣播資訊顯示控制單元
707,1707‧‧‧關鍵字資訊顯示控制單元
751,1751‧‧‧資訊顯示螢幕
753,1753‧‧‧影像顯示區
755,1755‧‧‧關鍵字資訊顯示區
277,1269‧‧‧廣播聲頻資訊接收單元
1030‧‧‧關鍵字提取資料庫
1040‧‧‧搜尋引擎
1014‧‧‧可卸取式記錄媒體
1235,1271‧‧‧參數提取單元
1237,1263,1273‧‧‧關鍵字提取單元
1253‧‧‧搜尋結果儲存單元
1243,1265‧‧‧資訊搜尋單元
1245‧‧‧關鍵字同步化單元
1501,1503,1509,1603,1605,1607,1505,1507,1601‧‧‧欄
1050‧‧‧搜尋結果顯示螢幕
1255‧‧‧參照歷史記憶體單元
第1圖係說明圖式,顯示依據本發明之第一實施例的音訊聊天系統;第2圖係方塊圖,用以解說依據第一實施例之資訊處理裝置的硬體組態;第3圖係方塊圖,用以解說依據第一實施例之資訊處理裝置的組態;第4圖係方塊圖,用以解說依據第一實施例之語音辨識單元的組態;第5圖係說明圖式,顯示依據第一實施例之辨識資料庫;第6圖係說明圖式,顯示依據第一實施例之固定字元字典的實例;第7圖係說明圖式,顯示依據第一實施例之固定字元字典的另一實例;第8圖係說明圖式,顯示依據第一實施例之可變字元字典的實例; 第9圖係說明圖式,顯示依據第一實施例之類目表的實例;第10圖係說明圖式,顯示依據第一實施例之類目表的另一實例;第11圖係說明圖式,顯示依據第一實施例之語言模型的實例;第12圖係說明圖式,顯示依據第一實施例之音素列表的實例;第13圖係說明圖式,顯示依據第一實施例之假名(Kana)音素轉換規則;第14圖係流程圖,用以解說依據第一實施例之語音辨識方法的實例;第15圖係說明圖式,顯示依據第一實施例之用於語言評分之計算公式的實例;第16圖係說明圖式,顯示依據第一實施例之共用字典的修正實例;第17圖係說明圖式,顯示依據第一實施例之固定字元字典的修正實例;第18圖係說明圖式,顯示依據第一實施例之類目表的修正實例;第19圖係方塊圖,用以解說依據第一實施例之辨識字元字典產生單元;第20圖係說明圖式,顯示依據第一實施例之辨識字元字典產生/更新方法; 第21A圖係說明圖式,顯示依據第一實施例之音訊聊天系統的組態;第21B圖係說明圖式,顯示依據第一實施例之音訊聊天系統的修正實例;第22圖係說明圖式,顯示依據本發明之第二實施例之關鍵字偵測系統的組態;第23圖係方塊圖,用以解說依據第二實施例之資訊處理裝置的組態;第24圖係方塊圖,用以解說依據第二實施例之外部顯示裝置的組態;第25圖係說明圖式,顯示依據第二實施例之外部顯示裝置的資訊顯示螢幕;第76圖係流程圖,用以解說依據第二實施例之關鍵字偵測方法;第27圖係方塊圖,用以解說依據第二實施例之資訊處理裝置之第一修正實例的組態;第28圖係流程圖,用以解說依據該修正實例之關鍵字偵測方法;第29圖係說明圖式,顯示依據本發明之第三實施例的音訊聊天系統;第30圖係方塊圖,用以解說依據第三實施例之資訊處理裝置的硬體組態;第31圖係方塊圖,用以解說依據第三實施例之資訊處理裝置的組態; 第32圖係流程圖,用以解說由依據第三實施例之資訊處理裝置所使用之語音辨識方法及關鍵字偵測方法的實例;第33圖係流程圖,用以解說依據第三實施例之音訊聊天系統中的關鍵字同步化方法;第34圖係說明圖式,顯示由第三實施例之資訊處理裝置所顯示之搜尋資訊的實例;第35圖係說明圖式,顯示依據第三實施例之搜尋資訊的參照歷史資料;第36A圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法;第36B圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法之第一修正實例;第36C圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法之第二修正實例;第36D圖係簡略方塊圖,用以解說依據第三實施例之資訊處理裝置的語音辨識方法之第三修正實例;第37圖係說明圖式,顯示依據本發明之第四實施例的關鍵字提取系統;第38圖係方塊圖,用以解說依據第四實施例之資訊處理裝置的組態;第39圖係方塊圖,用以解說依據第四實施例之外部顯示裝置的組態;第40圖係說明圖式,顯示依據第四實施例之外部顯 示裝置的資訊顯示螢幕;第41圖係流程圖,用以解說依據第四實施例之關鍵字提取方法;第42圖係方塊圖,用以解說依據第四實施例之資訊處理裝置之第一修正實例的組態;以及第43圖係流程圖,用以解說依據該第一修正實例之關鍵字提取方法。
10‧‧‧音訊聊天系統
12‧‧‧通訊網路
14‧‧‧搜尋伺服器
20A‧‧‧資訊處理裝置
20B‧‧‧資訊處理裝置

Claims (49)

  1. 一種音訊聊天系統,包含:複數個資訊處理裝置,其當執行語音辨識時執行一音訊聊天;以及一搜尋伺服器,係經由一通訊網路而連接至該複數個資訊處理裝置,其中該搜尋伺服器揭示一搜尋關鍵字列表至該等資訊處理裝置之至少一資訊處理裝置,該搜尋關鍵字列表含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊,該至少一資訊處理裝置包含:一辨識字元字典產生單元,其自該搜尋伺服器獲取該搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供該語音辨識中使用;一語音辨識單元,其藉由參照含有該辨識字元字典之一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,其與至少一資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測單元,其自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  2. 一種資訊處理裝置,其自一搜尋伺服器獲取一搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天, 該搜尋關鍵字列表含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊,該資訊處理裝置包含:一辨識字元字典產生單元,其自該搜尋伺服器獲取該搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一語音辨識單元,其藉由參照含有該辨識字元字典之一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,其與該其他資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測單元,其自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  3. 如申請專利範圍第2項之資訊處理裝置,其中該辨識字元字典包含:一固定字元字典,其中係預先暫存預定的字元;以及一可變字元字典,其中係視需要為基礎而更新暫存的字元,且其中該辨識字元字典產生單元自該搜尋關鍵字列表選擇將被暫存於該可變字元字典中之字元,以產生該可變字元字典,該搜尋關鍵字列表含有該搜尋伺服器之更高分級 的搜尋關鍵字。
  4. 如申請專利範圍第3項之資訊處理裝置,其中該辨識字元字典產生單元根據由該關鍵字偵測單元所偵測之該等關鍵字的歷史資訊,決定該資訊處理裝置之使用者的偏好,且根據該偏好自該搜尋關鍵字列表選擇該等字元。
  5. 如申請專利範圍第3項之資訊處理裝置,其中該辨識字元字典產生單元使用該搜尋伺服器搜尋自該搜尋關鍵字列表所選擇之該等字元,且自該搜尋所獲得的搜尋結果獲取與該等字元相關連之一子關鍵字,藉以以與該等字元相互關連的方式將該子關鍵字暫存於該可變字元字典之中。
  6. 如申請專利範圍第3項之資訊處理裝置,其中該辨識字元字典產生單元根據由該搜尋伺服器正在搜尋之該等字元的頻率所決定之搜尋分級資訊,而施加一權重至選自該搜尋關鍵字列表的該等個別字元。
  7. 如申請專利範圍第6項之資訊處理裝置,其中該辨識字元字典產生單元根據由該關鍵字偵測單元所偵測之該等關鍵字的歷史資訊,計算該等關鍵字的頻率,及改變暫存於該可變字元字典中且對應於該等關鍵字之該等字元的權重。
  8. 一種資訊處理裝置,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自一辨識字元字典產生裝置獲取具有權重 資訊被施加至該處之該等字元,且與其他資訊處理裝置執行一音訊聊天,該辨識字元字典產生裝置係用以施加權重資訊至該等所選擇之字元以供語音辨識中使用,該資訊處理裝置包含:一語音辨識單元,其藉由參照含有自該辨識字元字典產生裝置所獲取之該等字元的一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制單元,其與該其他資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測單元,其自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  9. 一種語音辨識方法,係使用於一資訊處理裝置中,該資訊處理裝置自一搜尋伺服器獲取一搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天,該搜尋關鍵字列表含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊,該方法包含以下步驟:自該搜尋伺服器獲取該搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;在該音訊聊天之期間自交談的內容獲得音訊資料; 根據該音訊資料的聲頻特徵來分析該音訊資料,且產生對應於該交談的內容之字元順序候選;以及藉由參照含有該辨識字元字典之用於語音辨識中的一辨識資料庫,根據建構該字元順序的該等字元之間的語文序連(linguistic concatenation)特徵,分析該產生之字元順序候選,藉以選擇一最可行的字元順序,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  10. 一種語音辨識方法,係使用於一資訊處理裝置中,該資訊處理裝置自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自一辨識字元字典產生裝置獲取具有權重資訊被施加至該處之該等字元,且與其他資訊處理裝置執行一音訊聊天,該辨識字元字典產生裝置係施加權重資訊至該等選擇之字元以供語音辨識中使用,該方法包含以下步驟:自該辨識字元字典產生裝置獲取具有該權重資訊被施加至該處的該等字元,且將該等字元儲存於一辨識資料庫中,以供語音辨識中使用;在該音訊聊天之期間自交談的內容來獲得音訊資料;根據該音訊資料的聲頻特徵來分析該音訊資料,且產生對應於該交談的內容之字元順序候選;以及藉由參照該辨識資料庫,根據建構該字元順序的該等 字元之間的語文序連特徵,分析該產生之字元順序候選,藉以選擇一最可行的字元順序,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  11. 一種儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該資訊處理裝置自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,且與其他資訊處理裝置執行一音訊聊天,該程式允許電腦執行:一辨識字元字典產生功能,其自該搜尋伺服器獲取該搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一語音辨識功能,其藉由參照含有該辨識字元字典之一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制功能,其與該其他資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測功能,其自該語音辨識之結果偵測與在該音訊資料期間之該交談的內容相關連的關鍵字,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  12. 一種儲存用以控制一資訊處理裝置的電腦程式的 非暫態電腦儲存媒體,該資訊處理裝置自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,自該搜尋關鍵字列表選擇字元,自一辨識字元字典產生裝置獲取具有權重資訊被施加至該處之該等字元,且與其他資訊處理裝置執行一音訊聊天,該辨識字元字典產生裝置係施加權重資訊至該等選擇之字元以供語音辨識中使用,該程式允許電腦執行:一語音辨識功能,其藉由參照含有自該辨識字元字典產生裝置所獲取之該等字元的一辨識資料庫,在該音訊聊天期間自交談之對話所獲得的音訊資料上,執行語音辨識;一音訊交談控制功能,其與該其他資訊處理裝置執行該音訊資料的通訊控制;以及一關鍵字偵測功能,其自該語音辨識之結果偵測與在該音訊聊天期間之該交談的內容相關連的關鍵字,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  13. 一種資訊處理裝置,包含:一辨識字元字典產生單元,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋及與該搜尋關鍵字列表相關的分級資訊之搜尋關鍵字的搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語言辨識中使用; 一廣播本文資訊接收單元,其接收來自一廣播站所傳輸之廣播本文資訊;一關鍵字偵測單元,其藉由參照該辨識字元字典而自該廣播本文資訊偵測預定的關鍵字;以及一外部顯示裝置連接控制單元,其執行與一外部顯示裝置的連接控制,及輸出自該廣播本文資訊所偵測之該等關鍵字至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  14. 如申請專利範圍第13項之資訊處理裝置,其中該廣播本文資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置來獲取接收頻道資訊及該廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播本文資訊對應於該廣播頻道。
  15. 如申請專利範圍第13項之資訊處理裝置,其中該廣播本文資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊,且自該廣播站獲取該廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播本文資訊對應於該廣播頻道。
  16. 如申請專利範圍第13項之資訊處理裝置,其中該資訊處理裝置儲存該等關鍵字之一參照歷史於該外部顯示裝置中,以及 其中該外部顯示裝置連接控制單元將該外部顯示裝置所選擇之一關鍵字通知該搜尋伺服器。
  17. 一種資訊處理裝置,包含:一辨識字元字典產生單元,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋及與該搜尋關鍵字列表相關的分級資訊之搜尋關鍵字的搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播聲頻資訊接收單元,其接收來自一廣播站所傳輸之廣播聲頻資訊;一語音辨識單元,其藉由參照含有該辨識字元字典之一辨識資料庫,而在該廣播聲頻資訊上,執行語音辨識;一關鍵字偵測單元,其自該廣播聲頻資訊上之該語音辨識的結果偵測預定的關鍵字;以及一外部顯示裝置連接控制單元,其執行與一外部顯示裝置的連接控制,及輸出自該廣播聲頻資訊所偵測之該等關鍵字至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  18. 如申請專利範圍第17項之資訊處理裝置,其中該廣播聲頻資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊及該廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播聲頻資訊對應於該廣播頻道。
  19. 如申請專利範圍第17項之資訊處理裝置,其中該廣播聲頻資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊,且自該廣播站獲取該廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而及該廣播聲頻資訊對應於該廣播頻道。
  20. 如申請專利範圍第17項之資訊處理裝置,其中該資訊處理裝置儲存該等關鍵字之一參照歷史於該外部顯示裝置中,以及其中該外部顯示裝置連接控制單元將該外部顯示裝置所選擇之一關鍵字通知搜尋引擎。
  21. 一種關鍵字偵測方法,包含以下步驟:自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;接收來自一廣播站所傳輸之廣播本文資訊;藉由參照該辨識字元字典而自該廣播本文資訊偵測預定的關鍵字;以及執行與一外部顯示裝置的連接控制,及輸出自該廣播本文資訊所偵測之該等關鍵字至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  22. 一種關鍵字偵測方法,包含以下步驟:自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;接收來自一廣播站所傳輸之廣播聲頻資訊;藉由參照含有該辨識字元字典之一辨識資料庫,而在該廣播聲頻資訊上,執行語音辨識;自該廣播聲頻資訊上之該語音辨識的結果偵測預定的關鍵字;以及執行與一外部顯示裝置的連接控制,及輸出自該廣播聲頻資訊所偵測之該等關鍵字至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  23. 一種儲存控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一辨識字元字典產生功能,其自一搜尋伺服器來獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播本文資訊接收功能,其接收來自一廣播站所傳輸之廣播本文資訊; 一關鍵字偵測功能,其藉由參照該辨識字元字典而自該廣播本文資訊偵測預定的關鍵字;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,及輸出自該廣播本文資訊所偵測之該等關鍵字至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  24. 一種儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一辨識字元字典產生功能,其自一搜尋伺服器獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,以產生一辨識字元字典,該辨識字元字典含有字元以供語音辨識中使用;一廣播聲頻資訊接收功能,其接收來自一廣播站所傳輸之廣播聲頻資訊;一語音辨識功能,其藉由參照含有該辨識字元字典之一辨識資料庫而在該廣播聲頻資訊上,執行語音辨識;一關鍵字偵測功能,其自該廣播聲頻資訊上之該語音辨識的結果偵測預定的關鍵字;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,及輸出自該廣播聲頻資訊所偵測之該等關鍵字至該外部顯示裝置, 其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  25. 一種音訊聊天系統,包含:複數個資訊處理裝置,其執行一音訊聊天;一關鍵字提取資料庫,其當在該音訊聊天期間自交談的對話提取關鍵字時,由該等資訊處理裝置所參照;以及一搜尋引擎,其當使用所提取之該等關鍵字搜尋該等關鍵字及與該等關鍵字相關連的物件時,由該等資訊處理裝置所使用,該搜尋引擎對至少一資訊處理設備揭示含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表,其中至少一資訊處理裝置包含:一參數提取單元,其自音訊資料提取一參數,該音訊資料係產生自該對話,該參數表示該音訊資料的特徵;一關鍵字提取單元,其根據該參數及該關鍵字提取資料庫辨識該產生的音訊資料,且自該音訊資料提取該等關鍵字;一資訊搜尋單元,其使用該搜尋引擎搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件;一顯示單元,其顯示與該等關鍵字之該搜尋結果的位址資訊相互關連之一關鍵字,及與該等關鍵字相關連的該等物件之位址資訊相互關連的一物件;以及 一關鍵字同步化單元,其傳輸該等提取之關鍵字至其係該聊天之配對物的資訊處理裝置,且執行與該配對的資訊處理裝置之關鍵字同步化,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  26. 一種資訊處理裝置,其執行與其他資訊處理裝置之音訊聊天,該資訊處理裝置包含:一參數提取單元,其音訊資料提取一參數,該音訊資料係產生自音訊聊天期間之交談的對話,且該參數表示該音訊資料的特徵;一關鍵字提取單元,其根據該參數及一關鍵字提取資料庫辨識所產生的音訊資料,且自該音訊資料提取關鍵字;一資訊搜尋單元,其使用一搜尋引擎來搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋單元從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一搜尋資訊累積單元,其以與該等關鍵字之該搜尋結果的位址資訊及該等物件的位址資訊相互關連之方式,而分別累積該等關鍵字及該等物件,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網 路上可用的資訊。
  27. 如申請專利範圍第26項之資訊處理裝置,進一步包含一關鍵字同步化單元,其傳輸該等提取之關鍵字至其係該聊天之配對物的資訊處理裝置,且執行與該配對的資訊處理裝置之關鍵字同步化。
  28. 如申請專利範圍第26項之資訊處理裝置,進一步包含一資料庫記憶體單元,其儲存該關鍵字提取資料庫。
  29. 如申請專利範圍第26項之資訊處理裝置,其中該搜尋引擎係設置於該資訊處理裝置之內。
  30. 如申請專利範圍第26項之資訊處理裝置,進一步包含一顯示單元,其顯示與該等關鍵字之該搜尋結果的位址資訊相互關連之一關鍵字,及與該等關鍵字相關連的該等物件之位址資訊相互關連的一物件。
  31. 如申請專利範圍第26項之資訊處理裝置,進一步包含一參照歷史記憶體單元,其儲存該等關鍵字之一參照歷史。
  32. 如申請專利範圍第31項之資訊處理裝置,其中該參照歷史記憶體單元以與指定於個別之聊天及該聊天之配對物的識別號相互關連之方式,而儲存該等參照的關鍵字。
  33. 如申請專利範圍第31項之資訊處理裝置,其中該關鍵字提取單元在一優先的基礎上,提取安置在該參照歷史之更高分級處的一關鍵字。
  34. 如申請專利範圍第26項之資訊處理裝置,其中該關鍵字提取單元在一優先的基礎上,提取該搜尋引擎之一更高分級的搜尋關鍵字。
  35. 一種資訊處理裝置,其執行與其他資訊處理裝置之音訊聊天,至少一資訊處理裝置包含:一參數提取單元,其自音訊資料提取一參數,該音訊資料係產生自該音訊聊天期間之交談的對話,該參數表示該音訊資料的特徵;一關鍵字提取單元,其根據該參數及一關鍵字提取資料庫辨識所產生的音訊資料,且自該音訊資料提取關鍵字;一資訊搜尋單元,其使用一搜尋引擎搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋單元從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一搜尋資訊累積單元,其以與該等關鍵字之該搜尋結果的位址資訊及該等物件的位址資訊相互關連之方式,而分別累積該等關鍵字及該等物件,其中該資訊處理裝置包含一關鍵字同步化單元,其接收來自該至少一資訊處理裝置所傳輸的該等關鍵字,且執行與對應之資訊處理裝置的關鍵字同步化,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網 路上可用的資訊。
  36. 一儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一參數提取功能,其自音訊資料提取一參數,該音訊資料係產生自音訊聊天期間之交談的對話,該參數表示該音訊資料的特徵;一關鍵字提取功能,其根據該參數及一關鍵字提取資料庫辨識所產生的音訊資料,且自該音訊資料提取關鍵字;一資訊搜尋功能,其使用一搜尋引擎搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋功能從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一搜尋資訊儲存功能,其以與該等關鍵字之該搜尋結果的位址資訊及該等物件的位址資訊相互關連之方式,而分別儲存該等關鍵字及該等物件,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  37. 一種儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一關鍵字同步化功能,其接收來自至少一資訊處理裝置所傳輸的關鍵字,且執行與對應之資訊處理裝置的關鍵 字同步化,其中該等關鍵字係從使用者的語音參考由搜尋引擎所提供的關鍵字列表及相關的分級資訊所獲取,該搜尋引擎代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  38. 一種資訊處理裝置,包含:一廣播本文資訊接收單元,其接收來自一廣播站所傳輸之廣播本文資訊;一關鍵字提取單元,其根據一關鍵字提取資料庫而自該廣播本文資訊提取關鍵字;一資訊搜尋單元,其使用一搜尋引擎搜尋該等提取之關鍵字,且獲取該等關鍵字的搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋單元從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一外部顯示裝置連接控制單元,其以執行與一外部顯示裝置的連接控制,且輸出該等關鍵字、該等關鍵字之一搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  39. 如申請專利範圍第38項之資訊處理裝置,其中該廣播本文資訊接收單元自連接至該資訊處理裝置之該外 部顯示裝置獲取接收頻道資訊及該廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而及該廣播本文資訊對應於該廣播頻道。
  40. 如申請專利範圍第38項之資訊處理裝置,其中該廣播本文資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊,且自該廣播站獲取該廣播本文資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播本文資訊對應於該廣播頻道。
  41. 如申請專利範圍第38項之資訊處理裝置,進一步包含一參照歷史記憶體單元,該參照歷史記憶體單元儲存該等關鍵字之一參照歷史於該外部顯示裝置中,其中該外部顯示裝置連接控制單元將該外部顯示裝置所選擇之一關鍵字通知該搜尋引擎。
  42. 如申請專利範圍第38項之資訊處理裝置,進一步包含一關鍵字同步化單元,該關鍵字同步化單元傳輸該等提取之關鍵字到至少一資訊處理裝置,且執行與該至少一資訊處理裝置之關鍵字同步化。
  43. 一種資訊處理裝置,包含:一廣播聲頻資訊接收單元,其接收來自一廣播站所傳輸之廣播聲頻資訊;一參數提取單元,其自該廣播聲頻資訊中所包含的音訊資料來提取一參數,該參數表示該音訊資料的特徵;一關鍵字提取單元,其根據該參數及一關鍵字提取資 料庫來辨識該音訊資料,且自該音訊資料提取關鍵字;一資訊搜尋單元,其使用一搜尋引擎來搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋單元從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一外部顯示裝置連接控制單元,其執行與一外部顯示裝置的連接控制,且輸出該等關鍵字、該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
  44. 如申請專利範圍第43項之資訊處理裝置,其中該廣播聲頻資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊及該廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播聲頻資訊對應於該廣播頻道。
  45. 如申請專利範圍第43項之資訊處理裝置,其中該廣播聲頻資訊接收單元自連接至該資訊處理裝置之該外部顯示裝置獲取接收頻道資訊,且自該廣播站獲取該廣播聲頻資訊,該接收頻道資訊關於該外部顯示裝置正透過其接收之一廣播頻道,而該廣播聲頻資訊對應於該廣播頻道。
  46. 如申請專利範圍第43項之資訊處理裝置,進一 步包含一參照歷史記憶體單元,該參照歷史記憶體單元儲存該等關鍵字之一參照歷史於該外部顯示裝置中,其中該外部顯示裝置連接控制單元將該外部顯示裝置所選擇之一關鍵字通知該搜尋引擎。
  47. 如申請專利範圍第43項之資訊處理裝置,進一步包含一關鍵字同步化單元,該關鍵字同步化單元傳輸該等提取之關鍵字到至少一資訊處理裝置,且執行與該至少一資訊處理裝置之關鍵字同步化。
  48. 一種儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一廣播本文資訊接收能,其接收來自一廣播站廣播之廣播本文資訊;一關鍵字提取功能,其根據一關鍵字提取資料庫而自該廣播本文資訊提取關鍵字;一資訊搜尋功能,其使用一搜尋引擎搜尋所提取之關鍵字,及獲取與該等關鍵字相關連的物件,該資訊搜尋功能從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,且輸出該等關鍵字、該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網 路上可用的資訊。
  49. 一種儲存用以控制一資訊處理裝置的電腦程式的非暫態電腦儲存媒體,該程式使電腦實行:一廣播聲頻資訊接收功能,其接收來自一廣播站所傳輸之廣播聲頻資訊;一參數提取功能,其自該廣播聲頻資訊中所包含的音訊資料來提取一參數,該參數表示該音訊資料的特徵;一關鍵字提取功能,其根據該參數及一關鍵字提取資料庫辨識該音訊資料,且自該音訊資料提取關鍵字;一資訊搜尋功能,其使用一搜尋引擎搜尋該等提取之關鍵字,且獲取該等關鍵字之一搜尋結果及與該等關鍵字相關連的物件,該資訊搜尋功能從該搜尋引擎獲取含有由該搜尋伺服器所搜尋的搜尋關鍵字及與該搜尋關鍵字列表相關的分級資訊之一搜尋關鍵字列表;以及一外部顯示裝置連接控制功能,其執行與一外部顯示裝置的連接控制,且輸出該等關鍵字、該等關鍵字之搜尋結果,及與該等關鍵字相關連的物件至該外部顯示裝置,其中該搜尋伺服器代表一網站,其提供關鍵字搜尋服務及字典搜尋服務,使得使用者使用該搜尋伺服器搜尋網路上可用的資訊。
TW097113830A 2007-04-16 2008-04-16 音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體 TWI506982B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007107319 2007-04-16
JP2007107324 2007-04-16
JP2007325275A JP5042799B2 (ja) 2007-04-16 2007-12-17 音声チャットシステム、情報処理装置およびプログラム
JP2007325274A JP4987682B2 (ja) 2007-04-16 2007-12-17 音声チャットシステム、情報処理装置、音声認識方法およびプログラム

Publications (2)

Publication Number Publication Date
TW200922223A TW200922223A (en) 2009-05-16
TWI506982B true TWI506982B (zh) 2015-11-01

Family

ID=40383002

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097113830A TWI506982B (zh) 2007-04-16 2008-04-16 音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體

Country Status (2)

Country Link
US (1) US8620658B2 (zh)
TW (1) TWI506982B (zh)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080075237A1 (en) * 2006-09-11 2008-03-27 Agere Systems, Inc. Speech recognition based data recovery system for use with a telephonic device
WO2008069139A1 (ja) * 2006-11-30 2008-06-12 National Institute Of Advanced Industrial Science And Technology 音声認識システム及び音声認識システム用プログラム
JP5454469B2 (ja) * 2008-05-09 2014-03-26 富士通株式会社 音声認識辞書作成支援装置,処理プログラム,および処理方法
KR101056511B1 (ko) 2008-05-28 2011-08-11 (주)파워보이스 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템
US20090319504A1 (en) * 2008-06-18 2009-12-24 Motorola, Inc. Method and Apparatus for Providing Enhanced Search Results to a User of a Communication Device
US8423363B2 (en) * 2009-01-13 2013-04-16 CRIM (Centre de Recherche Informatique de Montréal) Identifying keyword occurrences in audio data
CN101923856B (zh) * 2009-06-12 2012-06-06 华为技术有限公司 语音识别训练处理、控制方法及装置
TWI399739B (zh) 2009-11-13 2013-06-21 Ind Tech Res Inst 語音留言與傳達之系統與方法
JP5156047B2 (ja) * 2010-03-31 2013-03-06 株式会社東芝 キーワード提示装置、方法及びプログラム
US9356790B2 (en) 2010-05-04 2016-05-31 Qwest Communications International Inc. Multi-user integrated task list
US9559869B2 (en) 2010-05-04 2017-01-31 Qwest Communications International Inc. Video call handling
US9501802B2 (en) * 2010-05-04 2016-11-22 Qwest Communications International Inc. Conversation capture
TWI418986B (zh) * 2010-07-06 2013-12-11 Inventec Corp 手持式電子裝置的響鈴調整方法及應用其之手持式電子裝置
US9015043B2 (en) * 2010-10-01 2015-04-21 Google Inc. Choosing recognized text from a background environment
US20120191454A1 (en) * 2011-01-26 2012-07-26 TrackThings LLC Method and Apparatus for Obtaining Statistical Data from a Conversation
US8650031B1 (en) * 2011-07-31 2014-02-11 Nuance Communications, Inc. Accuracy improvement of spoken queries transcription using co-occurrence information
JP5799733B2 (ja) * 2011-10-12 2015-10-28 富士通株式会社 認識装置、認識プログラムおよび認識方法
US9324323B1 (en) * 2012-01-13 2016-04-26 Google Inc. Speech recognition using topic-specific language models
US8775177B1 (en) 2012-03-08 2014-07-08 Google Inc. Speech recognition process
CN103428355B (zh) * 2012-05-24 2016-08-10 上海博泰悦臻电子设备制造有限公司 基于移动终端的语音控制装置及其语音控制方法
US10373508B2 (en) * 2012-06-27 2019-08-06 Intel Corporation Devices, systems, and methods for enriching communications
ES2566569T3 (es) * 2012-06-28 2016-04-13 Jajah Ltd Sistema y método para realizar consultas textuales en comunicaciones de voz
US9786281B1 (en) * 2012-08-02 2017-10-10 Amazon Technologies, Inc. Household agent learning
JP5706384B2 (ja) * 2012-09-24 2015-04-22 株式会社東芝 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
US10229676B2 (en) * 2012-10-05 2019-03-12 Avaya Inc. Phrase spotting systems and methods
US9558275B2 (en) * 2012-12-13 2017-01-31 Microsoft Technology Licensing, Llc Action broker
JP6028658B2 (ja) * 2013-03-28 2016-11-16 富士通株式会社 端末装置、変換文字候補同期方法及び変換文字候補同期プログラム
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
US10885918B2 (en) * 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
KR101524379B1 (ko) * 2013-12-27 2015-06-04 인하대학교 산학협력단 주문형 비디오에서 인터랙티브 서비스를 위한 캡션 교체 서비스 시스템 및 그 방법
US10516636B2 (en) * 2014-01-01 2019-12-24 SlamAd.com, Inc. Real-time messaging platform with enhanced privacy
US9601108B2 (en) 2014-01-17 2017-03-21 Microsoft Technology Licensing, Llc Incorporating an exogenous large-vocabulary model into rule-based speech recognition
US10749989B2 (en) 2014-04-01 2020-08-18 Microsoft Technology Licensing Llc Hybrid client/server architecture for parallel processing
US9697828B1 (en) * 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
WO2016002251A1 (ja) * 2014-06-30 2016-01-07 クラリオン株式会社 情報処理システム、及び、車載装置
US10387717B2 (en) 2014-07-02 2019-08-20 Huawei Technologies Co., Ltd. Information transmission method and transmission apparatus
KR102247533B1 (ko) * 2014-07-30 2021-05-03 삼성전자주식회사 음성 인식 장치 및 그 제어 방법
US10515151B2 (en) * 2014-08-18 2019-12-24 Nuance Communications, Inc. Concept identification and capture
US9959863B2 (en) 2014-09-08 2018-05-01 Qualcomm Incorporated Keyword detection using speaker-independent keyword models for user-designated keywords
US10157178B2 (en) * 2015-02-06 2018-12-18 International Business Machines Corporation Identifying categories within textual data
EP3324305A4 (en) * 2015-07-13 2018-12-05 Teijin Limited Information processing apparatus, information processing method, and computer program
GB201519032D0 (en) * 2015-10-28 2015-12-09 Drazin Jonathan A Market research system
CN108701459A (zh) * 2015-12-01 2018-10-23 纽昂斯通讯公司 将来自各种语音服务的结果表示为统一概念知识库
JP6526608B2 (ja) * 2016-09-06 2019-06-05 株式会社東芝 辞書更新装置およびプログラム
CN106385512B (zh) * 2016-10-28 2019-08-23 努比亚技术有限公司 一种语音信息接收装置和方法
JP6585112B2 (ja) * 2017-03-17 2019-10-02 株式会社東芝 音声キーワード検出装置および音声キーワード検出方法
WO2018207485A1 (ja) * 2017-05-11 2018-11-15 株式会社村田製作所 情報処理システム、情報処理装置、コンピュータプログラム、及び辞書データベースの更新方法
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US11062710B2 (en) * 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US20200273447A1 (en) * 2017-10-24 2020-08-27 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for key phrase spotting
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
CN110189750B (zh) * 2018-02-23 2022-11-15 株式会社东芝 词语检测系统、词语检测方法以及记录介质
CN109033386B (zh) * 2018-07-27 2020-04-10 北京字节跳动网络技术有限公司 搜索排序方法、装置、计算机设备和存储介质
CN110798393B (zh) * 2018-08-02 2021-10-26 腾讯科技(深圳)有限公司 声纹气泡的展示方法及使用声纹气泡的终端
CN109167884A (zh) * 2018-10-31 2019-01-08 维沃移动通信有限公司 一种基于用户语音的服务方法和装置
KR20200084413A (ko) * 2018-12-21 2020-07-13 삼성전자주식회사 컴퓨팅 장치 및 그 동작 방법
CN111161730B (zh) * 2019-12-27 2022-10-04 中国联合网络通信集团有限公司 语音指令匹配方法、装置、设备及存储介质
TWI767197B (zh) * 2020-03-10 2022-06-11 中華電信股份有限公司 提供語音互動教學的方法及伺服器
US11501067B1 (en) * 2020-04-23 2022-11-15 Wells Fargo Bank, N.A. Systems and methods for screening data instances based on a target text of a target corpus
JP7341111B2 (ja) * 2020-09-30 2023-09-08 本田技研工業株式会社 会話支援装置、会話支援システム、会話支援方法およびプログラム
US20220284905A1 (en) * 2021-03-05 2022-09-08 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
CN113284509B (zh) * 2021-05-06 2024-01-16 北京百度网讯科技有限公司 语音标注的正确率获取方法、装置和电子设备
CN114661882A (zh) * 2022-03-30 2022-06-24 浪潮通用软件有限公司 一种机器人聊天管理方法、设备及介质
CN115414666B (zh) * 2022-11-03 2023-03-03 深圳市人马互动科技有限公司 基于成语接龙游戏的语音数据处理方法及相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5732393A (en) * 1995-02-07 1998-03-24 Toyota Jidosha Kabushiki Kaisha Voice recognition device using linear predictive coding
US20010023192A1 (en) * 2000-03-15 2001-09-20 Hiroshi Hagane Information search system using radio partable terminal
US20010041977A1 (en) * 2000-01-25 2001-11-15 Seiichi Aoyagi Information processing apparatus, information processing method, and storage medium
TW491991B (en) * 1999-08-31 2002-06-21 Andersen Consulting Llp System, method, and article of manufacture for a voice recognition system for navigating on the internet utilizing audible information
US20050171782A1 (en) * 1999-09-03 2005-08-04 Sony Corporation Communication apparatus, communication method and program storage medium
TW200609775A (en) * 2004-09-01 2006-03-16 Creative Tech Ltd A search system

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3526101B2 (ja) 1995-03-14 2004-05-10 株式会社リコー 音声認識装置
US5842163A (en) * 1995-06-21 1998-11-24 Sri International Method and apparatus for computing likelihood and hypothesizing keyword appearance in speech
US6219045B1 (en) * 1995-11-13 2001-04-17 Worlds, Inc. Scalable virtual world chat client-server system
JP3414568B2 (ja) 1995-12-28 2003-06-09 シャープ株式会社 文字放送受信装置
US6275792B1 (en) * 1999-05-05 2001-08-14 International Business Machines Corp. Method and system for generating a minimal set of test phrases for testing a natural commands grammar
US6513009B1 (en) * 1999-12-14 2003-01-28 International Business Machines Corporation Scalable low resource dialog manager
JP2001184289A (ja) 1999-12-27 2001-07-06 Js Corporation:Kk チャットシステム、及びそれを含むインターネット上の情報提供システム
US7240093B1 (en) * 2000-02-29 2007-07-03 Microsoft Corporation Use of online messaging to facilitate selection of participants in game play
US20020010760A1 (en) * 2000-04-13 2002-01-24 Anthony Armenta Apparatus for and method of providing user notification and connectivity
US6999932B1 (en) * 2000-10-10 2006-02-14 Intel Corporation Language independent voice-based search system
US6731307B1 (en) * 2000-10-30 2004-05-04 Koninklije Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality
JP2002216026A (ja) 2000-11-17 2002-08-02 Sony Corp 情報通信システム、エージェント端末、情報配信システム、エージェントプログラムが記憶された記憶媒体、エージェントアクセスプログラムが記憶された記憶媒体、専用処理プログラムが記憶された記憶媒体、エージェントプログラム、エージェントアクセスプログラム、及び、専用処理プログラム
JP3683504B2 (ja) 2001-02-14 2005-08-17 日本電信電話株式会社 音声利用型情報検索装置および音声利用型情報検索プログラムと該プログラムを記録した記録媒体
JP2002297645A (ja) 2001-03-30 2002-10-11 Minolta Co Ltd インターネット情報検索端末
JP2003242176A (ja) * 2001-12-13 2003-08-29 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2003186494A (ja) 2001-12-17 2003-07-04 Sony Corp 音声認識装置および方法、記録媒体、並びにプログラム
JP3892338B2 (ja) 2002-05-08 2007-03-14 松下電器産業株式会社 単語辞書登録装置および単語登録用プログラム
JP4392581B2 (ja) 2003-02-20 2010-01-06 ソニー株式会社 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2004267433A (ja) 2003-03-07 2004-09-30 Namco Ltd 音声チャット機能を提供する情報処理装置、サーバおよびプログラム並びに記録媒体
JP4601306B2 (ja) 2003-03-13 2010-12-22 パナソニック株式会社 情報検索装置、情報検索方法、およびプログラム
US20070136067A1 (en) 2003-11-10 2007-06-14 Scholl Holger R Audio dialogue system and voice browsing method
JP2005309760A (ja) 2004-04-21 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> 検索語ランキング算出方法及び装置及びプログラム
US20050245317A1 (en) * 2004-04-30 2005-11-03 Microsoft Corporation Voice chat in game console application
US7836044B2 (en) * 2004-06-22 2010-11-16 Google Inc. Anticipated query generation and processing in a search engine
US7785197B2 (en) * 2004-07-29 2010-08-31 Nintendo Co., Ltd. Voice-to-text chat conversion for remote video game play
JP4005089B2 (ja) 2005-03-07 2007-11-07 株式会社東芝 コミュニケーション記録システム
JP2006319456A (ja) 2005-05-10 2006-11-24 Ntt Communications Kk キーワード提供システム及びプログラム
JP2007079745A (ja) 2005-09-12 2007-03-29 Sharp Corp ネットワーク接続装置、サーバ装置、端末装置、システム、受信方法、文字入力方法、送信方法、プログラムおよびコンピュータ読み取り可能な記録媒体
US20070124142A1 (en) * 2005-11-25 2007-05-31 Mukherjee Santosh K Voice enabled knowledge system
US8671008B2 (en) * 2006-07-14 2014-03-11 Chacha Search, Inc Method for notifying task providers to become active using instant messaging
WO2008011454A2 (en) * 2006-07-18 2008-01-24 Chacha Search, Inc. Anonymous search system using human searchers
JP4466666B2 (ja) 2007-03-14 2010-05-26 日本電気株式会社 議事録作成方法、その装置及びそのプログラム
US20100138402A1 (en) * 2008-12-02 2010-06-03 Chacha Search, Inc. Method and system for improving utilization of human searchers
US20110035383A1 (en) * 2009-08-06 2011-02-10 Ghimire Shankar R Advanced Text to Speech Patent Search Engine
US8375033B2 (en) * 2009-10-19 2013-02-12 Avraham Shpigel Information retrieval through identification of prominent notions
US20110320273A1 (en) * 2010-06-24 2011-12-29 Microsoft Corporation Serving content based on conversations

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5732393A (en) * 1995-02-07 1998-03-24 Toyota Jidosha Kabushiki Kaisha Voice recognition device using linear predictive coding
TW491991B (en) * 1999-08-31 2002-06-21 Andersen Consulting Llp System, method, and article of manufacture for a voice recognition system for navigating on the internet utilizing audible information
US20050171782A1 (en) * 1999-09-03 2005-08-04 Sony Corporation Communication apparatus, communication method and program storage medium
US20010041977A1 (en) * 2000-01-25 2001-11-15 Seiichi Aoyagi Information processing apparatus, information processing method, and storage medium
US20010023192A1 (en) * 2000-03-15 2001-09-20 Hiroshi Hagane Information search system using radio partable terminal
TW200609775A (en) * 2004-09-01 2006-03-16 Creative Tech Ltd A search system

Also Published As

Publication number Publication date
US8620658B2 (en) 2013-12-31
US20090055185A1 (en) 2009-02-26
TW200922223A (en) 2009-05-16

Similar Documents

Publication Publication Date Title
TWI506982B (zh) 音訊聊天系統、資訊處理裝置、語音辨識方法、關鍵字偵測方法、及記錄媒體
CN101309327B (zh) 语音聊天系统、信息处理装置、话语识别和关键字检测
US11978439B2 (en) Generating topic-specific language models
US8423359B2 (en) Automatic language model update
US9213746B2 (en) Method for searching for information using the web and method for voice conversation using same
US8073700B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
JP4987682B2 (ja) 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
US9672827B1 (en) Real-time conversation model generation
US8650031B1 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
KR101770358B1 (ko) 내장형 및 네트워크 음성 인식기들의 통합
JP6819988B2 (ja) 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム
JP4267081B2 (ja) 分散システムにおけるパターン認識登録
US9245523B2 (en) Method and apparatus for expansion of search queries on large vocabulary continuous speech recognition transcripts
US7742922B2 (en) Speech interface for search engines
US7818170B2 (en) Method and apparatus for distributed voice searching
CN103885949B (zh) 一种基于歌词的歌曲检索系统及其检索方法
US8825661B2 (en) Systems and methods for two stream indexing of audio content
US8126897B2 (en) Unified inverted index for video passage retrieval
CN107039040A (zh) 语音识别系统
KR20080068844A (ko) 텍스트 메타데이터를 갖는 음성문서의 인덱싱 및 검색방법, 컴퓨터 판독가능 매체
JP2004005600A (ja) データベースに格納された文書をインデックス付け及び検索する方法及びシステム
US10152298B1 (en) Confidence estimation based on frequency
US20200117742A1 (en) Dynamically suppressing query answers in search
TW200933391A (en) Network information search method applying speech recognition and sysrem thereof
JP3639776B2 (ja) 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees