TWI689865B - 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 - Google Patents
智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 Download PDFInfo
- Publication number
- TWI689865B TWI689865B TW106114384A TW106114384A TWI689865B TW I689865 B TWI689865 B TW I689865B TW 106114384 A TW106114384 A TW 106114384A TW 106114384 A TW106114384 A TW 106114384A TW I689865 B TWI689865 B TW I689865B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- reply
- message
- voice message
- hearing
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53366—Message disposing or creating aspects
- H04M3/53375—Message broadcasting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
- A61B5/0015—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by features of the telemetry system
- A61B5/002—Monitoring the patient using a local or closed circuit, e.g. in a room or building
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
- A61B5/0015—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by features of the telemetry system
- A61B5/0022—Monitoring a patient using a global network, e.g. telephone networks, internet
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/12—Audiometering
- A61B5/121—Audiometering evaluating hearing capacity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/12—Audiometering
- A61B5/121—Audiometering evaluating hearing capacity
- A61B5/123—Audiometering evaluating hearing capacity subjective methods
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/74—Details of notification to user or communication with user or patient ; user input means
- A61B5/7475—User input or interface means, e.g. keyboard, pointing device, joystick
- A61B5/749—Voice-controlled interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
- H04M3/53341—Message reply
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
- A61B5/0004—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by the type of physiological signal transmitted
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/41—Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
Abstract
一種智慧語音系統,包括有資料接收模組、語音訊息接收模組、語音答覆模組及語音訊息輸出模組。資料接收模組接收關於一使用者之聽力評估資料,以根據該聽力評估資料取得一聽力參數。語音訊息接收模組接收使用者發出之語音訊息。語音答覆模組取得適於答覆該語音訊息之答覆語音訊息,其中該語音答覆訊息之聲音頻率並依據該聽力參數而被調整。語音訊息輸出模組輸出該答覆語音訊息。
Description
本發明係關於一種智慧語音系統及語音輸出調整方法,特別是一種可以適於使用者的聽力狀況輸出語音訊息之智慧語音系統及語音輸出調整方法。
隨著人工智慧科技發展,智慧語音助理已逐漸發展成熟。現有的智慧語音助理透過大數據的運用及不斷更新,已可答覆人類相當多的問題,因而漸漸地被廣泛運用於日常生活當中。然而,目前的智慧語音助理雖可依照答覆的問題的不同而產生不同語調的聲音,惟並不能根據使用者的聽力狀況調整聲音頻率,對於老
年人或聽力障礙者而言,有可能產生無法聽見或聽不清楚答覆內容之情形。
因此,實有必要發明一種可調整聲音輸出頻率之智慧語音系統,已改善前揭問題。
本發明之主要目的係在提供一種能以適於使用者的聽力狀況輸出語音訊息之智慧語音服務功能。
為達成上述之目的,本發明揭示一種智慧語音系統,其包括有資料接收模組、語音訊息接收模組、語音答覆模組及語音訊息輸出模組。資料接收模組用以接收關於一使用者之聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據。語音訊息接收模組用以接收該使用者發出的語音訊息。語音答覆模組用以取得適於答覆該語音訊息之答覆語音訊息,其中該語音答覆訊息之聲音頻率並依據該聽力參數而被調整。語音訊息輸出模組用以輸出該答覆語音訊息。
為達成上述之目的,本發明另揭示一種語音輸出調整之方法,其適用於一語音服務伺服器,且語音服務伺服器係與電子
裝置連線。本發明之語音輸出調整方法包括下列步驟:接收一關於一使用者之聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據;接收該使用者發出之語音訊息;分析該語音訊息,並根據分析結果查找出適於答覆該語音訊息之答覆文字訊息;根據該答覆文字訊息產生一語音答覆訊息,其中該語音答覆訊息之聲音頻率並依據該聽力參數而被調整;以及,輸出該答覆語音訊息。
根據本發明之另一實施例,所述語音輸出調整之方法適用於電子裝置,其中電子裝置連線係與語音服務伺服器連線。該方法包括下列步驟:接收關於一使用者之聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據;接收該使用者發出之語音訊息;將該語音訊息發送至一語音服務伺服器;接收來自該語音服務伺服器之一原始答覆語音訊息,其中該原始答覆語音訊息係該語音服務伺服器根據該語音訊息而查找取得;依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息;以及,輸出該答覆語音訊息。
本發明更揭示一種內儲程式之電腦可讀取記憶媒體,當電腦載入該程式後,可完成本發明揭示之語音輸出調整之方法。
1,1A:智慧語音系統
10,10A:資料接收模組
20,20A:語音訊息接收模組
30,30A:語音答覆模組
31:語意分析單元
32:語音訊息產生單元
33,33A:頻率調整單元
34A:發問單元
35A:答覆接收單元
40,40A:語音訊息輸出模組
80,80A:語音服務伺服器
81,81A:第二無線通訊模組
82,82A:資料庫
83,96A:記憶體
84A:答覆模組
90,90A:電子裝置
91,91A:輸入介面
92,92A:第一無線通訊模組
93,93A:麥克風
94,94A:音訊處理晶片
95,95A:揚聲器
H:聽力評估資料
V:語音訊息
U:使用者
圖1係本發明智慧語音系統之第一實施例之實施環境示意圖。
圖2係本發明智慧語音系統之第二實施例之實施環境示意圖。
圖3係表示性別資料、年齡資料及聽力參數間之對應關係之示意圖。
圖4係表示一聽力參數數據圖。
圖5係本發明語音輸出調整之方法之第一實施例之步驟流程圖。
圖6係本發明語音輸出調整之方法之第二實施例之步驟流程圖。
為能讓 貴審查委員能更瞭解本發明之技術內容,特舉較佳具體實施例說明如下。
以下請先參考圖1,並請一併參考圖3及圖4。其中圖1係本發明智慧語音系統之第一實施例之實施環境示意圖;圖3係表示性別資料、年齡資料及聽力參數間之對應關係之示意圖;圖4係表示一聽力參數數據圖。
如圖1所示,在本發明之第一實施例中,智慧語音系統1安裝於一語音服務伺服器80中。除智慧語音系統1外,語音服
務伺服器80更包括第二無線通訊模組81、資料庫82及記憶體83。語音服務伺服器80可透過第二無線通訊模組81連線一電子裝置90,更具體而言,在本實施例中,電子裝置90包括有輸入介面91、第一無線通訊模組92、麥克風93、音訊處理晶片94及揚聲器95,而語音服務伺服器80可藉由第二無線通訊模組81與第一無線通訊模組92間的通訊建立,以和電子裝置90連線。在本發明之具體實施例中,第二無線通訊模組81與第一無線通訊模組92為無線網卡,但本發明不以此為限。
輸入介面91,例如可為觸控螢幕,可供使用者U輸入關於其自身之聽力評估資料H,以使語音服務伺服器80依據該聽力評估資料H查找取得對應之聽力參數(詳後述)。在本發明之具體實施例中,聽力評估資料H為使用者U之年齡資料及性別資料,但本發明不限於此,其也可為聽力參數之數據本身,且亦未必須需包含性別資料。
麥克風93用以接收使用者發出的語音訊息V,即可對使用者U發出的聲音進行收音。
音訊處理晶片94用以將麥克風93接收到的語音訊息V進行類比/數位轉換之處理,以產生數位格式之語音訊息V。並且,
數位格式之語音訊息V可經由第一無線通訊模組92而發送至語音服務伺服器80。
揚聲器95用以根據音訊處理晶片94處理產生之訊號,播放聲音。
在本發明之第一實施例中,智慧語音系統1包括有資料接收模組10、語音訊息接收模組20、語音答覆模組30以及語音訊息輸出模組40。需注意的是,上述各個模組除可配置為硬體裝置、軟體程式、韌體或其組合外,亦可藉電路迴路或其他適當型式配置;並且,各個模組除可以單獨之型式配置外,亦可以結合之型式配置。在一實施例中,各模組皆為軟體程式儲存於記憶體83中,藉由語音服務伺服器80中的一處理器(圖未示)執行各模組以達成本發明之功能。在另一實施例中,各模組也可以軟體程式之形式儲存於一電腦可讀取記憶媒體中,由電腦載入該程式後,執行各模組以達成本發明之功能。又本實施方式僅例示本發明之較佳實施例,為避免贅述,並未詳加記載所有可能的變化組合。然而,本領域之通常知識者應可理解,上述各模組或元件未必皆為必要。且為實施本發明,亦可能包含其他較細節之習知模組或
元件。各模組或元件皆可能視需求加以省略或修改,且任兩模組間未必不存在其他模組或元件。
在本發明之第一實施例中,資料接收模組10用以接收來自之電子裝置90之聽力評估資料H。具體而言,在本實施例中,電子裝置90在透過輸入介面91接收由使用者U輸入之聽力評估資料H後,該被輸入的聽力評估資料H會經由第一無線通訊模組92而發送至語音服務伺服器80,由資料接收模組10所接收。具體實施方式之一但不以此為限的是,可使電子裝置90之顯示器(圖未示)上顯示一輸入畫面,供使用者U輸入聽力評估資料H;使用者U於該輸入畫面上所輸入的聽力評估資料H會發送至語音服務伺服器80。資料接收模組10接收聽力評估資料H後,進一步地會根據該聽力評估資料H取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據。取得聽力參數後,資料接收模組10並會將該聽力參數儲存至記憶體83中。
以圖3所示對應關係表為例,一旦聽力評估資料H中的年齡資料以及性別資料分別為『71~80』及『男』,則資料接收模組10便可依據圖3所示對應關係(此對應關係表會儲存在資料庫82中)查找出關於該使用者之聽力參數應為『1010202040506060』,
其可用例如圖4所示之圖表來表示。圖4所示圖表係表示出使用者對於音頻250及500赫茲的聲音,可聽到的最小音量為10分貝;對於音頻1000及2000赫茲的聲音,可聽到的最小音量為20分貝;對於音頻3000赫茲的聲音,可聽到的最小音量為40分貝;對於音頻4000赫茲的聲音,可聽到的最小音量為50分貝;對於音頻6000及8000赫茲的聲音,可聽到的最小音量為60分貝。
在本發明之第一實施例中,語音訊息接收模組20用以接收該使用者U發出之一語音訊息V。更具體的說,在本實施例中,使用者U發出的聲音(即語音訊息V)在被麥克風93接收,並經由音訊處理晶片94處理後,可透過第一無線通訊模組92發送到語音服務伺服器80,而由語音訊息接收模組20接收。
在本發明之第一實施例中,語音答覆模組30用以取得適於答覆該語音訊息V之答覆語音訊息,其中該語音答覆訊息之聲音頻率並依據前述之聽力參數而被調整。在本實施例中,語音答覆模組30包含有語意分析單元31、語音訊息產生單元32及頻率調整單元33。語意分析單元31用以分析由語音訊息接收模組20接收到的語音訊息V,並根據分析結果以查找出適於答覆該語音訊息V之答覆文字訊息(語意的分析結果和答覆文字訊息間之對
應關係會儲存於資料庫82中)。語音訊息產生單元32用以將答覆文字訊息處理成為一原始答覆語音訊息。關於人類說話之語意分析,並根據分析結果回應適切之答覆,乃現有之技術(例如:蘋果電腦公司出產之Siri軟體,並可參考文字轉語音(TTS)相關技術文獻),為聲音處理技術領域中具有通常知識者所熟知,故在此不再多做贅述。頻率調整單元33用以依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生該答覆語音訊息。
此處需注意的是,在其他實施例中,上述語音訊息產生單元32也可直接依據聽力參數而將答覆文字訊息處理成為語音答覆訊息,亦即在執行文字轉語音之過程中,即依據聽力參數調整輸出聲音之頻率。
在本發明之第一實施例中,語音訊息輸出模組40用以輸出該答覆語音訊息至第二無線通訊模組81,並藉由第二無線通訊模組81以將該答覆語音訊息發送至電子裝置90。該答覆語音訊息經由電子裝置90之音訊處理晶片94的數位/類比之轉換處理後,便可由揚聲器95輸出(即播放語音)。由於答覆語音訊息之聲音頻率是依據和使用者聽力狀態相關的聽力參數而調整的,故輸出的語音可適於使用者收聽。
接著,請參考圖2關於本發明智慧語音系統之第二實施例之實施環境示意圖。
在本發明之第二實施例中,本發明之智慧語音系統1A安裝在電子裝置90A中,電子裝置90A可連線至一語音服務伺服器80A。語音服務伺服器80A包括有第二無線通訊模組81A、資料庫82A及答覆模組84A,語音服務伺服器80A可透由第二無線通訊模組81A而與電子裝置90A實現無線通訊。電子裝置90A除智慧語音系統1A外,尚包括輸入介面91A、第一無線通訊模組92A、麥克風93A、音訊處理晶片94A、揚聲器95A及記憶體96A,而由於此些元件之功能皆同前揭第一實施例所述,故在此不再多做贅述。
在本發明之第二實施例中,本發明之智慧語音系統1A包括有資料接收模組10A、語音訊息接收模組20A、語音答覆模組30A以及語音訊息輸出模組40A。
在本發明之第二實施例中,資料接收模組10A用以接收來自之電子裝置90之聽力評估資料H。具體而言,在本實施例中,使用者U經由輸入介面91A輸入的聽力評估資料H會被傳送至智慧語音系統1A,由資料接收模組10A接收。資料接收模組10A
接收聽力評估資料H後,進一步地會根據該聽力評估資料H取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據。取得聽力參數後,資料接收模組10A並會將該聽力參數儲存至記憶體96A中。
在本發明之第二實施例中,語音訊息接收模組20A用以接收使用者U發出的語音訊息V。更具體的說,在本實施例中,使用者U發出的聲音(即語音訊息V)在被麥克風93A接收,並經由音訊處理晶片94A處理後,會傳送至智慧語音系統1A,而由語音訊息接收模組20A接收。
在本發明之第二實施例中,語音答覆模組30A用以取得適於答覆該語音訊息V之答覆語音訊息,其中該語音答覆訊息之聲音頻率並依據前述之聽力參數而被調整。在本實施例中,語音答覆模組30A包含發問單元34A、答覆接收單元35A及頻率調整單元33A。發問單元34A用以將接收到的語音訊息透過第一無線通訊模組92A,發送至語音服務伺服器80A。語音服務伺服器80A之第二無線通訊模組81A接收該語音訊息後,答覆模組84A接著會分析該語音訊息之語意,且依照分析結果查找出適於答覆該語音訊息之答覆文字訊息,並將該答覆文字訊息處理成為一原始答
覆語音訊息。最後,該原始答覆語音訊息會再透過第二無線通訊模組81A回傳至電子裝置90A。答覆接收單元35A用以接收來自語音服務伺服器80A回傳的原始答覆語音訊息。頻率調整單元33A則用以依據聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息。
在本發明之第二實施例中,語音訊息輸出模組40A用以輸出答覆語音訊息至音訊處理晶片94A,該答覆語音訊息經數位/類比之轉換處理後,會由揚聲器95A輸出(即播放語音)。
接著,請參考圖5關於本發明語音輸出調整之方法之第一實施例之步驟流程圖,並請一併參考圖1。
在本發明之第一實施例中,本發明之語音輸出調整之方法適用於例如圖1所示之語音服務伺服器80,其包含之各步驟係由智慧語音系統1來實行。語音服務伺服器80係與電子裝置90連線。
如圖1及圖5所示,首先,執行步驟S501:接收關於一使用者之聽力評估資料,以根據該聽力評估資料取得一聽力參數。
在本發明之第一實施例中,使用者U可經由輸入介面91(例如:觸控螢幕)輸入關於自身的聽力評估資料H,可包含例如年齡資料及性別資料。聽力評估資料H會藉由第一無線通訊模組92被發送到語音服務伺服器80,由第二無線通訊模組81接收。再由第二無線通訊模組81傳送該聽力評估資料H至智慧語音系統1,由資料接收模組10接收。資料接收模組10接收關於使用者U之聽力評估資料H後,進一步地會根據該聽力評估資料H,透過查找例如圖3所示之對應關係表之方式,來取得對應之聽力參數,該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據。
執行步驟S502:接收使用者發出之語音訊息。
當使用者U啟動電子裝置90之智慧語音服務功能後,一旦其對著電子裝置90說話(即發出語音訊息),其所發出的語音訊息V即會被麥克風93所接收。接著,該語音訊息V會被發送到語音服務伺服器80,由第二無線通訊模組81接收。再由第二無線通訊模組81傳送該語音訊息V至智慧語音系統1,由語音訊息接收模組20接收。
執行步驟S503:分析該語音訊息,並根據分析結果查找出適於答覆該語音訊息之答覆文字訊息。
語音訊息接收模組20接收該語音訊息V後,接著語音答覆模組30之語意分析單元31會分析該語音訊息V之語意,並根據分析結果查找出適於答覆該語音訊息V之答覆文字訊息。
執行步驟S504:將答覆文字訊息處理成為原始答覆語音訊息。
步驟S503完成後,語音答覆模組30之語音訊息產生單元32會將答覆文字訊息處理成為原始答覆語音訊息。
執行步驟S505:依據聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息。
一旦答覆文字訊息被處理成為原始答覆語音訊息,接著語音答覆模組30之頻率調整單元33會依據資料接收模組10取得的聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息。
此處需注意的是,在其他實施例中,上述語音訊息產生單元32也可直接依據聽力參數而將答覆文字訊息處理成為語音答覆訊息,即在執行文字轉語音之過程中,即依據聽力參數調整輸
出聲音之頻率,換言之,亦可單一步驟:依據聽力參數,將答覆文字訊息處理成為語音答覆訊息,來取代步驟S504及S505。
最後,執行步驟S506:輸出答覆語音訊息。
步驟S505完成後,最後,語音訊息輸出模組40輸出該答覆語音訊息至第二無線通訊模組81,並藉由第二無線通訊模組81而被發送至電子裝置90。該答覆語音訊息經由音訊處理晶片94之數位/類比轉換處理後,可由揚聲器95輸出(即播放語音)。
最後,請參考圖6關於本發明語音輸出調整之方法之第二實施例之步驟流程圖,並請一併參考圖2、圖3及圖4。
如圖2所示,在本發明之第二實施例中,本發明之語音輸出調整之方法適用於例如圖2所示之電子裝置90A,其包含之各步驟係由智慧語音系統1來實行。電子裝置90A係與語音服務伺服器80A連線。
如圖6所示,首先,執行步驟S601:接收關於一使用者之聽力評估資料H,以根據該聽力評估資料H取得一聽力參數。
在本發明之第二實施例中,同樣地,使用者可透過輸入介面91A輸入關於自身的聽力評估資料H。資料接收模組10A自輸入介面91A接收聽力評估資料H後,便會根據該聽力評估資料
H,透過查找例如圖3所示之對應關係表之方式,來取得對應之聽力參數。
執行步驟S602:接收使用者發出之語音訊息。
同樣地,在本發明之第二實施例中,使用者U啟動電子裝置90之智慧語音服務功能後,其向電子裝置90所發出的語音訊息V在被麥克風93A後,會傳送到音訊處理晶片94A,並在音訊處理晶片94A為類比/數位之轉換處理後,傳送到智慧語音系統1,由語音訊息接收模組20接收。
執行步驟S603:將該語音訊息發送至語音服務伺服器。
語音訊息接收模組20A在接收語音訊息V後,接著,語音答覆模組30A之發問單元34A會將該語音訊息V,透過第一無線通訊模組92A,發送至語音服務伺服器80A。
語音服務伺服器80A之第二無線通訊模組81A接收該語音訊息V後,答覆模組84A接著會分析該語音訊息V之語意,並依照分析結果查找出適於答覆該語音訊息V之答覆文字訊息。接著,答覆模組84A會將該答覆文字訊息處理成為一原始答覆語音訊息,並透過第二無線通訊模組81A,將處理產生的原始答覆語音訊息回傳至電子裝置90A。
執行步驟S604:接收來自語音服務伺服器之原始答覆語音訊息。
原始答覆語音訊息經由第二無線通訊模組81A發送回電子裝置90A後,可由答覆模組30A之答覆接收單元35A所接收。
執行步驟S605:依據聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息。
當接收到來自語音服務伺服器80A之原始答覆語音訊息後,接著語音答覆模組30A之頻率調整單元33A會依據資料接收模組10取得的聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生答覆語音訊息。
最後,執行步驟S606:輸出答覆語音訊息。
步驟S605完成後,最後,語音訊息輸出模組40輸出該答覆語音訊息至音訊處理晶片94A,該答覆語音訊息經音訊處理晶片94A之數位/類比轉換處理後,可由揚聲器95A輸出(即發出語音)。
經由前揭說明可知,本發明揭示之語音輸出調整之方法可依據使用者的聽力狀態,調整電子裝置之智慧語音服務功能在回應使用者問題時,輸出聲音之頻率,故即便電子裝置的使用者
有聽力上的障礙,亦能感受電子裝置提供的智慧語音服務功能所帶來的便利。
綜上所陳,本發明無論就目的、手段及功效,在在均顯示其迥異於習知技術之特徵,懇請 貴審查委員明察,早日賜准專利,俾嘉惠社會,實感德便。惟應注意的是,上述諸多實施例僅係為了便於說明而舉例而已,本發明所主張之權利範圍自應以申請專利範圍所述為準,而非僅限於上述實施例。
1:智慧語音系統
10:資料接收模組
20:語音訊息接收模組
30:語音答覆模組
31:語意分析單元
32:語音訊息產生單元
33:頻率調整單元
40:語音訊息輸出模組
80:語音服務伺服器
81:第二無線通訊模組
82:資料庫
83:記憶體
90:電子裝置
91:輸入介面
92:第一無線通訊模組
93:麥克風
94:音訊處理晶片
95:揚聲器
H:聽力評估資料
V:語音訊息
U:使用者
Claims (12)
- 一種智慧語音系統,包括: 一資料接收模組,用以接收關於一使用者之一聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據; 一語音訊息接收模組,用以接收該使用者發出之一語音訊息; 一語音答覆模組,用以取得適於答覆該語音訊息之一答覆語音訊息,其中該語音答覆訊息之聲音頻率並依據該聽力參數而被調整;以及 一語音訊息輸出模組,用以輸出該答覆語音訊息。
- 如申請專利範圍第1項所述之智慧語音系統,其中語音答覆模組包括: 一語意分析單元,用以分析該語音訊息,並根據分析結果查找出適於答覆該語音訊息之一答覆文字訊息; 一語音訊息產生單元,用以依據該聽力參數,將該答覆文字訊息處理成為該語音答覆訊息。
- 如申請專利範圍第1項所述之智慧語音系統,其中語音答覆模組包括: 一語意分析單元,用以分析該語音訊息,並根據分析結果查找出適於答覆該語音訊息之一答覆文字訊息; 一語音訊息產生單元,用以將該答覆文字訊息處理成為一原始答覆語音訊息;以及 一頻率調整單元,用以依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生該答覆語音訊息。
- 如申請專利範圍第1項所述之智慧語音系統,其中語音答覆模組包括: 一發問單元,用以將該語音訊息發送至一語音服務伺服器,以使該語音服務伺服器分析該語音訊息後產生一原始答覆語音訊息; 一答覆接收單元,用以接收來自該語音服務伺服器之該原始答覆語音訊息;以及 一頻率調整單元,用以依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生該答覆語音訊息。
- 如申請專利範圍第1項所述之智慧語音系統,其中該使用者聽力評估資料包含一年齡資料或/及一性別資料。
- 一種語音輸出調整之方法,適用於一語音服務伺服器,該語音服務伺服器連線一電子裝置,該語音輸出調整方法包括下列步驟: 接收一關於一使用者之一聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據; 接收該使用者發出之一語音訊息; 分析該語音訊息,並根據分析結果查找出適於答覆該語音訊息之一答覆文字訊息; 根據該答覆文字訊息以產生一語音答覆訊息,其中該語音答覆訊息之聲音頻率並依據該聽力參數而被調整;以及 輸出該答覆語音訊息。
- 如申請專利範圍第6項所述之方法,其中根據該答覆文字訊息產生該語音答覆訊息之步驟包括: 依據該聽力參數,將該答覆文字訊息處理成為該語音答覆訊息。
- 如申請專利範圍第6項所述之方法,其中根據該答覆文字訊息產生該語音答覆訊息之步驟包括: 將該答覆文字訊息處理成為一原始答覆語音訊息;以及 依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生該答覆語音訊息。
- 如申請專利範圍第6項所述之方法,其中該使用者聽力評估資料包含一年齡資料或/及一性別資料。
- 一種語音輸出調整之方法,適用於一電子裝置,該電子裝置連線一語音服務伺服器,該方法包括下列步驟: 接收關於一使用者之一聽力評估資料,以根據該聽力評估資料取得一聽力參數,其中該聽力參數為該使用者對於不同頻率之聲音可聽見的最小音量數據; 接收該使用者發出之一語音訊息; 將該語音訊息發送至一語音服務伺服器; 接收來自該語音服務伺服器之一原始答覆語音訊息,其中該原始答覆語音訊息係該語音服務伺服器根據該語音訊息而查找取得; 依據該聽力參數,調整該原始答覆語音訊息之聲音頻率,以產生一答覆語音訊息;以及 輸出該答覆語音訊息。
- 如申請專利範圍第10項所述之方法,其中該使用者聽力評估資料包含一年齡資料或/及一性別資料。
- 一種內儲程式之電腦可讀取記憶媒體,當電腦載入該程式後,可完成如申請專利範圍第7至11項任一項所述之方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106114384A TWI689865B (zh) | 2017-04-28 | 2017-04-28 | 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 |
US15/823,678 US11115539B2 (en) | 2017-04-28 | 2017-11-28 | Smart voice system, method of adjusting output voice and computer readable memory medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106114384A TWI689865B (zh) | 2017-04-28 | 2017-04-28 | 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201839601A TW201839601A (zh) | 2018-11-01 |
TWI689865B true TWI689865B (zh) | 2020-04-01 |
Family
ID=63916981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106114384A TWI689865B (zh) | 2017-04-28 | 2017-04-28 | 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11115539B2 (zh) |
TW (1) | TWI689865B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW202027062A (zh) * | 2018-12-28 | 2020-07-16 | 塞席爾商元鼎音訊股份有限公司 | 聲音播放系統及其調整輸出聲音之方法 |
US11264029B2 (en) * | 2019-01-05 | 2022-03-01 | Starkey Laboratories, Inc. | Local artificial intelligence assistant system with ear-wearable device |
US11264035B2 (en) | 2019-01-05 | 2022-03-01 | Starkey Laboratories, Inc. | Audio signal processing for automatic transcription using ear-wearable device |
CN112256947B (zh) * | 2019-07-05 | 2024-01-26 | 北京猎户星空科技有限公司 | 一种推荐信息的确定方法、装置、系统、设备及介质 |
CN112741622B (zh) * | 2019-10-30 | 2022-11-15 | 深圳市冠旭电子股份有限公司 | 一种测听系统、测听方法、装置、耳机及终端设备 |
TWI768412B (zh) * | 2020-07-24 | 2022-06-21 | 國立臺灣科技大學 | 發音教學方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI467566B (zh) * | 2011-11-16 | 2015-01-01 | Univ Nat Cheng Kung | 多語言語音合成方法 |
TW201506914A (zh) * | 2010-08-05 | 2015-02-16 | Ace Comm Ltd | 用於自我管理的聲音增強的方法和系統 |
TWI520131B (zh) * | 2013-10-11 | 2016-02-01 | Chunghwa Telecom Co Ltd | Speech Recognition System Based on Joint Time - Frequency Domain and Its Method |
US9412364B2 (en) * | 2006-09-07 | 2016-08-09 | At&T Intellectual Property Ii, L.P. | Enhanced accuracy for speech recognition grammars |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008008730A2 (en) * | 2006-07-08 | 2008-01-17 | Personics Holdings Inc. | Personal audio assistant device and method |
US8447285B1 (en) * | 2007-03-26 | 2013-05-21 | Callwave Communications, Llc | Methods and systems for managing telecommunications and for translating voice messages to text messages |
US8498425B2 (en) * | 2008-08-13 | 2013-07-30 | Onvocal Inc | Wearable headset with self-contained vocal feedback and vocal command |
US8781836B2 (en) * | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9230556B2 (en) * | 2012-06-05 | 2016-01-05 | Apple Inc. | Voice instructions during navigation |
US9549060B2 (en) * | 2013-10-29 | 2017-01-17 | At&T Intellectual Property I, L.P. | Method and system for managing multimedia accessiblity |
US9111214B1 (en) * | 2014-01-30 | 2015-08-18 | Vishal Sharma | Virtual assistant system to remotely control external services and selectively share control |
US20160118036A1 (en) * | 2014-10-23 | 2016-04-28 | Elwha Llc | Systems and methods for positioning a user of a hands-free intercommunication system |
US20180270350A1 (en) * | 2014-02-28 | 2018-09-20 | Ultratec, Inc. | Semiautomated relay method and apparatus |
TWI580279B (zh) * | 2015-05-14 | 2017-04-21 | 陳光超 | 耳膜掛持之耳蝸助聽器 |
WO2017112813A1 (en) * | 2015-12-22 | 2017-06-29 | Sri International | Multi-lingual virtual personal assistant |
US10743101B2 (en) * | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10192552B2 (en) * | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
EP3328097B1 (en) * | 2016-11-24 | 2020-06-17 | Oticon A/s | A hearing device comprising an own voice detector |
US10319375B2 (en) * | 2016-12-28 | 2019-06-11 | Amazon Technologies, Inc. | Audio message extraction |
US10296093B1 (en) * | 2017-03-06 | 2019-05-21 | Apple Inc. | Altering feedback at an electronic device based on environmental and device conditions |
US10303715B2 (en) * | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US11423879B2 (en) * | 2017-07-18 | 2022-08-23 | Disney Enterprises, Inc. | Verbal cues for high-speed control of a voice-enabled device |
US10748533B2 (en) * | 2017-11-08 | 2020-08-18 | Harman International Industries, Incorporated | Proximity aware voice agent |
US10981501B2 (en) * | 2018-12-13 | 2021-04-20 | Lapis Semiconductor Co., Ltd. | Sound output device and sound output system |
TW202034152A (zh) * | 2019-03-11 | 2020-09-16 | 塞席爾商元鼎音訊股份有限公司 | 聲音播放裝置及其調整輸出聲音之方法 |
US20200296510A1 (en) * | 2019-03-14 | 2020-09-17 | Microsoft Technology Licensing, Llc | Intelligent information capturing in sound devices |
-
2017
- 2017-04-28 TW TW106114384A patent/TWI689865B/zh active
- 2017-11-28 US US15/823,678 patent/US11115539B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9412364B2 (en) * | 2006-09-07 | 2016-08-09 | At&T Intellectual Property Ii, L.P. | Enhanced accuracy for speech recognition grammars |
TW201506914A (zh) * | 2010-08-05 | 2015-02-16 | Ace Comm Ltd | 用於自我管理的聲音增強的方法和系統 |
TWI467566B (zh) * | 2011-11-16 | 2015-01-01 | Univ Nat Cheng Kung | 多語言語音合成方法 |
TWI520131B (zh) * | 2013-10-11 | 2016-02-01 | Chunghwa Telecom Co Ltd | Speech Recognition System Based on Joint Time - Frequency Domain and Its Method |
Also Published As
Publication number | Publication date |
---|---|
US20180316795A1 (en) | 2018-11-01 |
US11115539B2 (en) | 2021-09-07 |
TW201839601A (zh) | 2018-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI689865B (zh) | 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 | |
US20220295194A1 (en) | Interactive system for hearing devices | |
CN105489221B (zh) | 一种语音识别方法及装置 | |
US9053096B2 (en) | Language translation based on speaker-related information | |
US8934652B2 (en) | Visual presentation of speaker-related information | |
US9009038B2 (en) | Method and system for analyzing digital sound audio signal associated with baby cry | |
Chern et al. | A smartphone-based multi-functional hearing assistive system to facilitate speech recognition in the classroom | |
Killion et al. | Twenty years later: A new count-the-dots method | |
US20150332659A1 (en) | Sound vest | |
KR20160100811A (ko) | 정보 제공 방법 및 디바이스 | |
TWI638352B (zh) | 可調整輸出聲音之電子裝置及調整輸出聲音之方法 | |
Slaney et al. | Auditory measures for the next billion users | |
Drossos et al. | Investigating the impact of sound angular position on the listener affective state | |
US10841713B2 (en) | Integration of audiogram data into a device | |
JP7218143B2 (ja) | 再生システムおよびプログラム | |
WO2020022079A1 (ja) | 音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法 | |
Drossos et al. | Beads: A dataset of binaural emotionally annotated digital sounds | |
US9355648B2 (en) | Voice input/output device, method and programme for preventing howling | |
Pragt et al. | Preliminary evaluation of automated speech recognition apps for the hearing impaired and deaf | |
KR20150107520A (ko) | 음성인식 방법 및 장치 | |
WO2021144964A1 (ja) | ヒアリングデバイス、ヒアリングデバイスの調整方法 | |
KR20130116128A (ko) | 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법 | |
JP2004000490A (ja) | 補聴器選定システム | |
CN108877822A (zh) | 智能语音系统、语音输出调整的方法及计算机可读取记忆媒体 | |
JP2020119043A (ja) | 音声翻訳システムおよび音声翻訳方法 |