TWI768175B - 具收音場景切換功能的助聽系統 - Google Patents
具收音場景切換功能的助聽系統 Download PDFInfo
- Publication number
- TWI768175B TWI768175B TW108100992A TW108100992A TWI768175B TW I768175 B TWI768175 B TW I768175B TW 108100992 A TW108100992 A TW 108100992A TW 108100992 A TW108100992 A TW 108100992A TW I768175 B TWI768175 B TW I768175B
- Authority
- TW
- Taiwan
- Prior art keywords
- scene
- radio
- image
- module
- signal
- Prior art date
Links
- 230000006870 function Effects 0.000 title claims abstract description 20
- 230000005236 sound signal Effects 0.000 claims abstract description 35
- 230000004913 activation Effects 0.000 claims abstract description 14
- 230000000007 visual effect Effects 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 6
- 239000000969 carrier Substances 0.000 claims description 4
- 238000007635 classification algorithm Methods 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 239000004973 liquid crystal related substance Substances 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 6
- 238000004891 communication Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/028—Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/25—Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- User Interface Of Digital Computer (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
一種具收音場景切換功能的助聽系統,包含影像擷取器、麥克風陣列單元、收音控制裝置及聲音輸出器。收音控制裝置可接收分析影像擷取器取得之視野影像而判斷出相符的場景影像文本,並根據該場景影像文本對應之收音策略,控制啟動麥克風陣列單元進行收音,並由聲音輸出器輸出處理後聲音訊號。透過收音控制裝置可分析該視野影像以篩選出相符的場景影像文本與收音策略的設計,可使啟動之收音策略更切合該使用者所處環境的收音場景類型,是一種相當創新的創作。
Description
本發明是有關於一種助聽器,特別是指一種可切換收音場景的助聽系統。
目前助聽器可利用聲音訊號特性不同,有效的區分語音(speech)及噪音(noise),而將噪音訊號濾除,且可透過方向性麥克風的設計,降低來自使用者後方及側面的聲音訊號,然而日常生活環境中的聲音來源型態多變,來自使用者前方的聲音訊號中,除了談話對象的語音外,可能仍然充斥著其他人的講話聲,且其中大多數語音訊號是使用者不想聽的,例如菜市場場合、餐廳場合、演講場合與會議場合等環境的講話者聲音來源多變且不同,但現有麥克風的音訊處理晶片並無法進行這些聲音場景的辨識以調整採用適合的麥克風策略,僅具有簡單分析音訊以決定開啟全向性收音或方向性收音的簡單功能,所以使用上仍存在許多不便。
雖然較先進的助聽器可藉由雙耳通訊與波束成型的技術定位聲音的方向,但面對前方有多個語言訊號時,通常無法得知哪
個方向的語音訊號是大腦要的,所以只能保留病患最正面的較強語言訊號,以致於在面臨一對二講話、一對三講話,或者是使用者前方有很多人在講話的場面時,經常無法順利取得所需的語音訊號。
因此,本發明的目的,即在提供一種具收音場景切換功能而能改善先前技術之至少一個缺點的助聽系統。
於是,本發明具收音場景切換功能的助聽系統,適用於供一位使用者配戴使用。該助聽系統包含一個可擷取該使用者前方之視野影像的影像擷取器、一個麥克風陣列單元、一個訊號連接該影像擷取器與該麥克風陣列單元的收音控制裝置,及至少一個訊號連接於該收音控制裝置的聲音輸出器。該麥克風陣列單元包括多個相間隔之麥克風,每一麥克風可被各別控制啟動以擷取得到一個聲音訊號。該收音控制裝置包括一個場景分析模組、一個收音策略控制模組,及一個音訊處理模組。該場景分析模組內建有多個分別代表多種場景環境的場景影像文本,可分析該視野影像以得到至少一個相對應的場景影像文本,該收音策略控制模組內建有多個分別對應該等場景影像文本的收音策略,會根據該場景分析模組分析得到之該至少一場景影像文本啟動對應之收音策略,而控制啟動特定數量的麥克風進行收音,該音訊處理模組內建有多個分別對應該等收
音策略的音訊處理模式,會以對應之音訊處理模式接收處理被啟動之所有麥克風擷取的聲音訊號以得到一個處理後聲音訊號。該至少一聲音輸出器可將該處理後聲音訊號輸出以供該使用者聆聽。
本發明的功效在於:透過該收音控制裝置內建有該等場景影像文本與該等收音策略的設計,以及透過分析該視野影像以篩選出相符的場景影像文本的設計,可更準確識別出該使用者所處環境的收音場景類型,而啟動適合的收音策略,是一種相當創新的創作。
200:助聽系統
3:載具
31:前載體
32:鏡片
33:側載體
4:影像擷取器
5:麥克風陣列單元
51:麥克風
6:收音控制裝置
61:啟動控制模組
62:場景分析模組
621:手動場景模式
622:自動場景模式
63:收音策略控制模組
64:方位收音控制模組
65:音訊處理模組
7:聲音輸出器
8:顯示裝置
81:遙控模組
811:場景收音模式
812:方位收音模式
82:觸控顯示模組
本發明的其他的特徵及功效,將於參照圖式的實施方式中清楚地呈現,其中:圖1是本發明具收音場景切換功能的助聽系統的一個實施例的架構示意圖;及圖2是該實施例的功能方塊圖。
在本發明被詳細描述的前,應當注意在以下的說明內容中,類似的元件是以相同的編號來表示。
參閱圖1、2,本發明具收音場景切換功能的助聽系統200
的實施例,包含一個用以供一位使用者配戴的載具3、整合設置於該載具3的一個影像擷取器4、一個麥克風陣列單元5、一個收音控制裝置6與兩個聲音輸出器7,及一個顯示裝置8,該收音控制裝置6是訊號接於該影像擷取器4、該麥克風陣列單元5與該等聲音輸出器7。該顯示裝置8可設計成能供持用之手機或平板樣式,或者是能供穿戴、吊掛於身上之手環、手錶或項鍊形式,且是透過有線通訊技術及/或無線通訊技術訊號連接於該收音控制裝置6。由於無線通訊技術類型眾多且非本發明改良重點,因此不再詳述。
在本實施例中,該載具3是設計成眼鏡型式,可供該使用者配戴於頭部,具有一個位於使用者雙眼前方且裝設有鏡片32的前載體31,及兩個分別安裝於該前載體31左右兩側並供配掛於雙耳之鏡腳狀的側載體33。
該影像擷取器4是安裝於該前載體31之中間區段處,可擷取使用者前方視野的影像而得到一個視野影像。
該麥克風陣列單元5包括多個麥克風51,該等麥克風51是左右間隔設置於該前載體31,以及前後間隔設置於該等側載體33。每一麥克風51可被啟動感測周遭聲音而得到一個聲音訊號。
該收音控制裝置6包括一個啟動控制模組61、一個場景分析模組62、一個收音策略控制模組63、一個方位收音控制模組64,及一個音訊處理模組65。
該啟動控制模組61會控制啟動其中一個麥克風51進行收音以得到一個聲音訊號,且會控制該音訊處理模組65分析該聲音訊號是否存在語音成分,並會於該音訊處理模組65分析該聲音訊號存在語音成分時,觸發該影像擷取器4開始進行影像擷取,以及控制該場景分析模組62開始接收分析該視野影像。
該場景分析模組62內建有多個場景影像文本,且內建有可供選擇啟動的一個手動場景模式621與一個自動場景模式622。該等場景影像文本是根據各種場合環境影像中可能存在之人物數量、每一人物相對使用者之面向、距離、方位與移動/運動方式,以及所存在的各種景物影像等參數,透過特定分類演算法對上述各種參數進行分類辨識學習所建立的分類模型。
所述場合環境影像例如但不限於演講/上課場合、會議場合、戶外/公園綠地場合、派對場合、菜市場場合、超市/便利商店場合、市區街道場合、乘車場合與銀行櫃臺場合...等,所述景物影像例如但不限於會議桌、白板、黑板、講桌、投影機/投影布幕、樹木/植栽/綠地、天空、走道、各種交通工具、貨架、收銀機...等。所述分類演算法例如但不限於深度學習(deep belief network)、複雜決策樹演算法(Complex tree)、餘弦最近鄰近演算法(consine k-nearest neighbors,Cosine KNN)、卷積式類神經網路演算法(convolutional neural network,CNN),及二
次函數支持向量機演算法(Quadratic support vector machine,Quadratic SVM)...等。由於各類分類演算法根據各種場合環境影像訓練建立該等場景影像文本的方式眾多,且有其特定模式,因此不再詳述。
該場景分析模組62於啟動該手動場景模式621時,會控制該顯示裝置8顯示出全部場景影像文本以供使用者選擇。於啟動該自動場景模式622時,會先透過電腦視覺分析技術分析出該視野影像所存在之各種景物影像種類,並根據該等場景影像文本以特定之分類演算法進行該等景物影像的分類演算,而得到每一場景影像文本與該視野影像的相符程度,並篩選出相符程度達到一個預定值以上的多個場景影像文本,且對應篩選出之該等場景影像文本產生並傳送一個場景比對結果至該顯示裝置8,控制該顯示裝置8顯示出其篩選得到之所有場景影像文本以供選擇。
該收音策略控制模組63內建有多個收音策略,所述收音策略為控制啟動該等麥克風51進行收音的方法,例如控制啟動哪一個麥克風51以進行全向性收音,或控制啟動特定幾個麥克風51以相配合進行方向性收音等。該收音策略控制模組63會被該顯示裝置8針對某一場景影像文本所傳送的一個場景點選訊號觸發,而選擇啟動對應該場景影像文本的收音策略,進而控制啟動特定之麥克風51進行收音。
該方位收音控制模組64會被該顯示裝置8針對該視野影像中之某一影像區域所傳送的一個方位點選訊號觸發,而根據該影像區域於該視野影像中的方位,啟動特定位置與數量的麥克風51以相配合產生陣列式麥克風收音功能。
該音訊處理模組65內建有多個分別對應該等收音策略的音訊處理模式,會根據該收音策略控制模組63啟動之該收音策略,以對應之音訊處理模式對該麥克風陣列單元5收音得到之聲音訊號進行音訊處理,所述音訊處理內容例如但不限於進行類比/數位轉換、降噪處理與語音提取處理等,會自該聲音訊號中將不需要之噪音降噪濾除,並將語音訊號過濾放大輸出,以得到具有較佳訊雜比的處理後聲音訊號,並經由該等聲音輸出器7輸出該處理後聲音訊號。此外,該音訊處理模組65會於該方位收音控制模組64被觸發啟動,而啟動特定位置與數量的麥克風51以相配合產生陣列式麥克風收音功能時,除了會對聲音訊號進行類比/數位轉換與降噪處理外,還會配合以波束形成方法對該聲音訊號進行過濾處理,以及進行語音提取處理,藉以過濾得到一個對應該方位點選訊號代表之該視野影像中的方位的處理後聲音訊號。
由於該音訊處理模組65對聲音訊號進行降噪過濾處理與語音提取處理,以及以波束形成方法過濾出特定方位之聲音訊號都是習知技術,且方法相當多,亦非本發明之改良重點,因此不再詳
述。
該顯示裝置8包括一個遙控模組81,及一個觸控顯示模組82。該遙控模組81內建有可被切換啟動的一個場景收音模式811與一個方位收音模式812。該遙控模組81啟動該場景收音模式811時,會被該收音控制裝置6之該場景分析模組62觸發,而控制該觸控顯示模組82顯示出全部場景影像文本以供點選,或者是顯示出該場景比對結果對應之該等場景影像文本以供點選。且該遙控模組81會於其中一個場景影像文本被點選時,對應產生並傳送該場景點選訊號至該收音控制裝置6。
該遙控模組81啟動該方位收音模式812時,會控制該觸控顯示模組82同步接收顯示該影像擷取器4擷取之該視野影像,且會於該觸控顯示模組82顯示之該視野影像的其中一個影像區域被點選時,對應產生並傳送該方位點選訊號至該收音控制裝置6。
本發明助聽系統200使用時,使用者是將該載具3配戴於頭部,並將該等聲音輸出器7安裝於雙耳,且持用該顯示裝置8。系統啟動後,該影像擷取器4不會立即啟動影像擷取功能,該收音控制裝置6會先控制啟動一個麥克風51以進行全向性收音,並於分析收音得到之聲音訊號中存在語音訊號時,才控制啟動該影像擷取器4進行該視野影像之擷取。該收音控制裝置6會分析出與該視野影像相符程度達預定值以上的一個或多個場景影像文本,並進一步比對
出每一場景影像文本對應之該收音策略。
當該顯示裝置8是啟動該場景收音模式811,且該收音控制裝置6之該場景分析模組62是啟動該手動場景模式621時,該收音控制裝置6會控制該顯示裝置8顯示出所有場景影像文本以供選擇。當該場景分析模組62是啟動該自動場景模式622時,該收音控制裝置6會將篩選出之所有場景影像文本傳送至該顯示裝置8顯示。此時,該使用者可根據現場情況,操作該顯示裝置8以點選最符合需求的場景影像文本,而對應回傳一個場景點選訊號至該收音控制裝置6,該收音控制裝置6會根據該場景點選訊號啟動對應的收音策略,而控制啟動特定位置與數量的麥克風51開始進行收音,並對被啟動之所有麥克風51取得之聲音訊號進行語音提取處理,且將該處理後聲音訊號傳送至該等聲音輸出器7輸出,以供該使用者聆聽。
當該顯示裝置8是啟動該方位收音模式812時,該收音控制裝置6會將該影像擷取器4擷取得到之該視野影像同步傳送至該顯示裝置8。此時,使用者可操作該顯示裝置8以點選該視野影像中預定聆聽之的影像區域,該顯示裝置8會對應回傳一個方位點選訊號至該收音控制裝置6。該收音控制裝置6會根據該方位點選訊號對應之方位,控制啟動特定位置與數量的麥克風51,並透過波束形成方法過濾出對應方位之聲音訊號,並對該聲音訊號進行語音提取處
理,然後將該處理後聲音訊號傳送至該等聲音輸出器7輸出,以供該使用者聆聽。
在本實施例中,該收音控制裝置6是整合設置在該載具3,並透過無線通訊技術與該使用者手持的該顯示裝置8訊號連接,但實施時,在本發明之另一實施態樣中,可不將該收音控制裝置6設置在該載具3,而是改為整合設置在該顯示裝置8,可藉此降低該載具3所設置之電子元件數量,而相對減輕配戴重量。
而在本發明之另一實施態樣中,該顯示裝置8也可改為具有顯微投影功能的裝置,並整合設置在該載具3,且可對該載具3之該鏡片32進行顯微投影,而於該鏡片32投射成像顯示出該等場景影像文本與該視野影像,以供該使用者透過視覺控制或其它輸入構件來點選該等場景影像文本與點選該視野影像之影像區域。而在本發明之再另一實施態樣中,該顯示裝置8也可改為透明液晶顯示裝置,並安裝在該載具3而位於該使用者眼前,用以作為眼鏡形式之該載具的鏡片使用。
再者,實施時,在本發明之其它實施態樣中,該顯示裝置8非為必要,該收音控制裝置6可分析該視野影像以取得相符程度最高的該場景影像文本,並直接啟動對應之收音策略以控制該麥克風陣列單元5進行收音,不需再透過該顯示裝置8進行點選。
綜上所述,透過該收音控制裝置6內建有多種場景影像文
本與多個分別對應該等場景影像文本之收音策略的設計,以及可透過分析該影像擷取器4取得之該視野影像,而篩選出相符持程度達特定值以上的場景影像文本以供使用者選擇的設計,可更準確識別出該使用者所處環境的收音場景類型,且使用者也可透過操作該顯示裝置8的方式自行選擇最適合的場景影像文本。此外,使用者也可透過選擇啟動該顯示裝置8之方位收音模式812,透過直接點選該顯示裝置8顯示之該視野影像中的某一影像區域的方式,控制該收音控制裝置6以波束形成技術對該視野影像中之特定方位進行收音,相當方便。因此,本發明具收音場景切換功能的助聽系統200確實是一種相當創新的創作,確實能達成本發明的目的。
惟以上所述者,僅為本發明的實施例而已,當不能以此限定本發明實施的範圍,凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾,皆仍屬本發明專利涵蓋的範圍內。
4:影像擷取器
5:麥克風陣列單元
51:麥克風
6:收音控制裝置
61:啟動控制模組
62:場景分析模組
621:手動場景模式
622:自動場景模式
63:收音策略控制模組
64:方位收音控制模組
65:音訊處理模組
7:聲音輸出器
8:顯示裝置
81:遙控模組
811:場景收音模式
812:方位收音模式
82:觸控顯示模組
Claims (8)
- 一種具收音場景切換功能的助聽系統,適用於供一位使用者配戴使用,並包含:一個眼鏡型式的載具,用以供配戴於該使用者身上,具有一左右延伸的前載體,及二前後延伸且分別設置在該前載體左右兩端的側載體;一個影像擷取器,設置於該載具之該前載體,可擷取該使用者前方之視野影像;一個麥克風陣列單元,包括多個相間隔地設置在該前載體與該等側載體之麥克風,每一麥克風可被各別控制啟動以擷取得到一個聲音訊號;一個收音控制裝置,設置於該載具,且訊號連接於該影像擷取器與該等麥克風,包括一個場景分析模組、一個收音策略控制模組,及一個音訊處理模組,該場景分析模組內建有多個分別代表多種場景環境的場景影像文本,可透過電腦視覺分析技術分析出該視野影像所存在之各種景物影像種類,並根據該等場景影像文本以特定之分類演算法進行該等景物影像的分類演算,而得到每一場景影像文本與該視野影像的相符程度,並取得相符程度達一預定值以上的其中一個場景影像文本,該收音策略控制模組內建有多個分別對應該等場景影像文本的收音策略,會根據該場景分析模組分析取得之該場景影像文本啟動對應之收音策略,而控制啟動特定數量的麥克風進行收音,該音訊處理模組內建有多個分別對應該等收音策略的音訊處 理模式,會以對應之音訊處理模式接收處理被啟動之所有麥克風擷取的聲音訊號以得到一個處理後聲音訊號;及至少一個聲音輸出器,訊號連接於該收音控制裝置,並可將該處理後聲音訊號輸出以供該使用者聆聽。
- 如請求項1所述的具收音場景切換功能的助聽系統,還包含一個訊號連接於該收音控制裝置的顯示裝置,該場景分析模組會將相符程度大於一個預定值的每一場景影像文本傳送至該顯示裝置顯示以供選擇,該收音策略控制模組會根據被選擇之該場景影像文本啟動對應之收音策略,而控制啟動特定數量的麥克風進行收音。
- 如請求項2所述的具收音場景切換功能的助聽系統,其中,該場景分析模組內建有可供選擇啟動的一個手動場景模式與一個自動場景模式,於啟動該手動場景模式時,會控制該顯示裝置顯示全部場景影像文本以供選擇,於啟動該自動場景模式時,會根據該等場景影像文本分析該視野影像,且會將相符程度大於該預定值的多個場景影像文本傳送至該顯示裝置顯示以供選擇。
- 如請求項2或3所述的具收音場景切換功能的助聽系統,其中,該收音控制裝置還包括一個啟動控制模組,該啟動控制模組會控制啟動至少一個麥克風進行收音以得到該聲音訊號,且會觸發該音訊處理模組分析該聲音訊號是否存在語音,該啟動控制模組會於該音訊處理模組分析該聲音訊號存在語音時,控制啟動該影像擷取器,並觸發啟動該場景分析模組。
- 如請求項2或3所述的具收音場景切換功能的助聽系統,其中,該載具具有一個位於該使用者眼前的鏡片,該顯示裝置是安裝在該載具,且可透過顯微投影技術將該等場景影像文本投射成像於該鏡片以供選擇。
- 如請求項2或3所述的具收音場景切換功能的助聽系統,其中,該顯示裝置為安裝在該載具而位於該使用者眼前的透明液晶顯示裝置。
- 如請求項2或3所述的具收音場景切換功能的助聽系統,其中,該顯示裝置包括一個遙控模組,及一個觸控顯示模組,該遙控模組內建有可被啟動的一個場景收音模式,該遙控模組啟動該場景收音模式時,會控制該觸控顯示模組顯示該等場景影像文本以供點選,且會對應被點選之該場景影像文本產生並傳送一個場景點選訊號至該收音控制裝置,該收音策略控制模組會被該場景點選訊號觸發而啟動對應之收音策略。
- 如請求項7所述的具收音場景切換功能的助聽系統,其中,該收音控制裝置還包括一個方位收音控制模組,該遙控模組內建有可被切換啟動的該場景收音模式與一個方位收音模式,該遙控模組切換啟動該方位收音模式時,會控制該觸控顯示模組同步顯示該視野影像以供點選,且會根據被點選之影像區域於該視野影像中的方位,對應產生並傳送一個方位點選訊號至該收音控制裝置,該方位收音控制模組會被該方位點選訊號觸發,而控制啟動特定數量與設置位置的麥克風進行收音,該音訊處理模組會以波束 形成方法對該等麥克風擷取之聲音訊號進行過濾處理,以過濾得到一個對應該方位點選訊號代表之該視野影像中的方位的處理後聲音訊號。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108100992A TWI768175B (zh) | 2019-01-10 | 2019-01-10 | 具收音場景切換功能的助聽系統 |
CN201911233217.6A CN111429928A (zh) | 2019-01-10 | 2019-12-05 | 具收音场景切换功能的助听系统 |
US16/734,671 US10827260B2 (en) | 2019-01-10 | 2020-01-06 | Hearing aid system |
JP2020001123A JP2020113981A (ja) | 2019-01-10 | 2020-01-08 | 補聴器システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108100992A TWI768175B (zh) | 2019-01-10 | 2019-01-10 | 具收音場景切換功能的助聽系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202027520A TW202027520A (zh) | 2020-07-16 |
TWI768175B true TWI768175B (zh) | 2022-06-21 |
Family
ID=71517150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108100992A TWI768175B (zh) | 2019-01-10 | 2019-01-10 | 具收音場景切換功能的助聽系統 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10827260B2 (zh) |
JP (1) | JP2020113981A (zh) |
CN (1) | CN111429928A (zh) |
TW (1) | TWI768175B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022234871A1 (ko) * | 2021-05-04 | 2022-11-10 | 엘지전자 주식회사 | 음장 제어 장치 및 방법 |
CN115695620A (zh) * | 2021-07-22 | 2023-02-03 | 所乐思(深圳)科技有限公司 | 智能眼镜及其控制方法和系统 |
CN114615609B (zh) * | 2022-03-15 | 2024-01-30 | 深圳市昂思科技有限公司 | 助听器控制方法、助听器设备、装置、设备和计算机介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201526667A (zh) * | 2013-12-18 | 2015-07-01 | jing-feng Liu | 助聽系統與助聽系統之語音擷取方法 |
CN104982041A (zh) * | 2013-02-15 | 2015-10-14 | 三星电子株式会社 | 用于控制助听器的便携式终端及其方法 |
CN105532017A (zh) * | 2013-03-12 | 2016-04-27 | 谷歌技术控股有限责任公司 | 用于波束形成以获得语音和噪声信号的装置和方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1229518A1 (en) * | 2001-01-31 | 2002-08-07 | Alcatel | Speech recognition system, and terminal, and system unit, and method |
WO2002072317A1 (fr) * | 2001-03-09 | 2002-09-19 | Japan Science And Technology Corporation | Systeme de robot audiovisuel |
US9153195B2 (en) * | 2011-08-17 | 2015-10-06 | Microsoft Technology Licensing, Llc | Providing contextual personal information by a mixed reality device |
US10282057B1 (en) * | 2014-07-29 | 2019-05-07 | Google Llc | Image editing on a wearable device |
US10499164B2 (en) * | 2015-03-18 | 2019-12-03 | Lenovo (Singapore) Pte. Ltd. | Presentation of audio based on source |
JP6290827B2 (ja) * | 2015-06-05 | 2018-03-07 | リウ チン フォンChing−Feng LIU | オーディオ信号を処理する方法及び補聴器システム |
CA2927046A1 (en) * | 2016-04-12 | 2017-10-12 | 11 Motion Pictures Limited | Method and system for 360 degree head-mounted display monitoring between software program modules using video or image texture sharing |
CN110084089A (zh) * | 2016-10-26 | 2019-08-02 | 奥康科技有限公司 | 用于分析图像和提供反馈的可佩戴设备和方法 |
US10362270B2 (en) * | 2016-12-12 | 2019-07-23 | Dolby Laboratories Licensing Corporation | Multimodal spatial registration of devices for congruent multimedia communications |
US10599950B2 (en) * | 2017-05-30 | 2020-03-24 | Google Llc | Systems and methods for person recognition data management |
US10452923B2 (en) * | 2017-11-28 | 2019-10-22 | Visual Semantics, Inc. | Method and apparatus for integration of detected object identifiers and semantic scene graph networks for captured visual scene behavior estimation |
-
2019
- 2019-01-10 TW TW108100992A patent/TWI768175B/zh active
- 2019-12-05 CN CN201911233217.6A patent/CN111429928A/zh active Pending
-
2020
- 2020-01-06 US US16/734,671 patent/US10827260B2/en active Active
- 2020-01-08 JP JP2020001123A patent/JP2020113981A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104982041A (zh) * | 2013-02-15 | 2015-10-14 | 三星电子株式会社 | 用于控制助听器的便携式终端及其方法 |
CN105532017A (zh) * | 2013-03-12 | 2016-04-27 | 谷歌技术控股有限责任公司 | 用于波束形成以获得语音和噪声信号的装置和方法 |
TW201526667A (zh) * | 2013-12-18 | 2015-07-01 | jing-feng Liu | 助聽系統與助聽系統之語音擷取方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202027520A (zh) | 2020-07-16 |
JP2020113981A (ja) | 2020-07-27 |
CN111429928A (zh) | 2020-07-17 |
US10827260B2 (en) | 2020-11-03 |
US20200228894A1 (en) | 2020-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10575117B2 (en) | Directional sound modification | |
TWI768175B (zh) | 具收音場景切換功能的助聽系統 | |
TWI543635B (zh) | Speech Acquisition Method of Hearing Aid System and Hearing Aid System | |
US9949056B2 (en) | Method and apparatus for presenting to a user of a wearable apparatus additional information related to an audio scene | |
CN101520690B (zh) | 图像获取和显示设备以及图像获取和显示方法 | |
JP6094190B2 (ja) | 情報処理装置および記録媒体 | |
US20230045237A1 (en) | Wearable apparatus for active substitution | |
US20190028817A1 (en) | System and method for a directional speaker selection | |
US20170303052A1 (en) | Wearable auditory feedback device | |
CN107888973B (zh) | 一种脑电控制的视频输入听觉显示导盲装置及方法 | |
EP3582511A2 (en) | Directional sound modification | |
US20200227067A1 (en) | Communication aid system | |
JP6290827B2 (ja) | オーディオ信号を処理する方法及び補聴器システム | |
US20220225049A1 (en) | An apparatus and associated methods for capture of spatial audio | |
WO2019119290A1 (zh) | 提示信息确定方法、装置、电子设备和计算机程序产品 | |
TW200411627A (en) | Robottic vision-audition system | |
CN111128180A (zh) | 一种听力障碍者的辅助对话系统 | |
TWI725668B (zh) | 注意力集中輔助系統 | |
JP2021197658A (ja) | 収音装置、収音システム及び収音方法 | |
CA2297344A1 (en) | Look direction microphone system with visual aiming aid | |
US20240177588A1 (en) | Hearing aiding apparatus integrating image-acoustics positioning, omnidirectional acoustic reception, and warning | |
US20240362796A1 (en) | Image analysis to switch audio devices |