TWI725668B

TWI725668B - 注意力集中輔助系統

Info

Publication number: TWI725668B
Application number: TW108146002A
Authority: TW
Inventors: 陳筱涵
Original assignee: 陳筱涵
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2021-04-21
Also published as: CN112995846A; TW202123990A

Abstract

一種注意力集中輔助系統，其收音裝置包括可被使用者帶動水平偏轉的載具，及安裝在載具的麥克風陣列、耳機模組與語音追蹤模組。該語音追蹤模組會根據該載具之水平偏轉位移切換啟動安裝在該載具之對應位置的麥克風，並以波束成形技術控制該等麥克風恆朝一預定方向進行語音提取以得到一個語音訊號，並經由該耳機模組輸出該語音訊號以供聆聽。透過收音裝置之定向追蹤模式能持續朝講者方向提取語音的設計，可持續提供來自講者的語音內容供使用者聆聽，可幫助使用者將注意力集中向該講者，講者也更容易透過講話內容喚回使用者的注意力。

Description

注意力集中輔助系統

本發明是有關於一種輔具，特別是指一種用於輔助集中注意力的輔助系統。

注意力不集中是一種會影響學習與生活的症狀，具有注意力不集中症狀的學童的注意力容易因周遭一點聲音刺激而被轉移，無法專心聽講與做功課，也很難集中注意力完成一件工作或遊戲。如不適時進行治療，會嚴重影響學童的學習與成長。

目前針對注意力不集中症狀的主要治療方式為藥物治療，特別是當學童本身症狀已嚴重妨礙到學習、人際關係及人格發展時，藥物治療可以有效幫助這些學童。但因為治療藥物會引發一些副作用，例如頭痛、腸胃不適、食慾降低、噁心及失眠等，所以許多家長與老師擔心藥物治療會影響學童的成長發育與生活作息，而排斥採用藥物治療。

因此，本發明的目的，即在提供一種可用以輔助改善注意力不集中症狀的注意力集中輔助系統。

於是，本發明注意力集中輔助系統，適用於供一位使用者配戴，並包含一個收音裝置。該收音裝置包括一個用以供配戴在該使用者頭部且可被該使用者帶動水平偏轉位移的載具，及安裝在該載具的一個麥克風陣列、一個耳機模組與一個語音追蹤模組，該麥克風陣列具有多個間隔設置在該載具的麥克風，該耳機模組具有兩個用以供分別設置在該使用者雙耳的耳機本體。該語音追蹤模組會根據該載具之水平偏轉位移切換啟動安裝在該載具之對應位置的麥克風，並以波束成形技術控制被啟動之該等麥克風恆朝一預定方向進行語音提取以得到一個語音訊號，並經由該等耳機本體輸出該語音訊號以供聆聽。

本發明的功效在於：透過該收音裝置之該定向追蹤模式設計，使得該收音裝置能持續朝該講者方向進行語音提取，除了可藉由該耳機模組降低周遭環境雜音對該使用者的干擾，還可持續提供來自該講者的語音內容供該使用者聆聽，可幫助該使用者持續將注意力集中向該講者，而該講者也更容易透過講話內容喚回該使用者的注意力。

在本發明被詳細描述前，應當注意在以下的說明內容中，類似的元件是以相同的編號來表示。

參閱圖1、2、3，本發明注意力集中輔助系統200的實施例，適用於供一位使用者900配戴使用，並包含一個用以供配戴在該使用者900之頭部的收音裝置3，及一個用以供該使用者900隨身攜帶或配戴的隨身裝置4，且該收音裝置3與該隨身裝置4間可透過有線通訊技術及/或無線通訊技術訊號連接以進行資料傳輸，所述無線通訊技術例如但不限於藍芽與wifi等。

該收音裝置3包括一個載具31，及安裝在該載具31的一個麥克風陣列32、一個耳機模組33、一個影像擷取模組34與一個語音追蹤模組35。

在本實施例中，該載具31是設計成眼鏡形式，可供該使用者900配戴在頭部，該載具31具有一個左右延伸的鏡框311，及兩個前後延伸且分別安裝在該鏡框311左右兩端部的鏡腳312。但實施時，在本發明之其它實施態樣中，該載具31類型不以此為限，只要可供配戴設置在該使用者900之頭部，且可被該使用者900帶動水平偏轉位移即可。

該麥克風陣列32包括多個間隔分佈設置在該載具31之該鏡框311與該等鏡腳312的麥克風321，該等麥克風321可被控制啟動以進行收音。該耳機模組33具有兩個左右間隔設置在該載具31的該等鏡腳312而可用以輸出聲音的耳機本體331，該等耳機本體331可供該使用者900分別配戴在雙耳。該影像擷取模組34是設置在該載具31的該鏡框311中心部位，而可用以朝該使用者900的正面方向進行影像擷取以得到一個視野影像。

該語音追蹤模組35訊號連接該麥克風陣列32、該耳機模組33與該影像擷取模組34，且內建有可被切換啟動的一個定向追蹤模式351、一個預定講者追蹤模式352與一個小組收音模式353，並具有一個定向追蹤單元354、一個語音提取單元355，及一個嵌裝外露在該載具31外表面以供操作的按鍵單元356，該按鍵單元356可供操作以切換啟動該定向追蹤模式351、該預定講者追蹤模式352與該小組收音模式353，以及控制該定向追蹤單元354之運作。

該定向追蹤單元354可用以偵測該載具31之水平偏轉以得到一個偏轉角度值，且可被控制而以該載具31當前的一個正面方向為零度基準重新偵測得到該偏轉角度值，也就是說，可透過操作該按鍵單元356的方式，控制該定向追蹤單元354將當前測得的該偏轉角度值歸零，而以該載具31當前配戴在該使用者900使用時該正面方向的水平方位為零度基準，重新開始偵測該載具31被該使用者900頭部帶動產生的水平偏轉角度。實施時，該定向追蹤單元354可透過例如但不限於陀螺儀、三軸加速度感測器或感測地磁的磁場感測器等來達到偵測該載具31之水平偏轉角度的目的。

該語音提取單元355內建有多個分別對應不同偏轉角度值的收音策略，每一收音策略會與預定位置與數量的麥克風321對應，該語音提取單元355會根據該定向追蹤單元354測得之該偏轉角度值啟動其中一種收音策略，而以波束成形技術控制啟動對應之麥克風321相配合朝該偏轉角度值為零的方向進行語音提取以得到一個語音訊號，並將該語音訊號傳送至該耳機模組33，而經由該等耳機本體331輸出以供該使用者900聆聽。

此外，該語音追蹤模組35於啟動該定向追蹤模式351時，會觸發啟動該定向追蹤單元354、該語音提取單元355與該按鍵單元356，會使該定向追蹤單元354可被控制以將該偏轉角度值歸零，而以該載具31當前的正面方向為基準重新偵測該載具31的該偏轉角度值。

具體而言，在啟動該定向追蹤模式351情況下，當使用者900頭部帶動該載具31水平轉向面對一位講者800時，可操作該按鍵單元356以控制該定向追蹤單元354將當前的偏轉角度值歸零，而以該使用者900當前面向該講者800的方位為零度基準重新偵測水平方向的該偏轉角度值，且該語音提取單元355會根據當前測得之該偏轉角度值啟動對應之收音策略。

例如當該偏轉角度值為0度時，會以波束成形技術控制位在該鏡框311預定位置的多個麥克風321往該偏轉角度值為0度的方向進行指向性收音以得到該語音訊號。當使用者900頭部往右水平偏轉，而該定向追蹤單元354測得偏轉角度值是往右30度時，該語音提取單元355會切換啟動對應之收音策略，以波束成形技術控制位在該鏡框311與左側鏡腳312之預定位置的多個麥克風321往該偏轉角度值為0度的方向進行指向性收音以得到該語音訊號。也就是說，當該使用者900將該講者定位為零度基準後，即便該使用者900頭部水平偏轉，該語音提取單元355也會根據對應的收音策略控制啟動對應之麥克風321朝該偏轉角度值為0度的方向進行語音提取，而會持續朝該講者800方向進行語音提取，所以即便該使用者900轉頭而視線偏移該講者800，依然會清楚聽到來自該講者800方向的講話內容。

當該語音追蹤模組35於啟動該預定講者追蹤模式352時，會控制啟動該影像擷取模組34與該語音提取單元355，並將該影像擷取模組34擷取之該視野影像傳送至該隨身裝置4，且會接收該隨身裝置4對應回傳的一個預定講者方位。該語音提取單元355會以波束成形技術控制該麥克風陣列32朝該預定講者方位對應之方向進行語音提取以得到一個語音訊號，並經由該耳機模組33輸出該語音訊號以供該使用者900聆聽。

當該語音追蹤模組35於啟動該小組收音模式353時，會控制啟動該影像擷取模組34與該語音提取單元355，會將該視野影像傳送至該隨身裝置4，並接收該隨身裝置4對應回傳的所有可能性講者方位。該語音提取單元355會以波束成形技術控制該麥克風陣列32朝每一可能性講者方位對應之方向進行語音提取以得到一個語音訊號，並經由該耳機模組33輸出該語音訊號以供該使用者900聆聽。

該隨身裝置4包括一個預定講者分析模組41、一個可能性講者分析模組42，及一個講者定位模組43。該預定講者分析模組41可供操作以控制啟動該收音裝置3之該影像擷取模組34的影像擷取功能，使用者900可轉動頭部以帶動該收音裝置3的該影像擷取模組34朝向一位講者800進行影像擷取，藉以擷取得到該講者800的人物影像，此外，該預定講者分析模組41也可供操作以透過其它輸入介面輸入該講者800的人物影像。所述講者800的人物影像例如但不限於頭部，或者是半身照、全身照等。所述輸入介面例如但不限於USB介面或網路介面等。

該預定講者分析模組41會於該語音追蹤模組35啟動該預定講者追蹤模式352時被觸發啟動，並具有一個講者特徵建立單元411，及一個講者特徵比對單元412。該講者特徵建立單元411會分析擷取該講者800的所有人物影像的人物特徵以建立一個講者影像特徵參數。在本實施例中，是擷取每一人物影像中的頭部影像區域的人物特徵來建立該講者影像特徵參數，所述人物特徵例如但不限於臉形、臉部五官外形、髮型、頭髮顏色，以及頭部配件或飾品等特徵，但實施時，在本發明之另一實施態樣中，還可進一步分析每一人物影像的衣著的顏色、花紋與型態等來得到所述人物特徵，並彙整前述頭部影像區域的人物特徵與衣著的人物特徵以建立該講者影像特徵參數。由於透過分析人物影像之人物特徵以建立該講者影像特徵參數的方式眾多，因此實施時不以上述態樣為限。

該講者特徵比對單元412，可根據該講者影像特徵參數分析該視野影像中所存在之人物影像的影像特徵，判斷該視野影像中是否存在該講者800，藉以從該視野影像中識別出對應該講者800的一個講者影像。

該講者定位模組43會分析定位出該講者影像於該視野影像中的位置以得到一個預定講者方位，並將該預定講者方位回傳至該收音裝置3。

該可能性講者分析模組42會於該語音追蹤模組35啟動該小組收音模式353時被觸發啟動，包括一個可能性分析單元421，及一個嘴唇開合分析單元422。該可能性分析單元421內建有一用以分析該等人臉影像作為講話對象之可能性的可能性分類基準，該可能性分類基準就人臉影像相對於該使用者900之距離遠近、方位與左右偏轉角度大小設定有不同之運算權重比。所述距離遠近係根據該等人物影像大小、臉部影像大小、影像前後重疊情況...等影像特徵來進行每一人物影像相對距離的演算。所述方位係指每一人臉影像左右偏離該視野影像的一個視野中心的角度。所述左右偏轉角度是指每一人臉影像面向該使用者900的角度。由於分析取得該視野影像中的該等人臉影像的距離、方位與左右偏轉角度的影像分析處理技術眾多，因此不再詳述。

該可能性分析單元421會分析該視野影像中的所有人臉影像相對於該使用者900之距離、方位與偏轉角度，並根據該可能性分類基準所設定之運算權重進行分析運算，進而對該等人臉影像作為講話對象之可能性進行分類，而得到一個可能性訊號源分類，該可能性訊號源分類依據作為講話對象之可能性高低，分設有多個不同可能性級別，例如最高可能性級別、中度可能性級別，及低可能性級別等，會根據該等人臉影像作為講話對象的可能性分析結果，將每一人臉影像分類於對應的可能性級別中。該嘴唇開合分析單元422會分析被分類在最高可能性級別中的每一個人臉影像的嘴唇是否開合作動，並將嘴唇有開合作動的每一個人臉影像判斷為一個可能講者。然後，該講者定位模組43會分析被判斷為該可能講者的每一人臉影像於該視野影像中的位置以得到一個可能性講者方位，並將分析得到的每一可能性講者方位回傳至該收音裝置3。

由於現今的手機與平板電腦等行動裝置，以及可供隨身攜帶的筆記型電腦的功能都相當強大，所以本發明實施時，可將該預定講者分析模組41與該可能性講者分析模組42以APP（mobile application）等軟體程式的方式實施在具備與該收音裝置3進行通訊的行動裝置或筆記型電腦上，藉以構成該隨身裝置4。

本發明注意力集中輔助系統200使用時，可將該收音裝置3的該載具31配戴在需要進行注意力集中輔助的使用者900的頭部，並將該耳機模組33的該等耳機本體331分別設置在該使用者900的雙耳。

當啟動該收音裝置3與該隨身裝置4後，使用者900可根據當前環境情況，操作該收音裝置3的該按鍵單元356以選擇啟動該定向追蹤模式351、該預定講者追蹤模式352或該小組收音模式353。

當講者800會待在固定位置講話時，例如坐在一座位上講話，則可選擇啟動該定向追蹤模式351。此時，可讓該使用者900先轉頭面向該講者800，並操作該按鍵單元356以控制該定向追蹤單元354以當前的正面方向為零度基準，重新偵測該偏轉角度值。該語音提取單元355會根據接續測得的該偏轉角度值啟動對應的收音策略，控制對應位置與數量的麥克風321對該偏轉角度值為零度的方向進行語音提取以得到該語音訊號，並將該語音訊號傳送至該耳機模組33輸出以供該使用者900聆聽。因此，即便該使用者900轉頭偏離該講者800，該收音裝置3依然會對該講者800方向進行收音，並經由該耳機模組33輸出該語音訊號，讓該使用者900能持續聽到該講者800的講話內容。

藉此設計，一方面可透過設置在該使用者900雙耳的該耳機模組33阻隔周遭環境聲音的干擾，另一方面可透過持續對該講者800方向進行語音提取並輸出該語音訊號，來幫助具有注意力不集中症狀的該使用者900持續將注意力集中向該講者800，也可讓該講者800更有效地透過講話內容喚回該使用者900的注意力。

當該講者800會走動時，例如會在講台區域左右走動，則可選擇切換啟動該預定講者追蹤模式352。該收音裝置3會將擷取得到的該視野影像傳送至該隨身裝置4，該隨身裝置4會根據已儲存的該講者影像特徵參數分析該視野影像，藉以從該視野影像中識別出該講者影像，並分析得到該講者影像在該視野影像中的該預定講者方位，且將該預定講者方位回傳給該收音裝置3。該收音裝置3的該語音提取單元355會控制對應的麥克風321朝該預定講者方位進行語音提取以得到該語音訊號，並將該語音訊號傳送至該耳機模組33輸出以供該使用者900聆聽，同樣可讓該使用者900持續聽到該講者800講話內容。

當該使用者900前方有多位人士可能會是講者，而又無法確定誰是講話者時，則可選擇啟動該小組收音模式353。此時，該收音裝置3會將該使用者900前方的該視野影像傳送至該隨身裝置4，該隨身裝置4會對該視野影像中的所有人物影像進行可能性分類演算，藉以找出可能講者，並分析被判斷為可能講者之每一人臉影像的該可能性講者方位，且將所有可能性講者方位回傳至該收音裝置3。該收音裝置3的該語音提取單元355會控制對應的麥克風321朝該可能性講者方位進行語音提取以得到該語音訊號，並將該語音訊號傳送至該耳機模組33輸出以供該使用者900聆聽，同樣可讓該使用者900持續聽到該講者800講話內容。

在本實施例中，該可能性講者分析模組42會透過該嘴唇開合分析單元422分析該最高可能性級別中的人臉影像的嘴唇，藉以判斷該人臉影像是否為可能講者800。但實施時，在本發明之其它實施態樣中，該可能性講者分析模組42不以設置該嘴唇開合分析單元422為必要，可直接將被歸類在最高可能性級別的每一個人臉影像都設定為可能講者，該講者定位模組43直接分析被判斷為可能講者的每一人臉影像的該可能性講者方位，並將所有可能性講者方位回傳給該收音裝置3。

再者，實施時，該收音裝置3不以設置該影像擷取模組34為必要，此時，該隨身裝置4亦非必要，該語音追蹤模組35可僅透過該定向追蹤模式351持續朝該偏轉角度值為零度的方向對該講者800進行收音。

綜上所述，透過該收音裝置3可供選擇該定向追蹤模式351與該預定講者追蹤模式352的設計，以及該隨身裝置4會根據該講者影像特徵參數分析定位出該視野影像之該講者影像的講者方位的設計，使得該收音裝置3能持續朝該講者方向進行語音提取，可藉由該耳機模組33降低周遭環境雜音對該使用者900的干擾，並持續提供來自該講者800的語音內容供該使用者900聆聽，可幫助該使用者900持續將注意力集中向該講者800，而該講者800也更容易透過講話內容喚回該使用者900的注意力。

此外，進一步透過該收音裝置3的該小組收音模式353設計，以及該隨身裝置4會對該視野影像中之所有人臉影像進行可能性分類演算，並將最高可能性級別中的人臉影像判斷為可能講者，或者進一步配合判斷人臉影像之嘴唇的作動來判斷是否為可能講者的設計，使得配戴本發明注意力集中輔助系統200的使用者900在多人團體活動中，也能清楚聆聽到可能的講者800的講話內容，而將注意力集中在可能的講者800。因此，本發明注意力集中輔助系統200確實是一種有助於改善注意力不集中症狀的創新輔具，確實能達成本發明的目的。

惟以上所述者，僅為本發明的實施例而已，當不能以此限定本發明實施的範圍，凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾，皆仍屬本發明專利涵蓋的範圍內。

200:注意力集中輔助系統 3:收音裝置 31:載具 311:鏡框 312:鏡腳 32:麥克風陣列 321:麥克風 33:耳機模組 331:耳機本體 34:影像擷取模組 35:語音追蹤模組 351:定向追蹤模式 352:預定講者追蹤模式 353:小組收音模式 354:定向追蹤單元 355:語音提取單元 356:按鍵單元 4:隨身裝置 41:預定講者分析模組 411:講者特徵建立單元 412:講者特徵比對單元 42:可能性講者分析模組 421:可能性分析單元 422:嘴唇開合分析單元 43:講者定位模組 800:講者 900:使用者

本發明的其他的特徵及功效，將於參照圖式的實施方式中清楚地呈現，其中：圖1是本發明注意力集中輔助系統的一個實施例供一位使用者配戴使用時的立體示意圖；圖2是該實施例的立體圖；及圖3是該實施例的功能方塊圖；

3:收音裝置

32:麥克風陣列

321:麥克風

33:耳機模組

331:耳機本體

34:影像擷取模組

35:語音追蹤模組

351:定向追蹤模式

352:預定講者追蹤模式

353:小組收音模式

354:定向追蹤單元

355:語音提取單元

356:按鍵單元

4:隨身裝置

41:預定講者分析模組

411:講者特徵建立單元

412:講者特徵比對單元

42:可能性講者分析模組

421:可能性分析單元

422:嘴唇開合分析單元

43:講者定位模組

Claims

一種注意力集中輔助系統，適用於供一位使用者配戴，並包含：一個收音裝置，包括一個用以供配戴在該使用者頭部且可被該使用者帶動水平偏轉位移的載具，及安裝在該載具的一個麥克風陣列、一個耳機模組、一個影像擷取模組與一個語音追蹤模組，該麥克風陣列具有多個間隔設置在該載具的麥克風，該耳機模組具有兩個用以供分別設置在該使用者雙耳的耳機本體，該影像擷取模組可朝該載具正面方向進行影像擷取以得到一個視野影像，該語音追蹤模組內建有一個預定講者追蹤模式，會於啟動該預定講者追蹤模式時，控制啟動該影像擷取模組，並將該視野影像傳送至該隨身裝置，且會以波束成形技術控制該麥克風陣列朝該隨身裝置回傳的一個預定講者方位進行語音提取以得到一個語音訊號，並經由該等耳機本體輸出該語音訊號以供聆聽；及一個隨身裝置，用以供該使用者配戴且與該收音裝置訊號連接，包括一個預定講者分析模組，及一個講者定位模組，該預定講者分析模組包括一個講者特徵比對單元，該講者特徵比對單元可根據一個對應一預定講者的講者影像特徵參數分析該視野影像中的人物以識別得到一講者影像，該講者定位模組會分析該講者影像於該視野影像中的位置以得到該預定講者方位。
如請求項1所述的注意力集中輔助系統，其中，該語音追蹤模組包括一個定向追蹤單元，及一個語音提取單元，該定向追蹤單元可用以偵測該載具之水平偏轉角度以得到一個偏轉角度值，且可被操作而以該載具當前的一個正面方向為零度基準重新偵測得到該偏轉角度值，該語音提取單元內建有多個分別對應不同偏轉角度值的收音策略，且會根據當前之該偏轉角度值啟動對應之收音策略，而以波束成形技術控制預定位置與預定數量的麥克風朝該偏轉角度值為零的方向進行語音提取以得到一個語音訊號，該語音追蹤模組還內建有一個定向追蹤模式，會於啟動該定向追蹤模式時，使該定向追蹤單元致能而可被操作。
如請求項1所述的注意力集中輔助系統，其中，該預定講者分析模組還包括一個講者特徵建立單元，該講者特徵建立單元可供操作輸入該預定講者的人物影像，且會分析擷取該人物影像的人物特徵以建立該講者影像特徵參數。
如請求項1所述的注意力集中輔助系統，其中，該語音追蹤模組還內建有一個小組收音模式，且會於啟動該小組收音模式時，將該視野影像傳送至該隨身裝置，該隨身裝置還包括一個會於該語音追蹤模組啟動該小組收音模式被觸發啟動的可能性講者分析模組，該可能性講者分析模組可分析該視野影像中的所有人臉影像相對於該使用者之距離與方位，並根據該等人臉影像之距離和方位，對該等人臉影像作為講話對象之可能性進行演算分類，而得到一個可能性訊號源分類，該可能性訊號源分類規劃有多個分別具有不同可能性的級別，該講者定位模組會分析被分類於可能性最高的一個級別內的每一人臉影像於該視野影像中的位置以得到一個可能性講者方位，並將該可能性講者方位回傳至該收音裝置，該語音提取單元會以波束形成技術控制該麥克風陣列朝每一可能性講者方位對應之方向進行語音提取以得到一個語音訊號，並經由該耳機模組出所得到的每一語音訊號。
如請求項4所述的注意力集中輔助系統，其中，該可能性講者分析模組具有一個可能性分析單元，該可能性分析單元內建有一用以分析該等人臉影像作為講話對象之可能性的可能性分類基準，該可能性分類基準就人臉影像相對於該使用者之距離遠近、方位與左右偏轉角度大小設定有不同之運算權重比，該可能性分析單元會根據該可能性分類基準所設定之運算權重對該等人臉影像作為講話對象之可能性進行演算分類，以得到該可能性訊號源分類，而將每一人臉影像分類於對應的可能性級別中。
如請求項5所述的注意力集中輔助系統，其中，該可能性講者分析模組還具有一個嘴唇開合分析單元，該嘴唇開合分析單元會分析被分類在最高可能性級別中的每一個人臉影像的嘴唇是否開合作動，並將嘴唇有開合作動的每一個人臉影像判斷為一個可能講者，該講者定位模組會分析被判斷為該可能講者的每一人臉影像於該視野影像中的位置以得到該可能性講者方位。