CN111429928A

CN111429928A - 具收音场景切换功能的助听系统

Info

Publication number: CN111429928A
Application number: CN201911233217.6A
Authority: CN
Inventors: 陈筱涵
Original assignee: Individual
Current assignee: Individual
Priority date: 2019-01-10
Filing date: 2019-12-05
Publication date: 2020-07-17
Also published as: US20200228894A1; JP2020113981A; US10827260B2; TWI768175B; TW202027520A

Abstract

一种具收音场景切换功能的助听系统，包含影像撷取器、麦克风数组单元、收音控制装置及声音输出器。收音控制装置可接收分析影像撷取器取得之视野影像而判断出相符的场景影像文本，并根据所述场景影像文本对应之收音策略，控制启动麦克风数组单元进行收音，并由声音输出器输出处理后声音信号。透过收音控制装置可分析所述视野影像以筛选出相符的场景影像文本与收音策略的设计，可使启动之收音策略更切合用户所处环境的收音场景类型，是一种相当创新的创作。

Description

具收音场景切换功能的助听系统

技术领域

本发明涉及一种助听器，特别是涉及一种可切换收音场景的助听系统。

背景技术

目前助听器可利用声音信号特性不同，有效的区分语音(speech)及噪音(noise)，而将噪音信号滤除，且可通过方向性麦克风的设计，降低来自使用者后方及侧面的声音信号，然而日常生活环境中的声音来源型态多变，来自使用者前方的声音信号中，除了谈话对象的语音外，可能仍然充斥着其他人的讲话声，且其中大多数语音信号是使用者不想听的，例如菜市场场合、餐厅场合、演讲场合与会议场合等环境的讲话者声音来源多变且不同，但是现有麦克风的音频处理芯片并无法进行这些声音场景的辨识以调整采用适合的麦克风策略，只具有简单分析音讯以决定开启全向性收音或方向性收音的简单功能，所以使用上仍存在许多不便。

虽然较先进的助听器可通过双耳通信与波束成型的技术定位声音的方向，但是面对前方有多个语言信号时，通常无法得知哪个方向的语音信号是大脑要的，所以只能保留使用者最正面的较强语言信号，以致于在面临一对二讲话、一对三讲话，或者是使用者前方有很多人在讲话的场面时，经常无法顺利取得所需的语音信号。

发明内容

本发明的目的在于提供一种具收音场景切换功能而能改善先前技术之至少一个缺点的助听系统。

本发明具收音场景切换功能的助听系统，适用于供用户配戴使用。所述助听系统包含可撷取所述用户前方之视野影像的影像撷取器、麦克风数组单元、信号连接于所述影像撷取器与所述麦克风数组单元的收音控制装置，及至少一个信号连接于所述收音控制装置的声音输出器。所述麦克风数组单元包括多个相间隔之麦克风，每一麦克风可被单独控制启动以撷取得到声音信号。所述收音控制装置包括场景分析模块、收音策略控制模块，及音讯处理模块。所述场景分析模块内建有多个分别代表多种场景环境的场景影像文本，可分析所述视野影像以得到至少一个相对应的场景影像文本，所述收音策略控制模块内建有多个分别对应所述场景影像文本的收音策略，会根据所述场景分析模块分析得到之所述至少一场景影像文本启动对应之收音策略，而控制启动特定数量的麦克风进行收音，所述音讯处理模块内建有多个分别对应所述收音策略的音频处理模式，会以对应之音频处理模式接收处理被启动之所有麦克风撷取的声音信号以得到处理后声音信号。所述至少一声音输出器可将所述处理后声音信号输出以供所述用户聆听。

本发明所述的具收音场景切换功能的助听系统，还包含信号连接于所述收音控制装置的显示设备，所述场景分析模块可根据所述场景影像文本分析所述视野影像，以得到每一场景影像文本与所述视野影像的相符程度，且会将相符程度大于预定值的每一场景影像文本传送至所述显示设备显示以供选择，所述收音策略控制模块会根据被选择之所述场景影像文本启动对应之收音策略，而控制启动特定数量的麦克风进行收音。

本发明所述的具收音场景切换功能的助听系统，所述场景分析模块内建有可供选择启动的手动场景模式与自动场景模式，于启动所述手动场景模式时，会控制所述显示设备显示全部场景影像文本以供选择，于启动所述自动场景模式时，会根据所述场景影像文本分析所述视野影像，且会将相符程度大于所述预定值的多个场景影像文本传送至所述显示设备显示以供选择。

本发明所述的具收音场景切换功能的助听系统，所述收音控制装置还包括启动控制模块，所述启动控制模块会控制启动至少一个麦克风进行收音以得到所述声音信号，且会触发所述音讯处理模块分析所述声音信号是否存在语音，所述启动控制模块会于所述音讯处理模块分析所述声音信号存在语音时，控制启动所述影像撷取器，并触发启动所述场景分析模块。

本发明所述的具收音场景切换功能的助听系统，还包含可供配戴于所述用户身上的载具，所述影像撷取器与所述麦克风数组单元的麦克风设置于所述载具。

本发明所述的具收音场景切换功能的助听系统，所述载具为眼镜，且具有位于所述用户眼前的镜片，所述显示设备是安装在所述载具，且可通过微投影技术将所述场景影像文本与该视野影像投射成像于所述镜片以供选择。

本发明所述的具收音场景切换功能的助听系统，所述载具为眼镜，所述显示设备为安装在所述载具而位于所述用户眼前的透明液晶显示设备。

本发明所述的具收音场景切换功能的助听系统，所述显示设备包括遥控模块及触控显示模块，所述遥控模块内建有可被启动的场景收音模式，所述遥控模块启动所述场景收音模式时，会控制所述触控显示模块显示所述场景影像文本以供点选，且会对应被点选之所述场景影像文本产生并传送场景点选信号至所述收音控制装置，所述收音策略控制模块会被所述场景点选信号触发而启动对应之收音策略。

本发明所述的具收音场景切换功能的助听系统，所述收音控制装置还包括方位收音控制模块，所述遥控模块内建有可被切换启动的所述场景收音模式与方位收音模式，所述遥控模块切换启动所述方位收音模式时，会控制所述触控显示模块同步显示所述视野影像以供点选，且会根据被点选之影像区域于所述视野影像中的方位，对应产生并传送方位点选信号至所述收音控制装置，所述方位收音控制模块会被所述方位点选信号触发，而控制启动特定数量与设置位置的麦克风进行收音，所述音讯处模块会以波束成形方法对所述麦克风撷取之声音信号进行过滤处理，以过滤得到对应所述方位点选信号代表之所述视野影像中的方位的处理后声音信号。

本发明的功效在于：通过该收音控制装置内建有所述场景影像文本与所述收音策略的设计，以及通过分析该视野影像以筛选出相符的场景影像文本的设计，可更准确识别出该用户所处环境的收音场景类型，而启动适合的收音策略，是一种相当创新的创作。

附图说明

本发明的其他的特征及功效，将于参照图式的实施方式中清楚地呈现，其中：

图1是本发明具收音场景切换功能的助听系统的一个实施例的架构示意图；及

图2是该实施例的功能方块图。

具体实施方式

在本发明被详细描述前，应当注意在以下的说明内容中，类似的组件是以相同的编号来表示。

参阅图1、2，本发明具收音场景切换功能的助听系统200的实施例，包含一个用于供一位用户配戴的载具3、整合设置于该载具3的一个影像撷取器4、一个麦克风数组单元5、一个收音控制装置6与两个声音输出器7，及一个显示设备8，该收音控制装置6信号连接于该影像撷取器4、该麦克风数组单元5与所述声音输出器7。该显示设备8可设计成能供持用之手机或平板样式，或者是能供穿戴、吊挂于身上之手环、手表或项链形式，且是通过有线通信技术及/或无线通信技术信号连接于该收音控制装置6。由于无线通信技术类型众多且非本发明改良重点，因此不再详述。

在本实施例中，该载具3是设计成眼镜型式，可供该用户配戴于头部，具有一个位于用户双眼前方且安装有镜片32的前载体31，及两个分别安装于该前载体31左右两侧并供配挂于双耳之镜脚状的侧载体33。

该影像撷取器4安装于该前载体31之中间区段处，可撷取用户前方视野的影像而得到一个视野影像。

该麦克风数组单元5包括多个麦克风51，所述麦克风51左右间隔地设置于该前载体31，以及前后间隔地设置于所述侧载体33。每一麦克风51可被启动感测周遭声音而得到一个声音信号。

该收音控制装置6包括一个启动控制模块61、一个场景分析模块62、一个收音策略控制模块63、一个方位收音控制模块64，及一个音讯处理模块65。

该启动控制模块61会控制启动其中一个麦克风51进行收音以得到一个声音信号，且会控制该音讯处理模块65分析该声音信号是否存在语音成分，并会于该音讯处理模块65分析该声音信号存在语音成分时，触发该影像撷取器4开始进行影像撷取，以及控制该场景分析模块62开始接收分析该视野影像。

该场景分析模块62内建有多个场景影像文本，且内建有可供选择启动的一个手动场景模式621与一个自动场景模式622。所述场景影像文本是根据各种场合环境影像中可能存在之人物数量、每一人物相对用户之面向、距离、方位与移动/运动方式，以及所存在的各种景物影像等参数，以分类模型通过特定分类算法对上述各种参数进行分类辨识学习所建立。

所述场合环境影像例如但是不限于演讲/上课场合、会议场合、户外/公园绿地场合、派对场合、菜市场场合、超市/便利商店场合、市区街道场合、乘车场合与银行柜台场合等，所述景物影像例如但是不限于会议桌、白板、黑板、讲桌、投影机/投影布幕、树木/植栽/绿地、天空、走道、各种交通工具、货架、收款机等。所述分类算法例如但是不限于深度学习(deep beliefnetwork)、复杂判定树算法(Complex tree)、余弦最近邻近算法(consine k-nearest neighbors，Cosine KNN)、卷积式类神经网络算法(convolutional neuralnetwork，CNN)，及二次函数支持向量机算法(Quadratic support vector machine，Quadratic SVM)等。由于各类分类算法根据各种场合环境影像训练建立所述场景影像文本的方式众多，且有其特定模式，因此不再详述。

该场景分析模块62于启动该手动场景模式621时，会控制该显示设备8显示出全部场景影像文本以供用户选择。于启动该自动场景模式622时，会先通过计算机视觉分析技术分析出该视野影像所存在之各种景物影像种类，并根据该各种景物影像种类以特定之分类算法进行该视野影像的分类演算，而得到每一场景影像文本与该视野影像的相符程度，并筛选出相符程度达到一个预定值以上的多个场景影像文本，且对应筛选出之所述场景影像文本产生并传送一个场景比对结果至该显示设备8，控制该显示设备8显示出其筛选得到之所有场景影像文本以供选择。

该收音策略控制模块63内建有多个收音策略，所述收音策略为控制启动所述麦克风51进行收音的方法，例如控制启动哪一个麦克风51以进行全向性收音，或控制启动特定几个麦克风51以相配合进行方向性收音等。该收音策略控制模块63会被该显示设备8针对某一场景影像文本所传送的一个场景点选信号触发，而选择启动对应该场景影像文本的收音策略，进而控制启动特定之麦克风51进行收音。

该方位收音控制模块64会被该显示设备8针对该视野影像中之某一影像区域所传送的一个方位点选信号触发，而根据该影像区域于该视野影像中的方位，启动特定位置与数量的麦克风51以相配合产生数组式麦克风收音功能。

该音讯处理模块65内建有多个分别对应所述收音策略的音频处理模式，会根据该收音策略控制模块63启动之该收音策略，以对应之音频处理模式对该麦克风数组单元5收音得到之声音信号进行音频处理，所述音频处理内容例如但是不限于进行仿真/数字转换、降噪处理与语音提取处理等，会自该声音信号中将不需要之噪音降噪滤除，并将语音信号过滤放大输出，以得到具有较佳信噪比(signal-to-noise ratio)的处理后声音信号，并经由所述声音输出器7输出该处理后声音信号。此外，该音讯处理模块65会于该方位收音控制模块64被触发启动，而启动特定位置与数量的麦克风51以相配合产生数组式麦克风收音功能时，除了会对声音信号进行仿真/数字转换与降噪处理外，还会配合以波束成形方法对该声音信号进行过滤处理，以及进行语音提取处理，借以过滤得到一个对应该方位点选信号代表之该视野影像中的方位的处理后声音信号。

由于该音讯处理模块65对声音信号进行降噪过滤处理与语音提取处理，以及以波束成形方法过滤出特定方位之声音信号都是现有技术，且方法相当多，也非本发明之改良重点，因此不再详述。

该显示设备8包括一个遥控模块81，及一个触控显示模块82。该遥控模块81内建有可被切换启动的一个场景收音模式811与一个方位收音模式812。该遥控模块81启动该场景收音模式811时，会被该收音控制装置6的场景分析模块62触发，而控制该触控显示模块82显示出全部场景影像文本以供点选，或者是显示出该场景比对结果对应之所述场景影像文本以供点选。且该遥控模块81会于其中一个场景影像文本被点选时，对应产生并传送该场景点选信号至该收音控制装置6。

该遥控模块81启动该方位收音模式812时，会控制该触控显示模块82同步接收显示该影像撷取器4撷取之该视野影像，且会于该触控显示模块82显示之该视野影像的其中一个影像区域被点选时，对应产生并传送该方位点选信号至该收音控制装置6。

本发明助听系统200使用时，用户是将该载具3配戴于头部，并将所述声音输出器7安装于双耳，且持用该显示设备8。系统启动后，该影像撷取器4不会立刻启动影像撷取功能，该收音控制装置6会先控制启动一个麦克风51以进行全向性收音，并于分析收音得到之声音信号中存在语音信号时，才控制启动该影像撷取器4进行该视野影像之撷取。该收音控制装置6会分析出与该视野影像相符程度达预定值以上的一个或多个场景影像文本，并进一步比对出每一场景影像文本对应之该收音策略。

当该显示设备8启动该场景收音模式811，且该收音控制装置6之该场景分析模块62启动该手动场景模式621时，该收音控制装置6会控制该显示设备8显示出所有场景影像文本以供选择。当该场景分析模块62启动该自动场景模式622时，该收音控制装置6会将筛选出之所有场景影像文本传送至该显示设备8显示。此时，该用户可根据现场情况，操作该显示设备8以点选最符合需求的场景影像文本，而对应回传一个场景点选信号至该收音控制装置6，该收音控制装置6会根据该场景点选信号启动对应的收音策略，而控制启动特定位置与数量的麦克风51开始进行收音，并对被启动之所有麦克风51取得之声音信号进行语音提取处理，且将该处理后声音信号传送至所述声音输出器7输出，以供该用户聆听。

当该显示设备8启动该方位收音模式812时，该收音控制装置6会将该影像撷取器4撷取得到之该视野影像同步传送至该显示设备8。此时，用户可操作该显示设备8以点选该视野影像中预定聆听之的影像区域，该显示设备8会对应回传一个方位点选信号至该收音控制装置6。该收音控制装置6会根据该方位点选信号对应之方位，控制启动特定位置与数量的麦克风51，并通过波束成形方法过滤出对应方位之声音信号，并对该声音信号进行语音提取处理，然后将该处理后声音信号传送至所述声音输出器7输出，以供该用户聆听。

在本实施例中，该收音控制装置6是整合设置在该载具3，并通过无线通信技术与该用户手持的该显示设备8信号连接，但是实施时，在本发明之另一实施态样中，可不将该收音控制装置6设置在该载具3，而是改为整合设置在该显示设备8，可借此降低该载具3所设置之电子组件数量，而相对减轻配戴重量。

而在本发明之另一实施态样中，该显示设备8也可改为具有微投影功能的装置，并整合设置在该载具3，且可对该载具3之该镜片32进行微投影，而于该镜片32显示出所述场景影像文本与该视野影像，以供该用户通过视觉控制或其它输入构件来点选所述场景影像文本与点选该视野影像之影像区域。而在本发明之再另一实施态样中，该显示设备8也可改为透明液晶显示设备，并安装在该载具3而位于该用户眼前，用于作为眼镜形式之该载具的镜片使用。

再者，实施时，在本发明之其它实施态样中，该显示设备8非为必要，该收音控制装置6可分析该视野影像以取得相符程度最高的该场景影像文本，并直接启动对应之收音策略以控制该麦克风数组单元5进行收音，不需再通过该显示设备8进行点选。

综上所述，通过该收音控制装置6内建有多种场景影像文本与多个分别对应所述场景影像文本之收音策略的设计，以及可通过分析该影像撷取器4取得之该视野影像，而筛选出相符持程度达特定值以上的场景影像文本以供用户选择的设计，可更准确识别出该用户所处环境的收音场景类型，且用户也可通过操作该显示设备8的方式自行选择最适合的场景影像文本。此外，用户也可通过选择启动该显示设备8之方位收音模式812，通过直接点选该显示设备8显示之该视野影像中的某一影像区域的方式，控制该收音控制装置6以波束成形技术对该视野影像中之特定方位进行收音，相当方便。因此，本发明具收音场景切换功能的助听系统200确实是一种相当创新的创作，确实能达成本发明的目的。

以上所述者，只为本发明的实施例而已，当不能以此限定本发明实施的范围，凡是依本发明权利要求书及说明书内容所作的简单的等效变化与修饰，都仍属本发明的范围。

Claims

1.一种具收音场景切换功能的助听系统，适用于供用户配戴使用，并包含可撷取所述用户前方之视野影像的影像撷取器、麦克风数组单元，及至少一个声音输出器，所述麦克风数组单元包括多个相间隔之麦克风，每一麦克风可被单独控制启动以撷取得到声音信号，其特征在于：所述助听系统还包含收音控制装置，所述收音控制装置信号连接于所述影像撷取器、所述麦克风与所述声音输出器，包括场景分析模块、收音策略控制模块，及音讯处理模块，所述场景分析模块内建有多个分别代表多种场景环境的场景影像文本，可分析所述视野影像以得到至少一个相对应的场景影像文本，所述收音策略控制模块内建有多个分别对应所述场景影像文本的收音策略，会根据所述场景分析模块分析得到之所述至少一场景影像文本启动对应之收音策略，而控制启动特定数量的麦克风进行收音，所述音讯处理模块内建有多个分别对应所述收音策略的音频处理模式，会以对应之音频处理模式接收处理被启动之所有麦克风撷取的声音信号以得到处理后声音信号，并经由所述声音输出器输出所述处理后声音信号以供所述用户聆听。

2.根据权利要求1所述的具收音场景切换功能的助听系统，其特征在于：还包含信号连接于所述收音控制装置的显示设备，所述场景分析模块可根据所述场景影像文本分析所述视野影像，以得到每一场景影像文本与所述视野影像的相符程度，且会将相符程度大于预定值的每一场景影像文本传送至所述显示设备显示以供选择，所述收音策略控制模块会根据被选择之所述场景影像文本启动对应之收音策略，而控制启动特定数量的麦克风进行收音。

3.根据权利要求2所述的具收音场景切换功能的助听系统，其特征在于：所述场景分析模块内建有可供选择启动的手动场景模式与自动场景模式，于启动所述手动场景模式时，会控制所述显示设备显示全部场景影像文本以供选择，于启动所述自动场景模式时，会根据所述场景影像文本分析所述视野影像，且会将相符程度大于所述预定值的多个场景影像文本传送至所述显示设备显示以供选择。

4.根据权利要求2或3所述的具收音场景切换功能的助听系统，其特征在于：所述收音控制装置还包括启动控制模块，所述启动控制模块会控制启动至少一个麦克风进行收音以得到所述声音信号，且会触发所述音讯处理模块分析所述声音信号是否存在语音，所述启动控制模块会于所述音讯处理模块分析所述声音信号存在语音时，控制启动所述影像撷取器，并触发启动所述场景分析模块。

5.根据权利要求2或3所述的具收音场景切换功能的助听系统，其特征在于：还包含可供配戴于所述用户身上的载具，所述影像撷取器与所述麦克风数组单元的麦克风设置于所述载具。

6.根据权利要求5所述的具收音场景切换功能的助听系统，其特征在于：所述载具为眼镜，且具有位于所述用户眼前的镜片，所述显示设备安装在所述载具，且可通过微投影技术将所述场景影像文本与该视野影像投射成像于所述镜片以供选择。

7.根据权利要求5所述的具收音场景切换功能的助听系统，其特征在于：所述载具为眼镜，所述显示设备为安装在所述载具而位于所述用户眼前的透明液晶显示设备。

8.根据权利要求5所述的具收音场景切换功能的助听系统，其特征在于：所述显示设备包括遥控模块及触控显示模块，所述遥控模块内建有可被启动的场景收音模式，所述遥控模块启动所述场景收音模式时，会控制所述触控显示模块显示所述场景影像文本以供点选，且会对应被点选之所述场景影像文本产生并传送场景点选信号至所述收音控制装置，所述收音策略控制模块会被所述场景点选信号触发而启动对应之收音策略。

9.根据权利要求8所述的具收音场景切换功能的助听系统，其特征在于：所述收音控制装置还包括方位收音控制模块，所述遥控模块内建有可被切换启动的所述场景收音模式与方位收音模式，所述遥控模块切换启动所述方位收音模式时，会控制所述触控显示模块同步显示所述视野影像以供点选，且会根据被点选之影像区域于所述视野影像中的方位，对应产生并传送方位点选信号至所述收音控制装置，所述方位收音控制模块会被所述方位点选信号触发，而控制启动特定数量与设置位置的麦克风进行收音，所述音讯处模块会以波束成形方法对所述麦克风撷取之声音信号进行过滤处理，以过滤得到对应所述方位点选信号代表之所述视野影像中的方位的处理后声音信号。