WO2017067319A1

WO2017067319A1 - 信息传输方法和装置、及终端

Info

Publication number: WO2017067319A1
Application number: PCT/CN2016/096644
Authority: WO
Inventors: 么文琦
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-10-21
Filing date: 2016-08-25
Publication date: 2017-04-27
Also published as: CN106612364A

Abstract

一种信息传输方法和装置、及终端；该方法包括：获取人体喉部的震动发声；根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；通过通信网络传输所述转换信息。

Description

信息传输方法和装置、及终端

技术领域

本公开涉及通信技术领域，例如涉及信息传输方法和装置、及终端。

背景技术

手机作为一种通信工具已经得到了广泛的使用，用户使用手机可以方便地和其他人进行实时语音或文字通信。相关技术中，手机可通过麦克风收集用户发出的声音，从而实现语音通信。然而对于用户无法或者不方便发出语音场景，则用户无法用手机进行语音通信，例如，聋哑人无法发出可辨识的语音，则不能使用相关技术中的手机进行语音通话，普通用户在不方便发出语音的情况下，也不能使用相关技术中的手机进行语音通话。因此人们希望有一款手机能够满足无需用户发出语音，也可以进行语音通信的需求，然而，目前的终端难以满足这种需求。

发明内容

为了解决上述问题，本公开提出了一种信息传输方法和装置、及终端，能够实现用户无需发出声音即可使用终端进行语音通信的需求。

本公开实施例提出了一种信息传输方法，包括：

获取人体喉部的震动发声；

根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；以及

通过通信网络传输所述转换信息。

可选地，在所述获取震动发声对应的转换信息之后，还包括：

在转换信息为语音信息的情况下，将所述语音信息发送至麦克风输出端口。

可选地，还包括：

获取多个转换信息，并呈现所述多个转换信息，根据对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。

可选地，所述获取多个转换信息包括：根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个文字信息；

所述呈现多个转换信息包括：显示所述多个文字信息；

可选地，所述获取多个转换信息包括：根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息；

所述呈现多个转换信息包括：播放所述多个语音信息。

可选地，在所述获取人体喉部的震动发声之后，在所述根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息之前，还包括：

对获取的震动发声进行噪声滤除处理。

可选地，还包括：

接收通过通信网络传输的语音信息；

将所述语音信息转换为文字信息；以及

呈现所述文字信息。

本公开实施例还提出了一种信息传输装置，设置在终端上，包括：

拾音单元，设置为获取人体喉部的震动发声；

转换单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；以及

传输单元，设置为通过通信网络传输所述转换信息。

可选地，在转换信息为语音信息的情况下，所述转换单元将所述语音信息发送至麦克风输出端口。

可选地，还包括：

学习单元，设置为获取多个转换信息，并呈现所述多个转换信息，根据用户对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。

可选地，所述学习单元包括如下子单元的至少一个：

第一学习子单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个文字信息；并显示所述多个文字信息；

第二学习子单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息；并播放所述多个语音信息。

可选地，还包括：

滤噪单元，设置为对获取的震动发声进行噪声滤除处理。

可选地，还包括接收单元，设置为

接收通过通信网络传输的语音信息；

将所述语音信息转换为文字信息；以及

呈现所述文字信息。

本公开实施例还提出了一种终端，所述终端包括上述任一种信息传输装置。

本公开实施例还提供了一种非瞬时性计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述任一种信息传输方法。

本公开实施例还提供了一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够实现上述任一种信息传输方法。

与相关技术相比，本公开提供的技术方案，通过将人喉部发出的震动发声直接转换为转换信息，中间不需要实际声音的发出，转换信息为语音信息，通过通信网络将转换信息发送给对方，对方经过语音还原便可以听到通话发起方的声音，通过这种方式，可以做到“安静的”进行语音电话。整个过程不需发音，也不容易被旁人发觉，一方面，失语症患者之类的特殊人群，可以利用喉部的震动发声进行语音通话，从而给失语症患者提供了一种可以进行语音通话的通信终端，另一方面，为不方便发出声音的但又希望进行语音通话的场景下的通话提供了一种解决方法。

附图说明

下面对本公开实施例中的附图进行说明，实施例中的附图是用于对本公开实施例的理解，与说明书一起用于解释本公开实施例，并不构成对本公开实施例保护范围的限制。

图1为人体发声的示意图；

图2为本公开实施例提供的信息传输方法的流程图；

图3为本公开实施例提供的信息传输装置的结构组成示意图；

图4为本公开实施例提供的电子设备的硬件结构示意图。

实施方式

为了便于本领域技术人员的理解，下面结合附图对本公开作相关的描述，并不能用来限制本公开实施例的保护范围。需要说明的是，在不冲突的情况下，本公开实施例及实施例中的各种方式可以相互组合。

在介绍本公开实施例提出了一种信息传输方法和装置、及终端之前，首先对本公开实施例提供的信息传输方法和装置、及终端所基于的原理进行相关说明。

人类发音可分为四个步骤：产音，振动，共鸣和改扩发音。产音是由于肺呼气气流移动而产生；振动是喉声带振动而产生基本音；共鸣是喉以上的咽、口腔、鼻腔扩大声音；改扩发音是舌、齿、唇和腭改造扩大的基本音，而成为可辨识的声音。请参阅图1，为人体发声的示意图，如图1所示，喉声带1通过振动产生基本音，基本音经过口腔2中的舌、齿、唇和腭的改造扩大，为可辨识的声音。

聋哑人不能发出普通人可辨识的声音，但是通常聋哑人的喉声带依然可以震动发声，因此，可以利用喉声带的震动发声来进行语音通信。

相关技术中，以手机之类的通信工具为例，手机通过麦克风拾取用户的声音，麦克风的输入信号为用户的声音信号，麦克风的输出为对应的语音采样信号，其中，语音采样信号为模拟信号，语音采样信号经过模数转换转换为数字信号，再通过调制和载波的方式从通信网络进行发送。

其中，语音采样信号在通信网络中的另一端的手机中将还原为声音信号，从而实现远距离的语音通话。

本公开实施例提出了一种信息传输方法，该方法可应用于终端。参见图2，所述方法包括步骤100，300和500。

在步骤100中，获取人体喉部的震动发声；

在步骤300中，根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；

其中，所述转换信息指人类的语言所代表信息，例如，转换信息是语音信息或者文字信息。通过转换信息，具有普通交流能力的人能够理解表达者所要表达的信息或观点。例如，一条震动发声的发音为“诶哦啊”，普通人难以理解该震动发声所要表达的信息，经过转换得到的对应的语音信息或文字信息为“你好啊”，普通人能够理解转换后的语音信息或文字信息所要表达的信息或观点。

在步骤500中，通过通信网络传输所述转换信息。

本公开实施例中，在步骤300之后，该方法还可以包括步骤400。

在步骤400中，在转换信息为语音信息的情况下，将所述语音信息传输至麦克风输出端口。转换信息的格式对应麦克风输出端口的语音采样信号，这样，可以充分利用终端中已有的功能模块，避免对硬件部分的改动太大。

本公开实施例中，所述信息传输方法还包括：

获取多个转换信息，并呈现所述多个转换信息，根据用户对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。

其中，所述获取多个转换信息包括：

根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个文字信息；

所述呈现多个转换信息包括：显示所述多个文字信息。

或者，所述获取多个转换信息包括：根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息；所述呈现多个转换信息包括：播放所述多个语音信息。

由于聋哑人只能通过文字查看多个转换信息，即多个识别结果，因此需要将震动发声转换为对应的文字信息。在转换过程中，可以根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息，然后，根据语音信息与文字信息之间的对应关系，分别获取多个语音信息对应的文字信息，从而获取震动发声对应的多个文字信息。

对于普通人，如果希望使用本公开提供的信息传输装置，在机器学习的过程中，也可以通过语音来对多个转换结果进行选择。

上述调整过程可以上是机器学习的过程，针对每次手机识别的震动发声做机器学习，并通过用户后期的调整，能过不断提高震动发声信号转换的正确性。在使用初期，用户可以与机器建立一个友好的互动，不断训练语音传输设备对震动发生的识别的正确率，可以为日后更可好高效的声音识别提供可靠保证。

本公开实施例中，在步骤100之后，和步骤300之前，所述方法还可以包括：

在步骤200中，对获取的震动发声进行噪声滤除处理。

因为人体喉部发音时震动频率及幅度是有一定范围的，故可以将在这个范围及幅度外的信号作为噪音，将其过滤。这样过滤后的信号通过识别之后，转换为对应的转换信号。

所述信息传输方法还可以包括：

接收通过通信网络传输的语音信息，将所述语音信息转换为文字信息，呈现所述文字信息。

下面结合实施场景进行示例性说明。

用户打开终端，将终端置于喉部，通过呼吸气流发声，并在学习过程对终端识别的震动声音做甄别，以训练终端识别的正确率。

用户使用该终端拨打电话，在通话时，将设备置于喉部，通过呼吸气流发声，终端收集震动，并做必要转换，通过终端的语音信道发送出去。对接受方而言，使用普通的电话，手机，就可以听见用户的语音。

需要说明的是，上述方法可只应用于发起语音通话的终端中，对接收语音通话的终端，传送语音的传送端，以及运营商的使用环境等均无特别需求。

本公开实施例中，通过终端对人体喉部的震动发声进行收集，通过将人喉部发出的震动发声直接转换为转换信息，中间不需要实际声音的发出，转换信息为语音信息，通过通信网络将转换信息发送给对方，对方经过语音还原便可以听到通话发起方的声音，通过这种方式，可以做到“安静的”进行语音电话。整个过程不需发音，也不容易被旁人发觉，一方面，给失语症患者提供了一种可以进行语音通话的通信终端，另一方面，为不方便发出声音的但又希望进行语音通话的场景下的通话提供了一种解决方法。

基于与上述实施例相同或相似的构思，本公开实施例还提供一种信息传输装置，设置在终端上，参见图3，本公开实施例提出的一种信息传输装置包括拾音单元10，转换单元30和传输单元40，其中：

拾音单元10，设置为获取人体喉部的震动发声；

转换单元30，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；以及

传输单元40，设置为通过通信网络传输所述转换信息。

本公开实施例中，在转换信息为语音信息的情况下，所述转换单元30将所述语音信息发送至麦克风输出端口。

本公开实施例中，所述信息传输装置还可以包括：

学习单元50，设置为获取多个转换信息，并呈现所述多个转换信息，根据用户对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。

学习单元50对匹配关系进行调整之后，将改变转换单元30的转换过程。

本公开实施例中，所述学习单元50包括如下子单元的至少一个：

本公开实施例中，所述信息传输装置还可以包括：

滤噪单元20，设置为对获取的震动发声进行噪声滤除处理。

本公开实施例中，所述信息传输装置还可以包括接收单元60，设置为：

接收通过通信网络传输的语音信息；

将所述语音信息转换为文字信息；以及

呈现所述文字信息。

基于与上述实施例相同或相似的构思，本公开实施例还提供一种终端，所述终端包括本公开实施例提供的任一信息传输装置。

基于与上述实施例相同或相似的构思，本公开实施例还提供了一种电子设备，参见图4，该电子设备包括：

一个或多个处理器1000，图4中以一个处理器1000为例；

存储器2000。

所述电子设备还可以包括：输入装置3000和输出装置4000。

所述电子设备中的处理器1000、存储器2000、输入装置3000和输出装置 4000可以通过总线或者其他方式连接，图4中以通过总线连接为例。

存储器2000作为一种非瞬时性计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块。处理器1000通过运行存储在存储器2000中的软件程序、指令以及单元，从而执行各种功能应用以及数据处理，即实现上述方法实施例的信息传输方法。

存储器2000可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器2000可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性存储器件。在一些实施例中，存储器2000可选包括相对于处理器1000远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本实施例的输入装置3000可包括麦克风，获取人体喉部的震动发声，还可以包括接收输入的数字或字符信息，以及产生与终端的用户设置以及功能控制有关的键信号输入的其他输入装置，比如按键或触摸屏。输出装置4000可包括显示屏等显示设备，以及扬声器等音频播放设备。

本实施例的电子设备还可以包括通信装置5000，通过通信网络传输和/或接收信息。

基于与上述实施例相同或相似的构思，本实施例还提供了一种非瞬时性计算机可读存储介质，存储有计算机可执行指令，该计算机可执行指令用于执行上述任意一种信息传输方法。

需要说明的是，本领域普通技术人员可理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来执行相关的硬件来完成的，该程序可存储于一个非瞬时性计算机可读存储介质中，该程序在执行时，可包括如上述方法的实施例的流程，其中，该计算机可读存储介质可以为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

工业实用性

本公开实施例的信息传输方法和装置以及终端，通过将人喉部发出的震动发声直接转换为转换信息，中间不需要实际声音的发出，通过通信网络将转换信息发送给对方，对方经过语音还原便可以听到通话发起方的声音，给失语症患者提供了一种可以进行语音通话的通信终端，也为不方便发出声音的但又希望进行语音通话的场景下的通话提供了一种解决方法。

Claims

一种信息传输方法，包括：

获取人体喉部的震动发声；

根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；以及

通过通信网络传输所述转换信息。
根据权利要求1所述的方法，在所述获取震动发声对应的转换信息之后，还包括：

在转换信息为语音信息的情况下，将所述语音信息发送至麦克风输出端口。
根据权利要求1所述的方法，还包括：

获取多个转换信息，并呈现所述多个转换信息，根据对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。
根据权利要求3所述的方法，其中，

所述获取多个转换信息包括：根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个文字信息；

所述呈现多个转换信息包括：显示所述多个文字信息。；
根据权利要求3所述的方法，其中，

所述获取多个转换信息包括：根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息；

所述呈现多个转换信息包括：播放所述多个语音信息。
根据权利要求3所述的方法，在所述获取人体喉部的震动发声之后，在所述根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息之前，还包括：

对获取的震动发声进行噪声滤除处理。
根据权利要求1-6任一项所述的方法，还包括：

接收通过通信网络传输的语音信息；

将所述语音信息转换为文字信息；以及

呈现所述文字信息。
一种信息传输装置，设置在终端上，包括：

拾音单元，设置为获取人体喉部的震动发声；

转换单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的转换信息；所述转换信息为文字信息或语音信息；以及

传输单元，设置为通过通信网络传输所述转换信息。
根据权利要求8所述的信息传输装置，其中，在转换信息为语音信息的情况下，所述转换单元将所述语音信息发送至麦克风输出端口。
根据权利要求8所述的信息传输装置，还包括：

学习单元，设置为获取多个转换信息，并呈现所述多个转换信息，根据对多个转换信息的选择结果，对震动发声与语音信号之间的匹配关系进行调整。
根据权利要求10所述的信息传输装置，其中，所述学习单元包括如下子单元的至少一个：

第一学习子单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个文字信息；并显示所述多个文字信息；以及

第二学习子单元，设置为根据存储的震动发声与语音信号之间的匹配关系，获取震动发声对应的多个语音信息；并播放所述多个语音信息。
根据权利要求10所述的信息传输装置，还包括：

滤噪单元，设置为对获取的震动发声进行噪声滤除处理。
根据权利要求8所述的信息传输装置，还包括接收单元，设置为：

接收通过通信网络传输的语音信息；

将所述语音信息转换为文字信息；以及

呈现所述文字信息。
一种终端，包括权利要求8-12中任一项所述的信息传输装置。
一种非瞬时性计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1-7任一项所述的信息传输方法。