CN109063624A

CN109063624A - 信息处理方法、系统、电子设备和计算机可读存储介质

Info

Publication number: CN109063624A
Application number: CN201810841361.7A
Authority: CN
Inventors: 魏尚利
Original assignee: Shenzhen Man Niu Medical Co Ltd
Current assignee: Shenzhen Man Niu Medical Co Ltd
Priority date: 2018-07-26
Filing date: 2018-07-26
Publication date: 2018-12-21

Abstract

本发明实施例公开了一种信息处理方法、系统、电子设备和计算机可读存储介质，该方法包括：获取所述第一处理装置采集的手势姿态信息，并根据动作识别模型对所述手势姿态信息进行识别；当识别出所述手势姿态信息与预设标准姿态信息匹配时，通过所述第一处理装置输出与所述手势姿态信息对应的第一输出信息；获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别；当识别出所述语音信息与预设音频信息匹配时，通过所述第二处理装置输出与所述语音信息对应的第二输出信息。通过上述方法，丰富了聋哑人与正常人之间的沟通交流方式，使聋哑人与正常人能够高效沟通。

Description

信息处理方法、系统、电子设备和计算机可读存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种信息处理方法、系统、电子设备和计算机可读存储介质。

背景技术

随着社会的科技发展和进步，聋哑人群越来越得到社会的关注和重视，聋哑人群需要更高效率的与正常人进行沟通，来满足生活、工作等需求，而正常人也需要更好的理解与聋哑人沟通过程中所表达的内容，因此通过辅助产品来实现正常人与聋哑人之间的沟通显得尤为重要。

传统的辅助沟通产品通常需要聋哑人长期佩带设备，识别手语精准度不高，并且交流方式单一，导致单方面的沟通方式无法满足不同人群的需求，例如：当聋哑人使用手语沟通时，不懂手语的正常人无法理解到聋哑人需要表达的内容；或者，当不懂手语的正常人说话时，聋哑人无法理解正常人所表达的内容。

因此，现有的社交方法和方式无法全面性的满足聋哑人在沟通方面的需求，如何满足聋哑人与正常人高效的沟通，成为亟待解决的问题。

发明内容

本发明实施例提供一种信息处理方法、系统、电子设备和计算机可读存储介质，丰富了沟通交流方式，使聋哑人与正常人能够高效沟通。

一种信息处理方法，应用于便于聋哑人与正常人沟通的信息处理系统，所述信息处理系统包括第一处理装置和第二处理装置，所述第一处理装置用于处理第一类用户的手势姿态信息，所述第二处理装置用于处理第二类用户的语音信息；所述方法包括：

获取所述第一处理装置采集的手势姿态信息，并根据动作识别模型对所述手势姿态信息进行识别；

当识别出所述手势姿态信息与预设标准姿态信息匹配时，通过所述第一处理装置输出与所述手势姿态信息对应的第一输出信息；

获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别；

当识别出所述语音信息与预设音频信息匹配时，通过所述第二处理装置输出与所述语音信息对应的第二输出信息。

可选的，在其中一个实施例中，所述第一处理装置包括图像采集模块；所述获取所述第一处理装置采集的手势姿态信息，包括：

获取所述图像采集模块采集的具有所述手势姿态信息的图像；

分析所述图像中的手势特征；其中所述手势特征包括形状、运动轨迹、颜色、轮廓、深度中的一种或一种以上。

可选的，在其中一个实施例中，在所述根据动作识别模型对所述手势姿态信息进行识别之前，所述方法还包括：

采集国际标准手语的手势特征作为预设标准姿态信息，并建立所述预设标准姿态信息与所述第一输出信息的对应关系。

可选的，在其中一个实施例中，所述第一处理装置还包括音频播放模块和第一显示模块，所述第一输出信息包括语音信息和文字信息；

所述通过所述第一处理装置输出与所述手势姿态信息对应的第一输出信息，包括：

通过所述音频播放模块播放与所述手势姿态信息对应的语音信息；

通过所述第一显示模块显示与所述手势姿态信息对应的文字信息。

可选的，在其中一个实施例中，所述第二处理装置包括音频采集模块，所述获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别，包括：

建立预设音频信息与所述第二输出信息的映射关系；

获取基于所述第二处理装置中的音频采集模块采集的语音信息；

对所述语音信息进行预处理，并根据所述预设音频信息与第二输出信息的映射关系，确定与所述语音信息对应的第二输出信息。

可选的，在其中一个实施例中，所述第二处理装置还包括第二显示模块，所述通过所述第二处理装置输出与所述语音信息匹配的第二输出信息，包括：

基于所述第二处理装置中的第二显示模块输出所述第二输出信息，其中所述第二输出信息包括文字、手势动作、动画中的一种或一种以上。

可选的，在其中一个实施例中，所述方法还包括：

建立存储多个数据信息的数据库；所述数据信息包括预设标准姿态信息和预设语音信息；

对同一个数据信息进行特征学习，并根据预设训练模型对每个所述数据信息进行模拟训练；

根据训练后的数据信息更新所述数据库中的原有数据信息。

一种信息处理系统，所述信息处理系统包括第一处理装置和第二处理装置，所述第一处理装置用于处理第一类用户的手势姿态信息，所述第二处理装置用于处理第二类用户的语音信息；

其中，所述第一处理装置包括第一控制模块，所述第一控制模块用于获取所述第一处理装置采集的手势姿态信息，并根据动作识别模型对所述手势姿态信息进行识别，当识别出所述手势姿态信息与预设标准姿态信息匹配时，通过所述第一处理装置输出与所述手势姿态信息对应的第一输出信息；

所述第二处理装置包括第二控制模块，所述第二控制模块用于获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别，当识别出所述语音信息与预设音频信息匹配时，通过所述第二处理装置输出与所述语音信息匹配的第二输出信息。

一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现所述方法的步骤。

一种计算机可读存储介质，包括计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行所述方法的步骤。

实施本发明实施例，将具有如下有益效果：

上述信息处理方法、系统、电子设备和计算机可读存储介质，通过获取第一处理装置采集的手势姿态信息，并根据动作识别模型对手势姿态信息进行识别，当识别出手势姿态信息与预设标准姿态信息匹配时，通过第一处理装置输出与手势姿态信息对应的第一输出信息，能够将聋哑人的手势姿态信息转换为正常人能理解的信息。

通过获取第二处理装置采集的语音信息，并根据语音识别模型对语音信息进行识别，当识别出语音信息与预设音频信息匹配时，通过第二处理装置输出与语音信息对应的第二输出信息，能够将正常人的语音信息转换为聋哑人能理解的信息；因此，通过上述方法，丰富了聋哑人与正常人之间的沟通交流方式，使聋哑人与正常人能够高效沟通。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为一个实施例中信息处理方法的流程示意图；

图2为另一个实施例中信息处理方法的流程示意图；

图3为另一个实施例中信息处理方法的流程示意图；

图4为另一个实施例中信息处理方法的流程示意图；

图5为一个实施例中信息处理系统的结构框图；

图6为一个实施例中电子设备的内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本申请。可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件，但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说，在不脱离本申请的范围的情况下，可以将第一应用程序称为第二应用程序，且类似地，可将第二进应用程序为第一应用程序。第一应用程序和第二应用程序两者都是应用程序，但其不是同一应用程序。

以下提供一种信息处理方法，该信息处理方法应用于便于聋哑人与正常人沟通的信息处理系统，该信息处理系统包括第一处理装置和第二处理装置，所述第一处理装置用于处理第一类用户的手势姿态信息，所述第二处理装置用于处理第二类用户的语音信息，

需要说明的是，第一类用户指的是具有听觉与语言障碍的聋哑人群，第二类用户指的是正常人群。第一处理装置和第二处理装置均设置在用于辅助第一类用户与外界进行沟通交流的设备上，具体的，第一处理装置和第二处理装置可以设置在可穿戴设备上，以方便第一类用户与外界即时沟通，例如，将第一处理装置设置在眼镜上，将第二处理装置设置在手环上，可以理解，还可以将第一处理装置和第二处理装置设置在同一可穿戴设备上，例如将第一处理装置和第二处理装置同时设置在眼镜上，本申请实施例对此不进行限定。

如图1所示，为一个实施例中信息处理方法的流程图，该信息处理方法，包括以下步骤102～步骤108：

步骤102：获取所述第一处理装置采集的手势姿态信息，并根据动作识别模型对所述手势姿态信息进行识别。

其中，手势姿态信息指的是人手或者手和手臂结合产生的各种姿势或动作，本实施例的手势姿态信息可以理解为手语(sign language)的手部动作信息，手语指的是用手势比量动作，根据手势的变化模拟形象或者音节以构成一定意思或词语，是听力障碍还有无法言语的人(即聋哑人)互相交际和交流思想的一种手的语言。动作识别模型指的是能够对输入的手势动作进行分类识别的模型。

进一步的，第一处理装置包括图像采集模块，如图2所示，步骤102中获取所述第一处理装置采集的手势姿态信息的过程还包括以下步骤1021～步骤1022：

步骤1021：获取所述图像采集模块采集的具有所述手势姿态信息的图像。

具体的，图像采集模块包括至少一个摄像头，所述摄像头可以采集图像或视频，当通过所述摄像头采集到具有手势姿态信息的图像或视频时，对所述摄像头采集的图像或视频进行特征分析。

步骤1022：分析所述图像中的手势特征。

其中，所述手势特征包括但不限于形状、运动轨迹、颜色、轮廓和深度。具体的，对采集到的具有手势姿态信息的图像或视频进行手势分割，从而准确地提取图像中的人手部分，进一步的，对人手部分进行手势特征提取，根据提取的多个特征点分析手语动作。

可选的，在其他实施例中，还可以通过传感器模块采集所述手势姿态信息，传感器模块包括但不限于加速度传感器、弯曲传感器和磁传感器，结合多个传感器采集手势姿态信息，具体可包括手势动作的运动轨迹，手掌、手指的弯曲度以及手指之间的空间夹角等信息。通过分析传感器模块采集的数据分析手语动作。

在一个实施例中，在所述根据动作识别模型对所述手势姿态信息进行识别之前，该信息处理方法还包括：采集国际标准手语的手势特征作为预设标准姿态信息，并建立所述预设标准姿态信息与所述第一输出信息的对应关系。

具体的，国际标准手语指的是聋哑人国际标准手语，采集国际标准手语中的手势样本数据，对所述手势样本数据进行统计分类，并利用所述手势样本数据提取特征，对每个手势样本数据的特征进行分析处理，对每个手势样本数据进行翻译，匹配对应的文字和语音，从而建立预设标准姿态信息与所述第一输出信息的对应关系。

步骤104：当识别出所述手势姿态信息与预设标准姿态信息匹配时，通过所述第一处理装置输出与所述手势姿态信息对应的第一输出信息。

在一个实施例中，所述第一处理装置还包括音频播放模块和第一显示模块，音频播放模块包括扬声器、扩音器等，第一显示模块包括显示屏幕，例如镜面显示屏、液晶显示屏、等离子显示屏、射线管显示屏等。所述第一输出信息包括语音信息和文字信息。

具体的，通过所述音频播放模块播放与所述手势姿态信息对应的语音信息，通过所述第一显示模块显示与所述手势姿态信息对应的文字信息。例如，当识别出所述手势姿态信息与预设标准姿态信息匹配时，将手势姿态信息转换为语音，并通过扬声器播放所述语音；或者，将手势姿态信息转换为文字，并通过显示屏幕将所述文字显示在屏幕画面中。

步骤106：获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别。

其中，语音信息指的是第二类用户的说话语音，也即是正常人群的说话语音，当正常人群与聋哑人群说话交流时，通过第二处理装置采集正常人群的说话语音，获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别。

具体的，在一个实施例中，所述第二处理装置包括音频采集模块，如图3所示，步骤106的处理过程还包括以下步骤1061～步骤1063：

步骤1061：建立预设音频信息与所述第二输出信息的映射关系。

预设音频信息指的是语言词汇的标准发音，包括但不限于普通话的标准发音、方言的标准发音、英语发音等。采集多个语言词汇的声音样本数据，对所述声音样本数据进行统计分类，并利用所述声音样本数据提取特征，对每个声音样本数据的特征进行分析处理，对每个声音样本数据进行翻译，匹配对应的文字、手势动作、动画等，从而建立预设音频信息与所述第二输出信息的映射关系。

步骤1062：获取基于所述第二处理装置中的音频采集模块采集的语音信息。

音频采集模块包括麦克风，基于第二处理装置中的麦克风采集正常人群的说话语音。

步骤1063：对所述语音信息进行预处理，并根据所述预设音频信息与第二输出信息的映射关系，确定与所述语音信息对应的第二输出信息。

具体的，预处理的过程包括滤除噪声、混响处理、修复衰减。在对采集的语音信息进行预处理后，根据所述预设音频信息与第二输出信息的映射关系，确定与采集的语音信息对应的第二输出信息。

步骤108：当识别出所述语音信息与预设音频信息匹配时，通过所述第二处理装置输出与所述语音信息对应的第二输出信息。

具体的，所述第二处理装置还包括第二显示模块，第二显示模块包括显示屏幕，例如镜面显示屏、液晶显示屏、等离子显示屏、射线管显示屏等。当识别出所述语音信息与预设音频信息匹配时，基于所述第二处理装置中的显示屏幕显示所述第二输出信息，其中所述第二输出信息包括但不限于文字、手势动作、动画。

在一个实施例中，如图4所示，该信息处理方法还包括：

步骤402：建立存储多个数据信息的数据库；所述数据信息包括预设标准姿态信息和预设语音信息。

步骤404：对同一个数据信息进行特征学习，并根据预设训练模型对每个所述数据信息进行模拟训练。

步骤406：根据训练后的数据信息更新所述数据库中的原有数据信息。

具体的，通过AI算法对同一手势生成的数据以及同一语言词汇的声音数据进行深度学习训练并分析，将提取分类后的手势姿态信息、语音信息与标准库进行调整、校对、匹配。以实现不断优化对第一类用户的手势姿态信息的识别过程、以及对第二类用户的语音信息的识别过程。

上述信息处理方法，通过获取第一处理装置采集的手势姿态信息，并根据动作识别模型对手势姿态信息进行识别，当识别出手势姿态信息与预设标准姿态信息匹配时，通过第一处理装置输出与手势姿态信息对应的第一输出信息，能够将聋哑人的手势姿态信息转换为正常人能理解的信息。

基于相同的发明构思，还提供一种信息处理系统，如图5所示，为一个实施例中信息处理系统的结构框图，该信息处理系统，包括：第一处理装置110和第二处理装置120，第一处理装置110包括第一控制模块112、图像采集模块114、音频播放模块116和第一显示模块118，图像采集模块114、音频播放模块116、第一显示模块118分别与第一控制模块112电性连接；第二处理装置120包括第二控制模块122、音频采集模块124和第二显示模块126，音频采集模块124、第二显示模块126分别与第二控制模块122电性连接。

其中，第一处理装置110用于处理第一类用户的手势姿态信息，第二处理装置120用于处理第二类用户的语音信息。第一控制模块112用于获取第一处理装置110采集的手势姿态信息，并根据动作识别模型对所述手势姿态信息进行识别，当识别出所述手势姿态信息与预设标准姿态信息匹配时，通过第一处理装置110输出与所述手势姿态信息对应的第一输出信息。第二控制模块122用于获取第二处理装置120采集的语音信息，并根据语音识别模型对所述语音信息进行识别，当识别出所述语音信息与预设音频信息匹配时，通过第二处理装置120输出与所述语音信息匹配的第二输出信息。

图像采集模块114用于采集具有所述手势姿态信息的图像；音频播放模块116用于播放与所述手势姿态信息对应的语音信息；第一显示模块118用于显示与所述手势姿态信息对应的文字信息。

音频采集模块124用于采集外界的语音信息；第二显示模块126用于输出所述第二输出信息。

上述信息处理系统，能够将聋哑人的手势姿态信息转换为正常人能理解的信息，并且将正常人的语音信息转换为聋哑人能理解的信息；因此，通过上述装置，丰富了聋哑人与正常人之间的沟通交流方式，使聋哑人与正常人能够高效沟通。

上述信息处理系统中各个模块的划分仅用于举例说明，在其他实施例中，可将信息处理系统按照需要划分为不同的模块，以完成上述信息处理系统的全部或部分功能。

关于信息处理系统的具体限定可以参见上文中对于信号处理方法的限定，在此不再赘述。上述信息处理系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

本申请实施例中提供的信息处理系统中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时，实现本申请实施例中所描述的信息处理方法的步骤。

图6为一个实施例中电子设备的内部结构示意图。该终端包括通过系统总线连接的处理器、存储器和显示屏。其中，该处理器用于提供计算和控制能力，支撑整个电子设备的运行。存储器用于存储数据、程序、和/或指令代码等，存储器上存储至少一个计算机程序，该计算机程序可被处理器执行，以实现本申请实施例中提供的适用于电子设备的信息处理方法。存储器可包括磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random-Access-Memory，RAM)等。例如，在一个实施例中，存储器包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统、数据库和计算机程序。该数据库中存储有用于实现以上各个实施例所提供的一种信息处理方法相关的数据。该计算机程序可被处理器所执行，以用于实现本申请各个实施例所提供的一种信息处理方法。内存储器为非易失性存储介质中的操作系统、数据库和计算机程序提供高速缓存的运行环境。显示屏可以是触摸屏，比如为电容屏或电子屏，用于显示电子设备的界面信息。该电子设备可以是可穿戴式电子设备、手机、电脑或者个人数字助理等。

本领域技术人员可以理解，图2中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质，当所述计算机可执行指令被一个或多个处理器执行时，使得所述处理器执行如上述各实施例中所描述的信息处理方法。

本申请实施例还提供了一种计算机程序产品。一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述各实施例中所描述的信息处理方法。

在上述实施例中，可以全部或部分的通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或半导体介质(例如固态硬盘Solid State Disk(SSD))等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种信息处理方法，应用于便于聋哑人与正常人沟通的信息处理系统，其特征在于，所述信息处理系统包括第一处理装置和第二处理装置，所述第一处理装置用于处理第一类用户的手势姿态信息，所述第二处理装置用于处理第二类用户的语音信息；所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一处理装置包括图像采集模块；所述获取所述第一处理装置采集的手势姿态信息，包括：

3.根据权利要求2所述的方法，其特征在于，在所述根据动作识别模型对所述手势姿态信息进行识别之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述第一处理装置还包括音频播放模块和第一显示模块，所述第一输出信息包括语音信息和文字信息；

5.根据权利要求1所述的方法，其特征在于，所述第二处理装置包括音频采集模块，所述获取所述第二处理装置采集的语音信息，并根据语音识别模型对所述语音信息进行识别，包括：

建立预设音频信息与所述第二输出信息的映射关系；

6.根据权利要求5所述的方法，其特征在于，所述第二处理装置还包括第二显示模块，所述通过所述第二处理装置输出与所述语音信息匹配的第二输出信息，包括：

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据训练后的数据信息更新所述数据库中的原有数据信息。

8.一种信息处理系统，其特征在于，所述信息处理系统包括第一处理装置和第二处理装置，所述第一处理装置用于处理第一类用户的手势姿态信息，所述第二处理装置用于处理第二类用户的语音信息；

9.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其特征在于，包括计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如权利要求1-7任一项所述方法的步骤。