CN110289001A

CN110289001A - 一种基于多媒体语音图像识别的物业报事系统

Info

Publication number: CN110289001A
Application number: CN201910541940.4A
Authority: CN
Inventors: 张福军; 丁立; 李祥兵; 张力炯; 罗豪; 管鸿翔
Original assignee: Green Man Technology Co Ltd
Current assignee: Green Man Technology Co Ltd
Priority date: 2019-06-21
Filing date: 2019-06-21
Publication date: 2019-09-27

Abstract

本发明公开了一种基于多媒体语音图像识别的物业报事系统，通过语音输入及图片输入的形式，对报事内容进行识别、存储。本发明可以实现用户无需输入文字，只需语音录入，图片传入，通过识别系统，自动填充内容，即可完成报事功能，大幅提高用户的报事效率和准确性，减少用户的操作步骤和用户输入过程，提升用户体验和满意度。

Description

一种基于多媒体语音图像识别的物业报事系统

技术领域

本发明涉及多媒体领域，尤其涉及一种基于多媒体语音图像识别的物业报事系统。

背景技术

随着智慧社区移动应用普及，用户通过移动应用获取相应的服务增多，同时用户有许多问题需要社区物业帮忙解决。如何让用户利用移动应用快速，便捷，准确的反馈问题给物业方，方便物业服务方快速的提供服务，一直是社区物业努力的方向。

在传统的智慧社区移动应用中有一个报事功能，用户输入文字，描述问题，提交报事订单，但这个传统的报事功能，用户需要输入许多文字来描述问题，导致不能便捷，快速，准确反馈问题，有时也不一定能描述清晰，对于用户非常不友好，用户体验一般。

发明内容

本发明的目的是针对现有技术的缺陷，提供了一种无需文字输入的基于多媒体语音图像识别的物业报事系统，其操作简单，效率高。

为了实现以上目的，本发明采用以下技术方案：

一种基于多媒体语音图像识别的物业报事系统，包括以下步骤：

S1、点击报事功能模块；

S2、是否选择手动报事类型；

S3、根据S2中的选择获取报事类型；

S4、等待语音输入报事内容；

S5、语音识别子系统接受S4中的语音输入的报事内容进行语音内容的识别；

S6、将S5中识别的内容形成文字存储到报事内容中；

S7、添加图片；

S8、对S7中的图片进行图像识别处理；

S9、提交报事订单。

进一步的，S2中包括以下步骤：

S2、若选择手动报事类型为否，则进入等待语音输入过程

S22、如有语音输入报事类型，则语音识别子系统接受语音输入的类型进行语音内容的识别，并将识别内容进行反馈，接着进行S3，根据S22中的选择获取报事类型；若未接受到语音输入报事类型则重新进入S21，循环等待。

进一步的，S5中若一直为接收到可识别的语音输入的报事内容，则不断提示，直至输入的语音输入的报事内容可识别。

进一步的，S7中若无图片添加，则直接跳转至S9提交报事订单。

进一步的，本系统在S9提交报事订单之前还包括以下步骤：

S10、是否手动修改报事内容，若修改跳转至S11，若不修改跳转至S9；

S11、若修改则对S6中形成文字的报事内容进行手动修改。

进一步的，S5语音识别子系统的识别包括以下步骤：

S51、是否输入语音，若否，提示再次输入，若是，则进行下一步骤；

S52、语音识别，根据输入的语音进行语音内容的识别；

S53、设定识别次数的上限，根据识别到内容是否为完整语句判断是否成功，若在设定次数内识别成功则进行S6步骤，若无法在设定次数内识别则提示无法识别，提示再次输入。

进一步的，S22中语音识别子系统的识别包括以下步骤：

S52、语音识别，根据输入的语音进行语音内容的识别；

S53、设定识别次数的上限，根据识别到内容是否为完整语句判断是否成功，若在设定次数内识别成功则进行S3步骤，若无法在设定次数内识别则提示无法识别，提示再次输入。

采用本发明技术方案，本发明的有益效果为：与现有技术相比，本发明基于多媒体语音图像报事系统，可以实现用户无需输入文字，只需语音录入，图片传入，通过识别系统，自动填充内容，即可完成报事功能，大幅提高用户的报事效率和准确性，减少用户的操作步骤和用户输入过程，提升用户体验和满意度。

附图说明

图1是本发明提供的基于多媒体语音图像识别的物业报事系统流程图；

图2是本发明提供的基于多媒体语音图像识别的物业报事系统的语音识别子系统流程图。

具体实施方式

结合附图对本发明具体方案具体实施例作进一步的阐述。

区别于传统的报事系统，本发明多媒体语音图像识别的物业报事系统，优化用户的操作体验，用户可以只需输入语音或者图像，APP端利用多媒体语音图像识别技术。对提交的语音和图像进行识别，输入较少或者甚至不输入文字描述，减少用户操作，方便用户提交，也方便物业服务方准确了解用户的问题，提高了服务的效率。

如图所示，本发明包括以下几个实施例。

实施例一：

S1、点击报事功能模块；

S2、是否选择手动报事类型；

S3、根据S2中的选择获取报事类型；

S4、等待语音输入报事内容；

S6、将S5中识别的内容形成文字存储到报事内容中；

S7、添加图片；

S8、对S7中的图片进行图像识别处理；

S9、提交报事订单。

可选择的，S7中若无图片添加，则直接跳转至S9提交报事订单。

该实施例通过语音和图片进行报事处理，相比较键盘输入，大大提高了报事的效率。

实施例二、

与实施例一中区别之处如下，S2中还包括以下步骤：

S2、若选择手动报事类型为否，则进入等待语音输入过程

通过手动或者语音直接进行报事类型的选择，在输入报事类型前，对报事内容进行预分类，方便之后将具体的报事内容添加到相应的文件、区域下，便于报事内容的管理、核查与查看。

实施例三、

与实施例一中区别之处如下，S5中若一直为接收到可识别的语音输入的报事内容，则不断提示，直至输入的语音输入的报事内容可识别。

对于无法识别的语音进行提示。

实施例四、

与实施例一中区别之处如下，系统在S9提交报事订单之前还包括以下步骤：

S11、若修改则对S6中形成文字的报事内容进行手动修改。

语音识别的时候，多因输入是口吃不清、口音、环境噪音等问题导致识别出的文字有错误，因此，使用者可以根据识别后的文字内容，决定是否进行修改。此处的修改仅为个别字的修改，或者完全不需要修改，并不影响整体的使用效率。且因可以修改，提高了准确率。

实施例五、

根据实施例三中，S22语音识别子系统的识别包括以下步骤：

S52、语音识别，根据输入的语音进行语音内容的识别；

S53、设定识别次数的上限，根据识别到内容是否为完整语句判断是否成功，若在设定次数内识别成功则进行S3步骤，若无法在设定次数内识别则提示无法识别，提示再次输入。在语音识别子系统中识别语音输入报事类型的语音输入。语音识别子系统可以通过是否听到音频、音频是否清楚可识别对使用者进行提示，使得使用者可以根据提示进行修正，提高了使用效率和体验感。

实施例六、

SS5语音识别子系统的识别包括以下步骤：

S52、语音识别，根据输入的语音进行语音内容的识别；

S53、设定识别次数的上限，根据识别到内容是否为完整语句判断是否成功，若在设定次数内识别成功则进行S6步骤，若无法在设定次数内识别则提示无法识别，提示再次输入。在语音识别子系统中识别语音输入报事内容的语音输入。语音识别子系统可以通过是否听到音频、音频是否清楚可识别对使用者进行提示，使得使用者可以根据提示进行修正，提高了使用效率和体验感。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种基于多媒体语音图像识别的物业报事系统，其特征在于，包括以下步骤：

S1、点击报事功能模块；

S2、是否选择手动报事类型；

S3、根据S2中的选择获取报事类型；

S4、等待语音输入报事内容；

S6、将S5中识别的内容形成文字存储到报事内容中；

S7、添加图片；

S8、对S7中的图片进行图像识别处理；

S9、提交报事订单。

2.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，S2中包括以下步骤：

S2、若选择手动报事类型为否，则进入等待语音输入过程

3.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，S5中若一直为接收到可识别的语音输入的报事内容，则不断提示，直至输入的语音输入的报事内容可识别。

4.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，S7中若无图片添加，则直接跳转至S9提交报事订单。

5.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，本系统在S9提交报事订单之前还包括以下步骤：

S11、若修改则对S6中形成文字的报事内容进行手动修改。

6.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，S5语音识别子系统的识别包括以下步骤：

S52、语音识别，根据输入的语音进行语音内容的识别；

7.如权利要求2所述的一种基于多媒体语音图像识别的物业报事系统，其特征在于，S22中语音识别子系统的识别包括以下步骤：

S52、语音识别，根据输入的语音进行语音内容的识别；