CN110289001A - 一种基于多媒体语音图像识别的物业报事系统 - Google Patents

一种基于多媒体语音图像识别的物业报事系统 Download PDF

Info

Publication number
CN110289001A
CN110289001A CN201910541940.4A CN201910541940A CN110289001A CN 110289001 A CN110289001 A CN 110289001A CN 201910541940 A CN201910541940 A CN 201910541940A CN 110289001 A CN110289001 A CN 110289001A
Authority
CN
China
Prior art keywords
voice
report thing
content
input
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910541940.4A
Other languages
English (en)
Inventor
张福军
丁立
李祥兵
张力炯
罗豪
管鸿翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Green Man Technology Co Ltd
Original Assignee
Green Man Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Green Man Technology Co Ltd filed Critical Green Man Technology Co Ltd
Priority to CN201910541940.4A priority Critical patent/CN110289001A/zh
Publication of CN110289001A publication Critical patent/CN110289001A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate
    • G06Q50/163Property management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明公开了一种基于多媒体语音图像识别的物业报事系统,通过语音输入及图片输入的形式,对报事内容进行识别、存储。本发明可以实现用户无需输入文字,只需语音录入,图片传入,通过识别系统,自动填充内容,即可完成报事功能,大幅提高用户的报事效率和准确性,减少用户的操作步骤和用户输入过程,提升用户体验和满意度。

Description

一种基于多媒体语音图像识别的物业报事系统
技术领域
本发明涉及多媒体领域,尤其涉及一种基于多媒体语音图像识别的物业报事系统。
背景技术
随着智慧社区移动应用普及,用户通过移动应用获取相应的服务增多,同时用户有许多问题需要社区物业帮忙解决。如何让用户利用移动应用快速,便捷,准确的反馈问题给物业方,方便物业服务方快速的提供服务,一直是社区物业努力的方向。
在传统的智慧社区移动应用中有一个报事功能,用户输入文字,描述问题,提交报事订单,但这个传统的报事功能,用户需要输入许多文字来描述问题,导致不能便捷,快速,准确反馈问题,有时也不一定能描述清晰,对于用户非常不友好,用户体验一般。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种无需文字输入的基于多媒体语音图像识别的物业报事系统,其操作简单,效率高。
为了实现以上目的,本发明采用以下技术方案:
一种基于多媒体语音图像识别的物业报事系统,包括以下步骤:
S1、点击报事功能模块;
S2、是否选择手动报事类型;
S3、根据S2中的选择获取报事类型;
S4、等待语音输入报事内容;
S5、语音识别子系统接受S4中的语音输入的报事内容进行语音内容的识别;
S6、将S5中识别的内容形成文字存储到报事内容中;
S7、添加图片;
S8、对S7中的图片进行图像识别处理;
S9、提交报事订单。
进一步的,S2中包括以下步骤:
S2、若选择手动报事类型为否,则进入等待语音输入过程
S22、如有语音输入报事类型,则语音识别子系统接受语音输入的类型进行语音内容的识别,并将识别内容进行反馈,接着进行S3,根据S22中的选择获取报事类型;若未接受到语音输入报事类型则重新进入S21,循环等待。
进一步的,S5中若一直为接收到可识别的语音输入的报事内容,则不断提示,直至输入的语音输入的报事内容可识别。
进一步的,S7中若无图片添加,则直接跳转至S9提交报事订单。
进一步的,本系统在S9提交报事订单之前还包括以下步骤:
S10、是否手动修改报事内容,若修改跳转至S11,若不修改跳转至S9;
S11、若修改则对S6中形成文字的报事内容进行手动修改。
进一步的,S5语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S6步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。
进一步的,S22中语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S3步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。
采用本发明技术方案,本发明的有益效果为:与现有技术相比,本发明基于多媒体语音图像报事系统,可以实现用户无需输入文字,只需语音录入,图片传入,通过识别系统,自动填充内容,即可完成报事功能,大幅提高用户的报事效率和准确性,减少用户的操作步骤和用户输入过程,提升用户体验和满意度。
附图说明
图1是本发明提供的基于多媒体语音图像识别的物业报事系统流程图;
图2是本发明提供的基于多媒体语音图像识别的物业报事系统的语音识别子系统流程图。
具体实施方式
结合附图对本发明具体方案具体实施例作进一步的阐述。
区别于传统的报事系统,本发明多媒体语音图像识别的物业报事系统,优化用户的操作体验,用户可以只需输入语音或者图像,APP端利用多媒体语音图像识别技术。对提交的语音和图像进行识别,输入较少或者甚至不输入文字描述,减少用户操作,方便用户提交,也方便物业服务方准确了解用户的问题,提高了服务的效率。
如图所示,本发明包括以下几个实施例。
实施例一:
一种基于多媒体语音图像识别的物业报事系统,包括以下步骤:
S1、点击报事功能模块;
S2、是否选择手动报事类型;
S3、根据S2中的选择获取报事类型;
S4、等待语音输入报事内容;
S5、语音识别子系统接受S4中的语音输入的报事内容进行语音内容的识别;
S6、将S5中识别的内容形成文字存储到报事内容中;
S7、添加图片;
S8、对S7中的图片进行图像识别处理;
S9、提交报事订单。
可选择的,S7中若无图片添加,则直接跳转至S9提交报事订单。
该实施例通过语音和图片进行报事处理,相比较键盘输入,大大提高了报事的效率。
实施例二、
与实施例一中区别之处如下,S2中还包括以下步骤:
S2、若选择手动报事类型为否,则进入等待语音输入过程
S22、如有语音输入报事类型,则语音识别子系统接受语音输入的类型进行语音内容的识别,并将识别内容进行反馈,接着进行S3,根据S22中的选择获取报事类型;若未接受到语音输入报事类型则重新进入S21,循环等待。
通过手动或者语音直接进行报事类型的选择,在输入报事类型前,对报事内容进行预分类,方便之后将具体的报事内容添加到相应的文件、区域下,便于报事内容的管理、核查与查看。
实施例三、
与实施例一中区别之处如下,S5中若一直为接收到可识别的语音输入的报事内容,则不断提示,直至输入的语音输入的报事内容可识别。
对于无法识别的语音进行提示。
实施例四、
与实施例一中区别之处如下,系统在S9提交报事订单之前还包括以下步骤:
S10、是否手动修改报事内容,若修改跳转至S11,若不修改跳转至S9;
S11、若修改则对S6中形成文字的报事内容进行手动修改。
语音识别的时候,多因输入是口吃不清、口音、环境噪音等问题导致识别出的文字有错误,因此,使用者可以根据识别后的文字内容,决定是否进行修改。此处的修改仅为个别字的修改,或者完全不需要修改,并不影响整体的使用效率。且因可以修改,提高了准确率。
实施例五、
根据实施例三中,S22语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S3步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。在语音识别子系统中识别语音输入报事类型的语音输入。语音识别子系统可以通过是否听到音频、音频是否清楚可识别对使用者进行提示,使得使用者可以根据提示进行修正,提高了使用效率和体验感。
实施例六、
SS5语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S6步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。在语音识别子系统中识别语音输入报事内容的语音输入。语音识别子系统可以通过是否听到音频、音频是否清楚可识别对使用者进行提示,使得使用者可以根据提示进行修正,提高了使用效率和体验感。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种基于多媒体语音图像识别的物业报事系统,其特征在于,包括以下步骤:
S1、点击报事功能模块;
S2、是否选择手动报事类型;
S3、根据S2中的选择获取报事类型;
S4、等待语音输入报事内容;
S5、语音识别子系统接受S4中的语音输入的报事内容进行语音内容的识别;
S6、将S5中识别的内容形成文字存储到报事内容中;
S7、添加图片;
S8、对S7中的图片进行图像识别处理;
S9、提交报事订单。
2.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,S2中包括以下步骤:
S2、若选择手动报事类型为否,则进入等待语音输入过程
S22、如有语音输入报事类型,则语音识别子系统接受语音输入的类型进行语音内容的识别,并将识别内容进行反馈,接着进行S3,根据S22中的选择获取报事类型;若未接受到语音输入报事类型则重新进入S21,循环等待。
3.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,S5中若一直为接收到可识别的语音输入的报事内容,则不断提示,直至输入的语音输入的报事内容可识别。
4.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,S7中若无图片添加,则直接跳转至S9提交报事订单。
5.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,本系统在S9提交报事订单之前还包括以下步骤:
S10、是否手动修改报事内容,若修改跳转至S11,若不修改跳转至S9;
S11、若修改则对S6中形成文字的报事内容进行手动修改。
6.如权利要求1所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,S5语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S6步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。
7.如权利要求2所述的一种基于多媒体语音图像识别的物业报事系统,其特征在于,S22中语音识别子系统的识别包括以下步骤:
S51、是否输入语音,若否,提示再次输入,若是,则进行下一步骤;
S52、语音识别,根据输入的语音进行语音内容的识别;
S53、设定识别次数的上限,根据识别到内容是否为完整语句判断是否成功,若在设定次数内识别成功则进行S3步骤,若无法在设定次数内识别则提示无法识别,提示再次输入。
CN201910541940.4A 2019-06-21 2019-06-21 一种基于多媒体语音图像识别的物业报事系统 Pending CN110289001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910541940.4A CN110289001A (zh) 2019-06-21 2019-06-21 一种基于多媒体语音图像识别的物业报事系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910541940.4A CN110289001A (zh) 2019-06-21 2019-06-21 一种基于多媒体语音图像识别的物业报事系统

Publications (1)

Publication Number Publication Date
CN110289001A true CN110289001A (zh) 2019-09-27

Family

ID=68004141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910541940.4A Pending CN110289001A (zh) 2019-06-21 2019-06-21 一种基于多媒体语音图像识别的物业报事系统

Country Status (1)

Country Link
CN (1) CN110289001A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100918644B1 (ko) * 2009-06-17 2009-09-25 김정중 대화 시스템 및 대화 문장 생성 방법
CN202422195U (zh) * 2011-08-01 2012-09-05 上海巨浪信息科技有限公司 城市管理与社区服务综合应用移动终端
CN206025707U (zh) * 2016-06-27 2017-03-22 国网山东省电力公司荣成市供电公司 一种物业用便民箱
CN106601254A (zh) * 2016-12-08 2017-04-26 广州神马移动信息科技有限公司 信息输入方法和装置及计算设备
CN109119164A (zh) * 2018-08-15 2019-01-01 南京旭颢信息科技有限公司 一种通过语音辨识体征健康状态的系统
CN109840318A (zh) * 2019-01-04 2019-06-04 上海上湖信息技术有限公司 一种表单项的填写方法及系统
CN110010122A (zh) * 2018-01-05 2019-07-12 江苏慧明智能科技有限公司 护理床语音控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100918644B1 (ko) * 2009-06-17 2009-09-25 김정중 대화 시스템 및 대화 문장 생성 방법
CN202422195U (zh) * 2011-08-01 2012-09-05 上海巨浪信息科技有限公司 城市管理与社区服务综合应用移动终端
CN206025707U (zh) * 2016-06-27 2017-03-22 国网山东省电力公司荣成市供电公司 一种物业用便民箱
CN106601254A (zh) * 2016-12-08 2017-04-26 广州神马移动信息科技有限公司 信息输入方法和装置及计算设备
CN110010122A (zh) * 2018-01-05 2019-07-12 江苏慧明智能科技有限公司 护理床语音控制方法
CN109119164A (zh) * 2018-08-15 2019-01-01 南京旭颢信息科技有限公司 一种通过语音辨识体征健康状态的系统
CN109840318A (zh) * 2019-01-04 2019-06-04 上海上湖信息技术有限公司 一种表单项的填写方法及系统

Similar Documents

Publication Publication Date Title
US7680661B2 (en) Method and system for improved speech recognition
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
CN1163869C (zh) 用于开发交互式语音应用程序的系统和方法
US20200365138A1 (en) Method and device for providing voice recognition service
US20100145694A1 (en) Replying to text messages via automated voice search techniques
US7996209B2 (en) Method and system of generating and detecting confusing phones of pronunciation
JP6024675B2 (ja) 音声認識端末装置、音声認識システム、音声認識方法
CN107729321A (zh) 一种语音识别结果纠错方法
JP2018124425A (ja) 音声対話装置及び音声対話方法
CN105529030B (zh) 语音识别处理方法和装置
US20060149544A1 (en) Error prediction in spoken dialog systems
US20080154600A1 (en) System, Method, Apparatus and Computer Program Product for Providing Dynamic Vocabulary Prediction for Speech Recognition
US11093110B1 (en) Messaging feedback mechanism
US20060229864A1 (en) Method, device, and computer program product for multi-lingual speech recognition
CN109840318B (zh) 一种表单项的填写方法及系统
US20060020462A1 (en) System and method of speech recognition for non-native speakers of a language
KR20010054622A (ko) 음성 인식 시스템의 음성 인식률 향상 방법
US9251785B2 (en) Call steering data tagging interface with automatic semantic clustering
CN103546787A (zh) 校正语音识别错误的方法和应用该方法的广播接收设备
CN112995419B (zh) 一种语音对话的处理方法和系统
GB2409087A (en) Computer generated prompting
CN111583931A (zh) 业务数据处理方法及装置
CN106710585A (zh) 语音交互过程中的多音字播报方法及系统
CN109493846B (zh) 一种英语口音识别系统
CN1307610C (zh) 用于符号序列的语音识别的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927