CN113312886A - 客户端语音输入表单的方法 - Google Patents
客户端语音输入表单的方法 Download PDFInfo
- Publication number
- CN113312886A CN113312886A CN202110647177.0A CN202110647177A CN113312886A CN 113312886 A CN113312886 A CN 113312886A CN 202110647177 A CN202110647177 A CN 202110647177A CN 113312886 A CN113312886 A CN 113312886A
- Authority
- CN
- China
- Prior art keywords
- client
- content
- voice
- steps
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种客户端语音输入表单的方法,包括如下步骤:采集用户的语音数据;将所述语音数据识别为文字内容数据;将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。本申请的有益之处在于提供了一种免除了手工录入同时提高录入效率的客户端语音输入表单的方法。
Description
技术领域
本申请涉及语音输入方法,具体而言,涉及一种客户端语音输入表单的方法。
背景技术
当前移动客户端已全面普及,然而客户端的使用通常借助于手动的点击交互,对不便与使用手动操作的用户来说极不友好。
例如:无法正常使用双手的残障人士;不擅长使用智能手机的老年人等;尤其是遇到一些长表单的录入时,用户的完成信息录入的难度和成本很高。
另外,目前市面上已经有较为成熟的ASR(自动语音识别技术)工具,例如:科大讯飞和腾讯提供的语音转文字功能,其语音识别文字的技术和数据库已经较为成熟,并且具有较高识别率。并且部分ASR服务已支持多种方言的识别,例如:粤语等。
发明内容
为了解决现有技术的不足之处,本申请提供了一种客户端语音输入表单的方法,包括如下步骤:采集用户的语音数据;将所述语音数据识别为文字内容数据;将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。
进一步地,所述客户端语音输入表单的方法还包括如下步骤:提供表单界面以及语音录入操作界面。
进一步地,所述客户端语音输入表单的方法还包括如下步骤:读取表单界面要求输入的字段类型。
进一步地,所述客户端语音输入表单的方法还包括如下步骤:判断读取表单界面要求输入的字段类型为文本框内容还是选择项内容,如果读取表单界面要求输入的字段类型为文本框内容则转入文本框匹配判断步骤,如果读取表单界面要求输入的字段类型为选择项内容则转入选择项内容匹配判断步骤。
进一步地,所述文本框匹配判断步骤包括如下步骤:判断所述文字内容数据是否符合预设格式和字段长度要求;如果满足预设格式和字段长度要求,则系统语音提示后台校验文字内容数据。
进一步地,所述客户端语音输入表单的方法还包括如下步骤:所述选择项内容匹配判断步骤包括如下步骤:将文字内容数据与预存的字典值进行模糊匹配获得匹配字典值。
进一步地,所述选择项内容匹配判断步骤还包括如下步骤:向用户提示所述匹配字典值。
进一步地,所述选择项内容匹配判断步骤还包括如下步骤:采集用户对所述匹配字典值的反馈数据。
进一步地,所述选择项内容匹配判断步骤还包括如下步骤:根据所述反馈数据判断所述匹配字典值是否准确;如果所述匹配字典值准确则匹配字典值录入至所述表单界面。
进一步地,所述反馈数据为语音数据。
本申请的有益之处在于:提供了一种免除了手工录入同时提高录入效率的客户端语音输入表单的方法。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一种实施例的客户端语音输入表单的方法的总体流程图;
图2是根据本申请一种实施例的用户语音录入流程图;
图3是根据本申请一种实施例的识别录入项并语音识别流程图;
图4是根据本申请一种实施例的登录界面示意图;
图5是根据本申请一种实施例的选择语言界面示意图;
图6是根据本申请一种实施例的语言录入结果确认界面示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参照图1至图6所示,本申请的客户端语音输入表单的方法,包括如下步骤:采集用户的语音数据;将所述语音数据识别为文字内容数据;将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。
具体而言,所述客户端语音输入表单的方法还包括如下步骤:提供表单界面以及语音录入操作界面。
具体而言,所述客户端语音输入表单的方法还包括如下步骤:读取表单界面要求输入的字段类型。
具体而言,所述客户端语音输入表单的方法还包括如下步骤:判断读取表单界面要求输入的字段类型为文本框内容还是选择项内容,如果读取表单界面要求输入的字段类型为文本框内容则转入文本框匹配判断步骤,如果读取表单界面要求输入的字段类型为选择项内容则转入选择项内容匹配判断步骤。
具体而言,所述文本框匹配判断步骤包括如下步骤:判断所述文字内容数据是否符合预设格式和字段长度要求;如果满足预设格式和字段长度要求,则系统语音提示后台校验文字内容数据。
具体而言,所述客户端语音输入表单的方法还包括如下步骤:所述选择项内容匹配判断步骤包括如下步骤:将文字内容数据与预存的字典值进行模糊匹配获得匹配字典值。
具体而言,所述选择项内容匹配判断步骤还包括如下步骤:向用户提示所述匹配字典值。
具体而言,所述选择项内容匹配判断步骤还包括如下步骤:采集用户对所述匹配字典值的反馈数据。
具体而言,所述选择项内容匹配判断步骤还包括如下步骤:根据所述反馈数据判断所述匹配字典值是否准确;如果所述匹配字典值准确则匹配字典值录入至所述表单界面。
具体而言,所述反馈数据为语音数据。
概括而言,如图1所示,本申请的方法主要包括:
1.1:用户打开目标页面
1.2:选择语音录入方式
1.3:用户语音方式录入文字
1.4:系统将文字内容转化为文本内容或者选择项
作为具体方案,如图2至图3所示,具体流程包括:
2.1:识别录入项并语音识别;
2.1.1:系统读取要求录入的字段内容。包含要求录入的文本框,选择项(单选/多选);
2.1.2:系统语音询问用户要求录入的字段内容;
2.1.3:用户语音表达要输入的内容;
2.1.4:系统判断是否识别到语音内容;是,则进行下一步;
2.1.5:系统语音转文字;使用现成的ASR技术服务。
将2.1.1~2.1.5定义为流程c,2.1.4~2.1.5定义为流程d
2.1.6:系统判断要录入的字段类型:文本框或选择项(单选/多选)
若是选择项:则系统文字模糊匹配字段值,确认目标值后,系统语音确认是否为该匹配字典值。
判断:用户语音回复判断是否匹配正确;
匹配有误,则系统语音提示用户重新语音输入;并继续路程c;
匹配无误,则系统选择该字段,并进入下一流程2.1.8。
若是文本框:则系统录入识别的文字内容;并判定录入的内容的格式、长度是否符合客户端的要求,文字内为字符串格式,整数类型数字为INT型数字,小数类型数字为FLOAT型数字,且要求录入文字与数字的总长度小于N,其中N表示预先设置的录入长度阈值。
若符合:则进入下一流程2.1.7;若不符合:则系统语音提示前端校验的内容文案;并继续流程d。
2.1.7:确认是否还有表单字段内容需要录入 若是:则进入流程c; 若否:则结束全部流程。
步骤1.2提供了各个地方的方言俚语,扩宽了服务的客群范围,尽可能让所有用户均能使用语音录入;步骤1.3使用语音录入代替传统的手工录入,为不便与使用手动输入的用户也带来了良好的操作体验,例如:无法正常使用双手的残障人士、不擅长使用智能手机的老年人等;步骤1.4与2.1.1在语音录入与识别过程中将其分为文本框与选择项,细化了用户语言表述的类型,进而提升了之后录入与反馈的准确性。步骤1.1至1.4与步骤2.1为一整套完整的客户端语音输入表单的方式,可以在免除了手工录入的同时提高了录入效率。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种客户端语音输入表单的方法,其特征在于:
所述客户端语音输入表单的方法包括如下步骤:
采集用户的语音数据;
将所述语音数据识别为文字内容数据;
将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。
2.根据权利要求1所述的客户端语音输入表单的方法,其特征在于:
所述客户端语音输入表单的方法还包括如下步骤:
提供表单界面以及语音录入操作界面。
3.根据权利要求2所述的客户端语音输入表单的方法,其特征在于:
所述客户端语音输入表单的方法还包括如下步骤:
读取表单界面要求输入的字段类型。
4.根据权利要求3所述的客户端语音输入表单的方法,其特征在于:
所述客户端语音输入表单的方法还包括如下步骤:
判断读取表单界面要求输入的字段类型为文本框内容还是选择项内容,如果读取表单界面要求输入的字段类型为文本框内容则转入文本框匹配判断步骤,如果读取表单界面要求输入的字段类型为选择项内容则转入选择项内容匹配判断步骤。
5.根据权利要求4所述的客户端语音输入表单的方法,其特征在于:
所述文本框匹配判断步骤包括如下步骤:
判断所述文字内容数据是否符合预设格式和字段长度要求;
如果满足预设格式和字段长度要求,则系统语音提示后台校验文字内容数据。
6.根据权利要求5所述的客户端语音输入表单的方法,其特征在于:
所述客户端语音输入表单的方法还包括如下步骤:
所述选择项内容匹配判断步骤包括如下步骤:
将文字内容数据与预存的字典值进行模糊匹配获得匹配字典值。
7.根据权利要求6所述的客户端语音输入表单的方法,其特征在于:
所述选择项内容匹配判断步骤还包括如下步骤:
向用户提示所述匹配字典值。
8.根据权利要求7所述的客户端语音输入表单的方法,其特征在于:
所述选择项内容匹配判断步骤还包括如下步骤:
采集用户对所述匹配字典值的反馈数据。
9.根据权利要求8所述的客户端语音输入表单的方法,其特征在于:
所述选择项内容匹配判断步骤还包括如下步骤:
根据所述反馈数据判断所述匹配字典值是否准确;
如果所述匹配字典值准确则匹配字典值录入至所述表单界面。
10.根据权利要求9所述的客户端语音输入表单的方法,其特征在于:
所述反馈数据为语音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647177.0A CN113312886A (zh) | 2021-06-10 | 2021-06-10 | 客户端语音输入表单的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647177.0A CN113312886A (zh) | 2021-06-10 | 2021-06-10 | 客户端语音输入表单的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113312886A true CN113312886A (zh) | 2021-08-27 |
Family
ID=77378395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110647177.0A Pending CN113312886A (zh) | 2021-06-10 | 2021-06-10 | 客户端语音输入表单的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312886A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114462364A (zh) * | 2022-02-07 | 2022-05-10 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840318A (zh) * | 2019-01-04 | 2019-06-04 | 上海上湖信息技术有限公司 | 一种表单项的填写方法及系统 |
CN112800730A (zh) * | 2021-01-28 | 2021-05-14 | 中国工商银行股份有限公司 | 报表填报方法及装置 |
CN112836481A (zh) * | 2021-03-16 | 2021-05-25 | 上海适享文化传播有限公司 | 基于语音转文字的表单标准化输出方法 |
-
2021
- 2021-06-10 CN CN202110647177.0A patent/CN113312886A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840318A (zh) * | 2019-01-04 | 2019-06-04 | 上海上湖信息技术有限公司 | 一种表单项的填写方法及系统 |
CN112800730A (zh) * | 2021-01-28 | 2021-05-14 | 中国工商银行股份有限公司 | 报表填报方法及装置 |
CN112836481A (zh) * | 2021-03-16 | 2021-05-25 | 上海适享文化传播有限公司 | 基于语音转文字的表单标准化输出方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114462364A (zh) * | 2022-02-07 | 2022-05-10 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
CN114462364B (zh) * | 2022-02-07 | 2023-01-31 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7117223B2 (en) | Method of interpretation service for voice on the phone | |
US5978820A (en) | Text summarizing method and system | |
US20020032591A1 (en) | Service request processing performed by artificial intelligence systems in conjunctiion with human intervention | |
WO2013154010A1 (ja) | 音声認識サーバ統合装置および音声認識サーバ統合方法 | |
JP2002023783A (ja) | 対話処理システム | |
US20080077406A1 (en) | Mobile Dictation Correction User Interface | |
US20060133587A1 (en) | System and method for speech recognition-enabled automatic call routing | |
CN111917924A (zh) | 客服语音质检方法及相关设备 | |
JPH10105655A (ja) | 光学文字認識のための検証および訂正の方法およびシステム | |
JP2003216181A (ja) | 制約に基づく音声認識システム及び方法 | |
CA2413455C (en) | Systems and methods for translating languages | |
JP2002125047A5 (zh) | ||
CN109670020B (zh) | 一种语音交互方法、系统及装置 | |
CN109977398A (zh) | 一种特定领域的语音识别文本纠错方法 | |
CN113312886A (zh) | 客户端语音输入表单的方法 | |
CN108446278A (zh) | 一种基于自然语言的语义理解系统及方法 | |
CN110225210A (zh) | 基于通话摘要自动填写工单方法及系统 | |
CN114239607A (zh) | 一种对话答复方法及装置 | |
CN105721651A (zh) | 一种语音拨号方法和设备 | |
CN108682423A (zh) | 一种语音识别方法和装置 | |
CN116663890A (zh) | 一种基于机器学习模型的供电客户满意度评价方法及系统 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN112860724B (zh) | 一种用于人机融合客服系统的自动地址纠偏方法 | |
JPH10177468A (ja) | 移動端末音声認識/データベース検索通信システム | |
US6141661A (en) | Method and apparatus for performing a grammar-pruning operation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |