CN107357772A - 表单填写方法、装置和计算机设备 - Google Patents
表单填写方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN107357772A CN107357772A CN201710536455.9A CN201710536455A CN107357772A CN 107357772 A CN107357772 A CN 107357772A CN 201710536455 A CN201710536455 A CN 201710536455A CN 107357772 A CN107357772 A CN 107357772A
- Authority
- CN
- China
- Prior art keywords
- item
- text
- filled
- list
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000012545 processing Methods 0.000 claims description 74
- 230000015654 memory Effects 0.000 claims description 34
- 238000012546 transfer Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 189
- 230000006870 function Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了表单填写方法、装置和计算机设备。表单填写方法,包括:获取预设待填写表单,所述预设待填写表单包括至少两个填写项;获取用户输入的语音数据,将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。本发明实施例的技术方案,自动从语音中获取填入字段并填入表单对应填写项中,方便用户填写表单,提高数据录入效率。
Description
技术领域
本发明实施例涉及语音识别分析技术,尤其涉及表单填写方法、装置和计算机设备。
背景技术
当人们的生活和工作中,时常会出现需要在终端上进行表单填写的情况,例如行政普查、基础设施数据维护和公共安全应急处理等领域,需要工作人员进行户外数据调查。
现有技术中,在终端上进行表单填写,需要用户通过实体按键键盘或虚拟按键键盘进行输入填写。部分应用可实现语音输入,但是只能针对待填写表单的单个填写项进行逐个选取输入。
现有技术中的表单填写方式,用户需要对表单中的字段进行逐个填写,输入填写内容的速度慢。
发明内容
本发明提供表单填写方法、装置和计算机设备,以实现方便用户填写表单,提高数据录入效率。
第一方面,本发明实施例提供了一种表单填写方法,包括:
获取预设待填写表单,其中,所述预设待填写表单包括至少两个填写项;
获取用户输入的语音数据,将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。
第二方面,本发明实施例还提供了一种表单填写方法,包括:
接收终端发送的文本和处理标识信息,所述文本包括填写项和各填写项对应的填入字段;
在预设表单库中搜索与所述处理标识信息对应的预设待填写表单,所述预设待填写表单包括至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设待填写表单;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
将所述文本的填入字段和所述匹配结果发送至所述终端。
第三方面,本发明实施例还提供了一种表单填写装置,包括:
表单获取模块,用于获取预设待填写表单,其中,所述预设待填写表单包括至少两个填写项;
语音获取模块,用于获取用户输入的语音数据;
文本转化模块,用于将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;
匹配结果确定模块,用于基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
字段填入模块,用于根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。
第四方面,本发明实施例还提供了一种表单填写装置,包括:
文本信息接收模块,用于接收终端发送的文本和处理标识信息,所述文本包括填写项和各填写项对应的填入字段;
预设表单搜索模块,用于在预设表单库中搜索与所述处理标识信息对应的预设待填写表单,所述预设待填写表单包括至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设待填写表单;
匹配结果确定模块,用于基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
填入字段反馈模块,用于将所述文本的填入字段和所述匹配结果发送至所述终端。
第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面提供的表单填写方法。
第六方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第二方面提供的表单填写方法。
第七方面,本发明实施例还提供了一种计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面提供的表单填写方法。
第八方面,本发明实施例还提供了一种计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第二方面提供的表单填写方法。
本发明实施例的技术方案,通过从用户语音中获取待填写表单的填写项对应的填入字段并填入待填写表单中,解决需要针对待填写表单的单个填写项进行逐个选取而造成的操作繁琐,数据录入效率低的问题,实现方便用户填写表单,提高数据录入效率的效果。
附图说明
图1是本发明实施例一中的一种表单填写方法的流程图;
图2是本发明实施例二中的一种表单填写方法的流程图;
图3是本发明实施例三中的一种表单填写方法的流程图;
图4是本发明实施例四中的一种表单填写方法的流程图;
图5是本发明实施例五中的一种表单填写方法的流程图;
图6是本发明实施例六中的一种表单填写方法的流程图;
图7是本发明实施例七中的一种表单填写方法的流程图;
图8是本发明实施例八中的一种表单填写装置的结构示意图;
图9是本发明实施例九中的一种表单填写装置的结构示意图;
图10是本发明实施例十中的一种计算机设备的结构示意图;
图11是本发明实施例十一中的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种表单填写方法的流程图,本实施例可适用于用户在终端上填写表单的情况,所述终端可以为智能手机、平板电脑和掌上电脑等,该方法可以由表单填写装置来执行,该表单填写装置可以由硬件和/或软件来实现,该表单填写装置可以配置在由终端和服务器构成的表单填写系统中,该表单填写方法具体包括如下步骤:
步骤110、获取预设待填写表单,其中,预设待填写表单包括至少两个填写项。
其中,预设待填写表单是用户要进行填写的表单,其可以是预先建立并存储在终端的存储介质中,由终端从存储介质中根据用户的需要调取相应的预设待填写表单;预设待填写表单也可以是预先建立并存储在服务器中,由终端根据用户的需要通过网络从服务器获取相应的预设待填写表单。预设待填写表单中可以包括表单名称和至少两个填写项,示例的,预设待填写表单的表单名称为人口数据收集,预设待填写表单的填写项包括:变动类型、变动日期、现居住地详细地址、人序号、户序号、姓名、性别、民族、文化、婚姻和证件号码。
可选的,在获取预设待填写表单之后,展示预设待填写表单。这样,用户可以方便用户读取预设待填写表单的具体内容,可以在终端的显示屏上显示预设待填写表单,和/或通过语音向用户播报预设待填写表单的具体内容。
步骤120、获取用户输入的语音数据,将语音数据转化为文本,文本包括填写项和各填写项对应的填入字段。
其中,当用户要填写预设待填写表单时,可以是通过终端内置的麦克风或者终端上连接的外置麦克风输入语音数据;也可以是获取终端上连接的外部存储设备中存储的语音数据文件或者通过网络获取预设的语音数据文件。用户输入的语音数据的内容是按照预设模式构成的,例如,语音数据的内容可以是按照预设待填写表单的填写项在前,填写项对应的填入字段在后的模式构成的,并且,一个语音数据中可以包括多个填写项及其对应的填入字段,也就是每个填写项及其对应的填入字段都保持填写项在前,填写项对应的填入字段相邻在后的模式。将语音数据转化为文本,该文本中的字符便包括填写项和对应的填入字段,并且文本中的填写项和对应的填入字段也保持预设模式。
步骤130、基于预设待填写表单将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到匹配结果,匹配结果包括:文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
其中,文本中包括预设待填写表单的全部或者部分填写项,将文本中填写项与预设待填写表单的至少两个填写项进行匹配,确定文本的填写项与预设待填写表单中的至少部分填写项的匹配关系,之后,因为文本中的填写项和对应的填入字段是按照预设模式构成的,可以确定文本中的填写项和填入字段的对应关系,从而确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
可选的,步骤130包括:将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单中的至少部分填写项的匹配关系;
生成文本的填写项匹配的预设待填写表单中的至少部分填写项与文本的填写项对应的填入字段的匹配关系,作为匹配结果。
步骤140、根据匹配结果将文本的填入字段填入匹配的预设待填写表单的填写项中。
其中,在确定了文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系之后,将文本的填入字段填入匹配的预设待填写表单的填写项中。
可选的,在根据匹配结果将文本的填入字段填入匹配的预设待填写表单的填写项中之后,展示填写后的预设待填写表单。这样,用户可以方便用户读取填入的具体内容,可以在终端的显示屏上显示填写后的预设待填写表单,和/或通过语音向用户播报填写后的预设待填写表单的具体内容。
本实施例的技术方案,通过从用户语音中获取待填写表单的填写项对应的填入字段并填入待填写表单中,解决需要针对待填写表单的单个填写项进行逐个选取而造成的操作繁琐,数据录入效率低的问题,实现方便用户填写表单,提高数据录入效率的效果。
实施例二
图2为本发明实施例二提供的一种表单填写方法的流程图,本实施例的技术方案在上述实施例的技术方案的基础上,进一步细化,可选的,表单填写方法,还包括:
步骤210、获取用于标示识别预设待填写表单的处理标识信息。
其中,对于预设待填写表单,其有唯一对应的处理标识信息,该处理标识信息用于标示识别预设待处理表单,即处理标识信息相当于预设待处理表单的一个专属信息,利用处理标识信息可以调取对应的预设待填写表单。
可选的,按照预设格式生成用于标示识别预设待填写表单的处理标识信息;将预设待填写表单和对应的处理标识信息存储在预设表单库中。处理标识信息可以作为索引信息存储在预设表单库中,便于在获取预设待填写表单时,根据处理标识信息从预设表单库中搜索对应的预设待填写表单。并且,存储在预设表单库中的预设待填写表单,提取了预设待填写表单中的填写项并将提取的填写项与预设待填写表单对应存储,便于在进行文本中的填写项和预设待填写表单的填写项匹配时,获取预设待填写表单的填写项。示例的,处理标识信息可以是字符串,所述字符串可以由数字和/或字母组成,例如“2017031701”或“BG2017550”。
可选的,步骤130包括:
步骤220、根据处理标识信息在预设表单库中调取预设待填写表单的至少两个填写项,其中,处理标识信息与预设表单的对应关系是预先设定的,预设表单库中存储有至少一个预设表单。
步骤230、将文本的填写项与调取到的预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
其中,将文本中的填写项逐个与预先存储在预设表单库中的预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单的至少两个填写项的匹配关系,再根据文本中的填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
本实施例的技术方案,通过处理标识信息,从预设表单库中搜索与处理标识信息对应的预设待填写表单,并依据处理标识信息调取预设待填写表单的填写项,提高了获取预设待填写表单的填写项的效率。
实施例三
图3为本发明实施例三提供的一种表单填写方法的流程图,本实施例的技术方案在上述实施例的技术方案的基础上,进一步细化,可选的,表单填写方法中步骤130包括:
步骤310、对文本进行分词,得到文本分词。
其中,对文本进行分词操作,得到至少一个文本分词,文本中的字符按照排列顺序具备相应的在文本中的坐标,每个字符处于坐标的相邻坐标点之间,坐标点以整数标记。例如,文本中共有4个字符,那么,第一个字符处于坐标点0和坐标点1之间,第二个字符处于坐标点1和坐标点2之间,第三个字符处于坐标点2和坐标点3之间,第四个字符处于坐标点3和坐标点4之间。优选的,分词可以直接采用表单字段及对应拼音对录入数据的拼音进行匹配,然后得到各文本分词的坐标。当然,分词处理也可以是基于预设的分词词典进行的,可采用正向(逆向)最大匹配法、最佳匹配法、逐词遍历法或词频统计法,或其他合适的分词方法。
步骤320、在文本分词中搜索与预设待填写表单的至少两个填写项相匹配的文本分词。
其中,将文本分词逐个与预设待填写表单的各个填写项进行对比,遍历所有文本分词,直到所有文本分词都与预设待填写表单的至少两个填写项进行对比之后,将文本分词中与预设待填写表单的填写项相同的文本分词确定为文本分词中与预设待填写表单的填写项相匹配的文本分词。其中,填写项与文本分词的匹配方式可以为语义匹配,如每个填写项与各文本分词分别进行语义相似度计算,当相似度大于阈值且最大则认为匹配,或如计算是否在同一预设的同义词库中,如果在同一预设同义词库中,则认为匹配成功。也可以采用文本直接匹配或拼音直接匹配等方法。
步骤330、将搜索到的与预设待填写表单的至少部分填写项相匹配的文本分词确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间。
其中,当某个文本分词与预设待填写表单的某个填写项相同时,则将该文本分词确定为文本中的填写项,并确定文本中的填写项与预设待填写表单的填写项的匹配关系,并且记录文本中的填写项在文本中的坐标区间。例如,文本中的字符为“姓名张三”,经分词后得到文本分词“姓名”和“张三”,预设待填写表单中的填写项为“姓名”、“学历”和“年龄”,将文本分词“姓名”和“张三”分别与预设待填写表单的填写项进行匹配,确定文本分词“姓名”与预设待填写表单的填写项“姓名”相匹配,将文本分词“姓名”确定为文本中的填写项,而在文本中“姓名”的坐标区间为[0,2]。
例如:在用户输入采集数据时,通过匹配之前获取的表单字段信息,得到输入信息中表单字段所处坐标,通过坐标与输入语句长度的计算,获取字段及对应字段内容,用以下伪代码做简单说明。
实例:
表单字段:变动类型,变动日期,现居住地详细地址,人序号,户序号,姓名,性别,民族,文化,婚姻,证件号码
输入语句:姓名张三文化本科户序号123456
经过计算后:sequence=[[0,2],[4,2],[8,3]]
步骤340、将位于坐标区间预设相邻位置的至少一个文本分词确定为该坐标区间内的文本中的填写项对应的填入字段。
其中,用户输入的语音数据的内容是按照预设模式构成的,即用户输入的语音数据转换为文本后,文本中包括的填写项和对应的填入字段是按照预设模式排列的,例如,填写项在前,对应的填入字段相邻在后。当确定文本中的文本分词为填写项时,根据预设模式确定与该填写项对应的填入字段所处的预设相邻位置,预设相邻位置可以是在前相邻位置或在后相邻位置。将文本中位于相邻的填写项的坐标区间之间的文本分词确定为填入字段,并根据预设相邻位置确定填入字段和填写项的对应关系。当相邻填写项的坐标区间之间没有文本分词,则根据预设相邻位置,确定相应的填写项的填入字段为空,这样设置,可以让用户通过输入只包括填写项,但无对应填入字段的语音数据,清楚该填写项中已经填写的内容。
步骤350、根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
其中,在将文本分词中与预设待填写表单的填写项相匹配的文本分词确定为文本中的填写项之后,即确定了文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,再结合文本中填写项和对应的填入字段的对应关系,即可确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系,示例的,文本为“姓名张三”,其中,文本分词“姓名”与预设待填写表单中的填写项“姓名”相同,即文本分词“姓名”为文本中的填写项,且与预设待填写表单中的填写项“姓名”为匹配关系;文本中填写项和对应的填入字段的排列形式为填写项在前,对应的填入字段在后相邻,那么,文本分词“张三”为文本中的填写项“姓名”对应的填入字段;因而,文本中填写项“姓名”对应的填入字段“张三”与预设待填写表单的填写项“姓名”为匹配关系。
可选的,在上述的步骤130具体包括的步骤之外,步骤130还可以包括:
步骤360、在与文本对应的拼音串中搜索与预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组。
其中,将文本中的每个字符的拼音,按照文本中对应的字符的排列顺序,排列成拼音串,预设待填写表单的每个填写项中的字符对应的拼音,按照预设待填写表单的填写项中字符的排列顺序排列成与填写项对应的拼音组。在文本对应的拼音串中搜索与预设待填写表单的每个填写项的拼音组相同的拼音组,将其确定为与预设待填写表单的填写项的拼音组相匹配的文本拼音组。
步骤370、将搜索到的文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间。
其中,当文本的拼音串中存在与预设待填写表单的某个填写项的拼音组相同的文本拼音组时,则将该文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项与预设待填写表单的填写项的匹配关系,并且记录文本中的填写项在文本中的坐标区间。例如,文本中的字符为“姓名张三”,对应的拼音串为“xing ming zhang san”,预设待填写表单中的填写项为“姓名”、“学历”和“年龄”上述填写项对应的拼音组依次为“xing ming”、“xueli”和“nian ling”,在拼音串“xing ming zhang san”中搜索与“xingming”、“xue li”或“nian ling”相同的文本拼音组,确定文本拼音组“xing ming”与预设待填写表单的填写项的拼音组“xing ming”相同,进而确定文本中的“姓名”和预设待填写表单的填写项“姓名”相匹配,将文本中的字符“姓名”确定为文本中的填写项,而在文本中“姓名”的坐标区间为[0,2]。
步骤380、将位于坐标区间预设相邻位置的至少一个文本中的字符确定为该坐标区间内的文本中的填写项对应的填入字段。
其中,用户输入的语音数据的内容是按照预设模式构成的,即用户输入的语音数据转换为文本后,文本中包括的填写项和对应的填入字段是按照预设模式排列的,例如,填写项在前,对应的填入字段相邻在后。当确定文本中的字符或字符组为填写项时,根据预设模式确定预设相邻位置,预设相邻位置可以是在前相邻位置或在后相邻位置。将文本中位于相邻的填写项的坐标区间之间的字符确定为填入字段,并根据预设相邻位置确定填入字段和填写项的对应关系。当相邻填写项的坐标区间之间没有字符,则根据预设相邻位置,确定相应的填写项的填入字段为空,这样设置,可以让用户通过输入只包括填写项,但无对应填入字段的语音数据,清楚该填写项中已经填写的内容。
步骤390、根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
其中,在将文本的字符中与预设待填写表单的填写项相匹配的字符确定为文本中的填写项之后,即确定了文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,再结合文本中填写项和对应的填入字段的对应关系,即可确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
需要说明的是,步骤310-350和步骤360-390,两组步骤可以是择一执行,也可以是分别执行,然后将步骤350中确定的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系和步骤390中确定的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系累加在一起,作为最终的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
本实施例的技术方案,通过分析文本中包括的信息,确定文本中的填入字段和预设待填写表单的填写项的匹配关系,保证用户通过语音填写表单的准确率。
实施例四
图4为本发明实施例四提供的一种表单填写方法的流程图,本实施例的技术方案在上述实施例的技术方案的基础上,进一步细化,可选的,表单填写方法还包括:
步骤410、根据预设表单数据文件生成预设待填写表单。
其中,预设表单数据文件包括填写项和表单格式信息。预设表单数据文件可以是预先存储在终端的存储介质中,也可以是终端通过网络从服务器获取的。可选的,预设表单数据文件可以是JavaScript对象标记语言(JavaScript Object Notation,JSON)或可扩展标记语言(Extensible Markup Language,XML)格式的文件,示例的,当预设表单数据文件为JSON格式的文件时,预设表单数据文件中包括预设待填写表单的表单名称和填写项,具体为:{"id":"","title":"数据采集表","next_page_id":"","sections":[{"name":"流动人口采集建档名单","fields":[{"key":"姓名","type":"edit_text","hint":"请输入您的姓名","defaultValue":"","maxLength":"","validation":"","validInfo":""},{"key":"联系电话","type":"edit_text","hint":"输入电话号码","validation":""}]}]},根据该预设表单数据文件即可生成预设待填写表单。
使用标准数据格式,可以提高预设表单数据文件的通用性,利于不同操作系统下根据预设表单数据文件生成预设待填写表单的便捷性。
可选的,预设表单数据文件还包括:填入字段的数据类型和填入字段的数据范围。
可选的,在步骤410之后,还包括:
步骤420、获取预设待填写表单中填入字段的数据类型和填入字段的数据范围。
可选的,步骤140包括:
步骤430、根据预设待填写表单的填入字段的数据类型和填入字段的数据范围,确定文本的填入字段的正则表达式。
步骤440、根据正则表达式过滤对应的文本的填入字段中的无效信息,得到修正填入字段。
其中,填写项中填写的填入字段的具体内容有相应的数据类型和数据范围,例如,当填写项为“性别”时,其对应的填入字段的数据类型为单个文字,数据范围为“男”或“女”,那么对应的正则表达式可以滤除填入字段中除去“男”和“女”这两个文字以外的字符。用正则表达式对文本进行截取和处理,比如可以去掉头尾的多余字符。示例的,当用户输入的语音数据转换为文本之后,针对预设待填写表单中“性别”这一填写项对应的填入字段为“嗯男性”,通过正则表达式可以滤除多余的口语“嗯”,以及相对于数据范围多余的字符“性”。
步骤450、根据匹配结果将修正填入字段填入匹配的填写项中。
其中,当修正填入字段中的字符数量为零时,可以不将字符数量为零的修正填入字段填入匹配的填写项中。因为,当修正填入字段的字符数量为零时,说明用户输入的语音数据中包括的填入字段的具体内容可能是错误的,由此,避免将错误填入字段填入预设待填写表单的填写项中,并且,在此情况下,可以向用户展示提示信息,指示字符数量为零的修正填入字段对应的预设待填写表单中的填写项填写错误。
可选的,当与文本的填入字段相匹配的预设待填写表单的填写项中存在已填写的填入字段时,根据匹配结果以文本的填入字段覆盖已填写的填入字段。
本实施例的技术方案,通过填入字段的数据类型和数据范围,对填入字段进行修正,滤除正常填写内容以外的字符,从而提高填入字段的正确性和规范性。
实施例五
图5为本发明实施例五提供的一种表单填写方法的流程图,本实施例可适用于用户在终端上填写表单,并由服务器分析用户输入的语音数据,将分析的相关结果反馈至终端的情况,所述终端可以为智能手机、平板电脑和掌上电脑等,该方法可以由配置于服务器的表单填写装置来执行,该表单填写装置可以由硬件和/或软件来实现,该表单填写方法具体包括如下步骤:
步骤510、接收终端发送的文本和处理标识信息,文本包括填写项和各填写项对应的填入字段。
其中,终端获取预设待填写表单,其可以是预先建立并存储在终端的存储介质中,预设待填写表单中可以包括表单名称和至少两个填写项,示例的,预设待填写表单的表单名称为人口数据收集,预设待填写表单的填写项包括:变动类型、变动日期、现居住地详细地址、人序号、户序号、姓名、性别、民族、文化、婚姻和证件号码。然后,终端获取用户输入的语音数据,将语音数据转化为文本,文本包括填写项和各填写项对应的填入字段。当用户要填写预设待填写表单时,可以是通过终端内置的麦克风或者终端上连接的外置麦克风输入语音数据;也可以是获取终端上连接的外部存储设备中存储的语音数据文件或者通过网络获取预设的语音数据文件。用户输入的语音数据的内容是按照预设模式构成的,例如,语音数据的内容可以是按照预设待填写表单的填写项在前,填写项对应的填入字段在后的模式构成的,并且,一个语音数据中可以包括多个填写项及其对应的填入字段,也就是每个填写项及其对应的填入字段都保持填写项在前,填写项对应的填入字段相邻在后的模式。将语音数据转化为文本,该文本中的字符便包括填写项和对应的填入字段,并且文本中的填写项和对应的填入字段也保持预设模式。
终端获取用于标示识别预设待填写表单的处理标识信息。其中,对于预设待填写表单,其有唯一对应的处理标识信息,该处理标识信息用于标示识别预设待处理表单,即处理标识信息相当于预设待处理表单的一个专属信息,利用处理标识信息可以调取对应的预设待填写表单。
可选的,按照预设格式生成用于标示识别预设待填写表单的处理标识信息;将预设待填写表单和对应的处理标识信息存储在预设表单库中。处理标识信息可以作为索引信息存储在预设表单库中,便于在获取预设待填写表单时,根据处理标识信息从预设表单库中搜索对应的预设待填写表单。并且,存储在预设表单库中的预设待填写表单,提取了预设待填写表单中的填写项并将提取的填写项与预设待填写表单对应存储,便于在进行文本中的填写项和预设待填写表单的填写项匹配时,获取预设待填写表单的填写项。示例的,处理标识信息可以是字符串,所述字符串可以由数字和/或字母组成,例如“2017031701”或“BG2017550”。
步骤520、在预设表单库中搜索与处理标识信息对应的预设待填写表单,预设待填写表单包括至少两个填写项。其中,处理标识信息与预设表单的对应关系是预先设定的,预设表单库中存储有至少一个预设待填写表单;在预设表单库中搜索与处理标识信息相同的预先存储的处理标识信息,将与预先存储的处理标识信息对应存储在预设表单库的预设待填写表单确定为与处理标识信息对应的预设待填写表单。
步骤530、基于预设待填写表单将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到匹配结果。其中,匹配结果包括:文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
可选的,对接收到的文本进行语义分析,确定其中包括的填写项以及对应的填入字段。进一步的,基于待填写表单将文本的填写项与待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单中的至少部分填写项的匹配关系;
生成文本的填写项匹配的预设待填写表单中的至少部分填写项与文本的填写项对应的填入字段的匹配关系,作为匹配结果。
步骤540、将文本的填入字段和匹配结果发送至终端。
其中,终端在接收了文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系之后,将文本的填入字段填入匹配的预设待填写表单的填写项中。
本实施例的技术方案,通过从文本中获取待填写表单的填写项对应的填入字段并填入待填写表单中,解决需要针对待填写表单的单个填写项进行逐个选取而造成的操作繁琐,数据录入效率低的问题,实现方便用户填写表单,提高数据录入效率的效果。
实施例六
图6为本发明实施例六提供的一种表单填写方法的流程图,本实施例的技术方案在实施例五的技术方案的基础上,进一步细化,可选的,在步骤510之前,表单填写方法还包括:
步骤610、接收终端发送的预设待填写表单和对应的处理标识信息。
其中,预设待填写表单可以是终端根据预设表单数据文件生成的,预设表单数据文件包括填写项和表单格式信息。预设表单数据文件可以是预先存储在终端的存储介质中,也可以是终端通过网络从服务器获取的。可选的,预设表单数据文件可以是JavaScript对象标记语言(JavaScript Object Notation,JSON)或可扩展标记语言(ExtensibleMarkup Language,XML)格式的文件,示例的,当预设表单数据文件为JSON格式的文件时,预设表单数据文件中包括预设待填写表单的表单名称和填写项,具体为:{"id":"","title":"数据采集表","next_page_id":"","sections":[{"name":"流动人口采集建档名单","fields":[{"key":"姓名","type":"edit_text","hint":"请输入您的姓名","defaultValue":"","maxLength":"","validation":"","validInfo":""},{"key":"联系电话","type":"edit_text","hint":"输入电话号码","validation":""}]}]},根据该预设表单数据文件即可生成预设待填写表单。处理标识信息可以是由终端按照预设格式生成的,处理标识信息用于标示识别预设待填写表单。
步骤620、将预设待填写表单和对应的处理标识信息存储在预设表单库中。
其中,处理标识信息可以作为索引信息存储在预设表单库中,便于在获取预设待填写表单时,根据处理标识信息从预设表单库中搜索对应的预设待填写表单。并且,存储在预设表单库中的预设待填写表单,提取了预设待填写表单中的填写项并将提取的填写项与预设待填写表单对应存储,便于在进行文本中的填写项和预设待填写表单的填写项匹配时,获取预设待填写表单的填写项。
可选的,步骤530包括:
步骤630、根据处理标识信息在预设表单库中调取预设待填写表单的至少两个填写项。其中,处理标识信息与预设表单的对应关系是预先设定的,预设表单库中存储有至少一个预设表单。
步骤640、将文本的填写项与调取到的预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
其中,将文本中的填写项逐个与预先存储在预设表单库中的预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单的至少两个填写项的匹配关系,再根据文本中的填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
可选的,接收到的终端发送的预设待填写表单还包括:填入字段的数据类型和填入字段的数据范围;
可选的,步骤540包括:
根据预设待填写表单的填入字段的数据类型和填入字段的数据范围,确定文本的填入字段的正则表达式;
根据正则表达式过滤对应的所述文本的填入字段中的无效信息,得到修正填入字段;
将修正填入字段发送至所述终端。
本实施例的技术方案,通过处理标识信息,从预设表单库中搜索与处理标识信息对应的预设待填写表单,并依据处理标识信息调取预设待填写表单的填写项,提高了获取预设待填写表单的填写项的效率。
实施例七
图7为本发明实施例七提供的一种表单填写方法的流程图,本实施例的技术方案在实施例五和实施例六的技术方案的基础上,进一步细化,可选的,表单填写方法中步骤530包括:
步骤710、对文本进行分词,得到文本分词。
其中,对文本进行语义分析,并将文本进行分词操作,得到至少一个文本分词,文本中的字符按照排列顺序具备相应的在文本中的坐标,每个字符处于坐标的相邻坐标点之间,坐标点以整数标记。例如,文本中共有4个字符,那么,第一个字符处于坐标点0和坐标点1之间,第二个字符处于坐标点1和坐标点2之间,第三个字符处于坐标点2和坐标点3之间,第四个字符处于坐标点3和坐标点4之间。
步骤720、在文本分词中搜索与预设待填写表单的至少两个填写项相匹配的文本分词。
其中,将文本分词逐个与预设待填写表单的各个填写项进行对比,遍历所有文本分词,直到所有文本分词都与预设待填写表单的至少两个填写项进行对比之后,将文本分词中与预设待填写表单的填写项相同的文本分词确定为文本分词中与预设待填写表单的填写项相匹配的文本分词。
步骤730、将搜索到的与预设待填写表单的至少部分填写项相匹配的文本分词确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间。
其中,当某个文本分词与预设待填写表单的某个填写项相同时,则将该文本分词确定为文本中的填写项,并确定文本中的填写项与预设待填写表单的填写项的匹配关系,并且记录文本中的填写项在文本中的坐标区间。例如,文本中的字符为“姓名张三”,经分词后得到文本分词“姓名”和“张三”,预设待填写表单中的填写项为“姓名”、“学历”和“年龄”,将文本分词“姓名”和“张三”分别与预设待填写表单的填写项进行匹配,确定文本分词“姓名”与预设待填写表单的填写项“姓名”相匹配,将文本分词“姓名”确定为文本中的填写项,而在文本中“姓名”的坐标区间为[0,2]。
步骤740、将位于坐标区间预设相邻位置的至少一个文本分词确定为该坐标区间内的文本中的填写项对应的填入字段。
其中,用户输入的语音数据的内容是按照预设模式构成的,即用户输入的语音数据转换为文本后,文本中包括的填写项和对应的填入字段是按照预设模式排列的,例如,填写项在前,对应的填入字段相邻在后。当确定文本中的文本分词为填写项时,根据预设模式确定与该填写项对应的填入字段所处的预设相邻位置,预设相邻位置可以是在前相邻位置或在后相邻位置。将文本中位于相邻的填写项的坐标区间之间的文本分词确定为填入字段,并根据预设相邻位置确定填入字段和填写项的对应关系。当相邻填写项的坐标区间之间没有文本分词,则根据预设相邻位置,确定相应的填写项的填入字段为空,这样设置,可以让用户通过输入只包括填写项,但无对应填入字段的语音数据,清楚该填写项中已经填写的内容。
步骤750、根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
其中,在将文本分词中与预设待填写表单的填写项相匹配的文本分词确定为文本中的填写项之后,即确定了文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,再结合文本中填写项和对应的填入字段的对应关系,即可确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系,示例的,文本为“姓名张三”,其中,文本分词“姓名”与预设待填写表单中的填写项“姓名”相同,即文本分词“姓名”为文本中的填写项,且与预设待填写表单中的填写项“姓名”为匹配关系;文本中填写项和对应的填入字段的排列形式为填写项在前,对应的填入字段在后相邻,那么,文本分词“张三”为文本中的填写项“姓名”对应的填入字段;因而,文本中填写项“姓名”对应的填入字段“张三”与预设待填写表单的填写项“姓名”为匹配关系。
可选的,在上述的步骤530具体包括的步骤之外,步骤530还可以包括:
步骤760、在与文本对应的拼音串中搜索与预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组。
其中,将文本中的每个字符的拼音,按照文本中对应的字符的排列顺序,排列成拼音串,预设待填写表单的每个填写项中的字符对应的拼音,按照预设待填写表单的填写项中字符的排列顺序排列成与填写项对应的拼音组。在文本对应的拼音串中搜索与预设待填写表单的每个填写项的拼音组相同的拼音组,将其确定为与预设待填写表单的填写项的拼音组相匹配的文本拼音组。
步骤770、将搜索到的文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间。
其中,当文本的拼音串中存在与预设待填写表单的某个填写项的拼音组相同的文本拼音组时,则将该文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项与预设待填写表单的填写项的匹配关系,并且记录文本中的填写项在文本中的坐标区间。例如,文本中的字符为“姓名张三”,对应的拼音串为“xing ming zhang san”,预设待填写表单中的填写项为“姓名”、“学历”和“年龄”上述填写项对应的拼音组依次为“xing ming”、“xue li”和“nian ling”,在拼音串“xing ming zhang san”中搜索与“xingming”、“xue li”或“nian ling”相同的文本拼音组,确定文本拼音组“xing ming”与预设待填写表单的填写项的拼音组“xing ming”相同,进而确定文本中的“姓名”和预设待填写表单的填写项“姓名”相匹配,将文本中的字符“姓名”确定为文本中的填写项,而在文本中“姓名”的坐标区间为[0,2]。
步骤780、将位于坐标区间预设相邻位置的至少一个文本中的字符确定为该坐标区间内的文本中的填写项对应的填入字段。
其中,用户输入的语音数据的内容是按照预设模式构成的,即用户输入的语音数据转换为文本后,文本中包括的填写项和对应的填入字段是按照预设模式排列的,例如,填写项在前,对应的填入字段相邻在后。当确定文本中的字符或字符组为填写项时,根据预设模式确定预设相邻位置,预设相邻位置可以是在前相邻位置或在后相邻位置。将文本中位于相邻的填写项的坐标区间之间的字符确定为填入字段,并根据预设相邻位置确定填入字段和填写项的对应关系。当相邻填写项的坐标区间之间没有字符,则根据预设相邻位置,确定相应的填写项的填入字段为空,这样设置,可以让用户通过输入只包括填写项,但无对应填入字段的语音数据,清楚该填写项中已经填写的内容。
步骤790、根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
其中,在将文本的字符中与预设待填写表单的填写项相匹配的字符确定为文本中的填写项之后,即确定了文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,再结合文本中填写项和对应的填入字段的对应关系,即可确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
需要说明的是,步骤710-750和步骤760-790,两组步骤可以是择一执行,也可以是分别执行,然后将步骤750中确定的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系和步骤790中确定的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系累加在一起,作为最终的文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
本实施例的技术方案,通过分析文本中包括的信息,确定文本中的填入字段和预设待填写表单的填写项的匹配关系,保证用户通过语音填写表单的准确率。
实施例八
图8为本发明实施例八提供的一种表单填写装置的结构示意图,本实施例可适用于用户在终端上填写表单的情况,所述终端可以为智能手机、平板电脑和掌上电脑等,该表单填写装置可以由硬件和/或软件来实现,该表单填写装置可以配置在由终端和服务器构成的表单填写系统中,表单填写装置80包括:
表单获取模块810,用于获取预设待填写表单,其中,预设待填写表单包括至少两个填写项;
语音获取模块820,用于获取用户输入的语音数据;
文本转化模块830,用于将语音数据转化为文本,文本包括填写项和各填写项对应的填入字段;
匹配结果确定模块840,用于基于预设待填写表单将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到匹配结果,匹配结果包括:文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系;
字段填入模块850,用于根据匹配结果将文本的填入字段填入匹配的预设待填写表单的填写项中。
可选的,匹配结果确定模块840包括:
填写项匹配单元,用于将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单中的至少部分填写项的匹配关系;
填入字段匹配单元,用于生成文本的填写项匹配的预设待填写表单中的至少部分填写项与文本的填写项对应的填入字段的匹配关系,作为匹配结果。
可选的,表单填写装置80还包括:
表单生成模块,用于根据预设表单数据文件生成预设待填写表单,其中,预设表单数据文件包括填写项和表单格式信息。
可选的,表单填写装置80还包括:
标识信息获取模块,用于获取用于标示识别预设待填写表单的处理标识信息;
匹配结果确定模块840,具体包括:
填写项调取单元,用于根据处理标识信息在预设表单库中调取预设待填写表单的至少两个填写项,其中,处理标识信息与预设表单的对应关系是预先设定的,预设表单库中存储有至少一个预设表单;
匹配单元,用于将文本的填写项与调取到预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
可选的,表单填写装置80还包括:
标识信息生成模块,用于按照预设格式生成用于标示识别预设待填写表单的处理标识信息;
表单信息存储模块,用于将预设待填写表单和对应的处理标识信息存储在预设表单库中。
可选的,匹配结果确定模块840,包括:
文本分词单元,用于对文本进行分词,得到文本分词;
匹配分词搜索单元,用于在文本分词中搜索与预设待填写表单的至少两个填写项相匹配的文本分词;
第一坐标确定单元,用于将搜索到的与预设待填写表单的至少部分填写项相匹配的文本分词确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间;
第一填入字段确定单元,用于将位于坐标区间预设相邻位置的至少一个文本分词确定为该坐标区间内的文本中的填写项对应的填入字段;
第一匹配关系确定单元,用于根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
可选的,匹配结果确定模块840还包括:
匹配拼音组搜索单元,用于在与文本对应的拼音串中搜索与预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
第二坐标确定单元,用于将搜索到的文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间;
第二填入字段确定单元,用于将位于坐标区间预设相邻位置的至少一个文本中的字符确定为该坐标区间内的文本中的填写项对应的填入字段;
第二匹配关系确定单元,用于根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单的至少部分填写项的匹配关系。
可选的,预设相邻位置包括:在前相邻位置或在后相邻位置。
可选的,预设表单数据文件还包括:填入字段的数据类型和填入字段的数据范围;
可选的,表单填写装置80,还包括:
第二表单属性值确定模块,用于获取预设待填写表单中填入字段的数据类型和填入字段的数据范围;
可选的,字段填入模块850,包括:
正则表达式确定单元,用于根据预设待填写表单的填入字段的数据类型和填入字段的数据范围,确定文本的各填入字段的正则表达式;
修正字段确定单元,用于根据正则表达式过滤对应的文本的填入字段中的无效信息,得到修正填入字段;
填入单元,用于根据匹配结果将修正填入字段填入匹配的填写项中。
可选的,字段填入模块850,还包括:
字段修正单元,用于当修正填入字段中的字符数量为零时,不将字符数量为零的修正填入字段填入匹配的填写项中。
可选的,字段填入模块850包括:
覆盖填写单元,用于当与文本的填入字段相匹配的预设待填写表单的填写项中存在已填写的填入字段时,根据匹配结果以文本的填入字段覆盖已填写的填入字段。
可选的,表单填写装置80,还包括:
待填表单展示模块,用于在获取预设待填写表单之后,展示预设待填写表单;和/或
填写表单展示模块,用于在根据匹配结果将文本的填入字段填入匹配的预设待填写表单的填写项中之后,展示填写后的预设待填写表单。
实施例九
图9为本发明实施例九提供的一种表单填写装置的结构示意图,本实施例可适用于用户在终端上填写表单,并由服务器分析用户输入的语音数据,将分析的相关结果反馈至终端的情况,所述终端可以为智能手机、平板电脑和掌上电脑等,该表单填写装置配置于服务器,该表单填写装置可以由硬件和/或软件来实现,该表单填写装置90具体包括:
文本信息接收模块910,用于接收终端发送的文本和处理标识信息,文本包括填写项和各填写项对应的填入字段;
预设表单搜索模块920,用于在预设表单库中搜索与处理标识信息对应的预设待填写表单,预设待填写表单包括至少两个填写项,其中,处理标识信息与预设表单的对应关系是预先设定的,预设表单库中存储有至少一个预设待填写表单;
匹配结果确定模块930,用于基于预设待填写表单将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到匹配结果,匹配结果包括:文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系;
填入字段反馈模块940,用于将文本的填入字段和匹配结果发送至终端。
可选的,匹配结果确定模块930包括:
填写项匹配单元,用于将文本的填写项与预设待填写表单的至少两个填写项进行匹配,得到文本的填写项与预设待填写表单中的至少部分填写项的匹配关系;
填入字段匹配单元,用于生成文本的填写项匹配的预设待填写表单中的至少部分填写项与文本的填写项对应的填入字段的匹配关系,作为匹配结果。
可选的,表单填写装置90还包括:
预设表单信息接收模块,用于接收终端发送的预设待填写表单和对应的处理标识信息;
预设表单信息存储模块,用于将预设待填写表单和对应的处理标识信息存储在预设表单库中。
可选的,匹配结果确定930模块,包括:
填写项调取单元,用于根据处理标识信息在预设表单库中调取预设待填写表单的至少两个填写项;
匹配单元,用于将文本的填写项与调取到的预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
可选的,匹配结果确定模块930,包括:
文本分词单元,用于对文本进行分词,得到文本分词;
匹配分词搜索单元,用于在文本分词中搜索与预设待填写表单的至少两个填写项相匹配的文本分词;
第一坐标确定单元,用于将搜索到的与预设待填写表单的至少部分填写项相匹配的文本分词确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间;
第一填入字段确定单元,用于将位于坐标区间预设相邻位置的至少一个文本分词确定为该坐标区间内的文本中的填写项对应的填入字段;
第一匹配关系确定单元,用于根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单中的至少部分填写项的匹配关系。
可选的,匹配结果确定模块930,还包括:
匹配拼音组搜索单元,用于在与文本对应的拼音串中搜索与预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
第二坐标确定单元,用于将搜索到的文本拼音组对应的文本中的字符确定为文本中的填写项,并确定文本中的填写项在文本中的坐标区间;
第二填入字段确定单元,用于将位于坐标区间预设相邻位置的至少一个文本中的字符确定为该坐标区间内的文本中的填写项对应的填入字段;
第二对应关系确定单元,用于根据文本中的填写项与预设待填写表单中的至少部分填写项的匹配关系,以及文本中填写项与填入字段的对应关系,确定文本的填写项对应的填入字段与预设待填写表单的至少部分填写项的匹配关系。
可选的,预设相邻位置包括:在前相邻位置或在后相邻位置。
可选的,预设表单信息接收模块还用于:接收终端发送的填入字段的数据类型和填入字段的数据范围;
可选的,填入字段反馈模块940,包括:
正则表达式确定单元,用于根据预设待填写表单的填入字段的数据类型和填入字段的数据范围,确定文本的各填入字段的正则表达式;
修正字段确定单元,用于根据正则表达式过滤对应的文本的填入字段中的无效信息,得到修正填入字段;
修正填入字段反馈单元,用于将修正填入字段发送至终端。
本实施例的技术方案,通过从文本中获取待填写表单的填写项对应的填入字段并填入待填写表单中,解决需要针对待填写表单的单个填写项进行逐个选取而造成的操作繁琐,数据录入效率低的问题,实现方便用户填写表单,提高数据录入效率的效果。
实施例十
图10为本发明实施例十提供的一种计算机设备的结构示意图,如图10所示,该计算机设备包括处理器100、存储器101、输入装置102和输出装置103;计算机设备中处理器100的数量可以是一个或多个,图10中以一个处理器100为例;计算机设备中的处理器100、存储器101、输入装置102和输出装置103可以通过总线或其他方式连接,图10中以通过总线连接为例。
存储器101作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例一至实施例四中的表单填写方法对应的程序指令/模块(例如,实施例八提供的表单填写装置中的表单获取模块810、语音获取模块820、文本转化模块830、匹配结果确定模块840和字段填入模块850)。处理器100通过运行存储在存储器101中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的表单填写方法。
存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器101可进一步包括相对于处理器100远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置102可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置103可包括显示屏等显示设备。
实施例十一
图11为本发明实施例十一提供的一种服务器的结构示意图,如图11所示,该服务器包括处理器110、存储器111、输入装置112和输出装置113;服务器中处理器110的数量可以是一个或多个,图11中以一个处理器110为例;计算机设备中的处理器110、存储器111、输入装置112和输出装置113可以通过总线或其他方式连接,图11中以通过总线连接为例。
存储器111作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例五至实施例七中的表单填写方法对应的程序指令/模块(例如,实施例九提供的表单填写装置中的文本信息接收模块910、预设表单搜索模块920、匹配结果确定模块930和填入字段反馈模块940)。处理器110通过运行存储在存储器111中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的表单填写方法。
存储器111可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器111可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器111可进一步包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置112可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置113可包括显示屏等显示设备。
实施例十二
本发明实施例十二还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种表单填写方法,该方法包括:
获取预设待填写表单,其中,所述预设待填写表单包括至少两个填写项;
获取用户输入的语音数据,将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明实施例一至实施例四所提供的表单填写方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述表单填写装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例十三
本发明实施例十三还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种表单填写方法,该方法包括:
接收终端发送的文本和处理标识信息,所述文本包括填写项和各填写项对应的填入字段;
在预设表单库中搜索与所述处理标识信息对应的预设待填写表单,所述预设待填写表单包括至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设待填写表单;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
将所述文本的填入字段和所述匹配结果发送至所述终端。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明实施例五至实施例七所提供的表单填写方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述表单填写装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (44)
1.一种表单填写方法,其特征在于,包括:
获取预设待填写表单,其中,所述预设待填写表单包括至少两个填写项;
获取用户输入的语音数据,将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到所述文本的填写项与所述预设待填写表单中的至少部分填写项的匹配关系;
生成所述文本的填写项匹配的所述预设待填写表单中的至少部分填写项与所述文本的填写项对应的填入字段的匹配关系,作为匹配结果。
3.根据权利要求1所述的方法,其特征在于,在所述获取预设待填写表单之前,还包括:
根据预设表单数据文件生成所述预设待填写表单,其中,所述预设表单数据文件包括填写项和表单格式信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取用于标示识别所述预设待填写表单的处理标识信息;
所述基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,具体包括:
根据所述处理标识信息在预设表单库中调取所述预设待填写表单的所述至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设表单;
将所述文本的填写项与调取到的所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
5.根据权利要求4所述的方法,其特征在于,所述基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配之前,还包括:
按照预设格式生成用于标示识别所述预设待填写表单的处理标识信息;
将所述预设待填写表单和对应的所述处理标识信息存储在预设表单库中。
6.根据权利要求1所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
对所述文本进行分词,得到文本分词;
在所述文本分词中搜索与所述预设待填写表单的至少两个填写项相匹配的所述文本分词;
将搜索到的与所述预设待填写表单的至少部分填写项相匹配的所述文本分词确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
将位于所述坐标区间预设相邻位置的至少一个所述文本分词确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系。
7.根据权利要求1所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
在与所述文本对应的拼音串中搜索与所述预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
将搜索到的所述文本拼音组对应的所述文本中的字符确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
将位于所述坐标区间预设相邻位置的至少一个所述文本中的字符确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系。
8.根据权利要求6和7任一项所述的方法,其特征在于,所述预设相邻位置包括:在前相邻位置或在后相邻位置。
9.根据权利要求3所述的方法,其特征在于,所述预设表单数据文件还包括:填入字段的数据类型和填入字段的数据范围;
在所述根据预设表单数据文件生成所述预设待填写表单之后,还包括:
获取所述预设待填写表单中所述填入字段的数据类型和填入字段的数据范围;
所述根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中,包括:
根据所述预设待填写表单的所述填入字段的数据类型和填入字段的数据范围,确定所述文本的填入字段的正则表达式;
根据所述正则表达式过滤对应的所述文本的填入字段中的无效信息,得到修正填入字段;
根据所述匹配结果将所述修正填入字段填入匹配的填写项中。
10.根据权利要求9所述的方法,其特征在于,当所述修正填入字段中的字符数量为零时,不将字符数量为零的所述修正填入字段填入匹配的填写项中。
11.根据权利要求1所述的方法,其特征在于,所述根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中包括:
当与所述文本的填入字段相匹配的所述预设待填写表单的填写项中存在已填写的填入字段时,根据所述匹配结果以所述文本的填入字段覆盖所述已填写的填入字段。
12.根据权利要求1-7和9-11任一项所述的方法,其特征在于,还包括:
在所述获取预设待填写表单之后,展示所述预设待填写表单;和/或
在所述根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中之后,展示填写后的所述预设待填写表单。
13.一种表单填写方法,其特征在于,包括:
接收终端发送的文本和处理标识信息,所述文本包括填写项和各填写项对应的填入字段;
在预设表单库中搜索与所述处理标识信息对应的预设待填写表单,所述预设待填写表单包括至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设待填写表单;
基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
将所述文本的填入字段和所述匹配结果发送至所述终端。
14.根据权利要求13所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到所述文本的填写项与所述预设待填写表单中的至少部分填写项的匹配关系;
生成所述文本的填写项匹配的所述预设待填写表单中的至少部分填写项与所述文本的填写项对应的填入字段的匹配关系,作为匹配结果。
15.根据权利要求13所述的方法,其特征在于,在所述接收终端发送的文本和处理标识信息之前,还包括:
接收所述终端发送的所述预设待填写表单和对应的所述处理标识信息;
将所述预设待填写表单和对应的所述处理标识信息存储在所述预设表单库中。
16.根据权利要求15所述的方法,其特征在于,所述基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,包括:
根据所述处理标识信息在所述预设表单库中调取所述预设待填写表单的所述至少两个填写项;
将所述文本的填写项与调取到的所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
17.根据权利要求13所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
对所述文本进行分词,得到文本分词;
在所述文本分词中搜索与所述预设待填写表单的至少两个填写项相匹配的所述文本分词;
将搜索到的与所述预设待填写表单的至少部分填写项相匹配的所述文本分词确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
将位于所述坐标区间预设相邻位置的至少一个所述文本分词确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系。
18.根据权利要求13所述的方法,其特征在于,所述基于所述待填写表单将所述文本的填写项与所述待填写表单的至少两个填写项进行匹配,得到匹配结果,包括:
在与所述文本对应的拼音串中搜索与所述预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
将搜索到的所述文本拼音组对应的所述文本中的字符确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
将位于所述坐标区间预设相邻位置的至少一个所述文本中的字符确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单的至少部分填写项的匹配关系。
19.根据权利要求17和18任一项所述的方法,其特征在于,所述预设相邻位置包括:在前相邻位置或在后相邻位置。
20.根据权利要求15所述的方法,其特征在于,所述终端发送的所述预设待填写表单还包括:填入字段的数据类型和填入字段的数据范围;
将所述文本的填入字段发送至所述终端,包括:
根据所述预设待填写表单的所述填入字段的数据类型和填入字段的数据范围,确定所述文本的填入字段的正则表达式;
根据所述正则表达式过滤对应的所述文本的填入字段中的无效信息,得到修正填入字段;
将所述修正填入字段发送至所述终端。
21.一种表单填写装置,其特征在于,包括:
表单获取模块,用于获取预设待填写表单,其中,所述预设待填写表单包括至少两个填写项;
语音获取模块,用于获取用户输入的语音数据;
文本转化模块,用于将所述语音数据转化为文本,所述文本包括填写项和各填写项对应的填入字段;
匹配结果确定模块,用于基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
字段填入模块,用于根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中。
22.根据权利要求21所述的装置,其特征在于,所述匹配结果确定模块包括:
填写项匹配单元,用于将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到所述文本的填写项与所述预设待填写表单中的至少部分填写项的匹配关系;
填入字段匹配单元,用于生成所述文本的填写项匹配的所述预设待填写表单中的至少部分填写项与所述文本的填写项对应的填入字段的匹配关系,作为匹配结果。
23.根据权利要求21所述的装置,其特征在于,还包括:
表单生成模块,用于根据预设表单数据文件生成所述预设待填写表单,其中,所述预设表单数据文件包括填写项和表单格式信息。
24.根据权利要求21所述的装置,其特征在于,还包括:
标识信息获取模块,用于获取用于标示识别所述预设待填写表单的处理标识信息;
所述匹配结果确定模块,具体包括:
填写项调取单元,用于根据所述处理标识信息在预设表单库中调取所述预设待填写表单的所述至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设表单;
匹配单元,用于将所述文本的填写项与调取到所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
25.根据权利要求24所述的装置,其特征在于,还包括:
标识信息生成模块,用于按照预设格式生成用于标示识别所述预设待填写表单的处理标识信息;
表单信息存储模块,用于将所述预设待填写表单和对应的所述处理标识信息存储在预设表单库中。
26.根据权利要求19所述的装置,其特征在于,所述匹配结果确定模块,包括:
文本分词单元,用于对所述文本进行分词,得到文本分词;
匹配分词搜索单元,用于在所述文本分词中搜索与所述预设待填写表单的至少两个填写项相匹配的所述文本分词;
第一坐标确定单元,用于将搜索到的与所述预设待填写表单的至少部分填写项相匹配的所述文本分词确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
第一填入字段确定单元,用于将位于所述坐标区间预设相邻位置的至少一个所述文本分词确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
第一匹配关系确定单元,用于根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系。
27.根据权利要求21所述的装置,其特征在于,所述匹配结果确定模块,包括:
匹配拼音组搜索单元,用于在与所述文本对应的拼音串中搜索与所述预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
第二坐标确定单元,用于将搜索到的所述文本拼音组对应的所述文本中的字符确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
第二填入字段确定单元,用于将位于所述坐标区间预设相邻位置的至少一个所述文本中的字符确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
第二匹配关系确定单元,用于根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单的至少部分填写项的匹配关系。
28.根据权利要求26和27任一项所述的装置,其特征在于,所述预设相邻位置包括:在前相邻位置或在后相邻位置。
29.根据权利要求23所述的装置,其特征在于,所述预设表单数据文件还包括:填入字段的数据类型和填入字段的数据范围;
所述表单填写装置,还包括:
第二表单属性值确定模块,用于获取所述预设待填写表单中所述填入字段的数据类型和填入字段的数据范围;
所述字段填入模块,包括:
正则表达式确定单元,用于根据所述预设待填写表单的所述填入字段的数据类型和填入字段的数据范围,确定所述文本的各填入字段的正则表达式;
修正字段确定单元,用于根据所述正则表达式过滤对应的所述文本的填入字段中的无效信息,得到修正填入字段;
填入单元,用于根据所述匹配结果将所述修正填入字段填入匹配的填写项中。
30.根据权利要求29所述的装置,其特征在于,所述字段填入模块,还包括:
字段修正单元,用于当所述修正填入字段中的字符数量为零时,不将字符数量为零的所述修正填入字段填入匹配的填写项中。
31.根据权利要求19所述的装置,其特征在于,所述字段填入模块包括:
覆盖填写单元,用于当与所述文本的填入字段相匹配的所述预设待填写表单的填写项中存在已填写的填入字段时,根据所述匹配结果以所述文本的填入字段覆盖所述已填写的填入字段。
32.根据权利要求21-27和28-31任一项所述的装置,其特征在于,还包括:
待填表单展示模块,用于在所述获取预设待填写表单之后,展示所述预设待填写表单;和/或
填写表单展示模块,用于在所述根据所述匹配结果将所述文本的填入字段填入匹配的所述预设待填写表单的填写项中之后,展示填写后的所述预设待填写表单。
33.一种表单填写装置,其特征在于,包括:
文本信息接收模块,用于接收终端发送的文本和处理标识信息,所述文本包括填写项和各填写项对应的填入字段;
预设表单搜索模块,用于在预设表单库中搜索与所述处理标识信息对应的预设待填写表单,所述预设待填写表单包括至少两个填写项,其中,所述处理标识信息与所述预设表单的对应关系是预先设定的,所述预设表单库中存储有至少一个预设待填写表单;
匹配结果确定模块,用于基于所述预设待填写表单将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果,所述匹配结果包括:所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系;
填入字段反馈模块,用于将所述文本的填入字段和所述匹配结果发送至所述终端。
34.根据权利要求33所述的装置,其特征在于,所述匹配结果确定模块包括:
填写项匹配单元,用于将所述文本的填写项与所述预设待填写表单的至少两个填写项进行匹配,得到所述文本的填写项与所述预设待填写表单中的至少部分填写项的匹配关系;
填入字段匹配单元,用于生成所述文本的填写项匹配的所述预设待填写表单中的至少部分填写项与所述文本的填写项对应的填入字段的匹配关系,作为匹配结果。
35.根据权利要求33所述的装置,其特征在于,还包括:
预设表单信息接收模块,用于接收所述终端发送的所述预设待填写表单和对应的所述处理标识信息;
预设表单信息存储模块,用于将所述预设待填写表单和对应的所述处理标识信息存储在所述预设表单库中。
36.根据权利要求35所述的装置,其特征在于,所述匹配结果确定模块,包括:
填写项调取单元,用于根据所述处理标识信息在所述预设表单库中调取所述预设待填写表单的所述至少两个填写项;
匹配单元,用于将所述文本的填写项与调取到的所述预设待填写表单的至少两个填写项进行匹配,得到匹配结果。
37.根据权利要求33所述的装置,其特征在于,所述匹配结果确定模块,包括:
文本分词单元,用于对所述文本进行分词,得到文本分词;
匹配分词搜索单元,用于在所述文本分词中搜索与所述预设待填写表单的至少两个填写项相匹配的所述文本分词;
第一坐标确定单元,用于将搜索到的与所述预设待填写表单的至少部分填写项相匹配的所述文本分词确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
第一填入字段确定单元,用于将位于所述坐标区间预设相邻位置的至少一个所述文本分词确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
第一匹配关系确定单元,用于根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单中的至少部分填写项的匹配关系。
38.根据权利要求33所述的装置,其特征在于,所述匹配结果确定模块,包括:
匹配拼音组搜索单元,用于在与所述文本对应的拼音串中搜索与所述预设待填写表单的至少两个填写项的拼音组相匹配的文本拼音组;
第二坐标确定单元,用于将搜索到的所述文本拼音组对应的所述文本中的字符确定为所述文本中的填写项,并确定所述文本中的填写项在所述文本中的坐标区间;
第二填入字段确定单元,用于将位于所述坐标区间预设相邻位置的至少一个所述文本中的字符确定为该所述坐标区间内的所述文本中的填写项对应的填入字段;
第二对应关系确定单元,用于根据所述文本中的填写项与所述预设待填写表单中的至少部分填写项的匹配关系,以及所述文本中填写项与填入字段的对应关系,确定所述文本的填写项对应的填入字段与所述预设待填写表单的至少部分填写项的匹配关系。
39.根据权利要求37和38任一项所述的装置,其特征在于,所述预设相邻位置包括:在前相邻位置或在后相邻位置。
40.根据权利要求35所述的装置,其特征在于,所述预设表单信息接收模块还用于:接收所述终端发送的填入字段的数据类型和填入字段的数据范围;
所述填入字段反馈模块,包括:
正则表达式确定单元,用于根据所述预设待填写表单的所述填入字段的数据类型和填入字段的数据范围,确定所述文本的各填入字段的正则表达式;
修正字段确定单元,用于根据所述正则表达式过滤对应的所述文本的填入字段中的无效信息,得到修正填入字段;
修正填入字段反馈单元,用于将所述修正填入字段发送至所述终端。
41.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的表单填写方法。
42.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求13-20中任一所述的表单填写方法。
43.一种计算机可执行指令的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-12中任一所述的表单填写方法。
44.一种计算机可执行指令的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求13-20中任一所述的表单填写方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710536455.9A CN107357772A (zh) | 2017-07-04 | 2017-07-04 | 表单填写方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710536455.9A CN107357772A (zh) | 2017-07-04 | 2017-07-04 | 表单填写方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107357772A true CN107357772A (zh) | 2017-11-17 |
Family
ID=60293152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710536455.9A Pending CN107357772A (zh) | 2017-07-04 | 2017-07-04 | 表单填写方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107357772A (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287815A (zh) * | 2017-12-29 | 2018-07-17 | 重庆小雨点小额贷款有限公司 | 信息录入方法、装置、终端及计算机可读存储介质 |
CN108595393A (zh) * | 2018-01-11 | 2018-09-28 | 太原理工大学 | 一种自动填表方法和装置 |
CN108664460A (zh) * | 2018-04-16 | 2018-10-16 | 北京天使软件技术有限公司 | 语音填表装置、方法、系统及存储介质 |
CN108664199A (zh) * | 2018-05-07 | 2018-10-16 | 平安普惠企业管理有限公司 | 表单填写方法、装置、设备及计算机可读存储介质 |
CN108984510A (zh) * | 2018-09-12 | 2018-12-11 | 山西中电科新能源技术有限公司 | 通过语音将信息录入表格的系统 |
CN109360571A (zh) * | 2018-10-31 | 2019-02-19 | 深圳壹账通智能科技有限公司 | 贷款信息的处理方法及装置、存储介质、计算机设备 |
CN109389982A (zh) * | 2018-12-26 | 2019-02-26 | 江苏满运软件科技有限公司 | 发货信息语音识别方法、系统、设备及存储介质 |
CN109688271A (zh) * | 2019-01-16 | 2019-04-26 | 深圳壹账通智能科技有限公司 | 联系人信息输入的方法、装置及终端设备 |
CN109840318A (zh) * | 2019-01-04 | 2019-06-04 | 上海上湖信息技术有限公司 | 一种表单项的填写方法及系统 |
CN109994168A (zh) * | 2017-12-29 | 2019-07-09 | 北京医联蓝卡在线科技有限公司 | 一种语音建立居民健康档案的方法 |
CN110070872A (zh) * | 2019-04-22 | 2019-07-30 | 南京邮电大学 | 一种基于智能语音识别的物流填单方法 |
CN110210014A (zh) * | 2019-05-31 | 2019-09-06 | 贵州精准医疗电子有限公司 | 智能表格系统 |
WO2019205291A1 (zh) * | 2018-04-28 | 2019-10-31 | 平安科技(深圳)有限公司 | 保险销售实时监控方法、装置、设备及存储介质 |
CN110472200A (zh) * | 2019-07-29 | 2019-11-19 | 深圳市中兴新云服务有限公司 | 一种基于表单的数据处理方法、装置及电子设备 |
CN110765145A (zh) * | 2019-10-15 | 2020-02-07 | 益萃网络科技(中国)有限公司 | 内容项传输方法、装置、设备及存储介质 |
CN110839998A (zh) * | 2019-09-30 | 2020-02-28 | 佛山市威格特电气设备有限公司 | 智能安全帽语音填写作业表单方法 |
CN110931010A (zh) * | 2019-12-17 | 2020-03-27 | 用友网络科技股份有限公司 | 语音控制系统 |
CN111126009A (zh) * | 2019-12-12 | 2020-05-08 | 深圳追一科技有限公司 | 表单填写方法、装置、终端设备及存储介质 |
CN111797601A (zh) * | 2020-06-28 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 表单处理方法、装置、设备及存储介质 |
CN113378579A (zh) * | 2021-05-31 | 2021-09-10 | 五八到家有限公司 | 一种语音录入结构化数据的方法、系统及电子设备 |
CN113486639A (zh) * | 2021-07-02 | 2021-10-08 | 国网电子商务有限公司 | 表单的生成方法及装置、电子设备、存储介质 |
CN113590883A (zh) * | 2021-08-10 | 2021-11-02 | 上海杉互健康科技有限公司 | 医疗信息与数据库映射的方法、系统、设备及存储介质 |
CN114385054A (zh) * | 2021-12-08 | 2022-04-22 | 北京云测信息技术有限公司 | 表单填写方法、装置、电子设备及存储介质 |
CN114462364A (zh) * | 2022-02-07 | 2022-05-10 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
CN114841128A (zh) * | 2022-03-31 | 2022-08-02 | 北京百度网讯科技有限公司 | 基于人工智能的业务交互方法、装置、设备、介质及产品 |
CN115829296A (zh) * | 2023-02-03 | 2023-03-21 | 蜀道投资集团有限责任公司 | 施工状态信息调整方法、设备和介质 |
CN116663509A (zh) * | 2023-08-02 | 2023-08-29 | 四川享宇科技有限公司 | 一种银行业复杂系统的信息自动获取填入机器人 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103377652A (zh) * | 2012-04-25 | 2013-10-30 | 上海智臻网络科技有限公司 | 一种用于进行语音识别的方法、装置和设备 |
CN103886080A (zh) * | 2014-03-25 | 2014-06-25 | 中国科学院地理科学与资源研究所 | 一种从互联网非结构化文本提取道路交通信息方法 |
CN105096016A (zh) * | 2014-04-24 | 2015-11-25 | 北大方正集团有限公司 | 印刷订单自动生成方法和装置 |
CN105786797A (zh) * | 2016-02-23 | 2016-07-20 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
CN106570180A (zh) * | 2016-11-10 | 2017-04-19 | 北京百度网讯科技有限公司 | 基于人工智能的语音搜索方法及装置 |
-
2017
- 2017-07-04 CN CN201710536455.9A patent/CN107357772A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103377652A (zh) * | 2012-04-25 | 2013-10-30 | 上海智臻网络科技有限公司 | 一种用于进行语音识别的方法、装置和设备 |
CN103886080A (zh) * | 2014-03-25 | 2014-06-25 | 中国科学院地理科学与资源研究所 | 一种从互联网非结构化文本提取道路交通信息方法 |
CN105096016A (zh) * | 2014-04-24 | 2015-11-25 | 北大方正集团有限公司 | 印刷订单自动生成方法和装置 |
CN105786797A (zh) * | 2016-02-23 | 2016-07-20 | 北京云知声信息技术有限公司 | 一种基于语音输入的信息处理方法及装置 |
CN106570180A (zh) * | 2016-11-10 | 2017-04-19 | 北京百度网讯科技有限公司 | 基于人工智能的语音搜索方法及装置 |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019128103A1 (zh) * | 2017-12-29 | 2019-07-04 | 重庆小雨点小额贷款有限公司 | 信息录入方法、装置、终端及计算机可读存储介质 |
CN108287815A (zh) * | 2017-12-29 | 2018-07-17 | 重庆小雨点小额贷款有限公司 | 信息录入方法、装置、终端及计算机可读存储介质 |
CN109994168A (zh) * | 2017-12-29 | 2019-07-09 | 北京医联蓝卡在线科技有限公司 | 一种语音建立居民健康档案的方法 |
CN108595393A (zh) * | 2018-01-11 | 2018-09-28 | 太原理工大学 | 一种自动填表方法和装置 |
CN108664460A (zh) * | 2018-04-16 | 2018-10-16 | 北京天使软件技术有限公司 | 语音填表装置、方法、系统及存储介质 |
WO2019205291A1 (zh) * | 2018-04-28 | 2019-10-31 | 平安科技(深圳)有限公司 | 保险销售实时监控方法、装置、设备及存储介质 |
CN108664199A (zh) * | 2018-05-07 | 2018-10-16 | 平安普惠企业管理有限公司 | 表单填写方法、装置、设备及计算机可读存储介质 |
CN108984510A (zh) * | 2018-09-12 | 2018-12-11 | 山西中电科新能源技术有限公司 | 通过语音将信息录入表格的系统 |
CN109360571A (zh) * | 2018-10-31 | 2019-02-19 | 深圳壹账通智能科技有限公司 | 贷款信息的处理方法及装置、存储介质、计算机设备 |
CN109389982A (zh) * | 2018-12-26 | 2019-02-26 | 江苏满运软件科技有限公司 | 发货信息语音识别方法、系统、设备及存储介质 |
CN109840318A (zh) * | 2019-01-04 | 2019-06-04 | 上海上湖信息技术有限公司 | 一种表单项的填写方法及系统 |
CN109840318B (zh) * | 2019-01-04 | 2023-12-01 | 上海上湖信息技术有限公司 | 一种表单项的填写方法及系统 |
CN109688271A (zh) * | 2019-01-16 | 2019-04-26 | 深圳壹账通智能科技有限公司 | 联系人信息输入的方法、装置及终端设备 |
CN110070872A (zh) * | 2019-04-22 | 2019-07-30 | 南京邮电大学 | 一种基于智能语音识别的物流填单方法 |
CN110210014A (zh) * | 2019-05-31 | 2019-09-06 | 贵州精准医疗电子有限公司 | 智能表格系统 |
CN110210014B (zh) * | 2019-05-31 | 2023-05-30 | 贵州精准医疗电子有限公司 | 智能表格系统 |
CN110472200A (zh) * | 2019-07-29 | 2019-11-19 | 深圳市中兴新云服务有限公司 | 一种基于表单的数据处理方法、装置及电子设备 |
CN110472200B (zh) * | 2019-07-29 | 2023-10-27 | 深圳市中兴新云服务有限公司 | 一种基于表单的数据处理方法、装置及电子设备 |
CN110839998A (zh) * | 2019-09-30 | 2020-02-28 | 佛山市威格特电气设备有限公司 | 智能安全帽语音填写作业表单方法 |
CN110765145A (zh) * | 2019-10-15 | 2020-02-07 | 益萃网络科技(中国)有限公司 | 内容项传输方法、装置、设备及存储介质 |
CN110765145B (zh) * | 2019-10-15 | 2022-08-09 | 益萃网络科技(中国)有限公司 | 内容项传输方法、装置、设备及存储介质 |
CN111126009A (zh) * | 2019-12-12 | 2020-05-08 | 深圳追一科技有限公司 | 表单填写方法、装置、终端设备及存储介质 |
CN110931010A (zh) * | 2019-12-17 | 2020-03-27 | 用友网络科技股份有限公司 | 语音控制系统 |
CN111797601A (zh) * | 2020-06-28 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 表单处理方法、装置、设备及存储介质 |
CN111797601B (zh) * | 2020-06-28 | 2024-04-19 | 北京字节跳动网络技术有限公司 | 表单处理方法、装置、设备及存储介质 |
CN113378579A (zh) * | 2021-05-31 | 2021-09-10 | 五八到家有限公司 | 一种语音录入结构化数据的方法、系统及电子设备 |
CN113486639A (zh) * | 2021-07-02 | 2021-10-08 | 国网电子商务有限公司 | 表单的生成方法及装置、电子设备、存储介质 |
CN113590883A (zh) * | 2021-08-10 | 2021-11-02 | 上海杉互健康科技有限公司 | 医疗信息与数据库映射的方法、系统、设备及存储介质 |
CN114385054A (zh) * | 2021-12-08 | 2022-04-22 | 北京云测信息技术有限公司 | 表单填写方法、装置、电子设备及存储介质 |
CN114385054B (zh) * | 2021-12-08 | 2023-12-19 | 北京云测信息技术有限公司 | 表单填写方法、装置、电子设备及存储介质 |
CN114462364A (zh) * | 2022-02-07 | 2022-05-10 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
CN114462364B (zh) * | 2022-02-07 | 2023-01-31 | 北京百度网讯科技有限公司 | 录入信息的方法和装置 |
CN114841128A (zh) * | 2022-03-31 | 2022-08-02 | 北京百度网讯科技有限公司 | 基于人工智能的业务交互方法、装置、设备、介质及产品 |
CN115829296A (zh) * | 2023-02-03 | 2023-03-21 | 蜀道投资集团有限责任公司 | 施工状态信息调整方法、设备和介质 |
CN115829296B (zh) * | 2023-02-03 | 2023-06-16 | 蜀道投资集团有限责任公司 | 施工状态信息调整方法、设备和介质 |
CN116663509B (zh) * | 2023-08-02 | 2023-09-29 | 四川享宇科技有限公司 | 一种银行业复杂系统的信息自动获取填入机器人 |
CN116663509A (zh) * | 2023-08-02 | 2023-08-29 | 四川享宇科技有限公司 | 一种银行业复杂系统的信息自动获取填入机器人 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357772A (zh) | 表单填写方法、装置和计算机设备 | |
US10796105B2 (en) | Device and method for converting dialect into standard language | |
CN106910501A (zh) | 文本实体提取方法及装置 | |
CN111507099A (zh) | 文本分类方法、装置、计算机设备及存储介质 | |
Rashel et al. | Building an Indonesian rule-based part-of-speech tagger | |
CN108509427B (zh) | 文本数据的数据处理方法及应用 | |
CN112256822A (zh) | 文本搜索方法、装置、计算机设备和存储介质 | |
CN102737013A (zh) | 基于依存关系来识别语句情感的设备和方法 | |
CN111488468B (zh) | 地理信息知识点抽取方法、装置、存储介质及计算机设备 | |
CN110678868B (zh) | 翻译支持系统、装置和方法以及计算机可读介质 | |
CN108257593B (zh) | 一种语音识别方法、装置、电子设备及存储介质 | |
US10223349B2 (en) | Inducing and applying a subject-targeted context free grammar | |
CN108549723B (zh) | 一种文本概念分类方法、装置及服务器 | |
TWI752406B (zh) | 語音辨識方法、語音辨識裝置、電子設備、電腦可讀存儲介質及電腦程式產品 | |
Islam et al. | Bangla sentence correction using deep neural network based sequence to sequence learning | |
CN107247613A (zh) | 语句解析方法及语句解析装置 | |
KR20240012245A (ko) | 자연어처리 기반의 인공지능 모델을 이용한 faq를 자동생성하기 위한 방법 및 이를 위한 장치 | |
CN104573030A (zh) | 一种文本情绪预测方法及装置 | |
CN107038163A (zh) | 一种面向海量互联网信息的文本语义建模方法 | |
US20220365956A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
WO2015099418A1 (ko) | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 | |
CN104704487B (zh) | 翻译处理装置及程序 | |
CN106980640A (zh) | 针对照片的交互方法、设备和计算机可读存储介质 | |
US20230061773A1 (en) | Automated systems and methods for generating technical questions from technical documents | |
WO2023001308A1 (zh) | 文本识别方法及装置、计算机可读存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171117 |