CN112256853A - 问题生成方法、装置、设备及计算机可读存储介质 - Google Patents

问题生成方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112256853A
CN112256853A CN202011200483.1A CN202011200483A CN112256853A CN 112256853 A CN112256853 A CN 112256853A CN 202011200483 A CN202011200483 A CN 202011200483A CN 112256853 A CN112256853 A CN 112256853A
Authority
CN
China
Prior art keywords
question
type
target
key field
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011200483.1A
Other languages
English (en)
Inventor
曹春辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202011200483.1A priority Critical patent/CN112256853A/zh
Publication of CN112256853A publication Critical patent/CN112256853A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Abstract

本发明涉及自然语言处理,提供一种问题生成方法、装置、设备及计算机可读存储介质。本发明通过先从传入的提问信息中提取出提问关键字段,并确定提问关键字段对应的问题类型,再选择与问题类型对应的问题生成规则,最后按照相应的问题生成规则基于提问关键字段生成对应的问题语句,且对字段的个数、形式等不做任何限制,使得系统能够对当前传入的任何提问信息自动进行处理与对应问题生成,而并非局限于已有信息的对应问题生成,从而扩大了智能问题系统的问题生成范围。此外,本发明还涉及区块链技术,上述提问关键字段可存储于区块链中。

Description

问题生成方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种问题生成方法、装置、设备及计算机可读存储介质。
背景技术
随着智能问答技术的发展,智能问答系统能够为电子设备与用户之间建立基于自然语言的快速有效沟通。但由于目前的智能问题系统所能够输出的问题都是事先在数据库中配置好的,若是用户因为需要在已有问题的基础上再新增问题,而向数据库传入了原本不在库中的信息,现有的系统不仅无法识别这些新增信息,更无法根据这些新增信息生成相应问题。从而导致了现有的智能问题系统的问题生成范围太过局限的技术问题。
发明内容
本发明的主要目的在于提供一种问题生成方法、设备及计算机可读存储介质,旨在解决现有的智能问题系统的问题生成范围太过局限的技术问题。
为实现上述目的,本发明提供一种问题生成方法,所述问题生成方法包括:
获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
可选地,在所述目标问题类型为字符组合问题类型时,
所述确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则的步骤包括:
识别所述提问关键字段是否由数字、字母和/或特殊符号组成,并在所述提问关键字段由数字、字母和/或特殊符号组成时,确定所述目标信息所属的目标问题类型为字符组合问题类型;
从所述问题生成规则集合中选择字符组合类型的问题生成规则作为所述目标问题生成规则。
可选地,所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句,并将所述目标问题语句增加至预设问题数据库的步骤包括:
按照所述字符组合类型的问题生成规则,从所述提问关键字段中选择若干字符设为标记位;
将所述提问关键字段中位于所述标记位之前、之后和/或之间的内容作为正确答案内容;
对所述提问关键字段添加对应的属性名称字段,并结合所述正确答案内容与所述属性名称字段生成字符组合问题语句,以作为所述目标问题语句。
可选地,在所述目标问题生成规则为地址类型的问题生成规则时,
所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句的步骤包括:
按照所述地址类型的问题生成规则,获取所述提问关键字段所指示的目标地址名称,并在地图上查找出距离所述目标地址名称预设范围之内的混淆地址名称;
结合所述目标地址名称与所述混淆地址名称生成地址问题语句,以作为所述目标问题语句。
可选地,在所述目标问题生成规则为模板类型的问题生成规则时,
所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句的步骤包括:
按照所述模板类型的问题生成规则,获取预设的一般疑问句式的问题模块,并使用所述提问关键字段替换所述问题模板中的对应内容得到模板问题语句,以作为所述目标问题语句。
可选地,所述从所述提问信息中提取出提问关键字段的步骤之后,还包括:
判断所述提问关键字段是否存在于预设问题数据库中;
若是,则查找预设问题数据库中与所述提问关键字段相匹配的问题语句并输出;
若否,则执行确定所述提问关键字段所述的目标问题类型的步骤。
可选地,所述获取传入的提问信息,并从所述提问信息中提取出提问关键字段的步骤包括:
获取用户当前传入的提问信息,对所述提问信息进行预处理得到提问关键信息;
对所述提问关键信息进行分词处理,得到所述提问关键字段,其中,所述提问关键字段存储于区块链中。
此外,为实现上述目的,本发明还提供一种问题生成装置,所述问题生成装置包括:
字段提取模块,用于获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
规则选择模块,用于确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
问题生成模块,用于按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
可选地,在所述目标问题类型为字符组合问题类型时,
所述规则选择模块包括:
目标类型确定单元,用于识别所述提问关键字段是否由数字、字母和/或特殊符号组成,并在所述提问关键字段由数字、字母和/或特殊符号组成时,确定所述目标信息所属的目标问题类型为字符组合问题类型;
目标规则选择单元,用于从所述问题生成规则集合中选择字符组合类型的问题生成规则作为所述目标问题生成规则。
可选地,所述问题生成模块包括:
标记确定单元,用于按照所述字符组合类型的问题生成规则,从所述提问关键字段中选择若干字符设为标记位;
答案选择单元,用于将所述提问关键字段中位于所述标记位之前、之后和/或之间的内容作为正确答案内容;
第一问题生成单元,用于对所述提问关键字段添加对应的属性名称字段,并结合所述正确答案内容与所述属性名称字段生成字符组合问题语句,以作为所述目标问题语句。
可选地,在所述目标问题生成规则为地址类型的问题生成规则时,
所述问题生成模块包括:
地址查找单元,用于按照所述地址类型的问题生成规则,获取所述提问关键字段所指示的目标地址名称,并在地图上查找出距离所述目标地址名称预设范围之内的混淆地址名称;
第二问题生成单元,用于结合所述目标地址名称与所述混淆地址名称生成地址问题语句,以作为所述目标问题语句。
可选地,在所述目标问题生成规则为模板类型的问题生成规则时,
所述问题生成模块包括:
第三问题生成单元,用于按照所述模板类型的问题生成规则,获取预设的一般疑问句式的问题模块,并使用所述提问关键字段替换所述问题模板中的对应内容得到模板问题语句,以作为所述目标问题语句。
可选地,所述问题生成装置还包括:
字段判断模块,用于判断所述提问关键字段是否存在于预设问题数据库中;
第一判定模块,用于若是,则查找预设问题数据库中与所述提问关键字段相匹配的问题语句并输出;
第二判定模块,用于若否,则执行确定所述提问关键字段所述的目标问题类型的步骤。
可选地,所述字段提取模块包括:
关键信息获取单元,用于获取用户当前传入的提问信息,对所述提问信息进行预处理得到提问关键信息;
信息分词处理单元,用于对所述提问关键信息进行分词处理,得到所述提问关键字段,其中,所述提问关键字段存储于区块链中。
此外,为实现上述目的,本发明还提供一种问题生成设备,所述问题生成设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的问题生成程序,其中所述问题生成程序被所述处理器执行时,实现如上述的问题生成方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有问题生成程序,其中所述问题生成程序被处理器执行时,实现如上述的问题生成方法的步骤。
本发明提供一种问题生成方法、装置、设备及计算机可读存储介质,所述问题生成方法通过先从传入的提问信息中提取出关键字段,并确定关键字段对应的问题类型,再选择与问题类型对应的问题生成规则,最后按照相应的问题生成规则基于关键字段生成对应的问题语句,且对字段的个数、形式等不做任何限制,使得系统能够对当前传入的任何提问信息自动进行处理与对应问题生成,而并非局限于已有信息的对应问题生成,扩大了系统的问题生成范围,从而解决了现有的智能问题系统的问题生成范围太过局限的技术问题。
附图说明
图1为本发明实施例方案中涉及的问题生成设备的硬件结构示意图;
图2为本发明问题生成方法第一实施例的流程示意图;
图3为本发明问题生成装置的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例涉及的问题生成方法主要应用于问题生成设备,该问题生成设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的问题生成设备的硬件结构示意图。本发明实施例中,问题生成设备可以包括处理器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对问题生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及问题生成程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的问题生成程序,并执行本发明实施例提供的问题生成方法。
基于上述硬件结构,提出本发明问题生成方法的各个实施例。
随着智能问答技术的发展,智能问答系统能够为电子设备与用户之间建立基于自然语言的快速有效沟通。但由于目前的智能问题系统所能够输出的问题都是事先在数据库中配置好的,若是用户因为需要在已有问题的基础上再新增问题,而向数据库传入了原本不在库中的字段,现有的系统不仅无法识别这些新增字段,更无法根据这些新增字段生成相应问题。从而导致了现有的智能问题系统的问题生成范围太过局限的技术问题。
为解决上述问题,本发明提供一种问题生成方法,即通过先从传入的提问信息中提取出关键字段,并确定关键字段对应的问题类型,再选择与问题类型对应的问题生成规则,最后按照相应的问题生成规则基于关键字段生成对应的问题语句,且对字段的个数、形式等不做任何限制,使得系统能够对当前传入的任何提问信息自动进行处理与对应问题生成,而并非局限于已有信息的对应问题生成,扩大了系统的问题生成范围,从而解决了现有的智能问题系统的问题生成范围太过局限的技术问题。
参照图2,图2为本发明问题生成方法第一实施例的流程示意图。
本发明第一实施例提供一种问题生成方法,所述问题生成方法包括以下步骤:
步骤S10,获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
在本实施例中,本方法应用于装有智能问题系统的终端设备。提问信息为用户或终端为利用智能问题系统生成问题而向系统传入的提问素材内容,可以是若干关键词,也可以是完整的语句,还可以是若干关联的词语组合。本实施例对提问信息的形式与字数不做限制。提问关键字段为从提问信息中筛选出的具有实际意义的关键词,可以为一个或多个。
若提问信息是完整的语句,提问关键字段的提取方法可为先对语句进行停用词处理,过滤掉语句中的语气词等无实际意义的词语,然后再对剩下的部分进行分词处理,最后获取到提问所需的词语作为上述关键字段;若提问信息是若干关键词,则直接识别各关键词是否为提问所需的词语,若是则作为上述提问关键字段,若否则忽略;若提问信息是若干关联的词语对,例如“姓名”与“张三”是一对关联的词语组合,“年龄”与“二十岁”是以对关联的词语组合,则系统直接将一组词语组合作为一组关键字段,每组关键字段则形成一行记录,系统可将每一行记录按顺序展示在页面上。
步骤S20,确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
在本实施例中,目标问题类型为当前需要设置问题的提问关键字段所属的问题类型。需要说明的是,同一提问关键字段可对应不同的目标问题类型。预设问题生成规则集合为预先设置好的集成有多种问题生成规则的规则集合,用户可随时向其中添加新的问题生成规则或是更改原有的问题生成规则。字符组合类型为,由若干字符所组成的关键字段对应的问题类型。字符具体可为字母、数字、特殊符号等。字符组合类型又可细分为号码类型、字符串类型、数字类型、日期类型等。
固定模板类型为,对关键字段套用问题语句模板的问题类型,一般为具有明确答案的特殊疑问句或是一般疑问句,例如,有明确的答案的特殊疑问句为:“请问您的名字是?”,正确答案即为关键字段中的内容“张三”;一般疑问句为:“请问您的名字是xxx吗”。选择类型为,对关键字段设置的问题具有多个选项的问题类型。自定义类型为,系统可对关键字段或者关键字段以外的信息随机生成问题。需要说明的是,问题规则的选择虽默认为系统自动选择,但用户也可手动进行选择。例如,对于一关键字段“姓名”与“张三”,系统可默认生成固定模板类型的问题语句:“请问您的名字是张三吗”,也可将问题类型选项展示在页面上以供用户进行选择,若用户对于此关键字段选择了选择类型,则系统对于此关键字段所生成的问题为:“请问您的名字是下列选项中的哪一个?”,A选项:小明;B选项:张三;C选项:李四;D选项:小红。且对于同一个字段可以选择多种不同的问题生成规则,系统即可针对同样提问关键字段结合默认设置与用户选择生成多个不同类型的问题语句。
步骤S30,按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
在本实施例中,目标问题语句可为问题本身,也可包括问题本身与问题相应答案选项。系统按照当前根据实际的提问关键字段所自动选择或是用户选择的目标问题类型,从规则集合中调用对应的问题生成规则,将该提问关键字转化成相应的问题语句。
作为一具体实施例,对于选择类型,比如民族,省份,学历,关系,工作类型,毕业院校,担保方式,贷款用途,还款方式、婚姻状态等,这些为系统内置的一些常用数据,当然,还可以在后面自我维护,比如用户可以再添加一个性别,然后值集合为男,女就可以。对于选择类问题,用户在生成问题的时候,可以对不同的字段选择同的值,比如民族,如果此人为汉族,可以选择汉族问题,也可以选择其他民族提问,只不过是一个反问的方式,容易混淆。当然也可以生成带有选项的问题,从当前的字段对应的内容集合中选择多个来做下A,B,C,D选项让客户回答。这样的规则是可以扩展的,只要这个字段在系统内置中没有,用户自行去添加即可。
作为另一具体实施例,对于自定义开放式规则,问题随便设置,选项随便设置,可以是多选也可以是单选。这种就是开放类问题,相当于客服可以提问不是字段内的信息。比如,你觉得你会如期归还贷款吗?比如,你是否有逾期行为?此类也是比较常见的问题。
在本实施例中,本发明通过获取传入的提问信息,并从所述提问信息中提取出提问关键字段;确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。通过上述方式,本发明通过先从传入的提问信息中提取出关键字段,并确定关键字段对应的问题类型,再选择与问题类型对应的问题生成规则,最后按照相应的问题生成规则基于关键字段生成对应的问题语句,且对字段的个数、形式等不做任何限制,使得系统能够对当前传入的任何提问信息自动进行处理与对应问题生成,而并非局限于已有信息的对应问题生成,扩大了系统的问题生成范围,从而解决了现有的智能问题系统的问题生成范围太过局限的技术问题。
进一步地,基于上述图2所示的第一实施例,提出本发明问题生成方法的第二实施例。本实施例中,在所述目标问题类型为字符组合问题类型时,步骤S20包括:
识别所述提问关键字段是否由数字、字母和/或特殊符号组成,并在所述提问关键字段由数字、字母和/或特殊符号组成时,确定所述目标信息所属的目标问题类型为字符组合问题类型;
从所述问题生成规则集合中选择字符组合类型的问题生成规则作为所述目标问题生成规则。
在本实施例中,终端可通过识别技术识别出当前需要生成问题的关键字段中的内容是否为一串数字、字母、符合或是上述的任意组合。通常纯数字组合为各类证件号码,例如手机号码、银行卡号码、信用卡号码、住宅号码等,字符与数字组合的有车牌号码、邮箱地址、日期等,纯字母组合的可能是英文名称等。终端在识别出当前的关键字段为字符组合时,则可判定当前应调用字符组合问题生成规则。
进一步地,步骤S30包括:
按照所述字符组合类型的问题生成规则,从所述提问关键字段中选择若干字符设为标记位;
将所述提问关键字段中位于所述标记位之前、之后和/或之间的内容作为正确答案内容;
对所述提问关键字段添加对应的属性名称字段,并结合所述正确答案内容与所述属性名称字段生成字符组合问题语句,以作为所述目标问题语句。
在本实施例中,在字符组合问题生成规则中,一般是将关键字段中的数字和/或特殊字符内容中的某一部分作为需要用户回答的部分进行提问,例如,当前的关键字段是一串号码,常见的号码有:包括手机号,驾驶证号,银行卡号,信用卡号,住宅号,邮箱,车牌号等。具体操作时刻设置两个输入框,用户可在两个输入框中分别输入要截取的第一个位置和输入截取到的最后一个位置(也即是上述标记位),这样就会产生一段内容,可将提问字段是直接告知用户。这样生成的问题有比如:xxx号码的后四位是多少。或者后六位是多少。或者中间多少位是多少等。例如,当前的关键字段中包含有特殊字符,比如像邮箱有一个@符号,我们就可以在后面输入特殊字符。然后就可以得到@前面的信息或者后面的信息,这个完全取决于后面框内的选择形式和截取长度。比如提问,请问你的邮箱种类是什么邮箱?对于车牌号,我们可以截取前两位,或者以特殊符号点为截取位置,得到前面的信息,就可以提问:请问您的车牌是在哪个省哪个市办理的。在生成问题之后,还可将问题与关键字段关联添加至预设问题数据库中。
作为一种实施方式,终端还可获取针对字符组合类问题的混淆答案信息,以在显示问题语句时,将混淆答案信息与的正确答案共同显示。具体地,对于某一些数字类的关键字段,比如年龄,工资,几套房产,几个车产,几个孩子,工作年限,月交公积金,社保交了几年,贷款金额,贷款时长,房子房龄,车子车龄,房子面积等。这种问题的生成法:可以拿正常的数字填充到题目的问法上;可以在后面的框内输入混淆数字,比如年龄是20岁,那混淆规则数字输入1,就得到21岁或者19岁;可以在下列的选项中列所混淆生成后的选项。比如工资为5000,那混淆规则数字输入为1000,那就会产生四个选项,4000,5000,6000,7000。数字的规则可以靠客服人员的经验输入,使得混淆后的数据跟真实数字非常接近,也可以随机生成。
另外,还可以细分出关键字段为身份证号码,以及关键字段为日期的情况。对于关键字段为身份证号码的情况,由于身份证号是很关键的一项信息,它里面包含了丰富的信息,可以对任意长度进行截取,然后就可以制定许多问题的问法,以下列举一些常用的截取规则和提问方式。比如设置身份证倒数第四位或是倒数第六位为标记位,将标记位之后的四位或是六位,也即是身份证号的后四位或是后六位作为正确答案内容,然后再根据此正确答案内容获取对应的。出生年月日,生日,属相,星座,本命年、省份等信息来进行提问。获取前6位后,可以反查内置的数据来查到对应的数据。
对于日期类型的关键字段,比如:出生日期,身份证签发日期,身份证到期日期,社保交纳开始时间,还款日期等均属于日期类,用户可以随意改变日期来混淆问题,通过反问的方式或者正问的方式进行提问。比如用户自己手动改当前日期为另一个日期进行提问,这种反问的方式。比如可以通过输入日期改变规则,比如输入前后拉长几天,或者几个月或者几年等来自动改变日期,要么填充到问题上,要么生成问题的选项都可以。比如还可以截取日期的各个位置,得到年,月,日的信息来进行提问。
进一步地,在所述目标问题生成规则为地址类型的问题生成规则时,步骤S30包括:
按照所述地址类型的问题生成规则,获取所述提问关键字段所指示的目标地址名称,并在地图上查找出距离所述目标地址名称预设范围之内的混淆地址名称;
结合所述目标地址名称与所述混淆地址名称生成地址问题语句,以作为所述目标问题语句。
在本实施例中,对于地址类,比如家庭地址,单位地址,学校地址,业务办理地址等。这样的信息可以生成不同的题目,获取正确信息以后,可通过查找百度地图,查到该地址附近的地址,对问题进行混淆,比如提问一下错误的信息:你的家庭地址是【一个错误的附近地址】吗?用户可提前设置混淆地址的误差范围(也即是上述预设范围),例如一公里,地址的选择一般是选择方圆一公里以内的地址,更具有混淆性。
进一步地,通过具体公开了字符组合问题类型与地址类型的问题生成规则,使得智能问题系统能够针对字符组合类型与地址类型的关键字段进行相应问题的自动快捷生成,提升了系统的提问信息处理能力。
进一步地,基于上述图2所示的第一实施例,提出本发明问题生成方法的第三实施例。本实施例中,在所述目标问题生成规则为模板类型的问题生成规则时,步骤S30包括:
按照所述模板类型的问题生成规则,获取预设的一般疑问句式的问题模块,并使用所述提问关键字段替换所述问题模板中的对应内容得到模板问题语句,以作为所述目标问题语句。
在本实施例中,对于固定模板规则,例如,模板为:请问您的{name}是{value}吗?生成此种格式后,系统会自动装name替换成对应的字段中文名称,把value替换成对应的值。
进一步地,步骤S10之后,还包括:
判断所述提问关键字段是否存在于预设问题数据库中;
若是,则查找预设问题数据库中与所述提问关键字段相匹配的问题语句并输出;
若否,则执行确定所述提问关键字段所述的目标问题类型的步骤。
在本实施例中,系统在获取到当前传入的提问关键字段后,可先对其进行判断,判断该提问关键字段是否已经存在于预设问题数据库中。若该提问关键字段已存在于数据库中,则说明此前已经对该关键字段生成过相应问题,可直接查找到针对该关键字段所生成的历史问题语句并显示。或者用户也可选择与历史问题语句不同的问题类型生成新的问题语句;若该提问关键字段不存在于数据库,则说明系统还未对该关键字段生成过相应问题,则执行确定所述提问关键字段所述的目标问题类型的步骤。
进一步地,步骤S10包括:
获取用户当前传入的提问信息,对所述提问信息进行预处理得到提问关键信息;
对所述提问关键信息进行分词处理,得到所述提问关键字段,其中,所述提问关键字段存储于区块链中。
在本实施例中,预处理的具体操作可为停用词处理,提问关键信息为,对提问信息除去无实际意义的部分之后所剩下的内容。系统再对提问关键信息进行分词处理,即可得到上述提问关键字段。
需要强调的是,为进一步保证上述提问关键字段的私密和安全性,上述提问关键字段还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
进一步地,通过具体公开了固定模板问题类型的问题生成规则,使得智能问题系统能够针对固定模板类型的关键字段进行相应问题的自动快捷生成,提升了系统的提问信息处理能力;通过在当前的提问关键字段已存在于问题数据库中时直接调用历史问题语句,进一步提升了系统的问题生成效率。
此外,如图3所示,为实现上述目的,本发明还提供一种问题生成装置,所述问题生成装置包括:
字段提取模块10,用于获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
规则选择模块20,用于确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
问题生成模块30,用于按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
本发明还提供一种问题生成设备。
所述问题生成设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的问题生成程序,其中所述问题生成程序被所述处理器执行时,实现如上所述的问题生成方法的步骤。
其中,所述问题生成程序被执行时所实现的方法可参照本发明问题生成方法的各个实施例,此处不再赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有问题生成程序,其中所述问题生成程序被处理器执行时,实现如上述的问题生成方法的步骤。
其中,问题生成程序被执行时所实现的方法可参照本发明问题生成方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种问题生成方法,其特征在于,所述问题生成方法包括:
获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
2.如权利要求1所述的问题生成方法,其特征在于,在所述目标问题类型为字符组合问题类型时,
所述确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则的步骤包括:
识别所述提问关键字段是否由数字、字母和/或特殊符号组成,并在所述提问关键字段由数字、字母和/或特殊符号组成时,确定所述目标信息所属的目标问题类型为字符组合问题类型;
从所述问题生成规则集合中选择字符组合类型的问题生成规则作为所述目标问题生成规则。
3.如权利要求2所述的问题生成方法,其特征在于,所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句的步骤包括:
按照所述字符组合类型的问题生成规则,从所述提问关键字段中选择若干字符设为标记位;
将所述提问关键字段中位于所述标记位之前、之后和/或之间的内容作为正确答案内容;
对所述提问关键字段添加对应的属性名称字段,并结合所述正确答案内容与所述属性名称字段生成字符组合问题语句,以作为所述目标问题语句。
4.如权利要求1所述的问题生成方法,其特征在于,在所述目标问题生成规则为地址类型的问题生成规则时,
所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句的步骤包括:
按照所述地址类型的问题生成规则,获取所述提问关键字段所指示的目标地址名称,并在地图上查找出距离所述目标地址名称预设范围之内的混淆地址名称;
结合所述目标地址名称与所述混淆地址名称生成地址问题语句,以作为所述目标问题语句。
5.如权利要求1所述的问题生成方法,其特征在于,在所述目标问题生成规则为模板类型的问题生成规则时,
所述按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句的步骤包括:
按照所述模板类型的问题生成规则,获取预设的一般疑问句式的问题模块,并使用所述提问关键字段替换所述问题模板中的对应内容得到模板问题语句,以作为所述目标问题语句。
6.如权利要求1所述的问题生成方法,其特征在于,所述从所述提问信息中提取出提问关键字段的步骤之后,还包括:
判断所述提问关键字段是否存在于预设问题数据库中;
若是,则查找预设问题数据库中与所述提问关键字段相匹配的问题语句并输出;
若否,则执行确定所述提问关键字段所述的目标问题类型的步骤。
7.如权利要求1-6中任一项所述的问题生成方法,其特征在于,所述获取传入的提问信息,并从所述提问信息中提取出提问关键字段的步骤包括:
获取用户当前传入的提问信息,对所述提问信息进行预处理得到提问关键信息;
对所述提问关键信息进行分词处理,得到所述提问关键字段,其中,所述提问关键字段存储于区块链中。
8.一种问题生成装置,其特征在于,所述问题生成装置包括:
字段提取模块,用于获取传入的提问信息,并从所述提问信息中提取出提问关键字段;
规则选择模块,用于确定所述提问关键字段所属的目标问题类型,并根据所述目标问题类型从预设问题生成规则集合中选择对应的目标问题生成规则,其中,所述问题规则生成集合中至少包括字符组合类型、固定模板类型、选择类型、地址类型与自定义类型的问题生成规则;
问题生成模块,用于按照所述目标问题生成规则,将所述提问关键字段转化为目标问题语句。
9.一种问题生成设备,其特征在于,所述问题生成设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的问题生成程序,其中所述问题生成程序被所述处理器执行时,实现如权利要求1至7中任一项所述的问题生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有问题生成程序,其中所述问题生成程序被处理器执行时,实现如权利要求1至7中任一项所述的问题生成方法的步骤。
CN202011200483.1A 2020-10-30 2020-10-30 问题生成方法、装置、设备及计算机可读存储介质 Pending CN112256853A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011200483.1A CN112256853A (zh) 2020-10-30 2020-10-30 问题生成方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011200483.1A CN112256853A (zh) 2020-10-30 2020-10-30 问题生成方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112256853A true CN112256853A (zh) 2021-01-22

Family

ID=74268098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011200483.1A Pending CN112256853A (zh) 2020-10-30 2020-10-30 问题生成方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112256853A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051380A (zh) * 2021-03-23 2021-06-29 北京百度网讯科技有限公司 信息生成方法、装置、电子设备和存储介质
CN113298488A (zh) * 2021-04-30 2021-08-24 五八有限公司 行业问题库构建方法、装置、电子设备和计算机可读介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051380A (zh) * 2021-03-23 2021-06-29 北京百度网讯科技有限公司 信息生成方法、装置、电子设备和存储介质
CN113051380B (zh) * 2021-03-23 2023-07-25 北京百度网讯科技有限公司 信息生成方法、装置、电子设备和存储介质
CN113298488A (zh) * 2021-04-30 2021-08-24 五八有限公司 行业问题库构建方法、装置、电子设备和计算机可读介质

Similar Documents

Publication Publication Date Title
US8386461B2 (en) Method and apparatus for generating hash mnemonics
US11080423B1 (en) System for simulating a de-identified healthcare data set and creating simulated personal data while retaining profile of authentic data
JP5184290B2 (ja) 文書作成支援装置、文書作成支援方法およびプログラム
US20140279803A1 (en) Disambiguating data using contextual and historical information
CN110597816A (zh) 数据处理方法、装置、计算机设备和计算机可读存储介质
CN112115130A (zh) 获取数据对应关系的方法、装置、设备及介质
GB2389437A (en) Automatic data checking and correction
CN112256853A (zh) 问题生成方法、装置、设备及计算机可读存储介质
WO2019062081A1 (zh) 业务员画像形成方法、电子装置及计算机可读存储介质
CN108319661A (zh) 一种备件信息的结构化存储方法及装置
CN111914135A (zh) 数据查询方法、装置、电子设备及存储介质
CN111767565A (zh) 一种数据脱敏的处理方法、处理装置和存储介质
US8538013B2 (en) Rules-driven hash building
CN113935710A (zh) 一种合同审核的方法、装置、电子设备及存储介质
CN115292317A (zh) 表单生成方法、装置、设备及存储介质
CN110737644B (zh) 客户信息整合的方法、装置及计算机可读存储介质
WO2016124913A1 (en) Apparatus, method and system to verify meta data of a person
JP4787969B2 (ja) 記入用紙を利用したデータ処理システム及びデータ処理方法
CN113065323B (zh) 合同模板数据的导入方法、装置、设备以及存储介质
CN112950154A (zh) 流程信息匹配方法、装置、设备及存储介质
CN113111153A (zh) 一种数据分析方法、装置、设备及存储介质
CN114330263A (zh) 消息识别方法、装置、设备及存储介质
CN110766091A (zh) 一种套路贷团伙的识别方法及系统
CN110678887A (zh) 名片信息管理系统和名片信息管理程序
CN110969325A (zh) 获取法律案件的审理期限的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination