CN115858751A - 表格问答数据的处理方法、装置及电子设备 - Google Patents

表格问答数据的处理方法、装置及电子设备 Download PDF

Info

Publication number
CN115858751A
CN115858751A CN202211529616.9A CN202211529616A CN115858751A CN 115858751 A CN115858751 A CN 115858751A CN 202211529616 A CN202211529616 A CN 202211529616A CN 115858751 A CN115858751 A CN 115858751A
Authority
CN
China
Prior art keywords
data
question
text data
semantic
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211529616.9A
Other languages
English (en)
Inventor
张晗
杜新凯
吕超
谷姗姗
张云皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sunshine Insurance Group Co Ltd
Original Assignee
Sunshine Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sunshine Insurance Group Co Ltd filed Critical Sunshine Insurance Group Co Ltd
Priority to CN202211529616.9A priority Critical patent/CN115858751A/zh
Publication of CN115858751A publication Critical patent/CN115858751A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种表格问答数据的处理方法、装置及电子设备,通过获取用户输入的携带有指标的问题文本数据;提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;从预先存储的数据库中提取语义类别对应的指标数据;将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。本发明根据问题文本数据中的语义类别,将其对应的指标数据按照反馈模板进行反馈,以问答形式进行回复,问答的形式相对于报表可以与用户进行信息交互,充分利用对话的上下文信息帮助用户以更低的时间成本直观精准地找到相关业务指标,提高用户查询指标的效率和精准度。

Description

表格问答数据的处理方法、装置及电子设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种表格问答数据的处理方法、装置及电子设备。
背景技术
工业上许多业务仍然用表格的方式存储数据进行指标的统计分析,传统的可视化方法采用数据报表的形式。这种方式缺乏业务人员与系统的直接交互,面对大量的指标报表时,业务人员很难快速找到自己关注的指标数据,一旦报表字段与业务人员的理解有出入,其甚至不知道哪个报表是自己所要查询的。因此,本申请提出一种指标统计方法,通过自然语言的问题表述形式实现,可以通过语义理解的方式,将多样化的指标含义表述快速匹配到业务人员查询的标准指标上,大大提高查询效率和成功率。
发明内容
有鉴于此,本发明的目的在于提供一种表格问答数据的处理方法、装置及电子设备,可以提高查询效率和成功率。
第一方面,本发明实施例提供了一种表格问答数据的处理方法,该方法包括:获取用户输入的携带有指标的问题文本数据;提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;从预先存储的数据库中提取语义类别对应的指标数据;将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,从预先存储的数据库中提取语义类别对应的指标数据的步骤,包括:基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板;将语义类别填充至数据提取模板的模板槽位中,构建预定义的数据查询逻辑;使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板的步骤,包括:根据语义类别中的条件特征,确定问题文本数据对应的问题主类别;基于语义类别中的属性特征,从问题主类别中确定问题子类别;根据问题子类别关联的问题类型参数,得到问题文本数据对应的数据提取模板。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,数据库包括实体表格;实体表格对应于语义类别的实体特征;使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据的步骤,包括:根据语义类别中的属性特征,从实体表格中确定属性特征对应的值域区间;根据语义类别对应的实体特征,从值域区间中确定实体特征对应的单元格项;将单元格项中的单元格数据确定为语义类别对应的指标数据。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果的步骤,包括:将语义类别对应的指标数据填充至反馈模板对应的反馈槽位中,并将每个反馈槽位中的指标数据与反馈模板进行拼接,得到问题文本数据对应的反馈结果。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,获取用户输入的携带有指标的问题文本数据的步骤之后,方法还包括:对问题文本数据进行预处理,将问题文本数据转换为标准形式的问题文本数据;其中,预处理包括文本清洗和分词处理。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,对问题文本数据进行预处理的步骤,包括:提取问题文本数据中的数字参数和/或字符参数;根据预先存储的映射表,将问题文本数据中的数字参数和/或字符参数转换为对应的标准形式。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,对问题文本数据进行预处理的步骤,还包括:提取问题文本数据中的语义实体;根据预先定义的同义词库,将语义实体解析为提取模型对应的目标语义。
第二方面,本发明实施例还提供一种表格问答数据的处理装置,该装置应用于上述方法,该装置包括:信息获取模块,用于获取用户输入的携带有指标的问题文本数据;数据解析模块,用于提取问题文本数据中的语义类别,并基于语义类别确定反馈模板,其中,语义类别包括属性特征、条件特征和实体特征;提取模块,用于从预先存储的数据库中提取语义类别对应的指标数据;输出模块,用于将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
第三方面,本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述表格问答数据的处理方法。
本发明实施例带来了以下有益效果:
本发明提供的一种表格问答数据的处理方法、装置及电子设备,将用户提出的问题文本数据分成实体特征、属性特征和条件特征三种语义类别,再根据语义类别确定反馈模板,并将抽取的指标数据拼接至反馈模版形成回复,以问答形式进行问题反馈,将表格问答形式用于指标数据的可视化,问答的形式相对于报表可以与用户进行信息交互,基于该形式的可视化反馈可以充分利用对话的上下文信息帮助用户以更低的时间成本直观精准地找到相关业务指标,提高用户查询指标的效率和精准度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种表格问答数据的处理方法的流程图;
图2为本发明实施例提供的另一种表格问答数据的处理方法的流程图;
图3为本发明实施例提供的一种表格问答数据的处理装置的结构示意图;
图4为本发明实施例提供的另一种表格问答数据的处理装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
工业上许多业务仍然用表格的方式存储数据进行指标的统计分析,传统的可视化方法采用数据报表的形式。这种方式缺乏业务人员与系统的直接交互,面对大量的指标报表时,业务人员很难快速找到自己关注的指标数据,一旦报表字段与业务人员的理解有出入,其甚至不知道哪个报表是自己所要查询的。
基于上述问题,本发明实施例在于提出一种指标统计方法,通过自然语言的问题表述形式实现,可以通过语义理解的方式,将多样化的指标含义表述快速匹配到业务人员查询的标准指标上,大大提高查询效率和成功率。
基于此,本发明实施例提供的一种表格问答数据的处理方法、装置及电子设备,可以提高查询效率和成功率。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种表格问答数据的处理方法进行详细介绍,图1示出了本发明实施例提供的一种表格问答数据的处理方法的流程图,如图1所示,该方法包括以下步骤:
步骤S102,获取用户输入的携带有指标的问题文本数据。
步骤S104,提取问题文本数据中的语义类别,并基于语义类别确定反馈模板。
在具体实现时,用户可以根据需求提出问题,并将问题信息输入至系统中,此时,该系统可以获取用户输入的问题信息,并获取问题信息中的指标,根据指标信息确定该指标的语义类别,从而确定用户提出的问题信息的反馈模板,以根据反馈模板对用户提出的问题进行反馈。其中,语义类别包括属性特征、条件特征和实体特征;系统通过分析指标对应的属性特征、条件特征和实体特征从而确定相应的反馈模板。
步骤S106,从预先存储的数据库中提取语义类别对应的指标数据。
步骤S108,将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
在具体实现时,本发明实施例在于根据用户输入的问题文本数据输出相应的查询数据,举例说明,用户的问题信息可以是关于车险保费,如,7月渠道A的车险保费规模,此时,“7月”、“渠道A”和“车险保费规模”分别为一项指标,此时,系统可以从预先存储的数据库中提取“7月”时间段中“渠道A”的“车险保费规模”数据,得到用户的问题信息对应的指标数据。之后,再根据语义类别对应的反馈模板将各个指标数据拼接至该反馈模板中,并将拼接结果反馈给用户,以使用户得到问题信息的问题反馈。
本发明实施例提供的一种表格问答数据的处理方法,将用户提出的问题文本数据分成实体特征、属性特征和条件特征三种语义类别,再根据语义类别确定反馈模板,并将抽取的指标数据拼接至反馈模版形成回复,以问答形式进行问题反馈,将表格问答形式用于指标数据的可视化,问答的形式相对于报表可以与用户进行信息交互,基于该形式的可视化反馈可以充分利用对话的上下文信息帮助用户以更低的时间成本直观精准地找到相关业务指标,提高用户查询指标的效率和精准度。
为了便于理解,在上述实施例的基础上,本发明实施例还提供了另一种表格问答数据的处理方法进行详细介绍,图2示出了本发明实施例提供的另一种表格问答数据的处理方法的流程图,如图2所示,该方法包括以下步骤:
步骤S202,获取用户输入的携带有指标的问题文本数据。
步骤S204,对问题文本数据进行预处理,将问题文本数据转换为标准形式的问题文本数据。
具体的,系统中配置有提取模型、数据提取模板和反馈模板,以及用于查询指标数据的实体表格,系统会根据用户输入的问题文本数据确定数据提取模板,再基于问题文本数据构建数据提取模板的数据查询逻辑,使提取模型根据数据查询逻辑在问题文本数据对应的实体表格中查找指标数据,再将指标数据输入至反馈模板中,输出反馈模板中的结果,以向用户提供问题反馈。
在具体实现时,用户输入问题信息后,系统会对问题信息中的文本数据进行预处理,以将问题文本数据转换为标准形式的问题文本数据,其中,预处理包括文本清洗和分词处理,用于将问题文本数据划分为多个数字参数或字符参数与文字信息的组合数据。
具体的,可以提取问题文本数据中的数字参数和/或字符参数,根据预先存储的映射表,将问题文本数据中的数字参数和/或字符参数转换为对应的标准形式。用户输入的问题文本数据可能与预存的数据库的存储数据的形式不同,故,可以对提取出来的字符参数或字符参数根据映射表将其转换成数据库对应的标准形式的问题文本数据,方便系统进行数据分析。如,数据库中存储的数字参数可能以文字形式表现,而当用户输入的问题文本数据的数字参数为数字时,可以将相应的数字转换为相应的文字形式,或者,数据库中存储的字符参数为小写字母,当用户输入的问题文本数据的字符参数为大写字母时,可以将大写字母转换为相应的小写字母。
进一步的,系统还会提取问题文本数据中的语义实体,再根据预先定义的同义词库,将语义实体解析为提取模型对应的目标语义。用户输入的问题文本数据与数据库的存储数据的语义实体的内容可能不同,可以根据同义词库将提取的语义实体进行解析,得到模型对应的目标语义,以便于确定反馈模板。
步骤S206,提取问题文本数据中的语义类别,并基于语义类别确定反馈模板。
步骤S208,基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板。
在具体实现时,每个问题文本数据可以按照不同的问题类别进行分类,其中,问题类别包括问题主类别和问题子类别,再根据问题子类别可以确定问题类型参数,进而确定相应的数据提取模板。其中,问题主类别可以包括普通查询、属性约束、计算查询、实体比较等,普通查询对应的问题子类别可以包括获取实体的所有信息、获取实体的属性信息、获取所有实体等,此时,相应的问题类型参数可以是提取模型对应的类型指示,如上述问题子类别对应的问题类型参数分别为“S”、“SP”、“C”。属性约束对应的问题子类别可以包括显式属性约束和隐式属性约束,显式属性约束在于输入的问题文本数据的实体、属性、条件等均可以按照输入的信息直接在数据库中查询到,隐式属性约束则在于提供的问题文本数据中的实体或属性为属性对应的上位概念,此时,显式属性约束对应的问题类型参数为POC,隐式属性约束的问题类型参数为OC。计算查询对应的问题子类别可以包括聚合、差值等,实体比较对应的问题子类别可以包括全属性对比和单属性对比等,全属性对比对应的问题类型参数为cmp_all,单属性对比对应的问题类型参数可以是cmp_less、cmp_more、cmp_attr等,单属性对比的具体的问题类型参数根据分析得到的问题子类别的具体内容确定。上述问题类型参数在于对本发明实施例的问题类型参数进行说明,而非限定问题类型参数的具体内容。
根据语义类别确定反馈模板时,先确定语义类别对应的类别参数,再基于类别参数确定相应的问题类别,从而得到对应的数据提取模板。具体的,问题文本数据中包括的条件特征、属性特征和实体特征等语义类别所形成的问题文本数据可以在于提出某一属性的实体在哪些条件下的结果如何。如问题文本数据可以是“非车险各险种各月保费环比变化多少”,其中,属性特征为“非车险的各险种”,其对应的实体特征为“险种”,该问题文本数据中的条件特征为“各月”,“保费环比”以及“保费环比变化”,而上述条件特征中同样包括“月份”属性和“保费环比”属性。
问题文本数据还可以是“价格大于20w的车有哪些”,此时,属性特征为“价格”,条件特征为“大于20W”,实体为“车”,该问题文本数据在于确定实体“车”的具体内容,也即,该问题文本数据在于确定实体“车”的实体值。此时,可以根据语义类别中的条件特征,如,“价格”、“大于20W”、“车”和“车”的实体值等确定问题文本数据对应的问题主类别,此时,该问题文本数据的问题主类别为普通查询再基于语义类别中的属性特征,从问题主类别中确定问题子类别,再根据问题子类别关联的问题类型参数,得到问题文本数据对应的数据提取模板,此时,该问题文本数据的数据提取模板为车对应的“<属性,条件,实体,实体值?>”。
步骤S210,将语义类别填充至数据提取模板的模板槽位中,构建预定义的数据查询逻辑。
步骤S212,使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据。
得到数据提取模板后可以将对应的语义类别填充至相应的模板槽位中,构建预定义的数据查询逻辑,再使提取模型执行数据查询逻辑,进而从数据库中提取到相应的指标数据,该指标数据也可以指示上述问题文本数据中的实体特征和属性特征对应的属性值。本发明实施例的提取模型可以使用文本信息抽取模型,其中,该提取模型不拘泥于一种,可以采用任何种类的信息抽取模型,如LSTM、CRF、BERT等。
具体的,数据库包括实体表格,实体表格对应于语义类别的实体特征,在具体实现时,根据语义类别中的属性特征,从实体表格中确定属性特征对应的值域区间,再根据语义类别对应的实体特征,从值域区间中确定实体特征对应的单元格项,再将单元格项中的单元格数据确定为语义类别对应的指标数据。
其中每个实体分别对应相应的实体表格,每个实体表格中按照相应的属性存储有相应的数据,此时,可以在确定的实体表格中根据属性特征确定对应的值域区间,如表格中的行或列,再从值域区间中确定问题文本数据中的实体特征对应的单元格项,该单元格项中的数据可以是所要提取的指标数据。
步骤S214,将语义类别对应的指标数据填充至反馈模板对应的反馈槽位中,并将每个反馈槽位中的指标数据与反馈模板进行拼接,得到问题文本数据对应的反馈结果。
每个问题文本数据中不止包括一项实体特征和属性特征,此时可以将每个实体特征和属性特征对应的属性值指示的指标数据按照反馈模板的反馈槽位进行填充,基于反馈模板的模板结构对各个反馈槽位中的指标数据与反馈模板进行拼接,可以得到相应的问题文本数据反馈结果。
以问题文本数据为“价格大于20w的车有哪些”进行说明,其对应的反馈模版是“【属性】【条件】的【实体】有【实体值】”,当信息抽取得到的是属性是:价格,条件是:大于200000,实体是:车,查询的数据是“奔驰”时,反馈结果为“价格大于200000的车有奔驰”。
本发明实施例提供的另一种表格问答数据的处理方法,根据给定的语义表格的数据,通过信息抽取、实体识别、模版填充等自然语言处理方法解析用户问题文本,将用户提出的问题文本数据分成实体特征、属性特征和条件特征三种语义类别,用文本理解的方法解析用户问题,提取用户所关注问题实体、属性和条件信息,能够更精准地定位表格的单元格数据,直接命中表格的某个或者多个单元格数据,然后根据不同类型的反馈模版将单元格数据进行文本拼接,形成自然的语言表达返回给用户,按照问答形式进行反馈问题对应的结果,将表格问答形式用于指标数据的可视化,查找数据清晰、快速且准确,提高用户查询指标的效率和精准度;此外,通过提取模型在实体表格中抽取信息,再根据不同类型的反馈模版将单元格数据进行文本拼接形成回复,所形成的回复也为自然语言,回复形式自然,有益于用户理解。
进一步地,在上述方法实施例的基础上,本发明实施例还提供一种表格问答数据的处理装置,该装置应用于上述方法,图3示出了本发明实施例提供的一种表格问答数据的处理装置的结构示意图,如图3所示,该装置包括:
信息获取模块301,用于获取用户输入的携带有指标的问题文本数据。
数据解析模块302,用于提取问题文本数据中的语义类别,并基于语义类别确定反馈模板。其中,语义类别包括属性特征、条件特征和实体特征。
提取模块303,用于从预先存储的数据库中提取语义类别对应的指标数据。
输出模块304,用于将指标数据拼接至反馈模板中,以使用户得到问题文本数据对应的反馈结果。
本发明实施例提供的一种表格问答数据的处理装置,与上述实施例提供的一种表格问答数据的处理方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
进一步地,在上述装置实施例的基础上,本发明实施例还提供另一种表格问答数据的处理装置,图4示出了本发明实施例提供的另一种表格问答数据的处理装置的结构示意图,如图4所示,上述提取模块303,还用于基于语义类别对应的类别参数,确定问题文本数据对应的问题类别,得到问题类别对应的数据提取模板;将语义类别填充至数据提取模板的模板槽位中,构建预定义的数据查询逻辑;使用预先设置的提取模型执行数据查询逻辑,从预先存储的数据库中提取语义类别对应的指标数据。
上述提取模块303,还用于根据语义类别中的条件特征,确定问题文本数据对应的问题主类别;基于语义类别中的属性特征,从问题主类别中确定问题子类别;根据问题子类别关联的问题类型参数,得到问题文本数据对应的数据提取模板。
上述提取模块303,还用于根据语义类别中的属性特征,从实体表格中确定属性特征对应的值域区间;根据语义类别对应的实体特征,从值域区间中确定实体特征对应的单元格项;将单元格项中的单元格数据确定为语义类别对应的指标数据。
上述输出模块304,还用于将语义类别对应的指标数据填充至反馈模板对应的反馈槽位中,并将每个反馈槽位中的指标数据与反馈模板进行拼接,得到问题文本数据对应的反馈结果。
上述装置还包括数据处理模块305,用于对问题文本数据进行预处理,将问题文本数据转换为标准形式的问题文本数据;其中,预处理包括文本清洗和分词处理。
上述数据处理模块305,还用于提取问题文本数据中的数字参数和/或字符参数;根据预先存储的映射表,将问题文本数据中的数字参数和/或字符参数转换为对应的标准形式。
上述数据处理模块305,还用于提取问题文本数据中的语义实体;根据预先定义的同义词库,将语义实体解析为提取模型对应的目标语义。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图1至图2所示的方法的步骤。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述图1至图2所示的方法的步骤。
本发明实施例还提供了一种电子设备的结构示意图,如图5所示,为该电子设备的结构示意图,其中,该电子设备包括处理器51和存储器50,该存储器50存储有能够被该处理器51执行的计算机可执行指令,该处理器51执行该计算机可执行指令以实现上述图1至图2所示的方法。
在图5示出的实施方式中,该电子设备还包括总线52和通信接口53,其中,处理器51、通信接口53和存储器50通过总线52连接。
其中,存储器50可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线52可以是ISA(Industry StandardArchitecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等,还可以是AMBA(Advanced Microcontroller Bus Architecture,片上总线的标准)总线,其中,AMBA定义了三种总线,包括APB(Advanced Peripheral Bus)总线、AHB(Advanced High-performance Bus)总线和AXI(Advanced eXtensible Interface)总线。总线52可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器51可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器51中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器51可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器51读取存储器中的信息,结合其硬件完成前述图1至图2任一所示的方法。
本发明实施例所提供的一种表格问答数据的处理方法、装置及电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、
“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指
示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操5作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”
仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,
尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理0解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然
可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在
本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范5围为准。

Claims (10)

1.一种表格问答数据的处理方法,其特征在于,所述方法包括:
获取用户输入的携带有指标的问题文本数据;
提取所述问题文本数据中的语义类别,并基于所述语义类别确定反馈模板,其中,所述语义类别包括属性特征、条件特征和实体特征;
从预先存储的数据库中提取所述语义类别对应的指标数据;
将所述指标数据拼接至所述反馈模板中,以使用户得到所述问题文本数据对应的反馈结果。
2.根据权利要求1所述的方法,其特征在于,所述从预先存储的数据库中提取所述语义类别对应的指标数据的步骤,包括:
基于所述语义类别对应的类别参数,确定所述问题文本数据对应的问题类别,得到所述问题类别对应的数据提取模板;
将所述语义类别填充至所述数据提取模板的模板槽位中,构建预定义的数据查询逻辑;
使用预先设置的提取模型执行所述数据查询逻辑,从预先存储的数据库中提取所述语义类别对应的指标数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述语义类别对应的类别参数,确定所述问题文本数据对应的问题类别,得到所述问题类别对应的数据提取模板的步骤,包括:
根据所述语义类别中的条件特征,确定所述问题文本数据对应的问题主类别;
基于所述语义类别中的属性特征,从所述问题主类别中确定问题子类别;
根据所述问题子类别关联的问题类型参数,得到所述问题文本数据对应的数据提取模板。
4.根据权利要求2所述的方法,其特征在于,所述数据库包括实体表格;所述实体表格对应于所述语义类别的实体特征;
所述使用预先设置的提取模型执行所述数据查询逻辑,从预先存储的数据库中提取所述语义类别对应的指标数据的步骤,包括:
根据所述语义类别中的属性特征,从所述实体表格中确定所述属性特征对应的值域区间;
根据所述语义类别对应的实体特征,从所述值域区间中确定所述实体特征对应的单元格项;
将所述单元格项中的单元格数据确定为所述语义类别对应的指标数据。
5.根据权利要求1所述的方法,其特征在于,所述将所述指标数据拼接至所述反馈模板中,以使用户得到所述问题文本数据对应的反馈结果的步骤,包括:
将所述语义类别对应的指标数据填充至所述反馈模板对应的反馈槽位中,并将每个所述反馈槽位中的指标数据与所述反馈模板进行拼接,得到所述问题文本数据对应的反馈结果。
6.根据权利要求1所述的方法,其特征在于,所述获取用户输入的携带有指标的问题文本数据的步骤之后,所述方法还包括:
对所述问题文本数据进行预处理,将所述问题文本数据转换为标准形式的问题文本数据;其中,所述预处理包括文本清洗和分词处理。
7.根据权利要求6所述的方法,其特征在于,所述对所述问题文本数据进行预处理的步骤,包括:
提取所述问题文本数据中的数字参数和/或字符参数;
根据预先存储的映射表,将所述问题文本数据中的数字参数和/或字符参数转换为对应的标准形式。
8.根据权利要求7所述的方法,其特征在于,所述对所述问题文本数据进行预处理的步骤,还包括:
提取所述问题文本数据中的语义实体;
根据预先定义的同义词库,将所述语义实体解析为所述提取模型对应的目标语义。
9.一种表格问答数据的处理装置,其特征在于,所述装置应用于权利要求1至8任一项所述的方法,所述装置包括:
信息获取模块,用于获取用户输入的携带有指标的问题文本数据;
数据解析模块,用于提取所述问题文本数据中的语义类别,并基于所述语义类别确定反馈模板,其中,所述语义类别包括属性特征、条件特征和实体特征;
提取模块,用于从预先存储的数据库中提取所述语义类别对应的指标数据;
输出模块,用于将所述指标数据拼接至所述反馈模板中,以使用户得到所述问题文本数据对应的反馈结果。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现上述权利要求1至8任一项所述的表格问答数据的处理方法。
CN202211529616.9A 2022-11-30 2022-11-30 表格问答数据的处理方法、装置及电子设备 Pending CN115858751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211529616.9A CN115858751A (zh) 2022-11-30 2022-11-30 表格问答数据的处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211529616.9A CN115858751A (zh) 2022-11-30 2022-11-30 表格问答数据的处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN115858751A true CN115858751A (zh) 2023-03-28

Family

ID=85668876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211529616.9A Pending CN115858751A (zh) 2022-11-30 2022-11-30 表格问答数据的处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN115858751A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976294A (zh) * 2023-09-22 2023-10-31 青岛诺亚信息技术有限公司 一种用于实现复杂电子表格自动填充的方法及系统
CN117149985A (zh) * 2023-10-31 2023-12-01 海信集团控股股份有限公司 一种基于大模型的问答方法、装置、设备及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116976294A (zh) * 2023-09-22 2023-10-31 青岛诺亚信息技术有限公司 一种用于实现复杂电子表格自动填充的方法及系统
CN116976294B (zh) * 2023-09-22 2024-02-09 青岛诺亚信息技术有限公司 一种用于实现复杂电子表格自动填充的方法及系统
CN117149985A (zh) * 2023-10-31 2023-12-01 海信集团控股股份有限公司 一种基于大模型的问答方法、装置、设备及介质
CN117149985B (zh) * 2023-10-31 2024-03-19 海信集团控股股份有限公司 一种基于大模型的问答方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN115858751A (zh) 表格问答数据的处理方法、装置及电子设备
CN110377558B (zh) 文档查询方法、装置、计算机设备和存储介质
CN108255897B (zh) 可视化图表数据转换处理方法和装置
CN112257419B (zh) 一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质
CN113177125B (zh) 标准知识图谱构建、标准查询方法及装置
CN112732945B (zh) 标准知识图谱构建、标准查询方法及装置
CN110263155B (zh) 数据分类方法、数据分类模型的训练方法及系统
CN115239214B (zh) 企业的评估处理方法、装置及电子设备
CN112181924A (zh) 文件转换方法、装置、设备及介质
CA3051919C (en) Machine learning (ml) based expansion of a data set
CN113159118A (zh) 物流数据指标的处理方法、装置、设备及存储介质
CN112685544A (zh) 电信信息的查询方法、装置、设备和介质
CN114254109B (zh) 用于确定行业类别的方法及装置
CN114943219A (zh) 物料清单测试数据的生成方法、装置、设备及存储介质
CN113094424B (zh) 通过构建多级指标体系进行图表模式识别的方法和系统
CN113806526A (zh) 特征抽取方法、设备和存储介质
CN117540107B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111858732B (zh) 数据融合方法及终端
CN115587588B (zh) 文本内容审核方法、装置及电子设备
CN116719839B (zh) 会计档案的数据查询方法、装置和电子设备
CN115222371B (zh) 一种问题排查方法、装置、电子设备及存储介质
CN111259209B (zh) 基于人工智能的用户意图预测方法、电子装置及存储介质
EP3523771A1 (en) System and method for verifying unstructured enterprise resource planning data
CN112288585B (zh) 保险业务精算数据处理方法、装置及电子设备
CN113204710A (zh) 一种舆情分析方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination