CN117725908A - 一种自然语言处理中的时间解析方法、装置及设备 - Google Patents
一种自然语言处理中的时间解析方法、装置及设备 Download PDFInfo
- Publication number
- CN117725908A CN117725908A CN202410172095.9A CN202410172095A CN117725908A CN 117725908 A CN117725908 A CN 117725908A CN 202410172095 A CN202410172095 A CN 202410172095A CN 117725908 A CN117725908 A CN 117725908A
- Authority
- CN
- China
- Prior art keywords
- time
- operator
- phrase
- target
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003058 natural language processing Methods 0.000 title claims abstract description 37
- 238000004458 analytical method Methods 0.000 title abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000009471 action Effects 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 27
- 238000013507 mapping Methods 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 23
- 238000002372 labelling Methods 0.000 claims description 23
- 238000013145 classification model Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种自然语言处理中的时间解析方法、装置及设备,对用户语音数据进行语音识别,得到文本数据,提取文本数据中的时间短语。获取时间短语对应的多算子分类结果和实体识别结果,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子,目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况。实体识别结果包括各个子时间短语中的时间实体和时间实体对应的时间单位。结合多算子分类结果和实体识别结果构建时间短语对应的时间组合算子。基于当前时间和时间组合算子,推测时间短语对应的标准时间信息。如此,实现了用户与终端设备进行语音交互时,自然语言处理中的时间解析,得到的标准时间信息较为准确。
Description
技术领域
本申请涉及语音识别技术领域,尤其涉及一种自然语言处理中的时间解析方法、装置及设备。
背景技术
随着智慧家居的快速发展,智能家居通过应用自然语言处理技术实现了用户与智能家居设备之间更加智能化的语言交互。例如,用户可通过语音来控制智慧家居中的家居设备。在实际应用中,用户的语音由对话交互系统进行捕捉并处理,以生成控制指令来下发到对应的家居设备中进行控制。
在用户语音的自然语言处理过程中,用户语音中的时间解析是较为重要的。例如,当用户语音为“设置两天后下午三点半的闹钟”时,对话交互系统需要解析用户语音,获取设置闹钟的准确时间信息。
因此,亟需一种自然语言处理中的时间解析方法来解析用户语音中的时间信息。
发明内容
为了解决上述技术问题,本申请提供了一种自然语言处理中的时间解析方法、装置及设备,能够对用户语音进行自然语言处理,实现自然语言处理中的时间解析,获得用户语音中关于时间的标准时间信息。
为了实现上述目的,本申请提供的技术方案如下:
第一方面,本申请提供一种自然语言处理中的时间解析方法,所述方法包括:
提取对用户语音数据进行语音识别得到的文本数据中的时间短语;所述时间短语包括一个或多个子时间短语;
获取所述时间短语对应的多算子分类结果;所述多算子分类结果包括所述时间短语中的各个子时间短语分别对应的目标算子,所述目标算子用于表示所述子时间短语对应的时间单位的时间设置情况和时间偏移情况;
获取所述时间短语对应的实体识别结果;所述实体识别结果包括所述时间短语中的各个子时间短语中的时间实体以及所述时间实体对应的时间单位;
结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子;
根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息。
第二方面,本申请提供一种自然语言处理中的时间解析装置,所述装置包括:
提取单元,用于提取对用户语音数据进行语音识别得到的文本数据中的时间短语;所述时间短语包括一个或多个子时间短语;
第一获取单元,用于获取所述时间短语对应的多算子分类结果;所述多算子分类结果包括所述时间短语中的各个子时间短语分别对应的目标算子,所述目标算子用于表示所述子时间短语对应的时间单位的时间设置情况和时间偏移情况;
第二获取单元,用于获取所述时间短语对应的实体识别结果;所述实体识别结果包括所述时间短语中的各个子时间短语中的时间实体以及所述时间实体对应的时间单位;
组合单元,用于结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子;
确定单元,用于根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息。
第三方面,本申请提供一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的自然语言处理中的时间解析方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面所述的自然语言处理中的时间解析方法。
通过上述技术方案可知,本申请具有以下有益效果:
本申请提供了一种自然语言处理中的时间解析方法、装置及设备,用户可提供用于控制家居设备的语音数据,捕捉到该语音数据后,对用户语音数据进行语音识别,获得与用户语音数据匹配的文本数据。进而,提取文本数据中的时间短语,该时间短语包括一个或多个子时间短语。获取时间短语对应的多算子分类结果和实体识别结果。其中,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子,目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况。实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。进一步,结合时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及时间实体对应的时间单位,构建各个子时间短语分别对应的时间结构化表示,将各个子时间短语分别对应的时间结构化表示进行组合,获得时间短语对应的时间组合算子。基于此,根据当前时间以及时间组合算子,推测出时间短语对应的标准时间信息。
基于上述方式,解析时间短语,获得时间短语对应的多算子分类结果和实体识别结果,时间组合算子中不仅包括子时间短语中的时间设置情况和时间偏移情况,还包括该子时间短语中的时间单位和对应的时间实体,则多算子分类结果和实体识别结果能够用于表示时间短语中的丰富且完整的时间信息,用于确定时间短语对应的标准时间信息是较为准确的。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种自然语言处理中的时间解析方法的实施环境的示意图;
图2为本申请实施例提供的一种自然语言处理中的时间解析方法的流程图;
图3为本申请实施例提供的一种时间解析的示例图;
图4为本申请实施例提供的另一种自然语言处理中的时间解析方法的流程图;
图5为本申请实施例提供的一种自然语言处理中的时间解析装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
为了便于理解本申请实施例提供的自然语言处理中的时间解析方法,下面结合图1所示的实施环境进行说明。如图1所示,本申请实施例提供的自然语言处理中的时间解析方法可应用于包括终端设备101、网络102和服务器103的实施环境中。
在实际应用中,本申请实施例提供的自然语言处理中的时间解析方法可广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。在全屋智能数字化控制应用场景中,用户交互的终端设备101可包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备101可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
网络102可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。
服务器103通过网络102与终端设备101进行连接,可用于为终端设备101或终端设备101上安装的客户端提供服务(如应用服务等),可在服务器103上或独立于服务器103设置数据库,用于为服务器103提供数据存储服务,可在服务器103上或独立于服务器103配置云计算和/或边缘计算服务,用于为服务器103提供数据运算服务。
在实际应用中,用户存在与终端设备101进行语音交互的需求,以通过语音来控制终端设备101执行相应的操作。例如,终端设备101可为智能空调,用户向智能空调提供“两天后早上10:00开启空调”的语音,智能空调会执行相应操作。
基于图1所示的实施环境,在控制智能空调的过程中,用户与终端设备101交互的语音数据会被终端设备101捕捉到,终端设备101将捕捉到的用户语音通过网络102发送给服务器103进行处理。服务器103识别出语音数据中的标准时间信息,并将该标准时间信息返回给终端设备101进行后续设置。示例的,服务器103中包括时间解析系统,可由时间解析系统解析出语音数据中的标准时间信息。
具体地,服务器103接收到用户语音数据后,先对语音数据进行语音识别,获取与语音数据相匹配的文本数据,并提取文本数据中的时间短语。进而,获取时间短语对应的多算子分类结果和实体识别结果。其中,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子,目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况。实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。进一步,结合时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及时间实体对应的时间单位,构建各个子时间短语分别对应的时间结构化表示,将各个子时间短语分别对应的时间结构化表示进行组合,获得时间短语对应的时间组合算子。如此,根据当前时间以及时间组合算子,便可推测出时间短语对应的标准时间信息。
例如,当前时间为xxxx年10月18日的9:00:00,基于上述过程获得的“两天后早上10:00”对应的标准时间信息具体为xxxx年10月20日的10:00:00。后续,服务器103会将时间短语对应的标准时间信息通过网络102返回给终端设备101,以使终端设备101基于时间短语对应的标准时间信息进行相应设置。例如,智能空调会设置在xxxx年10月20日的10:00:00进行开启。
本领域技术人员可以理解,图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。
为了便于理解本申请,下面结合附图对本申请实施例提供的一种自然语言处理中的时间解析方法进行说明。
参见图2所示,该图为本申请实施例提供的一种自然语言处理中的时间解析方法的流程图,该方法可应用于上述实施例中的服务器103中。如图2所示,该方法可以包括S201-S205:
S201:提取对用户语音数据进行语音识别得到的文本数据中的时间短语;时间短语包括一个或多个子时间短语。
在实际交互场景中,用户先向终端设备发出语音,终端设备接收用户的语音,获得语音数据。进而,终端设备将语音数据发送给服务器,服务器对语音数据中的时间进行解析。
具体地,服务器接收到用户语音数据后,先对用户语音数据进行语音识别,获取与该用户语音数据相匹配的文本数据。对语音数据中的时间进行解析的问题转换为对与之匹配的文本数据中的时间进行解析,则后续的处理过程会基于文本数据进行。
为了对文本数据中的时间进行解析,先提取文本数据中的时间短语。时间短语即文本数据中与时间相关的短语。这样,后续的时间解析过程基于时间短语进行,能够避免文本数据中的其他文本对时间解析的干扰。
参见图3,图3为本申请实施例提供的一种时间解析的示例图。如图3所示,例如,用户语音数据转换后的文本数据为“两天后下午三点半提醒xx开会”,该文本数据中与时间相关的短语为“两天后下午三点半”,则从中提取到的时间短语即为“两天后下午三点半”。
在一种可能的实现方式中,本申请实施例提供了一种提取文本数据中的时间短语的具体实施方式,包括:
将文本数据输入第二实体识别模型中,获取文本数据中的时间短语;
其中,第二实体识别模型由文本样本数据以及文本样本数据中的时间短语标签训练得到。
需要说明的是,本申请实施例不限定第二实体识别模型的网络结构,可根据实际情况进行设置。例如,第二实体识别模型的网络结构可为预训练模型(如BERT模型)结合条件随机场CRF网络的结构,第二实体识别模型还可为命名实体识别NER模型。
第二实体识别模型用于从文本数据中识别出时间短语。第二实体识别模型通常可由文本样本数据以及文本样本数据中的时间短语标签训练得到。具体地,将文本样本数据输入第二实体识别模型中,第二实体模型对文本样本数据中的每个字符进行标注,以获得文本样本数据中的全部实体,进而从全部实体中筛选出完整的时间实体。基于第二实体识别模型输出的完整的时间实体与时间短语标签构建损失函数,并获取对应的损失值,基于损失值训练第二实体模型。第二实体识别模型训练结束后,便可用于提取文本数据中的时间短语。可以理解的是,文本数据中的时间短语可看作是文本数据中的完整的时间实体。
在另一种可能的实现方式中,还可基于正则表达式的方式提取文本数据中的时间短语。正则表达式,又称规则表达式,通常被用来检索符合特定模式的文本,可用于查找文本数据中的时间短语。这里不限定正则表达式的构建方式和内容,可根据实际情况进行确定。
时间短语通常包括一个或多个子时间短语。可以理解的是,时间短语中可涉及多个时间单位的时间。每个时间单位相关的时间均可看作是一个子时间短语,同一时间单位相关的不同时间可看作是不同的子时间短语。一个或多个子时间短语组成时间短语。其中,时间单位可包括年、月、周、日、小时、分钟、刻钟、秒钟等。在本申请实施例中,时间单位还可包括工作日、周末、节假日、月时间段、天时间段、今天、当前时间等。例如,时间短语“两天后下午三点半”中涉及“天”、“天时间段”、“小时”等三个时间单位,“天”相关的时间为“两天后”,“天时间段”相关的时间为“下午”,“小时”相关的时间为“三点半”。在该示例中,时间短语中的子时间短语为“两天后”、“下午”、“三点半”。
S202:获取时间短语对应的多算子分类结果;多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子,目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况。
通常,终端设备只能解析标准时间信息,标准时间信息为符合标准时间格式的时间,标准时间格式的表示方式可具体参见下文。由于获得的时间短语的表达方式非常多,且时间短语中可能包括了上下文推断,如“差五分四点”、“三天后的上午八点”等,则时间短语并非标准时间信息的表示方式。如果直接将时间短语返回给终端设备,终端设备不能理解该时间短语。因此,服务器提取到文本数据中的时间短语后,仍需对时间短语进行进一步的处理,以获取时间短语表示的标准时间信息。
在获取时间短语表示的标准时间信息的过程中,先获取时间短语对应的多算子分类结果。其中,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子。例如,时间短语为“两天后下午三点半”时,该时间短语对应的多算子分类结果包括“两天后”对应的目标算子、“下午”对应的目标算子以及“三点半”对应的目标算子。
可以理解的是,“下午”和“三点半”分别对应的时间单位为“天时间段”和“小时”,且“下午”和“三点半”表示时间会设置在下午和三点半。这表示,针对时间单位“天时间段”和“小时”,只存在时间直接的设置情况(简称时间设置情况),不存在时间偏移后再设置的情况(简称时间偏移情况)。“两天后”对应的时间单位为“天”,“两天后”中的“后”表示时间存在偏移且时间偏移向后,时间会从当前时间开始偏移到两天后。这表示,针对时间单位“天”,存在时间偏移情况,不存在时间设置情况。目标算子正是表示子时间短语对应的时间单位的时间设置情况和时间偏移情况的算子。时间设置情况为真(可理解为布尔“1”)或为空(可理解为布尔“0”),时间偏移情况为真或空。需要说明的是,当目标算子表示的时间设置情况为真时,则表示的时间偏移情况为空。当目标算子表示的时间偏移情况为真时,则表示的时间设置情况为空。
示例地,本申请实施例预先设置有时间算子集合和偏移方向算子集合。其中,预设的时间算子集合包括多个时间算子,时间算子包括时间设置算子和时间偏移算子,时间设置算子由时间设置标识和时间单位组成,时间偏移算子由时间偏移标识和时间单位组成;预设的偏移方向算子集合包括时间偏移向前的偏移方向算子和时间偏移向后的偏移方向算子。
在该示例中,时间设置标识用于表示时间单位的时间设置情况,具体表示时间设置情况为真,即,时间单位相关的时间是直接设置的,也可理解为时间设置算子用于表示时间单位的时间设置情况为真。时间偏移标识和偏移方向算子用于表示时间单位的时间偏移情况,具体表示时间偏移情况为真,即时间单位相关的时间是先偏移后再设置的,也可理解为时间偏移算子和偏移方向算子用于表示时间单位的时间偏移情况。可以理解的是,当时间算子为时间设置算子时,时间设置算子表示的时间设置情况为真,表示的时间偏移情况为空;当时间算子为时间偏移算子时,时间偏移算子时表示的时间偏移情况为真,时间设置情况为空。
示例地,时间设置算子包括以下一项或多项:
时间设置为当前日、时间设置为当前时间、时间设置为期望年份、时间设置为期望月份、时间设置为期望日、时间设置为期望时、时间设置为期望分钟、时间设置为期望刻钟、时间设置为期望秒、时间设置为工作日、时间设置为节假日、时间设置为月时间段、时间设置为天时间段。
示例地,时间偏移算子包括以下一项或多项:
秒数偏移、刻钟偏移、分钟偏移、小时偏移、天数偏移、周数偏移、月份偏移、年份偏移。
可以理解的是,上述示出的时间设置算子和时间偏移算子的示例并不构成对时间设置算子和时间偏移算子的限定,仅作为示例进行说明。
参见表1,表1示出了多种时间算子,包括多种时间设置算子和多种时间偏移算子,以及每个时间算子的名称、含义和示例。
其中,以“set”为起始的时间算子均为时间设置算子,以“shift”为起始的时间算子均为时间偏移算子。则时间设置算子有:时间设置为当前日setToday、时间设置为当前时间setNow、时间设置为期望年份setYear、时间设置为期望月份setMonth、时间设置为期望日setDay、时间设置为期望时setHour、时间设置为期望分钟setMinute、时间设置为期望刻钟setQuarter、时间设置为期望秒setSecond、时间设置为工作日setWeekday、时间设置为节假日setHoliday、时间设置为月时间段setPeriodOfMonth、时间设置为天时间段setPeriodOfDay。
表1 时间算子
。
则时间偏移算子有:秒数偏移shiftSecond、刻钟偏移shiftQuarter、分钟偏移shiftMinute、小时偏移shiftHour、天数偏移shiftDay、周数偏移shiftWeek、月份偏移shiftMonth、年份偏移shiftYear。
其中,时间设置算子中的“set”为时间设置标识,每个时间设置算子中除“set”之外的即为时间单位。时间偏移算子中的“shift”为时间偏移标识,每个时间偏移算子中除“shift”之外的即为时间单位。另外,时间偏移向前的偏移方向算子可用“shiftBefore”进行表示,时间偏移向后的偏移方向算子可用“shiftAfter”进行表示。
基于上述关于时间算子和偏移方向算子的示例,作为一种可选示例,目标算子包括目标时间算子和目标时间算子对应的目标偏移方向算子。目标时间算子属于预设的时间算子集合中的时间算子,目标偏移方向算子属于预设的偏移方向算子集合中的偏移方向算子。可以理解的是,当目标时间算子为时间设置算子时,目标时间算子对应的目标偏移方向算子为空,当目标时间算子为时间偏移算子时,目标时间算子对应的目标偏移方向算子非空,为“shiftBefore”或“shiftAfter”。
表2 时间短语示例以及标注的时间短语示例对应的多算子分类结果
。
在一种可能的实现方式中,本申请实施例提供了一种获取时间短语对应的多算子分类结果的具体实施方式,包括:
将时间短语输入多算子分类模型中,获取时间短语对应的多算子分类结果;
其中,多算子分类模型由预训练模型以及时间短语分类数据集训练得到;时间短语分类数据集包括时间短语示例以及时间短语示例对应的多算子分类结果。
示例地,多算子分类模型为预训练模型,预训练模型可示例为BERT-base预训练模型,这里仅为示例,并不作限定。预训练模型为预先训练完成的模型,针对本申请实施例中的场景,再基于时间短语分类数据集对预训练模型进行有监督微调,即可训练出适用于“用于获取时间短语对应的多算子分类结果”的多算子分类模型。
其中,由于时间短语中包括一个或多个子时间短语,则多算子分类模型实现的分类任务为多标签分类任务(此处的标签即算子),一个时间短语可能属于多个分类,由此,时间短语分类数据集中对时间短语示例标注的多算子分类结果可包括表1所示的21种时间算子、shiftAfter、shiftBefore(共计23种算子)中的一个或多个。参见上述表2,表2示出了一些时间短语示例以及时间短语示例对应的多算子分类结果。
在多算子分类模型训练结束后,将待分类的时间短语输入到多算子分类模型中,多算子分类模型会先识别到时间短语中的各个子时间短语,再识别每个子时间短语对应的目标算子,进而获得时间短语对应的多算子分类结果。可以理解的是,上述基于多算子分类模型获得时间短语对应的多算子分类结果的方式能够提高解析时间短语以获得对应的多算子分类结果的泛化能力,鲁棒性强。
在一种可能的实现方式中,本申请实施例提供了另一种获取时间短语对应的多算子分类结果的具体实施方式,包括如下步骤A1-A3:
A1:获取预先设置的算子映射关系;算子映射关系包括子时间短语与对应的时间算子之间的映射关系,以及子时间短语与对应的偏移方向算子之间的映射关系;时间算子为时间设置算子或时间偏移算子,时间设置算子由时间设置标识和时间单位组成,时间偏移算子由时间偏移标识和时间单位组成;偏移方向算子为时间向前的偏移方向算子或时间向后的偏移方向算子;当子时间短语对应的时间算子为时间设置算子时,子时间短语对应的偏移方向算子为空。
例如,子时间短语为“两天后”,对应的时间算子为shiftDay,对应的偏移方向算子为shiftAfter。子时间短语为“下午”,对应的时间算子为setPeriodOfDay,对应的偏移方向算子为空。子时间短语为“三点半”,对应的时间算子为setHour,对应的偏移方向算子为空。
由此,可建立子时间短语与对应的时间算子之间的映射关系,以及子时间短语与对应的偏移方向算子之间的映射关系。其余子时间短语的映射关系类似,这里不再赘述。
可以理解的是,当算子映射关系的数量越多时,枚举越充分,后续便可能够确定准确的时间短语对应的多算子分类结果。
A2:根据算子映射关系,查找时间短语中的子时间短语对应的目标算子;目标算子包括目标时间算子和目标时间算子对应的目标偏移方向算子。
当算子映射关系预先设置完成后,若需获取时间短语对应的多算子分类结果,则可先根据算子映射关系,查找时间短语中的子时间短语对应的目标算子。
例如,如图3所示,时间短语为“两天后下午三点半”,包括的子时间短语为“两天后”、“下午”和“三点半”,则可根据算子映射关系,查找“两天后”对应的目标时间算子为shiftDay、目标偏移方向算子为shiftAfter,查找“下午”对应的目标时间算子为setPeriodOfDay、目标偏移方向算子为空,以及查找“三点半”对应的目标时间算子为setHour、目标偏移方向算子为空。
A3:将时间短语中的各个子时间短语分别对应的目标算子,确定为时间短语对应的多算子分类结果。
进而,组合各个子时间短语分别对应的目标算子,得到时间短语对应的多算子分类结果。例如,如图3所示,时间短语“两天后下午三点半”对应的多算子分类结果包括shiftDay、setPeriodOfDay、setHour、shiftAfter。
基于上述A1-A3的相关内容可知,本申请实施例提供了一种构建算子映射关系并使用算子映射关系来获取时间短语对应的多算子分类结果的方式,该方式的准确性较高。
S203:获取时间短语对应的实体识别结果;实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。
另外,在获取时间短语表示的标准时间信息的过程中,还需获取时间短语对应的实体识别结果。在本申请实施例中,实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。时间实体可理解为子时间短语中的时间单位相关的时间,不包括时间偏移信息。例如,时间短语“两天后下午三点半”,其包括的子时间短语为“两天后”、“下午”和“三点半”,时间单位相关的时间分别为“两天”、“下午”和“三点半”,时间实体为“两天”、“下午”和“三点半”。
以下将先描述如何获取时间短语对应的实体识别结果。
在一种可能的实现方式中,本申请实施例提供了一种获取时间短语对应的实体识别结果的具体实施方式,包括:
将时间短语输入第一实体识别模型中,获取时间短语对应的序列标注结果;
对序列标注结果进行处理,获得时间短语对应的实体识别结果;
其中,第一实体识别模型由预训练模型联合条件随机场CRF网络,以及时间短语序列标注数据集训练得到;时间短语序列标注数据集包括时间短语示例以及时间短语示例对应的序列标注结果。
示例地,第一实体识别模型为由预训练模型联合条件随机场CRF网络所构成的模型。预训练模型示例可为BERT模型,即,第一实体识别模型可为BERT+CRF的实体识别模型。其中,BERT模型为预训练得到的。进而,基于时间短语序列标注数据集对第一实体识别模型进行有监督微调,便可训练出适用于实体识别任务的第一实体识别模型。
具体地,以时间短语示例作为输入,输入到预训练模型中,再将预训练模型的输出结果输入到CRF网络中,获取时间短语示例对应的预测序列标注结果。进而,基于预测序列标注结果和时间短语示例实际对应的序列标注结果构建损失函数并获取对应的损失值,基于损失值对预训练模型和CRF网络中的参数进行微调,直至训练结束。
其中,预训练模型和CRF网络采用的序列标注方式可为BIOES标注,通过序列标注能够获得标注后的字符序列标注结果(简称序列标注结果),字符序列标注结果用于表征每个字符的位置信息。在BIOES标注中,“B”用于表示实体中的起始字,“I”用于表示实体中的中间字,“E”用于表示实体中的结束字,“S”用于表示单字成词的实体,“O”用于表示其他字符。
在本申请实施例中,通过BIOES标注的字符序列标注结果(也可称为字符序列标签)具体可包括以下35种:[B-Year,I-Year,E-Year,B-Month,I-Month,E-Month,B-Day,I-Day,E-Day,B-Hour,I-Hour,E-Hour,B-Quarter,I-Quarter,E-Quarter,B-Minute,I-Minute,E-Minute,B-Second,I-Second,E-Second,B-Weekday,I-Weekday,E-Weekday,B-Holiday,I-Holiday,E-Holiday,B-PeriodOfDay,I-PeriodOfDay,E-PeriodOfDay,S-PeriodOfDay,B-PeriodOfMonth,I-PeriodOfMonth,E-PeriodOfMonth,O]。其中的“Year”、“Month”、“Day”、“Hour”、“Quarter”、“Minute”、“Second”、“Weekday”、“Holiday”、“PeriodOfDay”、“PeriodOfMonth”、“O”分别表示年、月、日、时、刻钟、分、秒、工作日、节假日、天时间段、月时间段、其他。“B-Year”表示词语中“年”相关的字符为起始字,“I-Year”表示词语中“年”相关的字符为中间字,“E-Year”表示词语中“年”相关的字符为结束字,其余类似,这里不再赘述。
可以理解的是,预训练模型和CRF网络采用的序列标注方式还可为“BEMSO”标注方式,这里不进行限定。下面基于表3提供一些时间短语示例对应的BIOES序列标注结果。
表3 BIOES序列标注示例
。
以时间短语示例“两天后下午三点半”为例,其对应的序列标注结果为“B-Day、E-Day、O、B-PeriodOfDay、E-PeriodOfDay、B-Hour、I-Hour、E-Hour”。基于此可知,“两”、“天”、“后”分别为实体的起始字、结束字和其他字符,“下”、“午”分别为实体的起始字和结束字,“三”、“点”、“半”分别为实体的起始字、中间字和结束字。
在基于时间短语序列标注数据集训练第一实体识别模型结束后,便可应用第一实体识别模型。具体地,将待识别的时间短语输入第一实体识别模型中,获取时间短语对应的序列标注结果。进而,对序列标注结果进行处理,获得时间短语对应的实体识别结果。
其中,“对序列标注结果进行处理,获得时间短语对应的实体识别结果”可包括如下步骤:按照时间短语中字符出现的顺序,从前往后依次将序列标注结果中的起始字B、结束字E以及起始字B和结束字E之间的字符识别为一个时间实体。
例如,将“两天”、“下午”以及“三点半”均识别为一个时间实体。进一步,获取每个时间实体对应的时间单位,将一个时间实体以及该时间实体对应的时间单位进行JSON格式表示,获取JSON表示结果。由各个JSON表示结果组成时间短语对应的实体识别结果。
例如,将实体识别结果表示为如下的JSON格式,其中,每个s_i表示所提取出的时间实体,i为正整数:
{
"Year": "s_1",
"Month": "s_2",
"Day": "s_3",
"Hour": "s_4",
"Quarter": "s_5",
"Minute": "s_6",
"Second": "s_7",
"Weekday": "s_8",
"Holiday": "s_9",
"PeriodOfDay": "s_10",
"PeriodOfMonth": "s_11"
}
其中,“Year”表示时间单位为年,“Month”表示时间单位为月,“Day”表示时间单位为日,"Hour"表示时间单位为“小时”,其余类似,不再详细赘述。
例如,如图3所示,时间短语为“两天后下午三点半”,基于第一实体识别模型提取到的实体识别结果为:{"Day":"两天","Hour":"三点半","PeriodOfDay":"下午"}。其中,“两天”、"三点半"、"下午"为时间实体,“Day”、“Hour”和“PeriodOfDay”为时间实体对应的时间单位。
需要说明的是,本申请实施例不限定S202和S203的执行步骤,示例地,可先执行步骤S203,再执行步骤S202;可先执行步骤S202,再执行步骤S203;还可同时执行步骤S202和S203。
S204:结合时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及时间实体对应的时间单位,构建各个子时间短语分别对应的时间结构化表示,将各个子时间短语分别对应的时间结构化表示进行组合,获得时间短语对应的时间组合算子。
在获取时间短语对应的多算子分类结果以及实体识别结果后,便可结合多算子分类结果和实体识别结果,获取时间短语对应的时间组合算子。具体地,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子(目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况),实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。
可知,基于多算子分类结果仅能够获知时间单位的时间设置情况和时间偏移情况,基于实体识别结果仅能够获知时间实体以及对应的时间单位。如此,可结合多算子分类结果和实体识别结果,获得时间短语中的完整的时间信息。
具体地,多算子分类结果和实体识别结果中的每个子时间短语均涉及到了时间单位。基于此,可基于相同时间单位,将子时间短语中的该时间单位涉及的目标算子和时间实体进行结合,获得相应的时间结构化表示。可以理解的是,这里不限定该时间结构化表示,可根据实际情况进行设置,例如为JSON结构化表示。时间结构化表示中包括了子时间短语中的表示时间单位的时间设置情况和时间偏移情况的目标算子,还包括了子时间短语中的时间实体以及时间实体对应的时间单位。时间结构化表示能够较为精准地表达子时间短语中的时间信息。
进而,对各个子时间短语分别对应的时间结构化表示进行组合,便可获得时间短语对应的时间组合算子。时间组合算子能够较为精准地表达时间短语中的完整的时间信息。
在一种可能的实现方式中,本申请实施例提供了一种S204的具体实施方式,包括B1-B4:
B1:为多算子分类结果中的目标时间算子构建对应的JSON对象,在JSON对象中增加动作字段,并设置动作字段的字段值为目标时间算子。
为便于表述,将多算子分类结果记为:,每个/>属于表1所示的21种时间算子或表示时间偏移方向的两种偏移方向算子(shiftAfter和shiftBefore)。其中,/>为1到/>的正整数,/>为正整数。
具体地,提取多算子分类结果中属于表1所示的21种时间算子的结果,即目标时间算子,记为/>。/>中除目标时间算子以外的算子为目标偏移方向算子。遍历所提取的每个目标时间算子/>,为每个目标时间算子构建一个JSON对象,在JSON对象中增加动作字段(记为“action”字段),并将动作字段的字段值设为该目标时间算子/>。其中,/>为1到的正整数,为正整数。
B2:当目标时间算子属于时间偏移算子时,在JSON对象中增加偏移方向字段,并设置偏移方向字段的字段值为目标时间算子对应的目标偏移方向算子。
另外,当目标时间算子属于时间偏移算子(即表1中以“shift”起始的时间算子)时,还会在JSON对象中增加偏移方向字段,可记为“shiftDirection”字段。并且,根据多算子分类结果/>确定目标时间算子对应的目标偏移方向算子。进而,将该目标偏移方向算子确定为偏移方向字段的字段值。其中,目标偏移方向算子可能为shiftAfter或shiftBefore,根据目标时间算子确定。
B3:提取目标时间算子中的时间单位,将目标时间算子中的时间单位作为字段添加到JSON对象中,并根据目标时间算子中的时间单位确定对应的目标实体识别结果,将目标实体识别结果中的时间单位对应的时间实体的实体值作为对应的字段值。
提取目标时间算子中的时间单位,即,提取时间算子中的除“set”和“shift”时间后缀,该时间后缀即为时间单位。例如,时间算子为“shiftDay”,其中的时间单位为“Day”。进而,将目标时间算子中的时间单位作为字段添加到JSON对象中,并添加对应的字段值。该字段值即实体识别结果中该时间单位对应的时间实体的实体值。实体值可以理解为数字。
下面通过具体示例进行详细说明:
例如:时间短语“两天后下午三点半”的多算子分类结果为:[shiftDay,setPeriodOfDay,setHour,setMinute,shiftAfter]。其中,目标时间算子为[shiftDay,setPeriodOfDay,setHour,setMinute]中的每一个,目标偏移方向算子为shiftAfter。时间短语“两天后下午三点半”的实体识别结果为:{"Day":"两天","Hour":"三点半","PeriodOfDay":"下午"}。
针对目标时间算子shiftDay,构建其JSON对象,在其JSON对象中增加“action”字段,“action”字段的字段值即为shiftDay。由于该目标时间算子具体属于时间偏移算子,存在设置时间偏移的情况,因此在JSON对象中增加“shiftDirection”字段,并将其字段值设为对应的目标偏移方向算子“shiftAfter”。进而,提取shiftDay中的时间后缀Day,Day即时间单位,在JSON对象中增加“Day”字段。再获取“Day”字段对应的目标实体识别结果为:"Day":"两天"。可知,其中“Day”对应的时间实体为“两天”,该时间实体的实体值即时间实体转换为的数字“2”。将“2”确定为“Day”字段的字段值。由此,得到的目标时间算子shiftDay的JSON对象为:
{
"action": "shiftDay",
"shiftDirection": "shiftAfter",
"Day": 2
}。
针对目标时间算子setPeriodOfDay,构建其JSON对象,在其JSON对象中增加“action”字段,“action”字段的字段值即为setPeriodOfDay。由于该目标时间算子不属于时间偏移算子,则无需添加“shiftDirection”字段。由于setPeriodOfDay的时间后缀为PeriodOfDay,PeriodOfDay即时间单位,在JSON对象中增加“PeriodOfDay”字段。再获取“PeriodOfDay”字段对应的目标实体识别结果为:"PeriodOfDay":"下午"。可知,其中“PeriodOfDay”对应的时间实体为“下午”,该时间实体的实体值也为“下午”。由此,得到的目标时间算子setPeriodOfDay的JSON对象为:
{
"action": "setPeriodOfDay",
"PeriodOfDay": "下午"
}。
针对目标时间算子setHour,构建其JSON对象,在其JSON对象中增加“action”字段,“action”字段的字段值即为setHour。由于该目标时间算子不属于时间偏移算子,则无需添加“shiftDirection”字段。由于setHour的时间后缀为Hour,Hour即时间单位,在JSON对象中增加“Hour”字段。再获取“Hour”字段对应的目标实体识别结果为:"Hour":"三点半"。可知,其中“Hour”字段对应的时间实体为“三点半”,该时间实体的实体值为“3:30”。将“3:30”确定为“Hour”字段的字段值。由此,得到的目标时间算子setHour的JSON对象为:
{
"action": "setHour",
"Hour": "3:30"
}。
B4:将各个目标时间算子分别对应的JSON对象进行组合,构建时间短语对应的时间组合算子。
在获得每个目标时间算子分别对应的JSON对象后,对各个JSON对象进行组合,构建时间短语对应的时间组合算子。
例如,结合图3,时间短语为“两天后下午三点半”的时间组合算子为:
[
{
"action": "shiftDay",
"shiftDirection": "shiftAfter",
"Day": 2
},
{
"action": "setPeriodOfDay",
"PeriodOfDay": "下午"
},
{
"action": "setHour",
"Hour": "3:30"
}
]
基于B1-B4可知,实现了将多算子分类结果和实体识别结果的结合,JSON对象中包括了时间短语中的完整的时间信息。
S205:根据当前时间以及时间组合算子,确定时间短语对应的标准时间信息。
在获得时间短语对应的时间组合算子后,根据当前时间和时间组合算子,推断时间短语对应的标准时间信息。
在一种可能的实现方式中,本申请实施例提供了一种根据当前时间以及时间组合算子,确定时间短语对应的标准时间信息的具体实施方式,包括步骤C1-C2:
C1:按照标准时间格式对当前时间进行转换,获得当前标准时间;标准时间格式包括时间字段、日期字段、时间字段对应的字段值以及日期字段对应的字段值;时间字段包括小时、分钟和秒;日期字段包括年、月和日;时间字段和日期字段均属于时间单位。
示例地,时间字段还可包括天时间段,日期字段还可包括节假日、工作日、月时间段。应理解,上述仅为示例,本申请实施例不限定时间字段和日期字段,可根据实际情况进行设置。
标准时间格式的表示如下所示,即需要包括时间字段timeBean(包括小时hour、分钟minute、秒second、天时间段periodOfDay)和日期字段dateBean(包括年year、月month、日day、节假日holiday、工作日weekdays、月时间段periodOfMonth),以及每个字段对应的字段值。其中,天时间段periodOfDay、节假日holiday、工作日weekdays、月时间段periodOfMonth为非必选项。
例如,当前时间为"2023-11-18 10:00:00",先将当前时间转为标准时间格式,获取当前标准时间。当前标准时间stdDateTime表示为:
{
"stdDateTime": {
"timeBean": {
"hour": 10,
"minute": 00,
"second": 0
},
"dateBean": {
"month": 11,
"year": 2023,
"day": 18
}
}
}
C2:基于时间组合算子,对当前标准时间执行修改操作,获取时间短语对应的标准时间信息。
时间组合算子中的时间字段、日期字段均属于时间单位。基于此,在一种可能的实现方式中,本申请实施例提供了一种C2的具体实施方式,包括C21-C24:
C21:遍历时间组合算子中的目标时间算子。
例如,时间短语为“两天后下午三点半”,时间组合算子中的目标时间算子包括shiftDay、setPeriodOfDay和setHour。基于此,遍历三个目标时间算子。
C22:针对遍历到的目标时间算子,获取目标时间算子中的目标时间单位,并确定当前标准时间中的与目标时间单位对应的目标字段。
针对遍历到的目标时间算子,执行步骤C22-C23。
例如,若遍历到目标时间算子shiftDay,获取目标时间算子中的目标时间单位“Day”,并确定当前标准时间中的与目标时间单位“Day”对应的目标字段为日期字段“day”。
若遍历到目标时间算子setPeriodOfDay,获取目标时间算子中的目标时间单位“PeriodOfDay”,确定当前标准时间中的与目标时间单位“PeriodOfDay”对应的目标字段为空。
若遍历到目标时间算子setHour,获取目标时间算子中的目标时间单位“Hour”,确定当前标准时间中的与目标时间单位“Hour”对应的目标字段为时间字段“hour”和“minute”。
C23:根据目标时间算子对应的目标偏移方向算子以及目标时间单位对应的时间实体的实体值,对目标字段的字段值进行修改。
例如,目标时间算子shiftDay对应的目标偏移方向算子为“shiftAfter”,表示天数向后偏移,目标时间单位“Day”对应的时间实体的实体值为“2”。则在日期字段“day”上进行修改,修改内容为在目标字段的字段值的基础上增加2天,则获得"day":20。可以理解的是,对于shiftBefore的情况即为减少相应的天数。
例如,目标时间算子setPeriodOfDay对应的目标偏移方向算子为空,目标时间单位“PeriodOfDay”对应的时间实体的实体值为“下午”,且由于当前标准时间中的与目标时间单位“PeriodOfDay”对应的目标字段为空,此时还确定有setPeriodOfDay与Hour相关,则可对“下午”进行记录,并在之后对setHour算子的Hour值增加12。
例如,目标时间算子setHour对应的目标偏移方向算子为空。目标时间单位“Hour”对应的时间实体的实体值为“3:30”。则在时间字段“hour”和“minute”上进行修改,修改内容为修改时间为“3:30”,由于需要在Hour值上增加12,则最终的时间为“15:30”,即“hour”为“15”,“minute”为“30”。
C24:遍历完时间组合算子中的目标时间算子后,获取时间短语对应的标准时间信息。
遍历完时间组合算子中的目标时间算子后,对于当前标准时间中没有涉及到的时间字段和日期字段,其字段值保持不变,获取时间短语对应的标准时间信息。
基于以上操作,结合图3,推断“两天后下午三点半”对应的标准时间信息为:
{
"stdDateTime": {
"timeBean": {
"hour": 15,
"minute": 30,
"second": 0
},
"dateBean": {
"month": 11,
"year": 2023,
"day": 20
}
}
}
基于上述S201-S205的相关内容可知,本申请提供了一种自然语言处理中的时间解析方法,用户可提供用于控制家居设备的语音数据,捕捉到该语音数据后,对用户语音数据进行语音识别,获得与用户语音数据匹配的文本数据。进而,提取文本数据中的时间短语,该时间短语包括一个或多个子时间短语。获取时间短语对应的多算子分类结果和实体识别结果。其中,多算子分类结果包括时间短语中的各个子时间短语分别对应的目标算子,目标算子用于表示子时间短语对应的时间单位的时间设置情况和时间偏移情况。实体识别结果包括时间短语中的各个子时间短语中的时间实体以及时间实体对应的时间单位。进一步,结合时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及时间实体对应的时间单位,构建各个子时间短语分别对应的时间结构化表示,将各个子时间短语分别对应的时间结构化表示进行组合,获得时间短语对应的时间组合算子。基于此,根据当前时间以及时间组合算子,推测出时间短语对应的标准时间信息。
基于上述方式,解析时间短语,获得时间短语对应的多算子分类结果和实体识别结果,时间组合算子中不仅包括子时间短语中的时间设置情况和时间偏移情况,还包括该子时间短语中的时间单位和对应的时间实体,则多算子分类结果和实体识别结果能够用于表示时间短语中的丰富且完整的时间信息,用于确定时间短语对应的标准时间信息是较为准确的。
参见图4,图4为本申请实施例提供的另一种自然语言处理中的时间解析方法的流程图。
在一种可能的实现方式中,结合图4,在上述实施例步骤S201提取对用户语音数据进行语音识别得到的文本数据中的时间短语之后,在S202获取时间短语对应的多算子分类结果之前,本申请实施例提供的自然语言处理中的时间解析方法还包括如下步骤S301-S303:
S301:由时间算子集合中的至少一个时间算子构建正则表达式和时间组合算子模板,基于正则表达式和时间组合算子模板编写对应的配置文件,获得由至少一个配置文件构成的配置文件列表。
以时间算子集合中的时间算子“shiftMinute”和“shiftSecond”为例构建正则表达式,正则表达式为“(?<shiftMinute>\\d+)(分钟?)(?<shiftSecond>\\d+)(秒钟?)?([之过]?后)”。除此之外,构建的时间组合算子模板为:
"actions": [
{
"action": "shiftMinute",
"minute": "",
"shiftDirection": "shiftAfter"
},
{
"action": "shiftSecond",
"second": "",
"shiftDirection": "shiftAfter"
}
]。
可知,时间算子模板中包括与时间算子相关的action字段、minute字段、shiftDirection字段等。
基于正则表达式和时间组合算子模板,编写的配置文件为:
"minuteAndSecondShiftRight": {
"regex": [
"(?<shiftMinute>\\d+)(分钟?)(?<shiftSecond>\\d+)(秒钟?)?([之过]?后)"
],
"actions": [
{
"action": "shiftMinute",
"minute": "",
"shiftDirection": "shiftAfter"
},
{
"action": "shiftSecond",
"second": "",
"shiftDirection": "shiftAfter"
}
]
}。
上述仅为一个配置文件的示例,当从时间算子集合中选择的时间算子的数量和内容不同时,构建的正则表达式和时间组合算子模板不同,对应的配置文件不同。
S302:遍历配置文件列表中的配置文件,基于遍历到的配置文件中的正则表达式来匹配时间短语。
在需要对时间短语进行解析时,遍历配置文件列表中的配置文件,基于遍历到的配置文件中的正则表达式来匹配时间短语。若匹配成功,则可将时间短语中的时间实体的实体值添加到时间组合算子模板中的对应位置处,获得该时间短语对应的时间组合算子。
以时间短语“2分10秒之后”为例,能够成功匹配到上述示例中的配置文件,便可将“2分10秒之后”映射到shiftMinute和shiftSecond算子上,并可将时间组合算子模板中的“minute”的字段值添加为2,将“second”的字段值添加为10,获得“2分10秒之后”对应的时间组合算子为:
"actions": [
{
"action": "shiftMinute",
"minute": "2",
"shiftDirection": "shiftAfter"
},
{
"action": "shiftSecond",
"second": "10",
"shiftDirection": "shiftAfter"
}
]。
S303:响应于匹配失败,执行获取时间短语对应的多算子分类结果以及后续步骤。
可以理解的是,若匹配失败,则执行上述实施例中的S202以及后续步骤。
需要说明的是,本申请中涉及的“响应于”用于表示执行操作所依赖的条件或状态,当满足一定的条件或状态时,可执行的一个或多个操作。其中,这些操作可以是实时的,也可以具有一定的延迟。
基于S301-S303的相关内容可知,通过基于正则表达式的配置文件的时间解析方法,只需维护和更新配置文件即可,维护较为方便。
基于上述内容,本申请实施例将时间短句解析为时间组合算子的方式可包括两种,即S301-S302中的基于正则表达式的配置文件的实现方式以及S202-S205中的实现方式。这两种方式可并行实现,或者将两种方式通过配置优先级的逻辑来进行合并。即,考虑到基于正则表达式的配置文件的实现方式的解析准确率较高,但召回率欠佳(特别是当用户语音较为模糊或随意时)。而若S202-S205的实现方式是基于多算子分类模型和第一实体识别模型实现的,则能较好地处理一些长尾情况。因此可优先选择基于正则表达式的配置文件的实现方式,当该方式未成功解析时,再选择S202-S205的实现方式,获得解析的时间组合算子。
可以理解的是,在基于正则表达式的配置文件的实现方式中,通过直接修改配置文件可对时间短语的解析进行快速修复和迭代,维护较为方便。在S202-S205的实现方式中,可基于多算子分类模型和第一实体识别模型,来提升时间短句解析的泛化能力,从而提升时间解析的鲁棒性。
基于上述方法实施例提供的一种自然语言处理中的时间解析方法,本申请实施例还提供了一种自然语言处理中的时间解析装置,下面将结合附图对自然语言处理中的时间解析装置进行说明。
参见图5所示,该图为本申请实施例提供的一种自然语言处理中的时间解析装置的结构示意图。如图5所示,该自然语言处理中的时间解析装置包括:
提取单元501,用于提取对用户语音数据进行语音识别得到的文本数据中的时间短语;所述时间短语包括一个或多个子时间短语;
第一获取单元502,用于获取所述时间短语对应的多算子分类结果;所述多算子分类结果包括所述时间短语中的各个子时间短语分别对应的目标算子,所述目标算子用于表示所述子时间短语对应的时间单位的时间设置情况和时间偏移情况;
第二获取单元503,用于获取所述时间短语对应的实体识别结果;所述实体识别结果包括所述时间短语中的各个子时间短语中的时间实体以及所述时间实体对应的时间单位;
组合单元504,用于结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子;
确定单元505,用于根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息。
在一种可能的实现方式中,所述第一获取单元502,具体用于:
将所述时间短语输入多算子分类模型中,获取所述时间短语对应的多算子分类结果;
其中,所述多算子分类模型由预训练模型以及时间短语分类数据集训练得到;所述时间短语分类数据集包括时间短语示例以及所述时间短语示例对应的多算子分类结果。
在一种可能的实现方式中,所述第二获取单元503,包括:
第一输入子单元,用于将所述时间短语输入第一实体识别模型中,获取所述时间短语对应的序列标注结果;
处理子单元,用于对所述序列标注结果进行处理,获得所述时间短语对应的实体识别结果;
其中,所述第一实体识别模型由预训练模型联合条件随机场网络,以及时间短语序列标注数据集训练得到;所述时间短语序列标注数据集包括时间短语示例以及所述时间短语示例对应的序列标注结果。
在一种可能的实现方式中,所述目标算子包括目标时间算子和所述目标时间算子对应的目标偏移方向算子;所述目标时间算子属于预设的时间算子集合中的时间算子,所述目标偏移方向算子属于预设的偏移方向算子集合中的偏移方向算子;
所述预设的时间算子集合包括时间设置算子和时间偏移算子,所述时间设置算子由时间设置标识和时间单位组成,所述时间偏移算子由时间偏移标识和时间单位组成;所述预设的偏移方向算子集合包括时间偏移向前的偏移方向算子和时间偏移向后的偏移方向算子;
其中,所述时间设置标识用于表示所述时间单位的时间设置情况,所述时间偏移标识和所述偏移方向算子用于表示所述时间单位的时间偏移情况。
在一种可能的实现方式中,所述组合单元504,包括:
构建子单元,用于为所述多算子分类结果中的目标时间算子构建对应的JSON对象,在所述JSON对象中增加动作字段,并设置所述动作字段的字段值为所述目标时间算子;
增加子单元,用于当所述目标时间算子属于时间偏移算子时,在所述JSON对象中增加偏移方向字段,并设置所述偏移方向字段的字段值为所述目标时间算子对应的目标偏移方向算子;
添加子单元,用于提取所述目标时间算子中的时间单位,将所述目标时间算子中的时间单位作为字段添加到所述JSON对象中,并根据所述目标时间算子中的时间单位确定对应的目标实体识别结果,将所述目标实体识别结果中的时间单位对应的时间实体的实体值作为对应的字段值;
组合子单元,用于将各个所述目标时间算子分别对应的JSON对象进行组合,构建所述时间短语对应的时间组合算子。
在一种可能的实现方式中,所述时间设置算子包括以下一项或多项:
时间设置为当前日、时间设置为当前时间、时间设置为期望年份、时间设置为期望月份、时间设置为期望日、时间设置为期望时、时间设置为期望分钟、时间设置为期望刻钟、时间设置为期望秒、时间设置为工作日、时间设置为节假日、时间设置为月时间段、时间设置为天时间段。
在一种可能的实现方式中,所述时间偏移算子包括以下一项或多项:
秒数偏移、刻钟偏移、分钟偏移、小时偏移、天数偏移、周数偏移、月份偏移、年份偏移。
在一种可能的实现方式中,所述装置还包括:
构建单元,用于在所述提取对用户语音数据进行语音识别得到的文本数据中的时间短语之后,所述获取所述时间短语对应的多算子分类结果之前,由时间算子集合中的至少一个时间算子构建正则表达式和时间组合算子模板,基于所述正则表达式和所述时间组合算子模板编写对应的配置文件,获得由至少一个配置文件构成的配置文件列表;
遍历单元,用于遍历所述配置文件列表中的配置文件,基于遍历到的配置文件中的正则表达式来匹配所述时间短语;
执行单元,用于响应于匹配失败,执行所述获取所述时间短语对应的多算子分类结果以及后续步骤。
在一种可能的实现方式中,所述提取单元501,包括:
识别子单元,用于对用户语音数据进行语音识别,获得与所述用户语音数据匹配的文本数据;
第二输入子单元,用于将所述文本数据输入第二实体识别模型中,获取所述文本数据中的时间短语;
其中,所述第二实体识别模型由文本样本数据以及所述文本样本数据中的时间短语标签训练得到。
在一种可能的实现方式中,所述第一获取单元502,包括:
第一获取子单元,用于获取预先设置的算子映射关系;所述算子映射关系包括子时间短语与对应的时间算子之间的映射关系,以及所述子时间短语与对应的偏移方向算子之间的映射关系;所述时间算子为时间设置算子或时间偏移算子,所述时间设置算子由时间设置标识和时间单位组成,所述时间偏移算子由时间偏移标识和时间单位组成;所述偏移方向算子为时间向前的偏移方向算子或时间向后的偏移方向算子;当所述子时间短语对应的时间算子为时间设置算子时,所述子时间短语对应的偏移方向算子为空;
查找子单元,用于根据所述算子映射关系,查找所述时间短语中的子时间短语对应的目标算子;所述目标算子包括目标时间算子和所述目标时间算子对应的目标偏移方向算子;
确定子单元,用于将所述时间短语中的各个子时间短语分别对应的目标算子,确定为所述时间短语对应的多算子分类结果。
在一种可能的实现方式中,所述确定单元505,包括:
转换子单元,用于按照标准时间格式对当前时间进行转换,获得当前标准时间;所述标准时间格式包括时间字段、日期字段、所述时间字段对应的字段值以及所述日期字段对应的字段值;所述时间字段包括小时、分钟和秒;所述日期字段包括年、月和日;所述时间字段和所述日期字段均属于所述时间单位;
第一修改子单元,用于基于所述时间组合算子,对所述当前标准时间执行修改操作,获取所述时间短语对应的标准时间信息。
在一种可能的实现方式中,所述第一修改子单元,包括:
遍历子单元,用于遍历所述时间组合算子中的目标时间算子;
第二获取子单元,用于针对遍历到的目标时间算子,获取所述目标时间算子中的目标时间单位,并确定所述当前标准时间中的与所述目标时间单位对应的目标字段;
第二修改子单元,用于根据所述目标时间算子对应的目标偏移方向算子以及所述目标时间单位对应的时间实体的实体值,对所述目标字段的字段值进行修改;
第三获取子单元,用于遍历完所述时间组合算子中的目标时间算子后,获取所述时间短语对应的标准时间信息。
需要说明的是,本实施例中各个单元的具体实现可以参见上述方法实施例中的相关描述。本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。例如,上述实施例中,处理单元和发送单元可以是同一个单元,也可以是不同的单元。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见系统部分说明即可。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (15)
1.一种自然语言处理中的时间解析方法,其特征在于,所述方法包括:
提取对用户语音数据进行语音识别得到的文本数据中的时间短语;所述时间短语包括一个或多个子时间短语;
获取所述时间短语对应的多算子分类结果;所述多算子分类结果包括所述时间短语中的各个子时间短语分别对应的目标算子,所述目标算子用于表示所述子时间短语对应的时间单位的时间设置情况和时间偏移情况;
获取所述时间短语对应的实体识别结果;所述实体识别结果包括所述时间短语中的各个子时间短语中的时间实体以及所述时间实体对应的时间单位;
结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子;
根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述时间短语对应的多算子分类结果,包括:
将所述时间短语输入多算子分类模型中,获取所述时间短语对应的多算子分类结果;
其中,所述多算子分类模型由预训练模型以及时间短语分类数据集训练得到;所述时间短语分类数据集包括时间短语示例以及所述时间短语示例对应的多算子分类结果。
3.根据权利要求1所述的方法,其特征在于,所述获取所述时间短语对应的实体识别结果,包括:
将所述时间短语输入第一实体识别模型中,获取所述时间短语对应的序列标注结果;
对所述序列标注结果进行处理,获得所述时间短语对应的实体识别结果;
其中,所述第一实体识别模型由预训练模型联合条件随机场网络,以及时间短语序列标注数据集训练得到;所述时间短语序列标注数据集包括时间短语示例以及所述时间短语示例对应的序列标注结果。
4.根据权利要求1所述的方法,其特征在于,所述目标算子包括目标时间算子和所述目标时间算子对应的目标偏移方向算子;所述目标时间算子属于预设的时间算子集合中的时间算子,所述目标偏移方向算子属于预设的偏移方向算子集合中的偏移方向算子;
所述预设的时间算子集合包括时间设置算子和时间偏移算子,所述时间设置算子由时间设置标识和时间单位组成,所述时间偏移算子由时间偏移标识和时间单位组成;所述预设的偏移方向算子集合包括时间偏移向前的偏移方向算子和时间偏移向后的偏移方向算子;
其中,所述时间设置标识用于表示所述时间单位的时间设置情况,所述时间偏移标识和所述偏移方向算子用于表示所述时间单位的时间偏移情况。
5.根据权利要求4所述的方法,其特征在于,所述结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子,包括:
为所述多算子分类结果中的目标时间算子构建对应的JSON对象,在所述JSON对象中增加动作字段,并设置所述动作字段的字段值为所述目标时间算子;
当所述目标时间算子属于时间偏移算子时,在所述JSON对象中增加偏移方向字段,并设置所述偏移方向字段的字段值为所述目标时间算子对应的目标偏移方向算子;
提取所述目标时间算子中的时间单位,将所述目标时间算子中的时间单位作为字段添加到所述JSON对象中,并根据所述目标时间算子中的时间单位确定对应的目标实体识别结果,将所述目标实体识别结果中的时间单位对应的时间实体的实体值作为对应的字段值;
将各个所述目标时间算子分别对应的JSON对象进行组合,构建所述时间短语对应的时间组合算子。
6.根据权利要求4所述的方法,其特征在于,所述时间设置算子包括以下一项或多项:
时间设置为当前日、时间设置为当前时间、时间设置为期望年份、时间设置为期望月份、时间设置为期望日、时间设置为期望时、时间设置为期望分钟、时间设置为期望刻钟、时间设置为期望秒、时间设置为工作日、时间设置为节假日、时间设置为月时间段、时间设置为天时间段。
7.根据权利要求4所述的方法,其特征在于,所述时间偏移算子包括以下一项或多项:
秒数偏移、刻钟偏移、分钟偏移、小时偏移、天数偏移、周数偏移、月份偏移、年份偏移。
8.根据权利要求1所述的方法,其特征在于,在所述提取对用户语音数据进行语音识别得到的文本数据中的时间短语之后,所述获取所述时间短语对应的多算子分类结果之前,所述方法还包括:
由时间算子集合中的至少一个时间算子构建正则表达式和时间组合算子模板,基于所述正则表达式和所述时间组合算子模板编写对应的配置文件,获得由至少一个配置文件构成的配置文件列表;
遍历所述配置文件列表中的配置文件,基于遍历到的配置文件中的正则表达式来匹配所述时间短语;
响应于匹配失败,执行所述获取所述时间短语对应的多算子分类结果以及后续步骤。
9.根据权利要求1所述的方法,其特征在于,所述提取对用户语音数据进行语音识别得到的文本数据中的时间短语,包括:
对用户语音数据进行语音识别,获得与所述用户语音数据匹配的文本数据;
将所述文本数据输入第二实体识别模型中,获取所述文本数据中的时间短语;
其中,所述第二实体识别模型由文本样本数据以及所述文本样本数据中的时间短语标签训练得到。
10.根据权利要求1所述的方法,其特征在于,所述获取所述时间短语对应的多算子分类结果,包括:
获取预先设置的算子映射关系;所述算子映射关系包括子时间短语与对应的时间算子之间的映射关系,以及所述子时间短语与对应的偏移方向算子之间的映射关系;所述时间算子为时间设置算子或时间偏移算子,所述时间设置算子由时间设置标识和时间单位组成,所述时间偏移算子由时间偏移标识和时间单位组成;所述偏移方向算子为时间向前的偏移方向算子或时间向后的偏移方向算子;当所述子时间短语对应的时间算子为时间设置算子时,所述子时间短语对应的偏移方向算子为空;
根据所述算子映射关系,查找所述时间短语中的子时间短语对应的目标算子;所述目标算子包括目标时间算子和所述目标时间算子对应的目标偏移方向算子;
将所述时间短语中的各个子时间短语分别对应的目标算子,确定为所述时间短语对应的多算子分类结果。
11.根据权利要求1所述的方法,其特征在于,所述根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息,包括:
按照标准时间格式对当前时间进行转换,获得当前标准时间;所述标准时间格式包括时间字段、日期字段、所述时间字段对应的字段值以及所述日期字段对应的字段值;所述时间字段包括小时、分钟和秒;所述日期字段包括年、月和日;所述时间字段和所述日期字段均属于时间单位;
基于所述时间组合算子,对所述当前标准时间执行修改操作,获取所述时间短语对应的标准时间信息。
12.根据权利要求11所述的方法,其特征在于,所述基于所述时间组合算子,对所述当前标准时间执行修改操作,获取所述时间短语对应的标准时间信息,包括:
遍历所述时间组合算子中的目标时间算子;
针对遍历到的目标时间算子,获取所述目标时间算子中的目标时间单位,并确定所述当前标准时间中的与所述目标时间单位对应的目标字段;
根据所述目标时间算子对应的目标偏移方向算子以及所述目标时间单位对应的时间实体的实体值,对所述目标字段的字段值进行修改;
遍历完所述时间组合算子中的目标时间算子后,获取所述时间短语对应的标准时间信息。
13.一种自然语言处理中的时间解析装置,其特征在于,所述装置包括:
提取单元,用于提取对用户语音数据进行语音识别得到的文本数据中的时间短语;所述时间短语包括一个或多个子时间短语;
第一获取单元,用于获取所述时间短语对应的多算子分类结果;所述多算子分类结果包括所述时间短语中的各个子时间短语分别对应的目标算子,所述目标算子用于表示所述子时间短语对应的时间单位的时间设置情况和时间偏移情况;
第二获取单元,用于获取所述时间短语对应的实体识别结果;所述实体识别结果包括所述时间短语中的各个子时间短语中的时间实体以及所述时间实体对应的时间单位;
组合单元,用于结合所述时间短语中的各个子时间短语分别对应的目标算子、各个子时间短语中的时间实体以及所述时间实体对应的时间单位,构建各个所述子时间短语分别对应的时间结构化表示,将各个所述子时间短语分别对应的时间结构化表示进行组合,获得所述时间短语对应的时间组合算子;
确定单元,用于根据当前时间以及所述时间组合算子,确定所述时间短语对应的标准时间信息。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的自然语言处理中的时间解析方法。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-12中任一所述的自然语言处理中的时间解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410172095.9A CN117725908B (zh) | 2024-02-07 | 2024-02-07 | 一种自然语言处理中的时间解析方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410172095.9A CN117725908B (zh) | 2024-02-07 | 2024-02-07 | 一种自然语言处理中的时间解析方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725908A true CN117725908A (zh) | 2024-03-19 |
CN117725908B CN117725908B (zh) | 2024-05-24 |
Family
ID=90210981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410172095.9A Active CN117725908B (zh) | 2024-02-07 | 2024-02-07 | 一种自然语言处理中的时间解析方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725908B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106409295A (zh) * | 2015-07-31 | 2017-02-15 | 腾讯科技(深圳)有限公司 | 从自然语音信息中识别时间信息的方法和装置 |
CN108920500A (zh) * | 2018-05-24 | 2018-11-30 | 众安信息技术服务有限公司 | 一种时间解析方法 |
CN114861678A (zh) * | 2022-03-30 | 2022-08-05 | 青岛海尔科技有限公司 | 时间信息的确定方法和装置、存储介质及电子装置 |
CN115410560A (zh) * | 2022-08-29 | 2022-11-29 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、存储介质及设备 |
WO2023142914A1 (zh) * | 2022-01-29 | 2023-08-03 | 北京有竹居网络技术有限公司 | 日期识别方法、装置、可读介质及电子设备 |
CN117391095A (zh) * | 2023-10-31 | 2024-01-12 | 鼎道智联(北京)科技有限公司 | 一种自然语言解析方法、装置、电子设备及存储介质 |
-
2024
- 2024-02-07 CN CN202410172095.9A patent/CN117725908B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106409295A (zh) * | 2015-07-31 | 2017-02-15 | 腾讯科技(深圳)有限公司 | 从自然语音信息中识别时间信息的方法和装置 |
CN108920500A (zh) * | 2018-05-24 | 2018-11-30 | 众安信息技术服务有限公司 | 一种时间解析方法 |
WO2023142914A1 (zh) * | 2022-01-29 | 2023-08-03 | 北京有竹居网络技术有限公司 | 日期识别方法、装置、可读介质及电子设备 |
CN114861678A (zh) * | 2022-03-30 | 2022-08-05 | 青岛海尔科技有限公司 | 时间信息的确定方法和装置、存储介质及电子装置 |
CN115410560A (zh) * | 2022-08-29 | 2022-11-29 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、存储介质及设备 |
CN117391095A (zh) * | 2023-10-31 | 2024-01-12 | 鼎道智联(北京)科技有限公司 | 一种自然语言解析方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
贾圣宾;向阳;: "面向智能服务系统的时间语义理解", 计算机应用, no. 03, 10 March 2018 (2018-03-10) * |
Also Published As
Publication number | Publication date |
---|---|
CN117725908B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108345692B (zh) | 一种自动问答方法和系统 | |
CN105261366B (zh) | 语音识别方法、语音引擎及终端 | |
JP6667931B2 (ja) | 音声情報から時間情報を認識するための方法およびデバイス | |
US20210125600A1 (en) | Voice question and answer method and device, computer readable storage medium and electronic device | |
CN108737324B (zh) | 生成人工智能服务组件的方法、装置及相关设备、系统 | |
CN103488655B (zh) | 复合模型数据处理方法及系统 | |
CN114911535B (zh) | 应用程序组件配置方法、存储介质及电子装置 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
CN111444677A (zh) | 基于大数据的阅读模型优化方法、装置、设备及介质 | |
Diyan et al. | Intelligent Internet of Things gateway supporting heterogeneous energy data management and processing | |
Bugeja et al. | Functional classification and quantitative analysis of smart connected home devices | |
CN105550361B (zh) | 日志处理方法及装置和问答信息处理方法及装置 | |
Windiatmoko et al. | Developing FB chatbot based on deep learning using RASA framework for university enquiries | |
CN113596270A (zh) | 基于智能语音客服的外呼策略配置方法、装置及设备 | |
CN101916283B (zh) | 由动态网页上获取链接信息的方法及其服务器 | |
CN117725908B (zh) | 一种自然语言处理中的时间解析方法、装置及设备 | |
CN117149140B (zh) | 一种用于编码的架构信息生成方法、装置及相关设备 | |
CN114490679A (zh) | 一种基于标识解析的数据治理方法、装置、设备及介质 | |
CN116910567B (zh) | 推荐业务的在线训练样本构建方法及相关装置 | |
CN116913274A (zh) | 基于生成式大模型的场景生成方法、装置和存储介质 | |
CN111046145A (zh) | 交互意图路径的挖掘方法以及装置 | |
CN115599260A (zh) | 智能场景的生成方法、装置、系统、存储介质及电子装置 | |
WO2023173596A1 (zh) | 语句文本的意图识别方法和装置、存储介质及电子装置 | |
CN110908642A (zh) | 一种策略生成执行方法和装置 | |
CN113792211A (zh) | 一种资源推送处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |