CN117196035A - 回复内容的处理方法、装置、电子设备及存储介质 - Google Patents
回复内容的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117196035A CN117196035A CN202311120150.1A CN202311120150A CN117196035A CN 117196035 A CN117196035 A CN 117196035A CN 202311120150 A CN202311120150 A CN 202311120150A CN 117196035 A CN117196035 A CN 117196035A
- Authority
- CN
- China
- Prior art keywords
- text
- category
- directed acyclic
- acyclic graph
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 34
- 230000006870 function Effects 0.000 claims description 131
- 238000012549 training Methods 0.000 claims description 124
- 238000012545 processing Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 38
- 238000013519 translation Methods 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 19
- 230000004048 modification Effects 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013145 classification model Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 4
- 125000002015 acyclic group Chemical group 0.000 claims description 2
- 230000010365 information processing Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 9
- 239000008186 active pharmaceutical agent Substances 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本公开涉及信息处理技术领域,尤其涉及一种回复内容的处理方法、装置、电子设备及存储介质,所述处理方法包括:获取初始识别文本;获取所述初始识别文本的对应的第一有向无环图;获取待识别文本;根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图。本公开实施例提供的处理方法可实现对于不同时段接收的识别文本的调整,有利于实现回复内容的互相关联。此外,用户的历史意图也被第一有向无环图表征,可实现信息的溯源。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种回复内容的处理方法、装置、电子设备及存储介质。
背景技术
任务型对话系统可根据用户提出的任务,生成合适的回复内容以完成该任务。任务型对话系统通常包括四个模块:自然语言理解模块(或称NLU模块,全称为NaturalLanguage Understanding)、对话管理(或称DM模块,全称为Dialogue Management)和自然语言生成模块(或称NLG模块,全称为Natural Language Generation),通过以上模块的依次调用即可生成回复内容。任务型对话系统被广泛应用于人机交互场景中。故如何更好地构建任务型对话系统,使其更好地生成回复内容,是开发人员亟需解决的技术问题。
发明内容
本公开提出了一种回复内容的处理技术方案。
根据本公开的一方面,提供了一种回复内容的处理方法,所述处理方法包括:获取初始识别文本;其中,所述初始识别文本表示初始回复请求;获取所述初始识别文本的对应的第一有向无环图;其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成;获取待识别文本;其中,所述待识别文本表示当前回复请求的回复内容,所述初始回复请求与当前回复请求不同;根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图;其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
在一种可能的实施方式中,所述关联类别为未设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:将所述关联类别与第一有向无环图中的每个节点进行匹配;在任一节点匹配成功、且确定所述待识别文本对应的操作为引用操作的情况下,将匹配成功的节点对应的属性值,作为所述关联类别对应的属性值;其中,所述引用操作表示所述待识别文本对所述初始识别文本进行引用;根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图。
在一种可能的实施方式中,所述根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图,包括:根据所述第一代码序列中的每个类别、每个函数,生成每个类别对应的节点、每个函数对应的节点;根据所述关联类别对应的属性值,更新所述关联类别对应的节点;根据所述第一代码序列中类别与函数、函数与函数、类别与类别之间的逻辑处理顺序,将对应的节点进行有向连接,作为第二有向无环图;其中,所述有向无环图中节点之间的连线对应有节点之间传递的输入参数。
在一种可能的实施方式中,所述关联类别为已设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:将所述关联类别与第一有向无环图中的每个节点进行匹配;在所述关联类别与任一节点匹配成功、且确定所述待识别文本对应的操作为修改操作的情况下,复制第一有向无环图;其中,所述修改操作表示所述待识别文本对所述初始识别文本进行修改;将复制后的第一有向无环图中的目标节点对应的属性值设定为所述关联类别对应的属性值后,作为第二有向无环图。
在一种可能的实施方式中,所述关联类别为初始识别文本对应的代码序列中存在的类别,所述处理方法还包括以下任意一项:将待识别文本中与预设字段相同的文本,作为关联类别、将待识别文本输入至关联类别检测模型中,将输出的字段作为关联类别。
在一种可能的实施方式中,所述将所述关联类别与第一有向无环图中的每个节点进行匹配,包括:通过预设操作符,对所述关联类别与每个节点进行比对,在关联类别与目标节点为同一个类别的情况下,将目标节点作为匹配成功的节点。
在一种可能的实施方式中,所述确定所述待识别文本对应的操作,包括:将所述待识别文本及初始识别文本输入至训练后的分类模型中,得到所述待识别文本对应的操作标识;其中,所述训练后的分类模型通过训练文本及其之前的文本、训练文本对应的操作标识训练得到;所述操作标识为以下任意一项:为引用操作、为修改操作、不为引用操作、不为修改操作、不为引用操作以及修改操作;根据所述待识别文本对应的操作标识,确定所述待识别文本对应的操作。
在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的第一代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别。
在一种可能的实施方式中,所述处理方法还包括:针对所述第一代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;依次执行所述第一代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
在一种可能的实施方式中,所述处理方法还包括:根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列;其中,所述训练后的第二生成模型通过训练文本、所述训练文本对应的训练代码序列训练得到,或通过训练文本、所述训练文本对应的训练转译文本得到;所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。
在一种可能的实施方式中,所述处理方法还包括:将所述待识别文本及初始识别文本输入至训练后的第一生成模型中,得到所述待识别文本对应的第二代码序列;其中,所述训练后的第一生成模型通过训练文本及其之前的文本、基于其之前的文本进行更新后的训练文本对应的代码序列训练得到;所述更新包括以下至少一项:针对训练文本之前的文本进行引用操作的文本更新、针对训练文本之前的文本进行修改操作的文本更新;根据所述第二代码序列,生成第二有向无环图。
根据本公开的一方面,提供了一种回复内容的处理装置,所述处理装置包括:初始识别文本获取模块,用以获取初始识别文本;其中,所述初始识别文本表示初始回复请求;图获取模块,用以获取所述初始识别文本的对应的第一有向无环图;其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成;待识别获取模块,用以获取待识别文本;其中,所述待识别文本表示当前回复请求的回复内容,所述初始回复请求与当前回复请求不同;第二有向无环图生成模块,用以根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图;其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
在本公开实施例中,可获取初始识别文本,而后获取所述初始识别文本的对应的第一有向无环图,再获取待识别文本,最终根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图。本公开实施例提供的处理方法可实现对于不同时段接收的识别文本的调整,有利于实现回复内容的互相关联。此外,用户的历史意图也被第一有向无环图表征,可实现信息的溯源。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出了根据本公开实施例提供的一种回复内容的处理方法。
图2示出了根据本公开实施例提供的一种回复内容的处理装置的框图。
图3示出了根据本公开实施例提供的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
参阅图1所示,图1示出了根据本公开实施例提供的一种回复内容的处理方法,所述处理方法包括:
步骤S100,获取初始识别文本。其中,所述初始识别文本表示初始回复请求。其中,所述初始识别文本通过待识别语音转换或电子设备接收得到,用于表示初始回复请求。在一个示例中,初始识别文本可由用户手动输入。在另一个示例中,步骤S100可包括:获取初始识别语音。而后将所述初始识别语音转换为初始识别文本。本公开实施例可支持文本输入、语音输入的应用场景。上述初始识别文本可通过用户在显示界面中文本框内的输入予以获取。上述初始识别语音可通过相关技术中电子设备的语音采集装置予以获取,初始识别语音可通过相关技术中的识别模型、识别算法转换为初始识别文本即可,本公开实施例在此不做赘述。
步骤S200,获取所述初始识别文本的对应的第一有向无环图。其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成。代码序列为通过代码元素表示所述回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种。其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种。在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息。所述待识别文本对应的代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别。其中,不同的词组中相同的实体信息对应的类别相同,不同的待识别文本的词组对应的函数相同或不同。例如:词组1可为“新建会议”,词组2可为“更改会议”,则“会议”对应的类别可相同,此外,不同的待识别文本也可复用相同的函数,以实现通过少量的代码元素实现大量文本信息的长尾表示。在一个示例中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。示例性地,本文所述的代码序列可包括类别(或称为类)、函数、操作符。其中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束,或者说,操作符使类别有了具体内容(例如属性值),成为实例。示例性地,上述类别可表现为person(人类)类别、datetime(日期时间)类别、event(事件)类别等,对应了文本中可能出现的实体信息的种类,例如:person类别的属性可包括:姓、名、联系电话、邮箱等,通过操作符对每个属性赋值的方式可以得到一个具体的person实例,例如:姓:李、名:二、联系电话:11111、邮箱11.com可作为一个具体的person实例,相当于文本中的实体信息。而函数可表现为对各种类别进行的不同操作,例如:可对某个person实例打电话(例如:通过访问“李二”这个person实例的方式得到“李二”的联系电话11111,而后调用电子设备的通话相关的API,实现对11111的拨号呼叫,其中,API全称为Application Programming Interface,即应用程序编程接口)、获取某个person实例的信息、获取某个datatime实例的年份等。具体可由开发人员视实际情况,进行设定,应当理解的是,函数之间也可以嵌套,以构成一个复杂的处理逻辑。应当理解的是,上述类别、函数、操作符由开发人员根据不同的应用场景预先设定得到,具体的构成可由开发人员予以确定。此处以个人日程管理为例,在该应用场景下,类别可包括:Event类别,用以表示一个日程,属性可包括开始时间、结束时间、持续时间、地点、会议主题等。Person类别,用以表示日程的参会人,属性可包括姓名、邮箱、电话等。DateTime类别,用以表示日程的开始时间、日程的结束时间,属性可包括年份、月份、日期、小时、分钟等(Event类别中的开始时间、结束时间可通过DateTime类别予以表示,换言之,类别之间可产生嵌套以实现多层次的数据表示)。Duration(时长)用以表示日程的持续时长,属性可包括将秒作为计量单位的持续时长(Event类别中的持续时间可通过Duration类别予以表示)等。Location类别用以表示日程的地点,属性可包括地点、地点描述等(Event类别中的地点可通过Location类别予以表示)。在该应用场景下,函数可包括:CreateEvent(创建事件)函数,用以创建日程。DeleteEvent(删除事件)函数,用以删除日程。UpdateEvent(更新事件)函数,用以更新日程(针对已创建的日程)。RemindEvent(提醒事件)函数,用以提醒日程。操作符可为针对实例具体参数值的大小判断、实例中属性的类型进行判断等。应当理解的是函数可通过操作符对类别进行处理,实现函数的功能。示例性地,CreateEvent函数可包括Event类别(此处仅做出示例性的表述,每个函数可调用的类别数量由开发人员视实际情况而定),而后通过待识别文本中的限制条件(例如Constraint(限制)[类别]函数,该函数可对类别中属性的属性值进行限制、或对待处理的类别是何种类别进行限制),对Event类别中的属性赋值(例如:通过操作符赋值),以得到一个具体的Event实例。通过将函数、类别、操作符进行组合,即可得到上文所述的代码序列。例如:待识别文本为“今天早上八点开例会”则对应生成的代码序列中Event实例中开始时间这一属性的属性值被限制为“早上八点”、Event实例中会议主题这一属性的属性值被限制为“例会”。应当理解的是每个类别对应的每个属性的属性值不必均有具体数值,若待识别文本中没有该属性的限制描述,则可将该属性的属性值设定为空。换言之,用户在输入待识别文本时,可不必针对每个属性进行描述,即“今天早上八点开例会”可不必描述为“今天早上八点至十点在八楼开持续两个小时的例会”,以符合用户的自然语言习惯,也即用户在实际场景下输入待识别文本时不必关注每个实例具体是如何构成的,以上两种说法的信息量虽然不同,但是均可表现为一段代码序列以被正常执行。再例如:待识别文本为“今天天气热不热”,则其对应的代码序列可包括如下函数:IsHot(是否炎热)函数,该函数通过温度阈值与输入的温度值进行比较,以判断输入的温度值是否属于冷或热的情况,上述温度阈值可由开发人员根据实际情况予以设定。IsHot函数中需输入的温度值通过WeatherQueryApi(天气查询API)函数予以获取。WeatherQueryApi函数,用以调用外部的API输入地点实例、时间实例,输出温度实例(也即上文中的温度值)。WeatherQueryApi函数需输入的地点实例通过AtPlace(获取地点)函数予以获取,时间实例通过Today(今天)函数予以获取。AtPlace函数可获取上文中的地点实例,例如该地点实例可为电子设备当前所在位置。Today函数可获取上文中的时间实例,例如该时间实例可为电子设备的当前时间。函数中调用的地点实例、时间实例即为地点类别、时间类别对应的实例,实例中数值的赋予过程通过操作符予以表示。
所述有向无环图用以表示文本对应的针对回复请求的回复内容。其中,所述关联类别用以表示与初始识别文本具备关联性的类别,所述初始识别文本为所述待识别文本之前的文本。示例性地,上述有向无环图由若干节点通过逻辑处理顺序有向连接构成,每个节点对应一个函数或类别。针对关联类别的具体生成方式,本公开实施例在此不做限制。在一个示例中,所述关联类别为初始识别文本对应的代码序列中存在的类别,所述处理方法还包括以下任意一项:将待识别文本中与预设字段相同的文本,作为关联类别、将待识别文本输入至关联类别检测模型中,将输出的字段作为关联类别。例如可通过规则性的匹配算法,在出现特定文本的情况下,将特定文本作为关联类别,例如出现“那天”、“那个地方”等对前文进行引用的文本(也即后文将述的引用操作),或将特定文本之后出现的文本作为关联类别,例如出现“修改为”等对前文进行修改的文本(也即后文将述的修改操作),将“修改为”之后的文本作为关联类别(如“修改为10点”中的“10点”为关联类别),也可根据模型输出待识别文本中的关联类别(模型输出关联类别的过程,后文将予以详述),本公开实施例在此不做限制。
步骤S300,获取待识别文本。其中,所述待识别文本可通过待识别语音转换或电子设备接收得到,用于表示当前回复请求,所述初始回复请求与当前回复请求不同。在一个示例中,待识别文本可由用户手动输入。在另一个示例中,步骤S300可包括:获取待识别语音。而后将所述待识别语音转换为待识别文本。本公开实施例可支持文本输入、语音输入的应用场景。上述待识别文本可通过用户在显示界面中文本框内的输入予以获取。上述待识别语音可通过相关技术中电子设备的语音采集装置予以获取,待识别语音可通过相关技术中的识别模型、识别算法转换为待识别文本即可,本公开实施例在此不做赘述。
步骤S400,根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图。其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
在一种可能的实施方式中,所述处理方法可包括:根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列。其中,所述训练后的第二生成模型通过训练文本、所述训练文本对应的训练代码序列训练得到。在此情况下,所述根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列可包括:将所述待识别文本输入至训练后的第二生成模型,得到所述待识别文本对应的第一代码序列。示例性地,训练文本对应的训练代码序列通过开发人员进行标注得到,基于此对第二生成模型进行训练,即可得到可将待识别文本转换为代码序列的第二生成模型。应当理解的是,上述第二生成模型的具体模型结构、参数设置等可根据开发人员的实际需求而定,本公开实施例在此不做限制。示例性地,第二生成模型的损失函数也可由开发人员进行设定,例如:可根据训练代码序列与根据训练文本生成的预测第一代码序列之间的差异确定损失值,第二生成模型可将缩小该损失值作为其训练目标,不断调整其模型参数,得到训练后的第二生成模型。上述训练文本可包括若干实际场景下的历史聊天信息,即可实现生活模型针对该若干实际场景下的待识别文本,生成对应的第一代码序列。
在一种可能的实施方式中,所述训练后的第二生成模型通过训练文本、所述训练文本对应的训练转译文本得到。所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。在此情况下,所述根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列可包括:将所述待识别文本输入至训练后的第二生成模型,得到所述待识别文本对应的转译文本。而后根据第一代码序列与转译文本之间预设的对应关系,确定所述转译文本对应的第一代码序列,作为所述待识别文本对应的第一代码序列。所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。例如:训练文本为面向人类的自然语言,训练代码序列为面向机器的模块化语言,训练转译文本为介于二者之间的、面向人类以及面向机器的模块化自然语言,以建立训练文本与第一代码序列之间的关联。示例性地,模块化的自然语言可表现为将第一代码序列中的函数转译为自然语言中的表示,例如上文中的CreateEvent函数对应的训练转译文本为“创建日程”、DeleteEvent函数对应的训练转译文本为“删除日程”。训练转译文本“创建日程”对应的训练文本可为“开会”、“约见”等。示例性地,上述对应关系可由开发人员根据实际情况进行设定,可根据转译文本确定对应的第一代码序列即可,本公开实施例在此不做限制。结合实际场景,函数、类的命名通常由开发人员进行设定,具有一定的主观性,其中不乏英文简写,语义表现能力较差,在此情况下,若第二生成模型直接预测第一代码序列,则训练难度会更高、精度也无法保证,故本公开实施例通过建立训练转译文本与训练代码序列之间的对应关系(该对应关系也可理解为转译文本与第一代码序列之间的对应关系,此外该对应关系可视实际情况予以改变,例如在函数名发生变化后,只需更改该对应关系中原函数名即可重新建立对应关系,而无需对第二生成模型本身进行重新训练,可修改性更强)的方式,以第二生成模型能够预测转译文本为训练目标,对第二生成模型进行训练,不仅可降低训练难度,而且可提高最终生成的第一代码序列的生成精度。
在一种可能的实施方式中,所述关联类别为未设定属性值的类别,步骤S400可包括:将所述关联类别与第一有向无环图中的每个节点进行匹配。在一个示例中,将所述关联类别与第一有向无环图中的每个节点进行匹配,包括:通过预设操作符,对所述关联类别与每个节点进行比对,在关联类别与目标节点为同一个类别的情况下,将目标节点作为匹配成功的节点。上述预设操作符可为相关技术中的“=”或“?=”在任一节点匹配成功、且确定所述待识别文本对应的操作为引用操作的情况下,将匹配成功的节点对应的属性值,作为所述关联类别对应的属性值。其中,所述引用操作表示所述待识别文本对所述初始识别文本进行引用。示例性地,若用户输入的待识别文本为“那天的天气如何”,初始识别文本为“6月2日去开会”,则待识别文本中的关联类别为“那天”。若仅参考待识别文本,则“那天”仅是一个时间类别,而非一个时间实例,即没有具体属性值,换言之,电子设备无法得到“那天”的具体日期(即关联类别未设定属性值,待识别文本对应的操作为引用操作)。在此情况下,可对第一有向无环图进行一个时间类别的节点查询,若查询到一个时间类别对应的节点,则将该节点对应的属性值作为上文中“那天”的属性值。例如:“6月2日去开会”对应的有向无环图中可对应有“6月2日”对应的节点,“去开会”对应的节点,在该示例中“6月2日”即为时间类别对应的节点,则可将“6月2日”作为“那天”。示例性地,上述匹配成功可表现为关联类别与一个节点对应的类别相同或具有对应关系。例如:可通过节点之间的输入参数、和/或节点对应的类别进行匹配。再例如:关联类别为person类别,则可通过搜索第一有向无环图中的节点,直至搜索到一个person类别对应的节点,则视为匹配成功。将搜索到的person类别视为关联类别匹配成功的类别,将搜索到的person类别对应的属性值(可为该person类别对应的person实例的属性值)赋给关联类别,以具象化关联类别,完成待识别文本的引用操作。在另一个示例中,在匹配失败的情况下,可生成提示以告知用户需输入该关联类别的部分或全部属性对应的属性值。最终根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图。
在一种可能的实施方式中,所述根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图,包括:根据所述第一代码序列中的每个类别、每个函数,生成每个类别对应的节点、每个函数对应的节点。根据所述关联类别对应的属性值,更新所述关联类别对应的节点。示例性地,上述更新可表现为将关联类别对应的属性值填入所述关联类别对应的节点。而后根据所述第一代码序列中类别与函数、函数与函数、类别与类别之间的逻辑处理顺序,将对应的节点进行有向连接,作为第二有向无环图。其中,所述有向无环图中节点之间的连线对应有节点之间传递的输入参数。示例性地,上述逻辑处理顺序可通过所述代码序列中函数与函数、类别与类别、函数与类别之间的嵌套关系予以确定。例如:Yield(结果)函数(用以输出结果的函数)通过IsHot函数得到冷或热的结果予以输出回复内容。IsHot函数通过WeatherQueryApi函数获取table(表格)参数,通过table参数中的温度值与温度阈值进行比较,得到上述冷或热的结果。WeatherQueryApi函数通过AtPlace函数获取place(地点)参数,通过Constraint[DateTmie]函数获取time(时间)参数,通过palce参数指示的地点、time参数指示的时间、通过天气相关的API即可查询到一个table参数,该table参数用以表示该地点在该时间下的温度、湿度、空气污染程度等信息。Constraint[DateTmie]函数通过Today函数生成一个时间类别的时间实例,若待识别文本为“今天的天气热不热”则该时间实例为“今天”。Atplace函数通过Here函数生成一个地点类别的地点实例,若待识别文本为“今天的天气热不热”,则该地点实例为电子设备当前所在地,例如:上海。该示例中的每个函数、每个类别对应一个节点,通过上述逻辑处理顺序进行有向连接即可得到代码序列对应的有向无环图,上述函数之间传递的table参数、place参数、time参数,即为上述输入参数,以推动函数依次生成运算结果。
在一种可能的实施方式中,所述节点包括:根节点、叶子节点、普通节点。其中,所述根节点为逻辑处理顺序中首个函数对应的节点,所述叶子节点为逻辑处理顺序中最后的函数对应的节点,所述普通节点为除根节点以及叶子节点的其他节点。承接上例,上例中的Yield函数对应的节点在逻辑处理顺序中被首个调用,则Yield函数对应的节点为上例中的根节点。Today函数、Here函数对应的节点在逻辑处理顺序中被最后调用,则Today函数、Here函数均为叶子节点。IsHot函数、WeatherQueryApi函数、AtPlace函数、Constraint[DateTmie]函数对应的节点不为首个调用、最后调用的节点,即为上例中的其他节点。在此情况下,步骤S300中生成第二有向无环图可包括:由所述根节点至所述叶子节点,依次调用每个节点对应的函数,而后将所述叶子节点对应的调用结果作为所述叶子节点对应的结果子图。其中,所述结果子图用以保存所述叶子节点对应的类别的属性值的生成过程。最终保存所述结果子图至所述有向无环图。承接上例,Today函数、Here函数对应的叶子节点分别需要根据时间类别建立“今天”的时间实例、根据地点类别建立“上海”的地点实例。每个实例的得到过程如下:建立类别,获取类别对应的属性的具体数值,将具体数值赋予该类别即可得到该类别对应的实例。本公开实施例将叶子节点对应的类别的属性值的生成过程作为结果子图保存至所述有向无环图中,可提升有向无环图的数据存储广度,使得根据有向无环图执行的函数具备可追溯性。
在一种可能的实施方式中,所述关联类别为已设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:将所述关联类别与第一有向无环图中的每个节点进行匹配;在所述关联类别与任一节点匹配成功、且确定所述待识别文本对应的操作为修改操作的情况下,复制第一有向无环图;其中,所述修改操作表示所述待识别文本对所述初始识别文本进行修改;将复制后的第一有向无环图中的目标节点对应的属性值设定为所述关联类别对应的属性值后,作为第二有向无环图。例如:待识别文本为“还是去地点B”(该例中“地点B”作为关联类别,且为已设定属性值的地点类别),初始识别文本为“今天去地点A”,初始识别文本对应了一个有向无环图a(也即上文所述的目标有向无环图)。则将有向无环图a复制下来得到有向无环图b,将有向无环图b中的“地点A”对应的节点的属性值(也即目标节点对应的属性值)更新为“地点B”作为“还是去地点B”的有向无环图。本公开实施例在待识别文本对应的操作为修改操作的情况下,可通过复制的方式对复制下来的有向无环图进行修改,而不改变前文对应的有向无环图,使得修改操作不会造成信息丢失。例如上例中“地点A”这一信息还是会被保留下来,在用户输入新的待识别文本“算了,还是上一个地方吧”,则新的待识别文本还是可以查询到“地点A”并可基于此生成有向无环图。匹配过程可参考上文,本公开实施例在此不做赘述。
在一种可能的实施方式中,所述确定所述待识别文本对应的操作,包括:将所述待识别文本及初始识别文本输入至训练后的分类模型中,得到所述待识别文本对应的操作标识。其中,所述训练后的分类模型通过训练文本及其之前的文本、训练文本对应的操作标识训练得到。所述操作标识为以下任意一项:为引用操作、为修改操作、不为引用操作、不为修改操作、不为引用操作以及修改操作。最终根据所述待识别文本对应的操作标识,确定所述待识别文本对应的操作。示例性地,上述操作标识可通过开发人员予以标定得到。本公开实施例在此不限定上述分类模型的模型结构、训练方式,开发人员可视实际情况设定。例如:可将训练文本及其之前的文本输入至分类模型中,得到预测操作标识,并将减小其与操作标识之间的差异作为训练目标进行训练,即可得到上述训练后的分类模型。本公开实施例可通过训练后的分类模型确定待识别文本对应的操作,以提高待识别文本对应的操作的确定精度。
在一种可能的实施方式中,所述处理方法还包括:将所述待识别文本及初始识别文本输入至训练后的第一生成模型中,得到所述待识别文本对应的第二代码序列。其中,所述训练后的第一生成模型通过训练文本及其之前的文本、基于其之前的文本进行更新后的训练文本对应的代码序列训练得到。所述更新包括以下至少一项:针对训练文本之前的文本进行引用操作的文本更新、针对训练文本之前的文本进行修改操作的文本更新。最终根据所述第二代码序列,生成第二有向无环图。本公开实施例在此不限定上述第一生成模型的模型结构、训练方式,开发人员可视实际情况设定。例如:可将训练文本及其之前的文本输入至第一生成模型中,得到预测代码序列,可将减小其与更新后的训练文本对应的代码序列之间的差异作为训练目标进行训练,即可得到上述训练后的第一生成模型。例如:训练文本为“那里的天气如何”,训练文本之前的文本为“今天去北京”,则基于训练文本之前的文本进行引用操作的更新后的训练文本对应的代码序列为“北京的天气如何”对应的代码序列,再例如训练文本为“不,还是去上海”,训练文本之前的文本为“今天去河南”,则基于训练文本之前的文本进行修改操作的更新后的训练文本对应的代码序列为“今天去上海”对应的代码序列。本公开实施例提供的第一生成模型可通过端到端的方式,根据待识别文本及初始识别文本,直接输出待识别文本进行过引用操作或修改操作之后的第二代码序列,而后根据该第二代码序列,即可第二有向无环图(有向无环图的生成过程可参考上文),可降低有向无环图的生成复杂度。
在一种可能的实施方式中,所述处理方法还包括:针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例。其中,所述实例为设置了至少一个属性值的类别。依次执行所述代码序列中的带有实例的函数,生成回复内容。示例性地,带有实例的函数可指导电子设备准确执行相应的操作,以使函数可实现开发人员预定的功能。例如:“今天10点开会”,则函数为创建会议的函数,该函数包括查询“今天”时间的函数(可调用时间查询相关的应用程序编程接口,以生成“今天”(类别为时间,属性值可包括年、月、日、小时等)对应的实例),此处以“今天”为2020年10月13日为例,则创建会议的函数可实现在2020年10月13日的10点建立会议的功能。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种回复内容的处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
参阅图2,图2示出了根据本公开实施例提供的一种回复内容的处理装置的框图,结合图2,所述处理装置100包括:初始识别文本获取模块110,用以获取初始识别文本;其中,所述初始识别文本表示初始回复请求;图获取模块120,用以获取所述初始识别文本的对应的第一有向无环图;其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成;待识别获取模块130,用以获取待识别文本;其中,所述待识别文本表示当前回复请求的回复内容,所述初始回复请求与当前回复请求不同;第二有向无环图生成模块140,用以根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图;其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
在一种可能的实施方式中,所述关联类别为未设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:将所述关联类别与第一有向无环图中的每个节点进行匹配;在任一节点匹配成功、且确定所述待识别文本对应的操作为引用操作的情况下,将匹配成功的节点对应的属性值,作为所述关联类别对应的属性值;其中,所述引用操作表示所述待识别文本对所述初始识别文本进行引用;根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图。
在一种可能的实施方式中,所述根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图,包括:根据所述第一代码序列中的每个类别、每个函数,生成每个类别对应的节点、每个函数对应的节点;根据所述关联类别对应的属性值,更新所述关联类别对应的节点;根据所述第一代码序列中类别与函数、函数与函数、类别与类别之间的逻辑处理顺序,将对应的节点进行有向连接,作为第二有向无环图;其中,所述有向无环图中节点之间的连线对应有节点之间传递的输入参数。
在一种可能的实施方式中,所述关联类别为已设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:将所述关联类别与第一有向无环图中的每个节点进行匹配;在所述关联类别与任一节点匹配成功、且确定所述待识别文本对应的操作为修改操作的情况下,复制第一有向无环图;其中,所述修改操作表示所述待识别文本对所述初始识别文本进行修改;将复制后的第一有向无环图中的目标节点对应的属性值设定为所述关联类别对应的属性值后,作为第二有向无环图。
在一种可能的实施方式中,所述关联类别为初始识别文本对应的代码序列中存在的类别,所述处理装置还用以执行以下任意一项:将待识别文本中与预设字段相同的文本,作为关联类别、将待识别文本输入至关联类别检测模型中,将输出的字段作为关联类别。
在一种可能的实施方式中,所述将所述关联类别与第一有向无环图中的每个节点进行匹配,包括:通过预设操作符,对所述关联类别与每个节点进行比对,在关联类别与目标节点为同一个类别的情况下,将目标节点作为匹配成功的节点。
在一种可能的实施方式中,所述确定所述待识别文本对应的操作,包括:将所述待识别文本及初始识别文本输入至训练后的分类模型中,得到所述待识别文本对应的操作标识;其中,所述训练后的分类模型通过训练文本及其之前的文本、训练文本对应的操作标识训练得到;所述操作标识为以下任意一项:为引用操作、为修改操作、不为引用操作、不为修改操作、不为引用操作以及修改操作;根据所述待识别文本对应的操作标识,确定所述待识别文本对应的操作。
在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的第一代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别。
在一种可能的实施方式中,所述处理装置还用以:针对所述第一代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;依次执行所述第一代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
在一种可能的实施方式中,所述处理装置还用以:根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列;其中,所述训练后的第二生成模型通过训练文本、所述训练文本对应的训练代码序列训练得到,或通过训练文本、所述训练文本对应的训练转译文本得到;所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。
在一种可能的实施方式中,所述处理装置还用以:将所述待识别文本及初始识别文本输入至训练后的第一生成模型中,得到所述待识别文本对应的第二代码序列;其中,所述训练后的第一生成模型通过训练文本及其之前的文本、基于其之前的文本进行更新后的训练文本对应的代码序列训练得到;所述更新包括以下至少一项:针对训练文本之前的文本进行引用操作的文本更新、针对训练文本之前的文本进行修改操作的文本更新;根据所述第二代码序列,生成第二有向无环图。
该方法与计算机系统的内部结构存在特定技术关联,且能够解决如何提升硬件运算效率或执行效果的技术问题(包括减少数据存储量、减少数据传输量、提高硬件处理速度等),从而获得符合自然规律的计算机系统内部性能改进的技术效果。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
电子设备可以被提供为终端设备、服务器或其它形态的设备。
参阅图3所示,图3示出了根据本公开实施例提供的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或终端设备。参照图3,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OS XTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (15)
1.一种回复内容的处理方法,其特征在于,所述处理方法包括:
获取初始识别文本;其中,所述初始识别文本表示初始回复请求;
获取所述初始识别文本的对应的第一有向无环图;其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成;
获取待识别文本;其中,所述待识别文本表示当前回复请求,所述初始回复请求与当前回复请求不同;
根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图;其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
2.如权利要求1所述的处理方法,其特征在于,所述关联类别为未设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:
将所述关联类别与第一有向无环图中的每个节点进行匹配;
在任一节点匹配成功、且确定所述待识别文本对应的操作为引用操作的情况下,将匹配成功的节点对应的属性值,作为所述关联类别对应的属性值;其中,所述引用操作表示所述待识别文本对所述初始识别文本进行引用;
根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图。
3.如权利要求2所述的处理方法,其特征在于,所述根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图,包括:
根据所述第一代码序列中的每个类别、每个函数,生成每个类别对应的节点、每个函数对应的节点;
根据所述关联类别对应的属性值,更新所述关联类别对应的节点;
根据所述第一代码序列中类别与函数、函数与函数、类别与类别之间的逻辑处理顺序,将对应的节点进行有向连接,作为第二有向无环图;其中,所述有向无环图中节点之间的连线对应有节点之间传递的输入参数。
4.如权利要求1所述的处理方法,其特征在于,所述关联类别为已设定属性值的类别,所述根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图,包括:
将所述关联类别与第一有向无环图中的每个节点进行匹配;
在所述关联类别与任一节点匹配成功、且确定所述待识别文本对应的操作为修改操作的情况下,复制第一有向无环图;其中,所述修改操作表示所述待识别文本对所述初始识别文本进行修改;
将复制后的第一有向无环图中的目标节点对应的属性值设定为所述关联类别对应的属性值后,作为第二有向无环图。
5.如权利要求1所述的处理方法,其特征在于,所述关联类别为初始识别文本对应的代码序列中存在的类别,所述处理方法还包括以下任意一项:
将待识别文本中与预设字段相同的文本,作为关联类别、将待识别文本输入至关联类别检测模型中,将输出的字段作为关联类别。
6.如权利要求2或4所述的处理方法,其特征在于,所述将所述关联类别与第一有向无环图中的每个节点进行匹配,包括:通过预设操作符,对所述关联类别与每个节点进行比对,在关联类别与目标节点为同一个类别的情况下,将目标节点作为匹配成功的节点。
7.如权利要求2或4所述的处理方法,其特征在于,所述确定所述待识别文本对应的操作,包括:
将所述待识别文本及初始识别文本输入至训练后的分类模型中,得到所述待识别文本对应的操作标识;其中,所述训练后的分类模型通过训练文本及其之前的文本、训练文本对应的操作标识训练得到;所述操作标识为以下任意一项:为引用操作、为修改操作、不为引用操作、不为修改操作、不为引用操作以及修改操作;
根据所述待识别文本对应的操作标识,确定所述待识别文本对应的操作。
8.如权利要求1所述的处理方法,其特征在于,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的第一代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别。
9.如权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
针对所述第一代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;
依次执行所述第一代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
10.如权利要求1所述的处理方法,其特征在于,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
11.如权利要求1所述的处理方法,其特征在于,所述处理方法还包括:根据所述待识别文本、训练后的第二生成模型,得到所述待识别文本对应的第一代码序列;其中,所述训练后的第二生成模型通过训练文本、所述训练文本对应的训练代码序列训练得到,或通过训练文本、所述训练文本对应的训练转译文本得到;所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。
12.如权利要求1所述的处理方法,其特征在于,所述处理方法还包括:
将所述待识别文本及初始识别文本输入至训练后的第一生成模型中,得到所述待识别文本对应的第二代码序列;其中,所述训练后的第一生成模型通过训练文本及其之前的文本、基于其之前的文本进行更新后的训练文本对应的代码序列训练得到;所述更新包括以下至少一项:针对训练文本之前的文本进行引用操作的文本更新、针对训练文本之前的文本进行修改操作的文本更新;
根据所述第二代码序列,生成第二有向无环图。
13.一种回复内容的处理装置,其特征在于,所述处理装置包括:
初始识别文本获取模块,用以获取初始识别文本;其中,所述初始识别文本表示初始回复请求;
图获取模块,用以获取所述初始识别文本的对应的第一有向无环图;其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成;
待识别获取模块,用以获取待识别文本;其中,所述待识别文本表示当前回复请求的回复内容,所述初始回复请求与当前回复请求不同;
第二有向无环图生成模块,用以根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图;其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
14.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至12中任意一项所述的回复内容的处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的回复内容的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311120150.1A CN117196035A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311120150.1A CN117196035A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117196035A true CN117196035A (zh) | 2023-12-08 |
Family
ID=88982805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311120150.1A Pending CN117196035A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117196035A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160337281A1 (en) * | 2015-05-16 | 2016-11-17 | International Business Machines Corporation | Generate and display contextual hints in a message |
US20170192962A1 (en) * | 2015-12-30 | 2017-07-06 | International Business Machines Corporation | Visualizing and exploring natural-language text |
CN109190114A (zh) * | 2018-08-13 | 2019-01-11 | 北京百度网讯科技有限公司 | 用于生成回复信息的方法和装置 |
US20190138595A1 (en) * | 2017-05-10 | 2019-05-09 | Oracle International Corporation | Enabling chatbots by detecting and supporting affective argumentation |
CN110287297A (zh) * | 2019-05-22 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 对话答复方法、装置、计算机设备及计算机可读存储介质 |
CN112632241A (zh) * | 2020-12-16 | 2021-04-09 | 中国建设银行股份有限公司 | 智能会话的方法、装置、设备和计算机可读介质 |
CN114398903A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN114706945A (zh) * | 2022-03-24 | 2022-07-05 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN115879422A (zh) * | 2023-02-16 | 2023-03-31 | 之江实验室 | 一种对话回复生成方法、装置和存储介质 |
CN115934904A (zh) * | 2022-11-11 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 文本处理方法以及装置 |
CN116483976A (zh) * | 2023-04-28 | 2023-07-25 | 平安科技(深圳)有限公司 | 挂号科室推荐方法、装置、设备及存储介质 |
CN116644170A (zh) * | 2023-06-28 | 2023-08-25 | 南京领行科技股份有限公司 | 回复文本生成方法、装置、通信设备及存储介质 |
-
2023
- 2023-08-31 CN CN202311120150.1A patent/CN117196035A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160337281A1 (en) * | 2015-05-16 | 2016-11-17 | International Business Machines Corporation | Generate and display contextual hints in a message |
US20170192962A1 (en) * | 2015-12-30 | 2017-07-06 | International Business Machines Corporation | Visualizing and exploring natural-language text |
US20190138595A1 (en) * | 2017-05-10 | 2019-05-09 | Oracle International Corporation | Enabling chatbots by detecting and supporting affective argumentation |
CN109190114A (zh) * | 2018-08-13 | 2019-01-11 | 北京百度网讯科技有限公司 | 用于生成回复信息的方法和装置 |
CN110287297A (zh) * | 2019-05-22 | 2019-09-27 | 深圳壹账通智能科技有限公司 | 对话答复方法、装置、计算机设备及计算机可读存储介质 |
CN112632241A (zh) * | 2020-12-16 | 2021-04-09 | 中国建设银行股份有限公司 | 智能会话的方法、装置、设备和计算机可读介质 |
CN114398903A (zh) * | 2022-01-21 | 2022-04-26 | 平安科技(深圳)有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN114706945A (zh) * | 2022-03-24 | 2022-07-05 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN115934904A (zh) * | 2022-11-11 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 文本处理方法以及装置 |
CN115879422A (zh) * | 2023-02-16 | 2023-03-31 | 之江实验室 | 一种对话回复生成方法、装置和存储介质 |
CN116483976A (zh) * | 2023-04-28 | 2023-07-25 | 平安科技(深圳)有限公司 | 挂号科室推荐方法、装置、设备及存储介质 |
CN116644170A (zh) * | 2023-06-28 | 2023-08-25 | 南京领行科技股份有限公司 | 回复文本生成方法、装置、通信设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10958598B2 (en) | Method and apparatus for generating candidate reply message | |
US11394667B2 (en) | Chatbot skills systems and methods | |
CN109840089A (zh) | 用于对电子设备的会话代理进行视觉理解和编程的系统和方法 | |
US11087090B2 (en) | System for focused conversation context management in a reasoning agent/behavior engine of an agent automation system | |
WO2022134421A1 (zh) | 基于多知识图谱的智能答复方法、装置、计算机设备及存储介质 | |
CN110162675B (zh) | 应答语句的生成方法、装置、计算机可读介质及电子设备 | |
US20220051662A1 (en) | Systems and methods for extraction of user intent from speech or text | |
WO2023142451A1 (zh) | 工作流生成方法、装置、电子设备 | |
US11727923B2 (en) | System and method for virtual conversations | |
CN116737910B (zh) | 智能对话处理方法、装置、设备及存储介质 | |
EP4283465A1 (en) | Data processing method and apparatus, and storage medium | |
CN115002099A (zh) | 基于rpa和ai实现ia的人机交互式文件处理方法和装置 | |
CN110928995B (zh) | 一种交互信息处理方法、装置、设备及存储介质 | |
CN117648422A (zh) | 问答提示系统、问答提示、库构建、模型训练方法和装置 | |
CN112784024A (zh) | 一种人机对话的方法、装置、设备以及存储介质 | |
CN111090740B (zh) | 一种用于对话系统的知识图谱生成方法 | |
CN114531334A (zh) | 意图处理方法、装置、电子设备和可读存储介质 | |
CN117196035A (zh) | 回复内容的处理方法、装置、电子设备及存储介质 | |
CN117077790A (zh) | 回复内容的处理方法、装置、电子设备及存储介质 | |
CN114255750B (zh) | 数据集构建和任务式对话方法、电子设备和存储介质 | |
CN108509442B (zh) | 搜索方法和装置、服务器以及计算机可读存储介质 | |
CN115543428A (zh) | 一种基于策略模板的模拟数据生成方法和装置 | |
CN117171318A (zh) | 回复内容的生成方法、装置、电子设备及存储介质 | |
CN105988992A (zh) | 图标推送方法及装置 | |
CN113722584A (zh) | 任务推送方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |