CN117171318A - 回复内容的生成方法、装置、电子设备及存储介质 - Google Patents
回复内容的生成方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117171318A CN117171318A CN202311117181.1A CN202311117181A CN117171318A CN 117171318 A CN117171318 A CN 117171318A CN 202311117181 A CN202311117181 A CN 202311117181A CN 117171318 A CN117171318 A CN 117171318A
- Authority
- CN
- China
- Prior art keywords
- text
- code sequence
- recognized
- identified
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000006870 function Effects 0.000 claims description 151
- 238000012549 training Methods 0.000 claims description 89
- 238000013519 translation Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 abstract description 9
- 230000010365 information processing Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000012423 maintenance Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 239000008186 active pharmaceutical agent Substances 0.000 description 7
- 238000013145 classification model Methods 0.000 description 6
- 125000002015 acyclic group Chemical group 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本公开涉及信息处理技术领域,尤其涉及一种回复内容的生成方法、装置、电子设备及存储介质,所述生成方法包括:获取待识别文本;根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;执行所述代码序列,生成针对所述当前回复请求的回复内容。本公开可通过代码序列的方式表现待识别文本的语义,通过代码之间的组合便可支持用户请求内容的长尾表达,有利于上下文的衔接表达。此外,本公开实施例无需设定现有技术中的请求内容列表,代码之间的不同组合即可表现出不同的请求内容,相较于相关技术中需要额外向请求内容列表中导入请求内容、请求内容对应的标准问题的方式,可降低维护成本。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种回复内容的生成方法、装置、电子设备及存储介质。
背景技术
任务型对话系统可根据用户提出的任务,生成合适的回复内容以完成该任务。任务型对话系统通常包括四个模块:自然语言理解模块(或称NLU模块,全称为NaturalLanguage Understanding)、对话管理(或称DM模块,全称为Dialogue Management)和自然语言生成模块(或称NLG模块,全称为Natural Language Generation),通过以上模块的依次调用即可生成回复内容。任务型对话系统被广泛应用于人机交互场景中。故如何更好地构建任务型对话系统,使其更好地生成回复内容,是开发人员亟需解决的技术问题。
发明内容
本公开提出了一种回复内容的生成技术方案。
根据本公开的一方面,提供了一种回复内容的生成方法,所述生成方法包括:获取待识别文本;其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求;根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种;执行所述代码序列,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述执行所述代码序列包括:获取预设的限制规则,根据预设的限制规则执行所述代码序列;其中,所述限制规则包括以下至少一种:针对时间类型的实体信息的时段限制、针对距离类型的实体信息的距离限制、针对数量类型的实体信息的数量限制。
在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别;其中,不同的词组中相同的实体信息对应的类别相同,不同的待识别文本的词组对应的函数相同或不同。
在一种可能的实施方式中,所述执行所述代码序列,生成针对所述当前回复请求的回复内容,包括:针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;依次执行所述代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练代码序列训练得到;所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的代码序列。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练转译文本训练得到;其中,所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述;所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的转译文本;根据代码序列与转译文本之间预设的对应关系,确定所述转译文本对应的代码序列,作为所述待识别文本对应的代码序列。
在一种可能的实施方式中,所述训练文本为多组训练文本;不同组训练文本对应不同的请求内容,不同请求内容对应的类别、函数、操作符相同或不同。
在一种可能的实施方式中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
根据本公开的一方面,提供了一种回复内容的生成装置,所述生成装置包括:文本获取模块,用以获取待识别文本;其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求;代码序列生成模块,用以根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种;回复内容生成模块,用以执行所述代码序列,生成针对所述当前回复请求的回复内容。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
在本公开实施例中,可获取待识别文本,而后根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,最终执行所述代码序列,生成针对所述当前回复请求的回复内容。本公开实施例可通过代码序列的方式表现待识别文本的语义,通过代码之间的组合便可支持用户请求内容的长尾表达,有利于上下文的衔接表达。此外,本公开实施例无需设定现有技术中的请求内容列表,代码之间的不同组合即可表现出不同的请求内容,相较于相关技术中需要额外向请求内容列表中导入请求内容、请求内容对应的标准问题的方式,可降低维护成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出了根据本公开实施例提供的一种回复内容的生成方法。
图2示出了根据本公开实施例提供的一种回复内容的生成装置的框图。
图3示出了根据本公开实施例提供的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
相关技术中,任务型对话系统中的自然语言理解模块用以对用户输入的信息进行理解,具体流程为将用户输入的信息(或称query)映射到预先定义好的请求内容(或称intent,可理解为应用场景)上,其核心为:根据领域或场景,预先定义好请求内容列表,一个请求内容对应一个标准问题,例如:标准问题“我的外卖还有多久送到”对应一个请求内容,标准问题“我要买火车票”对应一个请求内容,当用户输入的信息与标准问题类似或相同时,即可了解到用户的请求内容,进而生成对应的回复内容。此举易造成以下问题:1、在用户输入的信息过长时,对该信息的理解程度不够。2、预先定义的标准问题的数量不足以满足复杂多样的场景,而添加新的请求内容将会提高回复成本。3、对于用户输入的模糊信息无法支持,例如:用户输入的信息包括:“三点半左右”、“附近五十米”等。4、对于上下文衔接无法表达,例如:用户输入的信息为“会后安排去超市”,则需要额外的模块识别会议的时间,再通过规则组合才能完成最终的理解。
有鉴于此,本公开实施例提供了一种回复内容的生成方法,所述生成方法包括:获取待识别文本。而后根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列。最终执行所述代码序列,生成针对所述当前回复请求的回复内容。本公开实施例可通过代码序列的方式表现待识别文本的语义,通过代码之间的组合便可支持用户请求内容的长尾表达,有利于上下文的衔接表达。此外,本公开实施例无需设定现有技术中的请求内容列表,代码之间的不同组合即可表现出不同的请求内容,相较于相关技术中需要额外向请求内容列表中导入请求内容、请求内容对应的标准问题的方式,可降低维护成本。
参阅图1所示,图1示出了根据本公开实施例提供的一种回复内容的生成方法,所述生成方法包括:步骤S100,获取待识别文本。其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求。在一个示例中,待识别文本可由用户手动输入。在另一个示例中,步骤S100可包括:获取待识别语音。而后将所述待识别语音转换为待识别文本。本公开实施例可支持文本输入、语音输入的应用场景。上述待识别文本可通过用户在显示界面中文本框内的输入予以获取。上述待识别语音可通过相关技术中电子设备的语音采集装置予以获取,待识别语音可通过相关技术中的识别模型、识别算法转换为待识别文本即可,本公开实施例在此不做赘述。
步骤S200,根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列。其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种。在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息。所述待识别文本对应的代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别。其中,不同的词组中相同的实体信息对应的类别相同,不同的待识别文本的词组对应的函数相同或不同。例如:词组1可为“新建会议”,词组2可为“更改会议”,则“会议”对应的类别可相同,此外,不同的待识别文本也可复用相同的函数,以实现通过少量的代码元素实现大量文本信息的长尾表示。在一个示例中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。示例性地,上述类别可表现为person(人类)类别、datetime(日期时间)类别、event(事件)类别等,对应了文本中可能出现的实体信息的种类,例如:person类别的属性可包括:姓、名、联系电话、邮箱等,通过对每个属性赋值的方式可以得到一个具体的person实例,例如:姓:李、名:二、联系电话:11111、邮箱11.com可作为一个具体的person实例,相当于文本中的实体信息。而函数可表现为对各种类别进行的不同操作,例如:可对某个person实例打电话(例如:通过访问“李二”这个person实例的方式得到“李二”的联系电话11111,而后调用电子设备的通话相关的API,实现对11111的拨号呼叫,其中,API全称为Application Programming Interface,即应用程序编程接口)、获取某个person实例的信息、获取某个datatime实例的年份等。具体可由开发人员视实际情况,进行设定,应当理解的是,函数之间也可以嵌套,以构成一个复杂的处理逻辑。应当理解的是,上述类别、函数、操作符由开发人员根据不同的应用场景预先设定得到,具体的构成可由开发人员予以确定。此处以个人日程管理为例,在该应用场景下,类别可包括:Event类别,用以表示一个日程,属性值可包括开始时间、结束时间、持续时间、地点、会议主题等。Person类别,用以表示日程的参会人,属性值可包括姓名、邮箱、电话等。DateTime类别,用以表示日程的开始时间、日程的结束时间,属性值可包括年份、月份、日期、小时、分钟等(Event类别中的开始时间、结束时间可通过DateTime类别予以表示,换言之,类别之间可产生嵌套以实现多层次的数据表示)。Duration(时长)用以表示日程的持续时长,可将秒作为计量单位,属性值可包括持续时长(Event类别中的持续时间可通过Duration类别予以表示)等。Location(地点)类别用以表示日程的地点,属性值可包括地点、地点描述等(Event类别中的地点可通过Location类别予以表示)。在该应用场景下,函数可包括:CreateEvent(创建事件)函数,用以创建日程。DeleteEvent(删除事件)函数,用以删除日程。UpdateEvent(更新事件)函数,用以更新日程(针对已创建的日程)。RemindEvent(提醒事件)函数,用以提醒日程。操作符可为针对实例具体参数值的大小判断、实例中属性值的类型进行判断等。应当理解的是函数可通过操作符对类别进行处理,实现函数的功能。示例性地,CreateEvent函数可包括Event类别(此处仅做出示例性的表述,每个函数可调用的类别数量由开发人员视实际情况而定),而后通过待识别文本中的限制条件(例如关键字Constraint(限制),该关键字可对类别中属性值进行限制、或对待处理的类别是何种类别进行限制),对Event类别中的属性值赋值(例如:通过操作符赋值),以得到一个具体的Event实例。通过将函数、类别、操作符进行组合,即可得到上文所述的代码序列。例如:待识别文本为“今天早上八点开例会”则对应生成的代码序列中Event实例中开始时间这一属性值被限制为“早上八点”、Event实例中会议主题这一属性值被限制为“例会”。应当理解的是每个类别对应的每个属性值不必均有具体数值,若待识别文本中没有该属性值的限制描述,则可将该属性值设定为空。承接上例,用户在输入待识别文本时,不必针对每个属性值进行描述,即“今天早上八点开例会”可不必描述为“今天早上八点至十点在八楼开持续两个小时的例会”,以符合用户的自然语言习惯,换言之,用户在输入待识别文本时不必关注每个实例具体是如何构成的,两种说法的信息量虽然不同,但是均可表现为一段代码序列被正常执行。
再例如:待识别文本为“今天天气热不热”,则代码序列可包括:IsHot(是否炎热)函数,该函数通过温度阈值与输入的温度值进行比较,以判断输入的温度值是否属于冷或热的情况,上述温度阈值可由开发人员根据实际情况予以设定。IsHot函数中需输入的温度值通过WeatherQueryApi(天气查询API)函数予以获取。WeatherQueryApi函数,用以调用外部的API输入地点实例、时间实例,输出温度实例(也即上文中的温度值)。WeatherQueryApi函数需输入的地点实例通过AtPlace(获取地点)函数予以获取,时间实例通过Today(今天)函数予以获取。AtPlace函数可获取上文中的地点实例,例如该地点实例可为电子设备当前所在位置。Today函数可获取上文中的时间实例,例如该时间实例可为电子设备的当前时间。在该示例中,包括了时间类别、地点类别。操作符可表现为赋予类别具体属性值、赋予函数调用的为何种类别的运算符。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练代码序列训练得到。步骤S200可包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的代码序列。示例性地,训练文本对应的训练代码序列通过开发人员进行标注得到,基于此对生成模型进行训练,即可得到可将待识别文本转换为代码序列的生成模型。应当理解的是,上述生成模型的具体模型结构、参数设置等可根据开发人员的实际需求而定,本公开实施例在此不做限制。示例性地,生成模型的损失函数也可由开发人员进行设定,例如:可根据训练代码序列与根据训练文本生成的预测代码序列之间的差异确定损失值,生成模型可将缩小该损失值作为其训练目标,不断调整其模型参数,得到训练后的生成模型。上述训练文本可包括若干实际场景下的历史聊天信息,即可实现生活模型针对该若干实际场景下的待识别文本,生成对应的代码序列。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练转译文本训练得到。其中,所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述。例如:训练文本为面向人类的自然语言,训练代码序列为面向机器的模块化语言,训练转译文本为介于二者之间的、面向人类以及面向机器的模块化自然语言,以建立训练文本与代码序列之间的关联。示例性地,模块化的自然语言可表现为将代码序列中的函数转译为自然语言中的表示,例如上文中的CreateEvent函数对应的训练转译文本为“创建日程”、DeleteEvent函数对应的训练转译文本为“删除日程”。训练转译文本“创建日程”对应的训练文本可为“开会”、“约见”等。步骤S200可包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的转译文本。而后根据代码序列与转译文本之间预设的对应关系,确定所述转译文本对应的代码序列,作为所述待识别文本对应的代码序列。示例性地,上述对应关系可由开发人员根据实际情况进行设定,可根据转译文本确定对应的代码序列即可,本公开实施例在此不做限制。结合实际场景,函数、类的命名通常由开发人员进行设定,具有一定的主观性,其中不乏英文简写,语义表现能力较差,在此情况下,若生成模型若直接预测代码序列,则训练难度会更高、精度也无法保证,故本公开实施例通过建立训练转译文本与训练代码序列之间的对应关系(该对应关系也可理解为转译文本与代码序列之间的对应关系,此外该对应关系可视实际情况予以改变,例如在函数名发生变化后,只需更改该对应关系中原函数名即可重新建立对应关系,而无需对生成模型本身进行重新训练,可修改性更强)的方式,以生成模型能够预测转译文本为训练目标,对生成模型进行训练,不仅可降低训练难度,而且可提高最终生成的代码序列的生成精度。
在一种可能的实施方式中,所述训练文本为多组训练文本。不同组训练文本对应不同的请求内容,不同请求内容对应的类别、函数、操作符相同或不同。示例性地,不同的训练文本(或待识别文本),其对应的训练代码序列(或代码序列)中的函数、类、操作符可相似或相同,例如:训练文本“今天热不热”、“今天的天气是什么”均可包括上文中的WeatherQueryApi函数,即可通过低成本的方式构成大量不同语义的表述。训练文本可对应不同的请求内容(或称为intent),开发人员以请求内容作为实际应用场景,构建训练文本、训练文本可能使用的类别、函数、操作符。应当理解的是,这里的请求内容并非通过数据的形式直接表现,而是由开发人员根据不同请求内容进行函数、类、操作符的设计,生成模型仍是通过训练文本预测训练代码序列,即可学习到训练文本隐性的应用场景特征。
继续结合图1,步骤S300,执行所述代码序列,生成针对所述当前回复请求的回复内容。示例性地,上述可根据执行代码序列得到的数值,进一步生成回复内容,上述回复内容为更贴近自然语言的文本信息。例如:待识别文本为“现在几点了”,则对应的代码序列在执行后,可得到具体的时间数值,比如:6点45分作为执行结果,则可根据该执行结果,进行自然语言处理加工,比如最终生成的回复内容可为“现在的时间是6点45分”,具体过程,本公开实施例在此不做限制,可由开发人员予以设定,回复内容相较于代码序列得到的数值更偏向人类的自然语言习惯即可。
在一种可能的实施方式中,步骤S300中执行所述代码序列,包括:获取预设的限制规则,根据预设的限制规则执行所述代码序列。其中,所述限制规则包括以下至少一种:针对时间类型的实体信息的时段限制、针对距离类型的实体信息的距离限制、针对数量类型的实体信息的数量限制。结合实际应用场景,用户通常会输入含义模糊的待识别文本,例如:待输入文本为“今天8点左右的行程安排是什么”,上述代码序列可生成的时间实例为8点,而非“8点左右”,故本公开实施例可在识别到“左右”“约”等模糊化表述的文本时,针对对应的实体信息(该示例中为8点),结合预设的限制规则,例如:时段限制为30分钟,则最终执行结果将会查询7点45分至8点15分之间的行程安排,以满足用户的查询预期,通过设定限制规则的方式可准确指导代码运行,在接收到多个不同请求时,该多个不同请求实际请求回复的内容在允许的偏差内时,可以通过限制规则实现代码序列的复用,减少回复内容的生成成本。上述时段限制、距离限制、数量限制的具体数值可由开发人员结合实际场景设定,或后期由用户进行自定义设定,本公开实施例在此不做限制。
在一种可能的实施方式中,步骤S300可包括:针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例。其中,所述实例为设置了至少一个属性值的类别。依次执行所述代码序列中的带有实例的函数,生成回复内容。示例性地,带有实例的函数可指导电子设备准确执行相应的操作,以使函数可实现开发人员预定的功能。例如:“今天10点开会”,则函数为创建会议的函数,该函数包括查询“今天”时间的函数(可调用时间查询相关的应用程序编程接口,以生成“今天”(类别为时间,属性值可包括年、月、日、小时等)对应的实例),此处以“今天”为2020年10月13日为例,则创建会议的函数可实现在2020年10月13日的10点建立会议的功能。
在一种可能的实施方式中,所述生成方法还可包括:生成并存储所述代码序列对应的有向无环图。其中,所述有向无环图用以表示所述待识别文本对应的当前回复请求的回复内容。该步骤可包括:根据所述代码序列中的每个类别、每个函数,生成每个类别对应的节点、每个函数对应的节点。而后根据所述代码序列中类别与函数、函数与函数、类别与类别之间的逻辑处理顺序,将对应的节点进行有向连接,作为所述代码序列对应的有向无环图。其中,所述有向无环图中节点之间的连线对应有节点之间传递的输入参数。示例性地,上述逻辑处理顺序可通过所述代码序列中函数与函数、类别与类别、函数与类别之间的嵌套关系予以确定。例如:Yield(结果)函数(用以输出结果的函数)通过IsHot函数得到冷或热的结果予以输出回复内容。IsHot函数通过WeatherQueryApi函数获取table(表格)参数,通过table参数中的温度值与温度阈值进行比较,得到上述冷或热的结果。WeatherQueryApi函数通过AtPlace函数获取place(地点)参数,通过Constraint[DateTmie]函数获取time(时间)参数,通过palce参数指示的地点、time参数指示的时间、通过天气相关的API即可查询到一个table参数,该table参数用以表示该地点在该时间下的温度、湿度、空气污染程度等信息。Constraint[DateTmie]函数通过Today函数生成一个时间类别的时间实例,若待识别文本为“今天的天气热不热”则该时间实例为“今天”。Atplace函数通过Here函数生成一个地点类别的地点实例,若待识别文本为“今天的天气热不热”,则该地点实例为电子设备当前所在地,例如:上海。该示例中的每个函数、每个类别对应一个节点,通过上述逻辑处理顺序进行有向连接即可得到代码序列对应的有向无环图,上述函数之间传递的table参数、place参数、time参数,即为上述输入参数,以推动函数依次生成运算结果。
在一种可能的实施方式中,所述节点包括:根节点、叶子节点、普通节点。其中,所述根节点为逻辑处理顺序中首个函数对应的节点,所述叶子节点为逻辑处理顺序中最后的函数对应的节点,所述普通节点为除根节点以及叶子节点的其他节点。承接上例,上例中的Yield函数对应的节点在逻辑处理顺序中被首个调用,则Yield函数对应的节点为上例中的根节点。Today函数、Here函数对应的节点在逻辑处理顺序中被最后调用,则Today函数、Here函数均为叶子节点。IsHot函数、WeatherQueryApi函数、AtPlace函数、Constraint[DateTmie]函数对应的节点不为首个调用、最后调用的节点,即为上例中的其他节点。在此情况下,所述生成方法可包括:由所述根节点至所述叶子节点,调用每个节点对应的函数,而后将所述叶子节点对应的调用结果作为所述叶子节点对应的结果子图。其中,所述结果子图用以保存所述叶子节点对应的类别的属性值的生成过程。最终保存所述结果子图至所述有向无环图。承接上例,Today函数、Here函数对应的叶子节点分别需要根据时间类别建立“今天”的时间实例、根据地点类别建立“上海”的地点实例。每个实例的得到过程如下:建立类别,获取类别对应的属性的具体数值,将具体数值赋予该类别即可得到该类别对应的实例。本公开实施例将叶子节点对应的类别的属性值的生成过程作为结果子图保存至所述有向无环图中,可提升有向无环图的数据存储广度,使得根据有向无环图执行的函数具备可追溯性。在一种可能的实施方式中,所述有向无环图中相连的第一节点、第二节点之间,所述第一节点将目标类别对应的目标属性值,透传至所述第二节点。其中,所述目标属性值为所述第一节点针对目标类别的至少一个属性值中未进行数值更改的属性值。所述第一节点指向所述第二节点。示例性地,上文中的Yield函数对应的节点可视为第二节点,IsHot函数对应的节点可视为第一节点,IsHot函数得到“热”或“不热”的具体结果,将其透传至Yield函数,进行回复内容的生成,例如Yield函数可生成“今天不热”或“今天热”等更贴合自然语言的回答。应当理解的是,在该示例中,IsHot函数也可作为第二节点,其对应的第一节点为WeatherQueryApi函数对应的节点,WeatherQueryApi获取table参数,将其透传至IsHot函数对应的节点,IsHot函数通过table参数中的温度值与温度阈值进行比较,得到上述冷或热的结果。换言之,一个节点即可作为第一节点,也可作为第二节点,可视节点之间的指向而定,本公开实施例在此不做限制。
在一种可能的实施方式中,所述处理方法还包括:在对所述待识别文本进行上下文回复内容查询的情况下,查询所述待识别文本之前或之后的每个文本对应的有向无环图,并作为所述待识别文本对应的上下文回复内容。本公开实施例可通过有向无环图的方式对回复内容进行存储,并通过保存每个文本对应的有向无环图的方式,使得每个文本对应的回复内容均具有可追溯性。上述上下文回复内容查询可通过现有技术的任务对话系统予以调用,本公开实施例在此不做赘述,例如:可用于通过上下文回复内容辅助进行待识别文本的予以理解、对上下文回复内容进行修改等。
在一种可能的实施方式中,所述处理方法还包括:在所述待识别文本是对目标有向无环图中的目标节点进行更新的情况下,获取所述目标有向无环图,执行以下任意一项操作:对所述目标有向无环图的目标节点进行更新、或复制所述目标有向无环图,对复制后的目标有向无环图的目标节点进行更新,将更新后的目标有向无环图作为所述待识别文本对应的有向无环图。示例性地,在确定待识别文本具有对目标有向无环图进行更改的请求内容的情况下(例如通过训练后的机器学习模型予以判定,或通过检测关键词的方式予以判定),可对目标有向无环图的目标节点进行更新,该种方式的实现更为简单、快捷,不会增加有向无环图的总量。也可复制所述目标有向无环图,对复制后的目标有向无环图的目标节点进行更新,将更新后的目标有向无环图作为所述待识别文本对应的有向无环图,该种方式可使得每次修改均可被追溯,例如:第一个待识别文本为“今天去上海开会”,第二个待识别文本为“不,还是去苏州”,第三个待识别文本为“不,不去苏州了,还是原先的地点”,在该示例中对开会地点进行了多次修改,若直接在第一个待识别文本对应的有向无环图上进行更改,则后续用户若以第一个待识别文本为基础进行修改,则实际上是在第二个待识别文本对应的有向无环图上进行修改,“原先的地点”会在生成第二个待识别文本的有向无环图时被丢弃,造成信息丢失。而复制后再进行修改则可使信息不会丢失,有利于提高回复内容的溯源能力。
在一种可能的实施方式中,所述处理方法还包括:在已生成的有向无环图的总数大于预设总数、或已生成的有向无环图占用的存储空间大小大于预设空间大小的情况下,根据预设规则,删除有向无环图。示例性地,上述预设规则可包括:按照有向无环图的生成时间排序后,优先删除生成时间最早的若干有向无环图、按照有向无环图的应用频率排序后,优先删除应用频率最低的若干有向无环图等,本公开实施例在此不做限制,可由开发人员根据实际需求而定。上述预设总数、预设空间大小的具体数值也可由开发人员根据实际需求而定。
在一种可能的实施方式中,所述生成方法可包括:针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例。其中,所述实例为设置了至少一个属性值的类别。依次执行所述代码序列中的带有实例的函数,生成回复内容。示例性地,带有实例的函数可指导电子设备准确执行相应的操作,以使函数可实现开发人员预定的功能。例如:“今天10点开会”,则函数为创建会议的函数,该函数包括查询“今天”时间的函数(可调用时间查询相关的应用程序编程接口,以生成“今天”(类别为时间,属性值可包括年、月、日、小时等)对应的实例),此处以“今天”为2020年10月13日为例,则创建会议的函数可实现在2020年10月13日的10点建立会议的功能。
在一种可能的实施方式中,在步骤S100之前,所述处理方法可包括:获取初始识别文本。其中,所述初始识别文本表示初始回复请求。其中,所述初始识别文本通过待识别语音转换或电子设备接收得到,用于表示初始回复请求。在一个示例中,初始识别文本可由用户手动输入。在另一个示例中,可包括:获取初始识别语音。而后将所述初始识别语音转换为初始识别文本。本公开实施例可支持文本输入、语音输入的应用场景。上述初始识别文本可通过用户在显示界面中文本框内的输入予以获取。上述初始识别语音可通过相关技术中电子设备的语音采集装置予以获取,初始识别语音可通过相关技术中的识别模型、识别算法转换为初始识别文本即可,本公开实施例在此不做赘述。而后获取所述初始识别文本的对应的第一有向无环图。其中,所述第一有向无环图用以表示所述初始识别文本对应的回复请求的回复内容,通过所述初始识别文本对应的代码序列生成。
所述有向无环图用以表示文本对应的针对回复请求的回复内容。其中,所述关联类别用以表示与初始识别文本具备关联性的类别,所述初始识别文本为所述待识别文本之前的文本。示例性地,上述有向无环图由若干节点通过逻辑处理顺序有向连接构成,每个节点对应一个函数或类别。针对关联类别的具体生成方式,本公开实施例在此不做限制。在一个示例中,所述关联类别为初始识别文本对应的代码序列中存在的类别,所述处理方法还包括以下任意一项:将待识别文本中与预设字段相同的文本,作为关联类别、将待识别文本输入至关联类别检测模型中,将输出的字段作为关联类别。例如可通过规则性的匹配算法,在出现特定文本的情况下,将特定文本作为关联类别,例如出现“那天”、“那个地方”等对前文进行引用的文本(也即后文将述的引用操作),或将特定文本之后出现的文本作为关联类别,例如出现“修改为”等对前文进行修改的文本(也即后文将述的修改操作),将“修改为”之后的文本作为关联类别(如“修改为10点”中的“10点”为关联类别),也可根据模型输出待识别文本中的关联类别(模型输出关联类别的过程,后文将予以详述),本公开实施例在此不做限制。
在一种可能的实施方式中,步骤S300之后还可包括:根据所述初始识别文本和所述待识别文本的关联类别,以及第一有向无环图,确定待识别文本对应的第二有向无环图。其中,所述第二有向无环图用以表示所述当前回复请求的回复内容。
在一种可能的实施方式中,所述关联类别为未设定属性值的类别,步骤S400可包括:将所述关联类别与第一有向无环图中的每个节点进行匹配。在一个示例中,将所述关联类别与第一有向无环图中的每个节点进行匹配,包括:通过预设操作符,对所述关联类别与每个节点进行比对,在关联类别与目标节点为同一个类别的情况下,将目标节点作为匹配成功的节点。上述预设操作符可为相关技术中的“=”或“?=”在任一节点匹配成功、且确定所述待识别文本对应的操作为引用操作的情况下,将匹配成功的节点对应的属性值,作为所述关联类别对应的属性值。其中,所述引用操作表示所述待识别文本对所述初始识别文本进行引用。示例性地,若用户输入的待识别文本为“那天的天气如何”,初始识别文本为“6月2日去开会”,则待识别文本中的关联类别为“那天”。若仅参考待识别文本,则“那天”仅是一个时间类别,而非一个时间实例,即没有具体属性值,换言之,电子设备无法得到“那天”的具体日期(即关联类别未设定属性值,待识别文本对应的操作为引用操作)。在此情况下,可对第一有向无环图进行一个时间类别的节点查询,若查询到一个时间类别对应的节点,则将该节点对应的属性值作为上文中“那天”的属性值。例如:“6月2日去开会”对应的有向无环图中可对应有“6月2日”对应的节点,“去开会”对应的节点,在该示例中“6月2日”即为时间类别对应的节点,则可将“6月2日”作为“那天”。示例性地,上述匹配成功可表现为关联类别与一个节点对应的类别相同或具有对应关系。例如:可通过节点之间的输入参数、和/或节点对应的类别进行匹配。再例如:关联类别为person类别,则可通过搜索第一有向无环图中的节点,直至搜索到一个person类别对应的节点,则视为匹配成功。将搜索到的person类别视为关联类别匹配成功的类别,将搜索到的person类别对应的属性值(可为该person类别对应的person实例的属性值)赋给关联类别,以具象化关联类别,完成待识别文本的引用操作。在另一个示例中,在匹配失败的情况下,可生成提示以告知用户需输入该关联类别的部分或全部属性对应的属性值。最终根据所述关联类别对应的属性值、所述待识别文本对应的第一代码序列,得到第二有向无环图。
在一种可能的实施方式中,所述关联类别为已设定属性值的类别,所述根据至少一个初始识别文本,得到第二有向无环图,包括:将所述关联类别与至少一个初始识别文本对应的至少一个有向无环图中的每个节点进行匹配,而后在所述关联类别与任一节点匹配成功、且确定所述待识别文本对应的操作为修改操作的情况下,复制匹配成功的目标节点对应的、所述至少一个有向无环图中的目标有向无环图,所述修改操作表示所述待识别文本对初始识别文本进行修改。将复制后的目标有向无环图中的目标节点对应的属性值设定为所述关联类别对应的属性值后,作为第二有向无环图。例如:待识别文本为“还是去地点B”(该例中“地点B”作为关联类别,且为已设定属性值的地点类别),初始识别文本为“今天去地点A”,初始识别文本对应了一个有向无环图a(也即上文所述的目标有向无环图)。则将有向无环图a复制下来得到有向无环图b,将有向无环图b中的“地点A”对应的节点的属性值(也即目标节点对应的属性值)更新为“地点B”作为“还是去地点B”的有向无环图。本公开实施例在待识别文本对应的操作为修改操作的情况下,可通过复制的方式对复制下来的有向无环图进行修改,而不改变前文对应的有向无环图,使得修改操作不会造成信息丢失。例如上例中“地点A”这一信息还是会被保留下来,在用户输入新的待识别文本“算了,还是上一个地方吧”,则新的待识别文本还是可以查询到“地点A”并可基于此生成有向无环图。匹配过程可参考上文,本公开实施例在此不做赘述。
在一种可能的实施方式中,所述确定所述待识别文本对应的操作,包括:将所述待识别文本及初始识别文本输入至训练后的分类模型中,得到所述待识别文本对应的操作标识。其中,所述训练后的分类模型通过训练文本及其之前的文本、训练文本对应的操作标识训练得到。所述操作标识为以下任意一项:为引用操作、为修改操作、不为引用操作、不为修改操作、不为引用操作以及修改操作。最终根据所述待识别文本对应的操作标识,确定所述待识别文本对应的操作。示例性地,上述操作标识可通过开发人员予以标定得到。本公开实施例在此不限定上述分类模型的模型结构、训练方式,开发人员可视实际情况设定。例如:可将训练文本及其之前的文本输入至分类模型中,得到预测操作标识,并将减小其与操作标识之间的差异作为训练目标进行训练,即可得到上述训练后的分类模型。本公开实施例可通过训练后的分类模型确定待识别文本对应的操作,以提高待识别文本对应的操作的确定精度。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种回复内容的生成方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
参阅图2所示,图2示出了根据本公开实施例提供的回复内容的生成装置的框图,结合图2,所述生成装置100包括:文本获取模块110,用以获取待识别文本;其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求;代码序列生成模块120,用以根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种;回复内容生成模块130,用以执行所述代码序列,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述执行所述代码序列包括:获取预设的限制规则,根据预设的限制规则执行所述代码序列;其中,所述限制规则包括以下至少一种:针对时间类型的实体信息的时段限制、针对距离类型的实体信息的距离限制、针对数量类型的实体信息的数量限制。
在一种可能的实施方式中,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别;其中,不同的词组中相同的实体信息对应的类别相同,不同的待识别文本的词组对应的函数相同或不同。
在一种可能的实施方式中,所述执行所述代码序列,生成针对所述当前回复请求的回复内容,包括:针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;依次执行所述代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练代码序列训练得到;所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的代码序列。
在一种可能的实施方式中,所述训练后的生成模型基于训练文本、训练文本对应的训练转译文本训练得到;其中,所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述;所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的转译文本;根据代码序列与转译文本之间预设的对应关系,确定所述转译文本对应的代码序列,作为所述待识别文本对应的代码序列。
在一种可能的实施方式中,所述训练文本为多组训练文本;不同组训练文本对应不同的请求内容,不同请求内容对应的类别、函数、操作符相同或不同。
在一种可能的实施方式中,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
该方法与计算机系统的内部结构存在特定技术关联,且能够解决如何提升硬件运算效率或执行效果的技术问题(包括减少数据存储量、减少数据传输量、提高硬件处理速度等),从而获得符合自然规律的计算机系统内部性能改进的技术效果。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
电子设备可以被提供为终端设备、服务器或其它形态的设备。
参阅图3所示,图3示出了根据本公开实施例提供的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或终端设备。参照图3,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OS XTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (11)
1.一种回复内容的生成方法,其特征在于,所述生成方法包括:
获取待识别文本;其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求;
根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种;
执行所述代码序列,生成针对所述当前回复请求的回复内容。
2.如权利要求1所述的生成方法,其特征在于,所述执行所述代码序列包括:获取预设的限制规则,根据预设的限制规则执行所述代码序列;其中,所述限制规则包括以下至少一种:针对时间类型的实体信息的时段限制、针对距离类型的实体信息的距离限制、针对数量类型的实体信息的数量限制。
3.如权利要求1所述的生成方法,其特征在于,所述待识别文本包括至少一个词组,所述词组包括至少一个实体信息;所述待识别文本对应的代码序列包括:所述至少一个词组中每个词组对应的函数、所述每个词组对应的函数包括该词组中每个实体信息对应的类别;其中,不同的词组中相同的实体信息对应的类别相同,不同的待识别文本的词组对应的函数相同或不同。
4.如权利要求1所述的生成方法,其特征在于,所述执行所述代码序列,生成针对所述当前回复请求的回复内容,包括:
针对所述代码序列中的每个函数,通过所述每个函数对应的应用程序编程接口、或所述待识别文本中对应的实体信息,确定所述函数中至少一个类别对应的实例;其中,所述实例为设置了至少一个属性值的类别;
依次执行所述代码序列中的带有实例的函数,生成针对所述当前回复请求的回复内容。
5.如权利要求1所述的生成方法,其特征在于,所述训练后的生成模型基于训练文本、训练文本对应的训练代码序列训练得到;
所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的代码序列。
6.如权利要求1所述的生成方法,其特征在于,所述训练后的生成模型基于训练文本、训练文本对应的训练转译文本训练得到;其中,所述训练转译文本用以表示所述训练文本对应的训练代码序列的内容描述;
所述根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列,包括:将所述待识别文本输入至训练后的生成模型,得到所述待识别文本对应的转译文本;
根据代码序列与转译文本之间预设的对应关系,确定所述转译文本对应的代码序列,作为所述待识别文本对应的代码序列。
7.如权利要求5或6所述的生成方法,其特征在于,所述训练文本为多组训练文本;不同组训练文本对应不同的请求内容,不同请求内容对应的类别、函数、操作符相同或不同。
8.如权利要求1所述的生成方法,其特征在于,所述类别用以表示文本中的实体信息的种类,所述函数用以表示针对所述类别的操作,所述操作符用以表示针对所述类别的约束。
9.一种回复内容的生成装置,其特征在于,所述生成装置包括:
文本获取模块,用以获取待识别文本;其中,所述待识别文本通过待识别语音转换或电子设备接收得到,用于表示当前回复请求;
代码序列生成模块,用以根据所述待识别文本、训练后的生成模型,得到所述待识别文本对应的代码序列;其中,所述代码序列为通过代码元素表示所述当前回复请求的序列,所述代码元素包括类别、函数、操作符中的一种或几种;
回复内容生成模块,用以执行所述代码序列,生成针对所述当前回复请求的回复内容。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的回复内容的生成方法。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的回复内容的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311117181.1A CN117171318A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的生成方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311117181.1A CN117171318A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的生成方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117171318A true CN117171318A (zh) | 2023-12-05 |
Family
ID=88940506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311117181.1A Pending CN117171318A (zh) | 2023-08-31 | 2023-08-31 | 回复内容的生成方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117171318A (zh) |
-
2023
- 2023-08-31 CN CN202311117181.1A patent/CN117171318A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10958598B2 (en) | Method and apparatus for generating candidate reply message | |
US11394667B2 (en) | Chatbot skills systems and methods | |
US11347783B2 (en) | Implementing a software action based on machine interpretation of a language input | |
US11816439B2 (en) | Multi-turn dialogue response generation with template generation | |
CN111428042B (zh) | 对话服务中的实体级澄清 | |
CN112136124A (zh) | 用于与计算机实现的自动助理进行人机对话会话的依赖图谈话建模 | |
US10326863B2 (en) | Speed and accuracy of computers when resolving client queries by using graph database model | |
CN110489198A (zh) | 一种工单处理的方法和系统 | |
CN114840671A (zh) | 对话生成方法、模型的训练方法、装置、设备及介质 | |
CN116737910B (zh) | 智能对话处理方法、装置、设备及存储介质 | |
Windiatmoko et al. | Developing facebook chatbot based on deep learning using rasa framework for university enquiries | |
US20220051662A1 (en) | Systems and methods for extraction of user intent from speech or text | |
CN112650842A (zh) | 基于人机交互的客服机器人意图识别方法及相关设备 | |
Windiatmoko et al. | Developing FB chatbot based on deep learning using RASA framework for university enquiries | |
CN114090755A (zh) | 基于知识图谱的回复语句确定方法、装置及电子设备 | |
CN114997414A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN114531334A (zh) | 意图处理方法、装置、电子设备和可读存储介质 | |
CN112287085A (zh) | 语义匹配方法、系统、设备及存储介质 | |
CN110249326B (zh) | 自然语言内容生成器 | |
CN117171318A (zh) | 回复内容的生成方法、装置、电子设备及存储介质 | |
CN114255750B (zh) | 数据集构建和任务式对话方法、电子设备和存储介质 | |
CN116108918A (zh) | 对话预训练模型的训练方法及相关装置 | |
WO2022264434A1 (ja) | プログラムコード自動生成システム | |
CN117077790A (zh) | 回复内容的处理方法、装置、电子设备及存储介质 | |
CN117196035A (zh) | 回复内容的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |