CN112307167A - 文本切句方法、装置、计算机设备和存储介质 - Google Patents

文本切句方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112307167A
CN112307167A CN202011185970.5A CN202011185970A CN112307167A CN 112307167 A CN112307167 A CN 112307167A CN 202011185970 A CN202011185970 A CN 202011185970A CN 112307167 A CN112307167 A CN 112307167A
Authority
CN
China
Prior art keywords
target
state
sentence cutting
sentence
state machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011185970.5A
Other languages
English (en)
Inventor
姜博怀
杨勤荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202011185970.5A priority Critical patent/CN112307167A/zh
Publication of CN112307167A publication Critical patent/CN112307167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种文本切句方法、装置、计算机设备和存储介质,涉及自然语言处理技术领域。该文本切句方法通过在接收到切句指令之后,调用切句状态机,然后根据待进行切句的目标文本的字符确定有限输入集合,利用切句状态机对有限输入集合中的目标文本进行切句处理。由于切句状态机包括多个状态、各状态分别对应的多个目标事件以及多个状态转移条件,其中,多个状态是切句状态机的状态,多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各个状态转移条件与字符的属性信息相关。本申请实施例可以实现对多种不同的语言场景中的文本进行灵活切句的目的。

Description

文本切句方法、装置、计算机设备和存储介质
技术领域
本申请涉及自然语言处理技术领域,特别是涉及一种文本切句方法、装置、计算机设备和存储介质。
背景技术
切句是将文本拆分成若干条句子,是很多自然语言处理任务数据处理的基础环节。错误的切句会影响文本的原始意思,进而影响后续的自然语言处理任务。
现有技术中,对文本进行切句的方法一般是:根据标点符号切句,即按照顺序读取待进行切句的目标文本的字符,当读取到的字符为标点符号时,即进行切句。
然而,上述文本切句方法不灵活,对复杂文本不能实现很好的切句。
发明内容
基于此,本申请实施例提供了一种文本切句方法、装置、计算机设备和存储介质。
第一方面,提供了一种文本切句方法,该方法包括:
在接收到切句指令后,调用切句状态机,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关;
将待进行切句的目标文本中的字符作为有限输入集合;
基于有限输入集合,利用切句状态机对目标文本进行切句处理。
在本申请的一个实施例中,利用切句状态机对目标文本进行切句处理,包括:
获取切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是切句事件,则执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
在本申请的一个实施例中,该方法还包括:
若当前所处状态对应的目标事件不是切句事件,则获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件;
调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,从多个状态转移条件中确定执行结果所满足的目标状态转移条件,包括:
确定读取到的字符的类型信息;
根据类型信息,从多个状态转移条件中确定类型信息所满足的目标状态转移条件。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,从多个状态转移条件中确定执行结果所满足的目标状态转移条件,包括:
确定已读取到的字符的数量;
根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
在本申请的一个实施例中,目标事件包括读取有限输入集合中的下一个字符的事件、读取有限输入集合中的前一个字符的事件、切句事件和结束事件;
状态转移条件包括字符属于停句符号,字符属于书名号,字符属于最后一个字符,字符属于外文字符和字符为第N个字符中的至少一个,其中N为已读取的字符的数量。
在本申请的一个实施例中,调用切句状态机之前,方法还包括:
提供状态机配置界面;
基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据状态配置信息确定切句状态机的多个状态;
根据目标事件信息确定各状态分别对应的目标事件;
根据状态转移条件信息确定多个状态转移条件;
根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
第二方面,提供了一种文本切句装置,该装置包括:
状态机调用模块,用于在接收到切句指令后,调用切句状态机,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关;
文本处理模块,用于将待进行切句的目标文本中的字符作为有限输入集合;
切句模块,用于基于有限输入集合,利用切句状态机对目标文本进行切句处理。
在本申请的一个实施例中,切句模块还用于:
获取切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是切句事件,则执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
在本申请的一个实施例中,切句模块还用于:
若当前所处状态对应的目标事件不是切句事件,则获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件;
调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,切句模块还用于:
确定读取到的字符的类型信息;
根据类型信息,从多个状态转移条件中确定类型信息所满足的目标状态转移条件。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,切句模块还用于:
确定已读取到的字符的数量;
根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
在本申请的一个实施例中,目标事件包括读取有限输入集合中的下一个字符的事件、读取有限输入集合中的前一个字符的事件、切句事件和结束事件;
状态转移条件包括字符属于停句符号,字符属于书名号,字符属于最后一个字符,字符属于外文字符和字符为第N个字符中的至少一个,其中N为已读取的字符的数量。
在本申请的一个实施例中,状态机调用模块还用于:
提供状态机配置界面;
基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据状态配置信息确定切句状态机的多个状态;
根据目标事件信息确定各状态分别对应的目标事件;
根据状态转移条件信息确定多个状态转移条件;
根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
第三方面,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时实现如上述第一方面所述方法的步骤。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第二方面任一项所述方法的步骤。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过在接收到切句指令之后,调用切句状态机,然后根据待进行切句的目标文本的字符确定有限输入集合,利用切句状态机对有限输入集合中的目标文本进行切句处理。由于切句状态机包括多个状态、各状态分别对应的多个目标事件以及多个状态转移条件,其中,多个状态是切句状态机的状态,多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各个状态转移条件与字符的属性信息相关。本申请实施例,可以将不同的语言场景映射为切句状态机的不同状态对应的目标事件,可以根据不同场景中文本的字符的属性信息设置与字符的属性信息相关的多个状态转移条件。这样,通过多个状态、各状态对应的目标事件以及与字符的属性信息相关的多个状态转移条件,实现对多种不同的语言场景中的文本进行灵活切句的目的。
附图说明
图1为本申请实施例涉及到的一种实施环境的示意图;
图2为本申请实施例提供的一种文本切句方法的流程图;
图3为本申请实施例提供的一种切句状态机的状态转移图;
图4为本申请实施例提供的一种对目标文本进行切句处理的方法的流程图;
图5为本申请实施例提供的一种确定目标状态转移条件的方法的示意图;
图6为本申请实施例提供的另一种确定目标状态转移条件的方法的示意图;
图7为本申请实施例提供的一种构建切句状态机的方法的流程图;
图8为本申请实施例提供的一种文本切句装置的框图;
图9为本申请实施例提供的一种计算机设备的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
通常情况下,在自然语言处理任务中,需要对文本进行合理切句,切句即是将文本拆分成若干条句子。错误的切句会影响文本的原始意思,进而影响后续的自然语言处理任务。
在一种可能的应用场景中,用户可以利用移动终端的语音通话功能进行语音输入,可以对输入的音频进行语音识别,从而将输入的音频转化为文本,然后对文本进行切句处理,以得到合理的语言句子。
在另一种可能的应用场景中,语言翻译软件在对外文进行翻译之后,可以得到翻译文本,在实际应用中,可以对翻译文本进行切句处理,以得到合理的语言句子。
上述应用场景仅仅是示例性的,其并不用于限制本申请。在实际应用中,还可能存在其他需要对文本进行切句处理的场景,本申请实施例在此不进行一一赘述。
相关技术中,对文本进行切句的方法一般是:根据标点符号切句,即按照顺序读取待进行切句的目标文本的字符,当读取到的字符为标点符号时,即进行切句。然而,汉语语言较为复杂,且灵活多变。在实际应用中,文本中常常会出现连续的标点符号,例如“你说什么!?这是不能这么定!”。在一些特殊的应用场景中,还可能出现较为复杂的连续标点符号,例如“张三问『这里是哪里?我为什么在这?』『这是东莱国。』白衣老者答道。”而上述文本切句方法的切句方式较为单一,且切句方式不灵活,因此无法对具有复杂语义的文本进行合理切句。
本申请实施例中,考虑到汉语语言的复杂性和灵活性,提供了一种基于有限状态机的文本切句方法,该方法通过在接收到切句指令之后,调用切句状态机,然后根据待进行切句的目标文本的字符确定有限输入集合,利用切句状态机对有限输入集合中的目标文本进行切句处理。由于切句状态机包括多个状态、各状态分别对应的多个目标事件以及多个状态转移条件,其中,多个状态是切句状态机的状态,多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各个状态转移条件与字符的属性信息相关。本申请实施例,可以将不同的语言场景映射为切句状态机的不同状态对应的目标事件,可以根据不同场景中文本的字符的属性信息设置与字符的属性信息相关的多个状态转移条件。这样,通过多个状态、各状态对应的目标事件以及与字符的属性信息相关的多个状态转移条件,实现对多种不同的语言场景中的文本进行灵活切句的目的。
下面,将对本申请实施例提供的文本切句方法所涉及到的实施环境进行简要说明。
如图1所示,该实施环境包括服务器101和终端102,其中,服务器101和终端102可以通过有线或者无线的方式进行通信。
图1所示的实施环境中,终端102可以基于不同的应用场景获取待进行切句的目标文本,在获取待进行切句的目标文本之后,终端102可以将该待进行切句的目标文本发送至服务器101,以由服务器101对该待进行切句的目标文本执行本申请实施例提供的文本切句方法。
需要指出的是,在一些可能的实现方式中,本申请实施例提供的文本切句方法所涉及到的实施环境可以仅包括终端102,在实时环境仅包括终端102的情况下,终端102可以基于不同的应用场景获取待进行切句的目标文本,并在获取到待进行切句的目标文本之后,终端102可以对该待进行切句的目标文本执行本申请实施例提供的文本切句方法。
还需要指出的是,在另一些可能的实现方式中,本申请实施例提供的文本切句方法所涉及到的实施环境可以仅包括服务器101。在实施环境仅包括服务器101的情况下,服务器101可以维护一数据库,该数据库中可以存储有待进行切句的目标文本,该待进行切句的目标文本可以是在不同的应用场景下获取到的文本,服务器101可以对数据库中存储的待进行切句的目标文本执行本申请实施例提供的文本切句方法。
请参考图2,其示出了本申请实施例提供的一种文本切句方法的流程图,该文本切句方法可以应用于上文所述的实施环境中的服务器或者终端中(下文统一称为计算机设备)。如图2所示,该文本切句方法可以包括以下步骤:
步骤201、计算机设备在接收到切句指令后,调用切句状态机。
其中,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关。
本申请实施例中,可以提供指令输入界面,计算机设备可以响应于指令输入界面中用户的输入操作接收到切句指令,然后调用预先设置好的切句状态机。其中,设置切句状态机的过程可以详见下述内容。
下面对本申请实施例提供的切句状态机的架构进行说明,切句状态机包括以下六个部分,该六个部分为状态的有限集合、有限输入集合、初始状态、终止状态、状态转移条件和状态转移函数。其中:
状态的有限集合,是指切句状态机包括的多个状态组成的集合,其中,在任意一个时刻,切句状态机只处于一种状态。状态的有限集合还可以包括各状态所分别对应的目标事件,目标事件为切句状态机的驱动事件,本申请实施例中,目标事件为基于待进行切句的目标文本发生的事件。
有限输入集合,是指待进行切句的目标文本的字符组成的集合,有限输入集合为切句状态机的输入数据。
初始状态,是指切句状态机在进行初始化之后所处的状态。本申请实施例中,计算机设备调用切句状态机之后,切句状态机响应于切句指令而进行初始化,在初始化之后,切句状态机所处的状态为初始状态。
终止状态,是指切句状态机完成切句任务时所处的状态。
状态转移条件,是指切句状态机在多个状态之间进行转移时所需要满足的条件。在一种可选的实现方式中,切句状态机包括的多个状态转移条件可以形成分别对应于各个状态的状态转移条件集合,不同的状态对应的状态转移条件集合中包括的状态转移条件可以部分相同或者全部相同。各个状态对应的状态转移条件集合中包括的状态转移条件是指从各个状态转移至其他状态所需满足的条件。
状态转移函数,包括各状态转移条件分别对应的状态转移函数,状态转移函数用于在满足状态转移条件的情况下将切句状态机从当前所处状态跳转至目标状态,其中,目标状态与状态转移条件相关。
如图3所示,图3中示例性地示出了一种切句状态机的状态转移图。其中,圆框表示切句状态机的状态,圆框中的文字表示目标事件,方框表示状态转移条件,箭头指示方向用于表示切句状态机在状态之间进行跳转时的跳转方向,q0表示初始状态,F表示终止状态,i表示从有限输入集合中读取的字符。
步骤202、计算机设备将待进行切句的目标文本中的字符作为有限输入集合。
如上文所述,该待进行切句的目标文本可以是在不同的应用场景中获得的文本。
计算机设备可以将目标文本中的字符组成切句状态机的有限输入集合并输入到切句状态机中。
步骤203、计算机设备基于有限输入集合,利用切句状态机对目标文本进行切句处理。
本申请实施例中,切句状态机包括的多个状态分别对应的目标事件至少包括切句事件和读取切句状态机的有限输入结合中的字符的读取事件。这样,切句状态机可以通过读取事件读取待进行切句的目标文本中的字符,并根据读取到的字符进行状态跳转,以从当前所处状态跳转至下一个状态,当切句状态机跳转到的下一个状态对应的目标事件为切句事件时,可以对目标文本进行切句。
在切句之后,切句状态机的状态可以回到初始状态,并准备下一次切句,直至运行到目标文本的末尾,进入终止状态,并输出对目标文本的切句结果。
本申请实施例提供的文本切句方法,通过在接收到切句指令之后,调用切句状态机,然后根据待进行切句的目标文本的字符确定有限输入集合,利用切句状态机对有限输入集合中的目标文本进行切句处理。由于切句状态机包括多个状态、各状态分别对应的多个目标事件以及多个状态转移条件,其中,多个状态是切句状态机的状态,多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各个状态转移条件与字符的属性信息相关。本申请实施例,可以将不同的语言场景映射为切句状态机的不同状态对应的目标事件,可以根据不同场景中文本的字符的属性信息设置与字符的属性信息相关的多个状态转移条件。这样,通过多个状态、各状态对应的目标事件以及与字符的属性信息相关的多个状态转移条件,实现对多种不同的语言场景中的文本进行灵活切句的目的。
在上文所述的实施例的基础上,下面,本申请实施例将对利用切句状态机对目标文本进行切句处理的技术过程进行说明。如图4所示,该技术过程可以包括以下步骤:
步骤401,计算机设备获取切句状态机当前所处状态对应的目标事件。
本申请实施例中,切句状态机响应于切句指令而进行初始化,在初始化之后,切句状态机所处的状态为初始状态。然后,计算机设备可以调用切句状态机读取目标文本中的第一个字符,并调用切句状态机获取初始状态对应的目标事件,并执行该初始状态机对应的目标事件,得到执行结果。
举例而言,若初始状态对应的目标事件为读取下一个字符,得到的执行结果就是读取了目标文本中的第二个字符。本申请实施例中,可以根据读取到的第二个字符从多个状态转移条件中确定出该第二个字符所满足的目标状态转移条件。然后调用目标状态转移条件对应的状态转移函数,利用该状态转移函数将切句状态机从初始状态跳转至下一个状态。其中,如图3所示,该下一个状态为与目标状态转移条件关联的箭头所指向的状态。
在一种可选的实现方式中,本申请实施例中,各个状态可以分别对应一个状态转移条件集合,各个状态转移条件集合可以包括至少一个状态转移条件,多个状态转移条件集合包括的状态转移条件组成上述多个状态转移条件。本申请实施例中,计算机设备可以根据读取到的第二个字符从初始状态对应的状态转移条件集合中确定出该第二个字符所满足的目标状态转移条件。
当切句状态机跳转至下一个状态之后,该下一个状态为切句状态机当前所处状态。计算机设备可以根据切句状态机可以从状态的有限集合中获取当前所处状态对应的目标事件。
可选的,目标事件可以包括读取有限输入集合中的下一个字符的事件、读取有限输入集合中的前一个字符的事件、切句事件和终止事件。
步骤402,若当前所处状态对应的目标事件不是切句事件,则计算机设备获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件。
本申请实施例中,在当前所处状态对应的目标事件不是切句事件的情况下,计算机设备可以执行当前所处状态对应的目标事件,并得到的执行结果。举例而言,例如当前所处状态对应的目标事件为“读取前一个字符”,那么当前所处状态对应的目标事件的执行结果为:读取到了一个字符。为便于后续说明,下面以读取到的字符为“在”进行说明。
然后计算机设备可以根据该执行结果从多个状态转移条件中确定执行结果所满足的目标状态转移条件。
可选的,本申请实施例中,状态转移条件可以包括字符属于停句符号,字符属于书名号,字符属于最后一个字符,字符属于外文字符和字符为第N个字符中的至少一个,其中N为已读取的字符的数量。
其中,本申请实施例提供了两种确定执行结果所满足的目标状态转移条件的场景,下面,如图5所示,对第一种场景进行说明,在第一种场景中,当前所处状态对应的目标事件为读取切句状态机的有限输入集合中的字符的读取事件,该读取事件的执行结果为读取到的字符。
步骤501,计算机设备确定读取到的字符的类型信息。
本申请实施例中,字符的类型信息可以包括文字、停句符号、连续停句符号和英文字母等,其中,读取到的字符的类型信息可以是上述这些类型信息中的一种。
承接上文举例,本申请实施例中,读取到的字符为“在”,该字符的类型信息为:文字。
步骤502,计算机设备根据所述类型信息,从所述多个状态转移条件中确定所述类型信息所满足的所述目标状态转移条件。
本申请实施例中,多个状态转移条件与字符的属性信息相关,其中,字符的类型信息为字符的属性信息中的一种。举例而言,多个状态转移条件可以例如包括:属于停句符号、属于文字、属于阿拉伯字母等。
计算机设备可以根据读取到的字符为“在”的类型信息,逐一地与当前所处状态对应的状态转移条件集合中包括的多个状态转移条件进行比对,显然,“在”的类型信息不满足“属于停句符号”这一状态转移条件,也不满足“属于阿拉伯字母”这一状态转移条件,满足“属于文字”这一状态转移条件。因此,“属于文字”这一状态转移条件即该执行结果所满足的目标状态转移条件。
本申请实施例中,根据字符的类型信息可以确定出停句符号,并能够在遇到停句符号的情况下,对目标文本进行切句处理。
下面,如图6所示,对第二种场景进行说明,在第二种场景中,当前所处状态对应的目标事件为读取切句状态机的有限输入集合中的字符的读取事件,该读取事件的执行结果为读取到的字符。
步骤601,计算机设备确定已读取到的字符的数量。
本申请实施例中,已读取到的字符的数量为字符的属性信息中的一种,计算机设备可以调用切句状态机记录已经读取的字符的数量,每读取一个字符,在数量上进行加1处理,从而获取当前已经读取到的字符的数量。
步骤602,计算机设备根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
举例而言,例如已读取到的字符的数量为10,而当前所处状态对应的目标状态转移条件集合中包括的多个状态转移条件分别为:等于15字符、不等于15字符、属于文字、属于停句符号。
计算机设备可以根据已读取到的字符的数量,逐一地与当前所处状态对应的状态转移条件集合中包括的多个状态转移条件进行比对,显然,该已读取到的字符的数量满足“不等于15字符”这一状态转移条件。不满足其他状态转移条件。因此“不等于15字符”即该执行结果所满足的目标状态转移条件。
本申请实施例中,根据字符的数量对目标文本进行短句合并或者将长句切为短句,可以实现对目标文本进行灵活切句。
步骤403,计算机设备调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
本申请实施例中,各状态转移条件对应的状态转移函数是预先设置好的,在计算机代码中,状态转移函数可以通过哈希表实现。
可选的,本申请实施例中,状态转移函数可以按照用户的需求进行自定义,以便于将切句状态机的状态从当前所处状态跳转至其他任意一个状态。
计算机设备可以根据目标状态转移条件确定出目标状态转移条件对应的状态转移函数,并基于状态转移函数将切句状态机从当前所处状态跳转至目标状态,其中,目标状态为目标状态转移函数中已经预先设置好的状态。
步骤404,若当前所处状态对应的目标事件是切句事件,则计算机设备执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
若当前所处状态对应的目标事件是切句事件,则计算机设备执行切句事件,执行的过程是指在已读取的最后一个字符的位置处对目标文本进行切句,例如是在已读取的最后一个字符的位置处添加空格,以将已读取字符与未读取的字符分隔开。
本申请实施例中,在当前所处状态对应的目标事件是切句事件的情况下,对目标文本进行切句处理,实现了灵活地的目标文本进行切句的目的。
本申请实施例中,提供了一种构建切句状态机的方法,如图7所示,该方法包括以下步骤:
步骤701,计算机设备提供状态机配置界面。
本申请实施例中,状态机配置界面可以如图8所示,状态机配置界面可以具有选择功能和编辑功能。
步骤702,计算机设备基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息。
在一种可选的实现方式中,用户可以基于状态机配置界面的编辑功能进行编辑操作,以输入状态配置信息、目标事件信息以及状态转移条件信息。
在另一种可选的实现方式中,计算机设备中可以预先存储有已经设置好的多种状态配置信息、多种目标事件配置信息和多种状态转移条件信息;用户可以通过状态机配置界面中的选择功能,从预先设置好的多种状态配置信息、多种目标事件配置信息和多种状态转移条件信息中选择并输入需要的状态配置信息、目标事件信息以及状态转移条件信息。
步骤703,计算机设备根据状态配置信息确定切句状态机的多个状态,根据目标事件信息确定各状态分别对应的目标事件,根据状态转移条件信息确定多个状态转移条件。
步骤704,计算机设备根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
本申请实施例中,计算机设备可以根据多个状态,各状态分别对应的目标事件以及多个状态转移条件构建切句逻辑和各个状态转移条件对应的状态转移函数,从而生成切句状态机。
本申请实施例中,切句状态机包括的多个状态、各状态分别对应的目标事件以及多个状态转移条件均可以通过自定义的方式获取,这样用户可以按照需求自定义任意的切句逻辑,而不需要花费时间对不同的目标文本单独开发不同的切句工具,因此本申请实施例提供的切句状态机,降低了对目标文本进行切句处理的成本,并提高了工作效率。
请参考图8,其示出了本申请实施例提供的一种文本切句装置800的框图,该文本切句装置800可以配置于图1示出的服务器或者终端中。如图8所示,该文本切句装置可以包括:状态机调用模块801、文本处理模块802和切句模块803,其中:
状态机调用模块801,用于在接收到切句指令后,调用切句状态机,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关;
文本处理模块802,用于将待进行切句的目标文本中的字符作为有限输入集合;
切句模块803,用于基于有限输入集合,利用切句状态机对目标文本进行切句处理。
在本申请的一个实施例中,切句模块803还用于:
获取切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是切句事件,则执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
在本申请的一个实施例中,切句模块803还用于:
若当前所处状态对应的目标事件不是切句事件,则获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件;
调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,切句模块803还用于:
确定读取到的字符的类型信息;
根据类型信息,从多个状态转移条件中确定类型信息所满足的目标状态转移条件。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,切句模块803还用于:
确定已读取到的字符的数量;
根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
在本申请的一个实施例中,目标事件包括读取有限输入集合中的下一个字符的事件、读取有限输入集合中的前一个字符的事件、切句事件和结束事件;
状态转移条件包括字符属于停句符号,字符属于书名号,字符属于最后一个字符,字符属于外文字符和字符为第N个字符中的至少一个,其中N为已读取的字符的数量。
在本申请的一个实施例中,状态机调用模块801还用于:
提供状态机配置界面;
基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据状态配置信息确定切句状态机的多个状态;
根据目标事件信息确定各状态分别对应的目标事件;
根据状态转移条件信息确定多个状态转移条件;
根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
关于文本切句装置的具体限定可以参见上文中对于文本切句方法的限定,在此不再赘述。上述文本切句装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块的操作。
在本申请的一个实施例中,提供了一种计算机设备,该计算机设备可以为终端或者服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器和存储器。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机程序被处理器执行时以实现一种文本切句方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请的一个实施例中,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
在接收到切句指令后,调用切句状态机,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关;
将待进行切句的目标文本中的字符作为有限输入集合;
基于有限输入集合,利用切句状态机对目标文本进行切句处理。
在本申请的一个实施例中,该处理器执行计算机程序时实现以下步骤:
获取切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是切句事件,则执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
在本申请的一个实施例中,该处理器执行计算机程序时实现以下步骤:若当前所处状态对应的目标事件不是切句事件,则获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件;
调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,该处理器执行计算机程序时实现以下步骤:确定读取到的字符的类型信息;
根据类型信息,从多个状态转移条件中确定类型信息所满足的目标状态转移条件。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,该处理器执行计算机程序时实现以下步骤:确定已读取到的字符的数量;
根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
在本申请的一个实施例中,该处理器执行计算机程序时实现以下步骤:
提供状态机配置界面;
基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据状态配置信息确定切句状态机的多个状态;
根据目标事件信息确定各状态分别对应的目标事件;
根据状态转移条件信息确定多个状态转移条件;
根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
本申请实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在本申请的一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在接收到切句指令后,调用切句状态机,切句状态机包括多个状态、各状态分别对应的目标事件以及多个状态转移条件,其中,切句状态机包括的多个目标事件至少包括切句事件和读取切句状态机的有限输入集合中的字符的读取事件,各状态转移条件与字符的属性信息相关;
将待进行切句的目标文本中的字符作为有限输入集合;
基于有限输入集合,利用切句状态机对目标文本进行切句处理。
在本申请的一个实施例中,计算机程序被处理器执行时实现以下步骤:
获取切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是切句事件,则执行切句事件,以在已读取的最后一个字符的位置处对目标文本进行切句。
在本申请的一个实施例中,计算机程序被处理器执行时实现以下步骤:
若当前所处状态对应的目标事件不是切句事件,则获取当前所处状态对应的目标事件的执行结果,并从多个状态转移条件中确定执行结果所满足的目标状态转移条件;
调用目标状态转移条件对应的状态转移函数,利用状态转移函数将切句状态机从当前所处状态跳转至目标状态。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,计算机程序被处理器执行时实现以下步骤:确定读取到的字符的类型信息;
根据类型信息,从多个状态转移条件中确定类型信息所满足的目标状态转移条件。
在本申请的一个实施例中,当前所处状态对应的目标事件为读取事件,执行结果为读取到的字符,计算机程序被处理器执行时实现以下步骤:确定已读取到的字符的数量;
根据已读取到的字符的数量从多个状态转移条件中确定已读取的字符的数量所满足的目标状态转移条件。
在本申请的一个实施例中,计算机程序被处理器执行时实现以下步骤:
提供状态机配置界面;
基于状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据状态配置信息确定切句状态机的多个状态;
根据目标事件信息确定各状态分别对应的目标事件;
根据状态转移条件信息确定多个状态转移条件;
根据多个状态,各状态分别对应的目标事件以及多个状态转移条件生成切句状态机。
本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文本切句方法,其特征在于,所述方法包括:
在接收到切句指令后,调用切句状态机,所述切句状态机包括多个状态、各所述状态分别对应的目标事件以及多个状态转移条件,其中,所述切句状态机包括的多个所述目标事件至少包括切句事件和读取所述切句状态机的有限输入集合中的字符的读取事件,各所述状态转移条件与字符的属性信息相关;
将待进行切句的目标文本中的字符作为所述有限输入集合;
基于所述有限输入集合,利用所述切句状态机对所述目标文本进行切句处理。
2.根据权利要求1所述的方法,其特征在于,所述利用所述切句状态机对所述目标文本进行切句处理,包括:
获取所述切句状态机当前所处状态对应的目标事件;
若当前所处状态对应的目标事件是所述切句事件,则执行所述切句事件,以在已读取的最后一个字符的位置处对所述目标文本进行切句。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若当前所处状态对应的目标事件不是所述切句事件,则获取当前所处状态对应的目标事件的执行结果,并从所述多个状态转移条件中确定所述执行结果所满足的目标状态转移条件;
调用所述目标状态转移条件对应的状态转移函数,利用所述状态转移函数将所述切句状态机从当前所处状态跳转至目标状态。
4.根据权利要求3所述的方法,其特征在于,所述当前所处状态对应的目标事件为所述读取事件,所述执行结果为读取到的字符,所述从所述多个状态转移条件中确定所述执行结果所满足的目标状态转移条件,包括:
确定读取到的字符的类型信息;
根据所述类型信息,从所述多个状态转移条件中确定所述类型信息所满足的所述目标状态转移条件。
5.根据权利要求3所述的方法,其特征在于,所述当前所处状态对应的目标事件为所述读取事件,所述执行结果为读取到的字符,所述从所述多个状态转移条件中确定所述执行结果所满足的目标状态转移条件,包括:
确定已读取到的字符的数量;
根据所述已读取到的字符的数量从所述多个状态转移条件中确定所述已读取的字符的数量所满足的所述目标状态转移条件。
6.根据权利要求1所述的方法,其特征在于,所述目标事件包括读取所述有限输入集合中的下一个字符的事件、读取所述有限输入集合中的前一个字符的事件、切句事件和结束事件;
所述状态转移条件包括字符属于停句符号,字符属于书名号,字符属于最后一个字符,字符属于外文字符和字符为第N个字符中的至少一个,其中N为已读取的字符的数量。
7.根据权利要求1所述的方法,其特征在于,所述调用切句状态机之前,所述方法还包括:
提供状态机配置界面;
基于所述状态机配置界面接收用户输入的状态配置信息、目标事件信息以及状态转移条件信息;
根据所述状态配置信息确定所述切句状态机的多个状态;
根据所述目标事件信息确定各所述状态分别对应的目标事件;
根据所述状态转移条件信息确定所述多个状态转移条件;
根据所述多个状态,各所述状态分别对应的目标事件以及多个状态转移条件生成所述切句状态机。
8.一种文本切句装置,其特征在于,所述装置包括:
状态机调用模块,用于在接收到切句指令后,调用切句状态机,所述切句状态机包括多个状态、各所述状态分别对应的目标事件以及多个状态转移条件,其中,所述切句状态机包括的多个所述目标事件至少包括切句事件和读取所述切句状态机的有限输入集合中的字符的读取事件,各所述状态转移条件与字符的属性信息相关;
文本处理模块,用于将待进行切句的目标文本中的字符作为所述有限输入集合;
切句模块,用于基于所述有限输入集合,利用所述切句状态机对所述目标文本进行切句处理。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011185970.5A 2020-10-30 2020-10-30 文本切句方法、装置、计算机设备和存储介质 Pending CN112307167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011185970.5A CN112307167A (zh) 2020-10-30 2020-10-30 文本切句方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011185970.5A CN112307167A (zh) 2020-10-30 2020-10-30 文本切句方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112307167A true CN112307167A (zh) 2021-02-02

Family

ID=74332237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011185970.5A Pending CN112307167A (zh) 2020-10-30 2020-10-30 文本切句方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112307167A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114485718A (zh) * 2022-01-05 2022-05-13 腾讯科技(深圳)有限公司 语音导航方法、装置、电子设备、存储介质以及程序产品

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201834A (zh) * 2007-11-01 2008-06-18 复旦大学 基于文档类型定义的xml数据流关键字搜索方法
CN101957751A (zh) * 2010-06-04 2011-01-26 福建星网锐捷网络有限公司 一种状态机的实现方法及装置
CN102103497A (zh) * 2009-12-18 2011-06-22 阿尔卡特朗讯 有限状态机执行装置和方法、在应用中的建立和使用方法
CN105045603A (zh) * 2015-08-24 2015-11-11 北京金山安全软件有限公司 一种构建有限状态机模型框架的方法、装置及电子装置
CN105868113A (zh) * 2016-03-31 2016-08-17 广州华多网络科技有限公司 字符串查找方法及装置
US20160294952A1 (en) * 2015-03-30 2016-10-06 24/7 Customer, Inc. Method and apparatus for facilitating stateless representation of interaction flow states
US20160350282A1 (en) * 2014-02-25 2016-12-01 Tencent Technology (Shenzhen) Company Limited Sensitive text detecting method and apparatus
CN106802886A (zh) * 2016-12-30 2017-06-06 语联网(武汉)信息技术有限公司 一种多语文本的切词方法
CN106874259A (zh) * 2017-02-23 2017-06-20 腾讯科技(深圳)有限公司 一种基于状态机的语义解析方法及装置、设备
CN107247706A (zh) * 2017-06-16 2017-10-13 中国电子技术标准化研究院 文本断句模型建立方法、断句方法、装置及计算机设备
CN108334492A (zh) * 2017-12-05 2018-07-27 腾讯科技(深圳)有限公司 文本分词、即时消息处理方法和装置
CN108563631A (zh) * 2018-03-23 2018-09-21 江苏速度信息科技股份有限公司 一种自然语言地址描述的自动识别方法
CN108597517A (zh) * 2018-03-08 2018-09-28 深圳市声扬科技有限公司 标点符号添加方法、装置、计算机设备和存储介质
CN109145282A (zh) * 2017-06-16 2019-01-04 贵州小爱机器人科技有限公司 断句模型训练方法、断句方法、装置及计算机设备
CN109683897A (zh) * 2018-12-29 2019-04-26 广州华多网络科技有限公司 程序处理方法、装置及设备
CN109981818A (zh) * 2019-03-25 2019-07-05 上海予桐电子科技有限公司 域名语义异常分析方法、装置、计算机设备及其存储介质
US20190370615A1 (en) * 2016-10-31 2019-12-05 Talla, Inc. State machine methods and apparatus comprising work unit transitions that execute acitons relating to natural language communication, and artifical intelligence agents to monitor state machine status and generate events to trigger state machine transitions

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201834A (zh) * 2007-11-01 2008-06-18 复旦大学 基于文档类型定义的xml数据流关键字搜索方法
CN102103497A (zh) * 2009-12-18 2011-06-22 阿尔卡特朗讯 有限状态机执行装置和方法、在应用中的建立和使用方法
CN101957751A (zh) * 2010-06-04 2011-01-26 福建星网锐捷网络有限公司 一种状态机的实现方法及装置
US20160350282A1 (en) * 2014-02-25 2016-12-01 Tencent Technology (Shenzhen) Company Limited Sensitive text detecting method and apparatus
US20160294952A1 (en) * 2015-03-30 2016-10-06 24/7 Customer, Inc. Method and apparatus for facilitating stateless representation of interaction flow states
CN105045603A (zh) * 2015-08-24 2015-11-11 北京金山安全软件有限公司 一种构建有限状态机模型框架的方法、装置及电子装置
CN105868113A (zh) * 2016-03-31 2016-08-17 广州华多网络科技有限公司 字符串查找方法及装置
US20190370615A1 (en) * 2016-10-31 2019-12-05 Talla, Inc. State machine methods and apparatus comprising work unit transitions that execute acitons relating to natural language communication, and artifical intelligence agents to monitor state machine status and generate events to trigger state machine transitions
CN106802886A (zh) * 2016-12-30 2017-06-06 语联网(武汉)信息技术有限公司 一种多语文本的切词方法
CN106874259A (zh) * 2017-02-23 2017-06-20 腾讯科技(深圳)有限公司 一种基于状态机的语义解析方法及装置、设备
CN109145282A (zh) * 2017-06-16 2019-01-04 贵州小爱机器人科技有限公司 断句模型训练方法、断句方法、装置及计算机设备
CN107247706A (zh) * 2017-06-16 2017-10-13 中国电子技术标准化研究院 文本断句模型建立方法、断句方法、装置及计算机设备
CN108334492A (zh) * 2017-12-05 2018-07-27 腾讯科技(深圳)有限公司 文本分词、即时消息处理方法和装置
CN108597517A (zh) * 2018-03-08 2018-09-28 深圳市声扬科技有限公司 标点符号添加方法、装置、计算机设备和存储介质
CN108563631A (zh) * 2018-03-23 2018-09-21 江苏速度信息科技股份有限公司 一种自然语言地址描述的自动识别方法
CN109683897A (zh) * 2018-12-29 2019-04-26 广州华多网络科技有限公司 程序处理方法、装置及设备
CN109981818A (zh) * 2019-03-25 2019-07-05 上海予桐电子科技有限公司 域名语义异常分析方法、装置、计算机设备及其存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐健等: "基于有限状态机的SMS液晶显示终端的研究与实现", 《自动化技术与应用》, vol. 25, no. 11, 31 December 2006 (2006-12-31), pages 24 - 26 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114485718A (zh) * 2022-01-05 2022-05-13 腾讯科技(深圳)有限公司 语音导航方法、装置、电子设备、存储介质以及程序产品

Similar Documents

Publication Publication Date Title
CN110765763B (zh) 语音识别文本的纠错方法、装置、计算机设备和存储介质
CN109840083B (zh) 网页组件模板构建方法、装置、计算机设备和存储介质
CN112181489B (zh) 代码迁移方法、装置、计算机设备及存储介质
CN109597618B (zh) 程序开发方法、装置、计算机设备及存储介质
US9959868B1 (en) Conversational programming interface
CN112446218A (zh) 长短句文本语义匹配方法、装置、计算机设备及存储介质
CN111191079A (zh) 一种文档内容获取方法、装置、设备及存储介质
CN108846069B (zh) 一种基于标记语言的文档执行方法及装置
CN104951219A (zh) 一种移动终端文本输入的方法及移动终端
CN111126010B (zh) Freemaker模板文件修复方法、装置、计算机设备及存储介质
CN112307167A (zh) 文本切句方法、装置、计算机设备和存储介质
CN113283228A (zh) 文档生成方法、装置、电子设备及存储介质
CN116955557A (zh) 应用于大语言模型的提示词确定方法、装置、设备及介质
CN110688400A (zh) 数据处理方法、装置、计算机设备和存储介质
CN113626468B (zh) 基于人工智能的sql语句生成方法、装置、设备及存储介质
CN109344385B (zh) 自然语言处理方法、装置、计算机设备和存储介质
CN111353027A (zh) 聊天机器人中的答案反馈方法、装置、计算机设备和介质
CN108132783A (zh) 一种Web App的配置方法及装置
CN111142871A (zh) 一种前端页面开发系统、方法、设备、介质
CN111026604A (zh) 一种日志文件解析方法及装置
CN111796830B (zh) 一种协议解析处理方法、装置、设备及介质
CN114490510A (zh) 文本流归档方法、装置、计算机设备及存储介质
CN113448982A (zh) Ddl语句的解析方法、装置、计算机设备及存储介质
CN113221506A (zh) 一种讲义排版的方法、装置、电子设备及存储介质
CN109857393B (zh) 顺序控制图的可视化实现方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination