CN113221514A - 文本处理方法、装置、电子设备和存储介质 - Google Patents

文本处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113221514A
CN113221514A CN202110485808.3A CN202110485808A CN113221514A CN 113221514 A CN113221514 A CN 113221514A CN 202110485808 A CN202110485808 A CN 202110485808A CN 113221514 A CN113221514 A CN 113221514A
Authority
CN
China
Prior art keywords
word
target
words
sentence
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110485808.3A
Other languages
English (en)
Inventor
杜春赛
徐文铭
郑翔
杨晶生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202110485808.3A priority Critical patent/CN113221514A/zh
Publication of CN113221514A publication Critical patent/CN113221514A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本公开提供一种文本处理方法、装置、电子设备和存储介质。该方法的一具体实施方式包括:向用户展示目标文本;响应于用户将目标文本中的原始词语修改为目标词语的修改操作,确定修改操作对应的相关词语,其中,相关词语集合中的相关词语基于原始词语的文字和/或读音确定;将相关词语替换为目标词语。该实施方式能够有效提高用户对文本进行编辑修改的效率,并且能够提高文本纠错的准确率。

Description

文本处理方法、装置、电子设备和存储介质
技术领域
本公开的实施例涉及文本处理技术领域,具体涉及文本处理方法、装置、电子设备和存储介质。
背景技术
语音识别技术(Automatic Speech Recognition,ASR)可以利用超大规模语言模式识别以及自主学习技术,预测对话语境,对各类业务生成的声音信号做集中的分析处理,实现高效的语音转写文字服务。
语音识别出的文本通常会存在错误,需要对其进行纠正。例如,对于一些专有名词,如人名及专业术语,识别难度较大,错误率较高,常会映射成一些常用词,需要将其纠正为专有名词。现有方式中通常依靠人工方式对语音识别文本进行纠错,效率较低。
因此,有必要提出一种新的对文本进行处理的技术方案。
发明内容
本公开的实施例提出了文本处理方法、装置、电子设备和存储介质。
第一方面,本公开提供了一种文本处理方法,包括:
向用户展示目标文本;
响应于用户将上述目标文本中的原始词语修改为目标词语的修改操作,确定上述修改操作对应的相关词语集合,其中,上述相关词语集合中的相关词语基于上述原始词语的文字和/或读音确定;
将上述相关词语替换为上述目标词语。
在一些可选的实施方式中,上述将上述相关词语替换为上述目标词语,包括:
向用户展示替换提示信息;
响应于用户对上述替换提示信息的确认操作,将上述相关词语替换为上述目标词语。
在一些可选的实施方式中,上述确定上述修改操作对应的相关词语集合,包括:
在上述目标文本中查找与上述原始词语的文字相同的第一词语,得到第一词语集合;
在预设混淆音字典中查找上述目标词语的读音对应的近似读音,以及在上述目标文本中查找上述近似读音对应的第二词语,得到第二词语集合;
根据上述第一词语集合和上述第二词语集合中的至少一项,得到上述修改操作对应的相关词语集合。
在一些可选的实施方式中,上述根据上述第一词语集合和上述第二词语集合中的至少一项,得到上述修改操作对应的相关词语集合,包括:
根据上述第一词语和/或上述第二词语所在句子的语法特性,确定上述第一词语和/或上述第二词语是否为上述相关词语;
响应于确定是,将上述第一词语和/或上述第二词语确定为上述相关词语集合中的元素。
在一些可选的实施方式中,上述根据上述第一词语和/或上述第二词语所在句子的语法特性,确定上述第一词语和/或上述第二词语是否为上述相关词语,包括以下至少一项:
根据上述第一词语和/或上述第二词语在相应句子中的词性,确定上述第一词语和/或上述第二词语是否为上述相关词语;
根据上述第一词语和/或上述第二词语所在句子的通顺度,确定上述第一词语和/或上述第二词语是否为上述相关词语;
将上述第一词语和/或上述第二词语、上述第一词语和/或上述第二词语所在句子以及上述目标词语输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述根据上述第一词语和/或上述第二词语所在句子的语法特性,确定上述第一词语和/或上述第二词语是否为上述相关词语,包括:
根据上述第一词语和/或上述第二词语在相应句子中的词性和上述第一词语和/或上述第二词语所在句子的通顺度,初步判断上述第一词语和/或上述第二词语是否为上述相关词语;
响应于上述初步判断的结果为是,将上述第一词语和/或上述第二词语所在句子输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述目标文本通过语音识别处理得到。
第二方面,本公开提供了一种文本处理装置,包括:
展示单元,用于向用户展示目标文本;
确定单元,用于响应于用户将上述目标文本中的原始词语修改为目标词语的修改操作,确定上述修改操作对应的相关词语集合,其中,上述相关词语集合中的相关词语基于上述原始词语的文字和/或读音确定;
替换单元,用于将上述相关词语替换为上述目标词语。
在一些可选的实施方式中,上述替换单元进一步用于:
向用户展示替换提示信息;
响应于用户对上述替换提示信息的确认操作,将上述相关词语替换为上述目标词语。
在一些可选的实施方式中,上述确定单元进一步用于:在上述目标文本中查找与上述原始词语的文字相同的第一词语,得到第一词语集合;
在预设混淆音字典中查找上述目标词语的读音对应的近似读音,以及在上述目标文本中查找上述近似读音对应的第二词语,得到第二词语集合;
根据上述第一词语集合和上述第二词语集合中的至少一项,得到上述修改操作对应的相关词语集合。
在一些可选的实施方式中,上述确定单元进一步用于:
根据上述第一词语和/或上述第二词语所在句子的语法特性,确定上述第一词语和/或上述第二词语是否为上述相关词语;
响应于确定是,将上述第一词语和/或上述第二词语确定为上述相关词语集合中的元素。
在一些可选的实施方式中,上述确定单元进一步用于:
根据上述第一词语和/或上述第二词语在相应句子中的词性,确定上述第一词语和/或上述第二词语是否为上述相关词语;
根据上述第一词语和/或上述第二词语所在句子的通顺度,确定上述第一词语和/或上述第二词语是否为上述相关词语;
将上述第一词语和/或上述第二词语、上述第一词语和/或上述第二词语所在句子以及上述目标词语输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述确定单元进一步用于:
根据上述第一词语和/或上述第二词语在相应句子中的词性和上述第一词语和/或上述第二词语所在句子的通顺度,初步判断上述第一词语和/或上述第二词语是否为上述相关词语;
响应于上述初步判断的结果为是,将上述第一词语和/或上述第二词语所在句子输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述目标文本通过语音识别处理得到。
第三方面,本公开提供了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开第一方面任一实施方式描述的方法。
第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如本公开第一方面任一实施方式描述的方法。
本公开的实施例提供的文本处理方法、装置、电子设备和存储介质,基于用户对目标文本的修改操作,确定修改操作对应的相关词语并将其替换为目标词语,能够对相关词语进行批量修改,有效提高用户对文本进行编辑修改的效率。此外,还能够避免遗漏相关词语,有利于能够提高文本纠错的准确率。
另外,本公开的实施例提供的文本处理方法、装置、电子设备和存储介质,通过将目标文本中与目标词语读音相似的词语作为相关词语,能够在语音识别场景中有效提高语音识别文本的纠错效率和纠错准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。在附图中:
图1是根据本公开的文本处理系统的一个实施例的系统架构图;
图2是根据本公开的文本处理方法的一个实施例的流程图;
图3是根据本公开的复筛步骤的分解流程图;
图4是根据本公开的文本处理装置的一个实施例的结构示意图;
图5是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的文本处理方法、装置、终端设备和存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如语音交互类应用、视频会议类应用、短视频社交类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有麦克风和扬声器的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来文本处理服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上采集的目标文本提供处理服务的后台服务器。后台服务器可以对接收到的目标文本等进行相应处理。
在一些情况下,本公开所提供的文本处理方法可以由终端设备101、102、103和服务器105共同执行,例如,“向用户展示目标文本”的步骤可以由终端设备101、102、103执行,“响应于用户将目标文本中的原始词语修改为目标词语的修改操作,确定修改操作对应的相关词语”的步骤可以由服务器105执行。本公开对此不做限定。相应地,文本处理装置也可以分别设置于终端设备101、102、103和服务器105中。
在一些情况下,本公开所提供的文本处理方法可以由终端设备101、102、103执行,相应地,文本处理装置也可以设置于终端设备101、102、103中,这时,系统架构100也可以不包括服务器105。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本公开的文本处理方法的一个实施例的流程200,应用于图1中的终端设备或服务器,该流程200包括以下步骤:
步骤201,向用户展示目标文本。
在本实施例中,目标文本是待编辑修改的文本。目标文本可以由终端设备进行显示。上述终端设备例如是手机、平板电脑、笔记本电脑、台式电脑等。
在本实施例中,目标文本可以存储在终端设备本地,也可以由服务器将其发送至终端设备。
在一个例子中,目标文本可以通过语音处理得到。上述语音识别技术可以利用语言模式识别以及自主学习技术,对各类业务生成的声音信号做集中的分析处理,实现高效的语音转写文字服务。其中,语音识别可以包含特征提取、模式匹配和参考模型库三个基本部分,分为学习和训练两个阶段。首先对识别内容的特征参数进行训练,得到参考模板,再将测试模板与存在的参考模板通过识别决策进行匹配,获得最佳匹配的参考模板就构成了语音识别的结果。
在一个例子中,可以通过对线上会议的音频进行语音识别,得到语音识别文本并将其作为目标文本。这里,目标文本可以是会议的字幕文本,也可以是会议的会议记录文本。在其他例子中,目标文本也可以来源于文字识别、用户直接输入等。
步骤202,响应于用户将目标文本中的原始词语修改为目标词语的修改操作,确定修改操作对应的相关词语,其中,其中,相关词语集合中的相关词语基于原始词语的文字和/或读音确定。
在本实施例中,用户可以对显示的目标文本进行编辑。用户可以通过修改操作将目标文本中的原始词语修改为目标词语。上述修改操作例如是先删除原始词语再输入目标词语,或者直接将原始词语替换为目标词语等。
在本实施例中,目标文本可以对应于任何语言,例如汉语、英语等。本实施例中的词语可以是目标文本对应的语言中特定的语言单位,例如汉语中的词语、英语中的单词等。
在本实施例中,相关词语集合中的相关词语基于原始词语的文字和/或读音确定可以。相关词语例如是目标文本中与原始词语写法一致的词语,或者是目标文本中与目标词语读音相似的词语。在一个例子中,用户通过修改操作将目标文本中某一位置的原始词语“黄山”修改为目标词语“房山”,则目标文本中其他位置的“黄山”为该修改操作对应的相关词语。此外,目标文本中与目标词语“房山”读音近似的词语,例如目标文本中的“唐山”、“芒山”等也为该修改操作对应的相关词语。
在一个例子中,可以将用户对汉语词语(包括至少两个汉字)的修改识别为上述修改操作,而不将用户对单个汉字的修改识别为上述修改操作。
在一个例子中,可以通过以下方式确定修改操作对应的相关词语:
首先,可以在目标文本中查找与原始词语的文字相同的第一词语,得到第一词语集合。
其次,可以在预设混淆音字典中查找目标词语的读音对应的近似读音,以及在目标文本中查找近似读音对应的第二词语,得到第二词语集合。这里,预设混淆音字典可以存储有目标读音与相应的近似读音的映射关系。例如,预设混淆音字典中可以存储有目标读音“fangshan”与相应的近似读音“tangshan”、“mangshan”等的映射关系。
在一个例子中,可以通过预设混淆音字典获得与目标词语的读音对应的多个近似读音,例如获得与目标词语的读音对应的5个近似读音或者10个近似读音,在此基础上查找相应的第二词语。上述多个近似读音可以按照概率大小依次排列。
在一个例子中,可以在预设混淆音字典中存储汉语词语、英文单词等特定语言单位的读音。
在一个例子中,可以先对目标文本进行分词处理,在此基础上,将分词后各个词语的读音与上述近似读音进行匹配,从而得到与上述近似读音对应的第二词语。
最后,根据第一词语集合和第二词语集合中的至少一项,得到修改操作对应的相关词语集合。
步骤203,将相关词语替换为目标词语。
在一个例子中,可以直接将相关词语替换为目标词语。例如在前文描述的例子中,可以直接将目标文本中其他位置的“黄山”和目标文本中与目标词语“房山”读音近似的词语“唐山”、“芒山”等替换为目标词语“房山”。
在一个例子中,在将相关词语替换为目标词语之前,可以先征求用户的确认。在该例子中,可以先向用户展示替换提示信息,再响应于用户对替换提示信息的确认操作,将相关词语替换为目标词语。这里,替换提示信息例如以“是否对相关词语执行批量替换”为内容的提示消息。此外,还可以在替换提示信息中将相关词语的位置和内容等一并显示。如此,有利于确认用户的意图,提升用户的使用体验,避免出现非出于用户本意的自动替换。
在上述例子中,可以对相关词语进行批量替换,也可以对相关词语逐个进行替换。
在一个例子中,在将第一词语和/或第二词语确定为相关词语之前,可以进行复筛,即根据第一词语和/或第二词语所在句子的语法特性,确定第一词语和/或第二词语是否为相关词语。响应于确定是,将第一词语和/或第二词语确定为相关词语集合中的元素。如此,有利于提高文本替换的准确率。
在上述例子中,可以根据第一词语和/或第二词语在相应句子中的词性,确定第一词语和/或第二词语是否为相关词语。其中,可以比较第一词语和/或第二词语在所在句子中的词性与原始词语在所在句子中的词性是否相同,在二者词性相同的情况下将第一词语和/或第二词语确定为相关词语。此外,在会议音频识别的场景中,由于识别错误通常出现在人名、专业术语等名词中,因此可以先判断第一词语和/或第二词语在句子中的词性是否为名词,在其词性为名词的情况下将其确定为相关词语。
在上述例子中,可以根据第一词语和/或第二词语所在句子的通顺度,确定第一词语和/或第二词语是否为相关词语。其中,可以将第一词语和/或第二词语所在句子的通顺度与将其替换为目标词语后句子的通顺度进行比较,在修改后句子的通顺度更高的情况下,将第一词语和/或第二词语确定为相关词语。还可以将第一词语和/或第二词语所在句子的通顺度与预设的通顺度阈值进行比较,在第一词语和/或第二词语所在句子的通顺度小于预设的通顺度阈值的情况下,将其确定为相关词语。这里,句子的通顺度可以通过困惑度(Perplexity)或者其他类型的评分来衡量,本公开对此不做限定。
在上述例子中,可以将第一词语和/或第二词语、第一词语和/或第二词语所在句子以及目标词语输入预先训练的机器学习模型,得到表示第一词语和/或第二词语是否为相关词语的输出结果。其中,可以预先通过训练样本集(包括需要修改的句子的样本和不需要修改的句子的样本)进行机器学习训练,得到上述机器学习模型。
在一个例子中,可以按图3所示的流程执行复筛步骤300。首先,可以如图3中的步骤301所示,根据第一词语和/或第二词语在相应句子中的词性和第一词语和/或第二词语所在句子的通顺度,初步判断第一词语和/或第二词语是否为相关词语。其次,可以如图3中的步骤302所示,响应于初步判断的结果为是,将第一词语和/或第二词语所在句子输入预先训练的机器学习模型,得到表示第一词语和/或第二词语是否为相关词语的输出结果。如此,可以根据第一词语和/或第二词语在句子中的词性和第一词语和/或第二词语所在句子的通顺度去除明显不需要替换的词语,降低输入至机器学习模型的数据量,提高运算速度。
在步骤301中,可以同时考虑第一词语和/或第二词语在句子中的词性和第一词语和/或第二词语所在句子的通顺度,进行综合评分,据此进行初步判断。
本公开实施例提供的文本处理方法,基于用户对目标文本的替换操作,确定修改操作对应的相关词语并将其替换为目标词语,能够对相关词语进行批量替换,有效提高用户对文本进行编辑修改的效率。此外,还能够避免遗漏相关词语,有利于能够提高文本纠错的准确率。
另外,本公开实施例提供的文本处理方法,通过将目标文本中与目标词语读音相似的词语作为相关词语,能够在语音识别场景中有效提高语音识别文本的纠错效率和纠错准确率。
进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种文本处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种终端设备中。
如图4所示,本实施例的文本处理装置400包括:展示单元401、替换单元402和修改单元403。其中,展示单元401,用于向用户展示目标文本;确定单元402,用于响应于用户将上述目标文本中的原始词语修改为目标词语的修改操作,确定上述修改操作对应的相关词语集合,其中,上述相关词语集合中的相关词语基于上述原始词语的文字和/或读音确定;替换单元403,用于将相关词语替换为目标词语。
在本实施例中,文本处理装置400的展示单元401、确定单元402和替换单元403的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202和步骤203的相关说明,在此不再赘述。
在一些可选的实施方式中,上述替换单元403可以进一步用于:向用户展示替换提示信息;响应于用户对上述替换提示信息的确认操作,将上述相关词语替换为上述目标词语。
在一些可选的实施方式中,上述确定单元402可以进一步用于:在上述目标文本中查找与上述原始词语的文字相同的第一词语,得到第一词语集合;在预设混淆音字典中查找上述目标词语的读音对应的近似读音,以及在上述目标文本中查找上述近似读音对应的第二词语,得到第二词语集合;根据上述第一词语集合和上述第二词语集合中的至少一项,得到上述修改操作对应的相关词语集合。
在一些可选的实施方式中,上述确定单元402可以进一步用于:根据上述第一词语和/或上述第二词语所在句子的语法特性,确定上述第一词语和/或上述第二词语是否为上述相关词语;响应于确定是,将上述第一词语和/或上述第二词语确定为上述相关词语集合中的元素。
在一些可选的实施方式中,上述确定单元402可以进一步用于执行以下至少一项:根据上述第一词语和/或上述第二词语在相应句子中的词性,确定上述第一词语和/或上述第二词语是否为上述相关词语;根据上述第一词语和/或上述第二词语所在句子的通顺度,确定上述第一词语和/或上述第二词语是否为上述相关词语;将上述第一词语和/或上述第二词语、上述第一词语和/或上述第二词语所在句子以及上述目标词语输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述确定单元402可以进一步用于:根据上述第一词语和/或上述第二词语在相应句子中的词性和上述第一词语和/或上述第二词语所在句子的通顺度,初步判断上述第一词语和/或上述第二词语是否为上述相关词语;响应于上述初步判断的结果为是,将上述第一词语和/或上述第二词语所在句子输入预先训练的机器学习模型,得到表示上述第一词语和/或上述第二词语是否为上述相关词语的输出结果。
在一些可选的实施方式中,上述目标文本可以通过语音识别处理得到。
需要说明的是,本公开的实施例提供的文本处理装置中各单元的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开的终端设备的计算机系统500的结构示意图。图5示出的计算机系统500仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有计算机系统500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许计算机系统500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备的计算机系统500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如图2所示的实施例及其可选实施方式示出的文本处理方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,展示单元还可以被描述为“用于向用户展示目标文本的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种文本处理方法,包括:
向用户展示目标文本;
响应于用户将所述目标文本中的原始词语修改为目标词语的修改操作,确定所述修改操作对应的相关词语集合,其中,所述相关词语集合中的相关词语基于所述原始词语的文字和/或读音确定;
将所述相关词语替换为所述目标词语。
2.根据权利要求1所述的方法,其中,所述将所述相关词语替换为所述目标词语,包括:
向用户展示替换提示信息;
响应于用户对所述替换提示信息的确认操作,将所述相关词语替换为所述目标词语。
3.根据权利要求1所述的方法,其中,所述确定所述修改操作对应的相关词语集合,包括:
在所述目标文本中查找与所述原始词语的文字相同的第一词语,得到第一词语集合;
在预设混淆音字典中查找所述目标词语的读音对应的近似读音,以及在所述目标文本中查找所述近似读音对应的第二词语,得到第二词语集合;
根据所述第一词语集合和所述第二词语集合中的至少一项,得到所述修改操作对应的相关词语集合。
4.根据权利要求3所述的方法,其中,所述根据所述第一词语集合和所述第二词语集合中的至少一项,得到所述修改操作对应的相关词语集合,包括:
根据所述第一词语和/或所述第二词语所在句子的语法特性,确定所述第一词语和/或所述第二词语是否为所述相关词语;
响应于确定是,将所述第一词语和/或所述第二词语确定为所述相关词语集合中的元素。
5.根据权利要求4所述的方法,其中,所述根据所述第一词语和/或所述第二词语所在句子的语法特性,确定所述第一词语和/或所述第二词语是否为所述相关词语,包括以下至少一项:
根据所述第一词语和/或所述第二词语在相应句子中的词性,确定所述第一词语和/或所述第二词语是否为所述相关词语;
根据所述第一词语和/或所述第二词语所在句子的通顺度,确定所述第一词语和/或所述第二词语是否为所述相关词语;
将所述第一词语和/或所述第二词语、所述第一词语和/或所述第二词语所在句子以及所述目标词语输入预先训练的机器学习模型,得到表示所述第一词语和/或所述第二词语是否为所述相关词语的输出结果。
6.根据权利要求4所述的方法,其中,所述根据所述第一词语和/或所述第二词语所在句子的语法特性,确定所述第一词语和/或所述第二词语是否为所述相关词语,包括:
根据所述第一词语和/或所述第二词语在相应句子中的词性和所述第一词语和/或所述第二词语所在句子的通顺度,初步判断所述第一词语和/或所述第二词语是否为所述相关词语;
响应于所述初步判断的结果为是,将所述第一词语和/或所述第二词语所在句子输入预先训练的机器学习模型,得到表示所述第一词语和/或所述第二词语是否为所述相关词语的输出结果。
7.根据权利要求1-6中任一项所述的方法,其中,所述目标文本通过语音识别处理得到。
8.一种文本处理装置,包括:
展示单元,用于向用户展示目标文本;
确定单元,用于响应于用户将所述目标文本中的原始词语修改为目标词语的修改操作,确定所述修改操作对应的相关词语集合,其中,所述相关词语集合中的相关词语基于所述原始词语的文字和/或读音确定;
替换单元,用于将所述相关词语替换为所述目标词语。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被一个或多个处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202110485808.3A 2021-04-30 2021-04-30 文本处理方法、装置、电子设备和存储介质 Pending CN113221514A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110485808.3A CN113221514A (zh) 2021-04-30 2021-04-30 文本处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110485808.3A CN113221514A (zh) 2021-04-30 2021-04-30 文本处理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113221514A true CN113221514A (zh) 2021-08-06

Family

ID=77090844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110485808.3A Pending CN113221514A (zh) 2021-04-30 2021-04-30 文本处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113221514A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115688750A (zh) * 2022-10-27 2023-02-03 北京有竹居网络技术有限公司 文本处理方法、装置、可读介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874241A (zh) * 2016-12-23 2017-06-20 《中国医药科学》杂志社有限公司 一种智能化文稿编辑系统
CN110415704A (zh) * 2019-06-14 2019-11-05 平安科技(深圳)有限公司 庭审笔录数据处理方法、装置、计算机设备和存储介质
CN112115706A (zh) * 2020-08-31 2020-12-22 北京字节跳动网络技术有限公司 文本处理方法、装置、电子设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874241A (zh) * 2016-12-23 2017-06-20 《中国医药科学》杂志社有限公司 一种智能化文稿编辑系统
CN110415704A (zh) * 2019-06-14 2019-11-05 平安科技(深圳)有限公司 庭审笔录数据处理方法、装置、计算机设备和存储介质
CN112115706A (zh) * 2020-08-31 2020-12-22 北京字节跳动网络技术有限公司 文本处理方法、装置、电子设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115688750A (zh) * 2022-10-27 2023-02-03 北京有竹居网络技术有限公司 文本处理方法、装置、可读介质及电子设备

Similar Documents

Publication Publication Date Title
US10614803B2 (en) Wake-on-voice method, terminal and storage medium
KR102401942B1 (ko) 번역품질 평가 방법 및 장치
CN112115706B (zh) 文本处理方法、装置、电子设备及介质
CN110473525B (zh) 获取语音训练样本的方法和装置
US11527233B2 (en) Method, apparatus, device and computer storage medium for generating speech packet
US20240021202A1 (en) Method and apparatus for recognizing voice, electronic device and medium
CN109858045B (zh) 机器翻译方法和装置
CN111986655B (zh) 音频内容识别方法、装置、设备和计算机可读介质
US10950240B2 (en) Information processing device and information processing method
CN110880324A (zh) 语音数据的处理方法、装置、存储介质及电子设备
CN113221514A (zh) 文本处理方法、装置、电子设备和存储介质
CN111815274A (zh) 信息处理方法、装置和电子设备
CN112837672A (zh) 对话归属的确定方法、装置、电子设备及存储介质
CN113761865A (zh) 声文重对齐及信息呈现方法、装置、电子设备和存储介质
CN112652329B (zh) 文本重对齐方法、装置、电子设备和存储介质
CN110728137B (zh) 用于分词的方法和装置
CN111027332B (zh) 生成翻译模型的方法和装置
CN113312928A (zh) 文本翻译方法、装置、电子设备和存储介质
CN113241061B (zh) 语音识别结果的处理方法、装置、电子设备和存储介质
CN112632241A (zh) 智能会话的方法、装置、设备和计算机可读介质
US10559298B2 (en) Discussion model generation system and method
CN112395844A (zh) 拼音生成方法、装置和电子设备
CN112951274A (zh) 语音相似度确定方法及设备、程序产品
CN111562864B (zh) 显示图片方法、电子设备和计算机可读介质
US20240153485A1 (en) Systems and methods for machine-learning based multi-lingual pronunciation generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination