CN113672144A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN113672144A
CN113672144A CN202111040355.XA CN202111040355A CN113672144A CN 113672144 A CN113672144 A CN 113672144A CN 202111040355 A CN202111040355 A CN 202111040355A CN 113672144 A CN113672144 A CN 113672144A
Authority
CN
China
Prior art keywords
polyphone
viewing range
pronunciation
determining
viewing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111040355.XA
Other languages
English (en)
Inventor
王宁
姜伟
张爽
朱伟基
邹双圆
朱浩
程龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202111040355.XA priority Critical patent/CN113672144A/zh
Publication of CN113672144A publication Critical patent/CN113672144A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本申请公开了一种数据处理方法,具体地:当用户触发多音字查看操作之后,可以确定查看范围,并进一步确定所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,并显示所述每个多音字分别对应的至少一种读音。由此可见,在本申请中,用户触发多音字查看操作之后,不是直接获取整个目标文本中多音字的读音,而是首先判断查看范围,并且所述查看范围可以是目标文本,也可以是目标文本中的部分文本。这就使得本方案可以根据实际情况适应性的为用户展示查看范围中的多音字的读音,而不是直接展示整个目标文本中的多音字的读音,从而使得本方案能够更加符合用户需求,从而用户体验更佳。

Description

一种数据处理方法及装置
技术领域
本申请涉及数据处理领域,特别是涉及一种数据处理方法及装置。
背景技术
在一些场景例如在音频创作的场景中,可以将文字转换成音频。但是,文字可能有多种发音,即有的文字为“多音字”。这就导致在将文字转换成音频之后,需要对前述多音字的发音进行纠错。
而目前对多音字的发音进行纠错的方式,用户体验不佳。
发明内容
本申请所要解决的技术问题是:目前对多音字的发音进行纠错的方式,用户体验不佳,提供一种数据处理方法及装置。
第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述方法还包括:
确定所述查看范围中包括的易错多音字。
可选的,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
第二方面,本申请实施例提供了一种数据处理装置,所述装置包括:
第一确定单元,用于响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取单元,用于获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
第一显示单元,用于显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取单元,用于:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述装置还包括:
第二确定单元,用于确定所述查看范围中包括的易错多音字。
可选的,所述第二确定单元,用于:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述第二确定单元,用于:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第二确定单元,用于:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取单元,用于:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述第一确定单元,用于:
响应于所述用户通过第一控件触发的所述多音字查看操作,确定所述查看范围。
可选的,所述至少一个多音字包括第二多音字,所述装置还包括:
第二显示单元,用于显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
第三方面,本申请实施例提供了一种数据处理装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述操作还包括:
确定所述查看范围中包括的易错多音字。
可选的,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行以上第一方面任意一项所述的方法。与现有技术相比,本申请实施例具有以下优点:
本申请实施例提供了一种数据处理方法,具体地,当用户触发多音字查看操作之后,可以确定查看范围,并进一步确定所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,并显示所述每个多音字分别对应的至少一种读音。由此可见,在本申请实施例中,用户触发多音字查看操作之后,不是直接获取整个目标文本中多音字的读音,而是首先判断查看范围,并且所述查看范围可以是目标文本,也可以是目标文本中的部分文本。这就使得本方案可以根据实际情况适应性的为用户展示查看范围中的多音字的读音,而不是直接展示整个目标文本中的多音字的读音,从而使得本方案能够更加符合用户需求,从而用户体验更佳。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理方法的流程示意图;
图2为本申请实施例提供的一种数据处理装置的结构示意图;
图3为本申请实施例提供的客户端的结构示意图;
图4为本申请实施例提供的服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的发明人经过研究发现,目前,一些应用程序或者网页具备将文字转换成音频的功能。具体地,该应用程序的某一页面或者网页页面中包括文本输入区,用户可以通过手动式输入或者导入文件的方式在该文本输入区输入目标文本。进一步地,用户可以点击“生成音频”控件,则可以直接生成所述目标文本对应的目标音频。可以理解的是,所述目标文本中可能会包括多音字,而自动生成的目标音频中多音字的读音有可能是错误的,这就导致需要进一步对目标文本中多音字的读音进行纠错。
在一个示例中,用户可以触发多音字查看操作,用户触发多音字查看操作之后,所述文本输入区所在的页面上则会显示所述目标文本中所有多音字在目标音频中的读音,以便于用户查看并进行纠错。
可以理解的是,由于在实际中存在目标文本篇幅过长的情况,因此,若在文本输入区所在的页面上显示目标文本中所有多音字在目标音频中的读音,则会导致所述页面上显示的读音过多,不便于用户阅读。因此,目前对多音字的发音进行纠错的方式,用户体验不佳。
需要说明的是,本申请实施例中的多音字,可以是中文多音字,也可以是英文多音字,还可以是其它语言的多音字,本申请实施例不做具体限定。对于中文多音字而言,多音字的不同读音可以对应不同语义,对于英文多音字而言,其多种读音例如可以是英式发音或者美式发音。
需要说明的是,本申请实施例中提及的对目标文本中多音字的读音进行纠错,可以是对中文多音字进行纠错,也可以是对英文多音字的英式发音或者美式发音进行选择。
为了解决上述问题,本申请实施例提供了一种数据处理方法及装置。在本申请实施例的以下描述中,以所述多音字为中文多音字为例进行说明。
下面结合附图,详细说明本申请的各种非限制性实施方式。
示例性方法
参见图1,该图为本申请实施例提供的一种数据处理方法的流程示意图。
本申请实施例提供的方法,可以由安装了前述具备将文字转换成音频的应用程序的设备、或者运行了搜索引擎的设备执行。此处提及的设备包括但不限于终端设备和服务器。此处提及的终端设备,可以是智能手机、平板电脑等移动终端,也可以是台式计算机等终端设备。
为方便描述,在以下描述中,将前述“文本输入区所在的页面”简称为“页面”,如上所述可知,该页面可以是一个网页页面,也可以是应用程序显示的某一页面。在以下描述中,目标文本为在所述页面的文本输入区输入的文本,目标音频为根据目标文本自动生成的音频。
在本实施例中,所述方法例如可以通过以下步骤S101-S103实现。
S101:响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本。
在本申请实施例中,用户可以通过相应的控件触发多音字查看操作。在一个示例中,用户可以通过第一控件触发所述多音字查看操作。例如,所述页面上可以包括第一控件的标识,第一用户点击所述第一控件的标识,则可以触发所述多音字查看操作。此处提及的第一控件的标识,例如可以是包括文字“多音字”的图标。
在本申请实施例中,当用户触发多音字查看操作之后,所述设备进一步确定查看范围。此处的查看范围可以是目标文本,也可以是目标文本中的部分文本。
在一个示例中,考虑到在实际中存在一些场景,用户希望对目标文本中的部分文本中的多音字的发音进行查看并纠错。例如,当所述目标文本篇幅过长时,用户希望首先对一部分文本中的多音字的发音进行查看并纠错。又如,当目标文本中各部分的重要程度不同时,用户希望优先对重要程度比较高的文本中的多音字的发音进行查看并纠错。鉴于此,所述查看范围可以由用户自主选择。具体地:用户可以选择目标文本中的部分文本,若用户针对所述目标文本中的部分文本执行了选择操作,则可以确定所述查看范围为所述部分文本。用户例如可以通过控制光标在所述文本输入区拖动的方式,选择所述目标文本中的部分文本。可以理解的是,用户可以对目标文本中的多个字符(例如某一段落)执行选择操作,也可以对所述目标文本中的其中一个字符(例如某一多音字)执行选择操作,本申请实施例不做具体限定。在又一个示例中,用户可能希望对整个目标文本中的多音字的发音进行查看并纠错。对于这种情况,为简化用户操作,在本申请实施例中,用户可以不针对所述目标文本中的任意一个文本执行选择操作,直接触发前述多音字查看操作。换言之,若用户触发了多音字查看操作,但并未针对所述目标文本中的任一文本执行选择操作,则可以确定所述查看范围为所述目标文本。
通过以上对查看范围的描述可知,该查看范围与用户需求相匹配。
S102:获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音。
在本申请实施例中,S102可以有多种实现方式。以下介绍两种可能的实现方式。
第一种实现方式中:为方便用户对所述查看范围中包括的各个多音字的读音进行纠错,获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
此处提及的所述每个多音字分别对应的至少一种读音,可以是所述每个多音字在目标音频中的读音,也可以是所述每个多音字的所有读音。可以理解的是,若获取所述每个多音字在目标音频中的读音,则在执行S103显示该读音之后,可以方便用户通读所述查看范围,以确定所述目标音频中所述查看范围内的多音字的读音是否正确。若获取所述每个多音字的所有读音,则可以方便用户对该多音字的正确读音进行选择。
另外,若获取每个多音字的所有读音,则S103在显示所述所有读音时,对于某一多音字而言,该多音字在目标音频中的读音的显示方式、与该多音字的其它读音的显示方式可以有所区别,以方便用户确定当前目标音频中该多音字的读音是否正确。例如,对于多音字“长”,其在目标音频中的读音为“[zhǎng]”,而其它读音为“[cháng]”,则可以将读音“[zhǎng]”加粗显示,读音“[cháng]”不加粗显示。
第二种实现方式:考虑到用户查看多音字的读音是为了进行纠错,而并不是所有的多音字的发音都需要纠错。因此,S102的又一种实现方式为:获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
此处提及的易错多音字,指的是所述目标音频中该多音字对应的读音出错的概率比较大的多音字。采用这种方式,仅获取容易出错的多音字的至少一种读音,而不再获取出错概率较小的多音字的读音,在执行S103之后,可以有效减少所述页面上显示的内容,提升用户的阅读体验,也能提升纠错效率。
如上描述可知,在显示查看范围中多音字的读音时,可以显示易错多音字的读音,也可以显示所有多音字的读音。在一个示例中,可以默认显示易错多音字的读音,若用户希望显示所有多音字的读音,也可以通过所述页面上的相应控件进行修改,使得所述页面上显示所有多音字的读音。
在本申请实施例中,若S102采用第二种实现方式,则在执行S102之前,还需要确定所述查看范围内包括的易错多音字,在确定所述易错多音字之后,再执行S102。接下来,介绍确定所述查看范围内包括的易错多音字的具体实现方式。
在本申请实施例中,考虑到对于一个字而言,其上下文能够体现其语义信息。换言之,多音字的上下文可以在一定程度上用于确定该多音字是否为易错多音字。例如:若某一多音字与其上下文能够确切的确定某一语义,则可以认为该多音字不是易错多音字,反之,若该多音字与其上下文不能确切的确定某一语义,则可以认为该多音字为易错多音字。换言之,可以根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
在本申请实施例中,“根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字”可以有多种实现方式。接下来,以确定第一多音字是否为易错多音字为例,介绍“根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字”的两种可能的实现方式。其中:所述第一多音字在目标音频中的读音为第一读音。
在一种实现方式中,可以利用机器学习模型确定所述第一多音字是否为易错多音字。具体地:考虑到一个字的读音与该字在其所在的句子中的位置有一定的关系。因此,可以将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,该机器学习模型则会输出所述第一多音字在所述语句中的读音为第一读音的概率。若所述概率小于或者等于预设阈值,则说明所述目标音频中所述第一多音字的读音出错的概率较大,故而可以确定所述第一多音字为易错多音字。
需要说明的是,本申请实施例不具体限定所述预设阈值,所述预设阈值例如可以为0.6。另外,所述机器学习模型除了可以输出所述第一多音字的读音为第一读音的概率之外,还可以输出所述第一多音字的读音为其它读音的概率。
在本申请实施例中,所述机器学习模型可以是预先训练得到的,例如,可以利用大量包括多音字的训练语句进行训练,以得到所述机器学习模型。具体地:可以以训练语句、多音字在训练语句中的位置、多音字在训练语句中的读音作为输入,训练所述机器学习模型。关于所述机器学习模型的具体训练过程,此处不做详述。另外,该机器学习模型可以是卷积神经网络模型,也可以是深度神经网络模型,还可以是最大熵模型,本申请实施例不做具体限定。
在又一种实现方式中,考虑到若第一多音字与其相邻的字构成已有词汇,则该第一多音字为易错多音字的概率很小。反之,若第一多音字与其相邻的字不够成已有词汇,则所述第一多音字为易错多音字的概率相对较大。例如,多音字A与其相邻的其它几个字构成一个成语,则可以确定该多音字不是易错多音字。反之,根据多音字A的上下文,发现多音字A与其相邻的其它字不够成已有词汇,则第一多音字为易错多音字的概率相对较大。因此,在本申请实施例中,可以对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;并进一步判断所述第一分词是否为已有词汇,若第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
S103:显示所述每个多音字分别对应的至少一种读音。
在S102确定所述每个多音字分别对应的至少一种读音之后,可以显示所述每个多音字分别对应的至少一种读音。关于显示所述每个多音字分别对应的至少一种读音的方式,本申请实施例不做具体限定。
在一个示例中,可以在所述每个多音字的上方显示与其对应的读音。当然,也可以在所述目标文本中所述多音字所在的位置之后,插入所述每个多音字分别对应的至少一种读音。
通过以上描述可知,利用本方案,可以根据实际情况适应性的为用户展示查看范围中的多音字的读音,而不是直接展示整个目标文本中的多音字的读音,从而使得本方案能够更加符合用户需求,从而用户体验更佳。
在一些实施例中,考虑到对于一些多音字而言,用户可能对该读音不是特别了解。因此,在一个示例中,除了显示所述每个多音字分别对应的至少一种读音之外,还可以显示各读音分别对应的词汇,以方便用户了解各多音字的正确读音,从而使得用户可以为该多音字选择正确的读音。以所述至少一个多音字中的第二多音字为例,利用本申请实施例的方案,除了显示第二多音字的一个或者多个读音之外,还可以显示包括所述第二多音字的至少一个词汇,并且,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
举例说明:
多音字“的”,包括四种读音,分别是“[de]”、“[dì][dí]”和“[dī]”,则执行本方案之后,可以在所述页面上显示读音“[de]”、“[dì]和“[dī]”,或者经过用户触发分别显示对应的词汇示例或者注释;例如:“[de]:好的”、“[dí]:的确”、“[dì]:箭靶的中心”以及“[dī]:“的士”的省称”,具体显示样式不做限定。
需要说明的是,为了避免所述页面上显示的内容过多给用户带来干扰,在一个示例中,可以在用户触发了读音学习功能的情况下,再显示包括所述第二多音字的至少一个词汇。例如,用户可以通过双击或者右键点击所述第二多音字的读音,以触发所述读音学习功能;又如,用户可以将光标移至所述第二多音字的读音所在的显示区域,以触发所述读音学习功能。等等,此处不一一列举说明。
示例性设备
基于以上实施例提供的方法,本申请实施例还提供了一种装置,以下结合附图介绍该装置。
参见图2,该图为本申请实施例提供的一种数据处理装置的结构示意图。所述装置200例如可以具体包括:第一确定单元201、获取单元202和第一显示单元203。
第一确定单元201,用于响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取单元202,用于获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
第一显示单元203,用于显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取单元202,用于:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述装置还包括:
第二确定单元,用于确定所述查看范围中包括的易错多音字。
可选的,所述第二确定单元,用于:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述第二确定单元,用于:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第二确定单元,用于:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取单元202,用于:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述第一确定单元201,用于:
响应于所述用户通过第一控件触发的所述多音字查看操作,确定所述查看范围。
可选的,所述至少一个多音字包括第二多音字,所述装置还包括:
第二显示单元,用于显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
由于所述装置200是与以上方法实施例提供的方法对应的装置,所述装置200的各个单元的具体实现,均与以上方法实施例为同一构思,因此,关于所述装置200的各个单元的具体实现,可以参考以上方法实施例的描述部分,此处不再赘述。
本申请实施例提供的方法,可以由客户端执行也可以由服务器执行,以下对执行上述方法的客户端和服务器分别进行说明。
图3示出了一种客户端300的框图。例如,客户端300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,客户端300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口33,传感器组件314,以及通信组件316。
处理组件302通常控制客户端300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理部件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在客户端300的操作。这些数据的示例包括用于在客户端300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为客户端300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为客户端300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述客户端300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当客户端300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当客户端300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为客户端300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为客户端300的显示器和小键盘,传感器组件314还可以检测客户端300或客户端300一个组件的位置改变,用户与客户端300接触的存在或不存在,客户端300方位或加速/减速和客户端300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于客户端300和其他设备之间有线或无线方式的通信。客户端300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,客户端300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行下述方法:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述方法还包括:
确定所述查看范围中包括的易错多音字。
可选的,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
图4是本申请实施例中服务器的结构示意图。该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。
更进一步地,中央处理器422可以执行下述方法:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述方法还包括:
确定所述查看范围中包括的易错多音字。
可选的,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口456,一个或一个以上键盘456,和/或,一个或一个以上操作系统441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本申请实施例还提供了一种计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行以下方法:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
可选的,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
可选的,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
可选的,所述方法还包括:
确定所述查看范围中包括的易错多音字。
可选的,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
可选的,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
可选的,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种数据处理方法,其特征在于,所述方法包括:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
2.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:
若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
3.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:
若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
4.根据权利要求1所述的方法,其特征在于,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述查看范围中包括的易错多音字。
6.根据权利要求5所述的方法,其特征在于,所述确定所述查看范围中包括的易错多音字,包括:
根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
7.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
8.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
9.根据权利要求1所述的方法,其特征在于,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
10.根据权利要求1所述的方法,其特征在于,所述每个多音字分别对应的至少一种读音,包括:
所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
所述每个多音字的全部读音。
11.根据权利要求1所述的方法,其特征在于,所述响应于用户触发的多音字查看操作,包括:
响应于所述用户通过第一控件触发的所述多音字查看操作。
12.根据权利要求1所述的方法,其特征在于,所述至少一个多音字包括第二多音字,所述方法还包括:
显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
13.一种数据处理装置,其特征在于,所述装置包括:
第一确定单元,用于响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取单元,用于获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
第一显示单元,用于显示所述每个多音字分别对应的至少一种读音。
14.一种数据处理装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
显示所述每个多音字分别对应的至少一种读音。
15.一种计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行权利要求1至12任意一项所述的方法。
CN202111040355.XA 2021-09-06 2021-09-06 一种数据处理方法及装置 Pending CN113672144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111040355.XA CN113672144A (zh) 2021-09-06 2021-09-06 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111040355.XA CN113672144A (zh) 2021-09-06 2021-09-06 一种数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN113672144A true CN113672144A (zh) 2021-11-19

Family

ID=78548522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111040355.XA Pending CN113672144A (zh) 2021-09-06 2021-09-06 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN113672144A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461436A (zh) * 2018-10-23 2019-03-12 广东小天才科技有限公司 一种语音识别发音错误的纠正方法及系统
CN111145724A (zh) * 2019-12-31 2020-05-12 出门问问信息科技有限公司 一种多音字标注方法、装置以及计算机可读存储介质
CN112037756A (zh) * 2020-07-31 2020-12-04 北京搜狗科技发展有限公司 语音处理方法、装置和介质
CN112802444A (zh) * 2020-12-30 2021-05-14 科大讯飞股份有限公司 语音合成方法、装置、设备及存储介质
CN112818657A (zh) * 2019-11-15 2021-05-18 北京字节跳动网络技术有限公司 多音字读音的确定方法、装置、电子设备及存储介质
CN112818089A (zh) * 2021-02-23 2021-05-18 掌阅科技股份有限公司 文本注音方法、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109461436A (zh) * 2018-10-23 2019-03-12 广东小天才科技有限公司 一种语音识别发音错误的纠正方法及系统
CN112818657A (zh) * 2019-11-15 2021-05-18 北京字节跳动网络技术有限公司 多音字读音的确定方法、装置、电子设备及存储介质
CN111145724A (zh) * 2019-12-31 2020-05-12 出门问问信息科技有限公司 一种多音字标注方法、装置以及计算机可读存储介质
CN112037756A (zh) * 2020-07-31 2020-12-04 北京搜狗科技发展有限公司 语音处理方法、装置和介质
CN112802444A (zh) * 2020-12-30 2021-05-14 科大讯飞股份有限公司 语音合成方法、装置、设备及存储介质
CN112818089A (zh) * 2021-02-23 2021-05-18 掌阅科技股份有限公司 文本注音方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10296201B2 (en) Method and apparatus for text selection
CN107564526B (zh) 处理方法、装置和机器可读介质
US9959487B2 (en) Method and device for adding font
CN107291704B (zh) 处理方法和装置、用于处理的装置
CN107291260B (zh) 一种信息输入方法和装置、及用于信息输入的装置
RU2733816C1 (ru) Способ обработки речевой информации, устройство и запоминающий носитель информации
EP3734472A1 (en) Method and device for text processing
CN111797262A (zh) 诗词生成方法、装置、电子设备和存储介质
CN111324214B (zh) 一种语句纠错方法和装置
US20230267282A1 (en) Poetry generation
CN109308126B (zh) 一种候选词展示方法和装置
CN109725736B (zh) 一种候选排序方法、装置及电子设备
CN108108356B (zh) 一种文字翻译方法、装置及设备
RU2636673C2 (ru) Способ и устройство для сохранения строки
CN113672144A (zh) 一种数据处理方法及装置
CN108983992B (zh) 一种具有标点符号的候选项展示方法和装置
CN110780749B (zh) 一种字符串纠错方法和装置
CN113591495A (zh) 语音翻译方法、装置及存储介质
CN110620960B (zh) 视频的字幕处理方法及装置
WO2022105229A1 (zh) 一种输入方法、装置和用于输入的装置
CN113127613B (zh) 聊天信息处理方法及装置
CN111880696B (zh) 一种基于百科的数据处理方法及装置
CN112083811B (zh) 一种候选项展示方法和装置
CN112528129B (zh) 多语种翻译系统语种搜索方法及装置
CN109408623B (zh) 信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination