WO2015172448A1

WO2015172448A1 - 一种中文人名播报方法及装置

Info

Publication number: WO2015172448A1
Application number: PCT/CN2014/084267
Authority: WO
Inventors: 刘伟
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-05-14
Filing date: 2014-08-13
Publication date: 2015-11-19
Also published as: CN105095180A

Abstract

一种中文人名播报方法及装置。所述方法包括：在预置的读音数据库中，搜索待播报文本字符串中的人名字符串；通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识；将已进行读音标识的待播报文本字符串发送至终端侧，以供终端侧按照所述读音字符串播报所述人名字符串。

Description

一种中文人名播报方法及装置技术领域

本发明涉及移动通讯领域，特别涉及一种中文人名播报方法及相关的装置。

背景技术

词法分析：是计算机科学中将字符序列转换为单词序列的过程。进行词法分析的程序或者函数叫做词法分析器，也叫扫描器。供语法分析器调用。由于汉语不像英文单词是以空格分开的，因此词法分析一般都是结合语义分析技术相结合使用。

句法分析：所谓句法分析 (Parsing)就是指对句子中的词语语法功能进行分析，比如 "我来晚了" ，这里 "我" 是主语， "来" 是谓语， "晚了" 是补语。句法分析现在主要的应用在于中文信息处理，如机器翻译等。它是语块分析（ chunking )思想的一个直接实现，语块分析通过识别出高层次的结构单元来简化句子的描述。从不同的句子中找到语块规律的一条途径是学习一种语法，这种语法能够解释所找到的分块结构。这属于语法归纳的范畴。

语音合成（ Text To Speech, TTS ) ：语音合成就是一个将文本转化为语音输出的过程，这个过程的工作主要是将输入的文本按字或词分解为音素，并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析，以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放。

目前汉语人名中普遍存在多音字，有些多音字的发音又是姓氏中所独有的，例如，曾（zeng)沈 (shen)翟 (zhai)单 (shan), 在一些常用词汇中的读音为曾 (ceng)沈 (chen)翟 (di) 单 (dan)。另外一些历史人名中有些特殊的发音，例如刘禅 (shan),关云长 (chang),贾平凹 (wa),在一些常用词汇中的读音为禅 (chan) 长 (zhang) 凹 (ao)。对于姓名的多音字， TTS播报引擎基本上按照常用词汇的发音进行播报，经常播出让人啼笑皆非的效果，例如人名：曾 (ceng)—庭。发明内容

本发明实施例提供一种中文人名播报方法及装置，通过对待播报文本字符串中的人名字符串进行多音字读音标识，并按照所标识的多音字读音播报人名字符串，解决中文人名中多音字播报不准确的问题。

根据本发明的一个实施例，提供了一种中文人名播报方法，包括：终端侧将含有人名字符串的待播报文本字符串发送至网络侧；

接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串；

按照所述读音字符串播报所述人名字符串。

根据本发明的另一个实施例，提供了一种中文人名播报方法，包括：网络侧在预置的读音数据库中，搜索待播报文本字符串中的人名字符串；通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识；将已进行读音标识的待播报文本字符串发送至终端侧，以供终端侧按照所述读音字符串播报所述人名字符串。

较佳地，在预置的读音数据库中，搜索待播报文本字符串中的人名字符串的步骤之前，还包括：

网络侧接收来自终端侧的待播报文本字符串；

对所述待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。

较佳地，所述读音数据库包括历史人名发音知识库和 /或姓氏发音知识库，网络侧在所述历史人名发音知识库和 /或姓氏发音知识库中，搜索待播报文本字符串中的人名字符串。较佳地，所述的通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识的步骤包括：

网络侧在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串；将所述读音字符串插入到所述待播 "^文本字符串的指定位置，标识所述人名的读音。

根据本发明的另一个实施例，提供了一种中文人名播报装置，包括：终端侧收发模块，其设置为：将含有人名字符串的待播报文本字符串发送至网络侧，并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串；以及

终端侧播报模块，其设置为：按照所述读音字符串播报所述人名字符串。根据本发明的另一实施例，提供了一种中文人名播报装置，包括：网络侧搜索模块，其设置为：在预置的读音数据库中，搜索待播报文本字符串中的人名字符串；

网络侧标识模块，其设置为：通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识；以及网络侧发送模块，其设置为：将已进行读音标识的待播报文本字符串发送至终端侧，以供终端侧按照所述读音字符串播报所述人名字符串。

较佳地，还包括：

网络侧接收模块，其设置为：在所述网络侧搜索模块搜索待播报文本字符串中的人名字符串之前，接收来自终端侧的待播报文本字符串；以及网络侧分析模块，其设置为：对所述待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。

较佳地，所述读音数据库包括历史人名发音知识库和 /或姓氏发音知识库，所述网络侧搜索模块是设置为在所述历史人名发音知识库和 /或姓氏发音知识库中，搜索待播报文本字符串中的人名字符串。较佳地，所述网络侧标识模块是设置为在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串，并将所提取的读音字符串插入到所述待播报文本字符串的指定位置，标识所述人名的读音。本发明实施例还提供一种计算机程序，包括程序指令，当该程序指令被终端侧执行时 , 使得该终端侧可执行上述方法。

本发明实施例还提供一种计算机程序，包括程序指令，当该程序指令被网络侧执行时，使得该网络侧可执行上述方法。

本发明实施例还提供一种载有上述任一计算机程序的载体。

本发明实施例通过文本中的语义解析出人名并标识，从而达到在终端侧

TTS播报的时候可以根据标识将人名中的多音字按照正确发音播报的目的。

附图概述

图 1是本发明实施例提供的终端侧的中文人名播报方法原理框图；图 2是本发明实施例提供的终端侧的中文人名播报装置框图；

图 3是本发明实施例提供的网络侧的中文人名播报方法原理框图；图 4是本发明实施例提供的网络侧的中文人名播报装置框图；

图 5是本发明实施例提供的 "曾一庭看《三国演义》这部小说，他非常喜欢关云长这个角色。 " 经过句法分析和语法分析后所得出的两颗语法树；图 6是本发明实施例提供的中文人名播报流程图。

本发明的较佳实施方式

以下结合附图对本发明的优选实施例进行详细说明，需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。图 1 是本发明实施例提供的终端侧的中文人名播报方法原理框图，如图 1所示，包括：

步骤 S101：终端侧将含有人名字符串的待播 "^文本字符串发送至网络侧，步骤 S102: 接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串人名字符串，

步骤 S103: 按照所述读音字符串播报所述人名字符串。为实现对中文人名的正确播报，终端侧利用网络侧对人名字符串进行处理。若所述人名中存在多音字，则网络侧对该多音字进行读音标识，从而使得终端侧的语音合成引擎能够按照所标识的读音正确播报所述人名中的多音字。

图 2是本发明实施例提供的终端侧的中文人名播报装置框图，如图 2所示，包括终端侧收发模块 21和终端侧播报模块 22。其中：

所述终端侧收发模块 21 将含有人名字符串的待播报文本字符串发送至网络侧，并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串；所述终端侧播报模块 22按照所述读音字符串播报所述人名字符串。

图 3是本发明实施例提供的网络侧的中文人名播报方法原理框图，如图 3所示，包括：

步骤 S301 : 网络侧收到终端侧的待播报文本字符串后，对所述待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。在预置的读音数据库中，搜索所述人名字符串。若搜索到相应的人名字符串，则说明所述人名中具有多音字。

所述步骤 S301 中的读音数据库包括历史人名发音知识库和 /或姓氏发音知识库，网络侧在所述历史人名发音知识库和 /或姓氏发音知识库中，搜索待播报文本字符串中的人名字符串。

步骤 S302: 通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识。

该步骤中，网络侧在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串，并将所述读音字符串插入到所述待播报文本字符串的指定位置，标识所述人名的读音。

步骤 S303: 将已进行读音标识的待播报文本字符串发送至终端侧，以供终端侧按照所述读音字符串播报所述人名字符串。

图 4是本发明实施例提供的中文人名播报装置框图，如图 4所示，包括网络侧接收模块 41、网络侧分析模块 42、网络侧搜索模块 43、网络侧标识模块 44和网络侧发送模块 45。其中：

所述网络侧接收模块 41接收来自终端侧的待播报文本字符串。

所述网络侧分析模块 42对所述网络侧接收模块 41接收的待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。

所述网络侧搜索模块 43在预置的读音数据库中，搜索所述网络侧分析模块 42分析得到的人名字符串。其中，所述读音数据库包括历史人名发音知识库和 /或姓氏发音知识库。

所述网络侧标识模块 44在所述网络侧搜索模块 43搜索到所述人名字符串时，通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识。具体地说，所述标识模块 24在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串，并将所提取的读音字符串插入到所述待播报文本字符串的指定位置，标识所述人名的读音。

所述网络侧发送模块 45 将已进行读音标识的待播报文本字符串发送至终端侧，以供终端侧按照所述网络侧标识模块 44已标识的读音字符串播报所述待播报文本字符串中的人名字符串。

具体实施时，可以按照如下步骤进行：

步骤一：定义字符串中的读音槽，用以标识人名中多音字的读音，以便于 TTS引擎根据读音槽中的标识用正确的读音进行播报。

步骤二：建立历史人名读音知识库，对于历史人名中的字的特殊读音根据步骤一进行读音槽的标识。同时建立姓氏读音知识库，对于特殊的姓氏读音根据步骤一进行读音槽的标识。步骤三：利用词法分析和句法分析技术在句法树中找到名字字符串的节点位置 (数据源如果是联系人则可以直接在姓氏读音知识库进行搜索匹配并添加读音槽）。

步骤四：在历史人名知识库中搜索待播报文本字符串生成的句法树中的名字字符串节点，如果搜索到了就将文本字符串中所匹配到的历史人名字符串进行读音槽的标识。

步骤五：如果在历史人名知识库中没有搜索到的人名字符串节点，则在姓氏读音知识库中进行搜索匹配，对于匹配到的多音字姓氏进行读音槽的标识。

步骤六： TTS播报引擎根据读音槽制定人名中多音字的播报策略。

本发明实施例还提供一种计算机程序，包括程序指令，当该程序指令被终端侧执行时，使得该终端侧可执行上述方法。

本发明实施例还提供一种载有上述任一计算机程序的载体。

图 6是本发明实施例提供的中文人名播报流程图，如图 6所示，本实施例仅以电话终端 TTS语音播报 "曾一庭看《三国演义》这部小说，他非常喜欢关云长这个角色。 " 这段文本为例。

首先，定义字符串中的读音槽，例如名字 "曾一庭" ，可以定义为 "曾 [Pronounce:zeng]—庭"，以 [Pronounce:xxx]类似这样格式的字符串标识叫做读音槽。

其次，在服务器端以数据库的形式建立历史人名读音知识库以及姓氏读音知识库，见以下表 1和表 2所示。表 1为历史人名读音知识库图表，表 2 为姓氏读音知识库图表。将 "曾一庭看《三国演义》这部小说，他非常喜欢关云长这个角色。 " 这段待 TTS播报的文本内容由手机终端以 http方式传输到服务器端，由服务器端进行词法分析和句法分析后得到两颗语法树，语法树展示有两个 Name节点（ "曾一庭" ， "关云长" ），见附图 5所示。

表 1

Id Hi story name Pronounce char Pronounce slot 1 关云长长 [Pronounce： chang]

2 刘禅禅 [Pronounce： shan]

3 贾平凹凹 [Pronounce : wa]

表 2

然后，按照以下步骤进行中文人名标识和播报：

步骤一：匹配历史人名读音知识库，若在所述历史人名读音知识库中匹配到人名字符串，则执行步骤二，若没有匹配到，则执行步骤三。

步骤二：标识读音槽。

将（ "曾一庭" ， "关云长"）这两个 Name节点作为检索条件在历史人名读音知识库中用 SQL 查询语句（类似 select * from table 1 h where h.History— name = "关云长，，)搜索匹配到 "关云长 [Pronounce hang]" , 将这个读音槽插入到文本字符串中，例如： "曾一庭看《三国演义》这部小说，他喜欢关云长 [Pronounce hang]这个角色。，，。

步骤三：匹配姓氏读音知识库，若在所述姓氏读音知识库中匹配到人名字符串，则执行步骤四，若没有匹配到，则执行步骤五。

步骤四：标识读音槽。

将剩余的（ "曾一庭" ）这个 Name节点在姓氏读音知识库用 SQL查询语句搜索匹配到 "曾 [Pronounce:zeng] —庭" ，将上一个步骤处理好的文本进行处理后得出 "曾 [Pronounce:zeng]—庭看《三国演义》这部小说，他非常喜欢关云长 [Pronounce hang]这个角色。，，如手机），终端再将处理好后的文本以参数的形式传给 TTS引擎， TTS引擎依据 "曾 [Pronounce :zeng]，， "长 [Pronounce :chang]，，这两个读音槽进行播才艮策略的制定，即 TTS引擎按照读音槽中的读音播报人名。

尽管上文对本发明进行了详细说明，但是本发明不限于此，本技术领域技术人员可以根据本发明的原理进行各种修改。因此，凡按照本发明原理所作的修改，都应当理解为落入本发明的保护范围。

本领域的技术人员应该明白，上述的本发明实施例所提供的装置和 /或系统的各组成部分，以及方法中的各步骤，可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

工业实用性

本发明实施例通过文本中的语义解析出人名并标识，从而达到在终端侧 TTS播报的时候可以根据标识将人名中的多音字按照正确发音播报的目的。

Claims

权利要求书

1、一种中文人名播报方法，包括：

终端侧将含有人名字符串的待播报文本字符串发送至网络侧；

所述终端侧接收来自所述网络侧的已对所述人名字符串完成读音标识的待播报文本字符串；

所述终端侧按照所述读音字符串播报所述人名字符串。

2、一种中文人名播报方法，包括：

网络侧在预置的读音数据库中，搜索待播报文本字符串中的人名字符串；所述网络侧通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识；

所述网络侧将已进行读音标识的待播报文本字符串发送至终端侧，以供所述终端侧按照所述读音字符串播报所述人名字符串。

3、根据权利要求 2所述的方法，其中，在预置的读音数据库中，搜索待播报文本字符串中的人名字符串的步骤之前，还包括：

所述网络侧接收来自所述终端侧的待播报文本字符串；

所述网络侧对所述待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。

4、根据权利要求 2或 3所述的方法，其中，所述读音数据库包括历史人名发音知识库和 /或姓氏发音知识库，网络侧在所述历史人名发音知识库和 / 或姓氏发音知识库中，搜索待播报文本字符串中的人名字符串。

5、根据权利要求 4所述的方法，其中，所述的通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识的步骤包括：

所述网络侧在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串；

所述网络侧将所述读音字符串插入到所述待播报文本字符串的指定位置，标识所述人名的读音。

6、一种中文人名播报装置，包括：

终端侧收发模块，其设置为：将含有人名字符串的待播报文本字符串发送至网络侧，并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串；以及

终端侧播报模块，其设置为：按照所述读音字符串播报所述人名字符串。

7、一种中文人名播报装置，包括：

网络侧搜索模块，其设置为：在预置的读音数据库中，搜索待播报文本字符串中的人名字符串；

网络侧标识模块，其设置为：通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识；以及

网络侧发送模块，其设置为：将已进行读音标识的待播报文本字符串发送至终端侧，以供所述终端侧按照所述读音字符串播报所述人名字符串。

8、根据权利要求 7所述的装置，还包括：

网络侧接收模块，其设置为：在所述网络侧搜索模块搜索待播报文本字符串中的人名字符串之前，接收来自终端侧的待播报文本字符串；及

网络侧分析模块，其设置为：对所述待播报文本字符串进行语义分析，得到所述待播报文本字符串中的人名字符串。

9、根据权利要求 7或 8所述的装置，其中，所述读音数据库包括历史人名发音知识库和 /或姓氏发音知识库，所述网络侧搜索模块是设置为在所述历史人名发音知识库和 /或姓氏发音知识库中，搜索待播报文本字符串中的人名字符串。

10、根据权利要求 9所述的装置，其中，所述网络侧标识模块是设置为在所述历史人名发音知识库和 /或姓氏发音知识库中提取对应于所述人名字符串的读音字符串，并将所提取的读音字符串插入到所述待播报文本字符串的指定位置，标识所述人名的读音。

11、一种计算机程序，包括程序指令，当该程序指令被终端侧执行时，使得该终端侧可执行权利要求 1所述的方法。

12、一种载有权利要求 11所述计算机程序的载体。

13、一种计算机程序，包括程序指令，当该程序指令被网络侧执行时, 使得该网络侧可执行权利要求 2-5任一项所述的方法。

14、一种载有权利要求 13所述计算机程序的载体。