JP6928642B2 - 音声放送方法及び装置 - Google Patents
音声放送方法及び装置 Download PDFInfo
- Publication number
- JP6928642B2 JP6928642B2 JP2019503523A JP2019503523A JP6928642B2 JP 6928642 B2 JP6928642 B2 JP 6928642B2 JP 2019503523 A JP2019503523 A JP 2019503523A JP 2019503523 A JP2019503523 A JP 2019503523A JP 6928642 B2 JP6928642 B2 JP 6928642B2
- Authority
- JP
- Japan
- Prior art keywords
- broadcast
- target
- tag set
- tag
- broadcasting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000013507 mapping Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000008451 emotion Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000001902 propagating effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
- G10L2013/105—Duration
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Electrically Operated Instructional Devices (AREA)
- Information Transfer Between Computers (AREA)
- Circuits Of Receivers In General (AREA)
Description
Claims (14)
- 被放送対象を取得するステップと、
詩詞、天気、時間、計算を含む、前記被放送対象の目標対象タイプを認識するステップと、
前記目標対象タイプに基づいて、前記被放送対象とマッチングする、前記被放送対象の放送ルールを特徴付けるための放送タグ集合を取得するステップであって、前記放送タグ集合が、休止タグ、アクセントタグ、ボリュームタグ、音調タグ、音声速度タグ、音源タグ、オーディオ導入タグ、同形異音語識別子タグ、数字読み方識別子タグを含むステップと、
前記放送タグ集合によって特徴付けられた前記放送ルールに基づいて、前記被放送対象を放送するステップとを含む音声放送方法。 - 前記目標タイプに基づいて、前記被放送対象とマッチングする前記放送タグ集合を取得するステップは、
前記目標対象タイプに基づいて、対象タイプと前記放送タグ集合とのマッピング関係をクエリして、前記被放送対象とマッチングする、前記放送タグ集合である第1放送タグ集合を取得するステップを含む請求項1に記載の音声放送方法。 - 前記目標対象タイプに基づいて、前記対象タイプと前記放送タグ集合とのマッピング関係をクエリして、前記被放送対象とマッチングする前記第1放送タグ集合を取得するステップの後に、
ユーザの放送ニーズを取得するステップと、
前記放送ニーズに基づいて、前記被放送対象とマッチングする第2放送タグ集合を形成するステップと、
前記第1放送タグ集合及び前記第2放送タグ集合を利用して、前記放送タグ集合を形成するステップとをさらに含む請求項2に記載の音声放送方法。 - 前記第1放送タグ集合及び前記第2放送タグ集合を利用して、前記放送タグ集合を形成するステップは、
前記第1放送タグ集合から一部の放送タグを選定して前記第1目標放送タグ集合を形成するステップと、
前記第2放送タグ集合から一部の放送タグを選択して前記第2目標放送タグ集合を形成するステップと、
前記第1目標放送タグ集合及び/又は前記第2目標放送タグ集合を利用して、前記放送タグ集合を形成するステップとを含む請求項3に記載の音声放送方法。 - 前記被放送対象を取得するステップの前に、
前記対象タイプのそれぞれに対して、異なる前記対象タイプにおける前記放送ルールを取得するステップと、
前記放送ルールに基づいて、前記対象タイプに対応する前記放送タグ集合を形成するステップと、
前記対象タイプと前記放送タグ集合との前記マッピング関係を構築するステップとをさらに含む請求項1から請求項4のいずれかに記載の音声放送方法。 - 前記被放送対象の前記目標対象タイプを認識するステップは、
前記被放送対象のキー情報に基づいて、前記被放送対象の前記目標対象タイプを認識するステップを含む請求項1から請求項5のいずれかに記載の音声放送方法。 - 被放送対象を取得する第1取得モジュールと、
詩詞、天気、時間、計算を含む、前記被放送対象の目標対象タイプを認識する認識モジュールと、
前記目標対象タイプに基づいて、前記被放送対象とマッチングする、前記被放送対象の放送ルールを特徴付けるための放送タグ集合を取得する第2取得モジュールであって、前記放送タグ集合が、休止タグ、アクセントタグ、ボリュームタグ、音調タグ、音声速度タグ、音源タグ、オーディオ導入タグ、同形異音語識別子タグ、数字読み方識別子タグを含む第2取得モジュールと、
前記放送タグ集合によって特徴付けられた前記放送ルールに基づいて、前記被放送対象を放送する放送モジュールとを備える音声放送装置。 - 前記第2取得モジュールは、
前記目標対象タイプに基づいて、対象タイプと前記放送タグ集合とのマッピング関係をクエリして、前記被放送対象とマッチングする、前記放送タグ集合である第1放送タグ集合を取得するクエリ取得ユニットを備える請求項7に記載の音声放送装置。 - 前記第2取得モジュールは、
前記目標対象タイプに基づいて、前記対象タイプと前記放送タグ集合とのマッピング関係をクエリして、前記被放送対象とマッチングする前記第1放送タグ集合を取得した後、ユーザの放送ニーズを取得するニーズ取得ユニットと、
前記放送ニーズに基づいて、前記被放送対象とマッチングする第2放送タグ集合を形成する第1形成ユニットと、
前記第1放送タグ集合及び前記第2放送タグ集合を利用して、前記放送タグ集合を形成する第2形成ユニットとをさらに備える請求項8に記載の音声放送装置。 - 前記第2形成ユニットは、具体的には、前記第1放送タグ集合から一部の放送タグを選定して前記第1目標放送タグ集合を形成し、前記第2放送タグ集合から一部の放送タグを選択して前記第2目標放送タグ集合を形成し、前記第1目標放送タグ集合及び/又は前記第2目標放送タグ集合を利用して、前記放送タグ集合を形成する請求項9に記載の音声放送装置。
- 前記対象タイプのそれぞれに対して、異なる前記対象タイプにおける前記放送ルールを取得し、前記放送ルールに基づいて、前記対象タイプに対応する前記放送タグ集合を形成し、前記対象タイプと前記放送タグ集合との前記マッピング関係を構築する構築モジュールをさらに備える請求項7から請求項10のいずれかに記載の音声放送装置。
- 前記認識モジュールは、具体的には、前記被放送対象のキー情報に基づいて、前記被放送対象の前記目標対象タイプを認識する請求項7から請求項11のいずれかに記載の音声放送装置。
- メモリと、
プロセッサとを備え、
該プロセッサは、前記メモリに記憶されている実行可能プログラムコードを読み出して、前記実行可能プログラムコードに対応するプログラムを実行して、請求項1から請求項6のいずれかに記載の音声放送方法を実現するスマート機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラムがプロセッサによって実行される場合、請求項1から請求項6のいずれかに記載の音声放送方法が実現されるコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710541569.2 | 2017-07-05 | ||
CN201710541569.2A CN107437413B (zh) | 2017-07-05 | 2017-07-05 | 语音播报方法及装置 |
PCT/CN2018/094116 WO2019007308A1 (zh) | 2017-07-05 | 2018-07-02 | 语音播报方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019533212A JP2019533212A (ja) | 2019-11-14 |
JP6928642B2 true JP6928642B2 (ja) | 2021-09-01 |
Family
ID=60459727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019503523A Active JP6928642B2 (ja) | 2017-07-05 | 2018-07-02 | 音声放送方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200184948A1 (ja) |
EP (1) | EP3651152A4 (ja) |
JP (1) | JP6928642B2 (ja) |
KR (1) | KR102305992B1 (ja) |
CN (1) | CN107437413B (ja) |
WO (1) | WO2019007308A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437413B (zh) * | 2017-07-05 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
CN108053820A (zh) * | 2017-12-13 | 2018-05-18 | 广东美的制冷设备有限公司 | 空气调节器的语音播报方法及装置 |
CN108600911B (zh) | 2018-03-30 | 2021-05-18 | 联想(北京)有限公司 | 一种输出方法及电子设备 |
CN109582271B (zh) * | 2018-10-26 | 2020-04-03 | 北京蓦然认知科技有限公司 | 一种动态设置tts播放参数的方法、装置及设备 |
CN109523987A (zh) * | 2018-11-30 | 2019-03-26 | 广东美的制冷设备有限公司 | 事件语音播报方法、装置及家电设备 |
CN110032626B (zh) * | 2019-04-19 | 2022-04-12 | 百度在线网络技术(北京)有限公司 | 语音播报方法和装置 |
CN110189742B (zh) * | 2019-05-30 | 2021-10-08 | 芋头科技(杭州)有限公司 | 确定情感音频、情感展示、文字转语音的方法和相关装置 |
CN110456687A (zh) * | 2019-07-19 | 2019-11-15 | 安徽亿联网络科技有限公司 | 一种多模式智能场景控制系统 |
US11380300B2 (en) | 2019-10-11 | 2022-07-05 | Samsung Electronics Company, Ltd. | Automatically generating speech markup language tags for text |
CN112698807B (zh) * | 2020-12-29 | 2023-03-31 | 上海掌门科技有限公司 | 语音播报方法、设备及计算机可读介质 |
CN113611282B (zh) * | 2021-08-09 | 2024-05-14 | 苏州市广播电视总台 | 广播节目智能播报系统及方法 |
CN115985022A (zh) * | 2022-12-14 | 2023-04-18 | 江苏丰东热技术有限公司 | 设备情况实时语音播报方法、装置、电子设备及存储介质 |
CN118314901B (zh) * | 2024-06-05 | 2024-08-20 | 深圳市声扬科技有限公司 | 语音播放方法、装置、电子设备以及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100724868B1 (ko) * | 2005-09-07 | 2007-06-04 | 삼성전자주식회사 | 다수의 합성기를 제어하여 다양한 음성 합성 기능을제공하는 음성 합성 방법 및 그 시스템 |
US7822606B2 (en) * | 2006-07-14 | 2010-10-26 | Qualcomm Incorporated | Method and apparatus for generating audio information from received synthesis information |
KR101160193B1 (ko) * | 2010-10-28 | 2012-06-26 | (주)엠씨에스로직 | 감성적 음성합성 장치 및 그 방법 |
US9202465B2 (en) * | 2011-03-25 | 2015-12-01 | General Motors Llc | Speech recognition dependent on text message content |
US9767789B2 (en) * | 2012-08-29 | 2017-09-19 | Nuance Communications, Inc. | Using emoticons for contextual text-to-speech expressivity |
WO2015162737A1 (ja) * | 2014-04-23 | 2015-10-29 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
US10192541B2 (en) * | 2014-06-05 | 2019-01-29 | Nuance Communications, Inc. | Systems and methods for generating speech of multiple styles from text |
JP6596891B2 (ja) * | 2015-04-08 | 2019-10-30 | ソニー株式会社 | 送信装置、送信方法、受信装置、及び、受信方法 |
CN105139848B (zh) * | 2015-07-23 | 2019-01-04 | 小米科技有限责任公司 | 数据转换方法和装置 |
CN105931631A (zh) * | 2016-04-15 | 2016-09-07 | 北京地平线机器人技术研发有限公司 | 语音合成系统和方法 |
CN106557298A (zh) * | 2016-11-08 | 2017-04-05 | 北京光年无限科技有限公司 | 面向智能机器人的背景配音输出方法及装置 |
CN106652995A (zh) * | 2016-12-31 | 2017-05-10 | 深圳市优必选科技有限公司 | 文本语音播报方法及系统 |
CN107437413B (zh) * | 2017-07-05 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
-
2017
- 2017-07-05 CN CN201710541569.2A patent/CN107437413B/zh active Active
-
2018
- 2018-07-02 JP JP2019503523A patent/JP6928642B2/ja active Active
- 2018-07-02 WO PCT/CN2018/094116 patent/WO2019007308A1/zh unknown
- 2018-07-02 EP EP18828877.3A patent/EP3651152A4/en not_active Withdrawn
- 2018-07-02 US US16/616,611 patent/US20200184948A1/en not_active Abandoned
- 2018-07-02 KR KR1020197002335A patent/KR102305992B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP3651152A1 (en) | 2020-05-13 |
CN107437413B (zh) | 2020-09-25 |
EP3651152A4 (en) | 2021-04-21 |
CN107437413A (zh) | 2017-12-05 |
KR20190021409A (ko) | 2019-03-05 |
KR102305992B1 (ko) | 2021-09-28 |
JP2019533212A (ja) | 2019-11-14 |
WO2019007308A1 (zh) | 2019-01-10 |
US20200184948A1 (en) | 2020-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6928642B2 (ja) | 音声放送方法及び装置 | |
US10614803B2 (en) | Wake-on-voice method, terminal and storage medium | |
JP6357458B2 (ja) | 音声合成における同綴異音異義語の曖昧さの解消 | |
KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
CN101030368B (zh) | 在保持情感的同时跨通道进行通信的方法和系统 | |
KR102628036B1 (ko) | 음성 신호를 기초로 한 텍스트 편집 장치 및 텍스트 편집 방법 | |
WO2020098115A1 (zh) | 字幕添加方法、装置、电子设备及计算机可读存储介质 | |
CN110197655B (zh) | 用于合成语音的方法和装置 | |
CN109410918B (zh) | 用于获取信息的方法及装置 | |
CN112908292B (zh) | 文本的语音合成方法、装置、电子设备及存储介质 | |
CN108804667B (zh) | 用于呈现信息的方法和装置 | |
CN107908743B (zh) | 人工智能应用构建方法和装置 | |
WO2014154097A1 (en) | Automatic page content reading-aloud method and device thereof | |
WO2021169825A1 (zh) | 语音合成方法、装置、设备和存储介质 | |
CN110413834B (zh) | 语音评论修饰方法、系统、介质和电子设备 | |
WO2023287360A2 (zh) | 多媒体处理方法、装置、电子设备及存储介质 | |
US11056103B2 (en) | Real-time utterance verification system and method thereof | |
CN110379406A (zh) | 语音评论转换方法、系统、介质和电子设备 | |
CN111105781B (zh) | 语音处理方法、装置、电子设备以及介质 | |
US20140297285A1 (en) | Automatic page content reading-aloud method and device thereof | |
CN113221514A (zh) | 文本处理方法、装置、电子设备和存储介质 | |
CN113761865A (zh) | 声文重对齐及信息呈现方法、装置、电子设备和存储介质 | |
KR20140088327A (ko) | 동적인 대화를 이용한 어학 학습 방법, 이를 위한 시스템 및 장치 | |
KR20220034488A (ko) | 전자 장치 및 이의 제어 방법 | |
CN112951274A (zh) | 语音相似度确定方法及设备、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200416 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200623 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20201022 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210216 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210406 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20210629 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20210803 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20210803 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6928642 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |