JP2014215396A - 発音付与方法とその装置とプログラム - Google Patents
発音付与方法とその装置とプログラム Download PDFInfo
- Publication number
- JP2014215396A JP2014215396A JP2013091471A JP2013091471A JP2014215396A JP 2014215396 A JP2014215396 A JP 2014215396A JP 2013091471 A JP2013091471 A JP 2013091471A JP 2013091471 A JP2013091471 A JP 2013091471A JP 2014215396 A JP2014215396 A JP 2014215396A
- Authority
- JP
- Japan
- Prior art keywords
- word
- word candidate
- grammar
- context
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 10
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 10
- 230000000877 morphologic effect Effects 0.000 claims description 20
- 230000010354 integration Effects 0.000 claims description 3
- 241001237726 Yoma Species 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】発音付与方法は、形態素解析過程S110と文法生成過程S120と文脈自由文法音声認識過程S130を備える。形態素解析過程S110は、テキストデータを入力として、当該テキストデータを形態素解析した単語候補系列を出力する。文法生成過程S120は、形態素解析過程で得られた単語候補系列を入力として、当該単語候補系列から文脈自由文法に基づいて文法を生成する。文脈自由文法音声認識過程S130は、上記テキストデータに対応した音声データと文法生成過程で生成した文法を入力として、当該文法に基づいた文脈自由文法音声認識処理を行って、音声合成に用いる単語系列の読みを出力する。
【選択図】図2
Description
Claims (5)
- テキストデータを入力として、当該テキストデータを形態素解析した単語候補系列を出力する形態素解析過程と、
上記単語候補系列を入力として、当該単語候補系列から文脈自由文法に基づいて文法を生成する文法生成過程と、
上記テキストデータに対応した音声データと上記文法を入力として、当該文法に基づいた文脈自由文法音声認識処理を行って、音声合成に用いる単語系列の読みを出力する文脈自由文法音声認識過程と、
を備える発音付与方法。 - テキストデータを入力として、当該テキストデータを形態素解析した第1単語候補系列を出力する形態素解析過程と、
上記第1単語候補系列を入力として、当該第1単語候補系列から文脈自由文法に基づいて文法を生成する文法生成過程と、
上記テキストデータの音声データと上記文法を入力として、上記文法に基づいた文脈自由文法音声認識処理を行って、第2単語候補系列とその尤度を出力する文脈自由文法音声認識過程と、
上記音声データを入力として当該音声データを大語彙連続音声認識して、第3単語候補系列を出力する大語彙連続音声認識過程と、
上記第2単語候補系列と第3単語候補系列とを照合し、同一時間区間で一致している単語候補が存在する時間区間とそれ以外の時間区間を区分して時間区間に対応付けた対応付後第2単語候補系列とその尤度と対応付後第3単語候補系列を出力する単語候補系列照合過程と、
上記対応付後第2単語候補系列と上記対応付後第3単語候補系列とを、同一時間区間で照合し、一致する単語が1つしかない場合は当該単語を当該時間区間の単語として決定し、一致する単語が複数存在する場合は上記尤度の高い単語を当該時間区間の単語として決定し、一致する単語が無い場合は当該時間区間に対応する上記対応付後第2単語候補と上記対応付後第3単語候補を、新たに当該時間区間に対応する単語候補とした第4単語候補系列を出力する単語候補判定統合過程と、
上記第4単語候補系列を入力として、上記時間区間に対応する未確定の単語候補から、文脈自由文法を生成して文脈自由文法音声認識処理を行って、尤度最大の単語候補を当該時間区間の単語として決定した単語系列の読みを出力する再認識過程と、
を備える発音付与方法。 - テキストデータを入力として、当該テキストデータを形態素解析した単語候補系列を出力する形態素解析部と、
上記単語候補系列を入力として、当該単語候補系列から文脈自由文法に基づいて文法を生成する文法生成部と、
上記テキストデータに対応した音声データと上記文法を入力として、当該文法に基づいた文脈自由文法音声認識処理を行って、音声合成に用いる単語系列の読みを出力する文脈自由文法音声認識部と、
を具備する発音付与装置。 - テキストデータを入力として、当該テキストデータを形態素解析した第1単語候補系列を出力する形態素解析部と、
上記第1単語候補系列を入力として、当該第1単語候補系列から文脈自由文法に基づいて文法を生成する文法生成部と、
上記テキストデータの音声データと上記文法を入力として、上記文法に基づいた文脈自由文法音声認識処理を行って、第2単語候補系列とその尤度を出力する文脈自由文法音声認識部と、
上記音声データを入力として当該音声データを大語彙連続音声認識して、第3単語候補系列を出力する大語彙連続音声認識部と、
上記第2単語候補系列と第3単語候補系列とを照合し、同一時間区間で一致している単語候補が存在する時間区間とそれ以外の時間区間を区分して時間区間に対応付けた対応付後第2単語候補系列とその尤度と対応付後第3単語候補系列を出力する単語候補系列照合部と、
上記対応付後第2単語候補系列と上記対応付後第3単語候補系列とを、同一時間区間で照合し、一致する単語が1つしかない場合は当該単語を当該時間区間の単語として決定し、一致する単語が複数存在する場合は上記尤度の高い単語を当該時間区間の単語として決定し、一致する単語が無い場合は当該時間区間に対応する上記対応付後第2単語候補と上記対応付後第3単語候補を、新たに当該時間区間に対応する単語候補とした第4単語候補系列を出力する単語候補判定統合部と、
上記第4単語候補系列を入力として、上記時間区間に対応する未確定の単語候補から、文脈自由文法を生成して文脈自由文法音声認識処理を行って、尤度最大の単語候補を当該時間区間の単語として決定した単語系列の読みを出力する再認識部と、
を具備する発音付与装置。 - 請求項1又は2に記載した発音付与方法を、コンピュータで処理するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013091471A JP6009396B2 (ja) | 2013-04-24 | 2013-04-24 | 発音付与方法とその装置とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013091471A JP6009396B2 (ja) | 2013-04-24 | 2013-04-24 | 発音付与方法とその装置とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014215396A true JP2014215396A (ja) | 2014-11-17 |
JP6009396B2 JP6009396B2 (ja) | 2016-10-19 |
Family
ID=51941218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013091471A Expired - Fee Related JP6009396B2 (ja) | 2013-04-24 | 2013-04-24 | 発音付与方法とその装置とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6009396B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019154468A (ja) * | 2018-03-07 | 2019-09-19 | 株式会社Nttドコモ | 対話システム |
KR20200030354A (ko) * | 2018-09-12 | 2020-03-20 | 주식회사 한글과컴퓨터 | 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02238494A (ja) * | 1989-03-13 | 1990-09-20 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH10171806A (ja) * | 1996-12-13 | 1998-06-26 | Nec Corp | 語義曖昧性解消装置及び方法 |
JP2003242147A (ja) * | 2002-02-18 | 2003-08-29 | Seiko Epson Corp | ネットワーク文法生成方法およびネットワーク文法生成装置ならびに音声認識装置 |
JP2004198831A (ja) * | 2002-12-19 | 2004-07-15 | Sony Corp | 音声認識装置および方法、プログラム、並びに記録媒体 |
JP2007024960A (ja) * | 2005-07-12 | 2007-02-01 | Internatl Business Mach Corp <Ibm> | システム、プログラムおよび制御方法 |
JP2007171275A (ja) * | 2005-12-19 | 2007-07-05 | Canon Inc | 言語処理装置及び現後処理方法 |
JP2007256297A (ja) * | 2004-03-18 | 2007-10-04 | Nec Corp | 音声処理方法と通信システム並びに通信端末およびサーバとプログラム |
JP2008176202A (ja) * | 2007-01-22 | 2008-07-31 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
JP2011247928A (ja) * | 2010-05-24 | 2011-12-08 | Nec Corp | 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム |
-
2013
- 2013-04-24 JP JP2013091471A patent/JP6009396B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02238494A (ja) * | 1989-03-13 | 1990-09-20 | Matsushita Electric Ind Co Ltd | 音声合成装置 |
JPH10171806A (ja) * | 1996-12-13 | 1998-06-26 | Nec Corp | 語義曖昧性解消装置及び方法 |
JP2003242147A (ja) * | 2002-02-18 | 2003-08-29 | Seiko Epson Corp | ネットワーク文法生成方法およびネットワーク文法生成装置ならびに音声認識装置 |
JP2004198831A (ja) * | 2002-12-19 | 2004-07-15 | Sony Corp | 音声認識装置および方法、プログラム、並びに記録媒体 |
JP2007256297A (ja) * | 2004-03-18 | 2007-10-04 | Nec Corp | 音声処理方法と通信システム並びに通信端末およびサーバとプログラム |
JP2007024960A (ja) * | 2005-07-12 | 2007-02-01 | Internatl Business Mach Corp <Ibm> | システム、プログラムおよび制御方法 |
JP2007171275A (ja) * | 2005-12-19 | 2007-07-05 | Canon Inc | 言語処理装置及び現後処理方法 |
JP2008176202A (ja) * | 2007-01-22 | 2008-07-31 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
JP2011247928A (ja) * | 2010-05-24 | 2011-12-08 | Nec Corp | 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6016029793; Norbert BRAUNSCHWEILER, et al.: 'Lightly Supervised Recognition for Automatic Alignment of Large Coherent Speech Recordings' Proc. INTERSPEECH 2010 , 20100926, pp.2222-2225, ISCA * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019154468A (ja) * | 2018-03-07 | 2019-09-19 | 株式会社Nttドコモ | 対話システム |
JP7019462B2 (ja) | 2018-03-07 | 2022-02-15 | 株式会社Nttドコモ | 対話システム |
KR20200030354A (ko) * | 2018-09-12 | 2020-03-20 | 주식회사 한글과컴퓨터 | 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법 |
KR102144345B1 (ko) | 2018-09-12 | 2020-08-13 | 주식회사 한글과컴퓨터 | 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP6009396B2 (ja) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US8073693B2 (en) | System and method for pronunciation modeling | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
WO2014183373A1 (en) | Systems and methods for voice identification | |
TWI610294B (zh) | 語音辨識系統及其方法、詞彙建立方法與電腦程式產品 | |
JP2001296880A5 (ja) | ||
CN108074562B (zh) | 语音识别装置、语音识别方法以及存储介质 | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
CN102439660A (zh) | 基于置信度得分的语音标签方法和装置 | |
JPWO2014136222A1 (ja) | 音声認識装置および音声認識方法 | |
KR101068122B1 (ko) | 음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법 | |
JP2012094117A (ja) | アラビア語テキストに発音区別符号を付与するための方法およびシステム | |
US11295733B2 (en) | Dialogue system, dialogue processing method, translating apparatus, and method of translation | |
US20110224985A1 (en) | Model adaptation device, method thereof, and program thereof | |
JP6009396B2 (ja) | 発音付与方法とその装置とプログラム | |
JP6082657B2 (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
JP2012177815A (ja) | 音響モデル学習装置、および音響モデル学習方法 | |
JP2015161927A (ja) | 音響モデル生成装置、音響モデルの生産方法、およびプログラム | |
US20150206539A1 (en) | Enhanced human machine interface through hybrid word recognition and dynamic speech synthesis tuning | |
JP2024038566A (ja) | キーワード検出装置、キーワード検出方法、およびキーワード検出プログラム | |
JP5888723B2 (ja) | 発音辞書作成装置、発音辞書の生産方法、およびプログラム | |
JP2008242059A (ja) | 音声認識辞書作成装置および音声認識装置 | |
KR20200091738A (ko) | 핵심어 검출 장치, 이를 이용한 핵심어 검출 방법 및 컴퓨터 프로그램 | |
JP2021529338A (ja) | 発音辞書生成方法及びそのための装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6009396 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |