JP5888723B2 - 発音辞書作成装置、発音辞書の生産方法、およびプログラム - Google Patents
発音辞書作成装置、発音辞書の生産方法、およびプログラム Download PDFInfo
- Publication number
- JP5888723B2 JP5888723B2 JP2011197883A JP2011197883A JP5888723B2 JP 5888723 B2 JP5888723 B2 JP 5888723B2 JP 2011197883 A JP2011197883 A JP 2011197883A JP 2011197883 A JP2011197883 A JP 2011197883A JP 5888723 B2 JP5888723 B2 JP 5888723B2
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- information
- word
- entry
- word information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
は後続する単語によって発音が「/han-gug/」のように変化する。一方、例文3では前後の単語の影響を受けず、発音の変化は生じない。
(1)語節内においては、前後の単語の影響で様々な発音変化が生じる。
(2)話し言葉などで語節間にポーズが生起しない場合に限り語節間の発音変化が生じる。
(3)語節間で生じる発音変化は、先行する単語の影響による重複閉鎖や後続単語によるリエゾンなどの発音変化に限られる。なお、韓国語の閉鎖音には平音・激音・濃音の3項対立があり、平音は無気音、激音は有気音、濃音は喉頭の緊張を伴う無気音である。平音が音節境界で連続した場合、内破+外破として実現され、破裂の際は喉頭の緊張を伴う濃音として実現される(/VC.C'V/)。これが表記上の重複閉鎖である。また、重複閉鎖の詳細について、論文(http://www.lang.nagoya-u.ac.jp/nichigen/issue/pdf/3/3-14.pdf#search='重複閉鎖')に説明がある。
(実施の形態1)
(具体例1)
(以下、当該語節を語節Aという。)が存在する場合、分類部13を構成する分割手段131は、語節Aを2つの単語A1と単語A2に分ける。
なお、単語A1は、
単語A2は、
である。
次に、単語位置決定手段132は、単語A1に対して、単語情報群内における位置を、「語節頭に生起する」と判断する。次に、フラグ付与手段133は、単語A1に対して、分類フラグ「L」を付与し、「単語A1_L」を得る。そして、分類部13は、語節A中の単語A1に対する発音情報を得て、当該発音情報と「単語A1_L」とを有する発音エントリを構成する。
(以下、当該語節を語節Bという。)が存在する場合、分類部13を構成する分割手段131は、当該語節Bは、2以上の単語に分割できない、と判断する。次に、単語位置決定手段132は、語節Bと一致する単語B1に対して、単語情報群内における位置を、「1単語で語節を構成している」と判断する。次に、フラグ付与手段133は、単語B1に対して、分類フラグ「S」を付与し、「単語B1_S」を得る。そして、分類部13は、語節Bの中の単語B1に対する発音情報を得て、当該発音情報と「単語B1_S」とを有する発音エントリを構成する。
を例にとり、説明する。
以下の例文1では、語節Bは1単語から構成され、単語B1は後続の単語の影響を受けず、
となる。
(例文1)
一方、以下の例文2では、語節
(語節Cという。)
は単語C1と単語C2の2単語から構成される。
なお、単語C1は、
単語C2は、
である。
そして、語節Cにおいて、単語C1は後続の単語C2の影響で、「/han-gug/」の発音となる。
(例文2)
また、以下の例文3では、語節
(語節Dという。)
は単語D1と単語D2と単語D3の3単語から構成される。
なお、単語D1は、
単語D2は、
単語D3は、
である。
そして、語節Dにおいて、単語D1は後続の単語D2の影響で、「/han-gug/」の発音となる。
(例文3)
また、以下は単語
(単語Eという)(教育)の発音変化例である。つまり、単語Eは、前後の単語の影響により「kyo-yug」「gyo-yuk」「kyo-yukh」「kyo-yun」「kkyo-yug」「kkyo-yuk」「gyo-yun」のように発音が変化することがある。
(「「単語A1_L」,「han-guk」」、「「単語A1_L」,「han-gug」」、「「単語A1_R」,「han-guk」」、「「単語A1_C」,「han-guk」」、「「単語A1_C」,「han-gug」」、「「単語A1_S」,「han-guk」」、と同意義である)を得る。
(実験)
(具体例2)
なお、同様の現象は英語においても存在し、文節や意味の切れ目で息継ぎをする場合は、その切れ目の前後では、前後の単語による音の変化は生じない。
以下の例文1を「When a family moved in」と「a different family came」の間に息継ぎを入れて発声した場合、「in」は後続の単語の影響を受けず「/in/」と発声する
(例文1)
When a family moved in, a different family came.
一方、以下の例文2において、「it was in a different way.」を、息継ぎをせず発声する場合は、「in」の音は後続の単語「a」の影響を受け「/in n/」のような発音となる。
(例文2)
If you slipped in, it was in a different way.
2 音声認識装置
11 発音辞書
12 情報群格納部
13 分類部
14 エントリ決定部
15 発音エントリ選択部
61 音響モデル
62 言語モデル
63 音声受付部
64 音声認識部
65 認識結果出力部
131 分割手段
132 単語位置決定手段
133 フラグ付与手段
141 選択条件格納手段
142 頻度算出手段
143 判断手段
144 発音エントリ蓄積手段
Claims (6)
- 一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを格納し得る発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納し得る情報群格納部と、
前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置。 - 前記エントリ決定部は、
前記分類フラグごとに、発音エントリを選択する条件である選択条件を格納している選択条件格納手段と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出する頻度算出手段と、
前記分類フラグに対応する選択条件を前記選択条件格納手段から取得し、前記頻度算出手段が算出した頻度が前記取得した選択条件に合致するか判断する判断手段と、
前記判断手段が選択条件に合致すると判断した発音情報を有する発音エントリを前記発音辞書に蓄積する発音エントリ蓄積手段とを具備する請求項1記載の発音辞書作成装置。 - 前記エントリ決定部が選択した1以上の発音エントリに対して、各発音エントリが有する単語情報の前記情報群格納部における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する発音エントリ選択部をさらに具備し、
前記エントリ決定部は、
前記発音エントリ選択部が選択した発音エントリのみを、前記発音辞書に蓄積する請求項1または請求項2記載の発音辞書作成装置。 - 前記一の言語は、韓国語であり、
前記単語情報群は、語節である請求項1から請求項3いずれか記載の発音辞書作成装置。 - 記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを含む発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納しており、
分類部、およびエントリ決定部により実現される発音辞書の生産方法であって、
前記分類部が、前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類ステップと、
前記エントリ決定部が、前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定ステップとを具備する発音辞書の生産方法。 - 記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを含む発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納しており、
コンピュータを、
前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011197883A JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011197883A JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013061371A JP2013061371A (ja) | 2013-04-04 |
JP5888723B2 true JP5888723B2 (ja) | 2016-03-22 |
Family
ID=48186113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011197883A Expired - Fee Related JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5888723B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102069697B1 (ko) * | 2013-07-29 | 2020-02-24 | 한국전자통신연구원 | 자동 통역 장치 및 방법 |
KR102615290B1 (ko) * | 2016-09-01 | 2023-12-15 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004170887A (ja) * | 2002-11-22 | 2004-06-17 | Canon Inc | データ処理システム及びデータ格納方法 |
KR100707970B1 (ko) * | 2006-03-10 | 2007-04-16 | (주)인피니티 텔레콤 | 이동통신단말기를 이용한 통역 서비스 방법 |
JP5180800B2 (ja) * | 2008-12-11 | 2013-04-10 | 独立行政法人情報通信研究機構 | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム |
JP4981076B2 (ja) * | 2009-02-02 | 2012-07-18 | 日本放送協会 | 発音辞書修正装置、音声認識装置、およびコンピュータプログラム |
-
2011
- 2011-09-12 JP JP2011197883A patent/JP5888723B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013061371A (ja) | 2013-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110675855B (zh) | 一种语音识别方法、电子设备及计算机可读存储介质 | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
JP5072415B2 (ja) | 音声検索装置 | |
CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
WO2018192186A1 (zh) | 语音识别方法及装置 | |
CN112397056B (zh) | 语音评测方法及计算机存储介质 | |
WO2012164835A1 (ja) | 韻律生成装置、音声合成装置、韻律生成方法および韻律生成プログラム | |
US9129596B2 (en) | Apparatus and method for creating dictionary for speech synthesis utilizing a display to aid in assessing synthesis quality | |
KR101068122B1 (ko) | 음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법 | |
CN113327574A (zh) | 一种语音合成方法、装置、计算机设备和存储介质 | |
JP5688761B2 (ja) | 音響モデル学習装置、および音響モデル学習方法 | |
KR101097186B1 (ko) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 | |
CN103035244A (zh) | 一种可实时反馈用户朗读进度的语音跟踪方法 | |
KR20090063546A (ko) | 음성인식 장치 및 방법 | |
JP5888723B2 (ja) | 発音辞書作成装置、発音辞書の生産方法、およびプログラム | |
Manjunath et al. | Development of phonetic engine for Indian languages: Bengali and Oriya | |
Manjunath et al. | Automatic phonetic transcription for read, extempore and conversation speech for an Indian language: Bengali | |
Johnson et al. | Comparison of algorithms to divide noisy phone sequences into syllables for automatic unconstrained English speaking proficiency scoring | |
Mabokela et al. | An integrated language identification for code-switched speech using decoded-phonemes and support vector machine | |
Sasmal et al. | A zero-resourced indigenous language phones occurrence and durations analysis for an automatic speech recognition system | |
CN111489742B (zh) | 声学模型训练方法、语音识别方法、装置及电子设备 | |
JP6009396B2 (ja) | 発音付与方法とその装置とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5888723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |