JP2021096327A - アクセント推定装置、アクセント学習装置、アクセント推定方法、および、アクセント学習方法 - Google Patents
アクセント推定装置、アクセント学習装置、アクセント推定方法、および、アクセント学習方法 Download PDFInfo
- Publication number
- JP2021096327A JP2021096327A JP2019226480A JP2019226480A JP2021096327A JP 2021096327 A JP2021096327 A JP 2021096327A JP 2019226480 A JP2019226480 A JP 2019226480A JP 2019226480 A JP2019226480 A JP 2019226480A JP 2021096327 A JP2021096327 A JP 2021096327A
- Authority
- JP
- Japan
- Prior art keywords
- accent
- notation
- estimation
- reading
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 238000010801 machine learning Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 10
- 235000016496 Panda oleosa Nutrition 0.000 description 8
- 240000000220 Panda oleosa Species 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 238000013136 deep learning model Methods 0.000 description 7
- 230000021615 conjugation Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- -1 adverbs Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 235000012830 plain croissants Nutrition 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
上記アクセント推定装置において、前記解析部は、前記アクセント辞書に基づいて前記推定用表記を解析して、前記推定用表記の読みを出力し、前記推定部は、前記モデルの入力値とする前記推定用表記の読みを、前記解析部が出力した前記推定用表記の読みとしてもよい。
図1が示すように、アクセント推定装置10は、アクセント推定プログラムを実行して、アクセント推定方法を行う。アクセント推定装置10は、利用者端末20から推定要求20Qを受け付ける。アクセント推定装置10は、推定要求20Qを受け付けて、推定用表記20Dを取得する。推定用表記20Dは、アクセントを推定する対象である。アクセント推定装置10は、下記(A)〜(D)の4つの入力値を、機械学習モデルの入力値に含める。機械学習モデルは、4つの入力値を用いて、推定用表記20Dのアクセントを出力する。アクセント推定装置10は、機械学習モデルが出力したアクセントを、推定要求20Qの回答10Aとして、利用者端末20に提供する。
(A)推定用表記20D
(B)推定用表記20Dの読み
(C)推定用表記20Dの品詞
(D)推定用表記20Dの辞書アクセント
(A)推定用表記20Dは、文字、数字、記号によって書き表される文字列である。推定用表記20Dは、例えば「世界遺産」のように、文法上のひとまとまりの意味を有した最小限の単位である単語である。推定用表記20Dは、例えば「北欧で登録されている世界遺産の数は」のように、単語の連なりとして統語論的にひとつの機能を有する文である。推定用表記20Dは、例えば「北欧で登録されている世界遺産の数は32カ所ある」のように、文の連なりとしてひとつの内容を表した文章である。
図2が示すように、アクセント推定装置10は、読み推定モジュール14、および、アクセント推定モジュール15として機能する。アクセント推定装置10は、制御部12がアクセント推定プログラムを実行することによって、読み推定モジュール14、および、アクセント推定モジュール15として機能する。
図3が示すように、アクセント推定モジュール15が備えるアクセント推定モデルは、ニューラルネットワークを備える。ニューラルネットワークは、複数の入力ノードNAから構成される入力層18A、複数の中間ノードNBから構成される中間層18B(隠れ層)、および、複数の出力ノードNCから構成される出力層18Cを備える。
アクセント推定装置10が行うアクセント推定方法は、読み推定処理、当てはめ処理、および、アクセント推定処理を含む。
アクセント学習装置30は、アクセント推定装置10が備える機械学習モデルを変更して学習処理を行う点がことなる一方で、その他の構成においては、アクセント推定装置10と共通する。以下では、アクセント推定装置10と異なる構成を説明し、アクセント推定装置10と共通する構成に関しては、同一の符号を付して、その説明を割愛する。
(A1)学習用表記
(B1)学習用表記の読み
(C1)学習用表記の品詞
(D1)学習用表記の読みの教師アクセント
アクセント学習装置30が行うアクセント学習方法は、読み学習処理、当てはめ処理、および、アクセント学習処理を含む。
(1)推定用表記20Dが新語を含む場合であれ、推定用表記20Dが未知の結合規則で作られた複合語を含む場合であれ、アクセント辞書13Aに登録されたアクセントが未知語の読みに当てはめられる。そして、未知語の読みに当てはめられたアクセントが適切なアクセントではない場合であれ、当該アクセントを適切なアクセントに近づけ得るような推定が、アクセント推定モデルによって行われる。結果として、推定用表記20Dが未知語を含む場合であっても、推定用表記20Dの読みに適したアクセントを作成することが可能であるから、アクセントの推定精度を高めることが可能となる。
・アクセント推定装置10は、読み推定処理に用いる辞書をアクセント辞書13Aとすることも可能である。なお、上述したように、読み推定処理に用いる辞書を読み方辞書13Rとする構成であれば、推定用表記20Dの読みの精度を高めることが可能である。一方、読み推定処理に用いる辞書をアクセント辞書13Aとする構成であれば、アクセント推定装置が備える辞書数を少なくして装置構成の簡素化を図ることが可能ともなる。
・アクセント推定装置10は、アクセントの推定に際して、上記(A)(B)(D)を機械学習モデルの入力値として、上記(C)を機械学習モデルの入力値から割愛してもよい。アクセント学習装置30は、アクセントの学習に際して、上記(A1)(B1)(D1)を機械学習モデルの入力値として、上記(C1)を機械学習モデルの入力値から割愛してもよい。
13A…アクセント辞書
13R…読み方辞書
20D…推定用表記
20R…学習用入力値
20Ps…辞書アクセント
30…アクセント学習装置
Claims (9)
- 表記と読みとアクセントとを関連付けた辞書がアクセント辞書であり、前記アクセント辞書に基づいて推定用表記を解析し、前記アクセント辞書に登録されているアクセントを前記推定用表記の読みに当てはめることを、前記アクセント辞書に登録されていない未知語を含めて行い、それによって、前記推定用表記の辞書アクセントを出力する解析部と、
表記と読みと辞書アクセントとを入力値として当該表記の適切なアクセントを出力値とするように機械学習したモデルを備え、前記推定用表記、前記推定用表記の読み、および、前記解析部が出力した前記推定用表記の辞書アクセントを前記モデルの入力値として、前記モデルの出力値を前記推定用表記のアクセントとして出力する推定部と、を備える
アクセント推定装置。 - 前記解析部が、第1解析部であり、
表記と読みとを関連付けた辞書が読み方辞書であり、前記読み方辞書に基づいて前記推定用表記を解析し、前記推定用表記の読みを出力する第2解析部をさらに備え、
前記推定部は、前記モデルの入力値とする前記推定用表記の読みを、前記第2解析部が出力した前記推定用表記の読みとする
請求項1に記載のアクセント推定装置。 - 前記推定部は、前記モデルの入力値とする前記推定用表記の読みを、利用者が入力した適切な読みとする
請求項1に記載のアクセント推定装置。 - 前記解析部は、前記アクセント辞書に基づいて前記推定用表記を解析して、前記推定用表記の読みを出力し、
前記推定部は、前記モデルの入力値とする前記推定用表記の読みを、前記解析部が出力した前記推定用表記の読みとする
請求項1に記載のアクセント推定装置。 - 表記と読みとアクセントとを関連付けた辞書がアクセント辞書であり、前記アクセント辞書に基づいて学習用表記を解析し、前記アクセント辞書に登録されているアクセントを前記学習用表記の読みに当てはめることを、前記アクセント辞書に登録されていない未知語を含めて行い、それによって、前記学習用表記の辞書アクセントを出力する解析部と、
機械学習したモデルを出力する学習部であって、前記学習用表記、前記学習用表記の読み、および、前記学習用表記の辞書アクセントを前記モデルの入力値とし、前記学習用表記の適切なアクセントを前記モデルの出力値の理想値として、前記モデルに機械学習させる前記学習部と、を備える
アクセント学習装置。 - 前記解析部が、第1解析部であり、
表記と読みとを関連付けた辞書が読み方辞書であり、前記読み方辞書に基づいて前記学習用表記を解析して、前記学習用表記の読みを出力する第2解析部をさらに備え、
前記学習部は、前記モデルの入力値とする前記学習用表記の読みを、前記第2解析部が出力した前記学習用表記の読みとする
請求項5に記載のアクセント学習装置。 - 前記学習部は、前記モデルの入力値とする前記学習用表記の読みを、利用者が入力した適切な読みとする
請求項5に記載のアクセント学習装置。 - 表記と読みとアクセントとを関連付けた辞書がアクセント辞書であり、前記アクセント辞書に基づいて推定用表記を解析し、前記アクセント辞書に登録されているアクセントを前記推定用表記の読みに当てはめることを、前記アクセント辞書に登録されていない未知語の読みを含めて行い、それによって、前記推定用表記の辞書アクセントを出力すること、および、
表記と読みと辞書アクセントとを入力値として当該表記の適切なアクセントを出力値とするように機械学習したモデルを備え、前記推定用表記、前記推定用表記の読み、および、前記推定用表記の辞書アクセントを前記モデルの入力値として、前記モデルの出力値を前記推定用表記のアクセントとして出力すること、を含む
アクセント推定方法。 - 表記と読みとアクセントとを関連付けた辞書がアクセント辞書であり、前記アクセント辞書に基づいて学習用表記を解析し、前記アクセント辞書に登録されているアクセントを前記学習用表記の読みに当てはめることを、前記アクセント辞書に登録されていない未知語の読みを含めて行い、それによって、前記学習用表記の辞書アクセントを出力すること、および、
機械学習したモデルを出力することであって、前記学習用表記、前記学習用表記の読み、および、前記学習用表記の辞書アクセントを前記モデルの入力値とし、前記学習用表記の適切なアクセントを前記モデルの出力値の理想値として、前記モデルに機械学習させること、を含む
アクセント学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019226480A JP7526416B2 (ja) | 2019-12-16 | 2019-12-16 | アクセント推定装置、およびアクセント推定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019226480A JP7526416B2 (ja) | 2019-12-16 | 2019-12-16 | アクセント推定装置、およびアクセント推定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021096327A true JP2021096327A (ja) | 2021-06-24 |
JP7526416B2 JP7526416B2 (ja) | 2024-08-01 |
Family
ID=76431154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019226480A Active JP7526416B2 (ja) | 2019-12-16 | 2019-12-16 | アクセント推定装置、およびアクセント推定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7526416B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004309753A (ja) * | 2003-04-07 | 2004-11-04 | Nippon Telegr & Teleph Corp <Ntt> | アクセント位置推定方法、装置およびプログラム |
JP2008116650A (ja) * | 2006-11-02 | 2008-05-22 | Fujitsu Ltd | 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 |
JP2009500678A (ja) * | 2005-07-12 | 2009-01-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | システム、プログラムおよび制御方法 |
-
2019
- 2019-12-16 JP JP2019226480A patent/JP7526416B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004309753A (ja) * | 2003-04-07 | 2004-11-04 | Nippon Telegr & Teleph Corp <Ntt> | アクセント位置推定方法、装置およびプログラム |
JP2009500678A (ja) * | 2005-07-12 | 2009-01-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | システム、プログラムおよび制御方法 |
JP2008116650A (ja) * | 2006-11-02 | 2008-05-22 | Fujitsu Ltd | 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 |
Non-Patent Citations (4)
Title |
---|
HIDEYUKI TACHIBANA ET AL.: "Accent Estimation of Japanese Words from Their Surfaces and Romanizations for Building Large Vocabul", 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), JPN6023029492, May 2020 (2020-05-01), pages 8059 - 8063, XP033793722, ISSN: 0005113170, DOI: 10.1109/ICASSP40776.2020.9054081 * |
小野喜己ほか: "ニューラルネットワークを用いたアクセント句境界及びアクセント核推定", 日本音響学会講演論文集, JPN6023029493, March 2019 (2019-03-01), pages 1103 - 1106, ISSN: 0005113169 * |
長野徹ほか: "N-gramモデルを用いた音声合成のための読みおよびアクセントの同時推定", 情報処理学会論文誌, vol. 第47巻, 第6号, JPN6023029494, June 2006 (2006-06-01), pages 1793 - 1801, ISSN: 0005113168 * |
黒岩龍ほか: "日本語音声合成を目的としたアクセント処理のための規則と統計的学習", 日本音響学会講演論文集, JPN6023029495, March 2007 (2007-03-01), pages 301 - 302, ISSN: 0005113167 * |
Also Published As
Publication number | Publication date |
---|---|
JP7526416B2 (ja) | 2024-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gasser | HornMorpho: a system for morphological processing of Amharic, Oromo, and Tigrinya | |
Littell et al. | Indigenous language technologies in Canada: Assessment, challenges, and successes | |
JP6676110B2 (ja) | 発話文生成装置とその方法とプログラム | |
JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
CN102214238B (zh) | 一种汉语词语相近性匹配装置及方法 | |
King et al. | Evaluating approaches to personalizing language models | |
CN111339772B (zh) | 俄语文本情感分析方法、电子设备和存储介质 | |
Hasegawa-Johnson et al. | Grapheme-to-phoneme transduction for cross-language ASR | |
CN113822044B (zh) | 语法纠错数据生成方法、装置、计算机设备及存储介质 | |
Xiong et al. | Extended HMM and ranking models for Chinese spelling correction | |
Onyenwe | Developing methods and resources for automated processing of the african language igbo | |
JP2017091368A (ja) | 言い換え装置、方法、及びプログラム | |
Rajendran et al. | A robust syllable centric pronunciation model for Tamil text to speech synthesizer | |
Tran et al. | Webnlg 2020 challenge: Semantic template mining for generating references from rdf | |
WO2024069978A1 (ja) | 生成装置、学習装置、生成方法、学習方法、及びプログラム | |
Garay-Vitoria et al. | Modelling text prediction systems in low-and high-inflected languages | |
JP2022515048A (ja) | 音声認識の訓練および採点のための音訳 | |
JP7526416B2 (ja) | アクセント推定装置、およびアクセント推定方法 | |
Habeeb et al. | Three N-grams Based Language Model for Auto-correction of Speech Recognition Errors | |
Asahiah | Development of a Standard Yorùbá digital text automatic diacritic restoration system | |
Manohar et al. | Spellchecker for Malayalam using finite state transition models | |
CN111090720A (zh) | 一种热词的添加方法和装置 | |
TW202119259A (zh) | 對話系統之訊息回饋方法 | |
Li et al. | The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian | |
Bello García et al. | Nahuatl neural machine translation using attention based architectures: A comparative analysis for RNNs and transformers as a mobile application service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240326 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240710 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7526416 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |