JP2017122880A - 音読評価装置、表示制御方法、及びプログラム - Google Patents
音読評価装置、表示制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2017122880A JP2017122880A JP2016002550A JP2016002550A JP2017122880A JP 2017122880 A JP2017122880 A JP 2017122880A JP 2016002550 A JP2016002550 A JP 2016002550A JP 2016002550 A JP2016002550 A JP 2016002550A JP 2017122880 A JP2017122880 A JP 2017122880A
- Authority
- JP
- Japan
- Prior art keywords
- display
- evaluation
- speaker
- sentence
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
初めに、図1を参照して、本発明の一実施形態に係る音読評価装置Sの構成及び機能について説明する。図1は、本実施形態に係る音読評価装置Sの概要構成例を示す図である。なお、音読評価装置の一例として、パーソナルコンピュータや、携帯型情報端末(スマートフォン等)などが挙げられる。図1に示すように、音読評価装置Sは、通信部1、記憶部2、制御部3、操作部4、及びインターフェース(IF)部5等を備えて構成され、これらの構成要素はバス6に接続されている。操作部4は、ユーザからの操作(ユーザ操作)を受け付け、そのユーザ操作に応じた信号を制御部3へ出力する。ユーザ操作の例として、マウス操作が挙げられる。なお、ディスプレイDがタッチパネルディスプレイである場合、ユーザ操作は、ユーザの指やペン等による接触操作であってもよい。インターフェース部5には、マイクM、及びディスプレイD等が接続される。マイクMは、語学学習や、アナウンス、朗読などの発話練習等を行う練習者である話者が、複数の文要素を含む文(文章)を音読したときに発した音声を集音する。文要素は、文を構成する単位である。文要素の例として、フレーズ、文節、単語の他、後述するように複数のフレーズが結合した結合フレーズ等が挙げられる。ここで、フレーズは、一般に文章を読むときに一息で読む単位である。フレーズは、1以上の文節から構成される。つまり、1つのフレーズが1つの文節から構成される場合もあるし、1つのフレーズが複数の文節から構成される場合もある。文節は、例えば、1つ以上の単語のまとまりである。単語には、名詞、動詞、形容詞、副詞、及び接続詞等の自立語(単独で文節を構成できる品詞)や、助動詞及び助詞等の付属語(単独で文節を構成できない品詞)などがある。音読対象となる文の例として、語学学習や、アナウンス、朗読などで用いられる文章などが挙げられる。ディスプレイDは、制御部3からの表示指令にしたがって、後述する表示領域等が配置される表示画面を表示する。なお、マイクM、及びディスプレイDは、音読評価装置Sと一体型であってもよいし、別体であってもよい。
次に、音読評価装置Sの動作例について、実施例1と実施例2に分けて説明する。なお、以下に説明する動作の前提として、手本文要素区間データ及び話者音声波形データが制御部3に取り込まれ、音声処理部31により、手本文要素区間、手本インターバル区間、手本音圧、手本音高、手本特徴量、話者文要素区間、話者インターバル区間、話者音圧、話者音高、及び話者特徴量が特定され、これらのデータ、及び手本文要素区間毎のテキスト、並びに話者文要素区間毎のテキストが、例えば、音読対象のお手本となる所望の音声ファイルの識別情報に対応付けられて記憶部2に記憶されているものとする。さらに、音読評価部32により、評価項目別の評価点、区間評価点、総合評価点が算出され、これらの評価点が、音読対象のお手本となる所望の音声ファイルの識別情報に対応付けられて記憶部2に記憶されているものとする。
先ず、図5を参照して、実施例1について説明する。図5は、実施例1における制御部3の音読評価表示処理を示すフローチャートである。図5に示す処理は、例えば、話者が操作部4を介して音読対象のお手本となる所望の音声ファイルを指定して表示開始指示を行うことにより開始される。図5に示す処理が開始されると、制御部3(表示処理部33)は、指定された音声ファイルの識別情報に対応付けられたデータ(文要素区間データ、インターバル区間データ、テキストデータ等)、及び評価点のデータを記憶部2から読み込み、図2(A)に示すように、手本表示領域51、話者表示領域52、及び総合評価点表示領域53等が配置された表示画面をディスプレイDに表示させる(ステップS1)。図2(A)の例では、手本表示領域51と話者表示領域52と総合評価点表示領域53とは同一画面上に配置されている。これにより、全区間における総合評価点と、話者等が確認したい一部区間における評価点とを、話者等に同時に参照させることができる。ただし、総合評価点表示領域53は、手本表示領域51と話者表示領域52とが配置される画面とは別の画面に配置されてもよい。つまり、例えば、別の画面では総合評価点は表示されるが、手本表示領域51と話者表示領域52が表示されている画面には総合評価点が表示されなくてもよい。
次に、図6を参照して、実施例2について説明する。図6は、実施例2における制御部3の音読評価表示処理を示すフローチャートである。なお、実施例2は、話者テキスト表示領域においてテキストの領域が指定された場合と、話者テキスト表示領域においてアイコンの領域が指定された場合とで、ウインドウに表示される内容を切り替える構成である。なお、図6に示す処理では、話者スペース領域がユーザ操作により指定された場合の処理を省略している。図6に示す処理は、図5に示す処理と同様に開始される。図6に示すステップS21は、図5に示すステップS1と同様である。
2 記憶部
3 制御部
4 操作部
5 インターフェース部
6 バス
31 音声処理部
32 音読評価部
33 表示処理部
S 音読評価装置
Claims (8)
- 話者が文を音読したときに発した音声の波形を示す音声波形データに基づいて、前記音読された文を構成する各文要素の開始タイミングから終了タイミングまでの文要素区間と、複数の前記文要素のうち何れかの前記文要素の終了タイミングから次の前記文要素の開始タイミングまでのインターバル区間との少なくとも何れか一方の区間毎に前記音読に対する評価点を算出する評価点算出手段と、
前記評価点算出手段により算出された前記区間毎の評価点に基づいて、前記音読に対する総合評価点を算出する総合評価点算出手段と、
前記音読された文を構成する各文要素を表すテキストの少なくとも一部を、それぞれの前記文要素区間の時間長に応じた長さの第1の表示領域に時間軸に沿って前記文要素区間毎に表示させる第1表示制御手段と、
前記文要素区間の時間長より短い所定時間間隔毎に前記音声波形データに基づいて特定された音高と音圧との少なくとも何れか一方の音要素の時系列的な変化を表すグラフを第2の表示領域に前記時間軸に沿って表示させる第2表示制御手段と、
前記総合評価点算出手段により算出された総合評価点を第3の表示領域に表示させる第3表示制御手段と、
前記第1の表示領域、前記第2の表示領域、及び複数の前記第1の表示領域間に前記時間軸に沿って位置するスペース領域のうち、何れか一の領域がユーザ操作により指定された場合、指定された前記何れか一の領域に対応する前記区間において算出された前記評価点を表示する第1のウインドウをポップアップ表示させる第4表示制御手段と、
を備えることを特徴とする音読評価装置。 - 前記第4表示制御手段は、前記第1のウインドウの表示を継続させ、前記第1のウインドウの表示が継続している間に前記何れか一の領域とは異なる他の領域がユーザ操作により新たに指定された場合、新たに指定された他の領域に対応する前記区間において算出された前記評価点を表示する第2のウインドウをポップアップ表示させ、前記第1のウインドウの表示と前記第2のウインドウの表示を継続させることを特徴とする請求項1に記載の音読評価装置。
- 前記第4表示制御手段は、前記第1の表示領域または前記第2の表示領域がユーザ操作により指定された場合、前記指定された前記第1の表示領域または前記第2の表示領域に対応する前記区間において算出された評価点であって、前記音読に対する評価項目として予め設定された抑揚、音量、滑舌、及び速度のうち少なくとも何れか一つに対する前記評価点を表示する第1のウインドウをポップアップ表示させることを特徴とする請求項1または2に記載の音読評価装置。
- 前記第4表示制御手段は、前記スペース領域がユーザ操作により指定された場合、前記指定された前記スペース領域に対応する前記区間において算出された評価点であって、前記音読に対する評価項目として予め設定された間合いに対する前記評価点を表示する第1のウインドウをポップアップ表示させることを特徴とする請求項1乃至3の何れか一項に記載の音読評価装置。
- 前記第4表示制御手段は、前記第1の表示領域がユーザ操作により指定された場合、指定された前記第1の表示領域に少なくとも一部が表示された前記テキストの全部を表示する第3のウインドウをポップアップ表示させることを特徴とする請求項1乃至4の何れか一項に記載の音読評価装置。
- 前記音読に対する評価項目として予め設定された抑揚、音量、滑舌、及び速度のうち少なくとも何れか一つのそれぞれに対応する前記評価点であって、前記文要素区間毎に算出された前記評価点に基づいて、前記音読に対する区間評価点を前記文要素区間毎に算出する区間評価点算出手段と、
前記区間評価点算出手段により算出された各区間評価点を表すアイコンを、前記第1の表示領域毎に対応して配置された第4の表示領域に前記時間軸に沿って前記文要素区間毎に表示させる第5表示制御手段と、
を更に備え、
前記第4表示制御手段は、前記アイコンがユーザ操作により指定された場合、前記指定された前記アイコンに対応する前記文要素区間において算出された評価点であって、前記音読に対する評価項目として予め設定された抑揚、音量、滑舌、及び速度のうち少なくとも何れか一つのそれぞれに対する前記評価点を表示する第4のウインドウをポップアップ表示させることを特徴とする請求項1乃至5の何れか一項に記載の音読評価装置。 - 1つ以上のコンピュータにより実行される表示制御方法であって、
話者が文を音読したときに発した音声の波形を示す音声波形データに基づいて、前記音読された文を構成する各文要素の開始タイミングから終了タイミングまでの文要素区間と、複数の前記文要素のうち何れかの前記文要素の終了タイミングから次の前記文要素の開始タイミングまでのインターバル区間との少なくとも何れか一方の区間毎に前記音読に対する評価点を算出する評価点算出ステップと、
前記評価点算出ステップにより算出された前記区間毎の評価点に基づいて、前記音読に対する総合評価点を算出する総合評価点算出ステップと、
前記音読された文を構成する各文要素を表すテキストの少なくとも一部を、それぞれの前記文要素区間の時間長に応じた長さの第1の表示領域に時間軸に沿って前記文要素区間毎に表示させる第1表示制御ステップと、
前記文要素区間の時間長より短い所定時間間隔毎に前記音声波形データに基づいて特定された音高と音圧との少なくとも何れか一方の音要素の時系列的な変化を表すグラフを第2の表示領域に前記時間軸に沿って表示させる第2表示制御ステップと、
前記総合評価点算出ステップにより算出された総合評価点を第3の表示領域に表示させる第3表示制御ステップと、
前記第1の表示領域、前記第2の表示領域、及び複数の前記第1の表示領域間に前記時間軸に沿って位置するスペース領域のうち、何れか一の領域がユーザ操作により指定された場合、指定された前記何れか一の領域に対応する前記区間において算出された前記評価点を表示する第1のウインドウをポップアップ表示させる第4表示制御ステップと、
を含むことを特徴とする表示制御方法。 - 話者が文を音読したときに発した音声の波形を示す音声波形データに基づいて、前記音読された文を構成する各文要素の開始タイミングから終了タイミングまでの文要素区間と、複数の前記文要素のうち何れかの前記文要素の終了タイミングから次の前記文要素の開始タイミングまでのインターバル区間との少なくとも何れか一方の区間毎に前記音読に対する評価点を算出する評価点算出ステップと、
前記評価点算出ステップにより算出された前記区間毎の評価点に基づいて、前記音読に対する総合評価点を算出する総合評価点算出ステップと、
前記音読された文を構成する各文要素を表すテキストの少なくとも一部を、それぞれの前記文要素区間の時間長に応じた長さの第1の表示領域に時間軸に沿って前記文要素区間毎に表示させる第1表示制御ステップと、
前記文要素区間の時間長より短い所定時間間隔毎に前記音声波形データに基づいて特定された音高と音圧との少なくとも何れか一方の音要素の時系列的な変化を表すグラフを第2の表示領域に前記時間軸に沿って表示させる第2表示制御ステップと、
前記総合評価点算出ステップにより算出された総合評価点を第3の表示領域に表示させる第3表示制御ステップと、
前記第1の表示領域、前記第2の表示領域、及び複数の前記第1の表示領域間に前記時間軸に沿って位置するスペース領域のうち、何れか一の領域がユーザ操作により指定された場合、指定された前記何れか一の領域に対応する前記区間において算出された前記評価点を表示する第1のウインドウをポップアップ表示させる第4表示制御ステップと、
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016002550A JP6531654B2 (ja) | 2016-01-08 | 2016-01-08 | 音読評価装置、表示制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016002550A JP6531654B2 (ja) | 2016-01-08 | 2016-01-08 | 音読評価装置、表示制御方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017122880A true JP2017122880A (ja) | 2017-07-13 |
JP6531654B2 JP6531654B2 (ja) | 2019-06-19 |
Family
ID=59306548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016002550A Active JP6531654B2 (ja) | 2016-01-08 | 2016-01-08 | 音読評価装置、表示制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6531654B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111369980A (zh) * | 2020-02-27 | 2020-07-03 | 网易有道信息技术(北京)有限公司江苏分公司 | 语音检测方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143346A (ja) * | 1997-11-05 | 1999-05-28 | Seiko Epson Corp | 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 |
JP2001242978A (ja) * | 2000-03-02 | 2001-09-07 | Yokogawa Electric Corp | グラフ上のデータの属性を表示する方法および装置 |
JP2003058236A (ja) * | 2001-08-09 | 2003-02-28 | Mitsubishi Electric Corp | プラント監視制御装置 |
JP2003067099A (ja) * | 2001-08-28 | 2003-03-07 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、並びにプログラム |
JP2007147783A (ja) * | 2005-11-24 | 2007-06-14 | Yamaha Corp | 語学学習装置 |
US20080010068A1 (en) * | 2006-07-10 | 2008-01-10 | Yukifusa Seita | Method and apparatus for language training |
JP2011192173A (ja) * | 2010-03-16 | 2011-09-29 | Ntt Docomo Inc | 情報処理装置およびタッチパネル操作方法 |
US20150071517A1 (en) * | 2013-09-09 | 2015-03-12 | Samsung Electronics Co., Ltd. | Method and apparatus for providing information about pulse sequence for magnetic resonance imaging |
JP5756555B1 (ja) * | 2014-11-07 | 2015-07-29 | パナソニック株式会社 | 発話評価装置、発話評価方法及びプログラム |
-
2016
- 2016-01-08 JP JP2016002550A patent/JP6531654B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11143346A (ja) * | 1997-11-05 | 1999-05-28 | Seiko Epson Corp | 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 |
JP2001242978A (ja) * | 2000-03-02 | 2001-09-07 | Yokogawa Electric Corp | グラフ上のデータの属性を表示する方法および装置 |
JP2003058236A (ja) * | 2001-08-09 | 2003-02-28 | Mitsubishi Electric Corp | プラント監視制御装置 |
JP2003067099A (ja) * | 2001-08-28 | 2003-03-07 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、並びにプログラム |
JP2007147783A (ja) * | 2005-11-24 | 2007-06-14 | Yamaha Corp | 語学学習装置 |
US20080010068A1 (en) * | 2006-07-10 | 2008-01-10 | Yukifusa Seita | Method and apparatus for language training |
JP2011192173A (ja) * | 2010-03-16 | 2011-09-29 | Ntt Docomo Inc | 情報処理装置およびタッチパネル操作方法 |
US20150071517A1 (en) * | 2013-09-09 | 2015-03-12 | Samsung Electronics Co., Ltd. | Method and apparatus for providing information about pulse sequence for magnetic resonance imaging |
JP5756555B1 (ja) * | 2014-11-07 | 2015-07-29 | パナソニック株式会社 | 発話評価装置、発話評価方法及びプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111369980A (zh) * | 2020-02-27 | 2020-07-03 | 网易有道信息技术(北京)有限公司江苏分公司 | 语音检测方法、装置、电子设备及存储介质 |
CN111369980B (zh) * | 2020-02-27 | 2023-06-02 | 网易有道信息技术(江苏)有限公司 | 语音检测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6531654B2 (ja) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6397185B1 (en) | Language independent suprasegmental pronunciation tutoring system and methods | |
US7890330B2 (en) | Voice recording tool for creating database used in text to speech synthesis system | |
US8027837B2 (en) | Using non-speech sounds during text-to-speech synthesis | |
JP6024180B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JPH0651930A (ja) | 計算機 | |
EP2779159A1 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon | |
CN111653265B (zh) | 语音合成方法、装置、存储介质和电子设备 | |
JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
KR20150144031A (ko) | 음성 인식을 이용하는 사용자 인터페이스 제공 방법 및 사용자 인터페이스 제공 장치 | |
Cheng et al. | Articulatory limit and extreme segmental reduction in Taiwan Mandarin | |
JP5105943B2 (ja) | 発話評価装置及び発話評価プログラム | |
JP4587854B2 (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP4354299B2 (ja) | 事例検索プログラム、事例検索方法及び事例検索装置 | |
CN111199724A (zh) | 一种信息处理方法、设备及计算机可读存储介质 | |
Szekrényes | Annotation and interpretation of prosodic data in the hucomtech corpus for multimodal user interfaces | |
JP2016157097A (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP6314884B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
US20190088258A1 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP6531654B2 (ja) | 音読評価装置、表示制御方法、及びプログラム | |
US20140074468A1 (en) | System and Method for Automatic Prediction of Speech Suitability for Statistical Modeling | |
JP4744338B2 (ja) | 合成音声生成装置 | |
JP6418179B2 (ja) | 音読練習装置、表示制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170901 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190506 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6531654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |