JP2017090856A5 - - Google Patents

Download PDF

Info

Publication number
JP2017090856A5
JP2017090856A5 JP2015225047A JP2015225047A JP2017090856A5 JP 2017090856 A5 JP2017090856 A5 JP 2017090856A5 JP 2015225047 A JP2015225047 A JP 2015225047A JP 2015225047 A JP2015225047 A JP 2015225047A JP 2017090856 A5 JP2017090856 A5 JP 2017090856A5
Authority
JP
Japan
Prior art keywords
data
morpheme
information creation
speech
accent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015225047A
Other languages
Japanese (ja)
Other versions
JP6631186B2 (en
JP2017090856A (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2015225047A priority Critical patent/JP6631186B2/en
Priority claimed from JP2015225047A external-priority patent/JP6631186B2/en
Publication of JP2017090856A publication Critical patent/JP2017090856A/en
Publication of JP2017090856A5 publication Critical patent/JP2017090856A5/ja
Application granted granted Critical
Publication of JP6631186B2 publication Critical patent/JP6631186B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (9)

入力される音声データからアクセント位置及び区切り位置の少なくとも一方を示す第1位置データを取得する取得処理と、前記音声データに対応するテキストデータから生成された複数の形態素を含む形態素データに付与されているアクセントの位置及び前記複数の形態素間の区切り位置の少なくとも一方を示す第2位置データと、前記音声データから取得された第1位置データとを比較する比較処理と、前記比較処理にて前記第1及び第2の位置データが一致していない場合には、前記形態素データに対して前記第2位置データに代えて前記第1位置データを付与する処理を実行する処理部を備えた音声情報作成装置。   An acquisition process for acquiring first position data indicating at least one of an accent position and a break position from input speech data, and morpheme data including a plurality of morphemes generated from text data corresponding to the speech data A comparison process comparing the second position data indicating at least one of the position of the accent and the separation position between the plurality of morphemes and the first position data acquired from the audio data; If the first and second position data do not match, voice information creation comprising a processing unit that executes processing for assigning the first position data to the morpheme data instead of the second position data apparatus. 前記音声情報作成装置はさらに、
前記テキストデータに対して形態素解析処理を実行することにより、前記複数の形態素を含む形態素データを生成する形態素解析部を有する、請求項1に記載の音声情報作成装置。
The voice information creation device further includes:
The speech information creation device according to claim 1, further comprising: a morpheme analysis unit that generates morpheme data including the plurality of morphemes by executing a morpheme analysis process on the text data.
前記処理部は、前記取得処理として、前記音声データの無音区間の位置を前記第1位置データの区切り位置として取得する処理を実行する、請求項1または2に記載の音声情報作成装置。   The audio information creation device according to claim 1, wherein the processing unit executes a process of acquiring a position of a silent section of the audio data as a delimiter position of the first position data as the acquisition process. 前記処理部はさらに、前記比較処理において、前記第1位置データが示す区切り位置と第2の位置データが示す区切り位置と一致する場合は、前記形態素データに対して、前記第2の位置データが示す位置に、読点の情報を付与する、請求項1乃至3のいずれかに記載の音声情報作成装置。   In the comparison process, when the delimiter position indicated by the first position data coincides with the delimiter position indicated by the second position data, the processing unit further determines that the second position data is relative to the morpheme data. The voice information creation device according to claim 1, wherein reading point information is assigned to the indicated position. 前記処理部は、前記取得処理として、前記複数の形態素それぞれに対応する前記音声データの区間内で、前記音声データの基本周波数を判別する処理と、前記音声データの区間内で前記基本周波数が最も高い位置を、前記第1位置データのアクセント位置として取得する処理を実行する、請求項1乃至4のいずれかに記載の音声情報作成装置。   The processing unit includes, as the acquisition process, a process of determining a fundamental frequency of the speech data within a section of the speech data corresponding to each of the plurality of morphemes, and a highest fundamental frequency within the section of the speech data. The voice information creation device according to claim 1, wherein a process for acquiring a high position as an accent position of the first position data is executed. 前記処理部は、前記取得処理として、前記複数の形態素それぞれに対応する前記音声データの区間内で、前記音声データの信号強度を判別する処理と、前記音声データの区間内で前記信号強度が最も高い位置を、前記第1位置データのアクセント位置として取得する処理を実行する、請求項1乃至4のいずれかに記載の音声情報作成装置。   The processing unit includes, as the acquisition process, a process of determining a signal strength of the voice data within a section of the voice data corresponding to each of the plurality of morphemes, and a highest signal strength within the section of the voice data. The voice information creation device according to claim 1, wherein a process for acquiring a high position as an accent position of the first position data is executed. 処理部を備えた音声情報作成装置に用いられる音声情報作成方法であって、前記処理部が、
入力される音声データからアクセント位置及び区切り位置の少なくとも一方を示す第1位置データを取得し、
前記音声データに対応するテキストデータから生成された複数の形態素を含む形態素データに付与されているアクセントの位置及び前記複数の形態素間の区切り位置の少なくとも一方を示す第2位置データと、前記音声データから取得された第1位置データとを比較し、
前記第1及び第2の位置データが一致していない場合には、前記形態素データに対して前記第2位置データに代えて前記第1位置データを付与する、音声情報作成方法。
A speech information creation method used in a speech information creation apparatus including a processing unit, wherein the processing unit is
Obtaining first position data indicating at least one of an accent position and a break position from the input voice data;
Second position data indicating at least one of a position of an accent given to morpheme data including a plurality of morphemes generated from text data corresponding to the sound data and a delimiter position between the plurality of morphemes; and the sound data And the first position data obtained from
When the first and second position data do not coincide with each other, the voice information creating method of adding the first position data to the morpheme data instead of the second position data.
音声情報作成装置として用いられるコンピュータに、
入力される音声データからアクセント位置及び区切り位置の少なくとも一方を示す第1位置データを取得するステップと、
前記音声データに対応するテキストデータから生成された複数の形態素を含む形態素データに付与されているアクセントの位置及び前記複数の形態素間の区切り位置の少なくとも一方を示す第2位置データと、前記音声データから取得された第1位置データとを比較するステップと、
前記第1及び第2の位置データが一致していない場合には、前記形態素データに対して前記第2位置データに代えて前記第1位置データを付与するステップと、
を実行させるプログラム。
In a computer used as a voice information creation device,
Obtaining first position data indicating at least one of an accent position and a break position from input voice data;
Second position data indicating at least one of a position of an accent given to morpheme data including a plurality of morphemes generated from text data corresponding to the sound data and a delimiter position between the plurality of morphemes; and the sound data Comparing the first position data obtained from
If the first and second position data do not match, giving the first position data to the morpheme data instead of the second position data;
A program that executes
請求項1乃至6のいずれかに記載の音声情報作成装置と、
前記音声データから音素片データを切り出す処理と、前記音素片データ、前記音素片データを表わす音素ラベル、及び前記音声情報作成装置により前記音素片データに対応する形態素に付与されたアクセント情報を音声データベースに登録する処理と、を実行する登録処理部と、
を備えた音声データベース作成装置。
The voice information creation device according to any one of claims 1 to 6,
A speech database that extracts the phoneme data from the speech data, the phoneme data, the phoneme label that represents the phoneme data, and the accent information given to the morpheme corresponding to the phoneme data by the speech information creation device A registration processing unit for executing, a registration processing unit for executing
Voice database creation device with
JP2015225047A 2015-11-17 2015-11-17 Speech creation device, method and program, speech database creation device Active JP6631186B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015225047A JP6631186B2 (en) 2015-11-17 2015-11-17 Speech creation device, method and program, speech database creation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015225047A JP6631186B2 (en) 2015-11-17 2015-11-17 Speech creation device, method and program, speech database creation device

Publications (3)

Publication Number Publication Date
JP2017090856A JP2017090856A (en) 2017-05-25
JP2017090856A5 true JP2017090856A5 (en) 2018-11-15
JP6631186B2 JP6631186B2 (en) 2020-01-15

Family

ID=58768420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015225047A Active JP6631186B2 (en) 2015-11-17 2015-11-17 Speech creation device, method and program, speech database creation device

Country Status (1)

Country Link
JP (1) JP6631186B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331176B (en) * 2020-11-03 2023-03-10 北京有竹居网络技术有限公司 Speech synthesis method, speech synthesis device, storage medium and electronic equipment

Similar Documents

Publication Publication Date Title
JP6556575B2 (en) Audio processing apparatus, audio processing method, and audio processing program
Sereno et al. The contribution of segmental and tonal information in Mandarin spoken word processing
EP4235647A3 (en) Determining dialog states for language models
JP2017511915A5 (en)
US9697819B2 (en) Method for building a speech feature library, and method, apparatus, device, and computer readable storage media for speech synthesis
JP2017016131A (en) Speech recognition apparatus and method, and electronic device
JP2017515147A5 (en)
MX2016004667A (en) Template construction method and apparatus, and information recognition method and apparatus.
EP2963643A3 (en) Entity name recognition
WO2017166631A1 (en) Voice signal processing method, apparatus and electronic device
WO2014183373A1 (en) Systems and methods for voice identification
CN109686383A (en) A kind of speech analysis method, device and storage medium
KR20150144031A (en) Method and device for providing user interface using voice recognition
JP2016085697A5 (en)
JP2017509009A5 (en)
JP6576968B2 (en) End-of-speech determination device, end-of-speech determination method, and program
US20150286628A1 (en) Information extraction system, information extraction method, and information extraction program
JP6242963B2 (en) Language model improvement apparatus and method, speech recognition apparatus and method
JP2015087544A (en) Voice recognition device and voice recognition program
JP2017090856A5 (en)
CN106233373B (en) Information provider unit and information providing method
JP6009396B2 (en) Pronunciation providing method, apparatus and program thereof
JP2012226651A5 (en)
JP2017198790A (en) Speech evaluation device, speech evaluation method, method for producing teacher change information, and program
JP2021519122A (en) Detection of subjects with respiratory disabilities