JPWO2019239972A1 - 情報処理方法、情報処理装置およびプログラム - Google Patents
情報処理方法、情報処理装置およびプログラム Download PDFInfo
- Publication number
- JPWO2019239972A1 JPWO2019239972A1 JP2020525476A JP2020525476A JPWO2019239972A1 JP WO2019239972 A1 JPWO2019239972 A1 JP WO2019239972A1 JP 2020525476 A JP2020525476 A JP 2020525476A JP 2020525476 A JP2020525476 A JP 2020525476A JP WO2019239972 A1 JPWO2019239972 A1 JP WO2019239972A1
- Authority
- JP
- Japan
- Prior art keywords
- transition
- characteristic
- characteristic transition
- synthetic
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
- G10L13/0335—Pitch control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/203—Drawing of straight lines or curves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/008—Means for controlling the transition from one tone waveform to another
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/091—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith
- G10H2220/101—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters
- G10H2220/126—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters for graphical editing of individual notes, parts or phrases represented as variable length segments on a 2D or 3D representation, e.g. graphical edition of musical collage, remix files or pianoroll representations of MIDI-like files
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/315—Sound category-dependent sound synthesis processes [Gensound] for musical use; Sound category-specific synthesis-controlling parameters or control means therefor
- G10H2250/455—Gensound singing voices, i.e. generation of human voices for musical applications, vocal singing sounds or intelligible words at a desired pitch or with desired vocal effects, e.g. by phoneme synthesis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
Description
図1は、第1実施形態に係る情報処理装置100の構成を例示するブロック図である。情報処理装置100は、歌唱者が楽曲(以下「合成楽曲」という)を仮想的に歌唱した音声(以下「合成音声」という)を生成する音声合成装置である。第1実施形態の情報処理装置100は、複数の発音スタイルのうち何れかの発音スタイルで仮想的に発音される合成音声を生成する。発音スタイルは、例えば特徴的な発音の仕方を意味する。具体的には、例えば音高または音量等の特徴量の時間的な変化に関する特徴(すなわち特徴量の変化パターン)が発音スタイルの一例である。例えばラップ,R&B(rhythm and blues)またはパンク等の各種のジャンルの楽曲に好適な歌い廻しが発音スタイルの一例である。
第2実施形態を説明する。なお、以下の各例示において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
第3実施形態においては、遷移処理部25による合成特性遷移Vの生成に調整パラメータPが適用される。調整パラメータPの数値は、入力装置14に対する利用者からの指示に応じて可変に設定される。第3実施形態の調整パラメータPは、第1パラメータP1と第2パラメータP2とを含む。遷移処理部25の調整処理部33は、利用者からの指示に応じて第1パラメータP1および第2パラメータP2の各々の数値を設定する。第1パラメータP1および第2パラメータP2は特定範囲R毎に設定される。
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
以上に例示した形態から、例えば以下の構成が把握される。
Claims (15)
- 音響特性の遷移である第1特性遷移を利用者からの指示に応じて生成し、
複数の発音スタイルから選択された特定の発音スタイルで発音される音声の音響特性の遷移である第2特性遷移を生成し、
前記第1特性遷移と前記第2特性遷移との合成により、合成音声の音響特性の遷移である合成特性遷移を生成する
コンピュータにより実現される情報処理方法。 - 前記第1特性遷移は、前記利用者が描画した線図で表現される
請求項1の情報処理方法。 - 前記第2特性遷移の生成においては、前記複数の発音スタイルにそれぞれ対応する複数の遷移推定モデルのうち、前記特定の発音スタイルに対応する遷移推定モデルを利用して、前記第2特性遷移を生成する
請求項1または請求項2の情報処理方法。 - 前記第2特性遷移の生成においては、前記複数の発音スタイルにそれぞれ対応する音声を表す複数の表現サンプルのうち、前記特定の発音スタイルに対応する表現サンプルの音響特性の遷移を前記第2特性遷移として生成する
請求項1または請求項2の情報処理方法。 - 前記第2特性遷移の生成においては、複数の表現選択モデルのうち前記特定の発音スタイルに対応する表現選択モデルを利用して、音声を表す複数の表現サンプルから音符に対応する表現サンプルを選択し、当該表現サンプルの特性の遷移に応じて前記第2特性遷移を生成する
請求項1または請求項2の情報処理方法。 - 前記特定の発音スタイルが第1発音スタイルから第2発音スタイルに変更された場合、前記第1特性遷移を維持したまま、前記第2特性遷移を、前記第1発音スタイルに対応する特性遷移から前記第2発音スタイルに対応する特性遷移に変更する
請求項1から請求項5の何れかの情報処理方法。 - 前記合成特性遷移の生成においては、前記利用者からの指示に応じて設定される調整パラメータに応じた前記合成特性遷移を生成する
請求項1から請求項6の何れかの情報処理方法。 - 音響特性の遷移である第1特性遷移を利用者からの指示に応じて生成する第1遷移生成部と、
特定の発音スタイルで発音される音声の音響特性の遷移である第2特性遷移を生成する第2遷移生成部と、
前記第1特性遷移と前記第2特性遷移との合成により、合成音声の音響特性の遷移である合成特性遷移を生成する遷移合成部と
を具備する情報処理装置。 - 前記第1特性遷移は、前記利用者が描画した線図で表現される
請求項8の情報処理装置。 - 前記第2遷移生成部は、前記複数の発音スタイルにそれぞれ対応する複数の遷移推定モデルのうち、前記特定の発音スタイルに対応する遷移推定モデルを利用して、前記第2特性遷移を生成する
請求項8または請求項9の情報処理装置。 - 前記第2遷移生成部は、前記複数の発音スタイルにそれぞれ対応する音声を表す複数の表現サンプルのうち、前記特定の発音スタイルに対応する表現サンプルの音響特性の遷移を前記第2特性遷移として生成する
請求項8または請求項9の情報処理装置。 - 前記第2遷移生成部は、複数の表現選択モデルのうち前記特定の発音スタイルに対応する表現選択モデルを利用して、音声を表す複数の表現サンプルから音符に対応する表現サンプルを選択し、当該表現サンプルの特性の遷移に応じて前記第2特性遷移を生成する
請求項8または請求項9の情報処理装置。 - 前記特定の発音スタイルが第1発音スタイルから第2発音スタイルに変更された場合、前記第1特性遷移を維持したまま、前記第2特性遷移を、前記第1発音スタイルに対応する特性遷移から前記第2発音スタイルに対応する特性遷移に変更する
請求項8から請求項12の何れかの情報処理装置。 - 前記利用者からの指示に応じて設定される調整パラメータに応じた前記合成特性遷移を生成する調整処理部
を具備する請求項8から請求項13の何れかの情報処理装置。 - 音響特性の遷移である第1特性遷移を利用者からの指示に応じて生成する第1遷移生成部、
特定の発音スタイルで発音される音声の音響特性の遷移である第2特性遷移を生成する第2遷移生成部、および、
前記第1特性遷移と前記第2特性遷移との合成により、合成音声の音響特性の遷移である合成特性遷移を生成する遷移合成部
としてコンピュータを機能させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018114606 | 2018-06-15 | ||
JP2018114606 | 2018-06-15 | ||
PCT/JP2019/022254 WO2019239972A1 (ja) | 2018-06-15 | 2019-06-05 | 情報処理方法、情報処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019239972A1 true JPWO2019239972A1 (ja) | 2021-06-17 |
JP7127682B2 JP7127682B2 (ja) | 2022-08-30 |
Family
ID=68842231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020525476A Active JP7127682B2 (ja) | 2018-06-15 | 2019-06-05 | 情報処理方法、情報処理装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210097975A1 (ja) |
JP (1) | JP7127682B2 (ja) |
WO (1) | WO2019239972A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012103654A (ja) * | 2010-10-12 | 2012-05-31 | Yamaha Corp | 音声合成装置及びプログラム |
JP2013137520A (ja) * | 2011-11-29 | 2013-07-11 | Yamaha Corp | 音楽データ編集装置 |
JP2015034920A (ja) * | 2013-08-09 | 2015-02-19 | ヤマハ株式会社 | 音声解析装置 |
JP2015049253A (ja) * | 2013-08-29 | 2015-03-16 | ヤマハ株式会社 | 音声合成管理装置 |
JP2017097176A (ja) * | 2015-11-25 | 2017-06-01 | 株式会社テクノスピーチ | 音声合成装置および音声合成方法 |
JP2017107228A (ja) * | 2017-02-20 | 2017-06-15 | 株式会社テクノスピーチ | 歌声合成装置および歌声合成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101274961B1 (ko) * | 2011-04-28 | 2013-06-13 | (주)티젠스 | 클라이언트단말기를 이용한 음악 컨텐츠 제작시스템 |
-
2019
- 2019-06-05 WO PCT/JP2019/022254 patent/WO2019239972A1/ja active Application Filing
- 2019-06-05 JP JP2020525476A patent/JP7127682B2/ja active Active
-
2020
- 2020-12-11 US US17/119,426 patent/US20210097975A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012103654A (ja) * | 2010-10-12 | 2012-05-31 | Yamaha Corp | 音声合成装置及びプログラム |
JP2013137520A (ja) * | 2011-11-29 | 2013-07-11 | Yamaha Corp | 音楽データ編集装置 |
JP2015034920A (ja) * | 2013-08-09 | 2015-02-19 | ヤマハ株式会社 | 音声解析装置 |
JP2015049253A (ja) * | 2013-08-29 | 2015-03-16 | ヤマハ株式会社 | 音声合成管理装置 |
JP2017097176A (ja) * | 2015-11-25 | 2017-06-01 | 株式会社テクノスピーチ | 音声合成装置および音声合成方法 |
JP2017107228A (ja) * | 2017-02-20 | 2017-06-15 | 株式会社テクノスピーチ | 歌声合成装置および歌声合成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7127682B2 (ja) | 2022-08-30 |
WO2019239972A1 (ja) | 2019-12-19 |
US20210097975A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2838082B1 (en) | Voice analysis method and device, and medium storing voice analysis program | |
CN107430849B (zh) | 声音控制装置、声音控制方法和存储声音控制程序的计算机可读记录介质 | |
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JPWO2018084305A1 (ja) | 音声合成方法、音声合成装置およびプログラム | |
US9711123B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP6127371B2 (ja) | 音声合成装置および音声合成方法 | |
JP5625321B2 (ja) | 音声合成装置およびプログラム | |
WO2017047453A1 (ja) | 音質判定装置及び記録媒体 | |
WO2019181767A1 (ja) | 音処理方法、音処理装置およびプログラム | |
JP7124870B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP7127682B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP6992894B2 (ja) | 表示制御方法、表示制御装置およびプログラム | |
JP5790860B2 (ja) | 音声合成装置 | |
JP7180642B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP5953743B2 (ja) | 音声合成装置及びプログラム | |
JP2014170251A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2015148750A (ja) | 歌唱合成装置 | |
CN117877459A (zh) | 记录介质、音响处理方法以及音响处理系统 | |
JP2014002421A (ja) | 音声合成装置、音声合成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220801 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7127682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |