RU2591640C1 - Способ модификации голоса и устройство для его осуществления (варианты) - Google Patents

Способ модификации голоса и устройство для его осуществления (варианты) Download PDF

Info

Publication number
RU2591640C1
RU2591640C1 RU2015119825/08A RU2015119825A RU2591640C1 RU 2591640 C1 RU2591640 C1 RU 2591640C1 RU 2015119825/08 A RU2015119825/08 A RU 2015119825/08A RU 2015119825 A RU2015119825 A RU 2015119825A RU 2591640 C1 RU2591640 C1 RU 2591640C1
Authority
RU
Russia
Prior art keywords
output
singer
frequency
voice
audio
Prior art date
Application number
RU2015119825/08A
Other languages
English (en)
Inventor
Максим Иосифович Вашкевич
Илья Сергеевич Азаров
Денич Сергеевич Лихачев
Александр Юрьевич Бредихин
Александр Александрович Петровский
Original Assignee
Александр Юрьевич Бредихин
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Александр Юрьевич Бредихин filed Critical Александр Юрьевич Бредихин
Priority to RU2015119825/08A priority Critical patent/RU2591640C1/ru
Application granted granted Critical
Publication of RU2591640C1 publication Critical patent/RU2591640C1/ru

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

Изобретение относится к вычислительной технике, преимущественно к системам мультимедиа, и может быть использовано для модификации и коррекции певческого голоса в устройствах караоке. Технический результат - повышении качества воспроизведения. Для этого в средстве обеспечения сохраняют наборы параметров и вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения, конфигурируют средство обработки выбранным набором параметром, выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки и промодифицированный согласно заданному набору параметров, осуществляют адаптацию голоса певца-исполнителя к нотам музыкального сопровождения или корректировку голоса певца-исполнителя по эталонному исполнению певцом-профессионалом двумя описанными вариантами способов. Устройство для модификации голоса содержит центральный процессор, аудиопроцессор, средство управления и монитор, средство обеспечения, устройство ввода аудиосигнала, устройство вывода аудиосигнала и средство формирования динамических параметров, которое содержит блок формирования выходного контура частоты основного тона и блок преобразования параметров. 4 н. и 3 з.п. ф-лы, 8 ил.

Description

Область техники
Изобретение относится к вычислительной технике, преимущественно к системам мультимедиа, и может быть использовано для модификации и коррекции певческого голоса в устройствах караоке.
Предшествующий уровень техники
Традиционные способы модификации голоса преобразовывают диапазон частот основного тона из мужского голоса в женский голос и наоборот, чтобы позволить мужчине-певцу-исполнителю, поющему в караоке, воспроизвести песню, изначально принадлежащую и исполняемую профессиональной певицей - целевым певцом, и наоборот, чтобы позволить женщине - певцу-исполнителю, поющей в караоке, воспроизвести песню, изначально принадлежащую и исполняемую профессиональным певцом мужчиной - целевым певцом. Эффект изменения частоты основного тона звукового сигнала может достигаться изменением скорости воспроизведения, что приводит к смещению частоты всех составляющих сигнала Однако, во-первых, изменение скорости воспроизведения приводит к изменению длительности сигнала и потому не может быть использовано в приложениях, работающих в реальном масштабе времени, а во-вторых, эти способ искажают тембр голоса
Наиболее популярной альтернативой предыдущим способам является использование фазового вокодера (Flanagan J.L. and Golden R.M. Phase vocoder // Bell System Technical Journal, vol. 45, pp. 1493-1509, 1966 г.) и разнообразные методы на его основе, выполняющие смещение компонент сигнала в частотной области при помощи прямого и обратного преобразования Фурье. Применение фазового вокодера позволяет изменять высоту звучания сигнала без изменения длительности и сохранять тембр путем коррекции спектральной огибающей. Данный подход может быть использован для любых звуковых сигналов. Вокодер может быть реализован в режиме реального времени, поскольку выполняет обработку входного сигнала последовательно фрейм за фреймом. При применении его к речи и певческому голосу такой метод имеет существенные ограничения: 1) в обработке отсутствует какая-либо модель голосообразования, что при значительном изменении частоты основного тона приводит к неестественному звучанию; 2) выделяемые частотные составляющие сигнала не соответствуют гармоникам основного тона, что приводит к потере натуральности и звонкости голоса; 3) сигнал не разделяется на вокализованный и незокапизованный, что приводит к неестественному звучанию некоторых звуков (в частности невокализованных шипящих 'с', 'ш', а также смешанных, частично вокализованных, 'з' и 'ж').
Известен способ и устройство модификации голоса на основе представления аудиосигнала в виде модели суммы синусоидальных (детерминированных) и шумовых (стохастических) компонент, в котором голосовые сигналы преобразовываются путем модуляции частот и амплитуд синусоидальных компонент модели аудиосигнала, содержащее средства извлечения только детерминированных компонентов из входящего голосового сигнала, детерминирующие составляющие, включая совокупность составляющих синусоидальных колебаний, которые перечисляются последовательно, где входящий голосовой сигнал включает детерминированные элементы и остаточные элементы; средства отделения для разделения компонентов синусоидальной волны на координаты значения частоты и координаты значения амплитуды, которые перечисляются последовательно, также как и компоненты синусоидальной волны; запоминающее устройство для хранения информации об исходной высоте/тоне эталонного звукового сигнала, информацию высоты звука, включая первичную высоту, представляющую совпадение высоты дискретного сигнала по музыкальной шкале, и вторичную высоту, представляющую дробный шаг, изменяющийся в соответствии с дискретным сигналом, и хранимую информацию об амплитуде эталонного сигнала, представляющего координаты амплитуды компонентов синусоидальной волны, содержащиеся в эталонном звуковом сигнале, которые перечисляются последовательно; первое средство модуляции для модуляции координат значения частоты компонентов синусоидальной волны входящего голосового сигнала в соответствии с первичной информацией об эталонной высоте звучания, извлеченной из запоминающего устройства, для генерирования модулированных координат значения частоты; первичная модуляция означает дальнейшую модуляцию координат частоты компонентов синусоидальной волны входящего звукового сигнала на основе вторичной информации о высоте звучания, извлеченной из запоминающего устройства, для дальнейшей модуляции координат значения частоты; средства контроля для установления контрольных параметров для отслеживания уровня модуляции координат частоты на основании первичной и вторичной информации о высоте звучания таким образом, чтобы степень влияния высоты эталонного звукового сигнала на исходящий звуковой сигнал определялась на основании заданных параметров; второе средство модуляции для модуляции координат значения амплитуды компонентов синусоидальной волны входящего голосового сигнала в соответствии с информацией об амплитуде эталонного сигнала, представленного координатами значения амплитуды, которые пронумерованы в соответствии с координатами амплитуды входящего голосового сигнала, извлеченными из памяти запоминающего устройства, так, что каждая координата амплитуды входящего голосового сигнала смешивается с соответствующей координатой амплитуды эталонного сигнала посредством установленной пропорции; средства комбинирования для сложения каждой координаты модулированной частоты и координат значения далее модулированной амплитуды для синтезирования компонентов синусоидальной волны выходящего голосового сигнала с высотой звучания и тоном, отличными от высоты и тона входящего голосового сигнала; и средства смешивания для смешивания компонентов синтезированной синусоидальной волны, где компоненты модифицированной частоты участвуют в синтезе выходного голосового сигнала, имеющего отличия в высоте звучания от входящего голосового сигнала и испытывающего влияние эталонного голосового сигнала (Патент США 7117154, G10L 13/00, опубл. 03.10.2006).
Ограничением этого технического решения является то, что данный способ не позволяет осуществить качественное воспроизведение входного голосового сигнала непосредственно пользователя караоке - певца-исполнителя, по мастерству исполнения не уступающее профессиональному певцу, так чтобы на выходе караоке сохранялось звучание голоса пользователя караоке. Кроме того, недостатком данного изобретения является преобразование только части голосового сигнала, а точнее его вокализованной (гармонической) части. Не менее важная, не вокализованная часть голосового сигнала - сигнал-остаток - шумовая компонента, в данном изобретении остается без изменения, что не позволяет достичь хорошего качества целенаправленного преобразования голосового сигнала.
Наиболее близким к предлагаемому способу является способ модификации голоса, в котором модулируется входной голосовой сигнал певца-исполнителя в выходной голосовой сигнал целевого певца согласно заданному набору параметров (Патент США 5847303, G10H 1/36, опубл. 08.12.1998).
Известный способ модификации голоса заключается том, что
предварительно посредством устройства ввода и средства обработки - ауудиопроцессора сохраняют в средстве обеспечения наборы параметров, каждый из которых характеризует определенную модификацию спектра частот голоса певца-исполнителя,
вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, имеющий спектр частот, соответствующий голосу певца исполнителя,
задают требуемый набор параметров при помощи средства управления и монитора, и затем выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения,
конфигурируют средство обработки выбранным набором параметром из средства обеспечения для модификации голоса певца-исполнителя,
выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки - аудиопроцессором и промодифицированный согласно заданному набору параметров,
Известное устройство для модификации голоса содержит центральный процессор, аудиопроцессор, являющийся средством обработки сигналов, средство управления и монитор, средство обеспечения, сохраняющее таблицу параметров, устройство ввода аудиосигнала, подсоединенное к микрофону, и устройство вывода аудиосигнала, подсоединенное к громкоговорителю, при этом выход средства управления и монитор, соединен с входом центрального процессора, первый выход которого соединен с управляющим входом аудиопроцессора, а второй выход - с управляющим входом средства обеспечения, первый вход аудиопроцессора подсоединен к выходу устройство ввода аудиосигнала, выход средства обеспечения подсоединен ко второму входу аудиопроцессора, первый выход аудиопроцессора соединен со средством обеспечения, а второй его выход - со входом устройства вывода аудиосигнала
В известном способе и устройстве модификации голоса входной голос певца-исполнителя модифицируют в выходной голос целевого певца согласно заданному набору параметров. Из микрофона аудиосигнал певца-исполнителя, имеющий спектр частот специфический для его входного голоса, поступает в средство обработки - аудиопроцессор, который конфигурируется набором параметров из средства обеспечения (памяти таблицы параметров) для обработки аудиосигнала голоса певца-исполнителя по этому набору параметров. В таблице параметров хранится несколько наборов параметров, характеризующих вокальное исполнение конкретных целевых певцов и подготовленных заранее. Каждый из набора параметров определяет конкретную модификацию спектра частот входного голоса певца-исполнителя аудиопроцессором. Центральный процессор выбирает один набор параметров из таблицы параметров, который характеризует заданную мелодию заданного целевого певца, и конфигурирует аудиопроцессор данным выбранным набором параметров. Выходной аудиосигнал, который сформирован аудиопроцессором в соответствии с выбранным набором параметров, поступает через устройство вывода аудиосигнала на громкоговоритель. Выбор набора параметров, характеризующий целевого певца и песню (мелодию и стихи), задаются для пользователя на панели управления и выводятся на экран монитора
Более подробно работа ближайшего аналога описывается в разделе описания заявленного технического решения в сравнении его с ним.
Анализ известного способа модификации голоса и устройства показывает, что:
- отсутствуют средства для поддержки входного голоса певца-исполнителя для придания ему мелодичного звучания в соответствии с заданной партитурой песни (музыкальной композицией). Это обусловлено тем, что в данном способе контур частоты основного тона не определяется и не модифицируется в соответствии с партитурой мелодии или контуром частоты основного тона целевого певца, а также в способе не реализуется временное масштабирование (растяжение и сжатие) сигнала певца-исполнителя, т.е способ не позволяет осуществить качественное воспроизведение входного голосового сигнала непосредственно пользователя караоке, по мастерству исполнения не уступающее профессиональному исполнителю, или звучащей мелодии, так чтобы на выходе караоке сохранялось звучание голоса пользователя караоке;
- входной голос певца-исполнителя не соответствует выходному голосу целевого певца, потому что изменение частоты основного тона осуществляется только на 20% в сторону увеличения в случае изменения мужского голоса в женский и в сторону уменьшения при модификации женского голоса в мужской, а также спектр входного сигнала голоса певца-исполнителя меняется только по уровню и частотному диапазону, при этом огибающая спектра практически не изменяется, т.е спектр формант сдвигается в область верхних или нижних частот в зависимости от направления трансформирования голоса, а тембральная составляющая соответствует входному голосу певца-исполнителя. Поэтому в способе возможно формирование только тендерных голосов, и нельзя осуществить воспроизведение голосового сигнала непосредственно принадлежащего пользователю караоке с мастерством голосового сигнала певца-профессионала
Таким образом, в известном способе выходной сигнал не соответствует входному голосу певца-исполнителя, а только преобразованному тендерному голосу, определенному набором параметров целевого певца из таблицы параметров, при этом нельзя осуществить поддержку входного голоса певца-исполнителя для придания ему мелодичного звучания в соответствии с заданной партитурой песни (музыкальной композицией), воспроизведение голосового сигнала непосредственно принадлежащего певцу-исполнителю караоке с мастерством целевого голосового сигнала певца-профессионала
Раскрытие изобретения
Решаемая изобретением задача - улучшение технико-эксплуатационных характеристик и обеспечение возможности точного исполнения заданной мелодии голосом певца-исполнителя караоке, а также корректировка голоса певца-исполнителя караоке по эталонному исполнению песни и мелодии, позволяющая имитировать мастерство пения певца-профессионала.
Технический результат, который получен при реализации способа модификации голоса, - повышение качества воспроизведения вокально-инструментальных композиций голосом певца-пользователя караоке и расширение функциональных возможностей воспроизведения.
Для решения поставленной задачи с достижением указанного технического результата по первому варианту реализации изобретения в известном способе модификации голоса, заключающемся в том, что
предварительно посредством устройства ввода и средства обработки -ауудиопроцессора сохраняют в средстве обеспечения наборы параметров, каждый из которых характеризует определенную модификацию спектра частот голоса певца-исполнителя,
вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, имеющий спектр частот, соответствующий голосу певца исполнителя,
задают требуемый набор параметров при помощи средства управления и монитора, и затем выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения,
конфигурируют средство обработки выбранным набором параметром из средства обеспечения для модификации голоса певца-исполнителя,
выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки - аудиопроцессором и промодифицированный согласно заданному набору параметров,
согласно изобретению
для адаптации голоса певца-исполнителя к нотам музыкального сопровождения дополнительно используют средство формирования динамических параметров для корректировки голоса певца-исполнителя, обеспечивающее формирование выходного контура частоты основного тона и преобразование параметров,
средство обработки - аудиопроцессор дополнительно производит параметрический анализ аудиосигнала голоса певца-исполнителя и формирует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона (ЧОТ) и шумовой составляющей,
средство формирования динамических параметров создает выходной контур ЧОТ по нотам музыкального сопровождения, поступающих из средства обеспечения, и в соответствии с выходным контуром ЧОТ преобразует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей, скорректированных согласно нотам музыкального сопровождения,
затем средство обработки - аудиопроцессор производит параметрический синтез преобразованного вектора мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей, и формирует выходной аудиосигнал - синтезированный промодифицированный аудиосигнал голоса певца-исполнителя, который выводят посредством устройства вывода аудиосигнала для сведения синхронно во времени с музыкальным сопровождением.
Возможны дополнительные варианты осуществления способа по первому варианту, в которых целесообразно, чтобы:
- средство формирования динамических параметров выполняли из блока формирования выходного контура ЧОТ по нотам музыкального сопровождения и из блока преобразования параметров, обработку аудиосигнала голоса певца-исполнителя средством обработки производят фрейм за фреймом, центральный процессор синхронизирует ввод фрейма аудиосигнала голоса певца-исполнителя от микрофонного входа устройства ввода аудиосигнала в средство обработки - аудиопроцессор для выполнения параметрического анализа данного фрейма сигнала и формирования вектора параметров мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей [AS(n),
Figure 00000001
, S(n), rS(n)] голоса певца-исполнителя, где … где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000001
- мгновенное значение частоты основного тона, S(n) - мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, при этом центральный процессор из средства обработки осуществляет загрузку в блок формирования выходного контура ЧОТ нот конкретного музыкального сопровождения, определенного певцом-исполнителем посредством средства управления и монитора, в блоке формирования выходного контура частоты основного тона создают выходной контур ЧОТ
Figure 00000002
в соответствии с нотами, в блоке преобразования параметров на основании вектора параметров [AS(n),
Figure 00000003
, S(n), rS(n)] голоса певца-исполнителя и выходного контура ЧОТ
Figure 00000004
формируют преобразованный вектор параметров [
Figure 00000005
,
Figure 00000004
, (n),
Figure 00000006
], где
Figure 00000007
преобразованный параметр
Figure 00000008
,
Figure 00000009
- преобразованный параметр
Figure 00000010
, (n) - преобразованный параметр S(n),
Figure 00000011
- преобразованный параметр rS(n), скорректированные согласно нотам музыкального сопровождения, после параметрического синтеза средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей средство обработки формирует фрейм выходного аудиосигнала, а для сведения с музыкальным сопровождением фрейм выходного аудиосигнала микшируют в устройстве вывода аудиосигнала с данным музыкальным сопровождением, синхронизируемым во времени посредством центрального процессора, и если музыкальное сопровождение не завершено, процесс повторяют для следующего фрейма аудиосигнала голоса певца-исполнителя.
- для уменьшения эффекта "компьютерного акцента" при параметрическом синтезе средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей сохраняют на границах вокализованных сегментов нот музыкального сопровождения (партитуры песни) форму контура частоты основного тона
Figure 00000012
аудиосигнала голоса певца-исполнителя.
Устройство для модификации голоса по первому варианту выполнения изобретения, содержащее центральный процессор, аудиопроцессор, являющийся средством обработки сигналов, средство управления и монитор, средство обеспечения, сохраняющее таблицу параметров, устройство ввода аудиосигнала, подсоединенное к микрофону, и устройство вывода аудиосигнала, подсоединенное к громкоговорителю, при этом выход средства управления и монитор, соединен с входом центрального процессора, выход которого соединен с управляющими входами аудиопроцессора, средства обеспечения, устройства ввода аудиосигнала и устройства вывода аудиосигнала, соответственно, первый вход аудиопроцессора подсоединен к выходу устройство ввода аудиосигнала, выход средства обеспечения подсоединен ко второму входу аудиопроцессора, первый выход аудиопроцессора соединен со средством обеспечения, а второй его выход - со входом устройства вывода аудиосигнала, согласно изобретению введено средство формирования динамических параметров, выполненное из блока формирования выходного контура частоты основного тона и из блока преобразования параметров, последовательно соединенных первыми входами к выходу средства обеспечения, выход средства обеспечения подсоединен ко второму входу аудиопроцессора через средство формирования динамических параметров, первый выход аудиопроцессора соединен со средством обеспечения для передачи и хранения в его таблице параметров нот музыкального сопровождения, а вторые входы блока формирования выходного контура частоты основного тона и блока преобразования параметров подсоединены первому выходу аудиопроцессора для передачи в них мгновенного значения частоты основного тона
Figure 00000013
аудиосигнала голоса певца исполнителя и сигнала, характеризующего вектор параметров мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей [AS(n),
Figure 00000014
, S(n), rS(n)] голоса певца исполнителя, соответственно, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000015
- мгновенное значение частоты основного тона, S(n) - мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, соответственно, причем блок формирования выходного контура частоты основного тона выполнен с возможностью формирования
Figure 00000016
- преобразованного параметра
Figure 00000017
в соответствии с нотами музыкального сопровождения, а блок преобразования параметров - с возможностью формирования сигнала, характеризующего преобразованный вектор параметров [
Figure 00000018
,
Figure 00000019
, (n),
Figure 00000020
], где
Figure 00000021
- преобразованный параметр AS(n),
Figure 00000022
- преобразованный параметр
Figure 00000023
, (n) - преобразованный параметр S(n),
Figure 00000024
- преобразованный параметр
Figure 00000025
, скорректированные в соответствии с нотами музыкального сопровождения, кроме того, аудиопроцессор выполнен с возможностью параметрического синтеза преобразованного вектора параметров [
Figure 00000026
,
Figure 00000027
, (n),
Figure 00000028
] для формирования синтезированного промодифицированного сигнала s(n) и передачи его со второй выхода аудиопроцессора на вход устройства вывода аудиосигнала
Для решения поставленной задачи с достижением указанного технического результата по второму варианту реализации изобретения в известном способе модификации голоса, заключающемся в том, что
предварительно посредством устройства ввода и средства обработки - ауудиопроцессора сохраняют в средстве обеспечения наборы параметров, каждый из которых характеризует определенную модификацию спектра частот голоса певца-исполнителя,
вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, имеющий спектр частот, соответствующий голосу певца исполнителя,
задают требуемый набор параметров при помощи средства управления и монитора, и затем выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения,
конфигурируют средство обработки выбранным набором параметром из средства обеспечения для модификации голоса певца-исполнителя,
выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки - аудиопроцессором и промодифицированный согласно заданному набору параметров,
согласно изобретению
для корректировки голоса певца-исполнителя по эталонному исполнению, имитирующему мастерство пения целевого певца - певца-профессионала дополнительно используют средство формирования динамических параметров, обеспечивающее формирование выходного контура частоты основного тона и преобразование параметров,
предварительно посредством устройства ввода и средства обработки -ауудиопроцессора сохраняют в средстве обеспечения характеристику частоты основного тона, соответствующую эталонному исполнению,
средство обработки - аудиопроцессор дополнительно производит параметрический анализ аудиосигнала голоса певца-исполнителя и формирует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона (ЧОТ),
средство формирования динамических параметров создает выходной контур частоты основного тона ЧОТ по характеристике частоты основного тона, соответствующей эталонному исполнению, поступающей из средства обеспечения, и в соответствии с выходным контуром частоты основного тона ЧОТ преобразует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона (ЧОТ) и шумовой составляющей аудиосигнала голоса певца-исполнителя, скорректированных согласно характеристике частоты основного тона, соответствующей эталонному исполнению,
затем средство обработки - аудиопроцессор производит параметрический синтез преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона (ЧОТ) и шумовой составляющей, и формирует выходной аудиосигнал - промодифицированный аудиосигнал голоса певца-исполнителя, который выводят посредством устройства вывода аудиосигнала для сведения синхронно во времени с музыкальным сопровождением.
Возможен дополнительный вариант осуществления способа по второму варианту, в котором средство формирования динамических параметров выполняют из блока формирования выходного контура ЧОТ по эталонному исполнению и из блока преобразования параметров, обработку аудиосигнала голос певца-исполнителя средством обработки производят фрейм за фреймом, центральный процессор синхронизирует ввод фрейма аудиосигнала голоса певца-исполнителя от микрофонного входа устройства ввода аудиосигнала в средство обработки -аудиопроцессор для выполнения параметрического анализа данного фрейма сигнала и формирования вектора параметров мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей [AS(n),
Figure 00000029
, S(n), rS(n)] голоса певца-исполнителя, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000030
- мгновенное значение частоты основного тона, S(n) - мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, при этом центральный процессор из средства обеспечения осуществляет загрузку в блок формирования выходного контура частоты основного тона ЧОТ характеристику контура частоты основного тона ЧОТ
Figure 00000031
эталонного исполнения, определенного певцом-исполнителем посредством средства управления и монитора, в блоке формирования выходного контура частоты основного тона ЧОТ создают выходной контур частоты основного тона ЧОТ
Figure 00000032
, соответствующий характеристике контура частоты основного тона ЧОТ
Figure 00000033
эталонного исполнения, в блоке преобразования параметров на основании вектора параметров [AS(n),
Figure 00000034
, S(n), rS(n)] голоса певца-исполнителя и выходного контура частоты основного тона ЧОТ
Figure 00000035
формируют преобразованный вектор параметров [
Figure 00000036
,
Figure 00000037
, (n),
Figure 00000038
], где
Figure 00000039
- преобразованный параметр AS(n),
Figure 00000040
- преобразованный параметр
Figure 00000041
, (n) - преобразованный параметр S(n),
Figure 00000042
- преобразованный параметр rS(n), скорректированные согласно эталонному исполнению, после параметрического синтеза средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей средство обработки формирует фрейм выходного аудиосигнала, а для сведения с музыкальным сопровождением фрейм выходного аудиосигнала микшируют в устройстве вывода аудиосигнала с музыкальным сопровождением, синхронизируемым во времени посредством центрального процессора, и если музыкальное сопровождение не завершено, процесс повторяют для следующего фрейма аудиосигнала голоса певца-исполнителя.
Для уменьшения эффекта "компьютерного акцента" при параметрическом синтезе средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, ЧОТ и шумовой составляющей также можно сохранять на границах вокализованных сегментов аудиосигнала голоса целевого-певца (эталонного исполнения) форму контура частоты основного тона
Figure 00000043
аудиосигнала голоса певца-исполнителя.
В известном устройстве для модификации голоса по второму варианту выполнения изобретения, содержащем центральный процессор, аудиопроцессор, являющийся средством обработки сигналов, средство управления и монитор, средство обеспечения, сохраняющее таблицу параметров, устройство ввода аудиосигнала, подсоединенное к микрофону, и устройство вывода аудиосигнала, подсоединенное к громкоговорителю, при этом выход средства управления и монитор, соединен с входом центрального процессора, выход которого соединен с управляющими входами аудиопроцессора, средства обеспечения, устройства ввода аудиосигнала и устройства вывода аудиосигнала, соответственно, выход средства обеспечения подсоединен ко второму входу аудиопроцессора, первый выход аудиопроцессора соединен со средством обеспечения, а второй его выход - со входом устройства вывода аудиосигнала, согласно изобретению введено средство формирования динамических параметров, выполненное из блока формирования выходного контура частоты основного тона и из блока преобразования параметров, последовательно соединенных первыми входами к выходу средства обеспечения, выход средства обеспечения подсоединен ко второму входу аудиопроцессора через средство формирования динамических параметров, первый выход аудиопроцессора соединен со средством обеспечения для передачи и хранения в его таблице параметров характеристики частоты основного тона
Figure 00000044
эталонного исполнения, а вторые входы блока формирования выходного контура частоты основного тона и блока преобразования параметров подсоединены к первому выходу аудиопроцессора для передачи в них мгновенного значения частоты основного тона
Figure 00000045
аудиосигнала голоса певца исполнителя и сигнала, характеризующего вектор параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона (ЧОТ) и шумовой составляющей [AS(n),
Figure 00000046
, S(n), rS(n)] голоса певца исполнителя, соответственно, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000047
- мгновенное значение частоты основного тона, S(n) - мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, соответственно, причем блок формирования выходного контура частоты основного тона выполнен с возможностью формирования
Figure 00000048
- преобразованного параметра
Figure 00000049
в соответствии характеристикой частоты основного тона
Figure 00000050
эталонного исполнения, а блок преобразования параметров - с возможностью формирования сигнала, характеризующего преобразованный вектор параметров [
Figure 00000051
,
Figure 00000052
, (n),
Figure 00000053
], где
Figure 00000054
- преобразованный параметр AS(n),
Figure 00000055
- преобразованный параметр
Figure 00000056
, (n) - преобразованный параметр S(n),
Figure 00000057
- преобразованный параметр
Figure 00000058
, скорректированные в соответствии с характеристикой частоты основного тона
Figure 00000059
эталонного исполнения, кроме того, аудиопроцессор выполнен с возможностью параметрического синтеза преобразованного вектора параметров [
Figure 00000060
,
Figure 00000061
, (n),
Figure 00000062
] для формирования синтезированного промодифицированного сигнала s(n) и передачи его со второго выхода аудиопроцессора на вход устройства вывода аудиосигнала
Достоинством предложенного технического решения для модификации и коррекции певческого голоса певца-исполнителя является расширение функциональных возможностей воспроизведения вокально-инструментальных композиций, создание качественных музыкальных произведений из записанной фонограммы, включающей голос певца-исполнителя и соответствующего музыкального сопровождения, причем обработка голоса инвариантна к языку композиции и исполнения. Это позволяет получить, во-первых, корректировку входного голоса певца-исполнителя по нотам заданной мелодии, во-вторых, корректировку входного голоса певца-исполнителя по эталонному исполнению мелодии голосом другого целевого певца-профессионала, при этом обеспечивается высокое качество выходного голоса певца-исполнителя.
Указанные преимущества, а также особенности настоящего изобретения поясняются вариантами его осуществления со ссылками на прилагаемые фигуры.
Краткий перечень чертежей
Фиг. 1 - функциональная схема ближайшего аналога - устройства модификации голоса соответствующим набором параметров (аппарат караоке);
Фиг. 2 - то же, что фиг. 1, обобщенная функциональная схема (предшествующий уровень);
Фиг. 3 - обобщенная функциональная схема устройства модификации голоса, в которой осуществляется реализация заявленного способа по первому или второму вариантам;
Фиг. 4 - аудиосигнал и его спектрограмма с отмеченными гармониками частоты основного тона а) входной сигнал, б) сигнал с измененной частотой основного тона по отношению к входному сигналу;
Фиг. 5 - иллюстрация сепарации аудиосигнала на периодическую и стохастическую компоненты: а) входной сигнал с отмеченными областями вокализованности, б) выделенная вокализованная компонента, в) сигнал остаток - стохастическая компонента, г) синтезированный выходной сигнал с отмеченными вокализованными компонентами;
Фиг. 6 - иллюстрация формирования выходного контура частоты основного тона по нотам мелодии;
Фиг. 7 - иллюстрация формирования выходного контура частоты основного тона по эталонному исполнению;
Фиг. 8 - блок-схема алгоритма работы устройства для модификации голоса.
Варианты осуществления изобретения
Поскольку способы модификации голоса реализуются при помощи заявленных устройств, то их подробное описание приведено в разделе описания работы устройства
Устройство 1 для модификации голоса соответствующим набором параметров (аппарат караоке), который показан на фигуре 1, составлен из управляемого усилителя 2, аудиопроцессора 3, диска чейнджера (LD changer) 4, громкоговорителя 5, монитора 6, микрофона 7, инфракрасного пульта управления 8, центрального процессорного устройства 10, постоянного запоминающего устройства (ПЗУ) 11, оперативного запоминающего устройства (ОЗУ) 12, жесткого диска 17, контроллер связи 16 для осуществления цифрового ввода, приемника сигнала пульта управления 13, индикаторной панели управления 14, панели переключателей 15, тонального генератора 18, процессора голосовых данных 19, генератора символов 20, контроллеров дисплея 21 и дисковода гибких дисков 25, а также дисковода гибких дисков 26. Данная схема представляет одну из технических реализаций устройства модификации голоса соответствующим набором параметров (аппарата караоке), которая в общем случае соответствует микро-ЭВМ с дополнительными устройствами связи, ввода-вывода аналоговых аудиосигналов, аудиопроцессора цифровой обработки аудиосигналов, присоединенными к общей шине микро-ЭВМ.
Исходя из сведений, изложенных в патенте США №5847303 и его формулы изобретения, не нарушая технической сущности ближайшего аналога - способа и устройства для модификации голоса, которые модулируют входной голосовой сигнал певца-исполнителя в выходной голосовой сигнал целевого певца согласно заданному набору параметров, для более ясного понимания сущности процесса обработки аудиосигнала структурную схему процессора модификации голоса соответствующим набором параметров (аппарат караоке) 1, показанную на фигуре 1, можно представить в виде обобщенной известного аппарата 1 караоке, показанной фигуре 2. На фигуре 2 устройство 31 ввода аудиосигнала включает управляемый усилитель 2. Устройство 32 вывода аудиосигнала содержит управляемый усилитель 2, тональный генератор 18, процессор голосовых данных 19. Средство 33 обработки состоит из аудиопроцессора 3. В средство 34 обеспечения (память набора параметров) входят контроллер связи 16 для осуществления цифрового ввода и жесткий диск 17 для хранения таблицы параметров реконфигурации аудиопроцессора 3. Центральный процессор 35 включает центральное процессорное устройство 10, ПЗУ 11 хранения начального загрузчика ввода операционной системы, ОЗУ 12 для записи программы работы соответствующего режима устройства модификации голоса, которое модулирует входной голосовой сигнал певца-исполнителя в выходной голосовой сигнал целевого певца согласно заданному набору параметров, контроллер дисковода гибких дисков 25 и дисковод гибких дисков 26. Средство 36 управления и монитор образованы монитором 6, контроллером дисплея 21, генератором символов 20, диском чейнджера (LD changer) 4, инфракрасным пультом управления 8, приемником сигнала пульта управления 13, панелью переключателей 15 и индикаторов управления 14.
Из микрофона 7 входной сигнал певца-исполнителя, имеющий специфический спектр частот, через устройство 31 ввода аудиосигнала поступает в средство 33 обработки - аудиопроцессор (АП), который конфигурирован некоторым набором параметров, взятых из памяти (таблицы статических параметров) средства 34 обеспечения для обработки аудиосигнала певца-исполнителя по этому набору параметров (фиг. 2). В таблице параметров представлены для хранения несколько наборов параметров целевых певцов, подготовленных заранее, каждый из которых по-разному характеризует модификацию спектра частот певца-исполнителя средством 33 обработки - АП. Центральный процессор 35 выбирает один желательный из наборов параметров в таблице параметров и конфигурирует средство 33 обработки - АП этим выбранным набором параметров. Выходной аудиосигнал, который сформирован АП в соответствии с выбранным набором параметров и который представляет собой выходной голосовой сигнал близкий к целевому певцу, поступает через устройство 32 вывода аудиосигнала на громкоговоритель 5. Выбор набора параметров, характеризующий целевого певца и песню (мелодию и стихи) задаются на панели управления и выводятся на экран монитора - средство 36 управления и монитор. Таблица параметров, хранящаяся в памяти средства 34, обеспечения включает следующую группу параметров: 1) набор параметров, характеризующий вокальное исполнение конкретного целевого певца; 2) диапазон частоты основного тона (20% изменение частоты по отношению к частоте основного тона певца-исполнителя); 3) временное масштабирование; 4) коэффициенты фильтра, осуществляющего модификацию спектра входного аудиосигнала голоса певца-исполнителя. Способность манипулировать частотой основного тона и формой спектра входного сигнала позволяет преобразовать мужской голос в женский и наоборот. Караоке-аккомпанемент генерируется согласно предоставляемым последовательно по времени данным трека исполнения и последовательно во времени выбираются наборы параметров согласно данным трека управления, предоставляемыми последовательно во времени синхронно с данными исполнения: текст песни, выводимый на экран монитора Данные трека исполнения и трека управления генерируются центральным процессором 35. Способ генерации караоке-аккомпанемента, чтобы поддерживать голос певца-исполнителя, поющего песню-караоке, осуществляется согласно следующим этапам: параллельно караоке-аккомпанементу вводится через устройство 31 ввода аудиосигнала голос певца-исполнителя, имеющий специфический спектр частот; обработка данного аудиосигнала в средстве 33 обработки согласно выбранному набору параметров, каждый из которых по-разному характеризует модификацию специфического спектра частот голоса певца-исполнителя. Аудиопроцессор средства 33 обработки во времени конфигурируется выбираемыми последовательно наборами параметров так, что на этапе вывода выходной голос во времени модулирован согласно выбранным наборам параметров. Таким образом, голос певца-исполнителя динамически адаптируется к песне-караоке во время караоке-исполнения. Вывод модифицированного голоса певца-исполнителя, адаптированного к караоке-песне, осуществляется через средство 32 вывода аудиосигнала на громкоговоритель 5.
Заявленное устройство для модификации голоса (фиг. 3) по первому варианту выполнения изобретения содержит центральный процессор 35, аудиопроцессор (АП), являющийся средством 33 обработки сигналов, средство 36 управления и монитор, средство 34 обеспечения, сохраняющее таблицу параметров, устройство 31 ввода аудиосигнала, подсоединенное к микрофону 7, и устройство 32 вывода аудиосигнала, подсоединенное к громкоговорителю 5. Выход средства 36 управления и монитор, соединен с входом центрального процессора 35. Выход центрального процессора 35 соединен с управляющими входами аудиопроцессора, средства 34 обеспечения, устройства 31 ввода аудиосигнала и устройства 32 вывода аудиосигнала, соответственно. Первый вход АП подсоединен к выходу устройство 31 ввода аудиосигнала Выход средства 34 обеспечения подсоединен ко второму входу АП. Первый выход АП соединен со средством 34 обеспечения, а второй его выход - со входом устройства 32 вывода аудиосигнала
Введено средство 37 формирования динамических параметров, выполненное из блока 38 формирования выходного контура частоты основного тона (ЧОТ) и из блока 39 преобразования параметров, последовательно соединенных первыми входами к выходу средства 34 обеспечения. Выход средства 34 обеспечения подсоединен ко второму входу АП через средство 37 формирования динамических параметров. Первый выход АП соединен со средством 34 обеспечения для передачи и хранения в его таблице параметров нот музыкального сопровождения. Вторые входы блока 38 формирования выходного контура ЧОТ и блока 39 преобразования параметров подсоединены к первому выходу АП для передачи в блок формирования выходного контура ЧОТ мгновенного значения частоты основного тона
Figure 00000063
аудиосигнала голоса певца исполнителя, а в блок 39 преобразования параметров сигнала, характеризующего вектор параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей [AS(n),
Figure 00000064
, S(n), rS(n)] голоса певца исполнителя, соответственно, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000065
-мгновенное значение частоты основного тона, S(n) - мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, соответственно. Блок 38 формирования выходного контура ЧОТ выполнен с возможностью формирования
Figure 00000066
- преобразованного параметра
Figure 00000067
в соответствии с нотами музыкального сопровождения. Блок 39 преобразования параметров выполнен с возможностью формирования сигнала, характеризующего преобразованный вектор параметров [
Figure 00000068
,
Figure 00000069
, (n),
Figure 00000070
], где
Figure 00000071
- преобразованный параметр AS(n),
Figure 00000072
- преобразованный параметр
Figure 00000073
, (n) - преобразованный параметр S(n),
Figure 00000070
- преобразованный параметр rS(n), скорректированные в соответствии с нотами музыкального сопровождения. АП выполнен с возможностью параметрического синтеза преобразованного вектора параметров [
Figure 00000074
,
Figure 00000075
, (n),
Figure 00000070
] для формирования синтезированного промодифицированного сигнала s(n) и передачи его со второго выхода АП на вход устройства 32 вывода аудиосигнала
Устройство для модификации по второму варианту выполнения изобретения отличается от первого варианта только тем, что первый выход АП соединен со средством 34 обеспечения для передачи и хранения в его таблице параметров характеристики частоты основного тона
Figure 00000076
эталонного исполнения певцом-профессионалом (фиг. 3), которую предварительно формирует АП.
Работает устройство (фиг. 3) следующим образом.
Для повышения натуральности звучания и расширения доступного диапазона изменения основного тона используется решение, основанное на гибридной (детерминистской/стохастической) модели аудиосигнала, в которой используется три раздельные составляющие: периодическая, шумовая и транзиентная. Поскольку при изменении частоты основного тона (ЧОТ) голоса обрабатывается только вокализованная (детерминистская) часть сигнала, в заявленном техническом решении отсутствует необходимость различения между собой шумовых и транзиентных составляющих - вместе их можно отнести к невокализованной (стохастической) части сигнала
Аудиосигнал s(n) в общем случае в данном изобретении представляется в виде суммы двух составляющих: вокализованной и невокализованной. Для описания вокализованной части сигнала используется синусоидальная модель:
Figure 00000077
,
где Ak(n) - мгновенная амплитуда k-ой гармоники, K - общее число гармоник, k(n) мгновенное значение фазы k-ой гармоники, r(n) - шумовая составляющая сигнала, n - номер временного отсчета
Мгновенная частота fk(n) связана с мгновенной фазой следующим соотношением:
Figure 00000078
,
где Fs - частота дискретизации и k(n) - начальная фаза k-ой гармоники, а - fk(i) - частота i-ой субгармоники к-ой гармоники. Приближенно можно считать, что частота каждой гармоники является кратной частоте основного тона (фиг. 4 а), т.е.
fk(n) f0(n)k,
где f0(n) - частота основного тона (ЧОТ).
На фиг. 4б приведен сигнал с измененной частотой основного тона (частота увеличена) по отношению к входному сигналу, показанному на фиг. 4а
Оценка частоты основного тона выполняется при помощи, например, алгоритма (Azarov Е., Vashkevich М., Petrovsky A. Instantaneous pitch estimation based on RAPT framework // EUSIPCO 2012: proc. of the 20th European Signal Processing Conference. - Bucharest., 2012. - P. 2787-2791) или ему подобных (Pavlovets, A. Petrovsky, Robust HNR-Based Closed-Loop Pitch and Harmonic Parameters Estimation. INTERSPEECH 2011, pp. 1981-1984) или какими любыми другими известными из уровня техники методами, особенностью которых является возможность определения мгновенной частоты. Эта возможность достигается за счет использования специальной функции оценки периодичности inst(n, р) аналогичной автокорреляционной функции, вычисляемой из мгновенных гармонических параметров субполосных составляющих сигнала
Figure 00000079
где р - длина периода кандидата основного тона (под понятием «кандидат» понимается параметр частоты одной из гармоник, близкой к частоте основного тона), а
Figure 00000080
- мгновенная амплитуда k-ой гармоники возведенная в квадрат. В отличие от автокорреляционной функции, функция inst нечувствительна к любым изменениям частоты основного тона в окрестности отсчета n при условии, что используемые гармонические параметры получены достаточно точно, например, процент грубых ошибок может быть порядка 2-3%.
Вектор параметров модели аудио сигнала [А(n), f0(n), (n), r(n)] как входного голоса певца исполнителя [AS(n),
Figure 00000081
, S(n), rS(n)], так и сигнала голоса эталонного исполнения мелодии или целевого певца [AT(n),
Figure 00000082
, T(n), rT(n)] определяется с помощью параметрического анализа, выполняемого по одному из методов, представленных в работах (Zubrycki, P.; Petrovsky, A, "Quasi-periodic signal analysis using harmonic transform with application to voiced speech processing," Circuits and Systems (ISCAS), Proceedings of 2010 IEEE International Symposium on, vol., no., pp. 2374,2377, May 30 2010-June 2 2010; Abe, Т.; Honda, M., "Sinusoidal model based on instantaneous frequency attractors," Audio, Speech, and Language Processing, IEEE Transactions on, vol. 14, no. 4, pp. 1292, 1300, July 2006), или какими любыми другими известными из уровня техники методами. Параметрический анализ аудиосигнала входного голоса певца исполнителя [AS(n),
Figure 00000083
, S(n), rS(n)] и сигнала голоса эталонного исполнения мелодии или целевого певца [AT(n),
Figure 00000084
, T(n), rT(n)] осуществляется в средстве 33 обработки - АП.
Частота f0(n) основного тона определяет высоту звучания голоса. Контур частоты основного тона (его изменение в зависимости от времени на большом протяжении) определяет интонацию. Для того чтобы сохранить тембр входного голоса певца-исполнителя при изменении ЧОТ, должна сохраняться спектральная огибающая, которая формируется из мгновенных амплитуд гармоник основного тона спектральную огибающую E(n, f) можно рассматривать как функцию от номера временного n отсчета и частоты f, которая принимает значения мгновенных амплитуд гармоник частоты основного тона Ak(n) в соответствующих отсчетах частоты fk(n) (гармоник ЧОТ):
Е(n,fk(n))=Ak(n).
Для произвольных n и f функция Е(n,fk(n)) вычисляется путем линейной интерполяции ближайших к ним амплитудных значений. Вычисление спектральной огибающей E(n,f) выполняется в блоке 39 преобразования параметров, результатом работы которого является преобразованный вектор параметров [
Figure 00000085
,
Figure 00000086
, (n),
Figure 00000087
].
Синтез выходного аудиосигнала с модифицированным контуром ЧОТ может быть выполнен АП по следующей формуле:
Figure 00000088
,
где фазы гармонических компонентов (n) рассчитываются в соответствии с новым контуром частоты основного тона
Figure 00000089
следующим образом:
Figure 00000090
,
где
Figure 00000091
- частота i-ой субгармоники частоты основного тона, a FS - частота дискретизации.
Дополнительный фазовый параметр
Figure 00000092
используется для сохранения относительных фаз гармоник по отношению к фазе частоты основного тона. Данный параметр вычисляется как
Figure 00000093
.
Параметрический синтез выходного аудиосигнала на основе вектора преобразованных параметров [
Figure 00000094
,
Figure 00000095
, (n),
Figure 00000087
], который происходит в средстве 33 обработки - АП.
Основной тон присутствует только в вокализованных сегментах речи, т.е. только тогда, когда задействованы голосовые связки певца-исполнителя. Как было показано выше и на фиг. 4а и 4б, в спектре речевого сигнала вокализованность проявляется в виде спектральных компонент кратной частоте основного тона. На рис. 5а в качестве примера показан речевой сигнал с отмеченными контурами вокализованности в области спектра Для того, чтобы сохранить исходное качество звучания невокализованных звуков алгоритм изменения тона должен автоматически выделять области вокализованности и выполнять обработку только в этих областях (рис. 5а). Шумовая часть r(n) (фиг. 5в) выделяется из исходного сигнала вычитанием выделенных вокализованных звуков (фиг. 5б).
Таким образом, обработка аудиосигнала на основе принятой модели, т.е. параметрический анализ с цепью получения вектора параметров [А(n), f0(n), (n), r(n)] как для входного голоса певца исполнителя [AS(n),
Figure 00000096
, S(n), rS(n)], так и для сигнала голоса эталонного исполнения мелодии или целевого певца [AT(n),
Figure 00000097
, T(n), rT(n)] можно кратко описать в виде следующей последовательности действий:
1) Определение частоты основного тона f0(n);
2) Преобразование аудиосигнала в параметрический вид, т.е. оценка мгновенных гармонических параметров Ak(n), fk(n) и k(n). k=1, 2, … K;
3) Оценка вокализации каждой тройки указанных гармонических параметров по пункту 2 и отбор только тех, которые относятся к вокализованным областям спектра (вокализаванной может быть часть спектра, которая характеризуется данной тройкой параметров).
4) Синтез вокализованной компоненты аудиосигнала (фиг. 5б) и ее вычитание из исходного речевого сигнала для получения шумовой составляющей r(n) (фиг. 5в).
Синтез вокализованной компоненты с измененным контуром частоты основного тона в соответствии с целевым контуром частоты основного тона и сложение ее с шумовой составляющей r(n) выполняется в средстве 33 обработки - АП, т.е. на основе вектора преобразованных параметров [
Figure 00000098
,
Figure 00000099
, (n),
Figure 00000087
] (фиг. 5г).
Устройство для формирования выходного контура частоты основного тона функционирует в двух режимах по первому и второму вариантам (фиг. 3 и фиг. 8): 1) формирование контура частоты основного тона по нотам музыкального сопровождения; 2) формирование контура частоты основного тона по эталонному исполнению для придания голосу индивидуальной манеры профессионального певца Режим задается центральным процессором 35 в зависимости от выбора певца-исполнителя средством 36 управления. Формирование динамических параметров - выходного контура ЧОТ выполняется в процессе пения в соответствии с мелодией выбранного музыкального произведения.
В случае формирования выходного контура ЧОТ
Figure 00000100
по нотам музыкального сопровождения из таблицы статических параметров средства 34 обеспечения считываются ноты мелодии выбранного музыкального произведения. Контур выходного тона
Figure 00000101
формируется на основе нот мелодии таким образом, чтобы внести наименьшие искажения в обработанный сигнал. В первую очередь выполняется подбор октавы мелодии, наиболее близкой к голосу пользователя. Для этого частотный контур мелодии умножается и делится на коэффициенты 2 и 4, а затем сравнивается с ЧОТ входного сигнала голоса певца-исполнителя
Figure 00000102
. После этого выполняется выравнивание контура ЧОТ входного сигнала голоса певца-исполнителя
Figure 00000103
и мелодии по времени путем использования временного масштабирования на основе динамического программирования. За счет данной процедуры снижается уровень слышимых артефактов, вносимых в моменты переходов мелодии от ноты к ноте. Затем, контур ЧОТ входного сигнала голоса певца-исполнителя
Figure 00000104
притягивается к нотам музыкального сопровождения (фиг. 6). Исходная форма контура ЧОТ входного сигнала голоса певца-исполнителя
Figure 00000105
сохраняется на границах вокализованных сегментов для того, чтобы ослабить эффект "компьютерного акцента".
Для уменьшения расстояния между контуром ЧОТ входного сигнала голоса певца-исполнителя
Figure 00000106
и выходным контурам частоты основного тона
Figure 00000107
могут использоваться различные вариации. Возможные вариации заранее устанавливаются для музыкального сопровождения при помощи одновременно звучащих нот и обрабатываются при помощи динамического программирования.
В случае формирования выходного контура ЧОТ
Figure 00000108
по эталонному исполнению певца-профессионала (фиг. 3) вместо нот мелодии используется контур ЧОТ
Figure 00000109
(фиг. 7). Требуемый контур ЧОТ
Figure 00000110
целевого певца считывается из таблицы параметров средства 33 обеспечения, либо в реальном масштабе времени выделяется из исполнения выбранной композиции заданным целевым певцом в результате параметрического анализа в средстве 33 обработки - АП.
Синхранизация вычислительных процессов в устройстве для модификации голоса (фиг. 3) выполняется центральным процессором 35. При включении устройства для модификации голоса (фиг. 8) выполняется инициализация центрального процессора 35, средства 33 обработки (АП), запуск программного обеспечения, установление связи с устройствами 31 ввода и 32 вывода аудиосигналов. Интерфейс с пользователем обеспечивается при помощи средства 36 управления и монитора: интерактивной панели управления и экрана В устройстве для модификации голоса (фиг. 3) предусмотрены два режима работы (фиг. 8): корректировка входного голоса певца-исполнителя по нотам музыкального сопровождения, и корректировка входного голоса певца-исполнителя по эталонному исполнению.
Согласно режиму работы «Корректировка входного голоса певца-исполнителя по нотам» (фиг. 3 и 8), центральный процессор 35 загружает в таблицу параметров средства 34 обеспечения мелодию (ноты), определенные певцом-исполнителем на панели управления средства 36 управления и монитора, которые из таблицы параметров средства 34 обеспечения поступают в блок 38 формирования выходного контура ЧОТ. Далее осуществляется синхронизация центральным процессором 35 ввода фрейма аудиосигнала х(n) входного голоса певца-исполнителя из микрофонного входа устройства 31 ввода аудиосигнала в средство 33 обработки (АП) для выполнения параметрического анализа данного фрейма сигнала и получения вектора параметров [AS(n),
Figure 00000111
, S(n), rS(n)] входного голоса певца-исполнителя. В блоке 38 формирования выходного контура ЧОТ осуществляется получение выходного контура ЧОТ
Figure 00000112
в соответствии с нотами, который передается в блок 39 преобразования параметров, где на основании вектора параметров [AS(n),
Figure 00000113
, S(n), rS(n)] входного голоса певца-исполнителя и выходного контура ЧОТ
Figure 00000114
формируется преобразованный вектор параметров [
Figure 00000115
,
Figure 00000116
, (n),
Figure 00000087
]. В соответствии с этими параметрами в средстве 33 обработки (АП) выполняется параметрический синтез, согласно которому формируется фрейм сигнала s(n) выходного голоса певца-исполнителя. Далее в устройстве 32 вывода аудиосигнала фрейм сигнала выходного голоса певца-исполнителя микшируется с музыкальным сопровождением, переданным в устройство 32 вывода аудиосигнала центральным процессором 35 из таблицы параметров средства 33 обеспечения и выводится на громкоговоритель 5. Если музыкальная композиция не закончена, то процесс повторяется с ввода нового фрейма аудиосигнала х(n) входного голоса певца-исполнителя из микрофонного входа устройства 31 ввода аудиосигнала Следует отметить, что работа осуществляется в реальном масштабе времени и центральный процессор 35 осуществляет синхронизацию параллельной работы средства 33 обработки (АП), устройства 31 ввода аудиосигнала, блока 38 формирования выходного контура ЧОТ, блока 39 преобразования параметров и устройства 32 вывода аудиосигнала согласно принципу по фреймовой обработке сигналов (Vanhoof, J., Rompaey, К., Bolsens, I., Goossens, G., Man, H.: High-Level Synthesis for Real-Time Digital Signal Processing. Springer US, Boston, MA (1993)).
Для обеспечения режима работы корректировки голоса певца-исполнителя по эталонному исполнению (фиг. 3 и 8), позволяющему имитировать мастерство пения целевого певца - певца-профессионала, аудиосигнал голоса целевого певца, поступивший в средство 33 обработки (АП) из устройства 31 ввода аудиосигнала, на вход которого вместо микрофона, например, подключен проигрыватель, где записаны мелодии голосами целевых певцов. В результате обработки аудиосигнала голоса целевого певца в средстве 33 обработки формируется контур ЧОТ
Figure 00000117
и записывается в средство 34 обеспечения (таблицу статических параметров), который в дальнейшем используется как параметр данного режима работы устройства для модификации голоса Таким образом, в средстве 34 обеспечения формируется таблица статических параметров целевых певцов. Если певец-исполнитель выбрал режим работы устройства модификации голоса «Корректировка голоса по эталонному исполнению», центральный процессор 35 загружает в блок 38 формирования контура ЧОТ контур ЧОТ
Figure 00000118
выбранного целевого певца, в манере которого певец-исполнитель собирается исполнить музыкальную композицию.
Фрейм аудиосигнала х(n) входного голоса певца-исполнителя из микрофонного входа устройства 31 ввода аудиосигнала поступает в средство 33 обработки (АП) для выполнения параметрического анализа и формирования вектора параметров [AS(n),
Figure 00000119
, S(n), rS(n)] входного голоса певца-исполнителя. Далее, в блоке 38 формирования выходного контура ЧОТ осуществляется получение выходного контура ЧОТ
Figure 00000120
в соответствии с контуром ЧОТ целевого певца
Figure 00000121
загруженным из таблицы параметров средства 33 обеспечения, который передается в блок 39 преобразования параметров, где на основании вектора параметров [AS(n),
Figure 00000122
, S(n), rS(n)] входного голоса певца-исполнителя и выходного контура ЧОТ
Figure 00000123
формируется преобразованный вектор параметров [
Figure 00000124
,
Figure 00000125
, (n),
Figure 00000087
]. В соответствии с данными преобразованными параметрами в средстве 33 обработки (АП) выполняется параметрический синтез, согласно которому формируется фрейм сигнала s(n) выходного голоса певца-исполнителя. Далее в устройстве 32 вывода аудиосигнала фрейм сигнала выходного голоса певца-исполнителя микшируется с музыкальным сопровождением, переданным в устройство 32 вывода аудиосигнала центральным процессором 35 из таблицы параметров средства 34 обеспечения и выводится на громкоговоритель 5. Если музыкальная композиция не закончена, то процесс повторяется с ввода нового фрейма аудиосигнала входного голоса певца-исполнителя из микрофонного входа устройства 31 ввода аудиосигнала Центральный процессор 35 осуществляет синхронизацию паралельной работы средства 33 обработки (АП), устройства 31 ввода аудиосигнала, блока 38 формирования выходного контура ЧОТ, блока 39 преобразования параметров и устройства 32 вывода аудиосигнала согласно принципу по фреймовой обработке сигналов.
В каждом из режимов работы устройств для модификации голоса по первому и второму варианту певец-исполнитель поет с музыкальным сопровождением и наблюдает вспомогательную информацию (текст песни и/или нотную запись, время записи, отсчеты метронома и т.д), выводимую центральным процессором 35 из таблицы параметров средства 34 обеспечения, на средство 36 управления и монитор. Синхронизация данных в каждом из режимов достигается при помощи соответствующих сценариев с помощью центрального процессора 35.
Промышленная применимость
Наиболее успешно заявленный способ модификации голоса и устройство для его реализации (варианты) промышленно применим в системах караоке для обеспечения возможности максимально точного попадания голоса певца-исполнителя в ноты музыкального сопровождения и для имитирования мастерства пения выбранного целевого певца - певца-профессионала.

Claims (7)

1. Способ модификации голоса, заключающийся в том, что
предварительно посредством устройства ввода и средства обработки - аудиопроцессора сохраняют в средстве обеспечения наборы параметров, каждый из которых характеризует определенную модификацию спектра частот голоса певца-исполнителя,
вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, имеющий спектр частот, соответствующий голосу певца-исполнителя,
задают требуемый набор параметров при помощи средства управления и монитора, и затем выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения,
конфигурируют средство обработки выбранным набором параметром из средства обеспечения для модификации голоса певца-исполнителя,
выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки - аудиопроцессором и промодифицированный согласно заданному набору параметров,
отличающийся тем, что
для адаптации голоса певца-исполнителя к нотам музыкального сопровождения дополнительно используют средство формирования динамических параметров для корректировки голоса певца-исполнителя, обеспечивающее формирование выходного контура частоты основного тона и преобразование параметров,
средство обработки - аудиопроцессор дополнительно производит параметрический анализ аудиосигнала голоса певца-исполнителя и формирует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей,
средство формирования динамических параметров создает выходной контур частоты основного тона по нотам музыкального сопровождения, поступающих из средства обеспечения, и в соответствии с выходным контуром частоты основного тона преобразует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей, скорректированных согласно нотам музыкального сопровождения,
затем средство обработки - аудиопроцессор производит параметрический синтез преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей и формирует выходной аудиосигнал - промодифицированный аудиосигнал голоса певца-исполнителя, который выводят посредством устройства вывода аудиосигнала для сведения синхронно во времени с музыкальным сопровождением.
2. Способ по п. 1, отличающийся тем, что средство формирования динамических параметров выполняют из блока формирования выходного контура частоты основного тона по нотам музыкального сопровождения и из блока преобразования параметров, обработку аудиосигнала голоса певца-исполнителя средством обработки производят фрейм за фреймом, центральный процессор синхронизирует ввод фрейма аудиосигнала голоса певца-исполнителя от микрофонного входа устройства ввода аудиосигнала в средство обработки - аудиопроцессор для выполнения параметрического анализа данного фрейма сигнала и формирования вектора параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей
Figure 00000126
голоса певца-исполнителя, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000127
- мгновенное значение частоты основного тона,
Figure 00000128
- мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета, при этом центральный процессор из средства обработки осуществляет загрузку в блок формирования выходного контура частоты основного тона нот музыкального сопровождения, определенного певцом-исполнителем посредством средства управления и монитора, в блоке формирования выходного контура частоты основного тона создают выходной контур частоты основного тона
Figure 00000129
в соответствии с нотами, в блоке преобразования параметров на основании вектора параметров
Figure 00000126
голоса певца-исполнителя и выходного контура частоты основного тона
Figure 00000130
формируют преобразованный вектор параметров
Figure 00000131
где
Figure 00000132
- преобразованный параметр
Figure 00000133
- преобразованный параметр
Figure 00000134
- преобразованный параметр
Figure 00000135
- преобразованный параметр
Figure 00000136
скорректированные согласно нотам музыкального сопровождения, после параметрического синтеза средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей, средство обработки формирует фрейм выходного аудиосигнала, а для сведения с музыкальным сопровождением фрейм выходного аудиосигнала микшируют в устройстве вывода аудиосигнала с данным музыкальным сопровождением, синхронизируемым во времени посредством центрального процессора, и если музыкальное сопровождение не завершено, процесс повторяют для следующего фрейма аудиосигнала голоса певца-исполнителя.
3. Способ по п. 2, отличающийся тем, что для уменьшения эффекта "компьютерного акцента" при параметрическом синтезе средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей сохраняют на границах вокализованных сегментов нот музыкального сопровождения форму контура частоты основного тона
Figure 00000127
аудиосигнала голоса певца-исполнителя.
4. Устройство для модификации голоса, содержащее центральный процессор, аудиопроцессор, являющийся средством обработки сигналов, средство управления и монитор, средство обеспечения, сохраняющее таблицу параметров, устройство ввода аудиосигнала, подсоединенное к микрофону, и устройство вывода аудиосигнала, подсоединенное к громкоговорителю, при этом выход средства управления и монитор, соединен с входом центрального процессора, выход которого соединен с управляющими входами аудиопроцессора, средства обеспечения, устройства ввода аудиосигнала и устройства вывода аудиосигнала соответственно, первый вход аудиопроцессора подсоединен к выходу устройства ввода аудиосигнала, выход средства обеспечения подсоединен ко второму входу аудиопроцессора, первый выход аудиопроцессора соединен со средством обеспечения, а второй его выход - со входом устройства вывода аудиосигнала, отличающееся тем, что введено средство формирования динамических параметров, выполненное из блока формирования выходного контура частоты основного тона и из блока преобразования параметров, последовательно соединенных первыми входами к выходу средства обеспечения, выход средства обеспечения подсоединен ко второму входу аудиопроцессора через средство формирования динамических параметров, первый выход аудиопроцессора соединен со средством обеспечения для передачи и хранения в его таблице параметров нот музыкального сопровождения, а вторые входы блока формирования выходного контура частоты основного тона и блока преобразования параметров подсоединены к первому выходу аудиопроцессора для передачи в блок формирования выходного контура частоты основного тона мгновенного значения частоты основного тона
Figure 00000127
аудиосигнала голоса певца-исполнителя, а в блок преобразования параметров сигнала, характеризующего вектор параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей
Figure 00000137
голоса певца-исполнителя соответственно, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000138
- мгновенное значение частоты основного тона,
Figure 00000128
- мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, n - номер временного отсчета соответственно, причем блок формирования выходного контура частоты основного тона выполнен с возможностью формирования
Figure 00000139
- преобразованного параметра
Figure 00000140
в соответствии с нотами музыкального сопровождения, а блок преобразования параметров - с возможностью формирования сигнала, характеризующего преобразованный вектор параметров
Figure 00000141
Figure 00000142
где
Figure 00000143
- преобразованный параметр
Figure 00000144
- преобразованный параметр
Figure 00000145
Figure 00000146
- преобразованный параметр
Figure 00000135
- преобразованный параметр rS(n), скорректированные в соответствии с нотами музыкального сопровождения, аудиопроцессор выполнен с возможностью параметрического синтеза преобразованного вектора параметров
Figure 00000147
для формирования синтезированного промодифицированного сигнала s(n) и передачи его со второго выхода аудиопроцессора на вход устройства вывода аудиосигнала.
5. Способ модификации голоса, заключающийся в том, что
предварительно посредством устройства ввода и средства обработки - аудиопроцессора сохраняют в средстве обеспечения наборы параметров, каждый из которых характеризует определенную модификацию спектра частот голоса певца-исполнителя,
вводят синхронно с музыкальным сопровождением в средство обработки посредством устройства ввода аудиосигнала голос певца-исполнителя, имеющий спектр частот, соответствующий голосу певца-исполнителя,
задают требуемый набор параметров при помощи средства управления и монитора и затем выбирают посредством центрального процессора требуемый набор параметров в средстве обеспечения,
конфигурируют средство обработки выбранным набором параметров из средства обеспечения для модификации голоса певца-исполнителя,
выводят посредством устройства вывода аудиосигнала голос певца-исполнителя, обработанный средством обработки - аудиопроцессором и промодифицированный согласно заданному набору параметров,
отличающийся тем, что
для корректировки голоса певца-исполнителя по эталонному исполнению, имитирующему мастерство пения целевого певца - певца-профессионала дополнительно используют средство формирования динамических параметров, обеспечивающее формирование выходного контура частоты основного тона и преобразование параметров,
предварительно посредством устройства ввода и средства обработки - аудиопроцессора сохраняют в средстве обеспечения характеристику частоты основного тона, соответствующую эталонному исполнению,
средство обработки - аудиопроцессор дополнительно производит параметрический анализ аудиосигнала голоса певца-исполнителя и формирует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона,
средство формирования динамических параметров создает выходной контур частоты основного тона по характеристике частоты основного тона, соответствующей эталонному исполнению, поступающей из средства обеспечения, и в соответствии с выходным контуром частоты основного тона преобразует вектор мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей аудиосигнала голоса певца-исполнителя, скорректированных согласно характеристике частоты основного тона, соответствующей эталонному исполнению,
затем средство обработки - аудиопроцессор производит параметрический синтез преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей и формирует выходной аудиосигнал - промодифицированный аудиосигнал голоса певца-исполнителя, который выводят посредством устройства вывода аудиосигнала для сведения синхронно во времени с музыкальным сопровождением.
6. Способ по п. 5, отличающийся тем, что средство формирования динамических параметров выполняют из блока формирования выходного контура частоты основного тона по эталонному исполнению и из блока преобразования параметров, обработку аудиосигнала голоса певца-исполнителя средством обработки производят фрейм за фреймом, центральный процессор синхронизирует ввод фрейма аудиосигнала голоса певца-исполнителя от микрофонного входа устройства ввода аудиосигнала в средство обработки - аудиопроцессор для выполнения параметрического анализа данного фрейма сигнала и формирования вектора параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей
Figure 00000148
голоса певца-исполнителя, где АS(n) - мгновенное значение амплитуды гармоники,
Figure 00000127
- мгновенное значение частоты основного тона,
Figure 00000149
- мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, a n - номер временного отсчета, при этом центральный процессор из средства обеспечения осуществляет загрузку в блок формирования выходного контура частоты основного тона характеристику контура частоты основного тона ЧОТ
Figure 00000150
эталонного исполнения, определенного певцом-исполнителем посредством средства управления и монитора, в блоке формирования выходного контура частоты основного тона создают выходной контур частоты основного тона
Figure 00000151
соответствующий характеристике контура частоты основного тона ЧОТ
Figure 00000150
эталонного исполнения, в блоке преобразования параметров на основании вектора параметров
Figure 00000152
голоса певца-исполнителя и выходного контура частоты основного тона
Figure 00000153
формируют преобразованный вектор параметров
Figure 00000154
где
Figure 00000155
- преобразованный параметр
Figure 00000156
- преобразованный параметр
Figure 00000157
Figure 00000158
- преобразованный параметр
Figure 00000159
- преобразованный параметр rS(n), скорректированные согласно эталонному исполнению, после параметрического синтеза средством обработки - аудиопроцессором преобразованного вектора мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей средство обработки формирует фрейм выходного аудиосигнала, а для сведения с музыкальным сопровождением фрейм выходного аудиосигнала микшируют в устройстве вывода аудиосигнала с музыкальным сопровождением, синхронизируемым во времени посредством центрального процессора, и если музыкальное сопровождение не завершено, процесс повторяют для следующего фрейма аудиосигнала голоса певца-исполнителя.
7. Устройство для модификации голоса, содержащее центральный процессор, аудиопроцессор, являющийся средством обработки сигналов, средство управления и монитор, средство обеспечения, сохраняющее таблицу параметров, устройство ввода аудиосигнала, подсоединенное к микрофону, и устройство вывода аудиосигнала, подсоединенное к громкоговорителю, при этом выход средства управления и монитор, соединен с входом центрального процессора, выход которого соединен с управляющими входами аудиопроцессора, средства обеспечения, устройства ввода аудиосигнала и устройства вывода аудиосигнала соответственно, первый вход аудиопроцессора подсоединен к выходу устройства ввода аудиосигнала, выход средства обеспечения подсоединен ко второму входу аудиопроцессора, первый выход аудиопроцессора соединен со средством обеспечения, а второй его выход - с входом устройства вывода аудиосигнала, отличающееся тем, что введено средство формирования динамических параметров, выполненное из блока формирования выходного контура частоты основного тона и из блока преобразования параметров, последовательно соединенных первыми входами к выходу средства обеспечения, выход средства обеспечения подсоединен ко второму входу аудиопроцессора через средство формирования динамических параметров, первый выход аудиопроцессора соединен со средством обеспечения для передачи и хранения в его таблице параметров характеристики частоты основного тона
Figure 00000150
эталонного исполнения, а вторые входы блока формирования выходного контура частоты основного тона и блока преобразования параметров подсоединены первому выходу аудиопроцессора для передачи в блок формирования выходного контура частоты основного тона мгновенного значения частоты основного тона
Figure 00000160
аудиосигнала голоса певца-исполнителя, а в блок преобразования параметров - сигнала, характеризующего вектор параметров мгновенных значений амплитуды гармоник, фазы, частоты основного тона и шумовой составляющей
Figure 00000161
голоса певца-исполнителя соответственно, где AS(n) - мгновенное значение амплитуды гармоники,
Figure 00000160
- мгновенное значение частоты основного тона,
Figure 00000162
- мгновенное значение фазы гармоник основного тона, rS(n) - шумовая составляющая сигнала, а n - номер временного отсчета, причем блок формирования выходного контура частоты основного тона выполнен с возможностью формирования
Figure 00000163
- преобразованного параметра
Figure 00000160
в соответствии характеристикой частоты основного тона
Figure 00000164
эталонного исполнения, а блок преобразования параметров - с возможностью формирования сигнала, характеризующего преобразованный вектор параметров
Figure 00000165
Figure 00000166
где
Figure 00000167
- преобразованный параметр
Figure 00000168
- преобразованный параметр
Figure 00000169
Figure 00000170
- преобразованный параметр
Figure 00000171
- преобразованный параметр rS(n), скорректированные в соответствии с характеристикой частоты основного тона
Figure 00000164
эталонного исполнения, аудиопроцессор выполнен с возможностью параметрического синтеза преобразованного вектора параметров
Figure 00000172
для формирования синтезированного промодифицированного сигнала s(n) и передачи его со второго выхода аудиопроцессора на вход устройства вывода аудиосигнала.
RU2015119825/08A 2015-05-27 2015-05-27 Способ модификации голоса и устройство для его осуществления (варианты) RU2591640C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2015119825/08A RU2591640C1 (ru) 2015-05-27 2015-05-27 Способ модификации голоса и устройство для его осуществления (варианты)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015119825/08A RU2591640C1 (ru) 2015-05-27 2015-05-27 Способ модификации голоса и устройство для его осуществления (варианты)

Publications (1)

Publication Number Publication Date
RU2591640C1 true RU2591640C1 (ru) 2016-07-20

Family

ID=56412618

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015119825/08A RU2591640C1 (ru) 2015-05-27 2015-05-27 Способ модификации голоса и устройство для его осуществления (варианты)

Country Status (1)

Country Link
RU (1) RU2591640C1 (ru)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4278838A (en) * 1976-09-08 1981-07-14 Edinen Centar Po Physika Method of and device for synthesis of speech from printed text
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US5847303A (en) * 1997-03-25 1998-12-08 Yamaha Corporation Voice processor with adaptive configuration by parameter setting
US7117154B2 (en) * 1997-10-28 2006-10-03 Yamaha Corporation Converting apparatus of voice signal by modulation of frequencies and amplitudes of sinusoidal wave components
US7577565B2 (en) * 2001-02-21 2009-08-18 Texas Instruments Incorporated Adaptive voice playout in VOP
RU2471251C2 (ru) * 2007-05-24 2012-12-27 Майкрософт Корпорейшн Устройство на основе личности

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4278838A (en) * 1976-09-08 1981-07-14 Edinen Centar Po Physika Method of and device for synthesis of speech from printed text
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
US5847303A (en) * 1997-03-25 1998-12-08 Yamaha Corporation Voice processor with adaptive configuration by parameter setting
US7117154B2 (en) * 1997-10-28 2006-10-03 Yamaha Corporation Converting apparatus of voice signal by modulation of frequencies and amplitudes of sinusoidal wave components
US7577565B2 (en) * 2001-02-21 2009-08-18 Texas Instruments Incorporated Adaptive voice playout in VOP
RU2471251C2 (ru) * 2007-05-24 2012-12-27 Майкрософт Корпорейшн Устройство на основе личности

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
US 8589166 B2,, 19.11.2013. *

Similar Documents

Publication Publication Date Title
JP6724932B2 (ja) 音声合成方法、音声合成システムおよびプログラム
JP6733644B2 (ja) 音声合成方法、音声合成システムおよびプログラム
CN109559718B (zh) 电子乐器、电子乐器的乐音产生方法以及存储介质
US20210375248A1 (en) Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium
US20210366454A1 (en) Sound signal synthesis method, neural network training method, and sound synthesizer
WO2020095951A1 (ja) 音響処理方法および音響処理システム
US20210350783A1 (en) Sound signal synthesis method, neural network training method, and sound synthesizer
JP6977818B2 (ja) 音声合成方法、音声合成システムおよびプログラム
JP7331588B2 (ja) 情報処理方法、推定モデル構築方法、情報処理装置、推定モデル構築装置およびプログラム
JP2003345400A (ja) ピッチ変換装置、ピッチ変換方法及びプログラム
US20220084492A1 (en) Generative model establishment method, generative model establishment system, recording medium, and training data preparation method
RU2591640C1 (ru) Способ модификации голоса и устройство для его осуществления (варианты)
JP3540159B2 (ja) 音声変換装置及び音声変換方法
JP2022065554A (ja) 音声合成方法およびプログラム
US11756558B2 (en) Sound signal generation method, generative model training method, sound signal generation system, and recording medium
JP3540609B2 (ja) 音声変換装置及び音声変換方法
JPH1031496A (ja) 楽音発生装置
JP5703555B2 (ja) 楽音信号処理装置及びプログラム
JP2009237590A (ja) 音声効果付与装置
JP3949828B2 (ja) 音声変換装置及び音声変換方法
JP3907838B2 (ja) 音声変換装置及び音声変換方法
JP3540160B2 (ja) 音声変換装置及び音声変換方法
JP3934793B2 (ja) 音声変換装置及び音声変換方法
JP2004287350A (ja) 音声変換装置、音声効果付与装置、及びプログラム
JP2000010599A (ja) 音声変換装置及び音声変換方法

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20190528