KR20230168672A - 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치 - Google Patents

웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치 Download PDF

Info

Publication number
KR20230168672A
KR20230168672A KR1020220069239A KR20220069239A KR20230168672A KR 20230168672 A KR20230168672 A KR 20230168672A KR 1020220069239 A KR1020220069239 A KR 1020220069239A KR 20220069239 A KR20220069239 A KR 20220069239A KR 20230168672 A KR20230168672 A KR 20230168672A
Authority
KR
South Korea
Prior art keywords
section
sound source
string
repetitive waveform
sound
Prior art date
Application number
KR1020220069239A
Other languages
English (en)
Inventor
이재영
Original Assignee
현대모비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대모비스 주식회사 filed Critical 현대모비스 주식회사
Priority to KR1020220069239A priority Critical patent/KR20230168672A/ko
Publication of KR20230168672A publication Critical patent/KR20230168672A/ko

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q5/00Arrangement or adaptation of acoustic signal devices
    • B60Q5/005Arrangement or adaptation of acoustic signal devices automatically actuated
    • B60Q5/008Arrangement or adaptation of acoustic signal devices automatically actuated for signaling silent vehicles, e.g. for warning that a hybrid or electric vehicle is approaching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/04Sound-producing devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60YINDEXING SCHEME RELATING TO ASPECTS CROSS-CUTTING VEHICLE TECHNOLOGY
    • B60Y2200/00Type of vehicle
    • B60Y2200/90Vehicles comprising electric prime movers
    • B60Y2200/91Electric vehicles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60YINDEXING SCHEME RELATING TO ASPECTS CROSS-CUTTING VEHICLE TECHNOLOGY
    • B60Y2306/00Other features of vehicle sub-units
    • B60Y2306/11Noise generation, e.g. drive noise to warn pedestrians that an electric vehicle is approaching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

본 발명은 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치에 관한 것으로서, 본 개시의 일 측면에 따른 전기차량을 위한 유사 엔진음 생성 방법은 문자열 음원을 입력받는 단계와 음원 변동 구간을 탐색하는 단계와 상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 단계와 상기 추출된 반복 파형에 기반하여 문자열 유사 엔짐음을 출력하는 단계를 포함할 수 있다.

Description

웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치{Method for generating wavetable-based string output pseudo-engine sound and apparatus therefor}
본 발명은 전기차를 위한 유사 엔진음 생성 기술에 관한 것으로서, 상세하게, 웨이브테이블 기반으로 문자열을 출력하는 유사 엔진음 생성 기술에 관한 것이다.
전기 자동차는 실제 엔진 소리가 없으므로 운전자는 자동차가 어느 정도의 속도로 달리고 있는지 청각적으로 인식하기 어려운 문제점이 있다.
전기차 액티브 사운드 디자인 (electric vehicle Active Sound Design, e-ASD) 시스템은 차량의 주행 속도, 모터의 토크 그리고 가속 페달 가압 상태에 따라 운전자에게 몰입감을 주는 소리를 차량 내/외부로 생성하기 위하여 고안되었다.
일반적으로 e-ASD 시스템에 사용되는 방법은 웨이브테이블(wavetable) 방식이다.
웨이브테이블 기반의 e-ASD는 단순한 디지털 사인파 생성 방법과 유사하지만 보다 일반적인 파형을 반복 재생하여 연속음을 생성하며, 도 1에 보여지는 바와 같이 다양한 웨이브테이블 파형을 중첩함으로써 악보와 같은 준주기함수 생성이 가능하다.
웨이블테이블을 사용하면 음원을 PCM(Pulse Code Modulation) 샘플링한 것과 대비하여 데이터 양이 작아 메모리 크기를 줄일 수 있는 장점은 있으나, 역 이산 푸리에 변환(Inverse Discrete Fourier Transform)과 같은 변환 과정이 포함되지 않으므로 실시간 연산이 가능한 장점을 가진다.
e-ASD 시스템은 엔진음이 없는 전기차에 새롭게 설계된 소리를 주행 상태에 맞춰서 차량 내부에 출력하는 시스템이므로 엔진음 범주에서 벗어난 소리를 재생해도 크게 문제가 되지 않는다.
일반적으로 e-ASD 시스템에서 생성되는 소리는 크게 엔진음과 사이버음 두 종류로 구분될 수 있다.
하지만, 엔진음과 사이버음으로는 운전자의 주행의 재미를 주고 운전 몰임감을 높이는 데에 한계가 있다.
본 개시의 목적은 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 것이다.
본 개시의 다른 목적은 중복 의미 전달 없이 음원 분석을 통해 보다 몰임감 있는 문자열 기반의 유사 엔진음으로 출력하는 것이 가능한 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 것이다.
본 개시의 또 다른 목적은 문자열 음원의 주파수와 에너지가 평탄한 모음 구간을 추출하고, 추출된 모음 구간을 보다 세분화하여 에너지 변화량이 작은 구간을 반복 파형으로 결정함으로써 단일 의미 전달이 가능하고 문자열 음원을 자연스럽게 늘리는 것이 가능한 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 것이다.
본 개시의 또 다른 목적은 ASP(Accelerator Pedal Sensor) 값에 기반하여 문자열 유사 엔진음의 출력 여부를 판단하고, RPM(Revolution Per Minute) 변화에 적응적으로 유사 엔진음의 피치(Pitch) 조정함으로써 보다 몰임감있는 문자열 기반 유사 엔진음을 출력하는 것이 가능한 e-ASD 시스템을 제공하는 것이다.
본 개시의 또 다른 목적은 전기차의 주행 상태에 따라 다양한 문자열이 매핑된 유사 엔진음을 출력함으로써, 확장성이 높고 운전의 재미 및 몰임감을 향상시키는 것이 가능한 e-ASD 시스템을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 개시의 일 측면에 따른 전기차량을 위한 유사 엔진음 생성 방법은 문자열 음원을 입력받는 단계와 음원 변동 구간을 탐색하는 단계와 상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 단계와 상기 추출된 반복 파형에 기반하여 문자열 유사 엔짐음을 출력하는 단계를 포함할 수 있다.
실시 예로, 상기 음원 변동 구간을 탐색하는 단계는 상기 입력된 음원을 구간으로 분리하는 단계와 사전 정의된 복수의 선정 조건에 기반하여 상기 분리된 구간 중 상기 음원 변동 구간을 결정하는 단계를 포함할 수 있다.
실시 예로, 상기 복수의 선정 조건은 상기 구간 별 계산된 에너지 레벨에 기반하여 선정하는 제1 선정 조건, 상기 구간 별 계산된 에너지 변화량에 기반하여 선정하는 제2 선정 조건 및 상기 구간 별 계산된 멜-스펙트로그램 변화량에 기반하여 선정하는 제3 선정 조건을 포함할 수 있다.
실시 예로, 상기 방법은 상기 제1 내지 3 선정 조건을 모두 만족하는 구간을 잠정적 후보 구간으로 선택하는 단계와 상기 선택된 잠정적 후보 구간 중 가장 긴 구간을 최종 음원 변동 구간으로 결정하는 단계를 더 포함할 수 있다.
실시 예로, 상기 제1 선정 조건에 따라 상기 구간 별 계산된 에너지가 제1 임계치보가 큰 구간이 선정되고, 상기 제2 선정 조건에 따라 상기 구간 별 계산된 에너지 변화량이 제2 임계치보가 작은 구간이 선정되고, 상기 제3 선정 조건에 따라 상기 구간 별 계산된 멜-스펙트로그램의 변화량이 제3 임계치보가 작은 구간이 선정될 수 있다.
실시 예로, 상기 음원 변동 구간은 상기 문자열의 모음 구간으로 결정될 수 있다.
실시 예로, 상기 문자열 음원은 반복 재생되지 않을 수 있다.
실시 예로, 상기 탐색된 음원 변동 구간에 대한 반복 파형을 추출하는 단계는 상기 탐색된 음원 변동 구간을 세부 구간으로 분리하는 단계와 상기 세부 구간 별 에너지 변화량이 세부 에너지 변화량 임계값보다 작은 세부 구간 중 가장 긴 세부 구간을 선정하는 단계와 상기 선정된 세부 구간에 대한 반복 파형 시작점 및 반복 파형 종료점을 결정하는 단계를 포함하고, 상기 반복 파형 시작점 및 상기 반복 파형 종료점에 기반하여 상기 반복 파형이 추출될 수 있다.
실시 예로, 상기 반복 파형 시작점은 상기 선정된 세부 구간에 대한 자기 상관 값이 최대가 되는 지점으로 결정될 수 있다.
실시 예로, 상기 반복 파형 종료점은 상기 선정된 세부 구간 내 선택된 제1 표본과 제2 표본의 차이 값에 기반하여 결정될 수 있다.
실시 예로, 상기 방법은 APS(Accelerator Pedal Sensor) 센싱 값 및 RPM(Revolution Per Minute) 센싱 값을 입력받는 단계를 더 포함하고, 상기 APS 센싱 값에 기반하여 상기 문자열 유사 엔진음의 출력 여부가 결정되고, 상기 RPM 센싱 값에 기반하여 상기 출력되는 문자열 유사 엔진음의 피치(pitch)가 조정될 수 있다.
실시 예로, 상기 방법은 상기 APS 센싱 값이 APS 임계값보다 큰 것에 기반하여 상기 문자열 음원 중 상기 반복 파형 이전까지의 음원을 상기 RPM 센싱 값에 따라 상기 피치를 조정하여 재생하는 단계와 RPM 증가량이 RPM 임계값보다 큰 것에 기반하여 상기 피치를 상향 조정하여 상기 반복 파형을 재생하는 단계를 더 포함할 수 있다.
실시 예로, 상기 방법은 상기 RPM 증가량이 상기 RPM 임계값 이하인 것에 기반하여 현재 피치 값을 최종 피치로 설정하는 단계와 상기 반복 파형 이후부터 상기 문자열 음원의 끝까지 상기 최종 피치로 재생하는 단계를 더 포함할 수 있다.
본 개시의 다른 측면에 따르면, 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서가 전기차량을 위한 유사 엔진음 생성 동작들을 수행하게 하는 명령을 포함하는 적어도 하나의 컴퓨터 프로그램을 저장하는 비휘발성 컴퓨터 판독 가능 저장 매체에 있어서, 상기 동작들은 문자열 음원을 입력받는 단계와 음원 변동 구간을 탐색하는 단계와 상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 단계와 상기 추출된 반복 파형에 기반하여 상기 문자열 유사 엔진음을 출력하는 단계를 포함할 수 있다.
본 개시의 또 다른 측면에 따른 전기차량을 위한 문자열 유사 엔진음 생성 장치는 문자열 음원을 입력받는 문자열 음원 입력부와 음원 변동 구간을 탐색하는 음원 변동 구간 탐색부와 상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 반복 파형 추출부와 상기 추출된 반복 파형에 기반하여 문자열 유사 엔진음을 생성하는 문자열 유사 엔진음 생성부를 포함할 수 있다.
실시 예로, 상기 음원 변동 구간 탐색부는 상기 입력된 음원을 구간으로 분리하고, 사전 정의된 복수의 선정 조건에 기반하여 상기 분리된 구간 중 음원 변동 구간을 결정하되, 상기 음원 변동 구간은 상기 문자열의 모음 구간으로 결정될 수 있다.
실시 예로, 상기 복수의 선정 조건은 상기 구간 별 계산된 에너지 레벨에 기반하여 선정하는 제1 선정 조건과 상기 구간 별 계산된 에너지 변화량에 기반하여 선정하는 제2 선정 조건과 상기 구간 별 계산된 멜-스펙트로그램 변화량에 기반하여 선정하는 제3 선정 조건을 포함할 수 있다.
실시 예로, 상기 음원 변동 구간 탐색부는 상기 제1 내지 3 선정 조건을 모두 만족하는 구간을 잠정적 후보 구간으로 선택하고, 상기 선택된 잠정적 후보 구간 중 가장 긴 구간을 최종 음원 변동 구간으로 결정할 수 있다.
실시 예로, 상기 음원 변동 구간 탐색부가 상기 제1 선정 조건에 따라 상기 구간 별 계산된 에너지가 제1 임계치보가 큰 구간을 선정하고, 상기 제2 선정 조건에 따라 상기 구간 별 계산된 에너지 변화량이 제2 임계치보가 작은 구간을 선정하고, 상기 제3 선정 조건에 따라 상기 구간 별 계산된 멜-스펙트로그램의 변화량이 제3 임계치보가 작은 구간을 선정할 수 있다.
실시 예로, 상기 반복 파형 추출부가 상기 탐색된 음원 변동 구간을 세부 구간으로 분리하고, 상기 세부 구간 별 에너지 변화량이 세부 에너지 변화량 임계값보다 작은 세부 구간 중 가장 긴 세부 구간을 선정하고, 상기 선정된 세부 구간에 대한 반복 파형 시작점 및 반복 파형 종료점을 결정하고, 상기 반복 파형 시작점 및 상기 반복 파형 종료점에 기반하여 상기 반복 파형을 추출할 수 있다.
실시 예로, 상기 반복 파형 시작점은 상기 선정된 세부 구간에 대한 자기 상관 값이 최대가 되는 지점으로 결정될 수 있다.
실시 예로, 상기 반복 파형 종료점은 상기 선정된 세부 구간 내 선택된 제1 표본과 제2 표본의 차이 값에 기반하여 결정될 수 있다.
실시 예로, 상기 장치는 APS(Accelerator Pedal Sensor) 센싱 값에 기반하여 상기 문자열 유사 엔진음의 출력 여부를 결정하는 활성 조건 판단부를 더 포함하고, 상기 문자열 유사 엔진음 생성부가 RPM(Revolution Per Minute) 센싱 값에 기반하여 상기 출력되는 문자열 유사 엔진음의 피치(pitch)를 조정할 수 있다.
실시 예로, 상기 문자열 유사 엔진음 생성부가 상기 APS 센싱 값이 APS 임계값보다 큰 것에 기반하여 상기 문자열 음원 중중 상기 반복 파형 이전까지의 음원을 상기 RPM 센싱 값에 따라 상기 피치를 조정하여 재생하고, RPM 증가량이 RPM 임계값보다 큰 것에 기반하여 상기 피치를 상향 조정하여 상기 반복 파형을 재생할 수 있다.
실시 예로, 상기 문자열 유사 엔진음 생성부가 상기 RPM 증가량이 상기 RPM 임계값 이하인 것에 기반하여 현재 피치 값을 최종 피치로 설정하고, 상기 반복 파형 이후부터 상기 문자열 음원의 끝까지 상기 최종 피치로 재생할 수 있다.
본 개시에 따른 실시 예들에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시에 따른 실시 예들은 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 중복 의미 전달 없이 음원 분석을 통해 보다 몰임감 있는 문자열 기반의 유사 엔진음으로 출력하는 것이 가능한 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 문자열 음원의 주파수와 에너지가 평탄한 모음 구간을 추출하고, 추출된 모음 구간을 보다 세분화하여 에너지 변화량이 작은 구간을 반복 파형으로 결정함으로써 단일 의미 전달이 가능하고 문자열 음원을 자연스럽게 늘리는 것이 가능한 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치를 제공하는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 ASP(Accelerator Pedal Sensor) 값에 기반하여 문자열 유사 엔진음의 활성 조건 만족 여부를 판단하고, RPM(Revolution Per Minute) 변화에 적응적으로 유사 엔진음의 피치(Pitch) 조정함으로써 보다 몰임감있는 문자열 기반 유사 엔진음을 출력하는 것이 가능한 e-ASD 시스템을 제공할 수 있는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 전기차의 주행 상태에 따라 다양한 문자열이 매핑된 유사 엔진음을 출력함으로써, 확장성이 높고 운전의 재미 및 몰임감을 향상시키는 것이 가능한 e-ASD 시스템을 제공할 수 있는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 차량 제조사뿐만 아니라 일반 사용자에 의해 재미있는 엔진음 설계가 가능하므로 메타버스 등의 환경에서 사용자 참여형 서비스를 활성화시킬 수 있는 장점이 있다.
또한, 본 개시에 따른 실시 예들은 고객 맞춤형 문자열 출력 유사 엔진음을 제공할 수 있는 장점이 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
본 명세서에 첨부되는 도면은 본 발명에 대한 이해를 제공하기 위한 것으로서 본 발명의 다양한 실시형태들을 나타내고 명세서의 기재와 함께 본 발명의 원리를 설명하기 위한 것이다.
도 1은 종래 기술에 따른 웨이브테이블 기반의 유사 엔진음 생성 방법을 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 웨이브테이블 기반의 문자열 출력 유사 엔진음 생성 방법을 설명하기 위한 도면이다.
도 3은 본 개시의 일 실시 예에 따른 문자열 유사 엔진음 생성 장치의 구조를 설명하기 위한 블록도이다.
도 4는 본 개시의 실시 예에 따른 음색 변동 구간 탐색 방법을 설명하기 위한 순서도이다.
도 5는 본 개시의 실시 예에 따른 입력된 음원 신호에서 음색 변동을 위한 후보 구간을 선택하는 절차를 설명하기 위한 도면이다.
도 6은 본 개시의 실시 예에 따른 반복 파형 추출 방법을 설명하기 위한 순서도이다.
도 7은 본 개시의 실시 예에 따른 반복 파형 추출 과정을 설명하기 위한 도면이다.
도 8은 본 개시의 실시 예에 따른 문자열 유사 엔진음 생성 방법을 설명하기 위한 순서도이다.
도 9는 본 개시의 실시 예에 따른 문자열 유사 엔진음 생성 방법에 따른 실험 결과를 보여준다.
이하, 본 발명의 일부 실시 예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시 예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시 예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명의 실시 예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 개시의 다양한 예에서, “/” 및 “,”는 “및/또는”을 나타내는 것으로 해석되어야 한다. 예를 들어, “A/B”는 “A 및/또는 B”를 의미할 수 있다. 나아가, “A, B”는 “A 및/또는 B”를 의미할 수 있다. 나아가, “A/B/C”는 “A, B 및/또는 C 중 적어도 어느 하나”를 의미할 수 있다. 나아가, “A, B, C”는 “A, B 및/또는 C 중 적어도 어느 하나”를 의미할 수 있다.
본 개시의 다양한 예에서, “또는”은 “및/또는”을 나타내는 것으로 해석되어야 한다. 예를 들어, “A 또는 B”는 “오직 A”, “오직 B”, 및/또는 “A 및 B 모두”를 포함할 수 있다. 다시 말해, “또는”은 “부가적으로 또는 대안적으로”를 나타내는 것으로 해석되어야 한다.
이하, 도 2 내지 도 9를 참조하여, 본 발명의 실시 예들을 구체적으로 설명하기로 한다.
도 2는 본 개시의 실시 예에 따른 웨이브테이블 기반 문자열 출력 유사 엔짐음 생성 방법을 설명하기 위한 도면이다.
전기차 운전자에게 직접적으로 주행의 재미를 주는 요소는 단순 엔진음이나 사이버음이 아닌 음악이나 다양한 문자열일 수 있다. 전기차가 가속할 때 보다 몰입감을 더하기 위하여 주행 상황에 따라 특정 문자열이 포함된 음원을 재생하면 음색이 증가하고 보다 다양한 유사 엔진 효과음을 생성할 수 있다.
예를들어, 도 2에 도시된 바와 같이, 가속 페달을 밟아서 토크가 상승하면 “점~~~~~핑”과 같은 문자열이 반복 출력되도록 문자열 출력 유사 엔진음을 생성할 수 있다.
하지만, 도 2에 도시된 일반적인 웨이브테이블 기반의 e-ASD 시스템은 가속 페달을 밟아 토크가 상승함에 따라 문자열 출력 유사 엔진음 활성 조건이 만족되면 길이가 짧은 문자열 음원-예를 들면, "점핑"-을 일정 주기로 반복 재생하므로 중복 의미 전달 현상이 발생하는 문제점이 있다. 이는 운전 몰입감을 감소시키는 요인으로 작용할 수 있다.
도 3은 본 개시의 일 실시 예에 따른 문자열 유사 엔진음 생성 장치의 구조를 설명하기 위한 블록도이다.
도 3을 참조하면, 유사 엔진음 생성 시스템(300)은 크게 문자열 유사 엔진음 생성 장치(310), APS(Accelerator Pedal Sensor, 320), RPM(Revolution Per Minute) 측정 센서(330), 마이크(340) 및 스피커(350)을 포함하여 구성될 수 있다.
문자열 유사 엔진음 생성 장치(310)는 문자열 음원 입력부(311), 음색 변동 구간 탐색부(312), 반복 파형 추출부(313), 활성 조건 판단부(314) 및 문자열 유사 엔진음 생성부(315)를 포함하여 구성될 수 있다.
문자열 음원 입력부(311)는 마이크(340)를 통해 입력되거나 또는 메모리(미도시)에 저장된 문자열 음원을 입력받을 수 있다.
음색 변동 구간 탐색부(312)는 입력된 음원을 분석하여 음색 변동 구간을 탐색할 수 있다.
반복 파형 추출부(313)는 음색 변동 구간 탐색부(312)에 의해 탐색된 음색 변동 구간으로부터 준주기 파형의 주기성을 가지는 파형을 추출할 수 있다.
일반적으로 음색 변동 구간 탐색부(312)에 의해 탐색된 에너지와 주파수가 평탄한 음색 변동 구간은 비교적 긴 시간 간격-예를 들면, 30ms-으로 탐색된 것이므로, 준주기 파형의 주기성을 강화하기 위해서는 음색 변동 구간에서 짧게 반복될 파형을 추출해야 한다. 이를 위해, 반복 파형 추출부(313)는 탐색된 음색 변동 구간을 다시 짧은 구간, 즉 세부 구간-예를 들면, 2ms-으로 잘라서 세부 에너지 변화율을 계산할 수 있다. 이후, 반복 파형 추출부(313)는 세부 에너지 변화율이 세부 에너지 변화량 임계값보다 작은 적어도 하나의 잠정적 반복 파형 추출 구간을 식별할 수 있다. 반복 파형 추출부(313)는 식별된 적어도 하나의 잠정적 반복 파형 추출 구간 중 가장 긴 구간을 최종 반복 파형 추출 구간으로 결정할 수 있다.
반복 파형 추출부(313)는 최종 반복 파형 추출 구간에 대해 자기 상관(auto correlation) 계산을 수행하고, 자기 상관 값이 최대가 되는 지점을 반복 파형 시작점으로 결정할 수 있다.
반복 파형은 음원 재생이 완료된 후 다시 첫 부분이 재생되므로 반복 과정에서 잡음 발생을 줄이려면 반복해서 붙였을 때 자연스럽게 이어지도록 반복 파형의 종료점이 선택되어야 한다.
이를 위해, 반복 파형 추출부(313)는 반복 파형 시작점 이전 N개의 제1 표본을 선택하고, 결정된 최종 반복 파형 추출 구간의 M번째 샘플 이후부터 이동하면서 N개의 제2 표본을 선택할 수 있다.
반복 파형 추출부(313)는 제1 표본과 제2 표본 차이가 최소가 되는 시간까지를 반복 파형으로 선택할 수 있다. 즉, 제1 표본과 제2 표본이 가장 유사한 시간을 반복 파형 종료점으로 선택할 수 있다.
결과적으로, 반복 파형 추출부(313)는 최종 반복 파형 추출 구간에서 결정된 반복 파형 시작점과 반복 파형 종료점을 기반으로 반복 파형을 추출할 수 있다.
활성 조건 판단부(314)는 APS(320) 센싱 값에 기반하여 문자열 출력 조건이 만족되었는지 판단할 수 있다. 일 예로, 활성 조건 판단부(314)는 APS(320)로부터 획득된 센싱 값의 증가량이 임계값보다 큰 경우, 문자열 출력 조건이 만족된 것으로 판단하여 문자열 출력을 활성화시킬 수 있다.
문자열 유사 엔진음 생성부(315)는 RPM 측정 센서(330)로부터의 센싱 값에 기반하여 문자열 음원의 피치를 조정할 수 있다.
문자열 유사 엔진음 생성부(315)는 입력된 문자열 음원에서 반복 파형 전까지의 음원을 선택하고, 현재 PRM 센싱 값에 맞게 피치를 조정하여 선택된 음원을 스피커(350)를 통해 출력할 수 있다.
이후, 문자열 유사 엔진음 생성부(315)는 RPM 센싱 값에 맞게 피치를 조정하여 반복 파형을 스피커(350)를 통해 출력할 수 있다.
반복 파형 출력 중 RPM 증가량이 RPM 증가량 임계값보다 작은 경우, 문자열 유사 엔진음 생성부(315)는 현재 설정된 피치 값을 최종 피치 값으로 설정하여 반복 파형 이후부터 마지막 문자열까지의 음원 파형을 스피커(350)를 통해 출력할 수 있다.
반면, 반복 파형 출력 중 RPM 증가량이 RPM 증가량 임계값보다 큰 경우, 문자열 유사 엔진음 생성부(315)는 피치 값을 증가시켜 반복 파형을 재생시킬 수 있다.
도 4는 본 개시의 실시 예에 따른 음색 변동 구간 탐색 방법을 설명하기 위한 순서도이다.
이하 설명의 편의를 위해, 상기 도 3의 문자열 유사 엔진음 생성 장치(310)를 ‘장치(310)’와 혼용하여 설명하기로 한다.
도 4를 참조하면, 장치(310)는 문자열 음원을 입력받을 수 있다(S401).
장치(310)는 입력된 음원을 구간 별 분리할 수 있다(S402).
장치(310)는 각 구간 별 에너지를 계산할 수 있다(S403). 여기서, 각 구간 별 에너지는 하기 도 5에서 설명될 수학식 1에 의해 계산될 수 있다.
장치(310)는 구간 별 계산된 에너지가 제1 임계치보다 큰 구간을 선정할 수 있다(S404). 이하 설명의 편의를 위해, 404 단계의 선정 조건을 제1 선정 조건이라 명한다.
장치(310)는 각 구간 별 에너지 변화량을 계산할 수 있다(S405). 여기서, 각 구간 별 에너지는 하기 도 5에서 설명될 수학식 2에 의해 계산될 수 있다.
장치(310)는 계산된 에너지 변화량이 제2 임계치보다 작은 구간을 선정할 수 있다(S406). 이하 설명의 편의를 위해, 404 단계의 선정 조건을 제2 선정 조건이라 명한다.
장치(310)는 입력된 문자열 음원에 대한 멜-스펙트로그램(Mel-Spectrogram)을 생성할 수 있다(S407).
여기서, 멜-스펙트로그램은 주파수 특성이 시간에 따라 달라지는 오디오를 분석하기 위한 특징 추출 기법으로, 음의 높낮이인 피치(pitch)에서 발견한 사람의 음을 인지하는 기준(threshold)을 반영한 스케일(scale) 변환 함수인 로그 스케일의 멜-스케일(Mel-Scale)로 표현된 스펙트로그램이다.
입력된 음성 신호를 짧은 단위로 프레이밍하고 윈도우를 씌워 이를 푸리에 변환해서 연결하면 스팩트로그램이 생성된다. 즉, 스펙트로그램은 입력된 음성 신호에 대한 STFT(Short Time Fourier Transform)을 통해 획득될 수 있다.
인간의 고막은 주파수 낮을수록 민감하게 느끼고, 주파수가 높을수록 덜 민감하게 느낀다.
인간이 특정 주파수의 음성을 인식하기 위해서는 해당 주파수에 상응하는 임계치 이상의 멜-스케일을 가져야 한다.
스펙트로그램에 멜-필터뱅크(Mel filterbank)를 적용하여 멜-스펙트로그램이 획득될 수 있다.
장치(300)는 멜-스펙트로그램의 변화량을 계산할 수 있다(S408).
장치(300)는 멜-스펙트로그램의 변화량이 주파수 변화량 임계값보다 작은 구간을 선정할 수 있다(S409). 이하 설명의 편의를 위해, 409 단계의 선정 조건을 제3 선정 조건이라 명한다.
장치(300)는 제1 내지 3 선정 조건을 모두 만족시키는 구간을 잠정적 후보 구간으로 선정할 수 있다(S410)..
장치(300)는 잠정적 후보 구간 중 가장 긴 구간을 가지는 후보 구간을 최종 음색 변동 구간으로 결정할 수 있다(S411).
도 5는 본 개시의 실시 예에 따른 입력된 음원 신호에서 음색 변동을 위한 후보 구간을 선택하는 절차를 설명하기 위한 도면이다.
도 5를 참조하면, 도면 번호 520에 도시된 바와 같이, 문자열 유사 엔진음 생성 장치 (310)는 입력된 전체 음원 신호(Audio Signal, 510)에 대한 각 구간 별 에너지 레벨을 측정할 수 있다. 일 예로, 에너지 레벨 측정을 위한 각 구간은 30ms로 정의될 수 있으나, 이는 하나의 실시 예에 불과하며, 당업자의 설계에 따라 그보다 길거나 짧은 구간으로 정의될 수도 있다.
여기서, 입력된 전체 음원 신호에 대한 각 구간 별 에너지 레벨은 아래 수학식 1에 의해 계산될 수 있다.
Figure pat00001
여기서 x는 입력된 오디오 신호, k는 샘플 인덱스이며 N은 샘플수로 간격과 샘플링 주파수를 곱한 값으로 정의될 수 있다.
따라서 계산된 에너지 값이 소정 에너지 임계값보다 클 경우, 해당 구간에 음성 신호가 존재하는 것으로 판단될 수 있다.
음정 변경이 가능한 구간은 에너지가 일정해야 하므로, 각 구간 별 에너지 변화량(e’)을 구해서 소정 에너지 변화량 임계값보다 작은 구간이 음색 변경이 가능한 모음 구간 후보으로 판단될 수 있다.
문자열 유사 엔진음 생성 장치(310)는 도면 번호 530 도시된 바와 같이, 각 구간 별 에너지 레벨의 변화량을 측정할 수 있다.
여기서, 각 구간 별 에너지 레벨의 변화량은 아래 수학식 2에 의해 계산될 수 있다.
Figure pat00002
일반적으로 모음은 안정된 평탄부를 가지므로 주파수 변화량이 작다.
따라서, 문자열 유사 엔진음 생성 장치(310)는 사람의 귀에 들리는 주파수 변화를 확인하기 위하여 멜-스펙트로그램(Mel Spectrogram)(S)을 구한 후 아래 수학식 3에 의해 시간에 따른 멜-스펙트로그램의 주파수 변화량(S')을 산출할 수 있다.
Figure pat00003
문자열 유사 엔진음 생성 장치(310)는 멜-스펙트로그램의 주파수 변화량이 주파수 변화량 임계값보다 작은 안정된 구간을 모음 후보 구간으로 판단하여 선정할 수 있다. 여기서 Nmel은 사용된 필터 뱅크(filter bank)의 개수이다.
상술한 도 4의 실시 예에 따른 음색 변동 구간 탐색 방법에서 설명한 바와 같이, 수학식 1 내지 3의 연산 결과에 각각 소정 임계값을 적용하여 제1 내지 3 선정 과정이 수행되고, 제1 내지 3 선정 과정을 통해 모두 선정된 구간이 잠재적 후보 구간으로 결정될 수 있다. 이때, 명확한 음절 소리 생성을 위하여 최종 모음으로 추출되는 구간은 잠재적 후보 구간 중 길이가 가장 긴 구간으로 선택될 수 있다.
도 5를 참조하면, 잠재적 후보로 선정된 제1 후보 구간 및 제2 후보 구간 중 길이가 긴 제1 후보 구간이 음색 변동을 위한 구간으로 결정될 수 있다.
문자열 소리의 경우, 소리를 늘릴 때 모음 부분이 늘어난다. 예를 들어 “쩌어엄핑” 소리 원음을 늘릴 경우, 자음이 속한 음절인 “쩌”는 반복할 경우 “쩌쩌쩌쩌어엄핑”이 되므로 소리가 늘어나지 않고 반복된다고 생각되지만, 모음인“어”의 경우에는 “쩌어어어어엄핑”이 되므로 자연스럽게 소리가 늘어난 것처럼 들리게 된다. 따라서 사용자 입력된 문자열 오디오 신호 중에서 모음이 속한 시간 영역을 구분하여 잘라낼 수 있다면, 문자열 소리를 자연스럽게 늘릴 수 있다. 일반적으로 모음 구간은 도면 번호 520에 도시된 바와 같이, 에너지가 크며, 도면 번호 530에 도시된 바와 같이, 비교적 길고 안정된 평탄부를 구성한다.
도 6은 본 개시의 실시 예에 따른 반복 파형 추출 방법을 설명하기 위한 순서도이다.
도 6을 참조하면, 장치(300)는 상술한 도 4 내지 5에서 결정된 음색 변동 구간의 음원을 입력받을 수 있다(S601).
장치(300)는 음색 변동 구간의 음원을 세부 구간으로 분리할 수 있다(S602).
장치(300)는 각 세부 구간 별 에너지를 계산할 수 있다(S603). 여기서, 각 세부 구간 별 에너지는 상술한 수학식 1에 의해 계산될 수 있다.
장치(300)는 각 세부 구간 별 에너지 변화량을 계산할 수 있다(S604). 여기서, 각 세부 구간 별 에너지는 상술한 수학식 2에 의해 계산될 수 있다.
장치(300)는 에너지 변화량이 소정 세부 에너지 변화량 임계값보다 작은 구간들 중 가장 긴 구간을 선정할 수 있다(S605).
장치(300)는 선정된 구간에서의 자기 상관을 계산하고, 자기 상관 값이 최대가 되는 지점을 반복 파형 시작점으로 결정할 수 있다(S606 내지 S607).
장치(300)는 반복 파형 시작점 이전 N개의 연속된 제1 표본을 선택할 수 있다(S608).
장치(300)는 선정된 구간의 M번째 샘플 이후부터 이동하면서 N개의 연속된 제2 표본을 선택할 수 있다(S609).
장치(300)는 제1 표본과 제2 표본의 차이 값에 기반하여 반복 파형 종료점을 결정할 수 있다(S610). 일 예로, 장치(300)는 제1 표본과 제2 표본의 차이 값이 기준치 이하인 영역의 끝점을 반복 파형 종료점으로 결정할 수 있다. 즉, 장치(300)는 제1 표본과 제2 표본이 가장 유사한 음원 구간을 반복 파형 구간으로 결정할 수 있다.
장치(300)는 결정된 반복 파형 시작점과 반복 파형 종료점에 기반하여 반복 파형을 추출할 수 있다(S611).
도 7은 본 개시의 실시 예에 따른 반복 파형 추출 과정을 설명하기 위한 도면이다.
도 7을 참조하면, 장치(300)는 음색 변동 구간의 음원 신호를 세부 구간으로 분리할 수 있다(S710). 일 예로, 세부 구간은 2ms로 정의될 수 있다.
장치(300)는 각 세부 구간 별 에너지를 계산할 수 있다(S720). 여기서, 각 세부 구간 별 에너지는 상술한 수학식 1에 의해 계산될 수 있다.
장치(300)는 각 세부 구간 별 에너지 변화량을 계산할 수 있다(S730). 여기서, 각 세부 구간 별 에너지는 상술한 수학식 2에 의해 계산될 수 있다. 이때, 장치(300)는 에너지 변화량이 소정 세부 에너지 변화량 임계값(731)보다 작은 구간들 중 가장 긴 구간을 선정할 수 있다.
장치(300)는 선정된 구간에서의 자기 상관을 계산하고, 자기 상관 값이 최대가 되는 지점을 반복 파형 시작점(741)으로 결정할 수 있다(S740). 또한, 장치(300)는 음원 변동 구간 내 두 표본-예를 들면, 제1 표본과 제2 표본-을 선택하고, 선택된 두 표본의 차이 값에 기반하여 반복 파형 종료점을 결정할 수 있다. 일 예로, 장치(300)는 제1 표본과 제2 표본의 차이 값이 최소가 되는 영역까지를 반복 파형 종료점으로 결정할 수 있다.
반복 파형은 음원 재생이 완료된 후 다시 첫 부분이 재생되므로 반복 과정에서 잡음 발생을 줄이려면 반복해서 붙였을 때 자연스럽게 이어지도록 반복 파형의 종료점이 선택되어야 한다. 따라서 세부 구간의 끝 부분에 특정 영역을 설정한 후 아래 수학식 4와 같이 해당 영역에서 연속적으로 n개의 샘플을 선택하여 반복 파형 시작점 이전의 N개 샘플과 가장 유사한 시간 까지를 반복 파형으로 선택한다.
여기서,
Figure pat00005
는 최소 값을 가질 때의 m값을 의미하며, L은 세부 구간의 길이를 의미한다. 그리고, M은 주기성을 강화하기 위한 탐색 시작점을 의미하고, end는 반복 파형 종료점을 의미한다.
장치(300)는 결정된 반복 파형 시작점과 반복 파형 종료점에 기반하여 반복 파형을 추출할 수 있다(S750).
도 8은 본 개시의 실시 예에 따른 문자열 유사 엔진음 생성 방법을 설명하기 위한 순서도이다.
도 8의 실시 예에서는 상술한 문자열 음원에 대한 음원 변동 구간 탐색 및 반복 파형 추출이 완료된 것으로 가정한다.
도 8을 참조하면, 장치(300)는 APS 센싱 값 및 RPM 센싱 값을 입력받을 수 있다(S801).
장치(300)는 APS 증가량을 계산하고, APS 증가량이 APS 임계값보다 큰지 판단할 수 있다(S802).
판단 결과, APS 증가량이 APS 임계값보다 크면, 장치(300)는 문자열 유사 엔진음 출력을 활성화시킬 수 있다.
장치(300)는 문자열 유사 엔진음 출력이 활성화된 경우, 문자열 음원 파형 중 반복 파형 이전까지의 음원 파형을 선택할 수 있다(S803).
장치(300)는 선택된 음원 파형을 현재 RPM 센싱 값에 맞게 피치를 조정하여 재생시킬 수 있다(S804).
장치(300)는 현재 RPM 센싱 값에 맞게 피치를 조정하여 반복 파형을 재생을 시작할 수 있다(S805).
장치(300)는 반복 파형 재생 중 RPM 증가량을 계산하고, RPM 증가량이 RPM 임계값보다 큰지 판단할 수 있다(S806).
판단 결과, RPM 증가량이 RPM 임계값보다 크면, 장치(300)는 RPM 증가량에 따라 피치를 증가시켜 반복 파형을 재생할 수 있다.
반면, 반복 파형 재생 중 RPM 증가량이 RPM 임계값 이하이면, 장치는 현재 피치를 최종 피치로 설정한 후 반복 파형 이후부터 문자열 음원 파형의 끝까지 재생할 수 있다(S807 내지 S808).
도 9는 본 개시의 실시 예에 따른 문자열 유사 엔진음 생성 방법에 따른 실험 결과를 보여준다.
도 9를 참조하면, 도면 번호 910은 음색 변동 구간 탐색을 수행하지 않은 문자열 음원 신호 파형 및 멜-스펙토그램을 보여준다.
도면 번호 920은 음색 변동 구간 탐색을 통해 추출된 반복 파형에 대한 피치 시프트가 적용된 문자열 음원 신호 파형 및 멜-스펙토그램을 보여준다.
본 명세서에 개시된 실시 예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리 및/또는 스토리지)에 상주할 수도 있다.
예시적인 저장 매체는 프로세서에 커플링되며, 그 프로세서는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (25)

  1. 전기차량을 위한 유사 엔진음 생성 방법에 있어서 ,
    문자열 음원을 입력받는 단계;
    음원 변동 구간을 탐색하는 단계;
    상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 단계; 및
    상기 추출된 반복 파형에 기반하여 문자열 유사 엔진음을 출력하는 단계;
    를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 음원 변동 구간을 탐색하는 단계는,
    상기 입력된 음원을 구간으로 분리하는 단계; 및
    사전 정의된 복수의 선정 조건에 기반하여 상기 분리된 구간 중 상기 음원 변동 구간을 결정하는 단계
    를 포함하는, 방법.
  3. 제2항에 있어서,
    상기 복수의 선정 조건은,
    상기 구간 별 계산된 에너지 레벨에 기반하여 선정하는 제1 선정 조건;
    상기 구간 별 계산된 에너지 변화량에 기반하여 선정하는 제2 선정 조건; 및
    상기 구간 별 계산된 멜-스펙트로그램 변화량에 기반하여 선정하는 제3 선정 조건
    을 포함하는, 방법.
  4. 제3항에 있어서,
    상기 제1 내지 3 선정 조건을 모두 만족하는 구간을 잠정적 후보 구간으로 선택하는 단계; 및
    상기 선택된 잠정적 후보 구간 중 가장 긴 구간을 최종 음원 변동 구간으로 결정하는 단계
    를 더 포함하는, 방법.
  5. 제3항에 있어서,
    상기 제1 선정 조건에 따라 상기 구간 별 계산된 에너지가 제1 임계치보가 큰 구간이 선정되고,
    상기 제2 선정 조건에 따라 상기 구간 별 계산된 에너지 변화량이 제2 임계치보가 작은 구간이 선정되고,
    상기 제3 선정 조건에 따라 상기 구간 별 계산된 멜-스펙트로그램의 변화량이 제3 임계치보가 작은 구간이 선정되는, 방법.
  6. 제1항에 있어서,
    상기 음원 변동 구간은 상기 문자열의 모음 구간으로 결정되는, 방법.
  7. 제1항에 있어서,
    상기 문자열 음원은 반복 재생되지 않는 것을 특징으로 하는, 방법.
  8. 제1항에 있어서,
    상기 탐색된 음원 변동 구간에 대한 반복 파형을 추출하는 단계는,
    상기 탐색된 음원 변동 구간을 세부 구간으로 분리하는 단계;
    상기 세부 구간 별 에너지 변화량이 세부 에너지 변화량 임계값보다 작은 세부 구간 중 가장 긴 세부 구간을 선정하는 단계; 및
    상기 선정된 세부 구간에 대한 반복 파형 시작점 및 반복 파형 종료점을 결정하는 단계
    를 포함하고, 상기 반복 파형 시작점 및 상기 반복 파형 종료점에 기반하여 상기 반복 파형이 추출되는, 방법.
  9. 제8항에 있어서,
    상기 반복 파형 시작점은 상기 선정된 세부 구간에 대한 자기 상관 값이 최대가 되는 지점으로 결정되는, 방법.
  10. 제8항에 있어서,
    상기 반복 파형 종료점은 상기 선정된 세부 구간 내 선택된 제1 표본과 제2 표본 사이의 차이 값에 기반하여 결정되는, 방법.
  11. 제1항에 있어서,
    APS(Accelerator Pedal Sensor) 센싱 값 및 RPM(Revolution Per Minute) 센싱 값을 입력받는 단계를 더 포함하고,
    상기 APS 센싱 값에 기반하여 상기 문자열 유사 엔진음의 출력 여부가 결정되고, 상기 RPM 센싱 값에 기반하여 상기 출력되는 문자열 유사 엔진음의 피치(pitch)가 조정되는, 방법.
  12. 제11항에 있어서,
    상기 APS 센싱 값이 APS 임계값보다 큰 것에 기반하여 상기 문자열 음원 중중 상기 반복 파형 이전까지의 음원을 상기 RPM 센싱 값에 따라 상기 피치를 조정하여 재생하는 단계; 및
    RPM 증가량이 RPM 임계값보다 큰 것에 기반하여 상기 피치를 상향 조정하여 상기 반복 파형을 재생하는 단계
    를 더 포함하는, 방법.
  13. 제12항에 있어서,
    상기 RPM 증가량이 상기 RPM 임계값 이하인 것에 기반하여 현재 피치 값을 최종 피치로 설정하는 단계; 및
    상기 반복 파형 이후부터 상기 문자열 음원의 끝까지 상기 최종 피치로 재생하는 단계
    를 더 포함하는, 방법.
  14. 적어도 하나의 프로세서에 의해 실행될 때, 상기 적어도 하나의 프로세서가 전기차량을 위한 유사 엔진음 생성 동작들을 수행하게 하는 명령을 포함하는 적어도 하나의 컴퓨터 프로그램을 저장하는 비휘발성 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 동작들은,
    문자열 음원을 입력받는 단계;
    음원 변동 구간을 탐색하는 단계;
    상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 단계; 및
    상기 추출된 반복 파형에 기반하여 문자열 유사 엔진음을 출력하는 단계;
    를 포함하는, 저장 매체.
  15. 전기차량을 위한 문자열 유사 엔진음 생성 장치에 있어서 ,
    문자열 음원을 입력받는 문자열 음원 입력부;
    음원 변동 구간을 탐색하는 음원 변동 구간 탐색부;
    상기 탐색된 음원 변동 구간에서 반복 파형을 추출하는 반복 파형 추출부; 및
    상기 추출된 반복 파형에 기반하여 문자열 유사 엔진음을 생성하는 문자열 유사 엔진음 생성부
    를 포함하는, 장치.
  16. 제15항에 있어서,
    상기 음원 변동 구간 탐색부는,
    상기 입력된 음원을 구간으로 분리하고, 사전 정의된 복수의 선정 조건에 기반하여 상기 분리된 구간 중 음원 변동 구간을 결정하되,
    상기 음원 변동 구간은 상기 문자열의 모음 구간으로 결정되는, 장치.
  17. 제16항에 있어서,
    상기 복수의 선정 조건은,
    상기 구간 별 계산된 에너지 레벨에 기반하여 선정하는 제1 선정 조건;
    상기 구간 별 계산된 에너지 변화량에 기반하여 선정하는 제2 선정 조건; 및
    상기 구간 별 계산된 멜-스펙트로그램 변화량에 기반하여 선정하는 제3 선정 조건
    을 포함하는, 장치.
  18. 제17항에 있어서,
    상기 음원 변동 구간 탐색부는,
    상기 제1 내지 3 선정 조건을 모두 만족하는 구간을 잠정적 후보 구간으로 선택하고, 상기 선택된 잠정적 후보 구간 중 가장 긴 구간을 최종 음원 변동 구간으로 결정하는, 장치.
  19. 제17항에 있어서,
    상기 음원 변동 구간 탐색부가,
    상기 제1 선정 조건에 따라 상기 구간 별 계산된 에너지가 제1 임계치보가 큰 구간을 선정하고,
    상기 제2 선정 조건에 따라 상기 구간 별 계산된 에너지 변화량이 제2 임계치보가 작은 구간을 선정하고,
    상기 제3 선정 조건에 따라 상기 구간 별 계산된 멜-스펙트로그램의 변화량이 제3 임계치보가 작은 구간을 선정하는, 장치.
  20. 제15항에 있어서,
    상기 반복 파형 추출부가,
    상기 탐색된 음원 변동 구간을 세부 구간으로 분리하고,
    상기 세부 구간 별 에너지 변화량이 세부 에너지 변화량 임계값보다 작은 세부 구간 중 가장 긴 세부 구간을 선정하고,
    상기 선정된 세부 구간에 대한 반복 파형 시작점 및 반복 파형 종료점을 결정하고,
    상기 반복 파형 시작점 및 상기 반복 파형 종료점에 기반하여 상기 반복 파형을 추출하는, 장치.
  21. 제20항에 있어서,
    상기 반복 파형 시작점은 상기 선정된 세부 구간에 대한 자기 상관 값이 최대가 되는 지점으로 결정되는, 장치.
  22. 제20항에 있어서,
    상기 반복 파형 종료점은 상기 선정된 세부 구간 내 선택된 제1 표본과 제2 표본의 차이 값에 기반하여 결정되는, 장치.
  23. 제15항에 있어서,
    APS(Accelerator Pedal Sensor) 센싱 값에 기반하여 문자열 음원 출력 여부를 결정하는 활성 조건 판단부를 더 포함하고,
    상기 문자열 유사 엔진음 생성부가 RPM(Revolution Per Minute) 센싱 값에 기반하여 상기 출력되는 문자열 유사 엔진음의 피치(pitch)를 조정하는, 장치.
  24. 제23항에 있어서,
    상기 문자열 유사 엔진음 생성부가,
    상기 APS 센싱 값이 APS 임계값보다 큰 것에 기반하여 상기 문자열 음원 중중 상기 반복 파형 이전까지의 음원을 상기 RPM 센싱 값에 따라 상기 피치를 조정하여 재생하고,
    RPM 증가량이 RPM 임계값보다 큰 것에 기반하여 상기 피치를 상향 조정하여 상기 반복 파형을 재생하는, 장치.
  25. 제24항에 있어서,
    상기 문자열 유사 엔진음 생성부가,
    상기 RPM 증가량이 상기 RPM 임계값 이하인 것에 기반하여 현재 피치 값을 최종 피치로 설정하고,
    상기 반복 파형 이후부터 상기 문자열 음원의 끝까지 상기 최종 피치로 재생하는, 장치.







KR1020220069239A 2022-06-08 2022-06-08 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치 KR20230168672A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220069239A KR20230168672A (ko) 2022-06-08 2022-06-08 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220069239A KR20230168672A (ko) 2022-06-08 2022-06-08 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치

Publications (1)

Publication Number Publication Date
KR20230168672A true KR20230168672A (ko) 2023-12-15

Family

ID=89125023

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220069239A KR20230168672A (ko) 2022-06-08 2022-06-08 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치

Country Status (1)

Country Link
KR (1) KR20230168672A (ko)

Similar Documents

Publication Publication Date Title
CN105788589A (zh) 一种音频数据的处理方法及装置
EP2733696A1 (en) Voice synthesizing method and voice synthesizing apparatus
JPH09500223A (ja) 多言語音声認識システム
JPH08263097A (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
KR101325722B1 (ko) 사용자 입력 노래에 대응한 악보 생성 장치와 그 방법
JP2003295880A (ja) 録音音声と合成音声を接続する音声合成システム
KR100664960B1 (ko) 음성 인식 장치 및 방법
CN107871492B (zh) 音乐合成方法和系统
JP2001272991A (ja) 音声対話方法及び音声対話装置
JPH04358200A (ja) 音声合成装置
KR20230168672A (ko) 웨이브테이블 기반 문자열 출력 유사 엔진음 생성 방법 및 그를 위한 장치
JP2010060846A (ja) 合成音声評価システム及び合成音声評価方法
JP6578544B1 (ja) 音声処理装置、および音声処理方法
JPH07191696A (ja) 音声認識装置
JP6252420B2 (ja) 音声合成装置、及び音声合成システム
JP6075314B2 (ja) プログラム,情報処理装置,及び評価方法
JP5810947B2 (ja) 発声区間特定装置、音声パラメータ生成装置、及びプログラム
Wang et al. Beijing opera synthesis based on straight algorithm and deep learning
CN113409762B (zh) 情感语音合成方法、装置、设备及存储介质
JP6406182B2 (ja) カラオケ装置、及びカラオケシステム
JP2020204755A (ja) 音声処理装置、および音声処理方法
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
KR101135198B1 (ko) 음성을 이용하여 콘텐츠를 제작하는 방법 및 장치
JP6321334B2 (ja) 信号処理装置及びプログラム
Lee et al. A simple strategy for natural Mandarin spoken word stretching via the vocoder