KR20150009777A - 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 - Google Patents

실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 Download PDF

Info

Publication number
KR20150009777A
KR20150009777A KR1020130084127A KR20130084127A KR20150009777A KR 20150009777 A KR20150009777 A KR 20150009777A KR 1020130084127 A KR1020130084127 A KR 1020130084127A KR 20130084127 A KR20130084127 A KR 20130084127A KR 20150009777 A KR20150009777 A KR 20150009777A
Authority
KR
South Korea
Prior art keywords
signal
terminal
semiconductor
present
output
Prior art date
Application number
KR1020130084127A
Other languages
English (en)
Inventor
박성진
Original Assignee
주식회사 더바인코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 더바인코퍼레이션 filed Critical 주식회사 더바인코퍼레이션
Priority to KR1020130084127A priority Critical patent/KR20150009777A/ko
Publication of KR20150009777A publication Critical patent/KR20150009777A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 검출한 감마선에 대응한 광신호를 생성하여 출력하는 복수의 섬광결정으로 이루어진 섬광결정부, 상기 광신호를 신호의 세기에 비례하는 크기의 전기적인 펄스로 변환하여 출력하는 반도체광전자증배관를 복수개로 하여 이루어진 광전소자 어레이와, 상기 광전소자 어레이의 제1 출력을 수신하고, 상기 제1 출력을 이용하여 상기 감마선을 검출한 섬광결정의 위치에 대한 정보를 생성하여 출력하는 위치정보 제공부를 포함하며, 상기 복수의 반도체광전자증배관의 애노드 단자 또는 캐소드 단자 중 하나의 단자는 하나의 공통 라인에 연결되고, 상기 공통 라인은 상기 하나의 단자에서 출력하는 신호가 합하여진 제1 신호를 생성하며, 상기 복수의 반도체광전자증배관의 애노드 단자 또는 캐소드 단자 중 다른 하나의 단자는 각각 제2 신호를 출력하여 상기 위치정보 제공부에 제공하는 것을 특징으로 하는 방사선 검출기에 관한 것이다.

Description

실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치{PHASE VOCODER}
본 발명은 모바일에 적용되는 음성출력장치에 관한 것이다.
일반적으로 모바일에서의 음성 속도 제어기술은 음성의 왜곡 현상 없이 실시간으로 상대방의 목소리가 천천히 들리도록 신호처리 기술로 일부 국가에서 노인들의 가청률 증가를 목적으로 휴대폰에 적용되어 출시된 적이 있다.
그러나 추가적인 H/W 부품으로 인한 원가상승 문제로 매우 국한된 모델에 한해서 사용되었고, 음의 늘어짐 현상으로 듣기에 부자연스러우며, 시간영역에서 음성속도 신호처리 시 노이즈가 필수로 동반되었다
본 발명이 이루고자 하는 기술적 과제는 종래의 문제점을 S/W(소프트웨어)적으로 해결하는 실시간 음성스케일 변환 방법 및 이를 이용한 음성출력장치를 제공하는 것이다.
상기 기술적 과제를 달성하기 위한 특징에 따른 본 발명은 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누는 단계, 패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾸는 단계, 주파수 영역의 신호를 극좌표계로 바꾸고, 극좌표계로 바꾼 신호를 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어나게 하는 단계와, 스펙트럼 보간법을 마친 신호를 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원하는 단계를 포함하는 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치를 제공한다.
본 발명의 실시 예에 따르면, 모바일에서 소프트웨어적으로 출력 음성의 속도 처리를 하여 발음이 천천히 이루어지면서도 노이즈가 없고 가청력이 우수해지도록 한다.
도 1은 본 발명의 실시 예에 따른 음성출력장치의 구성을 보인 도면이다.
도 2는 본 발명의 실시 예에 따른 음성출력장치의 동작을 음성 신호 파형을 기준으로 도시한 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
이제, 도면을 참조하여 본 발명의 실시 예에 따른 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치에 대하여 상세히 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 음성출력장치의 구성을 보인 도면이다.
도 1에 도시된 바와 같이, 본 발명의 실시 예에 따른 음성출력장치는 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누며, 패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾼다.
그리고 주파수 영역의 신호를 계산상의 편의를 위해 극좌표계로 바꾸고, 극좌표계로 바꿔진 신호는 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어난다.
이때 스펙트럼 보간법의 세부 방법은 실험적 결과에 의해 미리 작성된 파라메터 테이블을 활용하므로, 전체 연산 량을 확연히 줄일 수 있고, 이에 따라 실시간 이동통신 등에 적용 가능하다.
스펙트럼 보간법을 마친 신호는 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원되어, 부드럽고 자연스럽게 음성스케일이 변환된 소리를 청취 가능하다.
도 2는 본 발명의 실시 예에 따른 음성출력장치의 동작을 음성 신호 파형을 기준으로 도시한 도면으로, Phase vocoder를 이용한 음성신호 스케일링 방법을 도시한 것이다.
도 2에서 (a)는 원래 음성신호이며 이를 고속푸리에 변환하면 (b)와 같이 된다. 이 신호를 주파수영역에서 transpose한 신호가 (c)이고, (d) 신호는 스펙트럼 포락선이다. 추출된 포락선을 기준으로 Interpolation을 수행하면 (e)와 같이 되고, (e) 신호를 역푸리에 변환하면 주파수와 시간이 변경된 음성 신호를 얻게되며, (d) 신호를 (b) 신호의 스펙트럼 영역으로 조정하면 주파수는 동일하나 느리게 들려지는 음성신호를 얻을 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100 : 방사선 검출기 110 : 섬광결정부
120 : 광가이드 130 : 광전소자 어레이
30, 140 : 위치정보 제공부 111 : 섬광결정

Claims (1)

  1. 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누는 단계
    패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾸는 단계,
    주파수 영역의 신호를 극좌표계로 바꾸고, 극좌표계로 바꾼 신호를 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어나게 하는 단계와,
    스펙트럼 보간법을 마친 신호를 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원하는 단계를 포함하는 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치.
KR1020130084127A 2013-07-17 2013-07-17 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 KR20150009777A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130084127A KR20150009777A (ko) 2013-07-17 2013-07-17 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130084127A KR20150009777A (ko) 2013-07-17 2013-07-17 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치

Publications (1)

Publication Number Publication Date
KR20150009777A true KR20150009777A (ko) 2015-01-27

Family

ID=52481821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130084127A KR20150009777A (ko) 2013-07-17 2013-07-17 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치

Country Status (1)

Country Link
KR (1) KR20150009777A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107749302A (zh) * 2017-10-27 2018-03-02 广州酷狗计算机科技有限公司 音频处理方法、装置、存储介质及终端
RU2775660C1 (ru) * 2018-11-28 2022-07-06 Биго Текнолоджи Пте. Лтд. Способ и устройство для обработки звуковых данных, а также носитель информации
US11875814B2 (en) 2018-11-28 2024-01-16 Bigo Technology Pte. Ltd. Audio data processing method, apparatus and device, and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107749302A (zh) * 2017-10-27 2018-03-02 广州酷狗计算机科技有限公司 音频处理方法、装置、存储介质及终端
RU2775660C1 (ru) * 2018-11-28 2022-07-06 Биго Текнолоджи Пте. Лтд. Способ и устройство для обработки звуковых данных, а также носитель информации
US11875814B2 (en) 2018-11-28 2024-01-16 Bigo Technology Pte. Ltd. Audio data processing method, apparatus and device, and storage medium

Similar Documents

Publication Publication Date Title
KR101210313B1 (ko) 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법
US20120316869A1 (en) Generating a masking signal on an electronic device
US11812208B2 (en) Wireless earphone noise reduction method and device, wireless earphone, and storage medium
US20150088500A1 (en) Wearable communication enhancement device
WO2009117084A2 (en) System and method for envelope-based acoustic echo cancellation
KR20140000626A (ko) 이동 단말의 음성에서 노이즈 감소를 위한 방법 및 장치
WO2016024853A1 (ko) 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
EP3275208B1 (en) Sub-band mixing of multiple microphones
CN105793922B (zh) 用于多路径音频处理的设备、方法和计算机可读介质
JP6608380B2 (ja) 耐雑音性を改良した通信システム、方法および装置
US20080219457A1 (en) Enhancement of Speech Intelligibility in a Mobile Communication Device by Controlling the Operation of a Vibrator of a Vibrator in Dependance of the Background Noise
JP2012015792A (ja) 音響補正装置、音響出力装置、及び音響補正方法
WO2013144422A1 (en) A method and apparatus for filtering an audio signal
KR20150009777A (ko) 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치
JP2008309955A (ja) ノイズサプレス装置
US9961441B2 (en) Near-end listening intelligibility enhancement
WO2019119376A1 (en) Earphone and method for uplink cancellation of an earphone
WO2022204697A1 (en) Audio processing for wind noise reduction on wearable devices
US20180158447A1 (en) Acoustic environment understanding in machine-human speech communication
GB2594265A (en) Apparatus, methods and computer programs for enabling rendering of spatial audio signals
Matsumoto Vision-referential speech enhancement of an audio signal using mask information captured as visual data
US10334361B1 (en) Speaker driver circuitry
JP5113096B2 (ja) 音源分離方法、装置およびプログラム
US20240071404A1 (en) Input selection for wind noise reduction on wearable devices
US11765504B2 (en) Input signal decorrelation

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination