KR20150009777A - 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 - Google Patents
실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 Download PDFInfo
- Publication number
- KR20150009777A KR20150009777A KR1020130084127A KR20130084127A KR20150009777A KR 20150009777 A KR20150009777 A KR 20150009777A KR 1020130084127 A KR1020130084127 A KR 1020130084127A KR 20130084127 A KR20130084127 A KR 20130084127A KR 20150009777 A KR20150009777 A KR 20150009777A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- terminal
- semiconductor
- present
- output
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 7
- 230000005855 radiation Effects 0.000 abstract description 2
- 230000005693 optoelectronics Effects 0.000 abstract 4
- 239000004065 semiconductor Substances 0.000 abstract 4
- 239000013078 crystal Substances 0.000 abstract 3
- 230000003287 optical effect Effects 0.000 abstract 2
- 230000005251 gamma ray Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 검출한 감마선에 대응한 광신호를 생성하여 출력하는 복수의 섬광결정으로 이루어진 섬광결정부, 상기 광신호를 신호의 세기에 비례하는 크기의 전기적인 펄스로 변환하여 출력하는 반도체광전자증배관를 복수개로 하여 이루어진 광전소자 어레이와, 상기 광전소자 어레이의 제1 출력을 수신하고, 상기 제1 출력을 이용하여 상기 감마선을 검출한 섬광결정의 위치에 대한 정보를 생성하여 출력하는 위치정보 제공부를 포함하며, 상기 복수의 반도체광전자증배관의 애노드 단자 또는 캐소드 단자 중 하나의 단자는 하나의 공통 라인에 연결되고, 상기 공통 라인은 상기 하나의 단자에서 출력하는 신호가 합하여진 제1 신호를 생성하며, 상기 복수의 반도체광전자증배관의 애노드 단자 또는 캐소드 단자 중 다른 하나의 단자는 각각 제2 신호를 출력하여 상기 위치정보 제공부에 제공하는 것을 특징으로 하는 방사선 검출기에 관한 것이다.
Description
본 발명은 모바일에 적용되는 음성출력장치에 관한 것이다.
일반적으로 모바일에서의 음성 속도 제어기술은 음성의 왜곡 현상 없이 실시간으로 상대방의 목소리가 천천히 들리도록 신호처리 기술로 일부 국가에서 노인들의 가청률 증가를 목적으로 휴대폰에 적용되어 출시된 적이 있다.
그러나 추가적인 H/W 부품으로 인한 원가상승 문제로 매우 국한된 모델에 한해서 사용되었고, 음의 늘어짐 현상으로 듣기에 부자연스러우며, 시간영역에서 음성속도 신호처리 시 노이즈가 필수로 동반되었다
본 발명이 이루고자 하는 기술적 과제는 종래의 문제점을 S/W(소프트웨어)적으로 해결하는 실시간 음성스케일 변환 방법 및 이를 이용한 음성출력장치를 제공하는 것이다.
상기 기술적 과제를 달성하기 위한 특징에 따른 본 발명은 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누는 단계, 패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾸는 단계, 주파수 영역의 신호를 극좌표계로 바꾸고, 극좌표계로 바꾼 신호를 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어나게 하는 단계와, 스펙트럼 보간법을 마친 신호를 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원하는 단계를 포함하는 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치를 제공한다.
본 발명의 실시 예에 따르면, 모바일에서 소프트웨어적으로 출력 음성의 속도 처리를 하여 발음이 천천히 이루어지면서도 노이즈가 없고 가청력이 우수해지도록 한다.
도 1은 본 발명의 실시 예에 따른 음성출력장치의 구성을 보인 도면이다.
도 2는 본 발명의 실시 예에 따른 음성출력장치의 동작을 음성 신호 파형을 기준으로 도시한 도면이다.
도 2는 본 발명의 실시 예에 따른 음성출력장치의 동작을 음성 신호 파형을 기준으로 도시한 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
이제, 도면을 참조하여 본 발명의 실시 예에 따른 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치에 대하여 상세히 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 음성출력장치의 구성을 보인 도면이다.
도 1에 도시된 바와 같이, 본 발명의 실시 예에 따른 음성출력장치는 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누며, 패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾼다.
그리고 주파수 영역의 신호를 계산상의 편의를 위해 극좌표계로 바꾸고, 극좌표계로 바꿔진 신호는 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어난다.
이때 스펙트럼 보간법의 세부 방법은 실험적 결과에 의해 미리 작성된 파라메터 테이블을 활용하므로, 전체 연산 량을 확연히 줄일 수 있고, 이에 따라 실시간 이동통신 등에 적용 가능하다.
스펙트럼 보간법을 마친 신호는 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원되어, 부드럽고 자연스럽게 음성스케일이 변환된 소리를 청취 가능하다.
도 2는 본 발명의 실시 예에 따른 음성출력장치의 동작을 음성 신호 파형을 기준으로 도시한 도면으로, Phase vocoder를 이용한 음성신호 스케일링 방법을 도시한 것이다.
도 2에서 (a)는 원래 음성신호이며 이를 고속푸리에 변환하면 (b)와 같이 된다. 이 신호를 주파수영역에서 transpose한 신호가 (c)이고, (d) 신호는 스펙트럼 포락선이다. 추출된 포락선을 기준으로 Interpolation을 수행하면 (e)와 같이 되고, (e) 신호를 역푸리에 변환하면 주파수와 시간이 변경된 음성 신호를 얻게되며, (d) 신호를 (b) 신호의 스펙트럼 영역으로 조정하면 주파수는 동일하나 느리게 들려지는 음성신호를 얻을 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100 : 방사선 검출기 110 : 섬광결정부
120 : 광가이드 130 : 광전소자 어레이
30, 140 : 위치정보 제공부 111 : 섬광결정
120 : 광가이드 130 : 광전소자 어레이
30, 140 : 위치정보 제공부 111 : 섬광결정
Claims (1)
- 입력된 신호(speech signal)를 실시간 처리에 적합한 프레임으로 나누는 단계
패스트 푸리에 변환(Fast Fourier Transform)으로 시간 영역의 신호를 주파수 영역의 신호로 바꾸는 단계,
주파수 영역의 신호를 극좌표계로 바꾸고, 극좌표계로 바꾼 신호를 스펙트럼 보간법(Spectral Interpolation)에 의해 미리 주어진 시간비율만큼 주파수 영역의 신호가 늘어나게 하는 단계와,
스펙트럼 보간법을 마친 신호를 역 푸리에변환(iFFT)에 의해 다시 시간영역 신호로 복원하는 단계를 포함하는 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130084127A KR20150009777A (ko) | 2013-07-17 | 2013-07-17 | 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130084127A KR20150009777A (ko) | 2013-07-17 | 2013-07-17 | 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150009777A true KR20150009777A (ko) | 2015-01-27 |
Family
ID=52481821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130084127A KR20150009777A (ko) | 2013-07-17 | 2013-07-17 | 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20150009777A (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749302A (zh) * | 2017-10-27 | 2018-03-02 | 广州酷狗计算机科技有限公司 | 音频处理方法、装置、存储介质及终端 |
RU2775660C1 (ru) * | 2018-11-28 | 2022-07-06 | Биго Текнолоджи Пте. Лтд. | Способ и устройство для обработки звуковых данных, а также носитель информации |
US11875814B2 (en) | 2018-11-28 | 2024-01-16 | Bigo Technology Pte. Ltd. | Audio data processing method, apparatus and device, and storage medium |
-
2013
- 2013-07-17 KR KR1020130084127A patent/KR20150009777A/ko not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749302A (zh) * | 2017-10-27 | 2018-03-02 | 广州酷狗计算机科技有限公司 | 音频处理方法、装置、存储介质及终端 |
RU2775660C1 (ru) * | 2018-11-28 | 2022-07-06 | Биго Текнолоджи Пте. Лтд. | Способ и устройство для обработки звуковых данных, а также носитель информации |
US11875814B2 (en) | 2018-11-28 | 2024-01-16 | Bigo Technology Pte. Ltd. | Audio data processing method, apparatus and device, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101210313B1 (ko) | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 | |
US20120316869A1 (en) | Generating a masking signal on an electronic device | |
US11812208B2 (en) | Wireless earphone noise reduction method and device, wireless earphone, and storage medium | |
US20150088500A1 (en) | Wearable communication enhancement device | |
WO2009117084A2 (en) | System and method for envelope-based acoustic echo cancellation | |
KR20140000626A (ko) | 이동 단말의 음성에서 노이즈 감소를 위한 방법 및 장치 | |
WO2016024853A1 (ko) | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 | |
EP3275208B1 (en) | Sub-band mixing of multiple microphones | |
CN105793922B (zh) | 用于多路径音频处理的设备、方法和计算机可读介质 | |
JP6608380B2 (ja) | 耐雑音性を改良した通信システム、方法および装置 | |
US20080219457A1 (en) | Enhancement of Speech Intelligibility in a Mobile Communication Device by Controlling the Operation of a Vibrator of a Vibrator in Dependance of the Background Noise | |
JP2012015792A (ja) | 音響補正装置、音響出力装置、及び音響補正方法 | |
WO2013144422A1 (en) | A method and apparatus for filtering an audio signal | |
KR20150009777A (ko) | 실시간 음성스케일 변환 방법과 이를 이용한 음성출력장치 | |
JP2008309955A (ja) | ノイズサプレス装置 | |
US9961441B2 (en) | Near-end listening intelligibility enhancement | |
WO2019119376A1 (en) | Earphone and method for uplink cancellation of an earphone | |
WO2022204697A1 (en) | Audio processing for wind noise reduction on wearable devices | |
US20180158447A1 (en) | Acoustic environment understanding in machine-human speech communication | |
GB2594265A (en) | Apparatus, methods and computer programs for enabling rendering of spatial audio signals | |
Matsumoto | Vision-referential speech enhancement of an audio signal using mask information captured as visual data | |
US10334361B1 (en) | Speaker driver circuitry | |
JP5113096B2 (ja) | 音源分離方法、装置およびプログラム | |
US20240071404A1 (en) | Input selection for wind noise reduction on wearable devices | |
US11765504B2 (en) | Input signal decorrelation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |