KR20120061862A - 음성 재생 장치 및 음성 재생 방법 - Google Patents

음성 재생 장치 및 음성 재생 방법 Download PDF

Info

Publication number
KR20120061862A
KR20120061862A KR1020127005656A KR20127005656A KR20120061862A KR 20120061862 A KR20120061862 A KR 20120061862A KR 1020127005656 A KR1020127005656 A KR 1020127005656A KR 20127005656 A KR20127005656 A KR 20127005656A KR 20120061862 A KR20120061862 A KR 20120061862A
Authority
KR
South Korea
Prior art keywords
reproduction
signal
ambient sound
audio
unit
Prior art date
Application number
KR1020127005656A
Other languages
English (en)
Inventor
다로 도가와
다께시 오따니
가오리 엔도
야스지 오따
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20120061862A publication Critical patent/KR20120061862A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

음성 재생 장치는, 주위음의 특징을 분석하는 주위음 분석부와, 재생용 신호의 음향 특징을 분석하는 특징 분석부와, 재생용 신호를 기록 매체에 기록하는 한편, 추적 재생의 재생 타이밍에서 기록 매체로부터 재생용 신호를 읽어내는 재생 타이밍 조정부와, 기록 매체로부터 읽어내어진 재생용 신호의 재생 속도를 변경하는 재생 속도 변경부와, 주위음 분석부의 분석 결과에 따른 재생 타이밍에서 재생용 신호가 재생되도록 상기 재생 타이밍 조정부를 제어하는 한편, 상기 주위음 분석부의 분석 결과, 및 상기 특징 분석부에 의해 얻어진 음향 특징에 따른 재생 속도로 상기 재생용 신호가 재생되도록 상기 재생 속도 변경부를 제어하는 제어부를 포함한다.

Description

음성 재생 장치 및 음성 재생 방법{VOICE REPRODUCTION DEVICE AND VOICE REPRODUCTION METHOD}
본 발명은, 음성 재생 장치 및 음성 재생 방법에 관한 것이다.
최근, 휴대 전화가 보급되어 다양한 장소에서 사용되어지고 있다. 휴대 전화는 조용한 장소뿐만 아니라, 공항의 로비나 역 플랫폼처럼 시끄러운 환경에서 사용된다.
이 때문에, 소음 환경에 있어서 송화자의 음성을 수화자에 대하여 듣기 용이하게 하기 위해, 주위 소음 레벨에 따라서 음성의 고역을 강조하는 방법이 있다(예를 들면, 특허 문헌 1 참조).
특허 문헌 1에 기재된 방법에서는, 강조하는 대역에 있어서 소음보다도 큰 레벨로 음성을 출력한다. 그러나, 음량이 스피커의 출력 성능의 한계를 초과하면 음성이 왜곡되게 되어, 오히려 음질이 열화되는 경우가 있었다. 혹은, 음성의 고레벨 출력이 수청자의 청각 기관에 악영향을 미칠 우려가 있었다.
따라서, 주위 소음 레벨이 큰 경우에는 수신 음성을 메모리에 기록해 두고, 주위 소음 레벨이 작아진 경우에 동시 기록 재생(추적 재생)을 행함으로써, 고소음 환경에서도 수신 음성을 듣기 용이하게 하는 방법이 있다(예를 들면, 특허 문헌 2 참조).
특허 문헌 1 : 일본 특허 공개 평11-202896호 공보 특허 문헌 2 : 일본 특허 공개 제2007-312040호 공보 특허 문헌 3 : 일본 특허 공개 제2002-258881호 공보 특허 문헌 4 : 일본 특허 공개 제2007-003682호 공보 특허 문헌 5 : 일본 특허 공개 제2002-287800호 공보 특허 문헌 6 : 일본 특허 공개 제2000-349893호 공보 특허 문헌 7 : 일본 특허 공개 평10-049191호 공보
특허 문헌 2에 기재된 방법에서는, 소음이 커질 때마다 추적 재생에 의해 발생하는 시간 지연이 계속해서 증가된다. 소음이 작은 경우라도 발생한 시간 지연을 회복시키는 일은 없다. 이 때문에, 수신 음성을 마저 들을 때까지 많은 시간을 소비하는 문제가 있었다.
본 발명의 양태의 하나의 목적은, 소음 발생 시에 입력된 재생용 신호를 소음이 없을 때에 단시간에 재생 가능하게 하는 기술을 제공하는 것이다.
본 발명의 양태의 하나는, 음성 재생 장치이며, 주위음의 특징을 분석하는 주위음 분석부와,
입력된 재생용 신호의 음향 특징을 분석하는 특징 분석부와,
상기 재생용 신호를 기록 매체에 기록하는 한편, 추적 재생의 재생 타이밍에서 상기 기록 매체로부터 상기 재생용 신호를 읽어내는 재생 타이밍 조정부와,
상기 기록 매체로부터 읽어내어진 재생용 신호의 재생 속도를 변경하는 재생 속도 변경부와,
상기 주위음 분석부의 분석 결과에 따른 재생 타이밍에서 상기 재생용 신호가 재생되도록 상기 재생 타이밍 조정부를 제어하는 한편, 상기 주위음 분석부의 분석 결과, 및 상기 특징 분석부에 의해 얻어진 음향 특징에 따른 재생 속도로 상기 재생용 신호가 재생되도록 상기 재생 속도 변경부를 제어하는 제어부를 포함한다.
본 발명의 양태의 하나에 따르면, 소음 발생 시에 입력된 재생용 신호를 소음이 없을 때에 단시간에 재생 가능하게 된다.
도 1은 실시 형태 1에 있어서의 음성 재생 장치의 구성예를 나타내는 도면이다.
도 2는 실시 형태 2에 있어서의 음성 재생 장치의 구성예를 나타내는 도면이다.
도 3은 실시 형태 2에 있어서의 제어부의 처리예를 나타내는 플로우차트이다.
도 4는 실시 형태 2에 있어서의 재생 타이밍 조정부의 처리예를 나타내는 플로우차트이다.
도 5는 실시 형태 2에 있어서의 재생 속도 변경부의 처리예를 나타내는 플로우차트이다.
도 6은 실시 형태 3에 있어서의 음성 재생 장치의 구성예를 나타내는 도면이다.
도 7은 실시 형태 3에 있어서의 음성 재생 장치의 제어부의 처리예를 나타내는 플로우차트이다.
도 8은 실시 형태 3에 있어서의 재생 타이밍 조정부의 처리예를 나타내는 플로우차트이다.
도 9는 실시 형태 4에 있어서의 음성 재생 장치의 구성예를 나타내는 도면이다.
도 10은 실시 형태 4에 있어서의 제어부의 처리예를 나타내는 플로우차트이다.
이하, 도면을 참조하여 본 발명의 실시 형태에 대해서 설명한다. 실시 형태의 구성은 예시이며, 본 발명의 양태는 실시 형태의 구성에 한정되지 않는다.
<실시 형태 1>
도 1은, 실시 형태 1에 따른 음성 재생 장치의 구성예를 나타내는 도면이다. 도 1에 있어서, 음성 재생 장치(1)는, 음성 재생 장치(1)의 주위음을 수음하는 마이크로폰(2)과 접속된 주위음 분석부(3)와, 입력 신호, 즉, 음성 재생 장치로 재생해야 할 재생용 신호가 입력되는 특징 분석부로서의 음성 분석부(4)를 구비하고 있다.
또한, 음성 재생 장치(1)는, 주위음 분석부(3) 및 음성 분석부(4)의 출력이 입력되는 제어부(5)와, 입력 신호 및 제어부(5)로부터의 출력이 입력되는 재생 타이밍 조정부(6)를 구비하고 있다.
또한, 음성 재생 장치(1)는, 재생 타이밍(6)으로부터의 출력과 제어부(5)로부터의 출력이 입력되는 재생 속도 변경부(7)를 구비하고 있다. 재생 속도 변경부(7)는, 재생음을 출력하기 위한 스피커(8)에 접속되어 있다.
주위음 분석부(3)에는, 음성 재생 장치(1)의 주위 소음의 발생 상황을 나타내는 마이크로폰(2)으로부터의 출력 신호가 입력된다. 주위음 분석부(3)는, 주위 소음의 발생 상황을 나타내는 출력 신호로부터 주위 소음(주위음이라고도 부름)의 특징을 분석한다.
음성 분석부(4)에는, 재생 대상의 입력 신호, 즉 재생용 신호가 입력된다. 음성 분석부(4)는, 재생용 신호의 음향 특징을 분석한다.
제어부(5)는, 주위음 분석부(3)로부터 입력되는 주위음의 분석 결과, 즉 주위 소음의 특징과, 음성 분석부(4)에 의한 재생용 신호의 분석 결과, 즉 재생용 신호의 음향 특징에 기초하여, 재생용 신호의 재생 타이밍 및 재생 속도를 결정한다. 제어부(5)는, 결정된 재생 타이밍을 재생 타이밍 조정부(6)에 지시함과 함께, 결정된 재생 속도를 재생 속도 변경부(7)에 지시한다.
재생 타이밍 조정부(6)는, 제어부(5)로부터의 지시에 따라서, 재생용 신호의 재생 타이밍을 조정한다. 즉, 재생 타이밍 조정부(6)는, 재생 타이밍에 따라서 재생용 신호를 재생 속도 변경부(7)에 부여한다.
재생 속도 변경부(7)는, 제어부(5)로부터의 지시에 따라서, 재생용 신호의 재생 속도를 변경하고, 재생 신호를 스피커(8)에 접속한다. 이와 같은 구성에 의해, 음성 재생 장치(1)에서는, 이하와 같은 동작이 행해지도록, 제어부가 주위음 분석부의 분석 결과와 음성 분석부의 분석 결과에 기초하여, 재생 타이밍 조정부(6) 및 재생 속도 변경부(7)를 제어한다.
즉, 주위음 분석부(3)의 분석 결과로 나타내어진 소음 시에 입력된 재생용 신호를 재생 타이밍 조정부(6)로 유지해 둔다. 그 후, 주위음 분석부(3)로부터 소음이 없다고 하는 분석 결과가 나타내어진 경우에 재생 타이밍 조정부(6)로부터 재생 속도 변경부(7)에 재생용 신호가 전달된다. 재생 속도 변경부(7)가 재생용 신호의 음향 특징에 따른 재생 속도로 재생용 신호의 재생 처리를 행한다.
이에 의해, 소음 환경 하에서 입력된 재생용 신호를, 소음이 멈춘 후의 재생 타이밍에서, 1보다 빠른 배속으로 재생함으로써, 소음 환경 하에서 입력된 음성을, 청취 용이한 환경 하에서 단시간 재생할 수 있다. 이에 의해, 지연을 억제한 상태에서, 재생 음성을 음성 재생 장치(1)의 사용자는 들을 수 있으므로, 음성 재생 장치(1)를 통화 목적으로 적절히 적용할 수 있다. 즉, 음성 재생 장치(1)를 전화기, 스마트폰, 퍼스널 컴퓨터와 같은 통화 기능을 갖는 전자 기기에 적용하는 것이 가능하게 된다.
<실시 형태 2>
도 2는, 실시 형태 2에 따른 음성 재생 장치의 구성예(음성 재생 장치(1A))를 나타낸다. 음성 재생 장치(1A)는, 소음 레벨(주위음 레벨이라고도 함)이 큰 경우에 음성 재생 장치(1)에 입력된 재생용 신호의 재생 타이밍을 어긋나게 함(시프트함)과 함께, 재생용 신호의 피치 주파수에 따라서 재생 시의 화속(話速)을 변경할 수 있다.
음성 재생 장치(1A)는, 예를 들면, 휴대 전화, 스마트폰, 퍼스널 컴퓨터와 같은 통화 기능, 혹은, 음성이 포함된 동화상 파일이나 음성 파일을 다운로드하여 재생 가능한 기능을 갖는 전자 기기에 적용할 수 있다. 혹은, 라디오 수신기나 텔레비전 수신기와 같은 음성 신호의 수신 장치에 적용할 수도 있다.
도 2에 있어서, 음성 재생 장치(1A)는, 주위 잡음이 입력되는 마이크로폰(2)과 접속된 주위음 분석부(3)와, 입력 신호, 즉, 재생용 신호가 입력되는 특징 분석부(4A)를 구비하고 있다. 재생용 신호는, 예를 들면, 통화 상대로부터의 수화 신호, 동화상 음성 데이터의 신호, 라디오, 텔레비전의 방송 음성 신호이다. 재생용 신호는, 음성 구간과 비음성 구간(무음 구간을 포함함)을 포함하고, 음성 구간 중의 신호를 음성 신호, 비음성 구간 중의 신호를 비음성 신호라고 부른다.
또한, 음성 재생 장치(1A)는, 주위음 분석부(3) 및 특징 분석부(4A)의 출력이 입력되는 제어부(5)와, 재생용 신호 및 제어부(5)로부터의 출력이 입력되는 재생 타이밍 조정부(6)를 구비하고 있다.
또한, 음성 재생 장치(1A)는, 재생 타이밍 조정부(6)로부터의 출력과 제어부(5)로부터의 출력이 입력되는 재생 속도 변경부(7)와, 재생 타이밍 조정부(6) 및 제어부(5)에 접속된 지연 시간 측정부(9)를 구비한다. 재생 속도 변경부(7)는, 재생음을 출력하기 위한 스피커(8)와 접속되어 있다.
재생 타이밍 조정부(6)는, 외부로부터 입력되는 재생용 신호를 읽어들이고, 제어부(5)로부터 입력되는 동작 모드에 따른 출력처에 재생용 신호를 출력하는 출력 선택부(64)와, 출력 선택부(64)로부터 입력되는 재생용 신호를 기록 매체인 버퍼(61)에 기록하는 기록부(62)와, 출력 선택부(64)로부터의 재생용 신호를 데이터로서 버퍼(61)에 기록함과 함께, 버퍼(61)에 기록된 데이터로부터 재생용 신호를 생성하여 출력하는 기록 재생부(63)를 포함하고 있다.
주위음 분석부(3)는, 음성 재생 장치(1A)의 주위의 소음을 수음하는 마이크로폰(2)으로부터 입력된 신호(주위음 신호라고 칭함)에 대한 분석을 행하여, 주위음의 유무를 나타내는 판정 결과를 출력한다.
구체적으로는, 주위음 분석부(3)는, 주위음 신호에 대한 분석을 단위 시간마다 행하고, 예를 들면 주위음 신호의 단위 시간마다의 소음 레벨을 측정한다. 주위음 분석부(3)는, 단위 시간마다의 소음 레벨이 미리 정해진 임계값 TH1을 하회하는지의 여부를 판정한다. 소음 레벨이 임계값 TH1을 하회하는 경우에는, 주위음 분석부(3)는, “주위음 소”의 판정 결과를 출력하고, 소음 레벨이 임계값 TH1 이상인 경우에는, 주위음 분석부(3)는, “주위음 대”의 판정 결과를 출력한다. 이와 같이 하여, 단위 시간마다의 주위음(소음)의 유무를 나타내는 판정 결과가 출력되어 제어부(5)에 입력된다. 임계값 TH1은, 주위음의 크기(소음 레벨)가 유저에 의한 재생음의 시청에 영향을 부여하는지의 여부를 고려하여 결정할 수 있다.
특징 분석부(4A)는, 단위 시간마다의 입력 신호(재생용 신호)의 특징을 분석한다. 특징 분석부(4A)는, 분석 결과로서, 단위 시간의 재생용 신호가 음성 신호인지 비음성 신호(무음을 포함함)의 판정 결과를 제어부(5)에 입력한다. 재생용 신호가 음성 신호인 경우에는, 특징 분석부(4A)는 음성 신호의 피치 주파수를 측정하고, 피치 주파수를 제어부(5)에 입력한다. 재생용 신호가 음성 신호인지 비음성 신호인지의 판정은, 예를 들면 특허 문헌 3(일본 특허 공개 제2002-258881호 공보)에 개시되어 있는 방법으로 행한다.
또한, 피치 주파수는, 예를 들면 이하와 같은 수학식 1 및 수학식 2를 이용하여 산출할 수 있다.
Figure pct00001
Figure pct00002
단,
x : 송화음의 신호
M : 상관 계수를 산출하는 구간의 길이(샘플)
a : 상관 계수를 산출하는 신호의 개시 위치
pitch : 피치 주파수(㎐)
corr(a) : 어긋남 위치가 a의 경우의 상관 계수
a_max : 최대 상관 계수에 대응하는 a
i : 신호의 인덱스(샘플)
freq :샘플링 주파수(㎐)
이다.
재생 타이밍 조정부(6)의 출력 선택부(64)는, 제어부(5)로부터의 동작 모드를 나타내는 제어 신호에 따라서, 재생용 신호의 출력처를 기록부(62), 기록 재생부(63), “출력 없음(종단)”과의 사이로 절환한다.
동작 모드에는, 재생 타이밍 조정부(6)로부터 수취한 재생용 신호를 버퍼(61)에 기록하는 한편, 버퍼(61)로부터 읽어내어진 데이터에 기초하는 재생용 신호를 재생하는 동시 기록 재생(추적 재생)을 행하는 “기록 재생” 모드와, 재생 타이밍 조정부(6)에 입력된 재생용 신호를 버퍼(61)에 기록하는 “기록” 모드와, 입력된 재생용 신호에 대한 처리를 행하지 않는 “처리 없음” 모드가 있다.
동작 모드가 “기록 재생”인 경우에는, 출력 선택부(64)는, 재생용 신호를 기록 재생부(63)에 출력한다. 이에 대하여, 동작 모드가 “기록”인 경우에는, 출력 선택부(64)는 재생용 신호를 기록부(62)에 출력한다. 또한, 동작 모드가 “처리 없음” 모드인 경우에는, 출력 선택부(64)는, 입력된 재생용 신호의 출력을 행하지 않는다.
기록부(62)는, 동작 모드 “기록”에 있어서, 출력 선택부(64)로부터 출력된 재생용 신호를 데이터로서 버퍼(61)에 축적하는 기입 처리를 행한다. 기록 재생부(63)는, “기록 재생” 모드에 있어서, 버퍼(61)로부터 읽어낸 데이터에 기초하는 재생용 신호를 생성하여 출력하는 한편, 출력 선택부(64)로부터의 재생용 신호를 데이터로서 버퍼(61)에 축적하는 기입 처리를 행한다. 기록 재생부(63)의 출력인 재생 신호는, 재생 속도 변경부(7)에 입력된다.
재생 속도 변경부(7)는, 제어부(5)로부터 지시되는 재생 배율에 따른 재생 속도로 재생 신호를 출력한다. 이에 의해, 재생 속도 변경부(7)에 의해 조정된 재생 속도의 재생음이 스피커(8)로부터 출력된다.
지연 시간 측정부(9)는, 재생 타이밍 조정을 위해 버퍼(61)에 축적된 재생용 신호의 길이, 즉 축적량을 취득하고, 축적량으로부터 지연 시간을 산출하고, 지연 시간을 제어부(5)에 입력한다.
제어부(5)는, 「주위음 있음」 또는 「주위음 없음」의 판정 결과, 음성 구간 또는 비음성 구간의 판정 결과, 피치 주파수, 및 지연 시간에 기초하여, 단위 시간마다의 동작 모드, 및 재생 배율을 결정한다. 결정된 동작 모드는, 재생 타이밍 조정부(6)에 통지되고, 재생 배율은 재생 속도 변경부(7)에 통지된다.
제어부(5)는, 주위음 분석부(3)에서 주위음 레벨 소라고 판정되고, 또한, 지연 시간 측정부(9)에서 측정한 지연 시간이 0이었던 경우에는, 통상 재생, 즉 1배속에서의 재생이 행해지도록 제어를 행한다. 이에 대해, 제어부(5)는, 주위음 분석부(3)에서 주위음 레벨 대라고 판정되고, 또한, 지연이 소정의 임계값 TH2 미만이었던 경우에는 재생 타이밍이 조정되도록 제어를 행한다. 상기 이외의 경우에는, 제어부(5)는 단시간 재생이 행해지도록 제어를 행한다.
또한, 주위음 분석부(3), 특징 분석부(4A), 제어부(5), 재생 타이밍 조정부(6), 재생 속도 변경부(7)는, 예를 들면, 전용의 하드웨어 회로의 적용에 의해 실현되는 기능으로서 실현할 수 있다.
또한, 주위음 분석부(3), 특징 분석부(4A), 제어부(5), 재생 타이밍 조정부(6), 재생 속도 변경부(7)는, CPU(Central Processing Unit)나 DSP(Digital Signal Processor)와 같은 프로세서(도시 생략)가 메모리(기록 매체:도시하지 않음)에 저장된 프로그램을 실행함으로써 생기는 기능으로서 실현할 수도 있다. 버퍼(61)는, 기록 매체(예를 들면, RAM이나 플래시 메모리와 같은 반도체 메모리)에 의해 실현된다.
혹은, 주위음 분석부(3), 특징 분석부(4A), 재생 타이밍 조정부(6), 및 재생 속도 변경부(7)가 전용의 하드웨어에 의해 실현되고, 제어부(5)가 전용 또는 범용의 프로세서에 의한 소프트웨어 처리에 의해 실현되게 되어 있어도 된다.
도 2에 도시한 구성은 어디까지나 예시이며, 도 2에 도시한 각 블록이 갖는 기능은, 복수의 블록에 의해 실현되도록 변형 가능하다. 혹은, 도 2의 복수의 블록의 기능이 하나의 블록에 의해 실현되도록 변형 가능하다. 또한, 어떤 블록의 일부의 기능이 다른 블록으로 실현되도록 변형 가능하다.
도 3은, 도 2에 도시한 제어부(5)의 처리예를 나타내는 플로우차트이다. 도 3에 도시하는 처리는, 예를 들면, 음성 재생 장치(1A)의 도시하지 않은 전원이 투입된 것을 트리거로서 개시된다.
도 3에 도시하는 처리는, 단위 시간 또는 소정 주기마다, 주위음 분석부(3), 특징 분석부(4A), 제어부(5), 재생 타이밍 조정부(6), 재생 속도 변경부(7), 및 지연 시간 측정부(9)가 동기를 취해 실행된다.
최초로, 제어부(5)는, 주위음 분석부(3)에서의 판정 결과인 「소음 소」 또는 「소음 대」를 나타내는 신호를 수신한다(스텝 S01).
다음으로, 제어부(5)는, 특징 분석부(4A)로부터, 재생용 신호가 음성 신호인지 비음성 신호인지를 나타내는 판정 결과를 수취한다(스텝 S02). 이때, 재생용 신호가 음성 신호인 경우에는, 제어부(5)는 음성 신호의 피치 주파수를 특징 분석부(4A)로부터 수취한다(스텝 S03). 따라서, 재생용 신호가 비음성 신호인 경우에는, 스텝 S03의 처리는 행해지지 않는다.
다음으로, 제어부(5)는, 지연 시간 측정부(9)로부터 지연 시간을 수취한다(스텝 S04). 다음으로, 제어부(5)는, 주위음 분석부(3)의 판정 결과가 “주위음 소”인지의 여부를 판정한다. 이때, 판정 결과가 “주위음 소”인 경우(S05 "예")에는, 스텝 S06으로 처리가 진행된다. 이에 대해, 판정 결과가 “주위음 대”인 경우(S05 "아니오")에는, 처리가 스텝 S12로 진행된다.
스텝 S06에서는, 제어부(5)는, 지연 시간이 제로, 즉, 버퍼(61)의 축적량이 제로인지의 여부를 판정함으로써, 지연이 있는지의 여부를 판정한다. 지연이 없는 경우(S06 "예")에는, 처리가 스텝 S07로 진행된다. 이에 대해, 지연이 있는 경우(S06 "아니오")에는, 처리가 스텝 S09로 진행된다.
스텝 S07에서는, 제어부(5)는, 동작 모드를 “기록 재생”으로 설정한다. 계속해서, 제어부(5)는, 재생 배율을 1배로 설정한다(스텝 S08). 그 후, 제어부(5)는, 처리를 스텝 S17로 진행하고, 동작 모드 “기록 재생”을 재생 타이밍 조정부(6)에 부여함과 함께, 재생 속도 “1배”를 재생 속도 변경부(7)에 부여한다. 그 후, 처리가 스텝 S01로 되돌아간다.
스텝 S06에서 지연 있음이라고 판정되고, 처리가 스텝 S09로 진행된 경우에는, 제어부(5)는, 동작 모드를 “기록 재생”으로 설정한다(스텝 S09).
다음으로, 제어부(5)는, 버퍼(61)로부터 읽어내어지는 음성 신호의 피치 주파수가 임계값 TH3 이상인지의 여부를 판정한다(스텝 S10). 이때, 피치 주파수가 임계값 TH3 이상이면(S10 "예"), 처리가 스텝 S08로 진행되고, 음성 신호의 재생 배율이 1배로 설정된다. 이에 대해, 피치 주파수가 임계값 TH3 미만이면(S10 "아니오"), 처리가 스텝 S11로 진행된다.
스텝 S11에서는, 제어부(5)는, 재생 배율을 X배(예를 들면 1<X≤2)로 설정한다. X의 값은, 예를 들면, 피치 주파수와 재생 배율과의 상관을 나타내는 맵을 미리 제어부(5)에 기억해 두고, 피치 주파수에 대응하는 재생 배율을 X로서 설정할 수 있다. 재생 배율이 상승함으로써, 음성의 주파수가 높아져, 청취 용이함이 향상된다.
그 후, 처리가 스텝 S17로 진행되고, 제어부(5)가 동작 모드 “기록 재생”을 재생 타이밍 조정부(6)에 부여함과 함께, 재생 속도 “X배”를 재생 속도 변경부(7)에 부여한다. 그 후, 처리가 스텝 S01로 되돌아간다.
그런데, 처리가 스텝 S05 내지 S12로 진행된 경우에는, 제어부(5)는, 입력 신호, 즉 재생용 신호가 음성 신호인지의 여부를 판정한다. 이때, 재생용 신호가 음성 신호인 경우(S12 "예")에는, 처리가 스텝 S13으로 진행된다. 이에 대해, 재생용 신호가 비음성 신호인 경우(S12 "아니오")에는, 처리가 스텝 S15로 진행된다.
스텝 S13에서는, 제어부(13)는, 지연 시간이 미리 정해진 임계값 TH3 이상인지의 여부를 판정한다. 이때, 지연 시간이 임계값 TH3 이상인 경우(S13 "예")에는, 처리가 스텝 S09로 진행되고, 동작 모드가 “기록 재생”으로 설정된다.
이에 대해, 지연 시간이 임계값 TH3 미만의 경우(S13 "아니오")에는, 제어부(5)는, 동작 모드를 “기록”으로 설정한다(스텝 S14). 또한, 제어부(5)는, 재생 배율을 0배로 설정한다. 재생 배율이 0배로 됨으로써, 스피커(8)로부터의 재생음 출력이 정지된다.
그 후, 처리가 스텝 S17로 진행되고, 동작 모드 “기록”이 재생 타이밍 조정부(6)에 주어짐과 함께, 재생 속도 “0배”가 재생 속도 변경부(7)에 주어진다. 그 후, 처리가 스텝 S01로 되돌아간다.
스텝 S12에 있어서, 재생용 신호가 비음성 신호라고 판정된 경우(S12 "아니오")에는, 제어부(15)는, 동작 모드를 “처리 없음”으로 설정하고(스텝 S15), 스텝 S16에서 재생 배율을 0으로 설정한다. 그 후, 처리가 스텝 S17로 진행되고, 동작 모드 “처리 없음”이 재생 타이밍 조정부(6)에 주어짐과 함께, 재생 속도 “0배”가 재생 속도 변경부(7)에 주어진다. 그 후, 처리가 스텝 S01로 되돌아간다.
동작 모드 “처리 없음”에서는, 재생용 신호가 출력 선택부(64)로부터 출력되지 않기 때문에, 재생도 버퍼(61)에의 기록도 행해지지 않는다. 따라서, 버퍼(61)에는, 음성 신호만이 축적되게 된다.
도 3에 도시한 처리에 따르면, 주위음이 작고, 지연이 없는 경우에는, 재생 배율 1배로 재생용 신호가 재생되어, 스피커(8)로부터 재생음이 출력된다. 이에 대해, 주위음이 작고, 지연이 있는 경우에는, 재생용 신호가 버퍼(61)에 기록된다. 이에 의해, 재생 타이밍 조정이 행해진다. 한편, 버퍼(61)에 기록된 음성 신호가 그 음성 신호의 피치 주파수에 따른 재생 배율로 재생된다.
이에 대해, 주위음이 크지만 지연이 없는 경우에는, 음성 신호의 버퍼(61)에의 기록이 행해져, 재생음의 출력이 정지된다. 이에 의해, 소음 환경화에서의 재생이 규제되어, 주위음이 저하된 시점에서의 재생을 시도하는 것이 가능하게 된다.
또한, 주위음이 크고, 지연도 큰 경우에는, 주위음이 작고, 지연이 있는 경우와 마찬가지의 동작이 행해진다. 즉, 주위의 소음이 크지만 재생의 지연을 허용할 수 없는 경우에는, 재생 배율을 필요에 따라서 상승시켜, 가능한 한 청취 용이한 재생음이 출력되도록 한다.
이와 같이 하여, 주위음이 작고 지연도 없는 경우에는, 음성 재생 장치(1A)는, 재생 타이밍을 조정하지 않고, 1배속으로 재생용 신호의 재생음을 출력하도록 동작한다. 한편, 주위음이 크고 지연이 작은 경우에는, 음성 재생 장치(1A)는, 재생음의 출력을 정지하여, 재생 타이밍의 조정을 도모하도록 동작한다. 또한, 주위음이 작게 지연이 있는 경우, 및 주위음이 크고 또한 지연이 큰 경우에는, 재생 속도를 올려서 단시간 재생이 행해지도록 동작할 수 있다.
또한, 주위음이 크지만 지연도 큰 경우에는, 피치 주파수의 크기에 상관없이, 1배를 상회하는 재생 배율 X가 설정되도록 해도 된다. 이와 같이 하면, 버퍼(61)의 축적량을 단시간에 줄이는 것이 가능하게 된다.
도 4는, 도 2에 도시한 재생 타이밍 조정부(6)의 동작예를 나타내는 플로우차트이다. 최초로, 재생 타이밍 조정부(6)의 출력 선택부(64)는, 외부로부터 입력되는 재생용 신호(입력 신호)를 도시하지 않은 내부 메모리에 읽어들인다(스텝 S21).
다음으로, 재생 타이밍 조정부(6)는, 제어부(5)로부터 입력되는 동작 모드를 수취하는(스텝 S22) 동작 모드는 내부 메모리에 기입된다.
다음으로, 재생 타이밍 조정부(6)는, 동작 모드가 “처리 없음”인지의 여부를 판정한다. 이때, 동작 모드가 “처리 없음”이면, 처리가 스텝 S27로 진행된다. 이때, 출력 선택부(64)로부터의 재생용 신호의 출력은 행해지지 않는다. 이에 대해, 동작 모드가 “처리 없음”이면, 처리가 스텝 S24로 진행된다. 이 경우, 출력 선택부(64)는 재생용 신호를 기록부(62)에 출력한다.
스텝 S24에서는, 기록부(62)에 의해 재생용 신호가 버퍼(61)에 기록됨과 함께, 재생 타이밍 조정부(6)에서 관리되고 있는 버퍼(61)의 데이터 기록 위치가 갱신된다.
스텝 S25에서는, 재생 타이밍 조정부(6)는, 동작 모드가 “기록 재생”인지의 여부를 판정한다. 이때, 동작 모드가 “기록 재생”이면(S25 "예"), 처리가 스텝 S27로 진행된다. 이에 대해, 동작 모드가 “재생”이 아니면(S25 "아니오"), 처리가 스텝 S25로 진행된다.
스텝 S25에서는, 재생 타이밍 조정부(6)는, 버퍼(61)에 축적된 데이터를 읽어내고, 이 데이터에 기초하는 음성 신호를 출력함과 함께, 재생 타이밍 조정부(6)에서 관리되고 있는 데이터 판독 위치를 갱신한다. 그 후, 처리가 스텝 S27로 진행된다.
스텝 S27에서는, 재생 타이밍 조정부(6)는, 데이터 판독 위치와 데이터 기록 위치와의 차로부터, 버퍼(61)의 축적량을 출력한다. 축적량은, 지연 시간 측정부(9)에 입력된다. 그 후, 처리가 스텝 S21로 되돌아간다.
이와 같이, 재생 타이밍 조정부(6)는, 읽어들인 재생용 신호가 음성 신호인지의 여부를 판정하고, 음성 신호의 경우에는 버퍼(61)에 축적하고, 비음성 신호의 경우에는 버퍼(61)에의 축적을 행하지 않는다. 이에 의해, 음성 구간의 신호, 즉 음성 신호만을 기록 재생하는 처리를 실현할 수 있다.
도 5는, 도 2에 도시한 재생 속도 변경부(7)의 동작예(단시간 재생 동작)를 나타내는 플로우차트이다.
최초로, 재생 속도 변경부(7)는, 제어부(5)로부터 재생 배율을 수취한다(스텝 S31). 다음으로, 재생 속도 변경부(7)는, 재생 배율이 0배인지의 여부를 판정한다(스텝 S32). 이때, 재생 배율이 0배이면(S32 "예"), 재생 속도 변경부(7)는, 재생 처리를 행하지 않고, 처리를 스텝 S31로 되돌린다. 따라서, 재생 신호는, 스피커(8)로부터 출력되지 않는다.
이에 대해, 재생 배율이 0배가 아니면(S32 "아니오"), 재생 속도 변경부(7)는, 기록 재생부(63)로부터 출력된 재생용 신호를 재생 속도 변경부(7) 내의 도시하지 않은 내부 메모리에 읽어들인다(S33).
다음으로, 재생 속도 변경부(7)는, 재생 배율이 1배인지의 여부를 판정한다(스텝 S34). 이때, 재생 배율이 1배이면(S34 "예"), 재생 속도 변경부(7)는, 통상 속도(1배)에서의 재생 처리를 행하고, 재생 신호를 스피커(8)를 향하여 출력한다. 따라서, 1배속의 재생 신호가 스피커(8)로부터 출력된다.
이에 대해, 재생 배율이 1배가 아니면(S34 "아니오"), 재생 속도 변경부(7)는, 기록 재생부(63)로부터 출력된 재생용 신호를, 제어부(5)로부터 지시된 재생 속도 X배로 재생 처리를 행한다(S36). 따라서, X배속의 재생 신호가 스피커(8)로부터 출력된다.
이와 같이 하여, 재생 속도 변경부(7)에서 재생 속도가 1배보다 큰 X배(단 최대값 2배)로 됨으로써, 단시간 재생이 실현된다.
실시 형태 2의 음성 재생 장치(1A)에 따르면, 주위 소음이 큰 경우에는, 재생용 신호 중의 음성 신호만이 동시 기록 재생(추적 재생)되도록, 음성 신호만의 버퍼(61)에의 축적이 행해진다. 이에 의해, 불필요한 시간 지연의 증가를 방지할 수 있다. 이에 대해, 주위 소음이 작은 경우에는, 화속을 빠르게 하여 재생함(재생 속도를 빠르게 함)으로써 시간 지연을 단축할 수 있다. 이 때문에, 재생음을 단시간에 들을 수 있다.
따라서, 예를 들면, 시간 지연이 소정의 임계값 이하(예를 들면 1초 정도)로 되도록, 재생 타이밍 및 재생 속도를 제어함으로써, 통화 용도에 적용하는 것이 가능하게 된다. 특히, 도어를 닫는 음이나 경보음과 같은 순간적으로 발생하는 소음에 대해, 듣기 용이한 재생음을 출력할 수 있다.
또한, 음성 재생 장치(1A)에 따르면, 재생 타이밍 조정부(6)에서, 주위 소음이 작아진 시점에 재생 타이밍을 어긋나게 할(타임 시프트시킬) 수 있다. 이에 의해, 재생음을 듣기 용이하게 할 수 있다.
또한, 음성 재생 장치(1A)에 따르면, “주위음 대”인 동안에 버퍼(61)에 축적되는 재생용 신호를 음성 신호에 한정할 수 있다. 이에 의해, 추적 재생되는 재생용 신호의 양을 줄일 수 있으므로, 불필요한 시간 지연의 증가를 방지할 수 있다. 또한, 음성 재생 장치(1A)의 시스템 구성에 필요한 메모리량을 삭감할 수 있다.
또한, 음성 재생 장치(1A)는, 재생 타이밍을 지연시킬 때에, 소음이 커지기 직전의 소정 시간분을 되돌아가 재생하도록 동작 가능하다. 이에 의해, 음성의 도중으로부터 추적 재생함에 따른 듣기 용이함의 저하를 방지할 수 있다.
또한, 음성 재생 장치(1A)는, 또는 어미(語尾)와 같은 소리가 낮아지는 개소(피치 주파수가 낮은 부분)의 재생 속도를 빠르게 하거나 할 수 있다. 이에 의해, 재생음의 듣기 용이함을 저하시키지 않고 시간 지연을 회복할 수 있다.
또한, 음성 재생 장치(1A)는, 재생 속도 변경부(7)에 있어서 화속 변환 기술을 이용함으로써, 원래의 음성의 피치 주파수를 유지하여 자연성을 저하시키지 않고 시간 지연을 회복할 수 있다. 화속 변환 기술은, 예를 들면, 특허 문헌 4(일본 특허 공개 제2007-003682호 공보)에 기재된 기술을 적용할 수 있다.
또한, 음성 재생 장치(1A)는, 지연 시간이 커지지 않도록 재생 제어를 실행할 수 있다. 이에 의해, 재생음을 단시간에 듣기 용이하게 할 수 있어, 특히 통화에 적용하는 것이 가능하게 된다.
또한, 음성 재생 장치(1A)는, 스텝 S13의 판단에 의해, 시간 지연이 소정값 이하로 되도록 상기 재생 타이밍 조정 및 상기 재생 속도 변경 처리를 행할 수 있다.
<실시 형태 3>
다음으로, 실시 형태 3에 따른 음성 재생 장치에 대해서 설명한다. 실시 형태 3은, 실시 형태 2와 공통된 구성을 갖는다. 이 때문에, 공통점에 대해서는 설명을 생략하고, 상위점을 중심으로 설명한다.
실시 형태 3으로서, 소음 레벨이 큰 경우에 재생용 신호의 재생 타이밍을 어긋나게 함과 함께, 재생용 신호에 포함되는 음성 구간 길이에 따라서 재생 속도 변경을 행할 수 있는 음성 재생 장치에 대해서 설명한다.
도 6은, 실시 형태 3에 있어서의 음성 재생 장치(1B)의 구성예를 나타내는 도면이다. 도 6에 있어서의 음성 재생 장치(1B)는, 이하의 점에서 음성 재생 장치(1A)와 다르다.
(1) 특징 분석부(4)가, 피치 주파수 대신에 음성 구간 길이를 제어부(5)에 입력한다.
(2) 제어부(5)가 음성 구간 길이에 기초하는 음성 구간 경계 데이터를 재생 타이밍 조정부(6)에 부여한다. 음성 구간 경계 데이터는, 음성 구간의 개시 시점을 나타내는 데이터이다.
(3) 제어부(5)는, 음성 구간 길이에 기초하여 재생 속도를 결정한다.
(4) 기록 재생부(63)는, 음성 구간 경계 데이터에 기초하여, 음성 구간의 선두로부터 추적 재생이 개시되도록, 버퍼(61)로부터 데이터의 읽어내기를 행한다.
이상의 점을 제외하고, 음성 재생 장치(1B)의 구성은 음성 재생 장치(1A)의 구성과 거의 마찬가지이다.
도 7은, 실시 형태 3에 있어서의 음성 재생 장치(1B)의 제어부(5)의 처리예를 나타내는 플로우차트이다. 도 7에 도시하는 처리는, 실시 형태 2에 있어서의 제어부(5)의 처리(도 3)와 이하의 점에서 다르다.
즉, 스텝 S03A에서, 제어부(5)는, 특징 분석부(4A)로부터의 음성 구간 길이를 수취한다. 그러면, 제어부(5)는, 음성 구간 길이로부터 구해지는 버퍼(61) 상의 음성 구간 경계 데이터를 생성한다.
또한, 스텝 S10A에서, 제어부(5)는, 버퍼(61)로부터 읽어내어 재생해야 할 데이터의 음성 구간 길이가 미리 설정된 임계값 Th4 이상인지의 여부를 판정한다. 이때, 음성 구간 길이가 임계값 TH4 이상이면(S10A "예"), 처리가 스텝 S08로 진행되고, 재생 배율이 1배로 설정된다. 이에 대해, 음성 구간 길이가 임계값 TH4 미만인 경우(S10A "아니오")에는, 재생 배율이 X배(1<X≤2)로 설정된다.
또한, 스텝 S27A에서, 재생 타이밍 조정부(6)에 대하여, 동작 모드와 함께 음성 구간 경계 데이터가 주어진다. 동작 모드 및 음성 구간 경계 데이터는 재생 타이밍 조정부(6) 내의 내부 메모리에 저장된다.
이상의 점을 제외하고, 제어부(5)의 처리는 실시 형태 2와 마찬가지이므로, 설명을 생략한다.
도 8은, 실시 형태 3에 있어서의 재생 타이밍 조정부(6)의 처리예를 나타내는 플로우차트이다. 도 8에 도시하는 스텝 S21 및 S22는, 실시 형태 2에 있어서의 처리(도 5)와 마찬가지이다.
스텝 S31에서는, 재생 타이밍 조정부(6)는, 음성 구간 경계 데이터를 수취하여, 내부 메모리에 저장한다.
다음으로, 재생 타이밍 조정부(6)는, 동작 모드가 변화된 것인지의 여부, 즉, 동작 모드 “기록 재생”이 다른 동작 모드(“처리 없음” 또는 “기록”)로 변화된 것인지의 여부를 판정한다(스텝 S32). 동작 모드 “기록 재생”이 다른 동작 모드로 변화된 경우(S32 "예")에는, 처리가 스텝 S33으로 진행되고, 동작 모드 “기록 재생”이 다른 동작 모드로 변화되어 있지 않은 경우(S32 "아니오")에는, 처리가 스텝 S34로 진행된다.
스텝 S33에서는, 재생 타이밍 조정부(6)는, 재생 타이밍 조정부(6)에서 관리되고 있는 데이터 판독 위치를 음성 구간의 선두로 수정하여, 처리를 스텝 S34로 진행한다.
스텝 S34에서는, 재생 타이밍 조정부(6)는, 동작 모드가 “처리 없음”인지의 여부를 판정한다. 동작 모드가 “처리 없음”인 경우(S34 "예")에는, 처리가 스텝 S38로 진행되고, 동작 모드가 “처리 없음”이 아닌 경우(S34 "아니오")에는, 처리가 스텝 S35로 진행된다.
스텝 S35에서는, 재생 타이밍 조정부(6)는, 재생용 신호와 음성 구간 경계 데이터를 버퍼(61)에 기록함과 함께, 데이터 기록 위치를 갱신한다.
계속해서, 재생 타이밍 조정부(6)는, 동작 모드가 “기록 재생”인지의 여부를 판정한다(스텝 S36). 이때, 동작 모드가 “기록 재생”인 경우(S36 "예")에는, 처리가 스텝 S37로 진행되고, 동작 모드가 “기록 재생”이 아닌 경우(S36 "아니오")에는, 처리가 스텝 S38로 진행된다.
스텝 S37에서는, 재생 타이밍 조정부(6)의 기록 재생부(63)가, 데이터 판독 위치에 기초하여 음성 구간의 선두로부터 데이터를 읽어내고, 재생용 신호를 생성하여 출력한다(스텝 S38).
실시 형태 3에 따르면, 동작 모드 “기록 재생”에 있어서 버퍼(61)로부터 읽어내어지는 음성 신호에 대해, 음성 구간 길이가 미리 설정된 임계값 TH3보다도 작은 경우에는 재생 속도 변경부(7)에서 화속 변환 처리에 의해 화속을 빠르게 하는 처리를 행한다. 재생 속도 변경 처리에 대해서는 화속 변환 기술을 이용하여 원래의 음성의 피치 주파수를 유지한 상태로 발화 속도를 변경함으로써, 자연성을 저하시키지 않고 시간 지연을 회복할 수 있다. 화속 변환 기술은, 예를 들면, 특허 문헌 4(일본 특허 공개 제2007-003682호 공보)에 기재된 기술을 적용할 수 있다.
이에 의해, 음성 재생 장치(1B)는, 재생 속도 변경부(7)에 있어서 화속 변환 기술을 이용함으로써, 원래의 음성의 피치 주파수를 유지하여 자연성을 저하시키지 않고 시간 지연을 회복할 수 있다.
또한, 실시 형태 3에 있어서의 재생 타이밍 조정 동작에서는, 음성 구간의 음성 신호를 축적하고 있는 버퍼(61)의 판독 위치를 음성 분석부(4A)에서 분석한 음성 구간의 개시 위치에 설정한다. 이에 의해, 주위음이 작아진 경우에, 음성 구간의 선두로 되돌아가 음성 신호가 재생된다. 이에 의해, 청취 용이함의 저하를 방지할 수 있다.
또한, 실시 형태 3에 있어서의 음성 재생 장치(1B)에 따르면, 예를 들면, 「음~」, 「저~」와 같은 음성 구간 길이가 짧은 음성 구간에 대해서 재생 속도를 빠르게 할 수 있다. 이에 의해, 재생음의 듣기 용이함을 저하시키지 않고 시간 지연을 회복할 수 있다.
<실시 형태 4>
다음으로, 실시 형태 4에 따른 음성 재생 장치에 대해서 설명한다. 실시 형태 4는, 실시 형태 3과 공통된 구성을 갖는다. 이 때문에, 공통점에 대해서는 설명을 생략하고, 상위점을 중심으로 설명한다.
실시 형태 4에서는, 주위 소음의 발생 상황을 학습한 결과와 메모리로부터 읽어낸 입력 신호에 포함되는 음성 구간 길이에 따라서 재생 타이밍의 조정과 재생 속도 변경을 행할 수 있는 음성 재생 장치에 대해서 설명한다.
도 9는, 실시 형태 4에 있어서의 음성 재생 장치(1C)의 구성예를 나타내는 도면이다. 음성 재생 장치(1C)의 구성 요소는, 실시 형태 3의 음성 재생 장치(1B)(도 6)와의 비교에 있어서 이하의 점에서 다르다.
(1) 주위음 분석부(3) 대신의 주위음 분석부(3A)를 갖는다. 주위음 분석부(3A)는, 마이크로폰(2)으로부터의 주위음(소음)을 내부 메모리에 읽어들이고, 주위음의 발생 간격을 학습한다. 즉, 주위음 분석부(3A)는, 소음 레벨이 임계값 TH1 이상으로 되는 구간(소음 구간)의 간격을 측정하고, 어떤 소음 구간의 종기로부터 다음 소음 구간의 시기까지의 간격에 대해서 평균, 분산과 같은 통계량을 주위음 발생 간격으로서 산출한다. 주위음 발생 간격은, 제어부(5)에 입력된다.
(2) 지연 시간 측정부(9)(도 6)가 생략되어 있다. 이 때문에, 버퍼(61)의 축적량에 기초하는 지연 시간이 제어부(5)에 주어지지 않는다.
(3) 제어부(5)는, 주위음 분석부(3A)로부터의 주위음 발생 간격과, 특징 분석부(4A)로부터의 음성/비음성의 판정 결과 및 음성 구간 길이에 기초하여, 재생 타이밍 조정부(6)의 동작 모드, 및 재생 속도를 결정한다.
이상의 점을 제외하고, 음성 재생 장치(1C)의 구성은, 음성 재생 장치(1B)의 구성과 거의 마찬가지이다.
도 10은, 실시 형태 4에 있어서의 음성 재생 장치(1C)의 제어부(5)에 의한 처리예를 나타내는 플로우차트이다. 도 10에 도시하는 처리는, 예를 들면, 음성 재생 장치(1C)의 전원 투입을 트리거로서 개시할 수 있다.
제어부(5)는, 주위음 분석부(3A)로부터, 학습 결과인 주위음 발생 간격 정보를 수취하여, 제어부(5) 내의 내부 메모리(도시 생략)에 읽어들인다(스텝 S101). 주위음 발생 간격 정보는, 예를 들면, 간격 시간 길이와, 간격 시간 길이에 기초하여 구해지는 다음의 소음 발생 예상 시각을 포함할 수 있다.
다음으로, 제어부(5)는, 특징 분석부(4A)로부터 재생용 신호에 대한 음성/비음성의 판정 결과를 수취하여, 내부 메모리에 읽어들인다(스텝 S102).
다음으로, 제어부(5)는, 특징 분석부(4A)로부터 음성 구간 길이를 수취하여, 내부 메모리에 읽어들인다(스텝 S103).
다음으로, 제어부(5)는, 음성/비음성의 판정 결과를 이용하여, 재생 타이밍 조정부(6)에 입력된 재생용 신호가 음성 신호인지의 여부를 판정한다(스텝 S104). 이때, 재생용 신호가 음성 신호인 경우(S104 "예")에는, 처리가 스텝 S105로 진행된다. 이에 대해, 재생용 신호가 비음성 신호인 경우(S104 "아니오")에는, 처리가 스텝 S113으로 진행된다.
스텝 S105에서는, 제어부(5)는, 음성 신호의 음성 구간 길이가, 주위음 발생까지의 기간보다 짧은지의 여부를 판정한다. 주위음 발생까지의 기간은, 소음 발생 예상 시각과 현시각으로부터 구할 수 있다.
음성 구간 길이가 주위음 발생까지의 기간보다 짧은 경우(S105 "예")에는, 제어부(5)는, 주위음이 발생하기 전에 음성 신호의 재생이 종료된다고 하는 과정에 기초하여, 처리를 스텝 S106으로 진행한다. 이에 대해, 음성 구간 길이가 주위음 발생까지의 기간 이상인 경우(S105 "아니오")에는, 음성 신호의 재생이 끝나기 전에 주위음이 발생한다고 하는 과정에 기초하여, 처리를 스텝 S108로 진행한다.
스텝 S106에서는, 제어부(5)는, 동작 모드를 “기록 재생”으로 설정한다. 계속해서, 제어부(5)는, 재생 배율을 1배로 설정한다(스텝 S107). 그 후, 제어부(5)는, 동작 모드 “기록 재생”을 재생 타이밍 조정부(6)를 향하여 출력함과 함께, 재생 배율 “1배”를 재생 속도 변경부(7)를 향하여 출력한다(스텝 S114). 그 후, 처리가 스텝 S101로 되돌아간다.
그런데, 처리가 스텝 S108로 진행된 경우에는, 제어부(5)는, 음성 구간 길이에 0.5를 가한 것(음성 구간 길이의 1/2)이 주위음 발생까지의 기간보다 짧은(미만임)지의 여부를 판정한다.
이때, 음성 구간 길이의 1/2이 주위음 발생까지의 기간보다 짧은 경우(S108 "예")에는, 처리가 스텝 S109로 진행한다. 이에 대해, 음성 구간 길이의 1/2이 주위음 발생까지의 기간 이상인 경우(S108 "아니오")에는, 처리가 스텝 S111로 진행한다.
스텝 S109에서는, 제어부(5)는, 동작 모드를 “기록 재생”으로 설정한다. 계속해서, 제어부(5)는, 재생 배율을 X(1<X≤2)배로 설정한다(스텝 S110). 이때의 X의 값은, 예를 들면 음성 구간 길이의 길이에 기초하여 결정할 수 있다.
그 후, 제어부(5)는, 동작 모드 “기록 재생”을 재생 타이밍 조정부(6)를 향하여 출력함과 함께, 재생 배율 “X배”를 재생 속도 변경부(7)를 향하여 출력한다(스텝 S114). 그 후, 처리가 스텝 S101로 되돌아간다.
처리가 스텝 S111로 진행된 경우에는, 제어부(5)는, 동작 모드를 “기록”으로 설정한다. 계속해서, 제어부(5)는, 재생 배율을 0배로 설정한다(스텝 S112).
그 후, 제어부(5)는, 동작 모드 “기록”을 재생 타이밍 조정부(6)를 향하여 출력함과 함께, 재생 배율 “0배”를 재생 속도 변경부(7)를 향하여 출력한다(스텝 S114). 그 후, 처리가 스텝 S101로 되돌아간다.
처리가 스텝 S104로 진행된 경우에는, 제어부(5)는, 동작 모드를 “처리 없음”으로 설정한다. 계속해서, 제어부(5)는, 재생 배율을 0배로 설정한다(스텝 S112).
그 후, 제어부(5)는, 동작 모드 “처리 없음”을 재생 타이밍 조정부(6)를 향하여 출력함과 함께, 재생 배율 “0배”를 재생 속도 변경부(7)를 향하여 출력한다(스텝 S114). 그 후, 처리가 스텝 S101로 되돌아간다.
실시 형태 4의 음성 재생 장치(1C)에 의하면, 주위음 분석부(3)가, 주위음의 간격을 학습하고, 제어부(5)에 부여한다. 제어부(5)는, 음성 구간 길이와 다음의 주위음(소음) 발생까지의 기간을 비교하고, 다음의 소음 발생까지 음성 신호의 재생이 끝난 경우에는, 1배속에서의 동시 기록 재생이 행해지도록 제어를 행한다.
이에 대해, 음성 구간 길이보다 다음의 주위음 발생까지의 기간이 긴 경우에는, 음성 구간 길이의 음성 신호를 재생하면, 그 재생 중에 주위음이 발생할 가능성이 있다. 이 경우, 제어부(5)는, 음성 구간 길이 음성 구간 길이의 절반의 길이(음성 구간 길이/2)와 다음의 주위음 발생까지의 기간을 비교하고, 음성 구간 길이/2의 값이 다음의 주위음 발생까지의 기간보다 짧은 경우에는, X배속에서의 동시 기록 재생이 행해지도록 제어를 행한다.
음성 구간 길이/2의 값이 다음의 주위음 발생까지의 기간이 음성 구간 길이/2의 값 이상인 경우에는, 음성 신호의 기록만을 행하여, 주위음 간격 중에 재생이 행해지도록 재생 타이밍을 지연시킨다. 이에 의해, 재생 속도를 지나치게 빠르게 하여 듣기 용이함을 저하시키지 않고, 소음에 겹치지 않도록 재생을 행하여, 재생음을 듣기 용이하게 할 수 있다.
1, 1A, 1B, 1C : 음성 재생 장치
2 : 마이크로폰
3, 3A : 주위음 분석부
4 : 음성 분석부
4A : 특징 분석부
5 : 제어부
6 : 재생 타이밍 조정부
7 : 재생 속도 변경부
8 : 스피커
61 : 버퍼(메모리)
62 : 기록부
63 : 기록 재생부
64 : 출력 선택부

Claims (12)

  1. 주위음의 특징을 분석하는 주위음 분석부와,
    재생용 신호의 음향 특징을 분석하는 특징 분석부와,
    상기 재생용 신호를 기록 매체에 기록하는 한편, 추적 재생의 재생 타이밍에서 상기 기록 매체로부터 상기 재생용 신호를 읽어내는 재생 타이밍 조정부와,
    상기 기록 매체로부터 읽어내어진 상기 재생용 신호의 재생 속도를 변경하는 재생 속도 변경부와,
    상기 주위음 분석부의 분석 결과에 따른 재생 타이밍에서 상기 재생용 신호가 재생되도록 상기 재생 타이밍 조정부를 제어하는 한편, 상기 주위음 분석부의 분석 결과, 및 상기 특징 분석부에 의해 얻어진 음향 특징에 따른 재생 속도로 상기 재생용 신호가 재생되도록 상기 재생 속도 변경부를 제어하는 제어부
    를 포함하는 음성 재생 장치.
  2. 제1항에 있어서,
    상기 주위음 분석부의 분석 결과는 주위음 레벨을 포함하고,
    상기 제어부는, 상기 주위음 레벨이 소정의 레벨 임계값 이상의 사이, 상기 재생용 신호가 상기 기록 매체에 기록되고, 상기 주위음 레벨이 상기 소정의 임계값 미만의 사이, 상기 기록 매체에 기록된 상기 재생용 신호가 추적 재생되도록, 상기 재생 타이밍 조정부를 제어하는 음성 재생 장치.
  3. 제2항에 있어서,
    상기 기록 매체의 축적량에 따른 지연 시간을 측정하는 측정부를 더 포함하고,
    상기 제어부는, 상기 주위음 레벨이 소정의 레벨 임계값 이상이며, 또한 상기 지연 시간이 소정의 지연 임계값보다 작은 경우에, 상기 재생용 신호가 상기 기록 매체에 기록되는 제어를 행하는 음성 재생 장치.
  4. 제3항에 있어서,
    상기 제어부는, 상기 주위음 레벨이 소정의 레벨 임계값 이상이지만, 상기 지연 시간이 소정의 시간 임계값 이상인 경우에는, 상기 기록 매체에 기록된 재생용 신호의 추적 재생이 행해지도록 상기 재생 타이밍 조정부를 제어하는 음성 재생 장치.
  5. 제1항에 있어서,
    상기 특징 분석부에 의해 얻어지는 음향 특징은, 상기 재생용 신호가 음성 신호인지 비음성 신호인지의 판단 결과를 포함하고,
    상기 제어부는, 상기 재생용 신호가 음성 신호이면 상기 기록 매체에의 기록이 행해지고, 상기 재생용 신호가 비음성 신호이면 상기 기록 매체에의 기록이 행해지지 않도록 상기 재생 타이밍 조정부를 제어하는 음성 재생 장치.
  6. 제1항에 있어서,
    상기 특징 분석부에 의해 얻어지는 음향 특징은, 음성 신호인 상기 재생용 신호의 피치 주파수를 포함하고,
    상기 제어부는, 상기 피치 주파수에 따른 재생 속도로 상기 재생용 신호가 재생되도록 상기 재생 속도 변경부를 제어하는 음성 재생 장치.
  7. 제1항에 있어서,
    상기 특징 분석부에 의해 얻어지는 음향 특징은, 음성 신호인 상기 재생용 신호의 음성 구간 길이를 포함하고,
    상기 제어부는, 상기 음성 구간 길이에 따른 재생 속도로 상기 재생용 신호가 재생되도록, 상기 재생 속도 변경부를 제어하는 음성 재생 장치.
  8. 제1항에 있어서,
    상기 특징 분석부에 의해 얻어지는 음향 특징은, 음성 신호인 상기 재생용 신호의 음성 구간 길이를 포함하고,
    상기 제어부는, 상기 기록 매체에 기록된 상기 재생용 신호가, 상기 음성 구간 길이에 기초하여 상기 재생용 신호의 선두로 되돌아가 읽어내어지도록 상기 재생 타이밍 조정부를 제어하는 음성 재생 장치.
  9. 제1항에 있어서,
    상기 주위음 분석부의 분석 결과가, 주기적으로 생기는 주위음의 간격을 포함하고,
    상기 특징 분석부에 의해 얻어지는 음향 특징이, 음성 신호인 상기 재생용 신호의 음성 구간 길이를 포함하고,
    상기 제어부는, 상기 음성 구간 길이와, 상기 주위음의 간격으로부터 구해지는 현시각으로부터 다음의 주위음 발생 시각까지의 시간 길이와의 관계에 기초하는 재생 속도로 상기 재생용 신호가 재생되도록 상기 재생 속도 변경부를 제어하는 음성 재생 장치.
  10. 제9항에 있어서,
    상기 제어부는, 재생 속도를 최대로 하였을 때의 상기 음성 구간 길이의 길이가 상기 시간 길이보다 긴 경우에, 상기 재생용 신호가 재생되지 않고 상기 기록 매체에 기록되는 제어를 행하는 음성 재생 장치.
  11. 제1항에 있어서,
    상기 주위음 분석부는 주위음의 발생 상황을 학습하고,
    상기 제어부는 주위음의 발생의 학습 결과에 기초하여 상기 재생용 신호의 재생 타이밍이 시프트하도록 상기 재생 타이밍 조정부를 제어하는 음성 재생 장치.
  12. 주위음의 특징을 분석하고,
    재생용 신호의 음향 특징을 분석하고,
    주위음의 분석 결과에 따른 재생 타이밍에서, 또한 상기 음향 특징에 따른 재생 속도로 상기 재생용 신호가 재생되도록 제어를 행하는
    것을 포함하는 음성 재생 방법.
KR1020127005656A 2009-09-02 2009-09-02 음성 재생 장치 및 음성 재생 방법 KR20120061862A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/065349 WO2011027437A1 (ja) 2009-09-02 2009-09-02 音声再生装置および音声再生方法

Publications (1)

Publication Number Publication Date
KR20120061862A true KR20120061862A (ko) 2012-06-13

Family

ID=43648998

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127005656A KR20120061862A (ko) 2009-09-02 2009-09-02 음성 재생 장치 및 음성 재생 방법

Country Status (6)

Country Link
US (1) US8457955B2 (ko)
EP (1) EP2474974A1 (ko)
JP (1) JPWO2011027437A1 (ko)
KR (1) KR20120061862A (ko)
CN (1) CN102483920A (ko)
WO (1) WO2011027437A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961441B2 (en) 2013-06-27 2018-05-01 Dsp Group Ltd. Near-end listening intelligibility enhancement
JP2016225755A (ja) * 2015-05-28 2016-12-28 富士通株式会社 通話装置およびプログラム
JP7240116B2 (ja) * 2018-09-11 2023-03-15 カワサキモータース株式会社 乗物の音声システム及び音声出力方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332500A (ja) * 1993-05-21 1994-12-02 Olympus Optical Co Ltd 可変速再生機能付音声再生装置
JPH08162981A (ja) * 1994-12-09 1996-06-21 Sanyo Electric Co Ltd 放送音声再生装置
JPH1049191A (ja) * 1996-07-31 1998-02-20 Denso Corp 話速変換装置
JPH11202896A (ja) * 1998-01-14 1999-07-30 Kokusai Electric Co Ltd 音声高域強調方法及び音声高域強調装置
JP2000349893A (ja) 1999-06-08 2000-12-15 Matsushita Electric Ind Co Ltd 音声再生方法および音声再生装置
JP3849116B2 (ja) 2001-02-28 2006-11-22 富士通株式会社 音声検出装置及び音声検出プログラム
JP2002287800A (ja) 2001-03-28 2002-10-04 Toshiba Corp 音声信号処理装置
JP3804569B2 (ja) * 2002-04-12 2006-08-02 ブラザー工業株式会社 文章読み上げ装置、文章読み上げ方法、及びプログラム
EP1840877A4 (en) * 2005-01-18 2008-05-21 Fujitsu Ltd ELOCUTION SPEED CHANGING METHOD AND ELOCUTION SPEED CHANGING DEVICE
JP4675692B2 (ja) 2005-06-22 2011-04-27 富士通株式会社 話速変換装置
JP4771857B2 (ja) * 2006-05-17 2011-09-14 三洋電機株式会社 放送受信装置
JP4965371B2 (ja) * 2006-07-31 2012-07-04 パナソニック株式会社 音声再生装置
WO2009011021A1 (ja) * 2007-07-13 2009-01-22 Panasonic Corporation 話速変換装置及び話速変換方法

Also Published As

Publication number Publication date
CN102483920A (zh) 2012-05-30
US8457955B2 (en) 2013-06-04
EP2474974A1 (en) 2012-07-11
US20120158403A1 (en) 2012-06-21
JPWO2011027437A1 (ja) 2013-01-31
WO2011027437A1 (ja) 2011-03-10

Similar Documents

Publication Publication Date Title
US9299333B2 (en) System for adaptive audio signal shaping for improved playback in a noisy environment
KR101455710B1 (ko) 오디오 명료도를 향상시키는 방법 및 장치, 그리고 컴퓨팅 장치
KR101334366B1 (ko) 오디오 배속 재생 방법 및 장치
US20080310652A1 (en) Device and Method for Audio Signal Gain Control
JP4940158B2 (ja) 音補正装置
US9271089B2 (en) Voice control device and voice control method
US20160267925A1 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
KR20090006756A (ko) 음성 프로세서 및 통신 단말 장치
JPWO2006008810A1 (ja) 速度変換装置、速度変換方法及びプログラム
KR20120061862A (ko) 음성 재생 장치 및 음성 재생 방법
JP5172580B2 (ja) 音補正装置及び音補正方法
KR20010015110A (ko) 주변 잡음 레벨 추정 장치, 통신 장치, 데이타 터미날장치 및 주변 잡음 레벨 추정 방법
JP2001188599A (ja) オーディオ信号復号装置
CN106293607B (zh) 自动切换音频输出模式的方法及系统
JP2000349893A (ja) 音声再生方法および音声再生装置
CN111694539A (zh) 在听筒和扬声器之间切换的方法、装置及介质
JP4814861B2 (ja) 音量調整装置、方法及びプログラム
JP4275055B2 (ja) 音質調整装置、放送受信機、プログラム、及び記録媒体
JPH08298698A (ja) 環境音分析装置
KR100661551B1 (ko) 이동단말기의 스피커와 마이크의 음량 조절 장치
KR102422794B1 (ko) 재생지연 조절 방법 및 장치와 시간축 변형방법 및 장치
KR101258057B1 (ko) 청각인지 마스킹 특성을 이용하여 주변잡음에 적응적인 전화기 벨소리 음량조정 장치 및 방법
CN114783460A (zh) 检测采集的声音一致性的方法、系统、设备和存储介质
JP2013135462A (ja) 携帯端末、制御方法、及びプログラム
KR20060006475A (ko) 이동통신단말기의 녹음 음성 벨소리 변환장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right