JP2007334968A - Voice switching apparatus - Google Patents

Voice switching apparatus Download PDF

Info

Publication number
JP2007334968A
JP2007334968A JP2006164005A JP2006164005A JP2007334968A JP 2007334968 A JP2007334968 A JP 2007334968A JP 2006164005 A JP2006164005 A JP 2006164005A JP 2006164005 A JP2006164005 A JP 2006164005A JP 2007334968 A JP2007334968 A JP 2007334968A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
voice
sound
music
switching
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006164005A
Other languages
Japanese (ja)
Inventor
Yuki Okawa
友樹 大川
Original Assignee
Pioneer Electronic Corp
Pioneer Solutions Corp
パイオニアソリューションズ株式会社
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice switching apparatus in which surrounding change can be accurately recognized when a user listens to music. <P>SOLUTION: The apparatus is provided with: a storage device 101 storing external sound as a recorded sound; an analysis device 103 discriminating whether the external sound satisfies discrimination conditions or not; a reproducing device 102 reproducing recorded sound stored in the storage device 101; and a switching unit 105 switching alternatively music input from a music reproducing device 10, the external sound, and the recorded sound reproduced by the reproducing device, and outputting it to a loudspeaker 31, and when it is decided that the external sound satisfies discrimination conditions, the sound recorded a predetermined time before the satisfaction of conditions is detected is reproduced and output from the loudspeaker 31. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、音声切換装置に関し、詳細には、利用者がヘッドフォン等で音楽を聴きながら必要な周囲の状況を的確に把握することが可能な音声切換装置に関する。 The present invention relates to voice switching apparatus and, more particularly, to voice switching apparatus capable user to accurately grasp the situation around the required while listening to music on headphones or the like.

従来、CDやMD、フラッシュメモリなどの記録メディアに記憶された音楽データを再生する携帯可能な携帯音楽再生装置が知られている。 Conventional, CD or MD, a portable portable music reproduction apparatus is known for reproducing music data stored in a recording medium such as a flash memory. 該携帯音楽再生装置は、通常、ヘッドフォンを用いて使用者のみが再生された音楽を聴くようになっている。 The portable music playback device, usually, is adapted to listen to music that only the user is played using headphones. 携帯音楽再生装置の音楽を再生して、ヘッドフォンで聴く場合、外部の音が聴こえ難い。 To play the music of the portable music playback device, if you listen with headphones, it is difficult to hear the external sound. これは、音楽のみを聴くには良い点であるが、例えば、電車などの公共交通施設を利用しているときには、電車内の放送(停車駅を知らせる放送など)がよく聞き取れず、乗り過ごすことがあるという問題がある。 This is a good point to listen to music only, for example, when you are using public transportation facilities such as train, (such as broadcasting to inform the stop station) broadcast of the train does not hear well, that ride past there is a problem in that there is. また、会話を行う際には、いちいちヘッドフォンを外さなければならず、面倒であるという問題がある。 In addition, when performing the conversation must be one by one remove the headphones, there is a problem in that it is cumbersome.

上記問題を解決するために、例えば、特許文献1の携帯音声再生装置では、マイクから入力される外部音声を音声認識し、音声認識された外部音声が予め記憶された所定の語句と一致した場合に、その旨を通知する技術が開示されている。 In order to solve the above problems, for example, in a portable audio playback apparatus of Patent Document 1, the external sound input from the microphone and speech recognition, if the speech recognized external voice matches the predetermined phrase stored in advance to a technique for notifying to that effect have been disclosed.

しかしながら、特許文献1では、例えば、目的の降車駅を「うらわ」と登録した場合、「みなみうらわ」や「きたうらわ」というアナウンスに対して、音声認識の結果、一致と判断して、利用者に「うらわ」と通知することになるため、利用者は「うらわ」が「みなみうらわ」であるのか、「きたうらわ」であるのかを判断することができないという問題がある。 However, in Patent Document 1, for example, if you register a destination station of interest as "Urawa", with respect to the announcement of "Minami Urawa" and "Kitaurawa", the result of speech recognition, it is determined that the match , because that will be notified as "Urawa" to the user, whether the user is a "Urawa" is "Minami Urawa", is a problem that it is not possible to determine whether it is "Kitaurawa" is there.

また、特許文献1では、例えば、「うらわ」駅で下車しようとしている場合において、周囲の人物が目的地とは異なる場所で「うらわ」と発した場合、音声認識の結果、一致と判断して、利用者に「うらわ」と通知される場合がある。 In Patent Document 1, for example, when trying to get off at "Urawa" station, if the periphery of the person is issued a "Urawa" at a different location from the destination, the result of speech recognition, consistent with decision to, there is a case to be notified as "Urawa" to the user. しかし、直ぐには、その通知が車掌アナウンスによるものか周囲の人物によるものかを判断できないという問題がある。 However, immediately, there is a problem that can not be determined or not the notice by anyone around or not by the conductor announcement.

また、利用者は音楽再生の利用を「周囲の騒音が好ましくないため、音楽再生を利用する」というケースもあるが、特許文献1では、周囲の騒音が静かになったら音楽再生を中止したいという要望に応えることができないという問題がある。 In addition, "because of the noise of the surrounding undesirable, to use the music playback" the user the use of music playback, but there is also a case that, in Patent Document 1, that want to stop the music playback Once you become quiet the noise of the surrounding there is a problem that it can not meet the demand.

また、特許文献2のヘッドセットでは、マイクから入力される外部音声を音声認識し、 Further, the headset of Patent Document 2, speech recognition external sound input from the microphone,
音声認識の結果、特定のキーワード、特定の人の声紋、または一定基準音量以上の音が一定時間検出された場合に、音楽再生装置から入力される音楽出力を停止して、利用者が外部音声を聞こえるようにする技術が開示されている。 Result of the speech recognition, specific keyword, if a particular human voice print or constant reference sound volume or sound was detected a predetermined time, stop the music output inputted from the music reproduction apparatus, the user external audio technology to be heard has been disclosed. 特許文献2によれば、音楽鑑賞中も特定人物の呼びかけや電話の呼び出しにも直ぐに反応することができる。 According to Patent Document 2, it is possible to react immediately to a call or phone call even specific person in music appreciation.

しかしながら、特許文献2では、「声紋一致」および「一定基準音量以上の音の検出」によって再生中の音楽がミュートされた場合、どのような呼びかけ、音によって音楽再生がミュートされたのかを判別することができないという問題がある。 However, in Patent Document 2, the music being played by the "voice print match" and "detection of a predetermined reference sound volume or sound" may have been muted, any call, music playback is to determine whether the muted by the sound that there is a problem that can not be.

例えば、音楽鑑賞中の利用者に対して「夕飯を食べに行こうよ」という呼びかけに対して、声紋一致した場合、音楽再生はミュートされたが、利用者はなぜ音楽再生がミュートされたのかがわからないという問題がある。 For example, for a call of "Let's go to eat dinner" to the user in listening to music, if you voiceprint match, but music playback has been muted, whether the user is why music playback is muted there is a problem that is not known. 例えば、音楽鑑賞中の利用者周辺でドアブザー音が鳴り響いた場合、音楽再生はミュートされたが、その中断がドアブザーなのか、電話コールなのか、または誰かの呼びかけなのかを判別することができないとい問題がある。 For example, if the rang is Doabuza sound at the user around in music appreciation, although the music reproduction is muted, have its interruption or Doabuza of the, it is impossible to determine whether telephone calls that the or someone calling such of There's a problem. さらに、特許文献1と同様、周囲の騒音が静かになったら音楽再生を中止したいという要望に応えることができないという問題がある。 In addition, as in Patent Document 1, there is a problem of not being able to meet the desire to stop the music playback Once you become quiet the noise of the surrounding.

特開2001−256771号公報 JP 2001-256771 JP 特開2005−192004号公報 JP 2005-192004 JP

本発明は、上記課題に鑑みてなされたものであり、主として、利用者が音楽鑑賞をしている場合に、周囲の状況変化を的確に把握することが可能な音声切換装置を提供することを目的とする。 The present invention has been made in view of the above problems, primarily when the user is music appreciation, to provide a voice switching device capable of accurately grasp the situation changes in the ambient for the purpose.

上述した課題を解決し、目的を達成するために、本発明は、マイクから入力される外部音声を録音音声として記憶する記憶手段と、前記マイクから入力される外部音声が判定条件に一致するか否かを判定する解析手段と、前記記憶手段に記憶した録音音声を再生する再生手段と、音楽再生装置から入力される音楽、前記マイクから入力される外部音声、および前記再生手段で再生される録音音声を択一的に切り換えてスピーカーに出力する切換手段と、を備え、前記解析手段により前記マイクから入力される外部音声が判定条件に一致すると判断された場合、前記再生手段は、条件一致を検出した時点よりも所定時間前からの録音音声を再生し、前記切換手段は当該再生した録音音声をスピーカーに出力することを特徴とする。 To solve the above problems and achieve the object, the present invention is either a storage means for storing the external sound input from the microphone as recorded speech, the external sound input from the microphone matches the determination condition and determining analyzing means whether a reproducing means for reproducing the recorded speech stored in the storage means, the music inputted from the music reproduction apparatus is reproduced by the external audio, and said reproducing means is input from the microphone If a switching means for outputting to the speaker switched voice recording Alternatively, with the external sound input from the microphone by the analyzing means is determined to match the determination condition, the reproducing means, condition match the play the recorded sound from the predetermined time before the time of detecting said switching means and outputting the recorded speech and the reproduced to the speaker.

以下に添付図面を参照して、この発明にかかる音声切換装置の最良な実施の形態を詳細に説明する。 With reference to the accompanying drawings, illustrating the best embodiment of the speech switching apparatus according to the present invention in detail. この実施の形態によりこの発明が限定されるものではない。 Not that the present invention is not limited by this embodiment. また、下記実施の形態における構成要素には、当業者が容易に想定できるものまたは実質的に同一のものが含まれる。 In addition, constituent elements in the following embodiments, those skilled in the art include easily assume or that are substantially equivalent.

(実施の形態) (Embodiment)
本実施の形態に係る音声切換装置は、マイクから入力される外部音声を録音音声として記憶する記憶手段と、前記マイクから入力される外部音声が判定条件に一致するか否かを判定する解析手段と、前記記憶手段に記憶した録音音声を再生する再生手段と、音楽再生装置から入力される音楽、前記マイクから入力される外部音声、および前記再生手段で再生される録音音声を択一的に切り換えてスピーカーに出力する切換手段と、を備え、前記解析手段により前記マイクから入力される外部音声が判定条件に一致すると判断された場合、前記再生手段は、条件一致を検出した時点よりも所定時間前からの録音音声を再生し、前記切換手段は当該再生した録音音声をスピーカーに出力する。 Voice switching apparatus according to this embodiment, the storage means and determines analyzing means whether the external sound matches the determination condition input from the microphone to store the external sound input from the microphone as the recording audio When a reproducing means for reproducing the recorded speech stored in the storage means, the music inputted from the music reproducing apparatus, alternatively the recorded sound to be played by the external sound, and the reproducing means is input from the microphone If and a switching means for outputting to the speaker switched, external audio input from the microphone by the analyzing means is determined to match the determination condition, the playback means, a predetermined than the time of detecting the condition match play the recorded sound from the time before, the switching means outputs the recorded speech and the reproduced to the speaker. この所定時間は、判定条件に一致した音声および利用者が該一致した音声の前後関係を把握するために必要な先行時間を含む長さ(図6のΔT=Δt1+Δt3参照)であることが望ましい。 The predetermined time is preferably audio and user matching the judgment condition is the length including the lead time required to understand the context of the speech that match the (see ΔT = Δt1 + Δt3 in FIG. 6).

本実施の形態の音声切換装置によれば、マイクから入力される外部音声が判定条件に一致した場合に、現時点よりも所定時間前からの録音音声を再生して、スピーカーに出力することができ、ヘッドフォン等を使用して音楽鑑賞をしている場合に、周囲の状況変化を的確に把握することが可能となる。 According to the voice switching apparatus of this embodiment, when the external sound input from the microphone matches the determining condition, playing a recorded voice from predetermined time before the present time, can be output to the speaker , if you are using headphones or the like is music appreciation, it is possible to accurately grasp the situation changes in the ambient.

また、再生手段は、録音音声を短縮再生(録音音声の録音時間よりも短い時間で再生)し、具体的には、通常の音声再生よりも早い再生スピードで再生(スピード再生)し、若しくは、無音部分をSKIP(スキップ)して再生(SKIP再生)するのが望ましい。 The reproducing means, recording audio shortened playback (reproduction in a shorter time than the recording time of the recorded speech), specifically, plays an early playback speed than the normal audio playback (speed reproduction), or, Play silence and sKIP (skip) (sKIP playback) to desirably.
また、再生手段は、前記録音音声の再生は実時間に追いつくまで行なうことが望ましい。 The reproduction means, reproduction of the recorded sound is desirably performed until catch up to real time. これにより、ライブの外部音声に追いつくことができ、意識の切換をスムースにさせることができる。 As a result, it is possible to catch up with the external sound of live, it can be the switching of consciousness smoothly.

また、前記録音音声の再生の前に、所定の音声を再生する音声再生手段を備えることが望ましい。 Further, before the recorded sound reproduction, it is desirable to provide a sound reproducing means for reproducing a predetermined sound. これにより、利用者は録音音声が再生されることを前もって知ることが可能となる。 Thus, the user is able to know in advance that the recorded sound is played.

また、解析手段は、判定条件として、キーワード、声紋、音声パターン、および音声レベルのうちの1または複数を予め記憶しておき、マイクから入力される外部音声がキーワード、声紋、音声パターン、および音声レベル等と一致するか否かを判定することが望ましい。 Furthermore, analysis means, as a determination condition, keyword, voiceprint, voice patterns, and storing in advance one or more of the sound level, the external audio keyword inputted from a microphone, voice print, speech pattern, and voice it is desirable to determine whether to match the level or the like. これにより、外部音声がキーワード、声紋、音声パターン、および音声レベルの条件に一致した場合に、利用者は現時点よりも所定時間前からの録音音声を聴くことができ、例えば、ヘッドフォンをして音楽鑑賞をしている電車の利用者は、降車駅のような外部アナウンスを的確に判別することができ、また、外部から利用者への呼びかけや周辺環境状況の変化等を認識することが可能となる。 Thus, the external sound keywords, voiceprint, when matching the voice pattern, and audio level conditions, the user can listen to the recorded speech from the predetermined time before the present time, for example, by a headphone music the user of the train that the appreciation is, an external announcement, such as a getting-off station can be accurately determined, also, that it is possible to recognize the change and the like of the interrogation and the surrounding environmental conditions to the user from the outside Become.

また、再生手段は、録音音声を短縮再生(録音音声の録音時間よりも短い時間で再生)し、具体的には、通常の音声再生よりも早い再生スピードで再生(スピード再生)し、若しくは、無音部分をSKIP(スキップ)して再生(SKIP再生)するのが望ましい。 The reproducing means, recording audio shortened playback (reproduction in a shorter time than the recording time of the recorded speech), specifically, plays an early playback speed than the normal audio playback (speed reproduction), or, Play silence and sKIP (skip) (sKIP playback) to desirably. これにより、ライブの外部音声に追いつくことができ、意識の切換をスムースにさせることができる。 As a result, it is possible to catch up with the external sound of live, it can be the switching of consciousness smoothly.

また、解析手段は、判定条件として、キーワード、声紋、音声パターン、および音声レベルのうちの1または複数を予め記憶しておき、マイクから入力される外部音声がキーワード、声紋、音声パターン、および音声レベル等と一致するか否かを判定することが望ましい。 Furthermore, analysis means, as a determination condition, keyword, voiceprint, voice patterns, and storing in advance one or more of the sound level, the external audio keyword inputted from a microphone, voice print, speech pattern, and voice it is desirable to determine whether to match the level or the like. これにより、外部音声がキーワード、声紋、音声パターン、および音声レベルの条件に一致した場合に、利用者は現時点よりも所定時間前からの所定時間前(図6のΔT=Δt1+Δt3)からの録音音声を聴くことができ、例えば、ヘッドフォンをして音楽鑑賞をしている電車の利用者は、降車駅のような外部アナウンスを的確に判別することができ、また、外部から利用者への呼びかけや周辺環境状況の変化等を認識することが可能となる。 Thus, the external sound keywords, voiceprint, when matching the voice pattern, and the audio level conditions, the user recorded speech from than the present time before a predetermined time from the predetermined time before (ΔT = Δt1 + Δt3 in FIG. 6) can listen to, for example, a user of the train and the headphones are a music appreciation, the external announcement, such as a getting-off station can be accurately determined, also, Ya calling from outside to the user it becomes possible to recognize the changes in the surrounding environment situation.

また、スピーカーは、ヘッドフォンに内蔵されるスピーカーであることが望ましい。 Further, the speaker is preferably a speaker built in the headphone. これにより、ヘッドフォンを使用して、音声再生装置で再生される音楽を鑑賞している際に、周囲の状況変化を的確に把握することが可能となる。 Thus, by using the headphones, when you are watching the music played by the audio reproduction apparatus, it is possible to accurately grasp the situation changes in the ambient.

(実施例) (Example)
図1は、本発明に係る音声切換装置を適用したヘッドフォンシステムの外観構成を示す図である。 Figure 1 is a diagram showing an external configuration of a headphone system to which the voice switching apparatus according to the present invention. 同図において、10は、CDやMD、フラッシュメモリなどの記録メディアに記憶された音楽データを再生する携帯可能な音声再生装置、20は、操作部21やマイク22が搭載されるスイッチ部、21は、音声再生装置10の音楽の再生/停止等を操作するための操作部、22は、外部の音声を集音するためのマイク、30はヘッドフォン、31は、ヘッドフォン30に搭載されたスピーカーを示している。 In the figure, 10 is a CD or MD, portable audio reproducing apparatus for reproducing music data stored in a recording medium such as a flash memory, 20 is a switch unit for the operation unit 21 and a microphone 22 are mounted, 21 the operating portion for operating the reproduction / stop of music of the audio reproducing apparatus 10, 22 includes a microphone for collecting external sound, 30 headphones, 31, the speaker mounted on the headphone 30 shows. 本発明に係る音声切換装置100は、スイッチ部20の内部に搭載される。 Voice switching apparatus 100 according to the present invention is mounted inside the switch unit 20.

図2は、本発明に係る音声切換装置100のブロック構成を示す図である。 Figure 2 is a block diagram showing the configuration of the speech switching apparatus 100 according to the present invention. 音声切換装置100は、図2に示すように、記憶装置101、再生装置102、解析装置103、検出器104、切換器105を備えている。 Voice switching apparatus 100 includes, as shown in FIG. 2, the storage device 101, the reproduction apparatus 102, the analyzer 103, detector 104, and a switcher 105.

マイク21は、音声切換装置100の利用中(電源稼動中)、終始周囲の音声を集音し、集音された音声は外部音声として、記憶装置101、音声解析装置103、切換器105に出力される。 Microphone 21 (during power running) utilized in speech switching apparatus 100, throughout it collects sound around, as collected voice is external audio, storage device 101 outputs the voice analyzer 103, a switcher 105 It is.

切換器105は、検出器104や操作部22からの切換指示に従って、マイク21から入力される外部音声、再生装置102から入力される録音音声、音楽再生装置10から入力される音楽を択一的に切り換えて、スピーカー31に出力する。 Switcher 105, in accordance with the switching instruction from the detector 104 or the operation unit 22, alternatively the external sound input from the microphone 21, record audio input from the playback device 102, a music input from the music reproduction apparatus 10 in switching, and outputs it to the speaker 31.

記憶装置101は、電源稼動中、マイク21から入力される外部音声の録音を継続する。 Storage device 101, during power operation, and continues recording of external sound input from the microphone 21. ここで、録音によって録音音声が保持される時間をΔTとする。 Here, the time for voice recording is held by recording and [Delta] T.

検出器104は、音楽再生装置10からの音楽の入力/停止や再生装置102からの録音音声の入力を検出して、切換器105に対する切換指示や解析装置103に対する解析指示を出力する。 Detector 104 detects the recording input audio from the input / stop and playback device 102 of the music from the music reproducing device 10, and outputs an analysis instruction to the switching instruction and analysis apparatus 103 for the switcher 105.

再生装置102は、解析装置103から録音音声再生指示(PLAY)が入力されると、記憶装置101に蓄積された外部音声を録音音声として再生して、検出器104および切換器105に出力する。 Reproducing apparatus 102, the recorded voice reproduction instruction from the analyzer 103 (PLAY) is input, and reproduces the external sound stored in the storage device 101 as recorded speech, and outputs to the detector 104 and switching unit 105.

解析装置103は、検出器104から判定開始指示が入力されると、マイク21から入力される外部音声を認識し、予め保存している判定条件テーブル(図4参照)に登録されている判定条件(所定キーワード、声紋、音声パターン、音声レベル)と一致するか否かを判定し、一致した場合には、解析を停止して再生装置102に対して、録音音声再生指示(PLAY)を出力する。 Analyzer 103, when the determination start instruction from the detector 104 is inputted, recognizing the external sound input from the microphone 21, the determination condition registered in the previously stored to that determination condition table (see FIG. 4) determining (predetermined keyword, voiceprint, voice patterns, sound level) whether consistent with, if there is a match, the playback apparatus 102 to stop the analysis, and outputs the recorded sound reproduction instruction (PLAY) .

具体的には、解析装置103は、入力される外部音声に対して、音声認識する音声認識手段、声紋認識する声紋認識手段、音声パターン認識する音声パターン認識手段、音声レベルを測定する音声レベル測定手段等を備えており、入力される外部音声が、予め条件判定テーブルに登録されている所定キーワード、声紋、音声パターン、音声レベルと一致するか否かを検出する。 Specifically, the analysis unit 103 to the external audio input, speech recognition speech recognition means, voiceprint recognizing voiceprint recognition means, audio pattern recognizing speech pattern recognition unit, sound level measurement for measuring the sound level comprises means such as an external sound input is a predetermined keyword registered in advance condition decision table, voiceprint, detects a voice pattern, whether to match the audio level.

図4は、判定条件テーブルの構成例を示す図である。 Figure 4 is a diagram showing a configuration example of the determination condition table. 判定条件テーブルには、図4に示すように、所定キーワード、声紋、音声パターン、および音声レベルの比較要素と、通知する場合の関連語句が登録される。 The determination condition table, as shown in FIG. 4, a predetermined keyword, voiceprint, and Comparative Element voice patterns, and audio level, the related phrases used for notifying registered. 判定条件テーブルのデータは不図示の入力手段で利用者が任意に登録可能となっている。 Data of the determination condition table is adapted to be arbitrarily registered by the user at the input means (not shown). 例えば、図4に示す判定条件テーブルでは、所定キーワードとして「うらわ」、声紋として「友人Aの声紋データ」、音声レベルとして「20dB以下」、および音声パターンとして「電話ベルの音声パターンデータ」が登録されており、解析装置103は、外部音声がこれらの比較要素(判定条件)の少なくとも1つと一致するか否かの判定を行う。 For example, the determination condition table illustrated in FIG. 4, "Urawa" as the predetermined keyword is "20dB or less" as "voiceprint data friend A", the sound level, and "voice pattern data of the telephone bell" as a voice pattern as voiceprint is registered, the analysis apparatus 103, the external sound to determine whether to match at least one of these comparisons elements (determination condition). なお、条件一致を判定した場合には、対応する関連語句の音声をスピーカー31から出力して、利用者にどの判定条件で一致を検出したかを通知することにしてもよい。 Incidentally, when it is determined condition match outputs a sound corresponding related phrases from the speaker 31 may be to notify whether it has detected a match in which the determination condition to the user. 例えば、図4に示す例では、「所定キーワード」の「うらわ」で条件一致を検出した場合には、「うらわ」を検出した旨を通知し、また、「友人Aの声紋データ」で条件一致を検出した場合には、「友人Aの声紋」を検出した旨を通知する。 For example, in the example shown in FIG. 4, in the case of detecting a condition consistent with "Urawa" in "predetermined keyword" it is notified that detects a "Urawa", also "voiceprint data friend A" in the case of detecting the conditions match, the notification that it has detected a "voice print of a friend a".

また、ここでは、判定条件を所定キーワード、声紋、音声パターン、および音声レベルとしているが、これらの全てを判定条件とする必要はなく、所定キーワード、声紋、音声パターン、および音声レベルのうちの1または複数を判定条件とすることができる。 Also, here, a predetermined keyword determination condition, voiceprint, although the speech pattern, and the sound level is not required to be all of these determination conditions, a predetermined keyword, voiceprint, one of the speech pattern, and the sound level or more to be a determination condition. また、ここでは、一致の判定をOR条件としているが、AND条件としてもよい。 Further, here, the determination of coincidence is the OR condition, or as an AND condition.

図3は、図1の音声切換装置100の動作を説明するためのフローチャートである。 Figure 3 is a flowchart for explaining the operation of the voice switching apparatus 100 of FIG. 以下の説明では、利用者がヘッドフォン30を使用して、音楽再生装置10で再生される音楽を鑑賞する場合について説明する。 In the following description, the user uses the headphone 30, the case of viewing the music played by the music playback apparatus 10.

図3において、まず、音声切換装置100では、電源が投入されると、マイク21は、周囲の音声を集音して外部音声として、記憶装置101、音声解析装置103、および切換器105に出力する。 3, first, the speech switching apparatus 100, when the power is turned on, the microphone 21 is output as an external sound by collecting ambient sounds, the storage device 101, voice analysis device 103, and the switcher 105 to. また、切換器105は、SWを端子aに切換えて、マイク21から入力される外部音声をスピーカー31より出力する。 Further, switching device 105 switches the SW to the terminal a, and outputs the external sound input from the microphone 21 from the loudspeaker 31. これにより、ヘッドフォン30をしている利用者が、ヘッドフォン30をすることによって阻害される周囲からの音声を、音声切換装置100を経由して明確に聞き取ることが可能となる。 Thus, the user that the headphone 30, a voice from the surroundings that are inhibited by the headphone 30, it is possible to hear clearly through the voice switching apparatus 100. すなわち、ヘッドフォン30を外すことなく、リアルタイムに周囲の音を確認したり、会話したりすることが可能となる。 In other words, without removing the headphones 30, or check the ambient sound in real-time, it is possible or talk. また、記憶装置101は、マイク21から入力される外部音声を録音し続ける。 The storage device 101 continues to record the external sound input from the microphone 21. 録音によって保持される時間はΔTとする。 Time held by recording the [Delta] T.

つづいて、検出器104は、音楽入力信号を電圧レベルなどから検出することで、音楽再生装置10から音楽が入力されたか否かを検出し(ステップS11)、音楽の入力を検出した場合には(ステップS11の「Yes」)、外部音声解析処理を実行する(ステップS12)。 Then, the detector 104, by detecting the music input signal such as a voltage level, to detect whether the music from the music reproduction device 10 is input (step S11), and when detecting the input of the music (step "Yes" in S11), and executes an external audio analysis process (step S12). なお、本実施例では、音楽入力信号を電圧レベルなどから検出することで、音声切換装置100が自律して稼動できるような構成としているが、音楽再生開始の検出を音楽再生装置10からの再生指示を制御信号として受信することで判断しても良い。 In the present embodiment, by detecting the music input signal such as a voltage level, but the voice switching apparatus 100 has a like can operate autonomously construction, regeneration of the detection of the music reproduction start from the music reproduction apparatus 10 it may be determined by receiving an instruction as control signal. また、音声切換のタイミングで、ビープ音や効果音などを鳴らすことにしてもよい。 Further, at the timing of the voice switching, it may be sounding like a beep or a sound effect. これにより、利用者に、これから以前とは異なる選択音声が出力されるということを意識させることができる。 As a result, the user, can be conscious of the fact that different selection audio is output from the future before. また、現在の切換状況を利用者に知らせるため、スイッチ部20にLEDや液晶パネルなどの表示装置を合わせて用意することで、切換状況(何の音声が出力されているか)を通知することにしてもよい。 Also, to inform the current switching status to the user, by preparing together display device such as an LED or a liquid crystal panel to the switch unit 20, and to notify the switching status (what voice is output) it may be.

ここで、外部音声解析処理を詳細に説明する。 Here, explaining the external audio analysis process in detail. 検出器104は、音楽入力を検知すると、切換器105に対して、音楽出力を行うための切換指示(SW:b)を出力すると共に、解析装置103に対して、判定開始指示(解析指示)を出力する。 Detector 104, upon detecting music input for switching unit 105, the switching instruction for performing music output (SW: b) outputs the relative analyzer 103, determination start instruction (Analysis indicated) to output.

切換器105は、検出器104から音楽出力を行うための切換指示(SW:b)が入力されると、SWを端子bに切換え、音声出力がスピーカー31に出力される。 Switcher 105, switching instruction for performing music output from the detector 104: If (SW b) is inputted, switches the SW to the terminal b, the sound output is outputted to the speaker 31. これにより、ユーザはスピーカー31より再生された音楽を聴くことができる。 Thus, the user can listen to music reproduced from the speaker 31. また、解析装置103は、検出器104から判定開始指示を受けとると、判定条件テーブルに予め登録されている判定条件(所定キーワード、声紋、音声パターン、音声レベル)と、入力された外部音声が一致するかどうかの判定を開始し(ステップS15)、一致しない場合には、ステップS13に戻る一方、一致した場合には、外部音声解析処理を停止し、ステップS16に移行する。 Further, the analyzer 103, when receiving the determination start instruction from the detector 104, the determination condition is previously registered in the determination condition table (predetermined keyword, voiceprint, voice patterns, sound level) and, is input external voice matches determination of whether the start (step S15), and if they do not match, the process returns to step S13, if there is a match, stops the external audio analysis process proceeds to step S16.

検出器104は、音楽再生を検知している間、音楽停止に関しても監視を行う(ステップS13)。 Detector 104 monitors while, with regard music stop that senses the music playback (step S13). 検知器104は、音楽停止を検知した場合、解析中止処理を実行した後(ステップS14)、ステップS11に戻る。 Detector 104, when detecting music stopped, after performing the analysis stop processing (step S14), and returns to step S11. なお、音楽停止の検出は外部の音楽再生装置10からの停止指示を制御信号として受信することで判断しても良い。 The detection of music stop may be determined by receiving the stop instruction from an external music reproduction apparatus 10 as a control signal.

この解析中止処理では、検出器104は、音楽停止を検知すると、切換器105に対して外部音声出力を行うための切換指示(SW:a)を出力すると共に、解析装置103に対して、判定中止指示(解析中止指示)を出力する。 In this analysis canceling process, the detector 104, upon detecting music stop, switching instruction for performing external audio output to switching device 105: outputs a (SW a), with respect to the analysis device 103, determination and it outputs a stop instruction (analysis stop instruction). 切換器105は、検出器104から外部音声出力を行うための切換指示(SW:a)が入力されると、SWを端子aに切換え、外部音声がスピーカー31に出力される。 Switcher 105, switching instruction for performing external audio output from the detector 104: If (SW a) is inputted, switches the SW to the terminal a, the external sound is output to the speaker 31. これにより、利用者は音楽が停止している間はヘッドフォン30を外すことなく、リアルタイムに周囲の音を確認したり、会話したりすることが可能となる。 As a result, the user while the music is stopped without removing the headphones 30, or check the ambient sound in real-time, it is possible or talk. また、解析装置103は、検出器104から判定中止指示を受けとると、外部音声の解析を中止する。 Further, the analysis unit 103 has received the decision cancel instruction from the detector 104, to stop the analysis of the external sound.

ステップS16では、記憶音声再生処理が実行される。 In step S16, the storage audio reproduction processing is executed. この記憶音声再生処理では、解析装置103は、再生装置102に対して、記憶した録音音声の録音音声再生指示(PLAY)を出力する。 In this memory the audio reproduction process, the analyzer 103 outputs to the reproduction apparatus 102, recording audio reproduction instruction of the stored recorded voice (PLAY). 再生装置102は、解析装置103から録音音声再生指示(PLAY)が入力されると、記憶装置101に蓄積された外部音声を録音音声として再生して、検出器104に出力する。 Reproducing apparatus 102, the recorded voice reproduction instruction from the analyzer 103 (PLAY) is input, and reproduces the external sound stored in the storage device 101 as recorded speech, and outputs to the detector 104.

なお、録音再生している際中も音楽再生装置10の音楽再生は継続しているが、音楽再生装置10と音声切換装置100の間に制御ラインが設けられている場合、録音再生と同期して、音楽再生停止信号を外部の音楽再生装置10に通知してもよい。 Although music playback of the music playback apparatus 10 also in case that recording and playback are continuously, if the control line between the music reproduction apparatus 10 and the audio switching unit 100 is provided, synchronized recording and playback in the same Te may notify the music reproduction stop signal to the outside of the music playback apparatus 10. これにより、音楽が利用者の意図しない状況で再生され続けるという状況を回避することができる。 As a result, it is possible to avoid a situation that the music continues to be played in an unintended situation of the user.

検出器104は、再生装置102から出力される録音音声を検出すると、切換器105に対して録音音声をスピーカー31に出力するための切換指示(SW:c)を出力する。 Detector 104 detects a voice recording that is outputted from the reproduction apparatus 102, the switching instruction for outputting the recorded speech to the speaker 31 relative to the switcher 105: Output (SW c). 切換器105は、検出器104から録音音声出力を行うための切換指示(SW:c)が入力されると、SWを端子cに切換え、録音音声がスピーカー31に出力される。 Switcher 105, switching instruction for performing recording audio output from the detector 104: If (SW c) is inputted, switches the SW to the terminal c, recorded voice is output to the speaker 31.

ここで、再生装置102で再生される録音音声について説明する。 The following describes recording sound reproduced by the reproduction apparatus 102. 再生装置102による録音音声の再生は、録音音声開始時点(判定条件の一致を検出した時点)よりも所定時間ΔT過去から開始する。 Reproduction of recorded sound by the playback apparatus 102 starts a predetermined time ΔT past than voice recording start time (time of detecting the coincidence of the determination condition). 図5は、録音音声の再生方法(その1)を説明するための図である。 Figure 5 is a diagram for explaining a method of reproducing recorded sound (Part 1). 所定時間ΔTは、下記の条件式(1)を満たすことが望ましい。 Predetermined time ΔT, it is desirable to satisfy the following conditional expression (1).

所定時間ΔT=所定の音声が出力される時間Δt1+一定時間Δt3・・・(1) Predetermined time [Delta] T = time predetermined sound is output .DELTA.t1 + predetermined time? T3 · · · (1)
図5において、Δt1は、所定の音声が出力される時間であり、説明の便宜上、解析装置103の条件一致の判定に必要な解析時間と同じ時間であるとしている。 In FIG. 5, .DELTA.t1 is the time predetermined sound is output, for convenience of explanation, and as the same time as the analysis time required for the determination of the condition match analysis device 103. 例えば、Δt1は、所定キーワードとして「うらわ」が登録されている場合、「うらわ」の音声が出力されるだけの時間である。 For example, .DELTA.t1, when "Urawa" is registered as a predetermined keyword, which is much time voice "Urawa" is output. また、Δt3は、利用者が該一致した音声の前後関係を把握するために必要な先行時間である。 Further,? T3 is the preceding time required to understand the context of the voice user matches the. 例えば、Δt2を、「みなみ」を音声出力する時間とした場合、Δt3は、「みなみ」を十分判断できるだけの時間である。 For example, if the .DELTA.t2, was time to the audio output to "South",? T3 is the only time sufficient determines "South". なお、Δt3を操作者が任意に設定できる構成としてもよい。 It may be configured to be arbitrarily set by the operator and? T3.

このように、「うらわ」というキーワードに対して、所定時間ΔT過去からの録音音声を再生することで、その前後関係を把握でき、判定一致が純粋に「うらわ」でヒットしたのか、「みなみうらわ」や「きたうらわ」でヒットしたのかを判別することができる。 In this way, for the keyword "Urawa", by playing the recorded voice from a predetermined time ΔT past, it can grasp the context, determining if a match that was hit in a purely "Urawa", " it is possible to determine whether the hit in Minami Urawa "and" Kitaurawa ". また、「うらわ」というキーワードに対して、外部音声をそのまま録音音声として再生することで、判定一致した状況が降車のための車掌アナウンスによるものか、周囲の人が目的地とは関係なく話した内容なのかを判別することができる。 In addition, for the keyword "Urawa", is able to play an external sound as it is as the voice recording, or the determination matched situation is due to the conductor announcement for getting off, story regardless of the destination is the people around it is possible to determine whether the contents of the that. これにより、利用者はヘッドフォン30で音楽を聴きながら、利用者にとって必要な周囲の状況を的確に把握することが可能となる。 As a result, while the user is listening to music with headphones 30, it is possible to accurately grasp the situation of the surrounding necessary for the user.

また、[声紋データ]の場合には、例えば、友人Aが「夕飯を食べに行こうよ」と呼びかけた際、[友人Aの声紋]という判定一致の状況を、ΔT過去からの録音音声を再生することで、友人Aが呼びかけの際に何と呼びかけたのかを判別することができる。 In addition, in the case of [voiceprint data] is, for example, when the friend A is called "I will go to eat dinner", the status of the match determination that [voice print of friends A], the recorded sound from the ΔT past by playing, it is possible to determine whether the called for what in friend a is calling.

また、[音声パターン]の場合には、電話のベルが鳴ったこと、また、その直後に電話ベルが鳴り止んだとしても、判定一致した状況を、ΔT過去からの録音音声を再生することで、電話のベルが鳴ったことを判断することができる。 In the case of [Audio Pattern is that the telephone bell rang, and also As ceased sounds telephone bell immediately, was determined match conditions, by reproducing the recorded sound from ΔT past , it can be determined that the telephone bell rang.

また、[音声レベル]の場合には、周囲の状況が静かになったという状況を判別することができる。 In the case of [Audio Level] can determine the status of it became quieter surroundings. これは周囲の状況に対して音漏れを気にする人に対しては周囲が静かになったから、音楽のボリュームを下げるといった判断を行うのに適している。 This is suitable for making a decision such as because for people to worry about the sound leakage to the situation around became quiet ambient, lower the music volume. なお、周囲がうるさくなったという状況を判別して、周囲がうるさいから音楽のボリュームを上げることにしてもよい。 It should be noted that, to determine the status of the surrounding has become noisy, may be raising the from the noisy surroundings of the music volume.

なお、上述したように、録音音声を再生開始する直前に今回の判定が何に起因して発生したのかを、スピーカー31から利用者に通知する構成としてもよい。 It should be noted that, as described above, whether the time of the decision to immediately before the start of play the recorded voice has occurred due to what may be configured to notify the user from the speaker 31. この通知によって、利用者は周囲の状況を把握するのにより優位なデータを取得することが可能となるからである。 This notification, the user because it is possible to obtain the advantage data by to grasp the surroundings. 或いはチャイム音などにより注意を促がすようにしてもよい。 Or attention may be be urged the due chime sound. また、これらを併用してもよい。 In addition, these may be used in combination.

また、録音音声を再生する場合は短縮再生する。 Also, if you want to play the recorded sound is to reduce reproduction. ここで、短縮再生とは、録音音声の録音時間よりも短い時間で再生することをいい、例えば、通常の音声再生よりも早い再生スピードで再生(スピード再生)し、若しくは、無音部分を効率よくSKIPして再生(SKIP再生)する。 Here, the shortened play, nice to play in a shorter time than the recording time of the recorded speech, for example, play at a faster playback speed than the normal audio playback and (speed play), or, the silence efficiently SKIP to play to (SKIP playback).

図6は、本実施例に係る録音音声の再生方法(その2)を説明するための図である。 Figure 6 is a diagram for explaining a method of reproducing recorded voice according to the present embodiment (Part 2). 図6において、録音音声を通常スピードで再生すると、スピーカー31から出力される音声は、常にΔT分だけ過去の音声となる。 6, when playing the recorded sound at normal speed, the sound output from the speaker 31 is always the previous speech by ΔT min. 本実施例では、ΔTのずれを通常スピードより早く再生すること、若しくは無音部分をSKIPすることでその差分が「0」に近づいて行くように再生して、短縮再生時間(ΔS)が経過した時点、つまり差分が「0」となった時点で、再生装置102による録音音声の再生を停止し、切換器105により、スピーカー出力を外部音声に切り替える。 In this embodiment, to play a deviation of ΔT earlier than normal speed, or silence being reproduced as the difference by SKIP approaches the "0", shortened playback time ([Delta] S) has elapsed time, when that is the difference becomes "0", to stop the reproduction of the recorded sound by the playback apparatus 102, the switching unit 105 switches the speaker output to an external sound. これにより、ヘッドフォン30で音楽を聞きながら目的の外部音声を認識でき、かつ外部音声認識後への復帰(意識の切換)をスムースにさせることができる。 As a result, while listening to music with headphones 30 can recognize the external voice of purpose, and it is possible to return to after an external speech recognition (switching of consciousness) smoothly.

例えば、音楽を聴いている最中に友人Aに話しかけられた状況を想定すると、まず、声紋による判定一致によって、「声紋、友人A」で条件一致を通知する。 For example, assuming a situation that has been spoken to friends A in the middle of listening to music, first of all, by the determination match by voiceprint, to notify the condition matches in the "voice print, friend A". これにより、音楽を聴いている最中に友人Aが呼びかけをしたということが認識できる。 As a result, it recognized that friend A has a call in the middle of listening to music. 次に、録音音声を短縮再生することで、友人Aがどのような内容の呼びかけをしたのかを把握することができる。 Then, with the shortened play the recorded voice, it is possible to figure out what was the appeal friend A is what kind of content. さらに、友人Aが話を継続したとしても、そのまま友人Aの会話を中断することなく、その話を途切れなく聞いて理解することが可能となる。 In addition, even as friends A continues the story, as it is without interrupting the conversation of friends A, it is possible to understand to hear without a break the story.

さて、上記ステップS16の記憶音声再生処理が終了した後は、検出器105は、切換器105に対して外部音声をスピーカー31出力するための切換指示(SW:a)を出力する。 Now, after the storing the audio reproduction processing in step S16 is completed, the detector 105, the switching instruction to the external audio speaker 31 outputs the switching device 105 (SW: a) outputting a. 切換器105は、検出器104から外部音声出力を行うための切換指示(SW:a)が入力されると、SWを端子aに切換え、外部音声がスピーカー31から出力される。 Switcher 105, switching instruction for performing external audio output from the detector 104: If (SW a) is inputted, switches the SW to the terminal a, the external sound is output from the speaker 31. なお、この場合、利用者が新たに音楽鑑賞を行う場合は、操作部22から手動にて切換器105に音楽出力するための切換指示(SW:b)を出力する。 In this case, if the user makes a new music appreciation, switching instruction for music output to switching device 105 from the operation unit 22 manually: Output (SW b). なお、一定時間経過後に、自動的に切換器105に音楽出力するための切換指示(SW:b)を出力する構成としてもよい。 Incidentally, after a predetermined time has elapsed, automatically switching unit 105 switching instruction to the music output (SW: b) may output a.

以上説明したように、本実施例に係る音声切換装置100によれば、マイク21から入力される外部音声を録音音声として記憶する記憶装置101と、マイク21から入力される外部音声が判定条件に一致するか否かを判定する解析装置103と、記憶装置101に記憶した録音音声を再生する再生装置102と、検出器104の指示に応じて、音楽再生装置10から入力される音楽、マイク21から入力される外部音声、および再生装置102で再生される録音音声を択一的に切り換えてスピーカー31に出力する切換器105と、を備え、解析装置102によりマイク21から入力される外部音声が判定条件に一致すると判断された場合、条件一致を検出時点より所定時間前からの録音音声を再生して録音音声をスピーカー31に出力す As described above, according to the speech switching apparatus 100 according to this embodiment, a storage device 101 for storing the external sound input from the microphone 21 as recorded speech, the external sound determination condition input from the microphone 21 and determines analyzer 103 whether match, music reproducing apparatus 102 for reproducing a recorded speech stored in the storage device 101, in response to an instruction of the detector 104 is input from the music reproduction device 10, microphone 21 comprising a, a switching unit 105 to be output to the speaker 31 by switching alternatively recording sound reproduced by the external audio and reproducing apparatus 102 is input from the external sound input from the microphone 21 by the analysis device 102 If it is determined that the matching judgment conditions, by reproducing the recorded voice from a predetermined time before the detection time conditions matching to output the recorded speech to the speaker 31 こととしたので、マイクから入力される外部音声が判定条件に一致した場合に、条件一致を検出時点よりも所定時間前からの録音音声を再生して、スピーカーに出力することができ、ヘッドフォン等を使用して音楽鑑賞をしている場合に、周囲の状況変化を的確に把握することが可能となる。 Since the the fact, when the external sound input from the microphone matches the determining condition, playing a recorded voice from predetermined time before the detection instant the condition match can be output to speakers, headphones, etc. use if you are a music appreciation, it is possible to accurately grasp the situation changes in the ambient.

また、本実施例に係る音声切換装置100によれば、再生装置102は、録音音声を短縮再生(録音音声の録音時間よりも短い時間で再生)し、具体的には、通常の音声再生よりも早い再生スピードで再生(スピード再生)し、若しくは無音部分をSKIPして再生(SKIP再生)することとしたので、ライブの外部音声に追いつくことができ、意識の切換をスムースにさせることができる。 Further, according to the speech switching apparatus 100 according to this embodiment, the playback device 102, voice recording shortened playback (playback time shorter than the recording time of the recorded speech), specifically, from the normal audio playback to play even in the early playback speed (speed play), or because the silence was decided to SKIP to play (SKIP playback), it is possible to catch up with the external sound of live, it can be the switching of consciousness to the smooth .

また、本実施例に係る音声切換装置100によれば、解析装置103は、判定条件として、キーワード、声紋、音声パターン、および音声レベルのうちの1または複数を予め記憶しておき、マイク21から入力される外部音声がキーワード、声紋、音声パターン、および音声レベル等と一致するか否かを判定することとしたので、外部音声がキーワード、声紋、音声パターン、および音声レベルの条件に一致した場合に、利用者は所定時間前からの録音音声を聴くことができ、例えば、ヘッドフォンをして音楽鑑賞をしている電車の利用者は、降車駅のような外部アナウンスを的確に判別することができ、また、外部から利用者への呼びかけや周辺環境状況の変化等を認識することが可能となる。 Further, according to the speech switching apparatus 100 according to this embodiment, the analysis device 103, as a determination condition, keyword, voiceprint, voice patterns, and storing in advance one or more of the sound level from the microphone 21 external audio keyword input, voice print, speech pattern, and so it was decided to determine whether to match the sound level or the like, when the external sound that match keywords, voiceprint, voice pattern, and the audio level conditions in, the user can listen to the recorded voice from the previous predetermined period of time, for example, a user of the train and the headphones are a music appreciation is, that accurately determine the external announcement, such as getting-off station can, also, it becomes possible to recognize the change and the like of the interrogation and the surrounding environmental conditions to the user from the outside.

また、本実施例に係る音声切換装置100によれば、スピーカー31は、ヘッドフォン30に内蔵されることとしたので、ヘッドフォンを使用して、音声再生装置で再生される音楽を鑑賞している際に、周囲の状況変化を的確に把握することが可能となる。 Further, according to the speech switching apparatus 100 according to this embodiment, the speaker 31, so it was decided to be built in the headphone 30, using headphones, by watching music played by the audio playback device in, it becomes possible to accurately grasp the situation changes in the ambient.

(変形例1) (Modification 1)
図7は、本発明に係る音声切換装置の変形例1を説明するための図である。 Figure 7 is a diagram for explaining a first modification of the voice switching apparatus according to the present invention. 図7において、変形例1は上記実施例と異なり、音声切換装置100を音声再生装置10の内部に実装した構成である。 7, the first modification differs from the above-described embodiment, a configuration that implements the speech switching apparatus 100 to the interior of the audio reproducing apparatus 10.

(変形例2) (Modification 2)
図8は、本発明に係る音声切換装置の変形例2を説明するための図である。 Figure 8 is a diagram for explaining a second modification of the voice switching apparatus according to the present invention. 図8において、変形例3は、音声切換装置100をヘッドフォンの内部に実装した構成である。 8, the third modification, a configuration that implements the speech switching apparatus 100 to the inside of the headphone.

(変形例3) (Modification 3)
図2に示す音声切換装置100では、入出力音声や制御信号を送信するために信号線(有線)を使用しているが、信号の送信を行う場合は有線に限られるものではなく、Bluetooth等の無線通信を使用することにしてもよい。 The speech switching apparatus 100 shown in FIG. 2, the use of the signal line (wired) to transmit input and output audio and control signals, not limited to wired When transmitting signals, Bluetooth, etc. it may be the use of wireless communications.

(変形例4) (Modification 4)
ヘッドセットを使用して電話会議・TV会議を実施する場合、周囲の音声状況の変化、例えば、他から声をかけられたり、電話が鳴ってないのに気づかないことがある。 When carrying out a conference call · TV conference using a headset, the change in the ambient sound situation, for example, may not notice or be multiplied by a voice from the other, to not have the telephone rang. そこで、本実施例に係るヘッドフォンシステムを使用して電話会議・TV会議を実施する場合、音楽再生装置10からの音楽を入力する代わりに、会議音声を入力とし、さらに、音声・TV会議の場合には、会議音声と外部音声のどちらの音声出力が優先かを前もって判断することが難しいため、会議音声をMUTE(ミュート)せずに効果音やビープ音を会議音声に重ねてスピーカー31に出力することにしてもよい。 Therefore, when carrying out a conference call · TV conference using headphones system according to this embodiment, instead of entering the music from the music reproducing device 10 inputs the conference voice, further, if the voice · TV conferencing to the output if the priority both of the audio output of the conference audio and outside voice because in advance it is difficult to determine, to the speaker 31 overlapping the sound effects and beep sound to the conference audio conference sound without mUTE (mute) it may be able to. また、利用者にとって必要な状況変化が生じたことを、表示装置を使用して映像で知らせることにしてもよい。 Further, that the status change necessary for the user is generated, it may be to inform the video using a display device. さらに、状況変化の音声による通知と、映像による通知の両方を行うことにしてもよく、音声および映像にどのような内容の状況変化があったかの情報を含めることにしてもよい。 Furthermore, the notification by the voice situation changes, may be decided to perform both the notification by the video, may be the inclusion of one of the information had situation change what content to the audio and video.

(変形例5) (Modification 5)
また、本発明に係る音声切換装置100は、ヘッドフォンを使用した場合に限られるものではなく、室内・車載用のスピーカー等に出力することにしてもよい。 The speech switching apparatus 100 according to the present invention is not limited to the case of using the headphones may be output to a speaker or the like of the indoor and automotive. 例えば、マイクを玄関のドアに配置し、かつ、音声切換装置100、音楽再生装置、およびスピーカーを室内に配置し、玄関のマイクから入力される外部音声に応じて、スピーカーから出力される音声を切換ることにしてもよい。 For example, place the microphone on the front door, and the speech switching apparatus 100, the music reproducing apparatus, and to place the speakers in a room, depending on the external audio input from the entrance of the microphone, the sound outputted from the speaker it may be that Setsu換Ru. これにより、例えば、室内で音楽鑑賞をしている場合に、玄関のマイクで来客者の音声を検出した場合に、スピーカーの出力を来客者の音声に切り換えることが可能となる。 Thus, for example, if you are a music appreciation indoors, in the case of detecting the voice of the visitor at the entrance of the microphone, it is possible to switch the output of the speaker voice visitor.

本発明に係る音声切換装置は、音楽鑑賞をしている場合に、外部の状況変化を的確に把握する場合に有用であり、特に、ヘッドフォンで音楽鑑賞をする場合に有用である。 Voice switching apparatus according to the present invention, if the music appreciation, are useful for accurately grasp the situation changes in the external, in particular, useful in the case of music appreciation headphones.

本発明に係る音声切換装置を適用したヘッドフォンシステムの外観構成を示す図である。 It is a diagram showing an external configuration of a headphone system to which the voice switching apparatus according to the present invention. 本発明に係る音声切換装置のブロック構成を示す図である。 It is a block diagram illustrating a configuration of a speech switching apparatus according to the present invention. 音声切換装置の動作を説明するためのフローチャートである。 It is a flowchart for explaining the operation of the voice switching apparatus. 判定条件テーブルの構成例を示す図である。 It is a diagram illustrating a configuration example of the determination condition table. 録音音声の再生方法(その1)を説明するための図である。 Recording sound reproducing method is a diagram for explaining a (first). 録音音声の再生方法(その2)を説明するための図である。 Recording sound reproducing method is a diagram for explaining a (second). 変形例1を説明するための図である。 It is a diagram for explaining a first modification. 変形例2を説明するための図である。 It is a diagram for explaining a second modification.

符号の説明 DESCRIPTION OF SYMBOLS

10 音声再生装置 20 スイッチ部 21 操作部 22 マイク 30 ヘッドフォン 31 スピーカー 100 音声切換装置 101 記憶装置 102 再生装置 103 解析装置 104 検出器 105 切換器 10 audio reproduction device 20 switch unit 21 operation unit 22 microphone 30 Headphones 31 speaker 100 speech switching apparatus 101 storage device 102 reproducing apparatus 103 analyzer 104 detector 105 switcher

Claims (7)

  1. マイクから入力される外部音声を録音音声として記憶する記憶手段と、 Storage means for storing the external sound input from the microphone as recorded speech,
    前記マイクから入力される外部音声が判定条件に一致するか否かを判定する解析手段と、 External sound and determining analysis means whether matching determination conditions input from the microphone,
    前記記憶手段に記憶した録音音声を再生する再生手段と、 Reproducing means for reproducing the recorded speech stored in the storage means,
    音楽再生装置から入力される音楽、前記マイクから入力される外部音声、および前記再生手段で再生される録音音声を択一的に切り換えてスピーカーに出力する切換手段と、 A switching means for outputting to the speaker switching music input from music playback device, a voice recording that is played by the external sound, and the reproducing means is input from the microphone Alternatively,
    を備え、 Equipped with a,
    前記解析手段により前記マイクから入力される外部音声が判定条件に一致すると判断された場合、前記再生手段は、条件一致を検出した時点よりも所定時間前からの録音音声を再生し、前記切換手段は当該再生した録音音声を前記スピーカーに出力することを特徴とする音声切換装置。 If the external sound input from the microphone is determined to match the determination condition by the analysis means, said reproduction means, than the time of detecting the condition match play the recorded sound from a predetermined time before, the switching means voice switching device and outputs the recorded speech and the reproduced to the speakers.
  2. 前記所定時間は、前記判定条件に一致した音声および利用者が該一致した音声の前後関係を把握するために必要な先行時間を含む長さであることを特徴とする請求項1に記載の音声切換装置。 The predetermined time is the voice of claim 1, wherein the determination condition to the matched voice and user, characterized in that a length including a lead time required to understand the context of the speech that match the switching device.
  3. 前記再生手段は、前記録音音声を短縮再生することを特徴とする請求項1または請求項2に記載の音声切換装置。 It said reproducing means, the audio switching device according to claim 1 or claim 2, characterized in that to reduce play the recorded voice.
  4. 前記再生手段は、前記録音音声の再生は実時間に追いつくまで行なうことを特徴とする請求項3に記載の音声切換装置。 It said reproducing means, the audio switching device according to claim 3, characterized in that the reproduction of the recorded sound is carried out until catch up to real time.
  5. 前記録音音声の再生の前に、所定の音声を再生する音声再生手段を備えたことを特徴とする請求項1〜請求項4のいずれか1つに記載の音声切換装置。 Wherein prior to recording the voice playback, voice switching apparatus as claimed in any one of claims 1 to 4, characterized in that it comprises a sound reproducing means for reproducing a predetermined sound.
  6. 前記判定条件は、キーワード、声紋、音声パターン、および音声レベルのうちの1または複数であることを特徴とする請求項1〜請求項5のいずれか1つに記載の音声切換装置。 The determination condition, keyword, voiceprint, voice pattern, and voice switching apparatus as claimed in any one of claims 1 to 5, characterized in that one or more of the audio level.
  7. 前記スピーカーは、ヘッドフォンに内蔵されるスピーカーであることを特徴とする請求項1〜請求項6のいずれか1つに記載の音声切換装置。 The speaker, speech switching apparatus according to any one of claims 1 to 6, characterized in that the speaker built in the headphone.
JP2006164005A 2006-06-13 2006-06-13 Voice switching apparatus Pending JP2007334968A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006164005A JP2007334968A (en) 2006-06-13 2006-06-13 Voice switching apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006164005A JP2007334968A (en) 2006-06-13 2006-06-13 Voice switching apparatus

Publications (1)

Publication Number Publication Date
JP2007334968A true true JP2007334968A (en) 2007-12-27

Family

ID=38934297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006164005A Pending JP2007334968A (en) 2006-06-13 2006-06-13 Voice switching apparatus

Country Status (1)

Country Link
JP (1) JP2007334968A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008263A (en) * 2009-06-26 2011-01-13 Intel Corp Controlling audio players using environmental audio analysis
JP2011097268A (en) * 2009-10-28 2011-05-12 Sony Corp Playback device, headphone, and playback method
WO2011118595A1 (en) * 2010-03-23 2011-09-29 ヤマハ株式会社 Headphones
CN103869971A (en) * 2012-12-10 2014-06-18 三星电子株式会社 Method and user device for providing context awareness service using speech recognition

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05224696A (en) * 1992-02-10 1993-09-03 Nippon Telegr & Teleph Corp <Ntt> Speech information retrieval and reproduction device
JP2001256771A (en) * 2000-03-14 2001-09-21 Sony Corp Portable music reproducing device
JP2003505712A (en) * 1999-04-20 2003-02-12 ベランス・コーポレイション Broadcast speech recognition system for keyword monitoring
JP2005244473A (en) * 2004-02-25 2005-09-08 Hitachi Ltd Digital broadcast receiving terminal, its data reproducing method and analog broadcast receiving terminal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05224696A (en) * 1992-02-10 1993-09-03 Nippon Telegr & Teleph Corp <Ntt> Speech information retrieval and reproduction device
JP2003505712A (en) * 1999-04-20 2003-02-12 ベランス・コーポレイション Broadcast speech recognition system for keyword monitoring
JP2001256771A (en) * 2000-03-14 2001-09-21 Sony Corp Portable music reproducing device
JP2005244473A (en) * 2004-02-25 2005-09-08 Hitachi Ltd Digital broadcast receiving terminal, its data reproducing method and analog broadcast receiving terminal

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542150B2 (en) 2009-06-26 2017-01-10 Intel Corporation Controlling audio players using environmental audio analysis
JP2011008263A (en) * 2009-06-26 2011-01-13 Intel Corp Controlling audio players using environmental audio analysis
US8983640B2 (en) 2009-06-26 2015-03-17 Intel Corporation Controlling audio players using environmental audio analysis
JP2011097268A (en) * 2009-10-28 2011-05-12 Sony Corp Playback device, headphone, and playback method
JP2011199699A (en) * 2010-03-23 2011-10-06 Yamaha Corp Headphone
CN102823272A (en) * 2010-03-23 2012-12-12 雅马哈株式会社 Headphones
US20130003983A1 (en) * 2010-03-23 2013-01-03 Yamaha Corporation Headphone
US9432767B2 (en) 2010-03-23 2016-08-30 Yamaha Corporation Headphone with microphones that processes external sound pickup by the microphones and inputs external source sound signal
WO2011118595A1 (en) * 2010-03-23 2011-09-29 ヤマハ株式会社 Headphones
CN102823272B (en) * 2010-03-23 2015-04-01 雅马哈株式会社 Headphones
EP2760016A3 (en) * 2012-12-10 2014-10-15 Samsung Electronics Co., Ltd Method and user device for providing context awareness service using speech recognition
CN103869971A (en) * 2012-12-10 2014-06-18 三星电子株式会社 Method and user device for providing context awareness service using speech recognition
EP3217394A1 (en) * 2012-12-10 2017-09-13 Samsung Electronics Co., Ltd Method and user device for providing context awareness service using speech recognition
CN103869971B (en) * 2012-12-10 2018-03-30 三星电子株式会社 A method for using speech recognition to provide context-aware services and user devices
US9940924B2 (en) 2012-12-10 2018-04-10 Samsung Electronics Co., Ltd. Method and user device for providing context awareness service using speech recognition

Similar Documents

Publication Publication Date Title
US6006115A (en) Wireless headphones for entertainment and telephonic communication
US7072686B1 (en) Voice controlled multimedia and communications device
US5406618A (en) Voice activated, handsfree telephone answering device
US20080300871A1 (en) Method and apparatus for identifying acoustic background environments to enhance automatic speech recognition
US20070263823A1 (en) Automatic participant placement in conferencing
US20080226087A1 (en) Position Sensing Using Loudspeakers as Microphones
US20080141302A1 (en) Apparatus and method for collaborating between a video device and a telephonic device
US20060280295A1 (en) Voice activated phone mute reminder method and apparatus
JP2001100785A (en) Speech recognition device for av apparatus
US20070054702A1 (en) Mobile device enhancement via a vehicular telematics system
US7928307B2 (en) Karaoke system
JP2005253017A (en) Mobile terminal, and method and program for reproducing broadcast record therein
US20150222977A1 (en) Awareness intelligence headphone
US9509269B1 (en) Ambient sound responsive media player
GB2285530A (en) A doorbell answering machine
US20060083387A1 (en) Specific sound playback apparatus and specific sound playback headphone
JP2003218999A (en) Mobile phone with voice recognition function and control program thereof
US20080165988A1 (en) Audio blending
US20060048207A1 (en) Voice-Operated Television with Telephone, Digital Video Recording and Weather Alert Functions
JPH10224488A (en) Video intercom
CN103269405A (en) Method and device for hinting friendlily
JP2011097268A (en) Playback device, headphone, and playback method
US7936885B2 (en) Audio/video reproducing systems, methods and computer program products that modify audio/video electrical signals in response to specific sounds/images
JPH07176178A (en) Audio device for vehicle
CN101721214A (en) Listening checking method and device based on mobile terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090519

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101119

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110705