JPH0713582A - Portable speech recognition output assisting device - Google Patents

Portable speech recognition output assisting device

Info

Publication number
JPH0713582A
JPH0713582A JP14898093A JP14898093A JPH0713582A JP H0713582 A JPH0713582 A JP H0713582A JP 14898093 A JP14898093 A JP 14898093A JP 14898093 A JP14898093 A JP 14898093A JP H0713582 A JPH0713582 A JP H0713582A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
voice
sound
speech
output
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP14898093A
Other languages
Japanese (ja)
Other versions
JP3068370B2 (en )
Inventor
Kenji Kono
憲嗣 河野
Original Assignee
Toshiba Corp
株式会社東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PURPOSE:To correctly recognize an inarticulate voice that a handicapped person speaks and to output a speech signal including the sensation of the voicing person. CONSTITUTION:This portable speech recognition output assisting device is provided with a speech input/output device 1 which has a speech input means 12 and a speech output means 13, a speech recognition part 2 which recognizes a voice print, an intonation, a pitch, and a generated sound from a vibration frequency signal inputted to the speech input means 12, a speech code decision part 3 which stores plural standard speech patterns and speech codes corresponding to the patterns. compares a speech code regarding the recognized generated sound with the stored speech codes, and outputs speech information on the voice print, intonation, pitch, etc., in addition to the standard speech pattern corresponding to the speech code when both the speech codes match each other, a speech synthesis part 5 which puts the standard speech pattern and voice print together and adds the intonation of the sound to synthesize a sound, and a speech conversion output part 7 which outputs the synthesized sound to a speech signal from the speech output means 13.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【産業上の利用分野】本発明は、例えば声帯摘出者や身体障害者等のごとき不明瞭な音声を発声する者が利用して好適な携帯用音声認識出力補助装置に係わり、特に手軽に携行可能とし、また不明瞭な音声を適切に認識して会話の補助に役立てうる携帯用音声認識出力補助装置に関する。 The present invention relates, for example a person who utters ambiguous sound such as such as vocal cords excised people and handicapped is utilized relates to a suitable portable voice recognition output auxiliary device, in particular easily carried possible and then, also relates to a portable voice recognition output assist device which can help to assist in conversation properly recognize ambiguous voice.

【0002】 [0002]

【従来の技術】従来の音声認識装置は、予め健常者の発声する音声に対応する多数の標準音声パターンを記憶し、その健常者の口から発声する音声パターンと予め記憶される多数の標準音声パターンとを比較照合し、健常者の発声する音声パターンと一致する標準音声パターンがあれば、当該標準音声パターンから健常者の発声する音声を認識することが行われている。 BACKGROUND OF THE INVENTION Conventional speech recognition device stores a number of standard voice patterns corresponding to voice uttered in advance healthy person, a number of standard audio to be previously stored speech pattern uttered from the mouth of the healthy person comparing collating the pattern, if any standard speech pattern that matches the voice pattern uttered healthy subjects, recognize the voice uttered healthy subjects from the standard voice pattern is performed.

【0003】一方、音声合成装置は、音声を出力する装置であって、アナウンサが発声する音声を録音し、それを分析手法によって低ビットに圧縮,記録し、さらに出力するときに再生する方式と、入力する仮名に対応して単音を組み合わせ,アクセントとイントネーションとを重畳する規則合成方式とがある。 On the other hand, the speech synthesizer is a device for outputting audio, a method to record a voice announcer utters, compresses it by analytical techniques at low bit, records, plays when a further output combine single note in response to kana to enter, there is a rule synthesizing method for superimposing the accent and intonation. 前者は音声応答装置の出力として利用され、プッシュホンのPB入力と組合わせてオーダエントリ分野で利用されている。 The former is utilized as an output of the voice response unit, it is used in the order entry fields in combination with touchtone PB input. 後者は、日本語,英語の文章から直接音声に変換する技術が開発されており、今後の技術の発展に期待するところが大きい。 The latter, Japanese, technology-to-speech directly from the English text and have been developed, largely to be expected in the development of future technology.

【0004】 [0004]

【発明が解決しようとする課題】しかしながら、従来の音声認識装置は、健常者の口から発声する音声パターンから音声認識を行っており、例えば手術等で声帯を抽出した者,舌ガンにより舌をなくした者,不明瞭な音声を発声する非健常者等から発する音声については全く認識できない。 [SUMMARY OF THE INVENTION However, the conventional speech recognition apparatus, and performs speech recognition from a speech pattern uttered from a healthy person's mouth, for example, those obtained by extracting vocal cord surgery or the like, the tongue by tongue cancer lost person, can not be completely aware of the sound emanating from the non-healthy or the like who uttered the ambiguous voice. その理由は、不明瞭な音声を発声するために認識不可能となるだけでなく、口から発声する音声の空気振動を検出しているので、声帯を抽出した者や舌ガンで舌をなくした者の場合にはもともと口から音声を発声しないので適用不能となる。 The reason is not only a recognition impossible to say the unclear speech because it detects the air vibrations of the voice uttered from the mouth, eliminating the tongue extracted person or tongue cancer of the vocal cords It becomes inapplicable because it does not say the sound from the original mouth in the case of a person.

【0005】なお、今後の技術的進歩いかんによっては不特定多数の音声認識が可能となったり、また音声認識装置を用いた種々の装置が日常生活の中で使用されてくるであろうが、何れにせよ、健常者に有効な装置の開発であると考えられる。 [0005] Incidentally, although it will in some future technological advances Ikan or enables an unspecified number of the speech recognition, also various devices using a voice recognition device comes used in daily life, in any case, it is considered to be a development of the apparatus useful healthy subjects. ゆえに、種々の障害をもつ非健常者は、その音声が不明瞭であったり、音声の発生速度が遅いために、折角新しい装置が開発されてもそれを充分に使いこなすことは非常に難しいと思われる。 Thus, a non-healthy person with a variety of disorders, thought or a the voice unclear, because the generation rate of the voice is low, much trouble new device to master sufficiently it be developed very difficult It is.

【0006】一方、前記音声合成装置の場合には、個人の発声する多くの言葉や感情のこもった音声信号とはならず、会話するという観点からみれば未だ不十分なものである。 [0006] On the other hand, in the case of the speech synthesis device, not to many of the words and speech signal loving feelings that utterance of the individual, but still inadequate when viewed from the point of view of conversation.

【0007】本発明は上記実情に鑑みてなされたもので、口から音声を発声できない者でも音声に相当する信号を確実に入力可能な携帯用音声認識出力補助装置を提供することを目的とする。 [0007] The present invention has been made in view of the above circumstances, and an object thereof is to provide a reliable input can be portable speech recognition output assisting device corresponding signal to the audio even a person who can not speak the voice from the mouth .

【0008】また、本発明の他の目的は、非健常者の発声する不明瞭な音声を正しく認識し、音声を発声する者の感情を含めた音声合成を実現する携帯用音声認識出力補助装置を提供することにある。 Another object of the present invention recognizes the unclear speech uttered non healthy person correctly, portable voice recognition output auxiliary apparatus for realizing voice synthesis, including the emotion of the person uttering the speech It is to provide a.

【0009】さらに、本発明の他の目的は、非健常者の身体の状況を考慮しつつ適切な音声信号を発生する携帯用音声認識出力補助装置を提供することにある。 Furthermore, another object of the present invention is to provide a portable speech recognition output assist device for generating an appropriate sound signal taking into account the non-healthy person's body conditions. さらに、本発明の他の目的は、非健常者が手軽に装着でき、 Furthermore, another object of the present invention, handicapped person can easily mount,
また操作性に富んだ携帯用音声認識出力補助装置を提供することにある。 And to provide a portable speech recognition output assisting device rich in operability.

【0010】 [0010]

【課題を解決するための手段】上記課題を解決するために、請求項1に対応する発明は、振動発生体に巻付け固定する吸音性の布地で形成された短冊状の装着体の裏面側に当該振動発生体から発生する振動を検出して電気的な振動周波数信号に変換する平坦状の音声入力手段を取り付け、さらに前記装着体の表面側に前記振動周波数信号に応じた音声信号を出力する平坦状の音声出力手段を取り付けた音声入出力装置を有する携帯用音声認識出力補助装置である。 In order to solve the above problems SUMMARY OF THE INVENTION, invention corresponding to claim 1, the back surface side of the winding fixing to sound absorbing formed by the fabric strip-shaped mounting member to the vibration generator the attachment of the flat voice input means for converting an electrical vibration frequency signal by detecting the vibration generated from the vibration generator further the mounting member and the output audio signal corresponding to the oscillation frequency signal to the surface side of the a portable voice recognition output assist device having voice input and output device fitted with a flat voice output means for.

【0011】次に、請求項2に対応する発明は、振動発生体から発生する振動を検出して電気的な振動周波数信号を出力する音声入力手段およびこの音声入力手段によって入力された振動周波数信号に応じた音声信号を出力する音声出力手段とを有する音声入出力装置と、前記音声入力手段から入力された振動周波数信号から声紋,音の強弱および高低,発生音を認識する音声認識部と、予め複数の標準音声パターンおよび当該パターンに対応する音声符号が記憶され、前記音声認識部によって認識された発生音に係わる音声符号と既に記憶されている前記音声符号とを比較し、両音声符号が一致したとき、前記音声符号に対応する標準音声パターンを読み出し、当該標準音声パターン、前記声紋,音の強弱および高低等からなる音声情報を [0011] Next, the invention is an oscillation frequency signal that is input by the voice input means and the voice input means for outputting an electrical vibration frequency signal by detecting the vibration generated from the vibration generator corresponding to claim 2 a voice input and output device and, voiceprint from the vibration frequency signal inputted from the voice input means, the sound of intensity and height recognize generated sound speech recognition unit and a voice output means for outputting a sound signal according to, pre voice code corresponding to a plurality of standard voice pattern and the pattern is stored, the already stored audio code relating to the recognized sound generated by the voice recognition unit compares the speech code, both speech code is when matched, it reads the standard voice patterns corresponding to the audio code, the standard voice pattern, the voiceprint, audio information consisting of strength and height, etc. of the sound 力する音声符号判定部とを設けた携帯用音声認識出力補助装置である。 A portable voice recognition output assisting apparatus provided with a speech code decision unit for force.

【0012】次に、請求項3に対応する発明は、請求項2に対応する発明の構成要件に、新たに前記音声符号判定部から出力される前記標準音声パターンと前記声紋とを合成し、さらに前記音の強弱および高低を付して合成音を作成する音声合成部と、この音声合成部で作成された合成音を音声信号に変換して前記音声出力手段から出力する音声変換出力部とを付加してなる携帯用音声認識出力補助装置である。 [0012] Next, the invention corresponding to claim 3, the constituent elements of the invention corresponding to claim 2, combines the above said standard voice pattern outputted from the newly said audio code judging unit voiceprint, a voice synthesizing unit for creating a synthesized speech further subjected strength and height of the sound, a voice conversion output portion for outputting from said audio output means into a speech signal synthesized sound created by the speech synthesizer a portable voice recognition output auxiliary device formed by adding a.

【0013】さらに、請求項4に対応する発明は、請求項2に対応する発明の構成要件に、新たに前記音声符号判定部から出力される前記標準音声パターンと前記声紋とを合成し、さらに前記音の強弱および高低を付して合成音を作成する音声合成部と、この音声合成部によって作成された合成音を記憶する音声記憶部と、この音声記憶部に記憶される合成音を音声信号に変換して前記音声出力手段から出力する音声変換出力部と、前記音声記憶部に記憶される合成音を読み出して前記音声出力手段から繰り返し出力させる音声繰返しスイッチと、前記音声変換出力部から出力される音声信号の速度を可変する音声速度可変手段と、前記音声変換出力部から出力される音声信号レベルを可変し強弱を付ける音声強弱可変手段とを付加してなる Furthermore, the invention corresponding to claim 4, the constituent elements of the invention corresponding to claim 2, combines the above said standard voice pattern outputted from the newly said audio code judging unit voiceprint, further speech and speech synthesis unit, a voice storage unit for storing synthetic speech created by the speech synthesizer, a synthesized voice that is stored in the voice storage unit for creating a synthesized sound are denoted by the intensity and level of the sound a voice conversion output unit for converting a signal outputted from the sound output unit, and the audio repeat switch for repeatedly outputted from the sound storage unit the sound output means reads the stored is synthesized sound from the speech conversion output unit and sound speed varying means for varying the speed of the audio signal output, obtained by adding the sound intensity varying means for applying a variable to intensity the audio signal level output from the voice conversion output unit 帯用音声認識出力補助装置である。 It is a speech recognition output auxiliary equipment for the band.

【0014】さらに、請求項5に対応する発明は、音声入力手段および音声出力手段とを有する音声入出力装置部分と、音声認識部,音声符号判定部,音声変換出力部をもつ本体装置部分と、前記音声記憶部に記憶される合成音を読み出して前記音声出力手段から繰り返し出力させる音声繰り返しスイッチ、前記音声変換出力部から出力される音声信号の速度を可変する音声速度可変手段、 Furthermore, the invention corresponding to claim 5, and the audio output device section having an audio input means and audio output means, a main unit portion having a speech recognition unit, audio sign determination unit, an audio conversion output unit , the voice storage unit to read out the stored is synthesized sound repeatedly from the sound output unit repeating speech to output switch, sound speed varying means for varying the speed of the sound signal output from the voice conversion output unit,
前記音声変換出力部から出力される音声信号レベルを可変し強弱を付ける音声強弱可変手段をもつ音声調整部分とに分けた携帯用音声認識出力補助装置である。 Wherein a portable voice recognition output assisting device divided into a sound adjusting portion having a sound intensity varying means for applying a variable to intensity the audio signal level output from the audio conversion output unit.

【0015】 [0015]

【作用】従って、請求項1に対応する発明は以上のような手段を講じたことにより、振動発生体,例えば非健常者の首に巻き付け固定する装着体に吸音性の布地を用い、かつ、装着体の裏面側および表面側とにそれぞれ個別に平坦状の音声入力手段および音声出力手段を取り付けたことにより、口から発声する音声や外部から入ってくる雑音の影響を防止でき、しかも非健常者の喉に対する負担が軽減され、直接喉から発声する振動を確実に入力することができる。 [Action] Therefore, by the invention corresponding to claim 1 which took measures as described above, the vibration generating body, using a sound absorbing fabric attachment body, for example for fixing wound around the neck of the non-healthy person, and, by fitted with back side and front side respectively individually flat voice input means and voice output means of the attachment body, it can prevent the influence of the noise coming from the sound or external uttered from the mouth, yet unhealthy the burden to the throat is reduced, it is possible to reliably input vibrations speaking directly from the throat.

【0016】次に、請求項2に対応する発明は、音声認識部が音声入力手段から入力される振動周波数信号から声紋,音の強弱,音の高低および発声音を認識して音声符号判定部に送出する。 [0016] Next, invention, voiceprint from the vibration frequency signal the speech recognition unit is input from the speech input unit, sound intensity, it recognizes the height and utterance of the sound speech code judging unit corresponding to claim 2 and it sends it to. この音声符号判定部では、予め複数の標準音声パターンおよび当該パターンに対応する音声符号が記憶されているので、音声認識部から送られてくる発生音に係わる音声符号と既に記憶されている音声符号とを比較し、両音声符号が一致したとき、その音声符号に対応する標準音声パターンを読み出し、当該標準音声パターン、前記声紋,音の強弱および高低等からなる音声情報を出力するので、非健常者の発声する不明瞭な音声でも正しく認識でき、また非健常者の発声する短い言葉から日常会話等に用いる長い言葉に変換されている標準音声パターンを容易に出力できる。 This audio code determination unit, advance since speech codes corresponding to a plurality of standard voice pattern and the pattern is stored, previously speech codes stored with the audio code relating to generating sound sent from the speech recognition unit comparing the door, when both voice code match, reads out the standard voice patterns corresponding to the audio code, the standard voice pattern, the voiceprint, since outputs audio information consisting of strength and height, etc. of the sound, unhealthy who also it is recognized correctly in unclear speech uttered and a standard voice pattern being converted into long term use in everyday conversation, etc. from a short word uttered non healthy person can be output easily.

【0017】さらに、請求項3に対応する発明は、請求項2に対応する発明と同様な作用を有する他、音声合成部にて音声符号判定部から送られてくる標準音声パターンと前記声紋とを合成し、さらに音の強弱,高低を付して合成音を作成するので、感情を含めて音声合成でき、 Furthermore, the invention corresponding to claim 3, further having the same effect as the invention corresponding to claim 2, said a standard voice pattern sent from the voice code determination section by the speech synthesis unit voiceprint was synthesized and further sound of strength, so designated by the high and low to create a synthesized sound, can speech synthesis, including the emotion,
しかも音声信号変換出力部において合成音を音声信号に変換して前記音声出力手段から出力するので、感情表現を伴った音声信号を出力できる。 Moreover, since the output from the sound output unit is converted into a speech signal synthesized speech in the audio signal conversion output unit can output the audio signal accompanied by emotional expressions.

【0018】さらに、請求項4に対応する発明は、請求項2および請求項3に対応する発明と同様な作用を有する他、音声繰返しスイッチを操作して前記音声記憶部から再度合成音を読み出して音声出力手段から繰り返し出力するので、相手から聞き直された場合でも最初から音声を発することなく同様の音声信号を出力できる。 Furthermore, the invention corresponding to claim 4, in addition to having a similar to the invention corresponding to claims 2 and 3 act, read again synthesized sound from the speech storage unit by operating the audio repeat switch since repeatedly outputted from the sound output unit Te, can output the same audio signals without emitting a sound from the first even if the re hear from the other. また、音声速度可変手段によって音声信号の出力速度を可変することにより、健常者にとって分かり易い速度で音声信号を出力できる。 Further, by varying the output speed of the sound signal by the sound speed varying means can output an audio signal at a straightforward rate for a healthy person. また、音声強弱可変手段によって音声信号レベルを可変し強弱を付けて出力するので、同様に健常者にとって分かり易い音声信号を出力できる。 Further, since the variable and outputs with a strength of audio signal level by the sound intensity changing means can output intelligible audio signal for healthy subjects as well.

【0019】さらに、請求項5に対応する発明は、音声入力手段および音声出力手段とを有する音声入出力装置部分と、音声認識部、音声符号判定部、音声信号変換出力部等をもつ本体装置部分と、種々の調整機能をもつ音声調整部分とに分けることにより、音声入出力装置部分は非健常者の首に巻き付け、本体装置部分は胴体の腰部分などに吊下し、音声調整部分は手元に持って操作するようにすれば、簡単に携行でき、かつ、手軽に操作できる。 Furthermore, the invention corresponding to claim 5, the main unit having a voice input and output device portion having an audio input means and voice output means, the speech recognition unit, audio code determining unit, the audio signal conversion output unit such as and portions, by separating into a sound adjusting portion having various adjustment functions, audio input and output device portion wound to the neck of the non-healthy person, the main unit portion suspended from such a torso waist, audio adjustment portion if to operate with the hand, easy to carry, and can be easily manipulated.

【0020】 [0020]

【実施例】以下、本発明の実施例について図面を参照して説明する。 EXAMPLES The following will be described with reference to the accompanying drawings embodiments of the present invention. 図1は本発明装置の構成を示すブロック図である。 Figure 1 is a block diagram showing the configuration of the device of the present invention. 図同において1は音声入出力装置であって、これは図2に示すごとく例えばむち打ち症などのときに首に巻き付けるコルセットのような例えば布地の装着体1 Figure 1 In the same is a sound output device, which attachment body 1, such for example a fabric like corset wrapped around the neck when such as for example whiplash 2
1が用いられ、この装着体11の適宜な個所には喉から発声する振動を直接取り込む音声入力手段12および音声信号を出力する音声出力手段13が取り付けられ、さらに首に巻き付け固定するために装着体両端部の対峙面にマジックテープ14a,14bが取り付けられている。 1 is used, the sound output unit 13 for outputting a voice input unit 12 and the audio signal capturing vibrations utterance directly from the throat to the appropriate location of the attachment body 11 is attached, attached to further wrapped around the neck fixed body both ends of the facing surfaces Velcro 14a, 14b is attached. なお、マジックテープ14a,14b以外の従来周知の種々の固定手段例えばホックなどを用いて固定してもよい。 Incidentally, Velcro 14a, may be fixed by using a well-known variety of securing means such as hook other than 14b.

【0021】前記装着体11は、例えば外部雑音を遮断するカーテン地のごとく吸音性の優れた布地で作成し、 [0021] The attachment body 11 creates, for example, excellent fabric as the sound absorbing curtain fabric for blocking external noise,
これによって口から発声する音声や外部から入ってくる雑音を吸収し、前記音声入力手段12に影響を与えないようにする。 This absorbs noise coming from voice and external uttered from the mouth, so as not to affect the sound input means 12. 音声入力手段12は、装着体11の裏側(内側)面部に平坦に取り付けられ、喉から発声する振動を電気信号に変換して出力する。 Voice input means 12, a flat attached to the back side (inside) surface of the mounting member 11, converts the vibration uttered from the throat to an electric signal. このように平坦化することにより装着体11に馴染み易く、喉への圧迫感がなく、ひいては喉に対する負担を軽減できる。 Thus amenable to attachment body 11 by flattening, no tightness to the throat, can reduce the burden on the thus throat. 一方、音声出力手段13は、音声入力手段12とは反対側,つまり装着体11の表側(外側)面部に同様にフラットなスピーカが取り付けられる。 On the other hand, the audio output unit 13, the opposite side, i.e. similar flat speaker is mounted on the front side (outside) surface of the mounting member 11 and the sound input means 12. このようにフラットなスピーカを口と同じ縦ライン上の正面に取り付けることにより、喉に対する負担が軽減され、話し相手からみればあたかも口から音声が発する状態を作り出す。 By thus attaching the flat loudspeaker in front on the same vertical line as the mouth, the burden on the throat is reduced, creating a state in which the emitted as if the sound from the mouth when viewed from conversation partner. また、この音声出力手段13は、装着体11と同系色または適宜な素材で覆うとか、音声出力手段13の色に適宜な工夫を講じることにより、出切る限り目立たない自然な取り付け状態に取り付けるものとする。 Also, the audio output unit 13, Toka covered with attachment body 11 and the same color or appropriate materials, by taking an appropriate twist on the color of the sound output unit 13, and those attached to the natural attachment state inconspicuous as possible to.

【0022】2は音声入力手段12から入力される音声振動周波数信号から個人の声紋の特徴,音の強弱と高低,正しい発声を認識する音声認識部である。 [0022] 2 wherein the individual voiceprint from the audio oscillation frequency signal inputted from the sound input means 12, sound intensity and high and low, the correct utterance recognizing speech recognition unit. この音声認識部2は、図3に示すように音声スペクトル変換手段21、音質判定手段22、声紋判定手段23および発声音認識手段24等からなっている。 The speech recognition unit 2, the speech spectrum converting means 21 as shown in FIG. 3, it consists quality determination unit 22, voice print determination unit 23 and the utterance recognition unit 24 or the like. この音声スペクトル変換手段21は、例えば図4(a)に示すような音声振動周波数信号を所定の周期でサンプリングすることにより、図4(b)に示すような音声スペクトルに変換する。 The speech spectrum converting means 21 by sampling the audio oscillation frequency signal as shown in FIG. 4 (a) for example, at a predetermined cycle, converts the speech spectrum as shown in Figure 4 (b). 音質判定手段22は、音声スペクトルから音の強弱と高低とを判定するものであり、そのうち音の強弱は、 Sound quality decision means 22 is intended to determine the high and low intensity of the sound from the audio spectrum, the intensity of which sound,
予め所定の基準レベルが設定され、音声スペクトルの各成分が基準レベルから上下方向にどの程度レベル的に離れているかを表すものであり、一方、音の高低は音の周波数に依存するが、ここでは専ら音声スペクトルの各成分のレベルを表す。 Previously predetermined reference level is set, which indicates how each of the components of the speech spectrum is how level-apart from the reference level in the vertical direction, whereas, the height of the sound depends on the frequency of the sound, wherein in exclusively represents the level of each component of the speech spectrum. 声紋判定手段23は音声スペクトルの周波数成分レベルを抽出するものであり、また発声音認識手段24は音声スペクトルの分布状態から発声音を決定し、その発声音に対応する文字コード,例えば「ア」とか「イ」とかのコードに変換し出力する。 Voice print determination unit 23 is intended to extract a frequency component level of the speech spectrum, also utterance recognition unit 24 determines the utterance from the distribution of the speech spectrum, the character code corresponding to the utterance, for example, "A" the output is converted to the code of Toka Toka "i". そして、これら判定手段22〜24によって判定されたデータは時系列的に出力され、音声符号判定部3に送られる。 Then, these data determined by the determining means 22 to 24 are outputted time series sent to the speech code judgment unit 3.

【0023】この音声符号判定部3は、予め標準音声パターンとそれに対応する音声符号とが記憶され、発声音認識手段24にて音声認識された正しい発声音である文字コード(音声符号)を取り出し、この音声符号と既に記憶されている音声符号とを比較し、両音声符号が同一となってとき、それに対応する標準音声パターンを出力する機能を有する。 [0023] The audio code determining unit 3 in advance standard voice pattern and the speech code corresponding thereto is stored, retrieves the character code (speech code) is a speech recognized correct utterance by utterance recognition unit 24 compares the speech code already stored with the audio code, when both speech code becomes the same, has a function of outputting the standard voice patterns corresponding thereto. 具体的には、図5に示すように標準音声パターンを記憶する音声パターン記憶手段31と、 Specifically, a voice pattern storage means 31 for storing the standard voice pattern as shown in FIG. 5,
この音声パターン記憶手段31の各標準音声パターンに対応する音声符号を記憶する音声符号記憶手段32と、 The audio code storage means 32 for storing a voice code corresponding to each standard voice pattern of the voice pattern storage means 31,
音声符号判定手段33とによって構成されている。 It is constituted by the audio code determining unit 33.

【0024】この音声符号判定手段33は、前記音質判定手段22からの音の強弱,高低に関するデータおよび声紋判定手段23からの声紋の特徴データをバッフアメモリ待ちの状態にし、発声音認識手段24で認識された正しい発声音の音声符号については、当該音声符号と音声符号記憶手段32に記憶されている多数の音声符号とを比較参照し、既に記憶されている音声符号と同一であれば、音声パターン記憶手段31から音声符号に対応する標準音声パターンを取り出し、既にバッフアメモリ待ちの状態にあるデータとともに音声情報記憶部4に記憶する。 [0024] The audio code determining unit 33, and the intensity of the sound from the sound judging means 22, the characteristic data of the voiceprint from the data and voice print determination unit 23 about the high and low states of the buffer memory waiting recognized utterance recognition unit 24 the speech code of-good utterance, the voice code and the number of audio code stored in the speech code memory means 32 compares the reference, if already the same as the voice code stored, audio pattern the standard voice patterns corresponding to the audio code from the storage means 31 is taken out, already stored in the voice information storage unit 4 along with the data in the state of the buffer memory waiting. このとき、発生音認識手段24の発生音の音声符号も同時に記憶してもよい。 In this case, the speech code of the generated sound of the sound generated recognition means 24 may also be stored simultaneously. 一方、発声音認識手段24 On the other hand, utterance recognition means 24
によって認識された音声符号と既に記憶されている音声符号とが不一致となったとき、その発声音認識手段24 When already a voice code that has been stored is not matched with the recognized speech code by the utterance recognition unit 24
で認識された発声音の音声符号を出力する。 In outputting the voice code of the recognized utterance.

【0025】なお、前記音声パターン記憶手段31に記憶されている標準音声パターンは、例えば“おはようございます”、“ありがとうございます”、“さようなら”などの日常会話で使用する言葉に相当するパターンである。 [0025] In addition, the standard voice pattern stored in the voice pattern storage means 31, for example, "Good morning", "Thank you", in a pattern corresponding to the word to be used in everyday conversation, such as "goodbye" is there. つまり、短い音声符号から長い言葉に変換することにより、非健常者が全ての言葉を発声しなくても十分に会話可能にパターン化している。 In other words, short by converting the voice code into long term, non-healthy person is sufficiently speakable patterned without say every word.

【0026】前記音声情報記憶部4は、声紋の特徴,音の強弱,音の高低および発声音に係わる標準音声パターン、必要に応じて認識された発生音の音声符号などの音声情報を一時記憶した後、音声合成部5に送出する。 [0026] The voice information storage unit 4, characterized in voiceprint, sound intensity, standard speech pattern according to the height and utterance of the sound, if necessary by temporarily storing the audio information such as speech code of the recognized generated sound after, it sent to the speech synthesizer 5.

【0027】この音声合成部5においては、図6に示すように音声情報記憶部4から送られてくる音声情報を記憶する音声情報記憶手段51と、この音声情報記憶手段51に記憶されている音声情報のうち、標準音声パターンと声紋の特徴データとを合成し、さらにかかる合成音に音の強弱および音の高低を付けることにより、完全に復調化した合成音を作り出し、後続の音声記憶部6に記憶する音声合成手段52とで構成されている。 [0027] In the speech synthesizer 5, the audio information storing means 51 for storing the voice information sent from the voice information storage unit 4 as shown in FIG. 6, are stored in the voice information storage means 51 of the audio information, and combining the feature data of the standard voice pattern and voiceprint, by attaching a height of intensity and sound of the sound to further such synthesized sounds, creating a completely demodulator and the synthesized sound, the subsequent voice storage unit It is composed of a voice synthesis section 52 for storing the 6.

【0028】7は音声変換出力部であって、これは音声記憶部6に記憶されている合成音情報を読み出して音声出力可能なアナログ信号に変換して音声出力手段13から音声を出力する機能をもっている。 [0028] 7 is a voice conversion output unit, which is a function of outputting audio from the audio output unit 13 converts the audio can be output analog signal by reading synthesized speech information stored in the speech storage section 6 it has.

【0029】さらに、本装置には音声出力調整部8が設けられている。 Furthermore, the present device is provided with a sound output adjuster 8. この音声出力調整部8を設けた理由は、 The reason for providing the audio output adjusting section 8,
非健常者の状況に応じて会話の内容が相手側に適切に伝達できるようにすることにある。 The contents of the conversation in accordance with the handicapped person situation is to be able to properly transmitted to the other party. すなわち、音声出力調整部8には、一度,音声出力手段13から出力された音声信号が相手側から聞き直されたとき、音声記憶部6から繰り返し合成音を出力させるために読み出し操作を行う音声繰返しスイッチ81が設けられている。 That is, the sound output adjuster 8, once when the audio signals output from the sound output unit 13 is re heard from the other side, the speech of reading operation in order to output repeatedly synthesized sound from the speech storage section 6 repeated switch 81 is provided. これは、 this is,
非健常者が最初から同じ音声を発声するのが非常に大変であるので、その負担を軽減するためである。 Since the non-healthy person speaks the same voice from the beginning is very hard, in order to reduce the burden.

【0030】また、この音声出力調整部8には、音声速度可変器82および音声強弱可変器83が設けられている。 Further, this audio output adjustment unit 8, the speech speed variator 82 and the sound intensity adjustment device 83 is provided. 予め音声変換出力部7側にコンデンサなどを用いたアナログ的な1次遅れ回路を組み込んでおき、音声速度可変器82で適宜に1次遅れ回路を短絡することにより、音声信号の速度を可変する。 Advance advance incorporate analog first-order lag circuit using a capacitor-speech output unit 7 side, by shorting the appropriate first-order lag circuit voice speed variator 82, to vary the speed of the speech signal . これは非健常者の発声速度は必ずしも早くないので、音声出力手段13から出力される合成音の出力速度を適宜変更し、健常者が聞き取り易い速度にするためである。 Since this utterance speed of the handicapped person is not always quickly, by appropriately changing the output speed of the synthesized sounds output from the sound output unit 13, because the healthy person to easily speed listening. また、音声強弱可変器83は、音声変換出力部7側の音声信号のレベルを可変するとか、増幅率を可変することにより、音声信号に強弱を付けて出力する。 The voice intensity variator 83 you can always try to adjust the levels of the audio conversion output portion 7 side of the speech signal, by varying the amplification factor, and outputs with a strength in the audio signal. これは外部の雑音が多いところでも音声出力手段13から出力される音声信号に強弱を付けて聞き取り易くするためである。 This is to easily hear with a strength to the audio signal output from the voice output unit 13 even at the outside of noisy.

【0031】次に、以上のように構成された装置の動作について説明する。 [0031] Next, the operation of the apparatus configured as described above. 先ず、非健常者が音声入出力装置1 First, non-healthy subjects audio input and output device 1
の装着体11を首に巻き付けた後、装着体11の両端対峙面に設けたマジックテープ部分を押し付けて固定する。 After winding the mounting body 11 to the neck, to secure against the Velcro portions provided at both ends facing surface of the mounting member 11. このとき、装着体11に取り付けられている音声出力手段13が正面位置にくるように設定し、また音声入力手段12は喉の振動を最も取り込み易い部位,例えば首の側部の位置に設定する。 In this case, the sound output means 13 is attached to the attachment body 11 is set to come to the front position, also the voice input unit 12 is set to the position of the most uptake prone sites, for example the neck of the side vibration of the throat . このとき、音声入力手段1 At this time, the voice input means 1
2および出力手段13が平坦状に形成されているので、 Since 2 and the output unit 13 is formed flat,
首に馴染み易く、喉に対する負担が非常に少なくなる。 Amenable to the neck, the burden to the throat is very small.

【0032】この状態において非健常者が音声を発生すると、当該非健常者の喉の振動を音声入力手段12で取り込んで電気的な振動周波数信号に変換し、音声認識部2に送出する。 [0032] handicapped persons in this state to generate a sound, the vibration of the throat of the handicapped person is converted into an electrical oscillation frequency signal is taken by the voice input unit 12, and sends it to the speech recognition unit 2.

【0033】ここで、音声認識部2は、音声入力手段1 [0033] In this case, the voice recognition unit 2, voice input means 1
2から入力される振動周波数信号を音声スペクトル変換手段21により音声スペクトルに変換した後、音質判定手段22,声紋判定手段23および発生音判定手段24 After converting the speech spectrum of the vibration frequency signal input from the 2 by the voice spectrum converting means 21, the sound quality determining means 22, voice print determination unit 23 and the generated sound determination unit 24
に送出する。 And it sends it to. これら各判定手段22〜24は前述した判定条件に従って音の強弱および音の高低、声紋の特徴および正しい発生音を決定し、特に発生音の場合には発生音に対応する文字コード(音声符号)に変換し、音の強弱および音の高低、声紋の特徴データとともに音声符号判定部3に送出する。 Height of each judging means 22 to 24 intensity and sound of the sound in accordance with the determination conditions described above, to determine the characteristics and the correct sound generated voiceprint, character codes corresponding to the generated sound especially in the case of the generated sound (voice code) converted to, and sends height of sound intensity and sound, with characteristic data for voiceprint to the audio code judgment unit 3.

【0034】この符号判定部3においては、予め音声パターン記憶手段31に標準音声パターンが記憶され、また音声符号記憶手段32に前記標準音声パターンに対応する音声符号が記憶されており、特に標準音声パターンには例えば“おはようございます”、“ありがとうございます”、“さようなら”などの日常会話で使用する言葉に相当するパターンの形で保存されている。 [0034] In the code judgment unit 3, previously speech pattern standard voice pattern storage means 31 is stored, also has speech code is stored corresponding to the standard voice pattern in the voice code storage means 32, in particular standard voice the pattern, for example, "Good morning", "Thank you", are stored in the form of a pattern corresponding to the word to be used in everyday conversation, such as "goodbye".

【0035】従って、符号判定部3では、音声認識部2 [0035] Therefore, the code judgment unit 3, the speech recognition unit 2
によって認識された正しい発声音である文字コード(音声符号)を受けると、その幾つかの音声符号と既に記憶されている音声符号とを比較し、両音声符号が同一となったとき、それに対応する標準音声パターンを読み出し、前記音質判定手段22からの音の強弱,高低に関するデータおよび声紋判定手段23からの声紋の特徴データとともに音声情報記憶部4を介して音声合成部5に送出する。 When receiving the character code (speech code) is a known-good utterance by comparing the voice code that has already been stored and its several speech code, when both voice code becomes identical, corresponding It reads the standard voice pattern, intensity of the sound from the sound judging means 22, and sends to the speech synthesis unit 5 via the voice information storage unit 4 along with the characteristic data of the voiceprint from the data and voice print determination unit 23 related to a height.

【0036】ここで、音声合成部5は、音声情報記憶部4から送られてくる標準音声パターン,音の強弱,高低および声紋等の音声情報を音声情報記憶手段51に一旦記憶した後、音声合成手段52で音声合成を行う。 [0036] Here, the speech synthesis unit 5, after temporarily stored in the voice information storage unit 51 the audio information of the standard voice pattern sent from the voice information storage unit 4, the sound of strength, such as high and low and voiceprint, voice performing speech synthesis by synthesizing means 52. この音声合成は、音声情報のうち、標準音声パターンと声紋の特徴データとを合成し、さらにかかる合成音に音の強弱および音の高低を付けて完全な復調をなした合成音を作り出し、音声記憶部6に記憶した後、音声変換出力部7に送られる。 The speech synthesis is among the audio information, and combining the feature data of the standard voice pattern and voiceprint, create a made a complete demodulation synthesized sound with a height of more sound in such a synthesized sound intensity and sound, voice after storing in the storage unit 6 and sent to the voice conversion output unit 7. この音声変換出力部7では、音声記憶部6に記憶されている合成音情報を読み出して音声出力可能なアナログ信号に変換して音声出力手段13から音声を出力する。 In the voice conversion output unit 7, and outputs the sound from the sound output unit 13 converts the audio can be output analog signal by reading synthesized speech information stored in the voice storage unit 6.

【0037】このとき、例えば相手側から聞き直されたとき、非健常者は、音声繰返しスイッチ81を操作すれば、音声記憶部6から再度合成音情報を読み出し、音声変換出力部7にて音声出力可能なアナログ信号に変換して音声出力手段13から音声を出力するので、相手側に適切な音声信号,つまり会話の内容を伝えることができる。 [0037] In this case, for example, when re heard from the other side, the non-healthy individuals, by operating the audio repeat switch 81, reads out again the synthesis sound information from the voice storage unit 6, the voice by voice conversion output section 7 since outputs sound from the sound output unit 13 is converted into printable analog signal can be conveyed appropriate audio signals to the other party, that is, the contents of the conversation. また、非健常者の発声速度が遅い場合には、音声速度可変器82で適宜に音声信号の出力速度を早くすれば、健常者等が聞き取り易くなる。 Further, when the utterance speed of the handicapped person is slow, it is appropriately faster the output speed of the audio signal to the voice speed changer 82, a healthy person or the like is easier to hear. また、例えば外部の雑音が多いところでは、音声強弱可変器83を可変操作すれば、音声信号レベルを大きくして音声出力手段13 Further, for example, external where noise is large, if the variable operating the audio strength changer 83, voice output unit 13 by increasing the audio signal level
から出力でき、同様に健常者等が聞き取り易くなる。 Can be output from, as well as become easier to hear is a healthy person, and the like.

【0038】従って、以上のような実施例の構成によれば、音声入出力装置1の本体となるべき装着体11は吸音性に優れた布地などで作成したので、非健常者の首に巻き付けたときに完全になじむだけでなく、口から発声する音声や外部から入ってくる雑音を吸収し、音声入力手段12からは喉から発声する振動を適切に入力できる。 [0038] Therefore, according to the configuration of the above-described embodiment, since the mounting member 11 to be a body of the audio input and output device 1 as created by the fabric having excellent sound absorbing properties, wrapped neck handicapped persons not only completely fit at the time was, to absorb the noise coming from the voice or external to the utterance from the mouth, can properly enter the vibration uttered from the throat from the voice input means 12. しかも、装着体11の面部には平坦状の音声入力手段12および音声出力手段13を貼り付けるように取り付ければ、軽量可で携行に便利であり、喉に対する圧迫感などがなくなり、喉に対する負担を軽減できる。 Moreover, by attaching to the surface of the mounting member 11 pasted flat voice input unit 12 and an audio output unit 13 is convenient to carry lightweight friendly, there is no such sense of oppression against throat, the burden on the throat It can be reduced. また、音声認識部2において音声入力手段12から入力される振動周波数信号から声紋の特徴,音の強弱および音の高低,発声音を認識し、この発声音の音声符号と声紋の特徴,音の強弱および音の高低情報等を音声符号判定部3に送出し、ここで音声符号と予め記憶されている多数の音声符号とを比較し、両音声符号が一致するとき、 Further, the voiceprint from the vibration frequency signal input from the sound input means 12 in the speech recognition unit 2 features, level of sound intensity and sound, recognizes the utterance, the speech code and voiceprint of the utterance feature, sound when the height information of the intensity and sound or the like is sent to the audio code judgment unit 3, wherein comparing the plurality of audio code which is previously stored speech encoding, both speech code match,
当該音声符号に対応するありがとうございます”、“さようなら”などの日常会話で使用する言葉に相当する標準音声パターンを読み出し、前記声紋の特徴,音の強弱および音の高低等とともに音声合成部5に送出するようにしたので、非健常者による最初の短い会話の発声から日常会話である長文の標準音声パターンを出力でき、非健常者による会話の負担を十分に補助できる。 Thank you corresponding to the audio coding "," goodbye "reads the standard voice pattern which corresponds to the word to be used in everyday conversation, such as, the characteristics of the voiceprint, along with the high and low, such as the sound of intensity and sound in speech synthesis section 5 since so sent, the first short conversation lengthy standard voice pattern a routine conversation utterances can output by non-healthy person, can be sufficiently assist the burden of conversation unhealthy person.

【0039】さらに、音声合成部5において、音声符号判定部3側から送られてくる各種の音声情報を一旦記憶した後、その音声情報の中から標準音声パターンに声紋の特徴を合成し、さらに音の強弱および音の高低を付けたので、非健常者の感情を含めた合成音を作成できる。 [0039] Further, in the voice synthesizing unit 5, after temporarily storing various voice information sent from the voice code judgment unit 3 side, it was synthesized characteristic voiceprint the standard voice pattern from the voice information, further because with the high and low of the sound of intensity and sound, able to create a synthesized sound, including the feelings of non-healthy individuals.

【0040】さらに、音声信号を繰り返し出力する音声繰返しスイッチ81、音声信号の速度や強度を可変する音声速度可変器82や音声強弱可変器83を設けたので、非健常者の状況や相手側の聞き取り状態に応じて適宜に操作しながら適切な音声信号を出力できる。 [0040] Further, the audio repeat switch 81 to repeatedly output the audio signal, is provided with the speech speed changer 82 and sound intensity changer 83 for changing the speed and intensity of the audio signal, the unhealthy person status and mating it outputs an appropriate audio signal while operating appropriately in accordance with listening state.

【0041】なお、上記実施例では、全体の構成について述べたが、非健常者が手軽に携行し簡単に操作する観点から考えたとき、次のような分割構成とすることが望ましい。 [0041] In the above embodiment has been described the overall structure, when the handicapped person is considered from the viewpoint of operating easily carried and easily, it is desirable that the as follows split configuration. つまり、音声入力手段12および音声出力手段13を有する音声入出力装置部分と、音声認識部2,音声符号判定部3,音声情報記憶部4,音声合成部5,音声記憶部6および音声変換出力部7等からなる電源部分を含む装置本体部分と、音声繰返しスイッチ81,音声速度可変器82および音声強弱可変器83等の音声出力調整部分とに分割すれば、適宜に信号線で接続するようにすれば、音声入出力装置部分を首に巻き付け固定し、 That is, the audio input and output device portion having a voice input unit 12 and an audio output unit 13, the speech recognition unit 2, the audio code judgment unit 3, the audio information storing unit 4, the voice synthesis unit 5, the voice storage unit 6 and the audio conversion output a device body portion including a power supply portion consisting of part 7, etc., the audio repeat switch 81, if divided into the audio output adjustment portion such as sound speed changer 82 and the sound intensity variation element 83, to connect properly to the signal line if in, fixed wrapped around the neck of the audio input and output device portion,
装置本体部分を腰に吊下し、音声出力調整部分を手にもっことができ、これによって手軽に携行でき、操作性を上げることができる。 Suspended from the device body portion to the waist can in his hand a sound output adjustment portion, thereby can carry easily, it is possible to enhance the operability.

【0042】また、装着体11は、布地を用いたが、吸音性の紙地またはそれに類する素材であれば、特に限定するものではない。 Further, attachment member 11 has been used a fabric, as long as the material similar to paper ground or sound absorption, is not particularly limited. その他、本発明はその要旨を逸脱しない範囲で種々変形して実施できる。 Besides, the present invention can be variously modified without departing from the scope thereof.

【0043】 [0043]

【発明の効果】以上説明したように本発明によれば、次のような種々の効果を奏する。 According to the present invention as described in the foregoing, it exhibits various effects such as the following. 請求項1の発明においては、口から音声を発声できない者でも音声に相当する信号を確実に入力でき、かつ、非健常者の喉を圧迫せずに喉の振動を適切に入力できる。 In the invention of claim 1, also a person who can not speak the voice from the mouth can be reliably input a signal corresponding to the voice, and the vibrations of the throat can be appropriately entered without pressing the throat of non-healthy person.

【0044】請求項2,3の発明は、非健常者の発声する不明瞭な音声を正しく認識でき、しかも音声パターン、声紋および音の強弱等を合成することにより、音声を発声する者の感情を含めた音声合成を実現できる。 The invention of claim 2 and 3, the unclear speech uttered the handicapped person can correctly recognized, moreover by synthesizing speech pattern, such as strength of voiceprint and sound, emotion of the person uttering the speech It is possible to realize a speech synthesis, including.

【0045】次に、請求項4の発明は、非健常者の身体の状況を考慮し、かつ、相手の聞き取り状態に応じて適宜に音声操作を行って適正な音声信号を発生することができる。 Next, the invention of claim 4, consider the non-healthy person's body conditions, and can appropriately generate the appropriate sound signal by a voice operation in accordance with the state listening opponent . さらに、請求項5の発明は、構成を適切に分割することにより、非健常者が手軽に装着でき、また非健常者による操作性を高めることができる。 Further, the invention of claim 5, by appropriately dividing the structure, a healthy person can be easily mounted and it is possible to improve the operability by the handicapped person.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明に係わる携帯用音声認識出力補助装置の一実施例を示す機能ブロック図。 Figure 1 is a functional block diagram showing an embodiment of a portable speech recognition output assisting device according to the present invention.

【図2】図1に示す音声入出力装置の構成を示す図。 2 is a diagram showing a configuration of a voice input and output device shown in FIG.

【図3】図1に示す音声認識部を具体化した機能ブロック図。 [Figure 3] embodying the functional block diagram of the speech recognition unit shown in FIG.

【図4】音声認識部による音声認識を説明する図。 Figure 4 is a diagram illustrating a speech recognition by the speech recognition unit.

【図5】図1に示す音声符号判定部を具体化した機能ブロック図。 [5] embodying the functional block diagram of the voice code determination unit shown in FIG.

【図6】図1に示す音声合成部を具体化した機能ブロック図。 6 embodying the functional block diagram of the speech synthesis unit shown in FIG.

【符号の説明】 DESCRIPTION OF SYMBOLS

1…音声入出力装置、2…音声認識部、3…音声符号判定部、4…音声情報記憶部、5…音声合成部、6…音声記憶部、7…音声変換出力部、8…音声出力調整部、1 1 ... audio input and output device, 2 ... speech recognition unit, 3 ... audio code determination section, 4 ... audio information storing unit, 5 ... speech synthesis unit, 6 ... voice storage unit, 7 ... sound conversion output unit, 8 ... audio output adjusting unit, 1
1…装着体、12…音声入力手段、13…音声出力手段、81…音声繰返しスイッチ、82…音声速度可変器、83…音声強弱可変器。 1 ... mounting body 12 ... sound input means, 13 ... sound output unit, 81 ... sound repeatedly switch, 82 ... audio speed changer, 83 ... sound intensity varying device.

Claims (5)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 振動発生体に巻付け固定する吸音性の素材によって形成された短冊状の装着体の裏面側に当該振動発生体から発生する振動を検出して電気的な振動周波数信号に変換する平坦状の音声入力手段を取り付け、さらに前記装着体の表面側に前記振動周波数信号に応じた音声信号を出力する平坦状の音声出力手段を取り付けた音声入出力装置を有することを特徴とする携帯用音声認識出力補助装置。 1. A conversion on the detected electrically oscillation frequency signal vibration generated from the vibration generating body on the back side of the strip-shaped mounting body that is formed by the sound absorbing material to the winding fixed to the vibration generator characterized in that it has a flat-shaped mounting voice input means, voice input and output device fitted with a flat audio output means further outputs an audio signal corresponding to the oscillation frequency signal to the surface side of the mounting body portable voice recognition output auxiliary equipment.
  2. 【請求項2】 振動発生体から発生する振動を検出して電気的な振動周波数信号を出力する音声入力手段およびこの音声入力手段によって入力された振動周波数信号に応じた音声信号を出力する音声出力手段とを有する音声入出力装置と、前記音声入力手段から入力された振動周波数信号から声紋,音の強弱,高低,発生音を認識する音声認識部と、予め複数の標準音声パターンおよび当該パターンに対応する音声符号が記憶され、前記音声認識部によって認識された発生音に係わる音声符号と既に記憶されている前記音声符号とを比較し、両音声符号が一致したとき、前記音声符号に対応する標準音声パターンを読み出し、当該標準音声パターン、前記声紋,音の強弱および高低等からなる音声情報を出力する音声符号判定部とを備えたこと Wherein the audio output for outputting an audio signal corresponding to the input vibration frequency signals by the voice input means and the voice input means for outputting an electrical vibration frequency signal by detecting the vibration generated from the vibration generator a voice output device and means, the voiceprint from the vibration frequency signal inputted from the voice input means, the sound of strength, high and low, and recognizing the speech recognition unit the generated sound, in advance a plurality of standard voice pattern and the pattern corresponding audio code is stored, the already stored audio code relating to the recognized sound generated by the voice recognition unit compares the voice code, when both voice code matches, corresponding to the audio code It reads the standard voice pattern, the standard voice pattern, the voiceprint, further comprising a voice code determination unit for outputting sound information consisting of strength and height, etc. of the sound を特徴とする携帯用音声認識出力補助装置。 Portable voice recognition output assisting device according to claim.
  3. 【請求項3】 請求項2記載において、前記音声符号判定部から出力される前記標準音声パターンと前記声紋とを合成し、さらに前記音の強弱および高低の何れか一方または両方を付して合成音を作成する音声合成部と、この音声合成部で作成された合成音を音声信号に変換して前記音声出力手段から出力する音声変換出力部とを付加したことを特徴とする携帯用音声認識出力補助装置。 3. The method of claim 2, wherein synthesizing the said standard voice pattern to be output and the voiceprint from the voice code determination unit, further subjected to one or both of the intensity and level of the sound synthesis a speech synthesizer to create sounds, portable speech recognition, characterized in that the created synthesized speech is converted to speech signals by adding an audio conversion output portion for outputting from said audio output means in this speech synthesizer output auxiliary equipment.
  4. 【請求項4】 請求項2記載において、前記音声符号判定部から出力される前記標準音声パターンと前記声紋とを合成し、さらに前記音の強弱および高低を付して合成音を作成する音声合成部と、この音声合成部によって作成された合成音を記憶する音声記憶部と、この音声記憶部に記憶される合成音を音声信号に変換して前記音声出力手段から出力する音声変換出力部と、前記音声記憶部に記憶される合成音を読み出して前記音声出力手段から繰り返し出力させる音声繰返しスイッチと、前記音声変換出力部から出力される音声信号の速度および強弱の何れか一方または両方を可変する音声可変手段とを付加したことを特徴とする携帯用音声認識出力補助装置。 4. The method of claim 2, wherein said audio code judging unit and said standard voice pattern outputted from the synthesizing and the voiceprint, voice create more synthetic sound denoted by the intensity and height of the sound synthesis and parts, and a voice storage unit for storing synthetic sound generated by the speech synthesizer, a voice conversion output portion for outputting the synthesized sound stored in the voice storage unit from the sound output unit is converted into a voice signal , variable and voice repeatedly switch reads the synthesized sound is repeatedly outputted from the sound output unit, either one or both of the rate and intensity of the voice signal output from the voice conversion output portion to be stored in the voice storage unit portable voice recognition output assisting apparatus characterized by the addition of a sound changing means to.
  5. 【請求項5】 音声入力手段および音声出力手段を有する音声入出力装置部分と、 前記音声入力手段から入力された振動周波数信号から声紋,音の強弱および高低,発生音を認識する音声認識部、この音声認識部によって認識された発生音の音声符号と予め記憶されている複数の音声符号とを比較し、両音声符号が一致したとき当該音声符号に対応する予め記憶されている標準音声パターンを読み出し、この標準音声パターン,前記声紋,音の強弱および高低等の音声情報を発生する音声符号判定部、これら標準音声パターン,声紋,音の強弱および高低等を合成する音声合成部、この音声合成部によって作成された合成音を音声信号に変換し前記音声出力手段から出力する音声変換出力部をもつ本体装置部分と、 前記音声記憶部に記憶され 5. A voice input means and voice input and output device portion having a sound output unit, voice print from the vibration frequency signal inputted from the voice input means, the sound of intensity and height, the voice recognition unit recognizes the generated sound, this is compared with the plurality of audio code stored in advance as voice code of recognized sound generated by the speech recognition unit, a standard voice pattern stored in advance corresponding to the speech code when both voice code matches reading, the standard voice pattern, the voiceprint, voice code decision unit which generates audio information intensity and height, etc. of sound, these standard voice pattern, a voiceprint, voice synthesis unit for synthesizing the strength and height, etc. of the sound, the speech synthesis a body unit portion having an audio conversion output portion for outputting from said audio output means into a speech signal created synthesized sound by parts, stored in the voice storage unit 合成音を読み出して前記音声出力手段から繰り返し出力させる音声繰り返しスイッチ、前記音声変換出力部から出力される音声信号の速度および強弱の何れか一方または両方を可変する音声可変手段をもつ音声調整部分とに分けることを特徴とする携帯用音声認識出力補助装置。 Voice repeatedly switch reads the synthesized sound is repeatedly outputted from the sound output unit, and either one or sound adjustment portion having a sound varying means for varying both the speed and intensity of the voice signal output from the voice conversion output unit portable voice recognition output assisting apparatus characterized by divided into.
JP14898093A 1993-06-21 1993-06-21 Portable voice recognition output auxiliary equipment Expired - Lifetime JP3068370B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14898093A JP3068370B2 (en) 1993-06-21 1993-06-21 Portable voice recognition output auxiliary equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14898093A JP3068370B2 (en) 1993-06-21 1993-06-21 Portable voice recognition output auxiliary equipment

Publications (2)

Publication Number Publication Date
JPH0713582A true true JPH0713582A (en) 1995-01-17
JP3068370B2 JP3068370B2 (en) 2000-07-24

Family

ID=15465003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14898093A Expired - Lifetime JP3068370B2 (en) 1993-06-21 1993-06-21 Portable voice recognition output auxiliary equipment

Country Status (1)

Country Link
JP (1) JP3068370B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2422238A (en) * 2005-01-17 2006-07-19 Univ Hull Generation of data from speech or voiceless mouthed speech
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
GB2422238A (en) * 2005-01-17 2006-07-19 Univ Hull Generation of data from speech or voiceless mouthed speech

Also Published As

Publication number Publication date Type
JP3068370B2 (en) 2000-07-24 grant

Similar Documents

Publication Publication Date Title
Glenn et al. Speaker identification based on nasal phonation
Schroeder Vocoders: Analysis and synthesis of speech
Weintraub A theory and computational model of auditory monaural sound separation
US7082393B2 (en) Head-worn, trimodal device to increase transcription accuracy in a voice recognition system and to process unvocalized speech
US5915237A (en) Representing speech using MIDI
Cooke et al. The auditory organization of speech and other sources in listeners and computational models
Markel et al. Long-term feature averaging for speaker recognition
US6941269B1 (en) Method and system for providing automated audible backchannel responses
Leinonen et al. Expression of emotional–motivational connotations with a one-word utterance
US20050144002A1 (en) Text-to-speech conversion with associated mood tag
US5546500A (en) Arrangement for increasing the comprehension of speech when translating speech from a first language to a second language
US20070112570A1 (en) Voice synthesizer, voice synthesizing method, and computer program
US4821326A (en) Non-audible speech generation method and apparatus
Fu et al. Importance of tonal envelope cues in Chinese speech recognition
US4661915A (en) Allophone vocoder
US4424415A (en) Formant tracker
US5911129A (en) Audio font used for capture and rendering
Womack et al. N-channel hidden Markov models for combined stressed speech classification and recognition
US6161091A (en) Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
JPH0887296A (en) Speech synthesis devices
Bond et al. Acoustic–phonetic characteristics of speech produced in noise and while wearing an oxygen mask
Fujimura On the second spectral peak of front vowels: a perceptual study of the role of the second and third formants
Rostolland Acoustic features of shouted voice
EP1280137B1 (en) Method for speaker identification
JP2002358089A (en) Method and device for speech processing