JPH0713582A - Portable speech recognition output assisting device - Google Patents

Portable speech recognition output assisting device

Info

Publication number
JPH0713582A
JPH0713582A JP5148980A JP14898093A JPH0713582A JP H0713582 A JPH0713582 A JP H0713582A JP 5148980 A JP5148980 A JP 5148980A JP 14898093 A JP14898093 A JP 14898093A JP H0713582 A JPH0713582 A JP H0713582A
Authority
JP
Japan
Prior art keywords
voice
output
sound
speech
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5148980A
Other languages
Japanese (ja)
Other versions
JP3068370B2 (en
Inventor
Kenji Kono
憲嗣 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5148980A priority Critical patent/JP3068370B2/en
Publication of JPH0713582A publication Critical patent/JPH0713582A/en
Application granted granted Critical
Publication of JP3068370B2 publication Critical patent/JP3068370B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

PURPOSE:To correctly recognize an inarticulate voice that a handicapped person speaks and to output a speech signal including the sensation of the voicing person. CONSTITUTION:This portable speech recognition output assisting device is provided with a speech input/output device 1 which has a speech input means 12 and a speech output means 13, a speech recognition part 2 which recognizes a voice print, an intonation, a pitch, and a generated sound from a vibration frequency signal inputted to the speech input means 12, a speech code decision part 3 which stores plural standard speech patterns and speech codes corresponding to the patterns. compares a speech code regarding the recognized generated sound with the stored speech codes, and outputs speech information on the voice print, intonation, pitch, etc., in addition to the standard speech pattern corresponding to the speech code when both the speech codes match each other, a speech synthesis part 5 which puts the standard speech pattern and voice print together and adds the intonation of the sound to synthesize a sound, and a speech conversion output part 7 which outputs the synthesized sound to a speech signal from the speech output means 13.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、例えば声帯摘出者や身
体障害者等のごとき不明瞭な音声を発声する者が利用し
て好適な携帯用音声認識出力補助装置に係わり、特に手
軽に携行可能とし、また不明瞭な音声を適切に認識して
会話の補助に役立てうる携帯用音声認識出力補助装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a portable voice recognition output assisting device suitable for use by a person who utters an unclear voice such as a vocal cord extractor or a physically handicapped person. The present invention relates to a portable voice recognition output assisting device capable of appropriately recognizing an unclear voice and assisting in conversation.

【0002】[0002]

【従来の技術】従来の音声認識装置は、予め健常者の発
声する音声に対応する多数の標準音声パターンを記憶
し、その健常者の口から発声する音声パターンと予め記
憶される多数の標準音声パターンとを比較照合し、健常
者の発声する音声パターンと一致する標準音声パターン
があれば、当該標準音声パターンから健常者の発声する
音声を認識することが行われている。
2. Description of the Related Art A conventional voice recognition apparatus stores in advance a large number of standard voice patterns corresponding to a voice uttered by a healthy person, and a voice pattern uttered by the mouth of the normal person and a large number of standard voices stored in advance. A pattern is compared and collated, and if there is a standard voice pattern that matches the voice pattern uttered by a healthy person, the voice uttered by a healthy person is recognized from the standard voice pattern.

【0003】一方、音声合成装置は、音声を出力する装
置であって、アナウンサが発声する音声を録音し、それ
を分析手法によって低ビットに圧縮,記録し、さらに出
力するときに再生する方式と、入力する仮名に対応して
単音を組み合わせ,アクセントとイントネーションとを
重畳する規則合成方式とがある。前者は音声応答装置の
出力として利用され、プッシュホンのPB入力と組合わ
せてオーダエントリ分野で利用されている。後者は、日
本語,英語の文章から直接音声に変換する技術が開発さ
れており、今後の技術の発展に期待するところが大き
い。
On the other hand, a voice synthesizer is a device for outputting a voice, in which a voice uttered by an announcer is recorded, compressed and recorded into low bits by an analysis method, and then reproduced when it is output. , There is a rule synthesizing method in which a single tone is combined in correspondence with an input kana and an accent and an intonation are superimposed. The former is used as the output of the voice response device and is used in the order entry field in combination with the PB input of a touch-tone phone. The latter has been developed with a technology for directly converting Japanese and English sentences into speech, and there are great expectations for the future development of the technology.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
音声認識装置は、健常者の口から発声する音声パターン
から音声認識を行っており、例えば手術等で声帯を抽出
した者,舌ガンにより舌をなくした者,不明瞭な音声を
発声する非健常者等から発する音声については全く認識
できない。その理由は、不明瞭な音声を発声するために
認識不可能となるだけでなく、口から発声する音声の空
気振動を検出しているので、声帯を抽出した者や舌ガン
で舌をなくした者の場合にはもともと口から音声を発声
しないので適用不能となる。
However, the conventional voice recognition device performs voice recognition from a voice pattern uttered by a healthy person's mouth. It cannot recognize the voices emitted by those who have lost the voices or the unhealthy persons who make unclear voices. The reason for this is that not only is unrecognizable due to the unclear voice being uttered, but also air vibration of the voice uttered from the mouth is detected, so the person who extracted the vocal cords and the tongue cancer lost the tongue. In the case of a person, it is not applicable because it does not utter a voice originally.

【0005】なお、今後の技術的進歩いかんによっては
不特定多数の音声認識が可能となったり、また音声認識
装置を用いた種々の装置が日常生活の中で使用されてく
るであろうが、何れにせよ、健常者に有効な装置の開発
であると考えられる。ゆえに、種々の障害をもつ非健常
者は、その音声が不明瞭であったり、音声の発生速度が
遅いために、折角新しい装置が開発されてもそれを充分
に使いこなすことは非常に難しいと思われる。
Depending on the future technological progress, an unspecified number of voice recognitions will be possible, and various devices using the voice recognition device will be used in daily life. In any case, it is considered to be the development of a device effective for the healthy person. Therefore, it seems that it is very difficult for an unhealthy person with various disabilities to use it sufficiently even if a new device is developed because the voice is unclear or the voice generation speed is slow. Be done.

【0006】一方、前記音声合成装置の場合には、個人
の発声する多くの言葉や感情のこもった音声信号とはな
らず、会話するという観点からみれば未だ不十分なもの
である。
On the other hand, in the case of the speech synthesizer, it does not produce many words or emotional speech signals uttered by an individual, which is still insufficient from the viewpoint of conversation.

【0007】本発明は上記実情に鑑みてなされたもの
で、口から音声を発声できない者でも音声に相当する信
号を確実に入力可能な携帯用音声認識出力補助装置を提
供することを目的とする。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a portable voice recognition output assisting device capable of surely inputting a signal corresponding to a voice even by a person who cannot speak the voice. .

【0008】また、本発明の他の目的は、非健常者の発
声する不明瞭な音声を正しく認識し、音声を発声する者
の感情を含めた音声合成を実現する携帯用音声認識出力
補助装置を提供することにある。
Another object of the present invention is to provide a portable voice recognition output assisting device which correctly recognizes an unclear voice uttered by an unhealthy person and realizes voice synthesis including the emotion of the person who utters the voice. To provide.

【0009】さらに、本発明の他の目的は、非健常者の
身体の状況を考慮しつつ適切な音声信号を発生する携帯
用音声認識出力補助装置を提供することにある。さら
に、本発明の他の目的は、非健常者が手軽に装着でき、
また操作性に富んだ携帯用音声認識出力補助装置を提供
することにある。
Still another object of the present invention is to provide a portable voice recognition output assisting device for generating an appropriate voice signal while considering the physical condition of an unhealthy person. Furthermore, another object of the present invention is that an unhealthy person can easily wear it,
Another object of the present invention is to provide a portable voice recognition output assisting device with excellent operability.

【0010】[0010]

【課題を解決するための手段】上記課題を解決するため
に、請求項1に対応する発明は、振動発生体に巻付け固
定する吸音性の布地で形成された短冊状の装着体の裏面
側に当該振動発生体から発生する振動を検出して電気的
な振動周波数信号に変換する平坦状の音声入力手段を取
り付け、さらに前記装着体の表面側に前記振動周波数信
号に応じた音声信号を出力する平坦状の音声出力手段を
取り付けた音声入出力装置を有する携帯用音声認識出力
補助装置である。
In order to solve the above-mentioned problems, the invention according to claim 1 is directed to the back side of a strip-shaped mounting body formed of a sound absorbing cloth which is wound around and fixed to a vibration generator. Is attached with a flat voice input means for detecting the vibration generated from the vibration generator and converting it into an electric vibration frequency signal, and further outputs a voice signal corresponding to the vibration frequency signal on the surface side of the mounting body. It is a portable voice recognition output assisting device having a voice input / output device to which a flat voice output means is attached.

【0011】次に、請求項2に対応する発明は、振動発
生体から発生する振動を検出して電気的な振動周波数信
号を出力する音声入力手段およびこの音声入力手段によ
って入力された振動周波数信号に応じた音声信号を出力
する音声出力手段とを有する音声入出力装置と、前記音
声入力手段から入力された振動周波数信号から声紋,音
の強弱および高低,発生音を認識する音声認識部と、予
め複数の標準音声パターンおよび当該パターンに対応す
る音声符号が記憶され、前記音声認識部によって認識さ
れた発生音に係わる音声符号と既に記憶されている前記
音声符号とを比較し、両音声符号が一致したとき、前記
音声符号に対応する標準音声パターンを読み出し、当該
標準音声パターン、前記声紋,音の強弱および高低等か
らなる音声情報を出力する音声符号判定部とを設けた携
帯用音声認識出力補助装置である。
Next, the invention according to claim 2 is a voice input means for detecting a vibration generated from a vibration generator and outputting an electric vibration frequency signal, and a vibration frequency signal inputted by the voice input means. A voice input / output device having a voice output means for outputting a voice signal according to the above, and a voice recognition part for recognizing a voiceprint, a sound intensity, a pitch, and a generated sound from a vibration frequency signal input from the voice input means, A plurality of standard voice patterns and voice codes corresponding to the patterns are stored in advance, the voice code relating to the generated sound recognized by the voice recognition unit is compared with the already stored voice code, and both voice codes are When they match, the standard voice pattern corresponding to the voice code is read, and the voice information including the standard voice pattern, the voiceprint, the strength of the sound, the pitch, etc. is read. A portable voice recognition output assisting apparatus provided with a speech code decision unit for force.

【0012】次に、請求項3に対応する発明は、請求項
2に対応する発明の構成要件に、新たに前記音声符号判
定部から出力される前記標準音声パターンと前記声紋と
を合成し、さらに前記音の強弱および高低を付して合成
音を作成する音声合成部と、この音声合成部で作成され
た合成音を音声信号に変換して前記音声出力手段から出
力する音声変換出力部とを付加してなる携帯用音声認識
出力補助装置である。
Next, in the invention corresponding to claim 3, in addition to the constituent features of the invention according to claim 2, the standard voice pattern newly output from the voice code determination section and the voiceprint are synthesized, Further, a voice synthesizing unit that creates a synthetic voice by adding the strength and the pitch of the sound, and a voice conversion output unit that converts the synthetic voice created by the voice synthesizing unit into a voice signal and outputs the voice signal from the voice output means. Is a portable voice recognition output assisting device.

【0013】さらに、請求項4に対応する発明は、請求
項2に対応する発明の構成要件に、新たに前記音声符号
判定部から出力される前記標準音声パターンと前記声紋
とを合成し、さらに前記音の強弱および高低を付して合
成音を作成する音声合成部と、この音声合成部によって
作成された合成音を記憶する音声記憶部と、この音声記
憶部に記憶される合成音を音声信号に変換して前記音声
出力手段から出力する音声変換出力部と、前記音声記憶
部に記憶される合成音を読み出して前記音声出力手段か
ら繰り返し出力させる音声繰返しスイッチと、前記音声
変換出力部から出力される音声信号の速度を可変する音
声速度可変手段と、前記音声変換出力部から出力される
音声信号レベルを可変し強弱を付ける音声強弱可変手段
とを付加してなる携帯用音声認識出力補助装置である。
Further, in the invention according to claim 4, in addition to the constituent features of the invention according to claim 2, the standard voice pattern and the voiceprint newly output from the voice code determination section are synthesized, and A voice synthesizing unit that creates a synthetic sound by adding the strength and the pitch of the sound, a voice storing unit that stores the synthetic voice created by the voice synthesizing unit, and a voice that outputs the synthetic voice stored in the voice storing unit. From the voice conversion output unit, a voice conversion output unit that converts the signal to output from the voice output unit, a voice repeat switch that reads the synthetic sound stored in the voice storage unit and repeatedly outputs the voice from the voice output unit, A voice speed changing means for changing the speed of the output voice signal, and a voice strength changing means for changing the voice signal level output from the voice conversion output section to add strength to the voice signal are added. It is a speech recognition output auxiliary equipment for the band.

【0014】さらに、請求項5に対応する発明は、音声
入力手段および音声出力手段とを有する音声入出力装置
部分と、音声認識部,音声符号判定部,音声変換出力部
をもつ本体装置部分と、前記音声記憶部に記憶される合
成音を読み出して前記音声出力手段から繰り返し出力さ
せる音声繰り返しスイッチ、前記音声変換出力部から出
力される音声信号の速度を可変する音声速度可変手段、
前記音声変換出力部から出力される音声信号レベルを可
変し強弱を付ける音声強弱可変手段をもつ音声調整部分
とに分けた携帯用音声認識出力補助装置である。
Further, the invention according to claim 5 is a voice input / output device portion having voice input means and voice output means, and a main body device portion having a voice recognition portion, a voice code determination portion, and a voice conversion output portion. A voice repeat switch for reading the synthetic sound stored in the voice storage unit and repeatedly outputting it from the voice output unit, a voice speed changing unit for changing the speed of a voice signal output from the voice conversion output unit,
The portable voice recognition output assisting device is divided into a voice adjusting portion having a voice intensity varying means for varying the voice signal level output from the voice converting and outputting part to give a dynamic intensity.

【0015】[0015]

【作用】従って、請求項1に対応する発明は以上のよう
な手段を講じたことにより、振動発生体,例えば非健常
者の首に巻き付け固定する装着体に吸音性の布地を用
い、かつ、装着体の裏面側および表面側とにそれぞれ個
別に平坦状の音声入力手段および音声出力手段を取り付
けたことにより、口から発声する音声や外部から入って
くる雑音の影響を防止でき、しかも非健常者の喉に対す
る負担が軽減され、直接喉から発声する振動を確実に入
力することができる。
Therefore, the invention according to claim 1 uses the above-mentioned means, and by using the sound absorbing cloth for the vibration generator, for example, the wearing body which is fixed by being wound around the neck of an unhealthy person, and By installing flat voice input means and voice output means separately on the back side and front side of the wearing body, it is possible to prevent the influence of the voice uttered from the mouth and the noise coming from the outside, and it is unhealthy. The burden on the person's throat is reduced, and the vibration directly emitted from the throat can be reliably input.

【0016】次に、請求項2に対応する発明は、音声認
識部が音声入力手段から入力される振動周波数信号から
声紋,音の強弱,音の高低および発声音を認識して音声
符号判定部に送出する。この音声符号判定部では、予め
複数の標準音声パターンおよび当該パターンに対応する
音声符号が記憶されているので、音声認識部から送られ
てくる発生音に係わる音声符号と既に記憶されている音
声符号とを比較し、両音声符号が一致したとき、その音
声符号に対応する標準音声パターンを読み出し、当該標
準音声パターン、前記声紋,音の強弱および高低等から
なる音声情報を出力するので、非健常者の発声する不明
瞭な音声でも正しく認識でき、また非健常者の発声する
短い言葉から日常会話等に用いる長い言葉に変換されて
いる標準音声パターンを容易に出力できる。
Next, in the invention according to claim 2, the voice recognition unit recognizes the voiceprint, the strength of the sound, the pitch of the sound, and the vocal sound from the vibration frequency signal input from the voice input means, and the voice code determination unit. Send to. In this voice code determination unit, since a plurality of standard voice patterns and voice codes corresponding to the patterns are stored in advance, the voice code relating to the generated sound sent from the voice recognition unit and the voice code already stored. When both voice codes match, the standard voice pattern corresponding to the voice code is read out, and voice information including the standard voice pattern, the voiceprint, the strength of the sound, and the pitch is output. An unclear voice uttered by a person can be correctly recognized, and a standard voice pattern converted from a short word uttered by an unhealthy person into a long word used for daily conversation can be easily output.

【0017】さらに、請求項3に対応する発明は、請求
項2に対応する発明と同様な作用を有する他、音声合成
部にて音声符号判定部から送られてくる標準音声パター
ンと前記声紋とを合成し、さらに音の強弱,高低を付し
て合成音を作成するので、感情を含めて音声合成でき、
しかも音声信号変換出力部において合成音を音声信号に
変換して前記音声出力手段から出力するので、感情表現
を伴った音声信号を出力できる。
Further, the invention according to claim 3 has the same operation as that of the invention according to claim 2, and the standard voice pattern and the voiceprint sent from the voice code determination part in the voice synthesis part. Is synthesized, and the synthesized voice is created by adding the strength and weakness of the sound, so that you can synthesize the voice including emotions.
Moreover, since the synthesized signal is converted into a speech signal in the speech signal conversion output section and is outputted from the speech output means, a speech signal accompanied by emotional expression can be outputted.

【0018】さらに、請求項4に対応する発明は、請求
項2および請求項3に対応する発明と同様な作用を有す
る他、音声繰返しスイッチを操作して前記音声記憶部か
ら再度合成音を読み出して音声出力手段から繰り返し出
力するので、相手から聞き直された場合でも最初から音
声を発することなく同様の音声信号を出力できる。ま
た、音声速度可変手段によって音声信号の出力速度を可
変することにより、健常者にとって分かり易い速度で音
声信号を出力できる。また、音声強弱可変手段によって
音声信号レベルを可変し強弱を付けて出力するので、同
様に健常者にとって分かり易い音声信号を出力できる。
Furthermore, the invention according to claim 4 has the same operation as the invention according to claims 2 and 3, and also operates the voice repeat switch to read the synthesized voice again from the voice storage unit. Since it is repeatedly output from the voice output means, the same voice signal can be output without producing a voice from the beginning even when the partner hears it again. Further, by changing the output speed of the audio signal by the audio speed changing means, it is possible to output the audio signal at a speed that is easy for a healthy person to understand. Further, since the voice signal level is varied by the voice intensity varying means and the voice signal is given with the varying strength, the voice signal can be output similarly to a normal person.

【0019】さらに、請求項5に対応する発明は、音声
入力手段および音声出力手段とを有する音声入出力装置
部分と、音声認識部、音声符号判定部、音声信号変換出
力部等をもつ本体装置部分と、種々の調整機能をもつ音
声調整部分とに分けることにより、音声入出力装置部分
は非健常者の首に巻き付け、本体装置部分は胴体の腰部
分などに吊下し、音声調整部分は手元に持って操作する
ようにすれば、簡単に携行でき、かつ、手軽に操作でき
る。
Further, the invention according to claim 5 is a main body device having a voice input / output device portion having voice input means and voice output means, a voice recognition portion, a voice code determination portion, a voice signal conversion output portion and the like. By dividing into a part and a voice adjustment part having various adjustment functions, the voice input / output device part is wrapped around the neck of an unhealthy person, the main body device part is hung on the waist part of the body, etc. If you carry it by hand, you can carry it easily and operate it easily.

【0020】[0020]

【実施例】以下、本発明の実施例について図面を参照し
て説明する。図1は本発明装置の構成を示すブロック図
である。図同において1は音声入出力装置であって、こ
れは図2に示すごとく例えばむち打ち症などのときに首
に巻き付けるコルセットのような例えば布地の装着体1
1が用いられ、この装着体11の適宜な個所には喉から
発声する振動を直接取り込む音声入力手段12および音
声信号を出力する音声出力手段13が取り付けられ、さ
らに首に巻き付け固定するために装着体両端部の対峙面
にマジックテープ14a,14bが取り付けられてい
る。なお、マジックテープ14a,14b以外の従来周
知の種々の固定手段例えばホックなどを用いて固定して
もよい。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the device of the present invention. In the figure, reference numeral 1 is a voice input / output device, and as shown in FIG. 2, this is a wearing body 1 of, for example, a cloth such as a corset that is wrapped around the neck in the case of whiplash.
1 is used, and an audio input means 12 for directly taking in vibrations uttered from the throat and an audio output means 13 for outputting an audio signal are attached to an appropriate portion of the wearing body 11, and are further attached to be wound around the neck and fixed. Velcro tapes 14a and 14b are attached to the facing surfaces of both ends of the body. It should be noted that various other well-known fixing means such as hooks other than the magic tapes 14a and 14b may be used for fixing.

【0021】前記装着体11は、例えば外部雑音を遮断
するカーテン地のごとく吸音性の優れた布地で作成し、
これによって口から発声する音声や外部から入ってくる
雑音を吸収し、前記音声入力手段12に影響を与えない
ようにする。音声入力手段12は、装着体11の裏側
(内側)面部に平坦に取り付けられ、喉から発声する振
動を電気信号に変換して出力する。このように平坦化す
ることにより装着体11に馴染み易く、喉への圧迫感が
なく、ひいては喉に対する負担を軽減できる。一方、音
声出力手段13は、音声入力手段12とは反対側,つま
り装着体11の表側(外側)面部に同様にフラットなス
ピーカが取り付けられる。このようにフラットなスピー
カを口と同じ縦ライン上の正面に取り付けることによ
り、喉に対する負担が軽減され、話し相手からみればあ
たかも口から音声が発する状態を作り出す。また、この
音声出力手段13は、装着体11と同系色または適宜な
素材で覆うとか、音声出力手段13の色に適宜な工夫を
講じることにより、出切る限り目立たない自然な取り付
け状態に取り付けるものとする。
The mounting body 11 is made of, for example, a cloth having a good sound absorbing property such as a curtain cloth for blocking external noise,
This absorbs the voice uttered by the mouth and the noise coming from the outside, and does not affect the voice input means 12. The voice input unit 12 is flatly attached to the back (inner) surface of the wearing body 11, and converts the vibration uttered from the throat into an electric signal and outputs the electric signal. By flattening in this way, it is easy to fit the wearing body 11, does not have a feeling of pressure on the throat, and can reduce the burden on the throat. On the other hand, in the voice output means 13, a flat speaker is similarly attached to the side opposite to the voice input means 12, that is, on the front (outer) surface of the mounting body 11. By mounting the flat speaker on the front in the same vertical line as the mouth in this way, the burden on the throat is reduced, and a state in which voice is emitted from the mouth when viewed from the other party is created. In addition, the sound output means 13 is mounted in a natural mounting state that is inconspicuous as long as it is out, by covering it with a color similar to that of the mounting body 11 or by using an appropriate material, or by taking appropriate measures for the color of the sound output means 13. To do.

【0022】2は音声入力手段12から入力される音声
振動周波数信号から個人の声紋の特徴,音の強弱と高
低,正しい発声を認識する音声認識部である。この音声
認識部2は、図3に示すように音声スペクトル変換手段
21、音質判定手段22、声紋判定手段23および発声
音認識手段24等からなっている。この音声スペクトル
変換手段21は、例えば図4(a)に示すような音声振
動周波数信号を所定の周期でサンプリングすることによ
り、図4(b)に示すような音声スペクトルに変換す
る。音質判定手段22は、音声スペクトルから音の強弱
と高低とを判定するものであり、そのうち音の強弱は、
予め所定の基準レベルが設定され、音声スペクトルの各
成分が基準レベルから上下方向にどの程度レベル的に離
れているかを表すものであり、一方、音の高低は音の周
波数に依存するが、ここでは専ら音声スペクトルの各成
分のレベルを表す。声紋判定手段23は音声スペクトル
の周波数成分レベルを抽出するものであり、また発声音
認識手段24は音声スペクトルの分布状態から発声音を
決定し、その発声音に対応する文字コード,例えば
「ア」とか「イ」とかのコードに変換し出力する。そし
て、これら判定手段22〜24によって判定されたデー
タは時系列的に出力され、音声符号判定部3に送られ
る。
Reference numeral 2 is a voice recognition unit for recognizing the characteristics of the personal voiceprint, the strength and weakness of the sound, and the correct utterance from the voice vibration frequency signal input from the voice input means 12. As shown in FIG. 3, the voice recognition unit 2 includes a voice spectrum conversion unit 21, a sound quality determination unit 22, a voiceprint determination unit 23, a vocal sound recognition unit 24, and the like. The voice spectrum conversion means 21 converts the voice vibration frequency signal as shown in FIG. 4 (a) into a voice spectrum as shown in FIG. 4 (b) by sampling the voice vibration frequency signal at a predetermined cycle. The sound quality judging means 22 judges the strength and the height of the sound from the voice spectrum, and the strength of the sound is
A predetermined reference level is set in advance, and it indicates how far each component of the voice spectrum is vertically separated from the reference level. On the other hand, the pitch of the sound depends on the frequency of the sound. Represents exclusively the level of each component of the speech spectrum. The voiceprint determination means 23 extracts the frequency component level of the voice spectrum, and the voicing sound recognition means 24 determines the voicing sound from the distribution state of the voice spectrum, and the character code corresponding to the voicing sound, for example, "A". It is converted into a code such as "a" or "a" and output. Then, the data judged by these judging means 22 to 24 are outputted in time series and sent to the voice code judging section 3.

【0023】この音声符号判定部3は、予め標準音声パ
ターンとそれに対応する音声符号とが記憶され、発声音
認識手段24にて音声認識された正しい発声音である文
字コード(音声符号)を取り出し、この音声符号と既に
記憶されている音声符号とを比較し、両音声符号が同一
となってとき、それに対応する標準音声パターンを出力
する機能を有する。具体的には、図5に示すように標準
音声パターンを記憶する音声パターン記憶手段31と、
この音声パターン記憶手段31の各標準音声パターンに
対応する音声符号を記憶する音声符号記憶手段32と、
音声符号判定手段33とによって構成されている。
The voice code determination section 3 stores a standard voice pattern and a voice code corresponding thereto in advance, and extracts a character code (voice code) which is a correct vocal sound recognized by the vocal recognition unit 24. , And has a function of comparing this voice code with a voice code already stored and, when both voice codes are the same, outputting a standard voice pattern corresponding thereto. Specifically, as shown in FIG. 5, a voice pattern storage unit 31 for storing a standard voice pattern,
A voice code storage means 32 for storing a voice code corresponding to each standard voice pattern of the voice pattern storage means 31;
It is constituted by the voice code judging means 33.

【0024】この音声符号判定手段33は、前記音質判
定手段22からの音の強弱,高低に関するデータおよび
声紋判定手段23からの声紋の特徴データをバッフアメ
モリ待ちの状態にし、発声音認識手段24で認識された
正しい発声音の音声符号については、当該音声符号と音
声符号記憶手段32に記憶されている多数の音声符号と
を比較参照し、既に記憶されている音声符号と同一であ
れば、音声パターン記憶手段31から音声符号に対応す
る標準音声パターンを取り出し、既にバッフアメモリ待
ちの状態にあるデータとともに音声情報記憶部4に記憶
する。このとき、発生音認識手段24の発生音の音声符
号も同時に記憶してもよい。一方、発声音認識手段24
によって認識された音声符号と既に記憶されている音声
符号とが不一致となったとき、その発声音認識手段24
で認識された発声音の音声符号を出力する。
The voice code judging means 33 puts the data concerning the strength and weakness of the sound from the sound quality judging means 22 and the voiceprint feature data from the voiceprint judging means 23 into a buffer memory waiting state, and is recognized by the vocal sound recognizing means 24. For the voice code of the generated correct uttered sound, the voice code and a large number of voice codes stored in the voice code storage unit 32 are compared and referred to. The standard voice pattern corresponding to the voice code is extracted from the storage means 31 and stored in the voice information storage unit 4 together with the data already in the buffer memory waiting state. At this time, the voice code of the generated sound of the generated sound recognition means 24 may be stored at the same time. On the other hand, the uttered sound recognition means 24
When the voice code recognized by the voice code and the voice code already stored do not match, the uttered sound recognition means 24
The voice code of the uttered sound recognized in is output.

【0025】なお、前記音声パターン記憶手段31に記
憶されている標準音声パターンは、例えば“おはようご
ざいます”、“ありがとうございます”、“さような
ら”などの日常会話で使用する言葉に相当するパターン
である。つまり、短い音声符号から長い言葉に変換する
ことにより、非健常者が全ての言葉を発声しなくても十
分に会話可能にパターン化している。
The standard voice patterns stored in the voice pattern storage means 31 are patterns corresponding to words used in daily conversation such as "Good morning", "Thank you", and "Goodbye". is there. That is, by converting the short speech code into the long words, the unhealthy person is sufficiently patterned to speak without uttering all the words.

【0026】前記音声情報記憶部4は、声紋の特徴,音
の強弱,音の高低および発声音に係わる標準音声パター
ン、必要に応じて認識された発生音の音声符号などの音
声情報を一時記憶した後、音声合成部5に送出する。
The voice information storage unit 4 temporarily stores voice information such as the characteristics of the voiceprint, the strength and weakness of the sound, the pitch of the sound and the standard voice pattern related to the uttered sound, and the voice code of the recognized generated sound as necessary. After that, the speech is sent to the voice synthesizer 5.

【0027】この音声合成部5においては、図6に示す
ように音声情報記憶部4から送られてくる音声情報を記
憶する音声情報記憶手段51と、この音声情報記憶手段
51に記憶されている音声情報のうち、標準音声パター
ンと声紋の特徴データとを合成し、さらにかかる合成音
に音の強弱および音の高低を付けることにより、完全に
復調化した合成音を作り出し、後続の音声記憶部6に記
憶する音声合成手段52とで構成されている。
In the voice synthesizing section 5, as shown in FIG. 6, the voice information storing means 51 for storing the voice information sent from the voice information storing section 4 and the voice information storing means 51 are stored. Of the voice information, the standard voice pattern and the voiceprint feature data are combined, and the strength and weakness of the sound and the pitch of the sound are added to the synthesized sound to create a completely demodulated synthesized sound, and the succeeding voice storage unit 6 and a voice synthesizing means 52 to be stored.

【0028】7は音声変換出力部であって、これは音声
記憶部6に記憶されている合成音情報を読み出して音声
出力可能なアナログ信号に変換して音声出力手段13か
ら音声を出力する機能をもっている。
Reference numeral 7 denotes a voice conversion output unit, which has a function of reading the synthesized voice information stored in the voice storage unit 6, converting it into an analog signal capable of voice output, and outputting voice from the voice output means 13. I have

【0029】さらに、本装置には音声出力調整部8が設
けられている。この音声出力調整部8を設けた理由は、
非健常者の状況に応じて会話の内容が相手側に適切に伝
達できるようにすることにある。すなわち、音声出力調
整部8には、一度,音声出力手段13から出力された音
声信号が相手側から聞き直されたとき、音声記憶部6か
ら繰り返し合成音を出力させるために読み出し操作を行
う音声繰返しスイッチ81が設けられている。これは、
非健常者が最初から同じ音声を発声するのが非常に大変
であるので、その負担を軽減するためである。
Further, this apparatus is provided with a voice output adjusting section 8. The reason for providing this audio output adjustment unit 8 is
The purpose is to be able to appropriately convey the content of the conversation to the other side according to the situation of an unhealthy person. That is, when the voice signal output from the voice output unit 13 is heard again by the other party, the voice output adjusting unit 8 performs a read operation to repeatedly output a synthesized voice from the voice storage unit 6. A repeat switch 81 is provided. this is,
This is because it is very difficult for an unhealthy person to make the same voice from the beginning, so that the burden is reduced.

【0030】また、この音声出力調整部8には、音声速
度可変器82および音声強弱可変器83が設けられてい
る。予め音声変換出力部7側にコンデンサなどを用いた
アナログ的な1次遅れ回路を組み込んでおき、音声速度
可変器82で適宜に1次遅れ回路を短絡することによ
り、音声信号の速度を可変する。これは非健常者の発声
速度は必ずしも早くないので、音声出力手段13から出
力される合成音の出力速度を適宜変更し、健常者が聞き
取り易い速度にするためである。また、音声強弱可変器
83は、音声変換出力部7側の音声信号のレベルを可変
するとか、増幅率を可変することにより、音声信号に強
弱を付けて出力する。これは外部の雑音が多いところで
も音声出力手段13から出力される音声信号に強弱を付
けて聞き取り易くするためである。
Further, the voice output adjusting section 8 is provided with a voice speed varying device 82 and a voice intensity varying device 83. An analog first-order delay circuit using a capacitor or the like is incorporated in advance on the voice conversion output unit 7 side, and the speed of the voice signal is changed by appropriately short-circuiting the first-order delay circuit with the voice speed changer 82. . This is because the utterance speed of the non-healthy person is not necessarily high, and therefore the output speed of the synthetic sound output from the voice output means 13 is appropriately changed so that the sound person can hear easily. Further, the voice strength varying device 83 outputs the voice signal with strength and weakness by varying the level of the voice signal on the side of the voice conversion output unit 7 or varying the amplification factor. This is to make the voice signal output from the voice output means 13 strong and weak so that it can be heard easily even in the presence of a lot of external noise.

【0031】次に、以上のように構成された装置の動作
について説明する。先ず、非健常者が音声入出力装置1
の装着体11を首に巻き付けた後、装着体11の両端対
峙面に設けたマジックテープ部分を押し付けて固定す
る。このとき、装着体11に取り付けられている音声出
力手段13が正面位置にくるように設定し、また音声入
力手段12は喉の振動を最も取り込み易い部位,例えば
首の側部の位置に設定する。このとき、音声入力手段1
2および出力手段13が平坦状に形成されているので、
首に馴染み易く、喉に対する負担が非常に少なくなる。
Next, the operation of the apparatus configured as described above will be described. First, a non-healthy person uses the voice input / output device 1
After the mounting body 11 is wrapped around the neck, the velcro tape portions provided on the opposite surfaces of the mounting body 11 are pressed and fixed. At this time, the voice output means 13 attached to the wearing body 11 is set so as to come to the front position, and the voice input means 12 is set at a position where the vibration of the throat is most easily taken in, for example, the side portion of the neck. . At this time, the voice input means 1
2 and the output means 13 are formed in a flat shape,
It easily fits on the neck and reduces the strain on the throat.

【0032】この状態において非健常者が音声を発生す
ると、当該非健常者の喉の振動を音声入力手段12で取
り込んで電気的な振動周波数信号に変換し、音声認識部
2に送出する。
When an unhealthy person produces a voice in this state, the vibration of the throat of the unhealthy person is captured by the voice input means 12, converted into an electric vibration frequency signal, and sent to the voice recognition section 2.

【0033】ここで、音声認識部2は、音声入力手段1
2から入力される振動周波数信号を音声スペクトル変換
手段21により音声スペクトルに変換した後、音質判定
手段22,声紋判定手段23および発生音判定手段24
に送出する。これら各判定手段22〜24は前述した判
定条件に従って音の強弱および音の高低、声紋の特徴お
よび正しい発生音を決定し、特に発生音の場合には発生
音に対応する文字コード(音声符号)に変換し、音の強
弱および音の高低、声紋の特徴データとともに音声符号
判定部3に送出する。
Here, the voice recognizing unit 2 includes the voice inputting means 1
After the vibration frequency signal input from 2 is converted into the voice spectrum by the voice spectrum conversion means 21, the sound quality determination means 22, the voiceprint determination means 23, and the generated sound determination means 24.
Send to. Each of the judging means 22 to 24 determines the strength and weakness of the sound, the pitch of the sound, the characteristics of the voiceprint and the correct generated sound according to the above-mentioned judgment conditions, and in the case of the generated sound, a character code (voice code) corresponding to the generated sound To the voice code determination unit 3 together with the strength of the sound, the pitch of the sound, and the feature data of the voiceprint.

【0034】この符号判定部3においては、予め音声パ
ターン記憶手段31に標準音声パターンが記憶され、ま
た音声符号記憶手段32に前記標準音声パターンに対応
する音声符号が記憶されており、特に標準音声パターン
には例えば“おはようございます”、“ありがとうござ
います”、“さようなら”などの日常会話で使用する言
葉に相当するパターンの形で保存されている。
In the code judging section 3, a standard voice pattern is stored in advance in the voice pattern storage means 31, and a voice code corresponding to the standard voice pattern is stored in the voice code storage means 32. Particularly, the standard voice pattern is stored. The patterns are stored in the form of patterns corresponding to words used in daily conversation such as “Good morning”, “Thank you”, and “Goodbye”.

【0035】従って、符号判定部3では、音声認識部2
によって認識された正しい発声音である文字コード(音
声符号)を受けると、その幾つかの音声符号と既に記憶
されている音声符号とを比較し、両音声符号が同一とな
ったとき、それに対応する標準音声パターンを読み出
し、前記音質判定手段22からの音の強弱,高低に関す
るデータおよび声紋判定手段23からの声紋の特徴デー
タとともに音声情報記憶部4を介して音声合成部5に送
出する。
Therefore, in the code determination section 3, the speech recognition section 2
When a character code (speech code) that is the correct uttered sound recognized by is received, some of the speech codes are compared with the already stored speech codes, and when both speech codes are the same, corresponding The standard voice pattern to be read is read out and sent to the voice synthesizing section 5 via the voice information storage section 4 together with the data regarding the strength and weakness of the sound from the sound quality determining means 22 and the voiceprint characteristic data from the voiceprint determining means 23.

【0036】ここで、音声合成部5は、音声情報記憶部
4から送られてくる標準音声パターン,音の強弱,高低
および声紋等の音声情報を音声情報記憶手段51に一旦
記憶した後、音声合成手段52で音声合成を行う。この
音声合成は、音声情報のうち、標準音声パターンと声紋
の特徴データとを合成し、さらにかかる合成音に音の強
弱および音の高低を付けて完全な復調をなした合成音を
作り出し、音声記憶部6に記憶した後、音声変換出力部
7に送られる。この音声変換出力部7では、音声記憶部
6に記憶されている合成音情報を読み出して音声出力可
能なアナログ信号に変換して音声出力手段13から音声
を出力する。
Here, the voice synthesizing unit 5 temporarily stores the voice information such as the standard voice pattern, the intensity of the sound, the pitch, and the voiceprint sent from the voice information storage unit 4 in the voice information storage means 51, and then the voice information is stored. The synthesizing means 52 performs speech synthesis. This voice synthesis synthesizes a standard voice pattern and voiceprint feature data from voice information, and further creates a synthesized voice that is completely demodulated by adding the dynamics of the voice and the pitch of the voice to the synthesized voice. After being stored in the storage unit 6, it is sent to the voice conversion output unit 7. The voice conversion output unit 7 reads the synthesized voice information stored in the voice storage unit 6, converts it into an analog signal capable of voice output, and outputs voice from the voice output means 13.

【0037】このとき、例えば相手側から聞き直された
とき、非健常者は、音声繰返しスイッチ81を操作すれ
ば、音声記憶部6から再度合成音情報を読み出し、音声
変換出力部7にて音声出力可能なアナログ信号に変換し
て音声出力手段13から音声を出力するので、相手側に
適切な音声信号,つまり会話の内容を伝えることができ
る。また、非健常者の発声速度が遅い場合には、音声速
度可変器82で適宜に音声信号の出力速度を早くすれ
ば、健常者等が聞き取り易くなる。また、例えば外部の
雑音が多いところでは、音声強弱可変器83を可変操作
すれば、音声信号レベルを大きくして音声出力手段13
から出力でき、同様に健常者等が聞き取り易くなる。
At this time, for example, when the voice is heard again by the other party, the unhealthy person operates the voice repeat switch 81 to read the synthesized voice information from the voice storage unit 6 again, and the voice conversion output unit 7 outputs the voice. Since the voice is output from the voice output means 13 after being converted into an analog signal that can be output, an appropriate voice signal, that is, the content of the conversation can be transmitted to the other party. Further, in the case where the speech speed of the unhealthy person is slow, it is easy for the unhealthy person or the like to hear by appropriately increasing the output speed of the sound signal by the sound speed varying device 82. Further, for example, in a place where there is a lot of external noise, the voice output level 13 can be increased by variably operating the voice strength variator 83.
Can be output, and similarly, a healthy person can easily hear.

【0038】従って、以上のような実施例の構成によれ
ば、音声入出力装置1の本体となるべき装着体11は吸
音性に優れた布地などで作成したので、非健常者の首に
巻き付けたときに完全になじむだけでなく、口から発声
する音声や外部から入ってくる雑音を吸収し、音声入力
手段12からは喉から発声する振動を適切に入力でき
る。しかも、装着体11の面部には平坦状の音声入力手
段12および音声出力手段13を貼り付けるように取り
付ければ、軽量可で携行に便利であり、喉に対する圧迫
感などがなくなり、喉に対する負担を軽減できる。ま
た、音声認識部2において音声入力手段12から入力さ
れる振動周波数信号から声紋の特徴,音の強弱および音
の高低,発声音を認識し、この発声音の音声符号と声紋
の特徴,音の強弱および音の高低情報等を音声符号判定
部3に送出し、ここで音声符号と予め記憶されている多
数の音声符号とを比較し、両音声符号が一致するとき、
当該音声符号に対応するありがとうございます”、“さ
ようなら”などの日常会話で使用する言葉に相当する標
準音声パターンを読み出し、前記声紋の特徴,音の強弱
および音の高低等とともに音声合成部5に送出するよう
にしたので、非健常者による最初の短い会話の発声から
日常会話である長文の標準音声パターンを出力でき、非
健常者による会話の負担を十分に補助できる。
Therefore, according to the configuration of the above embodiment, the mounting body 11 to be the main body of the voice input / output device 1 is made of cloth or the like having excellent sound absorbing property, so that it is wrapped around the neck of an unhealthy person. In addition to completely adapting itself to the sound when being played, it absorbs the voice uttered from the mouth and noise coming from the outside, and the voice input means 12 can appropriately input the vibration uttered from the throat. In addition, if the flat voice input means 12 and the voice output means 13 are attached to the surface of the wearing body 11 so as to be attached thereto, the weight is light and convenient for carrying, the pressure on the throat is eliminated, and the burden on the throat is reduced. Can be reduced. Further, the voice recognition unit 2 recognizes the characteristics of the voiceprint, the strength and weakness of the sound, the pitch of the sound, and the vocal sound from the vibration frequency signal input from the voice input unit 12, and recognizes the voice code of the vocal sound and the characteristics of the voiceprint and the sound. The strength and weakness information and the pitch information of the sound are sent to the voice code determination unit 3, where the voice code is compared with a large number of prestored voice codes, and when both voice codes match,
A standard voice pattern corresponding to words used in daily conversation such as "Thank you for the corresponding voice code" and "Goodbye" is read out, and the voice synthesizer 5 is accompanied by the features of the voiceprint, the strength of the sound, the pitch of the sound, and the like. Since the speech is transmitted, a long standard speech pattern, which is a daily conversation, can be output from the utterance of the first short conversation by the unhealthy person, and the burden of the conversation by the unhealthy person can be sufficiently assisted.

【0039】さらに、音声合成部5において、音声符号
判定部3側から送られてくる各種の音声情報を一旦記憶
した後、その音声情報の中から標準音声パターンに声紋
の特徴を合成し、さらに音の強弱および音の高低を付け
たので、非健常者の感情を含めた合成音を作成できる。
Further, in the voice synthesizing unit 5, after storing various voice information sent from the voice code judging unit 3 side, the features of the voiceprint are synthesized from the voice information into a standard voice pattern, and Since the strength of the sound and the pitch of the sound are added, it is possible to create a synthetic sound that includes the emotions of an unhealthy person.

【0040】さらに、音声信号を繰り返し出力する音声
繰返しスイッチ81、音声信号の速度や強度を可変する
音声速度可変器82や音声強弱可変器83を設けたの
で、非健常者の状況や相手側の聞き取り状態に応じて適
宜に操作しながら適切な音声信号を出力できる。
Further, since the voice repeat switch 81 for repeatedly outputting the voice signal, the voice speed changer 82 for changing the speed and strength of the voice signal and the voice strength changer 83 are provided, the situation of the unhealthy person and the other side It is possible to output an appropriate audio signal while performing an appropriate operation according to the listening state.

【0041】なお、上記実施例では、全体の構成につい
て述べたが、非健常者が手軽に携行し簡単に操作する観
点から考えたとき、次のような分割構成とすることが望
ましい。つまり、音声入力手段12および音声出力手段
13を有する音声入出力装置部分と、音声認識部2,音
声符号判定部3,音声情報記憶部4,音声合成部5,音
声記憶部6および音声変換出力部7等からなる電源部分
を含む装置本体部分と、音声繰返しスイッチ81,音声
速度可変器82および音声強弱可変器83等の音声出力
調整部分とに分割すれば、適宜に信号線で接続するよう
にすれば、音声入出力装置部分を首に巻き付け固定し、
装置本体部分を腰に吊下し、音声出力調整部分を手にも
っことができ、これによって手軽に携行でき、操作性を
上げることができる。
In the above embodiment, the entire structure has been described. However, from the viewpoint of being easily carried and operated easily by an unhealthy person, the following divided structure is preferable. That is, the voice input / output device portion having the voice input means 12 and the voice output means 13, the voice recognition portion 2, the voice code determination portion 3, the voice information storage portion 4, the voice synthesis portion 5, the voice storage portion 6 and the voice conversion output. If it is divided into a device main body portion including a power source portion including the portion 7 and a voice output adjusting portion such as a voice repeat switch 81, a voice speed variable device 82 and a voice intensity variable device 83, the signal lines can be connected appropriately. If you do, wrap the audio input / output device around the neck and fix it,
The main body of the device can be hung on the waist and the audio output adjustment part can be held in the hand, which makes it easy to carry and improve operability.

【0042】また、装着体11は、布地を用いたが、吸
音性の紙地またはそれに類する素材であれば、特に限定
するものではない。その他、本発明はその要旨を逸脱し
ない範囲で種々変形して実施できる。
Although the mounting body 11 is made of cloth, it is not particularly limited as long as it is a sound absorbing paper material or a similar material. In addition, the present invention can be modified in various ways without departing from the scope of the invention.

【0043】[0043]

【発明の効果】以上説明したように本発明によれば、次
のような種々の効果を奏する。請求項1の発明において
は、口から音声を発声できない者でも音声に相当する信
号を確実に入力でき、かつ、非健常者の喉を圧迫せずに
喉の振動を適切に入力できる。
As described above, according to the present invention, the following various effects are exhibited. According to the first aspect of the invention, even a person who cannot utter a voice from the mouth can reliably input a signal corresponding to the voice, and can properly input the throat vibration without pressing the throat of an unhealthy person.

【0044】請求項2,3の発明は、非健常者の発声す
る不明瞭な音声を正しく認識でき、しかも音声パター
ン、声紋および音の強弱等を合成することにより、音声
を発声する者の感情を含めた音声合成を実現できる。
According to the second and third aspects of the present invention, the unclear voice uttered by an unhealthy person can be correctly recognized, and the voice pattern, the voiceprint, and the strength of the sound are synthesized to synthesize the emotion of the person who utters the voice. Speech synthesis including can be realized.

【0045】次に、請求項4の発明は、非健常者の身体
の状況を考慮し、かつ、相手の聞き取り状態に応じて適
宜に音声操作を行って適正な音声信号を発生することが
できる。さらに、請求項5の発明は、構成を適切に分割
することにより、非健常者が手軽に装着でき、また非健
常者による操作性を高めることができる。
Next, the invention of claim 4 can generate an appropriate voice signal by considering the physical condition of an unhealthy person and by appropriately performing voice operation according to the listening condition of the other person. . Further, according to the invention of claim 5, by appropriately dividing the configuration, an unhealthy person can easily wear it, and operability by the unhealthy person can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係わる携帯用音声認識出力補助装置の
一実施例を示す機能ブロック図。
FIG. 1 is a functional block diagram showing an embodiment of a portable voice recognition output assisting device according to the present invention.

【図2】図1に示す音声入出力装置の構成を示す図。FIG. 2 is a diagram showing a configuration of a voice input / output device shown in FIG.

【図3】図1に示す音声認識部を具体化した機能ブロッ
ク図。
FIG. 3 is a functional block diagram embodying the voice recognition unit shown in FIG.

【図4】音声認識部による音声認識を説明する図。FIG. 4 is a diagram illustrating voice recognition by a voice recognition unit.

【図5】図1に示す音声符号判定部を具体化した機能ブ
ロック図。
5 is a functional block diagram embodying the voice code determination unit shown in FIG.

【図6】図1に示す音声合成部を具体化した機能ブロッ
ク図。
FIG. 6 is a functional block diagram embodying the voice synthesis unit shown in FIG. 1.

【符号の説明】[Explanation of symbols]

1…音声入出力装置、2…音声認識部、3…音声符号判
定部、4…音声情報記憶部、5…音声合成部、6…音声
記憶部、7…音声変換出力部、8…音声出力調整部、1
1…装着体、12…音声入力手段、13…音声出力手
段、81…音声繰返しスイッチ、82…音声速度可変
器、83…音声強弱可変器。
DESCRIPTION OF SYMBOLS 1 ... Voice input / output device, 2 ... Voice recognition unit, 3 ... Voice code determination unit, 4 ... Voice information storage unit, 5 ... Voice synthesis unit, 6 ... Voice storage unit, 7 ... Voice conversion output unit, 8 ... Voice output Adjustment unit, 1
1 ... Wearing body, 12 ... Voice input means, 13 ... Voice output means, 81 ... Voice repeat switch, 82 ... Voice speed variable device, 83 ... Voice intensity variable device.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 振動発生体に巻付け固定する吸音性の素
材によって形成された短冊状の装着体の裏面側に当該振
動発生体から発生する振動を検出して電気的な振動周波
数信号に変換する平坦状の音声入力手段を取り付け、さ
らに前記装着体の表面側に前記振動周波数信号に応じた
音声信号を出力する平坦状の音声出力手段を取り付けた
音声入出力装置を有することを特徴とする携帯用音声認
識出力補助装置。
1. A vibration generated from the vibration generator is detected on the back side of a strip-shaped mounting body formed of a sound absorbing material that is wound around and fixed to the vibration generator and converted into an electrical vibration frequency signal. A voice input / output device having a flat voice output means for outputting a voice signal corresponding to the vibration frequency signal on the front surface side of the wearing body. Portable voice recognition output assist device.
【請求項2】 振動発生体から発生する振動を検出して
電気的な振動周波数信号を出力する音声入力手段および
この音声入力手段によって入力された振動周波数信号に
応じた音声信号を出力する音声出力手段とを有する音声
入出力装置と、前記音声入力手段から入力された振動周
波数信号から声紋,音の強弱,高低,発生音を認識する
音声認識部と、予め複数の標準音声パターンおよび当該
パターンに対応する音声符号が記憶され、前記音声認識
部によって認識された発生音に係わる音声符号と既に記
憶されている前記音声符号とを比較し、両音声符号が一
致したとき、前記音声符号に対応する標準音声パターン
を読み出し、当該標準音声パターン、前記声紋,音の強
弱および高低等からなる音声情報を出力する音声符号判
定部とを備えたことを特徴とする携帯用音声認識出力補
助装置。
2. A voice input means for detecting a vibration generated from a vibration generator and outputting an electrical vibration frequency signal, and a voice output for outputting a sound signal corresponding to the vibration frequency signal input by the voice input means. A voice input / output device having a means, a voice recognition unit for recognizing a voiceprint, sound intensity, pitch, and generated sound from a vibration frequency signal input from the voice input means, and a plurality of standard voice patterns and patterns in advance. A corresponding voice code is stored, the voice code relating to the generated sound recognized by the voice recognition unit is compared with the already stored voice code, and when both voice codes match, the voice code is corresponded to. And a voice code determination unit for reading out the standard voice pattern and outputting voice information including the standard voice pattern, the voiceprint, the strength of the sound, and the pitch. A portable voice recognition output assisting device.
【請求項3】 請求項2記載において、前記音声符号判
定部から出力される前記標準音声パターンと前記声紋と
を合成し、さらに前記音の強弱および高低の何れか一方
または両方を付して合成音を作成する音声合成部と、こ
の音声合成部で作成された合成音を音声信号に変換して
前記音声出力手段から出力する音声変換出力部とを付加
したことを特徴とする携帯用音声認識出力補助装置。
3. The combination according to claim 2, wherein the standard voice pattern output from the voice code determination unit and the voice print are combined, and further, one or both of the strength and the low and high of the sound are added and combined. Portable voice recognition, characterized in that a voice synthesizing unit for producing a sound and a voice conversion output unit for converting the synthesized voice produced by the voice synthesizing unit into a voice signal and outputting the voice signal from the voice output means are added. Output auxiliary device.
【請求項4】 請求項2記載において、前記音声符号判
定部から出力される前記標準音声パターンと前記声紋と
を合成し、さらに前記音の強弱および高低を付して合成
音を作成する音声合成部と、この音声合成部によって作
成された合成音を記憶する音声記憶部と、この音声記憶
部に記憶される合成音を音声信号に変換して前記音声出
力手段から出力する音声変換出力部と、前記音声記憶部
に記憶される合成音を読み出して前記音声出力手段から
繰り返し出力させる音声繰返しスイッチと、前記音声変
換出力部から出力される音声信号の速度および強弱の何
れか一方または両方を可変する音声可変手段とを付加し
たことを特徴とする携帯用音声認識出力補助装置。
4. The voice synthesis according to claim 2, wherein the standard voice pattern output from the voice code determination unit is synthesized with the voiceprint, and further, the strength and the pitch of the voice are added to create a synthesized voice. Section, a voice storage section for storing the synthesized voice created by the voice synthesis section, and a voice conversion output section for converting the synthesized voice stored in the voice storage section into a voice signal and outputting the voice signal from the voice output means. , A voice repeat switch for reading the synthetic sound stored in the voice storage unit and repeatedly outputting it from the voice output unit, and varying either or both of the speed and the strength of the voice signal output from the voice conversion output unit. A portable voice recognition output assisting device, which is characterized in that a voice varying means is added.
【請求項5】 音声入力手段および音声出力手段を有す
る音声入出力装置部分と、 前記音声入力手段から入力された振動周波数信号から声
紋,音の強弱および高低,発生音を認識する音声認識
部、この音声認識部によって認識された発生音の音声符
号と予め記憶されている複数の音声符号とを比較し、両
音声符号が一致したとき当該音声符号に対応する予め記
憶されている標準音声パターンを読み出し、この標準音
声パターン,前記声紋,音の強弱および高低等の音声情
報を発生する音声符号判定部、これら標準音声パター
ン,声紋,音の強弱および高低等を合成する音声合成
部、この音声合成部によって作成された合成音を音声信
号に変換し前記音声出力手段から出力する音声変換出力
部をもつ本体装置部分と、 前記音声記憶部に記憶される合成音を読み出して前記音
声出力手段から繰り返し出力させる音声繰り返しスイッ
チ、前記音声変換出力部から出力される音声信号の速度
および強弱の何れか一方または両方を可変する音声可変
手段をもつ音声調整部分とに分けることを特徴とする携
帯用音声認識出力補助装置。
5. A voice input / output device portion having voice input means and voice output means, and a voice recognition section for recognizing a voiceprint, a sound intensity, a pitch, and a generated sound from a vibration frequency signal input from the voice input means. The voice code of the generated sound recognized by this voice recognition unit is compared with a plurality of voice codes stored in advance, and when both voice codes match, the standard voice pattern stored in advance corresponding to the voice code is determined. A voice code determination unit that reads out and generates voice information such as the standard voice pattern, the voiceprint, and sound intensity and pitch, a voice synthesis unit that synthesizes the standard voice pattern, voiceprint, sound intensity, pitch, and the like, and this voice synthesis. Stored in the voice storage unit; a main body device unit having a voice conversion output unit for converting the synthetic sound created by the unit into a voice signal and outputting the voice signal from the voice output unit. A voice repeat switch for reading a synthetic sound and repeatedly outputting it from the voice output means, and a voice adjusting portion having a voice varying means for varying one or both of the speed and the strength of the voice signal output from the voice conversion output section. A portable voice recognition output assisting device characterized by being divided into
JP5148980A 1993-06-21 1993-06-21 Portable speech recognition output assist device Expired - Lifetime JP3068370B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5148980A JP3068370B2 (en) 1993-06-21 1993-06-21 Portable speech recognition output assist device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5148980A JP3068370B2 (en) 1993-06-21 1993-06-21 Portable speech recognition output assist device

Publications (2)

Publication Number Publication Date
JPH0713582A true JPH0713582A (en) 1995-01-17
JP3068370B2 JP3068370B2 (en) 2000-07-24

Family

ID=15465003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5148980A Expired - Lifetime JP3068370B2 (en) 1993-06-21 1993-06-21 Portable speech recognition output assist device

Country Status (1)

Country Link
JP (1) JP3068370B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990059513A (en) * 1997-12-30 1999-07-26 구자홍 Communication method for people with speech impairment
JP2000308198A (en) * 1999-02-16 2000-11-02 Gm & M:Kk Hearing and
GB2422238A (en) * 2005-01-17 2006-07-19 Univ Hull Generation of data from speech or voiceless mouthed speech
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990059513A (en) * 1997-12-30 1999-07-26 구자홍 Communication method for people with speech impairment
JP2000308198A (en) * 1999-02-16 2000-11-02 Gm & M:Kk Hearing and
US7676372B1 (en) 1999-02-16 2010-03-09 Yugen Kaisha Gm&M Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
GB2422238A (en) * 2005-01-17 2006-07-19 Univ Hull Generation of data from speech or voiceless mouthed speech

Also Published As

Publication number Publication date
JP3068370B2 (en) 2000-07-24

Similar Documents

Publication Publication Date Title
US5911129A (en) Audio font used for capture and rendering
KR100619215B1 (en) Microphone and communication interface system
JP4327241B2 (en) Speech enhancement device and speech enhancement method
US8768701B2 (en) Prosodic mimic method and apparatus
JP2015225268A (en) Electronic music instrument, sound generation control method and program
JPH11175082A (en) Voice interaction device and voice synthesizing method for voice interaction
JP2000152394A (en) Hearing aid for moderately hard of hearing, transmission system having provision for the moderately hard of hearing, recording and reproducing device for the moderately hard of hearing and reproducing device having provision for the moderately hard of hearing
JP2001034280A (en) Electronic mail receiving device and electronic mail system
JP3068370B2 (en) Portable speech recognition output assist device
JPH07433A (en) Electric artificial larynx
EP1271469A1 (en) Method for generating personality patterns and for synthesizing speech
JPH05307395A (en) Voice synthesizer
JPH0950286A (en) Voice synthesizer and recording medium used for it
JPS59501520A (en) Device for articulatory speech recognition
JPS6057898A (en) Voice registration system
Sundberg et al. Long-term average spectrum analysis of phonatory effects of noise and filtered auditory feedback
KR100553437B1 (en) wireless telecommunication terminal and method for transmitting voice message using speech synthesizing
JP2006189544A (en) Interpretation system, interpretation method, recording medium with interpretation program recorded thereon, and interpretation program
JPH05224689A (en) Speech synthesizing device
JP2658068B2 (en) Voice processor
JP2642617B2 (en) Speech synthesizer
JP3883780B2 (en) Speech synthesizer
JP2010224392A (en) Utterance support device, method, and program
JPH07191698A (en) Speech vocalization device
Inbanila et al. Investigation of Speech Synthesis, Speech Processing Techniques and Challenges for Enhancements