JP3507686B2 - 音声認識機能を有する通信装置及び通信方法 - Google Patents

音声認識機能を有する通信装置及び通信方法

Info

Publication number
JP3507686B2
JP3507686B2 JP02050198A JP2050198A JP3507686B2 JP 3507686 B2 JP3507686 B2 JP 3507686B2 JP 02050198 A JP02050198 A JP 02050198A JP 2050198 A JP2050198 A JP 2050198A JP 3507686 B2 JP3507686 B2 JP 3507686B2
Authority
JP
Japan
Prior art keywords
code
voice
input
input voice
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02050198A
Other languages
English (en)
Other versions
JPH11205867A (ja
Inventor
敏之 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP02050198A priority Critical patent/JP3507686B2/ja
Priority to US09/231,633 priority patent/US6249759B1/en
Priority to GB9900922A priority patent/GB2334864B/en
Priority to AU12116/99A priority patent/AU747731B2/en
Publication of JPH11205867A publication Critical patent/JPH11205867A/ja
Application granted granted Critical
Publication of JP3507686B2 publication Critical patent/JP3507686B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/677Preventing the dialling or sending of predetermined telephone numbers or selected types of telephone numbers, e.g. long distance numbers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は携帯電話機などの通
信装置に係り、特に音声認識機能を有する通信装置及び
通信方法に関する。
【0002】
【従来の技術】日本国内の携帯電話は現在PDC(Pers
onal Digital Cellular)方式が主流であり、フルレー
トの音声符号化方式としてはVSELP(Vector Sum E
xcitedLinear Prediction)方式、ハーフレートではP
SI−CELP(Code ExcitedLinear Prediction)方
式が採用されている。これらの音声符号化方式では、入
力音声を予め用意された音声コードブックと比較するこ
とで入力音声に最も近いコードを選択し、その選択され
たコードを相手側へ送信する。受信側では、同じコード
ブックを用意して受信コードを音声として再生してい
る。
【0003】このようなPDC方式の携帯電話には、そ
の所持者本人以外の者が発信できないようにする発信制
限機能を有する者が提案されている。特に、特開昭61
−245785号公報及び特開平2−34078号公報
には、音声認識により発信制限を行う電話装置が開示さ
れている。例えば、特開平2−34078号公報に開示
された発信規制装置付電話機では、発声したパスワード
を予め登録しておき、同一音声で同一パスワードが入力
されたときに発信制限が解除される。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来技術ではどのように同一音声と判定するのかが明記さ
れていない。登録音声データと入力音声データとの完全
一致を判定基準にすれば膨大なデータ量となってしま
う。また、完全に同一の音声周波数を発声することは本
人でも不可能に近い。
【0005】本発明の目的は、大きなメモリ空間を必要
とせず少ないデータ量で、且つ所望の精度を有する音声
比較判定を行い発信規制を行うための方法及びその方法
を用いた通信装置を提供することにある。
【0006】更に、本発明の他の目的は、音声符号化に
コードベクトルを利用することで、更に、簡易なデータ
入力及び音声変更などの種々の機能を併せ備えた通信装
置及び通信方法を提供することにある。
【0007】
【課題を解決するための手段】本発明による音声符号化
にコードベクトルを利用した通信装置は、送信手段と、
音声入力手段と、複数のコードベクトルを格納した第1
記憶手段と、複数のコードベクトルを参照することで入
力音声をコード化し、入力音声コードを生成するコード
化手段と、有限個の音節からなる所定の入力音声から生
成された所定入力音声コードを格納する第2記憶手段
と、被判定用に入力された前記有限個の音節からなる所
定の入力音声から生成された判定入力音声コードと前記
所定入力音声コードとを音節単位で比較し、各音節毎に
群コード及び識別コードが一致すれば完全一致数Cをイ
ンクリメントし、入力音節数Wが登録された所望音節数
Npに到達すると、カウントされた完全一致数Cを予め
設定されたしきい値CTHと比較し、完全一致数Cがし
きい値CTH以上であれば、前記判定入力音声コードが
真であると判定する判定手段と、からなることを特徴と
する。
【0008】判定入力音声コードと所望入力音声コード
との一致の程度と所望レベルに設定可能な基準との比較
結果に基づいて判定入力音声コードの真偽を判定するた
めに、所望基準の選択によって使用形態等に応じた適切
な判定精度に設定することができる。
【0009】また、通常は発信制限状態に設定されてお
り、判定手段により判定入力音声コードが真であると判
定されたときに発信制限が解除されるように判定結果を
利用することができる。所望基準の選択によって発信制
限を厳格にしたり緩和したりすることが可能となる。
【0010】これに加えて、本発明による通信装置は、
送信手段、音声入力手段、キー入力手段、及び表示手段
を有し、更に、各々が音節の種類を示す群コードと音声
の相違を示す識別コードとを含む複数のコードベクトル
を格納する記憶手段と、複数のコードベクトルを参照す
ることで入力音声をコード化し群コード及び識別コード
からなる入力音声コードを生成するコード化手段と、入
力音声コードの群コードに対応する文字を送信メッセー
ジとして表示手段に表示し送信メッセージを送信手段を
通して送信する制御手段と、を有していて、送信メッセ
ージを音声入力により作成できるために、キー入力の煩
雑さを軽減できる。
【0011】更にまた、本発明による通信装置は、音声
入力手段と、各々が音節の種類を示す群コードと音声の
相違を示す識別コードとを含む複数のコードベクトルを
格納する記憶手段と、複数のコードベクトルを参照する
ことで入力音声に最も近い第1コードベクトルとは識別
コードが異なる第2コードベクトルを選択し、その第2
コードベクトルに従って入力音声コードを生成するコー
ド化手段と、入力音声コードを音声情報として送信する
送信手段と、からなることを特徴とする。
【0012】入力音声に最も近い第1コードベクトルと
は識別コードが異なる第2コードベクトルを選択して送
信することで、音声を変更した音声通信が可能となり、
例えばイタズラ電話の撃退などに利用することができ
る。
【0013】
【実施の形態】図1は、本発明による通信装置の第1実
施形態である携帯電話装置の概略的構成を示すブロック
図である。同図において、送受信器101はアンテナに
接続された送信電力アンプや受信アンプ及びモデム(変
復調器)などを含み、携帯電話制御プロセッサ102は
携帯電話のチャネル制御、後述する発信制限制御を含む
種々の制御などプログラム制御により実行する。即ち、
携帯電話制御プロセッサ102は、ROM(不図示)に
格納された制御プログラムを実行することで携帯電話装
置全体の動作制御を行う。携帯電話制御プロセッサ10
2は受信データに含まれる音声コードを音声コード処理
部103へ出力し、逆に音声コード処理部103からの
送信音声コードを入力して送信データを生成する。
【0014】音声コード処理部103は無線シーケンス
に従ったデータと後述する音声コード(群+識別コー
ド)との間の変換を行い、受信音声コードをベクトル再
生部104へ出力する。ベクトル再生部104は音声コ
ードブック111に予め格納されたコードベクトルを参
照しながら受信音声コードを音声ベクトルに変換する。
こうして再生された受信音声ベクトルはデジタル/アナ
ログ(D/A)変換器105によってアナログ音声信号
に変換され、スピーカ106によって音声として出力さ
れる。また、マイクロフォン107によって入力された
音声信号はA/D変換器108によってデジタル音声信
号に変換され、ベクトル量子化部109によってベクト
ル量子化され、その音声ベクトルがベクトル比較部11
0へ出力される。
【0015】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。音声
コード処理部103は、入力音声コードを無線シーケン
スに従ったデータに変換するが、その際、識別コードだ
けを別のコードに変更することで、同一の語に対して全
く別の音声のコードベクトルを生成して送信することも
できる。この場合、入力音声と同じ言葉が全く異なる音
声、言い換えれば別人により入力されたことと同じにな
る。このような音声変更機能は、ベクトル比較部110
により実現することもできる。
【0016】同時に、ベクトル比較部110で生成され
た入力音声コードは音声比較部へ出力される。音声比
較部はメモリ(RAM)112、読み出し専用メモリ
(ROM)113及びコード比較部114からなる。R
OM113には発信制限を解除するためのパスワードあ
るいはキーワードの音声コードが予め登録されている。
RAM112には送信すべき入力音声コードが格納され
る。コード比較部114は入力音声コードと登録キーワ
ードコードとを比較し、その比較結果を携帯電話制御プ
ロセッサ102へ出力する。携帯電話制御プロセッサ1
02は、後述するように、入力音声コードと登録キーワ
ードコードとの比較結果によって、発信制限を解除する
か拒否するかを判定する。なお、コード比較部114は
携帯電話制御プロセッサ102が実行する制御プログラ
ムにより実現することもできる。
【0017】携帯電話制御プロセッサ102には、必要
な情報を表示するための液晶ディスプレイ等の表示部1
15及びダイヤリングのためのテンキーやその他機能キ
ーを含むキー入力部116が接続されている。後に詳述
するように、ベクトル比較部110によって入力音声の
語を特定できるから、例えば選択呼出受信機(ページ
ャ)へのメッセージ作成に音声入力を利用することがで
きる。具体的には、マイクロフォン107を通して音声
でメッセージを入力し、そのメッセージを表示部115
へ表示した後、キー入力部116のキー操作によって修
正することも可能となる。
【0018】なお、上述した本発明による携帯電話機
は、ハードウエアとしては既存の携帯電話機にRAM1
12及びROM113のメモリ空間とコード比較部11
4とを追加するだけで実現することができる。その他の
回路は既存の携帯電話機に本来装備されているものなの
で、少ない回路を追加するだけで実現することができ
る。
【0019】(ベクトルコード化) 図2は本発明において採用された音声のベクトルコード
化を説明するための模式図であり、図3は音声コードブ
ック111の格納内容を説明するための模式図である。
マイクロフォン107によって入力されたアナログ音声
信号はA/D変換器108によってデジタル信号に変換
され、ベクトル量子化部109によって入力音声に対応
したベクトル量(入力音声ベクトル)に変換される。
【0020】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。例え
ば、図2に示すように、入力音声ベクトル201及び2
02が「あ群No.126」のコードベクトル203の
領域に含まれる場合には、これらの入力音声ベクトルは
共に1つの入力音声コードとして出力される。
【0021】音声コードブック111では、図3に示す
ように、日本語における47種の音節(いわゆる50
音)にそれぞれ群コードが割り当てられ、各群における
複数の異なる音声ベクトルにそれぞれ識別コードが割り
当てられている。例えば、10進表示すれば、あ群には
「00」が、い群には「01」が、・・・というように
群コードが割り当てられ、同じ「あ」の発声でも識別コ
ード「001」の音声と「002」の音声とは異なって
いる。
【0022】図4(A)に示すように、ある人の「あ」
の発声に対して、その入力音声ベクトルに最も近いコー
ドベクトル301(ここでは、コード「00126」の
コードベクトル)が選択されたとすると、群コード「0
0」によって音節「あ」であることが特定でき、更に識
別コード「126」によって音声を特定することができ
る。この認識コード「00126」が入力音声コードと
して音声コード処理部103へ出力される。
【0023】他方、図4(B)に示すように、別の人の
「あ」の発声に対して、その入力音声ベクトルに最も近
いコードベクトル302(ここでは、コード「0001
8」のコードベクトル)が選択された場合には、群コー
ド「00」で音節「あ」であることが、更に識別コード
「018」で音声をそれぞれ特定することができる。こ
の認識コード「00018」が入力音声コードとして音
声コード処理部103へ出力される。
【0024】(発信制限の設定) 先ず、携帯電話に発信制限を設定する場合には、その携
帯電話の所有者(以下、本人という。)はキー入力部1
16を通して携帯電話を発信制限設定モードに切り替え
る。これによって携帯電話制御プロセッサ102はRO
M113を書き換えモードに設定する。そして、本人自
身の声で所望の語数Npのキーワードあるいはパスワー
ドをマイクロフォン107に向かって発声する。有限個
の音節からなる、例えば5音節のキーワード「あいうえ
お」を発声すると、上述したように、各音節毎に対応す
る最も近いコードベクトルが選択され、入力音声コード
が生成される。この5つの入力音声コードが登録キーワ
ードコードとしてその語数Npと共にROM113に登
録される。
【0025】その際、発信制限を解除するための条件を
キー入力部116を通して設定しておくことが望まし
い。本実施形態では、後述するように、音声入力キーワ
ードの完全一致数のしきい値CTHを設定し、その値の
大きさによって発信制限を厳格にしたり緩和したりする
ことが可能となる。
【0026】(発信制限の解除) 図5は、本発明による通信方法の第1実施形態における
発信制限方法を示すフローチャートである。発信制限を
解除するには、先ず、キー入力部116を通して携帯電
話を発信制限解除モードに切り替えると、携帯電話制御
プロセッサ102は入力語数を示す変数W及び完全一致
数Cを初期化する(ステップS401)。そして、ユー
ザは発信制限の設定と同じ手順でマイクロフォン107
に向かってNp個の語からなるキーワードを発声する。
【0027】携帯電話制御プロセッサ102は、これら
入力音声コードをRAM112へ格納すると、その入力
音声コードとROM113に格納されている登録キーワ
ードの音声コードとをコード比較部114へ語単位で出
力すると共に入力語数Wをインクリメント(歩進)する
(ステップS402及びS403)。そしてコード比較
部114によって入力音声コードと登録キーワードコー
ドとが比較され(S404)、群コード及びそれに続く
識別コードが共に一致すれば(ステップS405及びS
406のYES)、完全一致数Cをインクリメントする
(ステップS407)。
【0028】群コードが不一致であれば(S405のN
O)、キーワード自体が異なるわけであるから即座に発
信制限解除が拒否される(ステップS411)。群コー
ドは一致するが識別コードが不一致であれば(ステップ
S406のNO)、完全一致数Cはインクリメントしな
い。以上のステップS402〜S407を入力語数Wが
所定語数Npに到達するまで繰り返す(ステップS40
8のNO)。
【0029】こうして入力語数Wが登録された所望語数
Npに到達すると(S408のYES)、カウントされ
た完全一致数Cを予め設定されたしきい値CTHと比較
する(ステップS409)。完全一致数Cがしきい値C
TH以上であれば(S409のYES)、正しいキーワ
ードが本人によって音声入力されたものと判断され、発
信制限が解除される(ステップS410)。従って、ユ
ーザはキー入力部116からダイヤリングにすることで
発信することができる。逆に、完全一致数Cがしきい値
CTHより小さい場合には(S409のNO)、キーワ
ードは正しくとも本人以外の者によって音声入力された
と判断され、発信制限の解除要求は拒否される(ステッ
プS411)。従って、ユーザは発信することができな
い。
【0030】しきい値CTHをキーワード語数Npと等
しく設定することはある困難をもたらす。全ての語に対
して群コード及び識別コードの両方が完全に一致するこ
とは、たとえ本人であっても容易ではなく、本人でも発
信制限を解除できない場合が生じ得るからである。逆に
言えば、常に同一の発声ができるという自信がある者に
は極めて有用な設定であろう。
【0031】しきい値CTH=0に設定することは、あ
る意味で有用である。例えば、特定の者にキーワードを
教えておけば、その本人以外の者でも正しいキーワード
を音声入力するだけで発信が可能となるからである。
【0032】従って、しきい値CTHを0以上Np未満
の適当な値に設定することが望ましいであろう。例え
ば、キーワード「あいうえお」に対してしきい値CTH
=2と設定しておけば、「あ、う、お」が完全一致して
いれば、「い、え」の識別コードが不一致であっても、
発信制限を解除することができるからである。
【0033】このように、しきい値CTHを大きく設定
すれば、本人以外の者が使える可能性は小さくなるが、
本人さえも拒絶される可能性が高くなる。逆に、しきい
値CTHを小さく設定すれば、本人以外の者が発信制限
を解除する可能性が高くなる。従ってユーザの使用環境
等を考慮して適切なしきい値CTHを設定すればよい。
逆に言えば、しきい値CTHが所望値に設定可能である
ことで、その設定の仕方によって様々な使い方が可能に
なるという効果が生じる。
【0034】(メッセージ生成) 図6は、本発明による通信方法の第2実施形態として付
加されているメッセージ生成方法を示すフローチャート
である。上述したように、認識コードの群コードにより
入力音声の語を特定できるから、例えば選択呼出受信機
(ページャ)へのメッセージ作成に音声入力を利用する
ことができる。先ず、携帯電話をメッセージ作成モード
にしておき、マイクロフォン107を通して音声でメッ
セージを入力する。入力音声ベクトルは、上述したよう
に、ベクトル比較部110に取り込まれ(S501)、
音声コードブック111のコードベクトルと比較される
ことで入力音声コードが生成される(S502)。音声
コード処理部103は、入力音声コードから群コードを
抽出して入力語を特定し(S503)、携帯電話制御プ
ロセッサ102へ送出する。携帯電話制御プロセッサ1
02は群コードに基づいて入力語を表示部115へ表示
させる(S504)。
【0035】こうして音声入力された語が表示部115
に表示されると、その表示メッセージを送信してよいか
否かを示す指令がユーザによってキー入力されるのを待
機する(S505)。送信文字の追加あるいは修正があ
る場合には(S505のNO)、次の語の入力を待機す
る。キー入力部116から入力されれば、そのキー入力
文字を表示部115に表示するステップS504へ戻
り、音声入力があれば上述したステップS501へ戻
る。以上のステップを繰り返すことで送信メッセージが
完成すると(S505のYES)、携帯電話制御プロセ
ッサ102は送受信器101を通してそのメッセージを
宛先のページャへ送信する(S507)。
【0036】このように音声認識機能を送信メッセージ
作成に利用し、音声入力ができない記号などはキー入力
によって挿入あるいは追加することで、キー入力の煩雑
さを軽減することができる。
【0037】図7は、上記メッセージ生成方法により生
成された選択呼出信号の一例を示すフォーマット図であ
る。選択呼出信号は呼出番号部601とそれに続くデー
タ部602からなり、データ部602に上記メッセージ
が音声コードとして格納される。図中のデータ部602
には、「000102・・・」というコードが乗せられ
ているから、「あいう・・・」というメッセージが送信
されることになる。
【0038】(音声変更制御) 図8は、本発明による通信方法の第3実施形態として付
加されている音声変更方法を示すフローチャートであ
る。上述したように、音声コード処理部103におい
て、識別コードのみを別のものに変換することで音声変
更が可能となる。まず、マイクロフォン107を通して
入力された入力音声ベクトルは、上述したように、ベク
トル比較部110に取り込まれ(S701)、音声コー
ドブック111のコードベクトルと比較される(S70
2)。こうして入力音声ベクトルに最も近いコードベク
トルが選択され、通常の群コード及び識別コードが特定
される(S703)。音声コード処理部103は、この
通常の群コート及び識別コードを基準として同一の群コ
ードにおける異なる識別コードを選択して携帯電話制御
プロセッサ102へ出力し、その辺抗された音声データ
が送信される(S704、S705)。即ち、同じ音節
で異なる声の音声コードが送信されることとなる。例え
ば、音声コードを周波数の低い方向にシフトさせるよう
に設定すれば、女性の声を男性の声に変更することも可
能となり、イタズラ電話撃退機能として利用することが
できる。
【0039】ベクトル比較部110におけるコードベク
トルの選択は携帯電話制御プロセッサ102によって制
御することも可能であるから、携帯電話がボイスチェン
ジモードに設定されると、携帯電話制御プロセッサ10
2は、ベクトル比較部110に対して、入力音声ベクト
ルに最も近いコードベクトルを選択する通常モードでは
なく、同一の語に対して全く別の音声のコードベクトル
を選択するように設定することもできる。
【0040】(選択呼出受信機) 図9は、本発明による通信装置に関連した選択呼出受信
機の概略的構成を示すブロック図である。アンテナを通
して受信された無線信号は無線部801によって復調さ
れ、ベースバンド信号がデコーダ802へ出力される。
デコーダ802はベースバンド信号を復号化し、復号化
された受信信号の選択呼出番号がID−ROM803に
格納されている自己の識別番号と一致するならば、それ
に続くデータ部の信号を受信データとしてプロセッサ8
04へ出力する。
【0041】プロセッサ804には群コードブック80
5及びメッセージメモリ806が接続されており、群コ
ードブック805に格納された群コードを参照して受信
データの解読を行う。例えば、図7に示すようなデータ
「000102・・・」であれば、「あいう・・・」と
いうメッセージを得ることができる。こうして解読され
たメッセージはメッセージメモリ806に格納される。
群コードブック805には群コードだけが格納されてい
ればよいから、大きなメモリ空間を必要としない。
【0042】また、プロセッサ804はデコーダ802
において自機の呼出を検出すると、音、振動あるいは光
の点滅等を発生する報知部807を駆動してユーザに着
信を報知する。受信メッセージはLCD等の表示部80
8に表示され、報知停止、その他指令はキー入力部80
9を通して行われる。このようにして、図6で説明した
ような本発明の携帯電話の音声認識機能を利用して生成
したメッセージを選択呼出受信機で受信し、そのメッセ
ージを表示することができる。
【図面の簡単な説明】
【図1】本発明による通信装置の第1実施形態である携
帯電話装置の概略的構成を示すブロック図である。
【図2】本発明で採用された音声のベクトルコード化を
説明するための模式図である。
【図3】本発明において使用される音声コードブックの
内容を説明するための模式図である。
【図4】本発明における入力音声とコード化された認識
コードとの関係を説明するための2つの例を示す模式図
である。
【図5】本発明による通信方法の第1実施形態である発
信制限方法を示すフローチャートである。
【図6】本発明による通信方法の第2実施形態に係る
ッセージ生成方法を示すフローチャートである。
【図7】図6に示すメッセージ生成方法により生成され
た選択呼出信号の一例を示すフォーマット図である。
【図8】本発明による通信方法の第3実施形態に係る
声変更方法を示すフローチャートである。
【図9】本発明による通信装置に関連する選択呼出受信
機の概略的構成を示すブロック図である。
【符号の説明】
101 送受信器 102 携帯電話制御プロセッサ102 103 音声コード処理部 104 ベクトル再生部 105 D/A変換器 106 スピーカ 107 マイクロフォン 108 A/D変換器 109 ベクトル量子化部 110 ベクトル比較部 111 音声コードブック 112 RAM 113 ROM 114 コード比較部 115 表示部 116 キー入力部
フロントページの続き (56)参考文献 特開 平9−84128(JP,A) 特開 昭51−93105(JP,A) 特開 平7−321945(JP,A) 特開 平7−273841(JP,A) 特開 平3−274596(JP,A) 特開 昭61−245785(JP,A) 特開 平2−34078(JP,A) 特開 平5−316203(JP,A) 特開 平4−343554(JP,A) 特開 平5−83359(JP,A) 特開 平7−248791(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04B 7/26 G10L 3/00 545 D

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声符号化に音節の種類を示す群コード
    と音声の相違を示す識別コードとを含むコードベクトル
    を利用した通信装置において、 送信手段と、 音声入力手段と、 複数のコードベクトルを格納した第1記憶手段と、 前記複数のコードベクトルを参照することで入力音声を
    コード化し、入力音声コードを生成するコード化手段
    と、 有限個の音節からなる所定の入力音声から生成された所
    定入力音声コードを格納する第2記憶手段と、 被判定用に入力された前記有限個の音節からなる所定の
    入力音声から生成された判定入力音声コードと前記所定
    入力音声コードとを音節単位で比較し、各音節毎に、群
    コードが不一致の場合には、即座に発信制限解除が拒否
    され、群コードが一致しそれに続く識別コードが一致す
    れば完全一致数Cをインクリメントし、群コードは一致
    するが識別コードが不一致であれば、完全一致数Cはイ
    ンクリメントせず、入力音節数Wが登録された所望音節
    数Npに到達すると、カウントされた完全一致数Cを予
    め設定されたしきい値CTHと比較し、完全一致数Cが
    しきい値CTH以上であれば、前記判定入力音声コード
    が真であると判定する判定手段と、 からなることを特徴とする通信装置。
  2. 【請求項2】 前記通信装置は、通常、発信制限状態に
    設定されており、前記判定手段により前記判定入力音声
    コードが真であると判定されたときに前記発信制限を解
    除することを特徴とする請求項1に記載の通信装置。
  3. 【請求項3】 請求項1又は請求項2に記載の通信装置
    であって、 キー入力手段と、 表示手段と、 前記入力音声コードの群コードに対応する文字を送信メ
    ッセージとして前記表示手段に表示し、前記送信メッセ
    ージを前記送信手段を通して送信する制御手段と、 をも含み構成されたことを特徴とする通信装置。
  4. 【請求項4】 前記表示手段に表示された送信メッセー
    ジは、前記音声入力手段及び前記キー入力手段のいずれ
    かを通して変更可能であることを特徴とする請求項3記
    載の通信装置。
  5. 【請求項5】 請求項1又は請求項2に記載の通信装置
    であって、 前記コード化手段によって前記複数のコードベクトルを
    参照することで前記入力音声に最も近い第1コードベク
    トルとは前記識別コードが異なる第2コードベクトルを
    選択し、その第2コードベクトルに従って入力音声コー
    ドを生成し、前記送信手段によって前記入力音声コード
    を音声情報として送信する、ことをも含む ことを特徴とする通信装置。
  6. 【請求項6】 音声符号化にコードベクトルを利用した
    通信装置の通信方法において、 各々が音節の種類を示す群コードと音声の相違を示す識
    別コードとを含む複数のコードベクトルを格納し、 前記複数のコードベクトルを参照することで入力音声に
    対応した群コード及び識別コードからなる入力音声コー
    ドを生成し、 有限個の音節からなる所望の入力音声から生成された所
    望入力音声コードを格納し、 被判定用に入力された前記有限個の音節からなる所定の
    入力音声から生成された判定入力音声コードと所望入力
    音声コードとを音節単位で比較し、各音節毎に、群コードが不一致の場合には、即座に発信
    制限解除が拒否され、群コードが一致しそれに続く識別
    コードが一致すれば完全一致数Cをインクリメントし、
    群コードは一致するが識別コードが不一致であれば、完
    全一致数Cはインクリメントせず 、入力音節数Wが登録
    された所望音節数Npに到達すると、カウントされた完
    全一致数Cを予め設定されたしきい値CTHと比較し、
    完全一致数Cがしきい値CTH以上であれば、前記判定
    入力音声コードが真であると判定し、 前記判定結果に従って発信制限の解除制御を行う、 ことを特徴とする通信方法。
  7. 【請求項7】 請求項6に記載の通信方法であって、 前記複数のコードベクトルを参照することで入力音声に
    対応した群コード及び識別コードからなる入力音声コー
    ドを生成し、 前記入力音声コードの群コードに対応する文字を送信メ
    ッセージとして表示し、 前記送信メッセージを送信する、ことをも含む ことを特徴とする通信方法。
  8. 【請求項8】 請求項6に記載の通信方法であって、 前記複数のコードベクトルを参照することで入力音声に
    最も近い第1コードベクトルとは前記識別コードが異な
    る第2コードベクトルを選択し、 前記第2コードベクトルに従って入力音声コードを生成
    し、 前記入力音声コードを音声情報として送信する、ことをも含む ことを特徴とする通信方法。
JP02050198A 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法 Expired - Fee Related JP3507686B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP02050198A JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法
US09/231,633 US6249759B1 (en) 1998-01-16 1999-01-15 Communication apparatus using speech vector comparison and recognition
GB9900922A GB2334864B (en) 1998-01-16 1999-01-15 Communication apparatus
AU12116/99A AU747731B2 (en) 1998-01-16 1999-01-15 Communication apparatus using speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02050198A JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法

Publications (2)

Publication Number Publication Date
JPH11205867A JPH11205867A (ja) 1999-07-30
JP3507686B2 true JP3507686B2 (ja) 2004-03-15

Family

ID=12028919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02050198A Expired - Fee Related JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法

Country Status (4)

Country Link
US (1) US6249759B1 (ja)
JP (1) JP3507686B2 (ja)
AU (1) AU747731B2 (ja)
GB (1) GB2334864B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000165511A (ja) * 1998-11-26 2000-06-16 Nec Corp 携帯電話機および携帯電話機のダイヤルロック方法
DE10063079A1 (de) * 2000-12-18 2002-07-11 Infineon Technologies Ag Verfahren zum Erkennen von Identifikationsmustern
WO2002077975A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile
AU2003272871A1 (en) * 2002-10-18 2004-05-04 Beijing Kexin Technology Co., Ltd. Portable digital mobile communication apparatus, method for controlling speech and system
US20060052057A1 (en) * 2004-09-03 2006-03-09 Per Persson Group codes for use by radio proximity applications
US7957972B2 (en) * 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
KR100897553B1 (ko) 2007-01-04 2009-05-15 삼성전자주식회사 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치
JP5607286B2 (ja) * 2007-03-27 2014-10-15 日本電気株式会社 情報処理端末、情報処理端末の制御方法、およびプログラム
CN100583649C (zh) * 2007-07-23 2010-01-20 华为技术有限公司 矢量编/解码方法、装置及流媒体播放器
US8615221B1 (en) 2012-12-06 2013-12-24 Google Inc. System and method for selection of notification techniques in an electronic device
US9037455B1 (en) * 2014-01-08 2015-05-19 Google Inc. Limiting notification interruptions
CN105261356A (zh) * 2015-10-30 2016-01-20 桂林信通科技有限公司 一种语音识别系统及方法
JP6577429B2 (ja) * 2016-08-31 2019-09-18 Kddi株式会社 通信端末、通信端末を利用した通信方法及び通信プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595916B2 (ja) 1975-02-13 1984-02-07 日本電気株式会社 音声分折合成装置
NL8303649A (nl) * 1983-10-24 1985-05-17 Philips Nv Werkwijze voor het vaststellen van de gebruiksbevoegdheid van een gebruiker van een abonneetoestel voor signaaloverdracht.
JPS61245785A (ja) 1985-04-24 1986-11-01 Nec Corp 音声認識により市外発信規制解除を行うボタン電話装置
JPH0234078A (ja) 1988-07-25 1990-02-05 Toshiba Corp 発信規制装置付電話機
US5167004A (en) * 1991-02-28 1992-11-24 Texas Instruments Incorporated Temporal decorrelation method for robust speaker verification
JPH04343554A (ja) 1991-05-20 1992-11-30 Sony Corp 電話装置
JPH0583359A (ja) 1991-09-19 1993-04-02 Hitachi Ltd 電話機方式
JPH05316203A (ja) 1992-05-11 1993-11-26 Sekisui Chem Co Ltd 発呼者認識電話装置
JP2899485B2 (ja) 1992-08-25 1999-06-02 シャープ株式会社 コードレス電話機
AU670379B2 (en) * 1993-08-10 1996-07-11 International Standard Electric Corp. System and method for passive voice verification in a telephone network
WO1995005656A1 (en) * 1993-08-12 1995-02-23 The University Of Queensland A speaker verification system
JP3098157B2 (ja) * 1994-03-11 2000-10-16 株式会社エヌ・ティ・ティ・データ 話者照合方法及び装置
JPH07273841A (ja) 1994-03-30 1995-10-20 Nippon Telegr & Teleph Corp <Ntt> 声質変換手段付き電話機
JPH07273864A (ja) 1994-04-04 1995-10-20 Victor Co Of Japan Ltd コードレス電話装置
JPH07321945A (ja) 1994-05-25 1995-12-08 Hitachi Ltd 電話機
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JPH0984128A (ja) 1995-09-20 1997-03-28 Nec Corp 音声認識機能を有する通信機器

Also Published As

Publication number Publication date
JPH11205867A (ja) 1999-07-30
AU1211699A (en) 1999-08-05
US6249759B1 (en) 2001-06-19
AU747731B2 (en) 2002-05-23
GB2334864B (en) 2000-03-15
GB2334864A (en) 1999-09-01

Similar Documents

Publication Publication Date Title
JP4110726B2 (ja) 聴力補正式の携帯電話機
EP0319210B1 (en) Radio telephone apparatus
JP3507686B2 (ja) 音声認識機能を有する通信装置及び通信方法
US20060140353A1 (en) Method for offering TTY/TTD service in a wireless terminal and wireless terminal implementing the same
US4949374A (en) Speech recognition system with an accurate recognition function
JP2002540731A (ja) 携帯電話機による使用のための数字列を生成するシステムおよび方法
KR100713368B1 (ko) 이동통신 단말기에서 단축번호를 이용한 콜 발신 방법
KR100369804B1 (ko) 휴대 전화 단말 시스템의 음성 인식 단문 메시지 전송장치 및 방법
KR20070018189A (ko) 이동통신단말기에서 수신제한장치 및 방법
JPH0984128A (ja) 音声認識機能を有する通信機器
JPH11112614A (ja) 通信方法及び装置
KR100310342B1 (ko) 휴대폰에서 스피커폰 모드시 송/수신 음성신호의 스위칭방법
KR100298317B1 (ko) 휴대용전화기의통화방법
KR0124475B1 (ko) 디지탈 셀룰라폰의 수신메세지 처리방법 및 그 장치
KR100421365B1 (ko) 영상 휴대전화기의 자동 도난신고 방법
JP4936792B2 (ja) 携帯電話装置
JPH07147694A (ja) 携帯電話装置
JP2003188948A (ja) 携帯端末装置
JPH1075470A (ja) 通信装置
KR101085731B1 (ko) 원격으로 이동통신 단말기의 전화번호부를 액세스 할 수있도록 하는 장치 및 방법
KR100365777B1 (ko) 전화기에서 전화번호 저장 장치 및 방법
KR100640443B1 (ko) 휴대폰에서 스피커폰 모드시 송/수신 음성신호의 스위칭 제어방법
KR100642928B1 (ko) 수화음 자동 조절 기능을 가지는 무선통신 단말기 및 그방법
KR100301725B1 (ko) 휴대전화기에서의대화형음성인식방법
KR100439224B1 (ko) 휴대전화기 매너모드의 발신자번호 확인장치와 그 운용방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031219

LAPS Cancellation because of no payment of annual fees