JPH11205867A - 音声認識機能を有する通信装置及び通信方法 - Google Patents

音声認識機能を有する通信装置及び通信方法

Info

Publication number
JPH11205867A
JPH11205867A JP10020501A JP2050198A JPH11205867A JP H11205867 A JPH11205867 A JP H11205867A JP 10020501 A JP10020501 A JP 10020501A JP 2050198 A JP2050198 A JP 2050198A JP H11205867 A JPH11205867 A JP H11205867A
Authority
JP
Japan
Prior art keywords
code
voice
input voice
input
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10020501A
Other languages
English (en)
Other versions
JP3507686B2 (ja
Inventor
Toshiyuki Oda
敏之 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP02050198A priority Critical patent/JP3507686B2/ja
Priority to US09/231,633 priority patent/US6249759B1/en
Priority to GB9900922A priority patent/GB2334864B/en
Priority to AU12116/99A priority patent/AU747731B2/en
Publication of JPH11205867A publication Critical patent/JPH11205867A/ja
Application granted granted Critical
Publication of JP3507686B2 publication Critical patent/JP3507686B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/677Preventing the dialling or sending of predetermined telephone numbers or selected types of telephone numbers, e.g. long distance numbers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 音声符号化にコードベクトルを利用して所望
の精度を有する音声比較判定を可能にする通信装置及び
通信方法を提供する。 【解決手段】 予め格納された複数のコードベクトルを
参照することで入力音声に対応した入力音声コードを生
成するベクトル比較部が設けられており、このベクトル
比較部によってキーワードの音声入力から生成されたキ
ーワード音声コードをメモリに予め登録しておく。ユー
ザによって音声入力されたキーワードから入力音声コー
ドを生成し、登録キーワード音声コードと比較する。そ
れらの一致の程度を所定判定基準と比較することで、入
力音声キーワードが本人により入力されたものか否かを
判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は携帯電話機などの通
信装置に係り、特に音声認識機能を有する通信装置及び
通信方法に関する。
【0002】
【従来の技術】日本国内の携帯電話は現在PDC(Pers
onal Digital Cellular)方式が主流であり、フルレー
トの音声符号化方式としてはVSELP(Vector Sum E
xcitedLinear Prediction)方式、ハーフレートではP
SI−CELP(Code ExcitedLinear Prediction)方
式が採用されている。これらの音声符号化方式では、入
力音声を予め用意された音声コードブックと比較するこ
とで入力音声に最も近いコードを選択し、その選択され
たコードを相手側へ送信する。受信側では、同じコード
ブックを用意して受信コードを音声として再生してい
る。
【0003】このようなPDC方式の携帯電話には、そ
の所持者本人以外の者が発信できないようにする発信制
限機能を有する者が提案されている。特に、特開昭61
−245785号公報及び特開平2−34078号公報
には、音声認識により発信制限を行う電話装置が開示さ
れている。例えば、特開平2−34078号公報に開示
された発信規制装置付電話機では、発声したパスワード
を予め登録しておき、同一音声で同一パスワードが入力
されたときに発信制限が解除される。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来技術ではどのように同一音声と判定するのかが明記さ
れておらず、登録音声データと入力音声データとの完全
一致を判定基準にすれば膨大なデータ量となるだけでな
く、完全に同一の音声周波数を発声することは本人でも
不可能に近い。
【0005】本発明の目的は、大きなメモリ空間を必要
とせずに所望の精度を有する音声比較判定を行うための
方法及びその方法を用いた通信装置を提供することにあ
る。
【0006】更に、本発明の他の目的は、音声符号化に
コードベクトルを利用して簡易なデータ入力及び音声変
更などの種々の機能を実現するための通信装置及び通信
方法を提供することにある。
【0007】
【課題を解決するための手段】本発明による音声符号化
にコードベクトルを利用した通信装置は、音声入力手段
と、複数のコードベクトルを格納した第1記憶手段と、
複数のコードベクトルを参照することで入力音声をコー
ド化し入力音声コードを生成するコード化手段と、所望
の入力音声から生成された所望入力音声コードを格納す
る第2記憶手段と、判定用の入力音声から生成された判
定入力音声コードと所望入力音声コードとを比較し、そ
れらの一致の程度と所望基準との比較結果に基づいて判
定入力音声コードの真偽を判定する判定手段と、からな
ることを特徴とする。
【0008】判定入力音声コードと所望入力音声コード
との一致の程度と所望基準との比較結果に基づいて判定
入力音声コードの真偽を判定するために、所望基準の選
択によって適切な判定精度を得ることができる。
【0009】また、通常は発信制限状態に設定されてお
り、判定手段により判定入力音声コードが真であると判
定されたときに発信制限が解除されるように判定結果を
利用することができる。所望基準の選択によって発信制
限を厳格にしたり緩和したりすることが可能となる。
【0010】更に、本発明による通信装置は、送信手
段、音声入力手段、キー入力手段、及び表示手段を有
し、更に、各々が音節の種類を示す群コードと音声の相
違を示す識別コードとを含む複数のコードベクトルを格
納する記憶手段と、複数のコードベクトルを参照するこ
とで入力音声をコード化し群コード及び識別コードから
なる入力音声コードを生成するコード化手段と、入力音
声コードの群コードに対応する文字を送信メッセージと
して表示手段に表示し送信メッセージを送信手段を通し
て送信する制御手段と、を有する。送信メッセージを音
声入力により作成できるために、キー入力の煩雑さを軽
減できる。
【0011】更にまた、本発明による通信装置は、音声
入力手段と、各々が音節の種類を示す群コードと音声の
相違を示す識別コードとを含む複数のコードベクトルを
格納する記憶手段と、複数のコードベクトルを参照する
ことで入力音声に最も近い第1コードベクトルとは識別
コードが異なる第2コードベクトルを選択し、その第2
コードベクトルに従って入力音声コードを生成するコー
ド化手段と、入力音声コードを音声情報として送信する
送信手段と、からなることを特徴とする。
【0012】入力音声に最も近い第1コードベクトルと
は識別コードが異なる第2コードベクトルを選択して送
信することで、音声を変更した音声通信が可能となり、
例えばイタズラ電話の撃退などに利用することができ
る。
【0013】
【実施の形態】図1は、本発明による通信装置の第1実
施形態である携帯電話装置の概略的構成を示すブロック
図である。同図において、送受信器101はアンテナに
接続された送信電力アンプや受信アンプ及びモデム(変
復調器)などを含み、携帯電話制御プロセッサ102は
携帯電話のチャネル制御、後述する発信制限制御を含む
種々の制御などプログラム制御により実行する。即ち、
携帯電話制御プロセッサ102は、ROM(不図示)に
格納された制御プログラムを実行することで携帯電話装
置全体の動作制御を行う。携帯電話制御プロセッサ10
2は受信データの音声コードを音声コード処理部103
へ出力し、音声コード処理部103からの送信音声コー
ドを入力して送信データを生成する。
【0014】音声コード処理部103は無線シーケンス
に従ったデータと後述する音声コード(群+識別コー
ド)との間の変換を行い、受信音声コードをベクトル再
生部104へ出力し、ベクトル再生部104は音声コー
ドブック111に予め格納されたコードベクトルを参照
しながら受信音声コードを音声ベクトルに変換する。こ
うして再生された受信音声ベクトルはデジタル/アナロ
グ(D/A)変換器105によってアナログ音声信号に
変換され、スピーカ106によって音声として出力され
る。また、マイクロフォン107によって入力された音
声信号はA/D変換器108によってデジタル音声信号
に変換され、ベクトル量子化部109によってベクトル
量子化され、その音声ベクトルがベクトル比較部110
へ出力される。
【0015】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。音声
コード処理部103は、入力音声コードを無線シーケン
スに従ったデータに変換するが、その際、識別コードだ
けを別のコードに変更することで、同一の語に対して全
く別の音声のコードベクトルを生成して送信することも
できる。この場合、入力音声と同じ言葉が全く異なる音
声、言い換えれば別人により入力されたことと同じにな
る。このような音声偏光器脳は、ベクトル比較部110
で実現することもできる。
【0016】更に、ベクトル比較部110で生成された
入力音声コードは音声比較部へ出力される。音声比較部
はメモリ(RAM)112、読み出し専用メモリ(RO
M)113及びコード比較部114からなる。RAM1
12には送信すべき入力音声コードが格納され、ROM
113には発信制限を解除するためのパスワードあるい
はキーワードの音声コードが予め登録されている。コー
ド比較部114は入力音声コードと登録キーワードコー
ドとを比較し、その比較結果を携帯電話制御プロセッサ
102へ出力する。携帯電話制御プロセッサ102は、
後述するように、入力音声コードと登録キーワードコー
ドとの比較結果によって、発信制限を解除するか拒否す
るかを判定する。なお、コード比較部114は携帯電話
制御プロセッサ102が実行する制御プログラムにより
実現することもできる。
【0017】携帯電話制御プロセッサ102には、必要
な情報を表示するための液晶ディスプレイ等の表示部1
15及びダイヤリングのためのテンキーやその他機能キ
ーを含むキー入力部116が接続されている。後に詳述
するように、ベクトル比較部110によって入力音声の
語を特定できるから、例えば選択呼出受信機(ページ
ャ)へのメッセージ作成に音声入力を利用することがで
きる。具体的には、マイクロフォン107を通して音声
でメッセージを入力し、そのメッセージを表示部115
へ表示した後、キー入力部116のキー操作によって修
正することも可能となる。
【0018】なお、上述した本発明による携帯電話機
は、ハードウエアとしては既存の携帯電話機にRAM1
12及びROM113のメモリ空間とコード比較部11
4とを追加するだけで実現することができる。その他の
回路は既存の携帯電話機に本来装備されているものなの
で、少ない回路を追加するだけで実現することができ
る。
【0019】(ベクトルコード化)図2は本発明におい
て採用された音声のベクトルコード化を説明するための
模式図であり、図3は音声コードブック111の格納内
容を説明するための模式図である。マイクロフォン10
7によって入力されたアナログ音声信号はA/D変換器
108によってデジタル信号に変換され、ベクトル量子
化部109によって入力音声に対応したベクトル量(入
力音声ベクトル)に変換される。
【0020】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。例え
ば、図2に示すように、入力音声ベクトル201及び2
02が「あ群No.126」のコードベクトル203の
領域に含まれる場合には、これらの入力音声ベクトルは
共に1つの入力音声コードとして出力される。
【0021】音声コードブック111では、図3に示す
ように、日本語における47種の音節(いわゆる50
音)にそれぞれ群コードが割り当てられ、各群における
複数の異なる音声ベクトルにそれぞれ識別コードが割り
当てられている。例えば、10進表示すれば、あ群には
「00」が、い群には「01」が、・・・というように
群コードが割り当てられ、同じ「あ」の発声でも識別コ
ード「1」の音声と「2」の音声とは異なっている。
【0022】図4(A)に示すように、ある人の「あ」
の発声に対して、その入力音声ベクトルに最も近いコー
ドベクトル301(ここでは、コード「00126」の
コードベクトル)が選択されたとすると、群コード「0
0」によって音節「あ」であることが特定でき、更に識
別コード「126」によって音声を特定することができ
る。この認識コード「00126」が入力音声コードと
して音声コード処理部103へ出力される。
【0023】他方、図4(B)に示すように、別の人の
「あ」の発声に対して、その入力音声ベクトルに最も近
いコードベクトル302(ここでは、コード「0001
8」のコードベクトル)が選択された場合には、群コー
ド「00」で音節「あ」であることが、更に識別コード
「018」で音声をそれぞれ特定することができる。こ
の認識コード「00018」が入力音声コードとして音
声コード処理部103へ出力される。
【0024】(発信制限の設定)先ず、携帯電話に発信
制限を設定する場合には、その携帯電話の所有者(以
下、本人という。)はキー入力部116を通して携帯電
話を発信制限設定モードに切り替える。これによって携
帯電話制御プロセッサ102はROM113を書き換え
モードに設定する。そして、本人自身の声で所望の語数
Npのキーワードあるいはパスワードをマイクロフォン
107に向かって発声する。例えば、5音節のキーワー
ド「あいうえお」を発声すると、上述したように、各音
節毎に対応する最も近いコードベクトルが選択され、入
力音声コードが生成される。この5つの入力音声コード
が登録キーワードコードとしてその語数Npと共にRO
M113に登録される。
【0025】その際、発信制限を解除するための条件を
キー入力部116を通して設定しておくことが望まし
い。本実施形態では、後述するように、音声入力キーワ
ードの完全一致数のしきい値CTHを設定し、その値の大
きさによって発信制限を厳格にしたり緩和したりするこ
とが可能となる。
【0026】(発信制限の解除)図5は、本発明による
通信方法の第1実施形態である発信制限方法を示すフロ
ーチャートである。発信制限を解除するには、先ず、キ
ー入力部116を通して携帯電話を発信制限解除モード
に切り替えると、携帯電話制御プロセッサ102は入力
語数を示す変数W及び完全一致数Cを初期化する(ステ
ップS401)。そして、ユーザは発信制限の設定と同
じ手順でマイクロフォン107に向かってNp個の語か
らなるキーワードを発声する。
【0027】携帯電話制御プロセッサ102は、これら
入力音声コードをRAM112へ格納すると、その入力
音声コードとROM113に格納されている登録キーワ
ードの音声コードとをコード比較部114へ語単位で出
力すると共に入力語数Wをインクリメント(歩進)する
(ステップS402及びS403)。そしてコード比較
部114によって入力音声コードと登録キーワードコー
ドとが比較され(S404)、群コード及びそれに続く
識別コードが共に一致すれば(ステップS405及びS
406のYES)、完全一致数Cをインクリメントする
(ステップS407)。
【0028】群コードが不一致であれば(S405のN
O)、キーワード自体が異なるわけであるから即座に発
信制限解除が拒否される(ステップS411)。群コー
ドは一致するが識別コードが不一致であれば(ステップ
S406のNO)、完全一致数Cはインクリメントしな
い。以上のステップS402〜S407を入力語数Wが
所定語数Npに到達するまで繰り返す(ステップS40
8のNO)。
【0029】こうして入力語数Wが登録された所望語数
Npに到達すると(S408のYES)、カウントされ
た完全一致数Cを予め設定されたしきい値CTHと比較す
る(ステップS409)。完全一致数Cがしきい値CTH
以上であれば(S409のYES)、正しいキーワード
が本人によって音声入力されたものと判断され、発信制
限が解除される(ステップS410)。従って、ユーザ
はキー入力部116からダイヤリングにすることで発信
することができる。逆に、完全一致数Cがしきい値CTH
より小さい場合には(S409のNO)、キーワードは
正しくとも本人以外の者によって音声入力されたと判断
され、発信制限の解除要求は拒否される(ステップS4
11)。従って、ユーザは発信することができない。
【0030】しきい値CTHをキーワード語数Npと等し
く設定することはある困難をもたらす。全ての語に対し
て群コード及び識別コードの両方が完全に一致すること
は、たとえ本人であっても容易ではなく、本人でも発信
制限を解除できない場合が生じる得るからである。逆に
言えば、常に同一の発声ができるという自信がある者に
は極めて有用な設定であろう。
【0031】しきい値CTH=0に設定することは、ある
意味で有用である。例えば、特定の者にキーワードを教
えておけば、その本人以外の者でも正しいキーワードを
音声入力するだけで発信が可能となるからである。
【0032】従って、しきい値CTHを0以上Np未満の
適当な値に設定することが望ましいであろう。例えば、
キーワード「あいうえお」に対してしきい値CTH=2と
設定しておけば、「あ、う、お」が完全一致していれ
ば、「い、え」の識別コードが不一致であっても、発信
制限を解除することができるからである。
【0033】このように、しきい値CTHを大きく設定す
れば、本人以外の者が使える可能性は小さくなるが、本
人さえも拒絶される可能性が高くなる。逆に、しきい値
THを小さく設定すれば、本人以外の者が発信制限を解
除する可能性が高くなる。従ってユーザの使用環境等を
考慮して適切なしきい値CTHを設定すればよい。逆に言
えば、しきい値CTHが所望値に設定可能であることで、
その設定の仕方によって様々な使い方が可能になるとい
う効果が生じる。
【0034】(メッセージ生成)図6は、本発明による
通信方法の第2実施形態であるメッセージ生成方法を示
すフローチャートである。上述したように、認識コード
の群コードにより入力音声の語を特定できるから、例え
ば選択呼出受信機(ページャ)へのメッセージ作成に音
声入力を利用することができる。先ず、携帯電話をメッ
セージ作成モードにしておき、マイクロフォン107を
通して音声でメッセージを入力する。入力音声ベクトル
は、上述したように、ベクトル比較部110に取り込ま
れ(S501)、音声コードブック111のコードベク
トルと比較されることで入力音声コードが生成される
(S502)。音声コード処理部103は、入力音声コ
ードから群コードを抽出して入力語を特定し(S50
3)、携帯電話制御プロセッサ102へ送出する。携帯
電話制御プロセッサ102は群コードに基づいて入力語
を表示部115へ表示させる(S504)。
【0035】こうして音声入力された語が表示部115
に表示されると、その表示メッセージを送信してよいか
否かを示す指令がユーザによってキー入力されるのを待
機する(S505)。送信文字の追加あるいは修正があ
る場合には(S505のNO)、次の語の入力を待機す
る。キー入力部116から入力されれば、そのキー入力
文字を表示部115に表示するステップS504へ戻
り、音声入力があれば上述したステップS501へ戻
る。以上のステップを繰り返すことで送信メッセージが
完成すると(S505のYES)、携帯電話制御プロセ
ッサ102は送受信器101を通してそのメッセージを
宛先のページャへ送信する(S507)。
【0036】このように音声認識機能を送信メッセージ
作成に利用し、音声入力ができない記号などはキー入力
によって挿入あるいは追加することで、キー入力の煩雑
さを軽減することができる。
【0037】図7は、上記メッセージ生成方法により生
成された選択呼出信号の一例を示すフォーマット図であ
る。選択呼出信号は呼出番号部601とそれに続くデー
タ部602からなり、データ部602に上記メッセージ
が音声コードとして格納される。図中のデータ部602
には、「000102・・・」というコードが乗せられ
ているから、「あいう・・・」というメッセージが送信
されることになる。
【0038】(音声変更制御)図8は、本発明による通
信方法の第3実施形態である音声変更方法を示すフロー
チャートである。上述したように、音声コード処理部1
03において、識別コードのみを別のものに変換するこ
とで音声変更が可能となる。まず、マイクロフォン10
7を通して入力された入力音声ベクトルは、上述したよ
うに、ベクトル比較部110に取り込まれ(S70
1)、音声コードブック111のコードベクトルと比較
される(S702)。こうして入力音声ベクトルに最も
近いコードベクトルが選択され、通常の群コード及び識
別コードが特定される(S703)。音声コード処理部
103は、この通常の群コート及び識別コードを基準と
して同一の群コードにおける異なる識別コードを選択し
て携帯電話制御プロセッサ102へ出力し、その辺抗さ
れた音声データが送信される(S704、S705)。
即ち、同じ音節で異なる声の音声コードが送信されるこ
ととなる。例えば、音声コードを周波数の低い方向にシ
フトさせるように設定すれば、女性の声を男性の声に変
更することも可能となり、イタズラ電話撃退機能として
利用することができる。
【0039】ベクトル比較部110におけるコードベク
トルの選択は携帯電話制御プロセッサ102によって制
御することも可能であるから、携帯電話がボイスチェン
ジモードに設定されると、携帯電話制御プロセッサ10
2は、ベクトル比較部110に対して、入力音声ベクト
ルに最も近いコードベクトルを選択する通常モードでは
なく、同一の語に対して全く別の音声のコードベクトル
を選択するように設定することもできる。
【0040】(選択呼出受信機)図9は、本発明による
通信装置の第2実施形態である選択呼出受信機の概略的
構成を示すブロック図である。アンテナを通して受信さ
れた無線信号は無線部801によって復調され、ベース
バンド信号がデコーダ802へ出力される。デコーダ8
02はベースバンド信号を復号化し、復号化された受信
信号の選択呼出番号がID−ROM803に格納されて
いる自己の識別番号と一致するならば、それに続くデー
タ部の信号を受信データとしてプロセッサ804へ出力
する。
【0041】プロセッサ804には群コードブック80
5及びメッセージメモリ806が接続されており、群コ
ードブック805に格納された群コードを参照して受信
データの解読を行う。例えば、図7に示すようなデータ
「000102・・・」であれば、「あいう・・・」と
いうメッセージを得ることができる。こうして解読され
たメッセージはメッセージメモリ806に格納される。
群コードブック805には群コードだけが格納されてい
ればよいから、大きなメモリ空間を必要としない。
【0042】また、プロセッサ804はデコーダ802
において自機の呼出を検出すると、音、振動あるいは光
の点滅等を発生する報知部807を駆動してユーザに着
信を報知する。受信メッセージはLCD等の表示部80
8に表示され、報知停止、その他指令はキー入力部80
9を通して行われる。このようにして、図6で説明した
ような携帯電話の音声認識機能を利用して生成したメッ
セージを選択呼出受信機で受信し、そのメッセージを表
示することができる。
【図面の簡単な説明】
【図1】本発明による通信装置の第1実施形態である携
帯電話装置の概略的構成を示すブロック図である。
【図2】本発明で採用された音声のベクトルコード化を
説明するための模式図である。
【図3】本発明において使用される音声コードブックの
内容を説明するための模式図である。
【図4】本発明における入力音声とコード化された認識
コードとの関係を説明するための2つの例を示す模式図
である。
【図5】本発明による通信方法の第1実施形態である発
信制限方法を示すフローチャートである。
【図6】本発明による通信方法の第2実施形態であるメ
ッセージ生成方法を示すフローチャートである。
【図7】図6に示すメッセージ生成方法により生成され
た選択呼出信号の一例を示すフォーマット図である。
【図8】本発明による通信方法の第3実施形態である音
声変更方法を示すフローチャートである。
【図9】本発明による通信装置の第2実施形態である選
択呼出受信機の概略的構成を示すブロック図である。
【符号の説明】
101 送受信器 102 携帯電話制御プロセッサ102 103 音声コード処理部 104 ベクトル再生部 105 D/A変換器 106 スピーカ 107 マイクロフォン 108 A/D変換器 109 ベクトル量子化部 110 ベクトル比較部 111 音声コードブック 112 RAM 113 ROM 114 コード比較部 115 表示部 116 キー入力部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年4月5日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 音声認識機能を有する通信装置及び通
信方法
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は携帯電話機などの通
信装置に係り、特に音声認識機能を有する通信装置及び
通信方法に関する。
【0002】
【従来の技術】日本国内の携帯電話は現在PDC(Pers
onal Digital Cellular)方式が主流であり、フルレー
トの音声符号化方式としてはVSELP(Vector Sum E
xcitedLinear Prediction)方式、ハーフレートではP
SI−CELP(Code ExcitedLinear Prediction)方
式が採用されている。これらの音声符号化方式では、入
力音声を予め用意された音声コードブックと比較するこ
とで入力音声に最も近いコードを選択し、その選択され
たコードを相手側へ送信する。受信側では、同じコード
ブックを用意して受信コードを音声として再生してい
る。
【0003】このようなPDC方式の携帯電話には、そ
の所持者本人以外の者が発信できないようにする発信制
限機能を有する者が提案されている。特に、特開昭61
−245785号公報及び特開平2−34078号公報
には、音声認識により発信制限を行う電話装置が開示さ
れている。例えば、特開平2−34078号公報に開示
された発信規制装置付電話機では、発声したパスワード
を予め登録しておき、同一音声で同一パスワードが入力
されたときに発信制限が解除される。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来技術ではどのように同一音声と判定するのかが明記さ
れていない。登録音声データと入力音声データとの完全
一致を判定基準にすれば膨大なデータ量となってしま
う。また、完全に同一の音声周波数を発声することは本
人でも不可能に近い。
【0005】本発明の目的は、大きなメモリ空間を必要
とせず少ないデータ量で、且つ所望の精度を有する音声
比較判定を行い発振規制を行うための方法及びその方法
を用いた通信装置を提供することにある。
【0006】更に、本発明の他の目的は、音声符号化に
コードベクトルを利用することで、更に、簡易なデータ
入力及び音声変更などの種々の機能を併せ備えた通信装
置及び通信方法を提供することにある。
【0007】
【課題を解決するための手段】本発明による音声符号化
にコードベクトルを利用した通信装置は、音声入力手段
と、複数のコードベクトルを格納した第1記憶手段と、
複数のコードベクトルを参照することで入力音声をコー
ド化し、入力音声コードを生成するコード化手段と、
限個の音節からなる所定の入力音声から生成された所定
入力音声コードを格納する第2記憶手段と、判定用の
入力音声から生成された判定入力音声コードと所定入力
音声コードとを比較し、それらの一致の程度と所望レベ
ルに設定可能な所定基準との比較結果に基づいて前記判
定入力音声コードの真偽を判定する判定手段と、からな
ることを特徴とする。
【0008】判定入力音声コードと所望入力音声コード
との一致の程度と所望レベルに設定可能な基準との比較
結果に基づいて判定入力音声コードの真偽を判定するた
めに、所望基準の選択によって使用形態等に応じた適切
な判定精度に設定することができる。
【0009】また、通常は発信制限状態に設定されてお
り、判定手段により判定入力音声コードが真であると判
定されたときに発信制限が解除されるように判定結果を
利用することができる。所望基準の選択によって発信制
限を厳格にしたり緩和したりすることが可能となる。
【0010】これに加えて、本発明による通信装置は、
送信手段、音声入力手段、キー入力手段、及び表示手段
を有し、更に、各々が音節の種類を示す群コードと音声
の相違を示す識別コードとを含む複数のコードベクトル
を格納する記憶手段と、複数のコードベクトルを参照す
ることで入力音声をコード化し群コード及び識別コード
からなる入力音声コードを生成するコード化手段と、入
力音声コードの群コードに対応する文字を送信メッセー
ジとして表示手段に表示し送信メッセージを送信手段を
通して送信する制御手段と、を有していて、送信メッセ
ージを音声入力により作成できるために、キー入力の煩
雑さを軽減できる。
【0011】更にまた、本発明による通信装置は、音声
入力手段と、各々が音節の種類を示す群コードと音声の
相違を示す識別コードとを含む複数のコードベクトルを
格納する記憶手段と、複数のコードベクトルを参照する
ことで入力音声に最も近い第1コードベクトルとは識別
コードが異なる第2コードベクトルを選択し、その第2
コードベクトルに従って入力音声コードを生成するコー
ド化手段と、入力音声コードを音声情報として送信する
送信手段と、からなることを特徴とする。
【0012】入力音声に最も近い第1コードベクトルと
は識別コードが異なる第2コードベクトルを選択して送
信することで、音声を変更した音声通信が可能となり、
例えばイタズラ電話の撃退などに利用することができ
る。
【0013】
【実施の形態】図1は、本発明による通信装置の第1実
施形態である携帯電話装置の概略的構成を示すブロック
図である。同図において、送受信器101はアンテナに
接続された送信電力アンプや受信アンプ及びモデム(変
復調器)などを含み、携帯電話制御プロセッサ102は
携帯電話のチャネル制御、後述する発信制限制御を含む
種々の制御などプログラム制御により実行する。即ち、
携帯電話制御プロセッサ102は、ROM(不図示)に
格納された制御プログラムを実行することで携帯電話装
置全体の動作制御を行う。携帯電話制御プロセッサ10
2は受信データに含まれる音声コードを音声コード処理
部103へ出力し、逆に音声コード処理部103からの
送信音声コードを入力して送信データを生成する。
【0014】音声コード処理部103は無線シーケンス
に従ったデータと後述する音声コード(群+識別コー
ド)との間の変換を行い、受信音声コードをベクトル再
生部104へ出力する。ベクトル再生部104は音声コ
ードブック111に予め格納されたコードベクトルを参
照しながら受信音声コードを音声ベクトルに変換する。
こうして再生された受信音声ベクトルはデジタル/アナ
ログ(D/A)変換器105によってアナログ音声信号
に変換され、スピーカ106によって音声として出力さ
れる。また、マイクロフォン107によって入力された
音声信号はA/D変換器108によってデジタル音声信
号に変換され、ベクトル量子化部109によってベクト
ル量子化され、その音声ベクトルがベクトル比較部11
0へ出力される。
【0015】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。音声
コード処理部103は、入力音声コードを無線シーケン
スに従ったデータに変換するが、その際、識別コードだ
けを別のコードに変更することで、同一の語に対して全
く別の音声のコードベクトルを生成して送信することも
できる。この場合、入力音声と同じ言葉が全く異なる音
声、言い換えれば別人により入力されたことと同じにな
る。このような音声変更機能は、ベクトル比較部110
により実現することもできる。
【0016】同時に、ベクトル比較部110で生成され
た入力音声コードは音声比較部へ出力される。音声比
較部はメモリ(RAM)112、読み出し専用メモリ
(ROM)113及びコード比較部114からなる。R
OM113には発信制限を解除するためのパスワードあ
るいはキーワードの音声コードが予め登録されている。
RAM112には送信すべき入力音声コードが格納され
る。コード比較部114は入力音声コードと登録キーワ
ードコードとを比較し、その比較結果を携帯電話制御プ
ロセッサ102へ出力する。携帯電話制御プロセッサ1
02は、後述するように、入力音声コードと登録キーワ
ードコードとの比較結果によって、発信制限を解除する
か拒否するかを判定する。なお、コード比較部114は
携帯電話制御プロセッサ102が実行する制御プログラ
ムにより実現することもできる。
【0017】携帯電話制御プロセッサ102には、必要
な情報を表示するための液晶ディスプレイ等の表示部1
15及びダイヤリングのためのテンキーやその他機能キ
ーを含むキー入力部116が接続されている。後に詳述
するように、ベクトル比較部110によって入力音声の
語を特定できるから、例えば選択呼出受信機(ページ
ャ)へのメッセージ作成に音声入力を利用することがで
きる。具体的には、マイクロフォン107を通して音声
でメッセージを入力し、そのメッセージを表示部115
へ表示した後、キー入力部116のキー操作によって修
正することも可能となる。
【0018】なお、上述した本発明による携帯電話機
は、ハードウエアとしては既存の携帯電話機にRAM1
12及びROM113のメモリ空間とコード比較部11
4とを追加するだけで実現することができる。その他の
回路は既存の携帯電話機に本来装備されているものなの
で、少ない回路を追加するだけで実現することができ
る。
【0019】(ベクトルコード化)図2は本発明におい
て採用された音声のベクトルコード化を説明するための
模式図であり、図3は音声コードブック111の格納内
容を説明するための模式図である。マイクロフォン10
7によって入力されたアナログ音声信号はA/D変換器
108によってデジタル信号に変換され、ベクトル量子
化部109によって入力音声に対応したベクトル量(入
力音声ベクトル)に変換される。
【0020】ベクトル比較部110は、音声コードブッ
ク111に格納されたコードベクトルと入力音声ベクト
ルとを比較し、入力音声ベクトルに最も近いコードベク
トルを選択し、そのコードベクトルのコードを入力音声
コードとして音声コード処理部103へ出力する。例え
ば、図2に示すように、入力音声ベクトル201及び2
02が「あ群No.126」のコードベクトル203の
領域に含まれる場合には、これらの入力音声ベクトルは
共に1つの入力音声コードとして出力される。
【0021】音声コードブック111では、図3に示す
ように、日本語における47種の音節(いわゆる50
音)にそれぞれ群コードが割り当てられ、各群における
複数の異なる音声ベクトルにそれぞれ識別コードが割り
当てられている。例えば、10進表示すれば、あ群には
「00」が、い群には「01」が、・・・というように
群コードが割り当てられ、同じ「あ」の発声でも識別コ
ード「001」の音声と「002」の音声とは異なって
いる。
【0022】図4(A)に示すように、ある人の「あ」
の発声に対して、その入力音声ベクトルに最も近いコー
ドベクトル301(ここでは、コード「00126」の
コードベクトル)が選択されたとすると、群コード「0
0」によって音節「あ」であることが特定でき、更に識
別コード「126」によって音声を特定することができ
る。この認識コード「00126」が入力音声コードと
して音声コード処理部103へ出力される。
【0023】他方、図4(B)に示すように、別の人の
「あ」の発声に対して、その入力音声ベクトルに最も近
いコードベクトル302(ここでは、コード「0001
8」のコードベクトル)が選択された場合には、群コー
ド「00」で音節「あ」であることが、更に識別コード
「018」で音声をそれぞれ特定することができる。こ
の認識コード「00018」が入力音声コードとして音
声コード処理部103へ出力される。
【0024】(発信制限の設定)先ず、携帯電話に発信
制限を設定する場合には、その携帯電話の所有者(以
下、本人という。)はキー入力部116を通して携帯電
話を発信制限設定モードに切り替える。これによって携
帯電話制御プロセッサ102はROM113を書き換え
モードに設定する。そして、本人自身の声で所望の語数
Npのキーワードあるいはパスワードをマイクロフォン
107に向かって発声する。有限個の音節からなる、
えば5音節のキーワード「あいうえお」を発声すると、
上述したように、各音節毎に対応する最も近いコードベ
クトルが選択され、入力音声コードが生成される。この
5つの入力音声コードが登録キーワードコードとしてそ
の語数Npと共にROM113に登録される。
【0025】その際、発信制限を解除するための条件を
キー入力部116を通して設定しておくことが望まし
い。本実施形態では、後述するように、音声入力キーワ
ードの完全一致数のしきい値CTHを設定し、その値の
大きさによって発信制限を厳格にしたり緩和したりする
ことが可能となる。
【0026】(発信制限の解除)図5は、本発明による
通信方法の第1実施形態における発信制限方法を示すフ
ローチャートである。発信制限を解除するには、先ず、
キー入力部116を通して携帯電話を発信制限解除モー
ドに切り替えると、携帯電話制御プロセッサ102は入
力語数を示す変数W及び完全一致数Cを初期化する(ス
テップS401)。そして、ユーザは発信制限の設定と
同じ手順でマイクロフォン107に向かってNp個の語
からなるキーワードを発声する。
【0027】携帯電話制御プロセッサ102は、これら
入力音声コードをRAM112へ格納すると、その入力
音声コードとROM113に格納されている登録キーワ
ードの音声コードとをコード比較部114へ語単位で出
力すると共に入力語数Wをインクリメント(歩進)する
(ステップS402及びS403)。そしてコード比較
部114によって入力音声コードと登録キーワードコー
ドとが比較され(S404)、群コード及びそれに続く
識別コードが共に一致すれば(ステップS405及びS
406のYES)、完全一致数Cをインクリメントする
(ステップS407)。
【0028】群コードが不一致であれば(S405のN
O)、キーワード自体が異なるわけであるから即座に発
信制限解除が拒否される(ステップS411)。群コー
ドは一致するが識別コードが不一致であれば(ステップ
S406のNO)、完全一致数Cはインクリメントしな
い。以上のステップS402〜S407を入力語数Wが
所定語数Npに到達するまで繰り返す(ステップS40
8のNO)。
【0029】こうして入力語数Wが登録された所望語数
Npに到達すると(S408のYES)、カウントされ
た完全一致数Cを予め設定されたしきい値CTHと比較
する(ステップS409)。完全一致数Cがしきい値C
TH以上であれば(S409のYES)、正しいキーワ
ードが本人によって音声入力されたものと判断され、発
信制限が解除される(ステップS410)。従って、ユ
ーザはキー入力部116からダイヤリングにすることで
発信することができる。逆に、完全一致数Cがしきい値
CTHより小さい場合には(S409のNO)、キーワ
ードは正しくとも本人以外の者によって音声入力された
と判断され、発信制限の解除要求は拒否される(ステッ
プS411)。従って、ユーザは発信することができな
い。
【0030】しきい値CTHをキーワード語数Npと等
しく設定することはある困難をもたらす。全ての語に対
して群コード及び識別コードの両方が完全に一致するこ
とは、たとえ本人であっても容易ではなく、本人でも発
信制限を解除できない場合が生じ得るからである。逆に
言えば、常に同一の発声ができるという自信がある者に
は極めて有用な設定であろう。
【0031】しきい値CTH=0に設定することは、あ
る意味で有用である。例えば、特定の者にキーワードを
教えておけば、その本人以外の者でも正しいキーワード
を音声入力するだけで発信が可能となるからである。
【0032】従って、しきい値CTHを0以上Np未満
の適当な値に設定することが望ましいであろう。例え
ば、キーワード「あいうえお」に対してしきい値CTH
=2と設定しておけば、「あ、う、お」が完全一致して
いれば、「い、え」の識別コードが不一致であっても、
発信制限を解除することができるからである。
【0033】このように、しきい値CTHを大きく設定
すれば、本人以外の者が使える可能性は小さくなるが、
本人さえも拒絶される可能性が高くなる。逆に、しきい
値CTHを小さく設定すれば、本人以外の者が発信制限
を解除する可能性が高くなる。従ってユーザの使用環境
等を考慮して適切なしきい値CTHを設定すればよい。
逆に言えば、しきい値CTHが所望値に設定可能である
ことで、その設定の仕方によって様々な使い方が可能に
なるという効果が生じる。
【0034】(メッセージ生成)図6は、本発明による
通信方法の第2実施形態として付加されているメッセー
ジ生成方法を示すフローチャートである。上述したよう
に、認識コードの群コードにより入力音声の語を特定で
きるから、例えば選択呼出受信機(ページャ)へのメッ
セージ作成に音声入力を利用することができる。先ず、
携帯電話をメッセージ作成モードにしておき、マイクロ
フォン107を通して音声でメッセージを入力する。入
力音声ベクトルは、上述したように、ベクトル比較部1
10に取り込まれ(S501)、音声コードブック11
1のコードベクトルと比較されることで入力音声コード
が生成される(S502)。音声コード処理部103
は、入力音声コードから群コードを抽出して入力語を特
定し(S503)、携帯電話制御プロセッサ102へ送
出する。携帯電話制御プロセッサ102は群コードに基
づいて入力語を表示部115へ表示させる(S50
4)。
【0035】こうして音声入力された語が表示部115
に表示されると、その表示メッセージを送信してよいか
否かを示す指令がユーザによってキー入力されるのを待
機する(S505)。送信文字の追加あるいは修正があ
る場合には(S505のNO)、次の語の入力を待機す
る。キー入力部116から入力されれば、そのキー入力
文字を表示部115に表示するステップS504へ戻
り、音声入力があれば上述したステップS501へ戻
る。以上のステップを繰り返すことで送信メッセージが
完成すると(S505のYES)、携帯電話制御プロセ
ッサ102は送受信器101を通してそのメッセージを
宛先のページャへ送信する(S507)。
【0036】このように音声認識機能を送信メッセージ
作成に利用し、音声入力ができない記号などはキー入力
によって挿入あるいは追加することで、キー入力の煩雑
さを軽減することができる。
【0037】図7は、上記メッセージ生成方法により生
成された選択呼出信号の一例を示すフォーマット図であ
る。選択呼出信号は呼出番号部601とそれに続くデー
タ部602からなり、データ部602に上記メッセージ
が音声コードとして格納される。図中のデータ部602
には、「000102・・・」というコードが乗せられ
ているから、「あいう・・・」というメッセージが送信
されることになる。
【0038】(音声変更制御)図8は、本発明による通
信方法の第3実施形態として付加されている音声変更方
法を示すフローチャートである。上述したように、音声
コード処理部103において、識別コードのみを別のも
のに変換することで音声変更が可能となる。まず、マイ
クロフォン107を通して入力された入力音声ベクトル
は、上述したように、ベクトル比較部110に取り込ま
れ(S701)、音声コードブック111のコードベク
トルと比較される(S702)。こうして入力音声ベク
トルに最も近いコードベクトルが選択され、通常の群コ
ード及び識別コードが特定される(S703)。音声コ
ード処理部103は、この通常の群コート及び識別コー
ドを基準として同一の群コードにおける異なる識別コー
ドを選択して携帯電話制御プロセッサ102へ出力し、
その辺抗された音声データが送信される(S704、S
705)。即ち、同じ音節で異なる声の音声コードが送
信されることとなる。例えば、音声コードを周波数の低
い方向にシフトさせるように設定すれば、女性の声を男
性の声に変更することも可能となり、イタズラ電話撃退
機能として利用することができる。
【0039】ベクトル比較部110におけるコードベク
トルの選択は携帯電話制御プロセッサ102によって制
御することも可能であるから、携帯電話がボイスチェン
ジモードに設定されると、携帯電話制御プロセッサ10
2は、ベクトル比較部110に対して、入力音声ベクト
ルに最も近いコードベクトルを選択する通常モードでは
なく、同一の語に対して全く別の音声のコードベクトル
を選択するように設定することもできる。
【0040】(選択呼出受信機)図9は、本発明による
通信装置に関連した選択呼出受信機の概略的構成を示す
ブロック図である。アンテナを通して受信された無線信
号は無線部801によって復調され、ベースバンド信号
がデコーダ802へ出力される。デコーダ802はベー
スバンド信号を復号化し、復号化された受信信号の選択
呼出番号がID−ROM803に格納されている自己の
識別番号と一致するならば、それに続くデータ部の信号
を受信データとしてプロセッサ804へ出力する。
【0041】プロセッサ804には群コードブック80
5及びメッセージメモリ806が接続されており、群コ
ードブック805に格納された群コードを参照して受信
データの解読を行う。例えば、図7に示すようなデータ
「000102・・・」であれば、「あいう・・・」と
いうメッセージを得ることができる。こうして解読され
たメッセージはメッセージメモリ806に格納される。
群コードブック805には群コードだけが格納されてい
ればよいから、大きなメモリ空間を必要としない。
【0042】また、プロセッサ804はデコーダ802
において自機の呼出を検出すると、音、振動あるいは光
の点滅等を発生する報知部807を駆動してユーザに着
信を報知する。受信メッセージはLCD等の表示部80
8に表示され、報知停止、その他指令はキー入力部80
9を通して行われる。このようにして、図6で説明した
ような本発明の携帯電話の音声認識機能を利用して生成
したメッセージを選択呼出受信機で受信し、そのメッセ
ージを表示することができる。
【図面の簡単な説明】
【図1】本発明による通信装置の第1実施形態である携
帯電話装置の概略的構成を示すブロック図である。
【図2】本発明で採用された音声のベクトルコード化を
説明するための模式図である。
【図3】本発明において使用される音声コードブックの
内容を説明するための模式図である。
【図4】本発明における入力音声とコード化された認識
コードとの関係を説明するための2つの例を示す模式図
である。
【図5】本発明による通信方法の第1実施形態である発
信制限方法を示すフローチャートである。
【図6】本発明による通信方法の第2実施形態に係る
ッセージ生成方法を示すフローチャートである。
【図7】図6に示すメッセージ生成方法により生成され
た選択呼出信号の一例を示すフォーマット図である。
【図8】本発明による通信方法の第3実施形態に係る
声変更方法を示すフローチャートである。
【図9】本発明による通信装置に関連する選択呼出受信
機の概略的構成を示すブロック図である。
【符号の説明】 101 送受信器 102 携帯電話制御プロセッサ102 103 音声コード処理部 104 ベクトル再生部 105 D/A変換器 106 スピーカ 107 マイクロフォン 108 A/D変換器 109 ベクトル量子化部 110 ベクトル比較部 111 音声コードブック 112 RAM 113 ROM 114 コード比較部 115 表示部 116 キー入力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G10L 9/00 G10L 9/00 N 9/18 9/18 E H04B 14/04 H04B 14/04 Z H04M 1/66 H04M 1/66 A

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声符号化にコードベクトルを利用した
    通信装置において、 音声入力手段と、 複数のコードベクトルを格納した第1記憶手段と、 前記複数のコードベクトルを参照することで入力音声を
    コード化し、入力音声コードを生成するコード化手段
    と、 所定の入力音声から生成された所定入力音声コードを格
    納する第2記憶手段と、 判定用の入力音声から生成された判定入力音声コードと
    前記所定入力音声コードとを比較し、それらの一致の程
    度と所定基準との比較結果に基づいて前記判定入力音声
    コードの真偽を判定する判定手段と、 からなることを特徴とする通信装置。
  2. 【請求項2】 前記所定基準は所望レベルに設定可能で
    あることを特徴とする請求項1記載の通信装置。
  3. 【請求項3】 前記通信装置は、通常、発信制限状態に
    設定されており、前記判定手段により前記判定入力音声
    コードが真であると判定されたときに前記発信制限を解
    除することを特徴とする請求項1又は2記載の通信装
    置。
  4. 【請求項4】 前記複数のコードベクトルの各々は、音
    節の種類を示す群コードと音声の相違を示す識別コード
    とを含み、 前記コード化手段は前記群コードと前記識別コードから
    なる入力音声コードを生成することを特徴とする請求項
    1ないし3のいずれかに記載の通信装置。
  5. 【請求項5】 音声符号化にコードベクトルを利用した
    通信装置において、 送信手段と、 音声入力手段と、 キー入力手段と、 表示手段と、 各々が音節の種類を示す群コードと音声の相違を示す識
    別コードとを含む複数のコードベクトルを格納する記憶
    手段と、 前記複数のコードベクトルを参照することで入力音声を
    コード化し、群コード及び識別コードからなる入力音声
    コードを生成するコード化手段と、 前記入力音声コードの群コードに対応する文字を送信メ
    ッセージとして前記表示手段に表示し、前記送信メッセ
    ージを前記送信手段を通して送信する制御手段と、 からなることを特徴とする通信装置。
  6. 【請求項6】 前記表示手段に表示された送信メッセー
    ジは、前記音声入力手段及び前記キー入力手段のいずれ
    かを通して変更可能であることを特徴とする請求項5記
    載の通信装置。
  7. 【請求項7】 所望の入力音声から生成された所望入力
    音声コードを格納する第2記憶手段と、 判定用の入力音声から生成された判定入力音声コードと
    前記所望入力音声コードとを比較し、それらの一致の程
    度と所望基準との比較結果に基づいて前記判定入力音声
    コードの真偽を判定する判定手段と、 を更に有し、 通常は送信制限状態に設定されており、前記判定手段に
    より前記判定入力音声コードが真であると判定されたと
    きに前記送信制限状態を解除することを特徴とする請求
    項5又は6記載の通信装置。
  8. 【請求項8】 音声符号化にコードベクトルを利用した
    通信装置において、音声入力手段と、 各々が音節の種類を示す群コードと音声の相違を示す識
    別コードとを含む複数のコードベクトルを格納する記憶
    手段と、 前記複数のコードベクトルを参照することで前記入力音
    声に最も近い第1コードベクトルとは前記識別コードが
    異なる第2コードベクトルを選択し、その第2コードベ
    クトルに従って入力音声コードを生成するコード化手段
    と、 前記入力音声コードを音声情報として送信する送信手段
    と、 からなることを特徴とする通信装置。
  9. 【請求項9】 所望の入力音声から生成された所望入力
    音声コードを格納する第2記憶手段と、 判定用の入力音声から生成された判定入力音声コードと
    前記所望入力音声コードとを比較し、それらの一致の程
    度と所望基準との比較結果に基づいて前記判定入力音声
    コードの真偽を判定する判定手段と、 を更に有し、 通常は送信制限状態に設定されており、前記判定手段に
    より前記判定入力音声コードが真であると判定されたと
    きに前記送信制限状態を解除することを特徴とする請求
    項8記載の通信装置。
  10. 【請求項10】 音声符号化にコードベクトルを利用し
    た通信装置の通信方法において、 複数のコードベクトルを格納し、 前記複数のコードベクトルを参照することで入力音声に
    対応した入力音声コードを生成し、 所望の入力音声から生成された所望入力音声コードを格
    納し、 判定用の入力音声から生成された判定入力音声コードと
    前記所望入力音声コードとを比較し、 前記判定入力音声コードと前記所望入力音声コードとの
    一致の程度と所望基準との比較結果に基づいて前記判定
    入力音声コードの真偽を判定し、 前記判定結果に従って発信制限の解除制御を行う、 ことを特徴とする通信方法。
  11. 【請求項11】 音声符号化にコードベクトルを利用し
    た通信装置の通信方法において、 各々が音節の種類を示す群コードと音声の相違を示す識
    別コードとを含む複数のコードベクトルを格納し、 前記複数のコードベクトルを参照することで入力音声に
    対応した群コード及び識別コードからなる入力音声コー
    ドを生成し、 前記入力音声コードの群コードに対応する文字を送信メ
    ッセージとして表示し、 前記送信メッセージを送信する、 ことを特徴とする通信方法。
  12. 【請求項12】 音声符号化にコードベクトルを利用し
    た通信装置の通信方法において、 各々が音節の種類を示す群コードと音声の相違を示す識
    別コードとを含む複数のコードベクトルを格納し、 前記複数のコードベクトルを参照することで前記入力音
    声に最も近い第1コードベクトルとは前記識別コードが
    異なる第2コードベクトルを選択し、 前記第2コードベクトルに従って入力音声コードを生成
    し、 前記入力音声コードを音声情報として送信する、 ことを特徴とする通信方法。
JP02050198A 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法 Expired - Fee Related JP3507686B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP02050198A JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法
US09/231,633 US6249759B1 (en) 1998-01-16 1999-01-15 Communication apparatus using speech vector comparison and recognition
GB9900922A GB2334864B (en) 1998-01-16 1999-01-15 Communication apparatus
AU12116/99A AU747731B2 (en) 1998-01-16 1999-01-15 Communication apparatus using speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02050198A JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法

Publications (2)

Publication Number Publication Date
JPH11205867A true JPH11205867A (ja) 1999-07-30
JP3507686B2 JP3507686B2 (ja) 2004-03-15

Family

ID=12028919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02050198A Expired - Fee Related JP3507686B2 (ja) 1998-01-16 1998-01-16 音声認識機能を有する通信装置及び通信方法

Country Status (4)

Country Link
US (1) US6249759B1 (ja)
JP (1) JP3507686B2 (ja)
AU (1) AU747731B2 (ja)
GB (1) GB2334864B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008244690A (ja) * 2007-03-27 2008-10-09 Nec Saitama Ltd 情報処理端末、情報処理端末の制御方法、およびプログラム
JP2018037879A (ja) * 2016-08-31 2018-03-08 Kddi株式会社 通信端末、通信端末を利用した通信方法及び通信プログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000165511A (ja) * 1998-11-26 2000-06-16 Nec Corp 携帯電話機および携帯電話機のダイヤルロック方法
DE10063079A1 (de) * 2000-12-18 2002-07-11 Infineon Technologies Ag Verfahren zum Erkennen von Identifikationsmustern
WO2002077975A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile
CN100403828C (zh) * 2002-10-18 2008-07-16 中国科学院声学研究所 一种便携式数字移动通讯设备及其语音控制方法和系统
US20060052057A1 (en) * 2004-09-03 2006-03-09 Per Persson Group codes for use by radio proximity applications
US7957972B2 (en) * 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
KR100897553B1 (ko) 2007-01-04 2009-05-15 삼성전자주식회사 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치
CN100583649C (zh) * 2007-07-23 2010-01-20 华为技术有限公司 矢量编/解码方法、装置及流媒体播放器
US8615221B1 (en) 2012-12-06 2013-12-24 Google Inc. System and method for selection of notification techniques in an electronic device
US9037455B1 (en) * 2014-01-08 2015-05-19 Google Inc. Limiting notification interruptions
CN105261356A (zh) * 2015-10-30 2016-01-20 桂林信通科技有限公司 一种语音识别系统及方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595916B2 (ja) 1975-02-13 1984-02-07 日本電気株式会社 音声分折合成装置
NL8303649A (nl) * 1983-10-24 1985-05-17 Philips Nv Werkwijze voor het vaststellen van de gebruiksbevoegdheid van een gebruiker van een abonneetoestel voor signaaloverdracht.
JPS61245785A (ja) 1985-04-24 1986-11-01 Nec Corp 音声認識により市外発信規制解除を行うボタン電話装置
JPH0234078A (ja) 1988-07-25 1990-02-05 Toshiba Corp 発信規制装置付電話機
US5167004A (en) * 1991-02-28 1992-11-24 Texas Instruments Incorporated Temporal decorrelation method for robust speaker verification
JPH04343554A (ja) 1991-05-20 1992-11-30 Sony Corp 電話装置
JPH0583359A (ja) 1991-09-19 1993-04-02 Hitachi Ltd 電話機方式
JPH05316203A (ja) 1992-05-11 1993-11-26 Sekisui Chem Co Ltd 発呼者認識電話装置
JP2899485B2 (ja) 1992-08-25 1999-06-02 シャープ株式会社 コードレス電話機
AU670379B2 (en) 1993-08-10 1996-07-11 International Standard Electric Corp. System and method for passive voice verification in a telephone network
WO1995005656A1 (en) 1993-08-12 1995-02-23 The University Of Queensland A speaker verification system
JP3098157B2 (ja) 1994-03-11 2000-10-16 株式会社エヌ・ティ・ティ・データ 話者照合方法及び装置
JPH07273841A (ja) 1994-03-30 1995-10-20 Nippon Telegr & Teleph Corp <Ntt> 声質変換手段付き電話機
JPH07273864A (ja) 1994-04-04 1995-10-20 Victor Co Of Japan Ltd コードレス電話装置
JPH07321945A (ja) 1994-05-25 1995-12-08 Hitachi Ltd 電話機
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JPH0984128A (ja) 1995-09-20 1997-03-28 Nec Corp 音声認識機能を有する通信機器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008244690A (ja) * 2007-03-27 2008-10-09 Nec Saitama Ltd 情報処理端末、情報処理端末の制御方法、およびプログラム
WO2008123223A1 (ja) * 2007-03-27 2008-10-16 Nec Corporation 情報処理端末、情報処理端末の制御方法、およびプログラム
JP2018037879A (ja) * 2016-08-31 2018-03-08 Kddi株式会社 通信端末、通信端末を利用した通信方法及び通信プログラム

Also Published As

Publication number Publication date
GB2334864A (en) 1999-09-01
JP3507686B2 (ja) 2004-03-15
US6249759B1 (en) 2001-06-19
GB2334864B (en) 2000-03-15
AU1211699A (en) 1999-08-05
AU747731B2 (en) 2002-05-23

Similar Documents

Publication Publication Date Title
US4949374A (en) Speech recognition system with an accurate recognition function
KR20080013852A (ko) 이동 단말기의 다중 동작 모드들을 제공하는 방법, 장치,및 컴퓨터 프로그램 생성물
JP3507686B2 (ja) 音声認識機能を有する通信装置及び通信方法
US5182765A (en) Speech recognition system with an accurate recognition function
JP2002540731A (ja) 携帯電話機による使用のための数字列を生成するシステムおよび方法
KR100713368B1 (ko) 이동통신 단말기에서 단축번호를 이용한 콜 발신 방법
US6603985B1 (en) Ringing tone control method and device for mobile communication apparatus
JPH11275651A (ja) 携帯電話機
KR20070018189A (ko) 이동통신단말기에서 수신제한장치 및 방법
JP2003188948A (ja) 携帯端末装置
JPH1075470A (ja) 通信装置
JP4936792B2 (ja) 携帯電話装置
JPH08289005A (ja) パスワード照合方式
KR101085731B1 (ko) 원격으로 이동통신 단말기의 전화번호부를 액세스 할 수있도록 하는 장치 및 방법
JP3119698B2 (ja) コードレス電話機
KR100365777B1 (ko) 전화기에서 전화번호 저장 장치 및 방법
JP2000216858A (ja) 携帯電話装置及びその遠隔個人デ―タ呼出し方法
JPH0730629A (ja) 音声ダイヤリング装置
JP2000184018A (ja) 携帯電話機
JP2002354101A (ja) 移動通信装置
JP2006074828A (ja) 電話装置
JP2000259179A (ja) 音声入力システム
KR20020056219A (ko) 무선전화기의 선택 호출방법
JP2000049905A (ja) 通信端末装置
JPH08317074A (ja) 携帯文字電話装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031219

LAPS Cancellation because of no payment of annual fees