JPH09288495A - ボタン指定・音声認識併用型入力方法及び装置 - Google Patents

ボタン指定・音声認識併用型入力方法及び装置

Info

Publication number
JPH09288495A
JPH09288495A JP8098925A JP9892596A JPH09288495A JP H09288495 A JPH09288495 A JP H09288495A JP 8098925 A JP8098925 A JP 8098925A JP 9892596 A JP9892596 A JP 9892596A JP H09288495 A JPH09288495 A JP H09288495A
Authority
JP
Japan
Prior art keywords
input
voice recognition
voice
button
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8098925A
Other languages
English (en)
Inventor
Masanobu Higashida
正信 東田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8098925A priority Critical patent/JPH09288495A/ja
Publication of JPH09288495A publication Critical patent/JPH09288495A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 より確かな入力文字を認定し、プッシュボタ
ン入力方式の有効性を高めることが可能なボタン指定・
音声認識併用型入力方法及び装置を提供することを目的
とする。 【解決手段】 本発明は、入力の可能性のある記号の種
類の数よりも少ない字種しか指定できない入力装置から
母音列または、子音列の指定を入力し、入力と同時に、
該入力装置に付加された音声入力装置から入力された音
声を入力装置に組み込まれた音声認識装置により認識
し、入力装置から入力された結果と音声認識装置により
認識された結果を照合し、入力された文字を特定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ボタン指定・音声
認識併用型入力方法及び装置に係り、特に、データベー
スに存在するデータを参照する際に、電話機等のように
入力キーの数が少ない装置を使用して迅速、かつ正確に
日本語情報を入力するためのボタン指定・音声認識併用
型入力方法及び装置に関する。
【0002】
【従来の技術】従来の、電話機のように実際の日本語文
字及び英文字の数よりも少ないキーしか持たない入力装
置から日本語の読み情報を入力する方法としては、以下
のような方法がある。
【0003】第1の方法は、「あ」は「あ」が表示され
ているボタンキーを1回、「い」は「あ」が表示さてい
るボタンキーを2回というように、行を指定するボタン
キーを選択してその行を表記するボタンを押す回数で指
定する入力方法がある。例えば、「とうきょう」を入力
するには、「44444(と)111(う)22(き)
888(よ)111(う)」とボタンキーを押す。
【0004】第2の方法は、電話等のようにキーの数が
少ない入力装置の場合は、「01」が「あ」、「02」
が「い」といったようにそれぞれの文字を数字2桁を用
いて記号化し、「あい」は「0102」のようにコード
化して入力している。例えば、「とうきょう」を入力す
る場合は、「45(と)13(う)22(き)83
(よ)13(う)」とボタンキーを押す。
【0005】第3の方法は、「ひかり49号」が「12
34」、「東京駅」が「9876」等のように、複合
語、単語等を一つの数字に対応させてコード化し、日本
語情報を投入する等により日本語文字列を投入してい
る。上記の方法は、日本語文字と入力コードとの間に1
対1の対応をつけた入力方式である。また、これらと異
なり、入力自体には曖昧性を許容した以下の方法があ
る。
【0006】第4の方法は、複数の日本語の文字を一つ
のボタンキーに配置した装置から「とやま」と「48
7」のようにそれぞれの文字が表示されたボタンキーを
一度づつ押下することで、日本語文字列を入力し、この
結果、入力文字列に曖昧さが生じた場合には(入力され
た数字が「487」である場合には、「とやま(富
山)」か「つやま(津山)」かが曖昧になることがあ
る)、システムからの順次確認による確定する方法で入
力する方法もある。
【0007】第5の方法として、入力の可能姓がある記
号種類の数よりも少ない字種しか指定できない入力装置
から記号列を入力し、複数の記号からなる記号列を文字
列に変換し、変換された文字列候補が実在するかを判定
し、文字列候補が複数実在する場合には、利用者に付加
情報を入力させ、入力された付加情報を変換した文字列
候補を一意に特定する方法である。
【0008】第6の方法として、音声識別装置を用いて
「とやま」を発声し、音声認識装置が正確に「とやま」
を認識するまで繰り返し発声を繰り返す方法がある。
【0009】
【発明が解決しようとする課題】しかしながら、上記の
従来の方法には、以下のような問題がある。従来の第1
の方法は、入力する文字を指定する方式であるため、入
力文字の正確性は、保証されている。但し、「あ列」の
文字はボタンキー1回、「い列」の文字列はボタンキー
を2回、「う列」の文字はボタンキー3回、「え列」の
文字列はボタンキーを4回、「お列」の文字はボタンキ
ー5回押すことになり、全ての列の文字が略同頻度で利
用されると仮定すれば、平均のボタンキー押下回数は、
3回となり、ボタンを多く押す必要がある。また、表示
装置がない場合は、ボタンキーを何回押したかわからな
くなることもあり、誤入力を起こす確率が大きくなる。
また、「うえ」のように同じ行の文字を続けて入力する
時には、「う」は「あ行」のボタン3回、「え」は「あ
行」を4回押すことになるが、「あ行」を7回続けて押
すと誤入力となる(「あお」、「いえ」、「うえ」、
「えい」等の可能性がある)ので、「あ行」のボタン3
回押して入力が確定するのを待った後で、「え」の「あ
行」を4回押すことになり、入力に時間がかかることに
なる。
【0010】従来の第2の方法は、文字を2桁の数字列
でコード化する方式でも入力自体の正確性は保証され
る。但し、それぞれの文字に対してコード表を参考にし
て2回づつボタンキーを押下することになるので、入力
時間が長くなる、長い文字列の入力ではボタンの押下回
数が文字数の2倍になるので、入力ミスの確率が増える
等の問題がある。
【0011】従来の第3の方法は、投入する日本語の文
字列に対応して予め数字列にコード化した変換表を参考
にしてコードを求め投入する方法もある。この方法は、
入力する情報毎にコード表を参照することになり、投入
に手間がかかるという問題がある。
【0012】従来の第4の方法の曖昧性を含む入力を許
容して、可能性のある単語候補を順次確認する方法で
は、候補単語の可能性が一意に絞り込めるか、または、
候補数が少ない場合には問題は少ないが、候補単語の数
が多くなると、順次確認に時間がかかり、利用者からみ
た場合、煩わしい入力方法となる。
【0013】従来の第5の方法では、複数の文字列候補
がある場合には利用者に選択させているが、候補が複数
ある場合には、当該候補数分の問い合わせが必要とな
り、利用者の負荷が大きくなる。従来の第6の方法の、
音声認識装置を使用する方法は、認識精度が高い場合は
問題が少ないが、何度発声しても認識がうまくいかない
時などは、極めて煩わしい入力方式となる。現在の認識
精度では、任意の単語を不特定の話者が発声したときの
認識精度は利用者が満足できるレベルには至っていな
い。
【0014】本発明は、上記の点に鑑みなされたもの
で、より確かな入力文字を認定し、プッシュボタン入力
方式の有効性を高めることが可能なボタン指定・音声認
識併用型入力方法及び装置を提供することを目的とす
る。
【0015】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明は、入力の可能性のあ
る記号の種類の数よりも少ない字種しか指定できない入
力装置から母音列または、子音列の指定を入力し、入力
と同時に、該入力装置に付加された音声入力装置から入
力された音声を入力装置に組み込まれた音声認識装置に
より認識し、入力装置から入力された結果と音声認識装
置により認識された結果を照合し、入力された文字を特
定する。
【0016】また、本発明は、入力装置と音声認識装置
による文字入力を連続することにより、複数の文字を文
字列として入力するボタン指定・音声認識併用型入力方
法において、入力装置から入力された結果または、音声
認識装置から入力された結果と、既にデータベースとし
て蓄積されている候補の中の情報と照合することで、入
力情報を確定する。
【0017】また、本発明は、各々のボタンキーに対応
する周波数信号を入力装置からの入力とし、入力された
周波数信号に対応する数字または、記号列を生成し、生
成された数字または、記号列に基づいて数字−単語変換
辞書を参照して、日本語単語候補を出力し、音声認識装
置により入力された音声信号を認識し、認識された文字
候補に順位を付与し、文字候補の順位の高い順に、入力
装置から出力された日本語単語候補と照合し、照合結果
を利用者に提示し、利用者からの応答に応じて該利用者
が入力した文字列を確定する。
【0018】図2は、本発明の原理構成図である。本発
明は、母音列または、子音列の指定により文字列を入力
する指定手段を有し、入力の可能性のある記号の種類の
数よりも少ない字種しか指定できないボタン指定入力装
置と、ボタン指定入力装置からボタン指定による文字列
の入力と同時に入力された音声を認識する音声認識装置
と、音声認識装置が認識した結果と、ボタン指定入力装
置で入力された文字列を照合して入力情報を確定する照
合手段を有する。
【0019】また、本発明は、複数のボタンキーと、複
数のボタンキーに対応する周波数信号を受信する入力信
号受信手段と、入力信号受信手段により入力された周波
数信号に基づいて数字または、記号列を生成し、出力す
る文字列生成手段を含むボタン指定入力装置と、人間が
発声する音声を入力可能とする音声入力手段と、音声入
力手段により入力された音声を認識して認識結果候補を
文字により出力する認識結果候補出力手段とを有する音
声認識装置と、ボタン指定入力装置により出力された文
字列と、認識結果候補出力手段により出力された候補と
を照合し、特定された情報を音声または、文字情報とし
て外部に対して出力/表示する照合結果出力手段とを有
する。
【0020】上記の認識結果候補出力手段は、入力音声
と比較するための音声認識用辞書と、入力音声に基づい
て音声認識用辞書を参照し、優先順に認識文字候補を出
力する出力順位付与手段を含む。
【0021】また、上記の音声認識用辞書は、予め数字
及び記号列と日本語単語との対応関係が格納されている
数字−単語変換情報を含む。また、上記の出力順位付与
手段は、音声認識用辞書を参照して、音声認識装置から
出力された日本語の文字候補の文字列からなる生成可能
な日本語の文字列のうち、数字−単語変換情報に基づい
て日本語の文字列とすることが可能か否かを検証する検
証手段と、検証手段により日本語の文字列となり得る可
能性が高い順に候補を出力する順位付与手段と、順位付
与手段により出力された結果を格納する単語候補格納手
段とを含む。
【0022】また、上記の認識結果候補出力手段は、単
語候補格納手段に格納されている順に利用者に提示する
候補提示手段と、候補提示手段により利用者が入力した
文字列を確定する文字列確定手段とを含む。
【0023】これにより、本発明は、電話機等の0から
9までの10個の数字キーと若干の補助キー(電話機の
場合は*と#)が付加されている装置の各々のキーに複
数の日本語文字(50音)及び英数字を対応させて、数
字と共に、文字を表示し、利用者は、表示された文字を
見ながら対応するボタンキーを一度づつ押下することに
よりPB入力を行うことで、入力される子音情報と音声
認識結果から想定され得る母音情報との組み合わせの可
能性を評価することで、子音情報から辞書を参照して検
索された可能性のある文字列候補に優先順位を付与し、
より確かな入力文字を認定する。これにより、PB入力
方式の有効性をより高めることが可能となる。
【0024】
【発明の実施の形態】図3は、本発明のボタン指定・音
声認識併用型入力装置の構成を示す。同図に示す装置8
は、入出力端末装置1、入力信号受信部2、音声認識処
理部3、数字−単語変換部4、数字−単語変換辞書5、
単語候補認定処理部6及び対話処理部7より構成され
る。
【0025】入出力端末装置1は、図4に示す構成を有
する。同図にはボタンキーを有する電話機の例を示す。
同図の入出力端末装置1は本装置の利用者のインタフェ
ースを司るインタフェース部11、入出力のキーを信号
化するPB信号入力部12、文字表示部13、利用者と
の対話を行うための送受話器14を有する。
【0026】電話機の場合には、入力部にはプッシュボ
タンキーが使用され、音声の入出力には送話器、受話器
が利用される。入力信号受信部2は、入出力端末装置1
からの入力データを受け取り、数字・記号列に変換する
機能を有する。入出力端末装置1が既存の電話機等を利
用し、データが交換機を経由して送られてくる場合に
は、データは、既に数字列に変換されているので、この
場合には、当該入力信号受信部2は単なるデータバッフ
ァでよいが、入出力端末装置1からのデータを数字列と
して受け取れない場合は、当該入出力端末装置1からの
信号を数字・記号列に変換する機能を含む必要がある。
【0027】音声認識処理部3は、利用者が入力時にボ
タンキーを押下すると同時に、入出力端末装置1の音声
入力装置を介して入力された当該ボタンキーに該当する
音声を認識する。音声認識結果は、ボタンキーの押下操
作に対応した認識結果として優先順位を付与して出力す
る。
【0028】数字−単語変換部4は、与えられた数字・
記号列をキーとして数字・記号列を数字−単語変換辞書
5を参照して対応する日本語の単語に変換する。対応す
る日本語単語が複数ある場合は、それら全てを抽出す
る。数字−単語変換辞書5は、対象とする業務に対応し
て、当該業務に使用される単語と当該単語に対応する数
字・記号列を対にして格納する。
【0029】単語候補認定処理部6は、数字−単語変換
部4及び音声認識処理部3から転送された情報に基づい
て、情報入力を当初利用者が意図した入力データに絞り
込む処理を行う。数字−単語変換部4からの情報だけで
入力データを一意に絞り込むことができた場合には、音
声認識情報との照合で確認した後、対話処理部7を介し
て確認対話を実行する。候補が複数ある場合には、入力
数字・記号列に対応する候補単語と音声認識の結果得ら
れる文字単位の認識結果とを照合し、可能性の高い順に
優先順位を付ける。候補が一つの時には、確認処理、複
数ある場合には、優先順位の高い順に順次確認を行う処
理を対話処理部7に依頼する。
【0030】対話処理部7は、単語候補認定処理部6か
ら依頼を受けて、利用者に音声情報で確認をとる。図5
は、本発明の動作の概要を示すフローチャートである。 ステップ101) 入力信号受付部2は、入出力端末装
置1からPB信号を受け付ける。このPB信号を受け付
ける場合には、ボタンキーに対応する周波数信号のDT
MF信号を受信する。
【0031】ステップ102) 入力信号受付部2は、
受信したPB信号に対応する数字または、記号列を生成
し、数字−単語変換部4に転送する。数字−単語変換部
4は、数字列または、記号列に対応する候補単語を抽出
する処理を行う。数字−単語変換部4は、転送された数
字列または記号列をキーとして数字−単語変換辞書5を
参照して対応する単語候補を抽出する。このとき、複数
の候補がある場合にはすべての候補を抽出する。
【0032】ステップ103) 上記のステップ101
と連動して音声認識処理部3は、入出力端末装置1の送
受話器14(音声入力部)から取得した音声を認識す
る。 ステップ104) 音声認識処理部3の音声認識結果の
候補文字列を抽出する。このとき、複数存在する場合に
は、全て抽出する。
【0033】ステップ105) ステップ102で抽出
した数字列に対応する候補単語と、ステップ104にお
いて抽出した音声認識結果の候補文字列を比較・照合す
る。 ステップ106) 照合において、ステップ102にお
いて抽出された単語候補が複数有る場合には、当該単語
候補に優先順位を付与する。また、ステップ104にお
いて抽出された単語候補も同様に優先順位を付与する。
【0034】ステップ107) 候補のうち、所定の閾
値を越えた候補のみを抽出する。 ステップ108) 抽出された候補を利用者に提示す
る。提示方法は、音声による対話を行ってもよいし、表
示機能を有する端末であれば、表示装置に当該候補を表
示するようにしてもよい。
【0035】ステップ109) 利用者から単語候補の
うち、一つの単語候補が指定されると、当該単語候補を
単語として同定する。
【0036】
【実施例】以下、図面と共に、本発明の実施例を説明す
る。図6は、本発明の一実施例のボタン指定・音声認識
併用型入力装置の構成を示す。同図中、図3と同一構成
部分には同一符号を付しその説明を省略する。
【0037】本実施例では、図6において、入出力装置
1は、多機能電話機とし、ボタンキー12、表示装置1
3及び送受話器14が接続されているものとする。ボタ
ンキは、図7に示されるような構成になっている。図7
は、本発明の一実施例の入力装置のボタンキーへの日本
語文字割り当ての例である。同図に示すように、従来の
装置と異なり、一つのキーに複数の日本語文字(50
音)が割り当てられている。
【0038】図7に示すボタンキーの割り当ての例を以
下に示す。図8は、本発明の一実施例の母音列、子音列
を指定するボタンキーの配置の例を示す。同図におい
て、「あ行」がボタンキー“1”に、「か行」がボタン
キー“2”のように、5文字ずつ対応している。また、
「が行」は、「か行」の2の後に濁音を示す「*」を押
下するように設定されている。
【0039】図9は、本発明の一実施例の数字−単語変
換辞書の内容を示す。数字−単語変換辞書5は、入力信
号受信部2から入力されたPB信号に対応する数字・記
号列と対応する日本語単語とを対応づける情報を有する
ものであり、入力数字列、単語候補、音韻表記により構
成され、例えば、周波数信号により“732”が入力さ
れた場合には、単語候補として「みさき」、「みさ
か」、「ましけ」、「まさか」等があり、それぞれの音
韻表記が付与される。
【0040】音声認識用辞書32は、音声認識部3が入
力音声に合致する音声の文字列を生成する際に参照され
る。上記の各構成要素を用いて、前述の図5のフローチ
ャートに従って本実施例の動作を説明する。
【0041】まず、電話機等の入出力端末1から「みさ
き」を入力する場合を考える。利用者は、電話機のボタ
ンキー12から「み」「さ」「き」に対応する「7」
「3」「2」のキーを順次押下すると同時に、各ボタン
キー12を押している間に、送話器14に向かって
「み」「さ」「き」と発音する。
【0042】まず、入力信号受信部2においてボタンキ
ー12から入力された「732」の信号を受け付ける
(ステップ101)。この入力信号を利用して、数字−
単語変換部4は、図9に示す数字−単語変換辞書5を参
照すると、ボタンキーから連続して入力された「73
2」に対応する日本語単語候補として、「みさき」の他
にも「みさか」「ましけ」「まさか」等の日本語単語が
検索され、候補単語として単語候補認定処理部6に転送
される。また、数字−単語変換部4は、入力された各数
字「7」「3」「2」に対応する単語の子音情報は、
「M」「S」「K」であることを同時に単語候補認定処
理部6に転送する(ステップ102)。
【0043】この処理と並行して、送受話器14を介し
て利用者から発声された音声情報は、音声認識処理部3
に転送される。音声認識部3は、音声認識用辞書32を
参照して音声認識処理が行われ、それぞれの認識結果が
優先順位付与部31に転送される。優先順位付与部31
は、音声認識された認識結果を取得すると、図10に示
すように、各々の認識結果に優先順位を付与して、単語
候補格納部33に出力する(ステップ104)。
【0044】図10において、「み」「さ」「き」と発
声されたことにより音声認識の候補として、「み」と発
音した音に対して、認識装置は、第1候補として
「み」、第2候補として「り」、第3候補として
「め」、第4候補として「か」と認識候補を示したこと
になる。この時点で音声認識装置3は必ずしも利用者が
発音した内容を正確に認識しているとは限らないこと
が、「さ」の第1候補が「た」、「き」の第1候補が
「い」であることから分かる。
【0045】これは、子音情報は音声区間が短く母音発
声期間の方が長いために、子音認識において失敗が生じ
易いことに起因する。但し、図10からわかるように、
母音の認識誤りは比較的小さい(但し、「い」を「え」
に間違うことはあり得る)。この認識結果は、図10に
示すような得点を付与して単語候補認識処理部6に転送
される。
【0046】単語候補認識処理部6は、数字−単語変換
部4から送付された子音情報「M」「S」「K」と音声
認識で得られた語候補の母音情報の組み合わせで作成で
きる全ての組み合わせを作成し、それぞれに得点を付与
する。この例を図11及び図12に示す。
【0047】例えば、それぞれ第1人気候補でみると母
音候補は、「I(4点)」「A(4点)」「I(4
点)」であるので、これに「M」「S」「K」の子音情
報と組み合わせて(これを記号でalblclと表記す
る)「MISAKI(みさき)」を作成し、得点は4+
4+4=12点となる。このようにして文字数の数の4
乗個の組み合わせを作成し、それぞれの候補から作られ
る組み合わせが、数字−単語候補の中にあるかどうかの
チェックと、それぞれの得点を表示したものが図11、
図12である。
【0048】このうち、数字−単語変換部4で数字−単
語変換辞書5から検索された実在可能性のある単語(図
11、図12において○が付与されているもの)だけに
絞って、得点を纏めて、これを得点順に並べて優先順位
を付与し、図13に示すような評価結果を生成する。な
お、実在可能性とは、例えば、姓の場合には、「みさ
き」「まさき」「みさか」は、姓として存在する可能性
が高いが、「ましけ」が姓として存在する可能姓は低
い。従って、この例における「ましけ」の得点は低くな
り、優先順位も低くなる。
【0049】図13の評価結果によれば、数字「73
2」だけの情報では、4つの候補に優先順位を付けるこ
とができないが、図10に示す音声認識の結果を併用す
ることにより明確な優先順位を付与できる。一般に、図
13に示す例において、第1候補(「みさき」)と第2
候補(「まさき)」の間にも大きな得点差が生じるの
で、所定の閾値を設定することにより一意に絞り込むこ
とが可能である。
【0050】単語候補認定処理部6は、図13に示す評
価結果の優先順位に従って、利用者に絞り込んだ単語候
補を確認する。図13の例において、最も優先順位の高
い単語候補は、『みさき』であるので、当該単語候補に
ついて利用者に確認する。対話処理部7は、利用者に
「今、“みさき”と入力しましたか?」と入力を確認
し、利用者から「はい」の確認を取得して、入力を“み
さき”と確定することができる。
【0051】上述のように本実施例によれば、複数の日
本語文字が一つのボタンキーに配置され、これを一度ず
つ押下することにより、日本語の文字列を入力しようと
する方式において、必然的に生じる母音の曖昧さを入力
と同時に発声される語の音声認識方法で、母音情報を補
完することが可能となり、利用者には特に大きな負担を
かけることなく、少ないキータッチ数で正しく日本語の
文字列を入力することが可能となる。
【0052】また、本実施例によれば、入力される可能
性がある単語が限られている場合や、住所や姓名のよう
に単語の組み合わせの可能性が実在データによって制限
されている場合の情報入力に特に有効である。しかし、
単語が限られていない場合でも、ボタンキーで入力され
た子音情報と、母音情報で最も確率の高い情報を組み合
わせるだけでも利用者の入力意図に対する信頼度の高い
認定が可能となる。
【0053】例えば、音声認識の結果、母音の特定は、
「み」に対して「I(7点)」「E(2点)」「A(7
点)」、「さ」に対して「A(7点)」「E(3
点)」、「き」に対して「I(9点)」「E(1点)」
から、それぞれ最も得点の高い「I」「A」「I」を選
択し、「732」に相当する「M」「S」「K」と組み
合わせて「MISAKI(みさき)」を候補として認定
することも可能である。この場合は、必ずしも、数字−
単語変換辞書に単語が格納されている必要はない。
【0054】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0055】
【発明の効果】上述のように、本発明によれば、従来よ
りもはるかに簡便で精度の高い日本語文字列を入力する
手段を提供することが可能となる。従って、現在使用さ
れている電話機を本発明の入出力装置として利用するこ
とにより、現在は、オペレータが対応している電話番号
案内のようなサービスを電話機のボタンキーを利用し
て、住所や、名義情報を入力することができ、オペレー
タを介入させずにこのようなデータベース検索型のサー
ビスを利用することができる。
【0056】また、列車の予約や劇場の切符の手配等を
電話機からコード表等の補助手段を用いないで実行する
ことができる。さらに、携帯形通信装置のメッセージを
送る場合にも現在の入力時間を約半分に短縮することが
できる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明のボタン指定・音声認識併用型入力装置
の構成図である。
【図4】本発明の入出力端末の構成図である。
【図5】本発明の動作の概要を示すフローチャートであ
る。
【図6】本発明の一実施例のボタン指定・音声認識併用
型入力装置の構成を示す。
【図7】本発明の第1の実施例の入力装置のボタンキー
への日本語文字の割り当ての例を示す。
【図8】本発明の一実施例の母音列・子音列を指定する
ボタンキーの配列の例を示す。
【図9】本発明の一実施例の数字−単語変換辞書の内容
例である。
【図10】本発明の一実施例の「み」「さ」「き」と発
声した時の音声認識の候補の例である。
【図11】本発明の一実施例の評価結果(その1)であ
る。
【図12】本発明の一実施例の評価結果(その2)であ
る。
【図13】本発明の一実施例の評価結果(優先順位)の
例である。
【符号の説明】
1 入出力端末装置、ボタン指定入力装置 2 入力信号受信部 3 音声認識処理部、音声認識装置 4 数字−単語変換部 5 数字−単語変換辞書 6 単語候補認定処理部、照合手段 7 対話処理部 12 ボタンキー 13 表示部 14 送受話器 31 優先順位付与部 32 音声認識用辞書 33 単語候補格納部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力の可能性のある記号の種類の数より
    も少ない字種しか指定できない入力装置から母音列また
    は、子音列の指定を入力し、 前記入力と同時に、該入力装置に付加された音声入力装
    置から入力された音声を前記入力装置に組み込まれた音
    声認識装置により認識し、 前記入力装置から入力された結果と前記音声認識装置に
    より認識された結果を照合し、 入力された文字を特定することを特徴とするボタン指定
    ・音声認識併用型入力方法。
  2. 【請求項2】 前記入力装置と前記音声認識装置による
    文字入力を連続することにより、複数の文字を文字列と
    して入力するボタン指定・音声認識併用型入力方法にお
    いて、 前記入力装置から入力された結果または、前記音声認識
    装置から入力された結果と、既にデータベースとして蓄
    積されている候補の中の情報と照合することで、入力情
    報を確定する請求項1記載のボタン指定・音声認識併用
    型入力方法。
  3. 【請求項3】 各々のボタンキーに対応する周波数信号
    を前記入力装置からの入力とし、 入力された前記周波数信号に対応する数字または、記号
    列を生成し、 生成された前記数字または、前記記号列に基づいて数字
    −単語変換辞書を参照して、日本語単語候補を出力し、 前記音声認識装置により入力された音声信号を認識し、
    認識された文字候補に順位を付与し、 前記文字候補の順位の高い順に、前記入力装置から出力
    された前記日本語単語候補と照合し、 照合結果を利用者に提示し、 前記利用者からの応答に応じて該利用者が入力した文字
    列を確定する請求項2記載のボタン指定・音声認識併用
    型入力方法。
  4. 【請求項4】 母音列または、子音列の指定により文字
    列を入力する指定手段を有し、入力の可能性のある記号
    の種類の数よりも少ない字種しか指定できないボタン指
    定入力装置と、 前記ボタン指定入力装置からボタン指定による文字列の
    入力と同時に入力された音声を認識する音声認識装置
    と、 前記音声認識装置が認識した結果と、前記ボタン指定入
    力装置で入力された前記文字列を照合して入力情報を確
    定する照合手段とを有することを特徴とするボタン指定
    ・音声認識併用型入力装置。
  5. 【請求項5】 複数のボタンキーと、 前記複数のボタンキーに対応する周波数信号を受信する
    入力信号受信手段と、 前記入力信号受信手段により入力された前記周波数信号
    に基づいて数字または、記号列を生成し、出力する文字
    列生成手段とを含むボタン指定入力装置と、 人間が発声する音声を入力可能とする音声入力手段と、 前記音声入力手段により入力された前記音声を認識して
    認識結果候補を文字により出力する認識結果候補出力手
    段とを有する音声認識装置と、 前記ボタン指定入力装置により出力された文字列と、前
    記認識結果候補出力手段により出力された候補とを照合
    し、特定された情報を音声または、文字情報として外部
    に対して出力/表示する照合結果出力手段とを有するこ
    とを特徴とするボタン指定・音声認識併用型入力装置。
  6. 【請求項6】 前記認識結果候補出力手段は、 入力音声と比較するための音声認識用辞書と、 前記入力音声に基づいて前記音声認識用辞書を参照し、
    優先順に認識文字候補を出力する出力順位付与手段を含
    む請求項5記載のボタン指定・音声認識併用型入力装
    置。
  7. 【請求項7】 前記音声認識用辞書は、 予め数字及び記号列と日本語単語との対応関係が格納さ
    れている数字−単語変換情報を含む請求項6記載のボタ
    ン指定・音声認識併用型入力装置。
  8. 【請求項8】 前記出力順位付与手段は、 前記音声認識用辞書を参照して、前記音声認識装置から
    出力された日本語の文字候補の文字列からなる生成可能
    な日本語の文字列のうち、前記数字−単語変換情報に基
    づいて日本語の文字列とすることが可能か否かを検証す
    る検証手段と、 前記検証手段により前記日本語の文字列となり得る可能
    性が高い順に候補を出力する順位付与手段と、 前記順位付与手段により出力された結果を格納する単語
    候補格納手段とを含む請求項6記載のボタン指定・音声
    認識併用型入力装置。
  9. 【請求項9】 前記認識結果候補出力手段は、 前記単語候補格納手段に格納されている順に利用者に提
    示する候補提示手段と、 前記候補提示手段により利用者が入力した文字列を確定
    する文字列確定手段とを含む請求項5及び8記載のボタ
    ン指定・音声認識併用型入力装置。
JP8098925A 1996-04-19 1996-04-19 ボタン指定・音声認識併用型入力方法及び装置 Pending JPH09288495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8098925A JPH09288495A (ja) 1996-04-19 1996-04-19 ボタン指定・音声認識併用型入力方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8098925A JPH09288495A (ja) 1996-04-19 1996-04-19 ボタン指定・音声認識併用型入力方法及び装置

Publications (1)

Publication Number Publication Date
JPH09288495A true JPH09288495A (ja) 1997-11-04

Family

ID=14232713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8098925A Pending JPH09288495A (ja) 1996-04-19 1996-04-19 ボタン指定・音声認識併用型入力方法及び装置

Country Status (1)

Country Link
JP (1) JPH09288495A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008301169A (ja) * 2007-05-31 2008-12-11 Kenwood Corp 無線機、制御方法及びプログラム
JP2009515227A (ja) * 2005-11-07 2009-04-09 韓國電子通信研究院 音声認識に基づくテキスト入力システムおよび方法
WO2017135516A1 (ko) * 2016-02-05 2017-08-10 삼성전자(주) 전자 기기 및 그 제어방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009515227A (ja) * 2005-11-07 2009-04-09 韓國電子通信研究院 音声認識に基づくテキスト入力システムおよび方法
JP2008301169A (ja) * 2007-05-31 2008-12-11 Kenwood Corp 無線機、制御方法及びプログラム
WO2017135516A1 (ko) * 2016-02-05 2017-08-10 삼성전자(주) 전자 기기 및 그 제어방법

Similar Documents

Publication Publication Date Title
US5917889A (en) Capture of alphabetic or alphanumeric character strings in an automated call processing environment
EP1267326B1 (en) Artificial language generation
US5794204A (en) Interactive speech recognition combining speaker-independent and speaker-specific word recognition, and having a response-creation capability
US20010016813A1 (en) Distributed recogniton system having multiple prompt-specific and response-specific speech recognizers
JP3542026B2 (ja) 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JPS603699A (ja) 適応性自動離散音声認識方法
JP2003216181A (ja) 制約に基づく音声認識システム及び方法
US7260531B2 (en) Interactive system, method, and program performing data search using pronunciation distance and entropy calculations
EP0848536A2 (en) Statistical database correction of alphanumeric account numbers for speach recognition and touch-tone recognition
CN101218625A (zh) 用于移动设备的使用拼写识别的字典查找
US20020198712A1 (en) Artificial language generation and evaluation
JP4845955B2 (ja) 音声認識結果訂正装置および音声認識結果訂正方法
JP3316826B2 (ja) 情報案内方法及びその装置
JPH09288495A (ja) ボタン指定・音声認識併用型入力方法及び装置
JP3221477B2 (ja) データベース照合型入力方法及び装置、データベース照合型日本語入力装置、並びに、電話番号案内サービスシステム
JP4498906B2 (ja) 音声認識装置
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
JPH09230889A (ja) 音声認識応答装置
JPH09114493A (ja) 対話制御装置
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2000181490A (ja) 利用者照合方法および利用者照合装置
JPH08329088A (ja) 音声入力翻訳装置
JPH0863185A (ja) 音声認識装置
JPH1195792A (ja) 音声処理装置および文字入力方法
JPH10207486A (ja) 対話型音声認識方法およびこの方法を実施する装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031216