JP2000056796A - 音声入力装置および方法 - Google Patents

音声入力装置および方法

Info

Publication number
JP2000056796A
JP2000056796A JP10224403A JP22440398A JP2000056796A JP 2000056796 A JP2000056796 A JP 2000056796A JP 10224403 A JP10224403 A JP 10224403A JP 22440398 A JP22440398 A JP 22440398A JP 2000056796 A JP2000056796 A JP 2000056796A
Authority
JP
Japan
Prior art keywords
voice
input
recognition
speech
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10224403A
Other languages
English (en)
Inventor
Makoto Shosakai
誠 庄境
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Chemical Industry Co Ltd
Original Assignee
Asahi Chemical Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Chemical Industry Co Ltd filed Critical Asahi Chemical Industry Co Ltd
Priority to JP10224403A priority Critical patent/JP2000056796A/ja
Publication of JP2000056796A publication Critical patent/JP2000056796A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 音声認識精度を向上させる。 【解決手段】 選択手段dの「1」の数字ボタンを押し
ながら音声を入力すると、認識手段gはア行の文字に対
応する音声認識用データを使用して音声認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本願発明は、携帯電話、携帯
情報端末、リモコンなどのような携帯機器において、限
定された個数のボタンおよび音声を用いて効率よく仮名
やアルファベットなどの文字をボタンおよび音声を併用
して入力する音声入力装置および方法に関するものであ
る。
【0002】
【従来の技術】携帯電話、携帯情報端末、リモコンなど
のような携帯用電子機器においては、ボタンスイッチ
(キースイッチ)を使用して文字(数字,記号を含む)
を入力できるようにしている。これらの電子機器ではそ
の表面積、体積、重さを十分大きくできないという制約
から、全体のボタン数を少なくするために、図5に示す
ようにテンキーのボタンを共用して、数字、仮名文字、
英文字を入力する。
【0003】図5の例ではカタカナ入力モードを不図示
の制御ボタンにより設定した後、たとえば、“1”の数
字ボタンを使用してア行のカタカナを入力する。また、
“2”の数字ボタンを使用してカ行のカタカナを入力す
る。ア行の「アイウエオ」のいずれかの文字を入力する
場合には、“1”のボタンの押下回数で入力の文字を指
定する。この例では、「ア」の文字は“1”のボタンを
1回押下し、「イ」の文字は“1”のボタンを2回連続
的に押下する。このような文字入力方法で例えば、「オ
ンセイ」という仮名文字列を入力する場合、図6に示す
ように「オ」の入力に4回「ン」の文字に3回というよ
うに合計で14回のボタン操作が必要となる。英文字列
の入力においても、カタカナの入力と比べると数字ボタ
ンを押す回数は少ないものの、同様に1回以上のボタン
操作が必要となる。このような文字入力方法を使用し
て、テキストからなる電子メールをデータ通信する携帯
電話の使用者は、文字入力のために非常に大きな手間を
必要とする。
【0004】そこで、音声による文字入力方法を使用す
ることが考えられ、また、音声認識技術においても、仮
名やアルファベットの認識は最も古くからのテーマとし
て研究開発されてきた。
【0005】音声認識は大別すると、特定の話者に固有
の登録語を認識する技術である特定話者音声認識と不特
定の話者に共通の固定語を認識する技術である不特定話
者音声認識の2つの手法がある。特定話者音声認識にお
いては、特定の話者が予め音声認識させたい単語を登録
するという作業が発生する。この作業は具体的には、特
定の話者が予め発声した単語の音声サンプルをある特徴
パラメータの系列(テンプレートと呼ぶ)に変換し、そ
の系列を単語のラベルとともにメモリーやハードディス
クなどの記憶装置に蓄積する。
【0006】音声サンプルをある特徴パラメータの系列
に変換する方法としては、ケプストラム分析や線形予測
分析などが知られており、「音声・音情報のディジタル
信号処理」(鹿野清宏、中村哲、伊勢史郎共著、(株)
昭晃堂)にも詳述されている。特定話者音声認識におい
ては、記憶装置に蓄積された特徴パラメータの系列(文
字認識用のデータ)と入力された音声から変換された特
徴パラメータの系列とを比較し、入力された音声から変
換された特徴パラメータの系列に最も類似した特徴パラ
メータの系列を持つ単語のラベルを認識結果として出力
する。
【0007】記憶装置に蓄積された特徴パラメータの系
列と入力された音声から変換された特徴パラメー夕の系
列とを比較する方法としては、動的計画法(dynam
icprogramming)による時間軸伸縮マッチ
ング(Dynamic Time Warping,D
TW)が広く用いられており、上記「音声・音情報のデ
ィジタル信号処理」にも詳しく述べられている。
【0008】一方、不特定話者音声認識においては、不
特定の話者に共通の固定語の特徴パラメータに関する情
報が予め記憶装置に蓄積されているため、特定話者音声
認識のようにユーザーが音声認識させたい単語を登録す
るという作業は発生しない。音声サンプルをある特徴パ
ラメータの系列に変換する方法としては、特定話者音声
認識と同様にケプストラム分析や線形予測分析などが知
られている。また、不特定の話者に共通の固定語の特徴
パラメータに関する情報の作成およびその情報と入力さ
れた音声から変換された特徴パラメータの系列との比較
には、隠れマルコフモデル(Hidden Marko
v Model,HMM)による方法が一般に用いられ
ている。HMMによる不特定話者音声認識についても、
上記「音声・音情報のディジタル信号処理」に詳しく述
べられている。例えば、日本語の場合、音声単位を上記
「音声・音情報のディジタル信号処理」の第2章に記載
されている音韻のセットとし、各音韻がHMMによりモ
デル化されているとする。表1に音韻のセットのラベル
の一覧を示す。この時、例えば「カ」は図3のような話
者に共通の音韻ラベルのネットワークでモデル化するこ
とができる。
【0009】
【表1】
【0010】HMMによる音韻モデルのデータ音素ラベ
ルネットワーク(図4参照)を音声認識用データとして
用意すれば、上記「音声・音情報のディジタル信号処
埋」の第4章に記載されているViterbiアルゴリ
ズムにより、当業者は仮名やアルファベットの不特定話
者音声認識装置を容易に構成することができる。
【0011】仮名はその全てが1音節である。また、ア
ルファベットもその大半が1〜3音節である。仮名やア
ルファベットのような短い音声の認識は、特に不特定話
者の場合かつ/または雑音が存在する環境において特に
困難であることは周知の事実である。表1の音韻の内、
5つの母音は不特定話者の場合かつ/または雑音が存在
する環境においても、実用に供することが可能なレベル
で比較的小規模のハードウェアで正確に認識することが
可能である。
【0012】しかしながら、子音については、不特定話
者の場合かつ/または雑音が存在する環境において十分
な性能が得られていないのが実状である。例えば、
「p」、「t」、「k」の識別は最も困難なものの1つ
であるために、「パ」、「タ」、「カ」の仮名の認識は
かなり困難である。同様の理由で、「b」、「d」、
「g」のアルファベットの認識もかなり困難であるとい
える。さらに、使いやすさの観点からは、仮名やアルフ
ァベットを1文字ずつ発声しそれを認識するのではな
く、連続的に発声し連続的に認識する方法が最も好まし
い。しかしながら、上述と同様の理由で不特定話者の場
合かつ/または雑音が存在する環境において特に困難で
あることは周知の事実である。
【0013】
【発明が解決しようとする課題】上述のように雑音が混
入しやすい環境下で入力した音声は音声の認識精度が低
下するという問題がある。
【0014】また、図5に示すようなテンキー(数字ボ
タン)を使用して文字入力を行う場合には、ユーザの入
力操作が大変に煩雑であるという問題がある。
【0015】さらにキーボードのように各文字毎のボタ
ンを有する文字入力装置は、表面積、体積、重さを十分
大きくできないという制約を持っている携帯電話、携帯
情報端末、リモコンなどのような携帯用電子機器におい
ては使用できないという問題がある。
【0016】そこで本発明は、数字ボタンのような少な
いボタン(入力用キースイッチ)と音声を併用すること
により音声認識性能の向上に寄与する音声入力装置およ
び方法を提供することにある。
【0017】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、予め記憶してある音声認
識用データを使用して入力音声を音声認識し、文字を音
声で入力する音声入力装置において、認識対象の音声の
表す文字を種類分けしておき、入力音声の種類を指示す
る指示手段と、当該指示された種類に対応する音声認識
用データを使用して音声認識を行う音声認識手段とを具
えたことを特徴とする。
【0018】請求項2の発明は、請求項1に記載の音声
入力装置において、共通する子音を持つかな文字同士で
種類分けすることを特徴とする。
【0019】請求項3の発明は、請求項1に記載の音声
入力装置において、連続する所定数の英文字同士で種類
分けすることを特徴とする。
【0020】請求項4の発明は、請求項1に記載の音声
入力装置において、前記入力音声の有無を判定する判定
手段をさらに有し、該判定手段により入力音声なしと判
定された場合には、前記指示手段は他の情報を入力し、
前記判定手段により入力音声ありと判定された場合に、
前記指示手段は入力音声の種類を指示することを特徴と
する。
【0021】請求項5の発明は、請求項4に記載の音声
入力装置において、前記指示手段は前記その他の情報と
して数字を入力することを特徴とする。
【0022】請求項6の発明は、予め記憶してある音声
認識用データを使用して入力音声を音声認識し、文字を
音声で入力する音声入力方法において、認識対象の音声
の表す文字を種類分けしておき、入力音声の種類を指示
し、当該指示された種類に対応する音声認識用データを
使用して音声認識を行うことを特徴とする。
【0023】請求項7の発明は、請求項6に記載の音声
入力方法において、共通する子音を持つかな文字同士で
種類分けすることを特徴とする。
【0024】請求項8の発明は。請求項6に記載の音声
入力方法において、連続する所定数の英文字同士で種類
分けすることを特徴とする。
【0025】請求項9の発明は、請求項6に記載の音声
入力方法において、前記入力音声の種類を指示するため
指示手段および入力音声の有無を判定するための判定手
段をさらに有し、前記判定手段により入力音声なしと判
定された場合には、前記指示手段は他の情報を入力し、
前記判定手段により入力音声ありと判定された場合に、
入力音声の種類を指示することを特徴とする。
【0026】請求項10の発明は、請求項9に記載の音
声入力方法において、前記指示手段は前記その他の情報
として数字を入力することを特徴とする。
【0027】
【発明の実施の形態】以下、図面を参照して、本発明の
実施形態を詳細に説明する。
【0028】図5のような数字ボタンを用いれば、
「ア」行、「カ」行、「サ」行などの仮名の行を指定す
ることは、ボタンを1回押せばよいので比較的容易であ
る。本願発明者は、1回のボタン操作で入力する文字が
たとえば、「ア」行等の文字(ア、イ、ウ、エ、オ)で
あるというように文字範囲を指定できることに気が付
き、入力しようとする文字を含む文字範囲、別の表現を
使用すると、入力しようとする文字の子音部分を数字ボ
タンにより指定して音声を入力する音声入力装置を発明
した。このような音声入力装置を使用して「オンセイ」
を入力する場合、ユーザは、図7に示すように仮名の子
音および母音の種類に対応した数字ボタン(この場合
「1」のボタンで「ア」行を指定しながら、ユーザが
「オ」を発声する。同様に「0」,「3」,「0」のボ
タンで「ワ行」,「サ行」,「ア行」をそれぞれ指示し
ながら、「ン」,「セ」,「イ」を順次発声する。この
例では、図7に示すように4回のボタン操作と4回の発
声で所望の文字を入力できるので、図6の従来例の数字
ボタンのみの入力方法に比べて、ボタン操作が10回も
少なく、入力操作労力を著しく低減することができる。
本実施形態では、ボタン操作と仮名の発声はほぼ同時に
行うことで、入力音声の5つの母音を認識するだけでよ
いので、短い処理時問でかつ、精度よく音声認識を行う
ことができる。
【0029】このような音声入力方法を適用した音声入
力装置の基本的な構成を図1を参照しながら説明する。
図1において、アナログ音声信号11はADコンバータ
等の入力手段aによりデジタル信号22に変換される。
デジタル信号22は変換手段bにより一定のフレーム周
期で音響パラメー夕33に変換される。音響パラメータ
としては、上記「音声・音情報のディジタル信号処理」
にも記述されているケプストラムなどを用いればよい。
【0030】音声単位データ蓄積手段cには、ROMや
RAMを使用することができ、例えば表1の音韻をモデ
ル化したHMMのデータを認識用データ44として蓄積
する。
【0031】次に、図5に示すような数字ボタンからな
る選択手段dにより、子音を選択する。例えば、数字ボ
タンの2を押すことにより、カ行の「カ」、「キ」、
「ク」、「ケ」、「コ」の5つの仮名を選択することが
できる。濁音は数字ボタンの2と*を連続して押すこと
により、たとえば、ガ行の「ガ」、「ギ」、「グ」、
「ゲ」、「ゴ」の5つの仮名を選択することができる。
また、「パ」、「ピ」、「プ」、「ペ」、「ポ」のよう
な破裂音についても数字ボタンの6を押した後に*を2
回押すという方法により選択することができる。
【0032】このようにして選択手段dにより選択され
た仮名ラベル55を用いて、生成手段fは音声単位系列
77を生成する。例えば、ユーザが数字ボタンの2を押
すことにより、カ行の「カ」、「キ」、「ク」、
「ケ」、「コ」の5つの仮名を選択した場合は、音声単
位系列77は図8の構成を取る。この音声単位系列77
と認識用データ44、具体的には、kに対応する認識用
データおよびa,i,u,e,oそれぞれに対応する認
識用データを用いて、音響パラメータ33の認識処理を
認識手段gにて行い、認識結果88を得る。
【0033】音声認識のための認識アルゴリズムとして
は、上述のViterbiアルゴリズムを用いればよ
い。認識結果88は、確認のためにスピーカーやディス
プレーなどの出力手段hにより、音声や画面による出力
結果99として話者に出力される。また、携帯電話のよ
うな無線通信を行う場合には、不図示の通信回路に文字
コード信号の形態で認識結果が引き渡される。
【0034】以上、仮名についての入力例を説明してき
たが、次にアルファベット(英文字)を入力するための
装置の基本構成を図2を参照して説明する。図2におい
て、図1と同様の個所には同一の符号を付しており、詳
細な説明を省略する。
【0035】数字ボタンに対する割り当てが、連続する
所定数の文字である点は仮名文字入力と英文字入力は共
通するが、仮名文字は、子音が共通の文字で種類分けす
るのに対し、英文字はたとえば、「A」、「B」、
「C」のようにアルファベット順で所定個数単位種類分
けする点が相違点である。この音声単位系列77は図9
のように構成することができる。
【0036】携帯電話機に本発明の音声入力装置を設置
した場合の回路構成を図10に示す。図10において、
101は図1の選択手段dとしてのキーマトリクスであ
り、図5に示すような数字ボタンおよび不図示の制御ボ
タンを有する。ユーザが数字ボタンを押下すると、その
ボタンに対応する識別信号が後述のMPU(マイクロプ
ロセッサ)100に入力される。
【0037】100はMPUであり、ROM,RAM,
CPUを有する。ROMは図1の音声単位データ蓄積手
段cとして音声認識用のデータを記憶している。RAM
は音声認識処理で使用されるワークデータを記憶する。
CPUは図1の変換手段b、生成手段f、認識手段gと
して機能する。出力手段hは図示していないがスピーカ
やディスプレイをMPU100と接続すればよく、詳細
な説明を要しないであろう。
【0038】102はマイクロホンであり、ユーザが入
力した文字を音声で入力する。入力された音声はマイク
ロホン102はアナログ信号の形態で出力されA/D変
換器によりCPU100が処理可能なデジタル信号に変
換される。
【0039】MPU100はキーマトリクス101から
出力される識別信号に基づきユーザによりどの数字ボタ
ンが押下されたかを識別し、マイクロホン102から入
力された音声を音声認識する。認識結果は、通信回路1
04およびアンテナ105を介して無線で送信されるか
または携帯電話機に付属のディスプレイに文字として表
示される。
【0040】このような構成で実行する文字入力処理を
図11のフローチャートを参照して説明する。図11は
MPU100のCPUが実行する処理手順であり、CP
Uが処理可能なプログラム言語で記載されたプログラム
がROMに保存されている。仮名文字の入力を行うか英
文字の入力を行うかはキーマトリクス101の制御ボタ
ンで指示され、指示された文字種に対応した図11の音
声認識プログラムがCPUにより実行される。本例では
仮名文字が選択されたものとして説明する。
【0041】ユーザが「1」の数字ボタンを押下して
「ア」「イ」「ウ」「エ」「オ」を発声し、マイクロホ
ン102に音声を入力する。発声をしていない時点では
音声信号のレベル値(アナログ信号の場合は電圧の値)
はほぼゼロに近い値となるので、CPUは入力の音声信
号のデジタル値と閾値を比較して音声の入力の有無を判
定する。
【0042】入力されたデジタル信号は順次にMPU1
00内のRAM(以下、RAMと略記)に一時記憶され
る(ステップS10→S20)。次にキーマトリクス1
01から識別信号が入力されたことを確認すると(ステ
ップS30),MPUのCPU(以下、CPUと略記)
は識別信号の種類内容を識別する。これにより、音声単
位系列77が生成され、音声認識に使用するデータ(識
別信号により指示された子音及び母音「a」、「i」、
「u」、「e」、「o」に対応する認識用データ)がR
OMから取り出されてRAMに一時記憶される(ステッ
プS40)。
【0043】ステップS20でRAMに記憶されている
入力の音声信号を変換した後、上記音声単位系列に対応
する音声認識用データを使用してCPUは音声認識を行
う。音声認識結果はディスプレイや通信回路104に出
力される(ステップS50)。
【0044】以下、数字ボタンと音声の双方の入力があ
る期間は、ステップS10〜S60の間の処理が繰り返
し実行される。
【0045】一方、ユーザが数字ボタンのみを操作して
音声を入力しない場合、手順はステップS10→S60
へと進み、このステップで数字ボタンの押下の有無が判
定される。ユーザが数字ボタンを押下している場合に
は、識別信号が発生しているので、これにより、押下あ
り(キー入力あり)とCPUにおいて判断し、CPUは
入力された情報を数字として取り扱う。したがって、こ
の例では、音声の発生の有無が、数字入力モードと仮名
文字入力モードとのモード切り替えを行っていることに
もなる。
【0046】上述の実施形態のほかに次の形態を実施す
ることができる。
【0047】1)本発明の音声入力装置はテンキーしか
有さない携帯用情報処理機器に非常に好適であるが、携
帯用情報処理機器に限定する必要はなく、キーボードを
有する情報処理機器で、音声入力を行う場合にも本発明
を適用できる。
【0048】この場合に、数字ボタンのに代わり他の文
字入力キー(あるいはボタン)を使用することができ
る。
【0049】2)上述の例は携帯電話機に本発明を適用
する例を説明したので、数字の入力用と音声入力する文
字の範囲(種類)指定用とに数字ボタンを兼用している
が、用途によっては種類指定専用のボタン(またはキ
ー)を設けてもよいこと勿論でる。
【0050】3)上述の実施形態では、数字ボタンを押
下しないで、音声を入力した場合には、その入力音声は
無効化される(図11のステップS10〜S30→S1
0の経路により無効化)。しかしながら、数字キーの押
下と音声の入力があった場合には、入力音声の指定モー
ド、数字ボタンの押下がなく、音声の入力があった場合
には、従来と同様の音声認識処理を行うモードというよ
うに音声の入力の有無と、数字ボタンの押下の有無をC
PUにより判定して、処理モードを設定こともできる。
用途としては、通常は、数字ボタン操作なしの音声入力
モードで音声による文字入力を行い、音声認識において
誤認識があった場合には、数字ボタンを使用した音声入
力モードに切り替えて音声入力を行う用途が考えられ
る。
【0051】4)本実施形態ではHMM方式の音声認識
方法について説明したが、たの音声認識方法についても
本発明を適用できる。通常、一般的な音声認識では音韻
や音素ラベル毎の標準パターン等と呼ばれる音声認識用
データを使用して音声認識を行う。この標準パターンを
子音や音韻毎に種類分けしておき、ボタンにより指示さ
れた種類(たとえば、Kの子音)に対応する標準パター
ンのみを使用して音声認識する。
【0052】5)音声が入力されたか否かを判定するた
めには、入力音声信号の電圧レベルを比較するほかに、
特開平7−66757号公報やPCT/JP98・00
915号に記載されているような音声の有無検出方法を
使用することができる。
【0053】この方法は、検出に若干時間がかかるが、
雑音の影響を受けないという利点がある。
【0054】
【発明の効果】以上、説明したように請求項1、6の発
明によれば、認識対象の音声の種類を指示手段により指
定することで認識に使用する認識用のデータが範囲指定
される。これにより、少ない時間で、音声認識を行うこ
とができるとともに、認識精度も大幅に向上する。
【0055】請求項2、7の発明では、ひらがなやカタ
カナの文字ではカ行,サ行のように子音と母音から構成
される文字が連続するので、子音を共通する文字同士で
種類分けし、この子音部分が指示手段により指定される
ので,子音に対する誤認識は皆無となる。
【0056】請求項3,8の発明は、連続する所定数の
文字で種類分けすることにより、所定数この文字につい
ての文字認識をおこなえばよく、英文字についても音声
認識精度を向上させることができる。
【0057】請求項4、5、9、10の発明によれば、
音声入力の有無を判定することによりテンキーのような
数字ボタンによる文字の入力と、音声の種類の指示を同
一のキーで兼用することができ、少ないキーで多種多様
の情報入力を行うことができる。
【図面の簡単な説明】
【図1】本発明実施形態の基本的な構成を示すブロック
図である。
【図2】本発明実施形態において英文字を音声入力する
ための基本構成を示すブロック図である。
【図3】音韻ラベルのネットワークを示す構成図であ
る。
【図4】音韻ラベルのネットワークの構成を示す構成図
である。
【図5】文字入力用の数字ボタンの配置を示す説明図で
ある。
【図6】従来の数字ボタンの操作内容を示す説明図であ
る。
【図7】本発明実施形態の数字ボタンの操作内容を示す
説明図である。
【図8】入力音声の音韻ラベルのネットワークの構成を
示す構成図である。
【図9】入力音声の音韻ラベルのネットワークの構成を
示す構成図である。
【図10】本発明実施形態の具体的な構成の一例を示す
ブロック図である。
【図11】MPU100の実行する処理手順を示すフロ
ーチャートである。
【符号の説明】
11 アナログ音声信号 22 デジタル信号 33 音響パラメータ 44 認識用データ 55 仮名ラベル 56 アルファベットラベル 77 音声単位系列 88 認識結果 99 出力結果

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 予め記憶してある音声認識用データを使
    用して入力音声を音声認識し、文字を音声で入力する音
    声入力装置において、 認識対象の音声の表す文字を種類分けしておき、入力音
    声の種類を指示する指示手段と、 当該指示された種類に対応する音声認識用データを使用
    して音声認識を行う音声認識手段とを具えたことを特徴
    とする音声入力装置。
  2. 【請求項2】 請求項1に記載の音声入力装置におい
    て、共通する子音を持つかな文字同士で種類分けするこ
    とを特徴とする音声入力装置。
  3. 【請求項3】 請求項1に記載の音声入力装置におい
    て、連続する所定数の英文字同士で種類分けすることを
    特徴とする音声入力装置。
  4. 【請求項4】 請求項1に記載の音声入力装置におい
    て、前記入力音声の有無を判定する判定手段をさらに有
    し、該判定手段により入力音声なしと判定された場合に
    は、前記指示手段は他の情報を入力し、前記判定手段に
    より入力音声ありと判定された場合に、前記指示手段は
    入力音声の種類を指示することを特徴とする音声入力装
    置。
  5. 【請求項5】 請求項4に記載の音声入力装置におい
    て、前記指示手段は前記その他の情報として数字を入力
    することを特徴とする音声入力装置。
  6. 【請求項6】 予め記憶してある音声認識用データを使
    用して入力音声を音声認識し、文字を音声で入力する音
    声入力方法において、 認識対象の音声の表す文字を種類分けしておき、 入力音声の種類を指示し、 当該指示された種類に対応する音声認識用データを使用
    して音声認識を行うことを特徴とする音声入力方法。
  7. 【請求項7】 請求項6に記載の音声入力方法におい
    て、共通する子音を持つかな文字同士で種類分けするこ
    とを特徴とする音声入力方法。
  8. 【請求項8】 請求項6に記載の音声入力方法におい
    て、連続する所定数の英文字同士で種類分けすることを
    特徴とする音声入力方法。
  9. 【請求項9】 請求項6に記載の音声入力方法におい
    て、前記入力音声の種類を指示するため指示手段および
    入力音声の有無を判定するための判定手段をさらに有
    し、前記判定手段により入力音声なしと判定された場合
    には、前記指示手段は他の情報を入力し、前記判定手段
    により入力音声ありと判定された場合に、入力音声の種
    類を指示することを特徴とする音声入力方法。
  10. 【請求項10】 請求項9に記載の音声入力方法におい
    て、前記指示手段は前記その他の情報として数字を入力
    することを特徴とする音声入力方法。
JP10224403A 1998-08-07 1998-08-07 音声入力装置および方法 Withdrawn JP2000056796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10224403A JP2000056796A (ja) 1998-08-07 1998-08-07 音声入力装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10224403A JP2000056796A (ja) 1998-08-07 1998-08-07 音声入力装置および方法

Publications (1)

Publication Number Publication Date
JP2000056796A true JP2000056796A (ja) 2000-02-25

Family

ID=16813220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10224403A Withdrawn JP2000056796A (ja) 1998-08-07 1998-08-07 音声入力装置および方法

Country Status (1)

Country Link
JP (1) JP2000056796A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005517216A (ja) * 2002-02-07 2005-06-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置
KR100868709B1 (ko) * 2000-12-22 2008-11-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉
JP2009150991A (ja) * 2007-12-19 2009-07-09 Denso Corp 単音節入力装置
JP2013042512A (ja) * 2003-04-18 2013-02-28 Benjamin Firooz Ghassabian モバイル装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100868709B1 (ko) * 2000-12-22 2008-11-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉
JP2005517216A (ja) * 2002-02-07 2005-06-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置
JP2013042512A (ja) * 2003-04-18 2013-02-28 Benjamin Firooz Ghassabian モバイル装置
JP2009150991A (ja) * 2007-12-19 2009-07-09 Denso Corp 単音節入力装置

Similar Documents

Publication Publication Date Title
US7260529B1 (en) Command insertion system and method for voice recognition applications
JP4468264B2 (ja) 多言語による名称の音声認識のための方法とシステム
RU2377664C2 (ru) Способ ввода текста
JP5480760B2 (ja) 端末装置、音声認識方法および音声認識プログラム
US8095364B2 (en) Multimodal disambiguation of speech recognition
US20080126093A1 (en) Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
EP1751737A2 (en) Multimodal disambiguation of speech recognition
JP2000056796A (ja) 音声入力装置および方法
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JP4230142B2 (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP2011248002A (ja) 翻訳装置
US11620978B2 (en) Automatic interpretation apparatus and method
JP3254977B2 (ja) 音声認識方法及び音声認識装置
JP2015227915A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US20080256071A1 (en) Method And System For Selection Of Text For Editing
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法
JP2010204442A (ja) 音声認識装置、音声認識方法、音声認識プログラムおよびプログラム記録媒体
CN116564286A (zh) 语音录入方法、装置、存储介质及电子设备
JPH0667688A (ja) 入力装置
JP2005049713A (ja) 単音声による文字入力システム
JP2000010588A (ja) 音声認識方法及び装置
JP2001184085A (ja) 音声認識装置
JPH1020881A (ja) 音声処理方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051101