JPH1195792A - 音声処理装置および文字入力方法 - Google Patents

音声処理装置および文字入力方法

Info

Publication number
JPH1195792A
JPH1195792A JP9256753A JP25675397A JPH1195792A JP H1195792 A JPH1195792 A JP H1195792A JP 9256753 A JP9256753 A JP 9256753A JP 25675397 A JP25675397 A JP 25675397A JP H1195792 A JPH1195792 A JP H1195792A
Authority
JP
Japan
Prior art keywords
voice
word
character string
character
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9256753A
Other languages
English (en)
Inventor
Shuzo Kato
修三 加藤
Kazuhiko Seki
和彦 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Uniden Corp
Original Assignee
Uniden Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Uniden Corp filed Critical Uniden Corp
Priority to JP9256753A priority Critical patent/JPH1195792A/ja
Publication of JPH1195792A publication Critical patent/JPH1195792A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 メモリの容量をそれほど必要とすることな
く、かつ、音声認識処理も短時間にて実現可能な音声処
理装置を提供する。 【解決手段】 音声情報を受け入れて、その音声に対応
する文字列を認識して登録することができる電話機10
は、文字および数字の各々に対応する音声データの組
と、予め定められた所定の単語の音声データの組とを記
憶するメモリ22内のテーブルと、受け入れた音声情報
を、文字や所定の単語に分割し、かつ、テーブルを参照
して、分割された文字および/または所定の単語を特定
する音声処理/識別装置20と、特定された文字および
/または所定の単語からなる文字列を表示する表示装置
16とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声により文字や
単語を入力する方法に関し、特に、電話機などに好適な
文字入力方法、および、これを用いた音声処理装置に関
する。
【0002】
【従来の技術】旧来より、単語をマイクなどを介して装
置に入力し、装置にて、入力された単語と予め辞書に登
録された単語とを照合し、入力された単語を認識する音
声処理装置が知られている。
【0003】たとえば、電話機においても、特開平7−
212456号公報に開示されたように、利用者が電話機に対
して発声した、電話機の操作用の命令語や短縮ダイヤル
番号を、電話機において音声認識し、認識結果と、予め
登録された命令語や短縮ダイヤルとを照合して、一致し
た命令語或いは短縮ダイヤルに応じた処理を実行するよ
うな構成が知られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の技術においては、多くの命令語や短縮ダイヤルを、
音声により認識可能とするために、上記命令語や短縮ダ
イヤルごとに、その音声データを予め登録しておく必要
がある。したがって、音声データを記憶するために必要
なメモリの容量が大きくなり、かつ、音声認識の結果
と、登録された音声データとの照合に時間を要するとい
う問題点があった。
【0005】本発明の目的は、メモリの容量をそれほど
必要とすることなく簡易な構成で実現でき、かつ、音声
認識処理も短時間にて実現可能であるとともに簡便な操
作で利用可能である音声処理装置および文字入力方法を
提供することにある。
【0006】
【課題を解決するための手段】本発明の目的は、音声情
報を受け入れて、その音声を認識する音声処理装置であ
って、文字および数字に関する音声情報について各々の
音節単位あるいはアルファベット単位に定められる音声
データ、及び予め定められた単語の音声データとを記憶
するテーブルと、前記テーブルを参照して、入力された
音声情報に対応する文字、数字および単語のうちの少な
くとも一つを選択する認識手段と、前記認識手段により
選択された文字、数字および単語のうちの少なくとも一
つを出力する出力手段とを備えたことを特徴とする音声
処理装置により達成される。
【0007】本発明によれば、文字および数字の音声デ
ータと、たとえば、特殊文字や制御文字などを示す所定
の単語の音声データとがテーブルに記憶されている。し
たがって、利用者は、文字を一つ一つ発声するととも
に、所定の単語については、単語自体を発声して、所望
の文字列を入力することができる。この音声処理装置に
おいて、たとえば、アルファベットおよび数字を用いる
のであれば、36個の音声データと、必要な単語の音声
データを、テーブルに記憶しておけば足りる。したがっ
て、テーブルに記憶する音声データの容量を小さくする
ことができ、かつまた、これにより、文字列の認識に必
要な時間を減少させることが可能となる。
【0008】本発明の好ましい実施態様においては、前
記テーブルに、相互に発音の類似する文字に関して、通
常の発音と異なる発音の音声データが記憶されている。
このように、予め誤認識のおそれのある文字に関して
は、識別しやすい音声の音声データを記憶しておくこと
により、文字の認識率を向上させることが可能となる。
【0009】本発明のさらに好ましい実施態様において
は、種々の単語の文字列を有する単語辞書と、前記文字
認識手段により認識された文字および/または所定の単
語からなる文字列と、単語辞書に収容された文字列とを
照合する照合手段とを備え、前記出力手段に、照合の結
果得られた単語の候補を出力するように構成されてい
る。
【0010】この実施態様によれば、単なる文字として
認識されたものからなる文字列と、単語辞書の文字列と
を照合するため、文字列全体としての認識率を向上させ
ることができる。また、単語辞書は文字列の集まりにす
ぎないため、種々の単語の音声データを記憶したテーブ
ルを設ける場合と比較して、メモリの容量を小さくする
ことができる。
【0011】本発明のさらに好ましい実施態様において
は、前記出力手段に出力された単語の候補から一つを選
択する選択手段を備えている。また、前記選択手段によ
り選択された単語の優先度を高めるように、前記単語辞
書に所定の情報を付加する学習手段がさらに設けられて
いるのが好ましい。
【0012】本発明のさらに好ましい実施態様において
は、利用者に取り付けられ、当該利用者の骨伝導を検出
する骨伝導検出素子を備え、前記骨伝導検出素子からの
信号が、音声情報として与えられる。これにより、外部
の雑音などの影響による文字列の誤認識を防止すること
が可能となる。
【0013】また、本発明の目的は、音声情報を与える
ことにより、所望の文字列を入力する文字入力方法であ
って、文字および数字に関する音声情報について各々の
音節単位あるいはアルファベット単位に定められる音声
データ、及び予め定められた単語の音声データとを記憶
するテーブルを参照して、入力された音声情報に対応す
る文字、数字および単語のうちの少なくとも一つを選択
する選択ステップと、前記選択ステップにより選択され
た文字、数字および単語のうちの少なくとも一つを出力
する出力ステップとを備えたことを特徴とする音声処理
方法によっても達成される。
【0014】
【発明の実施の形態】発明の実施の形態1.以下、添付
図面を参照して、本発明の実施の形態に付き説明を加え
る。図1は、本発明の実施の形態にかかる電話機の構成
を示すブロックダイヤグラムである。すなわち、本実施
の形態においては、本発明を電話機に適用している。
【0015】図1に示すように、この電話機10は、公
衆回線と接続され、マイクMCからの音声を公衆回線に向
けて出力し、或いは、公衆回線からの信号をスピーカS
Pに出力する送受話機12と、テンキーや種々のファン
クションキーからなる入力装置14と、液晶ディスプレ
イなどからなる表示装置16と、電話機10の種々の機
能を実現するためのプログラムなどを実行する制御装置
18と、マイクMCから与えられた音声を受け入れて、
この音声を認識する音声処理/認識装置20と、制御装
置18にて実行されるプログラムや、音声処理に必要な
テーブルを記憶したメモリ22とを備えている。
【0016】図2は、このメモリ22のテーブルを示す
図である。図2に示すように、メモリ22のテーブルに
は、アルファベット(“a”ないし“z”)の音声デー
タ、および、数字(“0”ないし“9”)の音声データ
のほか、特定の単語(以下、「特定単語」と称する。)
の音声データが記憶されている。この実施の形態におい
ては、特定単語には、ストップ(Stop)、ブランク(Blan
k)、カンマ(Comma)、アステリスク(Asterisk)、シャー
プ(Sharp)などの特殊文字が含まれる。すなわち、本実
施の形態においては、電話機を使用する際或いは通信の
ために必要な単語のみが、特定単語として選択され、そ
の音声データが、予めテーブルに記憶されている。
【0017】このように構成された電話機の動作につ
き、以下に説明する。この電話機は、通常の通話を実行
する「通話モード」、或いは、特定のダイヤル番号など
を登録するための「登録モード」の何れかの下で作動で
きるようになっている。このモードの切り換えは、入力
装置14の所定のファンクションキーを操作することに
より実行される。また、この実施の形態にかかる電話機
では、各キーと、所定のアルファベットとが対応付けら
れている。たとえば、「1」のキーと、アルファベット
“a”、“b”および“c”とが対応付けられ、「2」
のキーと、アルファベット“d”、“e”および“f”
とが対応付けられている。
【0018】「通話モード」の下において、電話機は、
公衆回線との接続をなして、操作されたキーに対応する
トーンを発生して、相手先との通信を実行する。これに
対して、「登録モード」の下では、図3のフローチャー
トに示す処理を実行する。
【0019】「登録モード」の下で、利用者がマイクMC
を介して、所望の文字列のアルファベットを、音声にて
順次入力する(ステップ301)。たとえば、ここで、
“dictionary”という文字列を入力したい場
合には、“d”、“i”、“c”、“t”、“i”、
“o”、“n”、“a”、“r”、“y”のアルファベ
ットを順次音声にて入力した後に、入力の終了を示す
“Stop”という特定単語を音声により入力する。他の特
定単語を含む場合にも、同様に音声により入力すれば良
い。たとえば、“abc defg*”という文字列を
入力する場合には、“a”、“b”、“c”、“Blan
k”、“d”、“e”、“f”、“g”、“Asterisk”
および“Stop”という文字および特定単語を、音声にて
入力すれば良い。
【0020】音声が入力されると、制御装置18は、入
力された音声信号を、音声処理/認識装置20に伝達す
る。音声処理/認識装置20では、順次入力されたアル
ファベットや数字或いは特定単語ごとの音声データを得
る(ステップ302)。すなわち、入力された文字列の
音声信号を、アルファベットや数字或いは特定単語に分
割する。より詳細には、ある閾値以下のレベルの時間が
所定時間以上続くことを判断することにより、アルファ
ベットごと或いは特定単語ごとの音声データを得ること
ができる。
【0021】次いで、音声処理/認識装置20は、ステ
ップ302にて得られたアルファベットや数字ごと、或
いは、特定単語ごとの音声データと、メモリ22のテー
ブルに記憶された登録されたアルファベットおよび特定
単語の音声データとを照合して、アルファベットおよび
特定単語を特定して、入力された文字列を特定する(ス
テップ303)。
【0022】このときの認識処理は従来のパターンマッ
チングなどの手法を利用できる。例えば、メモリ22に
は、各アルファベット、数字に対応する音声情報(例え
ば、持続時間、時間経過に対応した音声信号の強度情報
周波数分布)が格納されており、音声処理/認識装置2
0は、これら辞書データと実際に入力された音声データ
とを比較する(例えば、数値化された入力音声データと
辞書データとのユークリッド距離を求めたり、ベクトル
の内積などの類似度を求める)ことにより、最も似てい
るもの(距離がもっとも短いもの、類似度がもっとも大
きなもの)を選択することにより、入力された音声デー
タに対応する辞書データを選択する。
【0023】この実施の形態1においては、認識すべき
対象の種類が少ないので、辞書データが小さくてすむと
ともに、これら辞書データ内のデータ相互の距離が大き
く、違いが明らかであるために誤認識が少ないという特
徴もある。したがって、認識率を向上するために複雑な
アルゴリズムを採用する必要はあまりなく、簡便なアル
ゴリズムを採用できる。
【0024】このような処理が終了するのに応答して、
制御装置18は、音声処理/認識装置20から、特定さ
れた文字列のデータを受け入れ、これを表示装置16に
出力する。これにより、表示装置16の画面上に、特定
された文字列が表示される(ステップ304)。たとえ
ば、上述した第1の例では、ディスプレイの画面上に、
“display”という文字列が表示される。
【0025】利用者は、表示装置16の画面上に表示さ
れた文字列を参照して、表示された文字列が異なる場合
には、所定のキー(たとえば、「訂正キー」)を操作す
る(ステップ305でノー(No))。この場合には、ステ
ップ301に戻り、利用者は、再度マイクMCに向かっ
て、文字列を音声にて入力する。これに対して、表示さ
れた文字列と、入力した文字列が一致する場合には、利
用者は他の所定のキー(たとえば、「実行キー」)を操
作する(ステップ305でイエス(Yes))。これによ
り、電話機の状態は、「通常モード」の下となり、処理
が終了する。
【0026】或いは、ステップ305にてノー(No)と判
断された場合には、誤認識された文字のみを、キーを操
作することにより訂正できるように構成しても良い。
【0027】「通常モード」の下においては、上述した
手順にて登録した文字列のうち、所望のものを呼び出
し、この文字列に対応したダイヤルを発信することが可
能である。
【0028】たとえば、“abc defg*”という
登録された文字列を呼び出した場合には、入力装置14
のキーのうち、「通話キー」を操作することにより、上
記文字列に対応するダイヤル“111 2223*”を
発信することができる。
【0029】本実施の形態によれば、アルファベットや
数字、および、電話機を使用する際或いは通信のために
必要な特定単語の音声データが、テーブルに予め記憶さ
れ、利用者は、入力したい文字列に含まれるアルファベ
ットや数字および特定単語を音声にて入力することによ
り、入力した文字列が識別される。このため、テーブル
には、36個のアルファベットおよび数字の音声データ
と、いくつかの特定単語の音声データのみを記憶してお
けば良く、テーブルの容量を低減することが可能とな
り、また、認識処理において、処理時間を短縮すること
が可能となる。
【0030】その一方、利用者は、所望の文字列を登録
する際に、当該文字列を、アルファベットや数字および
特定単語を用いて発音すれば良く、煩雑な手順なく、所
望の文字列を登録することが可能となる。
【0031】従来は、例えば“abc”と入力しようと
するとき、「1」のキーを、1回押して入力し、次に2回
押して入力し、さらに3回押して入力することが必要で
あった。このように“abc”の3文字を入力するとき
に6回も同じキーを押す必要があった。このような不都
合を避けようとして、登録すべき情報を数字のコードで
表現することがなされていたのであるが、この場合、そ
のコードの対応表を持つか、利用者がそれを記憶してお
く必要があり、いずれにしても不便であった。この発明
の実施の形態によれば、かかる不都合を簡単に解消でき
るのである。
【0032】しかも、この発明の実施の形態は非常に簡
単な構成により実現可能であるので、従来の電話機など
の端末装置に適用する場合でも、大掛かりなハードウエ
アの追加は不要であり、マイクロプロセッサを内蔵して
いればわずかなプログラム及び辞書データの追加によ
り、上記機能を簡単に実現することができる。このよう
に容易に実現でき、その効果は非常に大きく、利用者の
便宜に資するこの発明の実施の形態の装置は、従来にま
ったくなく斬新なものである。
【0033】発明の実施の形態2.次に、本発明の第2
の実施の形態にかかる電話機につき説明を加える。この
実施の形態にかかる電話機の構成は、図1に示すものと
同一である。また、「登録モード」での処理も図3に示
すものと同一である。この実施の形態においては、特
に、誤認識が生じるおそれの大きいアルファベットの発
音を、通常の発音と異なるものに変更し、この変更され
た発音に基づく音声データを、テーブルに記憶してい
る。この実施の形態においては、特に、“b”、“d”
および“g”の間で、発音が比較的類似しているため、
これらを図4に示すように、その音声データを変更して
いる。
【0034】利用者は、文字列を入力する際に、その文
字列に“b”、“d”或いは“g”が含まれている場合
には、図4に示すような予め定められた発音にて、その
文字を発音すれば良い。
【0035】本実施の形態によれば、特定の文字につい
ては、他の文字との識別が容易になるように特殊な発音
による音声データがテーブルに記憶されている。したが
って、実施の形態1の場合よりもさらに簡便な構成を実
現しつつ、文字の認識率を向上させることが可能とな
る。
【0036】発明の実施の形態3.次に、本発明の第3
の実施の形態にかかる電話機につき、説明を加える。こ
の実施の形態においては、ユーザが誤認識しやすい文字
列については、ユーザ自身が特殊な発音による音声デー
タを、テーブルに登録できるようになっている。すなわ
ち、第2の実施の形態においては、誤認識の生じるおそ
れの大きい文字の音声データを、予めテーブルに記憶し
ておいたが、本実施の形態においては、ユーザ自身によ
り、所望の文字を選択して、その音声データを、テーブ
ルに登録することができる。
【0037】発明の実施の形態4.次に、本発明の第4
の実施の形態につき説明を加える。図5は、本発明の第
4の実施の形態にかかる電話機のブロックダイヤグラム
である。図5に示すように、この電話機100において
は、図1に示す構成部分に加えて、単語辞書24が設け
られている。単語辞書24には、種々の単語を構成する
文字列の組が予め記憶されている。
【0038】図6は、第4の実施の形態にかかる電話機
の「登録モード」の下で実行される処理を示すフローチ
ャートである。図6において、ステップ601ないし6
03は、図3のステップ301ないし303と同一であ
るので、説明を省略する。ステップ603において、入
力された文字列が特定されると、特定された文字列と、
単語辞書24に登録された単語とが照合される(ステッ
プ604)。ステップ604においては、完全に一致す
る単語のほか、一定の範囲で類似する単語が見出され
る。たとえば、特定された文字列のコストと、単語辞書
24中のある単語のコストとを比較して、その差が所定
の閾値よりも小さい場合には、その単語を、照合結果の
候補とすることができる。
【0039】ステップ604にて得られた候補は、制御
装置18により表示装置16に転送され、表示装置16
の画面上に表示される(ステップ605)。利用者は、
表示された候補を参照して、所望の候補を選択すること
ができる(ステップ606)。この選択も、音声にて実
行することができる。たとえば、利用者が、“CALL
(“C”、“A”、“L”、“L”)”を音声にて入力
したにもかかわらず、ステップ603の音声認識にて、
“CALE”と認識され、さらに、ステップ604にお
いて、二つの候補“CALL”および“CAKE”が得
られた場合を考える。この場合には、表示装置16の画
面上には、“1.CALL 2.CAKE”という文字
が表示される。利用者は、マイクMCを介して“1(on
e)”と、音声にて入力することにより、“CALL”と
いう文字列(単語)が登録される。
【0040】このようにして、必要な単語の選択および
登録が終了すると、電話機の状態は「通常モード」の下
となり、処理が終了する。
【0041】制御装置18は、上記ステップ604ない
しステップ606の処理に応じて、選択された単語の優
先順位を高くして、後の単語辞書24の検索(ステップ
604における「照合」)の際に、この単語が候補とな
る率を上昇させても良い。すなわち、登録の際に使用さ
れた単語は、検索順序の上位に配置し、利用者の癖を含
めて利用頻度の高い単語が候補となりやすくなるように
しても良い。このときの優先度のキーとして使用頻度を
利用することができる。
【0042】本実施の形態によれば、認識された文字列
と単語辞書中の単語とが照合され、照合による候補か
ら、所望の単語が選択されるため、利用者はより容易に
所望の文字列を登録することが可能となる。
【0043】発明の実施の形態5.次に、本発明の第5
の実施の形態にかかる電話機につき説明を加える。この
実施の形態にかかる電話機200においては、図7に示
すように、図1の構成に加えて、利用者の耳の後ろに取
り付けられ、利用者の骨伝導を検出して信号を出力する
骨伝導検出素子26と、骨伝導検出素子26からの信号
をアナログ−ディジタル変換するA/D変換器28とが
設けられている。
【0044】この電話機200においては、「登録モー
ド」の下で、マイクを介した音声を入力するのではな
く、骨伝導検出素子26からの信号を受け入れて、この
信号に基づき、音声認識を実行し、文字列を特定する。
【0045】この実施の形態によれば、骨伝導に基づき
音声情報を入手するため、外部の雑音などの影響によ
り、文字列の誤認識が生じるのを防止することが可能と
なる。
【0046】本発明は、以上の実施の形態に限定される
ことなく、特許請求の範囲に記載された発明の範囲内
で、種々の変更が可能であり、それらも本発明の範囲内
に包含されるものであることは言うまでもない。
【0047】たとえば、前記実施の形態においては、特
定単語として“Stop”、“Blank”、“Comma”、“Aste
risk”および“Sharp”の音声データがテーブルに予め
記憶されているが、特定単語はこれに限定されるもので
はなく、用途などに応じて変更できることは明らかであ
る。たとえば、本発明を、列車や航空券の予約システム
に適用する場合には、列車名や便名、駅名や飛行場名、
“禁煙席”という単語などを特定単語として、その音声
データをテーブルに記憶させておけば良い。従来行われ
ていた電話予約に比べ、不便なコードを使用する必要が
なくなり便利である。
【0048】或いは、アルファベットの音声データにつ
いても、予め各アルファベットの文字と、音声とを対応
付け、その音声データを記憶しても良い。たとえば、
“a”を“alpha”、“b”を“beta”、
“c”を“charley”、“d”を“delta”
という音声と対応つけ、その音声データをテーブルに記
憶しておいても良い。
【0049】さらに、本実施例においては、文字として
アルファベットを用いているが、これに限定されるもの
ではなく、日本語の「かな」を使用しても良いことはい
うまでもない。
【0050】また、前記実施の形態において、記号
「*」には、“Asterisk(アステリスク)”という音声
を対応させているが、たとえば、これに「スター(Sta
r)」という音声を対応させても良い。
【0051】さらに、前記実施の形態においては、特定
単語の音声データを予めテーブルに記憶させているが、
利用者が必要に応じて特定単語およびその音声データを
登録できるように構成しても良い。
【0052】また、前記実施の形態において、認識され
た文字列が表示装置の画面上に表示されているが(たと
えば、図3のステップ304参照)、これに限定される
ものではなく、認識された文字列に対応する音声を、ス
ピーカSPから発するように構成しても良い。
【0053】さらに、前記実施の形態においては、電話
機に本発明を適用しているが、これに限定されるもので
はなく、通信端末やコンピュータ装置にも本発明を適用
できることはいうまでもない。
【0054】また、本明細書において、手段とは必ずし
も物理的手段を意味するものではなく、各手段の機能
が、ソフトウェアによって実現される場合も包含する。
さらに、一つの手段の機能が、二つ以上の物理的手段に
より実現されても、若しくは、二つ以上の手段の機能
が、一つの物理的手段により実現されてもよい。
【0055】
【発明の効果】本発明によれば、メモリの容量をそれほ
ど必要とすることなく、かつ、音声認識処理も短時間に
て実現可能な音声処理装置および文字入力方法を提供す
るが可能となる。
【図面の簡単な説明】
【図1】 図1は、本発明の第1の実施の形態にかかる
電話機の構成を示すブロックダイヤグラムである。
【図2】 図2は、本実施の形態にかかるメモリのテー
ブルを示す図である。
【図3】 図3は、本実施の形態にかかる電話機の「登
録モード」の下にて実行される処理を示すフローチャー
トである。
【図4】 図4は、第2の実施の形態にかかるメモリの
テーブルを示す図である。
【図5】 図5は、本発明の第4の実施の形態にかかる
電話機の構成を示すブロックダイヤグラムである。
【図6】 図6は、第4の実施の形態にかかる電話機の
「登録モード」の下で実行される処理を示すフローチャ
ートである。
【図7】 図7は、本発明の第5の実施の形態にかかる
電話機の構成を示すブロックダイヤグラムである。
【符号の説明】
10 電話機 12 送受話機 14 入力装置 16 表示装置 18 制御装置 20 音声処理/認識装置 22 メモリ 24 単語辞書
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成9年10月2日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声情報を受け入れて、その音声を認識
    する音声処理装置であって、 文字および数字に関する音声情報について各々の音節単
    位あるいはアルファベット単位に定められる音声デー
    タ、及び予め定められた単語の音声データとを記憶する
    テーブルと、 前記テーブルを参照して、入力された音声情報に対応す
    る文字、数字および単語のうちの少なくとも一つを選択
    する認識手段と、 前記認識手段により選択された文字、数字および単語の
    うちの少なくとも一つを出力する出力手段とを備えたこ
    とを特徴とする音声処理装置。
  2. 【請求項2】 前記テーブルに、相互に発音の類似する
    文字あるいは数字に関して、通常の発音と異なる発音の
    音声データが記憶されていることを特徴とする請求項1
    に記載の音声処理装置。
  3. 【請求項3】 さらに、複数の単語の文字列を記憶する
    単語辞書と、 前記認識手段により認識された文字、数字および単語の
    うちの少なくともいずれかからなる文字列と、前記単語
    辞書に記憶された文字列とを照合する照合手段とを備
    え、 前記出力手段は、前記照合手段による照合の結果得られ
    た単語の候補を出力することを特徴とする請求項1また
    は請求項2に記載の音声処理装置。
  4. 【請求項4】 さらに、前記出力手段により出力された
    単語の候補が複数のときに、これら単語の候補から少な
    くとも一つを選択する選択手段を備えたことを特徴とす
    る請求項3に記載の音声処理装置。
  5. 【請求項5】 さらに、単語の優先度を定める所定の情
    報を、前記選択手段による選択結果に基づき前記単語辞
    書に付加する学習手段を備えたことを特徴とする請求項
    3に記載の音声処理装置。
  6. 【請求項6】 さらに、利用者に取り付けられ、当該利
    用者の骨伝導を検出する骨伝導検出素子を備え、 前記骨伝導検出素子からの信号が、前記音声情報として
    与えられることを特徴とする請求項1ないし請求項5の
    何れか一項に記載の音声処理装置。
  7. 【請求項7】 音声情報を与えることにより、所望の文
    字列を入力する文字入力方法であって、 文字および数字に関する音声情報について各々の音節単
    位あるいはアルファベット単位に定められる音声デー
    タ、及び予め定められた単語の音声データとを記憶する
    テーブルを参照して、入力された音声情報に対応する文
    字、数字および単語のうちの少なくとも一つを選択する
    選択ステップと、 前記選択ステップにより選択された文字、数字および単
    語のうちの少なくとも一つを出力する出力ステップとを
    備えたことを特徴とする音声処理方法。
JP9256753A 1997-09-22 1997-09-22 音声処理装置および文字入力方法 Withdrawn JPH1195792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9256753A JPH1195792A (ja) 1997-09-22 1997-09-22 音声処理装置および文字入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9256753A JPH1195792A (ja) 1997-09-22 1997-09-22 音声処理装置および文字入力方法

Publications (1)

Publication Number Publication Date
JPH1195792A true JPH1195792A (ja) 1999-04-09

Family

ID=17296975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9256753A Withdrawn JPH1195792A (ja) 1997-09-22 1997-09-22 音声処理装置および文字入力方法

Country Status (1)

Country Link
JP (1) JPH1195792A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006523904A (ja) * 2003-04-18 2006-10-19 ガーサビアン、ベンジャミン、フィルーツ 移動体及び固定環境内でのデータ入力向上システム
JP2010049699A (ja) * 1999-10-27 2010-03-04 Ghassabian Benjamin Firooz 一体型キーパッドシステム
US9158388B2 (en) 2005-06-16 2015-10-13 Keyless Systems Ltd. Data entry system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010049699A (ja) * 1999-10-27 2010-03-04 Ghassabian Benjamin Firooz 一体型キーパッドシステム
JP2006523904A (ja) * 2003-04-18 2006-10-19 ガーサビアン、ベンジャミン、フィルーツ 移動体及び固定環境内でのデータ入力向上システム
US9158388B2 (en) 2005-06-16 2015-10-13 Keyless Systems Ltd. Data entry system

Similar Documents

Publication Publication Date Title
KR101109265B1 (ko) 텍스트 입력 방법
US8229747B2 (en) System and method for spelling recognition using speech and non-speech input
US20030112277A1 (en) Input of data using a combination of data input systems
US6674372B1 (en) Chinese character input method using numeric keys and apparatus thereof
CN110827803A (zh) 方言发音词典的构建方法、装置、设备及可读存储介质
JP2002116793A (ja) データ入力システム及びその方法
JPH1195792A (ja) 音声処理装置および文字入力方法
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
EP1187431B1 (en) Portable terminal with voice dialing minimizing memory usage
JP2002073074A (ja) 音声による数字列認識方法ならびに装置
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JPH0863185A (ja) 音声認識装置
JP2007163967A (ja) 音声認識装置及び音声認識方法
JPH09230889A (ja) 音声認識応答装置
JP2002189490A (ja) ピンイン音声入力の方法
WO2007052281A1 (en) Method and system for selection of text for editing
JP3018759B2 (ja) 特定話者方式音声認識装置
JPH11261683A (ja) 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体
TWI247273B (en) Hand-held interactive dictionary looking up apparatus and method
JP2001159896A (ja) 音声認識機能を利用した簡易文字入力方法
JPH09288495A (ja) ボタン指定・音声認識併用型入力方法及び装置
JPH1063292A (ja) 音声処理装置および音声処理方法
JPH1063295A (ja) 認識結果を自動訂正する単語音声認識方法およびこの方法を実施する装置
JP2001282287A (ja) 音声認識装置
JP2995941B2 (ja) 不特定話者用音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207