JP4983587B2 - 単音節入力装置 - Google Patents

単音節入力装置 Download PDF

Info

Publication number
JP4983587B2
JP4983587B2 JP2007327307A JP2007327307A JP4983587B2 JP 4983587 B2 JP4983587 B2 JP 4983587B2 JP 2007327307 A JP2007327307 A JP 2007327307A JP 2007327307 A JP2007327307 A JP 2007327307A JP 4983587 B2 JP4983587 B2 JP 4983587B2
Authority
JP
Japan
Prior art keywords
single syllable
input
group
voice
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007327307A
Other languages
English (en)
Other versions
JP2009150991A (ja
Inventor
佑哉 服部
一郎 赤堀
まなぶ 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2007327307A priority Critical patent/JP4983587B2/ja
Publication of JP2009150991A publication Critical patent/JP2009150991A/ja
Application granted granted Critical
Publication of JP4983587B2 publication Critical patent/JP4983587B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、単音節に区切って発声された音声に基づいて単音節を入力する単音節入力装置に関する。
従来、話者によって入力された音声に基づいて、話者の意図する単音節を一単音節ずつ認識する単音節音声認識装置が広く知られている。このような単音節音声認識装置は、単語(即ち、複数の単音節からなる語)単位の音声認識を行う音声認識装置と異なり、音声認識を行う単語全てに対応する単語辞書を予め備えている必要がない。従って、最終的な入力結果の集合として、どのような単語や文章でも入力することができるという利点がある。このため、使用者がデータに任意の名前を付けるような場合に特に有効である。
このような単音節音声認識装置は、文字を50音表からタッチパネルで選ぶ方法や、携帯電話で用いられているような複数個のスイッチを用いて文字を入力する方法に比べて、ハンドルを握った状態で操作できるという点や視覚的な確認作業が必要なくなるという点において、車両等の運転中の操作に向いている。
しかし、単音節の音声を認識する場合は、単語単位の音声認識に比較して認識手がかりが少ないため、一般的に認識率が低い。そのため、このような単音節の音声を認識する音声認識装置では、より認識精度を向上させるために様々な工夫が施されている。
例えば、話者が例えば「あいうえおのあ」と入力することによって単音節の音声「あ」を認識するものが知られている(例えば、特許文献1を参照)。このように、話者が単音節よりも長い単音節認識用特定語を入力することにより、単に単音節を入力する場合と比較して音声認識装置の認識精度を向上させることができる。また、子音または母音を入力するスイッチ操作と音声入力とを併用することで認識性能を補おうとするものや(例えば、特許文献2を参照)、ダイヤルキーのような複数操作が可能な単一の装置を用い、認識した単音節の候補の選択及び決定を行うものが知られている(例えば、特許文献3を参照)。
特開平11−184495号公報 特開平9−288495号公報 特開平10−149194号公報
しかし上述の特許文献1に記載の技術では、話者が必要以上に長く発話する必要があり、入力に手間がかかるという問題があった。
また上述の特許文献2に記載の技術では、多くのスイッチが必要となるために、製造コストがかかる上にスイッチ操作が複雑になり、車両運転中の利用には適さないという問題があった。
また上述の特許文献3に記載の技術では、ダイヤルキーのような操作手段は製造コストがかかる上にスイッチ操作が複雑になるために、車両運転中の利用には適さないという問題があった。
本発明は、こうした問題に鑑みなされたものであり、低コストで、かつ簡単な操作で精度の高い単音節入力が可能な単音節入力装置を提供することを目的とする。
上記目的を達成するためになされた請求項1に記載の単音節入力装置では、押下操作が可能な押下操作手段と、日本語の単音節を複数の単音節グループに分割し、複数の単音節グループ毎に、単音節グループに属する単音節と、単音節グループを指定するための単音節である指定用単音節とが対応付けられたテーブルである単音節グループ・テーブルを記憶する記憶手段とを備え、まず、音声入力手段が音声を入力し、グループ特定手段が、音声入力手段に入力した音声のうち、単音節単位で区切って発声された音声を音声認識処理するとともに、記憶手段に記憶された単音節グループ・テーブルを参照することにより、音声入力手段に入力した指定用単音節である入力指定用単音節を特定する。そして第1報知手段が、グループ特定手段により特定された入力指定用単音節に対応する単音節グループである入力単音節グループを報知する。その後に入力決定手段が、記憶手段に記憶された単音節グループ・テーブルと、押下操作手段が押下操作された回数とに基づいて、入力単音節グループに属する単音節の中から、入力すべき単音節である入力単音節を選択し、その後、予め設定された第1単音節決定条件が成立すると、選択された単音節を前記入力単音節として決定する。そして第1無効手段が、入力決定手段により入力単音節が選択される前に、再発声された音声が音声入力手段に入力した場合に、入力単音節グループを無効にする。
このように構成された単音節入力装置によれば、音声入力手段に単音節が入力した場合に、まず、入力指定用単音節が特定される。そして、入力指定用単音節が特定されると、特定された入力指定用単音節に対応する単音節グループ(入力単音節グループ)が報知される。これにより利用者は、どの単音節グループが特定されたかを認識することができる。そして利用者は、押下操作手段を押下操作する回数により、入力単音節グループに属する単音節の中から、入力すべき単音節である入力単音節を決定する。
即ち、音声認識により認識する必要があるのは、単音節よりも数が少ない指定用単音節である。このため、音声入力した単音節を直接音声認識する場合と比較して、音声認識における誤認識を減少させることができる。また、グループ特定手段により特定された指定用単音節が誤っている場合に、再発話を行うだけで入力単音節グループを無効にすることができるので、無効にするために何らかの操作を行い、その後再び発話するのに比べて手間を減らすことができ、使い勝手が向上する。
更に、押下操作手段を押下するという簡単な操作で、入力単音節を決定することができるので、車両運転中における単音節入力に好適である。また押下操作手段は、単に押下操作を検出できればよいので、ダイヤルキーのような操作手段と比較して構成を簡略化できる。このため、低コストで単音節入力装置を製造することができる。
ところで、キーボードによる日本語の単音節入力として、ローマ字入力方式が普及している。そこで、請求項1に記載の単音節入力装置では、請求項2に記載のように、単音節グループは、50音の行毎に分割されているようにしてもよい。
例えば、「か」、「き」、「く」、「け」、「こ」をか行を表す1つの単音節グループとする。
なお、清音(例えば「あ」、「い」、「う」、「え」、「お」、「か」、「き」、「く」、「け」、「こ」等)だけでなく、濁音(例えば「が」、「ぎ」、「ぐ」、「げ」、「ご」等)、半濁音(「ぱ」、「ぴ」、「ぷ」、「ぺ」、「ぽ」)、拗音(「ゃ」、「ゅ」、「ょ」)を含む単音節(例えば「みゃ」、「みゅ」、「みょ」等)についても、清音と同様に行として分割するようにしてもよい(上記例はそれぞれ、が行、ぱ行、みゃ行とする)。
このように構成された単音節入力装置によれば、ローマ字入力方式という日本で普及した方式とも一致する方法で単音節グループが分割されるので、どの単音節グループに、どのような単音節がふくまれているかを、利用者が容易に把握することができる。例えば、さ行の単音節グループといえば、「さ」、「し」、「す」、「せ」、「そ」と容易に想起することができる。また、1つの単音節グループに含まれる単音節は最大5個であるので、入力単音節を決定するために押下操作手段が押下操作される回数を5回以下とすることができる。つまり、1つの単音節グループに多くの単音節が含まれ、必要な押下操作回数が多くなることにより、単音節の入力に要する時間が長くなってしまうことを防止することができる。
また日本語の単音節は、50音表で示されるように、同一の子音を有する単音節を「行」として分割されている。そして、各行を識別するために、母音が「あ」となる単音節を用いた名称が付されている。例えば、「た」行といえば、「た」、「ち」、「つ」、「て」、「と」を示す。
そこで、請求項2に記載の単音節入力装置では、請求項3に記載のように、指定用単音節は、母音が「あ」となる単音節であるようにするとよい。
このように構成された単音節入力装置によれば、第1報知手段が指定用単音節を報知すると、日本語を理解する利用者は、報知されている入力単音節グループを容易に識別することができる。
また、日本語の単音節は、50音表で示されるように、同一の行において、母音が「あ」「い」、「う」、「え」、「お」である単音節の順で並べられる。例えば、「な」行では、「な」、「に」、「ぬ」、「ね」、「の」の順で並べられる。
そこで、請求項2または請求項3に記載の単音節入力装置では、請求項4に記載のように、入力決定手段は、押下操作手段が押下操作された回数が1回、2回、3回、4回、及び5回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節を選択するようにするとよい。
このように構成された単音節入力装置によれば、同一の単音節グループにおける単音節と押下操作の回数との対応関係を、利用者が容易に把握することができる。
また請求項1〜請求項4の何れかに記載の単音節入力装置では、請求項5に記載のように、グループ特定手段は、第1無効手段が入力単音節グループを無効にした後に再び入力指定用単音節を特定する場合には、第1無効手段により無効にされた入力単音節グループに対応する指定用単音節を除外して、指定用単音節を特定するようにしてもよい。
このように構成された単音節入力装置によれば、何度発話しても正しい入力指定用単音節が特定されないという事態に陥ることを防止でき、使い勝手が向上する。
また請求項1〜請求項4の何れかに記載の単音節入力装置では、請求項6に記載のように、第2無効手段が、第1報知手段が指定用単音節を報知してから予め設定された第1入力無効時間が経過するまでの間に押下操作手段が押下操作されなかった場合に、グループ特定手段により特定された入力単音節グループを無効にするようにしてもよい。
このように構成された単音節入力装置によれば、グループ特定手段により特定された入力単音節グループが誤っている場合に、押下操作を行わないことにより入力単音節グループを無効にすることができるので、無効にするために何らかの操作を行うことを不要とすることができ、使い勝手が向上する。
また請求項6に記載の単音節入力装置では、請求項7に記載のように、グループ特定手段は、第2無効手段が入力単音節グループを無効にした後に再び入力指定用単音節を特定する場合には、第2無効手段により無効にされた入力単音節グループに対応する指定用単音節を除外して、入力指定用単音節を特定するようにしてもよい。
このように構成された単音節入力装置によれば、請求項5に記載の単音節入力装置と同様の効果を奏する。
また請求項1〜請求項4の何れかに記載の単音節入力装置では、請求項8に記載のように、グループ特定手段は、音声認識処理による認識結果を信頼度の順に、認識した複数の指定用単音節を順位付けし、第2報知手段は、グループ特定手段により順位付けされた順位である音声認識順位の高いものから指定用単音節に対応する単音節グループを報知し、更にグループ特定手段は、音声認識順位の高いものから第2報知手段が単音節グループを報知してから予め設定された第2入力無効時間が経過するまでの間に押下操作手段が押下操作されなかった場合には、音声認識順位が最も高い指定用単音節を除外して、再度、指定用単音節の順位付けを行うとともに、音声認識順位の高いものから第2報知手段が単音節グループを報知してから第2入力無効時間が経過するまでの間に押下操作手段が押下操作された場合には、第2報知手段により報知された単音節グループの中で最も順位が高い入力単音節グループに対応する指定用単音節を入力指定用単音節として特定するようにしてもよい。
このように構成された単音節入力装置によれば、一度に複数の入力単音節グループが報知され、その中から、認識結果が正しい単音節グループを選択することができる。このため、グループ特定手段により指定用単音節を1つのみ特定する場合と比較して、グループ特定手段により特定された指定用単音節が誤っているために再発話して、再度、音声認識を行わせるという事態に陥ることを抑制でき、使い勝手が向上する。
また、請求項1〜請求項8の何れかに記載の単音節入力装置では、第1単音節決定条件は、請求項9に記載のように、入力決定手段により単音節が選択された後に、発声された音声が音声入力手段に入力したことであるようにしてもよいし、請求項10に記載のように、入力決定手段により単音節が選択されてから予め設定された第1入力決定時間が経過するまでの間に押下操作手段が押下操作されなかったことであるようにしてもよい。
このように構成された単音節入力装置によれば、入力単音節を決定するための押下操作を減らすことができ、使い勝手が向上する。
また、請求項2または請求項3に記載の単音節入力装置では、請求項11に記載のように、入力決定手段は、押下操作手段が押下操作された回数が0回、1回、2回、3回、及び4回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節を選択し、その後、予め設定された第2単音節決定条件が成立すると、選択された単音節を入力単音節として決定するようにしてもよい。
このように構成された単音節入力装置によれば、「あ」の単音節を選択する場合には押下操作が不要となり、入力単音節を決定するために押下操作手段が押下操作される回数を4回以下とすることができる。即ち、請求項4に記載の単音節入力装置と比較して、押下操作の回数を減らすことができ、その分、単音節の入力に要する時間を短縮することができる。
また請求項11に記載の単音節入力装置では、請求項12に記載のように、第2単音節決定条件は、入力決定手段により単音節が選択されてから予め設定された第2入力決定時間が経過するまでの間に押下操作手段が押下操作されなかったことであるようにしてもよい。
このように構成された単音節入力装置によれば、入力単音節を決定するための押下操作を減らすことができすることができ、使い勝手が向上する。
また請求項12に記載の単音節入力装置では、請求項13に記載のように、第3無効手段が、第2単音節決定条件が成立する前に、発声された音声が音声入力手段に入力した場合に、入力単音節グループを無効にするようにしてもよい。
このように構成された単音節入力装置によれば、請求項1に記載の単音節入力装置と同様の効果を奏する。
また請求項13に記載の単音節入力装置では、請求項14に記載のように、グループ特定手段は、第3無効手段が入力単音節グループを無効にした後に再び入力指定用単音節を特定する場合には、第3無効手段により無効にされた入力単音節グループに対応する指定用単音節を除外して、入力指定用単音節を特定するようにしてもよい。
このように構成された単音節入力装置によれば、請求項5に記載の単音節入力装置と同様の効果を奏する。
また請求項11に記載の単音節入力装置では、請求項15に記載のように、第2単音節決定条件は、入力決定手段により単音節が選択されてから、発声された音声が音声入力手段に入力したことであるようにしてもよい。
このように構成された単音節入力装置によれば、請求項12に記載の単音節入力装置と同様の効果を奏する。
また請求項15に記載の単音節入力装置では、請求項16に記載のように、第4無効手段が、入力決定手段により単音節が選択されてから、予め設定された第3入力無効時間が経過するまでの間に押下操作手段が押下操作されなかった場合に、入力単音節グループを無効にするようにしてもよい。
このように構成された単音節入力装置によれば、請求項6に記載の単音節入力装置と同様の効果を奏する。
また請求項16に記載の単音節入力装置では、請求項17に記載のように、グループ特定手段は、第4無効手段が入力単音節グループを無効にした後に再び入力指定用単音節を特定する場合には、第4無効手段により無効にされた入力単音節グループに対応する指定用単音節を除外して、入力指定用単音節を特定するようにしてもよい。
このように構成された単音節入力装置によれば、請求項5に記載の単音節入力装置と同様の効果を奏する。
また、請求項1〜請求項17の何れかに記載の単音節入力装置では、請求項18に記載のように、第1音声特定手段が、音声入力手段に入力した音声のうち、濁点、半濁点、促音、拗音、及び長音符の少なくとも一つを入力するために発声された入力指示音声を特定するようにしてもよい。
このように構成された単音節入力装置によれば、利用者が入力指示音声を発声することにより濁点、半濁点、促音、拗音、及び長音符を入力することが可能となる。
濁点、半濁点、拗音を入力するための入力指示音声を用意した場合、あ行からわ行までの清音の単音節グループのみを利用すればいいので、音声認識処理の誤認識を更に減らすことができる。
また、請求項1〜請求項18の何れかに記載の単音節入力装置では、請求項19に記載のように、第2音声特定手段が、音声入力手段に入力した音声のうち、入力単音節を決定するために発声される単音節決定指示音声、入力単音節を訂正するために発声される単音節訂正指示音声、及び単音節の入力を終了するために発声される単音節終了指示音声の少なくとも一つを特定するようにしてもよい。
このように構成された単音節入力装置によれば、利用者が単音節決定指示音声、単音節訂正指示音声、及び単音節終了指示音声を発声することにより、それぞれ入力単音節の決定、入力単音節の訂正、及び単音節の入力終了を指示することが可能となり、運転中の操作としてより優れている。
ところで、カーナビゲーション装置などの車両用音声認識機器には発話開始スイッチを備えていることが多いので、請求項1〜請求項19の何れかに記載の単音節入力装置では、請求項20に記載のように、音声入力手段は、押下操作手段が押下操作された後に、音声の入力を受け付けるように構成されているようにするとよい。

このように構成された単音節入力装置によれば、押下操作手段は、発話開始スイッチと、単音節を入力するための単音節入力スイッチとを兼ねることができる。これにより、単音節入力装置の低コスト化に寄与することができる。また、発話開始スイッチと単音節入力スイッチとが別々に設けられている場合と比較して、スイッチ操作の煩雑さを抑えることができる。
(第1実施形態)
以下に本発明の第1実施形態について図面とともに説明する。
図1は本実施形態の単音節入力装置1の構成を示すブロック図である。
単音節入力装置1は、車両に搭載され、図1に示すように、運転者が発話した音声を入力する音声入力部2と、各種のガイド音声等を出力するための音声出力部3と、各種表示を行うための表示部4と、運転者による押し下げ操作(以下、押下操作ともいう)が行われる操作スイッチ5と、各種データを記憶するデータ記憶装置6と、上述した音声入力部2、操作スイッチ5及びデータ記憶装置6からの入力に応じて各種処理を実行し、音声出力部3及び表示部4を制御する制御部7とを備えている。
これらのうち音声入力部2は、図2に示すように、運転席にいる運転者からの声を入力し易いように、運転席の前方に取り付けられる。同様に表示部4は、運転席にいる運転者から見え易いように、運転席の前方に取り付けられる。また操作スイッチ5は、運転中の運転者が操作し易いように、ステアリングSTに取り付けられている。
また制御部7は、図1に示すように、経過時間を計測するタイマTMを備える。
またデータ記憶装置6は、例えばハードディスクなどの磁気記憶装置であり、単音節グループ・テーブル6aを記憶する領域を備えている。
この単音節グループ・テーブル6aは、図3に示すように、日本語の単音節を複数の単音節グループに分割し、単音節グループ毎に、単音節グループに属する単音節と、単音節グループを指定するためのグループ指定用単音節とが対応付けられたテーブルである。尚、単音節グループ・テーブル6a内の単音節グループには、単音節グループを識別するための単音節グループ識別番号が付されている。
また単音節グループ・テーブル6aには、清音(例えば「あ」、「い」、「う」、「え」、「お」、「か」、「き」、「く」、「け」、「こ」等)、濁音(例えば「が」、「ぎ」、「ぐ」、「げ」、「ご」等)、半濁音(「ぱ」、「ぴ」、「ぷ」、「ぺ」、「ぽ」)、拗音(「ゃ」、「ゅ」、「ょ」)を含む単音節(例えば「みゃ」、「みゅ」、「みょ」等)が記憶されている。
そして、単音節グループ・テーブル6a内の単音節グループは、50音の行毎に分割されている。
例えば、単音節グループ識別番号が「2」である単音節グループに属する単音節は、か行を構成する「か」、「き」、「く」、「け」、「こ」である。また、単音節グループ識別番号が「20」である単音節グループに属する単音節は、みゃ行を構成する「みゃ」、「みゅ」、「みょ」である。
また、各単音節グループに対応して設定されているグループ指定用単音節は、各単音節グループ内の単音節の中で、母音が「あ」となる単音節である。
例えば、単音節グループ識別番号が「2」である単音節グループに属する単音節は、「か」、「き」、「く」、「け」、「こ」である。これらの単音節のなかで、母音が「あ」となる単音節は「か」であるので、グループ指定用単音節として「か」が設定される。
このように構成された単音節入力装置1において、制御部7は、単音節を入力する単音節入力処理を実行する。
ここで、単音節入力装置1の制御部7が実行する単音節入力処理の手順を、図4を用いて説明する。図4は単音節入力処理を示すフローチャートである。
この単音節入力処理は、当該処理が実行されていない状態で操作スイッチ5が押下操作されるごとに実行が開始される処理である。
音声対話処理が実行されると、制御部7は、まずS10にて、音声入力部2に音声が入力したか否かを判断する。ここで音声が入力していない場合には(S10:NO)、S10の処理を繰り返し、音声入力部2に音声が入力されるまで待機する。一方、音声が入力した場合には(S10:YES)、S20にて、音声入力部2に入力した音声について音声認識を行う。
なおS20では、後述の処理で、S20での音声認識結果がキャンセルされた場合には、キャンセルされた音声認識結果により示されるグループ指定用単音節を除外して音声認識を行う。例えば、S100の処理で「ま」行の単音節グループがキャンセルされた場合には、次の音声認識で、「ま」行の単音節グループのグループ指定用単音節(即ち「ま」)を除外して音声認識を行う。
その後S30にて、S20での音声認識結果に基づき、単音節入力処理を終了させるための終了コマンドが入力されたか否かを判断する。尚、この終了コマンドが入力されたか否かは、音声認識結果が「おわり」という単語であるか否かにより判断される。
ここで、終了コマンドが入力された場合には(S30:YES)、単音節入力処理を終了する。一方、終了コマンドが入力されていない場合には(S30:NO)、S40にて、S20での音声認識結果に基づき、促音「っ」を入力するための促音コマンドが入力されたか否かを判断する。尚、この促音コマンドが入力されたか否かは、音声認識結果が「ちいさいつ」(即ち、「小さい‘つ’」)という単語であるか否かにより判断される。
ここで、促音コマンドが入力された場合には(S40:YES)、後述の入力テキストボックスNH1(図5を参照)に促音「っ」を入力し、S10に移行して、上述の処理を繰り返す。一方、促音コマンドが入力されていない場合には(S40:NO)、S60にて、S20での音声認識結果と単音節グループ・テーブル6aとに基づき、グループ指定用単音節が入力されたか否かを判断する。ここで、グループ指定用単音節が入力されていない場合には(S60:NO)、S10に移行して、上述の処理を繰り返す。
一方、グループ指定用単音節が入力された場合には(S60:YES)、S70にて、S20での音声認識結果を表示部4に表示させる。具体的には、S20での音声認識結果に基づき、音声認識結果が正しい可能性の最も高いグループ指定用単音節が属する単音節グループの候補を表示する。例えば、「ま」という単音節の音声が音声入力部2に入力して、S20での音声認識結果のうち最も信頼度の高いグループ指定用単音節として「ま」が認識された場合には、単音節グループが「ま」行であることを表示する。
例えば、図5(a)に示すように、表示部4の表示画面4aに単音節を入力するための入力テキストボックスNH1が表示されている場合に(図5(a)は、入力テキストボックスNH1に「なか」という文字が入力されており、次の文字の入力を待っている状態を示す。)、音声入力部2に単音節が入力されると、図5(b)に示すように、音声認識により認識された単音節グループの候補を示す単音節候補表示PH1が表示画面4aに表示される。単音節候補表示PH1は、音声認識により認識された単音節グループのグループ指定用単音節を表示する。例えば図5(b)において、単音節候補表示PH1は、「ま」行の単音節グループであることを示している。
その後S80にて、タイマTMを起動する。これによりタイマTMは、当該タイマTMが起動してからの経過時間を計測する。そしてS90にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S90:YES)、S110にて、単音節候補表示PH1に示された行に単音節グループを決定するとともに、その行の1段目を選択する。例えば図5(b)において、単音節候補表示PH1は、「ま」を表示しているので、単音節グループを「ま」行に決定する。更に、「ま」行の1段目は「ま」であるので、「ま」を選択する。
更にS120にて、タイマTMを起動する。これによりタイマTMは、当該タイマTMが起動してからの経過時間を計測する。即ち、S80での起動で計測されていた経過時間がリセットされて、再度、経過時間の計測が開始される。
そしてS130にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S130:YES)、S140にて、選択されている単音節を、次の段の単音節に変更する。例えば、「ま」行の1段目の「ま」が選択されている状態で、操作スイッチ5が押下操作されると、「ま」行の2段目の「み」が選択される。
その後S150にて、選択されている単音節を表示部4に表示させて、S120に移行し、上述の処理を繰り返す。例えば、「ま」行の1段目の「ま」が選択されている状態から更に操作スイッチ5が2回押下操作されると、「ま」行の3段目の「む」が選択されて、図5(c)に示すように、選択されている単音節を示す単音節選択表示PH2が表示画面4aに表示される。
一方、S130にて、操作スイッチ5が押下操作されない場合には(S130:NO)、S160にて、タイマTMにて計測された経過時間が予め設定された決定判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節が選択されてから決定判定時間が経過したか否かを判断する。
ここで、決定判定時間が経過していない場合には(S160:NO)、S130に移行し、上述の処理を繰り返す。一方、決定判定時間が経過した場合には(S160:YES)、S170にて、現在選択されている単音節を、入力すべき単音節(以下、入力単音節ともいう)と決定し、S10に移行する。これにより、図5(d)に示すように、入力単音節が、表示部4の表示画面4aに表示されている入力テキストボックスNH1に、入力単音節が追加される。
一方、S90にて、操作スイッチ5が押下操作されない場合には(S90:NO)、S100にて、タイマTMにて計測された経過時間が予め設定された無効判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節候補表示PH1が表示されてから無効判定時間が経過したか否かを判断する。
ここで、無効判定時間が経過していない場合には(S100:NO)、S90に移行し、上述の処理を繰り返す。一方、無効判定時間が経過した場合には(S100:YES)、S10に移行して、上述の処理を繰り返す。即ち、S20での音声認識結果をキャンセルし、再度、音声入力部2に入力した音声について音声認識を行う。
このように構成された単音節入力装置1では、音声入力部2が音声を入力し、音声入力部2に入力した音声のうち、単音節単位で区切って発声された音声を音声認識処理するとともに、データ記憶装置6に記憶された単音節グループ・テーブル6aを参照することにより、グループ指定用単音節を特定する(S20,S60)。そして、特定されたグループ指定用単音節に対応する単音節グループを表示する(S70)。その後に、単音節グループ・テーブル6aと、操作スイッチ5が押下操作された回数とに基づいて、単音節グループに属する単音節の中から、入力すべき単音節(入力単音節)を決定する(S80〜S170)。
このように構成された単音節入力装置1によれば、音声認識により認識する必要があるのは、単音節よりも数が少ないグループ指定用単音節である。このため、入力した単音節を直接認識する場合と比較して、入力すべき単音節を認識する場合の認識精度を向上させることができる。
更に、操作スイッチ5を押下するという簡単な操作で、入力単音節を決定することができるので、車両運転中における単音節入力に好適である。また操作スイッチ5は、単に押下操作を検出できればよいので、ダイヤルキーのような操作手段と比較して構成を簡略化できる。このため、低コストで単音節入力装置1を製造することができる。
また単音節グループは、50音の行毎に分割されている。つまり、50音という日本でよく用いられる方法で単音節グループが分割されるので、どの単音節グループに、どのような単音節がふくまれているかを、利用者が容易に把握することができる。
またグループ指定用単音節は、母音が「あ」となる単音節である。このため、利用者は、例えば、グループ指定用単音節が「ま」である場合には単音節グループが「ま」行であるというように、グループ指定用単音節が表示されることにより単音節グループを容易に識別することができる。
また、操作スイッチ5が押下操作された回数が1回、2回、3回、4回、及び5回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節が選択される。このため利用者は、50音表に基づいて、同一の単音節グループにおける単音節と押下操作の回数との対応関係を、容易に把握することができる。
また、単音節候補表示PH1が表示されてから無効判定時間が経過するまでに操作スイッチ5が押下操作されなかった場合に(S100:YES)、S20での音声認識結果がキャンセルされる。このため、S20での音声認識結果が誤っている場合に、押下操作を行わないことにより、認識された単音節グループを無効にすることができるので、無効にするために何らかの操作を行うことを不要とすることができ、使い勝手が向上する。
また、S20の処理では、音声認識結果がキャンセルされた場合には、キャンセルされた音声認識結果により示されるグループ指定用単音節を除外して音声認識を行う。このため、何度発話しても正しいグループ指定用単音節が特定されないという事態に陥ることを防止でき、使い勝手が向上する。
また、単音節が選択されてから決定判定時間が経過するまでの間に操作スイッチ5が押下操作されなかった場合に(S130:NO,S160:YES)、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定する(S170)。このため、入力単音節を決定するための押下操作を減らすことができすることができ、使い勝手が向上する。
また、促音を入力するために発声される促音コマンドを特定することができる(S20,S40)。このため、利用者が促音コマンドを発声することにより促音を入力することが可能となり、押下操作が行われる回数を減らすことができるので、使い勝手が向上する。
また、単音節の入力を終了するために発声される終了コマンドを特定することができる(S20,S30)。このため、利用者が終了コマンドを発声することにより単音節の入力終了を指示することが可能となり、押下操作が行われる回数を減らすことができるので、使い勝手が向上する。
また、操作スイッチ5が押下操作されると、音声の入力を受け付けるように構成されている(S10)。このため操作スイッチ5は、発話開始スイッチと、単音節を入力するための単音節入力スイッチとを兼ねることができる。これにより、単音節入力装置1の低コスト化に寄与することができる。また、発話開始スイッチと単音節入力スイッチとが別々に設けられている場合と比較して、スイッチ操作の煩雑さを抑えることができる。
以上説明した実施形態において、音声入力部2は本発明における音声入力手段、操作スイッチ5は本発明における押下操作手段、データ記憶装置6は本発明における記憶手段、S20及びS60の処理は本発明におけるグループ特定手段、S70の処理は本発明における第1報知手段、S80〜S170の処理は本発明における入力決定手段、グループ指定用単音節は本発明における指定用単音節、S130及びS160の条件は本発明における第1単音節決定条件である。
また、S100の処理は本発明における第2無効手段、S20及びS40の処理は本発明における第1音声特定手段、S20及びS30の処理は本発明における第2音声特定手段、無効判定時間は本発明における第1入力無効時間である。
(第2実施形態)
以下に本発明の第2実施形態について図面とともに説明する。尚、第2実施形態では、第1実施形態と異なる部分のみを説明する。
第2実施形態における単音節入力装置1は、単音節入力処理が変更された点以外は第1実施形態と同じである。
次に、第2実施形態の単音節入力処理手順を図6を用いて説明する。図6は第2実施形態の単音節入力処理を示すフローチャートである。
図6に示すように、第2実施形態の単音節入力処理が第1実施形態と異なるのは、S100の処理が省略されて、S102の処理が追加された点である。
即ち、S90にて、操作スイッチ5が押下操作されない場合には(S90:NO)、S102にて、音声入力部2に音声が入力したか否かを判断する。ここで音声が入力していない場合には(S102:NO)、S90に移行し、上述の処理を繰り返す。一方、音声が入力した場合には(S102:YES)、S20に移行して、上述の処理を繰り返す。即ち、S20での音声認識結果をキャンセルし、再度、音声入力部2に入力した音声について音声認識を行う。
このように構成された単音節入力装置1では、操作スイッチ5が押下操作される前に、音声が入力した場合には(S102:YES)、S20での音声認識結果がキャンセルされる。このため、S20での音声認識結果が誤っている場合に、再発話を行うだけで、認識された単音節グループを無効にすることができるので、無効にするために何らかの操作を行うことを不要とすることができ、使い勝手が向上する。
以上説明した実施形態において、S102の処理は本発明における第1無効手段である。
(第3実施形態)
以下に本発明の第3実施形態について図面とともに説明する。尚、第3実施形態では、第1実施形態と異なる部分のみを説明する。
第3実施形態における単音節入力装置1は、単音節入力処理が変更された点以外は第1実施形態と同じである。
次に、第3実施形態の単音節入力処理手順を図7を用いて説明する。図7は第3実施形態の単音節入力処理を示すフローチャートである。
図7に示すように、第3実施形態の単音節入力処理が第1実施形態と異なるのは、S70〜S170の処理が省略されて、S270〜S390の処理が追加された点である。
即ち、S60にて、グループ指定用単音節が入力された場合には(S60:YES)、S270にて、S20での音声認識結果を表示部4に表示させる。具体的には、S20での音声認識結果に基づき、音声認識結果が正しい可能性の高い順に順位付けをして、音声入力部2に入力したグループ指定用単音節に対応する単音節グループの候補を表示する。例えば、図8(a)に示すように、表示部4の表示画面4aに単音節を入力するための入力テキストボックスNH1が表示されている場合に(図8(a)は、入力テキストボックスNH1に「なか」という文字が入力されており、次の文字の入力を待っている状態を示す。)、音声入力部2に単音節が入力されると、図8(b)に示すように、音声認識により認識された単音節グループの候補を示す単音節候補表示PH1が表示画面4aに表示される。単音節候補表示PH1は、音声認識により認識された単音節グループのグループ指定用単音節を表示する。例えば図8(b)において、単音節候補表示PH1は、認識結果が1位、2位、3位の単音節グループのグループ指定用単音節を表示しており、認識結果の1位、2位、3位がそれぞれ「ま」行、「な」行、「わ」行であることを示している。
その後S280にて、タイマTMを起動する。これによりタイマTMは、当該タイマTMが起動してからの経過時間を計測する。そしてS290にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S290:YES)、S320にて、単音節候補表示PH1に示された1位の行に決定するとともに、その行の1段目の単音節を選択する。例えば図8(b)において、単音節候補表示PH1は、認識結果の1位として「ま」を表示しているので、「ま」行に決定する。更に、「ま」行の1段目は「ま」であるので、「ま」を選択する。
そしてS330にて、S320で決定された行(即ち、単音節グループ)のグループ指定用単音節を表示部4に表示させる。更にS340にて、タイマTMを起動する。これによりタイマTMは、当該タイマTMが起動してからの経過時間を計測する。即ち、S280での起動で計測されていた経過時間がリセットされて、再度、経過時間の計測が開始される。
そしてS350にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S350:YES)、S360にて、選択されている単音節を、次の段の単音節に変更する。例えば、「ま」行の1段目の「ま」が選択されている状態で、操作スイッチ5が押下操作されると、「ま」行の2段目の「み」が選択される。
その後S370にて、選択されている単音節を表示部4に表示させて、S340に移行し、上述の処理を繰り返す。例えば、「ま」行の1段目の「ま」が選択されている状態から更に操作スイッチ5が2回押下操作されると、「ま」行の3段目の「む」が選択されて、図8(c)に示すように、選択されている単音節を示す単音節選択表示PH2が表示画面4aに表示される。
一方、S350にて、操作スイッチ5が押下操作されない場合には(S350:NO)、S380にて、タイマTMにて計測された経過時間が予め設定された決定判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節が選択されてから決定判定時間が経過したか否かを判断する。
ここで、決定判定時間が経過していない場合には(S380:NO)、S350に移行し、上述の処理を繰り返す。一方、決定判定時間が経過した場合には(S380:YES)、S390にて、現在選択されている単音節を、入力すべき単音節(以下、入力単音節ともいう)と決定し、S10に移行する。これにより、図8(d)に示すように、入力単音節が、表示部4の表示画面4aに表示されている入力テキストボックスNH1に、入力単音節が追加される。
一方、S290にて、操作スイッチ5が押下操作されない場合には(S290:NO)、S300にて、タイマTMにて計測された経過時間が予め設定された表示変更判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節候補表示PH1が表示されてから表示変更判定時間が経過したか否かを判断する。
ここで、表示変更判定時間が経過していない場合には(S300:NO)、S290に移行し、上述の処理を繰り返す。一方、表示変更判定時間が経過した場合には(S300:YES)、S310にて、音声認識順位が最も高い単音節グループを除外して、単音節グループの順位付けを行うことにより、音声認識順位を変更し、S270に移行して、上述の処理を繰り返す。
例えば図9(a)に示すように、認識結果の1位、2位、3位がそれぞれ「な」行、「ま」行、「わ」行であることを示す単音節候補表示PH1が表示画面4aに表示されている場合に、単音節候補表示PH1が表示されてから表示変更判定時間が経過すると、図9(b)に示すように、単音節候補表示PH1は、音声認識順位の1位、2位がそれぞれ「ま」行、「わ」行である表示に変更される。つまり、音声認識順位の1位を除外することにより、音声認識順位が2位、3位であったものを、それぞれ1位、2位に変更する。
このように構成された単音節入力装置1では、S20での音声認識結果に基づき、音声認識結果が正しい可能性の高い順に順位付けをして、音声入力部2に入力したグループ指定用単音節に対応する単音節グループの候補を単音節候補表示PH1により表示する(S270)。更に、単音節候補表示PH1が表示されてから表示変更判定時間が経過するまでの間に操作スイッチ5が押下操作されない場合には(S290:NO,S300:YES)、音声認識順位が最も高いグループ指定用単音節を除外して、再度、グループ指定用単音節の順位付けを行うとともに、単音節候補表示PH1が表示されてから表示変更判定時間が経過するまでの間に操作スイッチ5が押下操作された場合には(S290:YES,S300:NO)、単音節候補表示PH1に表示された単音節グループの中で最も順位が高い単音節グループに対応するグループ指定用単音節を、音声入力部2に入力したグループ指定用単音節であると特定する(S320)。
このように構成された単音節入力装置によれば、一度に複数の単音節グループが表示され、その中から、認識結果が正しい単音節グループを選択することができる。このため、音声認識によりグループ指定用単音節を1つのみ特定する場合と比較して、特定されたグループ指定用単音節が誤っているために再発話して、再度、音声認識を行わせるという事態に陥ることを抑制でき、使い勝手が向上する。
以上説明した実施形態において、S20,S60,S280〜S320の処理は本発明におけるグループ特定手段、S330の処理は本発明における第1報知手段、S270の処理は本発明における第2報知手段、表示変更判定時間は本発明における第2入力無効時間である。である。
(第4実施形態)
以下に本発明の第4実施形態について図面とともに説明する。尚、第4実施形態では、第1実施形態と異なる部分のみを説明する。
第4実施形態における単音節入力装置1は、単音節入力処理が変更された点以外は第1実施形態と同じである。
次に、第4実施形態の単音節入力処理手順を図10を用いて説明する。図10は第4実施形態の単音節入力処理を示すフローチャートである。
図10に示すように、第4実施形態の単音節入力処理が第1実施形態と異なるのは、S80〜S170の処理が省略されて、S480〜S550の処理が追加された点である。
即ち、S70の処理が終了すると、S480にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S480:YES)、S500にて、単音節候補表示PH1に示された行に単音節グループを決定するとともに、その行の1段目の単音節を選択する。
そしてS510にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S510:YES)、S520にて、選択されている単音節を、次の段の単音節に変更する。その後S530にて、選択されている単音節を表示部4に表示させて、S510に移行し、上述の処理を繰り返す。
一方、S510にて、操作スイッチ5が押下操作されない場合には(S510:NO)、S540にて、音声入力部2に音声が入力したか否かを判断する。ここで、音声が入力していない場合には(S540:NO)、S510に移行し、上述の処理を繰り返す。一方、音声が入力した場合には(S540:YES)、S550にて、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定し、S20に移行する。
一方、S480にて、操作スイッチ5が押下操作されない場合には(S480:NO)、S490にて、音声入力部2に音声が入力したか否かを判断する。ここで音声が入力していない場合には(S490:NO)、S480に移行し、上述の処理を繰り返す。一方、音声が入力した場合には(S490:YES)、S20に移行して、上述の処理を繰り返す。即ち、S20での音声認識結果をキャンセルし、再度、音声入力部2に入力した音声について音声認識を行う。
このように構成された単音節入力装置1では、単音節が選択された後に、音声入力部2に音声が入力した場合に(S540:YES)、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定する(S550)。このため、入力単音節を決定するための押下操作を減らすことができすることができ、使い勝手が向上する。
以上説明した実施形態において、S540の条件は本発明における第1単音節決定条件である。
(第5実施形態)
以下に本発明の第5実施形態について図面とともに説明する。尚、第5実施形態では、第1実施形態と異なる部分のみを説明する。
第5実施形態における単音節入力装置1は、単音節入力処理が変更された点以外は第1実施形態と同じである。
次に、第5実施形態の単音節入力処理手順を図11を用いて説明する。図11は第5実施形態の単音節入力処理を示すフローチャートである。
図11に示すように、第5実施形態の単音節入力処理が第1実施形態と異なるのは、S80〜S170の処理が省略されて、S680〜S750の処理が追加された点である。
即ち、S70の処理が終了すると、S680にて、単音節候補表示PH1に示された行に単音節グループを決定するとともに、その行の1段目の単音節を選択する。そしてS690にて、タイマTMを起動する。
その後S700にて、操作スイッチ5が押下操作されたか否かを判断する。ここで、操作スイッチ5が押下操作された場合には(S700:YES)、S710にて、選択されている単音節を、次の段の単音節に変更する。その後S720にて、選択されている単音節を表示部4に表示させて、S690に移行し、上述の処理を繰り返す。
一方、S700にて、操作スイッチ5が押下操作されない場合には(S700:NO)、S730にて、音声入力部2に音声が入力したか否かを判断する。ここで、音声が入力した場合には(S730:YES)、S20に移行し、上述の処理を繰り返す。即ち、S730で音声が入力する前の音声認識結果をキャンセルし、S730で入力した音声について音声認識を行う。
一方、音声が入力していない場合には(S730:NO)、S740にて、タイマTMにて計測された経過時間が予め設定された決定判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節が選択されてから決定判定時間が経過したか否かを判断する。
ここで、決定判定時間が経過していない場合には(S740:NO)、S700に移行し、上述の処理を繰り返す。一方、決定判定時間が経過した場合には(S740:YES)、S750にて、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定し、S10に移行する。
このように構成された単音節入力装置1では、操作スイッチ5が押下操作された回数が0回、2回、3回、及び4回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節を選択する。このため、「あ」の単音節を選択する場合には押下操作が不要となり、入力単音節を決定するために操作スイッチ5が押下操作される回数を4回以下とすることができる。即ち、第1実施形態の単音節入力装置1と比較して、押下操作の回数を減らすことができ、その分、単音節の入力に要する時間を短縮することができる。
また、単音節が選択されてから決定判定時間が経過するまでの間に操作スイッチ5が押下操作されなかった場合に(S700:NO,S740:YES)、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定する(S750)。このため、入力単音節を決定するための押下操作を減らすことができすることができ、使い勝手が向上する。
また、入力単音節が決定される前に、音声が入力した場合には(S730:YES)、S20での音声認識結果がキャンセルされる。このため、S20での音声認識結果が誤っている場合に、再発話を行うだけで、認識された単音節グループを無効にすることができるので、無効にするために何らかの操作を行うことを不要とすることができ、使い勝手が向上する。
以上説明した実施形態において、S730の処理は本発明における第3無効手段、S700及びS740の条件は本発明における第2単音節決定条件である。
(第6実施形態)
以下に本発明の第6実施形態について図面とともに説明する。尚、第6実施形態では、第5実施形態と異なる部分のみを説明する。
第6実施形態における単音節入力装置1は、単音節入力処理が変更された点以外は第5実施形態と同じである。
次に、第6実施形態の単音節入力処理手順を図12を用いて説明する。図12は第6実施形態の単音節入力処理を示すフローチャートである。
図12に示すように、第6実施形態の単音節入力処理が第5実施形態と異なるのは、S730〜S750の処理が省略されて、S830〜S850の処理が追加された点である。
即ち、S700にて、操作スイッチ5が押下操作されない場合には(S700:NO)、S830にて、タイマTMにて計測された経過時間が予め設定された決定判定時間(本実施形態では、例えば5秒)を越えているか否かを判断する。即ち、単音節が選択されてから決定判定時間が経過したか否かを判断する。
ここで、決定判定時間が経過した場合には(S830:YES)、S10に移行し、上述の処理を繰り返す。即ち、S20での音声認識結果をキャンセルし、再度、音声入力部2に入力した音声について音声認識を行う。
一方、決定判定時間が経過していない場合には(S830:NO)、S840にて、音声入力部2に音声が入力したか否かを判断する。ここで、音声が入力していない場合には(S840:NO)、S700に移行し、上述の処理を繰り返す。一方、音声が入力した場合には(S840:YES)、S850にて、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定し、S20に移行する。
このように構成された単音節入力装置1では、入力単音節が決定される前に、音声が入力した場合には(S840:YES)、現在選択されている単音節を、入力すべき単音節(入力単音節)と決定する(S850)。このため、入力単音節を決定するための押下操作を減らすことができすることができ、使い勝手が向上する。
また、単音節が選択されてから決定判定時間が経過するまでの間に操作スイッチ5が押下操作されなかった場合に(S700:NO,S830:YES)、S20での音声認識結果がキャンセルされる。このため、S20での音声認識結果が誤っている場合に、押下操作を行わないことにより、認識された単音節グループを無効にすることができるので、無効にするために何らかの操作を行うことを不要とすることができ、使い勝手が向上する。
以上説明した実施形態において、S830の処理は本発明における第4無効手段、S840の条件は本発明における第2単音節決定条件、決定判定時間は本発明における第3入力無効時間である。
以上、本発明の一実施例について説明したが、本発明は上記実施例に限定されるものではなく、本発明の技術的範囲に属する限り種々の形態を採ることができる。
例えば上記実施形態においては、S20においてグループ指定用単音節のみを認識するものを示したが、全ての単音節を対象としても良い。この場合、S20での認識結果が例えば「さ」であった場合にも「し」であった場合にも、単音節グループが「さ」行であることを単音節候補表示PH1に表示し、更にその後の単音節選択は、母音が「あ」である「さ」から始める。この場合においても、音声認識処理は単音節グループのみを識別できれば良く、例えば「か」と「こ」の区別は問題とならないため、音声認識のみを用いた単音節入力に比べ誤認識を減らすことができる。
また上記実施形態においては、促音コマンドを認識できるものを示したが、濁音、半濁音、拗音、及び長音符を入力するためのコマンドを認識できるようにしてもよい。なお、入力の方法として、入力バッファの直前に決定した単音節を濁音や半濁音や拗音に変更するようにしてもよい。例えば、単音節「く」が決定した後に、「だくてん」と発声すると、単音節「ぐ」に変更されるようにしてもよい。または、単音節入力装置1側では清音の大文字入力のみが可能に構成され、予め登録された辞書に基づいて、濁音、半濁音、及び拗音が含まれる文字に変更するようにしてもよい。例えば、「かなかわ」と入力した後に、「かながわ」と変更するものである。
また上記実施形態においては、グループ指定用単音節は、各単音節グループ内の単音節の中で、母音が「あ」となる単音節であるものを示したが、これに限られるものではなく、「K(ケイ)」、「S(エス)」といった子音を表すアルファベットや、ア行であれば「1(イチ)」、カ行であれば「2(ニ)」といった数字など、一意に識別できるものであってもよい。
また上記実施形態においては、単音節グループは、50音の行毎に分割されているものを示したが、同一の母音を有する単音節毎に分割されるようにしてもよい。例えば、S20の音声認識では「あ」「い」「う」「え」「お」の5つの母音のみを認識し、操作スイッチ5を押すたびに50音表の同じ段で隣の音が選択されるように構成してもよい。または、1段を5個ずつ(「あ」行から「な」行、および「は」行から「わ」行)に区切ったものを単音節グループとし、「あ」、「い」、「う」、「え」、「お」、「は」、「ひ」、「ふ」、「へ」、「ほ」の10音を認識し、操作スイッチ5を押すたびに50音表の同じ段で隣の音が選択され最大5回の押下操作で50音全てが選択できるように構成してもよい。
また上記実施形態においては、「おわり」と発声される終了コマンドを認識できるものを示したが、例えば、「かくてい」と発声される確定コマンドにより入力単音節を決定してもよい。また、「ちがう」と発声される訂正コマンドにより、音声認識結果が正しい可能性の高い順に順位付けされた単音節グループの候補(第3実施形態のS270を参照)を次の順位の候補に変更するようにしてもよい。
また、操作スイッチ5の長押し操作を、上記確定コマンドまたは上記訂正コマンドの代わりの操作としてもよい。また、単音節グループの候補を訂正コマンドにより変更する場合に、次の順位の候補に変更するのではなく、発話前の状態に戻るように構成してもよい。
また上記実施形態においては、発話前に操作スイッチ5を押下する必要があるものを示したが、別のタイミングで発話の音声認識を開始するようにしてもよい。例えば、単音節入力装置1を搭載したナビゲーションシステムが「どこを目的地にしましょうか」と尋ねてくることで音声認識を開始してもよい。
また上記実施形態においては、操作スイッチ5を操作して単音節を入力するものを示したが、操作が複雑にならない程度に、やり直しや確定を行うための別のスイッチを設けるようにしてもよい。
単音節入力装置1の構成を示すブロック図である。 音声入力部2、表示部4及び操作スイッチ5の配置を説明する図である。 単音節グループ・テーブル6aの構成を示す図である。 第1実施形態の単音節入力処理を示すフローチャートである。 第1実施形態における単音節入力画面を示す図である。 第2実施形態の単音節入力処理を示すフローチャートである。 第3実施形態の単音節入力処理を示すフローチャートである。 第3実施形態における単音節入力画面を示す図である。 第3実施形態における単音節グループ選択画面を示す図である。 第4実施形態の単音節入力処理を示すフローチャートである。 第5実施形態の単音節入力処理を示すフローチャートである。 第6実施形態の単音節入力処理を示すフローチャートである。
符号の説明
1…単音節入力装置、2…音声入力部、3…音声出力部、4…表示部、5…操作スイッチ、6…データ記憶装置、6a…単音節グループ・テーブル、7…制御部

Claims (20)

  1. 音声を入力する音声入力手段と、
    押下操作が可能な押下操作手段と、
    日本語の単音節を複数の単音節グループに分割し、前記複数の単音節グループ毎に、前記単音節グループに属する単音節と、前記単音節グループを指定するための単音節である指定用単音節とが対応付けられたテーブルである単音節グループ・テーブルを記憶する記憶手段と、
    前記音声入力手段に入力した音声のうち、単音節単位で区切って発声された音声を音声認識処理するとともに、前記記憶手段に記憶された前記単音節グループ・テーブルを参照することにより、前記音声入力手段に入力した前記指定用単音節である入力指定用単音節を特定するグループ特定手段と、
    前記グループ特定手段により特定された前記入力指定用単音節に対応する前記単音節グループである入力単音節グループを報知する第1報知手段と、
    前記記憶手段に記憶された前記単音節グループ・テーブルと、前記押下操作手段が押下操作された回数とに基づいて、前記入力単音節グループに属する単音節の中から、入力すべき単音節である入力単音節を選択し、その後、予め設定された第1単音節決定条件が成立すると、該選択された単音節を前記入力単音節として決定する入力決定手段と、
    前記入力決定手段により前記入力単音節が選択される前に、再発声された音声が前記音声入力手段に入力した場合に、前記入力単音節グループを無効にするとともに前記グループ特定手段に前記再発声された音声を用いて再び前記入力指定用単音節を特定させる第1無効手段と
    を備えることを特徴とする単音節入力装置。
  2. 前記単音節グループは、50音の行毎に分割されている
    ことを特徴とする請求項1に記載の単音節入力装置。
  3. 前記指定用単音節は、母音が「あ」となる単音節である
    ことを特徴とする請求項2に記載の単音節入力装置。
  4. 前記入力決定手段は、
    前記押下操作手段が押下操作された回数が1回、2回、3回、4回、及び5回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節を選択する
    ことを特徴とする請求項2または請求項3に記載の単音節入力装置。
  5. 前記グループ特定手段は、
    前記第1無効手段が前記入力単音節グループを無効にした後に再び前記入力指定用単音節を特定する場合には、前記第1無効手段により無効にされた前記入力単音節グループに対応する前記指定用単音節を除外して、前記指定用単音節を特定する
    ことを特徴とする請求項1〜請求項4の何れかに記載の単音節入力装置。
  6. 前記第1報知手段が前記入力単音節グループを報知してから予め設定された第1入力無効時間が経過するまでの間に前記押下操作手段が押下操作されなかった場合に、前記入力単音節グループを無効にする第2無効手段を備える
    ことを特徴とする請求項1〜請求項4の何れかに記載の単音節入力装置。
  7. 前記グループ特定手段は、
    前記第2無効手段が前記入力単音節グループを無効にした後に再び前記入力指定用単音節を特定する場合には、前記第2無効手段により無効にされた前記入力単音節グループに対応する前記指定用単音節を除外して、前記入力指定用単音節を特定する
    ことを特徴とする請求項6に記載の単音節入力装置。
  8. 前記グループ特定手段は、音声認識処理による認識結果を信頼度の順に、認識した複数の前記指定用単音節を順位付けし、
    前記グループ特定手段により順位付けされた順位である音声認識順位の高いものから前記指定用単音節に対応する前記単音節グループを報知する第2報知手段を備え、
    更に、前記グループ特定手段は、
    前記音声認識順位の高いものから前記第2報知手段が前記単音節グループを報知してから予め設定された第2入力無効時間が経過するまでの間に前記押下操作手段が押下操作されなかった場合には、前記音声認識順位が最も高い前記指定用単音節を除外して、再度、前記指定用単音節の順位付けを行うとともに、
    前記音声認識順位の高いものから前記第2報知手段が前記単音節グループを報知してから前記第2入力無効時間が経過するまでの間に前記押下操作手段が押下操作された場合には、前記第2報知手段により報知された前記単音節グループの中で最も順位が高い前記入力単音節グループに対応する前記指定用単音節を前記入力指定用単音節として特定する
    ことを特徴とする請求項1〜請求項4の何れかに記載の単音節入力装置。
  9. 前記第1単音節決定条件は、
    前記入力決定手段により単音節が選択された後に、発声された音声が前記音声入力手段に入力したことである
    ことを特徴とする請求項1〜請求項8の何れかに記載の単音節入力装置。
  10. 前記第1単音節決定条件は、
    前記入力決定手段により単音節が選択されてから予め設定された第1入力決定時間が経過するまでの間に前記押下操作手段が押下操作されなかったことである
    ことを特徴とする請求項1〜請求項8の何れかに記載の単音節入力装置。
  11. 前記入力決定手段は、
    前記押下操作手段が押下操作された回数が0回、2回、3回、及び4回であるときに、それぞれ母音が「あ」、「い」、「う」、「え」、及び「お」である単音節を選択し、その後、予め設定された第2単音節決定条件が成立すると、該選択された単音節を前記入力単音節として決定する
    ことを特徴とする請求項2または請求項3に記載の単音節入力装置。
  12. 前記第2単音節決定条件は、
    前記入力決定手段により単音節が選択されてから予め設定された第2入力決定時間が経過するまでの間に前記押下操作手段が押下操作されなかったことである
    ことを特徴とする請求項11に記載の単音節入力装置。
  13. 前記第2単音節決定条件が成立する前に、再発声された音声が前記音声入力手段に入力した場合に、前記入力単音節グループを無効にするとともに前記グループ特定手段に前記再発声された音声を用いて再び前記入力指定用単音節を特定させる第3無効手段を備える
    ことを特徴とする請求項12に記載の単音節入力装置。
  14. 前記グループ特定手段は、
    前記第3無効手段が前記入力単音節グループを無効にした後に再び前記入力指定用単音節を特定する場合には、前記第3無効手段により無効にされた前記入力単音節グループに対応する前記指定用単音節を除外して、前記入力指定用単音節を特定する
    ことを特徴とする請求項13に記載の単音節入力装置。
  15. 前記第2単音節決定条件は、
    前記入力決定手段により単音節が選択されてから、発声された音声が前記音声入力手段に入力したことである
    ことを特徴とする請求項11に記載の単音節入力装置。
  16. 前記入力決定手段により単音節が選択されてから、予め設定された第3入力無効時間が経過するまでの間に前記押下操作手段が押下操作されなかった場合に、前記入力単音節グループを無効にする第4無効手段を備える
    ことを特徴とする請求項15に記載の単音節入力装置。
  17. 前記グループ特定手段は、
    前記第4無効手段が前記入力単音節グループを無効にした後に再び前記入力指定用単音節を特定する場合には、前記第4無効手段により無効にされた前記入力単音節グループに対応する前記指定用単音節を除外して、前記入力指定用単音節を特定する
    ことを特徴とする請求項16に記載の単音節入力装置。
  18. 前記音声入力手段に入力した音声のうち、濁点、半濁点、促音、拗音、及び長音符の少なくとも一つを入力するために発声された入力指示音声を特定する第1音声特定手段を備える
    ことを特徴とする請求項1〜請求項17の何れかに記載の単音節入力装置。
  19. 前記音声入力手段に入力した音声のうち、前記入力単音節を決定するために発声される単音節決定指示音声、前記入力単音節を訂正するために発声される単音節訂正指示音声、及び単音節の入力を終了するために発声される単音節終了指示音声の少なくとも一つを特定する第2音声特定手段を備える
    ことを特徴とする請求項1〜請求項18の何れかに記載の単音節入力装置。
  20. 前記音声入力手段は、
    前記押下操作手段が押下操作された後に、音声の入力を受け付けるように構成されている
    ことを特徴とする請求項1〜請求項19の何れかに記載の単音節入力装置。
JP2007327307A 2007-12-19 2007-12-19 単音節入力装置 Expired - Fee Related JP4983587B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007327307A JP4983587B2 (ja) 2007-12-19 2007-12-19 単音節入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007327307A JP4983587B2 (ja) 2007-12-19 2007-12-19 単音節入力装置

Publications (2)

Publication Number Publication Date
JP2009150991A JP2009150991A (ja) 2009-07-09
JP4983587B2 true JP4983587B2 (ja) 2012-07-25

Family

ID=40920209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007327307A Expired - Fee Related JP4983587B2 (ja) 2007-12-19 2007-12-19 単音節入力装置

Country Status (1)

Country Link
JP (1) JP4983587B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210073461A (ko) * 2019-12-10 2021-06-18 도요타지도샤가부시키가이샤 에이전트 관리 장치, 프로그램, 및 에이전트 관리 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59170895A (ja) * 1983-03-17 1984-09-27 富士通株式会社 単音節入力方式
JP2755792B2 (ja) * 1990-06-14 1998-05-25 シャープ株式会社 音声認識装置
JPH11282490A (ja) * 1998-03-30 1999-10-15 Brother Ind Ltd 音声認識装置および記憶媒体
JPH11352989A (ja) * 1998-06-03 1999-12-24 Brother Ind Ltd 音声認識装置および記憶媒体
JP2000056796A (ja) * 1998-08-07 2000-02-25 Asahi Chem Ind Co Ltd 音声入力装置および方法
JP4042589B2 (ja) * 2003-02-27 2008-02-06 株式会社豊田中央研究所 車両用音声入力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210073461A (ko) * 2019-12-10 2021-06-18 도요타지도샤가부시키가이샤 에이전트 관리 장치, 프로그램, 및 에이전트 관리 방법

Also Published As

Publication number Publication date
JP2009150991A (ja) 2009-07-09

Similar Documents

Publication Publication Date Title
EP1941344B1 (en) Combined speech and alternate input modality to a mobile device
US8954329B2 (en) Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information
JP4468264B2 (ja) 多言語による名称の音声認識のための方法とシステム
US20050273337A1 (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US20060293889A1 (en) Error correction for speech recognition systems
JP5431282B2 (ja) 音声対話装置、方法、プログラム
JP5189858B2 (ja) 音声認識装置
KR101060928B1 (ko) 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호로 표시 가능한 시스템 및 그 시스템을 이용한 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호 표시 방법 및 중국어의 발음과 중국어 성조를 한글 발음기호로 표기하는 시스템 및 그 시스템을 이용한 중국어 발음과 중국어 성조를 한글 발음기호로 표기하는 방법
JP2013019958A (ja) 音声認識装置
JP2003114696A (ja) 音声認識装置、プログラム及びナビゲーションシステム
JP2006189730A (ja) 音声対話方法および音声対話装置
JP2006208486A (ja) 音声入力装置
JP4983587B2 (ja) 単音節入力装置
JP2008076811A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP4770374B2 (ja) 音声認識装置
JP4296290B2 (ja) 音声認識装置、音声認識方法及びプログラム
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP2009198871A (ja) 音声対話装置
JP4012228B2 (ja) 情報入力方法、情報入力装置及び記憶媒体
JP2015227915A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2005283797A (ja) 音声認識装置および音声認識方法
JP2014115594A (ja) 音声認識システムおよび音声認識システムの制御方法
JP2006330486A (ja) 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体
KR100777569B1 (ko) 멀티모달을 이용한 음성 인식 방법 및 그 장치
JP2008152043A (ja) 音声認識装置及び音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120409

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees