JP2007334665A - 文字入力装置及び携帯情報端末 - Google Patents
文字入力装置及び携帯情報端末 Download PDFInfo
- Publication number
- JP2007334665A JP2007334665A JP2006166366A JP2006166366A JP2007334665A JP 2007334665 A JP2007334665 A JP 2007334665A JP 2006166366 A JP2006166366 A JP 2006166366A JP 2006166366 A JP2006166366 A JP 2006166366A JP 2007334665 A JP2007334665 A JP 2007334665A
- Authority
- JP
- Japan
- Prior art keywords
- character
- input
- vowel
- voice
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Input From Keyboards Or The Like (AREA)
- Telephone Function (AREA)
Abstract
【課題】大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる文字入力装置及び携帯情報端末を得ることを目的とする。
【解決手段】音声入力部1により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する音声認識部2と、50音の行を指定する行指定文字の入力を受け付ける行指定文字入力部3とを設け、音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定する。
【選択図】図1
【解決手段】音声入力部1により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する音声認識部2と、50音の行を指定する行指定文字の入力を受け付ける行指定文字入力部3とを設け、音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定する。
【選択図】図1
Description
この発明は、少ない操作で文字を入力することが可能な文字入力装置と、その文字入力装置を搭載している携帯電話機などの携帯情報端末に関するものである。
携帯電話機などの携帯情報端末では、用意されているボタンが少ないため、同じボタンに複数の文字が割り当てられている。そのため、文字入力を行う場合、1文字の入力を確定するまでに、何度も同じボタンを押下する必要がある。
例えば、「おはよう」を入力する場合には、“あ”ボタンを5回、“は”ボタンを1回、“や”ボタンを3回、“あ”ボタンを3回押す必要があり、操作が繁雑になる。
例えば、「おはよう」を入力する場合には、“あ”ボタンを5回、“は”ボタンを1回、“や”ボタンを3回、“あ”ボタンを3回押す必要があり、操作が繁雑になる。
そのため、文字入力の容易化を図る入力補助機能を実装している携帯電話機が開発されている。
携帯電話機の入力補助機能としては、例えば、次のようなものがある。
ある単語の頭文字が入力されると、その頭文字に関連する単語を類推し、使用頻度が高い順に単語の候補を表示する。
これにより、複数の単語の候補の中から該当する単語を選択すれば、単語を構成する文字の全てを入力する必要がなくなるため、ボタンの押下回数を減らすことができる。
しかしながら、単語の候補数が多い場合、該当単語を探す手間が増えるため、必ずしも効率的に文字入力を行えない場合がある。
携帯電話機の入力補助機能としては、例えば、次のようなものがある。
ある単語の頭文字が入力されると、その頭文字に関連する単語を類推し、使用頻度が高い順に単語の候補を表示する。
これにより、複数の単語の候補の中から該当する単語を選択すれば、単語を構成する文字の全てを入力する必要がなくなるため、ボタンの押下回数を減らすことができる。
しかしながら、単語の候補数が多い場合、該当単語を探す手間が増えるため、必ずしも効率的に文字入力を行えない場合がある。
ボタンを押下する以外の方法で文字入力を行う方式として音声入力方式がある(例えば、特許文献1参照)。
音声入力方式は、携帯電話機が音声認識処理装置などを搭載することにより実現するものである。
携帯電話機が音声認識処理装置を搭載していれば、音声認識処理装置が音声を認識して、その認識結果を入力文字として取り扱うことができるので、ボタンを押下することなく、文字入力を行うことができる。
音声入力方式は、携帯電話機が音声認識処理装置などを搭載することにより実現するものである。
携帯電話機が音声認識処理装置を搭載していれば、音声認識処理装置が音声を認識して、その認識結果を入力文字として取り扱うことができるので、ボタンを押下することなく、文字入力を行うことができる。
しかしながら、音声認識処理装置の音声認識結果に誤りがある場合、ボタンを押下して、その音声認識結果である入力文字を修正する必要があり、必ずしも効率的に文字入力を行えない場合がある。
したがって、効率的に文字入力を行えるようにするには、音声認識処理装置の音声認識率を高める必要がある。
音声認識処理装置の音声認識率を高めるには、文章から単語を類推したり、韻律を用いて単語を類推したりする必要があり、大規模な音声認識辞書(データベース)を用意する必要がある。
したがって、効率的に文字入力を行えるようにするには、音声認識処理装置の音声認識率を高める必要がある。
音声認識処理装置の音声認識率を高めるには、文章から単語を類推したり、韻律を用いて単語を類推したりする必要があり、大規模な音声認識辞書(データベース)を用意する必要がある。
従来の携帯情報端末は以上のように構成されているので、音声認識処理装置の音声認識率を高めれば、入力文字の修正操作を減らすことができる。しかし、音声認識処理装置の音声認識率を高めるには、大規模な音声認識辞書を用意する必要があるなどの課題があった。
この発明は上記のような課題を解決するためになされたもので、大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる文字入力装置及び携帯情報端末を得ることを目的とする。
この発明に係る文字入力装置は、音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段とを設け、母音特定手段により特定された母音と文字入力手段により入力が受け付けられた行指定文字から入力文字を確定するようにしたものである。
この発明によれば、音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段とを設け、母音特定手段により特定された母音と文字入力手段により入力が受け付けられた行指定文字から入力文字を確定するように構成したので、大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる効果がある。
実施の形態1.
図1はこの発明の実施の形態1による携帯情報端末を示す構成図であり、図1の例では、携帯情報端末が携帯電話機であるものを示している。
図1の携帯電話機は、メール送受信機能(文字のデータを送受信する機能)を実装しており、文字の入力を受け付ける文字入力装置を搭載している。
図2はこの発明の実施の形態1による文字入力装置を示す構成図であり、図において、音声入力部1は例えばマイク1aなどから構成されており、音声入力部1はユーザが発する音声を集音して、その音声を示す音声データを音声認識部2に出力する処理を実施する。なお、音声入力部1は音声入力手段を構成している。
図1はこの発明の実施の形態1による携帯情報端末を示す構成図であり、図1の例では、携帯情報端末が携帯電話機であるものを示している。
図1の携帯電話機は、メール送受信機能(文字のデータを送受信する機能)を実装しており、文字の入力を受け付ける文字入力装置を搭載している。
図2はこの発明の実施の形態1による文字入力装置を示す構成図であり、図において、音声入力部1は例えばマイク1aなどから構成されており、音声入力部1はユーザが発する音声を集音して、その音声を示す音声データを音声認識部2に出力する処理を実施する。なお、音声入力部1は音声入力手段を構成している。
音声認識部2は音声を音節単位に認識するための音声認識辞書を搭載しており、音声認識部2は音声入力部1から出力された音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音(“あ”、“い”、“う”、“え”、“お”)を特定する処理を実施する。なお、音声認識部2は母音特定手段を構成している。
行指定文字入力部3は50音の行を指定する行指定文字(“あ”、“か”、“さ”、・・・、“わ”)が割り付けられているボタン3a(あ行を指定するボタン、か行を指定するボタン、さ行を指定するボタン、・・・、わ行を指定するボタン)などから構成されており、50音の行(あ行、か行、さ行、・・・、わ行)を指定する行指定文字の入力を受け付ける処理を実施する。なお、行指定文字入力部3は文字入力手段を構成している。
行指定文字入力部3は50音の行を指定する行指定文字(“あ”、“か”、“さ”、・・・、“わ”)が割り付けられているボタン3a(あ行を指定するボタン、か行を指定するボタン、さ行を指定するボタン、・・・、わ行を指定するボタン)などから構成されており、50音の行(あ行、か行、さ行、・・・、わ行)を指定する行指定文字の入力を受け付ける処理を実施する。なお、行指定文字入力部3は文字入力手段を構成している。
入力文字確定部4は音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定する処理を実施する。なお、入力文字確定部4は入力文字確定手段を構成している。
文字表示部5は例えば液晶ディスプレイ5aなどから構成されており、入力文字確定部4により確定された入力文字を表示する処理を実施する。
文字表示部5は例えば液晶ディスプレイ5aなどから構成されており、入力文字確定部4により確定された入力文字を表示する処理を実施する。
図1の例では、文字入力装置の構成要素である音声認識部2及び入力文字確定部4が専用のハードウェア(例えば、MPUを搭載している半導体集積回路)で構成されているものを想定しているが、文字入力装置がコンピュータで構成される場合、音声認識部2及び入力文字確定部4の処理内容が記述されているプログラムをコンピュータのメモリに格納し、そのコンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図3はこの発明の実施の形態1による文字入力装置の概略の処理内容を示すフローチャートであり、図4はこの発明の実施の形態1による文字入力装置の具体的な処理内容を示すフローチャートである。
図3はこの発明の実施の形態1による文字入力装置の概略の処理内容を示すフローチャートであり、図4はこの発明の実施の形態1による文字入力装置の具体的な処理内容を示すフローチャートである。
次に動作について説明する。
例えば、ユーザが携帯電話機を使用してメールを送信する場合、携帯電話機を操作して、メール作成画面である文字入力画面の表示要求を入力する。
文字入力装置の文字表示部5は、文字入力画面の表示要求を受けると、文字の入力を促す文字入力画面を携帯電話機の液晶ディスプレイ5aに表示する(ステップST1)。
例えば、ユーザが携帯電話機を使用してメールを送信する場合、携帯電話機を操作して、メール作成画面である文字入力画面の表示要求を入力する。
文字入力装置の文字表示部5は、文字入力画面の表示要求を受けると、文字の入力を促す文字入力画面を携帯電話機の液晶ディスプレイ5aに表示する(ステップST1)。
文字入力装置の音声入力部1は、文字表示部5が文字入力画面を携帯電話機の液晶ディスプレイ5aに表示すると、音声の集音処理を開始し、ユーザが音声を発すると(ステップST2)、ユーザの音声を集音して、その音声を示す音声データを音声認識部2に出力する(ステップST3)。
例えば、入力文字が「おはよう」である場合、ユーザが音声「おはよう」を発し、音声入力部1が音声「おはよう」を集音して、その音声を示す音声データを音声認識部2に出力する。
例えば、入力文字が「おはよう」である場合、ユーザが音声「おはよう」を発し、音声入力部1が音声「おはよう」を集音して、その音声を示す音声データを音声認識部2に出力する。
文字入力装置の音声認識部2は、音声入力部1から音声「おはよう」を示す音声データを受けると、その音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音(“あ”、“い”、“う”、“え”、“お”)を特定する(ステップST4)。
ユーザの音声が「おはよう」である場合、下記に示すように、“お”、“は”、“よ”、“う”の母音を特定する。
音節 母音
“お” → “お”
“は” → “あ”
“よ” → “お”
“う” → “う”
ユーザの音声が「おはよう」である場合、下記に示すように、“お”、“は”、“よ”、“う”の母音を特定する。
音節 母音
“お” → “お”
“は” → “あ”
“よ” → “お”
“う” → “う”
文字入力装置の行指定文字入力部3は、文字表示部5が文字入力画面を携帯電話機のディスプレイに表示すると、50音の行を指定する行指定文字(“あ”、“か”、“さ”、・・・、“わ”)の入力処理を開始し、ユーザが行指定文字が割り付けられているボタン3a(あ行を指定するボタン、か行を指定するボタン、さ行を指定するボタン、・・・、わ行を指定するボタン)を押すと(ステップST5)、行指定文字の入力を受け付ける処理を実施する(ステップST6)。
入力文字が「おはよう」である場合、次の順番でボタン3aを押すことになるが、入力文字が「おはよう」であれば、ボタン3aを4回押すだけでよい。
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
↓
は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)
↓
や行が割り付けられているボタン(図1では左から2番目、上から3番目のボタン)
↓
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
入力文字が「おはよう」である場合、次の順番でボタン3aを押すことになるが、入力文字が「おはよう」であれば、ボタン3aを4回押すだけでよい。
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
↓
は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)
↓
や行が割り付けられているボタン(図1では左から2番目、上から3番目のボタン)
↓
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
文字入力装置の入力文字確定部4は、上記のようにして、音声認識部2が各音節の母音を特定し、行指定文字入力部3が行指定文字の入力を受け付けると(ステップST7)、下記に示すように、順番に、各音節の母音と行指定文字を組み合わせることにより、入力文字を確定する(ステップST8)。
行指定文字 音節の母音 入力文字
“あ” + “お” → “お”
“は” + “あ” → “は”
“や” + “お” → “よ”
“あ” + “う” → “う”
行指定文字 音節の母音 入力文字
“あ” + “お” → “お”
“は” + “あ” → “は”
“や” + “お” → “よ”
“あ” + “う” → “う”
文字入力装置の文字表示部5は、入力文字確定部4が入力文字を確定すると、その入力文字を携帯電話機の液晶ディスプレイ5aに表示する(ステップST9)。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
この実施の形態1では、入力文字が「おはよう」である場合について示したが、例えば、入力文字が「きょう」のように、小文字の“ょ”が含まれている場合、や行が割り付けられているボタン3aを2回押せば、小文字のや行を指定することができる。
また、入力文字が「ばすてい」のように、濁音“ば”が含まれている場合、は行が割り付けられているボタン3aを2回押せば、濁音のは行を指定することができる。
また、入力文字が「ぱん」のように、半濁音“ぱ”が含まれている場合、は行が割り付けられているボタン3aを3回押せば、半濁音のは行を指定することができる。
さらに、入力文字が「きゃらめる」のように、拗音“きゃ”が含まれている場合、か行が割り付けられているボタン3aを2回押せば、拗音のか行を指定することができる。
また、入力文字が「はんどばっぐ」のように、促音“ばっ”が含まれている場合、は行が割り付けられているボタン3aを4回押せば、促音のは行を指定することができる。
また、入力文字が「ばすてい」のように、濁音“ば”が含まれている場合、は行が割り付けられているボタン3aを2回押せば、濁音のは行を指定することができる。
また、入力文字が「ぱん」のように、半濁音“ぱ”が含まれている場合、は行が割り付けられているボタン3aを3回押せば、半濁音のは行を指定することができる。
さらに、入力文字が「きゃらめる」のように、拗音“きゃ”が含まれている場合、か行が割り付けられているボタン3aを2回押せば、拗音のか行を指定することができる。
また、入力文字が「はんどばっぐ」のように、促音“ばっ”が含まれている場合、は行が割り付けられているボタン3aを4回押せば、促音のは行を指定することができる。
以上で明らかなように、この実施の形態1によれば、音声入力部1により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する音声認識部2と、50音の行を指定する行指定文字の入力を受け付ける行指定文字入力部3とを設け、音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定するように構成したので、大規模な音声認識辞書を用意することなく(音節の母音を特定するだけの音声認識辞書を用意すればよい)、文字入力の操作を軽減することができる効果を奏する。
実施の形態2.
上記実施の形態1では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合、ユーザが同じボタン3aを複数回押すものについて示したが、この実施の形態2では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合でも、清音の場合と同様に、ユーザが1音節につきボタン3aを1回押すだけで済むようにしている。
上記実施の形態1では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合、ユーザが同じボタン3aを複数回押すものについて示したが、この実施の形態2では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合でも、清音の場合と同様に、ユーザが1音節につきボタン3aを1回押すだけで済むようにしている。
具体的には、以下の通りである。
文字入力装置の音声入力部1は、ユーザが音声を発すると、上記実施の形態1と同様に、ユーザの音声を集音して、その音声を示す音声データを音声認識部2に出力する。
例えば、入力文字が「ばすてい」である場合、ユーザが音声「ばすてい」を発し、音声入力部1が音声「ばすてい」を集音して、その音声を示す音声データを音声認識部2に出力する。
この例では、音声「ばすてい」の中に濁音“ば”が含まれている。
文字入力装置の音声入力部1は、ユーザが音声を発すると、上記実施の形態1と同様に、ユーザの音声を集音して、その音声を示す音声データを音声認識部2に出力する。
例えば、入力文字が「ばすてい」である場合、ユーザが音声「ばすてい」を発し、音声入力部1が音声「ばすてい」を集音して、その音声を示す音声データを音声認識部2に出力する。
この例では、音声「ばすてい」の中に濁音“ば”が含まれている。
文字入力装置の音声認識部2は、音声入力部1から音声「ばすてい」を示す音声データを受けると、上記実施の形態1と同様に、その音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音を特定する。
ユーザの音声が「ばすてい」である場合、下記に示すように、“ば”、“す”、“て”、“い”の母音を特定する。
音節 母音
“ば” → “あ”
“す” → “う”
“て” → “え”
“い” → “い”
ユーザの音声が「ばすてい」である場合、下記に示すように、“ば”、“す”、“て”、“い”の母音を特定する。
音節 母音
“ば” → “あ”
“す” → “う”
“て” → “え”
“い” → “い”
また、文字入力装置の音声認識部2は、各音節の音種を特定する。即ち、各音節が清音であるのか、濁音であるのか、半濁音であるのか、拗音であるのか、促音であるのかを特定する。
ユーザの音声が「ばすてい」である場合、“ば”以外の音節は清音であると特定し、“ば”は濁音であると特定する。
この場合、音声認識部2は、音節の母音を特定する音声認識辞書の他に、音節の音種を特定する音声認識辞書を用意する必要があるが、従来例のように、子音を特定する必要がないので、大規模な音声認識辞書は必要ない。
ユーザの音声が「ばすてい」である場合、“ば”以外の音節は清音であると特定し、“ば”は濁音であると特定する。
この場合、音声認識部2は、音節の母音を特定する音声認識辞書の他に、音節の音種を特定する音声認識辞書を用意する必要があるが、従来例のように、子音を特定する必要がないので、大規模な音声認識辞書は必要ない。
文字入力装置の行指定文字入力部3は、文字表示部5が文字入力画面を携帯電話機のディスプレイに表示すると、上記実施の形態1と同様に、50音の行を指定する行指定文字の入力処理を開始し、ユーザが行指定文字が割り付けられているボタン3aを押すと、行指定文字の入力を受け付ける処理を実施する。
入力文字が「ばすてい」である場合、次の順番でボタン3aを押すことになるが、入力文字が「ばすてい」であれば、ボタン3aを4回押すだけでよい。
は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)
↓
さ行が割り付けられているボタン(図1では左から3番目、上から1番目のボタン)
↓
た行が割り付けられているボタン(図1では左から1番目、上から2番目のボタン)
↓
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
入力文字が「ばすてい」である場合、次の順番でボタン3aを押すことになるが、入力文字が「ばすてい」であれば、ボタン3aを4回押すだけでよい。
は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)
↓
さ行が割り付けられているボタン(図1では左から3番目、上から1番目のボタン)
↓
た行が割り付けられているボタン(図1では左から1番目、上から2番目のボタン)
↓
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
文字入力装置の入力文字確定部4は、上記のようにして、音声認識部2が各音節の母音と音種を特定し、行指定文字入力部3が行指定文字の入力を受け付けると、下記に示すように、順番に、各音節の母音及び音種(濁音、半濁音、拗音、促音)と、行指定文字を組み合わせることにより、入力文字を確定する。
行指定文字 音節の母音 音種 入力文字
“は” + “あ” + 濁音 → “ば”
“さ” + “う” + 清音 → “す”
“た” + “え” + 清音 → “て”
“あ” + “い” + 清音 → “い”
行指定文字 音節の母音 音種 入力文字
“は” + “あ” + 濁音 → “ば”
“さ” + “う” + 清音 → “す”
“た” + “え” + 清音 → “て”
“あ” + “い” + 清音 → “い”
文字入力装置の文字表示部5は、入力文字確定部4が入力文字を確定すると、上記実施の形態1と同様に、その入力文字を携帯電話機の液晶ディスプレイ5aに表示する。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
以上で明らかなように、この実施の形態2によれば、音声認識部2が各音節の母音を特定する他に各音節の音種を特定し、入力文字確定部4が音声認識部2により特定された母音及び音種と、行指定文字入力部3により入力が受け付けられた行指定文字とから入力文字を確定するように構成したので、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合でも、清音の場合と同様に、ユーザが1音節につきボタン3aを1回押すだけで入力処理を終えることができる効果を奏する。
実施の形態3.
上記実施の形態1,2では、携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除されるものについて示したが、入力文字に誤りが発生している原因の一つである音声認識辞書の音声認識パラメータの不適正は是正されない。
即ち、ユーザの発音と音声認識パラメータの整合性が取れていない場合、音声認識率が低下して、音声認識結果に誤りが生じることがあるが、上記実施の形態1では、入力文字に誤りがある場合でも、音声認識辞書の音声認識パラメータが修正されることはない。
上記実施の形態1,2では、携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除されるものについて示したが、入力文字に誤りが発生している原因の一つである音声認識辞書の音声認識パラメータの不適正は是正されない。
即ち、ユーザの発音と音声認識パラメータの整合性が取れていない場合、音声認識率が低下して、音声認識結果に誤りが生じることがあるが、上記実施の形態1では、入力文字に誤りがある場合でも、音声認識辞書の音声認識パラメータが修正されることはない。
そこで、この実施の形態3では、携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機の修正ボタン(図示せず)を操作して、正しい入力文字を入力すると、パラメータ更新手段を構成する音声認識部2が、音声認識辞書の音声認識パラメータを正しい入力文字に合わせて更新する。
図5は音声認識辞書の一例を示し、例えば、正しい文字が「き」であるとき、「か」と誤認識された場合、ユーザの入力音声の特徴を考慮して、以後、同じ音声が入力されたときは、文字「き」が文字「か」より選択される可能性が高くなるように、文字「き」と文字「か」の音声認識パラメータを更新する。
なお、音声認識パラメータの更新処理自体は、公知の技術であるため、詳細な説明を省略する。
図5は音声認識辞書の一例を示し、例えば、正しい文字が「き」であるとき、「か」と誤認識された場合、ユーザの入力音声の特徴を考慮して、以後、同じ音声が入力されたときは、文字「き」が文字「か」より選択される可能性が高くなるように、文字「き」と文字「か」の音声認識パラメータを更新する。
なお、音声認識パラメータの更新処理自体は、公知の技術であるため、詳細な説明を省略する。
以上で明らかなように、この実施の形態3によれば、入力文字確定部4により確定された入力文字に誤りがある場合、音声認識部2が音声認識処理を実施する際に使用する音声認識パラメータを正しい入力文字に合わせて更新するように構成したので、以降の音声認識処理の音声認識率を高めて、入力文字の誤りを低減することができる効果を奏する。
1 音声入力部(音声入力手段)、1a マイク、2 音声認識部(母音特定手段、パラメータ更新手段)、3 行指定文字入力部(文字入力手段)、3a ボタン、4 入力文字確定部(入力文字確定手段)、5 文字表示部、5a 液晶ディスプレイ。
Claims (4)
- 音声の入力を受け付ける音声入力手段と、上記音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段と、上記母音特定手段により特定された母音と上記文字入力手段により入力が受け付けられた行指定文字から入力文字を確定する入力文字確定手段とを備えた文字入力装置。
- 母音特定手段が各音節の母音を特定する他に各音節の音種を特定し、入力文字確定手段が上記母音特定手段により特定された母音及び音種と、文字入力手段により入力が受け付けられた行指定文字とから入力文字を確定することを特徴とする請求項1記載の文字入力装置。
- 入力文字確定手段により確定された入力文字に誤りがある場合、母音特定手段が音声認識処理を実施する際に使用する音声認識パラメータを正しい入力文字に合わせて更新するパラメータ更新手段を設けたことを特徴とする請求項1または請求項2記載の文字入力装置。
- 文字のデータを送受信する機能を備えている携帯情報端末において、音声の入力を受け付ける音声入力手段と、上記音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段と、上記母音特定手段により特定された母音と上記文字入力手段により入力が受け付けられた行指定文字から入力文字を確定する入力文字確定手段とを備えた文字入力装置を搭載していることを特徴とする携帯情報端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166366A JP2007334665A (ja) | 2006-06-15 | 2006-06-15 | 文字入力装置及び携帯情報端末 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166366A JP2007334665A (ja) | 2006-06-15 | 2006-06-15 | 文字入力装置及び携帯情報端末 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007334665A true JP2007334665A (ja) | 2007-12-27 |
Family
ID=38934083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006166366A Withdrawn JP2007334665A (ja) | 2006-06-15 | 2006-06-15 | 文字入力装置及び携帯情報端末 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007334665A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100910302B1 (ko) | 2007-06-28 | 2009-08-03 | 주식회사 케이티 | 멀티모달 기반의 정보 검색 장치 및 방법 |
-
2006
- 2006-06-15 JP JP2006166366A patent/JP2007334665A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100910302B1 (ko) | 2007-06-28 | 2009-08-03 | 주식회사 케이티 | 멀티모달 기반의 정보 검색 장치 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6570651B2 (ja) | 音声対話装置および音声対話方法 | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
US20060293889A1 (en) | Error correction for speech recognition systems | |
US20080126093A1 (en) | Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System | |
JP2007538278A (ja) | 音声認識システム | |
JP2008129412A (ja) | 半導体集積回路装置、電子機器 | |
US7035800B2 (en) | Method for entering characters | |
JP5189858B2 (ja) | 音声認識装置 | |
US20170364516A1 (en) | Linguistic model selection for adaptive automatic speech recognition | |
US7181397B2 (en) | Speech dialog method and system | |
CA3097683C (en) | Speech analysis system | |
JP2007193166A (ja) | 対話装置、対話方法及びプログラム | |
JP2018045675A (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
JP2007127896A (ja) | 音声認識装置及び音声認識方法 | |
JP5238395B2 (ja) | 言語モデル作成装置および言語モデル作成方法 | |
JP2006259641A (ja) | 音声認識装置及び音声認識用プログラム | |
JP2007334665A (ja) | 文字入力装置及び携帯情報端末 | |
CN113409761B (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
JP2011248002A (ja) | 翻訳装置 | |
JP4498906B2 (ja) | 音声認識装置 | |
JP2000101705A (ja) | 無線電話機 | |
EP2755202B1 (en) | Voice recognition device | |
JP6807491B1 (ja) | 補聴器用合成音声セットの修正方法 | |
JP4445371B2 (ja) | 認識語彙の登録装置と音声認識装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070919 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080701 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090327 |