JP2007334665A - 文字入力装置及び携帯情報端末 - Google Patents

文字入力装置及び携帯情報端末 Download PDF

Info

Publication number
JP2007334665A
JP2007334665A JP2006166366A JP2006166366A JP2007334665A JP 2007334665 A JP2007334665 A JP 2007334665A JP 2006166366 A JP2006166366 A JP 2006166366A JP 2006166366 A JP2006166366 A JP 2006166366A JP 2007334665 A JP2007334665 A JP 2007334665A
Authority
JP
Japan
Prior art keywords
character
input
vowel
voice
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006166366A
Other languages
English (en)
Inventor
Takeshi Inoue
武史 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006166366A priority Critical patent/JP2007334665A/ja
Publication of JP2007334665A publication Critical patent/JP2007334665A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

【課題】大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる文字入力装置及び携帯情報端末を得ることを目的とする。
【解決手段】音声入力部1により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する音声認識部2と、50音の行を指定する行指定文字の入力を受け付ける行指定文字入力部3とを設け、音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定する。
【選択図】図1

Description

この発明は、少ない操作で文字を入力することが可能な文字入力装置と、その文字入力装置を搭載している携帯電話機などの携帯情報端末に関するものである。
携帯電話機などの携帯情報端末では、用意されているボタンが少ないため、同じボタンに複数の文字が割り当てられている。そのため、文字入力を行う場合、1文字の入力を確定するまでに、何度も同じボタンを押下する必要がある。
例えば、「おはよう」を入力する場合には、“あ”ボタンを5回、“は”ボタンを1回、“や”ボタンを3回、“あ”ボタンを3回押す必要があり、操作が繁雑になる。
そのため、文字入力の容易化を図る入力補助機能を実装している携帯電話機が開発されている。
携帯電話機の入力補助機能としては、例えば、次のようなものがある。
ある単語の頭文字が入力されると、その頭文字に関連する単語を類推し、使用頻度が高い順に単語の候補を表示する。
これにより、複数の単語の候補の中から該当する単語を選択すれば、単語を構成する文字の全てを入力する必要がなくなるため、ボタンの押下回数を減らすことができる。
しかしながら、単語の候補数が多い場合、該当単語を探す手間が増えるため、必ずしも効率的に文字入力を行えない場合がある。
ボタンを押下する以外の方法で文字入力を行う方式として音声入力方式がある(例えば、特許文献1参照)。
音声入力方式は、携帯電話機が音声認識処理装置などを搭載することにより実現するものである。
携帯電話機が音声認識処理装置を搭載していれば、音声認識処理装置が音声を認識して、その認識結果を入力文字として取り扱うことができるので、ボタンを押下することなく、文字入力を行うことができる。
しかしながら、音声認識処理装置の音声認識結果に誤りがある場合、ボタンを押下して、その音声認識結果である入力文字を修正する必要があり、必ずしも効率的に文字入力を行えない場合がある。
したがって、効率的に文字入力を行えるようにするには、音声認識処理装置の音声認識率を高める必要がある。
音声認識処理装置の音声認識率を高めるには、文章から単語を類推したり、韻律を用いて単語を類推したりする必要があり、大規模な音声認識辞書(データベース)を用意する必要がある。
特開2001−186269号公報(段落番号[0010]から[0012]、図1)
従来の携帯情報端末は以上のように構成されているので、音声認識処理装置の音声認識率を高めれば、入力文字の修正操作を減らすことができる。しかし、音声認識処理装置の音声認識率を高めるには、大規模な音声認識辞書を用意する必要があるなどの課題があった。
この発明は上記のような課題を解決するためになされたもので、大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる文字入力装置及び携帯情報端末を得ることを目的とする。
この発明に係る文字入力装置は、音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段とを設け、母音特定手段により特定された母音と文字入力手段により入力が受け付けられた行指定文字から入力文字を確定するようにしたものである。
この発明によれば、音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段とを設け、母音特定手段により特定された母音と文字入力手段により入力が受け付けられた行指定文字から入力文字を確定するように構成したので、大規模な音声認識辞書を用意することなく、文字入力の操作を軽減することができる効果がある。
実施の形態1.
図1はこの発明の実施の形態1による携帯情報端末を示す構成図であり、図1の例では、携帯情報端末が携帯電話機であるものを示している。
図1の携帯電話機は、メール送受信機能(文字のデータを送受信する機能)を実装しており、文字の入力を受け付ける文字入力装置を搭載している。
図2はこの発明の実施の形態1による文字入力装置を示す構成図であり、図において、音声入力部1は例えばマイク1aなどから構成されており、音声入力部1はユーザが発する音声を集音して、その音声を示す音声データを音声認識部2に出力する処理を実施する。なお、音声入力部1は音声入力手段を構成している。
音声認識部2は音声を音節単位に認識するための音声認識辞書を搭載しており、音声認識部2は音声入力部1から出力された音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音(“あ”、“い”、“う”、“え”、“お”)を特定する処理を実施する。なお、音声認識部2は母音特定手段を構成している。
行指定文字入力部3は50音の行を指定する行指定文字(“あ”、“か”、“さ”、・・・、“わ”)が割り付けられているボタン3a(あ行を指定するボタン、か行を指定するボタン、さ行を指定するボタン、・・・、わ行を指定するボタン)などから構成されており、50音の行(あ行、か行、さ行、・・・、わ行)を指定する行指定文字の入力を受け付ける処理を実施する。なお、行指定文字入力部3は文字入力手段を構成している。
入力文字確定部4は音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定する処理を実施する。なお、入力文字確定部4は入力文字確定手段を構成している。
文字表示部5は例えば液晶ディスプレイ5aなどから構成されており、入力文字確定部4により確定された入力文字を表示する処理を実施する。
図1の例では、文字入力装置の構成要素である音声認識部2及び入力文字確定部4が専用のハードウェア(例えば、MPUを搭載している半導体集積回路)で構成されているものを想定しているが、文字入力装置がコンピュータで構成される場合、音声認識部2及び入力文字確定部4の処理内容が記述されているプログラムをコンピュータのメモリに格納し、そのコンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図3はこの発明の実施の形態1による文字入力装置の概略の処理内容を示すフローチャートであり、図4はこの発明の実施の形態1による文字入力装置の具体的な処理内容を示すフローチャートである。
次に動作について説明する。
例えば、ユーザが携帯電話機を使用してメールを送信する場合、携帯電話機を操作して、メール作成画面である文字入力画面の表示要求を入力する。
文字入力装置の文字表示部5は、文字入力画面の表示要求を受けると、文字の入力を促す文字入力画面を携帯電話機の液晶ディスプレイ5aに表示する(ステップST1)。
文字入力装置の音声入力部1は、文字表示部5が文字入力画面を携帯電話機の液晶ディスプレイ5aに表示すると、音声の集音処理を開始し、ユーザが音声を発すると(ステップST2)、ユーザの音声を集音して、その音声を示す音声データを音声認識部2に出力する(ステップST3)。
例えば、入力文字が「おはよう」である場合、ユーザが音声「おはよう」を発し、音声入力部1が音声「おはよう」を集音して、その音声を示す音声データを音声認識部2に出力する。
文字入力装置の音声認識部2は、音声入力部1から音声「おはよう」を示す音声データを受けると、その音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音(“あ”、“い”、“う”、“え”、“お”)を特定する(ステップST4)。
ユーザの音声が「おはよう」である場合、下記に示すように、“お”、“は”、“よ”、“う”の母音を特定する。
音節 母音
“お” → “お”
“は” → “あ”
“よ” → “お”
“う” → “う”
文字入力装置の行指定文字入力部3は、文字表示部5が文字入力画面を携帯電話機のディスプレイに表示すると、50音の行を指定する行指定文字(“あ”、“か”、“さ”、・・・、“わ”)の入力処理を開始し、ユーザが行指定文字が割り付けられているボタン3a(あ行を指定するボタン、か行を指定するボタン、さ行を指定するボタン、・・・、わ行を指定するボタン)を押すと(ステップST5)、行指定文字の入力を受け付ける処理を実施する(ステップST6)。
入力文字が「おはよう」である場合、次の順番でボタン3aを押すことになるが、入力文字が「おはよう」であれば、ボタン3aを4回押すだけでよい。
あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)

は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)

や行が割り付けられているボタン(図1では左から2番目、上から3番目のボタン)

あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
文字入力装置の入力文字確定部4は、上記のようにして、音声認識部2が各音節の母音を特定し、行指定文字入力部3が行指定文字の入力を受け付けると(ステップST7)、下記に示すように、順番に、各音節の母音と行指定文字を組み合わせることにより、入力文字を確定する(ステップST8)。
行指定文字 音節の母音 入力文字
“あ” + “お” → “お”
“は” + “あ” → “は”
“や” + “お” → “よ”
“あ” + “う” → “う”
文字入力装置の文字表示部5は、入力文字確定部4が入力文字を確定すると、その入力文字を携帯電話機の液晶ディスプレイ5aに表示する(ステップST9)。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
この実施の形態1では、入力文字が「おはよう」である場合について示したが、例えば、入力文字が「きょう」のように、小文字の“ょ”が含まれている場合、や行が割り付けられているボタン3aを2回押せば、小文字のや行を指定することができる。
また、入力文字が「ばすてい」のように、濁音“ば”が含まれている場合、は行が割り付けられているボタン3aを2回押せば、濁音のは行を指定することができる。
また、入力文字が「ぱん」のように、半濁音“ぱ”が含まれている場合、は行が割り付けられているボタン3aを3回押せば、半濁音のは行を指定することができる。
さらに、入力文字が「きゃらめる」のように、拗音“きゃ”が含まれている場合、か行が割り付けられているボタン3aを2回押せば、拗音のか行を指定することができる。
また、入力文字が「はんどばっぐ」のように、促音“ばっ”が含まれている場合、は行が割り付けられているボタン3aを4回押せば、促音のは行を指定することができる。
以上で明らかなように、この実施の形態1によれば、音声入力部1により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する音声認識部2と、50音の行を指定する行指定文字の入力を受け付ける行指定文字入力部3とを設け、音声認識部2により特定された母音と行指定文字入力部3により入力が受け付けられた行指定文字から入力文字を確定するように構成したので、大規模な音声認識辞書を用意することなく(音節の母音を特定するだけの音声認識辞書を用意すればよい)、文字入力の操作を軽減することができる効果を奏する。
実施の形態2.
上記実施の形態1では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合、ユーザが同じボタン3aを複数回押すものについて示したが、この実施の形態2では、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合でも、清音の場合と同様に、ユーザが1音節につきボタン3aを1回押すだけで済むようにしている。
具体的には、以下の通りである。
文字入力装置の音声入力部1は、ユーザが音声を発すると、上記実施の形態1と同様に、ユーザの音声を集音して、その音声を示す音声データを音声認識部2に出力する。
例えば、入力文字が「ばすてい」である場合、ユーザが音声「ばすてい」を発し、音声入力部1が音声「ばすてい」を集音して、その音声を示す音声データを音声認識部2に出力する。
この例では、音声「ばすてい」の中に濁音“ば”が含まれている。
文字入力装置の音声認識部2は、音声入力部1から音声「ばすてい」を示す音声データを受けると、上記実施の形態1と同様に、その音声データを解析して、ユーザの音声を音節単位に認識し、各音節の母音を特定する。
ユーザの音声が「ばすてい」である場合、下記に示すように、“ば”、“す”、“て”、“い”の母音を特定する。
音節 母音
“ば” → “あ”
“す” → “う”
“て” → “え”
“い” → “い”
また、文字入力装置の音声認識部2は、各音節の音種を特定する。即ち、各音節が清音であるのか、濁音であるのか、半濁音であるのか、拗音であるのか、促音であるのかを特定する。
ユーザの音声が「ばすてい」である場合、“ば”以外の音節は清音であると特定し、“ば”は濁音であると特定する。
この場合、音声認識部2は、音節の母音を特定する音声認識辞書の他に、音節の音種を特定する音声認識辞書を用意する必要があるが、従来例のように、子音を特定する必要がないので、大規模な音声認識辞書は必要ない。
文字入力装置の行指定文字入力部3は、文字表示部5が文字入力画面を携帯電話機のディスプレイに表示すると、上記実施の形態1と同様に、50音の行を指定する行指定文字の入力処理を開始し、ユーザが行指定文字が割り付けられているボタン3aを押すと、行指定文字の入力を受け付ける処理を実施する。
入力文字が「ばすてい」である場合、次の順番でボタン3aを押すことになるが、入力文字が「ばすてい」であれば、ボタン3aを4回押すだけでよい。
は行が割り付けられているボタン(図1では左から3番目、上から2番目のボタン)

さ行が割り付けられているボタン(図1では左から3番目、上から1番目のボタン)

た行が割り付けられているボタン(図1では左から1番目、上から2番目のボタン)

あ行が割り付けられているボタン(図1では左から1番目、上から1番目のボタン)
文字入力装置の入力文字確定部4は、上記のようにして、音声認識部2が各音節の母音と音種を特定し、行指定文字入力部3が行指定文字の入力を受け付けると、下記に示すように、順番に、各音節の母音及び音種(濁音、半濁音、拗音、促音)と、行指定文字を組み合わせることにより、入力文字を確定する。
行指定文字 音節の母音 音種 入力文字
“は” + “あ” + 濁音 → “ば”
“さ” + “う” + 清音 → “す”
“た” + “え” + 清音 → “て”
“あ” + “い” + 清音 → “い”
文字入力装置の文字表示部5は、入力文字確定部4が入力文字を確定すると、上記実施の形態1と同様に、その入力文字を携帯電話機の液晶ディスプレイ5aに表示する。
携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除される。
以上で明らかなように、この実施の形態2によれば、音声認識部2が各音節の母音を特定する他に各音節の音種を特定し、入力文字確定部4が音声認識部2により特定された母音及び音種と、行指定文字入力部3により入力が受け付けられた行指定文字とから入力文字を確定するように構成したので、入力文字に清音以外の音(濁音、半濁音、拗音、促音)が含まれている場合でも、清音の場合と同様に、ユーザが1音節につきボタン3aを1回押すだけで入力処理を終えることができる効果を奏する。
実施の形態3.
上記実施の形態1,2では、携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機のクリアボタン(図示せず)を押すと、入力文字確定部4により確定された入力文字が削除されるものについて示したが、入力文字に誤りが発生している原因の一つである音声認識辞書の音声認識パラメータの不適正は是正されない。
即ち、ユーザの発音と音声認識パラメータの整合性が取れていない場合、音声認識率が低下して、音声認識結果に誤りが生じることがあるが、上記実施の形態1では、入力文字に誤りがある場合でも、音声認識辞書の音声認識パラメータが修正されることはない。
そこで、この実施の形態3では、携帯電話機の液晶ディスプレイ5aに表示されている入力文字に誤りがある場合、ユーザが携帯電話機の修正ボタン(図示せず)を操作して、正しい入力文字を入力すると、パラメータ更新手段を構成する音声認識部2が、音声認識辞書の音声認識パラメータを正しい入力文字に合わせて更新する。
図5は音声認識辞書の一例を示し、例えば、正しい文字が「き」であるとき、「か」と誤認識された場合、ユーザの入力音声の特徴を考慮して、以後、同じ音声が入力されたときは、文字「き」が文字「か」より選択される可能性が高くなるように、文字「き」と文字「か」の音声認識パラメータを更新する。
なお、音声認識パラメータの更新処理自体は、公知の技術であるため、詳細な説明を省略する。
以上で明らかなように、この実施の形態3によれば、入力文字確定部4により確定された入力文字に誤りがある場合、音声認識部2が音声認識処理を実施する際に使用する音声認識パラメータを正しい入力文字に合わせて更新するように構成したので、以降の音声認識処理の音声認識率を高めて、入力文字の誤りを低減することができる効果を奏する。
この発明の実施の形態1による携帯情報端末を示す構成図である。 この発明の実施の形態1による文字入力装置を示す構成図である。 この発明の実施の形態1による文字入力装置の概略の処理内容を示すフローチャートである。 この発明の実施の形態1による文字入力装置の具体的な処理内容を示すフローチャートである。 音声認識辞書の一例を示す説明図である。
符号の説明
1 音声入力部(音声入力手段)、1a マイク、2 音声認識部(母音特定手段、パラメータ更新手段)、3 行指定文字入力部(文字入力手段)、3a ボタン、4 入力文字確定部(入力文字確定手段)、5 文字表示部、5a 液晶ディスプレイ。

Claims (4)

  1. 音声の入力を受け付ける音声入力手段と、上記音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段と、上記母音特定手段により特定された母音と上記文字入力手段により入力が受け付けられた行指定文字から入力文字を確定する入力文字確定手段とを備えた文字入力装置。
  2. 母音特定手段が各音節の母音を特定する他に各音節の音種を特定し、入力文字確定手段が上記母音特定手段により特定された母音及び音種と、文字入力手段により入力が受け付けられた行指定文字とから入力文字を確定することを特徴とする請求項1記載の文字入力装置。
  3. 入力文字確定手段により確定された入力文字に誤りがある場合、母音特定手段が音声認識処理を実施する際に使用する音声認識パラメータを正しい入力文字に合わせて更新するパラメータ更新手段を設けたことを特徴とする請求項1または請求項2記載の文字入力装置。
  4. 文字のデータを送受信する機能を備えている携帯情報端末において、音声の入力を受け付ける音声入力手段と、上記音声入力手段により入力が受け付けられた音声を音節単位に認識して、各音節の母音を特定する母音特定手段と、50音の行を指定する行指定文字の入力を受け付ける文字入力手段と、上記母音特定手段により特定された母音と上記文字入力手段により入力が受け付けられた行指定文字から入力文字を確定する入力文字確定手段とを備えた文字入力装置を搭載していることを特徴とする携帯情報端末。
JP2006166366A 2006-06-15 2006-06-15 文字入力装置及び携帯情報端末 Withdrawn JP2007334665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006166366A JP2007334665A (ja) 2006-06-15 2006-06-15 文字入力装置及び携帯情報端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006166366A JP2007334665A (ja) 2006-06-15 2006-06-15 文字入力装置及び携帯情報端末

Publications (1)

Publication Number Publication Date
JP2007334665A true JP2007334665A (ja) 2007-12-27

Family

ID=38934083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006166366A Withdrawn JP2007334665A (ja) 2006-06-15 2006-06-15 文字入力装置及び携帯情報端末

Country Status (1)

Country Link
JP (1) JP2007334665A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100910302B1 (ko) 2007-06-28 2009-08-03 주식회사 케이티 멀티모달 기반의 정보 검색 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100910302B1 (ko) 2007-06-28 2009-08-03 주식회사 케이티 멀티모달 기반의 정보 검색 장치 및 방법

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
TWI281146B (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US20060293889A1 (en) Error correction for speech recognition systems
US20080126093A1 (en) Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System
JP2007538278A (ja) 音声認識システム
JP2008129412A (ja) 半導体集積回路装置、電子機器
US7035800B2 (en) Method for entering characters
JP5189858B2 (ja) 音声認識装置
US20170364516A1 (en) Linguistic model selection for adaptive automatic speech recognition
US7181397B2 (en) Speech dialog method and system
CA3097683C (en) Speech analysis system
JP2007193166A (ja) 対話装置、対話方法及びプログラム
JP2018045675A (ja) 情報提示方法、情報提示プログラム及び情報提示システム
US20230148275A1 (en) Speech synthesis device and speech synthesis method
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP5238395B2 (ja) 言語モデル作成装置および言語モデル作成方法
JP2006259641A (ja) 音声認識装置及び音声認識用プログラム
JP2007334665A (ja) 文字入力装置及び携帯情報端末
CN113409761B (zh) 语音合成方法、装置、电子设备以及计算机可读存储介质
JP2011248002A (ja) 翻訳装置
JP4498906B2 (ja) 音声認識装置
JP2000101705A (ja) 無線電話機
EP2755202B1 (en) Voice recognition device
JP6807491B1 (ja) 補聴器用合成音声セットの修正方法
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070919

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080701

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090327