JP2004227156A - 文字入力方法 - Google Patents

文字入力方法 Download PDF

Info

Publication number
JP2004227156A
JP2004227156A JP2003012407A JP2003012407A JP2004227156A JP 2004227156 A JP2004227156 A JP 2004227156A JP 2003012407 A JP2003012407 A JP 2003012407A JP 2003012407 A JP2003012407 A JP 2003012407A JP 2004227156 A JP2004227156 A JP 2004227156A
Authority
JP
Japan
Prior art keywords
character
input
key
recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003012407A
Other languages
English (en)
Inventor
Shunichi Sato
俊一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003012407A priority Critical patent/JP2004227156A/ja
Publication of JP2004227156A publication Critical patent/JP2004227156A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】キー入力と音声認識を併用した携帯電話における文字入力操作が効率的に得られるようにした文字入力方法を提供すること。
【解決手段】音素認識手段3により音声入力された文字の母音を表面手段8に表示し、キー入力により、一文字づつ確定しながら文字入力を行うようにした文字入力方法において、音素認識誤りがあったと判断した場合には、予め設定してある音素認識誤り傾向に基づき、次候補として誤り率が高い文字を出力するようにしたもの。
【効果】誤認識が発生した場合の文字入力操作が効率化され、入力操作にかかる負担を軽減することができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、音素認識機能を利用して文字を入力する方法に係り、特に携帯電話などにおいて簡易に文字入力が行えるようにした文字入力方法に関する。
【0002】
【従来の技術】
近年、携帯電話による文字送信機能(Eメールなど)が広く普及し、送信可能な文字数も増加している。また、ジャバ(Java(登録商標))アプリケーションなどによるウェブとの連携による各種サービスを受ける場合においても、各種情報の送信が必要となり、文字を入力する機会が増える傾向にある。
【0003】
しかし、従来の携帯電話では、いくつかの文字を除き、一個のキー(押しボタン)に複数の文字を割り当てている方式なので、1字毎にキーを数回押して候補を選ぶ必要があり、このため操作が煩雑で、文字入力がユーザ(利用者)の大きな負担になっていた。
【0004】
また、入力方式として音声認識を使用する場合もあるが、このときは、入力した音声の誤認識により、やはり文字入力がユーザの大きな負担になっていた。
【0005】
そこで、従来から、キー操作による文字入力と音声認識による文字入力を併用する方法が種々提案されていて、例えば或る方法では、音声入力された日本語中の母音だけを認識し、この母音とキーボードから入力された子音とを組合せて文字列に編集して出力するようにしている(例えば、特許文献1参照。)。
【0006】
また、他の方法では、入力音声を音声認識した結果から入力候補とされたものに対して、キーボードから入力された品詞の種類など、補助的な情報により単語辞書を検索し、候補とな単語の変換を行うようにしている(例えば、特許文献2参照。)。
【0007】
更に、別の方法では、単語単位の音声入力から音素を抽出し、母音列と子音列とに分け、それぞれをキーとして単語見出し辞書を検索することにより、最も類似度の高い単語を入力単語として決定するようにしている(例えば、特許文献3参照。)。
【0008】
一方、更に別の方法では、カテゴリ情報別辞書検索手段を設け、検索対象範囲が少なくなるようにし、これにより誤認識の発生確率が減らせ、文字入力操作を軽減させるようにしている(例えば、特許文献4参照。)。
【0009】
【特許文献1】
特開昭57−11399号公報
【0010】
【特許文献2】
特開昭57−189241号公報
【0011】
【特許文献3】
特開昭60−118896号公報
【0012】
【特許文献4】
特開2001−159896号公報
【0013】
【発明が解決しようとする課題】
上記従来技術は、入力された音声の誤認識に際して正しい入力文字の確定操作が煩雑でキー入力回数が多い点に配慮がされておらず、ユーザに大きな負担を与えてしまうという問題があった。
【0014】
また、上記従来技術では、音声認識率を向上させるためには辞書検索などの処理が必要であり、携帯電話のように、CPUが低速な場合は、処理に大きな負担が掛かってしまうという問題があった。
【0015】
本発明の目的は、キー入力と音声認識を併用した携帯電話における文字入力操作が効率的に得られるようにした文字入力方法を提供することにある。
【0016】
【課題を解決するための手段】
上記目的は、日本語の音声入力とキー入力を併用して文字を認識する方式の文字入力方法において、音声により入力された日本語中の母音だけを認識する音素認識部と、前記入力された音声に対応するキーによる文字入力部と、前記音素認識部の出力とキー出力の組合せで文字を出力する文字認識部とを備えることにより達成される。
【0017】
このとき、音素認識部は、認識誤りを生じた場合に、予め設定してある音素認識誤り傾向に基づき、次候補として誤り率が高い文字を提示するようにし、更にこのとき、次候補が母音「う」であるようにしても上記目的が達成される。
【0018】
また、このとき、音声入力とキー入力をそれぞれ一文字づつ対応させたり、音声を一括で入力し、その後キー入力によって一文字づつ対応させたり、更にはキー入力に対応させて、一括入力した音声を順次再生させるようにしてもよい。
【0019】
【発明の実施の形態】
以下、本発明による文字入力方法について、本発明を携帯電話に適用した場合の実施の形態により詳細に説明する。ここで、図1は本発明が適用された携帯電話の一実施形態における文字入力に係わる部分を示すブロック図である。
【0020】
この図1において、1は音声入力装置で、例えばマイク(マイクロホン)などを用い、外部からユーザの音声を入力する働きをする。2はキー入力装置で、ユーザのキー操作により文字を入力する働きをする。3は音声認識装置で、入力された音声データをデジタル化して認識する働きをする。
【0021】
次に、4はキー入力制御手段で、キー入力装置2から入力されたデータを処理する働きをする。5は文字認識手段で、音素認識手段3による認識結果とキー入力制御手段4から入力される信号により、文字を認識する働きをする。
【0022】
また、6は認識誤り検索手段で、詳しくは後述するが、予め設定してある音素認識誤り傾向に基づいて文字を検索する働きをする。7は文字変換手段で、入力された文字の確定に必要な制御を行う。そして、8は表示手段で、ここでは携帯電話の液晶ディスプレイで構成され、操作指示の表示や確定した文字などを表示する働きをする。
【0023】
次に、図2は、キー入力装置2の一例で、この実施形態の場合は、携帯電話が対象なので、ファンクションキー11、12、方向キー13〜16、決定キー17、電話送受信キー18、クリアキー19、電話切断キー20、テンキー21〜30、それに特殊キー31、32を備え、通常の一般的な携帯電話のキー入力装置と同等な構成になっている。
【0024】
ここで図3は、テンキー21〜30に割り振ってある文字の一例で、テンキー21には五十音表の「あ」行、テンキー22には同じく「か」行というように、順に割り振られている。
【0025】
次に、この実施形態による文字入力処理について、図4により説明すると、この図で、まず入力文字51が入力したい文字列の一例で、ここでは、「ビジネス株式会社」という文字を入力する場合が例示されている。
【0026】
そして、音声入力52が図1の音声入力装置1から入力される音声を表わし、この場合は、「ビジネス株式会社」に対応する音声として、
「び→じ→ね→す→か→ぶ→し→き→か→い→し→や」
と入力されることになる。
【0027】
次に、音素認識53は、入力された音声から音素認識手段3により認識された結果であり、「びじねすかぶしきかいしや」という音声入力52に対して、
「い→い→え→う→あ→う→い→い→あ→い→い→あ」
と、それらの母音が音素認識53として認識されている状態が示されている。
【0028】
一方、キー入力54は音素認識53で認識された母音に対応する文字を入力するためのキー入力操作で、キー入力装置2から入力され、キー入力制御手段4で処理される文字列であり、図2のキー21〜32を操作して入力される。
【0029】
ここで、この図4では、これら音声入力52と音素認識53、それにキー入力54に付されている丸付き文字▲1▼、▲2▼、……は、それぞれにおける各々の文字の対応を表わす。
【0030】
このときの実際のキー操作は、
「66→#→33→#→5555→333→2→666→#→33→22→2→11→33→8→*」
と順次、カーソルを移しながら実行されるが、ここで、数字の重複は同じ数字キーの反復押下を表わし、例えば、「66」は、テンキー26を2回、押下することを意味する。
【0031】
従って、キー「66」の操作により「は行の(ひ)」が選択され、これが続くキー「#」の操作により、濁音の文字(び)となって入力され、キー操作「33」は「さ行の(し)」を表わし、続くキー「#」の操作により濁音の文字(じ)となって入力される。
【0032】
次に、キー操作「5555」は「な行の(ね)」の入力を表わし、キー操作「333」は「さ行の(す)」の入力を表わす。また、キー操作「2」により「か行の(か)」が入力され、キー操作「666」は「は行の(ふ)」で、続くキー「#」の操作により濁音の文字(ぶ)になる。
【0033】
また、キー操作「33」は「さ行の(し)」の入力になり、キー操作「22」は「か行の(き)」に、キー操作「11」は「あ行の(い)」に、キー操作「33」は「さ行の(し)」になる。そして、キー操作「8」は「や行の(や)」の選択で、続くキー「*」の操作により小文字の(ゃ)の入力になるのである。
【0034】
そして、これら音素認識結果53とキー入力54から、文字認識手段5により与えられる結果が文字認識結果55で、このときには、
「び じ ね す か ぶ し き か し ゃ」
と正しく認識されていることになる。
【0035】
そこで、最後に、この文字認識結果55を文字変換手段7で変換処理し、文字変換結果56として「ビジネス株式会社」という文字がデータとして入力されることになり、表示手段8に表示される。
【0036】
ここで、このときの音声入力52から文字認識結果55に至るまでの認識結果は、逐次、表示手段8に表示され、その都度、ユーザが確認できるようになっている。
【0037】
次に、音素認識に誤りがあったときの処理について、図4の入力文字51と同じ文字が入力された場合を例にして、図5により説明する。ここで、この図5では、図4の入力文字51と音声入力52、音素認識53、キー入力54、文字認識結果55、それに文字変換後56について、それぞれ入力文字61、音声入力62、音素認識63、キー入力64、文字認識結果65、文字変換後66として説明する。
【0038】
図5において、いま、ここで入力文字61の中の「ビジネス」における「ス」の音素について、正しくは「う行」と認識すべきところ、音素認識53の▲4▼’に示すように、誤って「え行」と認識してしまったとする。
【0039】
そして、このように母音「う」について、それが母音「え」と誤認識された場合、このままでは、この後のキー入力64で「3」(「さ行」)を入力したとき、「せ」と誤って文字認識されてしまうことになる。
【0040】
ここで、このときの誤認識は、表示手段8に表示されることから、ユーザに報知されるが、この場合、この実施形態では、予めユーザに訂正キーによる入力操作が指示されている。
【0041】
なお、この実施形態では、図2に示したファンクションキー12が訂正キーとして設定してあり、従って、以下、このファンクションキー12のことを訂正キー12と記すことにする。
【0042】
こうして誤認識を知ったユーザが訂正キー12を押すと、これにより文字認識手段5は認識誤り検索手段6と連携して処理を実行し、音素認識における認識率傾向を表わすデータ(後で詳述する)に基づき、次候補として母音「う」に対応する文字をユーザに提示する。このとき、例えばキー入力64の▲4▼に示すように、「3」(「さ行」)が入力されたとすると、まず「す」の文字が表示手段8に表示される。
【0043】
この場合、文字「す」で正しいので、このまま選択することにより誤認識の訂正が得られることになるが、文字「す」で誤っていた場合には、以下、「せ」、「そ」、「さ」、……というように、トグルで順次提示させる。これは、従来のキー入力と互換性をもたせ、キー入力操作に違和感が生じないようにするためである。
【0044】
ここで、上記した認識率傾向を表わすデータについて説明すると、図6は一般的な実験結果から得られた音素認識における認識率について示したもので、図示のように、母音「う」以外の文字については90%の認識率が得られるが、母音「う」については約50%の認識率しか得られないことが判る。
【0045】
そこで、この実施形態では、上述したように、母音「う」以外の文字で誤りがあり、ユーザが訂正キー12を押した場合には、まず、第一の候補として、母音「う」に対応する文字が提示されるようにしたものである。
【0046】
この場合、上記したように、母音「う」が約50%と認識率が低いことから、誤認識の場合は「う」である確率が高いことになり、従って、この実施形態によれば効率的な文字入力が得られることになる。
【0047】
ところで、この実施形態では、例えば「チーム」のような文字列を入力する場合、何もしなければ、例えば「ー」を入力するためには、「0」のテンキー30を4回押すことになる。
【0048】
このとき音素認識63で「あ」と認識して、「0」キーが押された場合には、候補として「わ」が提示されるが、ここで訂正キー12が押された場合、第一候補として、「ー」を提示させるようにすれば効率的な入力が得られる。つまり、この実施形態では、この例の場合も、予め設定してある音素認識誤り傾向と同様に扱うことにより、更に効率的な入力が得られることになる。
【0049】
次に、この実施形態による文字入力処理について、図7と図8のフローチャートにより説明すると、まず図7は、上述した一連の文字入力処理の全体を示したもので、この図7の処理の開始(ステップ81)は、例えばファンクションキー11、12、方向キー13〜16、決定キー17などの操作を契機とする。
【0050】
そして、処理が開始81されたら、まず判断処理82で文字入力処理か否かを調べ結果がNo(否定)、つまり、このときの処理の開始が文字入力のためではなかったときは通常処理91に戻る。
【0051】
一方、判断処理82での結果がYes(肯定)なら判断処理83に進み、ここでユーザが音声入力を選択したのか、キー入力だけによる通常の文字入力を選択したのかを調べる。ここで、この判断処理83での処理は、例えば表示手段8によるユーザへの問いかけと、これに対する応答として、指定されているキーのユーザによる押下により実行される。
【0052】
そして、まず、判断処理83の応答結果がNo のときは通常文字入力処理90に移行する。一方、結果がYes なら音声認識処理84に進む。
【0053】
音声認識処理84に進んだときは、ここで、まず音声認識され、次のキー入力処理85を実行し、文字認識処理86で文字認識が実行される。ここで、この文字認識処理86における文字認識処理の詳細は、図8のフローチャートにより後述する。
【0054】
そして、文字認識処理86の後は文字変換処理87を実行し、文字確定処理88を経て、終了89に至り、この結果、図4で説明した処理が得られることになる。
【0055】
次に、文字認識処理84の詳細について、図8のフローチャートにより説明する。処理を開始101したら、まず判断処理102で入力誤有りか否かを判定する。そして、結果がNo なら直ちに文字候補確定処理107に進み、ここで処理を終了108する。
【0056】
一方、判断処理102での結果がYes 、つまり入力誤有りのときは訂正キー入力処理103に進み、「う」を提示処理104で母音「う」に対応する文字を提示し、これで誤りありか否かの判断処理105に進む。
【0057】
そして、この判断処理105での結果がNo 、つまり誤りなしのときは文字候補確定処理107に進んでから処理を終了108する。
【0058】
一方、判断処理105で結果がYes 、つまり誤りがったときは、「え」からトグル処理106により次候補以降の文字を順次提示し、正しい文字が提示されたとき、文字候補確定処理107として、ユーザが文字確定処理を行なうのであり、従って、これにより図5の処理が得られることになる。
【0059】
ここで、以上の実施形態では、一文字づつ順次確定しながら文字入力を行っているが、音声入力は一括して行ない、その後、一文字づつ文字を確定していくようにしてもよい。
【0060】
例えば、図5において、音声入力62の▲1▼から終わりまでを一括して音声入力し、音素認識63で母音を認識した後、キー入力64で、順次、キー入力していく方法である。
【0061】
ここで、この音声を一括して入力する場合、キー入力に対応して、入力した音声をそのまま再生することにより、キーと入力した音声を対応させながら、キー入力を行うことができ、一文字づつ入力する場合と同様な入力が可能となる。
【0062】
従って、こ実施形態によれば、音素認識誤りがあったと判断された場合に、予め設定してある音素認識誤り傾向に基づき、次候補として誤り率が高い文字を表示手段に表示することにより、誤認識が発生した場合の文字入力操作が効率的に得られるので、ユーザの負担を軽減することができる。
【0063】
また、この実施形態によれば、音声入力とキー入力をそれぞれ一文字づつ対応させることにより、音声入力とキー入力の判定処理の煩雑さを軽減することも可能となる。
【0064】
一方、音声を一括で入力し、その後キー入力によって一文字づつ対応させることにより、音声入力の手間が軽減できる。ここで音声を一括で入力する場合、キー入力に対応させて、一括入力した音声を順次再生させることにより、音声入力とキー入力の対応が容易となる。
【0065】
特に、音素認識誤りがあったと判断された場合、次候補として母音音素「う」を優先的に表示手段に表示することにより、一般的に多数の人に対しても文字入力操作の負担を軽減ことが可能となる。
【0066】
【発明の効果】
本発明によれば、キー入力と音声認識を併用した携帯電話において、文字入力操作を効率的に得ることができ、ユーザの負担を軽減することができる。
【図面の簡単な説明】
【図1】本発明による文字入力方法の一実施形態を示すブロック図である。
【図2】本発明の一実施形態におけるキー入力装置の説明図である。
【図3】本発明の一実施形態における文字キー配置の説明図である。
【図4】本発明の一実施形態における音素認識による文字入力処理の説明図である。
【図5】本発明の一実施形態における認識誤りがあった場合の文字入力処理の説明図である。
【図6】音素認識傾向の説明図である。
【図7】本発明の一実施形態による文字入力処理の全体動作を説明するためのフローチャートである。
【図8】本発明の一実施形態における文字認識処理動作を説明するためのフローチャートである。
【符号の説明】
1 音声入力装置
2 キー入力装置
3 音声認識手段
4 キー入力制御手段
5 検索手段
6 文字を認識するための情報を格納した記憶部
7 表示手段
11、12 ファンクションキー
13、14、15、16 方向キー
17 決定キー
18 電話送受信キー
19 クリアキー
20 電話切断キー
21〜30 テンキー
31、32 特殊キー
51、61 入力文字
52、62 音声文字
53、63 音素認識
54、64 キー入力
55、65 入力認識結果
56、66 文字変換後
81、101 端子:開始
82 判断処理:文字入力
83 判断処理:音声入力
84 処理:音声認識処理
85 処理:キー入力処理
86 処理:文字認識処理
87 処理:文字変換処理
88 処理:文字確定
89、108 端子:終了
90 他:通常文字入力処理
91 他:通常処理
101 判断処理:入力誤有り
103 処理:訂正キー入力
104 処理:「う」を提示
105 判断処理:誤有り
106 処理:「え」からトグル
107 処理:文字候補確定

Claims (6)

  1. 日本語の音声入力とキー入力を併用して文字を認識する方式の文字入力方法において、
    音声により入力された日本語中の母音だけを認識する音素認識部と、
    前記入力された音声に対応するキーによる文字入力部と、
    前記音素認識部の出力とキー出力の組合せで文字を出力する文字認識部とを備えていることを特徴とする簡易文字入力方法。
  2. 請求項1に記載の文字入力方法において、
    前記音素認識部は、認識誤りを生じた場合に、予め設定してある音素認識誤り傾向に基づき、次候補として誤り率が高い文字を提示することを特徴とする文字入力方法。
  3. 請求項2に記載の文字入力方法において、
    前記次候補が母音「う」であることを特徴とする文字入力方法。
  4. 請求項1に記載の文字入力方法において、
    音声入力とキー入力をそれぞれ一文字づつ対応させることを特徴とする文字入力方法。
  5. 請求項1に記載の文字入力方法において、
    音声を一括で入力し、その後キー入力によって一文字づつ対応させることを特徴とする文字入力方法。
  6. 請求項5に記載の文字入力方法において、
    キー入力に対応させて、一括入力した音声を順次再生させることを特徴とする文字入力方法。
JP2003012407A 2003-01-21 2003-01-21 文字入力方法 Pending JP2004227156A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003012407A JP2004227156A (ja) 2003-01-21 2003-01-21 文字入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003012407A JP2004227156A (ja) 2003-01-21 2003-01-21 文字入力方法

Publications (1)

Publication Number Publication Date
JP2004227156A true JP2004227156A (ja) 2004-08-12

Family

ID=32901025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003012407A Pending JP2004227156A (ja) 2003-01-21 2003-01-21 文字入力方法

Country Status (1)

Country Link
JP (1) JP2004227156A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100910302B1 (ko) * 2007-06-28 2009-08-03 주식회사 케이티 멀티모달 기반의 정보 검색 장치 및 방법
JP2013016196A (ja) * 2012-09-24 2013-01-24 Nec Corp 入力文字候補を音声により変換する機能を備える情報処理装置及びその文字入力プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100910302B1 (ko) * 2007-06-28 2009-08-03 주식회사 케이티 멀티모달 기반의 정보 검색 장치 및 방법
JP2013016196A (ja) * 2012-09-24 2013-01-24 Nec Corp 入力文字候補を音声により変換する機能を備える情報処理装置及びその文字入力プログラム

Similar Documents

Publication Publication Date Title
KR101109265B1 (ko) 텍스트 입력 방법
JP4012143B2 (ja) 情報処理装置およびデータ入力方法
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
TWI293455B (en) System and method for disambiguating phonetic input
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
TWI266280B (en) Multimodal disambiguation of speech recognition
JP2006031092A (ja) 音声文字入力プログラム及び携帯端末装置
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
JP2009098490A (ja) 音声認識結果編集装置、音声認識装置およびコンピュータプログラム
WO1999063425A1 (fr) Procede et appareil de traitement d'informations et support de fourniture d'informations
WO2004036939A1 (fr) Appareil de communication mobile numerique portable, procede de commande vocale et systeme
US6674372B1 (en) Chinese character input method using numeric keys and apparatus thereof
US20050268231A1 (en) Method and device for inputting Chinese phrases
JP2006053906A (ja) コンピューティングデバイスへの入力を提供するための効率的なマルチモーダル方法
US20070038456A1 (en) Text inputting device and method employing combination of associated character input method and automatic speech recognition method
JP2002333948A (ja) 文字選択方法及び文字選択装置
US20060095263A1 (en) Character string input apparatus and method of controlling same
JPH08248987A (ja) 音声認識方法
JP2004227156A (ja) 文字入力方法
JP2011186994A (ja) 文字入力装置および文字入力方法
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JP3867775B2 (ja) 単語入力による文章作成装置
JP4229627B2 (ja) ディクテーション装置、方法及びプログラム
JPH0863185A (ja) 音声認識装置
JP2002189490A (ja) ピンイン音声入力の方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080520