JP2004032275A - 文字情報作成システムおよび文字情報作成装置 - Google Patents
文字情報作成システムおよび文字情報作成装置 Download PDFInfo
- Publication number
- JP2004032275A JP2004032275A JP2002184411A JP2002184411A JP2004032275A JP 2004032275 A JP2004032275 A JP 2004032275A JP 2002184411 A JP2002184411 A JP 2002184411A JP 2002184411 A JP2002184411 A JP 2002184411A JP 2004032275 A JP2004032275 A JP 2004032275A
- Authority
- JP
- Japan
- Prior art keywords
- character information
- communication terminal
- voice
- real time
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
【解決手段】通信端末1は、音声信号をマイク101で取得し文字情報作成装置2に送る。文字情報作成装置2は、リアルタイムで、音声信号に対して音声認識を行い文字情報を作成して通信端末1に送る。通信端末1は、その文字情報を表示する。通信端末1は、文字情報がユーザの意図するものなければ、ユーザの操作に従って修正を文字情報作成装置2に指示する。文字情報がユーザの意図どおりに修正されると、文字情報作成装置2は、文字情報の音声認識を確定させ、かな漢字変換して通信端末1に送る。通信端末1は、ユーザの操作に従い、必要に応じて、再変換するよう文字情報作成装置2に指示する。最後に、文字情報作成装置2は、かな漢字変換を確定させる。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、携帯電話機等の文字入力に関する。
【0002】
【従来の技術】
従来より、携帯電話機において電子メールの本文の作成するときなど、ユーザはキー操作により文字情報を入力している。例えば、ひらがなを入力した後、その文字情報をかな漢字変換することにより、ユーザは意図した文字情報を得ることができる。通常、それらの処理は全て携帯電話機に備えられた機能によって行われる。
【0003】
しかし、小型であることが好ましい携帯電話機のキーは、一般に操作しずらいものである。そのわずらわしさを解消するために、音声入力により文字情報を作成することが考えられている。
【0004】
音声認識により文字情報を入力するための処理は複雑であるため、それを行う装置には高い処理能力が要求される。しかし、近年の技術の進歩により、文字情報の音声入力は一般化してきている。そして、パーソナルコンピュータなどで実行可能な、音声認識を行うためのソフトウェアプログラム(以下、音声認識プログラム)が開発されている。ユーザの利便性を考えると、このような音声認識プログラムを携帯電話機上でも実行できることが好ましい。
【0005】
しかし、携帯電話機の処理能力が向上しているとはいえ、現状では音声認識プログラムを実行するには処理能力が不足しており、携帯電話機上で音声認識プログラムを実行するのはやや無理がある。また、携帯電話機に処理能力の高いプロセッサや記憶容量の大きな記憶装置を備えるのは、小型化、低コスト化、低消費電力化などが重要視される携帯電話機において、必ずしも好ましいことでないことがある。
【0006】
これに対して、通信ネットワーク上にあり、携帯電話機からアクセス可能で、音声データを文字情報に変換する機能を有するコンピュータ(以下、変換装置と称す)を設けることが考えられている。例えば、従来の携帯電話システムでは、携帯電話機から変換装置に音声通話を接続してユーザが携帯電話機に音声を入力すると、その音声は音声データとして変換装置に蓄積される。次に、変換装置が音声データを文字情報に変換する。音声データが変換された文字情報はデータ通信によって携帯電話機に送り返される。
【0007】
特開2002−16701号公報には、携帯電話機に入力された音声を文字情報に変換する装置(以下、変換装置と称す)が開示されている。特開2002−16701号公報によれば、電話回線を通して入力された音声は変換装置に一旦録音される。そして、変換装置は、録音した音声データを、かな漢字混じりの文字情報に変換する。次に、変換装置は、文字情報を電子メールにより携帯電話機に送信する。
【0008】
特開2001−350493号公報には、携帯電話機に入力された音声を電話回線を介して受信し、文字情報に変換した後、その文字情報を同じ電話回線を介して携帯電話機に送信する装置(以下、変換装置と称す)が開示されている。この変換装置は、1本の電話回線で音声と文字情報とが送受信されるが、音声と文字情報は時間を分けてその回線上を伝送される。
【0009】
特開2001−309049号公報には、音声を文字情報に変換するとき、意図する変換が得られる率(以下、変換率と称す)を向上させるための手法が示されている。特開2001−309049号公報によれば、音声を文字情報に変換する機能を有するメール作成装置にて使用される変換辞書等をユーザ自身が予め指定しておく。入力した音声は、ユーザが予め設定した辞書によって自動的に変換されることにより高い変換率が得られる。
【0010】
【発明が解決しようとする課題】
特開2002−16701号公報によれば、ユーザは音声を文字情報に変換することができる。しかし、この変換は変換装置によって自動的に行われるので、変換結果にユーザの意志が反映されず、ユーザの意図しない変換結果が得られてしまうことが多い。
【0011】
特開2001−350493号公報によれば、特開2002−16701号公報と同様に、ユーザは音声を文字情報に変換することができる。しかし、この場合も、変換結果にユーザの意志が反映されず、ユーザの意図しない変換結果が得られてしまうことが多い。変換結果に意図するものと異なる部分がある場合、ユーザは携帯電話機を操作して、その部分を修正する必要がある。
【0012】
特開2001−309049号公報によれば、音声を文字に変換するときの変換率が向上する。しかし、この場合も、変換結果にユーザの意志が反映されるわけではない。したがって、変換結果が得られた後、ユーザはそれを添削する必要がある。ユーザが予め指定した辞書が使用されているとはいえ、音声認識における誤りと、かな漢字混じりの文字情報に変換するときの誤りとが相乗して変換結果に現れるので、添削が必要とされる可能性は低くない。また、特開2001−309049号公報には、意図しない部分を修正する手段も開示されている。これによれば、修正の必要な部分をユーザがメール作成装置に通知すると、メール作成装置がそれを修正してユーザに送り返す。このように、ユーザは変換結果を添削し、修正することができるが、変換結果を改めて見直し、修正すべき部分を抽出し、その部分をメール作成装置に通知する必要があり、非常に手間のかかる作業である。
【0013】
本発明の目的は、音声入力により容易に意図する文字情報を作成できる携帯電話システムおよび文字情報作成装置を提供することである。
【0014】
【課題を解決するための手段】
上記目的を達成するために、本発明の文字情報作成システムは、音声より文字情報を作成する機能を有する文字情報作成システムであって、
マイクを有し、該マイクにて取得された音声信号を文字情報作成装置に送り、前記音声信号に基づく文字情報を前記文字情報作成装置から受信すると該文字情報を表示し、該文字情報がユーザの意図するものであれば前記文字情報作成装置に音声認識の確定をリアルタイムで通知する通信端末と、
前記音声信号を前記通信端末から受けると、リアルタイムで、該音声信号に対して音声認識を行い文字情報を作成して該文字情報を前記通信端末に送り、また前記通信端末から音声認識の確定の通知を受けると、該文字情報の音声認識をリアルタイムで確定する文字情報作成装置とを有している。
【0015】
したがって、本発明によれば、通信端末が音声を文字情報作成装置に送り、文字情報作成装置が音声認識を行ってリアルタイムで文字情報を作成し、その文字情報を通信端末に送り返すことができる。
【0016】
本発明の一態様によれば、前記通信端末は、前記文字情報が前記ユーザの意図するものでなく消去すべきものであれば前記文字情報の消去を前記文字情報作成装置にリアルタイムで指示し、また前記文字情報が前記ユーザの意図するものでなく修正すべきものであれば前記文字情報の修正を前記文字情報作成装置にリアルタイムで指示し、
前記文字情報作成装置は、前記通信端末から前記文字情報の消去を指示されると、該文字情報をリアルタイムで消去し、また前記通信端末から前記文字情報の修正を指示されると、該文字情報をリアルタイムで修正する。
【0017】
したがって、ユーザの意図に合わないためユーザが消去または修正の操作を通信端末に対して行うと、それが文字情報作成装置に通知され、リアルタイムで文字情報が消去または修正される。
【0018】
本発明の一態様によれば、前記文字情報作成装置は、前記文字情報の音声認識を確定した後に、該文字情報をかな漢字変換し、かな漢字変換後の文字情報を前記通信端末に送信し、また前記通信端末からかな漢字変換の確定の通知を受けると、前記かな漢字変換後の文字情報のかな漢字変換をリアルタイムで確定し、
前記通信端末は、前記かな漢字変換後の文字情報を前記文字情報作成装置から受けると、前記かな漢字変換後の文字情報をリアルタイムで表示し、前記かな漢字変換後の文字情報がユーザの意図するものであれば前記文字情報作成装置にかな漢字変換の確定をリアルタイムで通知する。
【0019】
したがって、通信端末にて音声認識が確定されると、文字情報作成装置にて文字情報は、かな漢字変換され、変換後の文字情報が通信端末に送られ、通信端末に表示される。
【0020】
本発明の一態様によれば、前記通信端末は、前記かな漢字変換後の文字情報が前記ユーザの意図するものでなければ、前記文字情報作成装置に再変換をリアルタイムで指示し、
前記文字情報作成装置は、前記通信端末から前記かな漢字変換後の文字情報の再変換を指示されると、前記かな漢字変換後の文字情報をリアルタイムで再変換する。
【0021】
したがって、文字情報が通信端末に表示され、ユーザが再変換の操作をすると、それがリアルタイムで文字情報作成装置に通知され、文字情報作成装置にてリアルタイムで再変換される。
【0022】
本発明の一態様によれば、前記通信端末は、前記音声信号を非音声通信によりリアルタイムで前記文字情報作成装置に送る。
【0023】
本発明の一態様によれば、前記通信端末は、前記音声信号を音声通信によりリアルタイムで前記文字情報作成装置に送る。
【0024】
本発明の一態様によれば、前記通信端末は、前記文字情報を非音声通信によりリアルタイムで前記通信端末に送る。
【0025】
本発明の一態様によれば、前記通信端末は、前記文字情報作成装置に対する通知および指示をリアルタイムで非音声通信により送る。
【0026】
本発明の一態様によれば、前記非音声通信はパケット通信である。
【0027】
したがって、音声信号、文字情報、通知や指示が、パケット通信などの非音声通信により送信されるので、これらの送信が必要なときにリアルタイムで送信することができる。
【0028】
本発明の一態様によれば、前記文字情報作成装置は、前記通信端末からの指示に従って、リアルタイムで、前記文字情報を利用して電子メールを作成し、送信する。
【0029】
本発明の文字情報作成装置は、通信ネットワークに接続され、通信端末から該通信ネットワークを介して受信した音声信号から文字情報を作成する文字情報作成装置であって、
前記通信端末からの音声信号を受信する通信部と、
前記通信部にて受信された前記音声信号に対してリアルタイムで音声認識処理を行い文字情報を作成し、該文字情報を前記通信部を介して前記通信端末に送信し、また前記通信端末から音声認識の確定の通知を受けると、前記文字情報の音声認識をリアルタイムで確定する音声認識部とを有している。
【0030】
本発明の一態様によれば、前記音声認識部は、前記通信端末から前記文字情報の消去を指示されると、該文字情報をリアルタイムで消去し、また前記通信端末から前記文字情報の修正を指示されると、該文字情報をリアルタイムで修正する。
【0031】
本発明の一態様によれば、前記音声認識部で前記文字情報の音声認識が確定された後、該文字情報をかな漢字変換し、かな漢字変換後の文字情報を前記通信部を介して前記通信端末に送信する文字編集部をさらに有している。
【0032】
本発明の一態様によれば、前記文字編集部は、前記通信端末から再変換を指示されると、前記かな漢字変換後の文字情報をリアルタイムで再変換する。
【0033】
本発明の一態様によれば、前記通信部は、前記通信端末から前記音声信号を非音声通信により受信する。
【0034】
本発明の一態様によれば、前記通信部は、前記通信端末から前記音声信号を音声通信により受信する。
【0035】
本発明の一態様によれば、前記通信部は、前記通信端末から前記文字情報を非音声通信により受信する。
【0036】
本発明の一態様によれば、前記通信部は、前記通信端末から通知および指示を非音声通信により受信する。
【0037】
本発明の一態様によれば、前記非音声通信はパケット通信である。
【0038】
本発明の一態様によれば、前記通信端末からの指示に従って、リアルタイムで、前記文字情報を利用して電子メールを作成し、送信するメール送信部をさらに有している。
【0039】
【発明の実施の形態】
本発明の一実施形態について図面を参照して詳細に説明する。
【0040】
図1は、本発明の一実施形態の携帯電話システムおよびそれを構成する各装置の構成を示すブロック図である。図1を参照すると、携帯電話システムは、携帯電話機1と文字情報作成装置2を有している。携帯電話機1と文字情報作成装置2はパケット通信回線3によって相互に接続されている。パケット通信回線3は無線回線および有線回線を含み、基地局(不図示)や基地局制御装置(不図示)などを経由する。
【0041】
携帯電話機1は、ユーザが入力した音声をパケット通信回線3により文字情報作成装置2に送る。文字情報作成装置2は、携帯電話機1から受信した音声に対して音声認識を行い文字情報を作成する。文字情報作成装置2は、文字情報作成の認識経過情報をパケット通信回線3を介して携帯電話機1に送る。認識経過情報は、文字情報作成装置2において作成された文字情報であって、まだ音声認識が確定していない部分を含むものである。ユーザは携帯電話機1に表示された認識経過情報を見て、携帯電話機1を操作することにより、文字情報を修正する。
【0042】
このとき、音声認識結果の修正を指示するコマンド(以下、修正コマンドと称す)が携帯電話機1から文字情報作成装置2にパケット通信回線3を介して送られる。修正コマンドは、修正部分と修正内容を含む。文字情報作成装置2は修正コマンドに従って文字情報を修正し、経過情報を再び携帯電話機1に送る。
【0043】
音声認識結果がユーザの意図するものとなれば、ユーザの指示により携帯電話機1は、音声認識結果を確定するための音声認識確定コマンドを文字情報作成装置2に送信する。音声認識結果がユーザの意図するものでなければ、ユーザの指示により携帯電話機1は、文字情報作成装置2に修正コマンドを送る。
【0044】
音声認識確定コマンドにより音声認識の結果が確定されると、文字情報作成装置2では、かな漢字変換が行われ、変換経過情報が携帯電話機1に送信される。変換経過情報は、文字情報作成装置2において作成された文字情報であって、まだかな漢字変換の確定していない部分を含むものである。変換経過情報のかな漢字変換がユーザの意図するものでなければ、ユーザの操作により携帯電話機1は、再変換を指示するための変換コマンドを文字情報作成装置2に送信する。また、ユーザは経過情報が意図するような文字情報となっていれば確定する。このとき、携帯電話機1から文字情報作成装置2には変換確定コマンドが送られる。
【0045】
携帯電話機1は、マイク101、A/D変換部102、パケット通信部103、文字編集部104、表示部105、操作部106およびメール送受信部107を有している。
【0046】
例えば、第3世代携帯電話システムなどによれば、パケット通信の伝送容量が大きくリアルタイム性が高い。すなわち、ユーザは文字情報を作成している装置が遠隔にあることをほとんど意識することなく、文字情報を作成することができる。携帯電話機1から指示や通知があれば、文字情報作成装置2は即座に所定の処理を行うことができるので、携帯電話機1にて直接に処理するのと同等のレスポンス性をユーザに提供できる。
【0047】
文字情報作成装置2は、パケット通信部201、D/A変換部202、音声認識部203、文字編集部204およびメール送信部205を有している。
【0048】
A/D変換部102は、マイク101によって得られた音声信号をアナログ・ディジタル変換して音声データを得る。A/D変換部102は、ユーザにより利用可能なアプリケーションプログラムにより実現されるものであってもよい。また、A/D変換部120は通常時には停止しており、音声入力により文字情報を作成するときにのみ起動することが好ましい。
【0049】
パケット通信部103は、パケット通信回線3を介してパケット通信を行う。例えば、A/D変換部102で得られた音声データをパケット化し、パケット通信回線3を介して文字情報作成装置2に送信する。このとき、A/D変換部102の指示により、パケット通信部103とパケット通信部201の間にパケット通信のコネクションが確立される。パケット通信部103とパケット通信部201の間のコネクションが確立されると、パケット通信部103は、マイク101からの音声信号がアナログ・ディジタル変換された音声データを文字情報作成装置2に送信可能な状態となる。
【0050】
文字編集部104は、文字情報作成装置3の文字編集部204との間でデータや情報を送受信しながら、文字情報を編集する。文字編集部104は、文字情報作成装置2からパケット通信部103を介して経過情報を受信し、その経過情報を表示部105に表示させる。また、操作部106に対するユーザの操作に従って修正コマンド、音声認識確定コマンド、文字情報消去コマンド、再変換コマンドまたは変換確定コマンドを作成し、パケット通信103を介して文字情報作成装置2に送る。
【0051】
表示部105は、液晶などのディスプレイ画面を含み、文字情報や画像を表示する。文字情報作成装置2からパケット回線3を介してパケット通信部103に送られてきた文字情報作成の経過情報を表示する。
【0052】
操作部106は、プッシュボタンを含み、文字情報の作成や修正、メール送信を行うときユーザにより操作される。
【0053】
メール送受信部107は、文字情報作成装置2によって作成された文字情報を利用して電子メールを作成し、送信する。また、メール送受信部107は、パケット通信により文字情報作成装置2に電子メールの作成を指示し、文字情報作成装置2上に作成された電子メールの送信を文字情報作成装置2に指示することもできる。このときメール送信指示のコマンド(以下、メール送信コマンドと称す)には電子メールの送信先の情報が含まれる。
【0054】
パケット通信部201は、パケット通信回線3を介してパケット通信を行う。例えば、携帯電話機1から音声データを受信し、D/A変換部202に送る。また、携帯電話機1からの修正コマンドや確定コマンドをパケット通信回線3を介して受信し、文字編集部204に送る。
【0055】
D/A変換部202は、パケット通信部201からの音声データをディジタル・アナログ変換して音声信号を作成し、音声認識部203に送る。
【0056】
音声認識部203は、D/A変換部202からの音声信号に対して音声認識処理を行い、文字情報に変換する。当然、ここで得られる文字情報には漢字は含まれていない。
【0057】
なお、ここでは音声認識部203はアナログ音声信号を文字情報に変換するものとして例示したが、他の例として、ディジタルの音声データを文字情報に変換してもよい。その場合、D/A変換部202は不要であり、携帯電話機1からの音声データがそのまま音声認識部203に入力されてもよい。また、D/A変換部202の代わりに、携帯電話機1からの音声データを音声認識部203の入力に適合する形式の音声データに変換するD/D変換器が設けられてもよい。
【0058】
文字編集部204は、音声認識部203で得られた文字情報に対してかな漢字変換処理を行い、かな漢字混じりの文字情報を作成する。文字編集部204は、かな漢字混じりの文字情報を作成すると、その文字情報を経過情報としてパケット通信部201を介して携帯電話機1に送信する。文字編集部204は、携帯電話機1からパケット通信部201を介してコマンドを受信すると、その指示に従って文字情報を処理する。ユーザは、携帯電話機1に音声を入力し、携帯電話機1に対して簡単な操作を行うことにより、例えば単語毎や文節単位など所望のかな漢字変換を行い、効率良く文字情報を作成できる。このようにして、文字編集部204は携帯電話機1の電子メールや電話帳情報を作成する。
【0059】
また、文字編集部204は、携帯電話機1からメール送信コマンドを受けると、指定された送信先に対する電子メールの送信をメール送信部205に指示する。
【0060】
メール送信部205は、文字編集部204から指示された電子メールを指示された送信先に送信する。
【0061】
図2は、本実施形態の携帯電話システムの動作を示すシーケンス図である。図2において▲の付された処理はパケット通信を伴う処理である。図2を参照すると、まず、電子メールの作成や電話帳への情報の追加など文字情報を作成したいとき、ユーザは音声入力機能(アプリケーション)を起動する(ステップS1)。
【0062】
次に、携帯電話機1と文字情報作成装置2はパケット通信部103とパケット通信部201の間にコネクションを設定する。その際、本実施形態では、文字情報作成装置2は、携帯電話機1あるいはユーザが、音声入力による文字情報作成を許容されたものであるか否か確認するために、パスワードによる認証を行うものとする。また、音声を文字情報に変換するときに利用される音声認識や、かな漢字変換のための辞書をユーザ毎に切り替えるものとする。
【0063】
具体的には、携帯電話機1がパケット通信開始要求を文字情報作成装置2に送ると(ステップS2)、文字情報作成装置2は認証要求を携帯電話機1に送る(ステップS3)。認証要求を受けると、携帯電話機1は、パスワードを含む認証応答を文字情報作成装置2に送る(ステップS4)。文字情報作成装置2は、認証応答に含まれているパスワードを確認すると認証を完了する(ステップS5)。
【0064】
次に、文字情報作成装置2は、その利用者用の辞書を選択して準備する(利用者別セットアップ)(ステップS6)。セットアップが完了すると、文字情報作成装置2は、セットアップが完了した旨を携帯電話機1に通知する(ステップS7)。
【0065】
次に、携帯電話機1が認識開始コマンドを文字情報作成装置2に送る(ステップS8)。以上の処理により、携帯電話機1および文字情報作成装置2は音声入力待ちとなる。
【0066】
次に、ユーザがマイク101に音声を入力すると、携帯電話機1は、その音声をアナログ・ディジタル変換して音声データにし、その音声データをパケット化して文字情報作成装置2に送信する(ステップS9)。音声データを送信(ステップS10)した後、携帯電話機1は文字情報作成装置2に認識コマンドを送る(ステップS11)。認識コマンドは、音声から文字情報への変換の開始を指示するためのコマンドである。
【0067】
音声データおよび認識コマンドを受信すると、文字情報作成装置2は、それをディジタル・アナログ変換し、音声認識する(ステップS12)。次に、文字情報作成装置2は、音声認識により得られた文字情報を認識経過情報として携帯電話機1に送信する(ステップS13)。例えば、音声認識により「せんじうおかいぎのけん」という文字情報が得られたとすると、それが携帯電話機1に送られる。なお、本実施形態では、認識コマンドにより音声認識が行われ、文字情報が携帯電話機1に送られるものとしたが、他の例も考えられる。例えば、音声認識の性能や通信回線の能力などによっては、文字情報作成装置2は入力された音声をリアルタイムで音声認識し、文字情報を携帯電話機1に送るものとしてもよい。その場合、認識コマンドは不要である。
【0068】
携帯電話機1は、文字情報を受信すると、それを表示部105に表示する。上述の例では、携帯電話機1の表示部105には「せんじうおかいぎのけん」と表示される(ステップS14)。ここで、ユーザは表示された文字情報を見て、それが意図するものであるか否か確認する。
【0069】
文字情報が意図するものでなく最初から音声入力をやり直したいとき、ユーザの操作により携帯電話機1は文字情報作成装置2に文字情報消去コマンドを送信する(ステップS15)。文字情報作成装置2は、文字情報消去コマンドに従って文字情報を消去する(ステップS16)。文字情報消去コマンドは、文字情報の消去を指示するためのコマンドである。文字情報消去コマンドを受信すると、文字情報作成装置2は、消去対象の文字情報を消去し、音声入力待ちの状態となる。ここでは、音声認識の確定していない文字情報が消去される。
【0070】
また、文字情報が意図するものでなく修正したいとき、ユーザは携帯電話機1を操作して、文字情報を修正する。そのとき、携帯電話機1は、修正すべき部分と修正内容を含む修正コマンドを文字情報作成装置2に送る(ステップS17)。例えば、上述の例で、「せんじつのかいぎのけん」に修正したいとき、ユーザは携帯電話機1の操作部106に「4つ5の」と入力する。これは、4番目の文字(「う」)を「つ」に変更し、5番目の文字(「お」)を「の」に変更することを示す。「4つ5の」という修正情報(修正部分および修正内容)を含む、修正コマンドが携帯電話機1から文字情報作成装置2に送信される。修正コマンドを受信すると、文字情報作成装置2は、修正コマンドに従って文字情報を修正する(ステップS18)。
【0071】
音声認識結果である文字情報が意図するものであれば、携帯電話機1は、ユーザの操作に従って、音声認識の結果を確定する音声認識確定コマンドを文字情報作成装置2に送信する(ステップS19)。音声認識確定コマンドを受信すると、文字情報作成装置2は、その文字情報に対する、かな漢字変換を開始する(ステップS20)。なお、ここでは、音声認識の結果が確定されると、即座に、かな漢字変換が開始される例を示したが、音声認識確定後、かな漢字変換の開始を指示するコマンドが携帯電話機1から文字情報作成装置2に送られてから、かな漢字変換が開始されてもよい。いずれにしても、かな漢字変換が開始されるのは、音声認識の結果が確定してからが好ましい。
【0072】
文字情報作成装置2は、かな漢字変換を行うと、変換後の文字情報を変換経過情報として携帯電話機1に送信する(ステップS21)。上述の例では、「先日の会議の権」の文字情報が送信される。なお、文字情報は、複数の変換候補を含んでもよい。文字情報に含まれた変換は確定したものでないので、文字情報には、例えば文節の区切りの情報が含まれる。文字情報を受信した携帯電話機1は、その文字情報を文節で区切って表示部105に表示する。上述の例では、例えば、「先日の/会議の/権」と表示される。
【0073】
変換結果が意図するものでなければ、ユーザは文節を選んで再変換を行う。このとき、携帯電話機1から文字情報作成装置2へは、再変換コマンドが送信される(ステップS22)。再変換コマンドには、例えば再変換すべき文節の情報が含まれる。上述の例では、「権」の部分の再変換が指示される。文字情報作成装置2は、再変換コマンドを受信すると、再変換を行う(ステップS23)。再変換により、文字情報の対象部分は、現在の文字から、同じ読みの他の文字に変更される。
【0074】
なお、本実施形態では、音声認識が確定すると即座に、かな漢字変換が開始されるので、これが再変換となる。しかし、かな漢字変換を指示するコマンドが送られてから、かな漢字変換が開始されることとすれば、ここでかな漢字変換の開始を指示するコマンドが送られ、最初の変換が行われる。
【0075】
文字情報作成装置2は、再変換を行うと、変換後の文字情報を変換経過情報として携帯電話機1に送信する(ステップS24)。
【0076】
再変換の繰り返しによって意図する文字情報が得られると、ユーザは文字情報を確定させる。例えば、ユーザは「決定ボタン」を押下する。このとき、変換確定コマンドが携帯電話機1から文字情報作成装置2に送信される(ステップS25)。
【0077】
変換確定コマンドを受信すると、文字情報作成装置2は、確定した文字情報を携帯電話機1に送信し、音声入力待ちの状態に移行する(ステップS26)。また、確定した文字情報を受信すると、携帯電話機1は、音声入力待ちの状態に移行する(ステップS27)。
【0078】
以上の処理が繰り返されることにより、ユーザの所望する文章が全て完成すると、ユーザは音声入力機能を動作を終了させる。このとき、携帯電話機1は、パケット通信のコネクションを切断し、音声入力動作を終了する(ステップS28)。また、文字情報作成装置2も、パケット通信のコネクションを切断し、音声入力動作を終了する(ステップS29)。このとき、携帯電話機1および文字情報作成装置2にて使用されていたリソース、例えばパケット通信のコネクションや実行されていたアプリケーション等が解放される。
【0079】
その後、ユーザは文字情報を利用して文章編集作業、例えばコピーや貼り付け、文字の挿入、削除などを行うことができる。
【0080】
なお、本実施形態では携帯電話機が例示されているが、本発明はそれに限定されるものではない。パケット通信回線を利用でき、文字入力を要する電子機器であれば本発明を適用可能である。例えば、FAX電話機の内蔵電話帳編集や、PHS端末での内蔵電話帳編集などに本発明を適用することができる。
【0081】
また、本実施形態では、得られた文字情報はパケット通信により携帯電話機1の文字編集部104に送信されることとしたが、本発明はそれに限定されない。文字情報作成装置2の文字編集部204からパケット通信による電子メールとして携帯電話機のメール送受信部107に自動送信してもよい。
【0082】
また、本実施形態では、携帯電話機1上で文字編集作業(コピーや貼り付け、文字挿入/削除、など)を行う例を示したが、文字情報を編集するコマンドを規定し、それを用いれば文字情報作成装置2上で文字編集作業を行うこともできる。
【0083】
また、本実施形態にて例示したコマンドは携帯電話機1の操作部106に対する操作により送出されることとしたが、音声入力によって送出されてもよく、操作部106に対する操作と音声の組み合わせによって送出されてもよい。
【0084】
また、本実施形態では、音声データをパケット通信によって携帯電話機1から文字情報作成装置2に送信する例を示したが、携帯電話機1と文字情報作成装置2の間に音声通話とパケット通信を同時に設定し、音声データを音声通話にて送り、コマンドをパケット通信により送ることとしてもよい。例えば、第3世代携帯電話システムやISDN、インターネット(IP)電話などによれば、それが可能である。それにより2者の会話を文字情報化することも可能となる。
【0085】
また、本実施形態において、パケット通信により送受信される音声データや文字情報は、パケット通信回線3の負荷を軽減するために、圧縮されたデータであってもよい。
【0086】
また、本実施形態において、パケット通信により送受信される音声データや文字情報、通知や指示は、情報セキュリティを確保するために、暗号化されたものであってもよい。
【0087】
本実施形態によれば、携帯電話機1が音声をパケット通信により文字情報作成装置2に送り、文字情報作成装置2が携帯電話機1とのパケット通信によりユーザの確認を得ながら音声認識およびかな漢字変換を行って文字情報を作成し、その文字情報をパケット通信により携帯電話機に送り返すので、携帯電話機1の操作部106に対する、わずらわしい操作が少なくて済むので、携帯電話機1での文字情報作成が容易である。
【0088】
また、音声データ、各種コマンドおよび文字情報の送信にパケット通信を用いることにより、ユーザの音声入力から修正を経て文字情報の完成までリアルタイムで行うことができる。また、文字情報の作成と同時に、それとは別に音声による通話を行うこともできる。
【0089】
また、音声通話とパケット通信を同時に設定し、音声入力に音声通話を用い、コマンドおよび文字情報の送信にパケット通信を用いれば、リアルタイムで文字情報を修正し、作成することができる。
【0090】
また、実際には文字情報作成装置2上で文字情報が作成されるが、携帯電話機1上で文字情報を作成するのと同様にユーザはリアルタイムで修正や確認ができる。
【0091】
また、音声認識が文字情報作成装置2によって行われるので、従来からの携帯電話機1に音声認識機能を追加せずに音声入力による文字情報作成を実現できる。
【0092】
また、音声認識およびかな漢字変換が文字情報作成装置2によって行われるので、携帯電話機1よりも処理能力の高い演算装置や記憶容量の大きい記憶装置を用いることができ、変換率の高い音声認識およびかな漢字変換が利用できる。
【0093】
また、音声認識およびかな漢字変換が文字情報作成装置2によって行われるので、文字情報作成装置2のこれらの機能(例えばソフトウェア)を改善することにより、全ての携帯電話機が改善された機能を利用可能となる。これにより、音声認識ロジックの改善、辞書の更新、不具合の改修などが容易かつ迅速にでき、また機能を一元的に管理できる。
【0094】
また、音声認識およびかな漢字変換が文字情報作成装置2によって行われるので、携帯電話機1にこれらの機能を搭載する必要が無く、携帯電話機1の大きさや重さ、コストを抑えることができる。
【0095】
本実施形態の携帯電話システムでは、携帯電話機1からの操作により、文字情報を利用して文字情報作成装置2上で電子メールを作成し、その電子メールを所望の送信先に送信できることとしてもよい。
【0096】
この場合、携帯電話機1から文字情報作成装置2に電子メールの送信を指示するときに通知する送信先は、携帯電話機1に内蔵されたアドレス帳からユーザが選択できる。これにより、携帯電話機1から直接送信される電子メールと、文字情報作成装置2から送信される電子メールとでアドレス帳が共用される。音声入力により文字情報作成装置2上で本文を作成し、携帯電話機1のアドレス帳から送信先を選択できるので、簡単な操作で電子メールの作成から送信まで行うことができ、またアドレス帳の一元管理ができる。
【0097】
また、本実施形態の携帯電話システムは、電子メールではなく、リアルタイムで文字情報作成装置2から直接相手へ文字データを送信(チャット)できてもよい。
【0098】
また、本実施形態では、文字情報作成装置2上で音声から文字情報を作成し、文字編集を行なう例を示したが、音声認識のみを文字情報作成装置2で行い、かな漢字変換および文字編集は携帯電話機1上で行うこととしてもよい。
【0099】
また、携帯電話機1へ搭載されパケット通信を用いてコンピュータと通信する機能が携帯電話機1に予め内蔵されている例を示したが、その機能を実現する処理を有するプログラムを必要に応じて携帯電話機1へインストール(ダウンロード)できることしてもよい。この場合、プログラムは特定の携帯電話機1に依存するようなソフトウェアでもよく、また機種依存を最小限にするように汎用言語(JAVA言語など)で作成されていてもよい。また、携帯電話機1はこのプログラムをインストールしなくても、あるいはアンインストールしても他の機能に影響がないものとする。今後、音声認識や、かな漢字変換の技術の向上によってユーザの確認なしに十分な変換率が得られるようになれば、インストールしなくともよい。さらに、開発コストの削減などのために、携帯電話機1からの本発明のコントロール機能を省略することもできる。
【0100】
【発明の効果】
本発明によれば、通信端末が音声を文字情報作成装置に送り、文字情報作成装置が音声認識を行ってリアルタイムで文字情報を作成し、その文字情報を通信端末に送り返すので、通信端末に対する少ない操作で容易にリアルタイムで文字情報を作成することができる。
【0101】
また、音声認識が文字情報作成装置によって行われるので、通信端末に音声認識機能を備えなくとも音声入力による文字情報作成を実現できる。
【0102】
また、音声認識およびかな漢字変換が文字情報作成装置によって行われるので、通信端末よりも処理能力の高い演算装置や記憶容量の大きい記憶装置を用いることができ、変換率の高い音声認識およびかな漢字変換が利用できる。
【0103】
また、音声認識およびかな漢字変換が文字情報作成装置によって行われるので、文字情報作成装置のこれらの機能(例えばソフトウェア)を改善することにより、全ての通信端末が改善された機能を利用可能となる。これにより、音声認識ロジックの改善、辞書の更新、不具合の改修などが容易かつ迅速にでき、また機能を一元的に管理できる。
【0104】
また、音声認識およびかな漢字変換が文字情報作成装置によって行われるので、通信端末にこれらの機能を搭載する必要が無く、通信端末の大きさや重さ、コストを抑えることができる。
【0105】
また、ユーザの意図に合わないためユーザが消去または修正の操作を通信端末に対して行うと、それが文字情報作成装置に通知され、リアルタイムで文字情報が消去または修正されるので、ユーザは通信端末上で文字情報を作成しているかのように、文字情報作成装置上に文字情報を作成することができる。
【0106】
また、通信端末にて音声認識が確定されると、文字情報作成装置にて文字情報は、かな漢字変換され、変換後の文字情報が通信端末に送られ、通信端末に表示されるので、通信端末に対する少ない操作で容易にリアルタイムで文字情報をかな漢字変換することができる。
【0107】
また、文字情報が通信端末に表示され、ユーザが再変換の操作をすると、それがリアルタイムで文字情報作成装置に通知され、文字情報作成装置にてリアルタイムで再変換されるので、ユーザは通信端末の表示を見ながら、文字情報のかな漢字変換を繰り返し、通信端末上で文字情報を作成するかのように、意図する文字情報を作成することができる。
【0108】
また、音声信号、文字情報、通知や指示が、パケット通信などの非音声通信により送信されるので、これらの送信が必要なときにリアルタイムで送信することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態の携帯電話システムおよびそれを構成する各装置の構成を示すブロック図である。
【図2】本実施形態の携帯電話システムの動作を示すシーケンス図である。
【符号の説明】
1 携帯電話機
101 マイク
102 A/D変換部
103 パケット通信部
104 文字編集部
105 表示部
106 操作部
107 メール送受信部
2 文字情報作成装置
201 パケット通信部
202 D/A変換部
203 音声認識部
204 文字編集部
205 メール送信部
3 パケット通信回線
Claims (20)
- 音声より文字情報を作成する機能を有する文字情報作成システムであって、
マイクを有し、該マイクにて取得された音声信号を文字情報作成装置に送り、前記音声信号に基づく文字情報を前記文字情報作成装置から受信すると該文字情報を表示し、該文字情報がユーザの意図するものであれば前記文字情報作成装置に音声認識の確定をリアルタイムで通知する通信端末と、
前記音声信号を前記通信端末から受けると、リアルタイムで、該音声信号に対して音声認識を行い文字情報を作成して該文字情報を前記通信端末に送り、また前記通信端末から音声認識の確定の通知を受けると、該文字情報の音声認識をリアルタイムで確定する文字情報作成装置とを有する文字情報作成システム。 - 前記通信端末は、前記文字情報が前記ユーザの意図するものでなく消去すべきものであれば前記文字情報の消去を前記文字情報作成装置にリアルタイムで指示し、また前記文字情報が前記ユーザの意図するものでなく修正すべきものであれば前記文字情報の修正を前記文字情報作成装置にリアルタイムで指示し、
前記文字情報作成装置は、前記通信端末から前記文字情報の消去を指示されると、該文字情報をリアルタイムで消去し、また前記通信端末から前記文字情報の修正を指示されると、該文字情報をリアルタイムで修正する、請求項1記載の文字情報作成システム。 - 前記文字情報作成装置は、前記文字情報の音声認識を確定した後に、該文字情報をかな漢字変換し、かな漢字変換後の文字情報を前記通信端末に送信し、また前記通信端末からかな漢字変換の確定の通知を受けると、前記かな漢字変換後の文字情報のかな漢字変換をリアルタイムで確定し、
前記通信端末は、前記かな漢字変換後の文字情報を前記文字情報作成装置から受けると、前記かな漢字変換後の文字情報をリアルタイムで表示し、前記かな漢字変換後の文字情報がユーザの意図するものであれば前記文字情報作成装置にかな漢字変換の確定をリアルタイムで通知する、請求項1または2記載の文字情報作成システム。 - 前記通信端末は、前記かな漢字変換後の文字情報が前記ユーザの意図するものでなければ、前記文字情報作成装置に再変換をリアルタイムで指示し、
前記文字情報作成装置は、前記通信端末から前記かな漢字変換後の文字情報の再変換を指示されると、前記かな漢字変換後の文字情報をリアルタイムで再変換する、請求項3記載の文字情報作成システム。 - 前記通信端末は、前記音声信号を非音声通信によりリアルタイムで前記文字情報作成装置に送る、請求項1〜4のいずれか1項に記載の文字情報作成システム。
- 前記通信端末は、前記音声信号を音声通信によりリアルタイムで前記文字情報作成装置に送る、請求項1〜4のいずれか1項に記載の文字情報作成システム。
- 前記通信端末は、前記文字情報を非音声通信によりリアルタイムで前記通信端末に送る、請求項1〜6のいずれか1項に記載の文字情報作成システム。
- 前記通信端末は、前記文字情報作成装置に対する通知および指示をリアルタイムで非音声通信により送る、請求項1〜7のいずれか1項に記載の文字情報作成システム。
- 前記非音声通信はパケット通信である、請求項5、7、8のいずれか1項に記載の文字情報作成システム。
- 前記文字情報作成装置は、前記通信端末からの指示に従って、リアルタイムで、前記文字情報を利用して電子メールを作成し、送信する、請求項1〜9のいずれか1項に記載の文字情報作成システム。
- 通信ネットワークに接続され、通信端末から該通信ネットワークを介して受信した音声信号から文字情報を作成する文字情報作成装置であって、
前記通信端末からの音声信号を受信する通信部と、
前記通信部にて受信された前記音声信号に対してリアルタイムで音声認識処理を行い文字情報を作成し、該文字情報を前記通信部を介して前記通信端末に送信し、また前記通信端末から音声認識の確定の通知を受けると、前記文字情報の音声認識をリアルタイムで確定する音声認識部とを有する文字情報作成装置。 - 前記音声認識部は、前記通信端末から前記文字情報の消去を指示されると、該文字情報をリアルタイムで消去し、また前記通信端末から前記文字情報の修正を指示されると、該文字情報をリアルタイムで修正する、請求項11記載の文字情報作成装置。
- 前記音声認識部で前記文字情報の音声認識が確定された後、該文字情報をかな漢字変換し、かな漢字変換後の文字情報を前記通信部を介して前記通信端末に送信する文字編集部をさらに有する、請求項11または12記載の文字情報作成装置。
- 前記文字編集部は、前記通信端末から再変換を指示されると、前記かな漢字変換後の文字情報をリアルタイムで再変換する、請求項13記載の文字情報作成装置。
- 前記通信部は、前記通信端末から前記音声信号を非音声通信により受信する、請求項11〜14のいずれか1項に記載の文字情報作成装置。
- 前記通信部は、前記通信端末から前記音声信号を音声通信により受信する、請求項11〜14のいずれか1項に記載の文字情報作成装置。
- 前記通信部は、前記通信端末から前記文字情報を非音声通信により受信する、請求項11〜16のいずれか1項に記載の文字情報作成装置。
- 前記通信部は、前記通信端末から通知および指示を非音声通信により受信する、請求項11〜17のいずれか1項に記載の文字情報作成装置。
- 前記非音声通信はパケット通信である、請求項15、17、18のいずれか1項に記載の文字情報作成装置。
- 前記通信端末からの指示に従って、リアルタイムで、前記文字情報を利用して電子メールを作成し、送信するメール送信部をさらに有する、請求項11〜19のいずれか1項に記載の文字情報作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002184411A JP2004032275A (ja) | 2002-06-25 | 2002-06-25 | 文字情報作成システムおよび文字情報作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002184411A JP2004032275A (ja) | 2002-06-25 | 2002-06-25 | 文字情報作成システムおよび文字情報作成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004032275A true JP2004032275A (ja) | 2004-01-29 |
Family
ID=31180338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002184411A Pending JP2004032275A (ja) | 2002-06-25 | 2002-06-25 | 文字情報作成システムおよび文字情報作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004032275A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009032096A (ja) * | 2007-07-27 | 2009-02-12 | Mizuho Information & Research Institute Inc | 営業支援システム、営業支援方法及び営業支援プログラム |
US9628892B2 (en) | 2013-01-24 | 2017-04-18 | Samsung Electronics Co., Ltd. | Method of determining operation mode of hearing device and hearing device |
-
2002
- 2002-06-25 JP JP2002184411A patent/JP2004032275A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009032096A (ja) * | 2007-07-27 | 2009-02-12 | Mizuho Information & Research Institute Inc | 営業支援システム、営業支援方法及び営業支援プログラム |
JP4564034B2 (ja) * | 2007-07-27 | 2010-10-20 | みずほ情報総研株式会社 | 営業支援システム、営業支援方法及び営業支援プログラム |
US9628892B2 (en) | 2013-01-24 | 2017-04-18 | Samsung Electronics Co., Ltd. | Method of determining operation mode of hearing device and hearing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8150920B2 (en) | System, method and computer program product for providing content to a terminal and directing the rendering of such content at the terminal | |
US20040204068A1 (en) | Mobile communication system and method, mobile communication terminal, server apparatus and program | |
JP2004221842A (ja) | コミュニケーションシステムおよびその端末装置 | |
JP2000305583A (ja) | 音声合成装置 | |
JP2000216910A (ja) | 電話端末装置 | |
WO2010040320A1 (zh) | 一种可视电话通话中的传递方法 | |
JP2007088772A (ja) | 移動通信端末装置 | |
JP2004032275A (ja) | 文字情報作成システムおよび文字情報作成装置 | |
JP3982307B2 (ja) | 文字入力装置 | |
KR100395321B1 (ko) | 이동통신단말기 단문메시지 서비스를 위한 문장편집 방법 | |
US20060019704A1 (en) | Integrating wireless telephone with external call processor | |
JP2008252742A (ja) | 電話装置、電話装置の動作方法、及び電話装置の動作プログラム | |
KR20010067983A (ko) | 통화중 음성에 배경음악을 합성해서 전송하는 방법 및 그장치 | |
JP4787577B2 (ja) | 携帯端末装置 | |
JP2007336161A (ja) | ファクシミリ通信装置および方法 | |
KR20060063481A (ko) | 파일 변환을 이용한 폰트 미지원 데이터 복구 방법 및그를 이용한 무선통신 단말기 | |
JP2000184069A (ja) | 電話スケジュール管理システム | |
JP2003101661A (ja) | 携帯電話を用いたメール送信システム | |
JP2001223823A (ja) | 移動体通信端末 | |
JP2006033017A (ja) | 携帯電話、携帯電話サーバおよび携帯電話システム | |
JPH11161567A (ja) | 情報処理装置及び方法及びシステム | |
JP2016162010A (ja) | 処理システム、端末装置、処理装置、処理装置制御方法、およびコンピュータプログラム | |
JPH10327269A (ja) | 電話機 | |
JP2001127899A (ja) | 通信端末装置及び記録媒体 | |
JP2001109683A (ja) | 電子メール装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20041217 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041217 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050517 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070803 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070912 |