【0001】
【発明の属する技術分野】
この発明は無線通信技術を応用した自動通訳システムに関するものである。
【0002】
【従来の技術】
図8は従来の自動通訳装置の構成を説明するためのブロック図である。同図において、1はマイクロフォン、2はスピーカ、7は音声取込LSI(Large Scale Integrated Circuit)、8は音声認識LSI、9は言語変換CPU(Central Processing Unit)、10は第一言語の辞書、11は第二言語の辞書、12は音声変換LSI、13は音声送信LSIである。ここで、第一言語と第二言語は、これから互いに通訳を行う必要の有る言語を一般化して表現している。
【0003】
マイクロフォン1より入力された第一言語の音声は、音声取込LSI7でAD(Analog to Digital)変換され、音声デジタル信号に変わる。デジタル信号化された音声は音声認識LSI8で第一言語の言語情報に変換される。この第一言語の言語情報は言語変換CPU9と言語変換ソフトウエア(図示せず)と第一言語の辞書10および第二言語の辞書11により、第二言語の言語情報に変換(通訳)される。
【0004】
さらにこの第二言語の言語情報は音声変換LSI12により音声デジタル信号に変換される。音声送信LSI13はデジタル信号化された第二言語の音声をDA変換してアナログ電気信号に変換する。このアナログ電気信号はスピーカ2により音声に変換されるので、第1言語から第2言語に通訳された言葉がスピーカ2から出力される。
【0005】
さて、これらの機能をリアルタイムに行うには、非常に高性能で大容量のメモリを持った半導体チップが複数個必要である。このため、従来の自動通訳装置はパソコン並みの重量と消費電力を呈し、また非常に高価なものにならざるを得なかった。
【0006】
【発明が解決しようとする課題】
自動通訳機が必要とされる場所は、空港、駅、街中など、広範囲に広がっているうえに、使われる時間も、数時間に及ぶこともあれば、ほんの1分程度で済むことも有る。ほんの数分程度しか使わないかもしれない、重くて、しかも高価な機器を通訳の利用者が常に携行することは不経済である。本発明は、いつでもどこでも手軽に通訳サービスを利用することができる自動通訳システムを提供することを目的としている。
【0007】
【課題を解決するための手段】
本発明にかかわる自動通訳装置は、音声信号を送受信可能な通信手段と、通信手段で受信した音声信号を言語情報に変換する音声認識手段と、言語情報の量を計測する情報量算出手段と、付帯する辞書を用いて言語情報を希望の言語に変換する言語変換手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される言語情報の量に基づいて算出するものである。
【0008】
また、音声信号を送受信可能な通信手段と、通信手段で受信した音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に変換するのに要する時間を計測する情報量算出手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される変換に要した時間に基づいて算出するものである。
【0009】
また、通信手段は、音声信号の送受信先を変更する切替え手段を有してなるものである。
【0010】
また、電話基地局に接続可能な回線切換え手段と、回線切換え手段から伝送される音声信号を言語情報に変換する音声認識手段と、言語情報の量を計測する情報量算出手段と、付帯する辞書を用いて言語情報を希望の言語に変換する言語変換手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される言語情報の量に基づいて算出するものである。
【0011】
また、電話基地局に接続可能な回線切換え手段と、回線切換え手段から伝送される音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に通訳するのに要する時間を計測する情報量算出手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される変換に要した時間に基づいて算出するものである。
【0012】
本発明にかかわる自動通訳システムは、携帯端末とこの携帯端末の音声信号を送受信可能な自動通訳装置を有する自動通訳システムにおいて、自動通訳装置は、携帯端末から送られてくる音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に変換するのに要する時間を計測する情報量算出手段を備え、自動通訳装置は、装置の使用料を情報量算出手段で計測される通訳に要した時間に基づいて算出し、携帯電話に通知するように構成されてなるものである。
【0013】
【発明の実施の形態】
実施の形態1.
以下、本発明の実施の形態を図に基づいて説明する。実施の形態1にかかわる自動通訳システムは図1に示される携帯端末6aと、図2に示される自動通訳装置15aから構成される。実施の形態1にかかわる自動通訳システムは、会議室などで第一言語を話す者と第二言語を話す者が対面している場合に使用されるもので、両者の間に携帯端末6aを置き、互いに携帯端末6aのスピーカから出力される自国言語を聞き取ることで会話を進める。
【0014】
図1、2において、1はマイクロフォン、2はスピーカ、3a,3bはアンテナ、4a,4bは無線通信用LSI、5は音声変換LSI、8は言語認識LSI、14は情報量を計測・算出するとともに音声データを一時的に記憶する情報量算出LSI、9は言語変換CPU、10は第一言語の辞書(言語を記録した不揮発メモリ)、11は第二言語の辞書、12は音声変換LSIである。
【0015】
マイクロフォン1は通訳を必要とする人間すべての声を拾えるほど感度が高く、またスピーカ2の音量は通訳が必要な人間すべてに聞こえるほど大きく設定されている。スピーカ2の代わりに、各利用者はイヤホン(図示せず)を使用して音声を聞いても良いし、スピーカとイヤホンを併用することもできる。
【0016】
携帯端末6aにはボタン(図示せず)を2個設けてあり、最初にボタン1の言語(例えば日本語)とボタン2の言語(例えば英語)を指定する。その後は会話中に、ボタン1を押してから日本語をしゃべり、ボタン2を押してから英語をしゃべるということを繰り返す。言語変換CPU9はボタン1又は2からの信号によりどの言語であるかを認識する。
【0017】
音声を携帯端末6aと自動通訳装置15aの間で送信する場合、先ず音声アナログ信号を音声デジタル信号に変換する。この音声デジタル信号を音声変調デジタル信号(例えば1、0のデジタル信号を0度と180度の位相差で表す位相信号に変換したもの)に変調し、さらにこの音声変調デジタル信号の周波数を上げて、高周波変調信号に変換する。受信はこの逆の作業が行われる。音声デジタル信号を変調デジタル信号に変換する音声変調手段(ベースバンド)、およびこの変調デジタル信号を高周波変調信号に変換する周波数変換器、並びにその逆の変換(復調)をする手段は、この実施の形態では無線通信用LSIに収納されている。
【0018】
次に自動通訳の手順を図3のフローチャートに従って説明する。通訳の依頼者は携帯端末6aから自動通訳装置15aを呼び出す(F2)。次に通訳したい言語を指定する(F3)。携帯端末6aのマイクロフォン1より入力された第一言語の音声は、音声変換LSI5(図1)でデジタル信号にAD変換される。デジタル信号に変換された音声は無線通信用LSI4aで高周波変調信号に変換され、アンテナ3aから電波として空気中を伝搬し、自動通訳装置15aのアンテナ3bで受信される(F5)。
【0019】
自動通訳装置15aに送られた携帯端末6aからの音声高周波変調信号は無線通信用LSI4bにより第一言語の変調デジタル信号に変換され、さらにこの変調デジタル信号は第一言語の音声デジタル信号に変換(復調)される。デジタル信号化された音声は音声認識LSI8に送られ、第一言語の言語情報(言葉の集合、文章)に変換される。この言語情報は情報量算出LSI14に送られ、言語情報の量が計測される(F6)。
【0020】
第一言語の言語情報は言語変換CPU9と言語変換ソフトウエア(図示せず)と第一言語の辞書10および第二言語の辞書11により第二言語の言語情報に変換(通訳)される(F7)。図2には2種類の辞書しか描かれていないが、辞書および言語変換ソフトウエアを増設すれば、あらゆる言語に対応できる。
【0021】
言語変換CPU9がアナログ出力の場合、第二言語の言葉は音声変換LSI12によりデジタル音声信号に変換する必要が有るが、言語変換CPU9がデジタル出力の場合には、第二言語の音声信号は直接、無線通信LSI4bに送られる。送られてきた音声デジタル信号は、高周波変調信号に変換され、アンテナ3bから空気中を伝搬し(F8)、携帯端末6aのアンテナ3aで受信される。
【0022】
アンテナ3aで受信された第二言語の高周波変調信号は無線通信用LSI4aで第二言語の音声デジタル信号に変換(復調)される。この第二言語の音声デジタル信号は音声変換LSI5により第二言語のアナログ信号に変換されるので、スピーカ2からは第二言語の音声が出力される。
【0023】
ここで、デジタル通信を利用している理由は、回路が複雑になるという短所はあるが、雑音に強い、音声以外のデータ(例えば課金データ)も送れる、多重化(多人数が利用できる)しやすいからである。利用者が一組で、通訳機が近くにある場合はアナログ通信でも問題はないが、複数の利用者(実施の形態2、3参照)に対応できるように、ここでもデジタル通信を利用している。
【0024】
会話が引き続いて進展する場合は、図3のF9からF5に戻って、通訳と情報量の計測が継続される。言語変換CPU9が通訳の処理中に別の依頼者からの音声データが送られた場合、その別の依頼者からの音声データは情報量算出LSI14に一時的に記憶される。この情報量算出LSI14に記憶された音声データは、先の音声データの通訳処理が終わってから、言語変換CPU9に送られて処理される。
【0025】
第二言語の音声が携帯端末6aから送られてきた場合は、以上に説明したのと同様の手順に従って、自動通訳装置15aで第二言語から第一言語に変換され、変換された第一言語の音声は携帯端末6aに送られる。
【0026】
会話が終了した場合、自動通訳装置15aは、計測された言語情報の量に応じた通訳料金を算出する(F10)。算出された料金は依頼者の携帯端末6aに通知される(F11)。その後、携帯端末6aと自動通訳装置15aの接続を解除して(F12)、通訳サービスが終了する(F13)。
【0027】
ここで、言語情報の量に応じた通訳料金とは、例えば音声認識LSI8で検出された単語数或いは文字数に比例する料金のことである。音声認識に要した時間に比例させることも考えられる。接続するたびに一定料金(基本料金)を加算してもよい。
【0028】
また、言語変換CPU9で処理するのに要した時間、あるいは言語変換された単語数或いは文字数に比例する料金を算出しても良い。ただしこの場合は、情報量算出LSI14は言語変換CPU9の後で言語情報を計測をする必要が有る。
【0029】
依頼者が多くて音声データが情報量算出LSI14の記憶容量を超える場合や通訳を希望する言語の辞書がない場合など、自動通訳装置15aの処理能力を超えるため、通訳業務が出来ない場合(F4でNOの場合)には、自動通訳装置15aは、依頼者の携帯端末6aに通訳不能通知を送信して(F14)、接続を解除し(F15)、終了する(F16)。この場合は通訳サービスの課金処理は行われない。
【0030】
言語情報の量に応じて通訳料金を設定する方法は、装置への接続時間に応じて料金を設定する方法と比べると、会話がない時間にも課金されてしまうという問題点がないため、手軽に利用できる。
【0031】
特に言語変換CPU9の処理時間に基づいて料金を設定する方法は、処理に最も時間のかかる言語変換CPU9の処理時間に比例しているため、受け入れられやすい料金体系である。さらに、「おはよう」などの通訳が簡単な会話は言語変換処理CPU9の処理時間が短いために低料金になるという合理性もある。
【0032】
携帯端末6aは無線通信LSI、音声変換LSI、マイクロフォンおよびスピーカで構成されているので、小型軽量で消費電力も低く、低コストで実現できる。また、自動通訳装置15aは音声データを一時的に記憶する機能を所有するので、複数の利用者への通訳サービスの提供が可能である。
【0033】
実施の形態2.
実施の形態2を、図4、5に基づいて説明する。携帯端末6b、6cは図1の携帯端末6aと同様の機能を持ち、また自動通訳装置15bは図2の自動通訳装置15aと同様の機能を持つものであるが、送受信先切り替え機能(図示せず)を備えている点が異なっている。図4には2台の携帯端末しか描かれていないが、言語変換CPU9の処理能力に応じて、任意の数だけ増設できる。
【0034】
送受信先を切り替えるために、携帯端末6b、6cの識別情報(アドレス)が予め決められている。自動通訳装置15bは通訳された音声信号とともに指定された携帯端末のアドレス信号を発信する。指定されたアドレスを持つ携帯端末のみが通訳された音声信号を受け取ることで送受信先の切換えが行われる。
【0035】
この送受信先切り替え機能は、現在のパソコンのネットワークなどで用いられているLAN(Local Area Network)や、Bluetoothなどの無線LANと同様の接続方法を用いて送受信先を選択する。
【0036】
図5において自動通訳装置15bに、音声送信LSI23が設けられている理由は、自動通訳装置15bは複数の携帯端末からの依頼をさばくので、自動通訳装置15aよりも高速でデータ処理/通信を行わなければならないからで、デジタル信号を高周波変調信号に変調する専用のLSIを設けて動作速度を速くしている。
【0037】
携帯端末6bを持っている利用者は自動通訳装置15bを呼び出して、通訳したい言語を指定する手続きを取るところまでは実施の形態1と同じであるが、その際さらに、通訳した言語音声を携帯端末6cに送るように、自動通訳装置15bに送り先の指定情報を送る。
【0038】
自動通訳装置15bは、携帯端末6bから送られた第一言語の音声を実施の形態1で説明した手順に従って第二言語に変換し、変換された第二言語音声は指定された送り先である携帯端末6cに送信される。逆に携帯端末6cから送られた第二言語の音声は第一言語に変換されて、携帯端末6bに送られる。事業者は言語情報の量に比例した料金を携帯端末6bを持つ依頼者に課金する。予め同意が得られているのであれば携帯端末6cの使用者に課金してもよい。
【0039】
自動通訳装置15bは2個以上の複数の携帯端末からの依頼を処理する。もし、依頼者が多いため通訳処理が遅れて依頼者が数秒間待たされた場合でも、言語情報の量に比例した料金が課金されるので、会話のない時間にも課金されるなどの無駄が無い。
【0040】
このように、実施の形態2にかかわる自動通訳システムは、通訳した言語音声を送信する携帯端末を指定出来るようにしたので、離れた場所にいる者同志の間でもお互いの自国言語だけで会話することが出来る。
【0041】
実施の形態3.
図6、7に基づいて実施の形態3を説明する。この自動通訳システムは、携帯電話を利用して、携帯電話基地局18と電話回線17で接続されている自動通訳装置15cから通訳サービスを受ける。自動通訳装置15cは携帯電話基地局18からみると、通常の電話の一つとして扱われ、自動通訳装置15cに電話をかけることで、自動通訳の契約者は現有の携帯電話16a〜16dを用いて、互いに会話を進めることが出来る。
【0042】
携帯電話16a〜16dは図4の携帯端末6b、6cと同様の機能を持っている。自動通訳装置15cは、複数の電話回線を備え、そのうち一回線(以後、回線acと呼ぶ)を携帯電話16aと自動通訳装置15cとの間の通話に、別の回線(以後、回線bcと呼ぶ)を携帯電話16bと自動通訳装置15cとの間の通話に、割り当てる。回線の割り当ては切換え機19が空いている回線を判断して自動的に行う。音声変換LSI5は携帯電話基地局18から送られてくる音声アナログ信号をデジタル信号に変換するものであるが、携帯電話基地局18とデジタル回線で接続されているのであれば不要である。
【0043】
先ず、携帯電話16aの使用者Aは、通常の手順に従って自動通訳装置15cに電話をかける。すると自動通訳装置15cは、携帯電話16aの使用者Aに対して、通訳を望む言語の種類と、相手先の電話番号を問い合わせる。携帯電話16aの使用者Aが、携帯電話16bの使用者Bと第2言語で話すことを選択し、自動通訳装置15cに伝えると、自動通訳装置15cは携帯電話16bに接続し、通訳サービスが開始する。
【0044】
携帯電話16aから伝送されてくる音声は、まず携帯電話基地局18で受信され、回線acを経由して自動通訳装置15cに伝送される。自動通訳装置15cは実施の形態1または2と同様の処理を行い、第1言語を第2言語に変換する。変換された第2言語の音声デジタル信号は、回線bcを経由して携帯電話基地局18に送り返され、携帯電話16bに発信される。
【0045】
これに対し携帯電話16bの使用者Bは、第2言語で応答すると、この音声は携帯電話基地局18で受信され、回線bcを経由して自動通訳装置15cに伝送される。自動通訳装置15cは実施の形態1または2と同様の処理を行い、第2言語を第1言語に変換する。変換された第1言語の音声デジタル信号は、回線acを経由して携帯電話基地局18に送り返され、携帯電話16aに発信される。事業者は言語情報の量に比例した料金を契約者に課金する。なお、携帯電話16aの使用者Aが、通話先に自分の携帯電話16aを指定することも原理的には可能である。
【0046】
自動通訳装置15cは複数の回線で接続されているため、言語変換CPU9の処理能力に応じて、複数の通訳を逐次処理することが可能である。例えば、携帯電話16cの使用者Cまたは携帯電話16dの使用者Dが、第1言語または第2言語で応答すると、この音声は携帯電話基地局18で受信され、回線ccまたは回線dcを経由して自動通訳装置15cに伝送される。伝送されてきた音声は、変換されて、指定した相手先に伝送される。
【0047】
以上のように実施の形態3では、携帯電話を利用して、通訳サービスを受けることが出来るので、依頼者は新たに携帯端末を購入する必要がなく、また、事業者は無線通信用LSIが不要になるので、より低コストで通訳サービスが提供できる。また、上記実施の形態では携帯電話を使用する例を示したが、固定電話であっても同様の通訳サービスを利用することができる。
【0048】
【発明の効果】
本発明にかかわる自動通訳装置は、音声信号を送受信可能な通信手段と、通信手段で受信した音声信号を言語情報に変換する音声認識手段と、言語情報の量を計測する情報量算出手段と、付帯する辞書を用いて言語情報を希望の言語に変換する言語変換手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される言語情報の量に基づいて算出することにより、手軽に通訳サービスを利用できる。
【0049】
また、音声信号を送受信可能な通信手段と、通信手段で受信した音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に変換するのに要する時間を計測する情報量算出手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される変換に要した時間に基づいて算出することにより、手軽に通訳サービスを利用できる。
【0050】
また、通信手段は、音声信号の送受信先を変更する切替え手段を有していることにより、複数の利用者が通訳サービスを利用できる。
【0051】
また、電話基地局に接続可能な回線切換え手段と、回線切換え手段から伝送される音声信号を言語情報に変換する音声認識手段と、言語情報の量を計測する情報量算出手段と、付帯する辞書を用いて言語情報を希望の言語に変換する言語変換手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される言語情報の量に基づいて算出することにより、手軽に通訳サービスを利用できる。
【0052】
また、電話基地局に接続可能な回線切換え手段と、回線切換え手段から伝送される音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に通訳するのに要する時間を計測する情報量算出手段を備えた自動通訳装置であって、装置の使用料を情報量算出手段で計測される変換に要した時間に基づいて算出することにより、手軽に通訳サービスを利用できる。
【0053】
本発明にかかわる自動通訳システムは、携帯端末とこの携帯端末の音声信号を送受信可能な自動通訳装置を有する自動通訳システムにおいて、自動通訳装置は、携帯端末から送られてくる音声信号を言語情報に変換する音声認識手段と、言語情報を付帯する辞書を用いて希望の言語に変換する言語変換手段と、言語変換手段が言語情報を希望の言語に変換するのに要する時間を計測する情報量算出手段を備え、自動通訳装置は、装置の使用料を情報量算出手段で計測される通訳に要した時間に基づいて算出し、携帯電話に通知するように構成されていることにより、手軽に通訳サービスを利用できる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかわる携帯端末の構成を示すブロック図である。
【図2】本発明の実施の形態1にかかわる自動通訳装置の構成を示すブロック図である。
【図3】自動通訳装置に接続するところから料金を算出し、接続を終了するまでの手順を説明するためのフローチャートである。
【図4】本発明の実施の形態2にかかわる自動通訳システムの構成を示すブロック図である。
【図5】本発明の実施の形態2にかかわる自動通訳装置の構成を示すブロック図である。
【図6】本発明の実施の形態3にかかわる自動通訳システムの構成を示すブロック図である。
【図7】本発明の実施の形態3にかかわる自動通訳装置の構成を示すブロック図である。
【図8】従来の自動通訳装置の構成を示すブロック図である。
【符号の説明】
1:マイクロフォン、2:スピーカ、3a、3b:アンテナ、4a、4b:無線通信用LSI、5:音声変換LSI、6a〜c:携帯端末、7:音声取込LSI、8:言語認識LSI、9:言語変換CPU、10:第一言語の辞書、11:第二言語の辞書、12:音声変換LSI、13:音声送信LSI、14:情報量算出LSI、15a〜15c:自動通訳装置、16a〜16d:携帯電話、17:電話回線、18:携帯電話基地局、19:切換え機、23:音声送信LSIである。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an automatic interpretation system to which a wireless communication technique is applied.
[0002]
[Prior art]
FIG. 8 is a block diagram for explaining the configuration of a conventional automatic interpreter. In the figure, reference numeral 1 denotes a microphone, 2 denotes a speaker, 7 denotes a speech capture LSI (Large Scale Integrated Circuit), 8 denotes a speech recognition LSI, 9 denotes a language conversion CPU (Central Processing Unit), 10 denotes a dictionary in a first language, Reference numeral 11 denotes a dictionary of a second language, 12 denotes a voice conversion LSI, and 13 denotes a voice transmission LSI. Here, the first language and the second language are generalized expressions of languages that need to be interpreted from each other.
[0003]
The voice of the first language input from the microphone 1 is subjected to AD (Analog to Digital) conversion by the voice capturing LSI 7 and converted into a voice digital signal. The voice converted into a digital signal is converted into language information of a first language by a voice recognition LSI 8. The language information of the first language is converted (interpreted) into language information of the second language by the language conversion CPU 9, language conversion software (not shown), the first language dictionary 10 and the second language dictionary 11. .
[0004]
Further, the language information of the second language is converted into a voice digital signal by the voice conversion LSI 12. The audio transmission LSI 13 converts the digitalized audio of the second language into a digital signal and converts it into an analog electric signal. Since the analog electric signal is converted into a voice by the speaker 2, words translated from the first language to the second language are output from the speaker 2.
[0005]
Now, in order to perform these functions in real time, a plurality of semiconductor chips having very high performance and large capacity memory is required. For this reason, the conventional automatic interpreting apparatus exhibited the same weight and power consumption as a personal computer, and had to be very expensive.
[0006]
[Problems to be solved by the invention]
The places where automatic interpreters are required are widespread, such as airports, train stations, and downtown, and can be used for a few hours or as little as a minute. It is uneconomical for a translator to carry heavy, expensive equipment that may only take a few minutes. SUMMARY OF THE INVENTION An object of the present invention is to provide an automatic interpreting system that can easily use an interpreting service anytime and anywhere.
[0007]
[Means for Solving the Problems]
The automatic interpreting apparatus according to the present invention is a communication means capable of transmitting and receiving a voice signal, a voice recognition means for converting a voice signal received by the communication means into linguistic information, an information amount calculating means for measuring the amount of linguistic information, An automatic interpreting apparatus provided with a language conversion means for converting language information into a desired language using an attached dictionary, wherein a usage fee of the apparatus is calculated based on the amount of language information measured by the information amount calculation means. Things.
[0008]
A communication unit capable of transmitting and receiving a voice signal; a voice recognition unit configured to convert a voice signal received by the communication unit into language information; a language conversion unit configured to convert a voice signal into a desired language using a dictionary attached to the language information; An automatic interpreting apparatus provided with an information amount calculating means for measuring a time required for the language converting means to convert the linguistic information into a desired language, wherein a fee for use of the apparatus is required for the conversion measured by the information amount calculating means. It is calculated based on the time taken.
[0009]
Further, the communication means includes switching means for changing a transmission destination of the audio signal.
[0010]
A line switching means connectable to the telephone base station; a voice recognition means for converting a voice signal transmitted from the line switching means into linguistic information; an information amount calculating means for measuring an amount of linguistic information; An automatic interpreting apparatus provided with a language conversion means for converting linguistic information into a desired language by using, and calculates a usage fee of the apparatus based on the amount of linguistic information measured by the information amount calculating means. .
[0011]
Line switching means connectable to a telephone base station, voice recognition means for converting a voice signal transmitted from the line switching means into linguistic information, and a language for converting to a desired language using a dictionary accompanying the linguistic information An automatic interpreting apparatus comprising a converting means and an information amount calculating means for measuring a time required for the language converting means to translate the linguistic information into a desired language, wherein the usage fee of the apparatus is measured by the information amount calculating means. This is calculated based on the time required for the conversion.
[0012]
An automatic translation system according to the present invention is an automatic translation system having a portable terminal and an automatic translation device capable of transmitting and receiving a voice signal of the portable terminal, wherein the automatic translation device converts a speech signal sent from the portable terminal into language information. Speech recognition means for conversion, language conversion means for converting into a desired language using a dictionary accompanying language information, and information amount calculation for measuring the time required for the language conversion means to convert the language information into a desired language The automatic interpreting apparatus includes means for calculating the fee for use of the apparatus based on the time required for interpreting, which is measured by the information amount calculating means, and notifying the mobile phone.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Embodiment 1 FIG.
Hereinafter, embodiments of the present invention will be described with reference to the drawings. The automatic translation system according to the first embodiment includes the portable terminal 6a shown in FIG. 1 and the automatic translation device 15a shown in FIG. The automatic interpreting system according to the first embodiment is used when a person who speaks the first language and a person who speaks the second language face each other in a meeting room or the like, and the portable terminal 6a is placed between them. Then, the conversation proceeds by listening to the native language output from the speaker of the portable terminal 6a.
[0014]
1 and 2, 1 is a microphone, 2 is a speaker, 3a and 3b are antennas, 4a and 4b are wireless communication LSIs, 5 is a voice conversion LSI, 8 is a language recognition LSI, and 14 measures and calculates the amount of information. An information amount calculation LSI for temporarily storing voice data, a language conversion CPU, a first language dictionary (non-volatile memory storing languages), a second language dictionary, and a voice conversion LSI. is there.
[0015]
The microphone 1 is so sensitive that it can pick up the voices of all the people who need an interpreter, and the volume of the speaker 2 is set so high that it can be heard by all the people who need an interpreter. Instead of the speaker 2, each user may listen to the sound using an earphone (not shown), or may use both the speaker and the earphone.
[0016]
The mobile terminal 6a is provided with two buttons (not shown), and first specifies the language of the button 1 (for example, Japanese) and the language of the button 2 (for example, English). After that, during conversation, the user repeatedly presses button 1 and speaks Japanese, and then presses button 2 and speaks English. The language conversion CPU 9 recognizes which language the signal is from the button 1 or 2.
[0017]
When transmitting voice between the portable terminal 6a and the automatic interpreter 15a, first, a voice analog signal is converted into a voice digital signal. This audio digital signal is modulated into an audio-modulated digital signal (for example, a digital signal of 1, 0 converted to a phase signal represented by a phase difference of 0 degree and 180 degrees), and the frequency of the audio modulated digital signal is further increased. , Into a high-frequency modulated signal. The reverse operation is performed for reception. Audio modulation means (baseband) for converting an audio digital signal into a modulated digital signal, a frequency converter for converting this modulated digital signal into a high-frequency modulated signal, and means for performing the reverse conversion (demodulation) are provided in this embodiment. In the form, it is housed in a wireless communication LSI.
[0018]
Next, the procedure of automatic interpretation will be described with reference to the flowchart of FIG. The interpreter requests the automatic interpreter 15a from the portable terminal 6a (F2). Next, a language to be interpreted is specified (F3). The first language voice input from the microphone 1 of the portable terminal 6a is AD-converted into a digital signal by the voice conversion LSI 5 (FIG. 1). The voice converted into a digital signal is converted into a high-frequency modulated signal by the wireless communication LSI 4a, propagates in the air as a radio wave from the antenna 3a, and is received by the antenna 3b of the automatic interpreter 15a (F5).
[0019]
The audio high-frequency modulated signal from the portable terminal 6a sent to the automatic interpreting device 15a is converted into a first language modulated digital signal by the wireless communication LSI 4b, and this modulated digital signal is converted into a first language audio digital signal ( Demodulated). The voice converted into a digital signal is sent to the voice recognition LSI 8, and is converted into linguistic information (a set of words and sentences) of the first language. This linguistic information is sent to the information amount calculation LSI 14, and the amount of linguistic information is measured (F6).
[0020]
The language information of the first language is converted (interpreted) into language information of the second language by the language conversion CPU 9, language conversion software (not shown), the first language dictionary 10 and the second language dictionary 11 (F7). ). Although only two types of dictionaries are illustrated in FIG. 2, any dictionary can be supported by adding a dictionary and language conversion software.
[0021]
When the language conversion CPU 9 has an analog output, the words in the second language need to be converted into digital audio signals by the audio conversion LSI 12, but when the language conversion CPU 9 has a digital output, the audio signals in the second language are directly output. It is sent to the wireless communication LSI 4b. The sent audio digital signal is converted into a high-frequency modulated signal, propagates through the air from the antenna 3b (F8), and is received by the antenna 3a of the portable terminal 6a.
[0022]
The high-frequency modulated signal of the second language received by the antenna 3a is converted (demodulated) into an audio digital signal of the second language by the wireless communication LSI 4a. Since the audio digital signal of the second language is converted into an analog signal of the second language by the audio conversion LSI 5, the audio of the second language is output from the speaker 2.
[0023]
The reason for using digital communication is that the circuit is complicated, but it is resistant to noise, can transmit data other than voice (eg, billing data), and is multiplexed (multiple users can use it). Because it is easy. When there is one set of users and an interpreter is nearby, there is no problem with analog communication. However, digital communication is used here to cope with a plurality of users (see Embodiments 2 and 3). I have.
[0024]
When the conversation continues to progress, the process returns from F9 to F5 in FIG. 3 and the interpretation and the measurement of the information amount are continued. If voice data from another client is sent while the language conversion CPU 9 is interpreting, the voice data from the other client is temporarily stored in the information amount calculation LSI 14. The voice data stored in the information amount calculation LSI 14 is sent to the language conversion CPU 9 and processed after the interpretation process of the voice data is completed.
[0025]
When the voice of the second language is transmitted from the portable terminal 6a, the second language is converted into the first language by the automatic interpreter 15a according to the same procedure as described above, and the converted first language is converted. Is sent to the portable terminal 6a.
[0026]
When the conversation is over, the automatic interpreting apparatus 15a calculates an interpreting fee according to the measured amount of linguistic information (F10). The calculated fee is notified to the portable terminal 6a of the client (F11). Thereafter, the connection between the portable terminal 6a and the automatic interpreting apparatus 15a is released (F12), and the interpreting service ends (F13).
[0027]
Here, the translation fee according to the amount of linguistic information is, for example, a fee proportional to the number of words or characters detected by the speech recognition LSI 8. It is also conceivable to make it proportional to the time required for voice recognition. A fixed fee (basic fee) may be added each time a connection is made.
[0028]
Alternatively, a charge proportional to the time required for processing by the language conversion CPU 9 or the number of words or characters converted into a language may be calculated. However, in this case, the information amount calculation LSI 14 needs to measure the language information after the language conversion CPU 9.
[0029]
In the case where the interpreting work cannot be performed because the processing capacity of the automatic interpreting apparatus 15a is exceeded, such as when the number of requesters is large and the voice data exceeds the storage capacity of the information amount calculation LSI 14, or when there is no dictionary of the language for which interpretation is desired (F4). In the case of NO, the automatic interpreting apparatus 15a transmits a translation impossible notification to the requesting portable terminal 6a (F14), releases the connection (F15), and ends (F16). In this case, the interpreting service is not charged.
[0030]
The method of setting the translation fee according to the amount of language information is simpler than the method of setting the fee according to the connection time to the device, because there is no problem that the fee is charged even when there is no conversation. Available to
[0031]
In particular, the method of setting the fee based on the processing time of the language conversion CPU 9 is an easy-to-accept fee system because it is proportional to the processing time of the language conversion CPU 9 which requires the longest processing. Further, there is also a rationale that a conversation such as "good morning" whose interpretation is easy is low because the processing time of the language conversion processing CPU 9 is short.
[0032]
Since the mobile terminal 6a includes a wireless communication LSI, a voice conversion LSI, a microphone, and a speaker, the mobile terminal 6a can be realized at low cost with small size, light weight, low power consumption. Further, since the automatic interpreting apparatus 15a has a function of temporarily storing voice data, it is possible to provide an interpreting service to a plurality of users.
[0033]
Embodiment 2 FIG.
Embodiment 2 will be described with reference to FIGS. The portable terminals 6b and 6c have the same function as the portable terminal 6a in FIG. 1, and the automatic interpreter 15b has the same function as the automatic interpreter 15a in FIG. )). Although only two mobile terminals are illustrated in FIG. 4, an arbitrary number can be added according to the processing capacity of the language conversion CPU 9.
[0034]
In order to switch the destination, the identification information (address) of the mobile terminals 6b and 6c is determined in advance. The automatic interpreting device 15b transmits an address signal of the designated portable terminal together with the interpreted voice signal. Only the portable terminal having the designated address receives the interpreted audio signal, and the destination is switched.
[0035]
This transmission / reception destination switching function selects a transmission / reception destination using a connection method similar to a LAN (Local Area Network) used in a current personal computer network or the like, or a wireless LAN such as Bluetooth.
[0036]
In FIG. 5, the reason why the voice interpreting LSI 23 is provided in the automatic interpreting device 15b is that the automatic interpreting device 15b processes requests from a plurality of mobile terminals, and therefore performs data processing / communication at a higher speed than the automatic interpreting device 15a. Therefore, a dedicated LSI for modulating a digital signal into a high-frequency modulation signal is provided to increase the operation speed.
[0037]
The user having the portable terminal 6b is the same as the first embodiment up to the point where the user calls the automatic interpreter 15b and takes the procedure of specifying the language to be interpreted. The destination specification information is sent to the automatic interpreting apparatus 15b as sent to the terminal 6c.
[0038]
The automatic interpreting apparatus 15b converts the first language voice sent from the mobile terminal 6b into the second language according to the procedure described in the first embodiment, and converts the converted second language voice into the designated destination, the mobile phone. It is transmitted to the terminal 6c. Conversely, the second language voice sent from the mobile terminal 6c is converted into the first language and sent to the mobile terminal 6b. The business operator charges a fee proportional to the amount of language information to the client having the portable terminal 6b. If the consent has been obtained in advance, the user of the portable terminal 6c may be charged.
[0039]
The automatic interpreter 15b processes requests from two or more mobile terminals. Even if the interpreter process is delayed due to the large number of clients and the client waits for a few seconds, a fee proportional to the amount of linguistic information will be charged, so there is no waste such as being charged even when there is no conversation There is no.
[0040]
As described above, the automatic interpreting system according to the second embodiment allows the designation of the mobile terminal to which the interpreted language voice is to be transmitted. I can do it.
[0041]
Embodiment 3 FIG.
Embodiment 3 will be described with reference to FIGS. This automatic interpreting system receives an interpreting service from an automatic interpreting device 15c connected to a mobile phone base station 18 and a telephone line 17 using a mobile phone. When viewed from the mobile phone base station 18, the automatic interpreter 15c is treated as one of ordinary telephones, and by calling the automatic interpreter 15c, the automatic interpreter uses the existing mobile phones 16a to 16d. You can talk with each other.
[0042]
The mobile phones 16a to 16d have the same functions as the mobile terminals 6b and 6c in FIG. The automatic interpreting apparatus 15c has a plurality of telephone lines, one of which is hereinafter referred to as a line ac, for communicating between the mobile phone 16a and the automatic interpreting apparatus 15c, and another line (hereinafter referred to as a line bc). ) Is assigned to a call between the mobile phone 16b and the automatic interpreter 15c. The line assignment is automatically performed by judging the line where the switching unit 19 is free. The voice conversion LSI 5 converts a voice analog signal sent from the mobile phone base station 18 into a digital signal, but is not required if the voice conversion LSI 5 is connected to the mobile phone base station 18 via a digital line.
[0043]
First, the user A of the mobile phone 16a calls the automatic interpreter 15c according to a normal procedure. Then, the automatic interpreting apparatus 15c inquires the user A of the mobile phone 16a about the type of language desired to be interpreted and the telephone number of the destination. When the user A of the mobile phone 16a selects to speak with the user B of the mobile phone 16b in the second language and informs the automatic interpreting device 15c, the automatic interpreting device 15c connects to the mobile phone 16b and the interpreting service is started. Start.
[0044]
The voice transmitted from the mobile phone 16a is first received by the mobile phone base station 18 and transmitted to the automatic interpreting apparatus 15c via the line ac. The automatic interpreting apparatus 15c performs the same processing as in the first or second embodiment, and converts the first language into the second language. The converted voice digital signal of the second language is sent back to the mobile phone base station 18 via the line bc and transmitted to the mobile phone 16b.
[0045]
On the other hand, when the user B of the mobile phone 16b answers in the second language, the voice is received by the mobile phone base station 18 and transmitted to the automatic interpreting apparatus 15c via the line bc. The automatic interpreting apparatus 15c performs the same processing as in the first or second embodiment, and converts the second language into the first language. The converted voice digital signal of the first language is sent back to the mobile phone base station 18 via the line ac and transmitted to the mobile phone 16a. The operator charges the contractor a fee proportional to the amount of language information. Note that it is possible in principle for the user A of the mobile phone 16a to designate his / her own mobile phone 16a as a destination.
[0046]
Since the automatic interpreter 15c is connected by a plurality of lines, it is possible to sequentially process a plurality of interpreters according to the processing capacity of the language conversion CPU 9. For example, when the user C of the mobile phone 16c or the user D of the mobile phone 16d answers in the first language or the second language, the voice is received by the mobile phone base station 18 and is transmitted via the line cc or the line dc. And transmitted to the automatic interpreter 15c. The transmitted voice is converted and transmitted to the designated destination.
[0047]
As described above, in the third embodiment, the interpreter service can be received by using the mobile phone, so that the client does not need to purchase a new mobile terminal, and the business operator can use the wireless communication LSI. Since it becomes unnecessary, an interpreter service can be provided at a lower cost. In the above-described embodiment, an example in which a mobile phone is used has been described. However, a similar interpreting service can be used even with a fixed phone.
[0048]
【The invention's effect】
The automatic interpreting apparatus according to the present invention is a communication means capable of transmitting and receiving a voice signal, a voice recognition means for converting a voice signal received by the communication means into linguistic information, an information amount calculating means for measuring the amount of linguistic information, An automatic interpreting apparatus provided with a language conversion means for converting language information into a desired language using an attached dictionary, wherein a usage fee of the apparatus is calculated based on the amount of language information measured by the information amount calculation means. This makes it easy to use the interpreter service.
[0049]
A communication unit capable of transmitting and receiving a voice signal; a voice recognition unit configured to convert a voice signal received by the communication unit into language information; a language conversion unit configured to convert a voice signal into a desired language using a dictionary attached to the language information; An automatic interpreting apparatus provided with an information amount calculating means for measuring a time required for the language converting means to convert the linguistic information into a desired language, wherein a fee for use of the apparatus is required for the conversion measured by the information amount calculating means. By calculating based on the calculated time, the interpreter service can be easily used.
[0050]
Further, since the communication means has a switching means for changing the transmission destination of the audio signal, a plurality of users can use the interpreting service.
[0051]
A line switching means connectable to the telephone base station; a voice recognition means for converting a voice signal transmitted from the line switching means into linguistic information; an information amount calculating means for measuring an amount of linguistic information; An automatic interpreting apparatus equipped with a language conversion means for converting language information into a desired language by using, by calculating the usage fee of the apparatus based on the amount of language information measured by the information amount calculation means, Easy to use interpreting service.
[0052]
Line switching means connectable to a telephone base station, voice recognition means for converting a voice signal transmitted from the line switching means into linguistic information, and a language for converting to a desired language using a dictionary accompanying the linguistic information An automatic interpreting apparatus comprising a converting means and an information amount calculating means for measuring a time required for the language converting means to translate the linguistic information into a desired language, wherein the usage fee of the apparatus is measured by the information amount calculating means. The interpretation service can be easily used by calculating based on the time required for the conversion.
[0053]
An automatic translation system according to the present invention is an automatic translation system having a portable terminal and an automatic translation device capable of transmitting and receiving a voice signal of the portable terminal, wherein the automatic translation device converts a speech signal sent from the portable terminal into language information. Speech recognition means for conversion, language conversion means for converting into a desired language using a dictionary accompanying language information, and information amount calculation for measuring the time required for the language conversion means to convert the language information into a desired language The automatic interpreting apparatus is configured to calculate the usage fee of the apparatus based on the time required for the interpreter measured by the information amount calculating means and to notify the mobile phone of the automatic interpreting apparatus. Service available.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a mobile terminal according to Embodiment 1 of the present invention.
FIG. 2 is a block diagram showing a configuration of an automatic interpreting apparatus according to Embodiment 1 of the present invention.
FIG. 3 is a flowchart for explaining a procedure from calculating a charge from a point of connection to the automatic interpreting apparatus to ending the connection;
FIG. 4 is a block diagram showing a configuration of an automatic interpretation system according to a second embodiment of the present invention.
FIG. 5 is a block diagram showing a configuration of an automatic interpreting apparatus according to Embodiment 2 of the present invention.
FIG. 6 is a block diagram showing a configuration of an automatic interpretation system according to Embodiment 3 of the present invention.
FIG. 7 is a block diagram showing a configuration of an automatic interpreting apparatus according to Embodiment 3 of the present invention.
FIG. 8 is a block diagram showing a configuration of a conventional automatic interpreter.
[Explanation of symbols]
1: microphone, 2: speaker, 3a, 3b: antenna, 4a, 4b: LSI for wireless communication, 5: audio conversion LSI, 6a to c: portable terminal, 7: audio capture LSI, 8: language recognition LSI, 9 : Language conversion CPU, 10: first language dictionary, 11: second language dictionary, 12: voice conversion LSI, 13: voice transmission LSI, 14: information amount calculation LSI, 15a to 15c: automatic interpreter, 16a to 16d: mobile phone, 17: telephone line, 18: mobile phone base station, 19: switcher, 23: voice transmission LSI.