JP2004362132A - Speech translation device - Google Patents

Speech translation device Download PDF

Info

Publication number
JP2004362132A
JP2004362132A JP2003158021A JP2003158021A JP2004362132A JP 2004362132 A JP2004362132 A JP 2004362132A JP 2003158021 A JP2003158021 A JP 2003158021A JP 2003158021 A JP2003158021 A JP 2003158021A JP 2004362132 A JP2004362132 A JP 2004362132A
Authority
JP
Japan
Prior art keywords
language
voice
speech
unit
translation device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003158021A
Other languages
Japanese (ja)
Inventor
Masato Miyanouchi
誠人 宮之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FREPAR NETWORKS Inc
Original Assignee
FREPAR NETWORKS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FREPAR NETWORKS Inc filed Critical FREPAR NETWORKS Inc
Priority to JP2003158021A priority Critical patent/JP2004362132A/en
Publication of JP2004362132A publication Critical patent/JP2004362132A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a speech translation device that enables persons using different languages to easily communicate with each other and that can be easily adapted to a plurality of different languages. <P>SOLUTION: In the speech translation device, a microphone inputs the speech of a first language. A speech recognition means recognizes the speech of the first language as speech signals of the first language. A translation means converts the speech signals of the first language into speech signals of a second language. A speech generation means generates the speech of the second language from the speech signals of the second language. Loudspeakers output the speech of the second language. The speech translation device has a body unit and a data unit including a storage medium for storing speech-translation data for each language to be translated. The data unit has a mounting part that allows the data unit to be removably attached to a case of the body unit. The data unit is replaced according to the language to be translated. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、使用者が発した音声を他の異なる言語に変換し、変換された音声を出力する音声翻訳装置に関する。
【0002】
【従来の技術】
一般に、音声翻訳装置は、マイクから入力された第1言語の音声を認識し、その認識信号を第2言語に翻訳して、その結果を音声合成してスピーカから出力するようになっている。従来の技術では、例えば、特許文献1のように、大掛かりなコンピュータと通信媒体を使い、複数の異なる言語の使用者が同時に会話できる多言語通訳装置がある。
【0003】
また、小型化されていて、持ち運ぶことができる音声翻訳装置は、例えば特許文献2などに開示され、図5は特許文献1の小型通訳機の斜め前面からの外観図を、図6は特許文献1の小型翻訳機の斜め後面からの外観図を示す。図5及び図6において、筐体100は、情報入出力部101とグリップ部102からなり、小型かつ片手で操作可能な形状になっている。情報入出力部101には、音声入力手段103や音声出力手段104、情報表示手段105が搭載されている。小型通訳機の後面に配設された電源スイッチ106により電源を入れると、音声入力スイッチ107が操作可能になり、音声入力スイッチ107を押下し、音声入力手段103により音声入力が行われる。そして、入力された音声の音声認識が行われ、候補文字列が情報表示手段105に表示される。上移動スイッチ108、下移動スイッチ109により情報表示手段105内のカーソルを上下に移動させて、候補文字列の中から翻訳したい候補を選択し、確定スイッチ110を押下すると、翻訳が実行される。そして、音声出力スイッチ111を押下すると、音声が生成され、音声出力手段104を通して音声が出力される。ここで、音量制御スイッチ112を調整することで、出力音声の音量が制御される。また、これらの作業中に取り消しをしたい場合には、取り消しスイッチ113を押下すれば、音声入力前の状態になる。
【0004】
【特許文献1】
特開2000−112939号公報
【0005】
【特許文献2】
特開2000−315205号公報
【0006】
【発明が解決しようとする課題】
ところが、特許文献1のような装置では、通訳を行う際に、利用者はパソコンと通信機器等を携帯する必要があり、海外旅行等での簡単な会話を通訳する場面では、使いやすいシステムではなかった。
【0007】
また、特許文献2の装置は、小型化されており、1台で翻訳が可能ではあるが、構造が複雑になってしまう。操作性の面でも、音声入力スイッチ107、音声出力スイッチ111、確定スイッチ110、取り消しスイッチ113等、操作すべきスイッチの数が多く、使用者が第1言語の音声を入力してから、翻訳された第2言語の音声が出力されるまでに時間がかかってしまう。さらに、翻訳対象を変更したい場合、例えば日本語を英語に翻訳(日英)から、日本語を中国語に翻訳(日中)に変更するには、新たに日中を翻訳対象とする装置が必要であった。
【0008】
本発明は、上述のような事情により鑑みて成されたものであり、互いに異なる言語を使用する者同志が手軽にコミュニケーションをとることができ、さらに異なる複数の言語にも容易に対応できるようにした音声翻訳装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明の上記目的は、マイクが第1言語の音声を入力し、音声認識手段が前記第1言語の音声を第1言語の音声信号と認識し、翻訳手段が前記第1言語の音声信号を第2言語の音声信号に変換し、音声生成手段が前記第2言語の音声信号から第2言語の音声を生成し、スピーカーが前記第2言語の音声を出力する音声翻訳装置であって、前記音声翻訳装置は、本体ユニットと、翻訳対象言語毎に音声−翻訳データを記憶した記憶媒体を含むデータユニットとを有し、前記データユニットが前記本体ユニットのケースに取り外し自在にする装着部を備え、且つ、翻訳対象言語に応じて前記データユニットを交換することにより、達成される。
【0010】
また、上記目的は、音声録音手段が、マイクを通して入力された音声を録音し、前記本体ユニット内に配設されたメモリが前記録音された音声を記憶し、前記スピーカが前記記憶された音声を出力することにより、効果的に達成される。
【0011】
また、上記目的は、前記本体ユニットの前記ケースが、音声の入力を開始するためのスイッチを有し、片手で握りながら前記スイッチを操作することができる棒状に形成されたグリップ部と、前記マイクと前記スピーカを有し、前面と後面とが明確にわかる形状に形成された本体部とから構成されていることにより、効果的に達成される。
【0012】
また、上記目的は、前記データユニットを前記本体ユニットの前記ケースに取り外し自在にする前記装着部が、前記グリップ部の底面に配設された凹部と、該凹部に嵌挿される前記データユニット上部に配設された凸部とから構成されていることにより、効果的に達成される。
【0013】
さらに、上記目的は、前記本体部の前面と後面に、前記マイクと前記スピーカを各1個内包されており、前記第1言語の音声が前面の前記マイクに入力されると、前記第2言語に変換された音声が後面の前記スピーカから出力され、前記第2言語の音声が後面の前記マイクに入力されると、前記第1言語に変換された音声が前面の前記スピーカから出力されるようになっていることにより、効果的に達成される。
【0014】
【発明の実施の形態】
以下、図面を参照にしながら、本発明の実施形態を説明する。
【0015】
図1は、本発明の一実施例を示す音声翻訳装置の構成を示す図である。同図において、音声翻訳装置1は、CPU2、メモリ3、周辺制御装置4、音声入力装置5、音声出力装置6、スイッチ7、8、音声録音手段9、録音スイッチ10を含む本体ユニット11と、認識用データ12aと翻訳用データ12bを含むデータユニット12から構成されている。
【0016】
音声入力手段5は、マイク13とA/D変換器14を含み、音声出力手段はスピーカ15とD/A変換器16を含み、前面側と後面側にそれぞれ各1個ずつ内包されている。前面側の音声入力手段5から入力された第1言語の音声は、第2言語に翻訳されて後面側の音声出力手段6より出力され、また、後面側の音声入力手段5から入力された第2言語の音声は、第1言語に翻訳されて前面側の音声出力手段6より出力されるようになっている。
【0017】
CPU2では、第1言語の音声を第1言語の音声信号と認識する、或いは、第2言語の音声を第2言語の音声信号と認識する音声認識手段2a、第1言語の音声信号を第2言語の音声信号に変換する、或いは、第2言語の音声信号を第1言語の音声信号に変換する翻訳手段2b、第2言語の音声信号から第2言語の音声を生成する、或いは第1言語の音声信号から第1言語の音声を生成する音声生成手段2cといった機能が実行される。
【0018】
データユニット12は、CPU2で実行されるプログラムや各種データが翻訳対象言語毎に記憶されている。ここで、各種データとは音声認識の参照とされる認識用データ12a、また、翻訳の参照とされる翻訳用データ12bである。また、データユニット12は、装着部17に取り外し自在に取り付けられているため、データユニット12を取り外し、翻訳対象言語の異なる別のデータユニットを取り付けることにより、例えば、日本語−英語の翻訳だったものを、日本語−中国語の翻訳へと変換することができる。
【0019】
メモリ3は、主にCPU2で行われる演算処理の作業領域として使用される。また、データユニット12に記憶されているプログラムや各種データがロードされることもある。
【0020】
特に制限はされないが、スイッチ7は前面側の音声入力手段5を開始させるスイッチであり、スイッチ8は後面側の音声入力手段5を開始するスイッチである。
【0021】
また、本音声翻訳装置1には、音声録音手段9が搭載されており、録音スイッチ10により、録音を開始し、マイク13から録音した音声をメモリ3に記憶させておくことができ、また、記憶させておいた音声をスピーカ15から再生することもできる。
【0022】
続いて、本装置の操作及び動作について説明する。
【0023】
前面側のスイッチ7を押し、前面側のマイク13を介して取り込まれた第1言語の音声は、A/D変換器14でデジタル信号に変換された後に、周辺制御装置4に取り込まれる。この第1言語の音声信号は、CPU2内の音声認識手段2aにより認識されるが、ここで、データユニット12に格納された認識用データ12aが参照にされる。認識された第1言語の音声信号は、CPU2内の翻訳手段12bにより第2言語の音声信号に翻訳されるが、ここで、データユニット12に格納された翻訳用データ12bが参照にされる。翻訳された第2言語の音声信号は、CPU2内の音声生成手段2cにより第2言語の音声に生成され、周辺制御装置4に送られる。これらCPU2における演算処理は、メモリ3を作業領域として使用しながら行われる。生成された第2言語の音声は、周辺制御装置4からD/A変換器16に伝達され、そこでアナログ信号に変換される。アナログに変換された第2言語の音声は、後面側のスピーカ15を介して出力される。
【0024】
また、後面側のスイッチ8を押下し、後面側のマイク13を介して第2言語を取り込んでも、上述した内容と同様の動作が行われ、翻訳された第1言語の音声が後面側のスピーカ15を介して出力される。
【0025】
図2は本発明の1実施例である音声翻訳装置の斜め前面からの外観図を、図3は本発明の1実施例である音声翻訳装置の斜め後面からの外観図を示す。図3、及び図4において、音声翻訳装置1のケース21は、マイク13とスピーカ15を有するオーディオ部21が内包されている本体部20aと、スイッチ7,8、録音スイッチ9、データユニット取り外しスイッチ23を有するグリップ部21bとから構成されている。本体部21aは、前面と後面が明確にわかる厚板状に形成され、また、グリップ部21bは、片手で握りながら上記したボタンを操作できる棒状に形成されている。
【0026】
オーディオ部22は前面と後面の両面に設けられていて、前述したように、スイッチ7を押下し、前面から第1言語(ここでは日本語)の音声を入力すると、後面から翻訳された第2言語(ここでは英語)の音声が出力され、スイッチ8を押下し、後面から第2言語(英語)の音声を入力すると、翻訳された第1言語(日本語)の音声が出力される。
【0027】
図4は、本発明の1実施例である音声翻訳装置のデータユニットが切り離された状態を斜め後面から示す外観図である。同図において、データユニット12は、データユニット取り外しスイッチ23により取り外し自在であり、装着部17は、グリップ部21bの底面に設けられた接続部凹部17aと、データユニット12の上面に設けられた凸部17bとで構成されている。取り付けの構造は、凸部17bの側面の一部に溝を設け、凹部17a内に設けられた爪が溝に引っ掛かり、データユニット12が固定されるようになっている。また、データユニット取り外しボタン23を押下すると、溝から爪が外れ、データユニット12を取り外すことができる。この取り外し構造は、特に限定されるものではなく、例えば、コンセント式に差し込む構造や、グリップ部20b底面に凸部を設け、データユニット12上面に設けられた凹部に嵌挿し、取り付ける構造などを適用してもよい。前述したように、日本語−英語翻訳用のデータユニット12を取り外し、日本語−中国語翻訳用のデータユニット12’を取り付けることで、日本語−英語の翻訳から、日本語−中国語の翻訳へと変換できる。
【0028】
以上本発明を具体的に説明してきたが、本発明はそれに限定されるものではなく、その趣旨を逸脱しない範囲で種々変更可能である。
【0029】
【発明の効果】
以上のように、本発明によると、マイクを通して入力された音声を第1言語の音声信号と認識し、該第1言語の音声信号を所定の規則に従って第2言語の音声信号に変換して、スピーカを通して外部に音声を発する音声翻訳装置において、翻訳対象毎に音声−翻訳データを記憶した記憶媒体を含むユニットを、翻訳対象に応じて前記ユニットを交換することにより、異なる言語間の翻訳を可能にした。これにより、わざわざ翻訳対象毎に装置を買う必要がなく、また、取り付け、取り外しの作業が簡単であるので、多言語に対し、臨機応変に対応できる。
【0030】
また、装置のケースを小型かつ片手で握りながら操作が可能な形状にすることにより、旅行等に手軽に持って行くことができ、対話中も自然な姿勢のまま、言語の壁を感じずにコミュニケーションすることができる。
【0031】
また、第1言語の音声入力手段と第2言語の音声出力手段を前面に、第1言語の音声出力手段と第2言語の音声入力手段を後面に設けた。この結果、一人が装置を持った状態で両者の翻訳が可能であるので、効率よく対話を進めることができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す音声翻訳装置の構成図である。
【図2】本発明の一実施例を示す音声翻訳装置の斜め前面からの外観図である。
【図3】本発明の一実施例を示す音声翻訳装置の斜め後面からの外観図である。
【図4】本発明の1実施例である音声翻訳装置のデータユニットを取り外した状態を斜め後面から示す外観図である。
【図5】従来の小型通訳機を示す斜め前面からの外観図である。
【図6】従来の小型翻訳機を示す斜め後面からの外観図である。
【符号の説明】
1 音声翻訳装置
2 CPU
2a 音声認識手段
2b 翻訳手段
2c 音声生成手段
3 メモリ
9 音声録音手段
11 本体ユニット
12 データユニット
13 マイク
15 スピーカ
17 装着部
17a 凹部
17b 凸部
21 ケース
21a 本体部
21b グリップ部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice translating device that converts a voice uttered by a user into another different language and outputs the converted voice.
[0002]
[Prior art]
Generally, a speech translator recognizes speech of a first language input from a microphone, translates the recognition signal into a second language, synthesizes the result, and outputs the result from a speaker. In the related art, for example, as in Patent Document 1, there is a multilingual interpreter that allows users of a plurality of different languages to simultaneously talk using a large-scale computer and a communication medium.
[0003]
A miniaturized and portable speech translator is disclosed, for example, in Patent Document 2 and the like. FIG. 5 is an external view of a small-sized interpreter disclosed in Patent Document 1 as viewed obliquely from the front, and FIG. 1 shows an external view of a small translator from an oblique rear surface. 5 and 6, the housing 100 includes an information input / output unit 101 and a grip unit 102, and has a small size and can be operated with one hand. The information input / output unit 101 includes a voice input unit 103, a voice output unit 104, and an information display unit 105. When the power is turned on by the power switch 106 disposed on the rear surface of the small interpreter, the voice input switch 107 becomes operable, the voice input switch 107 is pressed down, and voice input is performed by the voice input means 103. Then, voice recognition of the input voice is performed, and the candidate character string is displayed on the information display unit 105. When the cursor in the information display means 105 is moved up and down by the up and down movement switches 108 and 109 to select a candidate to be translated from the candidate character strings and the confirmation switch 110 is pressed, the translation is executed. When the sound output switch 111 is pressed, a sound is generated, and the sound is output through the sound output unit 104. Here, the volume of the output sound is controlled by adjusting the volume control switch 112. If the user wants to cancel during these operations, the user can press the cancel switch 113 to return to the state before the voice input.
[0004]
[Patent Document 1]
Japanese Patent Application Laid-Open No. 2000-112939
[Patent Document 2]
JP 2000-315205 A
[Problems to be solved by the invention]
However, in an apparatus such as that disclosed in Patent Literature 1, it is necessary for a user to carry a personal computer and a communication device or the like when interpreting. Did not.
[0007]
Further, the device of Patent Document 2 is miniaturized and can be translated by one device, but the structure becomes complicated. In terms of operability, too, the number of switches to be operated, such as the voice input switch 107, the voice output switch 111, the enter switch 110, and the cancel switch 113, is large. It takes a long time to output the sound of the second language. Further, when the translation target is to be changed, for example, to change from Japanese translation into English (Japanese-English) to Japanese translation into Chinese (Japanese-Chinese), a new device that translates Japanese and Chinese is required. Was needed.
[0008]
The present invention has been made in view of the above-described circumstances, and enables people who use different languages to easily communicate with each other and to easily cope with a plurality of different languages. It is an object of the present invention to provide a speech translator that has been implemented.
[0009]
[Means for Solving the Problems]
In the above object of the present invention, a microphone inputs a first language voice, a voice recognition unit recognizes the first language voice as a first language voice signal, and a translation unit converts the first language voice signal. A speech translation device that converts the speech into a speech signal in a second language, wherein the speech generation means generates speech in a second language from the speech signal in the second language, and a speaker outputs the speech in the second language; The speech translation device includes a main unit and a data unit including a storage medium storing speech-translation data for each language to be translated, and includes a mounting unit that allows the data unit to be detachably attached to a case of the main unit. This is achieved by exchanging the data units according to the language to be translated.
[0010]
Further, the above object is achieved in that the voice recording means records a voice input through a microphone, a memory provided in the main unit stores the recorded voice, and the speaker reproduces the stored voice. The output is achieved effectively.
[0011]
Further, the object of the present invention is that the case of the main body unit has a switch for starting to input a voice, a grip portion formed in a rod shape capable of operating the switch while grasping with one hand, and the microphone. And the speaker, and the main body is formed in a shape in which the front and rear surfaces can be clearly seen.
[0012]
In addition, the above object is achieved by providing a mounting part for detaching the data unit from the case of the main body unit, a concave part provided on a bottom surface of the grip part, and an upper part of the data unit inserted into the concave part. This is effectively achieved by being constituted by the arranged convex portions.
[0013]
Further, the object is that the microphone and the speaker are respectively included in the front and rear surfaces of the main body, and when the voice of the first language is input to the microphone on the front, the second language is transmitted. Is output from the rear speaker, and when the second language audio is input to the rear microphone, the audio converted to the first language is output from the front speaker. Is achieved effectively.
[0014]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0015]
FIG. 1 is a diagram showing a configuration of a speech translation apparatus according to an embodiment of the present invention. In the figure, a speech translation device 1 includes a main unit 11 including a CPU 2, a memory 3, a peripheral control device 4, a speech input device 5, a speech output device 6, switches 7, 8, a speech recording means 9, and a recording switch 10, The data unit 12 includes a recognition data 12a and a translation data 12b.
[0016]
The audio input means 5 includes a microphone 13 and an A / D converter 14, and the audio output means includes a speaker 15 and a D / A converter 16, one on each of the front side and the rear side. The voice of the first language input from the voice input means 5 on the front side is translated into a second language and output from the voice output means 6 on the rear side, and the second language input from the voice input means 5 on the rear side. The bilingual sounds are translated into the first language and output from the sound output means 6 on the front side.
[0017]
The CPU 2 recognizes the voice of the first language as the voice signal of the first language, or recognizes the voice of the second language as the voice signal of the second language, and recognizes the voice signal of the first language as the voice signal of the second language. A translator 2b for converting an audio signal of a second language into an audio signal of a second language or an audio signal of a first language, generating an audio of a second language from the audio signal of the second language, or A function such as a voice generation unit 2c that generates a voice of the first language from the voice signal is executed.
[0018]
The data unit 12 stores programs executed by the CPU 2 and various data for each language to be translated. Here, the various data are recognition data 12a referred to for speech recognition and translation data 12b referred to for translation. Further, since the data unit 12 is detachably attached to the mounting portion 17, the data unit 12 is detached, and another data unit having a different language to be translated is attached, so that, for example, Japanese-English translation is performed. Things can be translated into a Japanese-Chinese translation.
[0019]
The memory 3 is used as a work area for arithmetic processing mainly performed by the CPU 2. Further, a program or various data stored in the data unit 12 may be loaded.
[0020]
Although not particularly limited, the switch 7 is a switch for starting the voice input unit 5 on the front side, and the switch 8 is a switch for starting the voice input unit 5 on the rear side.
[0021]
Further, the voice translating device 1 is provided with a voice recording means 9, which can start recording by a recording switch 10 and store the voice recorded from the microphone 13 in the memory 3. The stored voice can be reproduced from the speaker 15.
[0022]
Subsequently, the operation and operation of the present apparatus will be described.
[0023]
The first language voice captured through the front-side switch 13 by pressing the front-side switch 7 is converted into a digital signal by the A / D converter 14 and then captured by the peripheral control device 4. The voice signal of the first language is recognized by the voice recognition means 2a in the CPU 2. Here, the recognition data 12a stored in the data unit 12 is referred to. The recognized speech signal in the first language is translated into a speech signal in the second language by the translation means 12b in the CPU 2. Here, the translation data 12b stored in the data unit 12 is referred to. The translated second language voice signal is generated into a second language voice by the voice generating means 2 c in the CPU 2 and sent to the peripheral control device 4. The arithmetic processing in the CPU 2 is performed while using the memory 3 as a work area. The generated second language voice is transmitted from the peripheral control device 4 to the D / A converter 16, where it is converted into an analog signal. The sound of the second language converted to analog is output via the speaker 15 on the rear side.
[0024]
Further, even if the switch 8 on the rear side is pressed and the second language is captured via the microphone 13 on the rear side, the same operation as described above is performed, and the translated voice of the first language is output to the speaker on the rear side. 15 is output.
[0025]
FIG. 2 is an external view of a speech translator according to one embodiment of the present invention as viewed obliquely from the front, and FIG. 3 is an external view of a speech translator according to one embodiment of the present invention as viewed obliquely from the back. 3 and 4, a case 21 of the speech translator 1 includes a main body 20a in which an audio unit 21 having a microphone 13 and a speaker 15 is included, switches 7, 8, a recording switch 9, and a data unit removal switch. And a grip portion 21b having a grip 23. The main body portion 21a is formed in a thick plate shape in which the front and rear surfaces can be clearly seen, and the grip portion 21b is formed in a rod shape in which the above-mentioned buttons can be operated while holding with one hand.
[0026]
The audio section 22 is provided on both the front and rear sides. As described above, when the switch 7 is pressed and a voice of the first language (here, Japanese) is input from the front, the second section translated from the rear side. When the voice of the language (here, English) is output, the switch 8 is pressed, and the voice of the second language (English) is input from the rear, the translated voice of the first language (Japanese) is output.
[0027]
FIG. 4 is an external view showing a state in which the data unit of the speech translating apparatus according to the embodiment of the present invention is cut off from an oblique rear surface. In the figure, the data unit 12 is detachable by a data unit removal switch 23, and the mounting portion 17 has a connecting portion concave portion 17a provided on the bottom surface of the grip portion 21b and a convex portion provided on the upper surface of the data unit 12. And a portion 17b. The mounting structure is such that a groove is provided in a part of the side surface of the convex portion 17b, and a claw provided in the concave portion 17a is caught by the groove, so that the data unit 12 is fixed. Further, when the data unit removal button 23 is pressed, the nail is released from the groove, and the data unit 12 can be removed. The detaching structure is not particularly limited. For example, a structure in which a plug-in type is inserted, a structure in which a convex portion is provided on the bottom surface of the grip portion 20b, and a structure in which the convex portion is inserted into a concave portion provided on the upper surface of the data unit 12 and attached are applied. May be. As described above, by removing the data unit 12 for Japanese-English translation and attaching the data unit 12 'for Japanese-Chinese translation, the Japanese-English translation to the Japanese-Chinese translation can be performed. Can be converted to
[0028]
Although the present invention has been specifically described above, the present invention is not limited thereto, and various modifications can be made without departing from the gist of the present invention.
[0029]
【The invention's effect】
As described above, according to the present invention, a voice input through a microphone is recognized as a first language voice signal, and the first language voice signal is converted into a second language voice signal according to a predetermined rule. In a voice translation device that emits voice to the outside through a speaker, translation between different languages is possible by exchanging a unit including a storage medium storing speech-translation data for each translation target according to the translation target. I made it. This eliminates the need to buy a device for each translation target and simplifies the work of attaching and detaching, so that it is possible to respond flexibly to multiple languages.
[0030]
In addition, by making the device case small and operable while holding it with one hand, it can be easily carried on a trip, etc., while maintaining a natural posture during dialogue without feeling the language barrier Can communicate.
[0031]
Also, the first language voice input means and the second language voice output means are provided on the front side, and the first language voice output means and the second language voice input means are provided on the rear side. As a result, translation can be carried out efficiently because both can be translated while one person has the device.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a speech translation apparatus according to an embodiment of the present invention.
FIG. 2 is an external view of a voice translating apparatus according to an embodiment of the present invention, as viewed obliquely from the front.
FIG. 3 is an external view of a voice translating apparatus according to an embodiment of the present invention, as viewed obliquely from behind.
FIG. 4 is an external view showing a state in which a data unit of the speech translation apparatus according to the embodiment of the present invention is removed, as viewed obliquely from the rear side.
FIG. 5 is an external view of a conventional small interpreter as viewed from an oblique front.
FIG. 6 is an external view of a conventional small translator as viewed from an oblique rear surface.
[Explanation of symbols]
1 speech translator 2 CPU
2a voice recognition means 2b translation means 2c voice generation means 3 memory 9 voice recording means 11 main unit 12 data unit 13 microphone 15 speaker 17 mounting portion 17a concave portion 17b convex portion 21 case 21a main body portion 21b grip portion

Claims (5)

マイクが第1言語の音声を入力し、音声認識手段が前記第1言語の音声を第1言語の音声信号と認識し、翻訳手段が前記第1言語の音声信号を第2言語の音声信号に変換し、音声生成手段が前記第2言語の音声信号から第2言語の音声を生成し、スピーカーが前記第2言語の音声を出力する音声翻訳装置であって、
前記音声翻訳装置は、本体ユニットと、翻訳対象言語毎に音声−翻訳データを記憶した記憶媒体を含むデータユニットとを有し、前記データユニットが前記本体ユニットのケースに取り外し自在にする装着部を備え、且つ、翻訳対象言語に応じて前記データユニットを交換することを特徴とする音声翻訳装置。
A microphone inputs a first language voice, a voice recognition unit recognizes the first language voice as a first language voice signal, and a translator converts the first language voice signal into a second language voice signal. A voice translation device that performs conversion, wherein the voice generating means generates a second language voice from the second language voice signal, and wherein the speaker outputs the second language voice;
The speech translation device has a main unit and a data unit including a storage medium storing speech-translation data for each language to be translated, and a mounting unit that allows the data unit to be detachably attached to a case of the main unit. A speech translation apparatus, comprising: exchanging the data units according to a language to be translated.
音声録音手段が、マイクを通して入力された音声を録音し、前記本体ユニット内に配設されたメモリが前記録音された音声を記憶し、前記スピーカが前記記憶された音声を出力するようになっている請求項1記載の音声翻訳装置。Voice recording means for recording voice input through a microphone, a memory provided in the main unit stores the recorded voice, and the speaker outputs the stored voice. The speech translation device according to claim 1. 前記本体ユニットの前記ケースが、音声の入力を開始するためのスイッチを有し、片手で握りながら前記スイッチを操作することができる棒状に形成されたグリップ部と、前記マイクと前記スピーカを有し、前面と後面とが明確にわかる形状に形成された本体部とから構成されている請求項1又は2記載の音声翻訳装置。The case of the main body unit has a switch for starting the input of voice, a grip portion formed in a rod shape that can operate the switch while grasping with one hand, the microphone and the speaker. 3. The speech translation device according to claim 1, wherein the speech translation device comprises a main body having a shape in which a front surface and a rear surface are clearly visible. 前記データユニットを前記本体ユニットの前記ケースに取り外し自在にする前記装着部が、前記グリップ部の底面に配設された凹部と、該凹部に嵌挿される前記データユニット上部に配設された凸部とから構成されている請求項3記載の音声翻訳装置。A mounting portion for detaching the data unit from the case of the main body unit; a concave portion provided on a bottom surface of the grip portion; and a convex portion provided on an upper portion of the data unit to be inserted into the concave portion. 4. The speech translation device according to claim 3, comprising: 前記本体部の前面と後面に、前記マイクと前記スピーカが各1個内包されており、前記第1言語の音声が前面の前記マイクに入力されると、前記第2言語に変換された音声が後面の前記スピーカから出力され、前記第2言語の音声が後面の前記マイクに入力されると、前記第1言語に変換された音声が前面の前記スピーカから出力されるようになっている請求項3又は4記載の音声翻訳装置。One microphone and one speaker are included on the front and rear surfaces of the main body, respectively. When sound of the first language is input to the microphone on the front, sound converted to the second language is generated. The voice output in the second language is output from the rear speaker, and the voice converted into the first language is output from the front speaker when the voice in the second language is input to the microphone in the rear. The speech translation device according to 3 or 4.
JP2003158021A 2003-06-03 2003-06-03 Speech translation device Pending JP2004362132A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003158021A JP2004362132A (en) 2003-06-03 2003-06-03 Speech translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003158021A JP2004362132A (en) 2003-06-03 2003-06-03 Speech translation device

Publications (1)

Publication Number Publication Date
JP2004362132A true JP2004362132A (en) 2004-12-24

Family

ID=34051565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003158021A Pending JP2004362132A (en) 2003-06-03 2003-06-03 Speech translation device

Country Status (1)

Country Link
JP (1) JP2004362132A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7552053B2 (en) 2005-08-22 2009-06-23 International Business Machines Corporation Techniques for aiding speech-to-speech translation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7552053B2 (en) 2005-08-22 2009-06-23 International Business Machines Corporation Techniques for aiding speech-to-speech translation
US7734467B2 (en) 2005-08-22 2010-06-08 International Business Machines Corporation Techniques for aiding speech-to-speech translation
US8768699B2 (en) 2005-08-22 2014-07-01 International Business Machines Corporation Techniques for aiding speech-to-speech translation

Similar Documents

Publication Publication Date Title
US7200560B2 (en) Portable reading device with display capability
CN100592749C (en) Conversation support system and conversation support method
US8032384B2 (en) Hand held language translation and learning device
JPH11143616A (en) Character communication device
US8606560B2 (en) Automatic simultaneous interpertation system
TW202044102A (en) Real-time foreign language communication system having wearable translation device designed to be worn on the user&#39;s head to directly pick up the content of foreigners&#39; speech for real-time translation
JP6457706B1 (en) Translation system, translation method, and translation apparatus
US20100088096A1 (en) Hand held speech recognition device
JPWO2013077110A1 (en) Translation apparatus, translation system, translation method and program
JP2019175426A (en) Translation system, translation method, translation device, and voice input/output device
JP2018191145A (en) Voice collection device, voice collection method, voice collection program, and dictation method
US20100161310A1 (en) Two-way translator structure
JP2017151619A (en) translator
JP2004362132A (en) Speech translation device
JP6980150B1 (en) 3D virtual real space providing server, 3D virtual real space providing method, 3D virtual real space providing program, 3D virtual real space display control device, 3D virtual real space display control method, 3D virtual real space display control program And 3D virtual reality space provision system
JP2019174786A (en) Speech translation apparatus, speech translation method, and program therefor
CN100440115C (en) Hand-held electronic device
JP6274234B2 (en) Loudspeaker and control method thereof
JP6543047B2 (en) Information processing apparatus, control program, recording medium
JP2001296877A (en) Program executing device which conducts voice conversation and its program
KR20210080764A (en) Neckband-type sound converting device
JP2020026011A (en) Robot operation device and robot operation program
KR100368066B1 (en) Speech interpreter
JP2002507772A (en) Device for information reproduction or function execution
Jans et al. High technology aids to communication

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071002